EA046157B1 - Композиции и способы селективной регуляции экспрессии генов - Google Patents

Композиции и способы селективной регуляции экспрессии генов Download PDF

Info

Publication number
EA046157B1
EA046157B1 EA202193162 EA046157B1 EA 046157 B1 EA046157 B1 EA 046157B1 EA 202193162 EA202193162 EA 202193162 EA 046157 B1 EA046157 B1 EA 046157B1
Authority
EA
Eurasian Patent Office
Prior art keywords
certain embodiments
seq
scn1a
dbd
etf
Prior art date
Application number
EA202193162
Other languages
English (en)
Inventor
Стефани Тальятела
Энн Таненхаус
Картик Рамамуртхи
Эндрю Янг
Дэвид Оберкофлер
Original Assignee
Инкоудид Терапьютикс, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Инкоудид Терапьютикс, Инк. filed Critical Инкоудид Терапьютикс, Инк.
Publication of EA046157B1 publication Critical patent/EA046157B1/ru

Links

Description

Ссылка
По заявке на настоящий патент испрашивается приоритет в соответствии с предварительной заявкой на патент США № 62/854238, поданной 29 мая 2019 г.; предварительной заявкой на патент США № 62/857727, поданной 5 июня 2019 г.; и предварительной заявкой на патент США № 63/008569, поданной 10 апреля 2020 г., каждая из которых полностью включена в настоящий документ посредством ссылки.
Перечень последовательностей
Настоящая заявка содержит Перечень последовательностей, который был представлен в электронном виде в формате ASCII и полностью включен в настоящий документ посредством ссылки. Указанная копия ASCII, созданная 28 мая 2020 г., называется 46482-724_601_SL.txt и имеет размер 418483 байта.
Предшествующий уровень техники настоящего изобретения
Широкий спектр заболеваний человека связан с аномальной экспрессией генов. В некоторых случаях генетическая мутация в гене вызывает нарушение его регуляции, подавление или отсутствие экспрессии вообще, что приводит к гаплонедостаточности. В некоторых случаях генетическая мутация в гене вызывает его активацию, что приводит к сверхэкспрессии гена. При лечении генетических нарушений или заболеваний существует множество проблем. Один из подходов - генная терапия, которая включает в себя терапевтическую доставку нуклеиновой кислоты в клетки пациента. Тем не менее, различные проблемы, связанные с генной терапией, остаются нерешенными, такие как нежелательный иммунный ответ, вызванный генной терапией, нецелевые эффекты, ограничения клонирующей способности носителей генной терапии (например, вирусов), поддержание терапевтического эффекта в течение более длительного периода времени и т.д. Центральная нервная система (ЦНС) ставит множество уникальных задач для разработки терапии, направленной на устранение основного нарушения экспрессии гена и/или белка. Хотя существуют лекарственные средства, которые помогают управлять симптомами заболеваний/нарушений ЦНС, многие заболевания/нарушения ЦНС, например, синдром Драве, не имеют специальных способов лечения или устранения. Таким образом, существует потребность в новых композициях и способах, способных модулировать экспрессию любого эндогенного гена, чтобы помочь обратить вспять эффекты заболевания или нарушения, в частности, в терапии со сниженной иммуногенностью, уменьшенными нецелевыми эффектами, повышенной специфичностью для целевого гена и/или повышенной терапевтической эффективностью.
Сущность настоящего изобретения
Согласно одному аспекту в настоящей заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит ДНК-связывающий домен (DBD), функционально связанный по меньшей мере с двумя активирующими транскрипцию доменами (TAD) следующим образом: TAD1-TAD2-DBD, DBD-TAD3-TAD4 или TAD1TAD2-DBD-TAD3-TAD4. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 независимо выбраны из следующего: VP16, VP64, Viper, CITED2, CITED4, CREB3 или их функциональных фрагментов. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления линкер отсутствует по меньшей мере между двумя доменами TAD.
Согласно определенным вариантам осуществления существует линкер по меньшей мере между двумя доменами TAD. Согласно определенным вариантам осуществления линкер содержит или состоит из GGSGGGSG (SEQ ID NO: 177) или GGSGGGSGGGSGGGSG (SEQ ID NO: 178).
Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 18-27 нуклеотидов.
Согласно определенным вариантам осуществления DBD характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления DBD характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления каждый из DBD и по меньшей мере двух TAD характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления каждый из DBD и по меньшей мере двух TAD характеризуется идентичностью последовательности, состав
- 1 046157 ляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.
Согласно определенным вариантам осуществления DBD содержит направляющую РНК и инактивированный нуклеазами белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.
Согласно определенным вариантам осуществления DBD содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления DBD содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления DBD содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления DBD содержит девять цинковых пальцев. Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 27 нуклеотидов.
Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления DBD содержит последовательность, содержащую любую из SEQ ID NO: 148-151.
Согласно определенным вариантам осуществления DBD получен из EGR1 человека или EGR3 человека.
Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-98. Согласно определенным вариантам осуществления DBD содержит SEQ ID NO: 77-98.
Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 92. Согласно определенным вариантам осуществления DBD содержит SEQ ID NO: 92.
Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 130 или 131. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 130 или 131.
Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 72 или 73. Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность любой из SEQ ID NO: 72 или 73.
Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в PV-содержащих нейронах, чем в других типах клеток. Согласно определенным вариантам осуществления регуляторный элемент содержит любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит SEQ ID NO: 2 или 3.
Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК характеризуется идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит любую из SEQ ID NO: 7, 14 или 15.
Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.
Согласно другому аспекту в заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит ДНКсвязывающий домен, функционально связанный с активирующим транскрипцию доменом, причем ДНКсвязывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147), и причем тег HA отсутствует (SEQ ID NO: 303) между ДНК-связывающим доменом и активирующим транскрипцию доменом. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR или VP64 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит VP64.
Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 18-27 нуклеотидов. Согласно определенным вариантам осуществления ДНКсвязывающий домен представляет собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=6-9. Согласно определенным вариантам осуществления ДНК-связывающий домен представляет
- 2 046157 собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=6. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=9. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 27 нуклеотидов.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, содержащую любую из SEQ ID NO: 148-151.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.
Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в PV-содержащих нейронах, чем в других типах клеток. Согласно определенным вариантам осуществления регуляторный элемент содержит любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит SEQ ID NO: 2 или 3.
Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 127. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 127.
Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 93 или 71. Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность любой из SEQ ID NO: 93 или 71.
Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК характеризуется идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит любую из SEQ ID NO: 7, 14 или 15.
Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус. Согласно другому аспекту в заявке представлен полинуклеотид, содержащий селективный в отношении PV сайт связывания микроРНК, содержащий последовательность, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к SEQ ID NO: 14 или 15, причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит SEQ ID NO: 14. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит SEQ ID NO: 15. Согласно другому аспекту в заявке представлена кассета экспрессии, содержащая селективный в отношении PV сайт связывания микроРНК и промотор и/или энхансер. Согласно определенным вариантам осуществления промотор и/или энхансер представляет собой селективный в отношении PV регуляторный элемент, который управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих нейронах (PV), чем в других типах клеток. Согласно определенным вариантам осуществления селективный в отношении PV регуляторный элемент функционально связан с трансгеном. Согласно другому аспекту в настоящей заявке представлена кассета экспрессии, содержащая регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один сайт связывания микроРНК, причем регуляторный элемент управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих (PV) нейронах, чем в других типах клеток, и причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах. Согласно определенным вариантам осуществления кассета экспрессии не содержит SEQ ID NO: 67. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания для MIR221 (SEQ ID NO:
- 3 046157
11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9), по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11) и по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит SEQ ID NO: 7, 14 или 15.
Согласно определенным вариантам осуществления трансген кодирует полипептид, содержащий не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке. Согласно определенным вариантам осуществления фактор транскрипции связывается с областью генома, содержащей 18-27 нуклеотидов. Согласно определенным вариантам осуществления фактор транскрипции содержит ДНК-связывающий домен. Согласно определенным вариантам осуществления фактор транскрипции содержит ДНК-связывающий домен и активирующий транскрипцию домен. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления как ДНКсвязывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит направляющую РНК и инактивированный нуклеазой белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит девять цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 27 нуклеотидов.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, содержащую любую из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 92-98. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 92-98.
Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147).
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.
Согласно определенным вариантам осуществления ДНК-связывающий домен происходит от EGR1 человека или EGR3 человека.
Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR, VP64, CITED2, CITED4 или CREB3 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность CITED2, CITED4 или CREB3 человека или их функциональный фрагмент.
Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую SEQ ID NO: 2 или 3.
Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 105, 106 и 127-129. Согласно определенным вариантам
- 4 046157 осуществления не встречающийся в природе фактор транскрипции содержит любую из SEQ ID NO: 105, 106 и 127-129.
Согласно определенным вариантам осуществления трансген содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 71, 74, 75, 76 или 184. Согласно определенным вариантам осуществления трансген содержит любую из SEQ ID NO: 71, 74, 75, 76 или 184.
Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.
Согласно другому аспекту в настоящей заявке представлен способ селективной экспрессии трансгена в парвальбумин-содержащих нейронах (PV) приматов, предусматривающий введение примату вирусного вектора, содержащего трансген и по меньшей мере один сайт связывания микроРНК, причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах.
Согласно определенным вариантам осуществления вирусный вектор дополнительно содержит регуляторный элемент, функционально связанный с трансгеном, причем регуляторный элемент управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих нейронах (PV), чем в других типах клеток. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9), по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11) и по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит SEQ ID NO: 7, 14 или 15.
Согласно определенным вариантам осуществления трансген содержит последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCNIA в клетке.
Согласно определенным вариантам осуществления фактор транскрипции связывается с областью генома, содержащей 18-27 нуклеотидов.
Согласно определенным вариантам осуществления фактор транскрипции содержит ДНКсвязывающий домен.
Согласно определенным вариантам осуществления фактор транскрипции содержит ДНКсвязывающий домен и активирующий транскрипцию домен.
Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит направляющую РНК и инактивированный нуклеазой белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит девять цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен свя
- 5 046157 зывается с геномной областью, содержащей 27 нуклеотидов.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, имеющую любую из SEQ ID NO: 148-151.
Согласно определенным вариантам осуществления ДНК-связывающий домен происходит из EGR1 человека или EGR3 человека.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 92-98. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 92-98.
Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147).
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.
Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR, VP64, CITED2, CITED4 или CREB3 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность CITED2, CITED4 или CREB3 человека или их функциональный фрагмент.
Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую SEQ ID NO: 2 или 3.
Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 105, 106 и 127-129. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит любую из SEQ ID NO: 105, 106 и 127-129.
Согласно определенным вариантам осуществления трансген содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 71, 74, 75, 76 или 184. Согласно определенным вариантам осуществления трансген содержит любую из SEQ ID NO: 71, 74, 75, 76 или 184.
Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.
Согласно определенным вариантам осуществления притма представляет собой человека. Согласно определенным вариантам осуществления примат представляет собой отличного от человека примата. Согласно определенным вариантам осуществления отличный от человека примат представляет собой обезьяну старого мира, орангутана, гориллу, шимпанзе, мартышку, яванского макака, макака-резус или свинохвостого макака.
Согласно другому аспекту в настоящей заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 128 или 129. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 128 или 129.
Согласно другому аспекту в настоящей заявке представлен способ увеличения экспрессии SCNIA в клетке путем введения любой из кассет экспрессии, представленных в настоящем документе. Согласно определенным вариантам осуществления клетка представляет собой нервную клетку. Согласно определенным вариантам осуществления нервная клетка выбрана из группы, состоящей из униполярных, биполярных, мультиполярных или псевдоуниполярных нейронов. Согласно определенным вариантам осуществления клетка представляет собой ГАМКергический нейрон. Согласно определенным вариантам осуществления клетка представляет собой PV-содержащий нейрон. Согласно определенным вариантам осуществления клетка не представляет собой нервную клетку. Согласно определенным вариантам осуществления клетка представляет собой глиальную клетку. Согласно определенным вариантам осуществления глиальная клетка выбрана из группы, состоящей из астроцитов, олигодендроцитов, эпендимных клеток, шванновских клеток и сателлитных клеток. Согласно определенным вариантам осуществления клетка находится внутри субъекта. Согласно определенным вариантам осуществления субъект представляет собой млекопитающее. Согласно определенным вариантам осуществления субъект представляет
- 6 046157 собой человека. Согласно определенным вариантам осуществления увеличение экспрессии SCN1A лечит заболевание, нарушение или симптом. Согласно определенным вариантам осуществления нарушение представляет собой нарушение центральной нервной системы. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления гаплонедостаточность является результатом того, что субъект является гетерозиготным по мутации потери функции гена SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную со вставкой, делецией или заменой в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с точечной мутацией в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой синдром Драве. Согласно определенным вариантам осуществления симптом нарушение центральной нервной системы представляет собой гиперактивность нейронов. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает снижение гиперактивности нейронов. Согласно определенным вариантам осуществления симптомом нарушения центральной нервной системы являются припадки. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает снижение частоты припадков. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает уменьшение тяжести припадков.
Согласно другому аспекту в настоящей заявке представлен способ увеличения экспрессии SCNIA в ЦНС путем введения любой из кассет экспрессии, представленных в настоящем документе. Согласно определенным вариантам осуществления кассету экспрессии вводят посредством одностороннего интрацеребровентрикулярного (ICV) введения. Согласно определенным вариантам осуществления кассету экспрессии вводят посредством двустороннего интрацеребровентрикулярного (ICV) введения. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в головном мозге. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит во фронтальной коре, теменной коре, височной коре, гиппокампе, продолговатом мозге и/или затылочной коре. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в позвоночнике. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в спинном мозге и/или межпозвонковом узле.
Включение по ссылке
Все публикации, патенты и заявки на патенты, упомянутые в настоящем описании, включены в настоящий документ посредством ссылки в той же степени, как если бы каждая отдельная публикация, патент или заявка на патент были специально и индивидуально указаны для включения посредством ссылки.
Краткое описание графических материалов
Новые особенности настоящего изобретения подробно изложены в прилагаемой формуле изобретения. Лучшее понимание особенностей и преимуществ настоящего изобретения будет получено при обращении к нижеследующему подробному описанию, в котором излагаются иллюстративные случаи, в которых используются принципы настоящего изобретения, и прилагаемым графическим материалам, на которых показано следующее.
На фиг. 1 показана активация эндогенного SCN1A с использованием сконструированных факторов транскрипции, которые связываются с различными областями на хромосоме 2 (со ссылкой на GRCh38.p12). Данные представлены в виде кратного изменения экспрессии SCN1A по сравнению с контрольным (EGFP-KASH) состоянием.
На фиг. 2A, фиг. 2B и фиг. 2C показана относительная экспрессия эндогенного SCN1A в клетках HEK293 с использованием SCN1A-специфических активаторов транскрипции (смотрите табл. 1). Данные представлены в виде кратного изменения относительно контрольных условий и показаны на шкале Logi0.
На фиг. 3A показана относительная экспрессия эндогенного SCN1A в нейронах ГАМК с использованием SCN1A-специфического активатора транскрипции (конструкция 30). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP).
На фиг. 3B показана относительная экспрессия эндогенного SCN1A в нейронах ГАМК с использованием SCN1A-специфических активаторов транскрипции (конструкции 25 и 16). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP) в Log10.
На фиг. 4 показана относительная экспрессия эндогенного SCN1A и 40 ближайших соседних генов, управляемых специфическим фактором транскрипции SCN1A (конструкция 30). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP-KASH) в Log10.
На фиг. 5A и фиг. 5B показана экспрессия SCN1A-специфического активатора транскрипции in vivo по сравнению с контрольной кассетой экспрессии, которая экспрессировала eGFP. На фиг. 5A показана относительная экспрессию гена SCN1A у мышей, которым инъецировали либо контрольный eGFP, либо конструкцию 4, содержащую активатор транскрипции SCN1A. На фиг. 5B показано изменение экспрессии SCN1A с точки зрения среднего процента eGFP. Эти эксперименты показывают, что активация транскрипции с помощью конструкции 4 привела к усилению экспрессии SCN1A приблизительно на 20-30%.
На фиг. 6A, фиг. 6B, фиг. 6C, фиг. 6D, фиг. 6E, фиг. 6F и фиг. 6G показано влияние на гипертерми- 7 046157 ческие припадки на мышиной модели синдрома Драве с нокаутом Scn1atm1Kea с использованием различных факторов транскрипции, специфических для SCN1A, по сравнению с контролем. Мышам P1 Scn1a +/- (гетерозиготные; HET) вводили либо AAV9-EGFP, либо вектор AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (одна из конструкций 31-34, 42 и 43). Мышей P26-P28, подвергнутых инфузии, подвергали тесту на припадки, вызванные гипертермией, и регистрировали внутреннюю температуру, при которой они испытывали тонико-клонический припадок. На фиг. 6D показано прямое сравнение между конструкцией 32, которая содержит тег HA, расположенным между DBD и TAD, и конструкцией 34, которая не содержит тега HA. На фиг. 6E показано прямое сравнение между конструкцией 31, которая содержит сайт связывания микроРНК m1, расположенный между кодирующей областью и хвостом полиА, и конструкцией 32, которая не содержит сайт связывания микроРНК m1. На фиг. 6H проиллюстрировано влияние на гипертермические припадки в модели синдрома Драве у мышей с мутантным Scn1aRX использованием конструкции 31 (по сравнению с контролем в виде введенного PBS).
На фиг. 7A, фиг. 7B, фиг. 7C и фиг. 7D показана выживаемость в модели синдрома Драве у мышей с нокаутом Scn1atm1Kea в различных условиях. На фиг. 7A показано сравнение мышей дикого типа (PBS WT) и Scn1a +/- (PBS HET) в анализе выживаемости. Мышам P1 Scn1a +/- (N=53) и Scn1a +/+ (N=54) вливали PBS. Мышей наблюдали в их домашней клетке ежедневно, и в случае какой-либо смертности регистрировали дату. Наблюдалась значительная разница в выживаемости между животными Scn1a +/- и Scn1a +/+ (P<0,0001). На фиг. 7B-D показано влияние на выживаемость в мышиной модели синдрома Драве для мышей, обработанных различными факторами транскрипции, специфическими для SCN1A, по сравнению с контролем. Мышам P1 Scn1a +/- вливали либо PBS, либо вектор AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (конструкции 31 или 33). Мышей наблюдали в их домашней клетке ежедневно, и в случае какой-либо смертности регистрировали дату. На фиг. 7D показано прямое сравнение между конструкцией 31, которая содержит сайт связывания микроРНК m1, расположенным между кодирующей областью и хвостом полиА, и конструкцией 33, которая не содержит сайт связывания микроРНК m1. На фиг. 7E показана выживаемость в модели синдрома Драве у мышей с мутантным Scn1aRX с использованием конструкции 31 (по сравнению с контролем, инъецированным PBS).
На фиг. 8 показана относительная экспрессия мРНК Scn1A в различных тканях головного мозга после интрапаренхимальной доставки вектора AAV9, кодирующего SCN1A-специфический фактор транскрипции (конструкция 33), введенного двум яванским макакам в дозе 1,2х1012 копий генома/животное, нормализованных по двум необработанным контрольным животным. Всех животных умерщвляли через 28 дней после инъекции и количественно определяли мРНК Scn1A в образцах тканей с помощью Taqman PCR. Данные представлены как нормализованная экспрессия целевой мРНК в различных срезах ткани головного мозга. Аналогичные результаты были зарегистрированы с другим набором праймеров/зонда, полученных из гена Scn1a.
На фиг. 9A-F показан характер экспрессии EGFP в области зубчатой извилины гиппокампа мартышки после обработки векторами AAV9, содержащими трансген EGFP под контролем промотора EF1a, промотора RE 2 (SEQ ID NO: 2) или промотора RE 2 (SEQ ID NO: 2) с сайтом связывания микроРНК m1 (SEQ ID NO: 7), расположенным между кодирующей областью EGFP и сайтом polyA. Типичная область зубчатой извилины гиппокампа показана для каждого вектора обработки. В верхнем ряду показаны ядра клеток, окрашенные DAPI, а в нижнем ряду показаны GFP-положительные области, окрашенные антителом к GFP. На фиг. 9A (обработка EF1a) область hylus CA4 гиппокампа обведена, а стрелки указывают на слой тела гранулярных клеток зубчатых клеток (DG). Фиг. 9B и фиг. 9C сосредоточены в той же области. Область CA4, которая представляет собой смесь возбуждающих и тормозных интернейронов, выделена, поскольку это была единственная область со значительной экспрессией в условии RE 2 + m1. При управляемой EF1a и RE 2 экспрессии трансгена экспрессия GFP была более распространенной и включала в себя другие области гиппокампа. Считается, что слой клеток DG содержит в основном возбуждающие нейроны. Экспрессия GFP, управляемая EF1a и RE 2, видна в слое клеток DG (фиг. 9D и фиг. 9E), но не присутствует у животных, обработанных RE 2 + m1 (фиг. 9F) (белые стрелки).
На фиг. 10A-L показано, что характер экспрессии EGFP в области зубчатой извилины гиппокампа мартышки после обработки векторами AAV9, содержащими трансген EGFP под контролем промотора EF1a, промотора RE 2 (SEQ ID NO: 2) или промотора RE 2 (SEQ ID NO: 2) с сайтом связывания микроРНК m1 (SEQ ID NO: 7), расположенным между кодирующей областью EGFP и сайтом polyA, в первую очередь локализован на парвальбумин-положительных (PV) клетках у животных, получавших RE 2 и RE 2 + m1. Типичная область зубчатой извилины гиппокампа показана для каждого вектора обработки. В верхнем ряду показаны GFP-положительные области, а в следующем нижнем ряду показаны те же области, окрашенные ингибирующим маркером интернейронов для PV. Область в рамке на фиг. 10A-F показана при большем увеличении на фиг. 10G-L. Экспрессия GFP, управляемая RE 2 и RE 2 + m1, в основном совмещена с ингибирующим маркером PV-содержащих интернейронов (белые стрелки на фиг. 10H и 10K, 10I и 10L), тогда как в EG-EF1a экспрессия GFP не так легко локализуется в PVположительных клетках (белые стрелки на фиг. 10G и 10J). Кроме того, GFP-положительные клетки характеризуются отчетливо выраженной морфологией интернейронов высокоразветвленных клеток с пи
- 8 046157 рамидным клеточным телом у животных, получавших RE 2 и RE 2 + ml (стрелки на фиг. 10H и 10I), по сравнению с менее отчетливой морфологией клеточного тела у животных, получавших EF1a (стрелки на фиг. 10G).
На фиг. 11 показан VG/диплоидный геном в образцах тканей фронтальной коры (FC), ростральной теменной коры (Rostral PC), височной коры (TC), каудальной теменной коры (Caudal PC), гиппокампа (Hip), продолговатого мозга (Med) и затылочной коры (OC) животных, получавших AAV9-REgabaeTFSCNiA, вводимые в дозе 4,8E+13 или 8E+13 мкг/животное посредством одностороннего интрацеребровентрикулярного (ICV) введения (пример 10 и пример 11). Каждая точка данных представляет VG/диплоидный геном для образца ткани, а горизонтальные полосы представляют средний VG/диплоидный геном для всех образцов ткани для каждого животного.
На фиг. 12 показаны транскрипты/мкг РНК в образцах тканей фронтальной коры (FC), ростральной теменной коры (Rostral PC), височной коры (TC), каудальной теменной коры (Caudal PC), гиппокампа (Hip), продолговатого мозга (Med) и затылочной коры (OC) животных, получавших AAV9-REgabaeTFSCN1A, вводимые в дозе 4,8E+13 или 8E+13 геномов вектора/животное посредством одностороннего интрацеребровентрикулярного (ICV) введения (пример 10 и пример 11). Каждая точка данных представляет геномы вектора/диплоидный геном для образца ткани, а горизонтальные полосы представляют собой среднее отношение геномы вектора/диплоидный геном для всех образцов ткани для каждого животного. Средние транскрипты для ARFGAP2 составляли 1,85Е+6/мкг РНК и обозначены пунктирной верхней граничной линией. Предел обнаружения обозначен пунктирной нижней граничной линией.
На фиг. 13 показано биораспределение вектора (геномы вектора/диплоидный геном) и экспрессия трансгена (транскрипты/мкг РНК) в образцах периферической ткани вне головного мозга. Показанные образцы периферической ткани представляют собой спинной мозг C2/L4 (SC C2/L4), межпозвонковый узел C2/L4 (DRG C2/L4), печень, селезенка, сердце, почки, легкие, поджелудочная железа и семенники/яичники. Среднее значение VCN (векторное биораспределение) и транскрипта (экспрессия трансгена) в головном мозге приматов показано пунктирной линией.
Подробное описание настоящего изобретения
В настоящем документе представлены сконструированные факторы транскрипции или eTF, которые не встречаются в природе и были разработаны для связывания с целевым сайтом генома и модуляции экспрессии представляющего интерес эндогенного гена. Такие eTF могут быть созданы для усиления или подавления экспрессии (экспрессии РНК и/или белка) представляющего интерес гена. В настоящем документе также представлены сайты связывания микроРНК, которые могут быть включены в вирусный вектор и обеспечивать селективную экспрессию трансгена в парвальбумин-содержащих нейронах (PV).
Согласно одному аспекту в настоящей заявке представлены eTF, которые способны повышать экспрессию гена альфа-субъединицы 1 натриевого потенциалзависимого канала (SCN1A) и повышать экспрессию его соответствующего белкового продукта Nav1.1, a также способы их применения для лечения заболеваний или нарушений, связанных с дефицитом Nav1.1, такие как, например, синдром Драве.
Согласно другому аспекту в настоящей заявке предусмотрены сайты связывания микроРНК, которые снижают экспрессию мРНК, содержащей сайт связывания микроРНК, в возбуждающих нейронах, тем самым приводя к селективной экспрессии гена в ГАМКергических нейронах или парвальбуминсодержащих нейронах (PV), и способы их применения для селективной экспрессии представляющего интерес гена в нейронах PV.
Определения.
Используемые в настоящем документе формы единственного числа предназначены для включения и форм множественного числа, если контекст явно не указывает на иное. Кроме того, в той степени, в которой термины включая в себя, включает в себя, имеющий, имеет, с или их варианты используются либо в подробном описании, либо в формуле изобретения, такие термины предназначены для включения аналогично термину содержащий.
Термин приблизительно или примерно означает в пределах допустимого диапазона ошибок для конкретного значения, определенного специалистом в настоящей области техники, который будет частично зависеть от того, как значение измеряется или определяется, т.е. ограничения системы измерения. Например, приблизительно может означать в пределах одного или более чем одного стандартного отклонения в соответствии с практикой в настоящей области техники. В качестве альтернативы приблизительно может означать диапазон до 20%, до 15%, до 10%, до 5% или до 1% от заданного значения.
Термины определение, измерение, оценка, оценивание, анализ и их грамматические эквиваленты могут использоваться в настоящем документе взаимозаменяемо для обозначения любой формы измерения и включают в себя определение того, присутствует элемент или нет (например, обнаружение). Эти термины могут включать в себя как количественные, так и/или качественные определения. Оценка может быть относительной или абсолютной.
Термин экспрессия относится к процессу, с помощью которого последовательность нуклеиновой кислоты или полинуклеотид транскрибируется с матрицы ДНК (например, в мРНК или другой транскрипт РНК), и/или процессу, посредством которого транскрибированная мРНК впоследствии транслируется в пептиды, полипептиды или белки. Транскрипты и кодируемые полипептиды можно вместе назы
- 9 046157 вать генным продуктом. Если полинуклеотид происходит из геномной ДНК, экспрессия может включать в себя сплайсинг мРНК в эукариотической клетке.
Используемые в настоящем документе термины функционально связанный, функциональная связь или их грамматические эквиваленты относятся к сопоставлению генетических элементов, например, промотора, энхансера, последовательности полиаденилирования и т.д., причем элементы находятся во взаимосвязи, позволяющей им работать ожидаемым образом. Например, регуляторный элемент, который может включать в себя промоторные и/или энхансерные последовательности, функционально связан с кодирующей областью, если регуляторный элемент помогает инициировать транскрипцию кодирующей последовательности. Между регуляторным элементом и кодирующей областью могут быть промежуточные остатки, пока сохраняется эта функциональная связь. Используемый в настоящем документе термин вектор относится к макромолекуле или ассоциации макромолекул, которая содержит полинуклеотид или ассоциируется с ним и которая может использоваться для опосредования доставки полинуклеотида в клетку. Примеры векторов включают в себя плазмиды, вирусные векторы, липосомы и другие носители для доставки генов. Вектор, как правило, содержит генетические элементы, например, регуляторные элементы, функционально связанные с геном для облегчения экспрессии гена в мишени.
Используемые в настоящем документе термины кассета экспрессии и кассета нуклеиновой кислоты взаимозаменяемо относятся к комбинации последовательностей нуклеиновых кислот или элементов, которые экспрессируются вместе или функционально связаны для экспрессии. В некоторых случаях кассета экспрессии относится к комбинации регуляторных элементов и гена или генов, с которыми они функционально связаны для экспрессии.
Термин AAV представляет собой сокращение от аденоассоциированного вируса и может использоваться для обозначения самого вируса или его производного. Термин охватывает все серотипы, подтипы, а также встречающиеся в природе и рекомбинантные формы, если не требуется иное. Сокращение rAAV относится к рекомбинантному аденоассоциированному вирусу, также называемому рекомбинантным вектором AAV (или вектором rAAV). Термин AAV включает в себя AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10 и их гибриды, AAV птиц, AAV крупного рогатого скота, AAV собак, AAV лошадей, AAV приматов, AAV не приматов и AAV овец. Геномные последовательности различных серотипов AAV, а также последовательности нативных концевых повторов (TR), белков Rep и субъединиц капсида известны в настоящей области техники. Такие последовательности можно найти в литературе или в общедоступных базах данных, таких как GenBank. Используемый в настоящем документе термин вектор rAAV относится к вектору AAV, содержащему полинуклеотидную последовательность, не имеющую происхождения AAV (т.е. полинуклеотид, гетерологичный AAV), как правило, последовательность, представляющую интерес для генетической трансформации клетки. В общем, гетерологичный полинуклеотид фланкирован по меньшей мере одной, а обычно двумя последовательностями инвертированных концевых повторов AAV (ITR). Вектор rAAV может быть одноцепочечным (ssAAV) или самокомплементарным (scAAV). Вирус AAV или вирусная частица AAV относится к вирусной частице, состоящей по меньшей мере из одного капсидного белка AAV и инкапсидированного полинуклеотидного вектора rAAV. Если частица содержит гетерологичный полинуклеотид (т.е. полинуклеотид, отличный от генома AAV дикого типа, такой как трансген, который должен быть доставлен в клетку млекопитающего), ее обычно называют векторной частицей rAAV или просто частицей rAAV. Таким образом, получение частицы rAAV обязательно включает в себя производство вектора rAAV, поскольку такой вектор содержится в частице rAAV.
Используемые в настоящем документе термины лечить, лечение, терапия и т.п. относятся к облегчению, задержке или замедлению прогрессирования, профилактике, ослаблению, уменьшению эффектов или симптомов, предотвращению возникновения, ингибированию или облегчению начало заболеваний или нарушений. Способы настоящего раскрытия можно использовать с любым млекопитающим. Примеры млекопитающих включают в себя, без ограничения, крыс, кошек, собак, лошадей, коров, овец, свиней и, более предпочтительно, людей. Терапевтический эффект включает в себя искоренение или улучшение основного подлежащего лечению заболевания. Кроме того, терапевтический эффект достигается за счет устранения или облегчения одного или нескольких физиологических симптомов, связанных с основным заболеванием, так что улучшение наблюдается у субъекта, несмотря на то, что субъект все еще может страдать от основного нарушения. В некоторых случаях с профилактической целью терапевтическое средство можно вводить субъекту с риском развития определенного заболевания или субъекту, сообщающему об одном или нескольких физиологических симптомах заболевания, даже если диагноз этого заболевания не был поставлен. Способы настоящего раскрытия можно использовать с любым млекопитающим. В некоторых случаях лечение может привести к уменьшению или прекращению симптомов (например, снижению частоты, продолжительности и/или тяжести припадков). Профилактический эффект включает в себя отсрочку или устранение появления заболевания или состояния, отсрочку или устранение появления симптомов заболевания или состояния, замедление, остановку или обращение вспять прогрессирования заболевания или состояния или любую их комбинацию.
Термин эффективное количество или терапевтически эффективное количество относится к тому количеству описанной в настоящем документе композиции, которого достаточно для воздействия на
- 10 046157 предполагаемое применение, включая в себя, без ограничения, лечение заболевания, как определено ниже. Терапевтически эффективное количество может варьироваться в зависимости от предполагаемого лечебного применения (in vivo) или субъекта и подвергаемого лечению патологического состояния, например, массы и возраста субъекта, тяжести патологического состояния, способа введения и т.п., что может легко определить специалист в настоящей области техники. Этот термин также применяется к дозе, которая вызовет конкретный ответ в целевой клетке. Конкретная доза будет варьироваться в зависимости от конкретной выбранной композиции, схемы дозированного введения, которую необходимо соблюдать, вводится ли она в комбинации с другими соединениями, времени введения, ткани, в которую ее вводят, и физической системы доставки, в которой она вводится.
Фрагмент нуклеотидной или пептидной последовательности относится к последовательности, которая короче эталонной или полноразмерной последовательности.
Вариант молекулы относится к аллельным вариациям таких последовательностей, т.е. к последовательности, по существу сходной по структуре и биологической активности либо со всей молекулой, либо с ее фрагментом.
Функциональный фрагмент последовательности ДНК или белка относится к фрагменту, который сохраняет биологическую активность (функциональную или структурную), которая по существу аналогична биологической активности полноразмерной последовательности ДНК или белка. Биологическая активность последовательности ДНК может заключаться в ее способности влиять на экспрессию способом, который, как известно, приписывается полноразмерной последовательности.
Термины субъект и индивидуум используются в настоящем документе взаимозаменяемо для обозначения позвоночного животного, предпочтительно, млекопитающего, более предпочтительно, человека. Описанные в настоящем документе способы могут быть применимы в терапевтических целях для человека, в ветеринарии и/или в доклинических исследованиях на животных моделях заболевания или состояния.
Термин in vivo относится к событию, которое происходит в организме субъекта.
Термин in vitro относится к событию, которое происходит вне тела субъекта. Например, анализ in vitro включает в себя любой анализ, проводимый вне субъекта. Анализы in vitro включают в себя анализы на основе клеток, в которых используются живые или мертвые клетки. Анализы in vitro также включают в себя бесклеточный анализ, в котором не используются интактные клетки.
В общем, идентичность последовательностей или гомология последовательностей, которые могут использоваться взаимозаменяемо, относятся к точному соответствию нуклеотид-нуклеотид или аминокислота-аминокислота двух полинуклеотидных или полипептидных последовательностей, соответственно. Как правило, способы определения идентичности последовательностей включают в себя сравнение двух нуклеотидных или аминокислотных последовательностей и определение их процентной идентичности. Сравнение последовательностей, например, с целью оценки идентичности, может быть выполнено с помощью любого подходящего алгоритма выравнивания, включая в себя, без ограничения, алгоритм Нидлмана-Вунша (см., например, выравниватель EMBOSS Needle, доступный на www.ebi.ac.uk/Tools/psa/emboss_needle/, необязательно с настройками по умолчанию), алгоритм BLAST (см., например, инструмент выравнивания BLAST, доступный на blast.ncbi.nlm.nih.gov/Blast.cgi, необязательно с настройками по умолчанию) и алгоритм Смита-Уотермана (см., например, выравниватель EMBOSS Water, доступный на www.ebi.ac.uk/Tools/psa/emboss_water/, необязательно с настройками по умолчанию). Оптимальное выравнивание можно оценить с использованием любых подходящих параметров выбранного алгоритма, включая в себя параметры по умолчанию. Процент идентичности, также называемый процент гомологии, между двумя последовательностями может быть рассчитан как количество точных совпадений между двумя оптимально выровненными последовательностями, деленное на длину эталонной последовательности и умноженное на 100. Процент идентичности также может быть определен, например, путем сравнения информации о последовательностях с использованием усовершенствованной компьютерной программы BLAST, включая в себя версию 2.2.9, доступную в Национальных институтах здравоохранения. Программа BLAST основана на способе совмещения Karlin and Altschul, Proc. Natl. Acad. Sci. USA 87:2264-2268 (1990) и как описано в Altschul, et al., J. Mol. Biol. 215:403-410 (1990); Karlin and Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5877 (1993) и Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997). Вкратце, программа BLAST определяет идентичность как количество идентичных выровненных символов (т.е. нуклеотидов или аминокислот), деленное на общее количество символов в более короткой из двух последовательностей. Программа может использоваться для определения процента идентичности по всей длине сравниваемых последовательностей. Параметры по умолчанию предоставляются для оптимизации поиска с помощью коротких последовательностей запросов, например, с помощью программы blastp. Программа также позволяет использовать фильтр SEG для маскировки сегментов последовательностей запросов, как это определено программой SEG Wootton and Federhen, Computers and Chemistry 17: 149-163 (1993). Высокая идентичность последовательностей, как правило, включает в себя диапазоны идентичности последовательностей от приблизительно 80% до 100% и целые числа между ними. Используемый в настоящем документе термин сконструированный применительно к белку относится к не встречающемуся в природе белку, включая в себя, без ограниче
- 11 046157 ния, белок, полученный из встречающегося в природе белка, или когда встречающийся в природе белок модифицирован или перепрограммирован, чтобы иметь определенное свойство.
Используемые в настоящем документе термины синтетический и искусственный используются взаимозаменяемо для обозначения белка или его домена, который характеризуется низкой идентичностью последовательности (например, идентичность последовательности составляет менее чем 50%) по отношению к встречающемуся в природе белку человека. Например, домены VPR и VP64 представляют собой синтетические домены трансактивации.
Используемый в настоящем документе термин сконструированный фактор транскрипции или eTF относится к не встречающемуся в природе ДНК-связывающему белку или не встречающемуся в природе модулятору транскрипции, который был модифицирован или перепрограммирован для связывания со специфическим целевым сайтом связывания и/или включения модифицированного или замененного эффекторного домена транскрипции.
Используемый в настоящем документе термин ДНК-связывающий домен может использоваться для обозначения одного или нескольких ДНК-связывающих мотивов, таких как цинковый палец или основной мотив спираль-петля-спираль (bHLH), индивидуально или вместе как часть ДНКсвязывающего белка.
Термины активирующий транскрипцию домен, домен активации транскрипции, домен трансактивации, транс-активирующий домен и TAD используются в настоящем документе взаимозаменяемо и относятся к домену белка, который вместе с ДНК-связывающим доменом может активировать транскрипцию с промотора, контактируя с транскрипционным аппаратом (например, с общими факторами транскрипции и/или РНК-полимеразой) либо напрямую, либо через другие белки, известные как коактиваторы.
Термины домен репрессора транскрипции и TRD используются в настоящем документе взаимозаменяемо и относятся к домену белка, который в сочетании с ДНК-связывающим доменом может репрессировать транскрипцию с промотора, контактируя с транскрипционным механизмом (например, общие факторы транскрипции и/или РНК-полимераза) либо напрямую, либо через другие белки, известные как корепрессоры.
Термин GRCh38.p12 относится к заплаточному релизу 12 Консорциума эталонных геномов Human Build 38 (GRCh38.p12), имеющему регистрационный номер сборки GenBank GCA_000001405.27 и датированному 21 декабря 2017 года.
Если не указано иное, все термины, использованные в настоящем документе, характеризуются тем же значением, что и для специалиста в настоящей области техники, и в практике настоящего изобретения будут использоваться традиционные способы молекулярной биологии, микробиологии и технологии рекомбинантных ДНК, которые находятся в пределах знания специалистов в настоящей области техники.
Сконструированные факторы транскрипции (eTF), которые активируют SCN1A
Согласно одному аспекту в настоящей заявке представлены eTF, которые способны повышать экспрессию гена альфа-субъединицы 1 натриевого канала с регулируемым напряжением (SCN1A) и увеличивать экспрессию его соответствующего белкового продукта Nav1.1. Ген SCN1A принадлежит к семейству генов, кодирующих субъединицы, используемые для сборки натриевых каналов. Эти каналы, которые транспортируют положительно заряженные ионы натрия в клетки, играют ключевую роль в способности клетки генерировать и передавать электрические сигналы. Ген SCN1A кодирует одну часть (альфасубъединицу) натриевого канала, называемого Nav1.1. Эти каналы в основном находятся в головном мозге, где они контролируют поток ионов натрия в клетки. Каналы Nav1.1 участвуют в передаче сигналов от одной нервной клетки (или нейрона) к другой. Было обнаружено, что несколько мутаций в гене SCN1A вызывают генетическую эпилепсию с фебрильными припадками плюс (GEFS+), которая представляет собой спектр припадочных расстройств различной степени тяжести. Эти состояния включают в себя простые фебрильные (связанные с лихорадкой) припадки, которые начинаются в младенчестве и обычно прекращаются к 5 годам, и фебрильные припадки плюс (FS+). FS+ включает в себя фебрильные и другие типы припадков, в том числе не связанные с лихорадкой (афебрильные припадки), которые продолжаются во взрослом возрасте. Спектр GEFS+ также включает в себя другие состояния, такие как синдром Драве (также известный как тяжелая миоклоническая эпилепсия младенчества или SMEI), которые вызывают более серьезные припадки, которые длятся дольше и которые трудно контролировать. Эти повторяющиеся припадки (эпилепсия) могут со временем обостряться и часто сопровождаются снижением функции головного мозга. Многие другие мутации были связаны с семейной гемиплегической мигренью, формой мигренозной головной боли, которая передается в семье, и по меньшей мере одна мутация была связана с эффективностью некоторых противосудорожных лекарственных средств. Таким образом, представленный в настоящем документе eTF, который увеличивает экспрессию SCN1A, можно использовать для лечения множества заболеваний или нарушений, связанных с мутациями в канале Nav1.1.
Факторы транскрипции (TF) представляют собой белки, которые связываются с определенными последовательностями в геноме и контролируют экспрессию генов. Сконструированные факторы транскрипции или eTF, представленные в настоящем документе, которые активируют SCN1A, представляют собой не встречающиеся в природе белки, которые содержат ДНК-связывающий домен (DBD) и по
- 12 046157 меньшей мере один домен, который является модулятором транскрипции, например, либо домен активации транскрипции (TAD), либо транскрипционный репрессорный домен (TRD). Согласно одному варианту осуществления eTF, который активирует SCN1A, может содержать DBD и TAD (например, TADDBD или DBD-TAD), причем DBD и TAD могут происходить из одного и того же белка или из разных белков. Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и два TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, и оба TAD происходят из второго белка, DBD и один TAD происходит из первого белка, а второй TAD происходит из второго белка, или DBD происходит из первого белка, один TAD происходит из второго белка, а второй TAD происходит из третьего белка (например, TAD1-DBD-TAD1, TAD1-DBDTAD2, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 или DBD-TAD1-TAD2). Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и три TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, a TAD происходят из одного или нескольких разных белков, или причем DBD и все TAD происходят из разных белков, например, TADX-TADX-TADX-DBD, TADX-TADX-DBD-TADX, TADX-DBD-TADX-TADX или DBDTADX-TADX-TADX, где каждый X выбран независимо и может быть таким же или отличным от одного или всех других TAD. Примеры включают в себя, например, TAD1-TAD1-DBD-TAD1, TAD1-TAD1DBD-TAD2, TAD1-TAD2-DBD-TAD1, TAD1-TAD2-DBD-TAD2, TAD1-TAD2-DBD-TAD3, TAD1-DBDTAD1-TAD1, TAD1- DBD-TAD2-TAD2, TAD1-DBD-TAD1-TAD2, TAD2-DBD-TAD1-TAD2, TAD1DBD-TAD2-TAD3, TAD1-TAD1-TAD1-DBD, TAD1-TAD2-TAD2-DBD, TAD1-TAD2-TAD2-DBD, TAD1TAD2-TAD3-DBD, DBD-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2, DBD-TAD1-TAD2-TAD2 или
DBD-TAD1-TAD2-TAD3 и т.д. Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и четыре TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, a TAD происходят из одного или нескольких разных белки, или причем DBD и все TAD происходят из разных белков, например, TADX-TADX-TADX-TADX-DBD, TADXTADX-TADX-DBD-TADX, TADX-TADX-DBD-TADX-TADX, TADX- DBD-TADX-TADX-TADX или DBDTADX-TADX-TADX-TADX, где каждый X выбирается независимо и может быть таким же или отличаться от одного или всех других TAD. Примеры включают в себя, например, TAD1-TAD1-DBD-TAD1-TAD1,
TAD 1 -TAD 1-DBD-TAD2-TAD2, TAD1-TAD2-DBD-TAD1-TAD3, TAD 1 -TAD 1 -TAD 1-DBD-TAD2, TAD 1-DBD-TAD2-TAD3-TAD4, TAD 1-DBD-TAD2-TAD3-TAD4,
TAD 1-TAD2-DBD-TAD1-TAD2, TAD 1-TAD3-DBD-TAD1-TAD2, TAD 1-TAD2-TAD3-DBD-TAD4, TAD 1 -DBD-TAD 1-TAD2-TAD3, TAD 1 -TAD 1 -TAD 1 -TAD 1 -DBD,
TAD 1-TAD2-DBD-TAD2-TAD1, TAD 1-TAD2-DBD-TAD3-TAD4, TAD 1 -DBD-TAD 1 -TAD 1-TAD2, TAD2-DBD-TAD1-TAD2-TAD3, TAD 1-TAD2-TAD2-TAD3-DBD,
TAD1-TAD2-TAD3-TAD4-DBD, DBD-TAD1-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2-TAD2, DBDTAD1-TAD2-TAD3-TAD4 или DBD-TAD1-TAD2-TAD3-TAD3 и т.д. Согласно одному варианту осуществления eTF, который активирует SCN1A, содержит DBD и два TAD, которые расположены на одном конце DBD (например, N-конце или C-конце), причем DBD происходит из первого белка, и оба TAD происходят из второго белка, или DBD происходит из первого белка, один TAD происходит из второго белка, а второй TAD происходит из третьего белка (например, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 или DBD-TAD1-TAD2). Согласно определенным вариантам осуществления DBD может представлять собой синтетическую конструкцию, содержащую домены из нескольких белков.
Согласно определенным вариантам осуществления DBD и TAD и/или два TAD могут быть напрямую конъюгированы, например, без промежуточной аминокислотной последовательности, DBD и TAD и/или два TAD могут быть конъюгированы с использованием пептидного линкера или их комбинаций. Согласно определенным вариантам осуществления DBD конъюгирован с TAD и/или один TAD конъюгирован со вторым TAD через линкер, содержащий 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50, 60, 70, 75, 80, 90 или 100 аминокислот или 1-5, 1-10, 1-20, 1-30, 1-40, 1-50, 1-75,
1-100, 5-10, 5-20, 5-30, 5-40, 5-50, 5-75, 5-100, 10-20, 10-30, 10-40, 10-50, 10-75, 10-100, 20-30, 20-40, 2050, 20-75 или 20-100 аминокислот. В некоторых случаях DBD и TAD и/или два TAD конъюгированы через встречающиеся в природе промежуточные остатки, обнаруженные во встречающихся в природе белках, из которых происходят домены. Согласно другим вариантам осуществления DBD и TAD и/или два TAD конъюгированы через синтетическую или экзогенную линкерную последовательность. Подходящие линкеры могут быть гибкими, расщепляемыми, нерасщепляемыми, гидрофильными и/или гидрофобными. Согласно определенным вариантам осуществления DBD и TAD и/или два TAD могут быть слиты вместе через линкер, содержащий множество остатков глицина и/или серина. Примеры пептидных линкеров глицина/серина включают в себя [GS]n, [GGGS]n (SEQ ID NO: 179), [GGGGS]n (SEQ ID NO: 180), [GGSG]n (SEQ ID NO: 181), где n представляет собой целое число, равное или больше 1. Согласно определенным вариантам осуществления линкер, используемый для конъюгирования DBD и TAD и/или двух TAD, представляет собой GGSGGGSG (SEQ ID NO: 177). Согласно определенным вариантам осуществления линкер, используемый для конъюгирования DBD и TAD и/или двух TAD, представляет собой GGSGGGSGGGSGGGSG (SEQ ID NO: 178). Согласно определенным вариантам осуществления, когда DBD конъюгирован с двумя TAD, первый и второй TAD могут быть конъюгированы с DBD с одинаковыми или разными линкерами, или один TAD может быть конъюгирован с DBD с помощью линкера, а
- 13 046157 другой TAD может быть конъюгирован напрямую с DBD (например, без промежуточной линкерной последовательности), или оба TAD могут быть непосредственно конъюгированы с DBD (например, без промежуточных линкерных последовательностей). Согласно определенным вариантам осуществления, когда DBD конъюгирован с двумя TAD на одном и том же конце (например, N-конце или C-конце), линкер, соединяющий два TAD, может быть таким же или отличаться от линкера, соединяющего TAD с DBD, или TAD могут быть конъюгированы друг с другом с помощью линкера, но TAD напрямую конъюгированы с DBD (например, без промежуточной линкерной последовательности), или TAD могут быть напрямую конъюгированы друг с другом (например, без промежуточных линкерных последовательностей), но TAD конъюгированы с DBD с помощью линкера. Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, не содержат один или несколько тегов HA (например, SEQ ID NO: 171), расположенных между DBD и одним или несколькими TAD.
Представленные в настоящем документе eTF, которые активируют SCN1A, обладают свойствами, отличными от природных факторов транскрипции. Согласно определенным вариантам осуществления eTF, который активирует SCN1A, содержит DBD, полученный из встречающегося в природе белка, который был модифицирован таким образом, что DBD связывается с другим целевым сайтом по сравнению с встречающимся в природе белком, из которого он получен, и eTF, содержащий такой модифицированный DBD модулирует экспрессию другого гена (например, SCN1A) по сравнению с природным белком, из которого получен DBD (например, геном, отличным от SCN1A). Согласно другим вариантам осуществления eTF, представленный в настоящем документе, который активирует SCN1A, содержит TAD, полученный из встречающегося в природе белка, который был модифицирован таким образом, что eTF, содержащий такой модифицированный TAD, модулирует экспрессию другого гена (например, SCN1A) по сравнению с встречающимся в природе белком, из которого получен TAD (например, ген, отличный от SCN1A), и/или eTF, содержащий такой модифицированный TAD, по-разному модулирует экспрессию SCN1A (например, активирует или подавляет) по сравнению с встречающимся в природе белком, из которого получен TAD. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, полученный из встречающегося в природе белка, и TAD, полученный из встречающегося в природе белка (одного и того же или разных белков), причем как DBD, так и TAD были модифицированы. Согласно таким вариантам осуществления DBD может связываться с другим целевым сайтом по сравнению с встречающимся в природе белком, из которого он был получен, eTF, содержащий такой модифицированный DBD и TAD, модулирует экспрессию другого гена (например, SCN1A) по сравнению с встречающимся в природе белком, из которых получены домены (например, ген(-ы), отличный от SCN1A), и/или eTF, содержащий такие модифицированные DBD и TAD, по-разному модулирует экспрессию SCN1A (например, активирует или подавляет) по сравнению с встречающимися в природе белками, из которых получены домены DBD и TAD.
ДНК-связывающие домены (DBD).
Приведенные в настоящем документе eTF, которые активируют SCN1A, могут содержать любой подходящий DBD, который связывается с представляющим интерес целевым сайтом (например, целевой сайт, который приводит к положительной регуляции SCN1A при связывании с помощью eTF, представленного в настоящем документе). Согласно определенным вариантам осуществления DBD может представлять собой синтетически разработанный DBD. Согласно другим вариантам осуществления DBD может быть получен из встречающегося в природе белка. Семейства DBD включают в себя основную спираль-петлю-спираль (bHLH) (например, c-Myc), основную лейциновую молнию (например, C/EBP), спираль-поворот-спираль (например, Oct-1) и цинковые пальцы (например, EGR1 или EGR3). Эти семейства демонстрируют широкий спектр специфичностей связывания ДНК и генных мишеней. Как предполагается в настоящем документе, любой из известных белков фактора транскрипции человека может служить в качестве белковой платформы для конструирования и/или перепрограммирования DBD для распознавания конкретного целевого сайта, что приводит к модуляции экспрессии эндогенного гена SCN1A. Согласно иллюстративным вариантам осуществления DBD, представленный в настоящем документе, содержит домен типа цинковые пальцы, связывающий домен TALEN или комплекс gRNA/Cas.
Представленный в настоящем документе DBD может быть разработан для распознавания любого целевого сайта, который приводит к активации SCN1A. Согласно иллюстративным вариантам осуществления DBD разработан для распознавания местоположения в геноме и повышения экспрессии эндогенного гена SCN1A, связанного с eTF. Сайты связывания, способные модулировать экспрессию эндогенного гена SCNIA при связывании с помощью представленного в настоящем документе eTF, могут быть расположены в любом месте генома, что приводит к модуляции экспрессии гена SCN1A. Согласно различным вариантам осуществления сайт связывания может быть расположен на хромосоме, отличной от SCN1A, на той же хромосоме, что и SCN1A, выше против хода транскрипции от сайта начала транскрипции (TSS) гена SCN1A, ниже по ходу транскрипции от TSS гена SCN1A, проксимальнее от TSS гена SCN1A, дистальнее от TSS гена SCN1A, в кодирующей области гена SCN1A, в интроне гена SCN1A, ниже по ходу транскрипции от полиА-хвоста гена SCN1A, в промоторной последовательности, которая регулирует ген SCN1A, или в последовательности энхансера, которая регулирует ген SCN1A.
- 14 046157
DBD может быть разработан для связывания с целевым сайтом связывания любой длины при условии, что он обеспечивает специфическое распознавание последовательности целевого сайта связывания посредством DBD, например, с минимальным или нулевым связыванием вне мишени. Согласно определенным вариантам осуществления целевой сайт связывания может модулировать экспрессию SCN1A при связывании с eTF на уровне, который является по меньшей мере 2-кратным, 5-кратным, 10-кратным, 20-кратным, 50-кратным, 75-кратным, 100-кратным, 150-кратным, 200-кратным, 250-кратным, 500кратным или более по сравнению со всеми другими генами. Согласно определенным вариантам осуществления целевой сайт связывания может модулировать экспрессию SCNIA при связывании с eTF на уровне, который является по меньшей мере 2-кратным, 5-кратным, 10-кратным, 20-кратным, 50-кратным, 75-кратным, 100-кратным, 150-кратным, 200-кратным, 250-кратным, 500-кратным или более по сравнению с 40 ближайшими соседними генами (например, 40 генов, расположенных ближе всего к хромосоме, выше против хода транскрипции или ниже по ходу транскрипции от кодирующей последовательности SCN1A). Согласно определенным вариантам осуществления целевой сайт связывания может составлять по меньшей мере 5 п.н., 10 п.н., 15 п.н., 20 п.н., 25 п.н., 30 п.н., 35 п.н., 40 п.н., 45 п.н. или 50 п.н. или более. Конкретная длина сайта связывания определяется типом DBD в eTF. В общем, чем больше длина сайта связывания, тем выше специфичность связывания и модуляции экспрессии гена (например, более длинные сайты связывания характеризуются меньшим количеством нецелевых эффектов). Согласно определенным вариантам осуществления, eTF, содержащий DBD, распознающий более длинный целевой сайт связывания, имеет меньше нецелевых эффектов, связанных с неспецифическим связыванием (таких как, например, модуляция экспрессии нецелевого гена или отличного от SCN1A гена) относительно нецелевых эффектов, наблюдаемых с eTF, имеющим DBD, который связывается с более коротким целевым сайтом. В некоторых случаях снижение нецелевого связывания по меньшей мере в 1,2, 1,3, 1,4, 1,5, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз ниже по сравнению с сопоставимым eTF, имеющим DBD, который распознает более короткий целевой сайт связывания.
Согласно определенным вариантам осуществления представленный в настоящем документе DBD может быть модифицирован, чтобы иметь повышенную аффинность связывания, так что он связывается с целевым сайтом связывания в течение более длительного периода времени, так что TAD, конъюгированный с DBD, может рекрутировать больше факторов транскрипции и/или рекрутировать такой фактор транскрипции на более длительный период времени, чтобы оказывать большее влияние на уровень экспрессии эндогенного гена SCN1A. Согласно определенным вариантам осуществления DBD может быть модифицирован для увеличения его специфического связывания (или целевого связывания) с желаемым целевым сайтом и/или модифицирован для уменьшения его неспецифического или нецелевого связывания.
Согласно различным вариантам осуществления связывание между DBD или eTF и целевым сайтом связывания может быть определено с использованием различных способов. Согласно определенным вариантам осуществления специфическое связывание между DBD или eTF и целевым сайтом связывания может быть определено с использованием анализа определения изменения подвижности, анализа защиты от ДНКазы или любого другого способа in vitro, известного в настоящей области техники для анализа связывания белок-ДНК. Согласно другим вариантам осуществления специфическое связывание между eTF и целевым сайтом связывания можно определить с помощью функционального анализа, например, путем измерения экспрессии (РНК или белка) гена (например, SCN1A), когда целевой сайт связывания связан с eTF. Например, целевой сайт связывания может быть расположен выше против хода транскрипции от репортерного гена (такого как, например, eGFP) или гена SCN1A в векторе, содержащемся в клетке или интегрированном в геном клетки, причем клетка экспрессирует eTF. Альтернативно, экспрессирующий eTF вектор может быть введен в тип клеток, который в природе содержит ген SCN1A. Более высокие уровни экспрессии репортерного гена (или SCN1A) в присутствии eTF по сравнению с контролем (например, без eTF или eTF, который распознает другой целевой сайт) указывают на то, что DBD eTF связывается с целевым сайтом. Подходящие in vitro (например, неклеточные) системы транскрипции и трансляции также могут быть использованы аналогичным образом. Согласно определенным вариантам осуществления eTF, который связывается с целевым сайтом, может характеризоваться по меньшей мере 2-кратной, 3-кратной, 5-кратной, 10-кратной, 15-кратной, 20-кратной, 30-кратной, 50-кратной, 75кратной, 100-кратной, 150-кратной или большей экспрессией репортерного гена или SCN1A по сравнению с контролем (например, без eTF или с eTF, который распознает другой целевой сайт).
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, размер которого составляет по меньшей мере 9 п.н., 12 п.н., 15 п.н., 18 п.н., 21 п.н., 24 п.н., 27 п.н., 30 п.н., 33 п.н. или 36 п.н.; более чем 9 п.н., 12 п.н., 15 п.н., 18 п.н., 21 п.н., 24 п.н., 27 п.н. или 30 п.н.; или 9-33 п.н., 9-30 п.н., 9-27 п.н., 9-24 п.н., 9-21 п.н., 9-18 п.н., 9-15 п.н., 9-12 п.н., 12-33 п.н., 12-30 п.н., 12-27 п.н., 12-24 п.н., 12-21 п.н., 12-18 п.н., 12-15 п.н., 15-33 п.н., 15-30 п.н., 15-27 п.н., 15-24 п.н., 15-21 п.н., 15-18 п.н., 18-33 п.н., 18-30 п.н., 18-27 п.н., 1824 п.н., 18-21 п.н., 21-33 п.н., 21-30 п.н., 21-27 п.н., 21-24 п.н., 24-33 п.н., 24-30 п.н., 24-27 п.н., 27-33 п.н., 27-30 п.н. или 30-33 п.н.. Согласно иллюстративным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который составляет
- 15 046157
18-27 п.н., 18 п.н. или 27 п.н.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, расположенный на хромосоме 2. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, расположенный на хромосоме 2 в пределах 110 т.п.н., 100 т.п.н., 90 т.п.н., 80 т.п.н., 70 т.п.н., 60 т.п.н., 50 т.п.н., 40 т.п.н., 30 т.п.н., 20 т.п.н., 10 т.п.н., 5 т.п.н., 4 т.п.н., 3 т.п.н., 2 т.п.н. или 1 т.п.н. выше против хода транскрипции или ниже по ходу транскрипции от ТСС SCN1A. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах 110 т.п.н. выше против хода транскрипции от TSS SCN1A. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах 110 т.п.н. ниже по ходу транскрипции от TSS SCN1A. Согласно иллюстративным вариантам осуществления такие целевые сайты связывания составляют 18-27 п.н., 18 п.н. или 27 п.н.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах положений 166179652-165989571, в пределах положений 166128050-166127958, в пределах положений 166155414-166140590, в пределах положений 166179652-1661777272 или в пределах положений 1659990246-165989592 (все со ссылкой на GRCh38.p12). Согласно иллюстративным вариантам осуществления такие целевые сайты связывания составляют 18-27 п.н., 18 п.н. или 27 п.н.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166178880, 166177369, 166177362, 166177299, 166177299, 166155393, 166155264, 166149373, 166149176, 166149165, 166149118, 166148953, 166148565, 166142396, 166142391, 166142344, 166142239, 166141162, 166140928, 166140590, 165990076, 165989684, 165989571, 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12) и (iii) способен вызывать по меньшей мере 1,2-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 25, 30, 31 или 35-66 или состоящим из нее, и (ii) способен вызывать по меньшей мере 1,2-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать как минимум 2кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 30, 31, 37, 38, 45, 47, 48, 49, 55, 61, 62 или 64 или состоящим из нее, и (ii) способен вызывать по меньшей мере 2-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., и (ii) перекрывается с положением на хромосоме 2, выбранным из 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 5-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 30, 31, 37 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 5-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166128002, 166128037, или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 15-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 30, 37 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 15-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
- 16 046157
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 20-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 30 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 20-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2 в положении 166128025 и (iii) способен вызывать по меньшей мере 25-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим или состоящим из SEQ ID NO: 30, и (ii) способен вызывать по меньшей мере 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н. и (ii) связывается с геномной областью, которая находится в пределах по меньшей мере 1 т.п.н., 750 п.н., 500 п.н., 400 п.н., 300 п.н., 200 п.н., 100 п.н. или 50 п.н. геномного местоположения, имеющего последовательность любой из SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2кратное, 5-кратное, 15-кратное, 20-кратное или 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н. и (ii) связывается с областью генома, которая по меньшей мере частично перекрывается с геномным местоположением, имеющим последовательность любой из SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2-кратное, 5-кратное, 15-кратное, 20-кратное или 25-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, имеющий любую из следующих последовательностей: SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2-кратное, 5-кратное, 15кратное, 20-кратное или 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, приводит по меньшей мере к 1,5-кратному, 2-кратному, 3-кратному, 4-кратному, 5-кратному, 6-кратному, 7-кратному, 8-кратному, 9-кратному, 10-кратному, 15-кратному, 20-кратному, 25-кратному, 50-кратному, 100-кратному или более или по меньшей мере 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более активации экспрессии SCN1A (РНК SCN1A и/или белок Nav1.1) в клетке или in vivo по сравнению с контролем (например, без eTF или с eTF, который не распознает целевой сайт). Согласно различным вариантам осуществления активация экспрессии SCNIA может быть обнаружена с помощью способов ПЦР, вестерн-блоттинга или иммуноанализов.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, связывается с целевым сайтом, который способен увеличивать экспрессию SCNIA по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2 раза, 3 раза, 4 раза, 5 раз, 8 раз, 10 раз, 12 раз, 15 раз, 18 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз, 75 раз, 100 раз или больше или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более относительно контроля в анализе активации транскрипции. Иллюстративный анализ активации транскрипции SCN1A представлен в настоящем документе в примере 3. Вкратце, HEK293 трансфицируют плазмидой, несущей eTF или контрольную репортерную конструкцию eGFP. Через 48 часов после трансфекции клетки собирают, выделяют РНК и подвергают обратной транскрипции, а полученные образцы кДНК анализируют с помощью кПЦР (например, с использованием праймеров, имеющих SEQ ID NO: 185 и 186) для количественного определения содержания эндогенного транскрипта SCN1A. GAPDH можно использовать в качестве эталонного гена для определения относительных уровней экспрессии SCN1A.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, кото
- 17 046157 рый активирует SCN1A, характеризуется минимальными нецелевыми эффектами, например, нецелевыми эффектами, связанными с неспецифическим связыванием, такими как, например, модуляция экспрессии нецелевого гена или отличного от SCN1A гена. Согласно одному варианту осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, специфически активирует SCN1A по сравнению с контролем, по меньшей мере в 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз или 50 раз больше, чем экспрессия, произведенная eTF для одного или нескольких нецелевых генов по сравнению с контролем. Согласно иллюстративному варианту осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, специфически активирует транскрипцию гена SCN1A по сравнению с контролем, по меньшей мере, в 15 раз больше, чем транскрипция 40 ближайших соседних генов (например, 40 ближайших генов, расположенных к кодирующей последовательности SCN1A на хромосоме 2), производимая eTF относительно контроля, например, PLA2R1, ITGB6, RBMS1, TANK, PSMD14, TBR1, SLC4A10, DPP4, FAP, IFIH1, GCA, FIGN, GRB14, COBLL1, SLC38A11, SCN3A, SCN2A, CSRNP3, GALNT3, TTC21B, SCN9A, SCN7A, B3GALT1, STK39, CERS6, NOSTRIN, SPC25, ABCB11, DHRS9, BBS5, KLHL41, FASTKD1, PPIG, CCDC173, PHOSPHO2, KLHL23, SSB, METTL5, UBR3 и MYO3B (смотрите табл. 14). Согласно различным вариантам осуществления активация транскрипции гена SCN1A может быть обнаружена с помощью способов ПЦР.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, способен снижать частоту припадков в анализе гипертермических припадков (HTS) в модели синдрома Драве на мышах Scn1atm1kea. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен снижать частоту припадков при температуре 42,6°C в анализе HTS по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2,0 раза или более или по меньшей мере на 20%, 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% или более по сравнению с контролем (например, обработанный PBS или воздействие вектором AAV, содержащим последовательность, кодирующую eGFP). Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен снижать частоту припадков при температуре 42,6°C в анализе HTS, так что по меньшей мере у 60%, 62%, 65%, 70%, 75%, 76%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% мышей, участвовавших в анализе, не наблюдалось припадков при температуре 42,6°C. Иллюстративный анализ HTS описан в настоящем документе в примере 6. Вкратце, пометам детенышей, полученным от самцов мышей Scn1a +/-, скрещенных с самками мышей C57Bl/6J, может быть введен вектор AAV9, кодирующий eTF, который активирует SCN1A, как предусмотрено в настоящем документе, или контрольный вектор, кодирующий eGFP, посредством двустороннего ICV в P1. Мышам можно вводить дозу ~1,0E10-5,0E12 копий геномов/мышь. Анализ HTS проводят на гетерозиготных мышах P26-P28 SCNIA и SCNIA дикого типа на смешанном фоне 129Stac X C57BL/6 путем повышения температуры тела мышей (в контролируемых условиях и с контролем температуры тела) на ~0,5°C каждые 2 минуты до начала первого тоникоклонического припадка, сопровождающегося потерей положения тела, или до достижения температуры тела 43°C. Считается, что у мыши не было припадка, если не было обнаружено припадка с потерей положения тела в течение всего периода эксперимента.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, способен увеличивать выживаемость мыши, гетерозиготной по SCN1A, например, линии мышей Scn1atm1kea. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен увеличивать выживаемость гетерозиготных мышей SCN1A при P100 по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2,0 раза или более, или по меньшей мере на 20%, 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% или более, как по сравнению с контролем (например, обработанным PBS или обработанным вектором AAV, содержащим последовательность, кодирующую eGFP). Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен увеличивать выживаемость гетерозиготных мышей SCN1A при P100, так что по меньшей мере 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% мышей, задействованных в анализе, все еще живы при P100. Иллюстративный анализ выживаемости описан в настоящем документе в примере 7. Вкратце, пометам детенышей, полученным от самцов мышей Scn1a +/-, скрещенных с самками мышей C57Bl/6J, может быть введен вектор AAV9 посредством двустороннего ICV в точке P1. Мышам можно вводить дозу ~1,0E10-5,0E12 копий геномов/мышь. Определяют количество мышей, доживших до P100.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, может содержать DBD из белка типа цинковые пальцы, полученного из белка типа цинковые пальцы, или нуклеаза представляет собой инактивированный белок типа цинковые пальцы. Цинковый палец представляет собой небольшой структурный мотив белка, который характеризуется координацией одного или нескольких ионов цинка (Zn2+) для стабилизации складки. Домены типа цинковые пальцы (Znf) представляют собой относительно небольшие белковые мотивы, которые содержат несколько пальцевидных выступов, которые создают тандемные контакты с целевым участком ДНК. Модульная природа мотива цинкового пальца позволяет связывать большое количество комбинаций последовательностей ДНК с высокой степенью аффинности и специфичности, и поэтому
- 18 046157 идеально подходит для создания белка, который может быть нацелен на определенные последовательности ДНК и связывать их. Многие сконструированные наборы цинковых пальцев основаны на домене типа цинковые пальцы мышиного фактора транскрипции Zif268. Zif268 содержит три отдельных мотива цинковые пальцы, которые вместе связывают последовательность из 9 п.н. с высокой аффинностью. Было идентифицировано большое количество белков типа цинковые пальцы, и они были охарактеризованы на различные типы на основе структуры, которая дополнительно описана в настоящем документе. Любой такой белок типа цинковые пальцы применим в связи с описанными в настоящем документе DBD.
Доступны различные способы конструирования белков типа цинковые пальцы. Например, описаны способы создания белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, Liu Q, et al., Design of polydactyl zinc-finger proteins for unique addressing within complex genomes, Proc Natl Acad Sci USA. 94 (11): 5525-30 (1997); Wright DA et al., Standardized reagents and protocols for engineering zinc finger nucleases by modular assembly, Nat Protoc. Nat Protoc. 2006; 1(3): 1637-52 и CA Gersbach and T Gaj, Synthetic Zinc Finger Proteins: The Advent of Targeted Gene Regulation and Genome Modification Technologies, Am Chem Soc 47: 2309-2318 (2014). Кроме того, общедоступны различные веб-инструменты для создания белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, программные инструменты для разработки нуклеаз типа цинковые пальцы и веб-сайт анализа сконструированных данных генома от OmicX, доступный в Интернете по адресу omictools.com/zfns-category; и вебсайт дизайна Zinc Finger Tools от Scripps, доступный в Интернете по адресу scripps.edu/barbas/zfdesign/zfdesignhome.php. Кроме того, доступны различные коммерчески доступные услуги по разработке белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги или наборы, предлагаемые Creative Biolabs (в Интернете по адресу creative-biolabs.com/Design-and-Synthesis-of-ArtificialZinc-Finger-Proteins.html), Modular Assembly Kit Zinc Finger Consortium, доступный от Addgene (в Интернете по адресу addgene.org/kits/zfc-modular-assembly/), или the CompoZr Custom ZFN Service от Sigma Aldrich (в Интернете по адресу sigmaaldrich.com/life-science/zinc-finger-nuclease-technology/customzfn.html).
Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, содержат DBD, содержащий один или несколько цинковых пальцев, или получены из DBD белка типа цинковые пальцы. В некоторых случаях DBD содержит несколько цинковых пальцев, причем каждый цинковый палец связан с другим цинковым пальцем или другим доменом либо на своем N-конце, либо на C-конце, или на обоих через аминокислотный линкер. В некоторых случаях представленный в настоящем документе DBD содержит один или несколько цинковых пальцев из одного или нескольких типов цинковых пальцев, описанных в табл. 9. В некоторых случаях представленный в настоящем документе DBD содержит множество структур или мотивов цинковых пальцев или множество цинковых пальцев, имеющих одну или несколько из SEQ ID NO: 152-167 или любую их комбинацию. Согласно определенным вариантам осуществления DBD содержит X-[ZF-X]n и/или [X-ZF]n-X, причем ZF представляет собой домен типа цинковые пальцы, содержащий любой из мотивов, перечисленных в табл. 9 (например, любой из SEQ ID NO: 136-146), X представляет собой аминокислотный линкер, содержащий 1-50 аминокислот, и n представляет собой целое число от 1 до 15, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, причем каждый ZF может независимо иметь ту же последовательность или последовательность, отличную от других последовательностей ZF в DBD, и причем каждый линкер X может независимо иметь такую же последовательность или последовательность, отличную от других последовательностей X в DBD. Каждый цинковый палец может быть связан с другой последовательностью, цинковым пальцем или доменом на своем C-конце, N-конце или с обоими. В DBD каждый линкер X может быть идентичным по последовательности, длине и/или свойству (например, гибкости или заряду) или отличаться по последовательности, длине и/или свойству. В некоторых случаях два или более линкера могут быть идентичными, в то время как другие линкеры различны. Согласно иллюстративным вариантам осуществления линкер может быть получен или быть производным от последовательностей, соединяющих цинковые пальцы, обнаруженных в одном или нескольких встречающихся в природе белках типа цинковые пальцы, представленных в табл. 9. Согласно другим вариантам осуществления подходящие линкерные последовательности включают в себя, например, линкеры из 5 или более аминокислот в длину. См. также патент США № 6479626; 6903185 и 7153949 для иллюстративных линкерных последовательностей из 6 или более аминокислот в длину, каждая из которых полностью включена в настоящий документ. Предлагаемые в настоящем документе белки DBD могут включать в себя любую комбинацию подходящих линкеров между отдельными цинковыми пальцами белка. Описанные в настоящем документе белки DBD могут включать в себя любую комбинацию подходящих линкеров между отдельными цинковыми пальцами белка.
Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, содержат DBD, содержащий один или несколько классических цинковых пальцев. Классический цинковый палец C2H2 содержит два цистеина в одной цепи и два остатка гис
- 19 046157 тидина в другой цепи, координируемых ионом цинка. Классический домен типа цинковый палец содержит два β-листа и одну α-спираль, причем а-спираль взаимодействует с молекулой ДНК и формирует основу связывания DBD с целевым сайтом и может называться спиралью распознавания. Согласно иллюстративным вариантам осуществления спираль распознавания цинковых пальцев содержит по меньшей мере одну аминокислотную замену в положении -1, 2, 3 или 6, тем самым изменяя специфичность связывания домена типа цинковые пальцы. Согласно другим вариантам осуществления представленный в настоящем документе DBD содержит один или несколько неклассических цинковых пальцев, например, C2-H2, C2-CH и C2-C2.
Согласно другому варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, содержащий мотив типа цинковые пальцы, имеющий следующую структуру: LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147), где n представляет собой целое число от 1 до 15, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, и каждый X независимо представляет собой последовательность распознавания (например, спираль распознавания), способную связываться с 3 п.н. целевой последовательности. Согласно иллюстративным вариантам осуществления n равно 3, 6 или 9. Согласно особенно предпочтительному варианту осуществления n равно 6. Согласно различным вариантам осуществления каждый X может независимо иметь одинаковую аминокислотную последовательность или отличную аминокислотную последовательность по сравнению с другими последовательностями X в DBD. Согласно иллюстративному варианту осуществления каждый X представляет собой последовательность, содержащую 7 аминокислот, которая была разработана для взаимодействия с 3 п.н. представляющего интерес целевого сайта связывания с использованием Zinger Finger Design Tool от Scripps, расположенного в Интернете по адресу scripps.edu/barbas/ zfdesign/zfdesignhome.php.
Поскольку каждый цинковый палец в DBD распознает 3 п.н., количество цинковых пальцев, включенных в DBD, сообщает длину сайта связывания, распознаваемого DBD, например, DBD с 1 цинковым пальцем распознает целевой сайт связывания, имеющий 3 п.н., DBD с 2 цинковыми пальцами распознает целевой сайт связывания, имеющий 6 п.н., DBD с 3 цинковыми пальцами распознает целевой сайт связывания, имеющий 9 п.н., DBD с 4 цинковыми пальцами распознает целевой сайт связывания, имеющий 12 п.н., DBD с 5 цинковыми пальцами распознает целевой сайт связывания, имеющий 15 п.н., DBD с 6 цинковыми пальцами распознает целевой сайт связывания, имеющий 18 п.н., DBD с 9 цинковыми пальцами распознает целевой сайт связывания, имеющий 27 п.н., и т. д. В общем, DBD, которые распознают более длинные целевые сайты связывания, будут проявлять большую специфичность связывания (например, меньшее нецелевое связывание или неспецифическое связывание).
Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который происходит из встречающегося в природе белка типа цинковые пальцы путем выполнения одной или нескольких аминокислотных замен в одной или нескольких спиралях распознавания доменов типа цинковые пальцы для изменения специфичности связывания DBD (например, изменение целевого сайта, распознаваемого DBD). Представленный в настоящем документе DBD может быть получен из любого встречающегося в природе белка типа цинковые пальцы. Согласно различным вариантам осуществления такой DBD может быть получен из белка типа цинковые пальцы любого вида, например, мыши, крысы, человека и т.д. Согласно иллюстративному варианту осуществления представленный в настоящем документе DBD получен из белка типа цинковые пальцы человека. Согласно определенным вариантам осуществления представленный в настоящем документе DBD получен из встречающегося в природе белка, перечисленного в табл. 9. Согласно иллюстративному варианту осуществления представленный в настоящем документе белок DBD получен из белка типа цинковые пальцы EGR человека, например, EGR1, EGR2, EGR3 или EGR4.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который происходит из встречающегося в природе белка, путем модификации DBD для увеличения количества доменов типа цинковые пальцы в белке DBD путем повторения одного или нескольких цинковые пальцев в пределах DBD встречающегося в природе белка. Согласно определенным вариантам осуществления такие модификации включают в себя дупликацию, утроение, учетверение или дальнейшее умножение цинковых пальцев в пределах DBD встречающегося в природе белка. В некоторых случаях умножается один цинковый палец из DBD человеческого белка, например, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или более копий одного и того же мотива цинкового пальца повторяется в DBD eTF. В некоторых случаях набор цинковых пальцев из DBD встречающегося в природе белка умножается, например, набор из 3 цинковых пальцев из DBD встречающегося в природе белка дублируется, чтобы получить eTF, имеющий DBD с 6 цинковыми пальцами, троекратно повторяется для получения DBD eTF с 9 цинковыми пальцами или повторяется четыре раза для получения DBD eTF с 12 цинковыми пальцами и т.д. В некоторых случаях набор цинковых пальцев из DBD встречающегося в природе белка частично реплицируется для формирования DBD eTF, имеющего большее количество цинковых пальцев, например, DBD eTF содержит четыре цинковых пальца, причем цинковые пальцы представляют собой одну копию первого цинкового пальца, одну копию второго цинкового пальца и две копии третьего цинкового пальца из встречающегося в природе белка,
- 20 046157 всего четыре цинковых пальца в DBD eTF. Затем такие DBD дополнительно модифицируют, производя одну или несколько аминокислотных замен в одной или нескольких спиралях распознавания доменов типа цинковые пальцы, чтобы изменить специфичность связывания DBD (например, изменяя целевой сайт, распознаваемый DBD). Согласно иллюстративным вариантам осуществления DBD получают из встречающегося в природе человеческого белка, такого как белок типа цинковые пальцы EGR человека, например, EGR1, EGR2, EGR3 или EGR4.
EGR1 и EGR3 человека характеризуются трехпальцевым DBD типа цинковые пальцы C2H2. Общие правила связывания для цинковых пальцев предусматривают, что все три пальца взаимодействуют со своей родственной последовательностью ДНК с аналогичной геометрией, используя одни и те же аминокислоты в альфа-спирали каждого цинкового пальца для определения специфичности или распознавания последовательности целевого сайта связывания. Такие правила связывания позволяют изменять DBD EGR1 или EGR3 для создания DBD, который распознает желаемый целевой сайт связывания. В некоторых случаях спираль распознавания ДНК из 7 аминокислот в мотиве цинкового пальца EGR1 или EGR3 модифицируется в соответствии с опубликованными правилами разработки цинковых пальцев. Согласно определенным вариантам осуществления каждый цинковый палец в DBD с тремя пальцами EGR1 или EGR3 модифицируется, например, путем изменения последовательности одной или нескольких спиралей распознавания и/или путем увеличения количества цинковых пальцев в DBD. Согласно определенным вариантам осуществления EGR1 или EGR3 перепрограммированы для распознавания целевого сайта связывания по меньшей мере из 9, 12, 15, 18, 21, 24, 27, 30, 33, 36 или более пар оснований в желаемом целевом сайте. Согласно определенным вариантам осуществления такой DBD, полученный из ERG1 или EGR3, содержит по меньшей мере 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или более цинковых пальцев. Согласно иллюстративному варианту осуществления один или несколько цинковых пальцев в DBD содержат по меньшей мере одну аминокислотную замену в положении -1, 2, 3 или 6 спирали распознавания.
Согласно различным вариантам осуществления eTF, который активирует SCN1A, содержащий DBD, полученный из EGR1 или EGR3, характеризуется специфичностью связывания ДНК, которая отличается от специфичности связывания встречающихся в природе EGR1 или EGR3, например, DBD распознает целевой сайт связывания, имеющий последовательность, отличную от последовательности сайта связывания, распознаваемой Лмодифицированными EGR1 или EGR3: (GCG(T/G)GGGCG) (SEQ ID NO: 182).
Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который представляет собой комплекс gRNA/Cas. CRISPR (кластеризованные регулярные промежуточные короткие палиндромные повторы)/Cas9 представляет собой инструмент для редактирования генома, который позволяет направленно воздействовать на сайтспецифический геном. Система CRISPR/Cas типа II представляет собой прокариотическую систему адаптивного иммунного ответа, которая использует некодирующие РНК, чтобы направлять нуклеазу Cas9 для индукции сайт-специфического расщепления ДНК. Система CRISPR/Cas9 была использована для создания простого, программируемого с помощью РНК способа, обеспечивающего редактирование генома в клетках млекопитающих. Одна направляющая РНК (sgRNA) может быть создана для направления нуклеазы Cas9 в конкретное место генома, которое затем связывается комплексом gRNA/Cas9. gRNA может быть сконструирована для связывания с представляющим интерес целевым сайтом с использованием различных способов и инструментов. Например, способы создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК описаны в Aach, et al. Flexible algorithm for identifying specific Cas9 targets in genomes. BioRxiv, Cold Spring Harbor Labs, doi: http://dx.doi.org/10.1101/005074 (2014); Bae, et al. Cas-OFFinder: a fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics. 30(10): 1473-1475 (2014); Doench, J. G. et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPRCas9. Nat Biotech 34, 184-191 (2016); Gratz, et al. Highly specific and efficient CRISPR/Cas9-catalyzed homology-directed repair in Drosophila. Genetics. 196(4):961-971 (2014); Heigwer, et al. E-CRISP: fast CRISPR target site identification. Nat Methods. 11(2):122-123 (2014); Ma, et al. A guide RNA sequence design platform for the CRISPR/Cas9 system for model organism genomes. Biomed Res Int. doi:http://doi.org/10.1155/2013/270805 (2013); Montague, et al. CHOPCHOP: a CRISPR/Cas9 and TALEN web tool for genome editing. Nucleic Acids Res. 42(W1):W401-W407 (2014); Liu, et al. CRISPR-ERA: a comprehensive design tool for CRISPR-mediated gene editing, repression and activation. Bioinformatics. 31(22):3676-3678 (2015); Ran, et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature. 520(7546):186-191 (2015); Wu, et al. Target specificity of the CRISPR-Cas9 system. Quant Biol. 2(2):59-70 (2015); Xiao, et al. CasOT: a genome-wide Cas9/gRNA off-target searching tool. Bioinformatics. 30(8):11801182 (2014); Zetsche, et al. Cpf1 is a single RNA-guided endonuclease of a Class 2 CRISPR-Cas System. Cell. 163(3):759-771 (2105). Кроме того, общедоступны различные веб-инструменты для создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, инструмент разработки CRISPR gRNA, доступный от AUTM в Интернете по адресу atum.bio/eCommerce/cas9/input?multipleContacts=false; инструмент разработки CRISPRa/i gRNA, доступ
- 21 046157 ный от Broad Institute в Интернете по адресу portals.broadinstitute.org/gpp/public/analysis-tools/sgrnadesign-crisprai; инструмент разработки E-CRISP, доступный в Немецком онкологическом исследовательском центре DKFZ, доступный в Интернете по адресу e-crisp.org/E-CRISP/; и инструмент Knockout Guide Design, доступный от Synthego в Интернете по адресу design.synthego.com/#/. Кроме того, доступны различные коммерчески доступные сервисы для создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги, предлагаемые IDT (в Интернете по адресу idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE), ThermoFisher (в Интернете по адресу thermofisher.com/order/custom-oligo/crispr) и GenScript (в Интернете по адресу genscript. com/gRNA-design-tool. html).
Согласно иллюстративным вариантам осуществления DBD, который представляет собой комплекс gRNA/Cas, содержит дезактивированный нуклеазой белок Cas или dCas, такой как, например, dCas9, такой как дезактивированный нуклеазой Staphylococcus aureus (dSaCas9) или дезактивированный нуклеазой Streptococcus pyogenes Cas9 (dSpCas9). gRNA представлена в виде последовательности, содержащей нацеливающую область, которая нацеливает комплекс gRNA/Cas на желаемый целевой сайт, и каркасную область, которая облегчает взаимодействие с белком Cas. Любой подходящий каркас gRNA может использоваться в связи с представленными в настоящем документе gRNA. Согласно иллюстративному варианту осуществления gRNA представляет собой одиночную gRNA или sgRNA и содержит следующую каркасную последовательность: 5'-GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCA AAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGA-3' (SEQ ID NO: 183). Нацеливающая область направляющей РНК присоединяется к 5'-концу каркасной последовательности с образованием полной sgRNA. Согласно определенным вариантам осуществления gRNA и белок dCas могут экспрессироваться из одной и той же кассеты экспрессии. Согласно определенным вариантам осуществления промотор U6 используется для экспрессии gRNA. Согласно другим вариантам осуществления gRNA может быть экспрессирована в клетке, которая была сконструирована для стабильной экспрессии белка dCas-TAD, например, либо путем стабильной интеграции dCas в геном, либо на плазмиде, которая стабильно поддерживается вне хромосом.
Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, может содержать DBD из TALEN, полученный из TALEN, или который представляет собой инактивированную нуклеазой TALEN. Подобные активатору транскрипции эффекторные нуклеазы (TALEN) представляют собой рестрикционные ферменты, которые содержат DBD и домен нуклеазы, которые могут быть сконструированы для разрезания определенных последовательностей ДНК. TALEN создаются путем конъюгирования эффекторного ДНК-связывающего домена TAL с доменом расщепления ДНК (например, нуклеазой). Эффекторы, подобные активатору транскрипции (TALE), могут быть сконструированы так, чтобы связываться с желаемой целевой последовательностью ДНК, тем самым направляя домен нуклеазы в определенное место.
Эффекторы TAL представляют собой бактериальные белки из бактерий Xanthomonas. ДНКсвязывающий домен содержит повторяющуюся высококонсервативную последовательность из 33-34 аминокислот с расходящимися 12-ой и 13-ой аминокислотами. Эти два положения, называемые Repeat Variable Diresidue (RVD), сильно изменчивы и показывают сильную корреляцию со специфическим распознаванием нуклеотидов. Эта прямая взаимосвязь между аминокислотной последовательностью и распознаванием ДНК позволяет конструировать DBD, которые специфически нацелены на желаемую последовательность, путем выбора комбинации повторяющихся сегментов, содержащих соответствующие RVD.
Существуют разные способы разработки TALE. Например, способы разработки TALE для связывания с представляющей интерес целевой последовательностью ДНК описаны в T. Cermak et al., Nucleic Acids Research. 39 (12):e82 (2011); F. Zhang F et al., Nature Biotechnology. 29 (2):149-53 (2011); R. Morbitzer et al., Nucleic Acids Research. 39 (13):5790-9 (2011); T. Li et al., Nucleic Acids Research. 39 (14):631525 (2011); R. Geissler et al., PLOS One. 6(5): e19509 (2011) и E. Weber et al., PLOS One. 6(5): e19722 (2011). Кроме того, общедоступны различные веб-инструменты для разработки TALE для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, E-Talen, доступный в Интернете по адресу e-talen.org/E-TALEN/TAL и инструмент Effector Nucleotide Targeter 2.0, доступный в Интернете по адресу tall-nt.cac.cornell.edu/node/add/single-tale. Кроме того, доступны различные коммерчески доступные сервисы для создания TALE для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги, предлагаемые OmicX (в Интернете по адресу omictools.com/), Addgene (в Интернете по адресу addgene.org/talen/guide/ или ThermoFisher (в Интернете: thermofisher.com/us/en/home/life-science/genome-editing/geneart-tals/tal-designtool.html). Кроме того, общедоступная программа (DNAWorks) может использоваться для создания олигонуклеотидов, подходящих для сборки TALE, смотрите, например, D. Hoover D Methods in Molecular Biology. 852: 215-23 (2012).
Домены модуляции транскрипции.
Приведенные в настоящем документе eTF, которые активируют SCN1A, могут содержать любой подходящий домен, который способен рекрутировать один или несколько белковых факторов, которые
- 22 046157 могут модулировать транскрипцию (например, РНК-полимеразу II, CBP/p300, CREB или KRAB) или уровень экспрессии гена от представляющего интерес гена, когда eTF связан с целевым сайтом через DBD (например, DBD с цинковыми пальцами, gRNA/Cas DBD или TALE DBD). Согласно определенным вариантам осуществления такой домен рекрутирует белковые факторы, которые увеличивают уровень транскрипции или экспрессии представляющего интерес гена, и представляет собой домен активации транскрипции (TAD). Согласно другим вариантам осуществления такой домен рекрутирует белковые факторы, которые снижают уровень транскрипции или экспрессии представляющего интерес гена, и представляет собой домен репрессора транскрипции (TRD). Согласно определенным вариантам осуществления домен модуляции транскрипции (TAD или TRD) может представлять собой синтетически сконструированный домен. Согласно другим вариантам осуществления домен модуляции транскрипции (TAD или TRD) может происходить из встречающегося в природе белка, например, фактора транскрипции, коактиватора транскрипции, корепрессора транскрипции или белка-сайленсера. Согласно различным вариантам осуществления домен модуляции транскрипции (TAD или TRD) может происходить из белка любого вида, например, мыши, крысы, обезьяны, вируса или человека.
Согласно одному иллюстративному варианту осуществления TAD, подходящий для применения в представленных в настоящем документе eTF, которые активируют SNC1A, происходит из вирусного белка. Иллюстративные TAD, полученные из вирусных белков, включают в себя, например, TAD-домен VP64 (SEQ ID NO: 133), VPR (SEQ ID NO: 132), VP16, VP128, p65, p300 или любой его функциональный фрагмент или вариант, или последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к ней.
Согласно другому иллюстративному варианту осуществления TAD, подходящий для применения в представленных в настоящем документе eTF, которые активируют SCN1A, происходит из белка человека. Иллюстративные TAD, полученные из белков человека, включают в себя, например, TAD-домен взаимодействующего с CBP/p300 трансактиватора 2 (CITED2) (SEQ ID NO: 134), взаимодействующего с CBP/p300 трансактиватора 4 (CITED4) (SEQ ID NO: 135), EGR1 (SEQ ID NO: 176), CREB3 (SEQ ID NO: 224) или EGR3 (SEQ ID NO: 175), или любой их функциональный фрагмент или вариант, или последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к ней.
Согласно определенным вариантам осуществления eTF, который активирует SCN1A, содержит DBD типа цинковые пальцы, который конъюгирован с доменом активации транскрипции или TAD. Согласно различным вариантам осуществления DBD типа цинковые пальцы может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления DBD типа цинковые пальцы, полученный из человеческого белка, например, EGR1 или EGR3, конъюгирован с TAD, полученным из человеческого белка, например, CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления DBD типа цинковые пальцы, полученный из человеческого белка, например, EGR1 или EGR3, конъюгирован с VP64 или VPR TAD. Согласно определенным вариантам осуществления синтетический DBD типа цинковые пальцы или DBD типа цинковые пальцы, характеризующийся идентичностью последовательности, составляющей менее чем 75%, по отношению к человеческому белку, например, EGR1 или EGR3, конъюгирован с TAD, полученным из человеческого белка, например, CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления синтетический DBD типа цинковые пальцы или DBD типа цинковые пальцы, характеризующийся идентичностью последовательности, составляющей менее чем 75%, по отношению к человеческому белку, например, EGR1 или EGR3, конъюгирован с VP64 или VPR TAD.
Согласно определенным вариантам осуществления белок dCas конъюгирован с TAD. Согласно различным вариантам осуществления dCas9 может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно иллюстративным вариантам осуществления dCas9 конъюгирован с VP64 или VPR TAD.
Согласно определенным вариантам осуществления белок TALE конъюгирован с TAD. Согласно различным вариантам осуществления TALE может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно иллюстративным вариантам осуществления TALE конъюгирован с VP64 или VPR TAD.
eTF, которые активируют SCN1A и высокогомологичны человеческим белкам.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, характеризуется высоким процентом идентичности по отношению к одному или нескольким белкам человека (как дополнительно описано ниже). Согласно определенным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, имеющим более низкий общий процент идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно из
- 23 046157 мерить с использованием анализа elispot, иммуноанализа или способа in silico. Согласно определенным вариантам осуществления такие eTF могут содержать DBD, полученный из EGR1 или EGR3 человека, и TAD, полученный из EGR1, EGR3, CITED2, CITED4 или CREB3 человека. Такие eTF практически не обладают иммуногенностью при введении субъекту или обладают пониженной иммуногенностью по сравнению с eTF, характеризующимися более низким процентом идентичности по отношению к последовательностям белков человека.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SNC1A, характеризуется идентичностью последовательности, составляющей по меньшей мере 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Когда представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD и TAD, происходящие из одного и того же белка, процент идентичности с человеческим белком может быть определен путем расчета общего количества аминокислотных остатков в eTF, которые соответствуют человеческому белку, из которого он был получен (например, EGR1 или EGR3), разделенного на общее количество аминокислотных остатков в eTF. Когда eTF, обеспечивающий активную регуляцию SCN1A, содержит DBD из одного человеческого белка и TAD, полученный из другого человеческого белка, процент идентичности с человеком может быть определен путем отдельного расчета процента идентичности с человеческим для каждого домена и суммирования этих двух показателей вместе, например, (i) вычисление общего количества аминокислотных остатков в DBD, которые соответствуют человеческому белку, из которого он был получен (например, EGR1 или EGR3), деленного на общее количество аминокислотных остатков в eTF; (ii) вычисление общего количества аминокислотных остатков в TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; и (iii) суммирование суммы (i) и (ii). Согласно такому варианту осуществления домены делятся следующим образом: первый домен проходит от N-конца eTF до начала кодирующей последовательности для второго домена, а второй домен проходит от начала кодирующей последовательности для второго домена через C-конец eTF (например, для eTF, имеющего конфигурацию NLS-DBD-линкер-NLS-TAD, первый домен будет NLS-DBD-линкер, а второй домен будет NLS-TAD). Когда представленный в настоящем документе eTF, который активирует SNC1A, содержит DBD из одного человеческого белка и двух TAD, полученных из одного или нескольких различных человеческих белков, процент идентичности с человеком может быть определен путем отдельного расчета процента идентичности с человеческим для каждого домена и суммирования всех троих вместе, например, (i) вычисление общего количества аминокислотных остатков в DBD, которые соответствуют белку человека, из которого он был получен (например, EGR1 или EGR3), деленного на общее количество аминокислотных остатков в eTF; (ii) вычисление общего количества аминокислотных остатков в первом TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; (iii) вычисление общего количества аминокислотных остатков во втором TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; и (iv) суммирование суммы (i), (ii) и (iii). Согласно такому варианту осуществления домены делятся следующим образом: первый домен проходит от N-конца eTF до начала кодирующей последовательности для второго домена, второй домен проходит от начала кодирующей последовательности для второго домена через начало кодирующей последовательности для третьего домена, а третий домен проходит от начала кодирующей последовательности для третьего домена через C-конец eTF (например, для eTF, имеющего конфигурацию NLSTAD1-линкер-NLS-DBD-линкер-NLS-TAD2, первый домен будет ^S-TADI^uh^p, второй домен будет NLS-DBD-линкер, а третий домен будет NLS-TAD2). Процент идентичности по отношению к одному или нескольким человеческим белкам, как описано в этом разделе, может быть определен с использованием выходного процента идентичности, полученного с помощью стандартного инструмента BLAST для белков, доступного в NCBI (например, инструмента выравнивания набора blastp, используя алгоритм blastp (белок -> белок) с параметрами по умолчанию) доступен в Интернете на веб-сайте NCBI по адресу blast. ncbi. nlm. nih. gov/.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, имеет преимущество в том, что вызывает слабый, минимальный или нулевой неблагоприятный иммунный ответ у человека из-за высокой степени идентичности последовательностей с природными белками человека. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, вызывает пониженную иммуногенность, например, снижение иммуногенности по меньшей мере в 0,5, 1, 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 10, 15, 20, 25, 30, 35, 40, 45 или 50 или более раз по сравнению с иммуногенностью, наблюдаемой с eTF, имеющим более низкий процент идентичности по отношению к одному или нескольким белкам человека, например, eTF, характеризующимся идентичностью последовательности, составляющей менее чем 50%, 55%, 65% или 70%, по отношению к одному или нескольким белкам человека. В некоторых случаях снижение иммуногенности можно измерить с помощью анализа elispot, иммуноанализа или способа in
- 24 046157 silico. Генная терапия, обладающая низкой или минимальной иммуногенностью, имеет несколько преимуществ, включая в себя улучшенную переносимость пациентом, уменьшенную дозу, необходимую для достижения терапевтического эффекта, пролонгированные терапевтические эффекты после одного введения, возможность вводить несколько раз или в нескольких дозах, если необходимо, устойчивую терапевтическую эффективность в течение более длительного периода времени на одно введение, повышенную безопасность и/или повышенную эффективность генной терапии.
Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включают в себя DBD и TAD, полученные из одного или нескольких встречающихся в природе белков человека. Согласно определенным вариантам осуществления такие eTF могут содержать DBD, полученный из любого встречающегося в природе белка человека, содержащего DBD. Согласно иллюстративным вариантам осуществления, представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из встречающегося в природе белка типа цинковые пальцы, такого как, например, любая из конструкций 5-27, 36-41 или 44-53, перечисленные в табл. 1. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из белка EGR человека, такого как EGR1, EGR2, EGR3 или EGR4. Согласно иллюстративным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из EGR1 или EGR3 человека. Согласно различным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из белка типа цинковые пальцы человека, в котором минимальные аминокислотные изменения (например, 1, 2, 3, 4, 5, 6, 7 или 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 2-3, 2-4, 2-5, 2-6, 27, 3-4, 3-5, 36 или 3-7 аминокислотных замен) были сделаны в одном или нескольких доменах типа цинковые пальцы DBD, чтобы изменить специфичность связывания DBD для распознавания представляющего интерес целевого сайта связывания. Такие модификации последовательности предпочтительно выполняются в спиралях распознавания доменов типа цинковые пальцы DBD, в то время как остальная часть DBD или белка типа цинковые пальцы человека (включая в себя TAD) остается немодифицированной, чтобы сохранить как можно больше идентичности последовательности с природным человеческим белок по возможности.
Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержат один или несколько доменов модуляции транскрипции (например, TAD), полученных из человеческого белка, конъюгированного с DBD, полученным из белка человека. Согласно различным вариантам осуществления домен модуляции транскрипции может происходить из любого встречающегося в природе человеческого белка, имеющего домен, способный рекрутировать один или несколько белковых факторов, которые могут модулировать транскрипцию (например, РНК-полимераза II, коактиваторный белок или ко-репрессорный белок) или уровень экспрессии гена из представляющего интерес гена, когда eTF связывается с целевым сайтом через DBD. Согласно иллюстративным вариантам осуществления TAD получен из белка EGR человека, такого как, например, EGR1, EGR2, EGR3 или EGR4 человека, или из указанного белка человека, такого как, например, белок CITED2 или CITED4 человека. Согласно иллюстративному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя TAD из белка EGR1 или EGR3 человека. Согласно другому иллюстративному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя TAD из белка CITED2 или CITED4 человека.
Согласно одному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может содержать DBD человека (hDBD) и TAD человека (hTAD) (например, hTAD-hDBD или hDBD-hTAD), причем hDBD и hTAD могут происходить из одного и того же человеческого белка или из разных человеческих белков. Согласно другому варианту осуществления представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может содержать hDBD и два hTAD, причем hDBD и hTAD происходят из одного и того же человеческого белка, hDBD происходит из первого человеческого белка и оба hTAD происходят из второго человеческого белка, hDBD и один hTAD происходят из первого человеческого белка, а второй hTAD происходит из
- 25 046157 второго человеческого белка, или hDBD происходит из первого человеческого белка, один hTAD происходит из второго человеческого белка, а второй hTAD происходит из третьего человеческого белка (например, hTAD1-hDBD-hTAD1, hTAD1-hDBD-hTAD2, hTAD1-hTAD1-hDBD, hTAD1-hTAD2-hDBD, hDBD-hTAD1-hTAD1 или hDBD-hTAD1-hTAD2).
Согласно иллюстративным вариантам осуществления представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержит любую из следующих конфигураций: (i) hDBD и hTAD, оба получены из EGR1 человека; (ii) hDBD и hTAD, оба получены из EGR3 человека; (iii) hDBD, полученный из EGR1 человека, и hTAD, полученный из CITED2 (например, hEGR1 DBD-hCITED2 TAD или hCITED2 TAD-hEGR1 DBD); (iv) hDBD, полученный из EGR1 человека, и hTAD, полученный из CITED4 человека (например, hEGR1 DBD-hCITED4 TAD или hCITED4 TAD-hEGR1 DBD); (v) hDBD, полученный из EGR3 человека, и hTAD, полученный из CITED2 (например, hEGR3 DBD-hCITED2 TAD или hCITED2 TAD-hEGR3 DBD); (vi) hDBD, полученный из EGR3 человека, и hTAD, полученный из CITED4 человека (например, hEGR3 DBD-hCITED4 TAD или hCITED4 TAD-hEGR3 DBD); (vii) hDBD, полученный из EGR1 человека, и два hTAD, полученные из CITED2 (например, hCITED2 TAD-hEGR1 DBDhCITED2 TAD, hCITED2 TAD-hCITED2 TAD-hEGR1 DBD или hEGR1 DBD-hCITED2 TAD-hCITED2 TAD); (viii) hDBD, полученный из EGR1 человека, и два hTAD, полученные из CITED4 человека (например, hCITED4 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR1 DBD или hEGR1 DBD-hCITED4 TAD-hCITED4 TAD); (ix) hDBD, полученный из EGR3 человека, и два hTAD, полученные из CITED2 человека (например, hCITED2 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TADhCITED2 TAD-hEGR3 DBD или hEGR3 DBD-hCITED2 TAD-hCITED2 TAD); (x) hDBD, полученный из EGR3 человека, и два hTAD, полученные из CITED4 человека (например, hCITED4 TAD-hEGR3 DBDhCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR3 DBD или hEGR3 DBD-hCITED4 TAD-hCITED4 TAD); (xi) hDBD, полученный из EGR1 человека, первый hTAD, полученный из CITED2 человека, второй hTAD, полученный из CITED4 человека (например, hCITED2 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hEGR1 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR1 DBD, hCITED4 TADhCITED2 TAD-hEGR1 DBD, hEGR1 DBD-hCITED4 TAD-hCITED2 TAD или hEGR1 DBD-hCITED2 TADhCITED4 TAD); или (xii) hDBD, полученный из EGR3 человека, первый hTAD, полученный из CITED2 человека, второй hTAD, полученный из CITED4 человека (например, hCITED2 TAD-hEGR3 DBDhCITED4 TAD, hCITED4 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR3 DBD, hCITED4 TAD-hCITED2 TAD-hEGR3 DBD, hEGR3 DBD-hCITED4 TAD-hCITED2 TAD или hEGR3 DBDhCITED2 TAD-hCITED4 TAD).
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 92-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или больше по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или больше по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может дополнительно содержать одну или несколько аминокислотных последовательностей или доменов в дополнение к доменам DBD и TAD, например, сигнал ядерной локализации или линкер и т.д. Кроме того, полинуклеотид, кодирующий представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может дополнительно содержать одну или несколько последовательностей нуклеиновых кислот в дополнение к кодирующей последовательности для eTF, например, промотор, энхансер, полиА-хвост и т.д. Согласно таким вариантам осуществления одна или несколько дополнительных аминокислотных последовательностей и/или после
- 26 046157 довательностей нуклеиновых кислот предпочтительно представляют собой человеческие последовательности, происходящие из человеческих последовательностей, или характеризуются идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к белку человека.
Иллюстративные eTF SCN1A.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий один или несколько доменов типа цинковые пальцы, содержащих спираль распознавания, содержащую любую из SEQ ID NO: 152167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий по меньшей мере один, два, три, четыре, пять, шесть, семь, восемь, девять, десять, одиннадцать или двенадцать доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий шесть доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий девять доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно иллюстративным вариантам осуществления такие eTF содержат ДНК-связывающий домен, содержащий SEQ ID NO: 147, где каждый X независимо выбран из любой из SEQ ID NO: 152-167, а n равно 6 или 9.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RSDNLVR x REDNLHT x RSDELVR x QSGNLTE x TSGHLVR x QNSTLTE (SEQ ID NO: 148), где x может представлять собой линкер из 1-50 аминокислот, (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 148, или (ii) функциональный фрагмент из (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 18, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более раз по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (SEQ ID NO: 149), где x может представлять собой линкер из 1-50 аминокислот, (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 149, или (ii) функциональный фрагмент из (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 30, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более раз по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RRDELNV x RSDHLTN x RSDDLVR x RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (SEQ ID NO: 151), (ii) последовательность, характеризую
- 27 046157 щаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 151, или (ii) функциональный фрагмент (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с Nконцом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 32, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая DPGALVR x RSDNLVR x QSGDLRR x THLDLIR x TSGNLVR x RSDNLVR (SEQ ID NO: 150), (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 89%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 150, или (ii) функциональный фрагмент (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 31, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 77-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 99-102 или 125-127; (ii) последовательность, содержащая любую из SEQ ID NO: 77-91; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 92-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей
- 28 046157 мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 127; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 127; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 77 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 128; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к SEQ ID NO: 128; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 129; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 129; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 130; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 130; или (iii) функциональный фрагмент или вариант любой из
- 29 046157 последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 131; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 131; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит DBD, содержащий комплекс gRNA/Cas, причем gRNA содержит нацеливающую последовательность, содержащую любую из SEQ ID NO: 35-66. Целевая последовательность gRNA прикреплена к 5'-концу последовательности каркаса, содержащей последовательность: 5'GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACT TGTTGGCGAGA-3' (SEQ ID NO: 183). Согласно иллюстративным вариантам осуществления белок Cas представляет собой дезактивированный нуклеазой белок Cas9. Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, конъюгированных с белком Cas, причем TAD выбран из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен VPR TAD, конъюгированный с C-концом белка Cas. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с Nконцом, C-концом или N-концом и C-концом белка Cas. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и Cконцом белка Cas. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или больше по сравнению с контролем.
Полинуклеотиды.
Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, кодирующие любой из eTF, которые активируют SNC1A, раскрытые в настоящем документе. Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, содержащие селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие последовательность, кодирующую eTF, которая активирует SCN1A, как раскрыто в настоящем документе, и селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлен селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, кодирующим eTF, который активирует SCN1A, и селективный в отношении PV регуляторный элемент.
Полинуклеотиды, кодирующие eTF, которые активируют SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид,
- 30 046157 содержащий любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223, или их вариант или функциональный фрагмент; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223; или (iii) нуклеиновая кислота, кодирующая eTF, который активирует SCN1A, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223, или их вариант или функциональный фрагмент.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, содержащий любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 92-98, или ее вариант или функциональный фрагмент; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 92-98; или (iii) нуклеиновая кислота, кодирующая DBD, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 92-98, или ее вариант или функциональный фрагмент, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 92-98.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, который активирует эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая eTF, содержащий любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент eTF, содержащий любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к eTF, содержащему любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223, причем eTF способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий DBD, который связывается с целевым сайтом генома, способным повышать регуляцию эндогенного SCN1A при связывании с помощью раскрытого в настоящем документе eTF, причем полинуклеотид содержит любой из следующих элементов: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 77-98; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 77-98; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 77-98, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 77-98.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий DBD, который связывается с целевым сайтом генома, способным активировать эндогенный SCN1A при связывании раскрытым в настоящем документе eTF, причем полинуклеотид содержит любой из следующих элементов: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 148-151; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 148-151; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 148-151, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 92-98.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая любую из SEQ ID NO: 70-76 или 184; (ii) нуклеиновая кислота, содержащая функциональный фрагмент любой из последовательностей (i); или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii), причем полинуклеотид кодирует eTF, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 70; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 70; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отноше
- 31 046157 нию к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 71; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 71; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 72; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 72; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 130, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 73; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 73; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 131, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 74; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 74; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 75; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 75; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 76; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 76; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 106, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 184; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 184; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по мень
- 32 046157 шей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 106, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Полинуклеотиды, содержащие сайты связывания микроРНК для селективной экспрессии в PVсодержащих нейронах.
Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, содержащие сайты связывания микроРНК, которые приводят к селективной экспрессии представляющего интерес гена в парвальбумин-содержащих нейронах (PV). МикроРНК или миРНК представляют собой небольшие некодирующие РНК (~20 нуклеотидов), которые регулируют экспрессию генов посттранскрипционно путем гибридизации с комплементарными сайтами узнавания в молекуле мРНК и приводят к ингибированию экспрессии генов, способствуя деградации транскрипта мРНК или подавляя трансляцию белка, кодируемого мРНК. Предусмотренные в настоящем документе сайты связывания микроРНК ингибируют экспрессию представляющего интерес гена в возбуждающих нейронах, тем самым способствуя селективной экспрессии представляющего интерес гена в PV-содержащих нейронах (например, селективные к PV сайты связывания микроРНК). Согласно определенным вариантам осуществления возбуждающие нейроны представляют собой нейроны, которые экспрессируют один или несколько из STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA и/или DKK3. Согласно иллюстративному варианту осуществления возбуждающие нейроны представляют собой нейроны, экспрессирующие CamKII.
Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие один или несколько сайтов связывания микроРНК для одной или нескольких микроРНК, которые способствуют селективной экспрессии PV, например, способствуют деградации мРНК, содержащей сайт связывания микроРНК, в возбуждающих нейронах. Примеры микроРНК, которые способствуют селективной экспрессии PV, включают в себя, например, miR-128, miR-221 и miR-222. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более селективных в отношении PV сайтов связывания микроРНК. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-128 (SEQ ID NO: 9). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-222 (SEQ ID NO: 13). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1 сайт связывания miR-128, по меньшей мере один сайт связывания miR-221 и по меньшей мере один сайт связывания miR-222. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-128 и по меньшей мере один сайт связывания miR-222. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-221 и по меньшей мере один сайт связывания miR-222. Согласно иллюстративному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 2 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 2 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 3 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 3 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 4 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 4 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 5 сайтов связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 5 сайтов связывания miR-221 (SEQ ID NO: 11). Согласно таким вариантам осуществления сайты связывания могут быть расположены в любом порядке. Например, для конструкции, содержащей 2 сайта связывания miR-128 и 2 сайта связывания miR-221, сайты связывания могут быть расположены в любой из следующих конфигураций: miR-128 - miR-128 - miR-221 - miR221, miR-128 - miR-221 - miR-128 - miR-221, miR-128 - miR221 - miR221 - miR-128, miR-221 - miR128 - miR221 - miR128, miR-221 - miR128 - miR128 - miR221 или miR221 - miR221 - miR128 - miR128. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 4 сайта связывания miR-128 (SEQ ID NO: 9), за которыми следуют четыре сайта связывания miR-221 (SEQ ID NO: 11), например, miR-128 - miR-128 - miR128 - miR-128 - miR221 - miR221 - miR-221 - miR221. Согласно другому иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 1 последовательность miR-221 (SEQ ID NO: 11), 1 последовательность miR-222 (SEQ ID NO: 13) и 1 сайт связывания miR-128 (SEQ ID NO: 9), например, miR
- 33 046157
221 - miR222 - miR128. Согласно другому иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 2 последовательности miR-221 (SEQ ID NO: 11), 2 последовательности miR-222 (SEQ ID NO: 13) и 2 сайта связывания miR128 (SEQ ID NO: 9) расположены в следующем порядке: miR-221 - miR222 - miR128 - miR-221 - miR222 miR128.
В полинуклеотидах, содержащих более одного сайта связывания микроРНК, сайты связывания могут быть непосредственно примыкающими друг к другу в полинуклеотидной последовательности (например, без линкера или промежуточной последовательности между сайтами связывания) или могут быть отделены друг от друга по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами. Согласно иллюстративным вариантам осуществления сайты связывания микроРНК разделены приблизительно 5 нуклеотидами или 5 нуклеотидами. Согласно иллюстративным вариантам осуществления последовательности, разделяющие сайты связывания микроРНК (а также соединения, образованные между сайтами связывания микроРНК, или соединения, образованные между сайтами связывания микроРНК и последовательностями, разделяющими сайты связывания микроРНК), не комплементарны никаким другим микроРНК или любым другим нейрональным микроРНК.
Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 7. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 7.
Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 14. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 14.
Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 15. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 15.
Согласно определенным вариантам осуществления указанные в настоящем документе сайты связывания микроРНК расположены в 3'-нетранслируемой области транскрипта мРНК, например, после кодона терминации трансляции (т.е. TAA, TGA или TAG) и перед полиА-хвостом. Сайт связывания микроРНК может быть расположен непосредственно рядом с кодоном терминации трансляции или может быть отделен от кодона терминации трансляции по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами, и/или может быть расположен рядом с полиА-хвостом или может быть отделен от полиАхвоста по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами.
Согласно определенным вариантам осуществления представленный в настоящем документе сайт связывания микроРНК приводит к селективной экспрессии гена в PV-содержащей клетке по сравнению с нецелевыми типами клеток. В некоторых случаях нецелевые типы клеток включают в себя, без ограничения, возбуждающие нейроны, не содержащие PV типы клеток ЦНС и ненейрональные типы клеток ЦНС. Согласно определенным вариантам осуществления селективные в отношении PV сайты связывания микроРНК приводят к селективной экспрессии генов в PV-содержащих нейронах по меньшей мере для одного, двух, трех, четырех, пяти или более не-PV типов клеток ЦНС. В некоторых случаях не-PV клетка ЦНС представляет собой возбуждающий нейрон, дофаминергический нейрон, астроцит, микроглию, мотонейрон, сосудистую клетку или не-ГАМКергический нейрон (например, клетку, которая не экспрессирует один или более GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP), не-PV нейрон (например, ГАМКергический нейрон, который не экспрессирует парвальбумин) или другие клетки ЦНС (например, типы клеток ЦНС, которые никогда не экспрессируют любой из PV, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP). Согласно иллюстративному варианту осуществления представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК приводит к повышенной селективности экспрессии генов в PV-содержащих нейронах по сравнению с возбуждающими нейронами (например, нейронами, которые экспрессируют один или несколько из STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA и/или DKK3) за счет уменьшения экспрессии в возбуждающих нейронах. В некоторых случаях типы клеток различают по разным клеточным маркерам, морфологии, фенотипу, генотипу, функции и/или любым другим средствам классификации типов клеток.
Селективность экспрессии, управляемая селективным в отношении PV сайтом связывания микроРНК, может быть измерена несколькими способами. Согласно одному варианту осуществления селективность экспрессии гена в PV-клетке по сравнению с не содержащими PV клетками может быть изме
- 34 046157 рена путем сравнения количества PV-клеток, которые экспрессируют обнаруживаемый уровень транскрипта из гена, который содержит селективный в отношении PV сайт связывания микроРНК, с общим количеством клеток, которые экспрессируют ген (например, отношение PV-содержащих к общему количеству клеток (PV + не-PV клеток), экспрессирующих ген). Например, селективность в отношении PVсодержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием кассеты экспрессии, содержащей ген, кодирующий флуоресцентный белок (например, eGFP), и селективный в отношении PV сайт связывания микроРНК для измерения экспрессии гена и антитела, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком). Селективность экспрессии в PVсодержащих клетках можно рассчитать путем деления количества клеток, которые экспрессируют как PV, так и eGFP (например, PV-содержащие клетки), на общее количество клеток, экспрессирующих eGFP (например, PV-содержащие клетки и не содержащие PV клетки), и умножения на 100, чтобы преобразовать в проценты. В другом примере селективность в отношении PV-содержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием кассеты экспрессии, содержащей ген, кодирующий флуоресцентный белок (например, eGFP), и селективный в отношении PV сайт связывания микроРНК для измерения экспрессии гена, и первое антитело, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком) и вторым антителом, которое идентифицирует возбуждающие клетки (например, антитело к CamKII, которое специфически взаимодействует с возбуждающими нейронами). Селективность экспрессии в PV-содержащих клетках можно рассчитать путем деления количества клеток, экспрессирующих как PV, так и eGFP (например, PV-клетки), на количество клеток, экспрессирующих eGFP + PV и eGFP + CamKII (например, PV-содержащие клетки и возбуждающие клетки), и умножения на 100 для преобразования в процент. Чем выше процент PV-содержащих клеток, экспрессирующих трансген, тем более селективным является сайт связывания микроРНК в отношении PVсодержащих клеток. Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК может быть высокоселективным для экспрессии в PV-содержащих клетках. Например, представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК может характеризоваться селективностью, составляющей приблизительно 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более чем приблизительно 99%, для PV-содержащих нейронов (например, PVсодержащие нейроны/все клетки х 100 или PV-содержащие нейроны/PV + возбуждающие нейроны х 100).
В некоторых случаях представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК является коротким. В некоторых случаях размер селективного в отношении PV сайта связывания микроРНК совместим с клонирующей способностью вектора, например, вирусного вектора или rAAV, так что комбинированный размер трансгена, промотора (и необязательного энхансера) и сайта связывания микроРНК не превышает клонирующую способность вектора. В некоторых случаях селективный в отношении PV сайт связывания микроРНК составляет в длину до приблизительно 500 п.н., 400 п.н., 300 п.н., 250 п.н., 225 п.н., 215 п.н., 210 п.н., 200 п.н., 150 п.н., 140 п.н., 135 п.н., 130 п.н., 125 п.н., 120 п.н., 115 п.н., 110 п.н., 100 п.н., 90 п.н., 80 п.н., 75 п.н., 70 п.н., 65 п.н., 60 п.н. или 50 п.н.. В некоторых случаях селективный в отношении PV сайт связывания микроРНК составляет приблизительно 50-500 п.н., 50-400 п.н., 50-300 п.н., 50-250 п.н., 50-200 п.н., 50-100 п.н., 50-75 п.н., 50-70 п.н., 100-500 п.н., 100-400 п.н., 100-300 п.н., 100-250 п.н., 100-200 п.н., 100-150 п.н., 100-140 п.н., 100-135 п.н., 200-500 п.н., 200-400 п.н., 200-300 п.н. или 200-250 п.н..
Согласно иллюстративным вариантам осуществления представленный в настоящем документе полинуклеотид, который содержит один или несколько селективных в отношении PV сайтов связывания микроРНК не содержит SEQ ID NO: 67.
Кассеты экспрессии.
Согласно другому аспекту в настоящей заявке представлены кассеты экспрессии, содержащие представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCNIA и/или содержит селективный в отношении PV сайт связывания микроРНК) и один или несколько регуляторных элементов. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и селективный в отношении PV промотор.
Согласно определенным вариантам осуществления представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, который активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) представляет собой часть кассеты экспрессии, содержащей один или несколько регуляторных элементов в добавок к
- 35 046157 последовательности, кодирующей eTF. Согласно иллюстративным вариантам осуществления представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, который активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК), представляет собой часть кассеты экспрессии, содержащей промотор, расположенный выше против хода транскрипции от трансгенной последовательности, чтобы быть способным управлять экспрессией трансгена (например, eTF, который избирательно активирует SCN1A) в клетке.
Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует регуляцию SCNIA и/или содержит селективный в отношении PV сайт связывания микроРНК) и конститутивный промотор, расположенный выше против хода транскрипции от последовательности, кодирующей трансген, чтобы быть способным управлять экспрессией трансгена (например, eTF, который избирательно активирует SCN1A) в клетке. Примеры конститутивных промоторов включают в себя промотор GAD2, промотор синапсина человека, промотор CBA, промотор CMV, промотор minCMV, TATA-бокс, супер основной промотор или промотор EF1a, или их комбинацию. Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и короткий промотор, способный управлять экспрессией, трансгена (например, eTF, который избирательно активирует SCN1A) в клетке. Согласно определенным вариантам осуществления короткий промотор, подходящий для применения в соответствии с описанными в настоящем документе молекулами нуклеиновой кислоты, содержит менее чем 500 п.н., 450 п.н., 400 п.н., 350 п.н., 300 п.н., 250 п.н., 225 п.н., 200 п.н., 175 п.н., 150 п.н., 145 п.н., 140 п.н., 135 п.н., 130 п.н., 125 п.н., 120 п.н., 115 п.н., 110 п.н., 105 п.н., 100 п.н., 95 п.н., 90 п.н., 85 п.н., 80 п.н. или 75 п.н. или приблизительно 80-300 п.н., 80-275 п.н., 80-250 п.н., 80-200 п.н., 80-150 п.н., 80-125 п.н., 80-120 п.н., 80-115 п.н., 80-110 п.н., 80-105 п.н., 80-100 п.н., 85-300 п.н., 85-275 п.н., 85-250 п.н., 85-200 п.н., 85-150 п.н., 85-125 п.н., 85-120 п.н., 85-115 п.н., 85-110 п.н., 85-105 п.н., 85100 п.н., 90-300 п.н., 90-275 п.н., 90-250 п.н., 90-200 п.н., 90-150 п.н., 90-125 п.н., 90-120 п.н., 90-115 п.н., 90-110 п.н., 90-105 п.н., 90-100 п.н., 95-300 п.н., 95-275 п.н., 95-250 п.н., 95-200 п.н., 95-150 п.н., 95-125 п.н., 95-120 п.н., 95-115 п.н., 95-110 п.н., 95-105 п.н., 95-100 п.н., 100-300 п.н., 100-275 п.н., 100-250 п.н., 100-200 п.н., 100-150 п.н., 100-125 п.н., 100-120 п.н., 100-115 п.н., 100-110 п.н. или 100-105 п.н. Согласно иллюстративным вариантам осуществления короткий промотор, подходящий для применения в соответствии с описанными в настоящем документе кассетами экспрессии, содержит приблизительно 100-120 п.н., приблизительно 117 п.н. или приблизительно 100 п.н.
Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит короткий промотор, содержащий или состоящий из следующего: (i) SEQ ID NO: 1; (ii) его вариант или функциональный фрагмент или (iii) последовательность нуклеиновой кислоты, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), функционально связанная с полинуклеотидом, кодирующим любой из eTF, который избирательно активирует раскрытый в настоящем документе SCN1A и необязательно содержащая раскрытый в настоящем документе сайт связывания микроРНК. Другие примеры короткой промоторной последовательности можно найти в публикации PCT №WO 2018/213786.
Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и селективный промотор клеточного типа, расположенный выше против хода транскрипции от последовательности, кодирующей трансген (например, eTF, который избирательно активирует SCN1A), чтобы иметь возможность избирательно управлять экспрессией трансгена в представляющей интерес клетке. Согласно определенным вариантам осуществления селективный промотор клеточного типа может быть селективным (например, избирательно управлять экспрессией) в отношении любого представляющего интерес типа клеток, такого как, например, клетка сердца, клетка печени, мышечная клетка, костная клетка, нейрон или их субпопуляции. Согласно иллюстративному варианту осуществления раскрытая в настоящем документе кассета экспрессии содержит полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, и селективный в отношении PV регуляторный элемент (например, промотор, энхансер и/или промотор и энхансер), расположенный выше против хода транскрипции от последовательности, кодирующей eTF, так чтобы быть способным избирательно управлять экспрессией eTF в PV-клетке, и, необязательно, селективный в отношении PV сайт связывания микроРНК. Селективный в отношении PV регуляторный элемент относится к регуляторному элементу, который специфически модулирует экспрессию гена в PV-содержащем нейроне. Согласно определенным вариантам осуществления селективные в отношении PV регуляторные элементы усиливают экспрессию в PV-содержащем нейроне по сравнению с одним или несколькими другими типами клеток ЦНС. Согласно определенным вариантам осуществления селективный в отноше- 36 046157 нии PV регуляторный элемент подавляет процессы транскрипции и/или трансляции в нецелевых типах клеток.
Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент приводит к селективной экспрессии гена в PV-клетке по сравнению с нецелевыми типами клеток. В некоторых случаях нецелевые типы клеток включают в себя, без ограничения, возбуждающие нейроны, не-PV типы клеток ЦНС и ненейрональные типы клеток ЦНС. Согласно определенным вариантам осуществления селективные в отношении PV регуляторные элементы приводят к селективной экспрессии генов в PV-содержащих нейронах по меньшей мере одного, двух, трех, четырех, пяти или более не содержащих PV типов клеток ЦНС. В некоторых случаях не содержащая PV клетка ЦНС представляет собой возбуждающий нейрон, дофаминергический нейрон, астроцит, микроглию, мотонейрон, сосудистую клетку или не-ГАМКергический нейрон, (например, клетка, которая не экспрессирует один или несколько из GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP), не содержащий PV нейрон (например, ГАМКергический нейрон, который не экспрессирует парвальбумин) или другие клетки ЦНС (например, типы клеток ЦНС, которые никогда не экспрессируют любой из PV, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP). В некоторых случаях представленный в настоящем документе селективный в отношении PV регуляторный элемент приводит к повышенной селективности экспрессии генов в PV-содержащих нейронах по сравнению с не содержащими PV ГАМКергическими клетками. В некоторых случаях типы клеток различают по разным клеточным маркерам, морфологии, фенотипу, генотипу, функции и/или любым другим средствам классификации типов клеток.
Селективность экспрессии, управляемую селективным в отношении PV регуляторным элементом, можно измерить несколькими способами. Согласно одному варианту осуществления селективность экспрессии гена в PV-содержащей клетке по сравнению с не содержащими PV клетками может быть измерена путем сравнения количества PV-содержащих клеток, которые экспрессируют обнаруживаемый уровень транскрипта от гена, который функционально связан с селективным в отношении PV регуляторным элементом, с общим количеством клеток, которые экспрессируют ген (например, отношение PV к общему количеству клеток (PV + не-PV клеток), экспрессирующих ген). Например, селективность в отношении PV-содержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием гена, кодирующего флуоресцентный белок (например, eGFP), функционально связанный с селективным в отношении PV регуляторным элементом для измерения экспрессии гена и антитела, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком). Селективность экспрессии в PVсодержащих клетках можно рассчитать путем деления количества клеток, которые экспрессируют как PV, так и eGFP (например, PV-содержащие клетки), на общее количество клеток, экспрессирующих eGFP (например, PV-содержащие клетки и не содержащие PV клетки), и умножения на 100, чтобы преобразовать в проценты. Чем выше процент PV-содержащих клеток, экспрессирующих трансген, тем более селективным является регуляторный элемент для PV-содержащих клеток. Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент может быть высокоселективным в отношении экспрессии в PV-содержащих клетках. Например, представленный в настоящем документе селективный в отношении PV регуляторный элемент может характеризоваться селективностью, составляющей приблизительно 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более чем приблизительно 99%, в отношении PV-содержащих нейронов (например, PV-содержащие нейроны/все клетки х 100).
В некоторых случаях представленный в настоящем документе селективный в отношении PV регуляторный элемент является коротким. В некоторых случаях размер селективного в отношении PV регуляторного элемента совместим с клонирующей способностью вектора, например, вирусного вектора или rAAV, так что комбинированный размер трансгена и одного или нескольких селективных в отношении PV регуляторных элементов не превышает клонирующую способность вектора. В некоторых случаях селективный в отношении PV регуляторный элемент составляет в длину приблизительно до 2050 п.н., 2000 п.н., 1900 п.н., 1800 п.н., 1700 п.н., 1600 п.н., 1500 п.н., 1400 п.н., 1300 п.н., 1200 п.н., 1100 п.н., 1000 п.н., 900 п.н., 800 п.н., 700 п.н., 600 п.н., 500 п.н., 400 п.н., 300 п.н., 200 п.н. или 100 п.н. В некоторых случаях селективный в отношении PV регуляторный элемент составляет приблизительно 500-600 п.н., 500-700 п.н., 500-800 п.н., 500-900 п.н., 500-1000 п.н., 500-1500 п.н., 500-2000 п.н. или 500-2050 п.н.
Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент содержит или состоит из любого из следующего: (i) SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинация или (iii) последовательность нуклеиновой кислоты, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к любому из (i) или (ii). В некоторых случаях регуляторный элемент включает в себя любую из SEQ ID NO: 2-4. Другие примеры селективных в отношении PV регуляторных элементов можно найти в публикации PCT № WO 2018/187363.
Согласно иллюстративным вариантам осуществления в настоящей заявке представлены кассеты
- 37 046157 экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A под контролем селективного в отношении PV регуляторного элемента. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий DBD, содержащий любую из следующих последовательностей: SEQ ID NO: 77-98 под контролем селективного в отношении PV регуляторного элемента, содержащего любую одна из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий любую из следующих последовательностей: SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, содержащую любую из следующих последовательностей: SEQ ID NO: 67-73 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий DBD, содержащий любую из следующих последовательностей: SEQ ID NO: 148-151 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий любую из следующих последовательностей: SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, содержащую любую из следующих последовательностей: SEQ ID NO: 67-76 или 316 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2.
Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие селективный в отношении PV сайт связывания микроРНК и последовательность промотора и/или энхансера. Любой из описанных в настоящем документе промоторов может быть включен в кассету экспрессии. Согласно иллюстративному варианту осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и селективный в отношении PV регуляторный элемент. Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинацию или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) любую из SEQ ID NO: 7, 14 или 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 7, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2. Согласно определенным вариантам осуществления представленный в настоящем документе полинуклеотид, содержит (1) селективный в отношении PV сайт связывания микроРНК,
- 38 046157 содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 15, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2. Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 15, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2.
Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и последовательность, кодирующую eTF, который стимулирует экспрессию SCN1A, как предусмотрено в настоящем документе. Согласно иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая селективный в отношении PV регуляторный элемент, eTF, который активирует экспрессию SCN1A, как предусмотрено в настоящем документе, и селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) любую из SEQ ID NO: 7, 14 или 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, ха
- 39 046157 растеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбина
- 40 046157 цию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii).
Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии, содержащая селективный в отношении PV регуляторный элемент и селективный в отношении PV сайт связывания микроРНК, характеризующийся размером менее чем 5 т.п.н., 4,9 т.п.н., 4,8 т.п.н., 4,7 т.п.н., 4,6 т.п.н., 4,5 т.п.н., 4,4 т.п.н., 4,3 т.п.н., 4,2 т.п.н., 4,1 т.п.н., 4,0 т.п.н., 3,9 т.п.н., 3,8 т.п.н., 3,7 т.п.н., 3,6 т.п.н., 3,5 т.п.н., 3,4 т.п.н., 3,3 т.п.н., 3,2 т.п.н., 3,1 т.п.н., 3,0 т.п.н., 2,9 т.п.н., 2,8 т.п.н., 2,7 т.п.н., 2,6 т.п.н., 2,5 т.п.н., 2,4 т.п.н., 2,3 т.п.н., 2,2 т.п.н., 2,1 т.п.н., 2,0 т.п.н., 1,9 т.п.н., 1,8 т.п.н., 1,7 т.п.н., 1,6 т.п.н. или 1,5 т.п.н. или менее, или приблизительно 1,5-5 т.п.н., 1,5-4,7 т.п.н., 1,5-4,5 т.п.н., 1,5-4,0 т.п.н., 1,5-3,5 т.п.н., 1,5-3,0 т.п.н., 1,5-2,5 т.п.н., 1,5-2,0 т.п.н.
Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии может содержать еще один дополнительный регуляторный элемент в дополнение к промотору, такой как, например, последовательности, связанные с инициацией или окончанием транскрипции, энхансерные последовательности и эффективные сигналы процессинга РНК. Иллюстративные регуляторные элементы включают в себя, например, интрон, энхансер, UTR, элемент стабильности, последовательность WPRE, консенсусную последовательность Kozak, посттрансляционный элемент ответа, сайт связывания микроРНК или последовательность полиаденилирования (полиА) или их комбинацию. Регуляторные элементы могут функционировать, чтобы модулировать экспрессию генов на фазе транскрипции, посттранскрипционной фазе или на фазе трансляции экспрессии генов. На уровне РНК регуляция может происходить на уровне трансляции (например, элементы стабильности, которые стабилизируют мРНК для трансляции), расщепления РНК, сплайсинга РНК и/или терминации транскрипции. Согласно различным вариантам осуществления регуляторные элементы могут рекрутировать факторы транскрипции в кодирующую область, которые повышают избирательность экспрессии генов в представляющем интерес типе клеток, увеличивают скорость, с которой производятся транскрипты РНК, повышают стабильность производимой РНК и/или увеличивают скорость образования синтеза белка из транскриптов РНК. Согласно иллюстративному варианту осуществления представленная в настоящем документе кассета экспрессии содержит по меньшей мере один селективный в отношении PV сайт связывания микроРНК, как предусмотрено в настоящем документе.
Согласно определенным вариантам осуществления описанные в настоящем документе кассеты экспрессии дополнительно содержат последовательность полиА. Подходящие последовательности полиА включают в себя, например, искусственный полиА длиной приблизительно 75 п.н. (PA75) (см., например, WO 2018/126116), полиА бычьего гормона роста, ранний сигнал полиА SV40, поздний сигнал полиА SV40, полиА бета-глобина кролика, полиА тимидинкиназы HSV, полиА гена протамина, полиА аденовируса 5 EIb, полиА гормона роста или полиА PBGD. Согласно иллюстративным вариантам осуществления последовательность полиА, подходящая для применения в представленных в настоящем документе кассетах экспрессии, представляет собой полиА hGH (SEQ ID NO: 17) или синтетический полиА (SEQ ID NO: 16). Как правило, последовательность полиА расположена ниже по ходу транскрипции от полинуклеотида, кодирующего eTF, в описанных в настоящем документе кассетах экспрессии.
Согласно определенным вариантам осуществления представленные в настоящем документе кассеты экспрессии дополнительно содержат одну или несколько последовательностей нуклеиновых кислот, кодирующих один или несколько сигналов ядерной локализации (NLS). Может быть использован любой пептид NLS, который облегчает импорт белка, к которому прикреплен, в ядро клетки. Примеры NLS включают в себя, например, NLS большого T-антигена SV40, NLS нуклеоплазмина, NLS EGL-13, NLS cMyc и NLS TUS-белка. Смотрите, например, C. Dingwall et al., J. Cell Biol. 107: 841-9 (1988); J.P. Makkerh et al., Curr Biol. 6: 1025-7 (1996) и M. Ray et al., Bioconjug. Chem. 26: 1004-7 (2015). NLS может быть расположен в любом месте последовательности белка eTF, но согласно предпочтительным вариантам осуществления он конъюгирован с N-концом eTF или доменом eTF. Согласно иллюстративным вариантам осуществления представленные в настоящем документе кассеты нуклеиновых кислот кодируют eTF с NLS, слитым с N-концом eTF. Согласно другим вариантам осуществления представленные в настоящем документе кассеты нуклеиновых кислот кодируют eTF с первым NLS, слитым с N-концом eTF, и вторым NLS, расположенным между DBD и доменом TAD eTF.
Векторы экспрессии.
Согласно определенным вариантам осуществления описанные в настоящем документе кассеты экспрессии могут быть включены в вектор экспрессии. Векторы экспрессии можно использовать для доставки кассеты экспрессии в целевую клетку посредством трансфекции или трансдукции. Вектор может представлять собой интегрирующий или неинтегрирующий вектор, что относится к способности вектора
- 41 046157 интегрировать кассету экспрессии или трансген в геном клетки-хозяина. Примеры векторов экспрессии включают в себя, без ограничения, (a) невирусные векторы, такие как векторы нуклеиновых кислот, включая в себя линейные олигонуклеотиды и кольцевые плазмиды; искусственные хромосомы, такие как искусственные хромосомы человека (HAC), искусственные хромосомы дрожжей (YAC) и бактериальные искусственные хромосомы (BAC или PAC)); эписомальные векторы; транспозоны (например, PiggyBac); и (b) вирусные векторы, такие как ретровирусные векторы, лентивирусные векторы, аденовирусные векторы и аденоассоциированные вирусные векторы.
Векторы экспрессии могут представлять собой линейные олигонуклеотиды или кольцевые плазмиды и могут быть доставлены в клетку с помощью различных способов трансфекции, включая в себя физические и химические способы. Физические способы, как правило, относятся к способам доставки, использующим физическую силу для противодействия барьеру клеточной мембраны для облегчения внутриклеточной доставки генетического материала. Примеры физических способов включают в себя использование иглы, баллистической ДНК, электропорацию, сонопорацию, фотопорацию, магнитофекцию и гидропорацию. Химические способы, как правило, относятся к способам, при которых химические носители доставляют молекулу нуклеиновой кислоты в клетку, и могут включать в себя неорганические частицы, векторы на основе липидов, векторы на основе полимеров и векторы на основе пептидов.
Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием катионного липида (например, катионной липосомы). Для доставки генов были исследованы различные типы липидов, такие как, например, липидная наноэмульсия (например, которая представляет собой дисперсию одной несмешивающейся жидкости в другой, стабилизированной эмульгирующим средством) или твердые липидные наночастицы.
Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием носителя для доставки на основе пептидов. Носители на основе пептидов могут иметь преимущества, заключающиеся в защите доставляемого генетического материала, нацеливании на специфические клеточные рецепторы, разрушении эндосомных мембран и доставке генетического материала в ядро. Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием носителя для доставки на основе полимера. Носители на основе полимеров могут содержать природные белки, пептиды и/или полисахариды или синтетические полимеры. Согласно одному варианту осуществления средство доставки на основе полимера содержит полиэтиленимин (PEI). PEI может конденсировать ДНК в положительно заряженные частицы, которые связываются с остатками анионной поверхности клетки и попадают в клетку посредством эндоцитоза. Согласно другим вариантам осуществления носитель для доставки на основе полимера может содержать поли-Ь-лизин (PLL), поли(DL-молочную кислоту) (PLA), поли^Ь-лактид-ко-гликозид) (PLGA), полиорнитин, полиаргинин, гистоны, протамины, дендримеры, хитозаны, синтетические аминопроизводные декстрана и/или катионные акриловые полимеры. Согласно определенным вариантам осуществления носители для доставки на основе полимеров могут включать в себя смесь полимеров, такую как, например, PEG и PLL.
Согласно определенным вариантам осуществления вектор экспрессии может представлять собой вирусный вектор, подходящий для генной терапии. Предпочтительные характеристики векторов вирусной генной терапии или векторов доставки генов могут включать в себя способность воспроизводимо и стабильно размножаться и очищаться до высоких титров; для опосредования направленной доставки (например, для доставки трансгена конкретно в представляющую интерес ткань или орган без широкого распространения вектора в другом месте); и опосредовать доставку гена и экспрессию трансгена, не вызывая вредных побочных эффектов.
Несколько типов вирусов, например, непатогенный парвовирус, называемый аденоассоциированным вирусом, были сконструированы для целей генной терапии, используя путь вирусной инфекции, но избегая последующей экспрессии вирусных генов, которая может привести к репликация и токсичности. Такие вирусные векторы можно получить путем удаления всех или некоторых кодирующих областей из вирусного генома, но оставив нетронутыми те последовательности (например, концевые повторяющиеся последовательности), которые могут быть необходимы для таких функций, как упаковка векторного генома в вирусный капсид или интеграция векторной нуклеиновой кислоты (например, ДНК) в хроматин хозяина.
Согласно различным вариантам осуществления подходящие вирусные векторы включают в себя ретровирусы (например, вирусы A-типа, B-типа, C-типа и D-типа), аденовирус, парвовирус (например, аденоассоциированные вирусы или AAV), коронавирус, вирусы с отрицательно-полярной нитью РНК, такие как ортомиксовирус (например, вирус гриппа), рабдовирус (например, вирус бешенства и везикулярного стоматита), парамиксовирус (например, корь и Сендай), вирусы с положительно-полярной нитью РНК, такие как пикорнавирус и альфавирус, и двухцепочечные ДНК-вирусы, включая в себя аденовирус, вирус герпеса (например, вирус простого герпеса типов 1 и 2, вирус Эпштейна-Барра, цитомегаловирус) и поксвирус (например, коровьей оспы, оспы птиц и оспы канареек). Примеры ретровирусов включают в себя вирус лейкемии-саркомы птиц, человеческий T-лимфотрофный вирус типа 1 (HTLV-1), вирус лейкемии крупного рогатого скота (BLV), лентивирус и спумавирус. Другие вирусы включают в себя, например, вирус Норуолк, тогавирус, флавивирус, реовирусы, паповавирус, гепаднавирус и вирус
- 42 046157 гепатита. Вирусные векторы можно разделить на две группы в зависимости от их способности интегрироваться в геном хозяина - интегрирующиеся и неинтегрирующиеся. Онкоретровирусы и лентивирусы могут интегрироваться в хроматин клетки-хозяина, в то время как аденовирусы, аденоассоциированные вирусы и вирусы герпеса преимущественно сохраняются в ядре клетки в виде внехромосомных эписом.
Согласно определенным вариантам осуществления подходящий вирусный вектор представляет собой ретровирусный вектор. Ретровирусы относятся к вирусам семейства Retroviridae. Примеры ретровирусов включают в себя онкоретровирусы, такие как вирус лейкемии мышей (MLV), и лентивирусы, такие как вирус иммунодефицита человека 1 (HIV-1). Ретровирусные геномы представляют собой одноцепочечные (оц) РНК и содержат различные гены, которые могут быть в цис- или транс-форме. Например, ретровирусный геном может содержать цис-действующие последовательности, такие как два длинных концевых повтора (LTR), с элементами для экспрессии генов, обратной транскрипции и интеграции в хромосомы хозяина. Другие компоненты включают в себя сигнал упаковки (psi или Ψ) для специфической упаковки РНК во вновь образованные вирионы и полипуриновый тракт (PPT), место инициации синтеза положительно-полярной нити ДНК во время обратной транскрипции. Кроме того, ретровирусный геном может содержать гены gag, pol и env. Ген gag кодирует структурные белки, ген pol кодирует ферменты, которые сопровождают оцРНК и осуществляют обратную транскрипцию вирусной РНК в ДНК, а ген env кодирует вирусную оболочку. Как правило, gag, pol и env предоставляются в транс для вирусной репликации и упаковки.
Согласно определенным вариантам осуществления представленный в настоящем документе ретровирусный вектор может представлять собой лентивирусный вектор. Распознаются по меньшей мере пять серогрупп или серотипов лентивирусов. Вирусы разных серотипов могут по-разному инфицировать определенные типы клеток и/или хозяев. Лентивирусы, например, включают в себя ретровирусы приматов и ретровирусы неприматов. Ретровирусы приматов включают в себя HIV и вирус иммунодефицита обезьян (SIV). Ретровирусы неприматов включают в себя вирус иммунодефицита кошек (FIV), вирус иммунодефицита крупного рогатого скота (BIV), вирус артрита-энцефалита коз (CAEV), вирус инфекционной анемии лошадей (EIAV) и виснавирус. Лентивирусы или лентивекторы могут быть способны трансдуцировать покоящиеся клетки. Как и в случае онкоретровирусных векторов, конструкция лентивекторов может быть основана на разделении цис- и транс-действующих последовательностей.
Согласно определенным вариантам осуществления в настоящей заявке представлены векторы экспрессии, которые были разработаны для доставки с помощью оптимизированного терапевтического ретровирусного вектора. Ретровирусный вектор может представлять собой лентивирус, содержащий левый (5') LTR; последовательности, которые способствуют упаковке и/или ядерному импорту вируса; промотор; необязательно, один или несколько дополнительных регуляторных элементов (таких как, например, энхансер или последовательность полиА); необязательно лентивирусный элемент обратного ответа (RRE); конструкция, содержащая селективный регуляторный элемент PV, функционально связанный с последовательностью, кодирующей eTF; необязательно инсулятор и правый (3') ретровирусный LTR.
Согласно иллюстративным вариантам осуществления представленный в настоящем документе вирусный вектор представляет собой аденоассоциированный вирус (AAV). AAV представляет собой небольшой вирус животных без оболочки, дефектной репликации, который поражает людей и некоторые другие виды приматов. Известно, что AAV вызывает заболевание человека и вызывает умеренный иммунный ответ. Векторы AAV могут также инфицировать как делящиеся, так и покоящиеся клетки, не встраиваясь в геном клетки-хозяина.
Геном AAV состоит из линейной одноцепочечной ДНК длиной ~4,7 т.п.н. Геном состоит из двух открытых рамок считывания (ORF), фланкированных последовательностью инвертированного концевого повтора (ITR) длиной приблизительно 145 п.н. ITR состоит из нуклеотидной последовательности на 5'конце (5' ITR) и нуклеотидной последовательности, расположенной на 3'-конце (3' ITR), которые содержат палиндромные последовательности. ITR функционируют в цис-системе путем сворачивания с образованием T-образных шпилечных структур за счет комплементарного спаривания оснований, которые действуют как праймеры во время инициации репликации ДНК для синтеза второй цепи. Две открытые рамки считывания кодируют гены rep и cap, которые участвуют в репликации и упаковке вириона. Согласно иллюстративному варианту осуществления представленный в настоящем документе вектор AAV не содержит генов rep или cap. Такие гены могут быть представлены в транс для производства вирионов, как описано ниже.
Согласно определенным вариантам осуществления вектор AAV может включать в себя лишнюю нуклеиновую кислоту. Согласно определенным вариантам осуществления лишняя нуклеиновая кислота может кодировать зеленый флуоресцентный белок или ген устойчивости к антибиотикам, таким как канамицин или ампициллин. Согласно определенным вариантам осуществления лишняя нуклеиновая кислота может быть расположена вне последовательностей ITR (например, по сравнению с последовательностью трансгена eTF и регуляторными последовательностями, которые расположены между 5' и 3' ITR-последовательностями).
Существуют различные серотипы AAV, включая в себя AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12 и AAV13. Эти серотипы различаются по своему тропизму
- 43 046157 или по типам клеток, которые они заражают. AAV могут содержать геном и капсиды из множества серотипов (например, псевдотипов). Например, AAV может содержать геном серотипа 2 (например, ITR), упакованный в капсид серотипа 5 или серотипа 9. Псевдотипы могут повышать эффективность трансдукции, а также изменять тропизм.
В некоторых случаях предпочтителен серотип AAV, который может пересекать гематоэнцефалический барьер или инфицировать клетки ЦНС. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный регуляторный элемент PV, функционально связанный с трансгеном, кодирующим eTF, который избирательно активирует SCN1A. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный в отношении PV сайт связывания микроРНК. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, кодирующим eTF, который селективно активирует SCN1A, и селективный в отношении PV сайт связывания микроРНК.
Согласно иллюстративным вариантам осуществления в настоящей заявке представлены векторы экспрессии, которые были разработаны для доставки с помощью AAV. AAV может быть любого серотипа, например, AAV1, AAV2, AAV3, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, или химерным, гибридным или вариантом AAV. AAV также может представлять собой самокомплементарный AAV (scAAV). Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR и 3' ITR. Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR, промотор, трансген, кодирующий eTF, и 3' ITR. Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR, энхансер, промотор, трансген, кодирующий eTF, последовательность полиА и 3' ITR.
Клетки-хозяева.
Согласно другому аспекту настоящее изобретение относится к клетке-хозяину, содержащей кассету экспрессии или вектор экспрессии, как раскрыто в настоящем документе. Клетки-хозяева могут представлять собой бактериальную клетку, дрожжевую клетку, клетку насекомого или клетку млекопитающего. Согласно иллюстративному варианту осуществления под клеткой-хозяином понимается любая линия клеток, которая восприимчива к заражению представляющим интерес вирусом и поддается культивированию in vitro.
Согласно определенным вариантам осуществления предложенная в настоящем документе клеткахозяин может использоваться для целей генной терапии ex vivo. Согласно таким вариантам осуществления клетки трансфицируют молекулой нуклеиновой кислоты или вектором экспрессии, содержащим селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и затем трансплантируют пациенту или субъекту. Трансплантированные клетки могут иметь аутологичное, аллогенное или гетерологичное происхождение. Для клинического применения выделение клеток, как правило, проводят в условиях надлежащей производственной практики (GMP). Перед трансплантацией, как правило, проверяется качество клеток и отсутствие микробов или других загрязнителей, и может проводиться предварительное кондиционирование, такое как облучение и/или иммуносупрессивное лечение. Кроме того, клетки-хозяева можно трансплантировать вместе с факторами роста для стимуляции пролиферации и/или дифференцировки клеток.
Согласно определенным вариантам осуществления клетка-хозяин может использоваться для генной терапии ex vivo. Предпочтительно указанные клетки представляют собой эукариотические клетки, такие как клетки млекопитающих, они включают в себя, без ограничения, людей, отличных от людей приматов, таких как обезьяны; шимпанзе; мартышки и орангутаны, домашних животных, включая в себя собак и кошек, а также домашний скот, такой как лошади, крупный рогатый скот, свиньи, овцы и козы, или другие виды млекопитающих, включая в себя, без ограничения, мышей, крыс, морских свинок, кроликов, хомяков и т.п. Специалист в настоящей области техники выберет более подходящие клетки в соответствии с пациентом или объектом трансплантации.
Согласно определенным вариантам осуществления представленная в настоящем документе клеткахозяин может представлять собой клетку со свойствами самообновления и плюрипотентности, например, стволовые клетки или индуцированные плюрипотентные стволовые клетки. Стволовые клетки предпочтительно представляют собой мезенхимальные стволовые клетки. Мезенхимальные стволовые клетки (MSC) способны дифференцироваться по меньшей мере в один из остеобластов, хондроцитов, адипоцитов или миоцитов и могут быть выделены из любого типа ткани. Как правило, MSC выделяют из костного мозга, жировой ткани, пуповины или периферической крови. Способы их получения хорошо известны специалисту в настоящей области техники. Индуцированные плюрипотентные стволовые клетки (также известные как iPS-клетки или iPSC) представляют собой тип плюрипотентных стволовых клеток, которые могут быть получены непосредственно из взрослых клеток. Yamanaka с соавт. индуцировали iPSклетки путем переноса генов Oct3/4, Sox2, Klf4 и c-Myc в фибробласты мыши и человека и вынуждая
- 44 046157 клетки экспрессировать гены (WO 2007/069666). Thomson с соавт. впоследствии производили iPS-клетки человека с использованием Nanog и Lin28 вместо Klf4 и c-Myc (WO 2008/118820).
Согласно иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин представляет собой упаковывающую клетку. Указанные клетки могут представлять собой прикрепленные или суспензионные клетки. Упаковывающая клетка и вспомогательный вектор или вирус, или конструкция(и) ДНК обеспечивают вместе в транс все недостающие функции, которые требуются для полной репликации и упаковки вирусного вектора.
Предпочтительно указанные упаковывающие клетки представляют собой эукариотические клетки, такие как клетки млекопитающих, включая в себя клетки обезьян, человека, собак и грызунов. Примерами клеток человека являются клетки PER.C6 (WO01/38362), MRC-5 (ATCC CCL-171), WI-38 (ATCC CCL-75), клетки HEK-293 (ATCC CRL-1573), клетки HeLa (ATCC CCL2) и фетальные клетки легких резус (ATCC CL-160). Примерами клеток отличных от людей приматов являются клетки Vero (ATCC CCL81), клетки COS-1 (ATCC CRL-1650) или клетки COS-7 (ATCC CRL-1651). Примерами клеток собаки являются клетки MDCK (ATCC CCL-34). Примерами клеток грызунов являются клетки хомяка, такие как BHK21-F, клетки HKCC или клетки CHO.
В качестве альтернативы источникам млекопитающих клеточные линии для применения в настоящем изобретении могут быть получены из источников птиц, таких как курица, утка, гусь, перепел или фазан. Примеры птичьих клеточных линий включают в себя птичьи эмбриональные стволовые клетки (WO01/85938 и WO03/076601), иммортализованные клетки сетчатки утки (WO2005/042728) и клетки, полученные из птичьих эмбриональных стволовых клеток, включая в себя клетки курицы (WO2006/108846) или клетки утки, такие как клеточная линия EB66 (WO2008/129058 и WO2008/142124).
Согласно другому варианту осуществления указанные клетки-хозяева представляют собой клетки насекомых, такие как клетки SF9 (ATCC CRL-1711), клетки Sf21 (IPLB-Sf21), клетки MG1 (BTI-TNMG1) или клетки High Five™ (BTI-TN-5B1-4).
Согласно определенным вариантам осуществления представленные в настоящем документе клеткихозяева, содержащие рекомбинантный вектор/геном AAV по настоящему изобретению (например, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A), могут дополнительно содержать одну или несколько конструкций нуклеиновых кислот, такие как, например, (i) конструкция нуклеиновой кислоты (например, плазмида-помощник AAV), которая кодирует гены rep и cap, но не несет последовательностей ITR; и/или (ii) конструкция нуклеиновой кислоты (например, плазмида), обеспечивающая аденовирусные функции, необходимые для репликации AAV. Согласно иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин содержит: i) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, как предусмотрено в настоящем документе (т.е. рекомбинантный геном AAV); ii) конструкцию нуклеиновой кислоты, кодирующую гены rep и cap AAV, которая не несет последовательности ITR; и iii) конструкцию нуклеиновой кислоты, содержащую аденовирусные гены-помощники (как описано ниже).
Согласно определенным вариантам осуществления гены-помощники rep, cap и аденовируса могут быть объединены в одной плазмиде (Blouin V et al. J Gene Med. 2004; 6(suppl): S223-S228; Grimm D. et al. Hum. Gene Ther. 2003; 7: 839-850). Таким образом, согласно другому иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин содержит: i) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как раскрыто в настоящем документе (т.е. рекомбинантный геном AAV); и ii) плазмиду, кодирующую гены rep и cap AAV, которая не несет последовательности ITR и дополнительно содержит гены-помощники аденовирусов.
Согласно другому варианту осуществления представленная в настоящем документе клетка-хозяин содержит: a) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе (т.е. геном рекомбинантного AAV); b) плазмиду, кодирующую гены rep и cap AAV, которая не несет последовательности ITR; и c) плазмиду, содержащую аденовирусные РНК геновпомощников E2a, E4 и VA; причем котрансфекция выполняется в клетках, предпочтительно в клетках млекопитающих, которые конститутивно экспрессируют и характеризуются транскомплементацией к аденовирусному гену E1, как клетки HEK-293 (ATCC CRL-1573).
Согласно определенным вариантам осуществления клетка-хозяин, подходящая для крупномасштабного производства векторов AAV, представляет собой клетки насекомых, которые можно инфицировать комбинацией рекомбинантных бакуловирусов (Urabe et al. Hum. Gene Ther. 2002; 13: 1935-1943). Например, клетки SF9 могут быть совместно инфицированы тремя бакуловирусными векторами, соответственно экспрессирующими rep AAV, cap AAV и упаковываемый вектор AAV. Рекомбинантные бакуловирусные векторы будут обеспечивать функции вирусного гена-помощника, необходимые для репликации и/или упаковки вируса.
Дополнительное руководство по конструированию и производству вирионов для генной терапии
- 45 046157 согласно настоящему изобретению можно найти в: Viral Vectors for Gene Therapy, Methods and Protocols. Series: Methods in Molecular Biology, Vol. 737. Merten and Al-Rubeai (Eds.); 2011 Humana Press (Springer); Gene Therapy. M. Giacca. 2010 Springer-Verlag; Heilbronn R. and Weger S. Viral Vectors for Gene Transfer: Current Status of Gene Therapeutics. In: Drug Delivery, Handbook of Experimental Pharmacology 197; M. Schafer-Korting (Ed.). 2010 Springer-Verlag; pp. 143-170; Adeno-Associated Virus: Methods and Protocols. R. O. Snyder and P. Moulllier (Eds). 2011 Humana Press (Springer); Bunning H. et al. Recent developments in adeno-associated virus technology. J. Gene Med. 2008; 10:717-733 и Adenovirus: Methods and Protocols. M. Chillon and A. Bosch (Eds.); Third. Edition. 2014 Humana Press (Springer).
Вирионы и способы получения вирионов.
Согласно определенным вариантам осуществления в настоящей заявке представлены вирусные частицы, содержащие вирусный вектор, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе. Термины вирусная частица и вирион используются в настоящем документе взаимозаменяемо и относятся к инфекционной и, как правило, дефектной по репликации вирусной частице, содержащей вирусный геном (например, вектор вирусной экспрессии), упакованный внутри капсида, и, в зависимости от случая, например, для ретровирусов - липидную оболочку, окружающую капсид. Капсид относится к структуре, в которую упакован вирусный геном. Капсид состоит из нескольких олигомерных структурных субъединиц, состоящих из белков. Например, у AAV есть икосаэдрический капсид, образованный взаимодействием трех капсидных белков: VP1, VP2 и VP3. Согласно одному варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент и селективный в отношении PV сайт связывания микроРНК. Согласно другому варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент, функционально связанный с последовательностью, кодирующей eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, в белковой оболочке. Согласно другому варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент, функционально связанный с последовательностью, кодирующей eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и селективный в отношении PV сайт связывания микроРНК в белковой оболочке.
Согласно определенным вариантам осуществления представленный в настоящем документе рекомбинантный вирион AAV может быть получен путем инкапсидации генома AAV, полученного из определенного серотипа AAV, в вирусную частицу, образованную природными белками Cap, соответствующими AAV того же конкретного серотипа. Согласно другим вариантам осуществления представленная в настоящем документе вирусная частица AAV содержит вирусный вектор, содержащий ITR данного серотипа AAV, упакованный в белки из другого серотипа. Смотрите, например, Bunning H et al. J Gene Med 2008; 10: 717-733. Например, вирусный вектор, имеющий ITR из данного серотипа AAV, может быть упакован в: a) вирусную частицу, состоящую из капсидных белков, полученных из того же или другого серотипа AAV (например, ITR AAV2 и капсидных белков AAV9; ITR AAV2 и капсидных белков AAV8 и т.п.); b) мозаичную вирусную частицу, состоящую из смеси капсидных белков из различных серотипов или мутантов AAV (например, ITR AAV2 с капсидными белками AAV1 и AAV9); c) химерную вирусную частицу, состоящую из капсидных белков, которые были усечены перестановкой доменов между различными серотипами или вариантами AAV (например, ITR AAV2 с белками капсида AAV8 с доменами AAV9); или d) нацеленную вирусную частицу, сконструированную для отображения селективных связывающих доменов, обеспечивающих строгое взаимодействие со специфическими рецепторами целевой клетки (например, ITR AAV5 с капсидными белками AAV9, генетически усеченными путем вставки пептидного лиганда; или капсидные белки AAV9, не модифицированные генетически путем связывания пептидного лиганда на поверхности капсида).
Квалифицированному специалисту будет понятно, что представленный в настоящем документе вирион AAV может содержать капсидные белки любого серотипа AAV. Согласно одному варианту осуществления вирусная частица содержит капсидные белки из серотипа AAV, выбранного из группы, состоящей из AAV1, AAV2, AAV5, AAV8 и AAV9, которые более подходят для доставки в ЦНС (M. Hocquemiller et al., Hum Gene Ther 27(7): 478-496 (2016)). Согласно конкретному варианту осуществления вирусная частица содержит кассету экспрессии по настоящему изобретению, в которой последовательности 5'ITR и 3'ITR кассеты экспрессии относятся к серотипу AAV2, а белки капсида относятся к серотипу AAV9.
В настоящей области техники известны многочисленные способы получения вирионов rAAV, включая в себя трансфекцию, получение стабильных клеточных линий и системы производства инфекционных гибридных вирусов, которые включают в себя гибриды аденовирус-AAV, гибриды герпесвирус-AAV (Conway, J E et al., (1997) J. Virology 71(11):8780-8789) и гибриды бакуловирус-AAV. Все куль
- 46 046157 туры производства rAAV для производства вирусных частиц rAAV требуют: 1) подходящие клеткихозяева, включая в себя, например, клеточные линии человеческого происхождения, такие как клетки HeLa, A549 или 293, или клеточные линии, полученные из насекомых, такие как SF-9, в случае систем производства бакуловирусов; 2) подходящей функции вируса-помощника, обеспечиваемой аденовирусом дикого типа или мутантным аденовирусом (таким как чувствительный к температуре аденовирус), вирусом герпеса, бакуловирусом или плазмидной конструкцией, обеспечивающей вспомогательные функции; 3) гены rep и cap AAV и генные продукты; 4) трансген (например, содержащий один или несколько из: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированный последовательностями ITR AAV; и 5) подходящие носители и компоненты среды для поддержки производства rAAV.
Согласно различным вариантам осуществления описанные в настоящем документе клетки-хозяева содержат следующие три компонента: (1) ген rep и ген cap, (2) гены, обеспечивающие вспомогательные функции, и (3) трансген (например, содержащий один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированных ITR. Ген rep AAV, ген cap AAV и гены, обеспечивающие вспомогательные функции, могут быть введены в клетку путем включения указанных генов в вектор, такой как, например, плазмида, и введения указанного вектора в клетку-хозяина. Гены rep, cap и гены, обеспечивающие вспомогательные функции, могут быть включены в одну и ту же плазмиду или в разные плазмиды. Согласно предпочтительному варианту осуществления гены rep и cap AAV включены в одну плазмиду, а гены, обеспечивающие вспомогательные функции, включены в другую плазмиду. Различные плазмиды для создания клетки-хозяина для производства вирионов (например, содержащие гены rep и cap AAV, вспомогательных функций или трансген) могут быть введены в клетку с использованием любого подходящего способа, хорошо известного в настоящей области техники. Примеры способов трансфекции включают в себя, без ограничения, соосаждение с фосфатом кальция, DEAE-декстраном, полибреном, электропорацию, микроинъекцию, опосредованное липосомами слияние, липофекцию, ретровирусную инфекцию и биолистическую трансфекцию. Согласно определенным вариантам осуществления плазмиды, обеспечивающие гены rep и cap, вспомогательные функции и трансген, фланкированный ITR, могут быть введены в клетку одновременно. Согласно другому варианту осуществления плазмиды, обеспечивающие гены rep и cap и вспомогательные функции, могут быть введены в клетку до или после введения плазмиды, содержащей трансген. Согласно иллюстративному варианту осуществления клетки трансфицируют одновременно тремя плазмидами (например, способом тройной трансфекции): (1) плазмидой, содержащей трансген (например, содержащей один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированного ITR, (2) плазмидой, содержащей гены rep и cap AAV, и (3) плазмидой, содержащей гены, обеспечивающие вспомогательные функции. Иллюстративные клетки-хозяева могут представлять собой клетки 293, A549 или HeLa.
Согласно другим вариантам осуществления один или несколько из (1) генов rep и cap AAV, (2) генов, обеспечивающих вспомогательные функции, и (3) трансгена (например, содержащего один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированного ITR, может переноситься упаковывающей клеткой либо эписомально, либо интегрироваться в геном упаковывающей клетки. Согласно одному варианту осуществления клетки-хозяева могут представлять собой упаковывающие клетки, в которых гены rep и cap AAV и гены, обеспечивающие вспомогательные функции, стабильно поддерживаются в клеткехозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащей один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированный ITR. Согласно другому варианту осуществления клетки-хозяева представляют собой упаковывающие клетки, в которых гены rep и cap AAV стабильно поддерживаются в клетке-хозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащей один или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированный ITR и плазмидой, содержащей вспомогательные функции. Согласно другому варианту осуществления клетки-хозяева могут представлять собой упаковывающие клетки, в которых вспомогательные функции стабильно поддерживаются в клетке-хозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащий один или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный
- 47 046157 в отношении PV промотор), фланкированный ITR, и плазмидой, содержащей гены rep и cap. Согласно другому варианту осуществления клетки-хозяева могут представлять собой клеточные линиипродуценты, которые стабильно трансфицируются генами rep и cap, генами, обеспечивающими вспомогательные функции, и последовательностью трансгена (например, содержащего одно или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированного ITR. Иллюстративные упаковывающие клетки и клетки-продуценты могут происходить из клеток 293, A549 или HeLa.
Согласно другому варианту осуществления линия клеток-продуцентов представляет собой линию клеток насекомых (как правило, клетки Sf9), которые инфицированы векторами экспрессии бакуловируса, которые обеспечивают белки Rep и Cap. Для этой системы не требуются гены-помощники аденовируса (Ayuso E, et al., Curr. Gene Ther. 2010, 10:423-436).
Используемый в настоящем документе термин белок cap относится к полипептиду, обладающему по меньшей мере одной функциональной активностью нативного белка cap AAV (например, VP1, VP2, VP3). Примеры функциональной активности белков cap включают в себя способность индуцировать образование капсида, способствовать накоплению одноцепочечной ДНК, облегчать упаковку ДНК AAV в капсиды (т.е. инкапсидацию), связываться с клеточными рецепторами и облегчать проникновение вириона в клетки-хозяева. В принципе, в контексте настоящего изобретения можно использовать любой белок Cap.
Сообщалось, что белки cap влияют на тропизм хозяина, специфичность клеток, тканей или органов, использование рецепторов, эффективность заражения и иммуногенность вирусов AAV. Соответственно, cap AAV для применения в rAAV может быть выбран с учетом, например, вида субъекта (например, человека или не человека), иммунологического состояния субъекта, его пригодности для длительного или краткосрочного лечения или конкретного терапевтического применения (например, лечение конкретного заболевания или нарушения или доставка в определенные клетки, ткани или органы). Согласно определенным вариантам осуществления белок cap происходит из группы AAV, состоящей из серотипов AAV1, AAV2, AAV5, AAV8 и AAV9. Согласно иллюстративному варианту осуществления белок cap происходит из AAV9.
Согласно некоторым вариантам осуществления cap AAV для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых cap AAV или кодирующей его нуклеиновой кислоты. Согласно определенным вариантам осуществления cap AAV по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых cap AAV.
Согласно некоторым вариантам осуществления cap AAV является химерным и содержит домены из двух, трех, четырех или более из вышеупомянутых cap AAV. Согласно определенным вариантам осуществления cap AAV представляет собой мозаику мономеров VP1, VP2 и VP3, происходящих из двух или трех различных AAV или рекомбинантного AAV. Согласно определенным вариантам осуществления композиция rAAV содержит более одного из вышеупомянутых cap.
Согласно некоторым вариантам осуществления cap AAV для применения в вирионе rAAV сконструирован таким образом, чтобы он содержал гетерологичную последовательность или другую модификацию. Например, последовательность пептида или белка, обеспечивающая избирательное нацеливание или уклонение от иммунитета, может быть преобразована в белок cap. В качестве альтернативы или в дополнение, cap может быть химически модифицирован так, чтобы поверхность rAAV была полиэтиленгликолированной (т.е. пегилированной), что может способствовать уклонению от иммунитета. Белок cap также может быть мутагенизирован (например, для удаления его естественного связывания с рецептором или для маскировки иммуногенного эпитопа).
Используемый в настоящем документе термин белок rep относится к полипептиду, обладающему по меньшей мере одной функциональной активностью нативного белка rep AAV (например, rep 40, 52, 68, 78). Примеры функциональной активности белка rep включают в себя любую активность, связанную с физиологической функцией белка, включая в себя облегчение репликации ДНК посредством распознавания, связывания и отсечения ориджина AAV репликации ДНК, а также активности ДНК-геликазы. Дополнительные функции включают в себя модуляцию транскрипции с промоторов AAV (или других гетерологичных) и сайт-специфическую интеграцию ДНК AAV в хромосому хозяина. Согласно конкретному варианту осуществления гены rep AAV могут происходить из серотипов AAV1, AAV2, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 или AAVrh10; более предпочтительно из серотипа AAV, выбранного из группы, состоящей из AAV1, AAV2, AAV5, AAV8 и AAV9.
Согласно определенным вариантам осуществления белок rep AAV для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых rep AAV или его кодирующей нуклеиновой кислоты. Согласно определенным вариантам осуществления rep AAV по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых rep AAV.
Использованные в настоящем документе выражения вспомогательные функции или гены
- 48 046157 помощники относятся к вирусным белкам, репликация которых зависит от AAV. Вспомогательные функции включают в себя те белки, которые необходимы для репликации AAV, включая в себя, без ограничения, те белки, которые участвуют в активации транскрипции гена AAV, стадиеспецифическом сплайсинге мРНК AAV, репликации ДНК AAV, синтезе продуктов экспрессии cap и сборке капсида AAV. Вспомогательные функции на основе вирусов могут быть получены из любого из известных вспомогательных вирусов, таких как аденовирус, вирус герпеса (кроме вируса простого герпеса типа 1) и вирус осповакцины. Вспомогательные функции включают в себя, без ограничения, аденовирус E1, E2a, VA и E4 или герпесвирус UL5, ULB, UL52 и UL29 и герпесвирусную полимеразу. Согласно предпочтительному варианту осуществления белки, от которых зависит репликация AAV, происходят от аденовируса.
Согласно определенным вариантам осуществления вирусный белок, репликация которого зависит от AAV, для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых вирусных белков или кодирующей его нуклеиновой кислоты. Согласно определенным вариантам осуществления вирусный белок по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых вирусных белков.
Способы анализа функций белков cap, белков rep и вирусных белков, от которых зависит репликация AAV, хорошо известны в настоящей области техники.
Клетки-хозяева для экспрессии представляющего интерес трансгена (например, содержащие одно или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор) могут быть выращены в условиях, подходящих для сборки вирионов AAV. Согласно определенным вариантам осуществления клетки-хозяева выращивают в течение подходящего периода времени, чтобы способствовать сборке вирионов AAV и высвобождению вирионов в среду. Как правило, клетки можно выращивать в течение приблизительно 24 часов, приблизительно 36 часов, приблизительно 48 часов, приблизительно 72 часов, приблизительно 4 дней, приблизительно 5 дней, приблизительно 6 дней, приблизительно 7 дней, приблизительно 8 дней, приблизительно 9 дней или до приблизительно 10 дней. Приблизительно через 10 дней (или раньше, в зависимости от условий культивирования и конкретной используемой клетки-хозяина) уровень продукции, как правило, значительно снижается. Как правило, время культивирования измеряется с момента образования вируса. Например, в случае AAV производство вируса, как правило, начинается после обеспечения функции вируса-помощника в соответствующей клетке-хозяине, как описано в настоящем документе. Как правило, клетки собирают от приблизительно 48 до приблизительно 100, предпочтительно от приблизительно 48 до приблизительно 96, предпочтительно от приблизительно 72 до приблизительно 96, предпочтительно от приблизительно 68 до приблизительно 72 часов после заражения вирусом-помощником (или после начала производства вируса).
Культуры-продуценты rAAV можно выращивать в различных условиях (в широком диапазоне температур, в течение различных периодов времени и т.п.), подходящих для конкретной используемой клетки-хозяина. Культуры производства rAAV включают в себя культуры, зависящие от прикрепления, которые можно культивировать в подходящих емкостях, зависящих от прикрепления, таких как, например, вращающиеся флаконы, фильтры из полого волокна, микроносители и биореакторы с уплотненным слоем или с псевдоожиженным слоем. Культуры производства вектора rAAV могут также включать в себя адаптированные к суспензии клетки-хозяева, такие как клетки HeLa, 293 и SF-9, которые можно культивировать различными способами, включая в себя, например, вращающиеся колбы, биореакторы с мешалкой и одноразовые системы, такие как система одноразовых реакторов фирмы Wave.
Подходящие среды, известные в настоящей области техники, могут использоваться для производства вирионов rAAV. Эти среды включают в себя, без ограничения, среды, производимые Hyclone Laboratories и JRH, включая в себя модифицированную среду Игла (MEM), модифицированную Дульбекко среду Игла (DMEM), каждая из которых полностью включена в настоящий документ посредством ссылки. Согласно определенным вариантам осуществления культуральная среда для производства rAAV может быть дополнена сывороткой или полученными из сыворотки рекомбинантными белками на уровне 0,5-20% (в объемном отношении или массово-объемном отношении). Альтернативно, векторы rAAV могут быть получены в бессывороточных условиях, которые также могут называться средами без продуктов животного происхождения.
После культивирования клеток-хозяев, чтобы обеспечить производство вирионов AAV, полученные вирионы могут быть собраны и очищены. Согласно определенным вариантам осуществления вирионы AAV могут быть получены из (1) клеток-хозяев производственной культуры путем лизиса клеток-хозяев и/или (2) культуральной среды указанных клеток через период времени после трансфекции, предпочтительно 72 часа. Вирионы rAAV могут быть собраны из отработанной среды из производственной культуры при условии, что клетки культивируются в условиях, которые вызывают высвобождение вирионов rAAV в среду из интактных клеток (см., например, патент США № 6566118). Подходящие способы лизирования клеток также известны в настоящей области техники и включают в себя, например, несколько циклов замораживания/оттаивания, обработку ультразвуком, микрофлюидизацию и обработку химиче
- 49 046157 скими веществами, такими как детергенты и/или протеазы.
После сбора вирионы rAAV могут быть очищены. Используемый в настоящем документе термин очищенный включает в себя препарат вирионов rAAV, лишенный по меньшей мере некоторых других компонентов, которые также могут присутствовать там, где вирионы rAAV встречаются в природе или из которых изначально получены. Таким образом, например, очищенные вирионы rAAV могут быть получены с использованием способа выделения для обогащения их из исходной смеси, такой как лизат культуры или супернатант производственной культуры. Обогащение можно измерить множеством способов, например, по доле устойчивых к ДНКазам частиц (DRP) или копий генома (gc), присутствующих в растворе, или по инфекционности, или его можно измерить по отношению к второму, потенциально мешающему веществу, присутствующему в исходной смеси, такому как загрязняющие вещества, включая в себя загрязняющие вещества производственной культуры или технологические загрязняющие вещества, включая в себя вирус-помощник, компоненты среды и т.п.
Согласно определенным вариантам осуществления выход культуры производства rAAV можно осветлить для удаления остатков клеток-хозяев. Согласно некоторым вариантам осуществления выход культуры производства можно осветлить с использованием множества стандартных технологий, таких как центрифугирование или фильтрация через фильтр с размером пор 0,2 мкм или более (например, фильтр из ацетата целлюлозы или серия глубинных фильтров).
Согласно определенным вариантам осуществления выход культуры для производства rAAV дополнительно обрабатывают бензоназой™ для расщепления любой высокомолекулярной ДНК, присутствующей в производственной культуре. Согласно некоторым вариантам осуществления расщепление бензоназой™ проводят в стандартных условиях, например, при конечной концентрации 1-2,5 единиц/мл бензоназы™ при температуре от температуры окружающей среды до 37°C в течение периода от 30 минут до нескольких часов.
Согласно определенным вариантам осуществления вирионы rAAV могут быть выделены или очищены с использованием одной или нескольких из следующих стадий очистки: равновесное центрифугирование; проточная анионообменная фильтрация; тангенциальная проточная фильтрация (TFF) для концентрирования частиц rAAV; захват rAAV с помощью апатитовой хроматографии; тепловая инактивация вируса-помощника; захват rAAV с помощью хроматографии гидрофобного взаимодействия; замена буфера с помощью эксклюзионной хроматографии (SEC); нанофильтрация и захват rAAV с помощью анионообменной хроматографии, катионообменной хроматографии или аффинной хроматографии. Эти стадии можно использовать по отдельности, в различных комбинациях или в разном порядке. Способы очистки частиц rAAV можно найти, например, в Xiao et al., (1998) Journal of Virology 72:2224-2232; патентах США № 6989264 и 8137948 и WO 2010/148143.
Согласно определенным вариантам осуществления очищенные вирионы AAV можно подвергнуть диализу против PBS, отфильтровать и хранить при температуре -80°C. Титры вирусных геномов можно определить с помощью количественной ПЦР с использованием линеаризованной плазмидной ДНК в качестве стандартной кривой (см., например, Lock M, et al., Hum. Gene Ther. 2010; 21:1273-1285).
Фармацевтические композиции.
Согласно определенным вариантам осуществления в настоящей заявке представлены композиции, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, и фармацевтически приемлемый носитель. Согласно другим вариантам осуществления в настоящей заявке представлены вирионы, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, и фармацевтически приемлемый носитель. Согласно иллюстративным вариантам осуществления такие композиции подходят для применения в генной терапии. Фармацевтические композиции предпочтительно стерильны и стабильны в условиях производства и хранения. Стерильные растворы могут быть получены, например, путем фильтрации через стерильные фильтрующие мембраны.
Приемлемые носители и вспомогательные вещества в фармацевтических композициях предпочтительно нетоксичны для реципиентов в используемых дозировках и концентрациях. Приемлемые носители и вспомогательные вещества могут включать в себя такие буферы, как фосфатный, цитратный, HEPES и TAE, такие антиоксиданты, как аскорбиновая кислота и метионин, такие консерванты, как гексаметоний хлорид, октадецилдиметилбензиламмонийхлорид, резорцин и хлорид бензалкония, такие белки, как сывороточный альбумин человека, желатин, декстран и иммуноглобулины, такие гидрофильные полимеры, как поливинилпирролидон, такие аминокислоты, как глицин, глутамин, гистидин и лизин, и такие углеводы, как глюкоза, манноза, сахароза и сорбитол. Фармацевтические композиции по настоящему раскрытию можно вводить парентерально в форме инъекционной композиции. Фармацевтические композиции для инъекций могут быть составлены с использованием стерильного раствора или любой фармацевтически приемлемой жидкости в качестве носителя. Фармацевтически приемлемые носители включают в себя, без ограничения, стерильную воду и физиологический раствор.
Фармацевтические композиции по настоящему раскрытию могут быть приготовлены в микрокап
- 50 046157 сулах, таких как гидроксилметилцеллюлозные или желатиновые микрокапсулы и микрокапсулы из полиметилметакрилата. Фармацевтические композиции по настоящему раскрытию также могут быть приготовлены в других системах доставки лекарственных средств, таких как липосомы, микросферы альбумина, микроэмульсии, наночастицы и нанокапсулы. Фармацевтическая композиция для генной терапии может быть в приемлемом разбавителе или может содержать матрицу с медленным высвобождением, в которую встроен носитель для доставки гена.
Представленные в настоящем документе фармацевтические композиции могут быть составлены для парентерального введения, подкожного введения, внутривенного введения, внутримышечного введения, внутриартериального введения, интрапаренхимального введения, интратекального введения, введения в мостомозжечковую цистерну, интрацеребровентрикулярного введения или внутрибрюшинного введения. Фармацевтическая композиция также может быть приготовлена или вводиться путем назального введения, посредством спрея, перорального, аэрозольного, ректального или вагинального введения. Согласно одному варианту осуществления представленная в настоящем документе фармацевтическая композиция вводится в ЦНС или спинномозговую жидкость (CSF), т.е. путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Тканевая мишень может быть специфической, например, ЦНС, или может представлять собой комбинацию нескольких тканей, например, мышечных тканей и тканей ЦНС. Иллюстративная ткань или другие мишени могут включать в себя печень, скелетные мышцы, сердечную мышцу, жировые отложения, почки, легкие, эндотелий сосудов, эпителиальные клетки, кроветворные клетки, ЦНС и/или CSF. Согласно предпочтительному варианту осуществления представленная в настоящем документе фармацевтическая композиция, содержащая селективный в отношении PV сайт связывания микроРНК и/или eTF, который избирательно активирует SCN1A, вводится инъекцией в ЦНС или спинномозговую жидкость, т.е. путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Один или несколько из этих способов можно использовать для введения фармацевтической композиции по настоящему раскрытию.
Согласно определенным вариантам осуществления представленная в настоящем документе фармацевтическая композиция содержит эффективное количество или терапевтически эффективное количество. В контексте настоящего описания такие количества относятся к количеству, эффективному в дозировках и в течение периодов времени, необходимых для достижения желаемого терапевтического результата, такого как повышение уровня экспрессии SCN1A и/или уменьшение частоты и/или продолжительности припадков.
Дозировка фармацевтических композиций по настоящему раскрытию зависит от факторов, включающих в себя путь введения, заболевание, которое необходимо лечить, и физические характеристики (например, возраст, массу, общее состояние здоровья) субъекта. Дозировка может быть скорректирована для обеспечения оптимального терапевтического ответа. Как правило, дозировка может представлять собой количество, которое эффективно лечит заболевание, не вызывая значительной токсичности. Согласно одному варианту осуществления представленный в настоящем документе вектор AAV можно вводить пациенту для лечения дефицита SCNIA (включая в себя, например, синдром Драве) в количестве или дозе в диапазоне от 5х 1011 до 1 х 1014 гк/кг (количество геномных копий на килограмм массы тела пациента (гк/кг)). Согласно более конкретному варианту осуществления вектор AAV вводят в количестве, которое находится в диапазоне от приблизительно 5х 1011 гк/кг до приблизительно 3х1013 гк/кг или от приблизительно 1х1012до приблизительно 1 х 1014 гк/кг, или от приблизительно 1 х 1012 до приблизительно 1х1013 гк/кг, или приблизительно 5х1011 гк/кг, 1х1012 гк/кг, 1,5х1012 гк/кг, 2,0х1012 гк/кг, 2,5х1012 гк/кг, 3х1012 гк/кг, 3,5х1012 гк/кг, 4х1012 гк/кг, 4,5х1012 гк/кг, 5х1012 гк/кг, 5,5х1012 гк/кг, 6х1012 гк/кг, 6,5х1012 гк/кг, 7х1012 гк/кг, 7,5х1012 гк/кг, 8х1012 гк/кг, 8,5х1012 гк/кг, 9х1012 гк/кг или 9,5х1012 гк/кг. гк/кг можно определить, например, с помощью кПЦР или цифровой капельной ПЦР (ddPCR) (см., например, M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2): 115-25). Согласно другому варианту осуществления представленный в настоящем документе вектор AAV можно вводить пациенту для лечения дефицита SCNIA (включая в себя, например, синдром Драве) в количестве или дозе в диапазоне от 1х 109 до 1х 1011 iu/кг (инфекционные единицы вектора (ш)/масса тела субъекта или пациента (кг)). Согласно определенным вариантам осуществления фармацевтическая композиция может быть приготовлена в виде стандартной дозы по мере необходимости. Такие единичные дозированные единицы могут содержать от приблизительно 1х109 gc до приблизительно 1 х 1015 gc.
Фармацевтические композиции по настоящему раскрытию можно вводить нуждающемуся в этом субъекту, например, один или несколько раз (например, 1-10 раз или более) ежедневно, еженедельно, ежемесячно, два раза в год, ежегодно или по медицинским показаниям. Согласно иллюстративному варианту осуществления достаточно однократного введения. Согласно одному варианту осуществления фармацевтическая композиция, содержащая кассету экспрессии, кодирующую селективный в отношении PV сайт связывания микроРНК и/или eTF, который избирательно активирует SCN1A, подходит для применения у людей и вводится путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Согласно одному вари- 51 046157 анту осуществления фармацевтическая композиция доставляется через периферическую вену путем болюсной инъекции. Согласно другим вариантам осуществления фармацевтическая композиция доставляется через периферическую вену путем инфузии в течение приблизительно 10 минут (±5 минут), в течение приблизительно 20 минут (±5 минут), в течение приблизительно 30 минут (±5 минут), в течение приблизительно 60 минут (±5 минут) или в течение более чем 90 минут (±10 минут).
Согласно другому аспекту в настоящей заявке дополнительно представлен набор, содержащий молекулу нуклеиновой кислоты, вектор, клетку-хозяина, вирион или фармацевтическую композицию, как описано в настоящем документе, в одном или нескольких контейнерах. Набор может содержать инструкции или упаковочные материалы, которые описывают, как вводить пациенту молекулу нуклеиновой кислоты, вектор, клетку-хозяина или вирион, содержащиеся в наборе. Контейнеры набора могут быть из любого подходящего материала, например, стекла, пластика, металла и т.д., и быть любого подходящего размера, формы или конфигурации. Согласно определенным вариантам осуществления наборы могут содержать одну или несколько ампул или шприцев, которые содержат молекулу нуклеиновой кислоты, вектор, клетку-хозяина, вирион или фармацевтическую композицию в подходящей жидкости или форме раствора.
Способы лечения.
Согласно одному аспекту в настоящей заявке представлены способы применения eTF, которые избирательно активируют SCN1A, как раскрыто в настоящем документе. Согласно определенным вариантам осуществления в настоящей заявке представлены способы введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, для усиления экспрессии SCNIA в клетке. Согласно различным вариантам осуществления eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, можно использовать для модуляции экспрессии SCNIA в клетке in vitro, in vivo или ex vivo.
Согласно определенным вариантам осуществления в настоящей заявке представлены способы лечения заболевания или нарушения, связанного с SCN1A, путем введения субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, при необходимости. Согласно определенным вариантам осуществления нарушение представляет собой нарушение центральной нервной системы. Согласно иллюстративным вариантам осуществления заболевание или нарушение связано с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления гаплонедостаточность является результатом того, что субъект является гетерозиготным по мутации потери функции гена SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную со вставкой, делецией или заменой в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с точечной мутацией в гене SCN1A. Согласно определенным вариантам осуществления способ лечения заболевания или нарушения предусматривает введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, так что недостаточная экспрессия SCN1A корректируется, доводится до пределов уровня здорового человека или доводится до нормального диапазона, определенного стандартом медицинской помощи. Согласно определенным вариантам осуществления раскрытые в настоящем документе способы применяются для лечения заболевания или нарушения, связанного с эндогенным SCN1A, содержащим одну или несколько мутаций, которые приводят к аномальной экспрессии SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлены способы облегчения симптома, связанного с заболеванием или нарушением, путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, нуждающемуся в этом субъекту.
Согласно иллюстративному варианту осуществления в настоящей заявке представлены способы лечения заболевания, нарушения или симптома, связанного с мутацией в SCN1A (например, точечной мутацией, заменой, делецией, инверсией и т.д.), дефицитом в Nav1.1 и/или снижением активности Nav1.1 путем введения нуждающемуся в этом субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно усиливает экспрессию гена SCN1A или его белкового продукта Nav1.1. Управляемые напряжением ионные натриевые каналы важны для генерации и распространения потенциалов действия в поперечнополосатых мышцах и нервных тканях. Управляемые напряжением ионные натриевые каналы представляют собой гетеромерные комплексы, состоящие из большой центральной порообразующей гликозилированной альфасубъединицы и двух меньших вспомогательных бета-субъединиц. Большая альфа-субъединица субъединица Nav1.1, кодируемая геном SCN1A, актуальна для различных заболеваний или нарушений, таких как синдром Драве. Nav1.1 экспрессируется в нейронах и может быть собрана с различными бета- 52 046157 субъединицами, включая в себя Νανβΐ, экспрессируемую геном SCN1B.
Согласно определенным вариантам осуществления в настоящей заявке представлены способы лечения заболеваний, связанных с мутацией в SCN1A (например, делецией, вставкой, инверсией, точечной мутацией (например, нонсенс-мутацией, миссенс-мутацией) и т.д.) или сниженной активностью Nav1.1 с использованием eTF, который избирательно повышает экспрессию эндогенного гена SCN1A. Заболевания и нарушения, связанные с мутациями SCN1A, включают в себя, без ограничения: синдром Драве, синдром Охтахара, эпилепсию, раннюю детскую эпилептическую энцефалопатию 6 (EIEE6), семейные фебрильные припадки 3A (FEB3A), трудноизлечимую детскую эпилепсию с генерализованными тоникоклоническими припадками (ICEGTC), мигрень, семейную гемиплегию 3 (FHM3), синдром Панайотопулоса, семейную фибрилляцию предсердий 13 (ATFB13), генерализованную эпилепсию с фебрильными судорогами плюс типа 1 (gefs + тип 1), синдром Бругада, неспецифический дефект сердечной проводимости, генерализованную эпилепсию плюс, доброкачественный ранний младенческий эпилептический синдром, раннюю детскую эпилептическую энцефалопатию (EIEE11), доброкачественную семейную детскую эпилепсию, нейродегенерацию, таупатии и болезнь Альцгеймера. В некоторых случаях неврологическим заболеванием является синдром Драве. Мутации или аномалии в SCN1A также были связаны с судорожными расстройствами, эпилепсией, аутизмом, семейной гемиплегической мигренью 3 типа (FHM3), генетической эпилепсией с фебрильными припадками плюс (GEFS+) и эффективностью некоторых противосудорожных лекарственных средств. Например, мутация ICS5N+5G>A в SCN1A связана с максимально безопасным количеством (дозой) противосудорожных лекарственных средств фенитоина и карбамазепина.
Согласно определенным вариантам осуществления в настоящей заявке представлен способ лечения субъекта с синдромом Драве или с риском его развития путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A. Синдром Драве характеризуется продолжительными фебрильными и нефебрильными припадками в течение первого года жизни ребенка. Это заболевание прогрессирует до других типов припадков, таких как миоклонические и парциальные припадки, задержка психомоторного развития и атаксия. Оно характеризуется когнитивными нарушениями, поведенческими нарушениями и двигательными нарушениями. Поведенческие нарушения часто включают в себя гиперактивность и импульсивность, а в более редких случаях - аутистическое поведение. Синдром Драве также связан с нарушениями сна, включая в себя сонливость и бессонницу. У многих пациентов синдром Драве вызван генетическими мутациями, которые приводят к выработке нефункциональных белков. При лечении заболеваний, связанных с генетическими причинами, существует множество проблем. Таким образом, большинство существующих способов лечения было направлено на профилактическое лечение припадков и других симптомов.
У 70-90% пациентов синдром Драве вызывается нонсенс-мутациями в гене SCN1A, что приводит к преждевременному стоп-кодону и, следовательно, к нефункциональному белку. Как правило, миссенсмутация в сегменте S5 или S6 поры натриевого канала приводит к потере функции канала и развитию синдрома Драве. Гетерозиготное наследование мутации SCN1A, например, нонсенс-мутация, миссенсмутация, делеция, вставка, инверсия и т.д. - это все, что необходимо для развития дефектного натриевого канала; у пациентов с синдромом Драве останется одна нормальная копия гена. Таким образом, заболевание характеризуется как гаплонедостаточность, и, таким образом, увеличение экспрессии функционирующей копии SCN1A может восстанавливать нормальные уровни продукции Nav1.1.
Симптомы, связанные с синдромом Драве, включают в себя судороги, дефекты памяти, задержку развития, низкий мышечный тонус и/или когнитивные проблемы. Лечение кассетой экспрессии, вектором экспрессии или вириальной частицей, описанными в настоящем документе, может привести к улучшению одного или нескольких симптомов, таких как уменьшение количества, продолжительности и/или интенсивности припадков. Введение генной терапии, как описано в настоящем документе, субъекту с риском развития синдрома Драве может предотвратить развитие или замедлить прогрессирование одного или нескольких симптомов Драве.
Согласно определенным вариантам осуществления лечение кассетой экспрессии, вектором экспрессии или вириальной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как описано в настоящем документе, снижает продолжительность и/или частоту припадков, например, припадков, связанных с синдромом Драве, по меньшей мере на 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 95% или более по сравнению с не подвергнутым лечению контролем или по сравнению с уровнем до лечения.
У некоторых пациентов с болезнью Альцгеймера выработка амилоида β (Ae) с участием многих пептидов и протеаз может влиять на возбудимость нейронов, вызывая припадки и подавляя регуляцию натриевого канала Nav1.1 в нейронах PV. Согласно другому варианту осуществления в настоящей заявке представлены способы лечения субъекта, страдающего болезнью Альцгеймера, путем введения описан
- 53 046157 ной в настоящем документе кассеты экспрессии, вектора экспрессии или вирусной частицы, которая содержит полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A. Симптомы, связанные с болезнью Альцгеймера, включают в себя кратковременную потерю памяти, когнитивные трудности, припадки и трудности с речью, исполнительными функциями, восприятием (агнозия) и выполнением движений (апраксия). Лечение кассетой экспрессии, вектором экспрессии или вирусной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, может привести к улучшению одного или нескольких симптомов болезни Альцгеймера, таких как снижение прогрессирования потери памяти или предотвращение одного или нескольких симптомов. В некоторых случаях лечение может привести к коррекции активности головного мозга с высокой мощностью гаммаизлучения. Лечение может привести к снижению частоты припадков и/или тяжести припадков или снижению активности высокой мощности гамма-излучения по меньшей мере на 10%, 20%, 30%, 40%, 50%, 60%, 70% или более, как по сравнению с отсутствием лечения. В некоторых случаях лечение может привести к улучшению когнитивных функций. Обучение и/или память могут быть улучшены по меньшей мере на 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% или более чем на 100% по сравнению с отсутствием лечения или перед лечением полинуклеотидом, кодирующим eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе.
В некоторых случаях лечение кассетой экспрессии, вектором экспрессии или вирусной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, снижает активность высокой мощности гамма-излучения (например, активность высокой мощности гаммаизлучения, связанную с болезнью Альцгеймера) по меньшей мере на 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% или 95% по сравнению с не подвергнутым лечению контролем или по сравнению с уровнем до лечения.
Паркинсонизм относится к совокупности признаков и симптомов, обнаруживаемых при болезни Паркинсона (PD), включая в себя медлительность (брадикинезию), тугоподвижность (ригидность), тремор и дисбаланс (постуральную нестабильность). В некоторых случаях введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как описано в настоящем документе, субъекту с риском развития или страдающим болезнью Паркинсона может предотвратить развитие одного или нескольких симптомов или замедлить прогрессирование болезни Паркинсона по меньшей мере на 10%, по меньшей мере на 20%, по меньшей мере на 30%, по меньшей мере на 40%, по меньшей мере на 50%, по меньшей мере на 60%, по меньшей мере на 70%, по меньшей мере на 80% или по меньшей мере на 90% по сравнению с отсутствием лечения.
Согласно определенным вариантам осуществления в настоящей заявке представлены способы, которые можно применять для лечения субъекта, который находится в группе риска развития заболевания. Может быть известно, что субъект предрасположен к заболеванию, например, неврологическому заболеванию или заболеванию, связанному с эпилепсией, припадками и/или энцефалопатией. Субъект может быть предрасположен к заболеванию из-за генетического события или из-за известных факторов риска. Например, субъект может нести мутацию в SCN1A, которая связана с эпилепсией (такой как, например, синдром Драве). Любая мутация в гене SCN1A, которая снижает его активность (за счет снижения уровней экспрессии, нарушения функции белка или комбинации обоих), может предрасполагать субъекта к заболеванию, включая в себя любое одно или несколько из вставок, делеций, инверсий, транслокаций или замен (например, точечные мутации, включая в себя нонсенс-мутации и/или миссенс-мутации) в гене SCN1A. В некоторых случаях субъект может быть предрасположен к такому заболеванию, как болезнь Альцгеймера, из-за возраста субъекта. В некоторых случаях у субъекта может быть недостаточное количество белка SCN1A, и лечение заболевания, связанного с SCN1A, предусматривает введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует эндогенный SCN1A, как описано в настоящем документе.
Согласно определенным вариантам осуществления лечение с использованием кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует эндогенный SCN1A, представленный в настоящем документе, может привести к уменьшению или прекращению симптомов, связанных с синдромом Драве или другим заболеванием, связанным с SCN1A, или нарушением, например, эпилепсией, связанной с гаплонедостаточностью SCN1A. Например, лечение может улучшить обучение, память, когнитивные и/или двигательные функции; уменьшить частоту и/или продолжительность припадков; и/или снизить температурную чувствительность (или увеличить температурный порог для запуска припадка).
Согласно другому аспекту в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах приматов путем введения кассеты экс
- 54 046157 прессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе.
Согласно определенным вариантам осуществления в настоящей заявке представлен способ генной терапии, предусматривающий введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в заявке представлены способы генной терапии, предусматривающие введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе.
Согласно определенным вариантам осуществления в настоящей заявке представлен способ лечения заболевания или нарушения, предусматривающий введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в заявке представлены способы лечения заболевания или нарушения, предусматривающие введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе. Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, необязательно, селективный в отношении PV регуляторный элемент, могут быть использованы для лечения заболевания или нарушения, в которое вовлечены PV-содержащие нейроны. Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК и, возможно, селективный в отношении PV регуляторный элемент, используются для лечения состояния нейронов. Нейрональные заболевания или нарушения, подходящие для лечения, включают в себя, без ограничения, синдром Драве, болезнь Альцгеймера, болезнь Паркинсона, болезнь Хантингтона, боковой амиотрофический склероз (ALS), спинальную мышечную атрофию (SMA), эпилепсию, нейродегенеративные нарушения, двигательные нарушения, нарушения настроения, болезни двигательных нейронов, прогрессирующую мышечную атрофию (PMA), прогрессирующий бульбарный паралич, псевдобульбарный паралич, первичный боковой склероз, неврологические последствия СПИДа, нарушения развития, рассеянный склероз, нейрогенетические нарушения, инсульт, травму спинного мозга, черепно-мозговую травму, таупатию, гиповозбудимость нейронов и/или припадки. Согласно некоторым вариантам осуществления вирусный вектор, вирусная частица или фармацевтическая композиция, содержащая трансген и селективный в отношении PV сайт связывания микроРНК и необязательно селективный в отношении PV регуляторный элемент, используются для лечения психического расстройства (например, шизофрении, обсессивно-компульсивного расстройства, наркомании, депрессии, тревоги, психоза); расстройства аутистического спектра (например, синдрома ломкой X-хромосомы, синдрома Ретта); эпилепсии (например, синдрома Драве, хронической травматической энцефалопатии, генерализованной эпилепсии с фебрильными припадками плюс (GEFS+), эпилептической энцефалопатии, височной эпилепсии, фокальной эпилепсии, туберозного склероза, эпилепсии, связанной с гаплонедостаточностью SCN1A); и/или нейродегенерации (например, болезни Альцгеймера, болезни Паркинсона). Заболевания, связанные с дисфункциональными нейронами PV, например, вызванные мутациями потери функции в SCN1A или Nav1.1, включают в себя: синдром Драве, синдром Охтахара, эпилепсию, раннюю детскую эпилептическую энцефалопатию 6 (EIEE6), семейные фебрильные припадки 3A (FEB3A), трудноизлечимую детскую эпилепсию с генерализованными тонико-клоническими припадками (ICEGTC), мигрень, семейную гемиплегию 3 (FHM3), синдром Панайотопулоса, семейную фибрилляцию предсердий 13 (ATFB13), генерализованную эпилепсию с фебрильными припадками плюс типа 1 (gefs + тип 1), неспецифический кардиальный синдром, неспецифический синдром Бругада дефект проводимости, генерализованную эпилепсию с фебрильными припадками плюс, доброкачественный ранний младенческий эпилептический синдром, раннюю детскую эпилептическую энцефалопатию 11 (EIEE11), доброкачественную семейную детскую эпилепсию, нейродегенерацию, таупатии и болезнь Альцгеймера.
Согласно определенным вариантам осуществления лечение с использованием кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и селективный в отношении PV сайт
- 55 046157 связывания микроРНК, и, возможно, селективный в отношении PV регуляторный элемент, описанный в настоящем документе, приводит к улучшению симптомов, связанных с заболеванием или нарушением нейронов. Например, за пациентом с болезнью Паркинсона можно наблюдать симптоматически на предмет улучшения двигательных функций, что указывает на положительный ответ на лечение. Введение терапии с использованием описанного в настоящем документе способа субъекту с риском развития нейронального нарушения может предотвратить развитие или замедлить прогрессирование одного или нескольких симптомов.
Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, необязательно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, могут быть использованы для лечения субъекта, у которого было диагностировано заболевание нейронов, например, эпилепсия, связанная с гаплонедостаточностью SCN1A, такая как, например, синдром Драве. Согласно различным вариантам осуществления любое из нейрональных заболеваний или нарушений, описанных в настоящем документе, вызвано известным генетическим событием (например, любой из мутаций SCN1A, известных в настоящей области техники) или имеет неизвестную причину.
Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, возможно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, могут быть использованы для лечения субъекта, который находится в группе риска развития заболевания или нарушения. Согласно определенным вариантам осуществления может быть известно, что субъект предрасположен к заболеванию, например, нейрональному заболеванию (например, эпилепсии, связанной с гаплонедостаточностью SCN1A, такой как, например, синдром Драве). Согласно определенным вариантам осуществления субъект может быть предрасположен к заболеванию из-за генетического события или из-за известных факторов риска. Например, субъект может нести мутацию в SCN1A, которая связана с эпилепсией или синдромом Драве, например, вставку, делецию, инверсию, транслокацию или замену (например, точечную мутацию, включая в себя нонсенс-мутацию и/или миссенс-мутацию).
Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, возможно, селективный регуляторный элемент PV, представленные в настоящем документе, могут быть использованы для уменьшения одного или нескольких симптомов, связанных с заболеванием или нарушением. Например, симптомы, связанные с синдромом Драве, включают в себя судороги, дефекты памяти, задержку развития, плохой мышечный тонус и/или когнитивные проблемы. Лечение вирусным вектором, вирусной частицей или фармацевтической композицией, содержащей трансген и селективный в отношении PV сайт связывания микроРНК и, необязательно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, может привести к улучшению одного или нескольких симптомов, таких как уменьшение количества, продолжительности и/или интенсивность припадков.
Согласно определенным вариантам осуществления описанные в настоящем документе способы используются для увеличения экспрессии трансгена в нейроне PV, генной терапии или лечения заболевания или нарушения у приматов. Согласно определенным вариантам осуществления примат представляет собой человека. Согласно определенным вариантам осуществления примат представляет собой отличного от человека примата. Согласно определенным вариантам осуществления отличный от человека примат представляет собой обезьяну старого мира, орангутана, гориллу, шимпанзе, яванского макака, макака-резус или свинохвостого макака.
Термины субъект и индивидуум используются в настоящем документе взаимозаменяемо для обозначения позвоночного животного, предпочтительно млекопитающего, более предпочтительно человека. Описанные в настоящем документе способы могут быть применимы в терапевтических целях для человека, в ветеринарии и/или в доклинических исследованиях на животных моделях заболевания или состояния. Согласно различным вариантам осуществления субъект, которого можно лечить в соответствии с описанными в настоящем документе способами, представляет собой млекопитающее, такое как, например, мышь, крыса, хомяк, морская свинка, песчанка, корова, овца, свинья, коза, осел, лошадь, собака, кошка, лама, обезьяна (например, обезьяна старого мира, мартышка или макак, такой как макак-резус, свинохвостый макак или яванский макак (например, макак-крабоед)), обезьяна (например, орангутан, горилла или шимпанзе) или человек. Согласно иллюстративному варианту осуществления субъект представляет собой человека.
В следующих таблицах представлены раскрытые в настоящем документе последовательности.
Таблица 1. Раскрытые в настоящем документе иллюстративные сконструированные факторы транскрипции. Последовательности регуляторных элементов (RE) раскрыты ниже в табл. 2 и 8. Для RE, когда указан m1, это означает, что сайт связывания микроРНК m1 (SEQ ID NO: 7, табл. 8) включен между кодирующей областью и полиА-хвостом. Последовательности ДНК-связывающих доменов (DBD) раскрыты ниже в табл. 3. Для DBD сконструированный цинковый палец (eZF) указывает на то, что конструкция имеет формулу, изложенную в SEQ ID NO: 147 (табл. 10); EGR1 указывает на то, что DBD происхо
- 56 046157 дит от человеческого EGR1 дикого типа (SEQ ID NO: 176; табл. 12); и EGR3 указывает на то, что DBD происходит от человеческого EGR3 дикого типа (SEQ ID NO: 175, табл. 12). Последовательности для целевых сайтов (например, последовательности, связанные с DBD) представлены в табл. 4 ниже. Последовательности для доменов активации транскрипции (TAD) раскрыты ниже в табл. 5. Для TAD (c) указывает на то, что TAD расположен на c-конце DBD, (n) указывает на то, что TAD расположен на n-конце DBD, (n/c) означает, что существует TAD, расположенный как на n-конце, так и на c-конце DBD, a 2x CITED4 (n) указывает на то, что есть 2 копии TAD CITED4, расположенные на n-конце DBD. Последовательности сконструированных факторов транскрипции полной длины (DBD + TAD) представлены в табл. 6 ниже.
Таблица 1
Конструкция RE DBD Целевой сайт TAD (положение) SEQ ID NO (DBD) SEQ ID NO (DBD + TAD)
1 RE 1 eZF Z13 VPR (c) 89 99
2 RE 1 eZF Z1 VPR (c) 77 100
3 RE 1 eZF Z13 VP64 (c) 89 101
4 RE 1 eZF Z1 VP64 (c) 77 102
5 RE 1 EGR1 Z13 CITED4 (n/c) 93 103
6 RE 1 EGR1 Z13 CITED4 (n) 93 104
7 RE 1 EGR1 Z1 CITED4 (n/c) 92 105
8 RE 1 EGR1 Z1 CITED4 (n) 92 106
9 RE 1 EGR1 Z1 CITED4 (c) 92 107
10 RE 1 EGR1 Z1 CITED2 (c) 92 108
И RE 1 EGR1 Z1 CITED2 (n) 92 109
12 RE 1 EGR3 Z1 CITED4 (n/c) 96 110
13 RE 1 EGR3 Z1 CITED4 (c) 96 111
14 RE 1 EGR3 Z1 CITED2 (c) 96 112
15 RE 1 EGR3 Z1 CITED2 (n) 96 113
16 СВА EGR3 Z15 N/A 98 114
17 RE 1 EGR1 Z13 N/A 93 115
18 RE 1 EGR1 Z15 N/A 94 116
19 RE 1 EGR1 Z13 N/A 93 117
20 RE 1 EGR1 Z13 N/A 93 115
21 RE 1 EGR1 Z1 N/A 92 118
22 СВА EGR3 Z13 N/A 97 119
23 RE 1 EGR1 Z17 N/A 95 120
24 RE 1 EGR1 Z13 N/A 93 121
25 СВА EGR3 Z1 N/A 96 122
26 RE 1 EGR1 Z1 N/A 92 123
27 RE 1 EGR1 Z1 N/A 92 124
28 RE 1 eZF Z8 VP64 (c) 84 125
29 RE 1 eZF Z14 VP64 (c) 90 126
30 СВА eZF Z13 VPR (c) 89 99
31 RE2(ml) eZF Z1 VP64 (c) 77 102
32 RE2 eZF Z1 VP64 (c) 77 102
33 RE2 eZF Z1 VPR (c) 77 100
34 RE2 eZF Z1 VP64 (c) 77 127
35 RE 2 (ml) eZF Z1 VP64 (c) 77 127
36 RE2 EGR1 Z1 CITED4 (n) 92 128
37 RE 2 (ml) EGR1 Z1 CITED4 (n) 92 106
38 RE 2 (ml) EGR1 Z1 CITED4 (n) 92 129
39 RE 2 (ml) EGR1 Z1 CITED4 (n/c) 92 105
40 RE 2 (ml) EGR1 Z1 2x CITED4 (n) 92 130
- 57 046157
41 RE2(ml) EGR1 Z1 2x CITED4 (n) 92 131
42 RE 2 (m2) eZF Z1 VP64 (c) 77 102
43 RE 2 (m3) eZF Z1 VP64 (c) 77 102
44 RE 2 (m2) EGR1 Z1 CITED4 (n) 92 106
45 RE 2 (m3) EGR1 Z1 CITED4 (n) 92 106
46 RE 1 EGR1 Z1 CITED4 (n) 92 205
47 RE 1 EGR1 Z1 2x CITED4 (n) 92 207
48 RE 1 EGR1 Z1 2x CITED4 (n) 92 209
49 CBA eZF Z1 CREB3 (n) 77 213
50 CBA EGR1 Z1 CREB3 (n) 92 (без Сконц. Lys) 217
51 CBA EGR1 Z13 CREB3 (n) 93 (без Сконц. Lys) 219
52 CBA eZF Z1 CREB3 (n); без домена TM на (с) 77 221
53 CBA EGR1 Z1 CREB3 (п); без домена ТМ на (с) 92 (без Сконц. Lys) 223
Таблица 2 Последовательности нуклеиновых кислот для различных регуляторных элементов (RE), ____________________раскрытых в настоящем документе____________________
RE Последовательность SEQ ID NO
RE 1 GTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAG CGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATT GACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGG GACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACG CAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATA AGCAGAGCTGGTACCGTGTGTATGCTCAGGGGCTGGGAA AGGAGGGGAGGGAGCTCCGGCTCAG 1
RE2 ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggtaacatatttt gaagttctgttgacataaagaatcatgatattaatgcccatggaaatgaaagggcgatcaacac tatggtttgaaaagggggaaattgtagagcacagatgtgttcgtgtggcagtgtgctgtctctag caatactcagagaagagagagaacaatgaaattctgattggccccagtgtgagcccagatga ggttcagctgccaactttctctttcacatcttatgaaagtcatttaagcacaactaactttttttttttttt tttttttttgagacagagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggct cactgcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagctgga attacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacgggggtttcaccat atcacccaggctggtctcgaactcctggcctcaagtgatccacctgcctcggcctcccaaagt gctgggattataggcgtcagccactatgcccaacccgaccaaccttttttaaaataaatatttaaa aaattggtatttcacatatatactagtatttacatttatccacacaaaacggacgggcctccgctg aaccagtgaggccccagacgtgcgcataaataacccctgcgtgctgcaccacctggggaga gggggaggaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttctc tgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccagggctggagc 2
- 58 046157
tcaaggaagcgtcgcagggtcacagatctgggggaaccccggggaaaagcactgaggcaa aaccgccgctcgtctcctacaatatatgggagggggaggttgagtacgttctggattactcata agaccttttttttttccttccgggcgcaaaaccgtgagctggatttataatcgccctataaagctcc agaggcggtcaggcacctgcagaggagccccgccgctccgccgactagctgcccccgcga gcaacggcctcgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacc ccggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcgagaggga actagcgagaacgaggaagcagctggaggtgacgccgggcagattacgcctgtcagggcc gagccgagcggatcgctgggcgctgtgcagaggaaaggcgggagtgcccggctcgctgtc gcagagccgaggtgggtaagctagcgaccacctggacttcccagcgcccaaccgtggctttt cagccaggtcctctcctcccgcggcttctcaaccaaccccatcccagcgccggccacccaac ctcccgaaatgagtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgtta cttttccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcggggct agagtgcaaggtgactgtggttcttctctggccaagtccgagggagaacgtaaagatatgggc ctttttccccctctcaccttgtctcaccaaagtccctagtccccggagcagttagcctctttctttcc agggaattagccagacacaacaacgggaaccagacaccgaaccagacatgcccgccccgt gcgccctccccgctcgctgcctttcctccctcttgtctctccagagccggatcttcaaggggag cctccgtgcccccggctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcac agctctcgcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtagag gccccgggacgaccgagctg
RE 3 TCAACAGGGGGACACTTGGGAAAGAAGGATGGGGACAG AGCCGAGAGGACTGTTACACATTAGAGAAACATCAGTG ACTGTGCCAGCTTTGGGGTAGACTGCACAAAAGCCCTGA GGCAGCACAGGCAGGATCCAGTCTGCTGGTCCCAGGAA GCTAACCGTCTCAGACAGAGCACAAAGCACCGAGACAT GTGCCACAAGGCTTGTGTAGAGAGGTCAGAGGACAGCG TACAGGTCCCAGAGATCAAACTCAACCTCACCAGGCTTG GCAGCAAGCCTTTACCAACCCACCCCCACCCCACCCACC CTGCACGCGCCCCTCTCCCCTCCCCATGGTCTCCCATGGC TATCTCACTTGGCCCTAAAATGTTTAAGGATGACACTGG CTGCTGAGTGGAAATGAGACAGCAGAAGTCAACAGTAG ATTTTAGGAAAGCCAGAGAAAAAGGCTTGTGCTGTTTTT AGAAAGCCAAGGGACAAGCTAAGATAGGGCCCAAGTAA TGCTAGTATTTACATTTATCCACACAAAACGGACGGGCC TCCGCTGAACCAGTGAGGCCCCAGACGTGCGCATAAATA ACCCCTGCGTGCTGCACCACCTGGGGAGAGGGGGAGGA CCACGGTAAATGGAGCGAGCGCATAGCAAAAGGGACGC GGGGTCCTTTTCTCTGCCGGTGGCACTGGGTAGCTGTGG CCAGGTGTGGTACTTTGATGGGGCCCAGGGCTGGAGCTC AAGGAAGCGTCGCAGGGTCACAGATCTGGGGGAACCCC GGGGAAAAGCACTGAGGCAAAACCGCCGCTCGTCTCCT ACAATATATGGGAGGGGGAGGTTGAGTACGTTCTGGATT ACTCATAAGACCTTTTTTTTTTCCTTCCGGGCGCAAAACC GTGAGCTGGATTTATAATCGCCCTATAAAGCTCCAGAGG CGGTCAGGCACCTGCAGAGGAGCCCCGCCGCTCCGCCGA CTAGCTGCCCCCGCGAGCAACGGCCTCGTGATTTCCCCG CCGATCCGGTCCCCGCCTCCCCACTCTGCCCCCGCCTACC CCGGAGCCGTGCAGCCGCCTCTCCGAATCTCTCTCTTCTC CTGGCGCTCGCGTGCGAGAGGGAACTAGCGAGAACGAG GAAGCAGCTGGAGGTGACGCCGGGCAGATTACGCCTGT 3
- 59 046157
CAGGGCCGAGCCGAGCGGATCGCTGGGCGCTGTGCAGA GGAAAGGCGGGAGTGCCCGGCTCGCTGTCGCAGAGCCG AGGTGGGTAAGCTAGCGACCACCTGGACTTCCCAGCGCC CAACCGTGGCTTTTCAGCCAGGTCCTCTCCTCCCGCGGCT TCTCAACCAACCCCATCCCAGCGCCGGCCACCCAACCTC CCGAAATGAGTGCTTCCTGCCCCAGCAGCCGAAGGCGCT ACTAGGAACGGTAACCTGTTACTTTTCCAGGGGCCGTAG TCGACCCGCTGCCCGAGTTGCTGTGCGACTGCGCGCGCG GGGCTAGAGTGCAAGGTGACTGTGGTTCTTCTCTGGCCA AGTCCGAGGGAGAACGTAAAGATATGGGCCTTTTTCCCC CTCTCACCTTGTCTCACCAAAGTCCCTAGTCCCCGGAGC AGTTAGCCTCTTTCTTTCCAGGGAATTAGCCAGACACAA CAACGGGAACCAGACACCGAACCAGACATGCCCGCCCC GTGCGCCCTCCCCGCTCGCTGCCTTTCCTCCCTCTTGTCT CTCCAGAGCCGGATCTTCAAGGGGAGCCTCCGTGCCCCC GGCTGCTCAGTCCCTCCGGTGTGCAGGACCCCGGAAGTC CTCCCCGCACAGCTCTCGCTTCTCTTTGCAGCCTGTTTCT GCGCCGGACCAGTCGAGGACTCTGGACAGTAGAGGCCC CGGGACGACCGAGCTG
RE 4 GCCCTCTAGGCCACCTGACCAGGTCCCCTCAGTCCCCCC CTTCCCACACTCCCACACTCAGCCCCCCTCCCCCCCCCCC GACCCCTGCAGGATTATCCTGTCTGTGTTCCTGACTCAGC CTGGGAGCCACCTGGGCAGCAGGGGCCAAGGGTGTCCT AGAAGGGACCTGGAGTCCACGCTGGGCCAAGCCTGCCCT TTCTCCCTCTGTCTTCCGTCCCTGCTTGCGGTTCTGCTGA ATGTGGTTATTTCTCTGGCTCCTTTTACAGAGAATGCTGC TGCTAATTTTATGTGGAGCTCTGAGGCAGTGTAATTGGA AGCCAGACACCCTGTCAGCAGTGGGCTCCCGTCCTGAGC TGCCATGCTTCCTGCTCTCCTCCCGTCCCGGCTCCTCATT TCATGCAGCCACCTGTCCCAGGGAGAGAGGAGTCACCCA GGCCCCTCAGTCCGCCCCTTAAATAAGAAAGCCTCCGTT GCTCGGCACACATACCAAGCAGCCGCTGGTGCAATCT 4
СВА (энхансер CMV + промотор бетаактина кур) CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACC GCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTA TGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACG TCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGC AGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTAT TGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGC CCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTA CATCTACGTATTAGTCATCGCTATTACCATGggtcgaggtgagc cccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttatttttt aattattttgtgcagcgatgggggcggggggggggggggcgcgcgccaggcggggcggg gcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagag cggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagc gaagcgcgcggcgggcgggagtcgctgcgttgccttcgccccgtgccccgctccgcgccg cctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcggga cggcccttctcctccgggctgtaattagcgcttggtttaatgacggctcgtttcttttctgtggctg cgtgaaagccttaaagggctccgggagggccctttgtgcgggggggagcggctcgggggg tgcgtgcgtgtgtgtgtgcgtggggagcgccgcgtgcggcccgcgctgcccggcggctgtg agcgctgcgggcgcggcgcggggctttgtgcgctccgcgtgtgcgcgaggggagcgcgg 5
- 60 046157
ccgggggcggtgccccgcggtgcgggggggctgcgaggggaacaaaggctgcgtgcgg ggtgtgtgcgtgggggggtgagcagggggtgtgggcgcggcggtcgggctgtaacccccc cctgcacccccctccccgagttgctgagcacggcccggcttcgggtgcggggctccgtgcg gggcgtggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgccgg gcggggcggggccgcctcgggccggggagggctcgggggaggggcgcggcggccccg gagcgccggcggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgtgcg agagggcgcagggacttcctttgtcccaaatctggcggagccgaaatctgggaggcgccgc cgcaccccctctagcgggcgcgggcgaagcggtgcggcgccggcaggaaggaaatggg cggggagggccttcgtgcgtcgccgcgccgccgtccccttctccatctccagcctcggggct gccgcagggggacggctgccttcgggggggacggggcagggcggggttcggcttctggc gtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagctcct gggcaacgtgctggttgttgtgctgtctcatcattttggcaaagaatt
EF1альфа GAGTAATTCATACAAAAGGACTCGCCCCTGCCTTGGGGA ATCCCAGGGACCGTCGTTAAACTCCCACTAACGTAGAAC CCAGAGATCGCTGCGTTCCCGCCCCCTCACCCGCCCGCT CTCGTCATCACTGAGGTGGAGAAGAGCATGCGTGAGGCT CCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAG TCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACC GGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAG TGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGG GGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTT CTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGT GCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTT ATGGCCCTTGCGTGCCTTGAATTACTTCCACGCCCCTGGC TGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAA GTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCC CTTCGCCTCGTGCTTGAGTTGAGGCCTGGCTTGGGCGCT GGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCT GTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTT TTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGT CTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCG GTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCC CAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCG GCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCC GGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCG CCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAG TTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTG CAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAG CGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTT TCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTA CCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTT TTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTA TGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGA AGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGA ATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAG CCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGG TGTCGTGA 6
Таблица 3. Аминокислотные последовательности для иллюстративных ДНК-связывающих доменов (DBD), представленных в настоящем документе. Для DBD сконструированный цинковый палец (eZF) указывает на то, что конструкция имеет формулу, изложенную в SEQ ID NO: 147 (табл. 10); EGR1 указывает на то, что DBD происходит от человеческого EGR1 дикого типа (SEQ ID NO: 176; табл. 12); и EGR3 указывает на то, что DBD происходит от человеческого EGR3 дикого типа (SEQ ID NO: 175, табл. 12). Целевые сайты представляют собой последовательности, связанные с DBD, и представлены в табл. 4 ниже.
- 61 046157
Таблица 3
DBD/целев ой сайт Последовательность SEQ ID NO
eZF/zl LEPGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPE CGKSFSREDNLHTHQRTHTGEKPYKCPECGKSFSRSDELV RHQRTHTGEKPYKCPECGKSFSQSGNLTEHQRTHTGEKPY KCPECGKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQN STLTEHQRTHTGKKTS 77
eZF/z2 LEPGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKP YKCPEC GKSF SRADNLTEHQRTHTGEKP YKCPEC GKSF SQL AHLR A HQRTHTGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKPYK CPECGKSFSQAGHLASHQRTHTGEKPYKCPECGKSFSTHL DLIRHQRTHTGKKTS 78
eZF/z3 LEPGEKPYKCPECGKSFSQAGHLASHQRTHTGEKPYKCPE CGKSFSREDNLHTHQRTHTGEKPYKCPECGKSFSTSGNLTE HQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYK CPECGKSFSQKSSLIAHQRTHTGEKPYKCPECGKSFSQAGH LASHQRTHTGKKTS 79
eZF/z4 LEPGEKPYKCPECGKSFSTTGNLTVHQRTHTGEKPYKCPE CGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSTSGNLTEHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SQRA NLRAHQRTHTGKKT S 80
eZF/z5 LEPGEKPYKCPECGKSF S SRRTCRAHQRTHTGEKP YKCPEC GKSFSTTGALTEHQRTHTGEKPYKCPECGKSFSRSDELVRH QRTHTGEKP YKCPEC GKSFSRNDALTEHQRTHTGEKPYKC PECGKSFSQSGDLRRHQRTHTGEKPYKCPECGKSFSTSHSL TEHQRTHTGKKTS 81
eZF/z6 LEPGEKPYKCPECGKSFSRKDNLKNHQRTHTGEKPYKCPE CGKSFSDPGALVRHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPY KCPECGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSRK DNLKNHQRTHTGKKTS 82
eZF/z7 LEPGEKPYKCPECGKSF S SKKALTEHQRTHTGEKP YKCPEC GKSF S SP ADLTRHQRTHTGEKP YKCPEC GKSF SRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGEKPYK CPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGN LTEHQRTHTGEKPYKCPECGKSFSTSGHLVRHQRTHTGEK PYKCPECGKSFSQNSTLTEHQRTHTGKKTS 83
- 62 046157
eZF/z8 LEPGEKPYKCPECGKSF S SPADLTRHQRTHTGEKPYKCPEC GKSF SRSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGEKPYK CPECGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTSGH LVRHQRTHTGKKTS 84
eZF/z9 LEPGEKPYKCPECGKSF S SKKALTEHQRTHTGEKPYKCPEC GKSF S SPADLTRHQRTHTGEKPYKCPEC GKSF SRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGEKPYK CPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGN LTEHQRTHTGKKTS 85
eZF/zlO LEPGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPE CGKSFSRNDALTEHQRTHTGEKPYKCPECGKSFSRNDALT EHQRTHTGEKPYKCPECGKSFSSPADLTRHQRTHTGEKPY KCPECGKSFSDPGNLVRHQRTHTGEKPYKCPECGKSFSQR AHLERHQRTHTGEKPYKCPECGKSFSQSSSLVRHQRTHTG EKPYKCPECGKSFSHRTTLTNHQRTHTGKKTS 86
eZF/zll LEPGEKPYKCPECGKSFSRNDALTEHQRTHTGEKPYKCPE CGKSFSSPADLTRHQRTHTGEKPYKCPECGKSFSDPGNLV RHQRTHTGEKPYKCPECGKSFSQRAHLERHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SHRT TLTNHQRTHTGKKTS 87
eZF/zl2 LEPGEKPYKCPECGKSFSRNDALTEHQRTHTGEKPYKCPE CGKSFSDPGHLVRHQRTHTGEKPYKCPECGKSFSTSGELV RHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPY KCPECGKSFS SKKALTEHQRTHTGEKPYKCPEC GKSF SQL AHLRAHQRTHTGEKPYKCPECGKSFSRSDHLTNHQRTHTG KKTS 88
eZF/zl3 LEPGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPE CGKSFSHRTTLTNHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSTSHSLTEHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SRED NLHTHQRTHTGKKTS 89
eZF/zl4 LEPGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPYKCPE CGKSFSRSDNLVRHQRTHTGEKPYKCPECGKSFSQSGDLR RHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPY KCPECGKSFSTSGNLVRHQRTHTGEKPYKCPECGKSFSRSD NLVRHQRTHTGKKTS 90
eZF/zl5 LEPGEKPYKCPECGKSFSRRDELNVHQRTHTGEKPYKCPE CGKSFSRSDHLTNHQRTHTGEKPYKCPECGKSFSRSDDLV RHQRTHTGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPY KCPECGKSFSHRTTLTNHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGEKPYKCPECGKSFSTSHSLTEHQRTHTGE KPYKCPECGKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFS REDNLHTHQRTHTGKKTS 91
EGRl/zl RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRN FSREDNLHTHIRTHTGEKPFACDICGRKFARSDELVRHTKI HLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPFQC RICMRNFSTSGHLVRHIRTHTGEKPFACDICGRKFAQNSTL TEHTKIHLRQKDK 92
- 63 046157
EGR1/Z13 RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRN FSHRTTLTNHIRTHTGEKPFACDICGRKFAREDNLHTHTKI HLRQKDRPYACPVESCDRRFSTSHSLTEHIRIHTGQKPFQC RICMRNFSQSSSLVRHIRTHTGEKPFACDICGRKFAREDNL HTHTKIHLRQKDK 93
EGR1/Z15 RPYACPVESCDRRFSRRDELNVHIRIHTGQKPFQCRICMRN FSRSDHLTNHIRTHTGEKPFACDICGRKFARSDDLVRHTKI HLRQKDRP YACPVESCDRRF SRSDNLVRHIRIHTGQKPFQC RICMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFAREDNL HTHTKIHLRQKDRPYACPVESCDRRFSTSHSLTEHIRIHTGQ KPFQCRICMRNFSQSSSLVRHIRTHTGEKPFACDICGRKFA REDNLHTHTKIHLRQKD 94
EGrl/zl7 RPYACPVESCDRRFSDPGALVRHIRIHTGQKPFQCRICMRN FSRSDNLVRHIRTHTGEKPFACDICGRKFAQSGDLRRHTKI HLRQKDRPYACPVESCDRRFSTHLDLIRHIRIHTGQKPFQC RICMRNFSTSGNLVRHIRTHTGEKPFACDICGRKFARSDNL VRHTKIHLRQKDRPYACPVESCDRRFSQSGHLTEHIRIHTG QKPFQCRICMRNFSERSHLREHIRTHTGEKPFACDICGRKF AQAGHLASHTKIHLRQKD 95
EGR3/zl RPHACPAEGCDRRFSRSDNLVRHLRIHTGHKPFQCRICMRS FSREDNLHTHIRTHTGEKPFACEFCGRKFARSDELVRHAKI HLKQKEHACPAEGCDRRFSQSGNLTEHLRIHTGHKPFQCRI CMRSFSTSGHLVRHIRTHTGEKPFACEFCGRKFAQNSTLTE HAKIHLKQKEK 96
EGR3/zl3 RPHACPAEGCDRRFSRSDNLVRHLRIHTGHKPFQCRICMRS FSHRTTLTNHIRTHTGEKPFACEFCGRKFAREDNLHTHAKI HLKQKEHACPAEGCDRRFSTSHSLTEHLRIHTGHKPFQCRI CMRSFSQSSSLVRHIRTHTGEKPFACEFCGRKFAREDNLHT HAKIHLKQKEK 97
EGR3/zl5 RPHACPAEGCDRRFSRRDELNVHLRIHTGHKPFQCRICMRS FSRSDHLTNHIRTHTGEKPFACEFCGRKFARSDDLVRHAKI HLKQKEHACPAEGCDRRF SRSDNLVRHLRIHTGHKPFQCR ICMRSFSHRTTLTNHIRTHTGEKPFACEFCGRKFAREDNLH THAKIHLKQKEHACPAEGCDRRFSTSHSLTEHLRIHTGHKP FQCRICMRSF SQS S SLVRHIRTHTGEKPF ACEFCGRKFARE DNLHTHAKIHLKQKEK 98
Таблица 4 Последовательности целевых сайтов и хромосомная локализация иллюстративных целевых сайтов, связанных с раскрытыми в настоящем документе ДНК-связывающими доменами
Начальн. положени e хром. 2 Последовательность целевого сайта Целевой сайт SEQ ID NO для последовательное ти целевого сайта
166149168 CTAGGTCAAGTGTAGGAG zl 18
166149158 ACTTGACCTAGACAGCCT z2 19
166073978 TGAATAACTCATTAGTGA z3 20
- 64 046157
166073933 AAAGTACATTAGGCTAAT z4 21
166149199 CCAGCACTGGTGCTTCGT z5 22
166149176 AAGGCTGTCTAGGTCAAG z6 23
166149168 CTAGGTCAAGTGTAGGAGACACAC z7 24
166149165 GGTCAAGTGTAGGAGACA z8 25
166149162 CAAGTGTAGGAGACACAC z9 26
166149160 AGTGTAGGAGACACACTGCTGGCC zlO 27
166149160 AGTGTAGGAGACACACTG zll 28
166149155 AGGAGACACACTGCTGGCCTG zl2 29
166128025 TAGGTACCATAGAGTGAG zl3 30
166127991 GAGGATACTGCAGAGGTC zl4 31
166127999 TAGGTACCATAGAGTGAGGCGAGGA TG zl5 32
166127991 ATAGAGTGAGGCGAGGATGAAGCCG AG zl6 33
166127974 TGAAGCCGAGAGGATACTGCAGAGG ТС zl7 34
Таблица 5 Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных доменов ______________________активации транскрипции (TAD)______________________
TAD Последовательность SEQ ID NO
VPR DALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDA LDDFDLDMLINSRSSGSPKKKRKVGSQYLPDTDDRHRIEEKRK RTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPY PFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPA PAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLS EALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQ GIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLP NGLLSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPKPEAGS AISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVH EPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALR EMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDL NLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF 132
VP64 DALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDA LDDFDLDML 133
CITED 2 MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRMGMGQFP S PHHHQQQQPQHAFNALMGEHIHYGAGNMNATSGIRHAMGPG TVNGGHPPSALAPAARFNNSQFMGPPVASQGGSLPASMQLQKL NNQYFNHHPYPHNHYMPDLHPAAGHQMNGTNQHFRDCNPKH SGGSSTPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNMPAS VAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGLDRIKELPELWL GQNEFDFMTDFVCKQQPSRVSC 134
CITED 4 ADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGPGLDSG LRPRGAPLGPPPPRQPGALAYGAFGPPSSFQPFPAVPPPAAGIAH LQPVATPYPGRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGG MDAELIDEEALTSLELELGLHRVRELPELFLGQSEFDCFSDLGS APPAGSVSC 135
CREB3 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWALPLSE VPSDWEVDDLLCSLLSPPASLNILSSSNPCLVHHDHTYSLPRET VSMDLESESCRKEGTQMTPQHMEELAEQEIARLVLTDEEKSLL EKEGLILPETLPLTKTEEQILKRVR 224
- 65 046157
Таблица 6
Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных сконст____________руированных факторов транскрипции (DBD + TAD) __________
Конструкция Последовательность SEQ ID NO
1 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF 99
2 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG 100
- 66 046157
NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF
3 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEDALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLGSDALDDFDLDML 101
4 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102
5 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFARE DNLHTHTKIHLRQKDRPYACPVESCDRRFSTSHSLT EHIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGE KPFACDICGRKFAREDNLHTHTKIHLRQKDKLEMA DHLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAG PGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQ PFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGP PGPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLE LELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVS C 103
6 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFARE DNLHTHTKIHLRQKDRPYACPVESCDRRFSTSHSLT 104
- 67 046157
EHIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGE KPF ACDICGRKF AREDNLHTHTKIHLRQKDK
7 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPF ACDICGRKF ARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC 105
8 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK 106
9 MQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCD RRFSRSDNLVRHIRIHTGQKPFQCRICMRNFSREDNL HTHIRTHTGEKPFACDICGRKFARSDELVRHTKIHLR QKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPF QCRICMRNF STSGHLVRHIRTHTGEKPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMADHLMLAEGYRLV QRPPSAAAAHGPHALRTLPPYAGPGLDSGLRPRGAP LGPPPPRQPGALAYGAFGPPSSFQPFPAVPPPAAGIA HLQPVATPYPGRAAAPPNAPGGPPGPQPAPSAAAPP PPAHALGGMDAELIDEEALTSLELELGLHRVRELPE LFLGQSEFDCFSDLGSAPPAGSVSC 107
10 MQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCD RRFSRSDNLVRHIRIHTGQKPFQCRICMRNFSREDNL HTHIRTHTGEKPF ACDICGRKF ARSDELVRHTKIHLR QKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPF QCRICMRNF STSGHLVRHIRTHTGEKPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMSGLEMADHMMAM NHGRFPDGTNGLHHHPAHRMGMGQFPSPHHHQQQ QPQHAFNALMGEHIHYGAGNMNATSGIRHAMGPG TVNGGHPPSALAPAARFNNSQFMGPPVASQGGSLP ASMQLQKLNNQYFNHHPYPHNHYMPDLHPAAGHQ MNGTNQHFRDCNPKHSGGS STPGGSGGS STPGGSG 108
- 68 046157
S S SGGGAGS SNSGGGSGSGNMP AS VAHVP AAMLPP NVIDTDFIDEEVLMSLVIEMGLDRIKELPELWLGQN EFDFMTDFVCKQQPSRVSC
И MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRM GMGQFPSPHHHQQQQPQHAFNALMGEHIHYGAGN MNATSGVRHAMGPGTVNGGHPPSALAPAARFNNS QFMGPPVASQGGSLPASMQLQKLNNQYFNHHPYPH NHYMPDLHP AAGHQMNGTNQHFRDCNPKHSGGS S TPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNM PASVAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGL DRIKELPELWLGQNEFDFMTDFVCKQQPSRVSCQSQ LII<PSRMRI<YPNRPSI<TPPHERPYACPVESCDRRFSR SDNLVRHIRIHTGQKPFQCRICMRNFSREDNLHTHIR THTGEKPFACDICGRKFARSDELVRHTKIHLRQKDR PYACPVESCDRRFSQSGNLTEHIRIHTGQKPFQCRIC MRNFSTSGHLVRHIRTHTGEKPFACDICGRKFAQNS TLTEHTKIHLRQKDK 109
12 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGRPHACPAEGCDRRFSRSDNLVRH LRIHTGHKPFQCRICMRSFSREDNLHTHIRTHTGEKP FACEFCGRKFARSDELVRHAKIHLKQKEHACPAEG CDRRFSQSGNLTEHLRIHTGHKPFQCRICMRSFSTSG HLVRHIRTHTGEKPFACEFCGRKFAQNSTLTEHAKI HLKQKEKLEMADHLMLAEGYRLVQRPPSAAAAHG PHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPGA LAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYPG RAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGMD AELIDEEALTSLELELGLHRVRELPELFLGQSEFDCF SDLGSAPPAGSVSC 110
13 MRPHACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQC RICMRSFSREDNLHTHIRTHTGEKPFACEFCGRKFAR SDELVRHAKIHLKQKEHACPAEGCDRRFSQSGNLTE HLRIHTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEK PFACEFCGRKFAQNSTLTEHAKIHLKQKEKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC 111
14 MRPHACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQC RICMRSFSREDNLHTHIRTHTGEKPFACEFCGRKFAR SDELVRHAKIHLKQKEHACPAEGCDRRFSQSGNLTE HLRIHTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEK PFACEFCGRKFAQNSTLTEHAKIHLKQKEKKAEKG GAPSASSAPPVSLAPVVTTCALEMSGLEMADHMMA MNHGRFPDGTNGLHHHPAHRMGMGQFPSPHHHQQ QQPQHAFNALMGEHIHYGAGNMNATSGIRHAMGP 112
- 69 046157
GTVNGGHPPSALAPAARFNNSQFMGPPVASQGGSL PASMQLQKLNNQYFNHHPYPHNHYMPDLHPAAGH QMNGTNQHFRDCNPKHSGGS STPGGSGGS STPGGS GS S SGGGAGS SNSGGGSGSGNMP AS VAHVP AAMLP PNVIDTDFIDEEVLMSLVIEMGLDRIKELPELWLGQN EFDFMTDFVCKQQPSRVSC
15 MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRM GMGQFPSPHHHQQQQPQHAFNALMGEHIHYGAGN MNATSGVRHAMGPGTVNGGHPPSALAPAARFNNS QFMGPPVASQGGSLPASMQLQKLNNQYFNHHPYPH NHYMPDLHP AAGHQMNGTNQHFRDCNPKHSGGS S TPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNM PASVAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGL DRIKELPELWLGQNEFDFMTDFVCKQQPSRVSCRPH ACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQCRICM RSFSREDNLHTHIRTHTGEKPFACEFCGRKFARSDEL VRHAKIHLKQKEHACPAEGCDRRFSQSGNLTEHLRI HTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEKPFA CEFCGRKFAQNSTLTEHAKIHLKQKEKKAEKGGAP SAS S APP VSL AP VVTTC A 113
16 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRR DELNVHLRIHTGHKPFQCRICMRSFSRSDHLTNHIRT HTGEKPFACEFCGRKFARSDDLVRHAKIHLKQKEH ACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQCRICM RSF SHRTTLTNHIRTHTGEKPF ACEFCGRKF AREDNL HTHAKIHLKQKEHACP AEGCDRRF STSHSLTEHLRI HTGHKPFQCRICMRSFSQSSSLVRHIRTHTGEKPFAC EFCGRKFAREDNLHTHAKIHLKQKEKKAEKGGAPS AS SAPP VSLAP VVTTC A 114
17 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S S SGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK FAREDNLHTHTKIHLRQKDRP YACPVESCDRRF STS HSLTEHIRIHTGQKPFQCRICMRNF SQS S SLVRHIRTH TGEKPFACDICGRKFAREDNLHTHTKIHLRQKDKKA DKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATT 115
- 70 046157
SYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSV PP AFP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTI EIC
18 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRRDELN VH IRIHTGQKP FQCRICMRNF SRSDHLTNHIRTHTGEKPF ACDICGRK FARSDDLVRHTKIHLRQKDRPYACPVESCDRRFSRS DNLVRHIRIHTGQKPFQCRICMRNFSHRTTLTNHIRT HTGEKPF ACDICGRKF AREDNLHTHTKIHLRQKDRP YACPVESCDRRFSTSHSLTEHIRIHTGQKPFQCRICM RNF SQ S S SL VRHIRTHTGEKPF ACDICGRKF AREDNL HTHTKIHLRQKDKK ADKS WAS SATS SLS S YP SP VA TSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTYPSPV HSGFP SP S VATT YS S VPP AFP AQ VS SFP S S AVTNSF SA STGLSDMTATFSPRTIEIC 116
19 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK FAREDNLHTHIRTHTGEKPFACDICGRKFSTSHSLTE HIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGEK PF ACDICGRKF AREDNLHTHTKIHLRQKDKKADKS VVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYP SPVPTSF S SPGS STYPSPVHSGFPSPS VATTYS S VPP A FP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTIEIC 117
20 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK 115
- 71 046157
FAREDNLHTHTKIHLRQKDRP YACPVESCDRRF STS HSLTEHIRIHTGQKPFQCRICMRNF SQS S SLVRHIRTH TGEKPFACDICGRKFAREDNLHTHTKIHLRQKDKKA DKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATT SYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSV PP AFP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTI EIC
21 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SREDNLHTHIRTHTGEKPF ACDICGR KFARSDELVRHTKIHLRQKDRPYACPVESCDRRFSQ SGNLTEHIRIHTGQKPFQCRICMRNF STSGHLVRHIR THTGEKPFACDICGRKFAQNSTLTEHTKIHLRQKDK KADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSP ATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTY SSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFS PRTIEIC 118
22 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRS DNLVRHLRIHTGHKPFQCRICMRSF SHRTTLTNHIRT HTGEKPFACEFCGRKFAREDNLHTHAKIHLKQKEH ACPAEGCDRRFSTSHSLTEHLRIHTGHKPFQCRICMR SFSQSSSLVRHIRTHTGEKPFACEFCGRKFAREDNLH THAKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTT CA 119
23 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SDPG ALVRHIRIHTGQKP FQCRICMRNF SRSDNLVRHIRTHTGEKPF ACDICGR 120
- 72 046157
KF AQSGDLRRHTKIHLRQKDRP YACPVESCDRRF ST HLDLIRHIRIHTGQKPFQC RIC MRNF STSGNLVRHIR THTGEKPFACDICGRKFARSDNLVRHTKIHLRQKDR PYACPVESCDRRFSQSGHLTEHIRIHTGQKPFQCRIC MRNFSERSHLREHIRTHTGEKPFACDICGRKFAQAG HL ASHTKH4LRQKDKK ADKS WAS S AT S SLS S YP SP VATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTYP SPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNS FSASTGLSDMTATFSPRTIEIC
24 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLTRHIRIHTGQKP FQCRICMRNFSHSTTLTNHIRTHTGEKPFACDICGRK FARSDNRKTHIRTHTGEKPFACDICGRKFSTSHSLTE HIRIHTGQKPFQCRICMRNFSQSSSLTRHIRTHTGEKP FACDICGRKFARSDNRKTHTKIHLRQKDKKADKSV VASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPS PVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAF PAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTIEIC 121
25 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRS DNLVRHLRIHTGHKPFQCRICMRSF SREDNLHTHIRT HTGEKPFACEFCGRKFARSDELVRHAKIHLKQKEH ACPAEGCDRRFSQSGNLTEHLRIHTGHKPFQCRICM RSFSTSGHLVRHIRTHTGEKPFACEFCGRKFAQNSTL TEHAKIHLKQKEKKAEKGGAPSASSAPPVSLAPWT TCA 122
26 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLTRHIRIHTGQKP FQCRICMRNFSRSDNLTTHIRTHTGEKPFACDICGRK 123
- 73 046157
FARSDERKRHIRTHTGEKPFACDICGRKFSQSGNLTE HIRIHTGQKPFQCRICMRNFSTSGHLTRHIRTHTGEK PFACDICGRKFAQSSTRKEHTKIHLRQKDKKADKSV VASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPS PVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAF PAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTIEIC
27 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SREDNLHTHIRTHTGEKPF ACDICGR KFARSDELVRHIRTHTGEKPFACDICGRKFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDKKADKS VVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYP SPVPTSF S SPGS STYPSPVHSGFPSPS VATTYS S VPP A FP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTIEIC 124
28 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFSS P ADLTRHQRTHTGEKPYKCPECGKSF SRSDNLVRH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPEC GKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTSG HLVRHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEDALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLGSDALDDFDLDML 125
29 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS DPGALVRHQRTHTGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSQSGDLRRHQRTHTG EKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYKCPE CGKSF STSGNLVRHQRTHTGEKPYKCPECGKSF SRS DNLVRHQRTHTGKKTSKRPAATKKAGQAKKKKGS YPYDVPDYALEDALDDFDLDMLGSDALDDFDLDM LGSDALDDFDLDMLGSDALDDFDLDML 126
30 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ 99
- 74 046157
AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF
31 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102
32 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102
33 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF 100
34 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS 127
- 75 046157
TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSD ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLD MLGSDALDDFDLDML
35 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSD ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLD MLGSDALDDFDLDML 127
36 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACPVES CDRRF SRSDNL VRHIRIHTGQK P FQC R IC MRNF SRED NLHTHIRTHTGEKPFACDICGRKFARSDELVRHTKIH LRQKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQK PFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDICGR KFAQNSTLTEHTKIHLRQKDK 128
37 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRF SRSDNL VRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK 106
38 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGGGSGGGSGQSQLIKPSRMRKYPN RPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRIHT GQKPFQCRICMRNFSREDNLHTHIRTHTGEKPFACDI CGRKFARSDELVRHTKIHLRQKDRPYACPVESCDRR FSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGHLVR HIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHLRQK DK 129
39 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE 105
- 76 046157
RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC
40 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCADHLMLAEGYRLVQRPPSAAAAHGPHALRTL PPYAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFG PPSSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPN APGGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEA LTSLELELGLHRVRELPELFLGQSEFDCFSDLGSAPP AGSVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACP VESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRNFS REDNLHTHIRTHTGEKPFACDICGRKFARSDELVRH TKIHLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHT GQKPFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDI CGRKFAQNSTLTEHTKIHLRQKDK 130
41 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGADHLMLAEGYRLVQRPPSAAAAH GPHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPG ALAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYP GRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGM DAELIDEEALTSLELELGLHRVRELPELFLGQSEFDC FSDLGSAPPAGSVSCGGSGGGSGQSQLIKPSRMRKY PNRPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDK 131
42 MAPI<I<I<RI<VGIHGVPAALEPGEI<P YKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102
- 77 046157
43 MAPKKKRKVGIHGVPAALEPGEKP YKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102
44 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK 106
45 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK 106
46 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGGGSGGGSGQSQLIKPSRMRKYPN RPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRIHT GQKPFQCRICMRNFSREDNLHTHIRTHTGEKPFACDI CGRKFARSDELVRHTKIHLRQKDRPYACPVESCDRR FSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGHLVR HIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHLRQK DK 205
47 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCADHLMLAEGYRLVQRPPSAAAAHGPHALRTL PPYAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFG PPSSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPN APGGPPGPQPAPSAAAPPPP AHALGGMD AELIDEEA 207
- 78 046157
LTSLELELGLHRVRELPELFLGQSEFDCFSDLGSAPP AGSVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACP VESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRNFS REDNLHTHIRTHTGEKPFACDICGRKFARSDELVRH TKIHLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHT GQKPFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDI CGRKFAQNSTLTEHTKIHLRQKDK
48 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGADHLMLAEGYRLVQRPPSAAAAH GPHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPG ALAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYP GRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGM DAELIDEEALTSLELELGLHRVRELPELFLGQSEFDC FSDLGSAPPAGSVSCGGSGGGSGQSQLIKPSRMRKY PNRPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDK 209
49 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRLEPGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTG EKPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPE CGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTS GHLVRHQRTHTGEKPYKCPECGKSFSQNSTLTEHQ RTHTGKKTSVYVGGLESRVLKYTAQNMELQNKVQ LLEEQNLSLLDQLRKLQAMVIEISNKTS S S STCILVLL VSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALPS EDPYQLELPALQSEVPKDSTHQWLDGSDCVLQAPG NT SCLLHYMPQ AP S AEPPLEWPFPDLF SEPLCRGPIL PLQANLTRKGGWLPTGSPSVILQDRYSG 213
50 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEISNKT S S S STCILVLL VSFCL LLVP AM YS SDTRGSLP AEHGVLSRQLRALP SEDP YQ 217
- 79 046157
LELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCL LHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQAN LTRKGGWLPTGSPSVILQDRYSG
51 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SHRTTLTNHIRTHTGEKPF A CDICGRKFAREDNLHTHTKIHLRQKDRPYACPVESC DRRFSTSHSLTEHIRIHTGQKPFQCRICMRNFSQSSSL VRHIRTHTGEKPFACDICGRKFAREDNLHTHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEISNKT S S S STCIL VLL VSFCL LLVP AM YS SDTRGSLP AEHGVLSRQLRALP SEDP YQ LELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCL LHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQAN LTRKGGWLPTGSPSVILQDRYSG 219
52 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRLEPGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTG EKPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPE CGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTS GHLVRHQRTHTGEKPYKCPECGKSFSQNSTLTEHQ RTHTGKKTSVYVGGLESRVLKYTAQNMELQNKVQ LLEEQNLSLLDQLRKLQAMVIEIS 221
53 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEIS 223
- 80 046157
Таблица 7
Последовательности нуклеиновой кислоты, кодирующие раскрытые в настоящем документе иллюстративные сконструированные факторы транскрипции
Конструкция Последовательность SEQ ID NO
31 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt 67
gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA
- 81 046157
ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA T AT GTT AT A A AC T AGT aaagagaccggttcactgtgacagtaaaa gagaccggttcactgtgagaatgaaagagaccggttcactgtgatcggaaaaga gaccggttcactgtgagcggccttgaaacccagcagacaatgtagctcagtaga aacccagcagacaatgtagctgaatggaaacccagcagacaatgtagcttcgg agaaacccagcagacaatgtagctAAGCTTGGGTGGCATCCC TGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGG AAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCT AATAAAATTAAGTTGCATCATTTTGTCTGACTAG GTGTCCTTCTATAATATTATGGGGTGGAGGGGGG TGGTATGGAGCAAGGGGCAAGTTGGGAAGACAA CCTGTAGGGCCTGCGGGGTCTATTGGGAACCAA GCTGGAGTGCAGTGGCACAATCTTGGCTCACTGC AATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTG CCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCAT GCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGG TAGAGACGGGGTTTCACCATATTGGCCAGGCTGG TCTCCAACTCCTAATCTCAGGTGATCTACCCACC TTGGCCTCCCAAATTGCTGGGATTACAGGCGTGA ACCACTGCTCCCTTCCCTGTCCTT
32 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc 68
- 82 046157
ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTAAGCTTGGGTGGCATCCC TGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGG AAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCT AATAAAATTAAGTTGCATCATTTTGTCTGACTAG GTGTCCTTCTATAATATTATGGGGTGGAGGGGGG TGGTATGGAGCAAGGGGCAAGTTGGGAAGACAA CCTGTAGGGCCTGCGGGGTCTATTGGGAACCAA GCTGGAGTGCAGTGGCACAATCTTGGCTCACTGC AATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTG CCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCAT
- 83 046157
GCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGG TAGAGACGGGGTTTCACCATATTGGCCAGGCTGG TCTCCAACTCCTAATCTCAGGTGATCTACCCACC TTGGCCTCCCAAATTGCTGGGATTACAGGCGTGA ACCACTGCTCCCTTCCCTGTCCTT
33 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA 69
- 84 046157
TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGAGGCC AGCGGTTCCGGACGGGCTGACGCATTGGACGAT TTTGATCTGGATATGCTGGGAAGTGACGCCCTCG ATGATTTTGACCTTGACATGCTTGGTTCGGATGC CCTTGATGACTTTGACCTCGACATGCTCGGCAGT GACGCCCTTGATGATTTCGACCTGGACATGCTGA TTAACTCTAGAAGTTCCGGATCTCCGAAAAAGAA ACGCAAAGTTGGTAGCCAGTACCTGCCCGACAC CGACGACCGGCACCGGATCGAGGAAAAGCGGAA GCGGACCTACGAGACATTCAAGAGCATCATGAA GAAGTCCCCCTTCAGCGGCCCCACCGACCCTAGA CCTCCACCTAGAAGAATCGCCGTGCCCAGCAGAT CCAGCGCCAGCGTGCCAAAACCTGCCCCCCAGC CTTACCCCTTCACCAGCAGCCTGAGCACCATCAA CTACGACGAGTTCCCTACCATGGTGTTCCCCAGC GGCCAGATCTCTCAGGCCTCTGCTCTGGCTCCAG CCCCTCCTCAGGTGCTGCCTCAGGCTCCTGCTCC TGCACCAGCTCCAGCCATGGTGTCTGCACTGGCT CAGGCACCAGCACCCGTGCCTGTGCTGGCTCCTG GACCTCCACAGGCTGTGGCTCCACCAGCCCCTAA ACCTACACAGGCCGGCGAGGGCACACTGTCTGA AGCTCTGCTGCAGCTGCAGTTCGACGACGAGGAT CTGGGAGCCCTGCTGGGAAACAGCACCGATCCT GCCGTGTTCACCGACCTGGCCAGCGTGGACAAC AGCGAGTTCCAGCAGCTGCTGAACCAGGGCATC CCTGTGGCCCCTCACACCACCGAGCCCATGCTGA TGGAATACCCCGAGGCCATCACCCGGCTCGTGAC AGGCGCTCAGAGGCCTCCTGATCCAGCTCCTGCC CCTCTGGGAGCACCAGGCCTGCCTAATGGACTGC TGTCTGGCGACGAGGACTTCAGCTCTATCGCCGA TATGGATTTCTCAGCCTTGCTGGGCTCTGGCAGC GGCAGCCGGGATTCCAGGGAAGGGATGTTTTTG CCGAAGCCTGAGGCCGGCTCCGCTATTAGTGACG TGTTTGAGGGCCGCGAGGTGTGCCAGCCAAAAC GAATCCGGCCATTTCATCCTCCAGGAAGTCCATG GGCCAACCGCCCACTCCCCGCCAGCCTCGCACCA ACACCAACCGGTCCAGTACATGAGCCAGTCGGG TCACTGACCCCGGCACCAGTCCCTCAGCCACTGG
- 85 046157
ATCCAGCGCCCGCAGTGACTCCCGAGGCCAGTC ACCTGTTGGAGGATCCCGATGAAGAGACGAGCC AGGCTGTCAAAGCCCTTCGGGAGATGGCCGATA CTGTGATTCCCCAGAAGGAAGAGGCTGCAATCT GTGGCCAAATGGACCTTTCCCATCCGCCCCCAAG GGGCCATCTGGATGAGCTGACAACCACACTTGA GTCCATGACCGAGGATCTGAACCTGGACTCACCC CTGACCCCGGAATTGAACGAGATTCTGGATACCT TCCTGAACGACGAGTGCCTCTTGCATGCCATGCA TATCAGCACAGGACTGTCCATCTTCGACACATCT CTGTTTTAAACTAGTaataaaagatctttattttcattagatctgtgtgt tggttttttgtgtg
34 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC 70
- 86 046157
AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCGACGC GCTGGACGATTTCGATCTCGACATGCTGGGTTCT GATGCCCTCGATGACTTTGACCTGGATATGTTGG GAAGCGACGCATTGGATGACTTTGATCTGGACAT GCTCGGCTCCGATGCTCTGGACGATTTCGATCTC GATATGTTATAAAAGCTTGGGTGGCATCCCTGTG ACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGT TGCCACTCCAGTGCCCACCAGCCTTGTCCTAATA AAATTAAGTTGCATCATTTTGTCTGACTAGGTGT CCTTCTATAATATTATGGGGTGGAGGGGGGTGGT ATGGAGCAAGGGGCAAGTTGGGAAGACAACCTG TAGGGCCTGCGGGGTCTATTGGGAACCAAGCTG GAGTGCAGTGGCACAATCTTGGCTCACTGCAATC TCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTC AGCCTCCCGAGTTGTTGGGATTCCAGGCATGCAT GACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAG AGACGGGGTTTCACCATATTGGCCAGGCTGGTCT CCAACTCCTAATCTCAGGTGATCTACCCACCTTG GCCTCCCAAATTGCTGGGATTACAGGCGTGAACC ACTGCTCCCTTCCCTGTCCTT
26 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta 71
- 87 046157
tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCGACGC GCTGGACGATTTCGATCTCGACATGCTGGGTTCT GATGCCCTCGATGACTTTGACCTGGATATGTTGG GAAGCGACGCATTGGATGACTTTGATCTGGACAT GCTCGGCTCCGATGCTCTGGACGATTTCGATCTC GATATGTTATAAaaagagaccggttcactgtgacagtaaaagagac
- 88 046157
cggttcactgtgagaatgaaagagaccggttcactgtgatcggaaaagagaccg gttcactgtgagcggccttgaaacccagcagacaatgtagctcagtagaaaccc agcagacaatgtagctgaatggaaacccagcagacaatgtagcttcggagaaa cccagcagacaatgtagctAAGCTTGGGTGGCATCCCTGTG ACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGT TGCCACTCCAGTGCCCACCAGCCTTGTCCTAATA AAATTAAGTTGCATCATTTTGTCTGACTAGGTGT CCTTCTATAATATTATGGGGTGGAGGGGGGTGGT ATGGAGCAAGGGGCAAGTTGGGAAGACAACCTG TAGGGCCTGCGGGGTCTATTGGGAACCAAGCTG GAGTGCAGTGGCACAATCTTGGCTCACTGCAATC TCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTC AGCCTCCCGAGTTGTTGGGATTCCAGGCATGCAT GACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAG AGACGGGGTTTCACCATATTGGCCAGGCTGGTCT CCAACTCCTAATCTCAGGTGATCTACCCACCTTG GCCTCCCAAATTGCTGGGATTACAGGCGTGAACC ACTGCTCCCTTCCCTGTCCTT
40 (кодирующая) ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCcGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCgccgaccacctgatgctcgccgagggctaccgcct ggtgcagaggccgccgtccgccgccgccgcccatggccctcatgcgctccgg actctgccgccgtacgcgggcccgggcctggacagtgggctgaggccgcgg ggggctccgctggggccgccgccgccccgccaacccggggccctggcgtac ggggccttcgggccgccgtcctccttccagccctttccggccgtgcctccgccg gccgcgggcatcgcgcacctgcagcctgtggcgacgccgtaccccggccgc gcCgccgcgccccccaacgctccgggaggccccccgggcccgcagccggc cccaagcgccgcagccccgccgccgcccgcgcacgccctgggcggcatgga cgccgaactcatcgacgaggaggcgctgacgtcgctggagctggagctgggg ctgcaccgcgtgcgcgagctgcccgagctgttcctgggccagagcgagttcga ctgcttctcggacttggggtccgcgccgcccgccggctccgtgagctgccagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaag acgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgc ttctccCGCAGCGACAACCTGGTGAGAcacatccgcatccac acaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCG AGAGGAT AACTT GC AC ACTcacatccgcacccacacaggcg 72
- 89 046157
aaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGA TGAACTTGTCCGAcataccaagatccacttgcggcagaaggaccgc ccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGG GAATCTGACTGAGcacatccgcatccacacaggccagaagcccttc cagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATCT GGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgac atctgtggaagaaagtttgccC AGA AT AGT AC CC T GAC CGA A cataccaagatccacttgcggcagaaggacaag
41 (кодирующая) ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCTGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCGGCGGCAGCGGCGGCGGAAGC GGCgccgaccacctgatgctcgccgagggctaccgcctggtgcagaggcc gccgtccgccgccgccgcccatggccctcatgcgctccggactctgccgccgt acgcgggcccgggcctggacagtgggctgaggccgcggggggctccgctgg ggccgccgccgccccgccaacccggggccctggcgtacggggccttcgggc cgccgtcctccttccagccctttccggccgtgcctccgccggccgcgggcatcg cgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcgcccc ccaacgctccgggaggccccccgggcccgcagccggccccaagcgccgca gccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactcatc gacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcgtgc gcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcggactt ggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtggtt ctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccgg cccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcctgt gatcgccgcttctccCGCAGCGACAACCTGGTGAGAcacatc cgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAaact tcagcCGAGAGGATAACTTGCACACTcacatccgcacccac acaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGG AGCGATGAACTTGTCCGAcataccaagatccacttgcggcaga aggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAA TCAGGGAATCTGACTGAGcacatccgcatccacacaggccag aagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTGG ACATCTGGTACGCcacatccgcacccacacaggcgaaaagcccttc gcctgcgacatctgtggaagaaagtttgccC AGA AT AGT ACC C TG ACCGAAcataccaagatccacttgcggcagaaggacaag 73
- 90 046157 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC
- 91 046157
CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTGAAACCCAGCAGACAAT GTAGCTAGACCCAGTAGCCAGATGTAGCTAAAG AGACCGGTTCACTGTGAAAGCTTGGGTGGCATCC CTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTG GAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCC TAATAAAATTAAGTTGCATCATTTTGTCTGACTA GGTGTCCTTCTATAATATTATGGGGTGGAGGGGG GTGGTATGGAGCAAGGGGCAAGTTGGGAAGACA ACCTGTAGGGCCTGCGGGGTCTATTGGGAACCA AGCTGGAGTGCAGTGGCACAATCTTGGCTCACTG CAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCT GCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCA TGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTG GTAGAGACGGGGTTTCACCATATTGGCCAGGCTG GTCTCCAACTCCTAATCTCAGGTGATCTACCCAC CTTGGCCTCCCAAATTGCTGGGATTACAGGCGTG AACCACTGCTCCCTTCCCTGTCCTT
43 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct 75
- 92 046157
cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTGAAACCCAGCAGACAAT GTAGCTAGACCCAGTAGCCAGATGTAGCTAAAG AGACCGGTTCACTGTGAGAAACCCAGCAGACAA TGTAGCTAGACCCAGTAGCCAGATGTAGCTAAA GAGACCGGTTCACTGTGAAAGCTTGGGTGGCATC CCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCT GGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTC CTAATAAAATTAAGTTGCATCATTTTGTCTGACT AGGTGTCCTTCTATAATATTATGGGGTGGAGGGG
- 93 046157
GGTGGTATGGAGCAAGGGGCAAGTTGGGAAGAC AACCTGTAGGGCCTGCGGGGTCTATTGGGAACC AAGCTGGAGTGCAGTGGCACAATCTTGGCTCACT GCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCC TGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGC ATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTT GGTAGAGACGGGGTTTCACCATATTGGCCAGGCT GGTCTCCAACTCCTAATCTCAGGTGATCTACCCA CCTTGGCCTCCCAAATTGCTGGGATTACAGGCGT GAACCACTGCTCCCTTCCCTGTCCTT
44 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCgc cgaccacctgatgctcgccgagggctaccgcctggtgcagaggccgccgtcc gccgccgccgcccatggccctcatgcgctccggactctgccgccgtacgcggg 76
- 94 046157
cccgggcctggacagtgggctgaggccgcggggggctccgctggggccgcc gccgccccgccaacccggggccctggcgtacggggccttcgggccgccgtc ctccttccagccctttccggccgtgcctccgccggccgcgggcatcgcgcacct gcagcctgtggcgacgccgtaccccggccgcgcggccgcgccccccaacgc tccgggaggccccccgggcccgcagccggccccaagcgccgcagccccgc cgccgcccgcgcacgccctgggcggcatggacgccgaactcatcgacgagg aggcgctgacgtcgctggagctggagctggggctgcaccgcgtgcgcgagct gcccgagctgttcctgggccagagcgagttcgactgcttctcggacttggggtc cgcgccgcccgccggctccgtgagctgcggtggttctggtggtggttctggtca gtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagca agacgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgcc gcttctccCGCAGCGACAACCTGGTGAGAcacatccgcatcc acacaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcC GAGAGGATAACTTGCACACTcacatccgcacccacacaggc gaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCG ATGAACTTGTCCGAcataccaagatccacttgcggcagaaggacc gcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAG GGAATCTGACTGAGcacatccgcatccacacaggccagaagccct tccagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATC TGGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcg acatctgtggaagaaagtttgccCAGAATAGTACCCTGACCG AAcataccaagatccacttgcggcagaaggacaagtaaCTCGAGGA AACCCAGCAGACAATGTAGCTAGACCCAGTAGC CAGATGTAGCTAAAGAGACCGGTTCACTGTGAA AGCTTGGGTGGCATCCCTGTGACCCCTCCCCAGT GCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTG CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCA TCATTTTGTCTGACTAGGTGTCCTTCTATAATATT ATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGG CAAGTTGGGAAGACAACCTGTAGGGCCTGCGGG GTCTATTGGGAACCAAGCTGGAGTGCAGTGGCA CAATCTTGGCTCACTGCAATCTCCGCCTCCTGGG TTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTT GTTGGGATTCCAGGCATGCATGACCAGGCTCAGC TAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCAC CATATTGGCCAGGCTGGTCTCCAACTCCTAATCT CAGGTGATCTACCCACCTTGGCCTCCCAAATTGC TGGGATTACAGGCGTGAACCACTGCTCCCTTCCC TGTCCTT
45 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac 184
- 95 046157
ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCgc cgaccacctgatgctcgccgagggctaccgcctggtgcagaggccgccgtcc gccgccgccgcccatggccctcatgcgctccggactctgccgccgtacgcggg cccgggcctggacagtgggctgaggccgcggggggctccgctggggccgcc gccgccccgccaacccggggccctggcgtacggggccttcgggccgccgtc ctccttccagccctttccggccgtgcctccgccggccgcgggcatcgcgcacct gcagcctgtggcgacgccgtaccccggccgcgcggccgcgccccccaacgc tccgggaggccccccgggcccgcagccggccccaagcgccgcagccccgc cgccgcccgcgcacgccctgggcggcatggacgccgaactcatcgacgagg aggcgctgacgtcgctggagctggagctggggctgcaccgcgtgcgcgagct gcccgagctgttcctgggccagagcgagttcgactgcttctcggacttggggtc cgcgccgcccgccggctccgtgagctgcggtggttctggtggtggttctggtca gtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagca agacgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgcc gcttctccCGCAGCGACAACCTGGTGAGAcacatccgcatcc acacaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcC GAGAGGATAACTTGCACACTcacatccgcacccacacaggc gaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCG ATGAACTTGTCCGAcataccaagatccacttgcggcagaaggacc gcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAG GGAATCTGACTGAGcacatccgcatccacacaggccagaagccct tccagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATC TGGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcg acatctgtggaagaaagtttgccCAGAATAGTACCCTGACCG
- 96 046157
AAcataccaagatccacttgcggcagaaggacaagtaaCTCGAGGA AACCCAGCAGACAATGTAGCTAGACCCAGTAGC CAGATGTAGCTAAAGAGACCGGTTCACTGTGAG AAACCCAGCAGACAATGTAGCTAGACCCAGTAG CCAGATGTAGCTAAAGAGACCGGTTCACTGTGA AAGCTTGGGTGGCATCCCTGTGACCCCTCCCCAG TGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGT GCCCACCAGCCTTGTCCTAATAAAATTAAGTTGC ATCATTTTGTCTGACTAGGTGTCCTTCTATAATAT TATGGGGTGGAGGGGGGTGGTATGGAGCAAGGG GCAAGTTGGGAAGACAACCTGTAGGGCCTGCGG GGTCTATTGGGAACCAAGCTGGAGTGCAGTGGC ACAATCTTGGCTCACTGCAATCTCCGCCTCCTGG GTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGT TGTTGGGATTCCAGGCATGCATGACCAGGCTCAG CTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCA CCATATTGGCCAGGCTGGTCTCCAACTCCTAATC TCAGGTGATCTACCCACCTTGGCCTCCCAAATTG CTGGGATTACAGGCGTGAACCACTGCTCCCTTCC CTGTCCTT
8 (кодирующая) ATGGCCgccgaccacctgatgctcgccgagggctaccgcctggtgcaga ggccgccgtccgccgccgccgcccatggccctcatgcgctccggactctgccg ccgtacgcgggcccgggcctggacagtgggctgaggccgcggggggctccg ctggggccgccgccgccccgccaacccggggccctggcgtacggggccttc gggccgccgtcctccttccagccctttccggccgtgcctccgccggccgcggg catcgcgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcg ccccccaacgctccgggaggccccccgggcccgcagccggccccaagcgcc gcagccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactc atcgacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcg tgcgcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcgg acttggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtg gttctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaacc ggcccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcc tgtgatcgccgcttctccCGCAGCGACAACCTGGTGAGAcac atccgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAa acttcagcCGAGAGGATAACTTGCACACTcacatccgcacc cacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCG GAGCGATGAACTTGTCCGAcataccaagatccacttgcggca gaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCA AT C AGGGA ATCTGACTGAGcacatccgcatccacacaggcca gaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTG GACATCTGGTACGCcacatccgcacccacacaggcgaaaagccct tcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCCT GACCGAAcataccaagatccacttgcggcagaaggacaag 203
46 (кодирующая) ATGGCCgccgaccacctgatgctcgccgagggctaccgcctggtgcaga ggccgccgtccgccgccgccgcccatggccctcatgcgctccggactctgccg ccgtacgcgggcccgggcctggacagtgggctgaggccgcggggggctccg ctggggccgccgccgccccgccaacccggggccctggcgtacggggccttc gggccgccgtcctccttccagccctttccggccgtgcctccgccggccgcggg catcgcgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcg 204
- 97 046157
ccccccaacgctccgggaggccccccgggcccgcagccggccccaagcgcc gcagccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactc atcgacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcg tgcgcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcgg acttggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtg gttctggtGGTGGCAGCGGGGGAGGTTCTGGTcagtccca gctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaagacg cccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgcttct ccCGCAGCGACAACCTGGTGAGAcacatccgcatccacaca ggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCGAG AGGAT AACTTGC AC ACT cacatccgcacccacacaggcgaaaa gcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGATGA ACTTGTCCGAcataccaagatccacttgcggcagaaggaccgccctta cgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGGGAA TCTGACTGAGcacatccgcatccacacaggccagaagcccttccagtg ccgcatctgcatg AGAaacttcagc AC A AGT GGAC AT С T GGT ACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgacatctg tggaagaaagtttgccC AGAAT AGT ACCCTGACCGAAcatac caagatccacttgcggcagaaggacaag
47 (кодирующая) ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCcGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCgccgaccacctgatgctcgccgagggctaccgcct ggtgcagaggccgccgtccgccgccgccgcccatggccctcatgcgctccgg actctgccgccgtacgcgggcccgggcctggacagtgggctgaggccgcgg ggggctccgctggggccgccgccgccccgccaacccggggccctggcgtac ggggccttcgggccgccgtcctccttccagccctttccggccgtgcctccgccg gccgcgggcatcgcgcacctgcagcctgtggcgacgccgtaccccggccgc gcCgccgcgccccccaacgctccgggaggccccccgggcccgcagccggc cccaagcgccgcagccccgccgccgcccgcgcacgccctgggcggcatgga cgccgaactcatcgacgaggaggcgctgacgtcgctggagctggagctgggg ctgcaccgcgtgcgcgagctgcccgagctgttcctgggccagagcgagttcga ctgcttctcggacttggggtccgcgccgcccgccggctccgtgagctgccagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaag acgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgc ttctccCGCAGCGACAACCTGGTGAGAcacatccgcatccac acaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCG 206
- 98 046157
AGAGGAT AACTT GC AC ACTcacatccgcacccacacaggcg aaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGA TGAACTTGTCCGAcataccaagatccacttgcggcagaaggaccgc ccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGG GAATCTGACTGAGcacatccgcatccacacaggccagaagcccttc cagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATCT GGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgac atctgtggaagaaagtttgccC AGA AT AGT AC CC T GAC CGA A cataccaagatccacttgcggcagaaggacaag
48 (кодирующая) ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCTGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCGGCGGCAGCGGCGGCGGAAGC GGCgccgaccacctgatgctcgccgagggctaccgcctggtgcagaggcc gccgtccgccgccgccgcccatggccctcatgcgctccggactctgccgccgt acgcgggcccgggcctggacagtgggctgaggccgcggggggctccgctgg ggccgccgccgccccgccaacccggggccctggcgtacggggccttcgggc cgccgtcctccttccagccctttccggccgtgcctccgccggccgcgggcatcg cgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcgcccc ccaacgctccgggaggccccccgggcccgcagccggccccaagcgccgca gccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactcatc gacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcgtgc gcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcggactt ggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtggtt ctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccgg cccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcctgt gatcgccgcttctccCGCAGCGACAACCTGGTGAGAcacatc cgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAaact tcagcCGAGAGGATAACTTGCACACTcacatccgcacccac acaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGG AGCGATGAACTTGTCCGAcataccaagatccacttgcggcaga aggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAA TCAGGGAATCTGACTGAGcacatccgcatccacacaggccag aagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTGG ACATCTGGTACGCcacatccgcacccacacaggcgaaaagcccttc gcctgcgacatctgtggaagaaagtttgccC AGA AT AGT ACC C TG ACCGAAcataccaagatccacttgcggcagaaggacaag 208
- 99 046157
49 (кодирующая) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggCTCGAACCAGGTGA AAAACCTTACAAATGTCCTGAATGTGGGAAATC ATTCAGTCGCAGCGACAACCTGGTGAGACATCA ACGCACCCATACAGGAGAAAAACCTTATAAATG TCCAGAATGTGGAAAGTCCTTCTCACGAGAGGAT AACTTGCACACTCATCAACGAACACATACTGGTG AAAAACCATACAAGTGTCCCGAATGTGGTAAAA GTTTTAGCCGGAGCGATGAACTTGTCCGACACCA ACGAACCCATACAGGCGAGAAGCCTTACAAATG TCCCGAGTGTGGCAAGAGCTTCTCACAATCAGGG AATCTGACTGAGCATCAACGAACTCATACCGGG GAAAAACCTTACAAGTGTCCAGAGTGTGGGAAG AGCTTTTCCACAAGTGGACATCTGGTACGCCACC AGAGGACACATACAGGGGAGAAGCCCTACAAAT GCCCCGAATGCGGTAAAAGTTTCTCTCAGAATAG TACCCTGACCGAACACCAGCGAACACACACTGG GAAAAAAACGAGTgtgtaCgttgggggtttagagagcCgggtctt gaaatacacagcccagaatatggagcttcagaacaaagtacagcttctggagga acagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgaga tCtcaaacaaaaccagcagcagcagcacctgcatcttggtcctGctagtctcctt ctgcctcctccttgtacctgctatgtactcctctgacacaagggggagcctgccag ctgagcatggagtgttgtcccgccagcttcgtgccctccccagtgaggaccctta ccagctggagctgcctgccctgcagtcagaagtgccgaaagacagcacacacc agtggttggacggctcagactgtgtactccaggcccctggcaacacttcctgcct gctgcattacatgcctcaggctcccagtgcagagcctcccctggagtggccCtt ccctgacctcttctcagagcctctctgccgaggtcccatcctccccctgcaggca aatctcacaaggaagggaggatggcttcctactggtagcccctctgtcattttgca ggacagatactcaggc 212
50 (кодирующая) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCAGCGACAACCTGGTGAG AcacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCGAGAGGATAACTTGCACACTcacatccg cacccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgc cCGGAGCGATGAACTTGTCCGAcataccaagatccacttgcg 216
- 100 046157
gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc С А АТ С AGGGA АТ С Т GACTGAGcacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGT GGACATCTGGTACGCcacatccgcacccacacaggcgaaaagcc cttcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCC TGACCGAAcataccaagatccacttgcggcagaaggacgtgtaCgttg ggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttcag aacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagga aactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcacc tgcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcctc tgacacaagggggagcctgccagctgagcatggagtgttgtcccgccagcttc gtgccctccccagtgaggacccttaccagctggagctgcctgccctgcagtcag aagtgccgaaagacagcacacaccagtggttggacggctcagactgtgtactcc aggcccctggcaacacttcctgcctgctgcattacatgcctcaggctcccagtgc agagcctcccctggagtggccCttccctgacctcttctcagagcctctctgccga ggtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttcct actggtagcccctctgtcattttgcaggacagatactcaggc
51 (кодирующая) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCTCAGACAACCTCGTTCGA cacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgAG AaacttcagcCACCGGACTACACTCACGAACcacatccgca cccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgcc AGAGAAGAC AATCTCC AT ACT cataccaagatccacttgcg gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc AC C AGC С АТТС ТС T С AC T GA Acacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCAGTCT AGC T C ACTGGT GAGGcacatccgcacccacacaggcgaaaagc ccttcgcctgcgacatctgtggaagaaagtttgccAGGGAGGATAAC CTGCATACGcataccaagatccacttgcggcagaaggacgtgtaCgtt gggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttca gaacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagg aaactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcac ctgcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcct ctgacacaagggggagcctgccagctgagcatggagtgttgtcccgccagctt cgtgccctccccagtgaggacccttaccagctggagctgcctgccctgcagtca gaagtgccgaaagacagcacacaccagtggttggacggctcagactgtgtact ccaggcccctggcaacacttcctgcctgctgcattacatgcctcaggctcccagt gcagagcctcccctggagtggccCttccctgacctcttctcagagcctctctgcc gaggtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttc ctactggtagcccctctgtcattttgcaggacagatactcaggc 218
52 (кодирующая) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg 220
- 101 046157
actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggCTCGAACCAGGTGA AAAACCTTACAAATGTCCTGAATGTGGGAAATC ATTCAGTCGCAGCGACAACCTGGTGAGACATCA ACGCACCCATACAGGAGAAAAACCTTATAAATG TCCAGAATGTGGAAAGTCCTTCTCACGAGAGGAT AACTTGCACACTCATCAACGAACACATACTGGTG AAAAACCATACAAGTGTCCCGAATGTGGTAAAA GTTTTAGCCGGAGCGATGAACTTGTCCGACACCA ACGAACCCATACAGGCGAGAAGCCTTACAAATG TCCCGAGTGTGGCAAGAGCTTCTCACAATCAGGG AATCTGACTGAGCATCAACGAACTCATACCGGG GAAAAACCTTACAAGTGTCCAGAGTGTGGGAAG AGCTTTTCCACAAGTGGACATCTGGTACGCCACC AGAGGACACATACAGGGGAGAAGCCCTACAAAT GCCCCGAATGCGGTAAAAGTTTCTCTCAGAATAG TACCCTGACCGAACACCAGCGAACACACACTGG GAAAAAAACGAGTgtgtaCgttgggggtttagagagcCgggtctt gaaatacacagcccagaatatggagcttcagaacaaagtacagcttctggagga acagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgaga tatca
53 (кодирующая) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCAGCGACAACCTGGTGAG AcacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCGAGAGGATAACTTGCACACTcacatccg cacccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgc cCGGAGCGATGAACTTGTCCGAcataccaagatccacttgcg gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc C A AT C AGGGA AT С T GACTGAGcacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGT GGACATCTGGTACGCcacatccgcacccacacaggcgaaaagcc cttcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCC TGACCGAAcataccaagatccacttgcggcagaaggacgtgtaCgttg ggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttcag aacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagga aactccaggccatggtgattgagatCtca 222
- 102 046157
Таблица 8
Последовательности нуклеиновых кислот для иллюстративных сайтов связывания микроРНК и микроРНК
Описание Последовательность SEQ ID NO
Сайт связывания Ml aaagagaccggttcactgtgacagtaaaagagaccggttcactgtgagaatgaaagag accggttcactgtgatcggaaaagagaccggttcactgtgagcggccttgaaacccagc agacaatgtagctcagtagaaacccagcagacaatgtagctgaatggaaacccagcag acaatgtagcttcggagaaacccagcagacaatgtagct 7
Последователь ность miR128 UCACAGUGAACCGGUCUCUUU 8
Сайт связывания miR128 AAAGAGACCGGTTCACTGTGA 9
Последователь ность miR221 AGCUACAUUGUCUGCUGGGUUUC 10
Сайт связывания miR221 GAAACCCAGCAGACAATGTAGCT 11
Последователь ность miR222 AGCUACAUCUGGCUACUGGGUCU 12
Сайт связывания miR222 AGACCCAGTAGCCAGATGTAGCT 13
Сайт связывания М2 GAAACCCAGCAGACAATGTAGCTAGACCCAGTAGCC AGATGTAGCTAAAGAGACCGGTTCACTGTGA 14
Сайт связывания М3 GAAACCCAGCAGACAATGTAGCTAGACCCAGTAGCC AGATGTAGCTAAAGAGACCGGTTCACTGTGAGAAAC CCAGCAGACAATGTAGCTAGACCCAGTAGCCAGATG TAGCTAAAGAGACCGGTTCACTGTGA 15
Таблица 9
Различные типы структур с цинковыми пальцами и иллюстративные белки типа цинковые пальцы для производства eTF
Название типа ZF SEQ ID NO Структура ZF (причем каждый х может независимо быть любым остатком) Иллюстративные белки, которые могут служить в качестве белковой платформы для eTF или ДНК-связывающего домена eTF, раскрытых в настоящем документе
«Цинковые пальцы» C2H2типа (ZNF) 136 С-х-С-х-Н-х-Н KLF4, KLF5, EGR3, ZFP637, SLUG, ZNF750, ZNF281, ΖΠ.Η.89, GLIS1, GLIS3
Белки типа «пальцы Ring» (RNF) 137 С-х-С-х-С-х-Н-ххх-С-хС-х-С-х-С MDM2, BRCA1, ZNF 179
Белки типа «пальцы PHD» (PHF) 138 С-х-С-х-С-х-С-ххх-Н-хС-х-С-х-С KDM2A, PHF1, ING1
- 103 046157
Содержащие домен LIM 139 С-х-С-х-Н-х-С-х-С-х-С-х- C-x-(C,H,D) ZNF185, LIMK1, PXN
Ядерные гормональные рецепторы (NR) 140 С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С VDR, ESRI, NR4A1
«Цинковые пальцы» СССНтипа (ZC3H) 141 С-х-С-х-С-х-Н RC3H1, HELZ, MBNL1, ZFP36, ZFP36L1
«Цинковые пальцы» FYVEтипа (ZFYVE) 140 С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С ЕЕА1, HGS, PIKFYVE
«Цинковые пальцы» ССНСтипа (ZCCHC) 142 С-х-С-х-Н-х-С CNH.H., SF1,LIN28A
«Цинковые пальцы» DHHCтипа (ZDHHC) 143 С-х-С-х-Н-х-С-ххх-С-хС-х-Н-х-С ZDHHC2, ZDHHC8, ZDHHC9
«Цинковые пальцы» MYNDTHna(ZMYND) 144 С-х-С-х-С-х-С-ххх-С-х-Сх-Н-х-С PDCD2, RUNX1T1, SMYD2, SMYD1
«Цинковые пальцы» RANBP2THna(ZRANB) 145 С-х-С-х-С-х-С YAF2, SHARPIN, EWSR1
«Цинковые пальцы» ZZтипа (ZZZ) 145 С-х-С-х-С-х-С HERC2, NBR1, CREBH.H.
«Цинковые пальцы» С2НСтипа (ZC2HC) 142 С-х-С-х-Н-х-С IKBKG, L3MBTL1, ZNF746
Содержащ. домен «цинковые пальцы» GATA (GATAD) 145 С-х-С-х-С-х-С GATA4, GATA6, MT Al
ZF класс гомеобоксы и псевдогены 136 С-х-С-х-Н-х-Н ADNP, ZEB1, ZHX1
Содержащ. домен ТНАР (ТНАР) 141 С-х-С-х-С-х-Н THAP1, THAP4, THAP11
- 104 046157
«Цинковые пальцы» СХХСтипа (СХХС) 140 С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С СХХС1, СХХС5, MBD1, DNMT1
«Цинковые пальцы» SWIMтипа (ZSWIM) 141 С-х-С-х-С-х-Н МАРЗК1, ZSWIM5, ZSWIM6
«Цинковые пальцы» AN1типа (ZFAND) 146 С-х-С-х-С-х-С-ххх-С-хН-х-Н-х-С ZFAND3, ZFAND6, IGHMH.H.2
«Цинковые пальцы» ЗСххСтипа (Z3CXXC) 142 С-х-С-х-Н-х-С ZAR1, RTP1, RTP4
«Цинковые пальцы» CWтипа (ZCW) 145 С-х-С-х-С-х-С MORC1, ZCWPW1, KDM1B
«Цинковые пальцы» GRFтипа (ZGRF) 145 С-х-С-х-С-х-С TTF2, NEIL3, ТОРЗ А
«Цинковые пальцы» MIZтипа (ZMIZ) 142 С-х-С-х-Н-х-С PIAS1, PIAS3, PIAS4
«Цинковые пальцы» BEDтипа (ZBED) 136 С-х-С-х-Н-х-Н ZBED1, ZBED4, ZBED6
«Цинковые пальцы» HITтипа (ZNHIT) 144 С-х-С-х-С-х-С-ххх-С-х-Сх-Н-х-С ZNHIT3, DDX59, INO80B
«Цинковые пальцы» MYMтипа (ZMYM) 145 С-х-С-х-С-х-С ZMYM2, ZMYM3, ZMYM4
«Цинковые пальцы» matrinтипа (ZMAT) 136 С-х-С-х-Н-х-Н ZNF638, ZMAT1, ZMAT3, ZMAT5
«Цинковые пальцы» С2Н2С-типа 136 С-х-С-х-Н-х-Н MYT1,MYT1L, ST18
«Цинковые пальцы» DBFтипа (ZDBF) 136 С-х-С-х-Н-х-Н DBF4, DBF4B, ZDBF2
«Цинковые пальцы» PARPтипа 142 С-х-С-х-Н-х-С LIG3, PARP1
- 105 046157
Таблица 10 Аминокислотные последовательности иллюстративных ДНК-связывающих доменов типа цинковые пальцы
DBD/целево й сайт Последовательность SEQID NO
eZF LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n YKCPECGKSFS X HQRTH - TGKKTS, где η - целое число от 1 до 15 и каждый X - это последовательность распознавания, способная связываться с 3 п.н. целевой последовательности 147
Целевой сайт Z1 RSDNLVR х REDNLHT х RSDELVR х QSGNLTE х TSGHLVR х QNSTLTE, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков 148
Целевой сайт Z13 RSDNLVR х HRTTLTN х REDNLHT х TSHSLTE х QSSSLVR х REDNLHT, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков 149
Целевой сайт Z14 DPGALVR х RSDNLVR х QSGDLRR х THLDLIR х TSGNLVR х RSDNLVR, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков 150
Целевой сайт Z15 RRDELNV х RSDHLTN х RSDDLVR х RSDNLVR х HRTTLTN х REDNLHT х TSHSLTE х QSSSLVR х REDNLHT, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков 151
Таблица 11
Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных последовательностей распознавания типа цинковые пальцы
Последовательность SEQ ID NO
RSDNLVR 152
REDNLHT 153
RSDELVR 154
QSGNLTE 155
TSGHLVR 156
QNSTLTE 157
DPGALVR 158
HRTTLTN 159
QSGDLRR 160
TSHSLTE 161
THLDLIR 162
QSSSLVR 163
TSGNLVR 164
RRDELNV 165
RSDDLVR 166
RSDHLTN 167
- 106 046157
Таблица 12
Другие раскрытые в настоящем документе нуклеотидные и аминокислотные последовательности
Описание Последовательность SEQ ID NO
Домен EGR1 NLS LH<PSRMRI<YPNRPSI< 168
SV40 NLS PKKKRKV 169
Нуклеоплазми hNLS KRPAATKKAGQAKKKK 170
Тэг НА YPYDVPDYA 171
spA (синтетич. полиА) AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGG TTTTTTGTGTGCGGACCGCACGTG 16
hGH (полиА гормона роста человека) GGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCT GGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTT GTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTA GGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTG GTATGGAGCAAGGGGCAAGTTGGGAAGACAACCTGT AGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTG CAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCC TGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTT GTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAA TTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATT GGCCAGGCTGGTCTCCAACTCCTAATCTCAGGTGATCT ACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGC GTGAACCACTGCTCCCTTCCCTGTCCTT 17
Белок SCN1A MEQTVLVPPGPDSFNFFTRESLAAIERRIAEEKAKNPKPD I<I<DDDENGPKPNSDLEAGI<NLPFIYGDIPPEMVSEPLED LDPYYINKKTFIVLNKGKAIFRFSATSALYILTPFNPLRKI AIKILVHSLFSMLIMCTILTNCVFMTMSNPPDWTKNVEY TFTGIYTFESLIKIIARGFCLEDFTFLRDPWNWLDFTVITF AYVTEFVDLGNVSALRTFRVLRALKTISVIPGLKTIVGAL IQSVKKLSDVMILTVFCLSVFALIGLQLFMGNLRNKCIQ WPPTNASLEEHSIEKNITVNYNGTLINETVFEFDWKSYIQ DSRYHYFLEGFLDALLCGNSSDAGQCPEGYMCVKAGRN PNYGYTSFDTFSWAFLSLFRLMTQDFWENLYQLTLRAA GKTYMIFFVLVIFLGSFYLINLILAVVAMAYEEQNQATLE EAEQKEAEFQQMIEQLKKQQEAAQQAATATASEHSREP S AAGRLSDS S SEASKLS SKS AKERRNRRKKRKQKEQSGG EEKDEDEFQKSESEDSIRRKGFRF SIEGNRLTYEKRYS SP HQSLLSIRGSLFSPRRNSRTSLFSFRGRAKDVGSENDFAD DEHSTFEDNESRRDSLFVPRRHGERRNSNLSQTSRSSRM LAVFPANGKMHSTVDCNGVVSLVGGPSVPTSPVGQLLP EVIIDKPATDDNGTTTETEMRKRRSSSFHVSMDFLEDPSQ RQRAMSIASILTNTVEELEESRQKCPPCWYKFSNIFLIWD CSPYWLKVKHVVNLVVMDPFVDLAITICIVLNTLFMAM EHYPMTDHFNNVLTVGNLVFTGIFTAEMFLKIIAMDPYY YFQEGWNIFDGFIVTLSLVELGLANVEGLSVLRSFRLLRV FKLAKSWPTLNMLIKIIGNSVGALGNLTLVLAIIVFIFAVV GMQLFGKSYKDCVCKIASDCQLPRWHMNDFFHSFLIVF RVLCGEWIETMWDCMEVAGQAMCLTVFMMVMVIGNL VVLNLFLALLLSSFSADNLAATDDDNEMNNLQIAVDRM HKGVAYVKRKIYEFIQQSFIRKQKILDEIKPLDDLNNKKD SCMSNHTAEIGKDLDYLKDVNGTTSGIGTGSSVEKYIIDE SDYMSFINNPSLTVTVPIAVGESDFENLNTEDFSSESDLEE 172
- 107 046157
SKEKLNES S S S SEGSTVDIGAPVEEQP VVEPEETLEPEACF TEGCVQRFKCCQINVEEGRGKQWWNLRRTCFRIVEHNW FETFIVFMILLSSGALAFEDIYIDQRI<TH<TMLEYADI<VFT YIFILEMLLKWVAYGYQTYFTNAWCWLDFLIVDVSLVS LTANALGYSELGAIKSLRTLRALRPLRALSRFEGMRVVV NALLGAIPSIMNVLLVCLIFWLIFSIMGVNLFAGKFYHCI NTTTGDRFDIEDVNNHTDCLI<LIERNETARWI<NVI<VNF DNVGFGYLSLLQVATFKGWMDIMYAAVDSRNVELQPK YEESLYMYLYFVIFIIFGSFFTLNLFIGVIIDNFNQQKKKFG GQDIFMTEEQKKYYNAMKKLGSKKPQKPIPRPGNKFQG MVFDFVTRQVFDISIMILICLNMVTMMVETDDQSEYVTT ILSRINLVFIVLFTGECVLKLISLRHYYFTIGWNIFDFVVVI LSIVGMFLAELIEKYFVSPTLFRVIRLARIGRILRLIKGAK GIRTLLFALMMSLPALFNIGLLLFLVMFIYAIFGMSNFAY VKREVGIDDMFNFETFGNSMICLFQITTSAGWDGLLAPIL NSKPPDCDPNKVNPGSSVKGDCGNPSVGIFFFVSYIIISFL VVVNMYIAVILENF S VATEES AEPLSEDDFEMF YEVWEK FDPDATQFMEFEKLSQFAAALEPPLNLPQPNKLQLIAMD LPMVSGDRIHCLDILFAFTKRVLGESGEMDALRIQMEER FMASNPSKVSYQPITTTLKRKQEEVSAVIIQRAYRRHLLK RTVKQASFTYNKNKIKGGANLLIKEDMIIDRINENSITEK TDLTMSTAACPPSYDRVTKPIVEKHEQEGKDEKAKGK
Белок dCAS KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANV ENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTD HSELSGINPYEARVKGLSQKLSEEEF S A ALLHLAKRRG V HNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLER LKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQ SFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLM GHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDEN EKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKG YRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIA KILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTH NLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQ KEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIE LAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKEN AKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEV DHIIPRS VSFDNSFNNK VLVKQEE ASKKGNRTPFQ YLS S S DSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRF SVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKV KSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANAD FIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEY KEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYS TRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLL MYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYL TKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNK VVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYE VNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRV IGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIAS KTQSIKKYSTDILGNLYEVKSKKHPQIIKKG 173
- 108 046157
Конструкция dCAS9-VP64 MAPKKKRKVGIHGVPAAKRNYILGLAIGITSVGYGIIDYE TRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRH RIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSE EEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRN SKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEA KQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGS PFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLY NALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPT LKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDI TARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQ EEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIF NRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIK VINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNR QTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLE AIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEE ASKKGNRTPFQ YLS S SD SKIS YETFKKHILNL AKGKGRIS I<TI<I<EYLLEERDINRF S VQKDFINRNLVDTRYATRGLMN LLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNK GYKHHAEDALIIANADFIFKEWKKLDKAKK VMENQMFE EKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHR VDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKD NDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDE KNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLN AHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFV TVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIAS FYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYL ENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKK HPQIIKKGKRPAATKKAGQAKKKKGSYPYDVPDYALED ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDML 174
Белок WT EGR3 (человека) MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSS DSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQPAP GNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPAS GALSTQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYS EPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDY NLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAF KDKQIHPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPH ACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFS RSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI HLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA 175
Белок WT EGR1 (человека) maaakaemqlmsplqisdpfgsfphsptmdnypkleemmllsngapqflgaagap egsgsnssssssgggggggggsnsssssstfnpqadtgeqpyehltaesfpdislnnek vlvetsypsqttrlppitytgrfslepapnsgntlwpeplfslvsglvsmtnppassssap spaassasasqspplscavpsndsspiysaaptfptpntdifpepqsqafpgsagtalqy pppaypaakggfqvpmipdylfpqqqgdlglgtpdqkpfqglesrtqqpsltplstik afatqsgsqdlkalntsyqsqlikpsrmrkypnrpsktppherpyacpvescdrrfsrs deltrhirihtgqkpfqcricmrnfsrsdhltthirthtgekpfacdicgrkfarsderkrht kihlrqkdkkadksvvas sats si s syp spvatsyp spvttsyp sp attsyp spvptsfs spgsstypspvhsgfpspsvattyssvppafpaqvssfpssavtnsfsastglsdmtatf sprtieic 176
- 109 046157
Линкер GGSGGGSG 177
Линкер GGSGGGSGGGSGGGSG 178
Линкер [GGGS]n 179
Линкер [GGGGS]n 180
Линкер [GGSG]n 181
Сайт распознавания для WT EGR1 или EGR3 GCG(T/G)GGGCG 182
Каркас sgRNA GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAG GCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAG A 183
Кодирующая последователь ность CREB3 человека atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagaggaaagt ggagatttggggacggcacccgatgaggccgtgagggccccactggactgggcgctg ccgctttctgaggtGccgagcgactgggaagtagatgatttgctgtgctccctgctgagtc ccccagcgtcgttgaacattctcagctcctccaacccctgccttgtccaccatgaccacac ctactccctcccacgggaaactgtctctatggatctagagagtgagagctgtagaaaaga ggggacccagatgactccacagcatatggaggagctggcagagcaggagattgctagg ctagtactgacagatgaggagaagagtctattggagaaggaggggcttattctgcctgag acacttcctctcactaagacagaggaacaaattctgaaacgtgtgcggaggaagattcga aataaaagatctgctcaagagagccgcaggaaaaagaaggtgtaCgttgggggtttaga gagcCgggtcttgaaatacacagcccagaatatggagcttcagaacaaagtacagcttct ggaggaacagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgag atCtcaaacaaaaccagcagcagcagcacctgcatcttggtcctGctagtctccttctgc ctcctccttgtacctgctatgtactcctctgacacaagggggagcctgccagctgagcatg gagtgttgtcccgccagcttcgtgccctccccagtgaggacccttaccagctggagctgc ctgccctgcagtcagaagtgccgaaagacagcacacaccagtggttggacggctcaga ctgtgtactccaggcccctggcaacacttcctgcctgctgcattacatgcctcaggctccca gtgcagagcctcccctggagtggccCttccctgacctcttctcagagcctctctgccgag gtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttcctactggta gcccctctgtcattttgcaggacagatactcaggc 210
Последователь ность АА CREB3 человека MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWA LPLSEVP SDWE VDDLLC SLLSPP ASLNILS S SNPCLVHHD HTYSLPRETVSMDLESESCRKEGTQMTPQHMEELAEQEI ARLVLTDEEKSLLEKEGLILPETLPLTKTEEQILKRVRRKI RNKRSAQESRRKKKVYVGGLESRVLKYTAQNMELQNK VQLLEEQNLSLLDQLRKLQAMVIEISNKTS S S STCILVLL VSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALPSEDP YQLELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCLL HYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQANLTRK GGWLPTGSPSVILQDRYSG 211
Человеческий С-концевой домен CREB3 с трансмембран ной областью VYVGGLESRVLKYTAQNMELQNKVQLLEEQNLSLLDQL RKLQAMVIEISNKTS S S STCILVLLVSFCLLLVP AMYS SD TRGSLPAEHGVLSRQLRALPSEDPYQLELPALQSEVPKD STHQWLDGSDCVLQAPGNTSCLLHYMPQAPSAEPPLEW PFPDLFSEPLCRGPILPLQANLTRKGGWLPTGSPSVILQD RYSG 225
Человеческий С-концевой VYVGGLESRVLKYTAQNMELQNKVQLLEEQNLSLLDQL RKLQAMVIEIS 226
- 110 046157
домен CREB3 без трансмембран ной области
Кодирующая последователь ность CREB3TRE atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagaggaaagt ggagatttggggacggcacccgatgaggccgtgagggccccactggactgggcgctg ccgctttctgaggtGccgagcgactgggaagtagatgatttgctgtgctccctgctgagtc ccccagcgtcgttgaacattctcagctcctccaacccctgccttgtccaccatgaccacac ctactccctcccacgggaaactgtctctatggatctagagagtgagagctgtagaaaaga ggggacccagatgactccacagcatatggaggagctggcagagcaggagattgctagg ctagtactgacagatgaggagaagagtctattggagaaggaggggcttattctgcctgag acacttcctctcactaagacagaggaacaaattctgaaacgtgtgcggCTTGAGCC CGGAGAGAAGCCGTACAAGTGCCCTGAGTGCGGCAA GTCTTTTAGCAGAAGAGACGAACTTAATGTCCACCAG CGAACGCATACTGGTGAAAAGCCCTATAAATGTCCTG AATGTGGGAAATCATTCTCCAGCCGCAGAACCTGTAG GGCTCACCAGCGAACACACACCGGCGAAAAACCATA CAAATGTCCAGAATGCGGGAAATCCTTTTCTCAGTCAT CCAACTTGGTGAGACATCAACGCACGCACACTGGAGA AAAGCCTTACAAATGCCCGGAATGTGGAAAGTCTTTT TCCCAATTGGCCCATTTGCGAGCCCATCAGAGGACTC ACACGGGCGAGAAACCTTACAAATGCCCGGAATGCGG GAAATCTTTTTCAACGAGTGGCAACCTCGTAAGACAC CAAAGAACGCATACAGGCGAAAAGCCATATAAGTGTC CTGAGTGTGGTAAATCATTCTCACACAGGACCACCCT GACAAATCACCAGCGCACGCACACCGGCAAGAAGAC AAGCgtgtaCgttgggggtttagagagcCgggtcttgaaatacacagcccagaatat ggagcttcagaacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactg aggaaactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcacct gcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcctctgacac aagggggagcctgccagctgagcatggagtgttgtcccgccagcttcgtgccctcccca gtgaggacccttaccagctggagctgcctgccctgcagtcagaagtgccgaaagacagc acacaccagtggttggacggctcagactgtgtactccaggcccctggcaacacttcctgc ctgctgcattacatgcctcaggctcccagtgcagagcctcccctggagtggccCttccct gacctcttctcagagcctctctgccgaggtcccatcctccccctgcaggcaaatctcacaa ggaagggaggatggcttcctactggtagcccctctgtcattttgcaggacagatactcagg c 214
CREB3-TRE MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWA LPLSEVP SDWEVDDLLC SLLSPP ASLNILS S SNPCLVHHD HTYSLPRETVSMDLESESCRKEGTQMTPQHMEELAEQEI ARLVLTDEEKSLLEKEGLILPETLPLTKTEEQILKRVRLEP GEKPYKCPECGKSFSRRDELNVHQRTHTGEKPYKCPEC GKSFS SRRTCRAHQRTHTGEKPYKCPECGKSF SQS SNLV RHQRTHTGEKPYKCPECGKSFSQLAHLRAHQRTHTGEK PYKCPECGKSFSTSGNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNHQRTHTGKKTSVYVGGLESRVLKYTAQNME LQNK VQLLEEQNLSLLDQLRKLQ AM VIEISNKT S S S STCI LVLLVSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALP SEDPYQLELPALQSEVPKDSTHQWLDGSDCVLQAPGNTS 215
CLLHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQANL TRKGGWLPTGSPSVILQDRYSG
Примеры
Следующие ниже примеры включены для дальнейшего описания некоторых аспектов настоящего раскрытия и не должны использоваться для ограничения объема настоящего изобретения.
Пример 1.
Идентификация целевых областей, способных активировать SCN1A, с использованием SCN1Aспецифических активаторов транскрипции.
Чтобы идентифицировать области генома, способные повышать экспрессию эндогенного SCN1A, разрабатывали различные сконструированные факторы транскрипции (либо нуклеазы типа цинковые пальцы, либо конструкции gRNA/daCas9), которые нацелены на различные области генома, как указано в табл. 4 и 13 выше. Для конструкций gRNA/daCas9 эта gRNA имела ту же последовательность, что и целевая область, потому что gRNA разрабатывали для нацеливания на комплементарную геномную цепь. Белок dCas9 представлял собой конструкцию dCAS9-VP64 (SEQ ID NO: 174). Клетки HEK293 культиви
- 111 046157 ровали стандартными способами и трансфицировали (FugeneHD, Promega) 3 мкг плазмиды, несущей сконструированный фактор транскрипции или контрольную конструкцию, на лунку 6-луночного планшета. Клетки трансфицировали плазмидами, экспрессирующими конструкции, указанные в табл. 13 ниже. Через 48 часов после трансфекции клетки собирали, выделяли РНК (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'-3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)). Данные представлены в виде кратных изменений относительно контрольного условия.
Результаты показаны на фиг. 1 и в табл. 13 ниже в виде кратного изменения транскрипции SCN1A относительно контрольных условий (например, репортерная конструкция EGFP-KASH). В табл. 13 приведены значения для конструкций, которые привели по меньшей мере к 1,5-кратному увеличению транскрипции по сравнению с контрольными условиями.
Таблица 13. Влияние различных целевых сайтов генома и соответствующих eTF на транскрипцию. CON указывает на конструкцию типа цинковые пальцы, которая использовалась в эксперименте (смотрите табл. 1). Для конструкций gRNA целевой сайт и последовательность gRNA являются одинаковыми, поскольку gRNA разрабатывали для нацеливания на комплементарную цепь ДНК.
Таблица13
СО N Начальн. положени е в хромосоме 2 Целевая последовательность Целево й сайт с фиг. 1 SEQ ID NO для целевое о сайта Среднее тзначение
4 166149168 ctaggtcaagtgtaggag zl 18 5,12090848 0,0096628
28 166149165 GGTCAAGTGTAGGAGACA z8 25 1,52068773 0,62403349
3 166128025 taggtaccatagagtgag zl3 30 25,4730028 0,14942042
29 166127991 gaggatactgcagaggtc zl4 31 8,6766618 0,16432794
166149176 aaggctgtctaggtcaagtgt g9 35 1,36378425 0,18753821
166149118 tgttcctccagattaacactt gio 36 1,63040825 0,46710683
166128002 gatgaagccgagaggatactg gH 37 18,7579211 0,13148732
166128037 gctgatttgtattaggtacca gl2 38 22,4892633 0,09291316
166177299 AGAAAGCTGATACAGATACA A gl5 39 1,7542842 0,34519408
166178880 ggtacgggcaaagatttcttg gl7 40 1,36801947 0,48762102
166177299 AGAAAGCTGATACAGATACA A gl9 41 1,45636874 0,44464045
166177369 ACACAATGAGCCACCTACAAG g20 42 1,31187425 0,42605224
166177362 GTGGCTCATTGTGTGTGTGCC g22 43 1,25217773 0,26572657
166155264 CATATCCCTGCAGGTTCAGAA g24 44 1,75688991 0,28984533
166155099 agagagagagagagagagaga g25 45 2,05701745 0,42409102
166155393 TTCTCAGTTTTGAAATTAAAA g26 46 1,64498972 0,21705582
166155255 TGGATTCTCTTCTGAACCTGC g27 47 2,27026665 0,43195546
166148361 TGCTGAGGCAGGACACAGTGT g29 48 2,4290169 0,30364553
166148843 ATCATCTGTAACCATCAAGGA g30 49 2,58328006 0,0748197
166148565 TCCTGCCTACTTAGTTTCAAG g31 50 1,97097781 0,25980859
166148953 ATTACAGTTCTGTCAGCATGC g32 51 1,34500323 0,32186367
166149373 TGGTCTCATTCTTTTTGTGGG g33 52 1,71471378 0,32104302
166142239 CGATATTTTCATGGATTCCTT g34 53 1,7735976 0,21954265
- 112 046157
166142391 CTGACACTTACTTTGTCTAAA g35 54 1,95513108 0,02069095
166142219 AAAACTGGAACCGCATTCCCA g36 55 2,08698135 0,0454403
166142396 ACAAAGTAAGTGTCAGTGTGG g37 56 1,30739959 0,72725347
166142344 ATAATAGTTGTGTCTTTATAA g38 57 1,55783618 0,29846459
166141162 TGTACAAGCAGGGCTGCAAA G g39 58 1,4663605 0,02946062
166140590 GTTAACAAATACACTAAACAC g40 59 1,37399196 0,33638238
166140928 ttcaacaagctcccaagaagt g42 60 1,46929899 0,24465271
166141090 ATGTTCAAGGTGCAGAAGGA A g43 61 2,04547409 0,09880194
165990246 TGTTTGCTCAAACGTGCACCA g44 62 2,13402102 0,25583999
165989684 AAATAAGACATGAAAACAAG A g45 63 1,27016182 0,32368695
165990193 AAATATGTACCACAAGAAATG g46 64 2,29522738 0,41829497
165990076 TATCTGGTTTCTCTCACTGCT g47 65 1,44542116 0,0947106
165989571 ATTGCAAAGCATAATTTGGAT g48 66 1,42246971 0,18117243
Пример 2.
Активация эндогенного SCN1A в клетках HEK293 с использованием специфических для SCN1A факторов транскрипции.
Клетки HEK293 культивировали стандартными способами и высевали в 6-луночные планшеты. Клетки в каждой лунке трансфицировали (FugeneHD, Promega) 3 мкг плазмиды, несущей либо единственную сконструированную конструкцию фактора транскрипции, CREB3 WT человека (SEQ ID NO: 211), либо контрольную конструкцию EGFP. Исследуемые сконструированные конструкции фактора транскрипции включали в себя: конструкции 1-27 и 46-53 (табл. 1) и плазмиду, экспрессирующую CREB3-TRE (SEQ ID NO: 215; CREB3 с ДНК-связывающим доменом bZIP, замененным синтетическим доменом ZF, нацеленным на промотор TET) (каждый исследовали отдельно). Через 48 часов после трансфекции клетки собирали и выделяли РНК (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, и относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA3' (SEQ ID NO: 188)). Данные представлены в виде кратных изменений относительно контрольного условия (смотрите фиг. 2A, фиг. 2B и фиг. 2C). Контрольная конструкция состояла из EGFP, экспрессированного под контролем RE 1 (SEQ ID NO: 1). Доставка сконструированных факторов транскрипции индуцировала различную степень активации эндогенного транскрипта SCNIA по отношению к состоянию EGFP.
Пример 3.
Активация эндогенного SCN1A в ГАМК-нейронах с использованием специфических для SCN1A факторов транскрипции.
ГАМК-нейроны iCell (Cellular Dynamics) помещали в 6-луночный планшет (~1E6 клеток/лунку) и поддерживали в соответствии с протоколом, рекомендованным производителем. Через 72 часа после посева рекомбинантный AAV (серотип AAV-DJ), экспрессирующий EGFP, или конструкцию активатора 30 на фиг. 3A, или конструкцию 25, или конструкцию 16 на фиг. 3B под контролем универсального промотора (промотор CBA) добавляли в культуральную среду приблизительно в количестве 2E11 копий генома на лунку. Через одну неделю (фиг. 3A) или две недели (фиг. 3B) после инфицирования РНК выделяли из культивированных клеток (набор Qiagen RNeasy Mini) и обрабатывали ДЦКазой. Восстановленную РНК подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве контрольного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)). Данные представлены в виде кратных изменений
- 113 046157 относительно контрольного условия (смотрите фиг. 3A и 3B). Управляемая AAV экспрессия сконструированных факторов транскрипции вызывала значительную активацию эндогенного транскрипта SCNIA в культивируемых полученных из iPS ГАМК-нейронах.
Пример 4.
Специфическая активация эндогенного SCN1A в ГАМК-нейронах с использованием специфического для SCN1A фактора транскрипции.
ГАМК-нейроны iCell (Cellular Dynamics) помещали в 6-луночный планшет (~1E6 клеток/лунку) и поддерживали в соответствии с протоколом, рекомендованным производителем. Через 72 часа после посева в культуральную среду добавляли рекомбинантный AAV (серотип AAV-DJ), экспрессирующий EGFP или активатор (конструкция 30), который содержит DBD типа цинковые пальцы, слитый с VPR TAD, управляемый промотором CBA под контролем промотора CBA приблизительно в количестве 2E11 копиях генома на лунку.
Через неделю после инфицирования РНК выделяли из культивированных клеток (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. Библиотеки RNAseq получали из восстановленной РНК с использованием набора библиотек TruSeq Stranded mRNA (Illumina) и секвенировали на Illumina NextSeq (секвенирование парных концов 2x75 циклов). Считанные данные секвенирования сопоставляли с геномом человека (RNASTAR), и анализ дифференциальной экспрессии выполняли с помощью DESeq2. Данные представлены в виде кратного изменения относительно контрольных (AAVDJ-CBA-EGFP) образцов (смотрите фиг. 4). Результаты показаны в табл. 14, а на фиг. 4 показана относительная экспрессия эндогенного SCN1A и транскриптов 40 ближайших соседних генов, представленная в виде кратных изменений относительно контрольного условия. Конструкция 30, как описано в табл. 1, была способна специфически увеличивать экспрессию гена SCN1A или белка Nav1.1 по сравнению с другими исследованными генами. Это указывает на то, что целевой сайт, распознаваемый активатором транскрипции конструкции 30, специфичен для гена SCN1A, что приводит к увеличению экспрессии гена SCNIA в нейронах ГАМК.
Таблица 14
Влияние на транскрипцию эндогенного SCN1A и 40 ближайших соседних генов в ГАМК-нейронах, обработанных специфическим для SCN1A фактором транскрипции (конструкция 30)
Название гена Начало хром. 2 Конец хром. 2 Нить хромое. Кратность изменения против контроля
PLA2R1 160788518 160919121 - 0,16367458
ITGB6 160956176 161128399 - 0,20679884
RBMS1 161128661 161350305 - 1,63514667
TANK 161993418 162092732 + 0,90946407
PSMD14 162164548 162268228 + 0,92699237
TBR1 162272604 162282381 + 0,53199642
SLC4A10 162280842 162841792 + 1,89407328
DPP4 162848750 162931052 - 2,82345284
FAP 163027193 163101661 - 2,26977379
IFIHI 163123588 163175213 - 1,46146481
GCA 163175349 163228105 + 2,58702426
FIGN 164449905 164592522 - 0,46785861
GRB14 165349321 165478358 - 0,5631965
COBLL1 165510133 165700189 - 0,43199257
SLC38A11 165752695 165812035 - 4,06730119
SCN3A 165944031 166060577 - 1,0807866
SCN2A 166095911 166248818 + 1,24475196
CSRNP3 166326156 166545917 + 0,82971233
GALNT3 166604100 166651192 - 0,33804418
- 114 046157
ТТС21В 166713984 166810353 - 1,58661143
SCN1A 166845669 166984523 - 62,9552975
SCN9A 167051694 167232503 - 1,71659087
SCN7A 167260082 167350757 - 0,29331967
B3GALT1 168675181 168730551 + 0,64436013
STK39 168810529 169104651 - 1,19821739
CERS6 169312371 169631644 + 0,86828378
NOSTRIN 169643048 169722024 + 1,82142718
SPC25 169690641 169769881 - 0,86880697
АВСВ11 169779447 169887832 - 3,1441368
DHRS9 169921298 169952677 + 1,10381777
BBS5 170335687 170382432 + 0,65476347
KLHL41 170366211 170382772 + 0,87373377
FASTKD1 170386258 170430385 - 1,02786927
PPIG 170440849 170497916 + 1,09866236
CCDC173 170501934 170550943 - 0,67290779
PHOSPHO2 170550974 170558218 + 0,91339152
KLHL23 170550997 170633499 + 0,73926347
SSB 170648442 170668574 + 1,00631994
METTL5 170666590 170681441 - 1,21271497
UBR3 170683967 170940641 + 1,21350908
MYO3B 171034654 171511681 + 0,52839217
Пример 5.
Экспрессия SCN1A из кассеты экспрессии in vivo.
Чтобы проверить экспрессию активаторов транскрипции SCN1A in vivo, создавали рекомбинантные векторы AAV9 компанией VectorBiolabs (Malvern, PA). Самцам мышей C57Bl/6 (N=5 на группу, возраст 7-8 недель) проводили двустороннюю инфузию 1,5 мкл очищенного вектора AAV в дорсальный гиппокамп (AP -2,0 мм, латерально ±1,5, DV -1,4 мм от твердой мозговой оболочки) и вентральный гиппокамп (AP -3,1 мм, латерально ± 2,8, DV -3,8 мм от твердой мозговой оболочки), всего 4 места инъекции. AAV доставляли со скоростью 0,3 мкл/мин с периодом отдыха 4 мин после каждой инъекции. Через четыре недели после воздействия мышей умерщвляли и иссекали ткань гиппокампа. Для каждой группы ткань левого и правого гиппокампа собирали вместе для гомогенизации у большинства животных (N=4), за исключением одного животного, у которого собирали и гомогенизировали только левый гиппокамп. РНК выделяли из гомогената (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР на экспрессию мышиного SCN1A с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: 30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 64°C, 15 секунд при температуре 72°C]. Праймеры против SCN1A мыши (5'-CAAAAAAGCCACAAAAGCCT-3' (SEQ ID NO: 189); 5'TTAGCTCCGCAAGAAACATC-3' (SEQ ID NO: 190)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A in vivo определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)).
На фиг. 5A и фиг. 5B показаны средние результаты для пяти животных, каждому из которых вводили конструкцию AAV9. Контрольная конструкция eGFP содержала репортерный трансген eGFP. Конструкция 4 (смотрите табл. 1) содержала активатор транскрипции, который распознавал целевую последовательность, содержащую SEQ ID NO: 18, как описано в табл. 1 выше. На фиг. 5A показана относительная экспрессия SCN1A in vivo. На фиг. 5B показано изменение экспрессии SCN1A in vivo в процентах от средней экспрессии eGFP. Эти результаты показали, что активатор транскрипции SCN1A экспрессионной кассеты A приводил к усилению экспрессии SCNIA приблизительно на 20-30% in vivo.
Такие кассеты экспрессии могут быть адаптированы для применения на людях для лечения синдрома Драве, эпилепсии, судорог, болезни Альцгеймера, болезни Паркинсона и/или любых других заболеваний или состояний, связанных с дефицитом и/или нарушением активности SCN1A.
- 115 046157
Пример 6.
Анализ гипертермических припадков (HTS) на мышах с синдромом Драве.
A. Гетерозиготная модель мыши с нокаутом Scn1a.
Лечение синдрома Драве и/или его симптомов с использованием кассет экспрессии исследовали на линии мышей Scn1atm1Kea Эта линия мышей представляет собой признанную мышиную модель для синдрома Драве. Линии мыши Scn1atm1Kea не требуют рекомбиназы CRE. Мышь Scn1atm1Kea (доступная из лаборатории the Jackson Laboratory; описанная в Hawkins et al., Scientific Reports, vol. 7: 15327 (2017)) содержит делецию первого кодирующего экзона SCN1A. Мыши, гомозиготные по аллелю нокаута SCN1A, характеризуются тремором, атаксией, припадками и умирают к 16-му дню после рождения. У гетерозиготных мышей на фоне C57BL/6 развиваются спонтанные припадки, и большая часть их умирает в течение нескольких недель. Такая линия мышей может быть использована для изучения безопасности и эффективности лечения эпилепсии и синдрома Драве. См. Miller et al., Genes Brain Behav. 2014 Feb;13(2):163-72 для дополнительной информации.
Чтобы исследовать эффективность активаторов транскрипции в линии мышей Scn1atm1Kea, в пометы детенышей, полученных от самцов Scn1a +/-, скрещенных с самками C57Bl/6J, вводили вектор AAV посредством двусторонней ICV в точке P1. Мышам вводили дозы конструкций 31-34 (табл. 1). Мышей оставляли без воздействий вместе с их матерью до отлучения в P18, а затем снова не трогали до P26-P28, когда начинали анализ гипертермического припадка (HTS). Отдельные пометы мышей, которым вводили дозу в P1, отсеивали на P18 и ежедневно наблюдали за смертностью. Индукцию гипертермического припадка проводили у гетерозиготных (HET) мышей и мышей WT Scn1a на смешанном фоне 129Stac X C57BL/6 в P26-P28. Перед исследованием мышам вставляли смазанный ректальный датчик температуры (Ret-4) и подсоединяли к модулю контроля температуры (TCAT 2DF, Physitemp), который был последовательно соединен с нагревательной лампой (HL-1). Затем мышей помещали в большой стеклянный стакан и на короткое время давали уравновеситься с окружающей средой. После этого температура тела повышалась на ~0,5°C каждые 2 минуты до начала первого тонико-клонического припадка, сопровождающегося потерей положения стоя или до достижения температуры 43°C. Если у мыши случался припадок с потерей положения тела, эксперимент заканчивали и регистрировали внутреннюю температуру тела мыши. Если в течение всего эксперимента не было обнаружено приступов с потерей положения тела, эта мышь считалась без припадков, и анализ завершали. Образцы тканей получали от мышей в точке P1, a генотипирование мышей выполняли в ходе эксперимента с использованием ПЦР в реальном времени. После завершения анализа генотипирование было не слепым, и статус мышей как HET или WT коррелировал с полученными данными. Данные наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью теста Мантеля-Кокса. Результаты показаны в табл. 15 и 16 и на фиг. 6A-E.
Таблица 15
Обобщение условий, использованных в примере 6
Конструкция Дозировка (копии генов/мышь)
Конструкция 31 (фиг. 6А и 6Е)) 6,0Е+10
Конструкция 32 (фиг. 6В, 6D, 6Е) 3,1Е+11
Конструкция 33 (фиг. 6С) 5,8Е+10
Конструкция 34 (фиг. 6D) 4,9Е+13
Таблица 16
Обобщение результатов анализа на гипертермические припадки
Конструкция eTF (FIG.) Кол-во контрольных животных (обработ. PBS) Кол-во обработанных животных % без припадков при темп. 42,6°С Рзначение
Репортер EGFP 16 N/A 44%
Конструкция 31 (фиг. 6А и 6Е)) 16 18 95 Р<0,0001
Конструкция 32 (фиг. 6В, 6D, 6Е) 16 21 76 Р<0,05
Конструкция 33 (фиг. 6С) 16 14 93 Р<0,001
Конструкция 34 (фиг. 6D) 16 12 83 Р<0,05
Дополнительные эксперименты проводили на мышах Scn1atm1Kea, как описано выше, чтобы проверить влияние конструкций 42 и 43 на припадки в анализе HTS. В этих экспериментах конструкцию 42 вводили в дозе 9x1010 копий генома/мышь посредством двусторонней ICV в P1, а конструкцию 43 вводили в дозе 6x1010 копий генома/мышь посредством двусторонней ICV в P1 или P5. Результаты показаны на фиг. 6F (конструкция 42) и фиг. 6G (конструкция 43). Обе конструкции показали значительное снижение припадков по сравнению с контрольными EGFP (P<0,0001 как для конструкции 42, так и для конструкции 43).
- 116 046157
B. Гетерозиготная мутантная модель мыши ScnlaRX.
Лечение синдрома Драве и/или его симптомов с использованием кассеты экспрессии по настоящему раскрытию исследовали на линии мышей Scn1aRX. Эта линия мышей представляет собой признанную модель мышей для синдрома Драве. Линии мыши Scn1aRX не требуют рекомбиназы CRE. Мышь Scn1aRX (доступная из лаборатории Jackson Laboratory; описанная в Ogiwara et al., J. Neuroscience, vol. 27: 59035914 (2007)), содержит нонсенс-мутацию с потерей функции в экзоне 21 гена SCN1A (CgG на TgA; R1407X). У гетерозиготных мышей на фоне C57BL/6 развиваются спонтанные припадки, и большой процент мышей умирает в течение нескольких недель.
Для проверки эффективности активаторов транскрипции в линии мышей Scn1aRX в пометы детенышей, полученных от скрещивания посредством ЭКО сперматозоидов самцов Scn1aRX/+ с яйцеклеткой C57Bl/6J с эмбрионами, имплантированными самкам CD-1, вводили вектор AAV (конструкция 31) в дозе 5,1х1010 копий генома ^сУмышь или контроль PBS посредством двусторонней ICV в P1. Мышей оставляли без воздействий вместе с их матерью до отлучения в P18, а затем снова оставляли без воздействий до P26-P28, когда начинали анализ HTS. Отдельные пометы мышей, которым вводили дозу в P1, осматривали в P18 и ежедневно наблюдали за смертностью. Индукцию гипертермического припадка проводили у гетерозиготных (HET) мышей P26-P28 и мышей WT Scn1a на фоне C57BL/6. Перед исследованием мышам вставляли смазанный ректальный датчик температуры (Ret-4) и подсоединяли к модулю контроля температуры (TCAT 2DF, Physitemp), который был последовательно соединен с нагревательной лампой (HL-1). Затем мышей помещали в большой стеклянный стакан и на короткое время давали уравновеситься с окружающей средой. После этого температура тела повышалась на ~0,5°C каждые 2 минуты до начала первого тонико-клонического припадка, сопровождающегося потерей положения тела, или до достижения температуры 43°C. Если у мыши случался припадок с потерей положения тела, эксперимент заканчивали и регистрировали внутреннюю температуру тела мыши. Если в течение всего эксперимента не было обнаружено припадков с потерей положения тела, эта мышь считалась без припадков, и анализ завершался. Образцы тканей получали от мышей в точке P1, и генотипирование мышей выполняли в ходе эксперимента с использованием ПЦР в реальном времени. После завершения анализа генотипирование было не слепым, и статус мышей как HET или WT коррелировал с полученными данными. Ни у одной из исследованных мышей WT Scna1 не было припадка. Данные для мышей HET, обработанных конструкцией 31 (n=13) и обработанных PBS контролем (n=14), наносили на кривую выживаемости Каплана-Мейера, и значимость определяли с помощью критерия Кокса-Мантеля. Как показано на фиг. 6H, мыши HET, обработанные конструкцией 31, показывают значительное снижение индукции гипертермического припадка по сравнению с мышами HET, получавшими контрольный PBS (P<0,01).
Пример 7.
Анализ выживаемости на мышиной модели синдрома Драве.
A. Гетерозиготная модель мыши с нокаутом Scn1a.
Для проверки эффективности активаторов транскрипции в линии мышей Scn1atmlKea в пометы детенышей, полученных от самцов Scn1a +/-, скрещенных с самками C57Bl/6J, вводили вектор AAV посредством двусторонней ICV в точке P1. Мышей не оставляли без воздействия с их матерью до отлучения. Наблюдение за состоянием здоровья мышей Scn1a +/- проводили ежедневно после отлучения в P18. Мышам, которые были найдены мертвыми в своей домашней клетке по любой причине, была записана дата. Данные наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью критерия Кокса-Мантеля.
Результаты показаны в табл. 17 и на фиг. 7A-D.
Таблица 17
Обобщение условий и результатов анализа выживаемости
SEQ ID Дозировка (gc/мышь) Кол-во контрольных животных (обработ. PBS) Кол-во обработанных животных % выживших в Р100 (*в Р83) Рзначение
PBS N/A 53 N/A 49%
Конструкция 33 (фиг. 7С и 7D) 5,8Е+10 53 29 76% Р<0,05
Конструкция 31 (фиг. 7В и 7D) 6,0Е+10 53 34 97% Р<0,0001
_~ .RX
B. Гетерозиготная модель мутантной мыши Scn1a .
Чтобы проверить эффективность активаторов транскрипции в линии мышей Scn1aRX, в пометы детенышей, полученных от самцов и скрещивания ЭКО сперматозоидов Scn1aRX/+ с яйцеклетками C57Bl/6J, в эмбрионы, имплантированных самками CD-1, вводили вектор AAV (конструкция 31) при 5,1х1010 копий генома ^сУмышь или контроль PBS посредством двусторонней ICV в P1. Мышей оставляли без воздействия с их матерью до отлучения. Наблюдение за состоянием здоровья мышей Scn1a
- 117 046157
RX/+ проводили ежедневно после отлучения в P18. Мышам, которые были найдены мертвыми в своей домашней клетке по любой причине, была записана дата. Данные для обработанных конструкцией 31 (n=27) и обработанных контролем (n=18) наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью критерия Кокса-Мантеля.
Как показано на фиг. 7E, мыши Scn1aRX/+, получившие конструкцию 31, характеризовались повышенной выживаемостью по сравнению с мышами Scn1aRX/+, получавшими контрольный PBS (P<0,0001).
Пример 8.
Уровни транскрипции SCN1A у отличных от человека приматов после лечения AAV, кодирующим специфический фактор транскрипции SCN1A.
В исследовании использовали самцов яванского макака (macaca fascicularis) в возрасте от 2 до 3 лет. Животных перед включением в исследование предварительно проверяли на наличие перекрестнореактивных антител к AAV9 с помощью клеточного анализа нейтрализующих антител. AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (конструкция 33), или контроль разводили в PBS и вводили интрапаренхимально в концентрации 1,2E12 gc/животное. Для инъекций определяли три различных стереотаксических координаты в каждом полушарии, шесть участков инъекции на животное. В каждую точку вводили объем 10 мкл. Инъекции в правое полушарие были симметричны левым. Два необработанных животных использовали в качестве контроля.
Для оценки экспрессии мРНК Scn1A проводили обратную транскрипцию с последующим способом кПЦР. При вскрытии трупа через 28 дней после введения дозы срезы тканей из различных областей головного мозга (лобная кора, теменная кора, височная кора, затылочная кора, гиппокамп, продолговатый мозг, мозжечок; по 200 мг каждого) от контрольных и обработанных животных собирали в RNAlater, а затем замораживали. Вкратце, иссекали 30 мг ткани, экстрагировали РНК (с помощью мини-набора для ткани Qiagen Rneasy Lipid, номер по каталогу 1023539), преобразовывали в кДНК путем обратной транскрипции (с использованием набора для обратной транскрипции кДНК высокой емкости Applied Biosystems, номер по каталогу 4368814) и проводили кПЦР с использованием набора праймеров/зондов для Scn1A и гена домашнего хозяйства GAPDH (Applied Biosystems, номер по каталогу Rh02621745-gI FAM).
Наборы праймеров/зондов для SCNIA приведены ниже.
Таблица 18
Последовательности праймеров, использованные в примере 8
Ген SEQ ID NO Последовательность (5’-3’) Примечание
ScnlA 191 CCATGGAACTGGCTCGATTTCAC F-праймер
192 ATTGGTGGGAGGCCACTGTAT R-праймер
193 AGGCCTGAAAACCATTGTGGGAGCCCT Зонд (FAM)
Экспрессию гена Scn1A в каждом исследуемом образце определяли относительным количественным анализом (RQ) с использованием способа сравнительного Ct (ΔΟ). Этот способ измеряет разность Ct (ΔΟ0 между целевым геном и геном домашнего хозяйства, а затем сравнивает значения ΔΟ образцов для лечения с контрольными образцами.
ACt = среднее Ct целевого гена - среднее Ct гена домашнего хозяйства.
ΔΔ(ΐ = Δ(ΐ образца лечения - Δ(ΐ контрольного образца.
Относительная экспрессия (образец лечения) = 2 - ΔΔ(ΐ
Данные представлены в виде нормализованной экспрессии целевой мРНК в различных тканях головного мозга (см. фиг. 8). Как показано на фиг. 8, участки головного мозга, проксимальные к участкам интрапаренхиматозных инъекций, показали самые высокие уровни экспрессии транскрипта SCN1A.
Пример 9.
Селективная экспрессия трансгена в PV-содержащих нейронах у отличных от человека приматов после лечения AAV, имеющего селективный в отношении PV промотор и сайт связывания микроРНК.
В исследовании использовали шесть мартышек (Callithrix jacchus), которых предварительно проверяли на перекрестно-реактивные антитела к AAV9 перед включением в исследование. Двум обезьянам вводили AAV9, содержащий трансген EGFP под контролем промотора EF1alpha, двум обезьянам вводили AAV9, содержащий трансген EGFP, под контролем RE 2 (SEQ ID NO: 2), и двум обезьянам вводили AAV9, содержащий трансген EGFP под контролем RE 2 (SEQ ID NO: 2), а также содержащий сайт связывания микроРНК (SEQ ID NO: 7), расположенный между кодирующей областью EGFP и полиАхвостом. Векторы AAV9 разводили в PBS и животным вводили три внутримозговые инъекции (2 мкл каждая) в гиппокамп/энторинальную кору каждого полушария, всего 6 участков инъекции на животное. Два животных получали вектор AAV9, содержащий EF1alpha-EGFP, каждое получило общую дозу 5,8E+11 копий генома/животное, два животных получали вектор AAV9, содержащий RE 2-EGFP, каждое получило общую дозу 3,0E+11 копий генома/животное, и два животных получали вектор AAV9, содержащий RE 2 + m1-EGFP, каждое получило общую дозу 2,3E+11 копий генома/животное.
- 118 046157
Иммуногистохимию использовали для оценки селективной экспрессии парвальбумина (PV). При вскрытии трупа, через 28 дней после введения дозы, собирали срезы тканей из различных областей головного мозга. Плавающие срезы головного мозга мартышек (35 мкм) фиксировали в 4% параформальдегиде, блокировали буфером (PBS, 3% BSA, 3% ослиная сыворотка, 0,3% Triton-X 100, 0,2% Tween-20), а затем окрашивали анти-GFP (Abcam ab290) ,а затем вторичным антителом, конъюгированным с Alexa488 (Thermo A21206). За этим последовали антитело к PV (Swant) и вторичное антитело, конъюгированное с Alexa-647 (Thermo A31571) и 4',6-диамидино-2-фенилиндолом (DAPI). Срезы монтировали и визуализировали с помощью PerkinElmer Vectra3.
Результаты показаны на фиг. 9A-F и 10A-L.
Пример 10.
Биораспространение eTFSCN1A
Целью этого исследования было сравнить биораспределение eTFSCN1A в центральной нервной системе (ЦНС) молодых обезьян яванского макака при введении в дозе 4,8E+13 посредством односторонней интрацеребровентрикулярной (ICV) инъекции. Каждому животному инъецировали AAV9, содержащий кассету экспрессии, кодирующую eTFSCN1A, под контролем селективного регуляторного элемента ГАМК (GABA) (REGABA-eTFSCN1A). Частицы AAV9 составляли в PBS + 0,001% плюроновой кислоты и вводили в дозе 4,8E+13 или 8E+13 vg/животное. Каждому животному вводили 2 мл приготовленных вирусных частиц. Дизайн исследования представлен в табл. 19.
Яванских макаков в возрасте двадцать четыре месяца группировали, как указано в табл. 19. Перед началом исследования образцы крови животных исследовали на уровни титра нейтрализующих антител к AAV9 с использованием анализа титра NAb, описанного выше. Для исследования выбирали животных с низкими или отрицательными результатами на антитела. Образцы вводили посредством инъекции ICV с использованием стандартных хирургических процедур. Размороженный дозируемый материал ненадолго хранили на влажном льду и нагревали до комнатной температуры непосредственно перед дозированием. Животных анестезировали, готовили к операции и помещали в стереотаксическую рамку, совместимую с MPT (Kopf). Для определения координат цели выполняли базовую МРТ. Делали разрез и просверливали одно отверстие в черепе над целевым участком. Шприц BD объемом 3 мл, прикрепленный к набору удлинителей с микроканальным отверстием длиной 36 дюймов, подготавливали с образцом и помещали в инфузионный насос. Линию экстензии примировали. Твердую мозговую оболочку открывали, и дозирующую иглу продвигали на глубину от 13,0 до 18,1 мм от мягкой мозговой оболочки. Инъекцию контрастного вещества и рентгеноскопию использовали для подтверждения введения спинномозговой иглы в правый боковой желудочек. В иглу Quinke BD размером 3,0 дюйма 22 г для спинномозговой хирургии добавляли контраст, чтобы определить ее расположение, перед тем, как прикрепить заправленную линию экстензии и шприц. Настройки насоса составляли 0,1 мл/мин в течение 19-20 минут. Буфер вводили вручную после введения дозы, чтобы очистить линию экстензии. Иглу оставляли на месте в течение 1-2 минут после завершения инфузии, а затем иглу извлекали. Носитель и исследуемое вещество вводили один раз в день 1, и субъектов поддерживали в течение 27- или 29-дневного периода восстановления.
Таблица 19
Дизайн исследования биораспределения
Группа Пол ID Доза (VG/животное)
Группа 1 (контроль-буфер) М 21001
Ж 11501
Группа 2 (REGABA-eTFSCN1A) м 2001 4,8Е+13
ж 2501 4,8Е+13
м 3001 4,8Е+13
м 3002 8Е+13
После введения дозы за животными регулярно наблюдали на протяжении всего исследования, и периодически отбирали образцы крови. Введение eTFSCN1A не было связано с неожиданной смертностью, клиническими данными или макроскопическими наблюдениями. Животные, получившие AAV9-REgabaeTFSCN1A, выживали до запланированного вскрытия трупа на 28 ± 2 дня. Никаких клинических или поведенческих признаков, повышения температуры тела или снижения массы тела во время ежедневных или еженедельных медицинских осмотров не наблюдалось. Временное повышение печеночных трансаминаз (АЛТ и ACT) у животных, получавших AAV9-REGABA-eTFSCN1A, наблюдалось, но полностью исчезало к концу исследования без иммуномодуляции, и не было отмечено сопутствующего повышения сывороточного билирубина или щелочной фосфатазы. Ни один из других измеренных результатов клинической химии не был выдающимся. В гистопатологических исследованиях печени не сообщалось о микроскопических наблюдениях. Лейкоциты CSF были повышены при окончательном сборе по сравнению со значениями до воздействия, но сравнимы между контрольными животными и животными, получившими AAV9-REGABA-eTFSCN1A Плеоцитоза, связанного с AAV9-REGABA-eTFSCN1A, не наблюдалось. Макрообследование и подробное микрогистопатологическое исследование ненейрональных тканей у всех животных не было примечательным. Ткани включали в себя основные периферические органы (например,
- 119 046157 сердце, легкие, селезенку, печень и гонады). Макрообследования и подробная микрогистопатология нейрональных тканей не показали каких-либо заметных результатов. Ткани включали в себя головной, спинной мозг и связанные с ним межпозвонковые узлы (из шейного, грудного и поясничного отделов).
Исследования проводились тремя независимыми патологами, в том числе одним в специализированном центре невропатологии.
ICV введение AAV9 не предотвращало постдозовый иммунный ответ в сыворотке, поскольку через четыре недели после введения дозы наблюдались нейтрализующие антитела к капсиду AAV9. Однако уровни нейтрализующих антител к AAV9 в CSF оставались неизменными и сравнимыми с уровнями до введения дозы (табл. 20).
Таблица 20
Титр сывороточных NAb к AAV9
Номер субъекта Титр сывороточных NAb к AAV9 Титр NAb CSF к AAV9
До скрининга При инъециров. Через 4 недели после инъециров. При инъециров. Через 4 недели после инъециров.
21001 1:5 < 1:5 < 1:5 < 1:5 < 1:5
11501 < 1:5 < 1:5 < 1:5 < 1:5 < 1:5
2001 < 1:5 < 1:5 1:405 < 1:5 1:5
2501 < 1:5 < 1:5 1:135 < 1:5 1:5
3001 < 1:5 < 1:5 1:1215 < 1:5 < 1:5
3002 < 1:5 < 1:5 1:135 < 1:5 < 1:5
Образцы собирали через 27-29 дней после введения дозы из основных органов (желудочков сердца, долей печени, долей сердца легких, почек, селезенки, поджелудочной железы и шейных лимфатических узлов) во время плановой некроскопии. Прицельную биопсию собирали с помощью восьмимиллиметровых биопсийных щипцов и обрабатывали, как описано ниже.
Пример 11.
Биораспределение eTFSCN1A в головном мозге.
ddPCR использовали для измерения биораспределения eTFSCN1A в головном мозге. Образцы из различных областей ткани головного мозга яванского макака (FC: лобная кора; PC: теменная кора; TC: височная кора; Hip: гиппокамп; Med: продолговатый мозг; OC: затылочная кора) измеряли на количество копий вектора для оценки биораспределения eTFSCN1A под контролем селективного регуляторного элемента ГАМК (REGABA-eTFSCN1A) при введении AAV9 посредством односторонней ICV. Тканевую ДНК выделяли с помощью наборов DNeasy Blood & Tissues (Qiagen). Количество ДНК определяли и нормализовали с помощью УФ-спектрофотометра. 20 нанограмм тканевой ДНК добавляли к реакционной смеси объемом 20 микролитров вместе с ddPCR Super Mix for Probes (без dUTP) (Bio-Rad) и праймерами TaqMan и зондами, направленными против областей последовательности eTFSCN1A. Создавали капли и амплифицировали шаблоны с использованием автоматического генератора капель и термоциклера (BioRad). После этапа ПЦР планшет загружали и считывали с помощью QX2000 Droplet Reader для определения числа копий вектора в тканях. Ген обезьяньего альбумина (MfAlb) служил внутренним контролем для нормализации содержания геномной ДНК и был амплифицирован в той же реакции. Праймеры и зонды для eTFSCN1A и MfAlb представлены в табл. 21.
Таблица 21
Праймеры и зонды для eTFSCN1A и MfAlb
Название праймеров/зонда gTpSCNIA MfAlbumin Прямой праймер eypSCNlA Обратный праймер eTFSCNlA Зонд eTFSCN1A Прямой праймер MfAlb Обратный праймер MfAlb Зонд MfAlb Последовательность (5’-3') GAATGTGGGAAATCATTCAGTCGC (SEQ ID NO: 194) GC AAGTTATCCTCTCGTGAGAAGG (SEQ ID NO: 195) GCGACAACCTGGTGAGACATCAACGCACC (SEQ ID NO: 196) GCTGTTATCTCTTGTGGGCTGT (SEQ ID NO: 197) AAACTCATGGGAGCTGCCGGTT (SEQ ID NO: 198) CCACACAAATCTCTCCCTGGCATTG (SEQ ID NO: 199)
eTFSCN1A широко распределялся по всему головному мозгу при дозировке 4,8E+13 вирусных геномов на животное со средним значением 1,3-3,5 вирусных геномов/диплоидный геном (фиг. 11). Кроме того, при сравнении переноса гена по всему головному мозгу REGABA-eTFSCN1A, после дозированного вве- 120 046157 дения 4,8E+13 вирусных геномов на животное, с переносом гена через головной мозг eGFP, веденного посредством ICV в различных дозах, увеличение вирусного генома/диплоидного генома наблюдалось с увеличением дозы. Это указывает на то, что перенос гена в головном мозге происходит дозозависимым образом при введении в AAV9 через ICV.
Пример 12.
Транскрипция eTFSCN1A в головном мозге.
Транскрипцию eTFSCN1A под контролем селективного регуляторного элемента ГАМК, REGABA (REGABA-eTFSCN1A), оценивали путем измерения мРНК eTFSCN1A с использованием анализа экспрессии генов на основе ddPCR. Тканевую РНК выделяли с помощью наборов RNeasy Plus Mini (Qiagen) или RNeasy Lipid Tissue Mini (Qiagen) для тканей головного мозга. Количество РНК определяли и нормализовали с помощью УФ-спектрофотометра, а качество РНК (RIN) проверяли с помощью Bioanalyzer RNA Chip. Один микрограмм тканевой РНК использовали для обработки ДНКазой и синтеза кДНК с помощью набора для синтеза кДНК SuperScript VILO с наборами ферментов ezDNase™ (Thermo Fisher). 50 микрограммов РНК преобразовывали в кДНК. кДНК добавляли в реакционную смесь объемом 20 микролитров вместе с ddPCR Super Mix for Probes (без dUTP) (Bio-Rad) и праймерами и зондами TaqMan, направленными против областей последовательности eTFSCN1A (табл. 22). Создавали капли и амплифицировали шаблоны с использованием автоматического генератора капель и термоциклера (Bio-Rad). После ПЦР-амплификации планшет загружали и считывали с помощью QX2000 Droplet Reader, чтобы получить уровни экспрессии генов в тканях. Ген обезьяны ARFGAP2 (MfARFGAP2) (Thermo Fisher Scientific) служил эндогенным контролем для нормализации уровней экспрессии гена и был амплифицирован в той же реакции. Среднее количество транскриптов для ARFGAP2 составляло 1,85E+6 мкг РНК (фиг. 12, верхняя граница). Предел обнаружения обозначен нижней границей.
мРНК eTFSCN1A наблюдалась по всему головному мозгу у всех животных, что указывает на то, что ГАМК-селективный промотор, REGABA, был транскрипционно активен в ткани головного мозга для всех макак, получивших AAV9-REGABA-eTFSCN1A (фиг. 12). FC: лобная кора; PC: теменная кора; TC: височная кора; Hip: гиппокамп; Med: продолговатый мозг; OC: затылочная кора.
Таблица 22 и зонды областей последовательности eTFSCN1A
Название праймеров/зонда Описание Последовательность (5'-3')
eypSCNlA Прямой праймер eTFSCNlA GAATGTGGGAAATCATTCAGTCGC (SEQ Ш NO: 200)
Обратный праймер eTFSCNlA GCAAGTTATCCTCTCGTGAGAAGG (SEQ Ш NO: 201)
Зонд eTFSCN1A GCGACAACCTGGTGAGACATCAACGCACC (SEQIDNO: 202)
MSARFGAP2 Прямой, обратный праймеры, зонд Thermo Fisher (номер в каталоге: 4448491)
Пример 13.
Биораспределение и транскрипция eTFSCN1A в периферических тканях.
Число копий вектора дополнительно измеряли в различных органах для оценки трансдукции REGABA-eTFSCN1A в тканях по всему организму при введении AAV9 посредством односторонней ICV. Уровни транскрипции eTFSCN1A также измеряли с помощью ddPCR для оценки транскрипционной активности eTFSCN1A под контролем GABA-селективного регуляторного элемента REGABA в тканях по всему организму при введении в AAV9 посредством односторонней ICV. Оба способа выполняли, как в общем описано выше. Трансдукция REGABA-eTFSCN1A и транскрипция eTFSCN1A в спинном мозге (SC) и межпозвонковом узле (DRG) были сопоставимы с уровнями, наблюдаемыми в головном мозге. За исключением печени, трансдукция REGABA-eTFSCN1A была ниже в периферических тканях за пределами головного мозга (фиг. 13). Трансдукция REGABA-eTFSCN1A в печени была выше, чем в головном мозге. Транскрипция eTFSCN1A не была обнаружена в периферических тканях, включая в себя сердце, легкие и гонады. Однако уровни транскрипта eTFSCN1A в печени были сопоставимы с уровнями eTFSCN1A, измеренными в головном мозге. Кроме того, транскрипция eTFSCN1A в печени является чрезвычайно низкой, если ее нормализовать по количеству присутствующих копий вектора (приблизительно в 1000 раз ниже по сравнению с транскрипцией eTFSCN1A в головном мозге). В целом это продемонстрировало, что транскрипция eTFSCN1A под контролем ГАМК-селективного регуляторного элемента REGABA ограничена ЦНС.
- 121 046157
Перечень последовательностей <110> ИНКОУДИД ТЕРАПЬЮТИКС, ИНК.
<120> КОМПОЗИЦИИ И СПОСОБЫ СЕЛЕКТИВНОЙ РЕГУЛЯЦИИ ЭКСПРЕССИИ ГЕНОВ <130> 46482-724.601 <140>
<141>
<150> 63/008,569 <151> 2020-04-10 <150> 62/857,727 <151> 2019-06-05 <150> 62/854,238 <151> 2019-05-29 <160> 226 <170> PatentIn version 3.5 <210> 1 <211> 259 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 1 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg180 tgggaggtct atataagcag agctggtacc gtgtgtatgc tcaggggctg ggaaaggagg240 ggagggagct ccggctcag259 <210> 2 <211> 2051 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 2 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240
- 122 046157
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct g 2051
- 123 046157 <210> 3 <211> 1878 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 3 tcaacagggg gacacttggg aaagaaggat ggggacagag ccgagaggac tgttacacat 60
tagagaaaca tcagtgactg tgccagcttt ggggtagact gcacaaaagc cctgaggcag 120
cacaggcagg atccagtctg ctggtcccag gaagctaacc gtctcagaca gagcacaaag 180
caccgagaca tgtgccacaa ggcttgtgta gagaggtcag aggacagcgt acaggtccca 240
gagatcaaac tcaacctcac caggcttggc agcaagcctt taccaaccca cccccacccc 300
acccaccctg cacgcgcccc tctcccctcc ccatggtctc ccatggctat ctcacttggc 360
cctaaaatgt ttaaggatga cactggctgc tgagtggaaa tgagacagca gaagtcaaca 420
gtagatttta ggaaagccag agaaaaaggc ttgtgctgtt tttagaaagc caagggacaa 480
gctaagatag ggcccaagta atgctagtat ttacatttat ccacacaaaa cggacgggcc 540
tccgctgaac cagtgaggcc ccagacgtgc gcataaataa cccctgcgtg ctgcaccacc 600
tggggagagg gggaggacca cggtaaatgg agcgagcgca tagcaaaagg gacgcggggt 660
ccttttctct gccggtggca ctgggtagct gtggccaggt gtggtacttt gatggggccc 720
agggctggag ctcaaggaag cgtcgcaggg tcacagatct gggggaaccc cggggaaaag 780
cactgaggca aaaccgccgc tcgtctccta caatatatgg gagggggagg ttgagtacgt 840
tctggattac tcataagacc tttttttttt ccttccgggc gcaaaaccgt gagctggatt 900
tataatcgcc ctataaagct ccagaggcgg tcaggcacct gcagaggagc cccgccgctc 960
cgccgactag ctgcccccgc gagcaacggc ctcgtgattt ccccgccgat ccggtccccg 1020
cctccccact ctgcccccgc ctaccccgga gccgtgcagc cgcctctccg aatctctctc 1080
ttctcctggc gctcgcgtgc gagagggaac tagcgagaac gaggaagcag ctggaggtga 1140
cgccgggcag attacgcctg tcagggccga gccgagcgga tcgctgggcg ctgtgcagag 1200
gaaaggcggg agtgcccggc tcgctgtcgc agagccgagg tgggtaagct agcgaccacc 1260
tggacttccc agcgcccaac cgtggctttt cagccaggtc ctctcctccc gcggcttctc 1320
aaccaacccc atcccagcgc cggccaccca acctcccgaa atgagtgctt cctgccccag 1380
cagccgaagg cgctactagg aacggtaacc tgttactttt ccaggggccg tagtcgaccc 1440
gctgcccgag ttgctgtgcg actgcgcgcg cggggctaga gtgcaaggtg actgtggttc 1500
ttctctggcc aagtccgagg gagaacgtaa agatatgggc ctttttcccc ctctcacctt 1560
gtctcaccaa agtccctagt ccccggagca gttagcctct ttctttccag ggaattagcc 1620
- 124 046157
agacacaaca acgggaacca gacaccgaac cagacatgcc cgccccgtgc gccctccccg 1680
ctcgctgcct ttcctccctc ttgtctctcc agagccggat cttcaagggg agcctccgtg 1740
cccccggctg ctcagtccct ccggtgtgca ggaccccgga agtcctcccc gcacagctct 1800
cgcttctctt tgcagcctgt ttctgcgccg gaccagtcga ggactctgga cagtagaggc 1860
cccgggacga ccgagctg 1878
<210> 4 <211> 509 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 4 gccctctagg ccacctgacc aggtcccctc agtccccccc ttcccacact cccacactca60 gcccccctcc cccccccccg acccctgcag gattatcctg tctgtgttcc tgactcagcc120 tgggagccac ctgggcagca ggggccaagg gtgtcctaga agggacctgg agtccacgct180 gggccaagcc tgccctttct ccctctgtct tccgtccctg cttgcggttc tgctgaatgt240 ggttatttct ctggctcctt ttacagagaa tgctgctgct aattttatgt ggagctctga300 ggcagtgtaa ttggaagcca gacaccctgt cagcagtggg ctcccgtcct gagctgccat360 gcttcctgct ctcctcccgt cccggctcct catttcatgc agccacctgt cccagggaga420 gaggagtcac ccaggcccct cagtccgccc cttaaataag aaagcctccg ttgctcggca480 cacataccaa gcagccgctg gtgcaatct509 <210> 5 <211> 1644 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 5 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt60 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca120 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc180 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta240 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac300 catgggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac360
- 125 046157
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 420
ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga 480
ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg 540
cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cgggagtcgc tgcgttgcct 600
tcgccccgtg ccccgctccg cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 660
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 720
gtttaatgac ggctcgtttc ttttctgtgg ctgcgtgaaa gccttaaagg gctccgggag 780
ggccctttgt gcggggggga gcggctcggg gggtgcgtgc gtgtgtgtgt gcgtggggag 840
cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 900
tgtgcgctcc gcgtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 960
gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg 1020
tgtgggcgcg gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga gttgctgagc 1080
acggcccggc ttcgggtgcg gggctccgtg cggggcgtgg cgcggggctc gccgtgccgg 1140
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 1200
gctcggggga ggggcgcggc ggccccggag cgccggcggc tgtcgaggcg cggcgagccg 1260
cagccattgc cttttatggt aatcgtgcga gagggcgcag ggacttcctt tgtcccaaat 1320
ctggcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cgggcgaagc 1380
ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc 1440
gtccccttct ccatctccag cctcggggct gccgcagggg gacggctgcc ttcggggggg 1500
acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag cctctgctaa 1560
ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg ttgttgtgct 1620
gtctcatcat tttggcaaag aatt 1644
<210> 6 <211> 1335 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 6
gagtaattca tacaaaagga ctcgcccctg ccttggggaa tcccagggac cgtcgttaaa 60
ctcccactaa cgtagaaccc agagatcgct gcgttcccgc cccctcaccc gcccgctctc 120
gtcatcactg aggtggagaa gagcatgcgt gaggctccgg tgcccgtcag tgggcagagc 180
gcacatcgcc cacagtcccc gagaagttgg ggggaggggt cggcaattga accggtgcct 240
- 126 046157
agagaaggtg gcgcggggta aactgggaaa gtgatgtcgt gtactggctc cgcctttttc 300
ccgagggtgg gggagaaccg tatataagtg cagtagtcgc cgtgaacgtt ctttttcgca 360
acgggtttgc cgccagaaca caggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct 420
ttacgggtta tggcccttgc gtgccttgaa ttacttccac gcccctggct gcagtacgtg 480
attcttgatc ccgagcttcg ggttggaagt gggtgggaga gttcgaggcc ttgcgcttaa 540
ggagcccctt cgcctcgtgc ttgagttgag gcctggcttg ggcgctgggg ccgccgcgtg 600
cgaatctggt ggcaccttcg cgcctgtctc gctgctttcg ataagtctct agccatttaa 660
aatttttgat gacctgctgc gacgcttttt ttctggcaag atagtcttgt aaatgcgggc 720
caagatctgc acactggtat ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg 780
tcccagcgca catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg 840
gggtagtctc aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc 900
ccgccctggg cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg 960
cttcccggcc ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg 1020
ggtgagtcac ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac 1080
tccacggagt accgggcgcc gtccaggcac ctcgattagt tctcgagctt ttggagtacg 1140
tcgtctttag gttgggggga ggggttttat gcgatggagt ttccccacac tgagtgggtg 1200
gagactgaag ttaggccagc ttggcacttg atgtaattct ccttggaatt tgcccttttt 1260
gagtttggat tttcaggtgt cttggttcat cgtga tctcaagcct cagacagtgg ttcaaagttt ttttcttcca 1320 1335
<210> 7 <211> 214 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 7 aaagagaccg gttcactgtg acagtaaaag agaccggttc actgtgagaa tgaaagagac60 cggttcactg tgatcggaaa agagaccggt tcactgtgag cggccttgaa acccagcaga120 caatgtagct cagtagaaac ccagcagaca atgtagctga atggaaaccc agcagacaat180 gtagcttcgg agaaacccag cagacaatgt agct214 <210> 8 <211> 21 <212> РНК <213> Homo sapiens
- 127 046157 <400> 8 ucacagugaa ccggucucuu u <210> 9 <211> 21 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 9 aaagagaccg gttcactgtg a 21 <210> 10 <211> 23 <212> РНК <213> Homo sapiens <400> 10 agcuacauug ucugcugggu uuc 23 <210> 11 <211> 23 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 11 gaaacccagc agacaatgta gct 23 <210> 12 <211> 23 <212> РНК <213> Homo sapiens <400> 12 agcuacaucu ggcuacuggg ucu <210> 13 <211> 23 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 13 agacccagta gccagatgta gct 23 <210> 14 <211> 67
- 128 046157 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 14 gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc 60 actgtga 67 <210> 15 <211> 134 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 15 gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc60 actgtgagaa acccagcaga caatgtagct agacccagta gccagatgta gctaaagaga120 ccggttcact gtga134 <210> 16 <211> 62 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 16 aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtgc ggaccgcacg 60 tg 62 <210> 17 <211> 477 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 17 gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca60 gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc120 ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca180 acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg240
- 129 046157
ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg 300
ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg 360
ggtttcacca tattggccag gctggtctcc aactcctaat ctcaggtgat ctacccacct 420
tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc tgtcctt 477
<210> 18 <211> 18 <212> ДНК <213> Homo sapiens <400> 18 ctaggtcaag tgtaggag <210> 19 <211> 18 <212> ДНК <213> Homo sapiens <400> 19 acttgaccta gacagcct <210> 20 <211> 18 <212> ДНК <213> Homo sapiens <400> 20 tgaataactc attagtga <210> 21 <211> 18 <212> ДНК <213> Homo sapiens <400> 21 aaagtacatt aggctaat <210> 22 <211> 18 <212> ДНК <213> Homo sapiens <400> 22 ccagcactgg tgcttcgt <210> 23 <211> 18 <212> ДНК <213> Homo sapiens <400> 23 aaggctgtct aggtcaag
- 130 046157 <210> 24 <211> 24 <212> ДНК <213> Homo sapiens <400> 24 ctaggtcaag tgtaggagac acac <210> 25 <211> 18 <212> ДНК <213> Homo sapiens <400> 25 ggtcaagtgt aggagaca <210> 26 <211> 18 <212> ДНК <213> Homo sapiens <400> 26 caagtgtagg agacacac <210> 27 <211> 24 <212> ДНК <213> Homo sapiens <400> 27 agtgtaggag acacactgct ggcc <210> 28 <211> 18 <212> ДНК <213> Homo sapiens <400> 28 agtgtaggag acacactg <210> 29 <211> 21 <212> ДНК <213> Homo sapiens <400> 29 aggagacaca ctgctggcct g
<210> 30
<211> 18
<212> ДНК
<213> Homo
sapiens <400> 30 taggtaccat agagtgag
- 131 046157
<210> 31
<211> 18
<212> ДНК
<213> Homo sapiens
<400> 31
gaggatactg cagaggtc <210> 32 <211> 27 <212> ДНК <213> Homo sapiens <400> 32 taggtaccat agagtgaggc gaggatg <210> 33 <211> 27 <212> ДНК <213> Homo sapiens <400> 33 atagagtgag gcgaggatga agccgag <210> 34 <211> 27 <212> ДНК <213> Homo sapiens <400> 34 tgaagccgag aggatactgc agaggtc <210> 35 <211> 21 <212> ДНК <213> Homo sapiens <400> 35 aaggctgtct aggtcaagtg t <210> 36 <211> 21 <212> ДНК <213> Homo sapiens <400> 36 tgttcctcca gattaacact t <210> 37 <211> 21 <212> ДНК <213> Homo sapiens <400> 37 gatgaagccg agaggatact g
- 132 046157 <210> 38 <211> 21 <212> ДНК <213> Homo sapiens <400> 38 gctgatttgt attaggtacc a <210> 39 <211> 21 <212> ДНК <213> Homo sapiens <400> 39 agaaagctga tacagataca a <210> 40 <211> 21 <212> ДНК <213> Homo sapiens <400> 40 ggtacgggca aagatttctt g <210> 41 <211> 21 <212> ДНК <213> Homo sapiens <400> 41 agaaagctga tacagataca a <210> 42 <211> 21 <212> ДНК <213> Homo sapiens <400> 42 acacaatgag ccacctacaa g <210> 43 <211> 21 <212> ДНК <213> Homo sapiens <400> 43 gtggctcatt gtgtgtgtgc c <210> 44 <211> 21 <212> ДНК <213> Homo sapiens <400> 44 catatccctg caggttcaga a
- 133 046157 <210> 45 <211> 21 <212> ДНК <213> Homo sapiens <400> 45 agagagagag agagagagag a <210> 46 <211> 21 <212> ДНК <213> Homo sapiens <400> 46 ttctcagttt tgaaattaaa a <210> 47 <211> 21 <212> ДНК <213> Homo sapiens <400> 47 tggattctct tctgaacctg c <210> 48 <211> 21 <212> ДНК <213> Homo sapiens <400> 48 tgctgaggca ggacacagtg t <210> 49 <211> 21 <212> ДНК <213> Homo sapiens <400> 49 atcatctgta accatcaagg a <210> 50 <211> 21 <212> ДНК <213> Homo sapiens <400> 50 tcctgcctac ttagtttcaa g <210> 51 <211> 21 <212> ДНК <213> Homo sapiens <400> 51 attacagttc tgtcagcatg c
- 134 046157 <210> 52 <211> 21 <212> ДНК <213> Homo sapiens <400> 52 tggtctcatt ctttttgtgg g <210> 53 <211> 21 <212> ДНК <213> Homo sapiens <400> 53 cgatattttc atggattcct t <210> 54 <211> 21 <212> ДНК <213> Homo sapiens <400> 54 ctgacactta ctttgtctaa a <210> 55 <211> 21 <212> ДНК <213> Homo sapiens <400> 55 aaaactggaa ccgcattccc a <210> 56 <211> 21 <212> ДНК <213> Homo sapiens <400> 56 acaaagtaag tgtcagtgtg g <210> 57 <211> 21 <212> ДНК <213> Homo sapiens <400> 57 ataatagttg tgtctttata a <210> 58 <211> 21 <212> ДНК <213> Homo sapiens <400> 58 tgtacaagca gggctgcaaa g
- 135 046157 <210> 59 <211> 21 <212> ДНК <213> Homo sapiens <400> 59 gttaacaaat acactaaaca c <210> 60 <211> 21 <212> ДНК <213> Homo sapiens <400> 60 ttcaacaagc tcccaagaag t <210> 61 <211> 21 <212> ДНК <213> Homo sapiens <400> 61 atgttcaagg tgcagaagga a <210> 62 <211> 21 <212> ДНК <213> Homo sapiens <400> 62 tgtttgctca aacgtgcacc a <210> 63 <211> 21 <212> ДНК <213> Homo sapiens <400> 63 aaataagaca tgaaaacaag a <210> 64 <211> 21 <212> ДНК <213> Homo sapiens <400> 64 aaatatgtac cacaagaaat g <210> 65 <211> 21 <212> ДНК <213> Homo sapiens <400> 65 tatctggttt ctctcactgc t
- 136 046157 <210> 66 <211> 21 <212> ДНК <213> Homo sapiens <400> 66 attgcaaagc ataatttgga t <210> 67 <211> 3585 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 67 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
- 137 046157
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc 2700
catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc 2760
tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg 2820
actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat 2880
aaactagtaa agagaccggt tcactgtgac agtaaaagag accggttcac tgtgagaatg 2940
aaagagaccg gttcactgtg atcggaaaag agaccggttc actgtgagcg gccttgaaac 3000
ccagcagaca atgtagctca gtagaaaccc agcagacaat gtagctgaat ggaaacccag 3060
cagacaatgt agcttcggag aaacccagca gacaatgtag ctaagcttgg gtggcatccc 3120
tgtgacccct ccccagtgcc tctcctggcc ctggaagttg ccactccagt gcccaccagc 3180
cttgtcctaa taaaattaag ttgcatcatt ttgtctgact aggtgtcctt ctataatatt 3240
- 138 046157
atggggtgga ggggggtggt atggagcaag gggcaagttg ggaagacaac ctgtagggcc 3300
tgcggggtct attgggaacc aagctggagt gcagtggcac aatcttggct cactgcaatc 3360
tccgcctcct gggttcaagc gattctcctg cctcagcctc ccgagttgtt gggattccag 3420
gcatgcatga ccaggctcag ctaatttttg tttttttggt agagacgggg tttcaccata 3480
ttggccaggc tggtctccaa ctcctaatct caggtgatct acccaccttg gcctcccaaa 3540
ttgctgggat tacaggcgtg aaccactgct cccttccctg tcctt 3585
<210> 68 <211> 3371 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 68 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
- 139 046157 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtaa gcttgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg2940 aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt3000 ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc3060
- 140 046157
aagttgggaa gacaacctgt agggcctgcg gggtctattg ggaaccaagc tggagtgcag 3120
tggcacaatc ttggctcact gcaatctccg cctcctgggt tcaagcgatt ctcctgcctc 3180
agcctcccga gttgttggga ttccaggcat gcatgaccag gctcagctaa tttttgtttt 3240
tttggtagag acggggtttc accatattgg ccaggctggt ctccaactcc taatctcagg 3300
tgatctaccc accttggcct cccaaattgc tgggattaca ggcgtgaacc actgctccct 3360
tccctgtcct t 3371
<210> 69 <211> 4380 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 69 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
- 141 046157
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc 2700
catacgacgt accagattac gctctcgagg aggccagcgg ttccggacgg gctgacgcat 2760
tggacgattt tgatctggat atgctgggaa gtgacgccct cgatgatttt gaccttgaca 2820
tgcttggttc ggatgccctt gatgactttg acctcgacat gctcggcagt gacgcccttg 2880
atgatttcga cctggacatg ctgattaact ctagaagttc cggatctccg aaaaagaaac 2940
gcaaagttgg tagccagtac ctgcccgaca ccgacgaccg gcaccggatc gaggaaaagc 3000
ggaagcggac ctacgagaca ttcaagagca tcatgaagaa gtcccccttc agcggcccca 3060
ccgaccctag acctccacct agaagaatcg ccgtgcccag cagatccagc gccagcgtgc 3120
- 142 046157
caaaacctgc cccccagcct taccccttca ccagcagcct gagcaccatc aactacgacg 3180
agttccctac catggtgttc cccagcggcc agatctctca ggcctctgct ctggctccag 3240
cccctcctca ggtgctgcct caggctcctg ctcctgcacc agctccagcc atggtgtctg 3300
cactggctca ggcaccagca cccgtgcctg tgctggctcc tggacctcca caggctgtgg 3360
ctccaccagc ccctaaacct acacaggccg gcgagggcac actgtctgaa gctctgctgc 3420
agctgcagtt cgacgacgag gatctgggag ccctgctggg aaacagcacc gatcctgccg 3480
tgttcaccga cctggccagc gtggacaaca gcgagttcca gcagctgctg aaccagggca 3540
tccctgtggc ccctcacacc accgagccca tgctgatgga ataccccgag gccatcaccc 3600
ggctcgtgac aggcgctcag aggcctcctg atccagctcc tgcccctctg ggagcaccag 3660
gcctgcctaa tggactgctg tctggcgacg aggacttcag ctctatcgcc gatatggatt 3720
tctcagcctt gctgggctct ggcagcggca gccgggattc cagggaaggg atgtttttgc 3780
cgaagcctga ggccggctcc gctattagtg acgtgtttga gggccgcgag gtgtgccagc 3840
caaaacgaat ccggccattt catcctccag gaagtccatg ggccaaccgc ccactccccg 3900
ccagcctcgc accaacacca accggtccag tacatgagcc agtcgggtca ctgaccccgg 3960
caccagtccc tcagccactg gatccagcgc ccgcagtgac tcccgaggcc agtcacctgt 4020
tggaggatcc cgatgaagag acgagccagg ctgtcaaagc ccttcgggag atggccgata 4080
ctgtgattcc ccagaaggaa gaggctgcaa tctgtggcca aatggacctt tcccatccgc 4140
ccccaagggg ccatctggat gagctgacaa ccacacttga gtccatgacc gaggatctga 4200
acctggactc acccctgacc ccggaattga acgagattct ggataccttc ctgaacgacg 4260
agtgcctctt gcatgccatg catatcagca caggactgtc catcttcgac acatctctgt 4320
tttaaactag taataaaaga tctttatttt cattagatct gtgtgttggt tttttgtgtg 4380
<210> 70 <211> 3332 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 70 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240 gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt300
- 143 046157
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
- 144 046157
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatccgacg 2700
cgctggacga tttcgatctc gacatgctgg gttctgatgc cctcgatgac tttgacctgg 2760
atatgttggg aagcgacgca ttggatgact ttgatctgga catgctcggc tccgatgctc 2820
tggacgattt cgatctcgat atgttataaa agcttgggtg gcatccctgt gacccctccc 2880
cagtgcctct cctggccctg gaagttgcca ctccagtgcc caccagcctt gtcctaataa 2940
aattaagttg catcattttg tctgactagg tgtccttcta taatattatg gggtggaggg 3000
gggtggtatg gagcaagggg caagttggga agacaacctg tagggcctgc ggggtctatt 3060
gggaaccaag ctggagtgca gtggcacaat cttggctcac tgcaatctcc gcctcctggg 3120
ttcaagcgat tctcctgcct cagcctcccg agttgttggg attccaggca tgcatgacca 3180
ggctcagcta atttttgttt ttttggtaga gacggggttt caccatattg gccaggctgg 3240
tctccaactc ctaatctcag gtgatctacc caccttggcc tcccaaattg ctgggattac 3300
aggcgtgaac cactgctccc ttccctgtcc tt 3332
<210> 71 <211> 3546 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 71 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240 gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt300 taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc360
- 145 046157 ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420 caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg480 cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt540 ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata600 ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg660 gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg720 aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag780 agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc840 tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg900 gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag960 gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat1020 tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc1080 gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac1140 tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc1200 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280
- 146 046157
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatccgacg 2700
cgctggacga tttcgatctc gacatgctgg gttctgatgc cctcgatgac tttgacctgg 2760
atatgttggg aagcgacgca ttggatgact ttgatctgga catgctcggc tccgatgctc 2820
tggacgattt cgatctcgat atgttataaa aagagaccgg ttcactgtga cagtaaaaga 2880
gaccggttca ctgtgagaat gaaagagacc ggttcactgt gatcggaaaa gagaccggtt 2940
cactgtgagc ggccttgaaa cccagcagac aatgtagctc agtagaaacc cagcagacaa 3000
tgtagctgaa tggaaaccca gcagacaatg tagcttcgga gaaacccagc agacaatgta 3060
gctaagcttg ggtggcatcc ctgtgacccc tccccagtgc ctctcctggc cctggaagtt 3120
gccactccag tgcccaccag ccttgtccta ataaaattaa gttgcatcat tttgtctgac 3180
taggtgtcct tctataatat tatggggtgg aggggggtgg tatggagcaa ggggcaagtt 3240
gggaagacaa cctgtagggc ctgcggggtc tattgggaac caagctggag tgcagtggca 3300
caatcttggc tcactgcaat ctccgcctcc tgggttcaag cgattctcct gcctcagcct 3360
cccgagttgt tgggattcca ggcatgcatg accaggctca gctaattttt gtttttttgg 3420
tagagacggg gtttcaccat attggccagg ctggtctcca actcctaatc tcaggtgatc 3480
tacccacctt ggcctcccaa attgctggga ttacaggcgt gaaccactgc tcccttccct 3540
gtcctt 3546
<210> 72 <211> 1707 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 72 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct60 gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt120 cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct180 ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg240
- 147 046157
cctcctccag ccgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300
gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360
gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420
gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480
ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540
ggctctgtgt cctgcgccga ccacctgatg ctcgccgagg gctaccgcct ggtgcagagg 600
ccgccgtccg ccgccgccgc ccatggccct catgcgctcc ggactctgcc gccgtacgcg 660
ggcccgggcc tggacagtgg gctgaggccg cggggggctc cgctggggcc gccgccgccc 720
cgccaacccg gggccctggc gtacggggcc ttcgggccgc cgtcctcctt ccagcccttt 780
ccggccgtgc ctccgccggc cgcgggcatc gcgcacctgc agcctgtggc gacgccgtac 840
cccggccgcg ccgccgcgcc ccccaacgct ccgggaggcc ccccgggccc gcagccggcc 900
ccaagcgccg cagccccgcc gccgcccgcg cacgccctgg gcggcatgga cgccgaactc 960
atcgacgagg aggcgctgac gtcgctggag ctggagctgg ggctgcaccg cgtgcgcgag 1020
ctgcccgagc tgttcctggg ccagagcgag ttcgactgct tctcggactt ggggtccgcg 1080
ccgcccgccg gctccgtgag ctgccagtcc cagctcatca aacccagccg catgcgcaag 1140
taccccaacc ggcccagcaa gacgcccccc cacgaacgcc cttacgcttg cccagtggag 1200
tcctgtgatc gccgcttctc ccgcagcgac aacctggtga gacacatccg catccacaca 1260
ggccagaagc ccttccagtg ccgcatctgc atgagaaact tcagccgaga ggataacttg 1320
cacactcaca tccgcaccca cacaggcgaa aagcccttcg cctgcgacat ctgtggaaga 1380
aagtttgccc ggagcgatga acttgtccga cataccaaga tccacttgcg gcagaaggac 1440
cgcccttacg cttgcccagt ggagtcctgt gatcgccgct tctcccaatc agggaatctg 1500
actgagcaca tccgcatcca cacaggccag aagcccttcc agtgccgcat ctgcatgaga 1560
aacttcagca caagtggaca tctggtacgc cacatccgca cccacacagg cgaaaagccc 1620
ttcgcctgcg acatctgtgg aagaaagttt gcccagaata gtaccctgac cgaacatacc 1680
aagatccact tgcggcagaa ggacaag 1707
<210> 73 <211> 1755 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 73 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60
- 148 046157 gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120 cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180 ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg 240 cctcctccag ctgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300 gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360 gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420 gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480 ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540 ggctctgtgt cctgcggcgg cagcggcggc ggaagcggcg ccgaccacct gatgctcgcc 600 gagggctacc gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg 660 ctccggactc tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg 720 gctccgctgg ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg 780 ccgccgtcct ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac 840 ctgcagcctg tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga 900 ggccccccgg gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc 960 ctgggcggca tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag 1020 ctggggctgc accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac 1080 tgcttctcgg acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt 1140 ggtggttctg gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg 1200 cccagcaaga cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc 1260 cgcttctccc gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc 1320 ttccagtgcc gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc 1380 cgcacccaca caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg 1440 agcgatgaac ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct 1500 tgcccagtgg agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc 1560 cgcatccaca caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca 1620 agtggacatc tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac 1680 atctgtggaa gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg 1740 cggcagaagg acaag 1755 <210> 74 <211> 3438 <212> ДНК
- 149 046157 <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 74 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
- 150 046157 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag2940 accggttcac tgtgaaagct tgggtggcat ccctgtgacc cctccccagt gcctctcctg3000 gccctggaag ttgccactcc agtgcccacc agccttgtcc taataaaatt aagttgcatc3060 attttgtctg actaggtgtc cttctataat attatggggt ggaggggggt ggtatggagc3120 aaggggcaag ttgggaagac aacctgtagg gcctgcgggg tctattggga accaagctgg3180 agtgcagtgg cacaatcttg gctcactgca atctccgcct cctgggttca agcgattctc3240 ctgcctcagc ctcccgagtt gttgggattc caggcatgca tgaccaggct cagctaattt3300 ttgttttttt ggtagagacg gggtttcacc atattggcca ggctggtctc caactcctaa3360 tctcaggtga tctacccacc ttggcctccc aaattgctgg gattacaggc gtgaaccact 3420 gctcccttcc ctgtcctt3438 <210> 75 <211> 3505
- 151 046157 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 75 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
- 152 046157 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag2940 accggttcac tgtgagaaac ccagcagaca atgtagctag acccagtagc cagatgtagc3000 taaagagacc ggttcactgt gaaagcttgg gtggcatccc tgtgacccct ccccagtgcc3060 tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa taaaattaag3120 ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga ggggggtggt3180 atggagcaag gggcaagttg ggaagacaac ctgtagggcc tgcggggtct attgggaacc3240 aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct gggttcaagc3300 gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga ccaggctcag3360 ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc tggtctccaa3420 ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat tacaggcgtg3480 aaccactgct cccttccctg tcctt3505
- 153 046157 <210> 76 <211> 3804 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 76 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
- 154 046157
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccg ccgaccacct gatgctcgcc gagggctacc 2100
gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg ctccggactc 2160
tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg gctccgctgg 2220
ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg ccgccgtcct 2280
ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac ctgcagcctg 2340
tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga ggccccccgg 2400
gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc ctgggcggca 2460
tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag ctggggctgc 2520
accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac tgcttctcgg 2580
acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt ggtggttctg 2640
gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg cccagcaaga 2700
cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc cgcttctccc 2760
gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc ttccagtgcc 2820
gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc cgcacccaca 2880
caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg agcgatgaac 2940
ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct tgcccagtgg 3000
agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc cgcatccaca 3060
caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca agtggacatc 3120
tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac atctgtggaa 3180
gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg cggcagaagg 3240
acaagtaact cgaggaaacc cagcagacaa tgtagctaga cccagtagcc agatgtagct 3300
aaagagaccg gttcactgtg aaagcttggg tggcatccct gtgacccctc cccagtgcct 3360
ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat aaaattaagt 3420
tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag gggggtggta 3480
- 155 046157
tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta ttgggaacca 3540
agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg ggttcaagcg 3600
attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac caggctcagc 3660
taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct ggtctccaac 3720
tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt acaggcgtga 3780
accactgctc ccttccctgt cctt 3804
<210> 77 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 77
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 1015
Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly 20 2530
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 35 4045
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val 65 70 7580
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 9095
Cys Gly Lys Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg
100 105110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120125
Phe Ser Thr Ser Gly His Leu Val Arg His Gln Arg Thr His Thr Gly
130 135140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Asn
145 150 155160
- 156 046157
Ser Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175 <210> 78 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 78
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
5 1015
Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His ThrGly
2530
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala 35 4045
Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His LeuArg
70 7580
Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu
9095
Cys Gly Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg 100 105110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120125
Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly 130 135140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser ThrHis
145 150 155160
Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Lys Lys ThrSer
165 170175 <210> 79 <211> 176 <212> Белок <213> Искусственная последовательность
- 157 046157 <220>
<223> Описание искусственной последовательности полипептид <400> 79
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Arg Glu 45
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser 65 70 75
Gly Asn Leu Thr
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Gln Ala
160
Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser 175 <210> 80 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 80
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
- 158 046157
Phe Ser Thr Thr Gly Asn Leu Thr
Val His Gln Arg
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Thr Ser 45
Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 65 70 75
Asp Asn Leu His 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr
100 105
Glu His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Gln Arg
160
Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175 <210> 81 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 81
Leu Glu Pro Gly Glu Lys
5
Phe Ser Ser Arg Arg Thr
Glu Lys Pro Tyr Lys Cys 35
Pro Tyr Lys Cys Pro Glu 10
Cys Arg Ala His Gln Arg 25
Pro Glu Cys Gly Lys Ser 40
Cys Gly Lys Ser 15
Thr His Thr Gly 30
Phe Ser Thr Thr 45
- 159 046157
Gly Ala Leu Thr Glu His Gln Arg
55
Thr His Thr Gly
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 65 70 75
Asp Glu Leu Val 80
Arg His Gln Arg Thr His 85
Thr Gly Glu Lys Pro Tyr
Lys Cys Pro Glu
Cys Gly Lys
Ser Phe
100
Ser Arg Asn Asp Ala Leu Thr
105
Glu His Gln Arg 110
Thr His
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Thr Ser
160
His Ser Leu Thr Glu His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser 175 <210> 82 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 82
Leu Glu Pro Gly 1
Glu Lys Pro Tyr 5
Lys Cys Pro Glu 10
Cys Gly Lys Ser 15
Phe Ser Arg Lys
Asp Asn Leu Lys
Asn His Gln Arg 25
Thr His Thr Gly 30
Glu Lys Pro Tyr 35
Lys Cys Pro Glu 40
Cys Gly Lys Ser
Phe Ser Asp Pro 45
Gly Ala Leu Val 50
Arg His Gln Arg 55
Thr His Thr Gly
Glu Lys Pro Tyr
Lys Cys Pro Glu 65
Cys Gly Lys Ser 70
Phe Ser Arg Glu 75
Asp Asn Leu His 80
Thr His Gln Arg
Thr His Thr Gly
Glu Lys Pro Tyr
Lys Cys Pro Glu
- 160 046157
90
Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Arg Lys
160
Asp Asn Leu Lys Asn His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175 <210> 83 <211> 232 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 83
Leu Glu Pro Gly 1
Glu Lys Pro Tyr 5
Lys Cys Pro Glu 10
Cys Gly Lys Ser 15
Phe Ser Ser Lys 20
Lys Ala Leu Thr
Glu His Gln Arg 25
Thr His Thr Gly 30
Glu Lys Pro Tyr 35
Lys Cys Pro Glu 40
Cys Gly Lys Ser
Phe Ser Ser Pro 45
Ala Asp Leu Thr 50
Arg His Gln Arg 55
Thr His Thr Gly
Glu Lys Pro Tyr
Lys Cys Pro Glu 65
Cys Gly Lys Ser 70
Phe Ser Arg Ser 75
Asp Asn Leu Val 80
Arg His Gln Arg
Thr His Thr Gly 85
Glu Lys Pro Tyr 90
Lys Cys Pro Glu
Cys Gly Lys Ser
100
Phe Ser Arg Glu
Asp Asn Leu His 105
Thr His Gln Arg
110
Thr His Thr Gly 115
Glu Lys Pro Tyr
120
Lys Cys Pro Glu
Cys Gly Lys Ser
125
- 161 046157
Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His Thr Gly
130 135140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
145 150 155160
Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly His Leu Val
180 185190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
195 200205
Cys Gly Lys Ser Phe Ser Gln Asn Ser Thr Leu Thr Glu His Gln Arg
210 215220
Thr His Thr Gly Lys Lys Thr Ser
225230 <210> 84 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 84
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
5 1015
Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His ThrGly
2530
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 35 4045
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn LeuHis
70 7580
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu
9095
- 162 046157
Cys Gly Lys Ser Phe Ser Arg Ser
100
Asp Glu Leu Val
105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Thr Ser
160
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175 <210> 85 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 85
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Ser Pro 45
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 65 70 75
Asp Asn Leu Val 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
100 105
Thr His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser
125
- 163 046157
Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Gln Ser
160
Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175 <210> 86 <211> 232 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 86
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Arg Asn 45
Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn 65 70 75
Asp Ala Leu Thr
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Asp Pro Gly Asn Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Gln Arg
160
Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly
Glu Lys Pro Tyr
- 164 046157
165
170
175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
180 185
Ser Ser Leu Val
190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
195 200
Lys Cys Pro Glu 205
Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr
210 215 220
Asn His Gln Arg
Thr His Thr Gly Lys Lys Thr Ser
225 230 <210> 87 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 87
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Ser Pro 45
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 65 70 75
Gly Asn Leu Val
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
- 165 046157
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Arg
145 150 155 160
Thr Thr Leu Thr Asn His Gln Arg Thr His
165 170
Thr Gly Lys Lys Thr Ser
175 <210> 88 <211> 204 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 88
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
5 1015
Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His ThrGly
2530
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 35 4045
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu LeuVal
70 7580
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu
9095
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile Arg His Gln Arg 100 105110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120125
Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly 130 135140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser GlnLeu
145 150 155160
Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys ProTyr
165 170175
- 166 046157
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
180 185
Asp His Leu Thr 190
Asn His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
195 200 <210> 89 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 89
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser His Arg 45
Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 65 70 75
Asp Asn Leu His 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr
100 105
Glu His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Arg Glu
160
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175
- 167 046157 <210> 90 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 90
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln Arg
25
Синтетический
Cys Gly Lys Ser 15
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Arg Ser 45
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser 65 70 75
Gly Asp Leu Arg 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Thr Ser Gly Asn Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Arg Ser
160
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser 175 <210> 91 <211> 260 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический
- 168 046157 <400> 91
Leu Glu Pro Gly Glu Lys Pro Tyr Lys
5
Phe Ser Arg Arg Asp Glu Leu Asn Val
25
Glu Lys Pro Tyr Lys Cys Pro Glu Cys
40
Asp His Leu Thr Asn His Gln Arg Thr
55
Lys Cys Pro Glu Cys Gly Lys Ser Phe 65 70
Arg His Gln Arg Thr His Thr Gly Glu 85
Cys Gly Lys Ser Phe Ser Arg Ser Asp
100 105
Thr His Thr Gly Glu Lys Pro Tyr Lys
115 120
Phe Ser His Arg Thr Thr Leu Thr Asn
130 135
Glu Lys Pro Tyr Lys Cys Pro Glu Cys 145 150
Asp Asn Leu His Thr His Gln Arg Thr
165
Lys Cys Pro Glu Cys Gly Lys Ser Phe
180 185
Glu His Gln Arg Thr His Thr Gly Glu
195 200
Cys Gly Lys Ser Phe Ser Gln Ser Ser
210 215
Thr His Thr Gly Glu Lys Pro Tyr Lys
225 230
Phe Ser Arg Glu Asp Asn Leu His Thr
245
Pro Glu Cys Gly Lys Ser 15
Gln Arg Thr His Thr Gly 30
Lys Ser Phe Ser Arg Ser 45
Thr Gly Glu Lys Pro Tyr 60
Arg Ser Asp Asp Leu Val 75 80
Pro Tyr Lys Cys Pro Glu 95
Leu Val Arg His Gln Arg
110
Pro Glu Cys Gly Lys Ser
125
Gln Arg Thr His Thr Gly 140
Lys Ser Phe Ser Arg Glu
155 160
Thr Gly Glu Lys Pro Tyr
175
Thr Ser His Ser Leu Thr
190
Pro Tyr Lys Cys Pro Glu
205
Leu Val Arg His Gln Arg
220
Pro Glu Cys Gly Lys Ser
235 240
Gln Arg Thr His Thr Gly
255
- 169 046157
Lys Lys Thr Ser
260 <210> 92 <211> 177 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 92
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr 20 25
Gly Gln Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg 35 40
Glu Asp Asn Leu 45
His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Asp
Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu
70 75
Val Arg His Thr
Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala
90
Cys Pro Val Glu
Ser Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu
100 105
Thr Glu His Ile
110
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg
115 120
Ile Cys Met Arg 125
Asn Phe Ser Thr Ser Gly His Leu Val Arg His Ile
130 135 140
Arg Thr His Thr
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
145 150 155
Lys Phe Ala Gln
160
Asn Ser Thr Leu Thr Glu His Thr Lys Ile His Leu
165 170
Arg Gln Lys Asp
175
Lys
- 170 046157 <210> 93 <211> 177 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 93
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr 20 25
Gly Gln Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His 35 40
Arg Thr Thr Leu 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Asp
Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu 65 70 75
His Thr His Thr
Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala 85 90
Cys Pro Val Glu
Ser Cys Asp Arg Arg Phe Ser Thr Ser His Ser Leu
100 105
Thr Glu His Ile
110
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg
115 120
Ile Cys Met Arg 125
Asn Phe Ser Gln Ser Ser Ser Leu Val Arg His Ile
130 135 140
Arg Thr His Thr
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
145 150 155
Lys Phe Ala Arg
160
Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu
165 170
Arg Gln Lys Asp
175
Lys <210> 94 <211> 264 <212> Белок <213> Искусственная последовательность
- 171 046157 <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 94
Arg Pro Tyr Ala 1
Cys Pro Val Glu Ser 5
Arg Asp Glu Leu
Asn Val His Ile Arg
Phe Gln Cys Arg
Ile Cys Met Arg Asn
Thr Asn His Ile
Arg Thr His Thr Gly 55
Cys Asp Arg 10
Ile His Thr
Phe Ser Arg
Glu Lys Pro 60
Arg Phe Ser Arg 15
Gly Gln Lys Pro 30
Ser Asp His Leu 45
Phe Ala Cys Asp
Ile Cys 65
Lys Ile
Ser Cys
Arg Ile
Asn Phe
130
Gly Glu 145
Glu Asp
Arg Pro
Ser His
Phe Gln
210
Val Arg
Gly Arg
His Leu
Asp Arg
100
His Thr 115
Ser His
Lys Pro
Asn Leu
Tyr Ala
180
Ser Leu
195
Cys Arg
His Ile
Lys Phe
Arg Gln 85
Arg Phe
Gly Gln
Arg Thr
Phe Ala
150
His Thr 165
Cys Pro
Thr Glu
Ile Cys
Arg Thr
Ala Arg
Lys Asp
Ser Arg
Lys Pro
120
Thr Leu 135
Cys Asp
His Thr
Val Glu
His Ile
200
Met Arg 215
His Thr
Ser Asp
Arg Pro
Ser Asp 105
Phe Gln
Thr Asn
Ile Cys
Lys Ile
170
Ser Cys 185
Arg Ile
Asn Phe
Gly Glu
Asp Leu 75
Tyr Ala
Asn Leu
Cys Arg
His Ile
140
Gly Arg 155
His Leu
Asp Arg
His Thr
Ser Gln
220
Lys Pro
Val Arg His Thr
Cys Pro Val Glu
Val Arg His Ile
110
Ile Cys Met Arg 125
Arg Thr His Thr
Lys Phe Ala Arg
160
Arg Gln Lys Asp
175
Arg Phe Ser Thr 190
Gly Gln Lys Pro 205
Ser Ser Ser Leu
Phe Ala Cys Asp
- 172 046157
225 230 235
240
Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu
245 250
His Thr His Thr
255
Lys Ile His Leu Arg Gln Lys Asp
260 <210> 95 <211> 264 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 95
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Asp
Pro Gly Ala Leu Val Arg
His Ile Arg Ile His Thr 25
Gly Gln Lys Pro 30
Phe Gln Cys Arg Ile Cys 35
Met Arg Asn Phe Ser Arg 40
Ser Asp Asn Leu 45
Val Arg His Ile Arg Thr 50
His Thr Gly Glu Lys Pro 55 60
Phe Ala Cys Asp
Ile Cys Gly Arg Lys Phe 65 70
Ala Gln Ser Gly Asp Leu 75
Arg Arg His Thr
Lys Ile His Leu Arg Gln 85
Lys Asp Arg Pro Tyr Ala 90
Cys Pro Val Glu
Ser Cys Asp Arg Arg Phe
100
Ser Thr His Leu Asp Leu
105
Ile Arg His Ile 110
Arg Ile His Thr Gly Gln 115
Lys Pro Phe Gln Cys Arg
120
Ile Cys Met Arg 125
Asn Phe Ser Thr Ser Gly
130
Asn Leu Val Arg His Ile
135 140
Arg Thr His Thr
Gly Glu Lys Pro Phe Ala
145 150
Cys Asp Ile Cys Gly Arg
155
Lys Phe Ala Arg
160
Ser Asp Asn Leu Val Arg
165
His Thr Lys Ile His Leu 170
Arg Gln Lys Asp
175
- 173 046157
Arg Pro Tyr Ala Cys Pro
180
Val Glu Ser Cys Asp Arg
185
Arg Phe Ser Gln
190
Ser Gly His Leu Thr Glu
195
His Ile Arg Ile His Thr
200
Gly Gln Lys Pro 205
Phe Gln Cys Arg Ile Cys
210
Met Arg Asn Phe Ser Glu
215 220
Arg Ser His Leu
Arg Glu His Ile Arg Thr
225 230
His Thr Gly Glu Lys Pro
235
Phe Ala Cys Asp
240
Ile Cys Gly Arg Lys Phe
245
Ala Gln Ala Gly His Leu
250
Ala Ser His Thr
255
Lys Ile His Leu Arg Gln
260
Lys Asp <210> 96 <211> 175 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 96
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr 20 25
Gly His Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg 35 40
Glu Asp Asn Leu 45
His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Glu
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu 65 70 75
Val Arg His Ala
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro
90
Ala Glu Gly Cys
Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu
100 105
His Leu Arg Ile 110
- 174 046157
His Thr Gly His Lys Pro 115
Phe Gln Cys Arg Ile Cys
120
Met Arg Ser Phe 125
Ser Thr Ser Gly His Leu
130
Val Arg His Ile Arg Thr
135 140
His Thr Gly Glu
Lys Pro Phe Ala Cys Glu
145 150
Phe Cys Gly Arg Lys Phe
155
Ala Gln Asn Ser
160
Thr Leu Thr Glu His Ala
165
Lys Ile His Leu Lys Gln
170
Lys Glu Lys
175 <210> 97 <211> 175 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 97
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr 20 25
Gly His Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser His 35 40
Arg Thr Thr Leu 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Glu
Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu 65 70 75
His Thr His Ala
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro
90
Ala Glu Gly Cys
Asp Arg Arg Phe Ser Thr Ser His Ser Leu Thr Glu
100 105
His Leu Arg Ile 110
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys
115 120
Met Arg Ser Phe 125
Ser Gln Ser Ser Ser Leu Val Arg His Ile Arg Thr
130 135 140
His Thr Gly Glu
- 175 046157
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe
145 150 155
Ala Arg Glu Asp
160
Asn Leu His Thr His Ala Lys Ile His Leu Lys Gln
165 170
Lys Glu Lys
175 <210> 98 <211> 261 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 98
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Arg Asp Glu Leu Asn Val His Leu Arg Ile His Thr 20 25
Gly His Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg 35 40
Ser Asp His Leu 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Glu
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Asp Leu 65 70 75
Val Arg His Ala
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro
90
Ala Glu Gly Cys
Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg
100 105
His Leu Arg Ile 110
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys
115 120
Met Arg Ser Phe 125
Ser His Arg Thr Thr Leu Thr Asn His Ile Arg Thr
130 135 140
His Thr Gly Glu
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe
145 150 155
Ala Arg Glu Asp
160
Asn Leu His Thr His Ala Lys Ile His Leu Lys Gln
165 170
Lys Glu His Ala 175
Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Thr
Ser His Ser Leu
- 176 046157
180 185
190
Thr Glu His Leu Arg Ile His Thr Gly His Lys Pro
195 200
Phe Gln Cys Arg 205
Ile Cys Met Arg Ser Phe Ser Gln Ser Ser Ser Leu
210 215 220
Val Arg His Ile
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
225 230 235
Phe Cys Gly Arg
240
Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Ala
245 250
Lys Ile His Leu
255
Lys Gln Lys Glu Lys
260 <210> 99 <211> 753 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 99
Met Ala Pro Lys 1
Lys Lys Arg Lys 5
Val Gly Ile His 10
Gly Val Pro Ala 15
Ala Leu Glu Pro
Gly Glu Lys Pro
Tyr Lys Cys Pro 25
Glu Cys Gly Lys 30
Ser Phe Ser Arg
Ser Asp Asn Leu 40
Val Arg His Gln
Arg Thr His Thr 45
Gly Glu Lys Pro 50
Tyr Lys Cys Pro 55
Glu Cys Gly Lys 60
Ser Phe Ser His
Arg Thr Thr Leu 65
Thr Asn His Gln
Arg Thr His Thr 75
Gly Glu Lys Pro 80
Tyr Lys Cys Pro
Glu Cys Gly Lys 85
Ser Phe Ser Arg 90
Glu Asp Asn Leu
His Thr His Gln
100
Arg Thr His Thr
Gly Glu Lys Pro 105
Tyr Lys Cys Pro 110
Glu Cys Gly Lys
115
Ser Phe Ser Thr
120
Ser His Ser Leu
Thr Glu His Gln 125
- 177 046157
Arg Thr His Thr Gly Glu Lys Pro
130 135
Tyr Lys Cys Pro Glu Cys Gly
140
Ser Phe Ser Gln
145
Ser Ser Ser Leu Val Arg His Gln Arg Thr His
150 155
Gly Glu Lys Pro
Tyr Lys Cys Pro Glu Cys Gly Lys
165 170
Ser Phe Ser
175
Glu Asp Asn Leu His
180
Thr His Gln Arg Thr His Thr Gly Lys Lys
185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Glu
210 215 220
Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp
225 230 235
Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
245 250 255
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
260 265 270
Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly
275 280 285
Pro Lys Lys Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp Thr
290 295 300
Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr
305 310 315
Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro
325 330 335
Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser
340 345 350
Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser
355 360 365
Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln
Lys
Thr 160
Arg
Thr
Lys
Ala
Met 240
Ser
Leu
Ser
Asp
Phe 320
Arg
Val
Thr
Ile
- 178 046157
370
375
380
Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro
385 390 395
Ala Pro Ala Pro Ala
405
Pro Ala Pro Ala Met
410
Val Ser Ala Leu Ala
415
Ala Pro Ala Pro Val
420
Pro Val Leu Ala Pro
425
Gly Pro Pro Gln Ala
430
Ala Pro Pro Ala Pro
435
Lys Pro Thr Gln Ala
440
Gly Glu Gly Thr Leu 445
Glu Ala Leu Leu Gln
450
Leu Gln Phe Asp Asp
455
Glu Asp Leu Gly Ala
460
Leu Gly Asn Ser Thr 465
Asp Pro Ala Val Phe 470
Thr Asp Leu Ala Ser 475
Asp Asn Ser Glu Phe
485
Gln Gln Leu Leu Asn
490
Gln Gly Ile Pro Val
495
Pro His Thr Thr Glu
500
Pro Met Leu Met Glu
505
Tyr Pro Glu Ala Ile
510
Arg Leu Val Thr Gly 515
Ala Gln Arg Pro Pro 520
Asp Pro Ala Pro Ala 525
Leu Gly Ala Pro Gly
530
Leu Pro Asn Gly Leu
535
Leu Ser Gly Asp Glu
540
Phe Ser Ser Ile Ala 545
Asp Met Asp Phe Ser 550
Ala Leu Leu Gly Ser 555
Ser Gly Ser Arg Asp
565
Ser Arg Glu Gly Met
570
Phe Leu Pro Lys Pro
575
Ala Gly Ser Ala Ile
580
Ser Asp Val Phe Glu
585
Gly Arg Glu Val Cys
590
Pro Lys Arg Ile Arg 595
Pro Phe His Pro Pro
600
Gly Ser Pro Trp Ala 605
Arg Pro Leu Pro Ala
610
Ser Leu Ala Pro Thr
615
Pro Thr Gly Pro Val
620
Gln 400
Gln
Val
Ser
Leu
Val 480
Ala
Thr
Pro
Asp
Gly 560
Glu
Gln
Asn
His
- 179 046157
Glu Pro Val 625
Pro Ala Pro
Asp Glu Glu
Thr Val Ile 675
Leu Ser His 690
Leu Glu Ser 705
Glu Leu Asn
His Ala Met
Phe
Gly Ser Leu
630
Ala Val Thr
645
Thr Ser Gln 660
Pro Gln Lys
Pro Pro Pro
Met Thr Glu
710
Glu Ile Leu
725
His Ile Ser 740
Thr Pro Ala
Pro Glu Ala
Ala Val Lys 665
Glu Glu Ala 680
Arg Gly His 695
Asp Leu Asn
Asp Thr Phe
Thr Gly Leu
745
Pro Val Pro
635
Ser His Leu 650
Ala Leu Arg
Ala Ile Cys
Leu Asp Glu
700
Leu Asp Ser
715
Leu Asn Asp 730
Ser Ile Phe
Gln Pro Leu Asp
640
Leu Glu Asp Pro
655
Glu Met Ala Asp
670
Gly Gln Met Asp 685
Leu Thr Thr Thr
Pro Leu Thr Pro
720
Glu Cys Leu Leu
735
Asp Thr Ser Leu 750 <210> 100 <211> 753 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 100
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His
510
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 2025
Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln 3540
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys 50 5560
Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr
Синтетический
Gly Val Pro Ala 15
Glu Cys Gly Lys 30
Arg Thr His Thr 45
Ser Phe Ser Arg
Gly Glu Lys Pro
- 180 046157
70 75
Tyr Lys Cys Pro Glu 85
Cys Gly Lys Ser Phe
Ser Arg Ser Asp Glu
Val Arg His Gln Arg
100
Thr His Thr Gly Glu
105
Lys Pro Tyr Lys Cys
110
Glu Cys Gly Lys Ser 115
Phe Ser Gln Ser Gly 120
Asn Leu Thr Glu His
125
Arg Thr His Thr Gly 130
Glu Lys Pro Tyr Lys 135
Cys Pro Glu Cys Gly
140
Ser Phe Ser Thr Ser 145
Gly His Leu Val Arg 150
His Gln Arg Thr His 155
Gly Glu Lys Pro Tyr
165
Lys Cys Pro Glu Cys
170
Gly Lys Ser Phe Ser
175
Asn Ser Thr Leu Thr
180
Glu His Gln Arg Thr
185
His Thr Gly Lys Lys
190
Ser Lys Arg Pro Ala
195
Ala Thr Lys Lys Ala 200
Gly Gln Ala Lys Lys 205
Lys Gly Ser Tyr Pro
210
Tyr Asp Val Pro Asp
215
Tyr Ala Leu Glu Glu
220
Ser Gly Ser Gly Arg 225
Ala Asp Ala Leu Asp 230
Asp Phe Asp Leu Asp 235
Leu Gly Ser Asp Ala
245
Leu Asp Asp Phe Asp
250
Leu Asp Met Leu Gly
255
Asp Ala Leu Asp Asp
260
Phe Asp Leu Asp Met
265
Leu Gly Ser Asp Ala
270
Asp Asp Phe Asp Leu 275
Asp Met Leu Ile Asn 280
Ser Arg Ser Ser Gly
285
Pro Lys Lys Lys Arg 290
Lys Val Gly Ser Gln
295
Tyr Leu Pro Asp Thr
300
Asp Arg His Arg Ile 305
Glu Glu Lys Arg Lys 310
Arg Thr Tyr Glu Thr 315
Leu
Pro
Gln
Lys
Thr 160
Gln
Thr
Lys
Ala
Met 240
Ser
Leu
Ser
Asp
Phe 320
- 181 046157
Lys
Ser Ile Met Lys Lys Ser Pro
325
Phe Ser Gly Pro Thr Asp Pro
330 335
Pro Pro Pro Arg Arg Ile Ala Val Pro
340 345
Ser Arg Ser
Ser Ala Ser
350
Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser
355 360 365
Ile Asn Tyr Asp Glu
370
Phe Pro Thr Met Val
375
Phe Pro Ser Gly Gln 380
Ser Gln Ala Ser Ala 385
Leu Ala Pro Ala Pro 390
Pro Gln Val Leu Pro 395
Ala Pro Ala Pro Ala
405
Pro Ala Pro Ala Met
410
Val Ser Ala Leu Ala
415
Ala Pro Ala Pro Val
420
Pro Val Leu Ala Pro
425
Gly Pro Pro Gln Ala
430
Ala Pro Pro Ala Pro
435
Lys Pro Thr Gln Ala
440
Gly Glu Gly Thr Leu 445
Glu Ala Leu Leu Gln
450
Leu Gln Phe Asp Asp 455
Glu Asp Leu Gly Ala
460
Leu Gly Asn Ser Thr 465
Asp Pro Ala Val Phe 470
Thr Asp Leu Ala Ser 475
Asp Asn Ser Glu Phe
485
Gln Gln Leu Leu Asn
490
Gln Gly Ile Pro Val
495
Pro His Thr Thr Glu
500
Pro Met Leu Met Glu
505
Tyr Pro Glu Ala Ile
510
Arg Leu Val Thr Gly 515
Ala Gln Arg Pro Pro 520
Asp Pro Ala Pro Ala 525
Leu Gly Ala Pro Gly
530
Leu Pro Asn Gly Leu
535
Leu Ser Gly Asp Glu 540
Phe Ser Ser Ile Ala 545
Asp Met Asp Phe Ser 550
Ala Leu Leu Gly Ser 555
Ser Gly Ser Arg Asp
565
Ser Arg Glu Gly Met
570
Phe Leu Pro Lys Pro
575
Arg
Val
Thr
Ile
Gln 400
Gln
Val
Ser
Leu
Val 480
Ala
Thr
Pro
Asp
Gly 560
Glu
- 182 046157
Ala Gly Ser
Ala Ile Ser 580
Asp Val Phe
585
Glu Gly Arg
Glu Val Cys Gln 590
Pro Lys Arg 595
Arg Pro Leu 610
Ile Arg Pro
Phe His Pro
600
Pro Gly Ser
Pro Trp Ala Asn 605
Pro Ala Ser
Leu Ala Pro 615
Thr Pro Thr
620
Gly Pro Val His
Glu Pro Val 625
Gly Ser Leu
630
Thr Pro Ala
Pro Val Pro
635
Gln Pro Leu Asp
640
Pro Ala Pro
Asp Glu Glu
Thr Val Ile 675
Leu Ser His 690
Leu Glu Ser 705
Glu Leu Asn
Ala Val Thr
645
Pro Glu Ala
Ser His Leu 650
Leu Glu Asp Pro
655
His Ala Met
Phe
Thr Ser Gln 660
Pro Gln Lys
Pro Pro Pro
Met Thr Glu
710
Glu Ile Leu
725
His Ile Ser 740
Ala Val Lys
665
Ala Leu Arg
Glu Met Ala Asp
670
Glu Glu Ala
680
Ala Ile Cys
Gly Gln Met Asp 685
Arg Gly His 695
Asp Leu Asn
Asp Thr Phe
Thr Gly Leu
745
Leu Asp Glu
700
Leu Asp Ser
715
Leu Asn Asp 730
Ser Ile Phe <210> 101 <211> 272 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 101
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His
5 10
Leu Thr Thr Thr
Pro Leu Thr Pro
720
Glu Cys Leu Leu
735
Asp Thr Ser Leu 750
Синтетический
Gly Val Pro Ala 15
- 183 046157
Ala Leu Glu Pro Gly
Glu Lys Pro Tyr Lys 25
Cys Pro Glu Cys Gly 30
Ser Phe Ser Arg Ser 35
Asp Asn Leu Val Arg 40
His Gln Arg Thr His 45
Gly Glu Lys Pro Tyr 50
Lys Cys Pro Glu Cys 55
Gly Lys Ser Phe Ser 60
Arg Thr Thr Leu Thr 65
Asn His Gln Arg Thr 70
His Thr Gly Glu Lys 75
Tyr Lys Cys Pro Glu 85
Cys Gly Lys Ser Phe
Ser Arg Glu Asp Asn
His Thr His Gln Arg
100
Thr His Thr Gly Glu
105
Lys Pro Tyr Lys Cys
110
Glu Cys Gly Lys Ser 115
Phe Ser Thr Ser His
120
Ser Leu Thr Glu His
125
Arg Thr His Thr Gly 130
Glu Lys Pro Tyr Lys 135
Cys Pro Glu Cys Gly
140
Ser Phe Ser Gln Ser 145
Ser Ser Leu Val Arg 150
His Gln Arg Thr His 155
Gly Glu Lys Pro Tyr
165
Lys Cys Pro Glu Cys
170
Gly Lys Ser Phe Ser
175
Glu Asp Asn Leu His
180
Thr His Gln Arg Thr
185
His Thr Gly Lys Lys
190
Ser Lys Arg Pro Ala
195
Ala Thr Lys Lys Ala
200
Gly Gln Ala Lys Lys 205
Lys Gly Ser Tyr Pro
210
Tyr Asp Val Pro Asp
215
Tyr Ala Leu Glu Asp
220
Leu Asp Asp Phe Asp 225
Leu Asp Met Leu Gly 230
Ser Asp Ala Leu Asp 235
Phe Asp Leu Asp Met
245
Leu Gly Ser Asp Ala
250
Leu Asp Asp Phe Asp
255
Asp Met Leu Gly Ser
260
Asp Ala Leu Asp Asp
265
Phe Asp Leu Asp Met
270
Lys
Thr
His
Pro 80
Leu
Pro
Gln
Lys
Thr 160
Arg
Thr
Lys
Ala
Asp 240
Leu
Leu
- 184 046157 <210> 102 <211> 272 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 102
Met Ala Pro Lys Lys Lys Arg Lys 1 5
Val Gly Ile His Gly Val Pro Ala
15
Ala Leu Glu Pro Gly Glu Lys Pro 20
Tyr Lys Cys Pro Glu Cys Gly Lys 25 30
Ser Phe Ser Arg Ser Asp Asn Leu
40
Val Arg His Gln Arg Thr His Thr 45
Gly Glu Lys Pro Tyr Lys Cys Pro
55
Glu Cys Gly Lys Ser Phe Ser Arg 60
Glu Asp Asn Leu His Thr His Gln 65 70
Arg Thr His Thr Gly Glu Lys Pro
80
Tyr Lys Cys Pro Glu Cys Gly Lys 85
Ser Phe Ser Arg Ser Asp Glu Leu
95
Val Arg His Gln Arg Thr His Thr
100
Gly Glu Lys Pro Tyr Lys Cys Pro
105 110
Glu Cys Gly Lys Ser Phe Ser Gln
115 120
Ser Gly Asn Leu Thr Glu His Gln
125
Arg Thr His Thr Gly Glu Lys Pro
130 135
Tyr Lys Cys Pro Glu Cys Gly Lys
140
Ser Phe Ser Thr Ser Gly His Leu
145 150
Val Arg His Gln Arg Thr His Thr
155 160
Gly Glu Lys Pro Tyr Lys Cys Pro
165
Glu Cys Gly Lys Ser Phe Ser Gln
170 175
Asn Ser Thr Leu Thr Glu His Gln
180
Arg Thr His Thr Gly Lys Lys Thr 185 190
Ser Lys Arg Pro Ala Ala Thr Lys
195 200
Lys Ala Gly Gln Ala Lys Lys Lys
205
- 185 046157
Lys Gly Ser Tyr Pro Tyr
210
Asp Val Pro Asp Tyr Ala
215 220
Leu Glu Asp Ala
Leu Asp Asp Phe Asp Leu
225 230
Asp Met Leu Gly Ser Asp
235
Ala Leu Asp Asp
240
Phe Asp Leu Asp Met Leu
245
Gly Ser Asp Ala Leu Asp
250
Asp Phe Asp Leu
255
Asp Met Leu Gly Ser Asp
260
Ala Leu Asp Asp Phe Asp
265
Leu Asp Met Leu 270 <210>
<211>
<212>
103
580 Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 103
Синтетический
Met Ala Ala 1
Arg Pro Pro
Leu Pro Pro
Gly Ala Pro 50
Tyr Gly Ala 65
Pro Pro Pro
Tyr Pro Gly
Gly Pro Gln
115
Ala Leu Gly
130
Ser Leu Glu
Asp His Leu 5
Ser Ala Ala 20
Tyr Ala Gly
Leu Gly Pro
Phe Gly Pro 70
Ala Ala Gly 85
Arg Ala Ala 100
Pro Ala Pro
Gly Met Asp
Leu Glu Leu
Met Leu Ala
Ala Ala His
Pro Gly Leu 40
Pro Pro Pro 55
Pro Ser Ser
Ile Ala His
Ala Pro Pro
105
Ser Ala Ala
120
Ala Glu Leu 135
Gly Leu His
Glu Gly Tyr 10
Gly Pro His
Asp Ser Gly
Arg Gln Pro 60
Phe Gln Pro 75
Leu Gln Pro 90
Asn Ala Pro
Ala Pro Pro
Ile Asp Glu
140
Arg Val Arg
Arg Leu Val Gln 15
Ala Leu Arg Thr 30
Leu Arg Pro Arg 45
Gly Ala Leu Ala
Phe Pro Ala Val
Val Ala Thr Pro
Gly Gly Pro Pro 110
Pro Pro Ala His 125
Glu Ala Leu Thr
Glu Leu Pro Glu
- 186 046157
145
150
155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Gln Ser Gln Leu
195
Ile Lys Pro Ser Arg 200
Met Arg Lys Tyr Pro 205
Arg Pro Ser Lys Thr 210
Pro Pro His Glu Arg 215
Pro Tyr Ala Cys Pro 220
Glu Ser Cys Asp Arg 225
Arg Phe Ser Arg Ser 230
Asp Asn Leu Val Arg 235
Ile Arg Ile His Thr
245
Gly Gln Lys Pro Phe
250
Gln Cys Arg Ile Cys
255
Arg Asn Phe Ser His
260
Arg Thr Thr Leu Thr
265
Asn His Ile Arg Thr
270
Thr Gly Glu Lys Pro
275
Phe Ala Cys Asp Ile 280
Cys Gly Arg Lys Phe
285
Arg Glu Asp Asn Leu
290
His Thr His Thr Lys
295
Ile His Leu Arg Gln
300
Asp Arg Pro Tyr Ala 305
Cys Pro Val Glu Ser 310
Cys Asp Arg Arg Phe 315
Thr Ser His Ser Leu
325
Thr Glu His Ile Arg
330
Ile His Thr Gly Gln
335
Pro Phe Gln Cys Arg
340
Ile Cys Met Arg Asn
345
Phe Ser Gln Ser Ser
350
Leu Val Arg His Ile 355
Arg Thr His Thr Gly 360
Glu Lys Pro Phe Ala 365
Asp Ile Cys Gly Arg
370
Lys Phe Ala Arg Glu
375
Asp Asn Leu His Thr 380
Thr Lys Ile His Leu 385
Arg Gln Lys Asp Lys 390
Leu Glu Met Ala Asp 395
160
Ser
Ser
Asn
Val
His 240
Met
His
Ala
Lys
Ser 320
Lys
Ser
Cys
His
His 400
- 187 046157
Leu Met Leu
Ala Glu Gly
405
Tyr Arg Leu
Val Gln Arg 410
Pro Pro Ser Ala
415
Ala Ala Ala
His Gly Pro 420
His Ala Leu
425
Arg Thr Leu
Pro Pro Tyr Ala
430
Gly Pro Gly
435
Leu Asp Ser
Gly Leu Arg
440
Pro Arg Gly
Ala Pro Leu Gly 445
Pro Pro Pro
450
Pro Arg Gln
Pro Gly Ala 455
Leu Ala Tyr
460
Gly Ala Phe Gly
Pro Pro Ser 465
Ser Phe Gln
470
Pro Phe Pro
Ala Val Pro
475
Pro Pro Ala Ala
480
Gly Ile Ala
His Leu Gln
485
Pro Val Ala
Thr Pro Tyr 490
Pro Gly Arg Ala
495
Ala Ala Pro
Pro Asn Ala 500
Pro Gly Gly
505
Pro Pro Gly
Pro Gln Pro Ala
510
Pro Ser Ala
515
Ala Ala Pro
Pro Pro Pro
520
Ala His Ala
Leu Gly Gly Met 525
Asp Ala Glu
530
Leu Ile Asp
Glu Glu Ala 535
Leu Thr Ser
540
Leu Glu Leu Glu
Leu Gly Leu 545
His Arg Val
550
Arg Glu Leu
Pro Glu Leu
555
Phe Leu Gly Gln
560
Ser Glu Phe
Asp Cys Phe
565
Ser Asp Leu
Gly Ser Ala 570
Pro Pro Ala Gly
575
Ser Val Ser Cys
580 <210> 104 <211> 394 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 104
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr 1 5 10
Arg Leu Val Gln 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His
Ala Leu Arg Thr
- 188 046157
Leu Pro Pro Tyr Ala 35
Gly Pro Gly Leu Asp 40
Ser Gly Leu Arg Pro 45
Gly Ala Pro Leu Gly 50
Pro Pro Pro Pro Arg 55
Gln Pro Gly Ala Leu 60
Tyr Gly Ala Phe Gly 65
Pro Pro Ser Ser Phe 70
Gln Pro Phe Pro Ala 75
Pro Pro Pro Ala Ala
Gly Ile Ala His Leu
Gln Pro Val Ala Thr
Tyr Pro Gly Arg Ala
100
Ala Ala Pro Pro Asn
105
Ala Pro Gly Gly Pro
110
Gly Pro Gln Pro Ala
115
Pro Ser Ala Ala Ala
120
Pro Pro Pro Pro Ala
125
Ala Leu Gly Gly Met
130
Asp Ala Glu Leu Ile 135
Asp Glu Glu Ala Leu 140
Ser Leu Glu Leu Glu 145
Leu Gly Leu His Arg 150
Val Arg Glu Leu Pro 155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Gln Ser Gln Leu 195
Ile Lys Pro Ser Arg 200
Met Arg Lys Tyr Pro 205
Arg Pro Ser Lys Thr 210
Pro Pro His Glu Arg 215
Pro Tyr Ala Cys Pro 220
Glu Ser Cys Asp Arg 225
Arg Phe Ser Arg Ser 230
Asp Asn Leu Val Arg 235
Ile Arg Ile His Thr
245
Gly Gln Lys Pro Phe
250
Gln Cys Arg Ile Cys
255
Arg Asn Phe Ser His
260
Arg Thr Thr Leu Thr
265
Asn His Ile Arg Thr
270
Arg
Ala
Val 80
Pro
Pro
His
Thr
Glu 160
Ser
Ser
Asn
Val
His 240
Met
His
- 189 046157
Thr Gly Glu
275
Lys Pro Phe
Ala Cys Asp
280
Arg Glu Asp
290
Asn Leu His
Thr His Thr 295
Asp Arg Pro 305
Thr Ser His
Pro Phe Gln
Leu Val Arg
355
Asp Ile Cys
370
Thr Lys Ile 385
Tyr Ala Cys 310
Ser Leu Thr 325
Cys Arg Ile 340
His Ile Arg
Gly Arg Lys
His Leu Arg 390
Pro Val Glu
Glu His Ile
Cys Met Arg
345
Thr His Thr
360
Phe Ala Arg 375
Gln Lys Asp
Ile Cys Gly
Lys Ile His 300
Ser Cys Asp 315
Arg Ile His 330
Asn Phe Ser
Gly Glu Lys
Glu Asp Asn
380
Lys
Arg Lys Phe Ala 285
Leu Arg Gln Lys
Arg Arg Phe Ser
320
Thr Gly Gln Lys
335
Gln Ser Ser Ser
350
Pro Phe Ala Cys 365
Leu His Thr His <210> 105 <211> 580 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 105
Met Ala Ala Asp 1
His Leu Met Leu 5
Ala Glu Gly Tyr 10
Arg Leu Val Gln 15
Arg Pro Pro Ser
Ala Ala Ala Ala
His Gly Pro His 25
Ala Leu Arg Thr 30
Leu Pro Pro Tyr 35
Ala Gly Pro Gly 40
Leu Asp Ser Gly
Leu Arg Pro Arg 45
Gly Ala Pro Leu 50
Gly Pro Pro Pro 55
Pro Arg Gln Pro
Gly Ala Leu Ala
Tyr Gly Ala Phe 65
Gly Pro Pro Ser 70
Ser Phe Gln Pro
Phe Pro Ala Val
Pro Pro Pro Ala
Ala Gly Ile Ala
His Leu Gln Pro
Val Ala Thr Pro
- 190 046157
Tyr Pro Gly Arg Ala
100
Ala Ala Pro Pro Asn
105
Ala Pro Gly Gly Pro
110
Gly Pro Gln Pro Ala
115
Pro Ser Ala Ala Ala
120
Pro Pro Pro Pro Ala
125
Ala Leu Gly Gly Met
130
Asp Ala Glu Leu Ile 135
Asp Glu Glu Ala Leu 140
Ser Leu Glu Leu Glu 145
Leu Gly Leu His Arg 150
Val Arg Glu Leu Pro 155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Gln Ser Gln Leu 195
Ile Lys Pro Ser Arg 200
Met Arg Lys Tyr Pro 205
Arg Pro Ser Lys Thr
210
Pro Pro His Glu Arg 215
Pro Tyr Ala Cys Pro 220
Glu Ser Cys Asp Arg 225
Arg Phe Ser Arg Ser 230
Asp Asn Leu Val Arg 235
Ile Arg Ile His Thr
245
Gly Gln Lys Pro Phe
250
Gln Cys Arg Ile Cys
255
Arg Asn Phe Ser Arg
260
Glu Asp Asn Leu His
265
Thr His Ile Arg Thr
270
Thr Gly Glu Lys Pro
275
Phe Ala Cys Asp Ile 280
Cys Gly Arg Lys Phe
285
Arg Ser Asp Glu Leu
290
Val Arg His Thr Lys
295
Ile His Leu Arg Gln
300
Asp Arg Pro Tyr Ala 305
Cys Pro Val Glu Ser 310
Cys Asp Arg Arg Phe 315
Gln Ser Gly Asn Leu
325
Thr Glu His Ile Arg
330
Ile His Thr Gly Gln
335
Pro
His
Thr
Glu 160
Ser
Ser
Asn
Val
His 240
Met
His
Ala
Lys
Ser 320
Lys
- 191 046157
Pro Phe Gln Cys Arg Ile Cys Met Arg
340 345
Leu Val Arg His Ile Arg Thr His Thr
355 360
Asp Ile Cys Gly Arg Lys Phe Ala Gln
370 375
Thr Lys Ile His Leu Arg Gln Lys Asp
385 390
Leu Met Leu Ala Glu Gly Tyr Arg Leu
405
Ala Ala Ala His Gly Pro His Ala Leu
420 425
Gly Pro Gly Leu Asp Ser Gly Leu Arg
435 440
Pro Pro Pro Pro Arg Gln Pro Gly Ala
450 455
Pro Pro Ser Ser Phe Gln Pro Phe Pro
465 470
Gly Ile Ala His Leu Gln Pro Val Ala 485
Ala Ala Pro Pro Asn Ala Pro Gly Gly
500 505
Pro Ser Ala Ala Ala Pro Pro Pro Pro
515 520
Asp Ala Glu Leu Ile Asp Glu Glu Ala
530 535
Leu Gly Leu His Arg Val Arg Glu Leu
545 550
Ser Glu Phe Asp Cys Phe Ser Asp Leu
565
Phe Ser Thr Ser Gly His
350
Glu Lys Pro Phe Ala Cys 365
Ser Thr Leu Thr Glu His
380
Leu Glu Met Ala Asp His
395 400
Gln Arg Pro Pro Ser Ala
415
Thr Leu Pro Pro Tyr Ala
430
Arg Gly Ala Pro Leu Gly
445
Ala Tyr Gly Ala Phe Gly
460
Val Pro Pro Pro Ala Ala
475 480
Pro Tyr Pro Gly Arg Ala
495
Pro Gly Pro Gln Pro Ala
510
His Ala Leu Gly Gly Met
525
Thr Ser Leu Glu Leu Glu
540
Glu Leu Phe Leu Gly Gln
555 560
Ser Ala Pro Pro Ala Gly
575
Ser Val Ser Cys
580
- 192 046157 <210> 106 <211> 394 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 106
Met Ala Ala Asp His Leu Met Leu 1 5
Ala Glu Gly Tyr Arg Leu Val Gln
15
Arg Pro Pro Ser Ala Ala Ala Ala 20
His Gly Pro His Ala Leu Arg Thr 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly
40
Leu Asp Ser Gly Leu Arg Pro Arg 45
Gly Ala Pro Leu Gly Pro Pro Pro
55
Pro Arg Gln Pro Gly Ala Leu Ala 60
Tyr Gly Ala Phe Gly Pro Pro Ser 65 70
Ser Phe Gln Pro Phe Pro Ala Val
80
Pro Pro Pro Ala Ala Gly Ile Ala 85
His Leu Gln Pro Val Ala Thr Pro
95
Tyr Pro Gly Arg Ala Ala Ala Pro
100
Pro Asn Ala Pro Gly Gly Pro Pro
105 110
Gly Pro Gln Pro Ala Pro Ser Ala
115 120
Ala Ala Pro Pro Pro Pro Ala His
125
Ala Leu Gly Gly Met Asp Ala Glu
130 135
Leu Ile Asp Glu Glu Ala Leu Thr
140
Ser Leu Glu Leu Glu Leu Gly Leu
145 150
His Arg Val Arg Glu Leu Pro Glu
155 160
Leu Phe Leu Gly Gln Ser Glu Phe
165
Asp Cys Phe Ser Asp Leu Gly Ser
170 175
Ala Pro Pro Ala Gly Ser Val Ser
180
Cys Gly Gly Ser Gly Gly Gly Ser
185 190
Gly Gln Ser Gln Leu Ile Lys Pro
195 200
Ser Arg Met Arg Lys Tyr Pro Asn
205
- 193 046157
Arg Pro
210
Ser Lys
Thr Pro
Glu Ser 225
Cys Asp
Arg Arg
230
Ile Arg
Ile His
Thr Gly 245
Arg Asn
Phe Ser
260
Arg Glu
Pro His 215
Phe Ser
Gln Lys
Asp Asn
Glu Arg
Arg Ser
Pro Phe
250
Leu His 265
Thr Gly
Glu Lys 275
Pro Phe
Ala Cys
280
Asp Ile
Pro Tyr 220
Asp Asn 235
Gln Cys
Thr His
Cys Gly
Ala Cys Pro Val
Leu Val Arg His
240
Arg Ile Cys Met
255
Ile Arg Thr His
270
Arg Lys Phe Ala 285
Arg Ser
290
Asp Glu
Leu Val
Arg His 295
Thr Lys
Ile His
300
Leu Arg Gln Lys
Asp Arg 305
Pro Tyr
Ala Cys
310
Pro Val
Glu Ser
Cys Asp 315
Arg Arg Phe Ser
320
Gln Ser
Gly Asn
Leu Thr 325
Glu His
Ile Arg
330
Ile His
Thr Gly Gln Lys
335
Pro Phe
Gln Cys
340
Arg Ile
Cys Met
Arg Asn 345
Phe Ser
Thr Ser Gly His 350
Leu Val
Arg His 355
Ile Arg
Thr His
360
Thr Gly
Glu Lys
Pro Phe Ala Cys 365
Asp Ile
370
Cys Gly
Arg Lys
Phe Ala 375
Gln Asn
Ser Thr
380
Leu Thr Glu His
Thr Lys 385
Ile His
Leu Arg
390
Gln Lys
Asp Lys <210> 107 <211> 388 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 107
Met Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg 1 5 10
Lys Tyr Pro Asn
Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr
Ala Cys Pro Val
- 194 046157
Glu Ser Cys Asp Arg 35
Arg Phe Ser Arg Ser 40
Asp Asn Leu Val Arg 45
Ile Arg Ile His Thr 50
Gly Gln Lys Pro Phe 55
Gln Cys Arg Ile Cys 60
Arg Asn Phe Ser Arg 65
Glu Asp Asn Leu His 70
Thr His Ile Arg Thr 75
Thr Gly Glu Lys Pro
Phe Ala Cys Asp Ile
Cys Gly Arg Lys Phe
Arg Ser Asp Glu Leu
100
Val Arg His Thr Lys
105
Ile His Leu Arg Gln
110
Asp Arg Pro Tyr Ala 115
Cys Pro Val Glu Ser 120
Cys Asp Arg Arg Phe 125
Gln Ser Gly Asn Leu
130
Thr Glu His Ile Arg
135
Ile His Thr Gly Gln
140
Pro Phe Gln Cys Arg 145
Ile Cys Met Arg Asn 150
Phe Ser Thr Ser Gly 155
Leu Val Arg His Ile
165
Arg Thr His Thr Gly
170
Glu Lys Pro Phe Ala
175
Asp Ile Cys Gly Arg
180
Lys Phe Ala Gln Asn
185
Ser Thr Leu Thr Glu
190
Thr Lys Ile His Leu 195
Arg Gln Lys Asp Lys
200
Leu Glu Met Ala Asp
205
Leu Met Leu Ala Glu
210
Gly Tyr Arg Leu Val
215
Gln Arg Pro Pro Ser
220
Ala Ala Ala His Gly 225
Pro His Ala Leu Arg 230
Thr Leu Pro Pro Tyr 235
Gly Pro Gly Leu Asp
245
Ser Gly Leu Arg Pro
250
Arg Gly Ala Pro Leu
255
Pro Pro Pro Pro Arg
260
Gln Pro Gly Ala Leu
265
Ala Tyr Gly Ala Phe
270
His
Met
His 80
Ala
Lys
Ser
Lys
His 160
Cys
His
His
Ala
Ala 240
Gly
Gly
- 195 046157
Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro
275 280
Pro Pro Ala Ala 285
Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr
290 295 300
Pro Gly Arg Ala
Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly
305 310 315
Pro Gln Pro Ala
320
Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala
325 330
Leu Gly Gly Met
335
Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser
340 345
Leu Glu Leu Glu
350
Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu
355 360
Phe Leu Gly Gln 365
Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala
370 375 380
Pro Pro Ala Gly
Ser Val Ser Cys 385 <210> 108 <211> 479 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 108
Met Gln Ser Gln 1
Leu Ile Lys Pro 5
Ser Arg Met Arg 10
Lys Tyr Pro Asn 15
Arg Pro Ser Lys
Thr Pro Pro His
Glu Arg Pro Tyr 25
Ala Cys Pro Val 30
Glu Ser Cys Asp 35
Arg Arg Phe Ser 40
Arg Ser Asp Asn
Leu Val Arg His 45
Ile Arg Ile His 50
Thr Gly Gln Lys 55
Pro Phe Gln Cys 60
Arg Ile Cys Met
Arg Asn Phe Ser 65
Arg Glu Asp Asn 70
Leu His Thr His
Ile Arg Thr His
Thr Gly Glu Lys
Pro Phe Ala Cys
Asp Ile Cys Gly
Arg Lys Phe Ala
- 196 046157
90 95
Arg
Asp
Gln
Pro 145
Leu
Asp
Thr
Glu
Gly 225
Gln
Phe
Asn
Gly
Ser 305
Ala
Ser Asp Glu Leu Val
100
Arg His Thr Lys Ile 105
His Leu Arg Gln Lys 110
Arg Pro Tyr Ala Cys 115
Pro Val Glu Ser Cys
120
Asp Arg Arg Phe Ser 125
Ser Gly Asn Leu Thr 130
Glu His Ile Arg Ile 135
His Thr Gly Gln Lys 140
Phe Gln Cys Arg Ile
150
Cys Met Arg Asn Phe
155
Ser Thr Ser Gly His
160
Val Arg His Ile Arg
165
Thr His Thr Gly Glu
170
Lys Pro Phe Ala Cys
175
Ile Cys Gly Arg Lys
180
Phe Ala Gln Asn Ser
185
Thr Leu Thr Glu His
190
Lys Ile His Leu Arg
195
Gln Lys Asp Lys Leu
200
Glu Met Ser Gly Leu 205
Met Ala Asp His Met 210
Met Ala Met Asn His 215
Gly Arg Phe Pro Asp 220
Thr Asn Gly Leu His
230
His His Pro Ala His
235
Arg Met Gly Met Gly
240
Phe Pro Ser Pro His
245
His His Gln Gln Gln
250
Gln Pro Gln His Ala
255
Asn Ala Leu Met Gly 260
Ala Thr Ser Gly Ile 275
Gly His Pro Pro Ser 290
Gln Phe Met Gly Pro
310
Ser Met Gln Leu Gln
325
Glu His Ile His Tyr 265
Gly Ala Gly Asn Met 270
Arg His Ala Met Gly 280
Ala Leu Ala Pro Ala 295
Pro Val Ala Ser Gln
315
Lys Leu Asn Asn Gln
330
Pro Gly Thr Val Asn
285
Ala Arg Phe Asn Asn 300
Gly Gly Ser Leu Pro
320
Tyr Phe Asn His His
335
- 197 046157
Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
340 345
Pro Ala Ala Gly
350
His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
355 360
Cys Asn Pro Lys 365
His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
370 375 380
Gly Ser Ser Thr
Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
385 390 395
Gly Ser Ser Asn
400
Ser Gly Gly Gly
Ser Gly Ser Gly Asn Met Pro Ala
405 410
Ser Val Ala His
415
Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
420 425
Thr Asp Phe Ile 430
Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
435 440
Gly Leu Asp Arg 445
Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
450 455 460
Glu Phe Asp Phe
Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
465 470 475
Val Ser Cys <210> 109 <211> 476 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 109
Met Ser Gly Leu 1
Glu Met Ala Asp 5
His Met Met Ala
Met Asn His Gly 15
Arg Phe Pro Asp
Gly Thr Asn Gly
Leu His His His 25
Pro Ala His Arg 30
Met Gly Met Gly 35
Gln Phe Pro Ser
Pro His His His
Gln Gln Gln Gln 45
Pro Gln His Ala 50
Phe Asn Ala Leu
Met Gly Glu His
Ile His Tyr Gly
Ala Gly Asn Met
Asn Ala Thr Ser
Gly Val Arg His
Ala Met Gly Pro
- 198 046157
Gly
Arg
Gly
Phe
Pro 145
Cys
Gly
Gly
Ser
Thr 225
Gly
Glu
Val
Pro
Pro 305
75 80
Thr Val Asn Gly Gly
Phe Asn Asn Ser Gln
100
Ser Leu Pro Ala Ser
115
Asn His His Pro Tyr 130
Ala Ala Gly His Gln
150
Asn Pro Lys His Ser
165
Ser Ser Thr Pro Gly 180
Ser Ser Asn Ser Gly
195
Val Ala His Val Pro 210
Asp Phe Ile Asp Glu
230
Leu Asp Arg Ile Lys
245
Phe Asp Phe Met Thr 260
Ser Cys Gln Ser Gln
275
Asn Arg Pro Ser Lys 290
Val Glu Ser Cys Asp
310
His Pro Pro Ser Ala
Phe Met Gly Pro Pro 105
Met Gln Leu Gln Lys
120
Pro His Asn His Tyr 135
Met Asn Gly Thr Asn
155
Gly Gly Ser Ser Thr
170
Gly Ser Gly Ser Ser 185
Gly Gly Ser Gly Ser 200
Ala Ala Met Leu Pro 215
Glu Val Leu Met Ser
235
Glu Leu Pro Glu Leu
250
Asp Phe Val Cys Lys 265
Leu Ile Lys Pro Ser 280
Thr Pro Pro His Glu 295
Arg Arg Phe Ser Arg
315
Leu Ala Pro Ala Ala
Val Ala Ser Gln Gly
110
Leu Asn Asn Gln Tyr
125
Met Pro Asp Leu His 140
Gln His Phe Arg Asp
160
Pro Gly Gly Ser Gly
175
Ser Gly Gly Gly Ala
190
Gly Asn Met Pro Ala 205
Pro Asn Val Ile Asp 220
Leu Val Ile Glu Met
240
Trp Leu Gly Gln Asn
255
Gln Gln Pro Ser Arg 270
Arg Met Arg Lys Tyr
285
Arg Pro Tyr Ala Cys 300
Ser Asp Asn Leu Val
320
- 199 046157
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
325 330
Phe
Gln Cys Arg Ile
335
Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His
340 345
Thr His Ile Arg
350
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
355 360
Cys Gly Arg Lys 365
Phe Ala Arg Ser Asp Glu Leu Val Arg His
370 375
Thr Lys
380
Ile His Leu Arg
Gln Lys Asp 385
Arg Pro Tyr
390
Phe Ser Gln
Ser Gly Asn
405
Gln Lys Pro
Phe Gln Cys 420
Gly His Leu
435
Val Arg His
Ala Cys Asp
450
Ile Cys Gly
Glu His Thr 465
Lys Ile His
470
Ala Cys Pro
Leu Thr Glu
Arg Ile Cys 425
Ile Arg Thr 440
Arg Lys Phe 455
Leu Arg Gln
Val Glu Ser
395
His Ile Arg 410
Met Arg Asn
His Thr Gly
Ala Gln Asn
460
Lys Asp Lys
475 <210> 110 <211> 554 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 110
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr
5 10
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His 20 25
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly 35 40
Cys Asp Arg Arg
400
Ile His Thr Gly 415
Phe Ser Thr Ser
430
Glu Lys Pro Phe 445
Ser Thr Leu Thr
Синтетический
Arg Leu Val Gln 15
Ala Leu Arg Thr 30
Leu Arg Pro Arg 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro
Gly Ala Leu Ala
- 200 046157
55 60
Tyr 65
Pro
Tyr
Gly
Ala
Ser 145
Leu
Ala
Gly
Arg
Pro 225
Leu
Glu
Ala
Cys
Gly Ala Phe Gly Pro Pro 70
Ser Ser Phe Gln Pro Phe Pro Ala Val
80
Pro Pro Ala Ala Gly Ile Ala His 85
Leu Gln Pro Val Ala Thr Pro
95
Pro Gly Arg Ala Ala
100
Pro Gln Pro Ala Pro
115
Leu Gly Gly Met Asp 130
Leu Glu Leu Glu Leu
150
Phe Leu Gly Gln Ser
165
Pro Pro Ala Gly Ser
180
Arg Pro His Ala Cys 195
Ser Asp Asn Leu Val 210
Phe Gln Cys Arg Ile
230
His Thr His Ile Arg
245
Phe Cys Gly Arg Lys 260
Lys Ile His Leu Lys 275
Asp Arg Arg Phe Ser 290
Ala Pro Pro Asn Ala
105
Pro Gly Gly Pro Pro
110
Ser Ala Ala Ala Pro
120
Pro Pro Pro Ala His
125
Ala Glu Leu Ile Asp 135
Glu Glu Ala Leu Thr 140
Gly Leu His Arg Val
155
Glu Phe Asp Cys Phe
170
Val Ser Cys Gly Gly
185
Pro Ala Glu Gly Cys 200
Arg His Leu Arg Ile 215
Cys Met Arg Ser Phe
235
Thr His Thr Gly Glu
250
Phe Ala Arg Ser Asp
265
Gln Lys Glu His Ala
280
Gln Ser Gly Asn Leu 295
Arg Glu Leu Pro Glu
160
Ser Asp Leu Gly Ser
175
Ser Gly Gly Gly Ser
190
Asp Arg Arg Phe Ser 205
His Thr Gly His Lys 220
Ser Arg Glu Asp Asn
240
Lys Pro Phe Ala Cys
255
Glu Leu Val Arg His 270
Cys Pro Ala Glu Gly
285
Thr Glu His Leu Arg 300
- 201 046157
Ile His Thr Gly His 305
Lys Pro Phe Gln Cys 310
Arg Ile Cys Met Arg 315
Phe Ser Thr Ser Gly
325
His Leu Val Arg His
330
Ile Arg Thr His Thr
335
Glu Lys Pro Phe Ala
340
Cys Glu Phe Cys Gly
345
Arg Lys Phe Ala Gln
350
Ser Thr Leu Thr Glu
355
His Ala Lys Ile His 360
Leu Lys Gln Lys Glu 365
Leu Glu Met Ala Asp
370
His Leu Met Leu Ala
375
Glu Gly Tyr Arg Leu 380
Gln Arg Pro Pro Ser 385
Ala Ala Ala Ala His 390
Gly Pro His Ala Leu 395
Thr Leu Pro Pro Tyr
405
Ala Gly Pro Gly Leu
410
Asp Ser Gly Leu Arg
415
Arg Gly Ala Pro Leu
420
Gly Pro Pro Pro Pro
425
Arg Gln Pro Gly Ala
430
Ala Tyr Gly Ala Phe 435
Gly Pro Pro Ser Ser 440
Phe Gln Pro Phe Pro
445
Val Pro Pro Pro Ala
450
Ala Gly Ile Ala His 455
Leu Gln Pro Val Ala
460
Pro Tyr Pro Gly Arg 465
Ala Ala Ala Pro Pro 470
Asn Ala Pro Gly Gly 475
Pro Gly Pro Gln Pro
485
Ala Pro Ser Ala Ala
490
Ala Pro Pro Pro Pro
495
His Ala Leu Gly Gly
500
Met Asp Ala Glu Leu
505
Ile Asp Glu Glu Ala
510
Thr Ser Leu Glu Leu
515
Glu Leu Gly Leu His 520
Arg Val Arg Glu Leu 525
Glu Leu Phe Leu Gly
530
Gln Ser Glu Phe Asp 535
Cys Phe Ser Asp Leu
540
Ser 320
Gly
Asn
Lys
Val
Arg 400
Pro
Leu
Ala
Thr
Pro 480
Ala
Leu
Pro
Gly
Ser Ala Pro Pro Ala 545
Gly Ser Val Ser Cys 550
- 202 046157 <210> 111 <211> 362 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 111
Met Arg Pro His Ala Cys 1 5
Pro Ala Glu Gly Cys Asp 10
Arg Arg Phe Ser 15
Arg Ser Asp Asn Leu Val 20
Arg His Leu Arg Ile His 25
Thr Gly His Lys 30
Pro Phe Gln Cys Arg Ile 35
Cys Met Arg Ser Phe Ser 40
Arg Glu Asp Asn 45
Leu His Thr His Ile Arg 50
Thr His Thr Gly Glu Lys 55 60
Pro Phe Ala Cys
Glu Phe Cys Gly Arg Lys 65 70
Phe Ala Arg Ser Asp Glu 75
Leu Val Arg His
Ala Lys Ile His Leu Lys 85
Gln Lys Glu His Ala Cys 90
Pro Ala Glu Gly
Cys Asp Arg Arg Phe Ser
100
Gln Ser Gly Asn Leu Thr
105
Glu His Leu Arg 110
Ile His Thr Gly His Lys 115
Pro Phe Gln Cys Arg Ile
120
Cys Met Arg Ser 125
Phe Ser Thr Ser Gly His
130
Leu Val Arg His Ile Arg
135 140
Thr His Thr Gly
Glu Lys Pro Phe Ala Cys
145 150
Glu Phe Cys Gly Arg Lys
155
Phe Ala Gln Asn
160
Ser Thr Leu Thr Glu His
165
Ala Lys Ile His Leu Lys
170
Gln Lys Glu Lys 175
Leu Glu Met Ala Asp His
180
Leu Met Leu Ala Glu Gly
185
Tyr Arg Leu Val 190
Gln Arg Pro Pro Ser Ala
195
Ala Ala Ala His Gly Pro 200
His Ala Leu Arg 205
- 203 046157
Thr Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser
210 215 220
Gly Leu Arg Pro
Arg Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln
225 230 235
Pro Gly Ala Leu
240
Ala Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln
245 250
Pro Phe Pro Ala
255
Val Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln
260 265
Pro Val Ala Thr
270
Pro Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala
275 280
Pro Gly Gly Pro 285
Pro Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro
290 295 300
Pro Pro Pro Ala
His Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp
305 310 315
Glu Glu Ala Leu
320
Thr Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val
325 330
Arg Glu Leu Pro
335
Glu Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe
340 345
Ser Asp Leu Gly
350
Ser Ala Pro Pro Ala Gly Ser Val Ser Cys
355 360 <210> 112 <211> 479 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 112
Met Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp
510
Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile His 2025
Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser 3540
Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys
Синтетический
Arg Arg Phe Ser 15
Thr Gly His Lys 30
Arg Glu Asp Asn 45
Pro Phe Ala Cys
- 204 046157
55 60
Glu Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg 65 70 75
Ala Lys Ile His Leu
Lys Gln Lys Glu His
Ala Cys Pro Ala Glu
Cys Asp Arg Arg Phe
100
Ser Gln Ser Gly Asn
105
Leu Thr Glu His Leu
110
Ile His Thr Gly His 115
Lys Pro Phe Gln Cys
120
Arg Ile Cys Met Arg 125
Phe Ser Thr Ser Gly
130
His Leu Val Arg His
135
Ile Arg Thr His Thr 140
Glu Lys Pro Phe Ala 145
Cys Glu Phe Cys Gly 150
Arg Lys Phe Ala Gln 155
Ser Thr Leu Thr Glu
165
His Ala Lys Ile His
170
Leu Lys Gln Lys Glu
175
Lys Ala Glu Lys Gly
180
Gly Ala Pro Ser Ala
185
Ser Ser Ala Pro Pro
190
Ser Leu Ala Pro Val
195
Val Thr Thr Cys Ala
200
Leu Glu Met Ser Gly
205
Glu Met Ala Asp His 210
Met Met Ala Met Asn
215
His Gly Arg Phe Pro
220
Gly Thr Asn Gly Leu 225
His His His Pro Ala 230
His Arg Met Gly Met 235
Gln Phe Pro Ser Pro
245
His His His Gln Gln
250
Gln Gln Pro Gln His
255
Phe Asn Ala Leu Met
260
Gly Glu His Ile His
265
Tyr Gly Ala Gly Asn
270
Asn Ala Thr Ser Gly
275
Ile Arg His Ala Met 280
Gly Pro Gly Thr Val 285
Gly Gly His Pro Pro
290
Ser Ala Leu Ala Pro
295
Ala Ala Arg Phe Asn
300
His 80
Gly
Arg
Ser
Gly
Asn 160
Lys
Val
Leu
Asp
Gly 240
Ala
Met
Asn
Asn
- 205 046157
Ser Gln Phe Met Gly Pro Pro Val Ala Ser Gln Gly
305 310 315
Gly Ser Leu Pro
320
Ala Ser Met Gln Leu Gln Lys Leu Asn Asn Gln Tyr
325 330
Phe Asn His His
335
Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
340 345
Pro Ala Ala Gly
350
His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
355 360
Cys Asn Pro Lys 365
His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
370 375 380
Gly Ser Ser Thr
Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
385 390 395
Gly Ser Ser Asn
400
Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala
405 410
Ser Val Ala His
415
Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
420 425
Thr Asp Phe Ile
430
Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
435 440
Gly Leu Asp Arg 445
Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
450 455 460
Glu Phe Asp Phe
Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
465 470 475
Val Ser Cys <210> 113 <211> 476 <212> Белок <213>
Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический <400>
Met 1
Arg полипептид
113
Ser
Phe
Gly
Pro
Leu
Glu 5
Met
Ala
Asp
His
Met 10
Met
Ala
Met Asn His Gly 15
Asp 20
Gly
Thr
Asn
Gly
Leu 25
His
His
His
Pro Ala His Arg 30
Met
Gly
Met
Gly
Gln
Phe
Pro
Ser
Pro
His
His
His
Gln Gln Gln Gln
- 206 046157
40 45
Pro
Ala 65
Gly
Arg
Gly
Phe
Pro 145
Cys
Gly
Gly
Ser
Thr 225
Gly
Glu
Val
Gln His Ala Phe Asn 50
Gly Asn Met Asn Ala
Thr Val Asn Gly Gly
Phe Asn Asn Ser Gln
100
Ser Leu Pro Ala Ser
115
Asn His His Pro Tyr 130
Ala Ala Gly His Gln
150
Asn Pro Lys His Ser
165
Ser Ser Thr Pro Gly 180
Ser Ser Asn Ser Gly
195
Val Ala His Val Pro 210
Asp Phe Ile Asp Glu
230
Leu Asp Arg Ile Lys
245
Phe Asp Phe Met Thr 260
Ser Cys Arg Pro His
275
Ala Leu Met Gly Glu 55
Thr Ser Gly Val Arg 75
His Pro Pro Ser Ala
Phe Met Gly Pro Pro 105
Met Gln Leu Gln Lys
120
Pro His Asn His Tyr 135
Met Asn Gly Thr Asn
155
Gly Gly Ser Ser Thr
170
Gly Ser Gly Ser Ser 185
Gly Gly Ser Gly Ser
200
Ala Ala Met Leu Pro 215
Glu Val Leu Met Ser
235
Glu Leu Pro Glu Leu
250
Asp Phe Val Cys Lys 265
Ala Cys Pro Ala Glu
280
His Ile His Tyr Gly 60
His Ala Met Gly Pro
Leu Ala Pro Ala Ala
Val Ala Ser Gln Gly
110
Leu Asn Asn Gln Tyr
125
Met Pro Asp Leu His 140
Gln His Phe Arg Asp
160
Pro Gly Gly Ser Gly
175
Ser Gly Gly Gly Ala
190
Gly Asn Met Pro Ala
205
Pro Asn Val Ile Asp 220
Leu Val Ile Glu Met
240
Trp Leu Gly Gln Asn
255
Gln Gln Pro Ser Arg 270
Gly Cys Asp Arg Arg
285
- 207 046157
Phe Ser Arg
290
Ser Asp Asn
Leu Val Arg 295
His Leu Arg
300
Ile His Thr Gly
His Lys Pro 305
Phe Gln Cys
310
Arg Ile Cys
Met Arg Ser
315
Phe Ser Arg Glu
320
Asp Asn Leu
His Thr His
325
Ile Arg Thr
His Thr Gly 330
Glu Lys Pro Phe
335
Ala Cys Glu
Phe Cys Gly 340
Arg Lys Phe
345
Ala Arg Ser
Asp Glu Leu Val
350
Arg His Ala
355
Lys Ile His
Leu Lys Gln
360
Lys Glu His
Ala Cys Pro Ala 365
Glu Gly Cys
370
Asp Arg Arg
Phe Ser Gln 375
Ser Gly Asn
380
Leu Thr Glu His
Leu Arg Ile 385
His Thr Gly
390
His Lys Pro
Phe Gln Cys
395
Arg Ile Cys Met
400
Arg Ser Phe
Ser Thr Ser
405
Gly His Leu
Val Arg His 410
Ile Arg Thr His 415
Thr Gly Glu
Lys Pro Phe 420
Ala Cys Glu
425
Phe Cys Gly
Arg Lys Phe Ala
430
Gln Asn Ser
435
Thr Leu Thr
Glu His Ala
440
Lys Ile His
Leu Lys Gln Lys 445
Glu Lys Lys
450
Ala Glu Lys
Gly Gly Ala 455
Pro Ser Ala
460
Ser Ser Ala Pro
Pro Val Ser 465
Leu Ala Pro
470
Val Val Thr
Thr Cys Ala
475 <210> 114 <211> 559 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 114
Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr 1 5 10
Met Ser Ser Leu
Leu Asn Gln Leu Pro Asp Asn Leu Tyr Pro Glu Glu
Ile Pro Ser Ala
- 208 046157
Leu Asn Leu Phe Ser
Gly Ser Ser Asp Ser 40
Val Val His Tyr Asn 45
Met Ala Thr Glu Asn
Val Met Asp Ile Gly 55
Leu Thr Asn Glu Lys 60
Asn Pro Glu Leu Ser 65
Tyr Ser Gly Ser Phe 70
Gln Pro Ala Pro Gly 75
Lys Thr Val Thr Tyr
Leu Gly Lys Phe Ala
Phe Asp Ser Pro Ser
Trp Cys Gln Asp Asn
100
Ile Ile Ser Leu Met
105
Ser Ala Gly Ile Leu
110
Val Pro Pro Ala Ser
115
Gly Ala Leu Ser Thr 120
Gln Thr Ser Thr Ala
125
Met Val Gln Pro Pro
130
Gln Gly Asp Val Glu
135
Ala Met Tyr Pro Ala 140
Pro Pro Tyr Ser Asn 145
Cys Gly Asp Leu Tyr 150
Ser Glu Pro Val Ser 155
His Asp Pro Gln Gly
165
Asn Pro Gly Leu Ala
170
Tyr Ser Pro Gln Asp
175
Gln Ser Ala Lys Pro
180
Ala Leu Asp Ser Asn
185
Leu Phe Pro Met Ile
190
Asp Tyr Asn Leu Tyr 195
His His Pro Asn Asp
200
Met Gly Ser Ile Pro 205
His Lys Pro Phe Gln
210
Gly Met Asp Pro Ile 215
Arg Val Asn Pro Pro 220
Ile Thr Pro Leu Glu 225
Thr Ile Lys Ala Phe 230
Lys Asp Lys Gln Ile 235
Pro Gly Phe Gly Ser
245
Leu Pro Gln Pro Pro
250
Leu Thr Leu Lys Pro
255
Arg Pro Arg Lys Tyr
260
Pro Asn Arg Pro Ser
265
Lys Thr Pro Leu His
270
Gln
Pro
Asn 80
Asn
Gly
Ser
Leu
Phe 160
Tyr
Pro
Glu
Pro
His 240
Ile
Glu
- 209 046157
Arg Pro His Ala Cys 275
Pro Ala Glu Gly Cys 280
Asp Arg Arg Phe Ser 285
Arg Asp Glu Leu Asn
290
Val His Leu Arg Ile
295
His Thr Gly His Lys 300
Phe Gln Cys Arg Ile 305
Cys Met Arg Ser Phe 310
Ser Arg Ser Asp His 315
Thr Asn His Ile Arg
325
Thr His Thr Gly Glu
330
Lys Pro Phe Ala Cys
335
Phe Cys Gly Arg Lys
340
Phe Ala Arg Ser Asp
345
Asp Leu Val Arg His
350
Lys Ile His Leu Lys 355
Gln Lys Glu His Ala 360
Cys Pro Ala Glu Gly
365
Asp Arg Arg Phe Ser
370
Arg Ser Asp Asn Leu
375
Val Arg His Leu Arg
380
His Thr Gly His Lys 385
Pro Phe Gln Cys Arg 390
Ile Cys Met Arg Ser 395
Ser His Arg Thr Thr
405
Leu Thr Asn His Ile
410
Arg Thr His Thr Gly
415
Lys Pro Phe Ala Cys
420
Glu Phe Cys Gly Arg
425
Lys Phe Ala Arg Glu
430
Asn Leu His Thr His
435
Ala Lys Ile His Leu 440
Lys Gln Lys Glu His 445
Cys Pro Ala Glu Gly
450
Cys Asp Arg Arg Phe
455
Ser Thr Ser His Ser
460
Thr Glu His Leu Arg 465
Ile His Thr Gly His 470
Lys Pro Phe Gln Cys 475
Ile Cys Met Arg Ser
485
Phe Ser Gln Ser Ser
490
Ser Leu Val Arg His
495
Arg Thr His Thr Gly
500
Glu Lys Pro Phe Ala
505
Cys Glu Phe Cys Gly
510
Lys Phe Ala Arg Glu
515
Asp Asn Leu His Thr 520
His Ala Lys Ile His 525
Arg
Pro
Leu 320
Glu
Ala
Cys
Ile
Phe 400
Glu
Asp
Ala
Leu
Arg 480
Ile
Arg
Leu
- 210 046157
Lys Gln Lys Glu Lys Lys Ala Glu
Lys Gly Gly Ala
Pro Ser Ala Ser
530
535
540
Ser Ala Pro Pro Val
Ser Leu Ala Pro Val Val Thr
Thr Cys Ala
545 550 555 <210> 115 <211> 631 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 115
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser
5 10
Синтетический
Pro Leu Gln Ile
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr 20 25
Met Asp Asn Tyr 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly 35 40
Ala Pro Gln Phe 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser
55 60
Asn Ser Ser Ser
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75
Ser Asn Ser Ser
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr
90
Gly Glu Gln Pro
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile
100 105
Ser Leu Asn Asn
110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln
115 120
Thr Thr Arg Leu 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu
130 135 140
Pro Ala Pro Asn
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser
145 150 155
Leu Val Ser Gly
160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser
165 170
Ser Ala Pro Ser
175
- 211 046157
Pro Ala Ala Ser Ser Ala Ser Ala
Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro
210
Thr Pro Asn
Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg
340 345 350
Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu
370 375 380
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
385 390 395
Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Thr
405 410 415
Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu
420 425 430
Cys
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
Arg
Ser
Phe
Thr
Ile 400
Lys
Ser
- 212 046157
Cys Asp
Ile His
450
Phe Ser 465
Glu Lys
Arg Arg 435
Thr Gly
Gln Ser
Pro Phe
Phe Ser
Gln Lys
Ser Ser
470
Ala Cys 485
Asp Asn
Leu His
500
Thr His
Thr Ser 440
Pro Phe 455
Leu Val
Asp Ile
Thr Lys
His Ser
Gln Cys
Arg His
Cys Gly
490
Ile His
505
Leu Thr
Arg Ile
460
Ile Arg 475
Arg Lys
Leu Arg
Lys Ala
Asp Lys 515
Ser Val
Val Ala
520
Ser Ser
Ala Thr
Glu His Ile Arg 445
Cys Met Arg Asn
Thr His Thr Gly
480
Phe Ala Arg Glu
495
Gln Lys Asp Lys 510
Ser Ser Leu Ser 525
Ser Tyr
530
Pro Ser
Pro Val
Ala Thr 535
Ser Tyr
Pro Ser
540
Pro Val Thr Thr
Ser Tyr 545
Pro Ser
Pro Ala
550
Thr Thr
Ser Tyr
Pro Ser 555
Pro Val Pro Thr
560
Ser Phe
Ser Ser
Pro Gly 565
Ser Ser
Thr Tyr
570
Pro Ser
Pro Val His Ser
575
Gly Phe
Pro Ser
580
Pro Ser
Val Ala
Thr Thr
585
Tyr Ser
Ser Val Pro Pro
590
Ala Phe
Pro Ala 595
Gln Val
Ser Ser
600
Phe Pro
Ser Ser
Ala Val Thr Asn 605
Ser Phe
610
Ser Ala
Ser Thr
Gly Leu 615
Ser Asp
Met Thr
620
Ala Thr Phe Ser
Pro Arg 625
Thr Ile
Glu Ile
630
Cys <210> 116 <211> 719 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 116
Синтетический
- 213 046157
Met Ala 1
Ala Ala
Lys Ala 5
Glu Met
Gln Leu
Met Ser
Pro Leu
Ser Asp
Pro Phe
Gly Ser
Phe Pro
His Ser 25
Pro Thr
Met Asp
Pro Lys
Leu Glu 35
Glu Met
Met Leu
Leu Ser
Asn Gly
Ala Pro 45
Gln Ile 15
Asn Tyr
Gln Phe
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser 50 5560
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser 65 70 7580
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro 85 9095
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250255
- 214 046157
Phe
Pro
Leu
Lys 305
Met
Pro
Asp
Gln
Asn 385
Cys
Ile
Cys
Ile
Phe 465
Glu
Asp
Pro Gln Gln Gln Gly 260
Phe Gln Gly Leu Glu
275
Ser Thr Ile Lys Ala 290
Ala Leu Asn Thr Ser
310
Arg Lys Tyr Pro Asn
325
Tyr Ala Cys Pro Val
340
Glu Leu Asn Val His
355
Cys Arg Ile Cys Met 370
His Ile Arg Thr His
390
Gly Arg Lys Phe Ala
405
His Leu Arg Gln Lys 420
Asp Arg Arg Phe Ser
435
His Thr Gly Gln Lys 450
Ser His Arg Thr Thr
470
Lys Pro Phe Ala Cys
485
Asn Leu His Thr His
500
Asp Leu Gly Leu Gly 265
Ser Arg Thr Gln Gln
280
Phe Ala Thr Gln Ser 295
Tyr Gln Ser Gln Leu
315
Arg Pro Ser Lys Thr
330
Glu Ser Cys Asp Arg 345
Ile Arg Ile His Thr
360
Arg Asn Phe Ser Arg 375
Thr Gly Glu Lys Pro
395
Arg Ser Asp Asp Leu
410
Asp Arg Pro Tyr Ala 425
Arg Ser Asp Asn Leu
440
Pro Phe Gln Cys Arg 455
Leu Thr Asn His Ile
475
Asp Ile Cys Gly Arg
490
Thr Lys Ile His Leu 505
Thr Pro Asp Gln Lys
270
Pro Ser Leu Thr Pro
285
Gly Ser Gln Asp Leu 300
Ile Lys Pro Ser Arg
320
Pro Pro His Glu Arg
335
Arg Phe Ser Arg Arg
350
Gly Gln Lys Pro Phe
365
Ser Asp His Leu Thr 380
Phe Ala Cys Asp Ile
400
Val Arg His Thr Lys 415
Cys Pro Val Glu Ser
430
Val Arg His Ile Arg 445
Ile Cys Met Arg Asn 460
Arg Thr His Thr Gly
480
Lys Phe Ala Arg Glu
495
Arg Gln Lys Asp Arg 510
- 215 046157
Pro Tyr
His Ser
530
Gln Cys 545
Arg His
Ala Cys 515
Leu Thr
Arg Ile
Ile Arg
Pro Val
Glu His
Cys Met
550
Thr His 565
Cys Gly
Arg Lys
580
Phe Ala
Ile His
Leu Arg 595
Gln Lys
Ser Ser
610
Ala Thr
Ser Ser
Ser Tyr 625
Pro Ser
Pro Val
630
Ser Tyr
Pro Ser
Pro Val 645
Thr Tyr
Pro Ser
660
Pro Val
Thr Thr
Tyr Ser 675
Ser Val
Glu Ser
520
Ile Arg 535
Arg Asn
Thr Gly
Arg Glu
Asp Lys
600
Leu Ser 615
Thr Thr
Pro Thr
His Ser
Pro Pro
680
Cys Asp
Ile His
Phe Ser
Glu Lys
570
Asp Asn 585
Lys Ala
Ser Tyr
Ser Tyr
Ser Phe
650
Gly Phe 665
Ala Phe
Arg Arg
Thr Gly
540
Gln Ser 555
Pro Phe
Leu His
Asp Lys
Pro Ser
620
Pro Ser 635
Ser Ser
Pro Ser
Pro Ala
Phe Ser Thr Ser 525
Gln Lys Pro Phe
Ser Ser Leu Val
560
Ala Cys Asp Ile
575
Thr His Thr Lys
590
Ser Val Val Ala 605
Pro Val Ala Thr
Pro Ala Thr Thr
640
Pro Gly Ser Ser
655
Pro Ser Val Ala
670
Gln Val Ser Ser 685
Phe Pro
690
Ser Ser
Ala Val
Thr Asn 695
Ser Phe
Ser Ala
700
Ser Thr Gly Leu
Ser Asp 705
Met Thr
Ala Thr
710
Phe Ser
Pro Arg
Thr Ile 715
Glu Ile Cys <210> 117 <211> 627 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический
- 216 046157 <400> 117 Met Ala Ala 1
Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln
10 15
Ser Asp Pro
Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn
25 30
Pro Lys Leu 35
Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln
45
Leu Gly Ala 50
Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser 55 60
Ser Ser Ser 65
Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 70 75
Ser Ser Ser
Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln
90 95
Tyr Glu His
Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn
100 105 110
Glu Lys Val
115
Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg
120 125
Pro Pro Ile
130
Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro
135 140
Ser Gly Asn 145
Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
150 155
Leu Val Ser
Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala
Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro
195
Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
200 205
Phe Pro Thr
210
Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
215 220
Phe Pro Gly 225
Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
230 235
Pro Ala Ala
Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Ile
Tyr
Phe
Ser
Ser 80
Pro
Asn
Leu
Asn
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
- 217 046157
Phe Pro Gln
Gln Gln Gly 260
Asp Leu Gly
265
Leu Gly Thr
Pro Asp Gln
270
Pro Phe Gln
275
Gly Leu Glu
Ser Arg Thr
280
Gln Gln Pro
Ser Leu Thr 285
Leu Ser Thr
290
Ile Lys Ala
Phe Ala Thr 295
Gln Ser Gly
300
Ser Gln Asp
Lys Ala Leu 305
Asn Thr Ser
310
Tyr Gln Ser
Gln Leu Ile
315
Lys Pro Ser
Met Arg Lys
Tyr Pro Asn
325
Arg Pro Ser
Lys Thr Pro 330
Pro His Glu
335
Pro Tyr Ala
Cys Pro Val 340
Glu Ser Cys
345
Asp Arg Arg
Phe Ser Arg
350
Asp Asn Leu
355
Val Arg His
Ile Arg Ile
360
His Thr Gly
Gln Lys Pro 365
Gln Cys Arg
370
Ile Cys Met
Arg Asn Phe 375
Ser His Arg
380
Thr Thr Leu
Asn His Ile 385
Arg Thr His
390
Thr Gly Glu
Lys Pro Phe
395
Ala Cys Asp
Cys Gly Arg
Lys Phe Ala
405
Arg Glu Asp
Asn Leu His 410
Thr His Ile
415
Thr His Thr
Gly Glu Lys 420
Pro Phe Ala
425
Cys Asp Ile
Cys Gly Arg
430
Phe Ser Thr
435
Ser His Ser
Leu Thr Glu
440
His Ile Arg
Ile His Thr 445
Gln Lys Pro
450
Phe Gln Cys
Arg Ile Cys 455
Met Arg Asn
460
Phe Ser Gln
Ser Ser Leu 465
Val Arg His
470
Ile Arg Thr
His Thr Gly 475
Glu Lys Pro
Ala Cys Asp
Ile Cys Gly
485
Arg Lys Phe
Ala Arg Glu 490
Asp Asn Leu
495
Thr His Thr
Lys Ile His
Leu Arg Gln
Lys Asp Lys
Lys Ala Asp
Lys
Pro
Leu
Arg 320
Arg
Ser
Phe
Thr
Ile 400
Arg
Lys
Gly
Ser
Phe 480
His
Lys
- 218 046157
Ser Val
Pro Val
530
Pro Ala 545
Pro Gly
Pro Ser
Gln Val
Ser Thr
610
500
Val Ala 515
Ala Thr
Thr Thr
Ser Ser
Val Ala
580
Ser Ser 595
Gly Leu
Ser Ser
Ser Tyr
Ser Tyr
550
Thr Tyr 565
Thr Thr
Phe Pro
Ser Asp
Ala Thr
520
Pro Ser 535
Pro Ser
Pro Ser
Tyr Ser
Ser Ser
600
Met Thr 615
505
Ser Ser
Pro Val
Pro Val
Pro Val
570
Ser Val
585
Ala Val
Ala Thr
510
Leu Ser
Thr Thr
540
Pro Thr 555
His Ser
Pro Pro
Thr Asn
Phe Ser
620
Ser Tyr Pro Ser 525
Ser Tyr Pro Ser
Ser Phe Ser Ser
560
Gly Phe Pro Ser
575
Ala Phe Pro Ala
590
Ser Phe Ser Ala 605
Pro Arg Thr Ile
Glu Ile Cys 625 <210> 118 <211> 631 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 118
Met Ala Ala Ala 1
Lys Ala Glu Met 5
Gln Leu Met Ser
Pro Leu Gln Ile
Ser Asp Pro Phe
Gly Ser Phe Pro
His Ser Pro Thr 25
Met Asp Asn Tyr 30
Pro Lys Leu Glu 35
Glu Met Met Leu
Leu Ser Asn Gly
Ala Pro Gln Phe 45
Leu Gly Ala Ala 50
Gly Ala Pro Glu 55
Gly Ser Gly Ser 60
Asn Ser Ser Ser
Ser Ser Ser Gly 65
Gly Gly Gly Gly 70
Gly Gly Gly Gly 75
Ser Asn Ser Ser
- 219 046157
Ser Ser Ser Ser Thr Phe Asn Pro
Gln Ala Asp Thr Gly Glu Gln
95
Tyr Glu His
Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn
100 105 110
Glu Lys Val
115
Leu Val Glu Thr
Ser Tyr Pro Ser Gln Thr Thr Arg
120 125
Pro Pro
130
Ile Thr
Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro
135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
145 150 155
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Pro
Asn
Leu
Asn
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
Arg
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu
- 220 046157
325
330 335
Pro
Asp
Gln
Thr 385
Cys
Ile
Cys
Ile
Phe 465
Glu
Ser
Lys
Ser
Ser 545
Ser
Tyr Ala Cys Pro Val Glu Ser 340
Cys Asp Arg Arg Phe Ser Arg
345 350
Asn Leu Val Arg His Ile Arg
355 360
Cys Arg Ile Cys Met Arg Asn
370 375
His Ile Arg Thr His Thr Gly
390
Gly Arg Lys Phe Ala Arg Ser 405
His Leu Arg Gln Lys Asp Arg 420
Asp Arg Arg Phe Ser Gln Ser
435 440
His Thr Gly Gln Lys Pro Phe
450 455
Ser Thr Ser Gly His Leu Val 470
Lys Pro Phe Ala Cys Asp Ile
485
Thr Leu Thr Glu His Thr Lys
500
Ala Asp Lys Ser Val Val Ala
515 520
Tyr Pro Ser Pro Val Ala Thr
530 535
Tyr Pro Ser Pro Ala Thr Thr
550
Phe Ser Ser Pro Gly Ser Ser 565
Ile His Thr Gly Gln Lys Pro
365
Phe Ser Arg Glu Asp Asn Leu
380
Glu Lys Pro Phe Ala Cys Asp 395
Asp Glu Leu Val Arg His Thr
410 415
Pro Tyr Ala Cys Pro Val Glu
425 430
Gly Asn Leu Thr Glu His Ile 445
Gln Cys Arg Ile Cys Met Arg 460
Arg His Ile Arg Thr His Thr 475
Cys Gly Arg Lys Phe Ala Gln
490 495
Ile His Leu Arg Gln Lys Asp
505 510
Ser Ser Ala Thr Ser Ser Leu
525
Ser Tyr Pro Ser Pro Val Thr 540
Ser Tyr Pro Ser Pro Val Pro 555
Thr Tyr Pro Ser Pro Val His
570 575
Ser
Phe
His
Ile 400
Lys
Ser
Arg
Asn
Gly 480
Asn
Lys
Ser
Thr
Thr 560
Ser
- 221 046157
Gly Phe
Pro Ser
580
Pro Ser
Val Ala
Ala Phe
Pro Ala 595
Gln Val
Ser Ser
600
Ser Phe
610
Ser Ala
Ser Thr
Gly Leu 615
Thr Thr 585
Phe Pro
Ser Asp
Tyr Ser
Ser Ser
Met Thr
620
Ser Val Pro Pro
590
Ala Val Thr Asn 605
Ala Thr Phe Ser
Pro Arg Thr Ile Glu Ile Cys
625 630 <210> 119 <211> 473 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 119
Синтетический
Met Thr Gly 1
Leu Asn Gln
Leu Asn Leu
Met Ala Thr
Asn Pro Glu 65
Lys Thr Val
Trp Cys Gln
Val Pro Pro
115
Met Val Gln
130
Pro Pro Tyr
Lys Leu Ala 5
Leu Pro Asp 20
Phe Ser Gly
Glu Asn Val
Leu Ser Tyr 70
Thr Tyr Leu 85
Asp Asn Ile 100
Ala Ser Gly
Pro Pro Gln
Ser Asn Cys
Glu Lys Leu
Asn Leu Tyr
Ser Ser Asp 40
Met Asp Ile 55
Ser Gly Ser
Gly Lys Phe
Ile Ser Leu
105
Ala Leu Ser
120
Gly Asp Val 135
Gly Asp Leu
Pro Val Thr 10
Pro Glu Glu
Ser Val Val
Gly Leu Thr 60
Phe Gln Pro 75
Ala Phe Asp 90
Met Ser Ala
Thr Gln Thr
Glu Ala Met
140
Tyr Ser Glu
Met Ser Ser Leu
Ile Pro Ser Ala
His Tyr Asn Gln 45
Asn Glu Lys Pro
Ala Pro Gly Asn 80
Ser Pro Ser Asn
Gly Ile Leu Gly 110
Ser Thr Ala Ser 125
Tyr Pro Ala Leu
Pro Val Ser Phe
- 222 046157
145
150
155
His Asp Pro Gln Gly
165
Asn Pro Gly Leu Ala
170
Tyr Ser Pro Gln Asp
175
Gln Ser Ala Lys Pro
180
Ala Leu Asp Ser Asn
185
Leu Phe Pro Met Ile
190
Asp Tyr Asn Leu Tyr 195
His His Pro Asn Asp
200
Met Gly Ser Ile Pro 205
His Lys Pro Phe Gln 210
Gly Met Asp Pro Ile 215
Arg Val Asn Pro Pro 220
Ile Thr Pro Leu Glu 225
Thr Ile Lys Ala Phe 230
Lys Asp Lys Gln Ile 235
Pro Gly Phe Gly Ser
245
Leu Pro Gln Pro Pro
250
Leu Thr Leu Lys Pro
255
Arg Pro Arg Lys Tyr
260
Pro Asn Arg Pro Ser
265
Lys Thr Pro Leu His
270
Arg Pro His Ala Cys 275
Pro Ala Glu Gly Cys 280
Asp Arg Arg Phe Ser 285
Ser Asp Asn Leu Val
290
Arg His Leu Arg Ile 295
His Thr Gly His Lys
300
Phe Gln Cys Arg Ile 305
Cys Met Arg Ser Phe 310
Ser His Arg Thr Thr 315
Thr Asn His Ile Arg
325
Thr His Thr Gly Glu
330
Lys Pro Phe Ala Cys
335
Phe Cys Gly Arg Lys
340
Phe Ala Arg Glu Asp
345
Asn Leu His Thr His
350
Lys Ile His Leu Lys 355
Gln Lys Glu His Ala 360
Cys Pro Ala Glu Gly
365
Asp Arg Arg Phe Ser
370
Thr Ser His Ser Leu
375
Thr Glu His Leu Arg
380
His Thr Gly His Lys 385
Pro Phe Gln Cys Arg 390
Ile Cys Met Arg Ser 395
160
Tyr
Pro
Glu
Pro
His 240
Ile
Glu
Arg
Pro
Leu 320
Glu
Ala
Cys
Ile
Phe 400
- 223 046157
Ser Gln
Ser Ser
Lys Pro
Phe Ala
420
Asn Leu
His Thr 435
Ala Glu
450
Lys Gly
Leu Ala 465
Pro Val
Ser Leu 405
Cys Glu
His Ala
Gly Ala
Val Thr
470
Val Arg
Phe Cys
Lys Ile 440
Pro Ser 455
Thr Cys
His Ile
410
Gly Arg 425
His Leu
Ala Ser
Ala
Arg Thr
Lys Phe
Lys Gln
Ser Ala
460
His Thr Gly Glu 415
Ala Arg Glu Asp
430
Lys Glu Lys Lys 445
Pro Pro Val Ser <210> 120 <211> 719 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический <400>
Met
Ser
Pro
Leu
Ser 65
Ser
Tyr
Glu
Pro полипептид
120
Ala
Asp
Lys
Gly 50
Ser
Ser
Glu
Lys
Pro
Ala
Ala
Lys 5
Ala
Glu
Met
Gln
Leu
Met
Ser
Pro Leu Gln Ile
Pro
Phe 20
Gly
Ser
Phe
Pro
His 25
Ser
Pro
Thr
Met Asp Asn Tyr 30
Leu 35
Glu
Glu
Met
Met
Leu 40
Leu
Ser
Asn
Gly
Ala Pro Gln Phe 45
Ala
Ala
Gly
Ala
Pro 55
Glu
Gly
Ser
Gly
Ser 60
Asn Ser Ser Ser
Ser
Ser
His
Val
115
Ile
Gly
Gly
Gly 70
Gly
Gly
Gly
Gly
Gly 75
Gly
Ser Asn Ser Ser
Ser
Thr 85
Phe
Asn
Pro
Gln
Ala 90
Asp
Thr
Gly Glu Gln Pro 95
Leu
100
Leu
Thr
Thr
Val
Tyr
Ala
Glu
Thr
Glu
Thr
Gly
Ser
Ser
120
Arg
Phe
105
Pro
Asp
Ile
Ser Leu Asn Asn
110
Tyr
Phe
Pro
Ser
Ser
Leu
Gln
Glu
Thr Thr Arg Leu 125
Pro Ala Pro Asn
- 224 046157
130
135
140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
145 150 155
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Asp
340 345 350
Gly Ala Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu
370 375 380
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
Arg
Pro
Phe
Val
- 225 046157
Arg 385
Cys
Ile
Cys
Ile
Phe 465
Glu
Asp
Pro
Gly
Gln 545
Glu
Cys
Ile
Ser
Ser 625
His Ile Arg Thr His
390
Gly Arg Lys Phe Ala
405
His Leu Arg Gln Lys 420
Asp Arg Arg Phe Ser
435
His Thr Gly Gln Lys 450
Ser Thr Ser Gly Asn
470
Lys Pro Phe Ala Cys
485
Asn Leu Val Arg His 500
Tyr Ala Cys Pro Val
515
His Leu Thr Glu His 530
Cys Arg Ile Cys Met
550
His Ile Arg Thr His
565
Gly Arg Lys Phe Ala
580
His Leu Arg Gln Lys
595
Ser Ala Thr Ser Ser 610
Tyr Pro Ser Pro Val
630
Thr Gly Glu Lys Pro
395
Gln Ser Gly Asp Leu
410
Asp Arg Pro Tyr Ala 425
Thr His Leu Asp Leu
440
Pro Phe Gln Cys Arg 455
Leu Val Arg His Ile
475
Asp Ile Cys Gly Arg
490
Thr Lys Ile His Leu 505
Glu Ser Cys Asp Arg 520
Ile Arg Ile His Thr 535
Arg Asn Phe Ser Glu
555
Thr Gly Glu Lys Pro
570
Gln Ala Gly His Leu 585
Asp Lys Lys Ala Asp 600
Leu Ser Ser Tyr Pro 615
Thr Thr Ser Tyr Pro
635
Phe Ala Cys Asp Ile
400
Arg Arg His Thr Lys 415
Cys Pro Val Glu Ser
430
Ile Arg His Ile Arg 445
Ile Cys Met Arg Asn 460
Arg Thr His Thr Gly
480
Lys Phe Ala Arg Ser
495
Arg Gln Lys Asp Arg 510
Arg Phe Ser Gln Ser
525
Gly Gln Lys Pro Phe 540
Arg Ser His Leu Arg
560
Phe Ala Cys Asp Ile
575
Ala Ser His Thr Lys 590
Lys Ser Val Val Ala
605
Ser Pro Val Ala Thr 620
Ser Pro Ala Thr Thr
640
- 226 046157
Ser Tyr
Pro Ser
Thr Tyr
Pro Ser
660
Thr Thr
Tyr Ser 675
Phe Pro
690
Ser Ser
Pro Val 645
Pro Val
Ser Val
Ala Val
Pro Thr
His Ser
Pro Pro
680
Thr Asn 695
Ser Phe
650
Gly Phe 665
Ala Phe
Ser Phe
Ser Asp Met Thr Ala Thr Phe Ser Pro Arg
705 710 <210> 121 <211> 627 <212> Белок <213> Искусственная последовательность <220>
Ser Ser
Pro Ser
Pro Ala
Ser Ala
700
Thr Ile 715 <223> Описание искусственной последовательности полипептид <400> 121 Met Ala Ala 1
Ser Asp Pro
Pro Lys Leu 35
Leu Gly Ala 50
Ala Lys Ala 5
Phe Gly Ser 20
Glu Glu Met
Ala Gly Ala
Glu Met Gln
Phe Pro His
Met Leu Leu
Pro Glu Gly 55
Leu Met Ser 10
Ser Pro Thr
Ser Asn Gly
Ser Gly Ser 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75
Ser
Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr
90
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile
100 105
Glu Lys Val Leu Val Glu Thr Ser
115 120
Tyr Pro Ser Gln
Pro Gly Ser Ser
655
Pro Ser Val Ala
670
Gln Val Ser Ser 685
Ser Thr Gly Leu
Glu Ile Cys
Синтетический
Pro Leu Gln Ile
Met Asp Asn Tyr 30
Ala Pro Gln Phe 45
Asn Ser Ser Ser
Ser Asn Ser Ser
Gly Glu Gln Pro
Ser Leu Asn Asn
110
Thr Thr Arg Leu 125
- 227 046157
Pro Pro Ile Thr Tyr Thr Gly Arg Phe
130 135
Ser Gly Asn Thr Leu Trp Pro Glu Pro
145 150
Leu Val Ser Met Thr Asn Pro Pro Ala
165
Pro Ala Ala Ser Ser Ala Ser Ala Ser
180 185
Ala Val Pro Ser Asn Asp Ser Ser Pro
195 200
Phe Pro Thr Pro Asn Thr Asp Ile Phe
210 215
Phe Pro Gly Ser Ala Gly Thr Ala Leu 225 230
Pro Ala Ala Lys Gly Gly Phe Gln Val
245
Phe Pro Gln Gln Gln Gly Asp Leu Gly
260 265
Pro Phe Gln Gly Leu Glu Ser Arg Thr
275 280
Leu Ser Thr Ile Lys Ala Phe Ala Thr
290 295
Lys Ala Leu Asn Thr Ser Tyr Gln Ser
305 310
Met Arg Lys Tyr Pro Asn Arg Pro Ser
325
Pro Tyr Ala Cys Pro Val Glu Ser Cys
340 345
Asp Asn Leu Thr Arg His Ile Arg Ile
355 360
Gln Cys Arg Ile Cys Met Arg Asn Phe
370 375
Leu Glu Pro Ala Pro Asn
140
Phe Ser Leu Val Ser Gly
155 160
Ser Ser Ser Ala Pro Ser
175
Ser Pro Pro Leu Ser Cys
190
Tyr Ser Ala Ala Pro Thr
205
Glu Pro Gln Ser Gln Ala
220
Tyr Pro Pro Pro Ala Tyr
235 240
Met Ile Pro Asp Tyr Leu
255
Gly Thr Pro Asp Gln Lys
270
Gln Pro Ser Leu Thr Pro
285
Ser Gly Ser Gln Asp Leu
300
Leu Ile Lys Pro Ser Arg
315 320
Thr Pro Pro His Glu Arg
335
Arg Arg Phe Ser Arg Ser
350
Thr Gly Gln Lys Pro Phe
365
His Ser Thr Thr Leu Thr
380
- 228 046157
Asn 385
Cys
Thr
Phe
Gln
Ser 465
Ala
Thr
Ser
Pro
Pro 545
Pro
Pro
Gln
Ser
Glu 625
His Ile
Gly Arg
His Thr
Ser Thr
435
Lys Pro 450
Ser Leu
Cys Asp
His Thr
Val Val
515
Val Ala 530
Ala Thr
Gly Ser
Ser Val
Val Ser
595
Thr Gly 610
Ile Cys
Arg Thr
Lys Phe
405
Gly Glu 420
Ser His
Phe Gln
Thr Arg
Ile Cys
485
Lys Ile 500
Ala Ser
Thr Ser
Thr Ser
Ser Thr
565
Ala Thr 580
Ser Phe
Leu Ser
His Thr 390
Ala Arg
Lys Pro
Ser Leu
Cys Arg
455
His Ile 470
Gly Arg
His Leu
Ser Ala
Tyr Pro
535
Tyr Pro 550
Tyr Pro
Thr Tyr
Pro Ser
Asp Met
615
Gly Glu
Ser Asp
Phe Ala
425
Thr Glu 440
Ile Cys
Arg Thr
Lys Phe
Arg Gln
505
Thr Ser 520
Ser Pro
Ser Pro
Ser Pro
Ser Ser
585
Ser Ala 600
Thr Ala
Lys Pro
395
Phe Ala
Cys Asp
Asn Arg 410
Cys Asp
His Ile
Met Arg
His Thr
475
Ala Arg 490
Lys Asp
Ser Leu
Val Thr
Val Pro
555
Val His 570
Val Pro
Val Thr
Thr Phe
Lys Thr
Ile Cys
Arg Ile
445
Asn Phe 460
Gly Glu
Ser Asp
Lys Lys
Ser Ser
525
Thr Ser 540
Thr Ser
Ser Gly
Pro Ala
Asn Ser
605
Ser Pro 620
His Ile
415
Gly Arg 430
His Thr
Ser Gln
Lys Pro
Asn Arg
495
Ala Asp 510
Tyr Pro
Tyr Pro
Phe Ser
Phe Pro
575
Phe Pro 590
Phe Ser
Arg Thr
Ile 400
Arg
Lys
Gly
Ser
Phe 480
Lys
Lys
Ser
Ser
Ser 560
Ser
Ala
Ala
Ile
- 229 046157 <210> 122 <211> 473 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 122
Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr
5 10
Синтетический
Met Ser Ser Leu
Leu Asn Gln Leu Pro Asp 20
Asn Leu Tyr Pro Glu Glu 25
Ile Pro Ser Ala
Leu Asn Leu Phe Ser Gly 35
Ser Ser Asp Ser Val Val 40
His Tyr Asn Gln 45
Met Ala Thr Glu Asn Val
Met Asp Ile Gly Leu Thr 55 60
Asn Glu Lys Pro
Asn Pro Glu Leu Ser Tyr 65 70
Ser Gly Ser Phe Gln Pro 75
Ala Pro Gly Asn 80
Lys Thr Val Thr Tyr Leu 85
Gly Lys Phe Ala Phe Asp 90
Ser Pro Ser Asn
Trp Cys Gln Asp Asn Ile
100
Ile Ser Leu Met Ser Ala
105
Gly Ile Leu Gly 110
Val Pro Pro Ala Ser Gly
115
Ala Leu Ser Thr Gln Thr
120
Ser Thr Ala Ser 125
Met Val Gln Pro Pro Gln
130
Gly Asp Val Glu Ala Met
135 140
Tyr Pro Ala Leu
Pro Pro Tyr Ser Asn Cys
145 150
Gly Asp Leu Tyr Ser Glu
155
Pro Val Ser Phe
160
His Asp Pro Gln Gly Asn
165
Pro Gly Leu Ala Tyr Ser
170
Pro Gln Asp Tyr
175
Gln Ser Ala Lys Pro Ala
180
Leu Asp Ser Asn Leu Phe
185
Pro Met Ile Pro
190
Asp Tyr Asn Leu Tyr His
195
His Pro Asn Asp Met Gly
200
Ser Ile Pro Glu 205
- 230 046157
His Lys Pro Phe Gln 210
Gly Met Asp Pro Ile 215
Arg Val Asn Pro Pro 220
Ile Thr Pro Leu Glu 225
Thr Ile Lys Ala Phe 230
Lys Asp Lys Gln Ile 235
Pro Gly Phe Gly Ser
245
Leu Pro Gln Pro Pro
250
Leu Thr Leu Lys Pro
255
Arg Pro Arg Lys Tyr
260
Pro Asn Arg Pro Ser
265
Lys Thr Pro Leu His
270
Arg Pro His Ala Cys 275
Pro Ala Glu Gly Cys 280
Asp Arg Arg Phe Ser 285
Ser Asp Asn Leu Val
290
Arg His Leu Arg Ile 295
His Thr Gly His Lys
300
Phe Gln Cys Arg Ile 305
Cys Met Arg Ser Phe 310
Ser Arg Glu Asp Asn 315
His Thr His Ile Arg
325
Thr His Thr Gly Glu
330
Lys Pro Phe Ala Cys
335
Phe Cys Gly Arg Lys
340
Phe Ala Arg Ser Asp
345
Glu Leu Val Arg His
350
Lys Ile His Leu Lys 355
Gln Lys Glu His Ala 360
Cys Pro Ala Glu Gly 365
Asp Arg Arg Phe Ser
370
Gln Ser Gly Asn Leu 375
Thr Glu His Leu Arg
380
His Thr Gly His Lys 385
Pro Phe Gln Cys Arg 390
Ile Cys Met Arg Ser 395
Ser Thr Ser Gly His
405
Leu Val Arg His Ile
410
Arg Thr His Thr Gly 415
Lys Pro Phe Ala Cys
420
Glu Phe Cys Gly Arg
425
Lys Phe Ala Gln Asn
430
Thr Leu Thr Glu His
435
Ala Lys Ile His Leu 440
Lys Gln Lys Glu Lys 445
Ala Glu Lys Gly Gly 450
Ala Pro Ser Ala Ser
455
Ser Ala Pro Pro Val
460
Pro
His 240
Ile
Glu
Arg
Pro
Leu 320
Glu
Ala
Cys
Ile
Phe 400
Glu
Ser
Lys
Ser
- 231 046157
Leu Ala Pro Val Val Thr Thr Cys Ala
465
470 <210> 123 <211> 627 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 123
Met Ala Ala Ala Lys Ala Glu Met 1 5
Gln Leu Met Ser Pro Leu Gln Ile
15
Ser Asp Pro Phe Gly Ser Phe Pro 20
His Ser Pro Thr Met Asp Asn Tyr 25 30
Pro Lys Leu Glu Glu Met Met Leu
40
Leu Ser Asn Gly Ala Pro Gln Phe 45
Leu Gly Ala Ala Gly Ala Pro Glu
55
Gly Ser Gly Ser Asn Ser Ser Ser 60
Ser Ser Ser Gly Gly Gly Gly Gly 65 70
Gly Gly Gly Gly Ser Asn Ser Ser
80
Ser Ser Ser Ser Thr Phe Asn Pro
Gln Ala Asp Thr Gly Glu Gln Pro
95
Tyr Glu His Leu Thr Ala Glu Ser
100
Phe Pro Asp Ile Ser Leu Asn Asn
105 110
Glu Lys Val Leu Val Glu Thr Ser
115 120
Tyr Pro Ser Gln Thr Thr Arg Leu
125
Pro Pro Ile Thr Tyr Thr Gly Arg
130 135
Phe Ser Leu Glu Pro Ala Pro Asn
140
Ser Gly Asn Thr Leu Trp Pro Glu
145 150
Pro Leu Phe Ser Leu Val Ser Gly
155 160
Leu Val Ser Met Thr Asn Pro Pro
165
Ala Ser Ser Ser Ser Ala Pro Ser
170 175
Pro Ala Ala Ser Ser Ala Ser Ala
180
Ser Gln Ser Pro Pro Leu Ser Cys
185 190
- 232 046157
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala 225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg
340 345 350
Asp Asn Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu
370 375 380
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
385 390 395
Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Ile
405 410 415
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
420 425 430
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr
435 440 445
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
Arg
Ser
Phe
Thr
Ile 400
Arg
Lys
Gly
- 233 046157
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
450 455 460
Phe Ser Thr Ser
Gly His Leu Thr Arg His Ile Arg Thr His Thr Gly
465 470 475
Glu Lys Pro Phe
480
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser
485 490
Ser Thr Arg Lys
495
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Lys
500 505
Lys Ala Asp Lys
510
Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser
515 520
Ser Tyr Pro Ser 525
Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr
530 535 540
Ser Tyr Pro Ser
Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr
545 550 555
Ser Phe Ser Ser
560
Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser
565 570
Gly Phe Pro Ser
575
Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro
580 585
Ala Phe Pro Ala
590
Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn
595 600
Ser Phe Ser Ala 605
Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser
610 615 620
Pro Arg Thr Ile
Glu Ile Cys 625 <210> 124 <211> 627 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 124
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser
5 10
Синтетический
Pro Leu Gln Ile
- 234 046157
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro
25
Thr Met Asp Asn
Pro Lys
Leu Glu Glu Met Met 35
Leu Leu Ser Asn Gly Ala Pro Gln 40 45
Leu Gly Ala Ala
Gly Ala Pro Glu Gly
Ser Gly Ser Asn Ser
Ser
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 65 70 75
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln 85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
145 150 155
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys
Gly Gly Phe Gln Val
245
Pro Met 250
Ile Pro Asp Tyr
255
Phe Pro Gln Gln Gln Gly Asp Leu
260
Gly Leu Gly Thr Pro Asp Gln
265 270
Tyr
Phe
Ser
Ser 80
Pro
Asn
Leu
Asn
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
Lys
- 235 046157
Pro Phe Gln Gly Leu
275
Glu Ser Arg Thr Gln 280
Gln Pro Ser Leu Thr
285
Leu Ser Thr Ile Lys 290
Ala Phe Ala Thr Gln
295
Ser Gly Ser Gln Asp
300
Lys Ala Leu Asn Thr 305
Ser Tyr Gln Ser Gln 310
Leu Ile Lys Pro Ser 315
Met Arg Lys Tyr Pro
325
Asn Arg Pro Ser Lys
330
Thr Pro Pro His Glu
335
Pro Tyr Ala Cys Pro
340
Val Glu Ser Cys Asp
345
Arg Arg Phe Ser Arg
350
Asp Asn Leu Val Arg 355
His Ile Arg Ile His 360
Thr Gly Gln Lys Pro 365
Gln Cys Arg Ile Cys
370
Met Arg Asn Phe Ser 375
Arg Glu Asp Asn Leu 380
Thr His Ile Arg Thr 385
His Thr Gly Glu Lys 390
Pro Phe Ala Cys Asp 395
Cys Gly Arg Lys Phe
405
Ala Arg Ser Asp Glu
410
Leu Val Arg His Ile
415
Thr His Thr Gly Glu
420
Lys Pro Phe Ala Cys
425
Asp Ile Cys Gly Arg
430
Phe Ser Gln Ser Gly
435
Asn Leu Thr Glu His
440
Ile Arg Ile His Thr 445
Gln Lys Pro Phe Gln 450
Cys Arg Ile Cys Met
455
Arg Asn Phe Ser Thr
460
Gly His Leu Val Arg 465
His Ile Arg Thr His 470
Thr Gly Glu Lys Pro 475
Ala Cys Asp Ile Cys
485
Gly Arg Lys Phe Ala
490
Gln Asn Ser Thr Leu
495
Glu His Thr Lys Ile
500
His Leu Arg Gln Lys
505
Asp Lys Lys Ala Asp
510
Ser Val Val Ala Ser
Ser Ala Thr Ser Ser
Leu Ser Ser Tyr Pro
Pro
Leu
Arg 320
Arg
Ser
Phe
His
Ile 400
Arg
Lys
Gly
Ser
Phe 480
Thr
Lys
Ser
- 236 046157
Pro Val
530
Pro Ala 545
Pro Gly
Pro Ser
Gln Val
Ser Thr
610
515
Ala Thr
Thr Thr
Ser Ser
Val Ala
580
Ser Ser 595
Gly Leu
Ser Tyr
Ser Tyr
550
Thr Tyr 565
Thr Thr
Phe Pro
Ser Asp
520
Pro Ser 535
Pro Ser
Pro Ser
Tyr Ser
Ser Ser
600
Met Thr 615
525
Pro Val
Pro Val
Pro Val
570
Ser Val
585
Ala Val
Ala Thr
Glu Ile Cys 625
Thr Thr
540
Pro Thr 555
His Ser
Pro Pro
Thr Asn
Phe Ser
620 <210> 125 <211> 272 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 125
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His
5 10
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 20 25
Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln
40
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
55 60
Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr
70 75
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
90
Ser Tyr Pro Ser
Ser Phe Ser Ser
560
Gly Phe Pro Ser
575
Ala Phe Pro Ala
590
Ser Phe Ser Ala 605
Pro Arg Thr Ile
Синтетический
Gly Val Pro Ala 15
Glu Cys Gly Lys 30
Arg Thr His Thr 45
Ser Phe Ser Arg
Gly Glu Lys Pro 80
Glu Asp Asn Leu
- 237 046157
His Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105
Pro Tyr Lys Cys Pro
110
Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr
165 170 175
Ser Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Asp Ala
210 215 220
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp
225 230 235 240
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
245 250 255
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
260 265 270 <210> 126 <211> 272 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 126
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr
25
Lys Cys Pro Glu Cys Gly Lys 30
- 238 046157
Ser Phe Ser Asp Pro 35
Gly Ala Leu Val Arg 40
His Gln Arg Thr His 45
Gly Glu Lys Pro Tyr 50
Lys Cys Pro Glu Cys 55
Gly Lys Ser Phe Ser 60
Ser Asp Asn Leu Val 65
Arg His Gln Arg Thr 70
His Thr Gly Glu Lys 75
Tyr Lys Cys Pro Glu 85
Cys Gly Lys Ser Phe
Ser Gln Ser Gly Asp
Arg Arg His Gln Arg
100
Thr His Thr Gly Glu
105
Lys Pro Tyr Lys Cys
110
Glu Cys Gly Lys Ser 115
Phe Ser Thr His Leu
120
Asp Leu Ile Arg His 125
Arg Thr His Thr Gly 130
Glu Lys Pro Tyr Lys 135
Cys Pro Glu Cys Gly
140
Ser Phe Ser Thr Ser 145
Gly Asn Leu Val Arg 150
His Gln Arg Thr His 155
Gly Glu Lys Pro Tyr
165
Lys Cys Pro Glu Cys
170
Gly Lys Ser Phe Ser
175
Ser Asp Asn Leu Val
180
Arg His Gln Arg Thr
185
His Thr Gly Lys Lys
190
Ser Lys Arg Pro Ala
195
Ala Thr Lys Lys Ala 200
Gly Gln Ala Lys Lys 205
Lys Gly Ser Tyr Pro
210
Tyr Asp Val Pro Asp
215
Tyr Ala Leu Glu Asp
220
Leu Asp Asp Phe Asp 225
Leu Asp Met Leu Gly 230
Ser Asp Ala Leu Asp 235
Phe Asp Leu Asp Met
245
Leu Gly Ser Asp Ala
250
Leu Asp Asp Phe Asp
255
Asp Met Leu Gly Ser
260
Asp Ala Leu Asp Asp
265
Phe Asp Leu Asp Met
270
Thr
Arg
Pro 80
Leu
Pro
Gln
Lys
Thr 160
Arg
Thr
Lys
Ala
Asp 240
Leu
Leu <210> 127 <211> 261
- 239 046157 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 127
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His
5 10
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 20 25
Синтетический
Gly Val Pro Ala 15
Glu Cys Gly Lys 30
Ser Phe Ser Arg Ser Asp 35
Asn Leu Val Arg His Gln 40
Arg Thr His Thr 45
Gly Glu Lys Pro Tyr Lys 50
Cys Pro Glu Cys Gly Lys 55 60
Ser Phe Ser Arg
Glu Asp Asn Leu His Thr 65 70
His Gln Arg Thr His Thr 75
Gly Glu Lys Pro 80
Tyr Lys Cys Pro Glu Cys 85
Gly Lys Ser Phe Ser Arg 90
Ser Asp Glu Leu 95
Val Arg His Gln Arg Thr
100
His Thr Gly Glu Lys Pro
105
Tyr Lys Cys Pro 110
Glu Cys Gly Lys Ser Phe 115
Ser Gln Ser Gly Asn Leu
120
Thr Glu His Gln 125
Arg Thr His Thr Gly Glu 130
Lys Pro Tyr Lys Cys Pro
135 140
Glu Cys Gly Lys
Ser Phe Ser Thr Ser Gly
145 150
His Leu Val Arg His Gln 155
Arg Thr His Thr
160
Gly Glu Lys Pro Tyr Lys
165
Cys Pro Glu Cys Gly Lys
170
Ser Phe Ser Gln
175
Asn Ser Thr Leu Thr Glu
180
His Gln Arg Thr His Thr
185
Gly Lys Lys Thr 190
Ser Lys Arg Pro Ala Ala
195
Thr Lys Lys Ala Gly Gln
200
Ala Lys Lys Lys 205
Lys Gly Ser Asp Ala Leu
210
Asp Asp Phe Asp Leu Asp
215 220
Met Leu Gly Ser
- 240 046157
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
225 230 235
Ser Asp Ala Leu
240
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
245 250
Leu Asp Asp Phe
255
Asp Leu Asp Met Leu
260 <210> 128 <211> 386 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 128
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr
5 10
Синтетический
Arg Leu Val Gln 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His 20 25
Ala Leu Arg Thr 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly
40
Leu Arg Pro Arg 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro
55 60
Gly Ala Leu Ala
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro 65 70 75
Phe Pro Ala Val
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro 85 90
Val Ala Thr Pro
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro
100 105
Gly Gly Pro Pro 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro
115 120
Pro Pro Ala His 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu
130 135 140
Glu Ala Leu Thr
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg
145 150 155
Glu Leu Pro Glu
160
- 241 046157
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gln
185
Ser Gln Leu Ile Lys
190
Ser Arg Met Arg Lys
195
Tyr Pro Asn Arg Pro
200
Ser Lys Thr Pro Pro
205
Glu Arg Pro Tyr Ala
210
Cys Pro Val Glu Ser
215
Cys Asp Arg Arg Phe 220
Arg Ser Asp Asn Leu 225
Val Arg His Ile Arg 230
Ile His Thr Gly Gln 235
Pro Phe Gln Cys Arg
245
Ile Cys Met Arg Asn
250
Phe Ser Arg Glu Asp
255
Leu His Thr His Ile
260
Arg Thr His Thr Gly
265
Glu Lys Pro Phe Ala
270
Asp Ile Cys Gly Arg 275
Lys Phe Ala Arg Ser 280
Asp Glu Leu Val Arg 285
Thr Lys Ile His Leu 290
Arg Gln Lys Asp Arg 295
Pro Tyr Ala Cys Pro 300
Glu Ser Cys Asp Arg 305
Arg Phe Ser Gln Ser 310
Gly Asn Leu Thr Glu 315
Ile Arg Ile His Thr
325
Gly Gln Lys Pro Phe
330
Gln Cys Arg Ile Cys
335
Arg Asn Phe Ser Thr
340
Ser Gly His Leu Val
345
Arg His Ile Arg Thr
350
Thr Gly Glu Lys Pro
355
Phe Ala Cys Asp Ile 360
Cys Gly Arg Lys Phe 365
Gln Asn Ser Thr Leu
370
Thr Glu His Thr Lys
375
Ile His Leu Arg Gln
380
Ser
Pro
His
Ser
Lys 240
Asn
Cys
His
Val
His 320
Met
His
Ala
Lys
Asp Lys 385 <210> 129 <211> 402 <212> Белок
- 242 046157 <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 129
Синтетический
Met Ala Ala 1
Asp His Leu 5
Met Leu Ala
Glu Gly Tyr 10
Arg Leu Val Gln 15
Arg Pro Pro
Ser Ala Ala 20
Ala Ala His
Gly Pro His
Ala Leu Arg Thr 30
Leu Pro Pro
Tyr Ala Gly
Pro Gly Leu 40
Asp Ser Gly
Leu Arg Pro Arg 45
Gly Ala Pro 50
Leu Gly Pro
Pro Pro Pro 55
Arg Gln Pro
Gly Ala Leu Ala
Tyr Gly Ala 65
Phe Gly Pro
Pro Ser Ser
Phe Gln Pro
Phe Pro Ala Val
Pro Pro Pro
Ala Ala Gly 85
Ile Ala His
Leu Gln Pro 90
Val Ala Thr Pro
Tyr Pro Gly
Arg Ala Ala 100
Ala Pro Pro
105
Asn Ala Pro
Gly Gly Pro Pro 110
Gly Pro Gln
115
Pro Ala Pro
Ser Ala Ala
120
Ala Pro Pro
Pro Pro Ala His 125
Ala Leu Gly
130
Gly Met Asp
Ala Glu Leu 135
Ile Asp Glu
140
Glu Ala Leu Thr
Ser Leu Glu 145
Leu Glu Leu
150
Gly Leu His
Arg Val Arg
155
Glu Leu Pro Glu
160
Leu Phe Leu
Gly Gln Ser
165
Glu Phe Asp
Cys Phe Ser 170
Asp Leu Gly Ser
175
Ala Pro Pro
Ala Gly Ser 180
Val Ser Cys
185
Gly Gly Ser
Gly Gly Gly Ser
190
Gly Gly Gly
195
Ser Gly Gly
Gly Ser Gly
200
Gln Ser Gln
Leu Ile Lys Pro 205
Ser Arg Met
210
Arg Lys Tyr
Pro Asn Arg 215
Pro Ser Lys
220
Thr Pro Pro His
- 243 046157
Glu Arg Pro 225
Arg Ser Asp
Pro Phe Gln
Leu His Thr
275
Tyr Ala Cys
230
Pro Val Glu
Ser Cys Asp
235
Arg Arg Phe Ser
240
Asp Ile
290
Thr Lys 305
Glu Ser
Ile Arg
Arg Asn
Thr Gly
370
Gln Asn 385
Asp Lys <210>
<211>
<212>
Asn Leu Val
245
Arg His Ile
Arg Ile His 250
Thr Gly Gln Lys
255
Cys Arg Ile 260
His Ile Arg
Cys Met Arg
265
Thr His Thr
280
Asn Phe Ser
Gly Glu Lys
Cys Gly
Arg Lys
Ile His
Leu Arg
310
Cys Asp
Arg Arg 325
Ile His
340
Thr Gly
Phe Ser 355
Glu Lys
Ser Thr
130
569 Белок
Thr Ser
Pro Phe
Leu Thr
390
Phe Ala 295
Gln Lys
Phe Ser
Gln Lys
Gly His 360
Ala Cys 375
Glu His
Arg Ser
Asp Glu
300
Asp Arg
Pro Tyr 315
Arg Glu Asp Asn 270
Pro Phe Ala Cys 285
Leu Val Arg His
Ala Cys Pro Val
320
Gln Ser
330
Gly Asn
Leu Thr Glu His
335
Pro Phe 345
Gln Cys
Arg Ile Cys Met
350
Leu Val
Arg His
Ile Arg Thr His 365
Asp Ile
Cys Gly
380
Arg Lys Phe Ala
Thr Lys
Ile His
395
Leu Arg Gln Lys
400 <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 130
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr
5 10
Arg Leu Val Gln 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His
Ala Leu Arg Thr
- 244 046157
Leu Pro Pro Tyr Ala 35
Gly Pro Gly Leu Asp 40
Ser Gly Leu Arg Pro 45
Gly Ala Pro Leu Gly 50
Pro Pro Pro Pro Arg 55
Gln Pro Gly Ala Leu 60
Tyr Gly Ala Phe Gly 65
Pro Pro Ser Ser Phe 70
Gln Pro Phe Pro Ala 75
Pro Pro Pro Ala Ala
Gly Ile Ala His Leu
Gln Pro Val Ala Thr
Tyr Pro Gly Arg Ala
100
Ala Ala Pro Pro Asn
105
Ala Pro Gly Gly Pro
110
Gly Pro Gln Pro Ala
115
Pro Ser Ala Ala Ala
120
Pro Pro Pro Pro Ala
125
Ala Leu Gly Gly Met
130
Asp Ala Glu Leu Ile 135
Asp Glu Glu Ala Leu 140
Ser Leu Glu Leu Glu 145
Leu Gly Leu His Arg 150
Val Arg Glu Leu Pro 155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Ala
185
Asp His Leu Met Leu
190
Glu Gly Tyr Arg Leu 195
Val Gln Arg Pro Pro
200
Ser Ala Ala Ala Ala
205
Gly Pro His Ala Leu
210
Arg Thr Leu Pro Pro 215
Tyr Ala Gly Pro Gly
220
Asp Ser Gly Leu Arg 225
Pro Arg Gly Ala Pro 230
Leu Gly Pro Pro Pro 235
Arg Gln Pro Gly Ala
245
Leu Ala Tyr Gly Ala
250
Phe Gly Pro Pro Ser
255
Phe Gln Pro Phe Pro
260
Ala Val Pro Pro Pro
265
Ala Ala Gly Ile Ala
270
Arg
Ala
Val 80
Pro
Pro
His
Thr
Glu 160
Ser
Ala
His
Leu
Pro 240
Ser
His
- 245 046157
Leu Gln Pro Val Ala
275
Thr Pro Tyr Pro Gly
280
Arg Ala Ala Ala Pro 285
Asn Ala Pro Gly Gly
290
Pro Pro Gly Pro Gln
295
Pro Ala Pro Ser Ala
300
Ala Pro Pro Pro Pro 305
Ala His Ala Leu Gly 310
Gly Met Asp Ala Glu 315
Ile Asp Glu Glu Ala
325
Leu Thr Ser Leu Glu
330
Leu Glu Leu Gly Leu
335
Arg Val Arg Glu Leu
340
Pro Glu Leu Phe Leu
345
Gly Gln Ser Glu Phe
350
Cys Phe Ser Asp Leu
355
Gly Ser Ala Pro Pro 360
Ala Gly Ser Val Ser 365
Gln Ser Gln Leu Ile
370
Lys Pro Ser Arg Met
375
Arg Lys Tyr Pro Asn
380
Pro Ser Lys Thr Pro 385
Pro His Glu Arg Pro 390
Tyr Ala Cys Pro Val 395
Ser Cys Asp Arg Arg
405
Phe Ser Arg Ser Asp
410
Asn Leu Val Arg His
415
Arg Ile His Thr Gly
420
Gln Lys Pro Phe Gln
425
Cys Arg Ile Cys Met
430
Asn Phe Ser Arg Glu 435
Asp Asn Leu His Thr 440
His Ile Arg Thr His 445
Gly Glu Lys Pro Phe
450
Ala Cys Asp Ile Cys 455
Gly Arg Lys Phe Ala
460
Ser Asp Glu Leu Val 465
Arg His Thr Lys Ile 470
His Leu Arg Gln Lys 475
Arg Pro Tyr Ala Cys
485
Pro Val Glu Ser Cys
490
Asp Arg Arg Phe Ser
495
Ser Gly Asn Leu Thr
500
Glu His Ile Arg Ile
505
His Thr Gly Gln Lys
510
Phe Gln Cys Arg Ile 515
Cys Met Arg Asn Phe
520
Ser Thr Ser Gly His
525
Pro
Ala
Leu 320
His
Asp
Cys
Arg
Glu 400
Ile
Arg
Thr
Arg
Asp 480
Gln
Pro
Leu
- 246 046157
Val Arg His Ile Arg Thr His Thr
530 535
Gly Glu Lys
Pro Phe Ala Cys Asp 540
Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr
545 550 555 560
Lys Ile His Leu Arg Gln Lys Asp Lys
565 <210> 131 <211> 585 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 131
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
5 1015
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155160
- 247 046157
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Ala Asp His Leu
195
Met Leu Ala Glu Gly 200
Tyr Arg Leu Val Gln 205
Pro Pro Ser Ala Ala
210
Ala Ala His Gly Pro 215
His Ala Leu Arg Thr
220
Pro Pro Tyr Ala Gly 225
Pro Gly Leu Asp Ser 230
Gly Leu Arg Pro Arg 235
Ala Pro Leu Gly Pro
245
Pro Pro Pro Arg Gln
250
Pro Gly Ala Leu Ala
255
Gly Ala Phe Gly Pro
260
Pro Ser Ser Phe Gln
265
Pro Phe Pro Ala Val
270
Pro Pro Ala Ala Gly
275
Ile Ala His Leu Gln
280
Pro Val Ala Thr Pro
285
Pro Gly Arg Ala Ala 290
Ala Pro Pro Asn Ala
295
Pro Gly Gly Pro Pro 300
Pro Gln Pro Ala Pro 305
Ser Ala Ala Ala Pro 310
Pro Pro Pro Ala His 315
Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
325 330 335
Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
340 345 350
Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
355 360 365
Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
370 375 380
Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
385 390 395
Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
405 410 415
Ser
Ser
Arg
Leu
Gly 240
Tyr
Pro
Tyr
Gly
Ala 320
Ser
Leu
Ala
Gly
Arg 400
Glu
- 248 046157
Ser Cys Asp
Arg Arg Phe 420
Ser Arg Ser
425
Asp Asn Leu
Val Arg His Ile
430
Arg Ile His
435
Thr Gly Gln
Lys Pro Phe
440
Gln Cys Arg
Ile Cys Met Arg 445
Asn Phe Ser
450
Arg Glu Asp
Asn Leu His 455
Thr His Ile
460
Arg Thr His Thr
Gly Glu Lys 465
Pro Phe Ala
470
Cys Asp Ile
Cys Gly Arg
475
Lys Phe Ala Arg
480
Ser Asp Glu
Leu Val Arg
485
His Thr Lys
Ile His Leu 490
Arg Gln Lys Asp
495
Arg Pro Tyr
Ala Cys Pro 500
Val Glu Ser
505
Cys Asp Arg
Arg Phe Ser Gln
510
Ser Gly Asn
515
Leu Thr Glu
His Ile Arg
520
Ile His Thr
Gly Gln Lys Pro 525
Phe Gln Cys
530
Arg Ile Cys
Met Arg Asn 535
Phe Ser Thr
540
Ser Gly His Leu
Val Arg His 545
Ile Arg Thr
550
His Thr Gly
Glu Lys Pro 555
Phe Ala Cys Asp
560
Ile Cys Gly
Arg Lys Phe
565
Ala Gln Asn
Ser Thr Leu 570
Thr Glu His Thr
575
Lys Ile His
Leu Arg Gln 580
Lys Asp Lys
585 <210> 132 <211> 523 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 132
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
5 10
Ser Asp Ala Leu 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 20 25
Leu Asp Asp Phe 30
- 249 046157
Asp
Met
Val 65
Glu
Ser
Ala
Pro
Pro 145
Ala
Ala
Val
Pro
Gln 225
Pro
Gln
Met
Leu Asp Met
Leu Gly Ser Asp
Ala Leu Asp Asp Phe Asp Leu Asp 45
Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys 50 55 60
Gly Ser Gln
Tyr
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu 70 75 80
Lys Arg Lys Arg Thr 85
Pro Phe Ser Gly Pro
100
Val Pro Ser Arg Ser 115
Tyr Pro Phe Thr Ser 130
Thr Met Val Phe Pro
150
Pro Ala Pro Pro Gln
165
Pro Ala Met Val Ser
180
Leu Ala Pro Gly Pro
195
Thr Gln Ala Gly Glu 210
Phe Asp Asp Glu Asp
230
Ala Val Phe Thr Asp
245
Leu Leu Asn Gln Gly 260
Leu Met Glu Tyr Pro
275
Tyr Glu Thr Phe Lys
Thr Asp Pro Arg Pro
105
Ser Ala Ser Val Pro
120
Ser Leu Ser Thr Ile 135
Ser Gly Gln Ile Ser
155
Val Leu Pro Gln Ala
170
Ala Leu Ala Gln Ala
185
Pro Gln Ala Val Ala
200
Gly Thr Leu Ser Glu 215
Leu Gly Ala Leu Leu
235
Leu Ala Ser Val Asp
250
Ile Pro Val Ala Pro
265
Glu Ala Ile Thr Arg
280
Ser Ile Met Lys Lys
Pro Pro Arg Arg Ile
110
Lys Pro Ala Pro Gln
125
Asn Tyr Asp Glu Phe 140
Gln Ala Ser Ala Leu
160
Pro Ala Pro Ala Pro
175
Pro Ala Pro Val Pro
190
Pro Pro Ala Pro Lys 205
Ala Leu Leu Gln Leu 220
Gly Asn Ser Thr Asp
240
Asn Ser Glu Phe Gln
255
His Thr Thr Glu Pro
270
Leu Val Thr Gly Ala
285
- 250 046157
Gln Arg Pro Pro Asp
290
Pro Ala Pro Ala Pro
295
Leu Gly Ala Pro Gly 300
Pro Asn Gly Leu Leu 305
Ser Gly Asp Glu Asp 310
Phe Ser Ser Ile Ala 315
Met Asp Phe Ser Ala
325
Leu Leu Gly Ser Gly
330
Ser Gly Ser Arg Asp
335
Arg Glu Gly Met Phe
340
Leu Pro Lys Pro Glu
345
Ala Gly Ser Ala Ile
350
Asp Val Phe Glu Gly 355
Arg Glu Val Cys Gln 360
Pro Lys Arg Ile Arg 365
Phe His Pro Pro Gly
370
Ser Pro Trp Ala Asn
375
Arg Pro Leu Pro Ala 380
Leu Ala Pro Thr Pro 385
Thr Gly Pro Val His 390
Glu Pro Val Gly Ser 395
Thr Pro Ala Pro Val
405
Pro Gln Pro Leu Asp
410
Pro Ala Pro Ala Val
415
Pro Glu Ala Ser His
420
Leu Leu Glu Asp Pro
425
Asp Glu Glu Thr Ser
430
Ala Val Lys Ala Leu 435
Arg Glu Met Ala Asp 440
Thr Val Ile Pro Gln
445
Glu Glu Ala Ala Ile
450
Cys Gly Gln Met Asp
455
Leu Ser His Pro Pro
460
Arg Gly His Leu Asp 465
Glu Leu Thr Thr Thr 470
Leu Glu Ser Met Thr 475
Asp Leu Asn Leu Asp
485
Ser Pro Leu Thr Pro
490
Glu Leu Asn Glu Ile
495
Asp Thr Phe Leu Asn
500
Asp Glu Cys Leu Leu
505
His Ala Met His Ile
510
Leu
Asp 320
Ser
Ser
Pro
Ser
Leu 400
Thr
Gln
Lys
Pro
Glu 480
Leu
Ser
Thr Gly Leu Ser Ile 515
Phe Asp Thr Ser Leu 520
Phe <210> 133 <211> 50
- 251 046157 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 133
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
510
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 2025
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp 3540
Синтетический
Ser Asp Ala Leu 15
Leu Asp Asp Phe 30
Phe Asp Leu Asp 45
Met Leu <210> 134 <211> 275 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 134
Синтетический
Met Ser Gly 1
Arg Phe Pro
Met Gly Met 35
Pro Gln His 50
Ala Gly Asn 65
Gly Thr Val
Leu Glu Met
Asp Gly Thr 20
Gly Gln Phe
Ala Phe Asn
Met Asn Ala
Asn Gly Gly 85
Arg Phe Asn
Asn Ser Gln 100
Gly Ser Leu
Pro Ala Ser
Ala Asp His
Asn Gly Leu 25
Pro Ser Pro 40
Ala Leu Met 55
Thr Ser Gly
His Pro Pro
Phe Met Gly
105
Met Gln Leu
Met Met Ala 10
His His His
His His His
Gly Glu His 60
Ile Arg His 75
Ser Ala Leu 90
Pro Pro Val
Gln Lys Leu
Met Asn His Gly 15
Pro Ala His Arg 30
Gln Gln Gln Gln 45
Ile His Tyr Gly
Ala Met Gly Pro 80
Ala Pro Ala Ala
Ala Ser Gln Gly 110
Asn Asn Gln Tyr
- 252 046157
115 120125
Phe Asn His His Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
130 135140
Pro Ala Ala Gly His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
145 150 155160
Cys Asn Pro Lys His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
165 170175
Gly Ser Ser Thr Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
180 185190
Gly Ser Ser Asn Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala
195 200205
Ser Val Ala His Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
210 215220
Thr Asp Phe Ile Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
225 230 235240
Gly Leu Asp Arg Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
245 250255
Glu Phe Asp Phe Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
260 265270
Val Ser Cys
275 <210> 135 <211> 183 <212> Белок <213>
Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 135
Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg Pro
5 1015
Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr LeuPro
2530
Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly Ala 35 4045
- 253 046157
Pro Leu
Gly Pro
Pro Pro
Ala Phe 65
Gly Pro
Pro Ser
Pro Ala
Ala Gly
Ile Ala 85
Gly Arg
Ala Ala
100
Ala Pro
Gln Pro
Ala Pro 115
Ser Ala
Gly Gly
130
Met Asp
Ala Glu
Glu Leu 145
Glu Leu
Gly Leu
150
Leu Gly
Gln Ser
Glu Phe 165
Pro Ala
Gly Ser
180
Val Ser
Pro Arg 55
Ser Phe
His Leu
Pro Asn
Ala Ala
120
Leu Ile 135
His Arg
Asp Cys
Cys
Gln Pro
Gln Pro
Gln Pro
Ala Pro 105
Pro Pro
Asp Glu
Val Arg
Phe Ser
170
Gly Ala 60
Phe Pro 75
Val Ala
Gly Gly
Pro Pro
Glu Ala
140
Glu Leu 155
Asp Leu
Leu Ala Tyr Gly
Ala Val Pro Pro
Thr Pro Tyr Pro 95
Pro Pro Gly Pro
110
Ala His Ala Leu 125
Leu Thr Ser Leu
Pro Glu Leu Phe
160
Gly Ser Ala Pro
175 <210> 136 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота
- 254 046157 <400> 136
Cys Xaa Cys Xaa His Xaa His 1 5 <210> 137 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 137
Cys Xaa Cys Xaa Cys Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa Cys Xaa
5 10 15
Cys <210> 138 <211> 17 <212> Белок <213> Искусственная последовательность
- 255 046157 <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 138
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa His Xaa Cys Xaa Cys Xaa
5 10 15
Cys <210> 139 <211> 15 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2)
- 256 046157 <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(8) <223> Любая аминокислота <220>
<221> MOD_RES <222> (10)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (15) . . (15) <223> Cys, His, or Asp <400> 139
Cys Xaa Cys Xaa His Xaa Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa
5 10 15 <210> 140 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
- 257 046157 <221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 140
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa Cys Xaa
5 10 15
Cys <210> 141 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 141
Cys Xaa Cys Xaa Cys Xaa His 1 5
- 258 046157 <210> 142 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 142
Cys Xaa Cys Xaa His Xaa Cys 1 5 <210> 143 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12)
- 259 046157 <223> Любая аминокислота <220>
<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 143
Cys Xaa Cys Xaa His Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His Xaa
5 10 15
Cys <210> 144 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220>
<221> MOD_RES
- 260 046157 <222> (16)..(16) <223> Любая аминокислота <400> 144
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His Xaa
5 10 15
Cys <210> 145 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 145
Cys Xaa Cys Xaa Cys Xaa Cys 1 5 <210> 146 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
- 261 046157 <221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 146
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa His Xaa His Xaa
5 10 15
Cys <210> 147 <211> 344 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <220>
<221> MISC_FEATURE <222> (8)..(322) <223> Эта область может содержать 1-15 повторяющихся звеньев Tyr Lys Cys Pro Glu Cys
Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro <220>
<221> NON_CONS <222> (18)..(19) <220>
<221> NON_CONS <222> (39)..(40) <220>
<221> NON_CONS <222> (60)..(61)
- 262 046157
NON_CONS (81) .. (82)
NON_CONS (102) .. (103)
NON_CONS (123)..(124)
NON_CONS (144) .. (145)
NON_CONS (165)..(166)
NON_CONS (186)..(187)
NON_CONS (207)..(208)
NON_CONS (228)..(229)
NON_CONS (249)..(250)
NON_CONS (270)..(271)
NON_CONS (291)..(292)
NON_CONS (312)..(313)
NON_CONS (333)..(334)
Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400>
147
Leu Glu Pro 1
Gly
Glu Lys Pro Tyr Lys 5
Cys Pro Glu Cys Gly 10
Lys Ser 15
Phe Ser His
Gln 20
Arg Thr His Thr Gly
Glu Lys Pro Tyr Lys
Cys Pro
- 263 046157
Glu Cys Gly Lys Ser 35
Phe Ser His Gln Arg 40
Thr His Thr Gly Glu Lys 45
Pro Tyr Lys Cys Pro 50
Glu Cys Gly Lys Ser 55
Phe Ser His Gln Arg Thr 60
His Thr Gly Glu Lys 65
Pro Tyr Lys Cys Pro 70
Glu Cys Gly Lys Ser Phe 75 80
Ser His Gln Arg Thr
His Thr Gly Glu Lys
Pro Tyr Lys Cys Pro Glu 95
Cys Gly Lys Ser Phe
100
Ser His Gln Arg Thr
105
His Thr Gly Glu Lys Pro
110
Tyr Lys Cys Pro Glu 115
Cys Gly Lys Ser Phe 120
Ser His Gln Arg Thr His
125
Thr Gly Glu Lys Pro
130
Tyr Lys Cys Pro Glu
135
Cys Gly Lys Ser Phe Ser 140
His Gln Arg Thr His 145
Thr Gly Glu Lys Pro 150
Tyr Lys Cys Pro Glu Cys
155 160
Gly Lys Ser Phe Ser
165
His Gln Arg Thr His
170
Thr Gly Glu Lys Pro Tyr
175
Lys Cys Pro Glu Cys
180
Gly Lys Ser Phe Ser
185
His Gln Arg Thr His Thr
190
Gly Glu Lys Pro Tyr
195
Lys Cys Pro Glu Cys 200
Gly Lys Ser Phe Ser His
205
Gln Arg Thr His Thr
210
Gly Glu Lys Pro Tyr
215
Lys Cys Pro Glu Cys Gly
220
Lys Ser Phe Ser His 225
Gln Arg Thr His Thr 230
Gly Glu Lys Pro Tyr Lys
235 240
Cys Pro Glu Cys Gly
245
Lys Ser Phe Ser His
250
Gln Arg Thr His Thr Gly
255
Glu Lys Pro Tyr Lys
260
Cys Pro Glu Cys Gly
265
Lys Ser Phe Ser His Gln
270
Arg Thr His Thr Gly
Glu Lys Pro Tyr Lys
Cys Pro Glu Cys Gly Lys
- 264 046157
275
280
Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys
290 295300
Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr
305 310315
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
325330
285
Pro Tyr Lys Cys
His Thr Gly Glu
320
Ser His Gln Arg
335
Thr His Thr Gly Lys Lys Thr Ser
340 <210> 148 <211> 292 <212> Белок <213> Искусственная последовательность <220>
< 223> Описание искусственной последовательности полипептид
Синтетический <220>
< 221> MOD_RES < 222> (8) .. (57) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (8)..(57) < 223> Эта область может содержать 1-50 остатков <220>
< 221> MOD_RES < 222> (65).. (114) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (65)..(114) < 223> Эта область может содержать 1-50 остатков <220>
< 221> MOD_RES < 222> (122)..(171) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (122)..(171) < 223> Эта область может содержать 1-50 остатков <220>
< 221> MOD_RES < 222> (179)..(228) < 223> Любая аминокислота
- 265 046157 <220>
<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1<220>
<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1<400> 148
Arg Ser Asp Asn Leu Val Arg Xaa Xaa 1 5
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
25
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
40
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
55
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 85
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105
Xaa Xaa Arg Ser Asp Glu Leu Val Arg
115 120
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165
Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 статков статков
Xaa Xaa Xaa Xaa Xaa Xaa
Xaa Xaa Xaa Xaa Xaa Xaa 30
Xaa Xaa Xaa Xaa Xaa Xaa 45
Glu Asp Asn Leu His Thr 60
Xaa Xaa Xaa Xaa Xaa Xaa
80
Xaa Xaa Xaa Xaa Xaa Xaa 95
Xaa Xaa Xaa Xaa Xaa Xaa
110
Xaa Xaa Xaa Xaa Xaa Xaa
125
Xaa Xaa Xaa Xaa Xaa Xaa
140
Xaa Xaa Xaa Xaa Xaa Xaa
155 160
Xaa Gln Ser Gly Asn Leu 175
Xaa Xaa Xaa Xaa Xaa Xaa
190
- 266 046157
Xaa Xaa
Xaa Xaa
210
Xaa Xaa 225
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 195
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 260
Xaa Xaa 275
Xaa Xaa
Xaa Xaa
Thr Ser
230
Xaa Xaa 245
Xaa Xaa
Xaa Xaa
Xaa Xaa
200
Xaa Xaa 215
Gly His
Xaa Xaa
Xaa Xaa
Xaa Xaa
280
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
220
Leu Val Arg Xaa
235
Xaa Xaa
250
Xaa Xaa
Xaa Xaa 265
Xaa Xaa
Xaa Xaa 205
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
270
Xaa Xaa
Xaa Xaa
Xaa Xaa
240
Xaa Xaa 255
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Gln Asn Ser
285
Thr Leu Thr Glu
290 <210> 149 <211> 292 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <220>
< 221> MOD_RES < 222> (8) .. (57) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (8)..(57) < 223> Эта область может содержать 1-50 остатков <220>
< 221> MOD_RES < 222> (65)..(114) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (65)..(114) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (122)..(171)
- 267 046157 <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-50 остатков <400> 149 Arg Ser Asp 1
Asn Leu Val
Arg Xaa Xaa
Xaa Xaa Xaa 10
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 20
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 45
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 55
His Arg Thr
Thr Leu Thr
Xaa Xaa Xaa 65
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 90
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 100
Xaa Xaa Xaa
105
Xaa Xaa Xaa
Xaa Xaa Xaa
110
Xaa Xaa Arg
115
Glu Asp Asn
Leu His Thr
120
Xaa Xaa Xaa
Xaa Xaa Xaa 125
Xaa Xaa Xaa
130
Xaa Xaa Xaa
Xaa Xaa Xaa 135
Xaa Xaa Xaa
140
Xaa Xaa Xaa
Xaa
Xaa
Xaa
Asn
Xaa 80
Xaa
Xaa
Xaa
Xaa
- 268 046157
Xaa Xaa 145
Xaa Xaa
Thr Glu
Xaa Xaa
Xaa Xaa 210
Xaa Xaa 225
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
180
Xaa Xaa 195
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
260
Xaa Xaa 275
Asn Leu His Thr
290 <210> 150 <211> 292 <212> Белок
Xaa Xaa
150
Xaa Xaa 165
Xaa Xaa
Xaa Xaa
Xaa Xaa
Gln Ser
230
Xaa Xaa 245
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
200
Xaa Xaa 215
Ser Ser
Xaa Xaa
Xaa Xaa
Xaa Xaa
280
Xaa Xaa
Xaa Xaa
170
Xaa Xaa 185
Xaa Xaa
Xaa Xaa
Xaa Xaa 155
Xaa Thr
Xaa Xaa
Xaa Xaa
Xaa Xaa 220
Xaa Xaa
Ser His
Xaa Xaa
190
Xaa Xaa 205
Xaa Xaa
Xaa Xaa
160
Ser Leu 175
Xaa Xaa
Xaa Xaa
Xaa Xaa
Leu Val Arg Xaa
235
Xaa Xaa
Xaa Xaa
240
Xaa Xaa
250
Xaa Xaa 265
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
270 <213> Искусственная последовательность <220>
Xaa Xaa 255
Xaa Xaa
Xaa Arg Glu Asp 285 <223> Описание искусственной последовательности: Синтетический полипептид <220>
<221> MOD_RES <222> (8) .. (57) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (8)..(57) <223> Эта область может содержать 1-50 остатков <221> MOD_RES <220>
- 269 046157 <222> (65) .. (114) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (65)..(114) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (122)..(171) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-50 остатков <400> 150
Asp Pro Gly Ala Leu Val Arg Xaa 1 5
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 25
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 35
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 45
Xaa Xaa 15
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 55
Xaa Arg Ser Asp Asn Leu Val Arg 60
Xaa Xaa 65
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 75
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 85
Xaa Xaa
Xaa
Xaa Xaa Xaa 90
Xaa Xaa
Xaa Xaa 80
Xaa Xaa 95
- 270 046157
Xaa
Xaa
Xaa
Xaa
100
Xaa
Xaa
Xaa
Xaa
Xaa
105
Xaa
Xaa
Xaa
Xaa
Xaa
110
Xaa
Xaa
Xaa
Xaa
Gln
115
Ser
Gly
Asp
Leu
Arg 120
Arg
Xaa
Xaa
Xaa
Xaa
125
Xaa
Xaa
Xaa
Xaa
Xaa
130
Xaa
Xaa
Xaa
Xaa
Xaa
135
Xaa
Xaa
Xaa
Xaa
Xaa
140
Xaa
Xaa
Xaa
Xaa
Xaa
145
Xaa
Xaa
Xaa
Xaa
Xaa
150
Xaa
Xaa
Xaa
Xaa
Xaa
155
Xaa
Xaa
Xaa
Xaa
Xaa
160
Xaa
Xaa
Xaa
Xaa
Xaa
165
Xaa
Xaa
Xaa
Xaa
Xaa
170
Xaa
Thr
His
Leu
Asp 175
Leu
Ile
Arg
Xaa
Xaa
180
Xaa
Xaa
Xaa
Xaa
Xaa
185
Xaa
Xaa
Xaa
Xaa
Xaa
190
Xaa
Xaa
Xaa
Xaa
Xaa
195
Xaa
Xaa
Xaa
Xaa
Xaa
200
Xaa
Xaa
Xaa
Xaa
Xaa
205
Xaa
Xaa
Xaa
Xaa
Xaa
210
Xaa
Xaa
Xaa
Xaa
Xaa
215
Xaa
Xaa
Xaa
Xaa
Xaa
220
Xaa
Xaa
Xaa
Xaa
Xaa
225
Xaa
Xaa
Xaa
Thr
Ser
230
Gly
Asn
Leu
Val
Arg 235
Xaa
Xaa
Xaa
Xaa
Xaa
240
Xaa
Xaa
Xaa
Xaa
Xaa
245
Xaa
Xaa
Xaa
Xaa
Xaa
250
Xaa
Xaa
Xaa
Xaa
Xaa
255
Xaa
Xaa
Xaa
Xaa
Xaa
260
Xaa
Xaa
Xaa
Xaa
Xaa
265
Xaa
Xaa
Xaa
Xaa
Xaa
270
Xaa
Xaa
Xaa
Xaa
Xaa
275
Xaa
Xaa
Xaa
Xaa
Xaa
280
Xaa
Xaa
Xaa
Xaa
Xaa
285
Arg
Ser
Asp
Asn Leu Val Arg
290 <210> 151 <211> 463 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <220>
- 271 046157 <221> MOD_RES <222> (8) .. (57) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (8)..(57) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (65).. (114) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (65)..(114) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (122)..(171) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (293)..(342) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (293)..(342) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (350)..(399) <223> Любая аминокислота остатков остатков остатков остатков остатков остатков
- 272 046157 <220>
<221> MISC_FEATURE <222> (350)..(399) <223> Эта область может содержать 1<220>
<221> MOD_RES <222> (407)..(456) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (407)..(456) <223> Эта область может содержать 1<400> 151
Arg Arg Asp Glu Leu Asn Val Xaa Xaa 1 5
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
25
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
40
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
55
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 85
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105
Xaa Xaa Arg Ser Asp Asp Leu Val Arg
115 120
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165
Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 статков статков
Xaa Xaa Xaa Xaa Xaa Xaa
Xaa Xaa Xaa Xaa Xaa Xaa 30
Xaa Xaa Xaa Xaa Xaa Xaa 45
Ser Asp His Leu Thr Asn 60
Xaa Xaa Xaa Xaa Xaa Xaa
80
Xaa Xaa Xaa Xaa Xaa Xaa 95
Xaa Xaa Xaa Xaa Xaa Xaa
110
Xaa Xaa Xaa Xaa Xaa Xaa
125
Xaa Xaa Xaa Xaa Xaa Xaa
140
Xaa Xaa Xaa Xaa Xaa Xaa
155 160
Xaa Arg Ser Asp Asn Leu 175
Xaa Xaa Xaa Xaa Xaa Xaa
190
- 273 046157
Xaa Xaa Xaa
195
Xaa Xaa Xaa
Xaa Xaa Xaa
200
Xaa Xaa Xaa
Xaa Xaa Xaa 205
Xaa Xaa Xaa
210
Xaa Xaa Xaa
Xaa Xaa Xaa 215
Xaa Xaa Xaa
220
Xaa Xaa Xaa
Xaa Xaa Xaa 225
Xaa His Arg
230
Thr Thr Leu
Thr Asn Xaa
235
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
245
Xaa Xaa Xaa
Xaa Xaa Xaa 250
Xaa Xaa Xaa
255
Xaa Xaa Xaa
Xaa Xaa Xaa 260
Xaa Xaa Xaa
265
Xaa Xaa Xaa
Xaa Xaa Xaa
270
Xaa Xaa Xaa
275
Xaa Xaa Xaa
Xaa Xaa Xaa
280
Xaa Xaa Xaa
Xaa Arg Glu 285
Asn Leu His
290
Thr Xaa Xaa
Xaa Xaa Xaa 295
Xaa Xaa Xaa
300
Xaa Xaa Xaa
Xaa Xaa Xaa 305
Xaa Xaa Xaa
310
Xaa Xaa Xaa
Xaa Xaa Xaa
315
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
325
Xaa Xaa Xaa
Xaa Xaa Xaa 330
Xaa Xaa Xaa
335
Xaa Xaa Xaa
Xaa Xaa Xaa 340
Thr Ser His
345
Ser Leu Thr
Glu Xaa Xaa
350
Xaa Xaa Xaa
355
Xaa Xaa Xaa
Xaa Xaa Xaa
360
Xaa Xaa Xaa
Xaa Xaa Xaa 365
Xaa Xaa Xaa
370
Xaa Xaa Xaa
Xaa Xaa Xaa 375
Xaa Xaa Xaa
380
Xaa Xaa Xaa
Xaa Xaa Xaa 385
Xaa Xaa Xaa
390
Xaa Xaa Xaa
Xaa Xaa Xaa
395
Xaa Xaa Xaa
Ser Ser Ser
Leu Val Arg
405
Xaa Xaa Xaa
Xaa Xaa Xaa 410
Xaa Xaa Xaa
415
Xaa Xaa Xaa
Xaa Xaa Xaa 420
Xaa Xaa Xaa
425
Xaa Xaa Xaa
Xaa Xaa Xaa
430
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa
Xaa
Xaa 240
Xaa
Xaa
Asp
Xaa
Xaa 320
Xaa
Xaa
Xaa
Xaa
Gln 400
Xaa
Xaa
Xaa
- 274 046157
435
440
445
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Glu Asp Asn Leu His Thr
450 455 460 <210> 152 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 152
Arg Ser Asp Asn Leu Val Arg
5 <210> 153 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 153
Arg Glu Asp Asn Leu His Thr
5 <210> 154 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 154 Arg Ser Asp Glu Leu Val Arg 1 5 <210> 155 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 155 Gln Ser Gly Asn Leu Thr Glu 1 5
- 275 046157 <210> 156 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 156
Thr Ser Gly His Leu Val Arg
5 <210> 157 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 157
Gln Asn Ser Thr Leu Thr Glu
5 <210> 158 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 158
Asp Pro Gly Ala Leu Val Arg
5 <210> 159 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 159
His Arg Thr Thr Leu Thr Asn
5 <210> 160 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический
- 276 046157 пептид <400> 160
Gln Ser Gly Asp Leu Arg Arg <210> 161 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 161
Thr Ser His Ser Leu Thr Glu
5 <210> 162 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 162
Thr His Leu Asp Leu Ile Arg
5 <210> 163 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 163
Gln Ser Ser Ser Leu Val Arg
5 <210> 164 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 164
Thr Ser Gly Asn Leu Val Arg
5
- 277 046157 <210> 165 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 165
Arg Arg Asp Glu Leu Asn Val
5 <210> 166 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 166
Arg Ser Asp Asp Leu Val Arg
5 <210> 167 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 167
Arg Ser Asp His Leu Thr Asn
5 <210> 168 <211> 16 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 168
Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys 1 5 10 15 <210> 169 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический
- 278 046157 пептид <400> 169
Pro Lys Lys Lys Arg Lys Val <210> 170 <211> 16 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 170
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 171 <211> 9 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 171
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
5 <210> 172 <211> 2009 <212> Белок <213> Homo sapiens <400> 172
Met Glu Gln Thr Val Leu Val Pro Pro Gly Pro Asp Ser Phe Asn Phe
5 1015
Phe Thr Arg Glu Ser Leu Ala Ala Ile Glu Arg Arg Ile Ala Glu Glu 20 2530
Lys Ala Lys Asn Pro Lys Pro Asp Lys Lys Asp Asp Asp Glu Asn Gly 35 4045
Pro Lys Pro Asn Ser Asp Leu Glu Ala Gly Lys Asn Leu Pro Phe Ile 50 5560
Tyr Gly Asp Ile Pro Pro Glu Met Val Ser Glu Pro Leu Glu Asp Leu 65 70 7580
Asp Pro Tyr Tyr Ile Asn Lys Lys Thr Phe Ile Val Leu Asn Lys Gly 85 9095
- 279 046157
Lys Ala Ile Phe Arg
100
Phe Ser Ala Thr Ser
105
Ala Leu Tyr Ile Leu
110
Pro Phe Asn Pro Leu
115
Arg Lys Ile Ala Ile 120
Lys Ile Leu Val His 125
Leu Phe Ser Met Leu
130
Ile Met Cys Thr Ile
135
Leu Thr Asn Cys Val 140
Met Thr Met Ser Asn 145
Pro Pro Asp Trp Thr 150
Lys Asn Val Glu Tyr 155
Phe Thr Gly Ile Tyr
165
Thr Phe Glu Ser Leu
170
Ile Lys Ile Ile Ala
175
Gly Phe Cys Leu Glu
180
Asp Phe Thr Phe Leu
185
Arg Asp Pro Trp Asn
190
Leu Asp Phe Thr Val 195
Ile Thr Phe Ala Tyr
200
Val Thr Glu Phe Val
205
Leu Gly Asn Val Ser
210
Ala Leu Arg Thr Phe 215
Arg Val Leu Arg Ala
220
Lys Thr Ile Ser Val 225
Ile Pro Gly Leu Lys 230
Thr Ile Val Gly Ala 235
Ile Gln Ser Val Lys
245
Lys Leu Ser Asp Val
250
Met Ile Leu Thr Val
255
Cys Leu Ser Val Phe
260
Ala Leu Ile Gly Leu
265
Gln Leu Phe Met Gly
270
Leu Arg Asn Lys Cys
275
Ile Gln Trp Pro Pro
280
Thr Asn Ala Ser Leu
285
Glu His Ser Ile Glu
290
Lys Asn Ile Thr Val
295
Asn Tyr Asn Gly Thr
300
Ile Asn Glu Thr Val 305
Phe Glu Phe Asp Trp 310
Lys Ser Tyr Ile Gln 315
Ser Arg Tyr His Tyr
325
Phe Leu Glu Gly Phe
330
Leu Asp Ala Leu Leu
335
Gly Asn Ser Ser Asp
Ala Gly Gln Cys Pro
Glu Gly Tyr Met Cys
Thr
Ser
Phe
Thr 160
Arg
Trp
Asp
Leu
Leu 240
Phe
Asn
Glu
Leu
Asp 320
Cys
Val
- 280 046157
340
345
350
Lys Ala Gly Arg Asn
355
Pro Asn Tyr Gly Tyr 360
Thr Ser Phe Asp Thr 365
Ser Trp Ala Phe Leu
370
Ser Leu Phe Arg Leu
375
Met Thr Gln Asp Phe 380
Glu Asn Leu Tyr Gln 385
Leu Thr Leu Arg Ala 390
Ala Gly Lys Thr Tyr 395
Ile Phe Phe Val Leu
405
Val Ile Phe Leu Gly
410
Ser Phe Tyr Leu Ile
415
Leu Ile Leu Ala Val
420
Val Ala Met Ala Tyr
425
Glu Glu Gln Asn Gln
430
Thr Leu Glu Glu Ala
435
Glu Gln Lys Glu Ala 440
Glu Phe Gln Gln Met
445
Glu Gln Leu Lys Lys 450
Gln Gln Glu Ala Ala
455
Gln Gln Ala Ala Thr
460
Thr Ala Ser Glu His 465
Ser Arg Glu Pro Ser 470
Ala Ala Gly Arg Leu 475
Asp Ser Ser Ser Glu
485
Ala Ser Lys Leu Ser
490
Ser Lys Ser Ala Lys
495
Arg Arg Asn Arg Arg
500
Lys Lys Arg Lys Gln
505
Lys Glu Gln Ser Gly
510
Glu Glu Lys Asp Glu 515
Asp Glu Phe Gln Lys 520
Ser Glu Ser Glu Asp
525
Ile Arg Arg Lys Gly
530
Phe Arg Phe Ser Ile 535
Glu Gly Asn Arg Leu
540
Tyr Glu Lys Arg Tyr 545
Ser Ser Pro His Gln 550
Ser Leu Leu Ser Ile 555
Gly Ser Leu Phe Ser
565
Pro Arg Arg Asn Ser
570
Arg Thr Ser Leu Phe
575
Phe Arg Gly Arg Ala
580
Lys Asp Val Gly Ser
585
Glu Asn Asp Phe Ala
590
Phe
Trp
Met 400
Asn
Ala
Ile
Ala
Ser 480
Glu
Gly
Ser
Thr
Arg 560
Ser
Asp
- 281 046157
Asp Glu His Ser Thr Phe Glu Asp Asn
595 600
Phe Val Pro Arg Arg His Gly Glu Arg
610 615
Thr Ser Arg Ser Ser Arg Met Leu Ala
625 630
Met His Ser Thr Val Asp Cys Asn Gly 645
Pro Ser Val Pro Thr Ser Pro Val Gly
660 665
Ile Asp Lys Pro Ala Thr Asp Asp Asn
675 680
Met Arg Lys Arg Arg Ser Ser Ser Phe
690 695
Glu Asp Pro Ser Gln Arg Gln Arg Ala
705 710
Thr Asn Thr Val Glu Glu Leu Glu Glu
725
Cys Trp Tyr Lys Phe Ser Asn Ile Phe
740 745
Tyr Trp Leu Lys Val Lys His Val Val
755 760
Phe Val Asp Leu Ala Ile Thr Ile Cys
770 775
Met Ala Met Glu His Tyr Pro Met Thr 785 790
Thr Val Gly Asn Leu Val Phe Thr Gly
805
Leu Lys Ile Ile Ala Met Asp Pro Tyr
820 825
Asn Ile Phe Asp Gly Phe Ile Val Thr
835 840
Ser Arg Arg Asp Ser Leu
605
Asn Ser Asn Leu Ser Gln
620
Phe Pro Ala Asn Gly Lys
635 640
Val Ser Leu Val Gly Gly
655
Leu Leu Pro Glu Val Ile
670
Thr Thr Thr Glu Thr Glu
685
Val Ser Met Asp Phe Leu
700
Ser Ile Ala Ser Ile Leu
715 720
Arg Gln Lys Cys Pro Pro
735
Ile Trp Asp Cys Ser Pro
750
Leu Val Val Met Asp Pro 765
Val Leu Asn Thr Leu Phe
780
His Phe Asn Asn Val Leu
795 800
Phe Thr Ala Glu Met Phe
815
Tyr Phe Gln Glu Gly Trp
830
Ser Leu Val Glu Leu Gly 845
- 282 046157
Leu
Arg 865
Lys
Leu
Gly
Leu
Phe 945
Glu
Val
Ser
Met
Ala
Ile
Leu
Ile
Ser
Ala Asn Val Glu Gly 850
Val Phe Lys Leu Ala
870
Ile Ile Gly Asn Ser
885
Ala Ile Ile Val Phe
900
Lys Ser Tyr Lys Asp
915
Pro Arg Trp His Met 930
Arg Val Leu Cys Gly
950
Val Ala Gly Gln Ala
965
Ile Gly Asn Leu Val 980
Leu Ser Val Leu Arg 855
Lys Ser Trp Pro Thr
875
Val Gly Ala Leu Gly
890
Ile Phe Ala Val Val
905
Cys Val Cys Lys Ile 920
Asn Asp Phe Phe His 935
Glu Trp Ile Glu Thr
955
Met Cys Leu Thr Val
970
Val Leu Asn Leu Phe
985
Ser Phe Ser Ala Asp Asn
995
Ser Phe Arg Leu Leu 860
Leu Asn Met Leu Ile
880
Asn Leu Thr Leu Val
895
Gly Met Gln Leu Phe 910
Ala Ser Asp Cys Gln 925
Ser Phe Leu Ile Val 940
Met Trp Asp Cys Met
960
Phe Met Met Val Met
975
Leu Ala Leu Leu Leu
990
Leu Ala Ala Thr Asp Asp Asp Asn Glu 1000 1005
Asn 1010 Asn Leu Gln Ile Ala 1015 Val Asp Arg Met His 1020 Lys Gly Val
Tyr 1025 Val Lys Arg Lys Ile 1030 Tyr Glu Phe Ile Gln 1035 Gln Ser Phe
Arg 1040 Lys Gln Lys Ile Leu 1045 Asp Glu Ile Lys Pro 1050 Leu Asp Asp
Asn 1055 Asn Lys Lys Asp Ser 1060 Cys Met Ser Asn His 1065 Thr Ala Glu
Gly 1070 Lys Asp Leu Asp Tyr 1075 Leu Lys Asp Val Asn 1080 Gly Thr Thr
Gly 1085 Ile Gly Thr Gly Ser 1090 Ser Val Glu Lys Tyr 1095 Ile Ile Asp
- 283 046157
Glu Ser 1100 Asp Tyr Met Ser Phe 1105 Ile Asn Asn Pro Ser 1110 Leu Thr Val
Thr Val 1115 Pro Ile Ala Val Gly 1120 Glu Ser Asp Phe Glu 1125 Asn Leu Asn
Thr Glu 1130 Asp Phe Ser Ser Glu 1135 Ser Asp Leu Glu Glu 1140 Ser Lys Glu
Lys Leu 1145 Asn Glu Ser Ser Ser 1150 Ser Ser Glu Gly Ser 1155 Thr Val Asp
Ile Gly 1160 Ala Pro Val Glu Glu 1165 Gln Pro Val Val Glu 1170 Pro Glu Glu
Thr Leu 1175 Glu Pro Glu Ala Cys 1180 Phe Thr Glu Gly Cys 1185 Val Gln Arg
Phe Lys 1190 Cys Cys Gln Ile Asn 1195 Val Glu Glu Gly Arg 1200 Gly Lys Gln
Trp Trp 1205 Asn Leu Arg Arg Thr 1210 Cys Phe Arg Ile Val 1215 Glu His Asn
Trp Phe 1220 Glu Thr Phe Ile Val 1225 Phe Met Ile Leu Leu 1230 Ser Ser Gly
Ala Leu 1235 Ala Phe Glu Asp Ile 1240 Tyr Ile Asp Gln Arg 1245 Lys Thr Ile
Lys Thr 1250 Met Leu Glu Tyr Ala 1255 Asp Lys Val Phe Thr 1260 Tyr Ile Phe
Ile Leu 1265 Glu Met Leu Leu Lys 1270 Trp Val Ala Tyr Gly 1275 Tyr Gln Thr
Tyr Phe 1280 Thr Asn Ala Trp Cys 1285 Trp Leu Asp Phe Leu 1290 Ile Val Asp
Val Ser 1295 Leu Val Ser Leu Thr 1300 Ala Asn Ala Leu Gly 1305 Tyr Ser Glu
Leu Gly 1310 Ala Ile Lys Ser Leu 1315 Arg Thr Leu Arg Ala 1320 Leu Arg Pro
Leu Arg Ala Leu Ser Arg Phe Glu Gly Met Arg Val Val Val Asn
- 284 046157
1325 1330 1335
Ala Leu 1340 Leu Gly Ala Ile Pro 1345 Ser Ile Met Asn Val 1350 Leu Leu Val
Cys Leu 1355 Ile Phe Trp Leu Ile 1360 Phe Ser Ile Met Gly 1365 Val Asn Leu
Phe Ala 1370 Gly Lys Phe Tyr His 1375 Cys Ile Asn Thr Thr 1380 Thr Gly Asp
Arg Phe 1385 Asp Ile Glu Asp Val 1390 Asn Asn His Thr Asp 1395 Cys Leu Lys
Leu Ile 1400 Glu Arg Asn Glu Thr 1405 Ala Arg Trp Lys Asn 1410 Val Lys Val
Asn Phe 1415 Asp Asn Val Gly Phe 1420 Gly Tyr Leu Ser Leu 1425 Leu Gln Val
Ala Thr 1430 Phe Lys Gly Trp Met 1435 Asp Ile Met Tyr Ala 1440 Ala Val Asp
Ser Arg 1445 Asn Val Glu Leu Gln 1450 Pro Lys Tyr Glu Glu 1455 Ser Leu Tyr
Met Tyr 1460 Leu Tyr Phe Val Ile 1465 Phe Ile Ile Phe Gly 1470 Ser Phe Phe
Thr Leu 1475 Asn Leu Phe Ile Gly 1480 Val Ile Ile Asp Asn 1485 Phe Asn Gln
Gln Lys 1490 Lys Lys Phe Gly Gly 1495 Gln Asp Ile Phe Met 1500 Thr Glu Glu
Gln Lys 1505 Lys Tyr Tyr Asn Ala 1510 Met Lys Lys Leu Gly 1515 Ser Lys Lys
Pro Gln 1520 Lys Pro Ile Pro Arg 1525 Pro Gly Asn Lys Phe 1530 Gln Gly Met
Val Phe 1535 Asp Phe Val Thr Arg 1540 Gln Val Phe Asp Ile 1545 Ser Ile Met
Ile Leu Ile Cys Leu Asn Met Val Thr Met Met Val Glu Thr Asp
1550 1555 1560
- 285 046157
Asp Gln 1565 Ser Glu Tyr Val Thr 1570 Thr Ile Leu Ser Arg 1575 Ile Asn Leu
Val Phe Ile Val Leu Phe Thr Gly Glu Cys Val Leu Lys Leu Ile
1580 1585 1590
Ser Leu Arg His Tyr Tyr Phe Thr Ile Gly Trp Asn Ile Phe Asp
1595 1600 1605
Phe Val Val Val Ile Leu Ser Ile Val Gly Met Phe Leu Ala Glu
1610 1615 1620
Leu Ile Glu Lys Tyr Phe Val Ser Pro Thr Leu Phe Arg Val Ile
1625 1630 1635
Arg Leu 1640 Ala Arg Ile Gly Arg 1645 Ile Leu Arg Leu Ile 1650 Lys Gly Ala
Lys Gly 1655 Ile Arg Thr Leu Leu 1660 Phe Ala Leu Met Met 1665 Ser Leu Pro
Ala Leu 1670 Phe Asn Ile Gly Leu 1675 Leu Leu Phe Leu Val 1680 Met Phe Ile
Tyr Ala 1685 Ile Phe Gly Met Ser 1690 Asn Phe Ala Tyr Val 1695 Lys Arg Glu
Val Gly 1700 Ile Asp Asp Met Phe 1705 Asn Phe Glu Thr Phe 1710 Gly Asn Ser
Met Ile 1715 Cys Leu Phe Gln Ile 1720 Thr Thr Ser Ala Gly 1725 Trp Asp Gly
Leu Leu 1730 Ala Pro Ile Leu Asn 1735 Ser Lys Pro Pro Asp 1740 Cys Asp Pro
Asn Lys 1745 Val Asn Pro Gly Ser 1750 Ser Val Lys Gly Asp 1755 Cys Gly Asn
Pro Ser 1760 Val Gly Ile Phe Phe 1765 Phe Val Ser Tyr Ile 1770 Ile Ile Ser
Phe Leu 1775 Val Val Val Asn Met 1780 Tyr Ile Ala Val Ile 1785 Leu Glu Asn
Phe Ser 1790 Val Ala Thr Glu Glu 1795 Ser Ala Glu Pro Leu 1800 Ser Glu Asp
- 286 046157
Asp Phe 1805 Glu Met Phe Tyr Glu 1810 Val Trp Glu Lys Phe 1815 Asp Pro Asp
Ala Thr 1820 Gln Phe Met Glu Phe 1825 Glu Lys Leu Ser Gln 1830 Phe Ala Ala
Ala Leu 1835 Glu Pro Pro Leu Asn 1840 Leu Pro Gln Pro Asn 1845 Lys Leu Gln
Leu Ile 1850 Ala Met Asp Leu Pro 1855 Met Val Ser Gly Asp 1860 Arg Ile His
Cys Leu 1865 Asp Ile Leu Phe Ala 1870 Phe Thr Lys Arg Val 1875 Leu Gly Glu
Ser Gly 1880 Glu Met Asp Ala Leu 1885 Arg Ile Gln Met Glu 1890 Glu Arg Phe
Met Ala 1895 Ser Asn Pro Ser Lys 1900 Val Ser Tyr Gln Pro 1905 Ile Thr Thr
Thr Leu 1910 Lys Arg Lys Gln Glu 1915 Glu Val Ser Ala Val 1920 Ile Ile Gln
Arg Ala 1925 Tyr Arg Arg His Leu 1930 Leu Lys Arg Thr Val 1935 Lys Gln Ala
Ser Phe 1940 Thr Tyr Asn Lys Asn 1945 Lys Ile Lys Gly Gly 1950 Ala Asn Leu
Leu Ile 1955 Lys Glu Asp Met Ile 1960 Ile Asp Arg Ile Asn 1965 Glu Asn Ser
Ile Thr 1970 Glu Lys Thr Asp Leu 1975 Thr Met Ser Thr Ala 1980 Ala Cys Pro
Pro Ser 1985 Tyr Asp Arg Val Thr 1990 Lys Pro Ile Val Glu 1995 Lys His Glu
Gln Glu 2000 Gly Lys Asp Glu Lys 2005 Ala Lys Gly Lys
<210> <211> <212> <213> 173 1052 Белок Homo sapiens
<400> 173
- 287 046157
Lys Arg Asn Tyr Ile Leu Gly Leu Ala 1 5
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg
25
Arg Leu Phe Lys Glu Ala Asn Val Glu
40
Lys Arg Gly Ala Arg Arg Leu Lys Arg
55
Arg Val Lys Lys Leu Leu Phe Asp Tyr 65 70
Glu Leu Ser Gly Ile Asn Pro Tyr Glu 85
Gln Lys Leu Ser Glu Glu Glu Phe Ser
100 105
Lys Arg Arg Gly Val His Asn Val Asn
115 120
Asn Glu Leu Ser Thr Lys Glu Gln Ile
130 135
Glu Glu Lys Tyr Val Ala Glu Leu Gln
145 150
Gly Glu Val Arg Gly Ser Ile Asn Arg
165
Lys Glu Ala Lys Gln Leu Leu Lys Val
180 185
Asp Gln Ser Phe Ile Asp Thr Tyr Ile
195 200
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly
210 215
Ile Lys Glu Trp Tyr Glu Met Leu Met
225 230
Glu Glu Leu Arg Ser Val Lys Tyr Ala
245
Gly Ile Thr Ser Val Gly 15
Val Ile Asp Ala Gly Val
Asn Glu Gly Arg Arg Ser 45
Arg Arg His Arg Ile Gln 60
Leu Leu Thr Asp His Ser 75 80
Arg Val Lys Gly Leu Ser 95
Ala Leu Leu His Leu Ala
110
Val Glu Glu Asp Thr Gly
125
Arg Asn Ser Lys Ala Leu
140
Glu Arg Leu Lys Lys Asp
155 160
Lys Thr Ser Asp Tyr Val
175
Lys Ala Tyr His Gln Leu
190
Leu Leu Glu Thr Arg Arg
205
Pro Phe Gly Trp Lys Asp
220
His Cys Thr Tyr Phe Pro
235 240
Asn Ala Asp Leu Tyr Asn
255
- 288 046157
Ala Leu Asn Asp Leu
260
Asn Asn Leu Val Ile
265
Thr Arg Asp Glu Asn
270
Lys Leu Glu Tyr Tyr 275
Glu Lys Phe Gln Ile
280
Ile Glu Asn Val Phe
285
Gln Lys Lys Lys Pro 290
Thr Leu Lys Gln Ile
295
Ala Lys Glu Ile Leu
300
Asn Glu Glu Asp Ile 305
Lys Gly Tyr Arg Val 310
Thr Ser Thr Gly Lys 315
Glu Phe Thr Asn Leu
325
Lys Val Tyr His Asp
330
Ile Lys Asp Ile Thr
335
Arg Lys Glu Ile Ile
340
Glu Asn Ala Glu Leu
345
Leu Asp Gln Ile Ala
350
Ile Leu Thr Ile Tyr
355
Gln Ser Ser Glu Asp 360
Ile Gln Glu Glu Leu
365
Asn Leu Asn Ser Glu
370
Leu Thr Gln Glu Glu
375
Ile Glu Gln Ile Ser
380
Leu Lys Gly Tyr Thr 385
Gly Thr His Asn Leu 390
Ser Leu Lys Ala Ile 395
Leu Ile Leu Asp Glu
405
Leu Trp His Thr Asn
410
Asp Asn Gln Ile Ala
415
Phe Asn Arg Leu Lys
420
Leu Val Pro Lys Lys
425
Val Asp Leu Ser Gln
430
Lys Glu Ile Pro Thr
435
Thr Leu Val Asp Asp
440
Phe Ile Leu Ser Pro
445
Val Lys Arg Ser Phe
450
Ile Gln Ser Ile Lys 455
Val Ile Asn Ala Ile
460
Lys Lys Tyr Gly Leu 465
Pro Asn Asp Ile Ile 470
Ile Glu Leu Ala Arg 475
Lys Asn Ser Lys Asp
485
Ala Gln Lys Met Ile
490
Asn Glu Met Gln Lys
495
Asn Arg Gln Thr Asn
500
Glu Arg Ile Glu Glu
505
Ile Ile Arg Thr Thr
510
Glu
Lys
Val
Pro 320
Ala
Lys
Thr
Asn
Asn 400
Ile
Gln
Val
Ile
Glu 480
Arg
Gly
- 289 046157
Lys
Gln
Leu 545
Ser
Glu
Ser
Asn
Leu 625
Ile
Asn
Lys
Phe
Leu 705
Asp
Ala
Phe
Glu Asn Ala Lys Tyr 515
Glu Gly Lys Cys Leu 530
Leu Asn Asn Pro Phe
550
Val Ser Phe Asp Asn
565
Glu Ala Ser Lys Lys
580
Ser Asp Ser Lys Ile
595
Leu Ala Lys Gly Lys 610
Leu Glu Glu Arg Asp
630
Asn Arg Asn Leu Val
645
Leu Leu Arg Ser Tyr 660
Ser Ile Asn Gly Gly
675
Lys Lys Glu Arg Asn 690
Ile Ile Ala Asn Ala
710
Lys Ala Lys Lys Val
725
Glu Ser Met Pro Glu
740
Ile Thr Pro His Gln
Leu Ile Glu Lys Ile 520
Tyr Ser Leu Glu Ala 535
Asn Tyr Glu Val Asp
555
Ser Phe Asn Asn Lys
570
Gly Asn Arg Thr Pro 585
Ser Tyr Glu Thr Phe
600
Gly Arg Ile Ser Lys 615
Ile Asn Arg Phe Ser
635
Asp Thr Arg Tyr Ala
650
Phe Arg Val Asn Asn 665
Phe Thr Ser Phe Leu
680
Lys Gly Tyr Lys His 695
Asp Phe Ile Phe Lys
715
Met Glu Asn Gln Met
730
Ile Glu Thr Glu Gln
745
Ile Lys His Ile Lys
Lys Leu His Asp Met
525
Ile Pro Leu Glu Asp 540
His Ile Ile Pro Arg
560
Val Leu Val Lys Gln
575
Phe Gln Tyr Leu Ser 590
Lys Lys His Ile Leu 605
Thr Lys Lys Glu Tyr 620
Val Gln Lys Asp Phe
640
Thr Arg Gly Leu Met
655
Leu Asp Val Lys Val
670
Arg Arg Lys Trp Lys
685
His Ala Glu Asp Ala 700
Glu Trp Lys Lys Leu
720
Phe Glu Glu Lys Gln
735
Glu Tyr Lys Glu Ile 750
Asp Phe Lys Asp Tyr
- 290 046157
755 760 765
Lys
Asp 785
Val
Lys
Pro
Glu
Thr 865
Tyr
Pro
Phe
Asn
Cys 945
Phe
Leu
Val
Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
790 795 800
Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
870 875 880
Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
950 955 960
Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
- 291 046157
Asp
Lys 1010
Arg
Pro
Pro
Arg
Ile 1015
Ile
Lys
Thr
Ile
Ala
1020
Ser
Lys Thr
Gln
Ser
1025
Ile
Lys
Lys
Tyr
Ser
1030
Thr
Asp
Ile
Leu
Gly 1035
Asn
Leu Tyr
Glu
Val
1040
Lys
Ser
Lys
Lys
His
1045
Pro
Gln
Ile
Ile
Lys 1050
Lys
Gly <210> 174 <211> 1148 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 174
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
5 1015
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 20 2530
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 35 4045
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 50 5560
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 65 70 7580
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 85 9095
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
100 105110
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
115 120125
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
130 135140
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
145 150 155160
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
- 292 046157
165
170
175
Asp Gly Glu Val Arg
180
Gly Ser Ile Asn Arg
185
Phe Lys Thr Ser Asp
190
Val Lys Glu Ala Lys
195
Gln Leu Leu Lys Val 200
Gln Lys Ala Tyr His 205
Leu Asp Gln Ser Phe
210
Ile Asp Thr Tyr Ile
215
Asp Leu Leu Glu Thr
220
Arg Thr Tyr Tyr Glu 225
Gly Pro Gly Glu Gly 230
Ser Pro Phe Gly Trp 235
Asp Ile Lys Glu Trp
245
Tyr Glu Met Leu Met
250
Gly His Cys Thr Tyr
255
Pro Glu Glu Leu Arg
260
Ser Val Lys Tyr Ala
265
Tyr Asn Ala Asp Leu
270
Asn Ala Leu Asn Asp 275
Leu Asn Asn Leu Val
280
Ile Thr Arg Asp Glu
285
Glu Lys Leu Glu Tyr
290
Tyr Glu Lys Phe Gln 295
Ile Ile Glu Asn Val
300
Lys Gln Lys Lys Lys 305
Pro Thr Leu Lys Gln 310
Ile Ala Lys Glu Ile 315
Val Asn Glu Glu Asp
325
Ile Lys Gly Tyr Arg
330
Val Thr Ser Thr Gly
335
Pro Glu Phe Thr Asn
340
Leu Lys Val Tyr His
345
Asp Ile Lys Asp Ile
350
Ala Arg Lys Glu Ile 355
Ile Glu Asn Ala Glu
360
Leu Leu Asp Gln Ile 365
Lys Ile Leu Thr Ile 370
Tyr Gln Ser Ser Glu 375
Asp Ile Gln Glu Glu 380
Thr Asn Leu Asn Ser 385
Glu Leu Thr Gln Glu 390
Glu Ile Glu Gln Ile 395
Asn Leu Lys Gly Tyr
405
Thr Gly Thr His Asn
410
Leu Ser Leu Lys Ala
415
Tyr
Gln
Arg
Lys 240
Phe
Tyr
Asn
Phe
Leu 320
Lys
Thr
Ala
Leu
Ser 400
Ile
- 293 046157
Asn Leu Ile Leu Asp
420
Glu Leu Trp His Thr
425
Asn Asp Asn Gln Ile
430
Ile Phe Asn Arg Leu
435
Lys Leu Val Pro Lys
440
Lys Val Asp Leu Ser
445
Gln Lys Glu Ile Pro 450
Thr Thr Leu Val Asp
455
Asp Phe Ile Leu Ser
460
Val Val Lys Arg Ser 465
Phe Ile Gln Ser Ile 470
Lys Val Ile Asn Ala 475
Ile Lys Lys Tyr Gly
485
Leu Pro Asn Asp Ile
490
Ile Ile Glu Leu Ala
495
Glu Lys Asn Ser Lys
500
Asp Ala Gln Lys Met
505
Ile Asn Glu Met Gln
510
Arg Asn Arg Gln Thr 515
Asn Glu Arg Ile Glu 520
Glu Ile Ile Arg Thr 525
Gly Lys Glu Asn Ala
530
Lys Tyr Leu Ile Glu 535
Lys Ile Lys Leu His 540
Met Gln Glu Gly Lys 545
Cys Leu Tyr Ser Leu 550
Glu Ala Ile Pro Leu 555
Asp Leu Leu Asn Asn
565
Pro Phe Asn Tyr Glu
570
Val Asp His Ile Ile
575
Arg Ser Val Ser Phe
580
Asp Asn Ser Phe Asn
585
Asn Lys Val Leu Val
590
Gln Glu Glu Ala Ser
595
Lys Lys Gly Asn Arg
600
Thr Pro Phe Gln Tyr
605
Ser Ser Ser Asp Ser 610
Lys Ile Ser Tyr Glu 615
Thr Phe Lys Lys His 620
Leu Asn Leu Ala Lys 625
Gly Lys Gly Arg Ile 630
Ser Lys Thr Lys Lys 635
Tyr Leu Leu Glu Glu
645
Arg Asp Ile Asn Arg
650
Phe Ser Val Gln Lys
655
Phe Ile Asn Arg Asn
660
Leu Val Asp Thr Arg
665
Tyr Ala Thr Arg Gly
670
Ala
Gln
Pro
Ile 480
Arg
Lys
Thr
Asp
Glu 560
Pro
Lys
Leu
Ile
Glu 640
Asp
Leu
- 294 046157
Met
Val
Lys 705
Ala
Leu
Gln
Ile
Tyr 785
Asn
Ile
Lys
Asp
Asp 865
Leu
Lys
Tyr
Asn Leu Leu Arg Ser 675
Lys Ser Ile Asn Gly 690
Phe Lys Lys Glu Arg
710
Leu Ile Ile Ala Asn
725
Asp Lys Ala Lys Lys 740
Ala Glu Ser Met Pro
755
Phe Ile Thr Pro His 770
Lys Tyr Ser His Arg
790
Asp Thr Leu Tyr Ser
805
Val Asn Asn Leu Asn
820
Lys Leu Ile Asn Lys
835
Pro Gln Thr Tyr Gln 850
Glu Lys Asn Pro Leu
870
Thr Lys Tyr Ser Lys
885
Tyr Tyr Gly Asn Lys 900
Pro Asn Ser Arg Asn 915
Tyr Phe Arg Val Asn 680
Gly Phe Thr Ser Phe 695
Asn Lys Gly Tyr Lys
715
Ala Asp Phe Ile Phe
730
Val Met Glu Asn Gln
745
Glu Ile Glu Thr Glu
760
Gln Ile Lys His Ile 775
Val Asp Lys Lys Pro
795
Thr Arg Lys Asp Asp
810
Gly Leu Tyr Asp Lys 825
Ser Pro Glu Lys Leu
840
Lys Leu Lys Leu Ile 855
Tyr Lys Tyr Tyr Glu
875
Lys Asp Asn Gly Pro
890
Leu Asn Ala His Leu
905
Lys Val Val Lys Leu 920
Asn Leu Asp Val Lys
685
Leu Arg Arg Lys Trp 700
His His Ala Glu Asp
720
Lys Glu Trp Lys Lys
735
Met Phe Glu Glu Lys 750
Gln Glu Tyr Lys Glu 765
Lys Asp Phe Lys Asp 780
Asn Arg Glu Leu Ile
800
Lys Gly Asn Thr Leu
815
Asp Asn Asp Lys Leu 830
Leu Met Tyr His His 845
Met Glu Gln Tyr Gly 860
Glu Thr Gly Asn Tyr
880
Val Ile Lys Lys Ile
895
Asp Ile Thr Asp Asp 910
Ser Leu Lys Pro Tyr
925
- 295 046157
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
930 935940
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
945 950 955960
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
965 970975
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
980 985990
Glu Leu Tyr Arg Val Ile
995
Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
10001005
Glu Val Asn Met Ile Asp Ile 1015 Thr Tyr Arg Glu Tyr 1020 Leu Glu Asn
1010
Met Asn 1025 Asp Lys Arg Pro Pro 1030 Arg Ile Ile Lys Thr 1035 Ile Ala Ser
Lys Thr 1040 Gln Ser Ile Lys Lys 1045 Tyr Ser Thr Asp Ile 1050 Leu Gly Asn
Leu Tyr 1055 Glu Val Lys Ser Lys 1060 Lys His Pro Gln Ile 1065 Ile Lys Lys
Gly Lys 1070 Arg Pro Ala Ala Thr 1075 Lys Lys Ala Gly Gln 1080 Ala Lys Lys
Lys Lys 1085 Gly Ser Tyr Pro Tyr 1090 Asp Val Pro Asp Tyr 1095 Ala Leu Glu
Asp Ala 1100 Leu Asp Asp Phe Asp 1105 Leu Asp Met Leu Gly 1110 Ser Asp Ala
Leu Asp 1115 Asp Phe Asp Leu Asp 1120 Met Leu Gly Ser Asp 1125 Ala Leu Asp
Asp Phe 1130 Asp Leu Asp Met Leu 1135 Gly Ser Asp Ala Leu 1140 Asp Asp Phe
Asp Leu Asp Met Leu
1145 <210> 175
- 296 046157 <211> 387 <212> Белок <213> Homo sapiens <400> 175
Met Thr Gly Lys Leu 1 5
Ala Glu Lys Leu Pro
Val Thr Met Ser Ser
Leu Asn Gln Leu Pro
Asp Asn Leu Tyr Pro
Glu Glu Ile Pro Ser
Leu Asn Leu Phe Ser
Gly Ser Ser Asp Ser 40
Val Val His Tyr Asn 45
Met Ala Thr Glu Asn 50
Val Met Asp Ile Gly 55
Leu Thr Asn Glu Lys 60
Asn Pro Glu Leu Ser 65
Tyr Ser Gly Ser Phe 70
Gln Pro Ala Pro Gly 75
Lys Thr Val Thr Tyr
Leu Gly Lys Phe Ala
Phe Asp Ser Pro Ser
Trp Cys Gln Asp Asn
100
Ile Ile Ser Leu Met
105
Ser Ala Gly Ile Leu
110
Val Pro Pro Ala Ser
115
Gly Ala Leu Ser Thr 120
Gln Thr Ser Thr Ala
125
Met Val Gln Pro Pro
130
Gln Gly Asp Val Glu 135
Ala Met Tyr Pro Ala 140
Pro Pro Tyr Ser Asn 145
Cys Gly Asp Leu Tyr 150
Ser Glu Pro Val Ser 155
His Asp Pro Gln Gly
165
Asn Pro Gly Leu Ala
170
Tyr Ser Pro Gln Asp
175
Gln Ser Ala Lys Pro
180
Ala Leu Asp Ser Asn
185
Leu Phe Pro Met Ile
190
Asp Tyr Asn Leu Tyr 195
His His Pro Asn Asp
200
Met Gly Ser Ile Pro 205
His Lys Pro Phe Gln 210
Gly Met Asp Pro Ile 215
Arg Val Asn Pro Pro 220
Ile Thr Pro Leu Glu 225
Thr Ile Lys Ala Phe 230
Lys Asp Lys Gln Ile 235
Leu
Ala
Gln
Pro
Asn 80
Asn
Gly
Ser
Leu
Phe 160
Tyr
Pro
Glu
Pro
His 240
- 297 046157
Pro Gly Phe Gly Ser Leu Pro Gln Pro Pro Leu Thr Leu Lys Pro Ile
245 250255
Arg Pro Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Leu His Glu
260 265270
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
275 280285
Ser Asp Glu Leu Thr Arg His Leu Arg Ile His Thr Gly His Lys Pro
290 295300
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Ser Asp His Leu
305 310 315320
Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
325 330335
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Ala
340 345350
Lys Ile His Leu Lys Gln Lys Glu Lys Lys Ala Glu Lys Gly Gly Ala
355 360365
Pro Ser Ala Ser Ser Ala Pro Pro Val Ser Leu Ala Pro Val Val Thr
370 375380
Thr Cys Ala 385 <210> 176 <211> 543 <212> Белок <213> Homo sapiens <400> 176
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
5 1015
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr 20 2530
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe 35 4045
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser 50 5560
- 298 046157
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 65 70 75
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln 85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
145 150 155
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Ser 80
Pro
Asn
Leu
Asn
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
- 299 046157
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345350
Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr
370 375380
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395400
Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Thr Lys
405 410415
Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys Ser Val Val Ala
420 425430
Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser Pro Val Ala Thr
435 440445
Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser Pro Ala Thr Thr
450 455460
Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser Pro Gly Ser Ser
465 470 475480
Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser Pro Ser Val Ala
485 490495
Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala Gln Val Ser Ser
500 505510
Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala Ser Thr Gly Leu
515 520525
Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile Glu Ile Cys
530 535540 <210> 177 <211> 8 <212> Белок <213> Искусственная последовательность
- 300 046157 <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 177
Gly Gly Ser Gly Gly Gly Ser Gly
5 <210> 178 <211> 16 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 178
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly 1 5 10 15 <210> 179 <211> 4 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 179
Gly Gly Gly Ser <210> 180 <211> 5 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 180
Gly Gly Gly Gly Ser
5 <210> 181 <211> 4 <212> Белок <213> Искусственная последовательность
- 301 046157 <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 181
Gly Gly Ser Gly <210> 182 <211> 9 <212> ДНК <213> Homo sapiens <400> 182 gcgkgggcg 9 <210> 183 <211> 76 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 183 gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60 caacttgttg gcgaga 76 <210> 184 <211> 3871 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 184 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
- 302 046157 cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540 ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata600 ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg660 gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg720 aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag780 agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc840 tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg900 gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag960 gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat1020 tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc1080 gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac1140 tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc1200 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccg ccgaccacct gatgctcgcc gagggctacc2100 gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg ctccggactc2160 tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg gctccgctgg2220 ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg ccgccgtcct2280 ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac ctgcagcctg2340
- 303 046157 tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga ggccccccgg 2400 gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc ctgggcggca2460 tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag ctggggctgc2520 accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac tgcttctcgg2580 acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt ggtggttctg2640 gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg cccagcaaga2700 cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc cgcttctccc2760 gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc ttccagtgcc2820 gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc cgcacccaca2880 caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg agcgatgaac2940 ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct tgcccagtgg3000 agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc cgcatccaca3060 caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca agtggacatc3120 tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac atctgtggaa3180 gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg cggcagaagg3240 acaagtaact cgaggaaacc cagcagacaa tgtagctaga cccagtagcc agatgtagct3300 aaagagaccg gttcactgtg agaaacccag cagacaatgt agctagaccc agtagccaga3360 tgtagctaaa gagaccggtt cactgtgaaa gcttgggtgg catccctgtg acccctcccc3420 agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg tcctaataaa3480 attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg ggtggagggg3540 ggtggtatgg agcaaggggc aagttgggaa gacaacctgt agggcctgcg gggtctattg3600 ggaaccaagc tggagtgcag tggcacaatc ttggctcact gcaatctccg cctcctgggt3660 tcaagcgatt ctcctgcctc agcctcccga gttgttggga ttccaggcat gcatgaccag3720 gctcagctaa tttttgtttt tttggtagag acggggtttc accatattgg ccaggctggt3780 ctccaactcc taatctcagg tgatctaccc accttggcct cccaaattgc tgggattaca3840 ggcgtgaacc actgctccct tccctgtcct t3871 <210> 185 <211> 22 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 185
- 304 046157 tgtctcggca ttgagaacat tc <210> 186 <211> 21 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 186 attggtggga ggccattgta t 21 <210> 187 <211> 20 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 187 accacagtcc atgccatcac 20 <210> 188 <211> 20 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 188 tccaccaccc tgttgctgta 20 <210> 189 <211> 20 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 189 caaaaaagcc acaaaagcct 20 <210> 190 <211> 20 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер
- 305 046157 <400> 190 ttagctccgc aagaaacatc <210> 191 <211> 23 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 191 ccatggaact ggctcgattt cac 23 <210> 192 <211> 21 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 192 attggtggga ggccactgta t 21 <210> 193 <211> 27 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический probe <400> 193 aggcctgaaa accattgtgg gagccct 27 <210> 194 <211> 24 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 194 gaatgtggga aatcattcag tcgc 24 <210> 195 <211> 24 <212> ДНК <213> Искусственная последовательность <220>
- 306 046157 <223> Описание искусственной последовательности: Синтетический праймер <400> 195 gcaagttatc ctctcgtgag aagg <210> 196 <211> 29 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический probe <400> 196 gcgacaacct ggtgagacat caacgcacc 29 <210> 197 <211> 22 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 197 gctgttatct cttgtgggct gt 22 <210> 198 <211> 22 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 198 aaactcatgg gagctgccgg tt 22 <210> 199 <211> 25 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический probe <400> 199 ccacacaaat ctctccctgg cattg 25 <210> 200 <211> 24 <212> ДНК <213> Искусственная последовательность
- 307 046157 <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 200 gaatgtggga aatcattcag tcgc 24 <210> 201 <211> 24 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 201 gcaagttatc ctctcgtgag aagg 24 <210> 202 <211> 29 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический probe <400> 202 gcgacaacct ggtgagacat caacgcacc 29 <210> 203 <211> 1182 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 203
atggccgccg accacctgat gctcgccgag ggctaccgcc tggtgcagag gccgccgtcc 60
gccgccgccg cccatggccc tcatgcgctc cggactctgc cgccgtacgc gggcccgggc 120
ctggacagtg ggctgaggcc gcggggggct ccgctggggc cgccgccgcc ccgccaaccc 180
ggggccctgg cgtacggggc cttcgggccg ccgtcctcct tccagccctt tccggccgtg 240
cctccgccgg ccgcgggcat cgcgcacctg cagcctgtgg cgacgccgta ccccggccgc 300
gcggccgcgc cccccaacgc tccgggaggc cccccgggcc cgcagccggc cccaagcgcc 360
gcagccccgc cgccgcccgc gcacgccctg ggcggcatgg acgccgaact catcgacgag 420
gaggcgctga cgtcgctgga gctggagctg gggctgcacc gcgtgcgcga gctgcccgag 480
ctgttcctgg gccagagcga gttcgactgc ttctcggact tggggtccgc gccgcccgcc 540
- 308 046157
ggctccgtga gctgcggtgg ttctggtggt ggttctggtc agtcccagct catcaaaccc 600
agccgcatgc gcaagtaccc caaccggccc agcaagacgc ccccccacga acgcccttac 660
gcttgcccag tggagtcctg tgatcgccgc ttctcccgca gcgacaacct ggtgagacac 720
atccgcatcc acacaggcca gaagcccttc cagtgccgca tctgcatgag aaacttcagc 780
cgagaggata acttgcacac tcacatccgc acccacacag gcgaaaagcc cttcgcctgc 840
gacatctgtg gaagaaagtt tgcccggagc gatgaacttg tccgacatac caagatccac 900
ttgcggcaga aggaccgccc ttacgcttgc ccagtggagt cctgtgatcg ccgcttctcc 960
caatcaggga atctgactga gcacatccgc atccacacag gccagaagcc cttccagtgc 1020
cgcatctgca tgagaaactt cagcacaagt ggacatctgg tacgccacat ccgcacccac 1080
acaggcgaaa agcccttcgc ctgcgacatc tgtggaagaa agtttgccca gaatagtacc 1140
ctgaccgaac ataccaagat ccacttgcgg cagaaggaca ag 1182
<210> 204 <211> 1206 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 204 atggccgccg accacctgat gctcgccgag ggctaccgcc tggtgcagag gccgccgtcc60 gccgccgccg cccatggccc tcatgcgctc cggactctgc cgccgtacgc gggcccgggc120 ctggacagtg ggctgaggcc gcggggggct ccgctggggc cgccgccgcc ccgccaaccc180 ggggccctgg cgtacggggc cttcgggccg ccgtcctcct tccagccctt tccggccgtg240 cctccgccgg ccgcgggcat cgcgcacctg cagcctgtgg cgacgccgta ccccggccgc300 gcggccgcgc cccccaacgc tccgggaggc cccccgggcc cgcagccggc cccaagcgcc360 gcagccccgc cgccgcccgc gcacgccctg ggcggcatgg acgccgaact catcgacgag420 gaggcgctga cgtcgctgga gctggagctg gggctgcacc gcgtgcgcga gctgcccgag480 ctgttcctgg gccagagcga gttcgactgc ttctcggact tggggtccgc gccgcccgcc540 ggctccgtga gctgcggtgg ttctggtggt ggttctggtg gtggcagcgg gggaggttct600 ggtcagtccc agctcatcaa acccagccgc atgcgcaagt accccaaccg gcccagcaag660 acgccccccc acgaacgccc ttacgcttgc ccagtggagt cctgtgatcg ccgcttctcc720 cgcagcgaca acctggtgag acacatccgc atccacacag gccagaagcc cttccagtgc780 cgcatctgca tgagaaactt cagccgagag gataacttgc acactcacat ccgcacccac840 acaggcgaaa agcccttcgc ctgcgacatc tgtggaagaa agtttgcccg gagcgatgaa900
- 309 046157
cttgtccgac ataccaagat ccacttgcgg cagaaggacc gcccttacgc ttgcccagtg 960
gagtcctgtg atcgccgctt ctcccaatca gggaatctga ctgagcacat ccgcatccac 1020
acaggccaga agcccttcca gtgccgcatc tgcatgagaa acttcagcac aagtggacat 1080
ctggtacgcc acatccgcac ccacacaggc gaaaagccct tcgcctgcga catctgtgga 1140
agaaagtttg cccagaatag taccctgacc gaacatacca agatccactt gcggcagaag 1200
gacaag 1206
<210> 205 <211> 402 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 205
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
5 1015
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155160
- 310 046157
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Gly Gly Ser Gly 195
Gly Gly Ser Gly Gln 200
Ser Gln Leu Ile Lys
205
Ser Arg Met Arg Lys
210
Tyr Pro Asn Arg Pro
215
Ser Lys Thr Pro Pro
220
Glu Arg Pro Tyr Ala 225
Cys Pro Val Glu Ser 230
Cys Asp Arg Arg Phe 235
Arg Ser Asp Asn Leu
245
Val Arg His Ile Arg
250
Ile His Thr Gly Gln
255
Pro Phe Gln Cys Arg
260
Ile Cys Met Arg Asn
265
Phe Ser Arg Glu Asp
270
Leu His Thr His Ile
275
Arg Thr His Thr Gly
280
Glu Lys Pro Phe Ala 285
Asp Ile Cys Gly Arg 290
Lys Phe Ala Arg Ser
295
Asp Glu Leu Val Arg 300
Thr Lys Ile His Leu 305
Arg Gln Lys Asp Arg 310
Pro Tyr Ala Cys Pro 315
Glu Ser Cys Asp Arg
325
Arg Phe Ser Gln Ser
330
Gly Asn Leu Thr Glu
335
Ile Arg Ile His Thr
340
Gly Gln Lys Pro Phe
345
Gln Cys Arg Ile Cys
350
Arg Asn Phe Ser Thr 355
Ser Gly His Leu Val 360
Arg His Ile Arg Thr 365
Thr Gly Glu Lys Pro
370
Phe Ala Cys Asp Ile 375
Cys Gly Arg Lys Phe 380
Gln Asn Ser Thr Leu 385
Thr Glu His Thr Lys 390
Ile His Leu Arg Gln 395
Ser
Ser
Pro
His
Ser 240
Lys
Asn
Cys
His
Val 320
His
Met
His
Ala
Lys 400
Asp Lys
- 311 046157 <210> 206 <211> 1707 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 206 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60
gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120
cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180
ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg 240
cctcctccag ccgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300
gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360
gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420
gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480
ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540
ggctctgtgt cctgcgccga ccacctgatg ctcgccgagg gctaccgcct ggtgcagagg 600
ccgccgtccg ccgccgccgc ccatggccct catgcgctcc ggactctgcc gccgtacgcg 660
ggcccgggcc tggacagtgg gctgaggccg cggggggctc cgctggggcc gccgccgccc 720
cgccaacccg gggccctggc gtacggggcc ttcgggccgc cgtcctcctt ccagcccttt 780
ccggccgtgc ctccgccggc cgcgggcatc gcgcacctgc agcctgtggc gacgccgtac 840
cccggccgcg ccgccgcgcc ccccaacgct ccgggaggcc ccccgggccc gcagccggcc 900
ccaagcgccg cagccccgcc gccgcccgcg cacgccctgg gcggcatgga cgccgaactc 960
atcgacgagg aggcgctgac gtcgctggag ctggagctgg ggctgcaccg cgtgcgcgag 1020
ctgcccgagc tgttcctggg ccagagcgag ttcgactgct tctcggactt ggggtccgcg 1080
ccgcccgccg gctccgtgag ctgccagtcc cagctcatca aacccagccg catgcgcaag 1140
taccccaacc ggcccagcaa gacgcccccc cacgaacgcc cttacgcttg cccagtggag 1200
tcctgtgatc gccgcttctc ccgcagcgac aacctggtga gacacatccg catccacaca 1260
ggccagaagc ccttccagtg ccgcatctgc atgagaaact tcagccgaga ggataacttg 1320
cacactcaca tccgcaccca cacaggcgaa aagcccttcg cctgcgacat ctgtggaaga 1380
aagtttgccc ggagcgatga acttgtccga cataccaaga tccacttgcg gcagaaggac 1440
cgcccttacg cttgcccagt ggagtcctgt gatcgccgct tctcccaatc agggaatctg 1500
actgagcaca tccgcatcca cacaggccag aagcccttcc agtgccgcat ctgcatgaga 1560
- 312 046157
aacttcagca caagtggaca tctggtacgc cacatccgca cccacacagg cgaaaagccc 1620
ttcgcctgcg acatctgtgg aagaaagttt gcccagaata gtaccctgac cgaacatacc 1680
aagatccact tgcggcagaa ggacaag 1707
<210> 207 <211> 569 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 207
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
5 1015
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170175
Ala Pro Pro Ala Gly Ser Val Ser Cys Ala Asp His Leu Met Leu Ala
180 185190
- 313 046157
Glu Gly Tyr Arg Leu
195
Val Gln Arg Pro Pro
200
Ser Ala Ala Ala Ala
205
Gly Pro His Ala Leu
210
Arg Thr Leu Pro Pro 215
Tyr Ala Gly Pro Gly
220
Asp Ser Gly Leu Arg 225
Pro Arg Gly Ala Pro 230
Leu Gly Pro Pro Pro 235
Arg Gln Pro Gly Ala
245
Leu Ala Tyr Gly Ala
250
Phe Gly Pro Pro Ser
255
Phe Gln Pro Phe Pro
260
Ala Val Pro Pro Pro
265
Ala Ala Gly Ile Ala
270
Leu Gln Pro Val Ala
275
Thr Pro Tyr Pro Gly
280
Arg Ala Ala Ala Pro 285
Asn Ala Pro Gly Gly 290
Pro Pro Gly Pro Gln 295
Pro Ala Pro Ser Ala
300
Ala Pro Pro Pro Pro 305
Ala His Ala Leu Gly 310
Gly Met Asp Ala Glu 315
Ile Asp Glu Glu Ala
325
Leu Thr Ser Leu Glu
330
Leu Glu Leu Gly Leu
335
Arg Val Arg Glu Leu
340
Pro Glu Leu Phe Leu
345
Gly Gln Ser Glu Phe
350
Cys Phe Ser Asp Leu
355
Gly Ser Ala Pro Pro 360
Ala Gly Ser Val Ser 365
Gln Ser Gln Leu Ile
370
Lys Pro Ser Arg Met
375
Arg Lys Tyr Pro Asn 380
Pro Ser Lys Thr Pro 385
Pro His Glu Arg Pro 390
Tyr Ala Cys Pro Val 395
Ser Cys Asp Arg Arg
405
Phe Ser Arg Ser Asp
410
Asn Leu Val Arg His
415
Arg Ile His Thr Gly
420
Gln Lys Pro Phe Gln
425
Cys Arg Ile Cys Met
430
Asn Phe Ser Arg Glu
Asp Asn Leu His Thr
His Ile Arg Thr His
His
Leu
Pro 240
Ser
His
Pro
Ala
Leu 320
His
Asp
Cys
Arg
Glu 400
Ile
Arg
Thr
- 314 046157
Gly Glu
450
Ser Asp 465
Arg Pro
435
Lys Pro
Glu Leu
Tyr Ala
Phe Ala
Val Arg
470
Cys Pro 485
Ser Gly
Asn Leu
500
Thr Glu
440
Cys Asp 455
His Thr
Val Glu
His Ile
Ile Cys
Lys Ile
Ser Cys
490
Arg Ile 505
Phe Gln
Cys Arg 515
Ile Cys
Met Arg
520
Asn Phe
Gly Arg
460
His Leu 475
Asp Arg
His Thr
Ser Thr
Val Arg
530
His Ile
Arg Thr
His Thr 535
Gly Glu
Lys Pro
540
Ile Cys 545
Gly Arg
Lys Phe
550
Ala Gln
Asn Ser
Thr Leu 555
445
Lys Phe
Arg Gln
Arg Phe
Gly Gln
510
Ser Gly 525
Phe Ala
Thr Glu
Ala Arg
Lys Asp
480
Ser Gln
495
Lys Pro
His Leu
Cys Asp
His Thr
560
Lys Ile His Leu Arg Gln Lys Asp Lys
565 <210> 208 <211> 1755 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 208 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct
gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt
cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct
ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg
cctcctccag ctgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga
gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc
gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag
gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag
ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc
120
180
240
300
360
420
480
540
- 315 046157
ggctctgtgt cctgcggcgg cagcggcggc ggaagcggcg ccgaccacct gatgctcgcc 600
gagggctacc gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg 660
ctccggactc tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg 720
gctccgctgg ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg 780
ccgccgtcct ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac 840
ctgcagcctg tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga 900
ggccccccgg gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc 960
ctgggcggca tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag 1020
ctggggctgc accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac 1080
tgcttctcgg acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt 1140
ggtggttctg gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg 1200
cccagcaaga cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc 1260
cgcttctccc gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc 1320
ttccagtgcc gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc 1380
cgcacccaca caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg 1440
agcgatgaac ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct 1500
tgcccagtgg agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc 1560
cgcatccaca caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca 1620
agtggacatc tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac 1680
atctgtggaa gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg 1740
cggcagaagg acaag 1755
<210> 209 <211> 585 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 209
Met Ala Ala Asp His Leu Met Leu 1 5
Ala Glu Gly Tyr Arg Leu Val Gln
15
Arg Pro Pro Ser Ala Ala Ala Ala 20
His Gly Pro His Ala Leu Arg Thr 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly
40
Leu Asp Ser Gly Leu Arg Pro Arg 45
- 316 046157
Gly Ala Pro Leu Gly 50
Pro Pro Pro Pro Arg 55
Gln Pro Gly Ala Leu 60
Tyr Gly Ala Phe Gly 65
Pro Pro Ser Ser Phe 70
Gln Pro Phe Pro Ala 75
Pro Pro Pro Ala Ala
Gly Ile Ala His Leu
Gln Pro Val Ala Thr
Tyr Pro Gly Arg Ala
100
Ala Ala Pro Pro Asn
105
Ala Pro Gly Gly Pro
110
Gly Pro Gln Pro Ala
115
Pro Ser Ala Ala Ala
120
Pro Pro Pro Pro Ala
125
Ala Leu Gly Gly Met
130
Asp Ala Glu Leu Ile 135
Asp Glu Glu Ala Leu 140
Ser Leu Glu Leu Glu 145
Leu Gly Leu His Arg 150
Val Arg Glu Leu Pro 155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Ala Asp His Leu
195
Met Leu Ala Glu Gly
200
Tyr Arg Leu Val Gln 205
Pro Pro Ser Ala Ala
210
Ala Ala His Gly Pro 215
His Ala Leu Arg Thr
220
Pro Pro Tyr Ala Gly 225
Pro Gly Leu Asp Ser 230
Gly Leu Arg Pro Arg 235
Ala Pro Leu Gly Pro
245
Pro Pro Pro Arg Gln
250
Pro Gly Ala Leu Ala
255
Gly Ala Phe Gly Pro
260
Pro Ser Ser Phe Gln
265
Pro Phe Pro Ala Val
270
Pro Pro Ala Ala Gly
275
Ile Ala His Leu Gln
280
Pro Val Ala Thr Pro
285
Pro Gly Arg Ala Ala
Ala Pro Pro Asn Ala
Pro Gly Gly Pro Pro
Ala
Val 80
Pro
Pro
His
Thr
Glu 160
Ser
Ser
Arg
Leu
Gly 240
Tyr
Pro
Tyr
Gly
- 317 046157
290
295
300
Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
305 310 315
Leu Gly Gly Met Asp Ala Glu Leu
325
Ile Asp Glu Glu Ala Leu Thr
330 335
Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
340 345 350
Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
355 360 365
Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
370 375 380
Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
385 390 395
Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
405 410 415
Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His
420 425 430
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
435 440 445
Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His
450 455 460
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
465 470 475
Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys
485 490 495
Arg Pro Tyr Ala Cys Pro Val Glu
500
Ser Cys Asp Arg Arg Phe Ser
505 510
Ser Gly Asn Leu Thr Glu His 515
Ile Arg Ile His Thr Gly Gln Lys
520 525
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
530 535
Thr Ser Gly His 540
Ala 320
Ser
Leu
Ala
Gly
Arg 400
Glu
Ile
Arg
Thr
Arg 480
Asp
Gln
Pro
Leu
- 318 046157
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
545
550
555
560
Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr
565
570
575
Lys Ile His Leu Arg Gln Lys Asp Lys
580
585 <210> 210 <211> 1113 <212> ДНК <213> Homo sapiens <400> 210 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggaggaa gattcgaaat480 aaaagatctg ctcaagagag ccgcaggaaa aagaaggtgt acgttggggg tttagagagc540 cgggtcttga aatacacagc ccagaatatg gagcttcaga acaaagtaca gcttctggag600 gaacagaatt tgtcccttct agatcaactg aggaaactcc aggccatggt gattgagatc660 tcaaacaaaa ccagcagcag cagcacctgc atcttggtcc tgctagtctc cttctgcctc720 ctccttgtac ctgctatgta ctcctctgac acaaggggga gcctgccagc tgagcatgga780 gtgttgtccc gccagcttcg tgccctcccc agtgaggacc cttaccagct ggagctgcct840 gccctgcagt cagaagtgcc gaaagacagc acacaccagt ggttggacgg ctcagactgt900 gtactccagg cccctggcaa cacttcctgc ctgctgcatt acatgcctca ggctcccagt960 gcagagcctc ccctggagtg gcccttccct gacctcttct cagagcctct ctgccgaggt1020 cccatcctcc ccctgcaggc aaatctcaca aggaagggag gatggcttcc tactggtagc1080 ccctctgtca ttttgcagga cagatactca ggc1113 <210> 211 <211> 371 <212> Белок <213> Homo sapiens <400> 211
- 319 046157
Met 1
Leu
Ala
Glu
Asn 65
Tyr
Cys
Ala
Leu
Lys 145
Lys
Gly
Gln
Gln
Ser 225
Leu
Glu Leu Glu Leu Asp 5
Glu Glu Ser Gly Asp 20
Pro Leu Asp Trp Ala 35
Val Asp Asp Leu Leu 50
Ile Leu Ser Ser Ser
Ser Leu Pro Arg Glu 85
Arg Lys Glu Gly Thr 100
Glu Gln Glu Ile Ala
115
Leu Glu Lys Glu Gly 130
Thr Glu Glu Gln Ile
150
Arg Ser Ala Gln Glu
165
Leu Glu Ser Arg Val
180
Asn Lys Val Gln Leu 195
Leu Arg Lys Leu Gln 210
Ser Ser Ser Thr Cys
230
Leu Val Pro Ala Met
245
Ala Gly Asp Gln Asp
Leu Gly Thr Ala Pro 25
Leu Pro Leu Ser Glu 40
Cys Ser Leu Leu Ser 55
Asn Pro Cys Leu Val 75
Thr Val Ser Met Asp
Gln Met Thr Pro Gln
105
Arg Leu Val Leu Thr 120
Leu Ile Leu Pro Glu 135
Leu Lys Arg Val Arg
155
Ser Arg Arg Lys Lys
170
Leu Lys Tyr Thr Ala
185
Leu Glu Glu Gln Asn
200
Ala Met Val Ile Glu 215
Ile Leu Val Leu Leu
235
Tyr Ser Ser Asp Thr
250
Leu Leu Ala Phe Leu
Asp Glu Ala Val Arg 30
Val Pro Ser Asp Trp 45
Pro Pro Ala Ser Leu 60
His His Asp His Thr
Leu Glu Ser Glu Ser
His Met Glu Glu Leu
110
Asp Glu Glu Lys Ser 125
Thr Leu Pro Leu Thr 140
Arg Lys Ile Arg Asn
160
Lys Val Tyr Val Gly
175
Gln Asn Met Glu Leu
190
Leu Ser Leu Leu Asp
205
Ile Ser Asn Lys Thr 220
Val Ser Phe Cys Leu
240
Arg Gly Ser Leu Pro
255
- 320 046157
Ala Glu His Gly Val Leu Ser Arg
260
Gln Leu Arg Ala Leu Pro Ser Glu
265 270
Asp Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys
275 280285
Asp Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala
290 295300
Pro Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser
305 310 315320
Ala Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro
325 330335
Leu Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys
340 345350
Gly Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg
355 360365
Tyr Ser Gly
370 <210> 212 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 212
atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggctcga accaggtgaa 480
aaaccttaca aatgtcctga atgtgggaaa tcattcagtc gcagcgacaa cctggtgaga 540
catcaacgca cccatacagg agaaaaacct tataaatgtc cagaatgtgg aaagtccttc 600
- 321 046157
tcacgagagg ataacttgca cactcatcaa cgaacacata ctggtgaaaa accatacaag 660
tgtcccgaat gtggtaaaag ttttagccgg agcgatgaac ttgtccgaca ccaacgaacc 720
catacaggcg agaagcctta caaatgtccc gagtgtggca agagcttctc acaatcaggg 780
aatctgactg agcatcaacg aactcatacc ggggaaaaac cttacaagtg tccagagtgt 840
gggaagagct tttccacaag tggacatctg gtacgccacc agaggacaca tacaggggag 900
aagccctaca aatgccccga atgcggtaaa agtttctctc agaatagtac cctgaccgaa 960
caccagcgaa cacacactgg gaaaaaaacg agtgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca 1140
aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc 1200
cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg 1260
ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc 1320
ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta 1380
ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca 1440
gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc 1500
atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc 1560
tctgtcattt tgcaggacag atactcaggc 1590
<210> 213 <211> 530 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 213
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
5 1015
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala ValArg
2530
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 7580
- 322 046157
Tyr
Cys
Ala
Leu
Lys 145
Lys
Asn
Cys
His
Gly 225
His
Ser
Lys
His
Cys 305
His
Ser Leu Pro Arg Glu
Thr Val Ser Met Asp
Leu Glu Ser Glu Ser
Arg Lys Glu Gly Thr 100
Glu Gln Glu Ile Ala
115
Leu Glu Lys Glu Gly 130
Thr Glu Glu Gln Ile
150
Pro Tyr Lys Cys Pro
165
Leu Val Arg His Gln 180
Pro Glu Cys Gly Lys 195
Gln Arg Thr His Thr 210
Lys Ser Phe Ser Arg
230
Thr Gly Glu Lys Pro
245
Gln Ser Gly Asn Leu
260
Pro Tyr Lys Cys Pro
275
Leu Val Arg His Gln 290
Pro Glu Cys Gly Lys
310
Gln Arg Thr His Thr
Gln Met Thr Pro Gln
105
His Met Glu Glu Leu
110
Arg Leu Val Leu Thr 120
Asp Glu Glu Lys Ser 125
Leu Ile Leu Pro Glu 135
Thr Leu Pro Leu Thr 140
Leu Lys Arg Val Arg
155
Glu Cys Gly Lys Ser
170
Arg Thr His Thr Gly 185
Ser Phe Ser Arg Glu
200
Gly Glu Lys Pro Tyr 215
Ser Asp Glu Leu Val
235
Tyr Lys Cys Pro Glu
250
Thr Glu His Gln Arg
265
Glu Cys Gly Lys Ser 280
Arg Thr His Thr Gly 295
Ser Phe Ser Gln Asn
315
Gly Lys Lys Thr Ser
Leu Glu Pro Gly Glu
160
Phe Ser Arg Ser Asp
175
Glu Lys Pro Tyr Lys
190
Asp Asn Leu His Thr 205
Lys Cys Pro Glu Cys 220
Arg His Gln Arg Thr
240
Cys Gly Lys Ser Phe
255
Thr His Thr Gly Glu
270
Phe Ser Thr Ser Gly 285
Glu Lys Pro Tyr Lys 300
Ser Thr Leu Thr Glu
320
Val Tyr Val Gly Gly
- 323 046157
325 330
335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn
340 345
Met Glu Leu Gln
350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser
355 360
Leu Leu Asp Gln 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser
370 375 380
Asn Lys Thr Ser
Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val Ser
385 390 395
Phe Cys Leu Leu
400
Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly
405 410
Ser Leu Pro Ala
415
Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu
420 425
Pro Ser Glu Asp
430
Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu
435 440
Val Pro Lys Asp 445
Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val
450 455 460
Leu Gln Ala Pro
Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln
465 470 475
Ala Pro Ser Ala
480
Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe
485 490
Ser Glu Pro Leu
495
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu
500 505
Thr Arg Lys Gly
510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu
515 520
Gln Asp Arg Tyr 525
Ser Gly
530 <210> 214 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полинуклеотид
Синтетический
- 324 046157 <400> 214 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcttga gcccggagag480 aagccgtaca agtgccctga gtgcggcaag tcttttagca gaagagacga acttaatgtc540 caccagcgaa cgcatactgg tgaaaagccc tataaatgtc ctgaatgtgg gaaatcattc600 tccagccgca gaacctgtag ggctcaccag cgaacacaca ccggcgaaaa accatacaaa660 tgtccagaat gcgggaaatc cttttctcag tcatccaact tggtgagaca tcaacgcacg720 cacactggag aaaagcctta caaatgcccg gaatgtggaa agtctttttc ccaattggcc780 catttgcgag cccatcagag gactcacacg ggcgagaaac cttacaaatg cccggaatgc840 gggaaatctt tttcaacgag tggcaacctc gtaagacacc aaagaacgca tacaggcgaa900 aagccatata agtgtcctga gtgtggtaaa tcattctcac acaggaccac cctgacaaat960 caccagcgca cgcacaccgg caagaagaca agcgtgtacg ttgggggttt agagagccgg1020 gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa1080 cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca1140 aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc1200 cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg1260 ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc1320 ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta1380 ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca1440 gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc1500 atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc1560 tctgtcattt tgcaggacag atactcaggc1590 <210> 215 <211> 530 <212> Белок <213> Искусственная последовательность <220>
- 325 046157 <223> Описание искусственной последовательности полипептид <400> 215
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu 1 5 10
Синтетический
Leu Ala Phe Leu
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp 20 25
Glu Ala Val Arg 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val
40
Pro Ser Asp Trp 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro
55 60
Pro Ala Ser Leu
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His 65 70 75
His Asp His Thr
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu
90
Glu Ser Glu Ser
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His
100 105
Met Glu Glu Leu
110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp
115 120
Glu Glu Lys Ser 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr
130 135 140
Leu Pro Leu Thr
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu
145 150 155
Glu Pro Gly Glu
160
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
165 170
Ser Arg Arg Asp
175
Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu
180 185
Lys Pro Tyr Lys
190
Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Arg Arg
195 200
Thr Cys Arg Ala 205
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
210 215 220
Cys Pro Glu Cys
Gly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val Arg
225 230 235
His Gln Arg Thr
240
- 326 046157
His
Ser
Lys
Asn
Cys 305
His
Leu
Asn
Leu
Ser 385
Leu
Glu
Pro
Ser
Gly 465
Glu
Thr Gly Glu Lys Pro
245
Gln Leu Ala His Leu
260
Pro Tyr Lys Cys Pro
275
Leu Val Arg His Gln 290
Pro Glu Cys Gly Lys
310
Gln Arg Thr His Thr
325
Glu Ser Arg Val Leu
340
Lys Val Gln Leu Leu
355
Arg Lys Leu Gln Ala 370
Ser Ser Thr Cys Ile
390
Val Pro Ala Met Tyr
405
His Gly Val Leu Ser
420
Tyr Gln Leu Glu Leu
435
Thr His Gln Trp Leu 450
Asn Thr Ser Cys Leu
470
Pro Pro Leu Glu Trp
485
Tyr Lys Cys Pro Glu
250
Cys Gly Lys Ser Phe
255
Arg Ala His Gln Arg 265
Glu Cys Gly Lys Ser
280
Arg Thr His Thr Gly 295
Ser Phe Ser His Arg
315
Gly Lys Lys Thr Ser
330
Lys Tyr Thr Ala Gln
345
Glu Glu Gln Asn Leu
360
Met Val Ile Glu Ile 375
Leu Val Leu Leu Val
395
Ser Ser Asp Thr Arg
410
Arg Gln Leu Arg Ala 425
Pro Ala Leu Gln Ser
440
Asp Gly Ser Asp Cys 455
Leu His Tyr Met Pro
475
Pro Phe Pro Asp Leu
490
Thr His Thr Gly Glu
270
Phe Ser Thr Ser Gly 285
Glu Lys Pro Tyr Lys 300
Thr Thr Leu Thr Asn
320
Val Tyr Val Gly Gly
335
Asn Met Glu Leu Gln
350
Ser Leu Leu Asp Gln
365
Ser Asn Lys Thr Ser 380
Ser Phe Cys Leu Leu
400
Gly Ser Leu Pro Ala
415
Leu Pro Ser Glu Asp 430
Glu Val Pro Lys Asp 445
Val Leu Gln Ala Pro 460
Gln Ala Pro Ser Ala
480
Phe Ser Glu Pro Leu
495
- 327 046157
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly 500 505 510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr 515 520 525
Ser Gly 530 <210> 216 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 216 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcgccc ttacgcttgc 480
ccagtggagt cctgtgatcg ccgcttctcc cgcagcgaca acctggtgag acacatccgc 540
atccacacag gccagaagcc cttccagtgc cgcatctgca tgagaaactt cagccgagag 600
gataacttgc acactcacat ccgcacccac acaggcgaaa agcccttcgc ctgcgacatc 660
tgtggaagaa agtttgcccg gagcgatgaa cttgtccgac ataccaagat ccacttgcgg 720
cagaaggacc gcccttacgc ttgcccagtg gagtcctgtg atcgccgctt ctcccaatca 780
gggaatctga ctgagcacat ccgcatccac acaggccaga agcccttcca gtgccgcatc 840
tgcatgagaa acttcagcac aagtggacat ctggtacgcc acatccgcac ccacacaggc 900
gaaaagccct tcgcctgcga catctgtgga agaaagtttg cccagaatag taccctgacc 960
gaacatacca agatccactt gcggcagaag gacgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca 1140
aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc 1200
- 328 046157
cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg 1260
ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc 1320
ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta 1380
ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca 1440
gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc 1500
atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc 1560
tctgtcattt tgcaggacag atactcaggc 1590
<210> 217 <211> 530 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 217
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu 1 5 1015
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 2530
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 7580
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser 85 9095
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys
- 329 046157
145
Pro
Arg
Cys
Thr
Phe 225
Gln
Phe
Gln
Gly
Ala 305
Glu
Leu
Asn
Leu
Ser 385
150
155
160
Val Glu Ser Cys Asp
165
Arg Arg Phe Ser Arg
170
Ser Asp Asn Leu Val
175
His Ile Arg Ile His
180
Met Arg Asn Phe Ser 195
His Thr Gly Glu Lys 210
Ala Arg Ser Asp Glu
230
Lys Asp Arg Pro Tyr
245
Ser Gln Ser Gly Asn 260
Lys Pro Phe Gln Cys
275
His Leu Val Arg His 290
Cys Asp Ile Cys Gly
310
His Thr Lys Ile His
325
Glu Ser Arg Val Leu
340
Lys Val Gln Leu Leu
355
Arg Lys Leu Gln Ala 370
Ser Ser Thr Cys Ile
390
Thr Gly Gln Lys Pro 185
Phe Gln Cys Arg Ile
190
Arg Glu Asp Asn Leu
200
Pro Phe Ala Cys Asp 215
Leu Val Arg His Thr
235
Ala Cys Pro Val Glu
250
Leu Thr Glu His Ile
265
Arg Ile Cys Met Arg 280
Ile Arg Thr His Thr 295
Arg Lys Phe Ala Gln
315
Leu Arg Gln Lys Asp
330
Lys Tyr Thr Ala Gln
345
Glu Glu Gln Asn Leu
360
Met Val Ile Glu Ile 375
Leu Val Leu Leu Val
395
His Thr His Ile Arg
205
Ile Cys Gly Arg Lys 220
Lys Ile His Leu Arg
240
Ser Cys Asp Arg Arg
255
Arg Ile His Thr Gly 270
Asn Phe Ser Thr Ser
285
Gly Glu Lys Pro Phe 300
Asn Ser Thr Leu Thr
320
Val Tyr Val Gly Gly
335
Asn Met Glu Leu Gln
350
Ser Leu Leu Asp Gln
365
Ser Asn Lys Thr Ser 380
Ser Phe Cys Leu Leu
400
- 330 046157
Leu Val
Pro Ala
Glu His
Gly Val
420
Pro Tyr
Gln Leu 435
Ser Thr
450
His Gln
Met Tyr 405
Leu Ser
Glu Leu
Trp Leu
Gly Asn 465
Thr Ser
Cys Leu
470
Glu Pro
Pro Leu
Glu Trp 485
Cys Arg
Gly Pro
500
Ile Leu
Gly Trp
Leu Pro 515
Thr Gly
Ser Ser
Arg Gln
Pro Ala 440
Asp Gly 455
Leu His
Pro Phe
Pro Leu
Ser Pro
520
Asp Thr
410
Leu Arg 425
Leu Gln
Ser Asp
Tyr Met
Pro Asp
490
Gln Ala 505
Ser Val
Arg Gly
Ala Leu
Ser Glu
Cys Val
460
Pro Gln 475
Leu Phe
Asn Leu
Ile Leu
Ser Leu
Pro Ser
430
Val Pro 445
Leu Gln
Ala Pro
Ser Glu
Thr Arg
510
Gln Asp 525
Pro Ala 415
Glu Asp
Lys Asp
Ala Pro
Ser Ala
480
Pro Leu 495
Lys Gly
Arg Tyr
Ser Gly
530 <210> 218 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 218 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcgccc ttacgcttgc
ccagtggagt cctgtgatcg ccgcttctcc cgctcagaca acctcgttcg acacatccgc
120
180
240
300
360
420
480
540
- 331 046157
atccacacag gccagaagcc cttccagtgc cgcatctgca tgagaaactt cagccaccgg 600
actacactca cgaaccacat ccgcacccac acaggcgaaa agcccttcgc ctgcgacatc 660
tgtggaagaa agtttgccag agaagacaat ctccatactc ataccaagat ccacttgcgg 720
cagaaggacc gcccttacgc ttgcccagtg gagtcctgtg atcgccgctt ctccaccagc 780
cattctctca ctgaacacat ccgcatccac acaggccaga agcccttcca gtgccgcatc 840
tgcatgagaa acttcagcca gtctagctca ctggtgaggc acatccgcac ccacacaggc 900
gaaaagccct tcgcctgcga catctgtgga agaaagtttg ccagggagga taacctgcat 960
acgcatacca agatccactt gcggcagaag gacgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca 1140
aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc 1200
cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg 1260
ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc 1320
ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta 1380
ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca 1440
gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc 1500
atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc 1560
tctgtcattt tgcaggacag atactcaggc 1590
<210> 219 <211> 530 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 219
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu 1 5 1015
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 2530
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560
- 332 046157
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val 65 7075
His His Asp His Thr
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser 85 9095
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu 100 105110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser 115 120125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr 130 135140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys
145 150 155160
Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val
165 170175
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile
180 185190
Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu Thr Asn His Ile Arg
195 200205
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
210 215220
Phe Ala Arg Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg
225 230 235240
Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg
245 250255
Phe Ser Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly
260 265270
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
275 280285
Ser Ser Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
290 295300
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His
305 310 315320
- 333 046157
Thr His Thr Lys Ile His Leu Arg
325
Gln Lys Asp Val Tyr Val Gly Gly
330 335
Leu Glu
Ser Arg Val
340
Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln
345 350
Asn Lys Val Gln
355
Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln
360 365
Leu Arg Lys Leu Gln Ala Met Val
370 375
Ile Glu Ile Ser Asn Lys Thr Ser
380
Ser Ser Ser Thr Cys
385
Ile Leu Val Leu Leu Val Ser Phe Cys Leu Leu
390 395400
Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro Ala
405 410415
Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu Asp
420 425430
Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys Asp
435 440445
Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala Pro
450 455460
Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser Ala
465 470 475480
Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro Leu
485 490495
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly
500 505510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr
515 520525
Ser Gly
530 <210> 220 <211> 1140 <212> ДНК <213> Искусственная последовательность
- 334 046157 <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 220 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggctcga accaggtgaa480 aaaccttaca aatgtcctga atgtgggaaa tcattcagtc gcagcgacaa cctggtgaga540 catcaacgca cccatacagg agaaaaacct tataaatgtc cagaatgtgg aaagtccttc600 tcacgagagg ataacttgca cactcatcaa cgaacacata ctggtgaaaa accatacaag660 tgtcccgaat gtggtaaaag ttttagccgg agcgatgaac ttgtccgaca ccaacgaacc720 catacaggcg agaagcctta caaatgtccc gagtgtggca agagcttctc acaatcaggg780 aatctgactg agcatcaacg aactcatacc ggggaaaaac cttacaagtg tccagagtgt840 gggaagagct tttccacaag tggacatctg gtacgccacc agaggacaca tacaggggag900 aagccctaca aatgccccga atgcggtaaa agtttctctc agaatagtac cctgaccgaa960 caccagcgaa cacacactgg gaaaaaaacg agtgtgtacg ttgggggttt agagagccgg1020 gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa1080 cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatatca1140 <210> 221 <211> 380 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 221
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
- 335 046157
40 45
Glu
Asn 65
Tyr
Cys
Ala
Leu
Lys 145
Lys
Asn
Cys
His
Gly 225
His
Ser
Lys
Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser 50 55 60
Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His 70 75
Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu 85 90 95
Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu
100 105 110
Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys
115 120 125
Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu
130 135 140
Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu Glu Pro Gly
150 155
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
165 170 175
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
180 185 190
Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
195 200 205
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
210 215 220
Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg
230 235
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
245 250 255
Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly
260 265 270
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser
275 280 285
Leu
Thr 80
Ser
Leu
Ser
Thr
Glu 160
Asp
Lys
Thr
Cys
Thr 240
Phe
Glu
Gly
- 336 046157
His Leu Val Arg His Gln Arg Thr
290 295
His Thr Gly Glu Lys Pro Tyr Lys
300
Cys Pro Glu Cys Gly Lys Ser Phe
305 310
Ser Gln Asn Ser Thr Leu Thr Glu
315 320
His Gln Arg Thr His Thr Gly Lys
325
Lys Thr Ser Val Tyr Val Gly Gly
330 335
Leu Glu Ser Arg Val Leu Lys Tyr
340
Thr Ala Gln Asn Met Glu Leu Gln
345 350
Asn Lys Val Gln Leu Leu Glu Glu
355 360
Gln Asn Leu Ser Leu Leu Asp Gln
365
Leu Arg Lys Leu Gln Ala Met Val
370 375
Ile Glu Ile Ser
380 <210> 222 <211> 1140 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 222 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcgccc ttacgcttgc 480
ccagtggagt cctgtgatcg ccgcttctcc cgcagcgaca acctggtgag acacatccgc 540
atccacacag gccagaagcc cttccagtgc cgcatctgca tgagaaactt cagccgagag 600
gataacttgc acactcacat ccgcacccac acaggcgaaa agcccttcgc ctgcgacatc 660
tgtggaagaa agtttgcccg gagcgatgaa cttgtccgac ataccaagat ccacttgcgg 720
cagaaggacc gcccttacgc ttgcccagtg gagtcctgtg atcgccgctt ctcccaatca 780
gggaatctga ctgagcacat ccgcatccac acaggccaga agcccttcca gtgccgcatc 840
tgcatgagaa acttcagcac aagtggacat ctggtacgcc acatccgcac ccacacaggc 900
- 337 046157 gaaaagccct gaacatacca gtcttgaaat cagaatttgt tcgcctgcga agatccactt acacagccca cccttctaga catctgtgga gcggcagaag gaatatggag tcaactgagg agaaagtttg gacgtgtacg cttcagaaca aaactccagg cccagaatag ttgggggttt aagtacagct ccatggtgat taccctgacc agagagccgg tctggaggaa tgagatctca
960
1020
1080
1140 <210> 223 <211> 380 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 223
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
5 10 15
Leu Glu Glu
Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu
40
Ser Glu Val Pro Ser Asp Trp 45
Glu Val Asp Asp Leu Leu Cys
55
Ser Leu Leu Ser Pro Pro Ala Ser Leu
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 75 80
Tyr Ser
Leu Pro
Cys Arg
Lys Glu
100
Ala Glu
Gln Glu 115
Leu Leu
130
Glu Lys
Lys Thr 145
Glu Glu
Pro Val
Glu Ser
Arg Glu 85
Gly Thr
Ile Ala
Glu Gly
Gln Ile
150
Cys Asp 165
Thr Val
Ser Met
Asp Leu
Glu Ser
Gln Met
Thr Pro 105
Gln His
Met Glu
110
Arg Leu
120
Val Leu
Thr Asp
Glu Glu 125
Leu Ile 135
Leu Pro
Glu Thr
140
Leu Pro
Leu Lys
Arg Val
Arg Arg 155
Pro Tyr
Arg Arg
Phe Ser
170
Arg Ser
Asp Asn
Glu Ser 95
Glu Leu
Lys Ser
Leu Thr
Ala Cys 160
Leu Val 175
- 338 046157
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
180 185
Gln Cys Arg Ile
190
Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His
195 200
Thr His Ile Arg 205
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
210 215 220
Cys Gly Arg Lys
Phe Ala Arg Ser Asp Glu Leu Val Arg His 225 230
Thr Lys 235
Ile His Leu Arg
240
Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser
245 250
Cys Asp Arg Arg
255
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg
260 265
Ile His Thr Gly 270
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
275 280
Phe Ser Thr Ser 285
Gly His Leu Val Arg His Ile Arg Thr His Thr Gly
290 295 300
Glu Lys Pro Phe
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn
305 310 315
Ser Thr Leu Thr
320
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Val
325 330
Tyr Val Gly Gly
335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn
340 345
Met Glu Leu Gln
350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser
355 360
Leu Leu Asp Gln 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser
370 375 380 <210> 224 <211> 155 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 224
Синтетический
- 339 046157
Met Glu 1
Leu Glu
Leu Asp 5
Ala Gly
Asp Gln
Asp Leu
Leu Ala Phe Leu
Leu Glu
Glu Ser
Gly Asp
Leu Gly
Thr Ala 25
Pro Asp
Glu Ala Val Arg 30
Ala Pro
Leu Asp 35
Trp Ala
Leu Pro
Leu Ser
Glu Val
Pro Ser Asp Trp 45
Glu Val
Asp Asp
Leu Leu
Cys Ser 55
Leu Leu
Ser Pro
Pro Ala Ser Leu
Asn Ile 65
Leu Ser
Ser Ser
Asn Pro
Cys Leu
Val His 75
His Asp His Thr
Tyr Ser
Leu Pro
Arg Glu 85
Thr Val
Ser Met
Asp Leu
Glu Ser Glu Ser
Cys Arg
Lys Glu
100
Gly Thr
Gln Met
Thr Pro 105
Gln His
Met Glu Glu Leu
110
Ala Glu
Gln Glu 115
Ile Ala
Arg Leu
120
Val Leu
Thr Asp
Glu Glu Lys Ser 125
Leu Leu
130
Glu Lys
Glu Gly
Leu Ile 135
Leu Pro
Glu Thr
140
Leu Pro Leu Thr
Lys Thr 145
Glu Glu
Gln Ile
150
Leu Lys
Arg Val
Arg 155 <210> 225 <211> 199 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 225
Синтетический
Val Tyr Val Gly Gly Leu 1 5
Glu Ser Arg Val Leu Lys 10
Tyr Thr Ala Gln 15
Asn Met Glu Leu Gln Asn
Lys Val Gln Leu Leu Glu 25
Glu Gln Asn Leu
Ser Leu Leu Asp Gln Leu 35
Arg Lys Leu Gln Ala Met 40
Val Ile Glu Ile 45
Ser Asn Lys Thr Ser Ser
Ser Ser Thr Cys Ile Leu
Val Leu Leu Val
- 340 046157
55 60
Ser Phe 65
Gly Ser
Leu Pro
Glu Val
Cys Leu
Leu Pro
Ser Glu
100
Pro Lys 115
Leu Leu
Val Pro
Ala Met
Ala Glu 85
Asp Pro
Asp Ser
His Gly
Val Leu
Tyr Gln
Leu Glu 105
Thr His
120
Gln Trp
Val Leu
130
Gln Ala
Pro Gly
Asn Thr 135
Ser Cys
Gln Ala 145
Pro Ser
Ala Glu
150
Pro Pro
Leu Glu
Phe Ser
Glu Pro
Leu Cys 165
Arg Gly
Pro Ile
170
Leu Thr
Arg Lys
180
Gly Gly
Trp Leu
Pro Thr 185
Tyr Ser 75
Ser Arg
Leu Pro
Leu Asp
Leu Leu
140
Trp Pro 155
Leu Pro
Gly Ser
Ser Asp Thr Arg 80
Gln Leu Arg Ala 95
Ala Leu Gln Ser
110
Gly Ser Asp Cys 125
His Tyr Met Pro
Phe Pro Asp Leu
160
Leu Gln Ala Asn
175
Pro Ser Val Ile
190
Leu Gln
Asp Arg 195
Tyr Ser
Gly <210> 226 <211> 49 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 226
Синтетический
Val Tyr Val Gly Gly Leu 1 5
Asn Met Glu Leu Gln Asn
Ser Leu Leu Asp Gln Leu 35
Glu Ser Arg Val Leu Lys 10
Lys Val Gln Leu Leu Glu 25
Arg Lys Leu Gln Ala Met 40
Tyr Thr Ala Gln 15
Glu Gln Asn Leu
Val Ile Glu Ile 45
Ser

Claims (24)

1. Полинуклеотид, содержащий последовательность нуклеиновой кислоты, кодирующую не встречающийся в природе фактор транскрипции, причем не встречающийся в природе фактор транскрипции содержит аминокислотную последовательность, имеющую по меньшей мере 97% идентичность последовательности SEQ ID NO: 127.
2. Полинуклеотид по п.1, в котором не встречающийся в природе фактор транскрипции содержит аминокислотную последовательность SEQ ID NO: 127.
3. Полинуклеотид по п.1 или 2, где полинуклеотид дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в парвальбумин (PV)содержащих нейронах, чем в других типах клеток, и где регуляторный элемент содержит SEQ ID NO: 1, 2, 3 или 4.
4. Полинуклеотид по п.3, в котором регуляторный элемент содержит SEQ ID NO: 2.
5. Полинуклеотид по любому из пп.1-4, дополнительно содержащий микроРНК связывающий сайт.
6. Полинуклеотид по п.5, в котором микроРНК связывающий сайт содержит SEQ ID NO: 9, 11 или 13.
7. Полинуклеотид по п.5, в котором микроРНК связывающий сайт содержит SEQ ID NO: 7, 14 или 15.
8. Полинуклеотид по п.5, где полинуклеотид содержит последовательность нуклеиновой кислоты, характеризующуюся идентичностью, составляющей по меньшей мере 95% по отношению к SEQ ID NO: 71.
9. Полинуклеотид по п.5, где полинуклеотид содержит SEQ ID NO: 71.
10. Полинуклеотид по любому из пп.1-9, где не встречающийся в природе фактор транскрипции увеличивает экспрессию гена SCNIA в клетке.
11. Экспрессионный вектор, содержащий полинуклеотид по любому из пп.1-10.
12. Экспрессионный вектор по п.11, где экспрессионный вектор представляет собой вирусный вектор.
13. Экспрессионный вектор по п.11, где вирусный вектор представляет собой аденоассоциированный вирусный (AAV) вектор.
14. Экспрессионный вектор по п.13, где AAV вектор имеет серотип AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10, AAV птиц, AAV крупного рогатого скота, AAV собак, AAV лошадей, AAV приматов, AAV не приматов, AAV овец, scAAV, scAAV1, scAAV2, scAAV5, scAAV8 или scAAV9, или их гибриды.
15. Экспрессионный вектор по п.14, где полинуклеотид дополнительно содержит последовательность 5' AAV инвертированного концевого повтора (ITR) и последовательность 3' AAV ITR.
16. Экспрессионный вектор по п.15, где каждая из последовательностей 5' AAV ITR и 3' AAV ITR независимо представляет собой AAV1, AAV2, AAV5, AAV8 или AAV9.
17. Фармацевтическая композиция, содержащая полинуклеотид по любому из пп.1-10 или экспрессионный вектор по любому из пп.11-16.
18. Клетка, содержащая полинуклеотид по любому из пп.1-10 или экспресионный вектор по любому из пп.11-16.
19. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для лечения эпилепсии у нуждающегося в этом субъекта.
20. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для лечения синдрома Драве у нуждающегося в этом субъекта.
21. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для снижения частоты или продолжительности припадков.
22. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для лечения эпилепсии у нуждающегося в этом субъекта.
23. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для лечения синдрома Драве у нуждающегося в этом субъекта.
24. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для снижения частоты или продолжительности припадков.
EA202193162 2019-05-29 2020-05-29 Композиции и способы селективной регуляции экспрессии генов EA046157B1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US62/854,238 2019-05-29
US62/857,727 2019-06-05
US63/008,569 2020-04-10

Publications (1)

Publication Number Publication Date
EA046157B1 true EA046157B1 (ru) 2024-02-12

Family

ID=

Similar Documents

Publication Publication Date Title
US12083188B2 (en) Engineered DNA binding proteins
KR102604159B1 (ko) 조직 선택적 트랜스진 발현
US20220136009A1 (en) Compositions and methods for selective gene regulation
CN107438671B (zh) 变体RNAi
TW201920679A (zh) 眼部疾病之細胞模式及用於眼部疾病的療法
US20230365963A1 (en) Methods for treating neurological disease
US20220193264A1 (en) Compositions and methods for treating laminopathies
CN112639108A (zh) 治疗非综合征性感觉神经性听力损失的方法
CN116134134A (zh) 用于治疗c9orf72相关疾病的三功能腺伴随病毒(aav)载体
EA046157B1 (ru) Композиции и способы селективной регуляции экспрессии генов
TW202221119A (zh) Dna結合域轉活化子及其用途