EA042798B1 - Терапевтические мишени для коррекции гена дистрофина человека с помощью редактирования генов и способы их применения - Google Patents

Терапевтические мишени для коррекции гена дистрофина человека с помощью редактирования генов и способы их применения Download PDF

Info

Publication number
EA042798B1
EA042798B1 EA201891317 EA042798B1 EA 042798 B1 EA042798 B1 EA 042798B1 EA 201891317 EA201891317 EA 201891317 EA 042798 B1 EA042798 B1 EA 042798B1
Authority
EA
Eurasian Patent Office
Prior art keywords
seq
grna molecule
nucleotide sequence
encoded
sequence shown
Prior art date
Application number
EA201891317
Other languages
English (en)
Inventor
Чарльз А. Герсбах
Жаклин Н. Робинсон-Хамм
Original Assignee
Дьюк Юниверсити
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Дьюк Юниверсити filed Critical Дьюк Юниверсити
Publication of EA042798B1 publication Critical patent/EA042798B1/ru

Links

Description

Перекрестная ссылка на родственные заявки
Данная заявка заявляет приоритет по предварительной заявке на патент США № 62/260712, поданной 30 ноября 2015 г., и предварительной заявке на патент США № 62/330336, поданной 2 мая 2016 г., все из которых включены в данный документ посредством ссылки во всей своей полноте.
Заявление о государственной заинтересованности
Настоящее изобретение было создано при государственной поддержке в соответствии с программой стипендий для выпускников, присужденной Национальным научным фондом. Правительство США обладает определенными правами на настоящее изобретение.
Область техники изобретения
Настоящее изобретение относится к области изменения экспрессии гена, конструирования генома и геномной перестройки генов с применением систем на основе коротких палиндромных повторов, регулярно расположенных группами, на основе систем (CRISPR)/CRISPR-ассоциированного белка (Cas) 9 и вирусных систем доставки. Настоящее изобретение также относится к области геномной инженерии и геномной перестройки генов в мышце, такой как скелетная мышца и сердечная мышца.
Предпосылки изобретения
Синтетические факторы транскрипции были разработаны для контроля экспрессии генов для многих различных медицинских и научных применений в системах, относящихся к млекопитающим, включая стимуляцию регенерации тканей, отбор лекарственных средств, компенсацию генетических дефектов, активацию молчащих онкосупрессоров, контроль дифференцировки стволовых клеток, проведение генетических скринингов и создание синтетических генных сетей. Эти факторы транскрипции способны целенаправленно воздействовать на промоторы или энхансеры эндогенных генов или могут быть целенаправленно сконструированы для распознавания последовательностей, ортогональных к геномам млекопитающих, для трансгенной регуляции. Наиболее общие стратегии конструирования новых факторов транскрипции, нацеленных на определяемые пользователем последовательности, основывались на программируемых ДНК-связывающих доменах белков цинковых пальцев и эффекторах, подобных активаторам транскрипции (TALE). Оба эти подхода предусматривают применение принципов взаимодействий белок-ДНК этих доменов с конструированием новых белков с уникальной ДНК-связывающей специфичностью. Хотя эти способы были очень успешны в большом числе применений, белковая инженерия, необходимая для манипулирования взаимодействиями белок-ДНК, может быть трудоемкой и нуждаться в специальных знаниях и навыках.
Кроме того, эти новые белки не всегда являются эффективными. Причины этого еще не известны, но могут быть связаны с эффектами эпигенетических модификаций и состоянием хроматина при связывании белка с целевым сайтом в геноме. Кроме того, существуют проблемы в обеспечении того, чтобы эти новые белки, а также другие компоненты доставлялись в каждую клетку. Существующие способы доставки этих новых белков и множества их компонентов включают доставку к клеткам в отдельных плазмидах или векторах, что приводит к высоковариабельным уровням экспрессии в каждой клетке из-за различий в количестве копий. Кроме того, активация генов после трансфекции является временной вследствие растворения плазмидной ДНК, а непостоянная экспрессия генов может быть недостаточной для индукции терапевтических эффектов. Более того, данный подход не подходит для типов клеток, которые не легко трансфицировать. Таким образом, другим ограничением этих новых белков является эффективность активации транскрипции.
Системы редактирования генов на основе CRISPR/Cas9 могут использоваться для введения сайтспецифических двухнитевых разрывов в целевые геномные локусы. Такое расщепление ДНК стимулирует естественный механизм репарации ДНК, сводящийся к одному из двух возможных путей репарации. При отсутствии донорной матрицы разрыв подвергают репарации посредством негомологичного соединения концов (NHEJ), подверженного погрешностям пути репарации, что приводит к небольшим вставкам или делециям ДНК. Данный способ можно использовать для намеренного разрушения, делеции или изменения рамки считывания последовательностей целевых генов. Однако если донорная матрица предоставляется вместе с нуклеазами, то клеточный аппарат осуществляет репарацию разрыва путем гомологичной рекомбинации, которая усиливается на несколько порядков в присутствии расщепления ДНК. Данный способ можно применять для введения специфических изменений в последовательность ДНК в целевых сайтах. Сконструированные нуклеазы применялись для редактирования генов в различных стволовых клетках и линиях клеток человека, а также для редактирования генов в печени мыши. Однако основной преградой для реализации этих технологий является доставка к конкретным тканям in vivo таким образом, который является эффективным, действенным и способствует успешной модификации генома.
Наследственные генетические заболевания характеризуются разрушающими эффектами по отношению к детям в Соединенных Штатах. Эти заболевания в настоящее время не поддаются лечению и можно лишь оказывать помощь, пытаясь облегчить симптомы. В течение нескольких десятилетий в области генной терапии обещали обеспечить лечение этих заболеваний. Однако технические преграды, связанные с безопасностью и действенностью доставки терапевтических генов к клеткам и пациентам, ограничивали данный подход. Мышечная дистрофия Дюшенна (DMD) представляет собой смертельное
- 1 042798 генетическое заболевание, клинически характеризующееся мышечной атрофией, потерей способности к передвижению и смертью, как правило на третьем десятилетии жизни вследствие функциональной дистрофии. DMD является результатом врожденных или спонтанных мутаций в гене дистрофина. Большая часть мутаций, вызывающих DMD, является результатом делеций экзона(ов), сдвигая трансляционную рамку считывания за пределы рамки.
Дистрофин является ключевым компонентом белкового комплекса, который отвечает за регуляцию целостности и функции мышечных клеток. Пациенты с DMD обычно теряют способность физически поддерживать себя на протяжении детства, постепенно становятся слабее в подростковом возрасте и умирают в возрасте от двадцати до тридцати лет. Существующие на данный момент стратегии экспериментальной генной терапии по отношению к DMD требуют повторного введения средств доставки временных генов или полагаются на постоянное включение чужеродного генетического материала в геномную ДНК. Оба данных способа имеют серьезные проблемы с безопасностью. Более того, эти стратегии ограничивались неспособностью доставлять крупную и сложную последовательность гена дистрофина. Остается потребность в более точном и действенном инструменте для редактирования генов для коррекции и лечения пациентов с мутациями в гене дистрофина.
Краткое описание изобретения
Настоящее изобретение направлено на направляющую РНК (gRNA), содержащую нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность.
Настоящее изобретение также относится к композиции для нацеливания на ДНК, содержащей первую gRNA и вторую gRNA. Первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность. Первая молекула gRNA и вторая молекула gRNA содержат нацеливающие домены.
Настоящее изобретение также относится к выделенному полинуклеотиду, содержащему вышеописанную молекулу gRNA или вышеописанную композицию для нацеливания на ДНК.
Настоящее изобретение относится к вектору, содержащему вышеописанную gRNA, вышеописанную композицию для нацеливания на ДНК или вышеописанный выделенный полинуклеотид.
Настоящее изобретение также относится к вектору, содержащему вышеописанную композицию для нацеливания на ДНК.
Настоящее изобретение также относится к вектору, кодирующему (a) первую молекулу направляющей РНК (gRNA);
(b) вторую молекулу gRNA; и (c) по меньшей мере одну молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
Первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность. Первая молекула gRNA и вторая молекула gRNA содержат нацеливающие домены.
Настоящее изобретение также относится к клетке, содержащей вышеописанную gRNA, вышеописанную композицию для нацеливания на ДНК, вышеописанный выделенный полинуклеотид или вышеописанный вектор.
Настоящее изобретение также относится к набору, содержащему вышеописанную gRNA, вышеописанную систему для нацеливания на ДНК, вышеописанный выделенный полинуклеотид, вышеописанный вектор или вышеописанную клетку и необязательно инструкции по применению.
Настоящее изобретение также относится к способу коррекции мутантного гена дистрофина в клетке. Способ предусматривает введение в клетку вышеописанной gRNA, вышеописанной системы для нацеливания на ДНК, вышеописанного выделенного полинуклеотида или вышеописанного вектора.
Настоящее изобретение также относится к способу редактирования мутантного гена дистрофина в геноме субъекта. Способ предусматривает введение субъекту композиции для редактирования генома, содержащей вышеописанную gRNA, вышеописанную систему для нацеливания на ДНК, вышеописанный выделенный полинуклеотид или вышеописанный вектор.
Настоящее изобретение также относится к способу лечения субъекта, нуждающегося в этом, у ко
- 2 042798 торого имеется мутантный ген дистрофина. Способ предусматривает введение субъекту вышеописанной gRNA, вышеописанной системы для нацеливания на ДНК, вышеописанного выделенного полинуклеотида или вышеописанного вектора.
Настоящее изобретение также относится к модифицированному вектору на основе аденоассоциированного вируса для редактирования мутантного гена дистрофина в геноме субъекта, содержащего первую полинуклеотидную последовательность, кодирующую вышеописанную gRNA, и вторую полинуклеотидную последовательность, кодирующую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
Настоящее изобретение также относится к композиции для обеспечения делеции сегмента гена дистрофина, содержащей экзон 51, при этом композиция содержит (a) первый вектор, содержащий полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второй вектор, содержащий полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
Каждая из первой и второй молекул gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, где первый вектор и второй вектор сконструированы с возможностью образования первого и второго двухнитевых разрывов в первом интроне и втором интроне, фланкирующих соответственно экзон 51 гена DMD человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.
Настоящее изобретение также относится к клетке, содержащей вышеописанную композицию.
Настоящее изобретение также относится к способу коррекции мутантного гена дистрофина в клетке, предусматривающему введение в клетку (a) первого вектора, содержащего полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второго вектора, содержащего полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
Каждая из первой молекулы gRNA и второй молекулы gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.
Настоящее изобретение также относится к способу лечения субъекта, нуждающегося в этом, у которого имеется мутантный ген дистрофина. Способ предусматривает введение субъекту (a) первого вектора, содержащего полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второго вектора, содержащего полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
Каждая из первой молекулы gRNA и второй молекулы gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.
Настоящее изобретение также относится к способу получения трансгенного эмбриона грызуна, у которого имеется ген дистрофина человека (hDMD), с делецией экзона 52 (Δ52). Способ предусматривает введение эмбриону грызуна вышеописанной gRNA, вышеописанной системы для нацеливания на ДНК, вышеописанного выделенного полинуклеотида, вышеописанного вектора, вышеописанного модифицированного вектора на основе аденоассоциированного вируса или вышеописанной композиции, за счет чего обеспечивается делеция экзона 52 из гена дистрофина человека, и отбор трансгенного эмбриона грызуна, у которого имеется делеция экзона 52 гена дистрофина человека, где эмбрион грызуна содержит нормальный ген дистрофина человека.
- 3 042798
Настоящее изобретение также относится к трансгенному эмбриону грызуна, полученному с помощью вышеописанного способа.
Настоящее изобретение также относится к трансгенному грызуну, полученному из вышеописанного трансгенного эмбриона грызуна.
Краткое описание графических материалов
На фиг. 1 показана активность отдельных JCR89 и JCR91 gRNA, которые нацеливают ген дистрофина человека в клетках HEK293T (ген дистрофина дикого типа) и линии миобластов пациентов с DMD (DMD 8036 и DMD 6594, каждый из которых обладает мутантной формой гена дистрофина), определенной с помощью анализа Surveyor.
На фиг. 2A и 2B показана делеция экзона 51 в геномной ДНК клеток HEK293T и миобластах пациентов с DMD (DMD 8036 и DMD 6594) (фиг. 2A) и кДНК из миобластов миобластов пациентов с DMD (фиг. 2B) с помощью совместной обработки SaCas9, и gRNA JCR89, и JCR91.
На фиг. 3 показана система на основе AAV in vivo для совместной доставки SaCas9 и JCR89 и JCR91 gRNA в двух вирусных векторах к мышечным тканям.
На фиг. 4 показано выявление делеции экзона 51 человека у трансгенных мышей, несущих ген DMD человека (hDMD/mdx мышей), после местной доставки вирусных векторов AAV8, несущих SaCas9 и gRNA, в переднюю большеберцовую мышцу (TA).
На фиг. 5 показано выявление делеции экзона 51 человека у трансгенных мышей, несущих ген hDMD, после системной доставки AAV8 с помощью инъекции в хвостовую вену.
На фиг. 6 показаны различные мишени gRNA, которые сохраняются между геномами человека и макака-резуса (см. последовательности gRNA в табл. 2). Расположение каждой gRNA указано по отношению к экзону 51 гена дистрофина человека.
На фиг. 7 показана активность отдельных gRNA после трансфекции клеток HEK293T человека, определенных с помощью анализа Surveyor.
На фиг. 8 показана специфичность кандидатных gRNA, предсказанных с применением программы CasOFFinder (Bae et al. (2014), Bioinformatics, 30: 147 3-1475).
На фиг. 9 показана делеция экзона 51 с помощью JCR157 и JCR160 gRNA в клетках HEK293T и клетках DMD 6594, как определено с помощью ПЦР геномной ДНК.
На фиг. 10 показана активность, определенная с помощью Surveyor, различных целевых длин gRNA JCR157: 19, 20, 21, 22 и 23 нуклеотидов.
На фиг. 11 показана активность, определенная с помощью Surveyor, различных целевых длин gRNA JCR160: 19, 20, 21, 22 и 23 нуклеотидов.
На фиг. 12 показаны делеции, полученные путем объединения JCR157 и JCR160 различной длины (21, 22 или 23 нуклеотида), как определено с помощью ПЦР геномной ДНК.
На фиг. 13 показана целевая нуклеазная активность с помощью анализа Surveyor in vitro.
На фиг. 14 показана делеция экзона 51 в геномной ДНК in vitro.
На фиг. 15 показана делеция экзона 51 в кДНК миобластов DMD человека in vitro, дифференцированных в течение 7 дней.
На фиг. 16 показано соединение экзонов 47-52 в кДНК миобластов пациентов с DMD in vitro.
На фиг. 17 показана конструкция мыши A52/mdx начиная со здоровой мыши hDMD/mdx.
На фиг. 18 показана проверка соответствия направляющей последовательности in vitro: индивидуальная (анализ Surveyor).
На фиг. 19 показана проверка соответствия направляющей последовательности in vitro: парная, при этом делецию экзона 51 в геномной ДНК клеток HEK293T создавали с использованием пары gRNA.
На фиг. 20 показан схематический протокол для микроинъекций ДНК.
На фиг. 21 показано схематическое скрещивание мышей.
На фиг. 22 показаны результаты генотипирования мышей-основателей.
На фиг. 23 показана часть результатов секвенирования у мышей-основателей 7, 63 и 76.
На фиг. 24 показано схематическое дополнительное скрещивание мышей.
На фиг. 25 показано генотипирование помета 5 (только самцы) в результате скрещивания самца основателя 76+mdx/mdx. 63 представляет собой самца основателя (однако в данном случае не родителя). 293 представляет клетку HEK293T геномной контрольной ДНК.
На фиг. 26 показано генотипирование помета 1 в результате скрещивания самца основателя 63+mdx/mdx.
На фиг. 27 показана часть прочтения секвенирования размером 392 п.о. детенышей 54497 и 54498.
На фиг. 28 показано иммуногистохимическое окрашивание сердца и TA из детенышей 54497 и 54498.
На фиг. 29 показано, что у мыши A52/mdx отсутствует белок дистрофин.
На фиг. 30 показан вестерн-блоттинг, указывающий на то, что у мыши A52/mdx отсутствует белок дистрофин, что согласуется с генотипом DMD, тогда как у здоровой мыши hDMD/mdx экспрессировался дистрофин.
- 4 042798
На фиг. 31 показана общая активность мыши A52/mdx по сравнению с мышами mdx и мышами hDMD/mdx, указанная на основании двигательной активности и осмотра.
На фиг. 32 показана стратегия коррекции мыши A52/mdx с применением SaCas9 и gRNA для пропуска экзона 51 с помощью нацеливания gRNA выше и ниже экзона 51 в интронной области для удаления.
На фиг. 33 показано восстановление белка дистрофина in vitro из делеции экзона 51 в миобластах пациента с DMD (клетки DMD 6594) с применением SaCas9 и JCR179 и JCR183 gRNA.
На фиг. 34 показана схема эксперимента по обработке мыши A52/mdx с применением gRNA и системы SaCas9.
На фиг. 35 показана делеция экзона 51 in vivo в правой TA мышце.
На фиг. 36 показана делеция экзона 51 in vivo в правой TA мышце.
На фиг. 37 показано восстановление белка дистрофина in vivo в обработанной TA мышце.
На фиг. 38 показано восстановление белка дистрофина in vivo в обработанной TA мышце.
На фиг. 39 показано среднее значение всех моментов времени для общего пройденного расстояния.
На фиг. 40 показано среднее значение всех моментов времени для общего количества поз со стоянием на задних лапах.
На фиг. 41 показана сила хватки 16-недельных необработанных и обработанных мышей.
На фиг. 42 показаны результаты ПЦР кДНК сердечной ткани.
На фиг. 43 показано секвенирование кДНК, амплифицированной с помощью ПЦР, на основании полос из фиг. 42.
Подробное описание изобретения
Описанные в данном документе определенные способы и сконструированные gRNA были раскрыты для того, чтобы быть полезными для систем редактирования генов на основе CRISPR/CRISPRассоциированной (Cas) 9 для изменения экспрессии, конструирования генома и коррекции или уменьшения эффектов мутаций в гене дистрофина, вовлеченном в генетические заболевания, например DMD. Раскрытые gRNA получали для целевых сайтов, которые больше поддаются переходу к клиническому применению. Например, ген, кодирующий Cas9 (SpCas9) S. pyogenes, слишком большой для доставки с помощью аденоассоциированного вируса (AAV), вектора, применяемого для системной доставки в мышцы, в случае если включены все другие необходимые регуляторные последовательности. Вместо этого раскрытые gRNA отбирали и подвергали скринингу для использования с Cas9 (SaCas9) S. aureus, который приблизительно на 1 т.о. меньше, чем SpCas9. Целевые отборы подвергали скринингу, для того чтобы быть совместимыми с мишенями SaCas9 в последовательностях, которые сохранялись между геномами человека и макаков-резусов, что значительно ограничивает количество возможных генных мишеней. Этот критерий отбора был выбран с тем, чтобы обеспечить возможность кандидатам gRNA, которые могут быть активными как у людей, так и у макаков-резусов, облегчить доклиническое тестирование на моделях приматов, отличных от человека. Раскрытые gRNA, которые нацеливаются на последовательности гена дистрофина как человека, так и макака-резуса, могут применяться с системой на основе CRISPR/Cas9 для нацеливания на интронные области вокруг экзона 51 гена дистрофина человека, вызывая геномные делеции этой области, для восстановления экспрессии функционального дистрофина в клетках от пациентов с DMD.
Также в данном документе описаны генетические конструкции, композиции и способы доставки систем редактирования генов на основе CRISPR/Cas9 и множество gRNA для нацеливания на ген дистрофина. Раскрытый в настоящем изобретении объект изобретения также предусматривает способы доставки генетических конструкций (например, векторов) или содержащих их композиций в скелетную мышцу и сердечную мышцу. Вектор может представлять собой AAV, в том числе модифицированные векторы на основе AAV. Раскрытый в настоящем изобретении объект изобретения описывает способ доставки активных форм лекарственных средств данного класса в скелетную мышцу и сердечную мышцу, которые являются эффективными, действенными и способствуют успешной модификации генома, а также обеспечивает средства для исправления генома человека для терапевтических применений и целевых модельных видов для фундаментальных научных применений.
Заголовки разделов, используемые в данном разделе, и полное раскрытие данного документа представлены просто для организационных целей и не подразумеваются как ограничивающие.
1. Определения.
Если не определено иное, то все технические и научные термины, используемые в данном документе, имеют такое же значение, как обычно понятно специалисту в данной области техники. В случае противоречий преимущественную силу будет иметь данный документ, содержащий определения. Предпочтительные способы и материалы описаны ниже, хотя при практическом осуществлении или тестировании настоящего изобретения можно использовать способы и материалы, аналогичные или эквивалентные описанным в данном документе. Все публикации, заявки на патенты, патенты и другие ссылочные материалы, упомянутые в данном документе, включены посредством ссылки во всей своей полноте. Материалы, способы и примеры, раскрытые в данном документе, являются лишь иллюстративными и не
- 5 042798 подразумеваются как ограничивающие.
Подразумевается, что термины содержат(ит), в том числе, имеющий, имеет, может, включает(ют) и их варианты, используемые в данном документе, являются открытыми переходными фразами, терминами или словами, которые не исключают возможность наличия дополнительных действий или структур. Формы единственного числа включают ссылки на множественное число, если контекст явно не указывает на иное. Настоящее изобретение также охватывает другие варианты осуществления, содержащие варианты осуществления или элементы, представленные в данном документе, состоящие из них и фактически состоящие из них, независимо от того, изложены они явным образом или нет.
При упоминании в данном документе числовых диапазонов каждое промежуточное число в них охватывается явным образом с той же степенью точности. Например, в случае диапазона 6-9 в дополнение к 6 и 9 охватываются числа 7 и 8, а в случае диапазона 6,0-7,0 явным образом охватываются числа 6,0, 6,1, 6,2, 6,3, 6,4, 6,5, 6,6, 6,7, 6,8, 6,9 и 7,0.
Используемый в данном документе термин приблизительно или примерно означает допустимый диапазон ошибок для конкретного уровня, определенного специалистом в данной области техники, который частично будет зависеть от того, как измеряют или определяют уровень, т.е. ограничений в системе измерения. Например, приблизительно может означать 3 или более 3 стандартных отклонений в соответствии с практикой в данной области техники. В качестве альтернативы приблизительно может означать диапазон до 20%, предпочтительно до 10%, более предпочтительно до 5% и более предпочтительно до 1% от данного уровня. В качестве альтернативы, в частности, в соответствии с биологическими системами или процессами термин может означать в пределах одного порядка величины предпочтительно в 5 раз и более предпочтительно в 2 раза от значения.
Термины аденоассоциированный вирус или AAV, используемые в данном документе взаимозаменяемо, относятся к небольшому вирусу, принадлежащему к роду Dependovirus семейства Parvoviridae, который инфицирует людей и некоторые другие виды приматов. В настоящее время AAV не вызывает болезни, а следовательно вирус вызывает очень умеренный иммунный ответ.
Используемый в данном документе термин область связывания относится к области в целевой области для нуклеазы, которая распознается и связывается нуклеазой.
Термины сердечная мышца или мышца сердца, используемые в данном документе взаимозаменяемо, означают тип рефлективной поперечно-полосатой мышцы, обнаруженной в стенках и гистологической основе сердца - миокарде. Сердечная мышца состоит из кардиомиоцитов или миокардиоцитов. Миокардиоциты демонстрируют полосатость, сходную с таковой в скелетных мышечных клетках, однако содержат лишь одно уникальное ядро в отличие от многоядерных скелетных мышц. В определенных вариантах осуществления термин состояние сердечной мышцы относится к состоянию, связанному с сердечной мышцей, такому как кардиомиопатия, сердечная недостаточность, аритмия и воспалительная болезнь сердца.
Используемый в данном документе термин кодирующая последовательность или кодирующая нуклеиновая кислота означает нуклеиновые кислоты (молекулу РНК или ДНК), которые содержат нуклеотидную последовательность, кодирующую белок. Кодирующая последовательность может дополнительно включать в себя сигналы инициации и терминации, функционально связанные с регуляторными элементами, в том числе промотор и сигнал полиаденилирования, способные управлять экспрессией в клетках индивидуума или млекопитающего, которому вводят нуклеиновую кислоту. Кодирующая последовательность может являться кодон-оптимизированной.
Используемый в данном документе термин комплементарная последовательность или комплементарный означает, что нуклеиновая кислота может образовывать пары оснований согласно УотсонуКрику (например, A-T/U и C-G) или Хугстену между нуклеотидами или нуклеотидными аналогами молекул нуклеиновых кислот. Термин комплементарность относится к свойству, разделяемому двумя последовательностями нуклеиновой кислоты, за счет которого, в случае если они выровнены антипараллельно друг другу, нуклеотидные основания в каждом положении будут комплементарными.
Термины коррекция, редактирование генома и восстановление, используемые в данном документе, относятся к изменению мутантного гена, который кодирует усеченный белок или вообще не кодирует какой-либо белок, за счет чего достигается экспрессия полноразмерного функционального или частично полноразмерного функционального белка. Коррекция или восстановление мутантного гена может предусматривать замену области гена, в которой имеется мутация, или замену всего мутантного гена копией гена, в которой мутация отсутствует, с помощью механизма репарации, такого как репарация с участием гомологичной рекомбинации (HDR). Коррекция или восстановление мутантного гена может также предусматривать репарацию мутации со сдвигом рамки, которая является причиной преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга, путем создания двухнитевого разрыва в гене, который затем репарируют с использованием негомологичного соединения концов (NHEJ). За счет NHEJ может добавляться или удаляться по меньшей мере одна пара оснований в ходе репарации, что может восстанавливать соответствующую рамку считывания и устранять преждевременный стоп-кодон. Коррекция или восстановление мутантного гена также
- 6 042798 может предусматривать разрушение аберрантного сайта акцептора сплайсинга или последовательности донора сплайсинга. Коррекция или восстановление мутантного гена может также предусматривать удаление сегмента гена, не являющегося существенно важным, путем одновременного воздействия двух нуклеаз на одну и ту же нить ДНК, для того чтобы восстановить соответствующую рамку считывания путем удаления ДНК между двумя сайтами-мишенями для нуклеаз и репарации разрыва ДНК с помощью NHEJ.
Термины донорная ДНК, донорная матрица и матрица репарации, используемые в данном документе взаимозаменяемо, относятся к фрагменту или молекуле двухнитевой ДНК, которая включает в себя по меньшей мере часть представляющего интерес гена. Донорная ДНК может кодировать полнофункциональный белок или частично функциональный белок.
Термин мышечная дистрофия Дюшенна или DMD, используемый в данном документе взаимозаменяемо, относится к рецессивному, фатальному, X-сцепленному нарушению, которое приводит к дегенерации мышц и впоследствии смертельному исходу. DMD является распространенным наследственным моногенным заболеванием и встречается у 1 из 3500 мужчин. DMD является результатом врожденных или спонтанных мутаций, которые вызывают нонсенс-мутации или мутации со сдвигом рамки в гене дистрофина. Большинство мутаций дистрофина, которые являются причиной DMD, представляют собой делеции экзонов, которые разрушают рамку считывания и приводят к преждевременной терминации трансляции в гене дистрофина. Пациенты с DMD обычно теряют способность физически поддерживать себя на протяжении детства, постепенно становятся слабее в подростковом возрасте и умирают в возрасте от двадцати до тридцати лет.
Используемый в данном документе термин дистрофин относится к стержнеобразному цитоплазматическому белку, который является частью белкового комплекса, соединяющего цитоскелет мышечного волокна с окружающим внеклеточным матриксом через клеточную мембрану. Дистрофин обеспечивает структурную стабильность дистрогликанового комплекса клеточной мембраны, который отвечает за регуляцию целостности и функции мышечных клеток. Ген дистрофина или ген DMD, используемые в данном документе взаимозаменяемо, образован 2,2 млн пар оснований в локусе Xp21. Размер первичного транскрипта составляет приблизительно 2400 т.о., при этом размер зрелой mRNA составляет приблизительно 14 т.о. 79 экзонов кодируют белок, образованный более чем 3500 аминокислотами.
Термин экзон 51, используемый в данном документе, относится к 51-му экзону гена дистрофина. Экзон 51 у пациентов с DMD часто является смежным с положениями делеций, разрушающих рамку считывания, и в клинических испытаниях на него был направлен пропуск экзона, основанный на применении олигонуклеотидов. Недавно в клиническом испытании с пропуском экзона 51 с помощью соединения этерлипсена сообщалось о значительном положительном функциональном эффекте в течение 48 недель со средним количеством дистрофин-положительных волокон 47% по сравнению с исходным уровнем. Мутации в экзоне 51 идеально подходят для устойчивой коррекции посредством редактирования генома на основе NHEJ.
Термины сдвиг рамки или мутация сдвига рамки, используемые в данном документе взаимозаменяемо, относятся к типу мутации гена, при которой добавление или делеция одного или нескольких нуклеотидов вызывает сдвиг в рамке считывания кодонов в mRNA. Сдвиг в рамке считывания может привести к изменению аминокислотной последовательности при трансляции белка, такой как миссенсмутация или преждевременный стоп-кодон.
Термины функциональный и полнофункциональный, используемые в данном документе взаимозаменяемо, описывают белок, который обладает биологической активностью. Термин функциональный ген относится к гену, транскрибируемому в mRNA, которая подвергается трансляции в функциональный белок.
Термин слитый белок, используемый в данном документе, относится к химерному белку, созданному путем соединения двух или более генов, которые исходно кодировали отдельные белки. Трансляция гибридного гена приводит к получению одного полипептида с функциональными свойствами, полученными от каждого из исходных белков.
Термин генетическая конструкция, используемый в данном документе, относится к молекулам ДНК или РНК, которые содержат нуклеотидную последовательность, кодирующую белок. Кодирующая последовательность включает в себя сигналы инициации и терминации, функционально связанные с регуляторными элементами, в том числе промотор и сигнал полиаденилирования, способные управлять экспрессией в клетках индивидуума, которому вводят молекулу нуклеиновой кислоты. Используемый в данном документе термин экспрессируемая форма относится к генным конструкциям, которые содержат необходимые регуляторные элементы, функционально связанные с кодирующей последовательностью, которая кодирует белок, за счет чего, в случае если он присутствует в клетке индивидуума, кодирующая последовательность будет экспрессироваться.
Используемый в данном документе термин генетическое заболевание относится к заболеванию, частично или полностью, непосредственно или косвенно вызванному одним или несколькими нарушениями в геноме, особенно к состоянию, которое присутствует от рождения. Нарушение может являться мутацией, вставкой или делецией. Нарушение может влиять на кодирующую последовательность гена
- 7 042798 или его регуляторную последовательность. Генетическое заболевание может представлять собой без ограничения DMD, мышечную дистрофию Беккера (BMD), гемофилию, кистозный фиброз, хорею Гантингтона, семейную гиперхолестеринемию (дефект рецептора LDL), гепатобластому, болезнь Вилсона, врожденную печеночную порфирию, наследственные нарушения обменных процессов в печени, синдром Леша-Нихана, серповидно-клеточную анемию, талассемию, пигментную ксеродермию, анемию Фанкони, пигментный ретинит, атаксию телеангиэктазию, синдром Блума, ретинобластому и болезнь ТайСакса.
Термин репарация с участием гомологичной рекомбинации или HDR, используемый в данном документе взаимозаменяемо, относится к механизму в клетках для репарации двухнитевых повреждений ДНК, в случае если в ядре присутствует гомологичная часть ДНК, в основном в фазах G2 и S клеточного цикла. В HDR используется матрица донорной ДНК для управления репарацией, и ее можно использовать для создания специфических изменений последовательности в геноме, включая целенаправленное добавление целых генов. Если донорная матрица предоставляется вместе с системой редактирования генов на основе CRISPR/Cas9, то клеточный аппарат осуществляет репарацию разрыва путем гомологичной рекомбинации, которая усиливается на несколько порядков в присутствии расщепления ДНК. В случае если фрагмент гомологичной ДНК отсутствует, вместо этого может происходить негомологичное соединение концов.
Термин редактирование генома, используемый в данном документе, относится к изменению гена. Редактирование генома может предусматривать коррекцию или восстановление мутантного гена. Редактирование генома может предусматривать нокаут гена, такого как мутантный ген или нормальный ген. Редактирование генома можно использовать для лечения заболеваний или улучшения восстановления мышц путем изменения представляющего интерес гена.
Термины идентичный или идентичность, используемые в данном документе в контексте двух или более нуклеиновых кислот или полипептидных последовательностей, означают, что последовательности имеют определенный процент остатков, которые являются идентичными в указанной области. Процент может быть рассчитан путем оптимального выравнивания двух последовательностей, сравнения двух последовательностей в указанной области, определения количества положений, в которых одинаковый остаток встречается в обеих последовательностях, с получением количества совпадающих положений, разделяя количество совпадающих положений на общее количество положений в указанной области и умножая результат на 100, чтобы получить процент идентичности последовательности. В случаях если две последовательности имеют разную длину или выравнивание дает в результате одну или несколько ступеней в шахматном порядке, а указанная область сравнения включает в себя только одну последовательность, при расчете эти остатки одной последовательности включаются в знаменатель, но не в числитель. При сравнении ДНК и РНК тимин (T) и урацил (U) можно считать эквивалентом. Идентификацию можно осуществлять вручную или с использованием компьютерного алгоритма для работы с последовательностями, такого как BLAST или BLAST 2.0.
Термины мутантный ген или мутированный ген, используемые в данном документе взаимозаменяемо, относятся к гену, который был подвергнут выявляемой мутации. Мутантный ген подвергся изменению, такому как потеря, получение или обмен генетического материала, что влияет на нормальную передачу и экспрессию гена. Термин разрушенный ген, используемый в данном документе, относится к мутантному гену, в котором имеется мутация, являющаяся причиной преждевременного стоп-кодона. Продукт разрушенного гена усечен по сравнению с продуктом полноразмерного неразрушенного гена.
Термин путь негомологичного соединения концов (NHEJ), используемый в данном документе, относится к пути репарации двухнитевых разрывов ДНК путем прямого лигирования концов разрыва без необходимости в гомологичной матрице. Независимое от матрицы повторное лигирование концов ДНК с помощью NHEJ представляет собой стохастический, подверженный ошибкам процесс репарации, который вводит случайные микровставки и микроделеции (вставки-делеции) в точке разрыва ДНК. Данный способ можно использовать для намеренного разрушения, делеции или изменения рамки считывания последовательностей целевых генов. Для управления репарацией в NHEJ обычно используются короткие гомологичные последовательности ДНК, называемые микрогомологиями. Эти микрогомологии часто присутствуют в однонитевых липких концах на конце двухнитевых разрывов. В случае если липкие концы идеально совместимы, то NHEJ обычно репарирует разрыв точно, однако может иметь место неточная репарация, приводящая к потере нуклеотидов, однако гораздо более часто липкие концы несовместимы.
Используемый в данном документе термин нормальный ген относится к гену, который не подвергался изменениям, таким как потеря, получение или обмен генетического материала. Нормальный ген подвергается нормальной передаче генов и экспрессии генов.
Термин опосредованный нуклеазой NHEJ, используемый в данном документе, относится к NHEJ, который инициируется после того, как нуклеаза, такая как молекула Cas9, разрезает двухнитевую ДНК.
Используемые в данном документе термины нуклеиновая кислота, или олигонуклеотид, или полинуклеотид означают по меньшей мере два нуклеотида, ковалентно связанных друг с другом. Изображение одиночной нити также определяет последовательность комплементарной нити. Таким образом,
- 8 042798 нуклеиновая кислота также охватывает комплементарную нить изображенной одиночной нити. Множество вариантов нуклеиновой кислоты можно использовать для той же цели, что и указанную нуклеиновую кислоту. Таким образом, нуклеиновая кислота также охватывает практически идентичные нуклеиновые кислоты и их комплементарные нити. Одиночная нить обеспечивает зонд, который может гибридизоваться с целевой последовательностью в жестких условиях гибридизации. Таким образом, нуклеиновая кислота также охватывает зонд, который гибридизуется в жестких условиях гибридизации.
Нуклеиновая кислота может быть однонитевой или двухнитевой или может содержать части как двухнитевой, так и однонитевой последовательности. Нуклеиновая кислота может представлять собой ДНК, как геномную, так и кДНК, РНК или гибридную молекулу, где нуклеиновая кислота может содержать комбинации дезоксирибо- и рибонуклеотидов, при этом комбинации оснований включают урацил, аденин, тимин, цитозин, гуанин, инозин, ксантин, гипоксантин, изоцитозин и изогуанин. Нуклеиновые кислоты можно получать с помощью способов химического синтеза или с помощью рекомбинантных способов.
Используемый в данном документе термин функционально связанный означает, что экспрессия гена находится под контролем промотора, с которым он пространственно соединен. Промотор может располагаться 5'-конце (выше) или 3'-конце (ниже) относительно гена под его контролем. Расстояние между промотором и геном может быть приблизительно таким же, как и расстояние между тем промотором и геном, который он контролирует, в гене, из которого получен промотор. Как известно из уровня техники, изменение этого расстояния может быть осуществлено без потери промоторной функции.
Термин частично функциональный, используемый в данном документе, описывает белок, который кодируется мутантным геном и характеризуется меньшей биологической активностью, чем функциональный белок, но большей, чем нефункциональный белок.
Термин преждевременный стоп-кодон или стоп-кодон вне рамки, используемый в данном документе взаимозаменяемо, относится к нонсенс-мутации в последовательности ДНК, которая является причиной стоп-кодона в месте, которое обычно не обнаруживается в гене дикого типа. Преждевременный стоп-кодон может приводить к усечению или укорочению белка по сравнению с полноразмерной версией белка.
Используемый в данном документе термин промотор означает молекулу синтетического или природного происхождения, которая способна обеспечивать, активировать или усиливать экспрессию нуклеиновой кислоты в клетке. Промотор может содержать одну или несколько специфических последовательностей регуляции транскрипции для дополнительного усиления экспрессии и/или для изменения пространственной экспрессии и/или временной экспрессии. Промотор может также содержать дистальные энхансерные или репрессорные элементы, которые могут располагаться в нескольких тысячах пар оснований от сайта инициации транскрипции. Промотор может быть получен из источников, в том числе вирусов, бактерий, грибов, растений, насекомых и животных. Промотор может регулировать экспрессию генетического компонента конститутивно или дифференциально с учетом клетки, ткани или органа, в которых происходит экспрессия, или с учетом стадии развития, на которой происходит экспрессия, или в ответ на внешние раздражители, такие как физиологические стрессы, патогены, ионы металлов или индуцирующие средства. Типичные примеры промоторов включают промотор бактериофага T7, промотор бактериофага T3, промотор SP6, промотор лактозного оперона, промотор tac, поздний промотор SV40, ранний промотор SV40, промотор RSV-LTR, промотор IE CMV, ранний промотор SV40 или поздний промотор SV40, промотор человека U6 (hU6) и промотор IE CMV.
Термин скелетная мышца, используемый в данном документе, относится к типу поперечнополосатой мышцы, которая находится под контролем соматической нервной системы и прикреплена к костям пучками коллагеновых волокон, известных как сухожилия. Скелетная мышца состоит из отдельных компонентов, известных как миоциты или мышечные клетки, иногда в разговорной речи называемые мышечными волокнами. Миоциты образуются в результате слияния развивающихся миобластов (тип эмбриональной клетки-предшественника, из которой возникает мышечная клетка) в процессе, известном как миогенез. Эти длинные цилиндрические многоядерные клетки также называются мышечными волокнами.
Термин состояние скелетных мышц, используемый в данном документе, относится к состоянию, связанному со скелетной мышцей, как например: мышечные дистрофии, старение, дегенерация мышц, заживление ран и мышечная слабость или атрофия.
Термины субъект и пациент, используемые в данном документе взаимозаменяемо, относятся к любому позвоночному животному, в том числе без ограничения млекопитающему (например, корове, свинье, верблюду, ламе, лошади, козе, кролику, овце, хомякам, морской свинке, кошке, собаке, крысе и мыши, приматам, не относящимся к человеку (например, обезьяне, такой как яванский макак или макакрезус, шимпанзе и т.д.), а также человеку). В некоторых вариантах осуществления субъект может являться человеком или не являться человеком. Субъекта или пациента можно подвергать другим формам лечения.
Термин ген-мишень, используемый в данном документе, относится к любой нуклеотидной последовательности, кодирующей известный или предполагаемый генный продукт. Ген-мишень может пред
- 9 042798 ставлять собой мутированный ген, вовлеченный в генетическое заболевание. В определенных вариантах осуществления ген-мишень представляет собой ген дистрофина человека. В определенных вариантах осуществления ген-мишень представляет собой мутантный ген дистрофина человека.
Термин целевая область, используемый в данном документе, относится к области гена-мишени, для которой сконструирована система редактирования генов на основе CRISPR/Cas9 для связывания и расщепления.
Используемый в данном документе термин трансген относится к гену или генетическому материалу, содержащему последовательность гена, которая была выделена из одного организма и введена в другой отличающийся организм. Этот ненативный сегмент ДНК может сохранять способность продуцировать РНК или белок в трансгенном организме или может изменять нормальную функцию генетического кода трансгенного организма. Введение трансгена может изменить фенотип организма.
Термин вариант, используемый в данном документе в отношении нуклеиновой кислоты, означает (i) часть или фрагмент эталонной нуклеотидной последовательности;
(ii) последовательность, комплементарную эталонной нуклеотидной последовательности или ее части;
(iii) нуклеиновую кислоту, которая практически идентична эталонной нуклеиновой кислоте или комплементарной ей последовательности; или (iv) нуклеиновую кислоту, которая гибридизуется в жестких условиях с эталонной нуклеиновой кислотой, комплементарной ей последовательностью или последовательностями, практически идентичными им.
Вариант в отношении пептида или полипептида за счет вставки, делеции или консервативной замены аминокислот отличается по аминокислотной последовательности, однако сохраняет по меньшей мере один тип биологической активности. Вариант также может означать белок с аминокислотной последовательностью, которая практически идентична аминокислотной последовательности эталонного белка, который сохраняет по меньшей мере один тип биологической активности. В данной области техники признается, что консервативная замена аминокислоты, т.е. замена аминокислоты на другую аминокислоту с аналогичными свойствами (например, гидрофильностью, относительным количеством и распределением заряженных областей), обычно предусматривает незначительное изменение. Эти незначительные изменения можно частично идентифицировать, учитывая индекс гидропатичности аминокислот, как это понимается в данной области техники. Kyte et al., J. Mol. Biol., 157: 105-132 (1982). Индекс гидропатичности аминокислоты определяется с учетом гидрофобности и заряда. Из уровня техники известно, что аминокислоты с аналогичными индексами гидропатичности можно заменять, при этом функция белка по-прежнему будет сохраняться. В одном аспекте заменяют аминокислоты с индексами гидропатичности, составляющими ±2. Гидрофобность аминокислот также можно использовать для выявления замен, которые в результате будут давать белки, сохраняющие биологическую функцию. Учет гидрофильности аминокислот в контексте пептида позволяет рассчитывать наибольшую локальную усредненную гидрофильность этого пептида. Замены можно осуществлять с аминокислотами, у которых различие значений гидрофильности находится в пределах ±2. Как на индекс гидрофобности, так и на значение гидрофильности аминокислот влияет определенная боковая цепь этой аминокислоты. В соответствии с этим наблюдением совместимость аминокислотных замен с биологической функцией зависит от относительного сходства аминокислот и, в частности, боковых цепей этих аминокислот, что выявляют на основе гидрофобности, гидрофильности, заряда, размера и других свойств.
Термин вектор, используемый в данном документе, означает последовательность нуклеиновой кислоты, содержащую точку начала репликации. Вектор может представлять собой вирусный вектор, бактериофаг, бактериальную искусственную хромосому или искусственную хромосому дрожжей. Вектор может представлять собой ДНК- или РНК-вектор. Вектор может представлять собой самореплицирующийся внехромосомный вектор, и предпочтительно представляет собой плазмидную ДНК. Например, вектор может кодировать белок Cas9 и по меньшей мере одну молекулу gRNA, такую как gRNA, содержащую нацеливающий домен под любой из SEQ ID NO: 1-19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарной ей последовательности. В некоторых вариантах осуществления белок Cas9 может характеризоваться аминокислотной последовательностью под SEQ ID NO: 27, SEQ ID NO: 33 или SEQ ID NO: 45. В некоторых вариантах осуществления белок Cas9 может представлять собой Cas9 S. aureus, такой как SaCas9 с аминокислотной последовательностью под SEQ ID NO: 33 или SEQ ID NO: 45. В некоторых вариантах осуществления белок Cas9 кодируется последовательностью нуклеиновой кислоты, содержащей нуклеиновую последовательность под SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 43 или SEQ ID NO: 44.
Если не указано иное, то научные и технические термины, используемые применительно к настоящему изобретению, должны иметь значения, которые обычно понимаются специалистами в данной области техники. Например, любые цифровые или словесные обозначения на иллюстрациях и методики, используемые применительно к клеточной и тканевой культуре, молекулярной биологии, иммунологии, микробиологии, генетике, химии и гибридизации белка и нуклеиновых кислот, описанные в данном до
- 10 042798 кументе, являются такими, которые хорошо известны и обычно используются в данной области техники. Смысл и объем терминов должны быть четкими и понятными; однако в случае любой скрытой двусмысленности определения, представленные в данном документе, превалируют над любым словарным или внешним определением. Кроме того, если иное не требуется по контексту, термины единственного числа включают множественное число, а термины множественного числа включают единственное число.
2. Генетические конструкции для редактирования гена дистрофина в геноме.
Настоящее изобретение направлено на генетические конструкции для редактирования генома, геномной перестройки или изменения экспрессии гена дистрофина (например, гена дистрофина человека). Генетические конструкции включают в себя по меньшей мере одну gRNA, которая нацеливается на последовательности гена дистрофина как человека, так и макака-резуса, такие как совместимые мишени SaCas9. Раскрытые gRNA могут включаться в систему редактирования генов на основе CRISPR/Cas9, в том числе системы, в которых применяется SaCas9, для нацеливания на интронные области вокруг экзона 51 гена дистрофина человека, вызывая геномные делеции этой области, для восстановления экспрессии функционального дистрофина в клетках от пациентов с DMD.
a. Ген дистрофина.
Термин дистрофин представляет собой стержнеобразный цитоплазматический белок, который является частью белкового комплекса, соединяющего цитоскелет мышечного волокна с окружающим внеклеточным матриксом через клеточную мембрану. Дистрофин обеспечивает структурную стабильность дистрогликанового комплекса клеточной мембраны. Ген дистрофина образован 2,2 млн пар оснований в локусе Xp21. Размер первичного транскрипта составляет приблизительно 2400 т.о., при этом размер зрелой mRNA составляет приблизительно 14 т.о. 79 экзонов кодируют белок, образованный более чем 3500 аминокислотами. Нормальная скелетная мышечная ткань содержит лишь небольшое количество дистрофина, однако отсутствие его нормальной экспрессии приводит к развитию тяжелых и неизлечимых симптомов. Некоторые мутации в гене дистрофина приводят к образованию неполноценного дистрофина и тяжелому дистрофическому фенотипу у пораженных пациентов. Некоторые мутации в гене дистрофина приводят к образованию полнофункционального белка дистрофина и проявлению более мягкого дистрофического фенотипа у пораженных пациентов.
DMD является результатом врожденных или спонтанных мутаций, которые вызывают нонсенсмутации или мутации со сдвигом рамки в гене дистрофина. Встречающиеся в природе мутации и их последствия относительно хорошо понятны в случае DMD. Известно, что делеции внутри рамки, которые происходят в областях экзонов 45-55 (например, экзона 51), содержащихся в пределах стержневого домена, могут обеспечивать образование высокофункциональных белков дистрофина, и многие носители являются бессимптомными или проявляют слабо выраженные симптомы. Более того, более 60% пациентов могут теоретически лечиться путем нацеливания на экзоны в данной области гена дистрофина (например, нацеливания на экзон 51). Усилия были предприняты для того, чтобы восстановить рамку считывания нарушенного дистрофина у пациентов с DMD посредством пропуска несущественного(ых) важного(ых) экзона(ов) (например, пропуск экзона 51) через сплайсинг mRNA с получением делетированых внутри, однако функциональных белков дистрофина. Делеция внутреннего(их) экзона(ов) дистрофина (например, делеция экзона 51) сохраняет соответствующую рамку считывания, однако обусловливает менее тяжелое проявление мышечной дистрофии Беккера или BMD. Генотип при мышечной дистрофии Беккера или BMD сходный с DMD в том, что делеции присутствуют в гене дистрофина. Однако эти делеции оставляют рамку считывания интактной. Таким образом, создается внутренне усеченный, однако частично функциональный белок дистрофина. BMD характеризуется широким спектром фенотипов, однако часто, если делеции находятся между экзонами 45-55 дистрофина, фенотип намного мягче по сравнению с DMD. Таким образом, изменение генотипа DMD на генотип BMD является распространенной стратегией для коррекции дистрофина. Существует много стратегий для коррекции дистрофина, многие из которых полагаются на восстановление рамки считывания эндогенного дистрофина. Это обеспечивает изменение генотипа заболевания от DMD до мышечной дистрофии Беккера. У многих пациентов с BMD имеются внутригенные делеции, которые сохраняют трансляционную рамку считывания, что приводит к образованию более короткого, однако в большинстве случаев функционального, белка дистрофина.
В определенных вариантах осуществления модификация экзона 51 (например, делеция или удаление экзона 51, например с помощью NHEJ) для восстановления рамки считывания ослабляет проявление фенотипа у субъектов с DMD, включая субъектов с DMD с мутациями в виде делеции. В определенных вариантах осуществления экзон 51 гена дистрофина относится к 51-му экзону гена дистрофина. Экзон 51 у пациентов с DMD часто является смежным с положениями делеций, разрушающих рамку считывания, и в клинических испытаниях на него был направлен пропуск экзона, основанный на применении олигонуклеотидов. В клиническом испытании с пропуском экзона 51 с помощью соединения этерлипсена сообщалось о значительном положительном функциональном эффекте в течение 48 недель со средним количеством дистрофин-положительных волокон, составляющим 47% по сравнению с исходным уровнем. Мутации в экзоне 51 идеально подходят для устойчивой коррекции посредством редактирования генома на основе NHEJ.
Раскрытые в настоящем изобретении векторы могут образовывать делеции в гене дистрофина, на
- 11 042798 пример гене дистрофина человека. В определенных вариантах осуществления вектор сконструирован с возможностью образования двух двухнитевых разрывов (первый двухнитевой разрыв и второй двухнитевой разрыв) в двух интронах (первом интроне и втором интроне) фланкирующих ген дистрофина, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего целевое положение. Целевое положение дистрофина может представлять собой экзонное целевое положение дистрофина или внутриэкзонное целевое положение дистрофина, как описано в данном документе. Делеция экзонного целевого положения дистрофина может обеспечить оптимизацию последовательности дистрофина у субъекта, страдающего от мышечной дистрофии Дюшенна, например она может улучшить действие или активность кодируемого белка дистрофина или привести к улучшению состояния заболевания у субъекта. В определенных вариантах осуществления удаление экзонного целевого положения дистрофина восстанавливает рамку считывания. Экзонное целевое положение дистрофина может содержать один или несколько экзонов гена дистрофина. В определенных вариантах осуществления целевое положение дистрофина содержит экзон 51 гена дистрофина (например, гена дистрофина человека).
Раскрытая в настоящем изобретении генетическая конструкция (например, вектор) может опосредовать высокоэффективное редактирование генов в экзоне 51 гена дистрофина (например, гена дистрофина человека). Раскрытая в настоящем изобретении генетическая конструкция (например, вектор) восстанавливает экспрессию белка дистрофина в клетках пациентов с DMD.
Экзон 51 у пациентов с DMD часто является смежным с положениями делеций, разрушающих рамку считывания. Элиминация экзона 51 из транскрипта дистрофина с помощью пропуска экзона может использоваться для лечения примерно 15% из всех пациентов с DMD. Данный класс мутаций дистрофина идеально подходит для устойчивой коррекции с помощью редактирования генома на основе NHEJ и HDR. Генетические конструкции (например, векторы), описанные в данном документе, разрабатывались для целенаправленной модификации экзона 51 в гене дистрофина человека. Раскрытая в настоящем изобретении генетическая конструкция (например, вектор) трансфицируется в клетки DMD человека и опосредует действенную модификацию генов и превращение в соответствующую рамку считывания. Восстановление белка сопутствует восстановлению рамки и обнаруживается в крупной популяции клеток, обработанных системой редактирования генов на основе CRISPR/Cas9.
b. Система CRISPR.
Раскрытая в настоящем изобретении генетическая конструкция (например, вектор) кодируется системой редактирования генов на основе CRISPR/Cas9, специфичной в отношении гена дистрофина (например, гену дистрофина человека). Короткие палиндромные повторы, регулярно расположенные группами и CRISPR, используемые в данном документе взаимозаменяемо, относятся к локусам, содержащим множественные короткие прямые повторы, которые встречаются в геномах примерно 40% секвенированных бактерий и 90% секвенированных архей. Система CRISPR представляет собой нуклеазную систему микроорганизмов, вовлеченную в защиту от встраивающихся фагов и плазмид, что обеспечивает форму приобретенного иммунитета. Локусы CRISPR в микробных хозяевах содержат комбинацию CRISPR-ассоциированных (Cas) генов, а также элементов некодирующей РНК, способных программировать специфичность CRISPR-опосредованного расщепления нуклеиновой кислоты. Короткие сегменты чужеродной ДНК, называемые спейсерами, включаются в состав генома между повторами CRISPR и служат в качестве памяти о прошлых воздействиях. Cas9 образует комплекс с 3'-концом sgRNA (также взаимозаменяемо называемой в данном документе как gRNA), и пара белок-РНК распознает свою геномную мишень посредством комплементарного спаривания оснований между 5'-концом последовательности sgRNA и предварительно определенной последовательностью ДНК размером 20 п.о., известной как протоспейсер. Этот комплекс направлен на гомологичные локусы патогенной ДНК через области, кодируемые в crRNA, т.е. протоспейсеры и мотивы, смежные с протоспейсером (PAM), в патогенном геноме. Некодирующая матрица CRISPR транскрибируется и расщепляется в пределах прямых повторов на короткие crRNA, содержащие отдельные спейсерные последовательности, которые направляют Cas-нуклеазы на целевой сайт (протоспейсер). Путем простого обмена последовательности распознавания размером 20 п.о. экспрессированной sgRNA, нуклеазу Cas9 можно направлять на новые мишени в геноме. Спейсеры CRISPR используются для распознавания и сайленсинга экзогенных генетических элементов с помощью способа, аналогичного RNAi у эукариотических организмов.
Известны три класса систем CRISPR (эффекторные системы типов I, II и III). Эффекторная система типа II осуществляет двухнитевой разрыв в целевой ДНК на четырех последовательных стадиях с использованием одного эффекторного фермента Cas9 для расщепления dsDNA. По сравнению с эффекторными системами типа I и типа III, для которых требуется несколько различных эффекторов, действующих как комплекс, эффекторная система типа II может функционировать в альтернативной среде, такой как эукариотические клетки. Эффекторная система типа II состоит из длинной pre-crRNA, которая транскрибируется из спейсер-содержащего локуса CRISPR, белка Cas9 и tracrRNA, которая участвует в процессинге pre-crRNA. При этом tracrRNA гибридизуются с областями повторов, разделяющими спейсеры pre-crRNA, инициируя тем самым расщепление dsRNA с помощью эндогенной РНКазы III. Это расщепление сопровождается вторым событием расщепления внутри каждого спейсера Cas9, производя зрелые crRNA, которые остаются связанными с tracrRNA и Cas9, образуя комплекс Cas9:crRNA-tracrRNA.
- 12 042798
Комплекс Cas9:crRNA-tracrRNA раскручивает ДНК-дуплекс и ищет последовательности для расщепления, соответствующие crRNA. Распознавание мишени происходит при выявлении комплементарности между последовательностью протоспейсера в последовательности целевой ДНК и оставшейся спейсерной последовательности в crRNA. Cas9 опосредует расщепление целевой ДНК, если на 3'-конце протоспейсера также присутствует мотив, смежный с протоспейсером (PAM). Для нацеливания на протоспейсер последовательность должна непосредственно сопровождаться мотивом, смежным с протоспейсером (PAM), короткой последовательностью, распознаваемой нуклеазой Cas9, которая требуется для расщепления ДНК. Различные системы типа II имеют разные требования к PAM. Система CRISPR из S. pyogenes может содержать последовательность PAM для этой Cas9 (SpCas9) в виде 5'-NRG-3', где R представляет собой либо A, либо G, и характеризующей специфичность этой системы в клетках человека. Уникальной способностью системы редактирования генов на основе CRISPR/Cas9 является эффективная способность одновременно нацеливаться на несколько различных геномных локусов путем совместной экспрессии одного белка Cas9 с двумя или более sgRNA. Например, система типа II из Streptococcus pyogenes в естественных условиях предпочитает применение последовательности NGG, где N может представлять собой любой нуклеотид, но также принимает другие последовательности PAM, такие как NAG, в сконструированных системах (Hsu et al., Nature Biotechnology (2013) DOI: 10.1038/nbt.2647). Аналогично Cas9, полученная из Neisseria meningitidis (NmCas9), как правило, содержит нативный PAM из NNNNGATT, однако обладает активностью со множеством PAM, включая PAM NNNNGNNN с высокой степенью вырожденности (Esvelt et al., Nature Methods (2013), DOI: 10.1038/nmeth.2681).
Молекула Cas9 S. aureus распознает мотив последовательности NNGRR (R=A или G) (SEQ ID NO: 22) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10, например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRN (R=A или G) (SEQ ID NO: 23) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10, например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRT (R=A или G) (SEQ ID NO: 24) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10, например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRV (R=A или G) (SEQ ID NO: 25) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10, например от 3 до 5 п.о., выше этой последовательности. В вышеупомянутых вариантах осуществления N может представлять собой нуклеотидный остаток, например любой из A, G, C или T. Молекулы Cas9 могут быть сконструированы для изменения специфичности PAM молекулы Cas9.
(1) Система редактирования генов на основе CRISPR/Cas9.
Было показано, что разработанная форма эффекторной системы типа II из Streptococcus pyogenes функционирует в клетках человека для конструирования генома. В этой системе белок Cas9 направляли на геномные целевые сайты с помощью синтетически восстановленной направляющей РНК (gRNA, также используемой в данном документе взаимозаменяемо как химерная одиночная направляющая РНК (sgRNA)), которая представляет собой слитую конструкцию crRNA-tracrRNA, которая устраняет необходимость в РНКазе III и процессинге crRNA в целом. В данном документе представлены сконструированные системы на основе CRISPR/Cas9 для применения в редактировании генома и лечении генетических заболеваний. Сконструированные системы на основе CRISPR/Cas9 могут быть сконструированы для нацеливания на любой ген, в том числе гены, вовлеченные в генетическое заболевание, старение, регенерацию тканей или заживление ран. Системы редактирования генов на основе CRISPR/Cas9 могут включать в себя белок Cas9 или слитый белок Cas9 и по меньшей мере одну gRNA. В определенных вариантах осуществления система включает две молекулы gRNA. Слитый белок Cas9 может, например, включать в себя домен с активностью, отличающейся от той, которая является эндогенной для Cas9, такой как домен трансактивации.
Ген-мишень (например, ген дистрофина, например ген дистрофина человека) может быть вовлечен в дифференцировку клетки или любой другой процесс, в котором может требоваться активация, или может содержать мутацию, такую как мутация со сдвигом рамки или нонсенс-мутация. Если ген-мишень содержит мутацию, которая является причиной преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга, то система редактирования генов на основе CRISPR/Cas9 может быть сконструирована для распознавания и связывания нуклеотидной последовательности выше или ниже преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга. Система на основе CRISPR-Cas9 может также использоваться для разрушения нормального сплайсинга гена путем целенаправленного воздействия на акцепторы и доноры сплайсинга, чтобы вызвать пропуск преждевременных стоп-кодонов или восстановить поврежденную рамку считывания. Система редактирования генов на основе CRISPR/Cas9 может опосредовать или не опосредовать нецелевые изменения в областях генома, кодирующих белок.
(a) Молекулы Cas9 и слитые белки Cas9.
Система редактирования генов на основе CRISPR/Cas9 может включать в себя белок Cas9 или сли
- 13 042798 тый белок Cas9. Белок Cas9 представляет собой эндонуклеазу, которая расщепляет нуклеиновую кислоту и кодируется локусами CRISPR, а также принимает участие в системе CRISPR типа II. Белок Cas9 может быть из любых видов бактерий или архей, в том числе без ограничения
Streptococcus pyogenes, Staphylococcus aureus (S. aureus), Acidovorax avenae, Actinobacillus pleuropneumoniae, Actinobacillus succinogenes, Actinobacillus suis, Actinomyces sp. , cycliphilus denitrifleans, Aminomonas paucivorans, Bacillus cereus, Bacillus smith!!. Bacillus thuringiensis, Bacteroides sp. r Blastopirellula marina, Bradyrhizobium sp. , Brevibacillus laterosporus, Campylobacter coll, Campylobacter jejuni, Campylobacter lari, Candidatus Punice!spirillum, Clostridium cellulolyticum, Clostridium perfringens, Corynebacterium accolens, Corynebacterium diphtheria, Corynebacterium matruchotii, Dinoroseobacter shibae, Eubacterium dolichum, gamma proteobacterium, Gluconacetobacter diazotrophicus, Haemophilus parainfluenzas , Haemophilus sputorum, Helicobacter canadensis, Helicobacter cinaedi, Helicobacter mustelae, Ilyobacter polytropus, Kingella kingae, Lactobacillus crispatus, Listeria ivanovii , Listeria monocytogenes, Listeriaceae bacterium, Methylocystis sp., Methylosinus trichosporium, Mobiluncus mulieris, Neisseria bacilliformis, Neisseria cinerea, Neisseria flavescens, Neisseria lactamica, Neisseria sp. , Neisseria wadsworthii, Nitrosomonas sp. , Parvibaculum lavamentivorans, Pasteurella multocida, Phascolarctobacterium succinatutens, Ralstonia syzygii, Rhodopseudomonas palustris, Rhodovulum sp. , Simonsiella muelleri, Sphingomonas sp., Sporolactobacillus vineae, Staphylococcus lugdunensis, Streptococcus sp. , Subdoligranulum sp. , Tistrella mobilis, Treponema sp. или Verminephrobacter eiseniae.
В определенных вариантах осуществления молекула Cas9 представляет собой белок Cas9, который представляет собой молекулу Cas9 Streptococcus pyogenes (также называемую в данном документе SpCas9). В определенных вариантах осуществления молекула Cas9 представляет собой молекулу Cas9 Staphylococcus aureus (также называемую в данном документе SaCas9).
Молекула Cas9 или слитый белок Cas9 могут взаимодействовать с одной или несколькими молекулами gRNA и совместно с молекулой(ами) gRNA, расположенными в сайте, который включает целевой домен и в определенных вариантах осуществления последовательность PAM. Способность молекулы Cas9 или слитого белка Cas9 распознавать последовательность PAM может определяться, например, с применением анализа трансформации, как описано ранее (Jinek 2012).
В определенных вариантах осуществления способность молекулы Cas9 или слитого белка Cas9 взаимодействовать с целевой нуклеиновой кислотой и расщеплять ее зависит от последовательности PAM. Последовательность PAM представляет собой последовательность в целевой нуклеиновой кислоте. В определенных вариантах осуществления расщепление целевой нуклеиновой кислоты происходит выше последовательности PAM. Молекулы Cas9 из различных видов бактерий могут распознавать различные мотивы последовательностей (например, последовательностей PAM). В определенных вариантах осуществления молекула Cas9 S. pyogenes узнает мотив последовательности NGG и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности (см., например, Mali, 2013). В определенных вариантах осуществления молекула Cas9 S. thermophilus распознает мотив последовательности NGGNG (SEQ ID NO: 36) и/или NNAGAAW (W=A или T) (SEQ ID NO: 20) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этих последовательностей (см., например Horvath, 2010; Deveau, 2008). В определенных вариантах осуществления молекула Cas9 S. mutans распознает мотив последовательности NGG и/или NAAR (R=A или G) (SEQ ID NO: 21) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности (см., например Deveau 2008). В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRR (R=A или G) (SEQ ID NO: 22) и управляет
- 14 042798 расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRN (R=A или G) (SEQ ID NO: 23) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRT (R=A или G) (SEQ ID NO: 24) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRV (R=A или G; V=A, или C, или G) (SEQ ID NO: 25) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности. В вышеупомянутых вариантах осуществления N может представлять собой нуклеотидный остаток, например, любой из A, G, C или T. Молекулы Cas9 могут быть сконструированы для изменения специфичности PAM молекулы Cas9.
В определенных вариантах осуществления вектор кодирует по меньшей мере одну молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25). В определенных вариантах осуществления по меньшей мере одна молекула Cas9 представляет собой молекулу Cas9 S. aureus. В определенных вариантах осуществления по меньшей мере одна молекула Cas9 представляет собой мутантную молекулу Cas9 S. aureus.
Белок Cas9 может быть мутирован таким образом, что нуклеазная активность инактивирована. Инактивированный белок Cas9 (iCas9, также называемый dCas9) без эндонуклеазной активности ранее нацеливали на гены в клетках бактерий, дрожжей и человека с помощью gRNA для сайленсинга экспрессии генов посредством стерических затруднений. Иллюстративные мутации по отношению к последовательности Cas9 S. pyogenes включают D10A, E762A, H840A, N854A, N863A и/или D986A. Иллюстративные мутации по отношению к последовательности Cas9 S. aureus включают D10A и N580A. В определенных вариантах осуществления молекула Cas9 представляет собой мутантную молекулу Cas9 S. aureus. В определенных вариантах осуществления мутантная молекула Cas9 S. aureus содержит мутацию D10A. Нуклеотидная последовательность, кодирующая данную мутантную Cas9 S. aureus, изложена под SEQ ID NO: 34, которая представлена ниже.
atgaaaagga actacattct ggggctggcc atcgggatta caagcgtggg
gtatgggatt attgactatg aaacaaggga cgtgatcgac gcaggcgtca
gactgttcaa ggaggccaac gtggaaaaca atgagggacg gagaagcaag
aggggagcca ggcgcctgaa acgacggaga aggcacagaa tccagagggt
gaagaaactg ctgttcgatt acaacctgct gaccgaccat tctgagctga
gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg
agtgcataac gtcaatgagg tggaagagga caccggcaac gagctgtcta
caaaggaaca gatctcacgc aatagcaaag ctctggaaga gaagtatgtc
gcagagctgc agctggaacg gctgaagaaa gatggcgagg tgagagggtc
aattaatagg ttcaagacaa gcgactacgt caaagaagcc aagcagctgc
tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga
agggagcccc ttcggatgga aagacatcaa ggaatggtac gagatgctga
tgggacattg cacctatttt ccagaagagc tgagaagcgt caagtacgct
tataacgcag atctgtacaa cgccctgaat gacctgaaca acctggtcat
caccagggat gaaaacgaga aactggaata ctatgagaag ttccagatca
tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag
cactggaaaa ccagagttca ccaatctgaa agtgtatcac gatattaagg
acatcacagc acggaaagaa atcattgaga acgccgaact gctggatcag
attgctaaga tcctgactat ctaccagagc tccgaggaca tccaggaaga
gctgactaac ctgaacagcg agctgaccca ggaagagatc gaacagatta
gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc
- 15 042798
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat
ctttaaccgg ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga
aagagatccc aaccacactg gtggacgatt tcattctgtc acccgtggtc
aagcggagct tcatccagag catcaaagtg atcaacgcca tcatcaagaa
gtacggcctg cccaatgata tcattatcga gctggctagg gagaagaaca
gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc
aaagtacctg attgaaaaaa tcaagctgca cgatatgcag gagggaaagt
gtctgtattc tctggaggcc atccccctgg aggacctgct gaacaatcca
ttcaactacg aggtcgatca tattatcccc agaagcgtgt ccttcgacaa
ttcctttaac aacaaggtgc tggtcaagca ggaagagaac tctaaaaagg
gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg
catcagcaag accaaaaagg agtacctgct ggaagagcgg gacatcaaca
gattctccgt ccagaaggat tttattaacc ggaatctggt ggacacaaga
tacgctactc gcggcctgat gaatctgctg cgatcctatt tccgggtgaa
caatctggat gtgaaagtca agtccatcaa cggcgggttc acatcttttc
tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga
gtggaaaaag ctggacaaag ccaagaaagt gatggagaac cagatgttcg
aagagaagca ggccgaatct atgcccgaaa tcgagacaga acaggagtac
aaggagattt tcatcactcc tcaccagatc aagcatatca aggatttcaa
ggactacaag tactctcacc gggtggataa aaagcccaac agagagctga
tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa
aaagctgatc aacaaaagtc ccgagaagct gctgatgtac caccatgatc
ctcagacata tcagaaactg aagctgatta tggagcagta cggcgacgag
aagaacccac tgtataagta ctatgaagag actgggaact acctgaccaa
gtatagcaaa aaggataatg gccccgtgat caagaagatc aagtactatg
ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta
tctggacaac ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca
tcaaaaagga gaactactat gaagtgaata gcaagtgcta cgaagaggct
aaaaagctga aaaagattag caaccaggca gagttcatcg cctcctttta
caacaacgac ctgattaaga tcaatggcga actgtatagg gtcatcgggg
tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat
caaaacaatt gcctctaaga ctcagagtat caaaaagtac tcaaccgaca
ttctgggaaa cctgtatgag gtgaagagca aaaagcaccc tcagattatc aaaaagggc [SEQ ID NO: 34].
В определенных вариантах осуществления мутантная молекула Cas9 S. aureus содержит мутацию N580A. Нуклеотидная последовательность, кодирующая эту мутантную молекулу Cas9 S. aureus, изложена под SEQ ID NO: 35, которая представлена ниже.
- 16 042798
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg
gtatgggatt attgactatg aaacaaggga cgtgatcgac gcaggcgtca
gactgttcaa ggaggccaac gtggaaaaca atgagggacg gagaagcaag
aggggagcca ggcgcctgaa acgacggaga aggcacagaa tccagagggt
gaagaaactg ctgttcgatt acaacctgct gaccgaccat tctgagctga
gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg
agtgcataac gtcaatgagg tggaagagga caccggcaac gagctgtcta
caaaggaaca gatctcacgc aatagcaaag ctctggaaga gaagtatgtc
gcagagctgc agctggaacg gctgaagaaa gatggcgagg tgagagggtc
aattaatagg ttcaagacaa gcgactacgt caaagaagcc aagcagctgc
tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga
agggagcccc ttcggatgga aagacatcaa ggaatggtac gagatgctga
tgggacattg cacctatttt ccagaagagc tgagaagcgt caagtacgct
tataacgcag atctgtacaa cgccctgaat gacctgaaca acctggtcat
caccagggat gaaaacgaga aactggaata ctatgagaag ttccagatca
tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag
cactggaaaa ccagagttca ccaatctgaa agtgtatcac gatattaagg
acatcacagc acggaaagaa atcattgaga acgccgaact gctggatcag
attgctaaga tcctgactat ctaccagagc tccgaggaca tccaggaaga
gctgactaac ctgaacagcg agctgaccca ggaagagatc gaacagatta
gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat
ctttaaccgg ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga
aagagatccc aaccacactg gtggacgatt tcattctgtc acccgtggtc
aagcggagct tcatccagag catcaaagtg atcaacgcca tcatcaagaa
gtacggcctg cccaatgata tcattatcga gctggctagg gagaagaaca
gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc
aaagtacctg attgaaaaaa tcaagctgca cgatatgcag gagggaaagt
gtctgtattc tctggaggcc atccccctgg aggacctgct gaacaatcca
- 17 042798
ttcaactacg aggtcgatca tattatcccc agaagcgtgt ccttcgacaa
ttcctttaac aacaaggtgc tggtcaagca ggaagaggcc tctaaaaagg
gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg
catcagcaag accaaaaagg agtacctgct ggaagagcgg gacatcaaca
gattctccgt ccagaaggat tttattaacc ggaatctggt ggacacaaga
tacgctactc gcggcctgat gaatctgctg cgatcctatt tccgggtgaa
caatctggat gtgaaagtca agtccatcaa cggcgggttc acatcttttc
tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga
gtggaaaaag ctggacaaag ccaagaaagt gatggagaac cagatgttcg
aagagaagca ggccgaatct atgcccgaaa tcgagacaga acaggagtac
aaggagattt tcatcactcc tcaccagatc aagcatatca aggatttcaa
ggactacaag tactctcacc gggtggataa aaagcccaac agagagctga
tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa
aaagctgatc aacaaaagtc ccgagaagct gctgatgtac caccatgatc
ctcagacata tcagaaactg aagctgatta tggagcagta cggcgacgag
aagaacccac tgtataagta ctatgaagag actgggaact acctgaccaa
gtatagcaaa aaggataatg gccccgtgat caagaagatc aagtactatg
ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta
tctggacaac ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca
tcaaaaagga gaactactat gaagtgaata gcaagtgcta cgaagaggct
aaaaagctga aaaagattag caaccaggca gagttcatcg cctcctttta
caacaacgac ctgattaaga tcaatggcga actgtatagg gtcatcgggg
tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat
caaaacaatt gcctctaaga ctcagagtat caaaaagtac tcaaccgaca
ttctgggaaa cctgtatgag gtgaagagca aaaagcaccc tcagattatc : aaaaagggc
[SEQ ID NO: 35].
Нуклеиновая кислота, кодирующая молекулу Cas9, может представлять собой синтетическую последовательность нуклеиновой кислоты. Например, синтетическая молекула нуклеиновой кислоты может быть химически модифицирована. Синтетическая последовательность нуклеиновой кислоты может быть кодон-оптимизированной, например, по меньшей мере один необычный кодон или малораспространенный кодон замещали обычным кодоном Например, синтетическая нуклеиновая кислота может управлять синтезом оптимизированной информационной mRNA, например, оптимизированной для экспрессии в системе экспрессии млекопитающих, например, описанной в данном документе.
Дополнительно или как альтернатива нуклеиновая кислота, кодирующая молекулу Cas9 или полипептид Cas9, может содержать последовательность ядерной локализации (NLS). Последовательности ядерной локализации известны из уровня техники.
Иллюстративная кодон-оптимизированная последовательность нуклеиновой кислоты, кодирующая молекулу Cas9 S. pyogenes, изложена под SEQ ID NO: 26, которая представлена ниже.
- 18 042798
atggataaaa agtacagcat cgggctggac atcggtacaa actcagtggg
gtgggccgtg attacggacg agtacaaggt accctccaaa aaatttaaag
tgctgggtaa cacggacaga cactctataa agaaaaatct tattggagcc
ttgctgttcg actcaggcga gacagccgaa gccacaaggt tgaagcggac
cgccaggagg cggtatacca ggagaaagaa ccgcatatgc tacctgcaag
aaatcttcag taacgagatg gcaaaggttg acgatagctt tttccatcgc
ctggaagaat cctttcttgt tgaggaagac aagaagcacg aacggcaccc
catctttggc aatattgtcg acgaagtggc atatcacgaa aagtacccga
ctatctacca cctcaggaag aagctggtgg actctaccga taaggcggac
ctcagactta tttatttggc actcgcccac atgattaaat ttagaggaca
tttcttgatc gagggcgacc tgaacccgga caacagtgac gtcgataagc
tgttcatcca acttgtgcag acctacaatc aactgttcga agaaaaccct
ataaatgctt caggagtcga cgctaaagca atcctgtccg cgcgcctctc
aaaatctaga agacttgaga atctgattgc tcagttgccc ggggaaaaga
aaaatggatt gtttggcaac ctgatcgccc tcagtctcgg actgacccca
aatttcaaaa gtaacttcga cctggccgaa gacgctaagc tccagctgtc
caaggacaca tacgatgacg acctcgacaa tctgctggcc cagattgggg
atcagtacgc cgatctcttt ttggcagcaa agaacctgtc cgacgccatc
ctgttgagcg atatcttgag agtgaacacc gaaattacta aagcacccct
tagcgcatct atgatcaagc ggtacgacga gcatcatcag gatctgaccc
tgctgaaggc tcttgtgagg caacagctcc ccgaaaaata caaggaaatc
ttctttgacc agagcaaaaa cggctacgct ggctatatag atggtggggc
cagtcaggag gaattctata aattcatcaa gcccattctc gagaaaatgg
acggcacaga ggagttgctg gtcaaactta acagggagga cctgctgcgg
aagcagcgga cctttgacaa cgggtctatc ccccaccaga ttcatctggg
cgaactgcac gcaatcctga ggaggcagga ggatttttat ccttttctta
aagataaccg cgagaaaata gaaaagattc ttacattcag gatcccgtac
tacgtgggac ctctcgcccg gggcaattca cggtttgcct ggatgacaag
gaagtcagag gagactatta caccttggaa cttcgaagaa gtggtggaca
agggtgcatc tgcccagtct ttcatcgagc ggatgacaaa ttttgacaag
aacctcccta atgagaaggt gctgcccaaa cattctctgc tctacgagta
ctttaccgtc tacaatgaac tgactaaagt caagtacgtc accgagggaa
tgaggaagcc ggcattcctt agtggagaac agaagaaggc gattgtagac
ctgttgttca agaccaacag gaaggtgact gtgaagcaac ttaaagaaga
ctactttaag aagatcgaat gttttgacag tgtggaaatt tcaggggttg
aagaccgctt caatgcgtca ttggggactt accatgatct tctcaagatc
ataaaggaca aagacttcct ggacaacgaa gaaaatgagg atattctcga
agacatcgtc ctcaccctga ccctgttcga agacagggaa atgatagaag
agcgcttgaa aacctatgcc cacctcttcg acgataaagt tatgaagcag
ctgaagcgca ggagatacac aggatgggga agattgtcaa ggaagctgat
caatggaatt agggataaac agagtggcaa gaccatactg gatttcctca
aatctgatgg cttcgccaat aggaacttca tgcaactgat tcacgatgac
tctcttacct tcaaggagga cattcaaaag gctcaggtga gcgggcaggg
- 19 042798
agactccctt catgaacaca tcgcgaattt ggcaggttcc cccgctatta
aaaagggcat ccttcaaact gtcaaggtgg tggatgaatt ggtcaaggta
atgggcagac ataagccaga aaatattgtg atcgagatgg cccgcgaaaa
ccagaccaca cagaagggcc agaaaaatag tagagagcgg atgaagagga
tcgaggaggg catcaaagag ctgggatctc agattctcaa agaacacccc
gtagaaaaca cacagctgca gaacgaaaaa ttgtacttgt actatctgca
gaacggcaga gacatgtacg tcgaccaaga acttgatatt aatagactgt
ccgactatga cgtagaccat atcgtgcccc agtccttcct gaaggacgac
tccattgata acaaagtctt gacaagaagc gacaagaaca ggggtaaaag
tgataatgtg cctagcgagg aggtggtgaa aaaaatgaag aactactggc
gacagctgct taatgcaaag ctcattacac aacggaagtt cgataatctg
acgaaagcag agagaggtgg cttgtctgag ttggacaagg cagggtttat
taagcggcag ctggtggaaa ctaggcagat cacaaagcac gtggcgcaga
ttttggacag ccggatgaac acaaaatacg acgaaaatga taaactgata
cgagaggtca aagttatcac gctgaaaagc aagctggtgt ccgattttcg
gaaagacttc cagttctaca aagttcgcga gattaataac taccatcatg
ctcacgatgc gtacctgaac gctgttgtcg ggaccgcctt gataaagaag
tacccaaagc tggaatccga gttcgtatac ggggattaca aagtgtacga
tgtgaggaaa atgatagcca agtccgagca ggagattgga aaggccacag
ctaagtactt cttttattct aacatcatga atttttttaa gacggaaatt
accctggcca acggagagat cagaaagcgg ccccttatag agacaaatgg
tgaaacaggt gaaatcgtct gggataaggg cagggatttc gctactgtga
ggaaggtgct gagtatgcca caggtaaata tcgtgaaaaa aaccgaagta
cagaccggag gattttccaa ggaaagcatt ttgcctaaaa gaaactcaga
caagctcatc gcccgcaaga aagattggga ccctaagaaa tacgggggat
ttgactcacc caccgtagcc tattctgtgc tggtggtagc taaggtggaa
aaaggaaagt ctaagaagct gaagtccgtg aaggaactct tgggaatcac
tatcatggaa agatcatcct ttgaaaagaa ccctatcgat ttcctggagg
ctaagggtta caaggaggtc aagaaagacc tcatcattaa actgccaaaa
tactctctct tcgagctgga aaatggcagg aagagaatgt tggccagcgc
cggagagctg caaaagggaa acgagcttgc tctgccctcc aaatatgtta
attttctcta tctcgcttcc cactatgaaa agctgaaagg gtctcccgaa
gataacgagc agaagcagct gttcgtcgaa cagcacaagc actatctgga
tgaaataatc gaacaaataa gcgagttcag caaaagggtt atcctggcgg
atgctaattt ggacaaagta ctgtctgctt ataacaagca ccgggataag
cctattaggg aacaagccga gaatataatt cacctcttta cactcacgaa
tctcggagcc cccgccgcct tcaaatactt tgatacgact atcgaccgga
aacggtatac cagtaccaaa gaggtcctcg atgccaccct catccaccag
tcaattactg gcctgtacga aacacggatcgacctctctc aactgggcgg cgactag [SEQ ID NO: 26].
Соответствующая аминокислотная последовательность молекулы Cas9 S. pyogenes изложена под SEQ ID NO: 27, которая представлена ниже.
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRL
KRTARRRYTRRKNRICYLQEIFSNEMAKVDDS FFHRLEES FLVEEDKKHERHPIFGNIVDEVAY HEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTY NQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNF DLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMD GTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRI
- 20 042798
PYYVGPLARGNSRFAWMTRKSEETITPWNFEEWDKGASAQSFIERMTNFDKNLPNEKVLPKHS LLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFD SVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTF KEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKWDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINR LSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEWKKMKNYWRQLLNAKLITQRK FDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAWGTALIKKYPKLESEFVYGDYKVYDVRKMIAK SEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLS MPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLWAKVEKG KSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLAS AGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLD ATLIHQSITGLYETRIDLSQLGGD [SEQ ID NO: 27]
Иллюстративные кодон-оптимизированные последовательности нуклеиновой кислоты, кодирующие молекулу Cas9 S. aureus и необязательно содержащие последовательности ядерной локализации (NLS), изложены под SEQ ID NO: 28-32, 43 и 44, которые представлены ниже. Другая иллюстративная кодон-оптимизированная последовательность нуклеиновой кислоты, кодирующая молекулу Cas9 S. pyogenes, предусматривает нуклеотиды 1293-4451 под SEQ ID NO: 83.
SEQ ID NO: 28 изложена ниже.
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg
gtatgggatt attgactatg aaacaaggga cgtgatcgac gcaggcgtca
gactgttcaa ggaggccaac gtggaaaaca atgagggacg gagaagcaag
aggggagcca ggcgcctgaa acgacggaga aggcacagaa tccagagggt
gaagaaactg ctgttcgatt acaacctgct gaccgaccat tctgagctga
gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg
agtgcataac gtcaatgagg tggaagagga caccggcaac gagctgtcta
caaaggaaca gatctcacgc aatagcaaag ctctggaaga gaagtatgtc
gcagagctgc agctggaacg gctgaagaaa gatggcgagg tgagagggtc
aattaatagg ttcaagacaa gcgactacgt caaagaagcc aagcagctgc
tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact
- 21 042798
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga
agggagcccc ttcggatgga aagacatcaa ggaatggtac gagatgctga
tgggacattg cacctatttt ccagaagagc tgagaagcgt caagtacgct
tataacgcag atctgtacaa cgccctgaat gacctgaaca acctggtcat
caccagggat gaaaacgaga aactggaata ctatgagaag ttccagatca
tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag
cactggaaaa ccagagttca ccaatctgaa agtgtatcac gatattaagg
acatcacagc acggaaagaa atcattgaga acgccgaact gctggatcag
attgctaaga tcctgactat ctaccagagc tccgaggaca tccaggaaga
gctgactaac ctgaacagcg agctgaccca ggaagagatc gaacagatta
gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat
ctttaaccgg ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga
aagagatccc aaccacactg gtggacgatt tcattctgtc acccgtggtc
aagcggagct tcatccagag catcaaagtg atcaacgcca tcatcaagaa
gtacggcctg cccaatgata tcattatcga gctggctagg gagaagaaca
gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc
aaagtacctg attgaaaaaa tcaagctgca cgatatgcag gagggaaagt
gtctgtattc tctggaggcc tccccctgg aggacctgct gaacaatcca ttcaactacg
aggtcgatca tattatcccc agaagcgtgt ccttcgacaa ttcctttaac
aacaaggtgc tggtcaagca ggaagagaac tctaaaaagg gcaataggac
tcctttccag tacctgtcta gttcagattc caagatctct tacgaaacct
ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt
ccagaaggat tttattaacc ggaatctggt ggacacaaga tacgctactc
gcggcctgat gaatctgctg cgatcctatt tccgggtgaa caatctggat
gtgaaagtca agtccatcaa cggcgggttc acatcttttc tgaggcgcaa
atggaagttt aaaaaggagc gcaacaaagg gtacaagcac catgccgaag
atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca
ggccgaatct atgcccgaaa tcgagacaga acaggagtac aaggagattt
tcatcactcc tcaccagatc aagcatatca aggatttcaa ggactacaag
tactctcacc gggtggataa aaagcccaac agagagctga tcaatgacac
cctgtatagt acaagaaaag acgataaggg gaataccctg attgtgaaca
- 22 042798
atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata
tcagaaactg aagctgatta tggagcagta cggcgacgag aagaacccac
tgtataagta ctatgaagag actgggaact acctgaccaa gtatagcaaa
aaggataatg gccccgtgat caagaagatc aagtactatg ggaacaagct
gaatgcccat ctggacatca cagacgatta ccctaacagt cgcaacaagg
tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga
gaactactat gaagtgaata gcaagtgcta cgaagaggct aaaaagctga
aaaagattag caaccaggca gagttcatcg cctcctttta caacaacgac
ctgattaaga tcaatggcga actgtatagg gtcatcgggg tgaacaatga
tctgctgaac cgcattgaag tgaatatgat tgacatcact taccgagagt
atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa
cctgtatgag gtgaagagca aaaagcaccc tcagattatc aaaaagggc [SEQ ID NO: 2 8] SEQ ID NO: 29 изложена ниже.
atgaagcgga actacatcct gggcctggac atcggcatca ccagcgtggg
ctacggcatc atcgactacg agacacggga cgtgatcgat gccggcgtgc
ggctgttcaa agaggccaac gtggaaaaca acgagggcag gcggagcaag
agaggcgcca gaaggctgaa gcggcggagg cggcatagaa tccagagagt
gaagaagctg ctgttcgact acaacctgct gaccgaccac agcgagctga
gcggcatcaa cccctacgag gccagagtga agggcctgag ccagaagctg
agcgaggaag agttctctgc cgccctgctg cacctggcca agagaagagg
cgtgcacaac gtgaacgagg tggaagagga caccggcaac gagctgtcca
ccaaagagca gatcagccgg aacagcaagg ccctggaaga gaaatacgtg
gccgaactgc agctggaacg gctgaagaaa gacggcgaag tgcggggcag
catcaacaga ttcaagacca gcgactacgt gaaagaagcc aaacagctgc
tgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc
tacatcgacc tgctggaaac ccggcggacc tactatgagg gacctggcga
gggcagcccc ttcggctgga aggacatcaa agaatggtac gagatgctga
tgggccactg cacctacttc cccgaggaac tgcggagcgt gaagtacgcc
tacaacgccg acctgtacaa cgccctgaac gacctgaaca atctcgtgat
caccagggac gagaacgaga agctggaata ttacgagaag ttccagatca
tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgcc
aaagaaatcc tcgtgaacga agaggatatt aagggctaca gagtgaccag
- 23 042798
caccggcaag cccgagttca ccaacctgaa ggtgtaccac gacatcaagg
acattaccgc ccggaaagag attattgaga acgccgagct gctggatcag
attgccaaga tcctgaccat ctaccagagc agcgaggaca tccaggaaga
actgaccaat ctgaactccg agctgaccca ggaagagatc gagcagatct
ctaatctgaa gggctatacc ggcacccaca acctgagcct gaaggccatc
aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgctat
cttcaaccgg ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga
aagagatccc caccaccctg gtggacgact tcatcctgag ccccgtcgtg
aagagaagct tcatccagag catcaaagtg atcaacgcca tcatcaagaa
gtacggcctg cccaacgaca tcattatcga gctggcccgc gagaagaact
ccaaggacgc ccagaaaatg atcaacgaga tgcagaagcg gaaccggcag
accaacgagc ggatcgagga aatcatccgg accaccggca aagagaacgc
caagtacctg atcgagaaga tcaagctgca cgacatgcag gaaggcaagt
gcctgtacag cctggaagcc atccctctgg aagatctgct gaacaacccc
ttcaactatg aggtggacca catcatcccc agaagcgtgt ccttcgacaa
cagcttcaac aacaaggtgc tcgtgaagca ggaagaaaac agcaagaagg
gcaaccggac cccattccag tacctgagca gcagcgacag caagatcagc
tacgaaacct tcaagaagca catcctgaat ctggccaagg gcaagggcag
aatcagcaag accaagaaag agtatctgct ggaagaacgg gacatcaaca
ggttctccgt gcagaaagac ttcatcaacc ggaacctggt ggataccaga
tacgccacca gaggcctgat gaacctgctg cggagctact tcagagtgaa
caacctggac gtgaaagtga agtccatcaa tggcggcttc accagctttc
tgcggcggaa gtggaagttt aagaaagagc ggaacaaggg gtacaagcac
cacgccgagg acgccctgat cattgccaac gccgatttca tcttcaaaga
gtggaagaaa ctggacaagg ccaaaaaagt gatggaaaac cagatgttcg
aggaaaagca ggccgagagc atgcccgaga tcgaaaccga gcaggagtac
aaagagatct tcatcacccc ccaccagatc aagcacatta aggacttcaa
ggactacaag tacagccacc gggtggacaa gaagcctaat agagagctga
ttaacgacac cctgtactcc acccggaagg acgacaaggg caacaccctg
atcgtgaaca atctgaacgg cctgtacgac aaggacaatg acaagctgaa
aaagctgatc aacaagagcc ccgaaaagct gctgatgtac caccacgacc
cccagaccta ccagaaactg aagctgatta tggaacagta cggcgacgag
aagaatcccc tgtacaagta ctacgaggaa accgggaact acctgaccaa
gtactccaaa aaggacaacg gccccgtgat caagaagatt aagtattacg
gcaacaaact gaacgcccat ctggacatca ccgacgacta ccccaacagc
agaaacaagg tcgtgaagct gtccctgaag ccctacagat tcgacgtgta
cctggacaat ggcgtgtaca agttcgtgac cgtgaagaat ctggatgtga
tcaaaaaaga aaactactac gaagtgaata gcaagtgcta tgaggaagct
aagaagctga agaagatcag caaccaggcc gagtttatcg cctccttcta
caacaacgat ctgatcaaga tcaacggcga gctgtataga gtgatcggcg
tgaacaacga cctgctgaac cggatcgaag tgaacatgat cgacatcacc
taccgcgagt acctggaaaa catgaacgac aagaggcccc ccaggatcat
taagacaatc gcctccaaga cccagagcat taagaagtac agcacagaca
ttctgggcaa cctgtatgaa gtgaaatcta agaagcaccc tcagatcatc aaaaagggc
[SEQ ID NO: 29]
- 24 042798
SEQ ID NO: 30 изложена ниже.
atgaagcgca actacatcct cggactggac atcggcatta cctccgtggg
atacggcatc atcgattacg aaactaggga tgtgatcgac gctggagtca
ggctgttcaa agaggcgaac gtggagaaca acgaggggcg gcgctcaaag
aggggggccc gccggctgaa gcgccgccgc agacatagaa tccagcgcgt
gaagaagctg ctgttcgact acaaccttct gaccgaccac tccgaacttt
ccggcatcaa cccatatgag gctagagtga agggattgtc ccaaaagctg
tccgaggaag agttctccgc cgcgttgctc cacctcgcca agcgcagggg
agtgcacaat gtgaacgaag tggaagaaga taccggaaac gagctgtcca
ccaaggagca gatcagccgg aactccaagg ccctggaaga gaaatacgtg
gcggaactgc aactggagcg gctgaagaaa gacggagaag tgcgcggctc
gatcaaccgc ttcaagacct cggactacgt gaaggaggcc aagcagctcc
tgaaagtgca aaaggcctat caccaacttg accagtcctt tatcgatacc
tacatcgatc tgctcgagac tcggcggact tactacgagg gtccagggga
gggctcccca tttggttgga aggatattaa ggagtggtac gaaatgctga
tgggacactg cacatacttc cctgaggagc tgcggagcgt gaaatacgca
tacaacgcag acctgtacaa cgcgctgaac gacctgaaca atctcgtgat
cacccgggac gagaacgaaa agctcgagta ttacgaaaag ttccagatta
ttgagaacgt gttcaaacag aagaagaagc cgacactgaa gcagattgcc
aaggaaatcc tcgtgaacga agaggacatc aagggctatc gagtgacctc
aacgggaaag ccggagttca ccaatctgaa ggtctaccac gacatcaaag
acattaccgc ccggaaggag atcattgaga acgcggagct gttggaccag
attgcgaaga ttctgaccat ctaccaatcc tccgaggata ttcaggaaga
actcaccaac ctcaacagcg aactgaccca ggaggagata gagcaaatct
ccaacctgaa gggctacacc ggaactcata acctgagcct gaaggccatc
aacttgatcc tggacgagct gtggcacacc aacgataacc agatcgctat
tttcaatcgg ctgaagctgg tccccaagaa agtggacctc tcacaacaaa
- 25 042798
aggagatccc tactaccctt gtggacgatt tcattctgtc ccccgtggtc
aagagaagct tcatacagtc aatcaaagtg atcaatgcca ttatcaagaa
atacggtctg cccaacgaca ttatcattga gctcgcccgc gagaagaact
cgaaggacgc ccagaagatg attaacgaaa tgcagaagag gaaccgacag
actaacgaac ggatcgaaga aatcatccgg accaccggga aggaaaacgc
gaagtacctg atcgaaaaga tcaagctcca tgacatgcag gaaggaaagt
gtctgtactc gctggaggcc attccgctgg aggacttgct gaacaaccct
tttaactacg aagtggatca tatcattccg aggagcgtgt cattcgacaa
ttccttcaac aacaaggtcc tcgtgaagca ggaggaaaac tcgaagaagg
gaaaccgcac gccgttccag tacctgagca gcagcgactc caagatttcc
tacgaaacct tcaagaagca catcctcaac ctggcaaagg ggaagggtcg
catctccaag accaagaagg aatatctgct ggaagaaaga gacatcaaca
gattctccgt gcaaaaggac ttcatcaacc gcaacctcgt ggatactaga
tacgctactc ggggtctgat gaacctcctg agaagctact ttagagtgaa
caatctggac gtgaaggtca agtcgattaa cggaggtttc acctccttcc
tgcggcgcaa gtggaagttc aagaaggaac ggaacaaggg ctacaagcac
cacgccgagg acgccctgat cattgccaac gccgacttca tcttcaaaga
atggaagaaa cttgacaagg ctaagaaggt catggaaaac cagatgttcg
aagaaaagca ggccgagtct atgcctgaaa tcgagactga acaggagtac
aaggaaatct ttattacgcc acaccagatc aaacacatca aggatttcaa
ggattacaag tactcacatc gcgtggacaa aaagccgaac agggaactga
tcaacgacac cctctactcc acccggaagg atgacaaagg gaataccctc
atcgtcaaca accttaacgg cctgtacgac aaggacaacg ataagctgaa
gaagctcatt aacaagtcgc ccgaaaagtt gctgatgtac caccacgacc
ctcagactta ccagaagctc aagctgatca tggagcagta tggggacgag
aaaaacccgt tgtacaagta ctacgaagaa actgggaatt atctgactaa
gtactccaag aaagataacg gccccgtgat taagaagatt aagtactacg
gcaacaagct gaacgcccat ctggacatca ccgatgacta ccctaattcc
cgcaacaagg tcgtcaagct gagcctcaag ccctaccggt ttgatgtgta
ccttgacaat ggagtgtaca agttcgtgac tgtgaagaac cttgacgtga
tcaagaagga gaactactac gaagtcaact ccaagtgcta cgaggaagca
aagaagttga agaagatctc gaaccaggcc gagttcattg cctccttcta
taacaacgac ctgattaaga tcaacggcga actgtaccgc gtcattggcg
tgaacaacga tctcctgaac cgcatcgaag tgaacatgat cgacatcact
taccgggaat acctggagaa tatgaacgac aagcgcccgc cccggatcat
taagactatc gcctcaaaga cccagtcgat caagaagtac agcaccgaca
tcctgggcaa cctgtacgag gtcaaatcga agaagcaccc ccagatcatc aagaaggga
[SEQ ID NO: 30]
- 26 042798
SEQ ID NO: 31 изложена ниже.
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCAAGCGGAACTACA TCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGA CGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGG AGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGC TGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGC CAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTG GCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCA CCAGAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCT GGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTAC GTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCA TCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAG CCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTC CCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACC T GAAC AAT С T C G T GAT С AC C AG G GAG GAGAAC GAGAAG С T G GAAT AT TAG GAGAAG T T С C AGAT CATC GAGAAC G T G T T CAAG CAGAAGAAGAAGС С СAC С С T GAAGCAGAT C GС CAAAGAAAT С С T C GTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACC TGAAGGTGTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCT GCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTG ACCAATCTGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATA CCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAA CGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAG CAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCT TCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCAT TATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAG CGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCA AGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGA AGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCC AGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCA AGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAAC СTTCAAGAAGCACATССTGAATСTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAG TATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACC TGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAA CAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGG
- 27 042798
AAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCA ACGCCGATTTCATCTT CAAAGAG T G GAAGAAAC T G GAGAAG G С CAAAAAAGT GAT GGAAAACGA GATGTTCGAGGAAAGGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAG AT С T T CAT САС С С С С САС CAGAT CAAG GAGAT TAAG GAG T T CAAG GAG TACAAGTAGAGССАСC GGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGA CAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTG AAAAAG С T GAT СAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC C AGAAACT GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAAT ССС С T GTACAAGTAG TAGGA GGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATT AAG TAT TAG G G CAACAAAC T GAAC GCCCATCTG GACAT СAC C GAC GAC TAC С С CAACAG CAGAA ACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTA C AAG T T C G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAAT AG C AAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCT TCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGA С С T G С T GAAC C G GAT C GAAG T GAACATGAT CGACAT СACС TACCGCGAGTACС T GGAAAACATG AACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGT ACAG CACAGACAT T С T G G G CAAC С T G TAT GAAG T GAAAT С TAAGAAG СAC С С T CAGAT CAT СAA AAAGGGCAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG [SEQ ID NO: 31]
SEQ ID NO: 32 изложена ниже.
ACCGGTGCCA CCATGTACCC ATACGATGTT СCAGATTAGG CTTCGCCGAA
GAAAAAGCGC AAGGTCGAAG CGTCCATGAA AAGGAACTAC ATTCTGGGGC
TGGACATCGG GATTACAAGC GTGGGGTATG GGATTATTGA CTATGAAACA
AGGGACGTGA TCGACGCAGG CGTCAGACTG TTCAAGGAGG CCAACGTGGA
AAACAATGAG GGACGGAGAA GCAAGAGGGG AGCCAGGCGC CTGAAACGAC
GGAGAAGGCA CAGAATCCAG AGGGTGAAGA AACTGCTGTT CGATTAGAAC
CTGCTGACCG ACCATTCTGA GCTGAGTGGA ATTAATCCTT ATGAAGCCAG
GGTGAAAGGC CTGAGTCAGA AGCTGTCAGA GGAAGAGTTT TCCGCAGCTC
TGCTGCACCT GGCTAAGCGC CGAGGAGTGC ATAACGTCAA TGAGGTGGAA
GAGGACACCG GCAACGAGCT GTCTACAAAG GAACAGATCT CACGCAATAG
CAAAGCTCTG GAAGAGAAGT ATGTCGCAGA GCTGCAGCTG GAACGGCTGA
AGAAAGATGG CGAGGTGAGA GGGTCAATTA ATAGGTTCAA GACAAGCGAC
TACGTCAAAG AAGCCAAGCA GCTGCTGAAA GTGCAGAAGG CTTACCACCA
GCTGGATCAG AGCTTCATCG ATACTTATAT CGACCTGCTG GAGACTCGGA
GAACСТАСTA TGAGGGACCA GGAGAAGGGA GCCCCTTCGG ATGGAAAGAC
ATCAAGGAAT GGTACGAGAT GCTGATGGGA CATTGCACCT ATTTTCCAGA
- 28 042798
AGAGCTGAGA AGCGTCAAGT ACGCTTATAA CGCAGATCT TACAACGCCC TGAATGACCT
GAACAACCTG GTCATСАССА GGGATGAAAA CGAGAAACTG GAATACTATG
AGAAGTTCCA GATCATCGAA AACGTGTTTA AGCAGAAGAA AAAGCСТАСА
CTGAAACAGA TTGCTAAGGA GATCCTGGTC AACGAAGAGG ACATCAAGGG
CTACCGGGTG ACAAGCACTG GAAAACGAGA GTTCACCAAT CTGAAAGTGT
ATCACGATAT TAAGGACATC ACAGCACGGA AAGAAATCAT TGAGAACGCC
GAACTGCTGG ATCAGATTGC TAAGATCCTG ACTATСТАСC AGAGCTCCGA
GGACATCCAG GAAGAGCTGA CTAACCTGAA CAGCGAGCTG ACCCAGGAAG
AGATCGAACA GATTAGTAAT CTGAAGGGGT ACACCGGAAC ACACAACCTG
TCCCTGAAAG CTATCAATCT GATTCTGGAT GAGCTGTGGC ATACAAACGA
CAATCAGATT GCAATCTTTA ACCGGCTGAA GCTGGTCCCA AAAAAGGTGG
ACCTGAGTCA GCAGAAAGAG ATCCCAACCA CACTGGTGGA CGATTTCATT
CTGTCACCCG TGGTCAAGCG GAGCTTCATC CAGAGCATCA AAGTGATCAA
CGCCATCATC AAGAAGTACG GCCTGCCCAA TGATATCATT ATCGAGCTGG
CTAGGGAGAA GAACAGCAAG GACGCACAGA AGATGATCAA TGAGATGCAG
AAACGAAACC GGCAGACCAA TGAACGCATT GAAGAGATTA TCCGAACTAC
CGGGAAAGAG AACGCAAAGT ACCTGATTGA AAAAATCAAG CTGCACGATA
TGCAGGAGGG AAAGTGTCTG TATTCTCTGG AGGCCATCCC CCTGGAGGAC
CTGCTGAACA ATCCATTCAA CTACGAGGTC GATCATATTA TCCCCAGAAG
CGTGTCCTTC GACAATTCCT TTAACAACAA GGTGCTGGTC AAGCAGGAAG
AGAACTCTAA AAAGGGCAAT AGGACTCCTT TCCAGTACCT GTCTAGTTCA
GATTCCAAGA TCTCTTACGA AACCTTTAAA AAGCACATTC TGAATCTGGC
CAAAGGAAAG GGCCGCATCA GCAAGACCAA AAAGGAGTAC CTGCTGGAAG
AGCGGGACAT CAACAGATTC TCCGTCCAGA AGGATTTTAT TAACCGGAAT
CTGGTGGACA CAAGATACGC TACTCGCGGC CTGATGAATC TGCTGCGATC
CTATTTCCGG GTGAACAATC TGGATGTGAA AGTCAAGTCC ATCAACGGCG
GGTTCACATC TTTTCTGAGG CGCAAATGGA AGTTTAAAAA GGAGCGCAAC
AAAGGGTACA AGCACCATGC CGAAGATGCT CTGATTATCG CAAATGCCGA
CTTCATCTTT AAGGAGTGGA AAAAGCTGGA CAAAGCCAAG AAAGTGATGG
AGAACCAGAT GTTCGAAGAG AAGCAGGCCG AATCTATGCC CGAAATCGAG
ACAGAACAGG AGTACAAGGA GATTTTCATC ACTCCTCACC AGATCAAGCA
TATCAAGGAT TTCAAGGACT ACAAGTACTC TCACCGGGTG GATAAAAAGC
CCAACAGAGA GCTGATCAAT GACACCCTGT ATAGTACAAG AAAAGACGAT
AAGGGGAATA CCCTGATTGT GAACAATCTG AACGGACTGT ACGACAAAGA
TAATGACAAG CTGAAAAAGC TGATCAACAA AAGTCCCGAG AAGCTGCTGA
TGTACСАССА TGATCCTCAG ACATATCAGA AACTGAAGCT GATTATGGAG
CAGTACGGCG ACGAGAAGAA CCCACTGTAT AAGTACTATG AAGAGACTGG
GAACTACCTG ACCAAGTATA GCAAAAAGGA TAATGGCCCC GTGATCAAGA
AGATCAAGTA CTATGGGAAC AAGCTGAATG CCCATCTGGA CATCACAGAC
GATTACCCTA ACAGTCGCAA CAAGGTGGTC AAGCTGTCAC TGAAGCCATA
CAGATTCGAT GTCTATCTGG ACAACGGCGT GTATAAATTT GTGACTGTCA
AGAATCTGGA TGTCATCAAA AAGGAGAACT ACTATGAAGT GAATAGCAAG
TGCTACGAAG AGGCTAAAAA GCTGAAAAAG ATTAGCAACC AGGCAGAGTT
CATCGCCTCC TTTTACAACA ACGACCTGAT TAAGATCAAT GGCGAACTGT
ATAGGGTCAT CGGGGTGAAC AATGATCTGC TGAACCGCAT TGAAGTGAAT
ATGATTGACA TCACTTACCG AGAGTATCTG GAAAACATGA ATGATAAGCG
CCCCCCTCGA ATTATCAAAA CAATTGCCTC TAAGACTCAG AGTATCAAAA
AGTACTCAAC CGACATTCTG GGAAACCTGT ATGAGGTGAA GAGCAAAAAG
CACCCTCAGA TTATCAAAAA GGGCTAAGAA TTC [SEQ ID NO: 32]
- 29 042798
SEQ ID NO: 43 изложена ниже.
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCAAGCGGAACTACA
TCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGA
CGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGG
AGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGC
TGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGC
CAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTG
GCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCA
CCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCT
GGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTAC
GTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCA
TCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAG
CCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTC
CCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACC
TGAACAATCTCGTGATCACCAGGGACGAGAACGAGAAGCTGGAATATTACGAGAAGTTCCAGAT
CATCGAGAACGTGTTCAAGCAGAAGAAGAAGCCCACCCTGAAGCAGATCGCCAAAGAAATCCTC
GTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACC
TGAAGGTGTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCT
GCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTG
ACCAATCTGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATA
CCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAA
CGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAG
CAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCT TCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCAT
TATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAG
CGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCA
AGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGA
AGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCC
AGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCA
AGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAAC
CTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAG
TATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACC
TGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAA
CAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGG
AAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCA
ACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGTGATGGAAAACCA
GATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAG
ATCTTCATCACCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACC
GGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGA
CAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTG
AAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGACCCCCAGACCTACC
AGAAACTGAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGA
GGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATT
AAGTATTACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAA
ACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTA
CAAGTTCGTGACCGTGAAGAATCTGGATGTGATCAAAAAAGAAAACTACTACGAAGTGAATAGC
AAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCT
TCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGA
- 30 042798
CCTGCTGAACCGGATCGAAGTGAACATGATCGACATCACCTACCGCGAGTACCTGGAAAACATG AACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGT ACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCCTCAGATCATCAA AAAGGGCAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG [SEQ ID NO: 43]
В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая молекулу Cas9 S. aureus, предусматривает нуклеотидную последовательность под SEQ ID NO: 44, которая представлена ниже.
AAGCGGAACTACATCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACT ACGAGACACGGGACGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAA CGAGGGCAGGCGGAGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAG AGAGTGAAGAAGCTGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCA ACCCCTACGAGGCCAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGC CCTGCTGCACCTGGCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGC AACGAGCTGTCCACCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGG CCGAACTGCAGCTGGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAA GACCAGCGACTACGTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTG GACCAGAGCTTCATCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGAC CTGGCGAGGGCAGCCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCA CTGCACCTACTTCCCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAAC GCCCTGAACGACCTGAACAATCTCGTGATCACCAGGGACGAGAACGAGAAGCTGGAATATTACG AGAAG Т Т С СAGAT CATC GAGAAC G Т G Т Т СAAG СAGAAGAAGAAG С С САС С С Т GAAG СAGAT С G С CAAAGAAATCCTCGTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCC GAG Т Т САС СААС С Т GAAG G Т G ТАС САС GACАТ СAAG GACAT TACCGCCCG GAAAGAGAT ТАТ Т G AGAACGCCGAGCTGCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACAT С СAG GAAGAAC Т GAC СААТ С Т GAAC ТСС GAG С Т GAC С СAG GAAGAGAT С GAG СAGAT С Т С ТААТ CTGAAGGGCTATACCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGC TGTGGCACACCAACGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGT GGACCTGTCCCAGCAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTC GTGAAGAGAAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGC CCAACGACATCATTATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAA CGAGATGCAGAAGCGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGC AAAGAGAACGCCAAGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCC TGTACAGCCTGGAAGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGA С САСАТ САТ С С С СAGAAG CGTGTCCTTC GACААСAG С Т Т СААСААСAAG GTGCTCGT GAAG СAG GAAGAAAACAGCAAGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGA TCAGCTACGAAACCTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAA GACCAAGAAAGAGTATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTC ATCAACCGGAACCTGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCT ACTTCAGAGTGAACAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCT GCGGCGGAAGTGGAAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCC CTGATCATTGCCAACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAG TGATGGAAAACCAGATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCA G GAG T AC AAAGAGAT С T T C AT С AC С С С С С AC C AGAT C AAG C AC AT T AAG GAC T T C AAG GAC TAG AAGTACAGCCACCGGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCA CCCGGAAGGACGACAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGA
- 31 042798
CAATGACAAGCTGAAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGAC С С С СAGAC СТАС СAGAAAC Т GAAG CTGATTATG GAACAG ТAC G G С GAC GAGAAGAAT С С С С Т G Т ACAAGTACTACGAGGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGT GAT СAAGAAGAT ТAAG ТАТ ТАС G G СААСАААС Т GAAC GCCCATCTG GACАТ САС С GAC GAC ТАС CCCAACAGCAGAAACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGG АСААТ G G С G Т G ТACAAG Т Т С G Т GAC С G Т GAAGAAT CTGGATGTGAT СAAAAAAGAAAAC ТАС ТА CGAAGTGAATAGCAAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAG TTTATCGCCTCCTTC ТАСААСААС GAT С Т GAT СAAGAT СААС G G С GAG С Т G ТATAGAG Т GAT С G G С G Т GAACААСGACС Т GС Т GAACСGGAT СGAAGТ GAACAT GAT С GACАТ САСС ТАССGСGAGТА CCTGGAAAACATGAACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAG AGCATTAAGAAGTACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACC CTCAGATCATCAAAAAGGGC [SEQ ID NO: 44]
Аминокислотная последовательность молекулы Cas9 S. aureus изложена под SEQ ID NO: 33, которая представлена ниже.
MKRNYILGLDIGIТSVGYG11DYE TRDVIDAGVRL EKEANVENNEGRRS KRGARRLKRRRRHRI QRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDT GNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQ LDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLY NALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGK PEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQIS NLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSP WKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTT GKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVK QEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKD FINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAED ALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKD YKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHH DPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDD YPNSRNKWKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQA EFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKT QSIKKYSTDILGNLYEVKSKKHPQIIKKG [SEQ ID NO: 33]
Аминокислотная последовательность молекулы Cas9 S. aureus изложена под SEQ ID NO: 45, которая представлена ниже.
KRNYILGLDIGIT SVGYG11DYE TRDVIDAGVRL FKEANVENNE GRRS KRGARRLKRRRRHRIQ RVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTG NELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQL DQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYN ALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISN LKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPV VKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTG KENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQ EENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDA LIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDY KYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHD PQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDY PNSRNKWKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE FIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQ SIKKYSTDILGNLYEVKSKKHPQIIKKG [SEQ ID NO: 45]
- 32 042798
Как альтернатива или дополнительно система редактирования генов на основе CRISPR/Cas9 может включать в себя слитый белок. Слитый белок может содержать два гетерологичных полипептидных домена, где первый полипептидный домен содержит белок Cas и второй полипептидный домен обладает активностью, такой как активность по отношению к активации транскрипции, активность по отношению к репрессии транскрипции, активность по отношению к фактору освобождения транскриптов, активность по отношению к модификации гистонов, нуклеазная активность, активность по отношению к ассоциации нуклеиновых кислот, метилазная активность или деметилазная активность. Слитый белок может предусматривать белок Cas9 или мутированный белок Cas9, слитый со вторым полипептидным доменом, который обладает активностью, такой как активность по отношению к активации транскрипции, активность по отношению к репрессии транскрипции, активность по отношению к фактору освобождения транскриптов, активность по отношению к модификации гистонов, нуклеазная активность, активность по отношению к ассоциации нуклеиновых кислот, метилазная активность или деметилазная активность.
(a) Активность по отношению к активации транскрипции.
Второй полипептидный домен может обладать активностью по отношению к активации транскрипции, т.е. трансактивирующим доменом. Например, экспрессия эндогенных генов млекопитающих, таких как гены человека, может достигаться за счет нацеливания слитого белка iCas9 и трансактивирующего домена на промоторы млекопитающих посредством комбинации gRNA. Трансактивирующий домен может включать в себя белок VP 16, множество белков VP 16, таких как домен VP48, или домен VP64, или домен p65 активатора активности транскрипции NF каппа B. Например, слитый белок может представлять собой iCas9-VP64.
(b) Активность по отношению к репрессии транскрипции.
Второй полипептидный домен может обладать активностью по отношению к репрессии транскрипции. Второй полипептидный домен может обладать активностью, связанной с Kruppel-боксом, таким как KRAB-домен, активностью по отношению к репрессии ERF-домена, активностью по отношению к репрессии Mxil-домена, активностью по отношению к репрессии SID4X-домена, активностью по отношению к репрессии Mad-SID-домена или активностью по отношению к белку, связывающему TATA-бокс. Например, слитый белок может представлять собой dCas9-KRAB.
(c) Активность по отношению к фактору освобождения транскриптов.
Второй полипептидный домен может обладать активностью по отношению к фактору освобождения транскриптов. Второй полипептидный домен может обладать активностью по отношению к эукариотическому фактору высвобождения 1 (ERF1) или активностью по отношению к эукариотическому фактору высвобождения 3 (ERF3).
(d) Активность по отношению к модификации гистонов.
Второй полипептидный домен может обладать активностью по отношению к модификации гистонов. Второй полипептидный домен может обладать гистондеацетилазной, гистонацетилтрансферазной, гистондеметилазной или гистонметилтрансферазной активностью. Гистонацетилтрансфераза может представлять собой p300 или CREB-связывающий белок (CBP белок) или их фрагмент. Например, слитый белок может представлять собой dCas9-p300.
(e) Нуклеазная активность.
Второй полипептидный домен может обладать нуклеазной активностью, которая отличается от нуклеазной активности белка Cas9. Нуклеазой или белком, обладающим нуклеазной активностью, является фермент, способный расщеплять фосфодиэфирные связи между нуклеотидными субъединицами нуклеиновых кислот. Нуклеазы обычно дополнительно разделяются на эндонуклеазы и экзонуклеазы, хотя некоторые из ферментов могут попадать в обе категории. Хорошо известными нуклеазами являются дезоксирибонуклеаза и рибонуклеаза.
(f) Активность по отношению к ассоциации нуклеиновых кислот.
Второй полипептидный домен может обладать активностью по отношению к ассоциации нуклеиновых кислот или ДНК-связывающего домена (DBD) белка, связывающего нуклеиновую кислоту, который представляет собой независимо уложенный домен белка, который содержит по меньшей мере один мотив, распознающий двухнитевую или однонитевую молекулу ДНК. DBD может распознавать конкретную последовательность ДНК (распознавание последовательности) или обладать общей аффинностью к ДНК. При этом область ассоциации нуклеиновых кислот выбрана из группы, состоящей из области спираль-поворот-спираль, области лейциновой застежки, области крылатая спираль, области крылатая спираль-поворот-спираль, области спираль-петля-спираль, укладки цепи иммуноглобулинов, B3-домена, домена с цинковыми пальцами, HMG-бокса, Wor3-домена, TAL-эффектора ДНК-связывающего домена.
(g) Метилазная активность.
Второй полипептидный домен может обладать метилазной активностью, которая предусматривает перенос метильной группы на ДНК, РНК, белок, малую молекулу, цитозин или аденин. Второй полипептидный домен может включать ДНК-метилтрансферазу.
(h) Деметилазная активность.
Второй полипептидный домен может обладать деметилазной активностью. Второй полипептидный
- 33 042798 домен может включать в себя фермент, который удаляет метильные (CH3-) группы из нуклеиновых кислот, белков (в частности, гистонов) и других молекул. Как альтернатива второй полипептид может скрывать метильную группу к гидроксиметилцитозину в механизме деметилирования ДНК. Второй полипептид может катализировать данную реакцию. Например, второй полипептид, который катализирует данную реакцию, может представлять собой Tet1.
(b ) gRNA, нацеливающая на ген дистрофина.
Система редактирования генов на основе CRISPR/Cas9 включает в себя по меньшей мере одну молекулу gRNA, например две молекулы gRNA. gRNA обеспечивает нацеливание системы редактирования генов на основе CRISPR/Cas9. gRNA является слитой конструкцией из двух некодирующих РНК: crRNA и tracrRNA. sgRNA может нацеливаться на любую требуемую последовательность ДНК путем обмена последовательности, кодирующей протоспейсер размером 20 п.о., который обеспечивает специфичность нацеливания, посредством комплементарного спаривания оснований с требуемой целевой ДНК. При этом gRNA имитирует встречающийся в природе дуплекс crRNA:tracrRNA, принимающий участие в эффекторной системе типа II. Этот дуплекс, который может включать в себя, например, 42-нуклеотидную crRNA и 75-нуклеотидную tracrRNA, действует как направляющий для Cas9 для расщепления целевой нуклеиновой кислоты. Термины целевая область, целевая последовательность или протоспейсер, используемые в данном документе взаимозаменяемо, относятся к области гена-мишени (например, гена дистрофина), на которую нацеливается система редактирования генов на основе CRISPR/Cas9. Система редактирования генов на основе CRISPR/Cas9 может включать в себя по меньшей мере одну gRNA, где gRNA нацеливаются на различные последовательности ДНК. Целевые последовательности ДНК могут быть перекрывающимися. После целевой последовательности или протоспейсера следует последовательность PAM на 3'-конце протоспейсера. Различные системы типа II имеют разные требования к PAM. Например, в системе типа II из Streptococcus pyogenes используется последовательность NGG, где N может представлять собой любой нуклеотид. В некоторых вариантах осуществления последовательность PAM может представлять собой NGG, где N может представлять собой любой нуклеотид. В некоторых вариантах осуществления последовательность PAM может представлять собой NNGRRT (SEQ ID NO: 24) или NNGRRV (SEQ ID NO: 25).
Количество молекул gRNA, кодируемых раскрытой в настоящем изобретении генетической конструкцией (например, вектор на основе AAV) может представлять собой по меньшей мере 1 gRNA, по меньшей мере 2 различные gRNA, по меньшей мере 3 различные gRNA, по меньшей мере 4 различные gRNA, по меньшей мере 5 различных gRNA, по меньшей мере 6 различных gRNA, по меньшей мере 7 различных gRNA, по меньшей мере 8 различных gRNA, по меньшей мере 9 различных gRNA, по меньшей мере 10 различных gRNA, по меньшей мере 11 различных gRNA, по меньшей мере 12 различных gRNA, по меньшей мере 13 различных gRNA, по меньшей мере 14 различных gRNA, по меньшей мере 15 различных gRNA, по меньшей мере 16 различных gRNA, по меньшей мере 17 различных gRNA, по меньшей мере 18 различных gRNA, по меньшей мере 19 различных gRNA, по меньшей мере 20 различных gRNA, по меньшей мере 25 различных gRNA, по меньшей мере 30 различных gRNA, по меньшей мере 35 различных gRNA, по меньшей мере 40 различных gRNA, по меньшей мере 45 различных gRNA или по меньшей мере 50 различных gRNA. Количество gRNA, кодируемых вектором, раскрытым в настоящем изобретении, может составлять от по меньшей мере 1 gRNA до по меньшей мере 50 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 45 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 40 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 35 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 30 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 25 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 20 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 16 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 12 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 8 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 4 различных gRNA, от по меньшей мере 4 gRNA до по меньшей мере 50 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 45 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 40 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 35 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 30 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 25 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 20 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 16 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 12 различные gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 8 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 50 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 45 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 40 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 35 различных gRNA, от 8 различных gRNA до по меньшей мере 30 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 25 различных gRNA, от 8 различных gRNA до по меньшей мере 20 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 16 различных gRNA или от 8 различных gRNA до по меньшей мере 12 различных gRNA. В определенных вариантах осуществления гене
- 34 042798 тическая конструкция (например, вектор AAV) кодируется одной молекулой gRNA, т.е. первой молекулой gRNA и необязательно молекулой Cas9. В определенных вариантах осуществления первая генетическая конструкция (например, первый вектор на основе AAV) кодируется одной молекулой gRNA, т.е. первой молекулой gRNA и необязательно молекулой Cas9, и вторая генетическая конструкция (например, второй вектор AAV) кодируется одной молекулой gRNA, т.е. второй молекулой gRNA и необязательно молекулой Cas9.
Молекула gRNA содержит нацеливающий домен, который комплементарен полинуклеотидной последовательности целевой ДНК, после которой следует последовательность PAM. При этом gRNA может содержать G на 5'-конце нацеливающего домена или комплементарной полинуклеотидной последовательности. Нацеливающий домен молекулы gRNA может содержать по меньшей мере 10 пар оснований, по меньшей мере 11 пар оснований, по меньшей мере 12 пар оснований, по меньшей мере 13 пар оснований, по меньшей мере 14 пар оснований, по меньшей мере 15 пар оснований, по меньшей мере 16 пар оснований, по меньшей мере 17 пар оснований, по меньшей мере 18 пар оснований, по меньшей мере 19 пар оснований, по меньшей мере 20 пар оснований, по меньшей мере 21 пару оснований, по меньшей мере 22 пары оснований, по меньшей мере 23 пары оснований, по меньшей мере 24 пары оснований, по меньшей мере 25 пар оснований, по меньшей мере 30 пар оснований или по меньшей мере 35 пар оснований, комплементарных последовательности целевой ДНК, после которой следует последовательность PAM. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 19-25 нуклеотидов. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 20 нуклеотидов. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 21 нуклеотид. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 22 нуклеотида. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 23 нуклеотида.
gRNA может нацеливаться на область гена дистрофина (DMD). В определенных вариантах осуществления gRNA может нацеливаться на по меньшей мере одно из экзонов, интронов, промоторной области, энхансерной области, транскрибируемой области гена дистрофина. В определенных вариантах осуществления молекула gRNA нацеливается на интрон 50 гена дистрофина человека. В определенных вариантах осуществления молекула gRNA нацеливается на интрон 51 гена дистрофина человека. В определенных вариантах осуществления молекула gRNA нацеливается на экзон 51 гена дистрофина человека. gRNA может включать в себя нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, или комплементарную ей последовательность.
Одиночную или мультиплексную gRNA можно сконструировать для восстановления рамки считывания дистрофина путем нацеливания мутационного участка горячих точек в экзоне 51 или как введение либо внутриэкзонных небольших вставок, так и делеций, либо удаление экзона 51. После лечения с помощью вектора, раскрытого в настоящем изобретении, может восстанавливаться экспрессия дистрофина в мышечных клетках пациента с Duchenne in vitro. Дистрофин человека был выявлен in vivo после трансплантации генетически скорректированных клеток пациента в иммунодефицитных мышей. Особенно важно то, что уникальные возможности многократного редактирования генов системы редактирования генов на основе CRISPR/Cas9 позволяют эффективно получать большие делеции этого мутационного участка горячих точек, которые могут корректировать до 62% мутаций пациента универсальными или специфичными для пациента подходами для редактирования гена. В некоторых вариантах осуществления кандидатные gRNA оценивали и выбирали на основании нецелевой активности, целевой активности, измеренных с помощью анализа Surveyor, а также расстояния от экзона.
3. Композиции для нацеливания на ДНК.
Настоящее изобретение также относится к композициям для нацеливания на ДНК, которые содержат данные генетические конструкции. Композиции для нацеливания на ДНК содержат по меньшей мере одну молекулу gRNA (например, две молекулы gRNA), которая нацеливается на ген дистрофина (например, ген дистрофина человека), как описано выше. По меньшей мере одна молекула gRNA может связывать и распознавать целевую область. Целевые области можно выбирать непосредственно выше возможных стоп-кодонов за пределами рамки считывания, так что вставки или делеции во время процесса репарации восстанавливают рамку считывания дистрофина путем преобразования рамки считывания. Целевые области также могут представлять собой сайты акцепторов сплайсинга или сайты доноров сплайсинга, так что вставки или делеции во время процесса репарации нарушают сплайсинг и восстанавливают рамку считывания дистрофина с помощью разрушения сайта сплайсинга и исключения экзона. Целевые области также могут представлять собой аберрантные стоп-кодоны, так что вставки или делеции во время процесса репарации восстанавливают рамку считывания дистрофина, устраняя или разрушая стопкодон.
В определенных вариантах осуществления композиция для нацеливания на ДНК, раскрытая в настоящем изобретении, включает в себя первую gRNA и вторую gRNA, где первая молекула gRNA и вто
- 35 042798 рая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, или комплементарную ей последовательность. В определенных вариантах осуществления первая молекула gRNA и вторая молекула gRNA содержат нацеливающие домены. В определенных вариантах осуществления первая молекула gRNA представлена под SEQ ID NO: 1 SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 или SEQ ID NO: 15 и вторая молекула gRNA представлена под SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 или SEQ ID NO: 19. В определенных вариантах осуществления первая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 и SEQ ID NO: 15 и вторая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.
В определенных вариантах осуществления первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15;
(xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 42.
В некоторых вариантах осуществления композиция для нацеливания на ДНК содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 37, и/или нуклеотидную последовательность, изложенную под SEQ ID NO: 38.
В определенных вариантах осуществления композиция для нацеливания на ДНК может дополнительно включать в себя по меньшей мере одну молекулу Cas9 или слитый белок Cas9, который распознается PAM либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25). В некоторых вариантах осуществления композиция для нацеливания на ДНК содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 83 или SEQ ID NO: 84. В определенных вариантах осуществления вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в
- 36 042798 первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.
Эффективность делеции векторов, раскрытых в настоящем изобретении, может быть связана с размером делеции, т.е. размером сегмента, подвергнутого делеции с помощью векторов. В определенных вариантах осуществления длину или размер определенных делеций определяют с помощью расстояния между последовательностями PAM в подлежащем нацеливанию гене (например, гене дистрофина). В определенных вариантах осуществления определенная делеция сегмента гена дистрофина, которую определяют с точки зрения ее длины и содержащей ее последовательности (например, экзон 51), происходит в результате разрывов, смежных с определенными последовательностями PAM, в пределах генамишени (например, гена дистрофина).
В определенных вариантах осуществления размер делеции составляет от приблизительно 50 пар оснований до приблизительно 2000 пар оснований (п.о.), например от приблизительно 50 п.о. до приблизительно 1999 п.о., от приблизительно 50 п.о. до приблизительно 1900 п.о., от приблизительно 50 п.о. до приблизительно 1800 п.о., от приблизительно 50 п.о. до приблизительно 1700 п.о., от приблизительно 50 п.о. до приблизительно 1650 п.о., от приблизительно 50 п.о. до приблизительно 1600 п.о., от приблизительно 50 п.о. до приблизительно 1500 п.о., от приблизительно 50 п.о. до приблизительно 1400 п.о., от приблизительно 50 п.о. до приблизительно 1300 п.о., от приблизительно 50 п.о. до приблизительно 1200 п.о., от приблизительно 50 п.о. до приблизительно 1150 п.о., от приблизительно 50 п.о. до приблизительно 1100 п.о., от приблизительно 50 п.о. до приблизительно 1000 п.о., от приблизительно 50 п.о. до приблизительно 900 п.о., от приблизительно 50 п.о. до приблизительно 850 п.о., от приблизительно 50 п.о. до приблизительно 800 п.о., от приблизительно 50 п.о. до приблизительно 750 п.о., от приблизительно 50 п.о. до приблизительно 700 п.о., от приблизительно 50 п.о. до приблизительно 600 п.о., от приблизительно 50 п.о. до приблизительно 500 п.о., от приблизительно 50 п.о. до приблизительно 400 п.о., от приблизительно 50 п.о. до приблизительно 350 п.о., от приблизительно 50 п.о. до приблизительно 300 п.о., от приблизительно 50 п.о. до приблизительно 250 п.о., от приблизительно 50 п.о. до приблизительно 200 п.о., от приблизительно 50 п.о. до приблизительно 150 п.о., от приблизительно 50 п.о. до приблизительно 100 п.о., от приблизительно 100 п.о. до приблизительно 1999 п.о., от приблизительно 100 п.о. до приблизительно 1900 п.о., от приблизительно 100 п.о. до приблизительно 1800 п.о., от приблизительно 100 п.о. до приблизительно 1700 п.о., от приблизительно 100 п.о. до приблизительно 1650 п.о., от приблизительно 100 п.о. до приблизительно 1600 п.о., от приблизительно 100 п.о. до приблизительно 1500 п.о., от приблизительно 100 п.о. до приблизительно 1400 п.о., от приблизительно 100 п.о. до приблизительно 1300 п.о., от приблизительно 100 п.о. до приблизительно 1200 п.о., от приблизительно 100 п.о. до приблизительно 1150 п.о., от приблизительно 100 п.о. до приблизительно 1100 п.о., от приблизительно 100 п.о. до приблизительно 1000 п.о., от приблизительно 100 п.о. до приблизительно 900 п.о., от приблизительно 100 п.о. до приблизительно 850 п.о., от приблизительно 100 п.о. до приблизительно 800 п.о., от приблизительно 100 п.о. до приблизительно 750 п.о., от приблизительно 100 п.о. до приблизительно 700 п.о., от приблизительно 100 п.о. до приблизительно 600 п.о., от приблизительно 100 п.о. до приблизительно 1000 п.о., от приблизительно 100 п.о. до приблизительно 400 п.о., от приблизительно 100 п.о. до приблизительно 350 п.о., от приблизительно 100 п.о. до приблизительно 300 п.о., от приблизительно 100 п.о. до приблизительно 250 п.о., от приблизительно 100 п.о. до приблизительно 200 п.о., от приблизительно 100 п.о. до приблизительно 150 п.о., от приблизительно 200 п.о. до приблизительно 1999 п.о., от приблизительно 200 п.о. до приблизительно 1900 п.о., от приблизительно 200 п.о. до приблизительно 1800 п.о., от приблизительно 200 п.о. до приблизительно 1700 п.о., от приблизительно 200 п.о. до приблизительно 1650 п.о., от приблизительно 200 п.о. до приблизительно 1600 п.о., от приблизительно 200 п.о. до приблизительно 1500 п.о., от приблизительно 200 п.о. до приблизительно 1400 п.о., от приблизительно 200 п.о. до приблизительно 1300 п.о., от приблизительно 200 п.о. до приблизительно 1200 п.о., от приблизительно 200 п.о. до приблизительно 1150 п.о., от приблизительно 200 п.о. до приблизительно 1100 п.о., от приблизительно 200 п.о. до приблизительно 1000 п.о., от приблизительно 200 п.о. до приблизительно 900 п.о., от приблизительно 200 п.о. до приблизительно 850 п.о., от приблизительно 200 п.о. до приблизительно 800 п.о., от приблизительно 200 п.о. до приблизительно 750 п.о., от приблизительно 200 п.о. до приблизительно 700 п.о., от приблизительно 200 п.о. до приблизительно 600 п.о., от приблизительно 200 п.о. до приблизительно 2000 п.о., от приблизительно 200 п.о. до приблизительно 400 п.о., от приблизительно 200 п.о. до приблизительно 350 п.о., от приблизительно 200 п.о. до приблизительно 300 п.о., от приблизительно 200 п.о. до приблизительно 250 п.о., от приблизительно 300 п.о. до приблизительно 1999 п.о., от приблизительно 300 п.о. до приблизительно 1900 п.о., от приблизительно 300 п.о. до приблизительно 1800 п.о., от приблизительно 300 п.о. до приблизительно 1700 п.о., от приблизительно 300 п.о. до приблизительно 1650 п.о., от приблизительно 300 п.о. до приблизительно 1600 п.о., от приблизительно 300 п.о. до приблизительно 1500 п.о., от приблизительно 300 п.о. до приблизительно 1400 п.о., от приблизительно 300 п.о. до приблизительно 1300 п.о., от приблизительно 300 п.о. до приблизительно 1200 п.о., от приблизительно 300 п.о. до приблизительно 1150 п.о., от приблизительно 300 п.о. до приблизительно 1100 п.о., от приблизительно 300 п.о. до приблизительно 1000 п.о., от приблизительно 300 п.о. до приблизительно 900 п.о., от прибли
- 37 042798 зительно 300 п.о. до приблизительно 850 п.о., от приблизительно 300 п.о. до приблизительно 800 п.о., от приблизительно 300 п.о. до приблизительно 750 п.о., от приблизительно 300 п.о. до приблизительно 700 п.о., от приблизительно 300 п.о. до приблизительно 600 п.о., от приблизительно 300 п.о. до приблизительно 3000 п.о., от приблизительно 300 п.о. до приблизительно 400 п.о. или от приблизительно 300 п.о. до приблизительно 350 п.о. В определенных вариантах осуществления размер делеции может составлять приблизительно 118 п.о., приблизительно 233 п.о., приблизительно 326 п.о., приблизительно 766 п.о., приблизительно 805 п.о. или приблизительно 1611 п.о.
4. Композиции для редактирования генома в мышце.
Настоящее изобретение направлено на генетические конструкции (например, векторы) или их композицию для редактирования гена-мишени в скелетной мышце или сердечной мышце в геноме субъекта. Композиция включает в себя модифицированный вектор на основе AAV и нуклеотидную последовательность, кодирующую систему редактирования генов на основе CRISPR/Cas9, например молекулу gRNA и молекулу Cas9. Композиция доставляет активные формы системы редактирования генов на основе CRISPR/Cas9 в скелетную мышцу или сердечную мышцу. Раскрытые в настоящем изобретении генетические конструкции (например, векторы) могут применяться в коррекции или уменьшении эффектов мутаций в гене дистрофина, вовлеченном в генетические заболевания и/или другие состояния, связанные со скелетной мышцей или сердечной мышцей, например DMD. Композиция может дополнительно содержать донорную ДНК или трансген. Эти композиции могут применяться в редактировании генома, в конструировании генома и коррекции или уменьшении эффектов мутаций в генах, вовлеченных в генетические заболевания и/или другие состояния, связанные со скелетной мышцей или сердечной мышцей.
a. Система редактирования генов на основе CRISPR/Cas9 для нацеливания на ген дистрофина.
В данном документе раскрыта система редактирования генов на основе CRISPR/Cas9, специфичная в отношении гена дистрофина. Система редактирования генов на основе CRISPR/Cas9 может включать в себя Cas9 и по меньшей мере одну gRNA для нацеливания на ген дистрофина. Система редактирования генов на основе CRISPR/Cas9 может связываться и распознавать целевую область. Целевые области можно выбирать непосредственно выше возможных стоп-кодонов за пределами рамки считывания, так что вставки или делеции во время процесса репарации восстанавливают рамку считывания дистрофина путем преобразования рамки считывания. Целевые области также могут представлять собой сайты акцепторов сплайсинга или сайты доноров сплайсинга, так что вставки или делеции во время процесса репарации нарушают сплайсинг и восстанавливают рамку считывания дистрофина с помощью разрушения сайта сплайсинга и исключения экзона. Целевые области также могут представлять собой аберрантные стоп-кодоны, так что вставки или делеции во время процесса репарации восстанавливают рамку считывания дистрофина, устраняя или разрушая стоп-кодон.
gRNA может нацеливаться на нуклеотидную последовательность, выбранную из группы, состоящей из SEQ ID NO: 1-19, 41, 42, или комплементарную ей последовательность. Например, раскрытую систему редактирования генов на основе CRISPR/Cas9 конструировали с тем, чтобы опосредовать высокоэффективное редактирование генов в экзоне 51 гена дистрофина. Эта система редактирования генов на основе CRISPR/Cas9 восстанавливает экспрессию белка дистрофина в клетках пациентов с DMD. В некоторых вариантах осуществления композиция для нацеливания на ДНК содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 37, нуклеотидную последовательность, изложенную под SEQ ID NO: 38, нуклеотидную последовательность, изложенную под SEQ ID NO: 83 и/или нуклеотидную последовательность, изложенную под SEQ ID NO: 84. Например, композиция для нацеливания на ДНК включает нуклеотидную последовательность, изложенную под SEQ ID NO: 37, нуклеотидную последовательность, изложенную под SEQ ID NO: 38 и нуклеотидную последовательность, изложенную под SEQ ID NO: 83, или композиция для нацеливания на ДНК включает нуклеотидную последовательность, изложенную под SEQ ID NO: 37, нуклеотидную последовательность, изложенную под SEQ ID NO: 38 и нуклеотидную последовательность, изложенную под SEQ ID NO: 84.
b. Векторы на основе аденоассоциированного вируса.
Композиция может также включать в себя вирусную систему доставки. В определенных вариантах осуществления вектор представляет собой вектор на основе аденоассоциированного вируса (AAV). Вектор на основе AAV представляет собой небольшой вирус, принадлежащий к роду Dependovirus семейства Parvoviridae, который инфицирует людей и некоторые другие виды приматов. Векторы на основе AAV можно использовать для доставки системы редактирования генов на основе CRISPR/Cas9 с применением различных конфигураций конструкции. Например, векторы на основе AAV могут доставлять кассеты экспрессии Cas9 и gRNA на отдельные векторы или на тот же вектор. Как альтернатива, если используются небольшие белки Cas9, полученные из таких видов как Staphylococcus aureus или Neisseria meningitidis, то и кассета экспрессии Cas9, и не менее двух кассет экспрессии gRNA могут быть объединены в одном векторе на основе AAV с пределом упаковки, составляющим 4,7 т.о.
В определенных вариантах осуществления вектор на основе AAV представляет собой модифицированный вектор на основе AAV. Модифицированный вектор на основе AAV может обладать повышенным тропизмом к сердечной и скелетной мышечным тканям. Модифицированный вектор на основе AAV может быть способен к доставке и экспрессировать систему редактирования генов на основе
- 38 042798
CRISPR/Cas9 в клетке млекопитающего. Например, модифицированный вектор на основе AAV может представлять собой вектор AAV-SASTG (Piacentino et al. (2012), Human Gene Therapy, 23: 635-646). Модифицированный вектор на основе AAV может доставлять нуклеазы в скелетную и сердечную мышцы in vivo. Модифицированный вектор на основе AAV может быть на основе одного или нескольких из ряда типов капсида, в том числе AAV1, AAV2, AAV5, AAV6, AAV8 и AAV9. Модифицированный вектор на основе AAV может быть на основе псевдотипа AAV2 с альтернативными тропными к мышцам капсидами AAV, таким как векторы AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5 и AAV/SASTG, которые эффективно трансдуцируют скелетную мышцу или сердечную мышцу путем системной и местной доставки (Seto et al., Current Gene Therapy (2012), 12: 139-151). Модифицированный вектор на основе AAV может представлять собой AAV2i8G9 (Shen et al., J. Biol. Chem. (2013), 288: 28814-28823). В некоторых вариантах осуществления композиция содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 39, и/или нуклеотидную последовательность, изложенную под SEQ ID NO: 40. В некоторых вариантах осуществления композиция включает в себя первый вектор, содержащий нуклеотидную последовательность, изложенную под SEQ ID NO: 39, и второй вектор, содержащий нуклеотидную последовательность, изложенную под SEQ ID NO: 40.
5. Способы редактирования генома в мышце.
Настоящее изобретение направлено на способ редактирования генома в скелетной мышце или сердечной мышце субъекта. Способ предусматривает введение в скелетную мышцу или сердечную мышцу субъекта композиции для редактирования генома в скелетной мышце или сердечной мышце, как описано выше. Редактирование генома может предусматривать коррекцию мутантного гена или вставку трансгена. Коррекция мутантного гена может предусматривать удаление, перестройку или замену мутантного гена. Коррекция мутантного гена может включать опосредованный нуклеазой NHEJ или HDR.
6. Способы коррекции мутантного гена и лечения субъекта.
Раскрытый в настоящем изобретении объект изобретения также предусматривает способы коррекции мутантного гена (например, мутантного гена дистрофина, например мутантного гена дистрофина человека) в клетке и лечение субъекта, страдающего от генетического заболевания, такого как DMD. Способ может предусматривать введение в клетку или субъекту генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции, как описано выше. Способ может предусматривать введение в скелетную мышцу или сердечную мышцу субъекта генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции для редактирования генома в скелетной мышце или сердечной мышце, как описано выше. Применение генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции для доставки системы редактирования генов на основе CRISPR/Cas9 в скелетную мышцу или сердечную мышцу может восстанавливать экспрессию полнофункционального или частично функционального белка с использованием матрицы репарации или донорной ДНК, которая может заменить весь ген или область, содержащую мутацию. Система редактирования генов на основе CRISPR/Cas9 может использоваться для введения сайт-специфических двухнитевых разрывов в целевые геномные локусы. Сайт-специфичные двухнитевые разрывы создаются тогда, когда система редактирования генов на основе CRISPR/Cas9 связывается с последовательностями целевой ДНК, обеспечивая тем самым возможность расщепления целевой ДНК. Такое расщепление ДНК может стимулировать естественный механизм репарации ДНК, сводящийся к одному из двух возможных путей репарации: репарации с участием гомологичной рекомбинации (HDR) или негомологичного соединения концов (NHEJ).
Настоящее изобретение направлено на редактирование генома с использованием системы редактирования генов на основе CRISPR/Cas9 без матрицы репарации, которая может эффективно корректировать рамку считывания и восстанавливать экспрессию функционального белка, вовлеченного в генетическое заболевание. Раскрытые системы редактирования генов на основе CRISPR/Cas9 могут предусматривать использование подходов коррекции на основе репарации с участием гомологичной рекомбинации или опосредованного нуклеазой негомологичного соединения концов (NHEJ), что обеспечивает возможность эффективной коррекции в линиях первичных клеток с ограниченной пролиферацией, которые могут не поддаваться гомологичной рекомбинации или генной коррекции на основе отбора. Эта стратегия объединяет быструю и надежную сборку активных систем редактирования генов на основе CRISPR/Cas9 с эффективным способом редактирования генов для лечения генетических заболеваний, вызванных мутациями в несущественных кодирующих областях, которые являются причиной сдвига рамки, преждевременных стоп-кодонов, аберрантных сайтов доноров сплайсинга или аберрантных сайтов акцепторов сплайсинга.
a. Опосредованное нуклеазой негомологичное соединение концов.
Восстановление экспрессии белка из эндогенного мутированного гена может проводиться путем NHEJ-опосредованной репарации ДНК без участия матрицы. В отличие от временного способа нацеливания на РНК гена-мишени коррекция рамки считывания гена-мишени в геноме с помощью временно экспрессируемой системы редактирования генов на основе CRISPR/Cas9 может приводить к полному восстановлению экспрессии целевого гена каждой модифицированной клеткой и во всем ее потомстве. В определенных вариантах осуществления NHEJ представляет собой опосредованный нуклеазой NHEJ,
- 39 042798 который в определенных вариантах осуществления относится к NHEJ, инициируемому молекулой Cas9, которая разрезает двухнитевую ДНК. Способ предусматривает введение генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции в скелетную мышцу или сердечную мышцу субъекта для редактирования генома в скелетной мышце или сердечной мышце.
Коррекция гена с помощью опосредованного нуклеазой NHEJ может исправлять мутированный ген-мишень и предлагает несколько потенциальных преимуществ над путем HDR. Например, для NHEJ не требуется донорная матрица, которая может вызывать неспецифический инсерционный мутагенез. В отличие от HDR, NHEJ эффективно работает на всех стадиях клеточного цикла и поэтому может эффективно использоваться как в делящихся, так и в постмитотических клетках, таких как мышечные волокна. Это обеспечивает надежное, полное восстановление гена, являющееся альтернативой пропуску экзонов на основе олигонуклеотидов или фармакологически инициируемому сквозному прохождению стопкодонов, и теоретически могла бы требоваться обработка всего лишь одним лекарственным средством. Коррекцию гена на основе NHEJ с использованием системы редактирования генов на основе CRISPR/Cas9, а также других сконструированных нуклеаз, включая мегануклеазы и нуклеазы типа цинковые пальцы, можно комбинировать с другими существующими платформами ex vivo и in vivo для клеточной и генной видов терапии в дополнение к описанному в данном документе способу электропорации плазмид. Например, доставка системы редактирования генов на основе CRISPR/Cas9 путем переноса генов на основе mRNA или в виде очищенных белков, способных проникать в клетку, может обеспечить возможность использования подхода к редактированию генома без ДНК, что позволит избегать любой возможности инсерционного мутагенеза.
b. Репарация с участием гомологичной рекомбинации.
Восстановление экспрессии белка из эндогенного мутированного гена может предусматривать репарацию с участием гомологичной рекомбинации. Вышеописанный способ дополнительно предусматривает введение донорной матрицы в клетку. Донорная матрица может включать в себя нуклеотидную последовательность, кодирующую полнофункциональный белок или частично функциональный белок. Например, донорная матрица может включать в себя конструкцию дистрофина с уменьшенным размером, называемую минидистрофином (минидис), полнофункциональную конструкцию дистрофина для восстановления мутантного гена дистрофина или фрагмент гена дистрофина, который после гомологичной репарации приводит к восстановлению мутантного гена дистрофина.
c. Способы коррекции мутантного гена и лечения субъекта с применением CRISPR/Cas9.
Настоящее изобретение также направлено на редактирование генома с помощью системы редактирования генов на основе CRISPR/Cas9 для восстановления экспрессии полнофункционального или частично функционального белка с использованием матрицы репарации или донорной ДНК, которая может заменить весь ген или область, содержащую мутацию. Система редактирования генов на основе CRISPR/Cas9 может использоваться для введения сайт-специфических двухнитевых разрывов в целевые геномные локусы. Сайт-специфичные двухнитевые разрывы создаются тогда, когда система редактирования генов на основе CRISPR/Cas9 связывается с последовательностями целевой ДНК с помощью gRNA, обеспечивая тем самым возможность расщепления целевой ДНК. Система редактирования генов на основе CRISPR/Cas9 обладает преимуществом в отношении усовершенствованного редактирования генома из-за их высокого уровня успешной и эффективной генетической модификации. Такое расщепление ДНК может стимулировать естественный механизм репарации ДНК, сводящийся к одному из двух возможных путей репарации: репарации с участием гомологичной рекомбинации (HDR) или негомологичного соединения концов (NHEJ). Например, система редактирования генов на основе CRISPR/Cas9, направленная на ген дистрофина, может включать в себя gRNA, содержащую последовательность нуклеиновой кислоты под любой из SEQ ID NO: 1-19, 41, 42 или комплементарную ей последовательность.
Настоящее изобретение направлено на редактирование генома с использованием системы редактирования генов на основе CRISPR/Cas9 без матрицы репарации, которая может эффективно корректировать рамку считывания и восстанавливать экспрессию функционального белка, вовлеченного в генетическое заболевание. Раскрытая система редактирования генов на основе CRISPR/Cas9 может предусматривать использование подходов с коррекцией на основе репарации с участием гомологичной рекомбинации или опосредованного нуклеазой негомологичного соединения концов (NHEJ), что обеспечивает возможность эффективной коррекции в линиях первичных клеток с ограниченной пролиферацией, которые могут не поддаваться гомологичной рекомбинации или генной коррекции на основе отбора. Эта стратегия объединяет быструю и надежную сборку активной системы редактирования генов на основе CRISPR/Cas9 с эффективным способом редактирования генов для лечения генетических заболеваний, вызванных мутациями в несущественных кодирующих областях, которые являются причиной сдвига рамки, преждевременных стоп-кодонов, аберрантных сайтов доноров сплайсинга или аберрантных сайтов акцепторов сплайсинга.
Настоящее изобретение предусматривает способы коррекции мутантного гена в клетке и лечения субъекта, страдающего от генетического заболевания, такого как DMD. Способ может предусматривать введение в клетку или субъекту системы редактирования генов на основе CRISPR/Cas9, полинуклеотида
- 40 042798 или вектора, кодирующего указанную систему редактирования генов на основе CRISPR/Cas9, или композиции, содержащей указанную систему редактирования генов на основе CRISPR/Cas9, как описано выше. Способ может предусматривать введение системы редактирования генов на основе CRISPR/Cas9, как например, введение белка Cas9 или слитого белка Cas9, содержащего второй домен, обладающий нуклеазной активностью, нуклеотидной последовательности, кодирующей указанный белок Cas9 или слитый белок Cas9, и/или по меньшей мере одной gRNA, где gRNA нацеливаются на различные последовательности ДНК. Целевые последовательности ДНК могут быть перекрывающимися. Количество gRNA, вводимой в клетку, может составлять по меньшей мере 1 gRNA, по меньшей мере 2 разные gRNA, по меньшей мере 3 разные gRNA, по меньшей мере 4 разные gRNA, по меньшей мере 5 разных gRNA, по меньшей мере 6 разных gRNA, по меньшей мере 7 разных gRNA, по меньшей мере 8 разных gRNA, по меньшей мере 9 разных gRNA, по меньшей мере 10 разных gRNA, по меньшей мере 15 разных gRNA, по меньшей мере 20 разных gRNA, по меньшей мере 30 разных gRNA или по меньшей мере 50 разных gRNA, описанных выше. gRNA может включать в себя последовательность нуклеиновой кислоты по меньшей мере одной из SEQ ID NO: 1-19, 41, 42 или комплементарную ей последовательность. Способ может предусматривать репарацию с участием гомологичной рекомбинации или негомологичное соединение концов.
7. Способы лечения заболевания.
Настоящее изобретение направлено на способ лечения заболевания у субъекта, нуждающегося в этом. Способ предусматривает введение в ткань или субъекту генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции, как описано выше. В определенных вариантах осуществления способ может предусматривать введение в скелетную мышцу или сердечную мышцу субъекта генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции, как описано выше. В определенных вариантах осуществления способ может предусматривать введение в вену субъекта генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции, как описано выше. В определенных вариантах осуществления субъект страдает от состояния, связанного со скелетной мышцей или сердечной мышцей, вызывающих дегенерацию, или слабость, или генетическое заболевание. Например, субъект может страдать от мышечной дистрофии Дюшенна, как описано выше.
a. Мышечная дистрофия Дюшенна.
Как описано выше, способ можно применять для коррекции гена дистрофина и удаления полнофункциональной или частично функциональной экспрессии белка указанного мутированного гена дистрофина. В некоторых аспектах и вариантах осуществления изобретение предусматривает способ уменьшения эффектов (например, клинических симптомов/признаков) DMD у пациента. В некоторых аспектах и вариантах осуществления изобретение предусматривает способ лечения DMD у пациента. В некоторых аспектах и вариантах осуществления изобретение предусматривает способ предупреждения DMD у пациента. В некоторых аспектах и вариантах осуществления изобретение предусматривает способ предупреждения дальнейшего прогрессирования DMD у пациента.
8. Способы получения трансгенного грызуна с Δ52 hDMD.
Настоящее изобретение относится к способу получения трансгенного эмбриона грызуна, у которого имеется ген дистрофина человека с делецией экзона 52. Способ предусматривает введение эмбриону грызуна gRNA, за счет чего обеспечивается делеция экзона 52 из гена дистрофина человека, и отбор трансгенного эмбриона грызуна, у которого имеется делеция экзона 52 гена дистрофина человека, где эмбрион грызуна содержит нормальный ген дистрофина человека. В некоторых вариантах осуществления эмбрион грызуна представляет собой эмбрион мыши. В некоторых вариантах осуществления трансгенный эмбрион грызуна является гетерозиготным hDMD или гетерозиготным hDMD-Δ52. В некоторых вариантах осуществления первую молекулу gRNA, содержащую нацеливающий домен, который включает в себя нуклеотидную последовательность, изложенную под SEQ ID NO: 41, и вторую молекулу gRNA, содержащую нацеливающий домен, который включает в себя нуклеотидную последовательность, изложенную под SEQ ID NO: 42, вводят в эмбрион грызуна для осуществления делеции экзона 52 гена дистрофина человека. В некоторых вариантах осуществления способ дополнительно включает введение в эмбрион грызуна белка Cas, содержащего аминокислотную последовательность, изложенную под SEQ ID NO: 27. Настоящее изобретение направлено на трансгенный эмбрион грызуна, который получают с помощью данного способа. Настоящее изобретение также относится к трансгенному грызуну, полученному из трансгенного эмбриона грызуна.
9. Конструкции и плазмиды.
Вышеописанные композиции могут содержать генетические конструкции, которые кодируют систему редактирования генов на основе CRISPR/Cas9, как раскрыто в данном документе. Генетическая конструкция, такая как плазмида, может содержать нуклеиновую кислоту, которая кодирует систему редактирования генов на основе CRISPR/Cas9, такую как белок Cas9 и слитые белки Cas9 и/или по меньшей мере одну из gRNA. Вышеописанные композиции могут содержать генетические конструкции, которые кодируют модифицированный вектор на основе AAV и последовательность нуклеиновой кислоты,
- 41 042798 которая кодирует систему редактирования генов на основе CRISPR/Cas9, как раскрыто в данном документе. Генетическая конструкция, такая как плазмида, может содержать нуклеиновую кислоту, которая кодирует систему редактирования генов на основе CRISPR/Cas9. Вышеописанные композиции могут содержать генетические конструкции, которые кодируют модифицированный лентивирусный вектор, раскрытый в данном документе.
Генетическая конструкция, такая как рекомбинантная плазмида или рекомбинантная вирусная частица, может содержать нуклеиновую кислоту, которая кодирует слитый белок Cas9, и по меньшей мере одну gRNA. В некоторых вариантах осуществления генетическая конструкция может содержать нуклеиновую кислоту, которая кодирует слитый белок Cas9 и по меньшей мере две различные gRNA. В некоторых вариантах осуществления генетическая конструкция может содержать нуклеиновую кислоту, которая кодирует слитый белок Cas9 и более двух различных gRNA. В некоторых вариантах осуществления генетическая конструкция может содержать промотор, который функционально связан с нуклеотидной последовательностью, кодирующей по меньшей мере одну молекулу gRNA и/или молекулу Cas9. В некоторых вариантах осуществления промотор функционально связан с нуклеотидной последовательностью, кодирующей первую молекулу gRNA, вторую молекулу gRNA и/или молекулу Cas9. Генетическая конструкция может присутствовать в клетке в виде функционирующей внехромосомной молекулы. Генетическая конструкция может представлять собой линейную минихромосому, включающую в себя центромеру, теломеры или плазмиды или космиды.
Генетическая конструкция также может представлять собой часть генома рекомбинантного вирусного вектора, в том числе рекомбинантного лентивируса, рекомбинантного аденовируса и рекомбинантного аденоассоциированного вируса. Генетическая конструкция может представлять собой генетического материала в аттенуированных живых микроорганизмах или рекомбинантных микробных векторах, которые заселяют клетки. Генетические конструкции могут содержать регуляторные элементы для экспрессии генов кодирующих последовательностей нуклеиновой кислоты. Регуляторные элементы могут представлять собой промотор, энхансер, инициирующий кодон, стоп-кодон или сигнал полиаденилирования.
В определенных вариантах осуществления генетическая конструкция представляет собой вектор. Вектор может представлять собой вектор на основе аденоассоциированного вируса (AAV), который кодирует по меньшей мере одну молекулу Cas9 и по меньшей мере одну молекулу gRNA; при этом вектор способен экспрессировать по меньшей мере одну молекулу Cas9 и по меньшей мере молекулу gRNA в клетке млекопитающего. Вектор может представлять собой плазмиду. Векторы можно применять для генной терапии in vivo. Вектор может являться рекомбинантным. Вектор может содержать гетерологичную нуклеиновую кислоту, кодирующую слитый белок, такой как слитый белок Cas9 или система редактирования генов на основе CRISPR/Cas9. Вектор может представлять собой плазмиду. Вектор может быть применим для трансфекции клеток нуклеиновой кислотой, кодирующей слитый белок Cas9 или систему редактирования генов на основе CRISPR/Cas9, при этом трансформированную клетку-хозяина культивируют и поддерживают в условиях, при которых происходит экспрессия слитого белка Cas9 или системы редактирования генов на основе CRISPR/Cas9.
Кодирующие последовательности могут быть оптимизированы для стабильности и высоких уровней экспрессии. В некоторых случаях кодоны выбирают для уменьшения образования вторичной структуры РНК, такой как структура, образовавшаяся вследствие внутримолекулярного связывания.
Вектор может содержать гетерологичную нуклеиновую кислоту, кодирующую систему редактирования генов на основе CRISPR/Cas9, и может дополнительно содержать инициирующий кодон, который может располагаться выше кодирующей последовательности системы редактирования генов на основе CRISPR/Cas9, а также стоп-кодон, который может располагаться ниже кодирующей последовательности системы редактирования генов на основе CRISPR/Cas9. Инициирующий кодон и кодон терминации могут находиться в рамке с кодирующей последовательностью системы редактирования генов на основе CRISPR/Cas9. Вектор также может содержать промотор, который функционально связан с кодирующей последовательностью системы редактирования генов на основе CRISPR/Cas9. Промотор, который функционально связан с кодирующей последовательностью системы редактирования генов на основе CRISPR/Cas9, может представлять собой промотор из вируса обезьяны 40 (SV40), промотор вируса опухоли молочной железы мыши (MMTV), промотор вируса иммунодефицита человека (HIV), такой как промотор длинного концевого повтора (LTR) вируса иммунодефицита крупного рогатого скота (BIV), промотор вируса Молони, промотор вируса птичьего лейкоза (ALV), промотор цитомегаловируса (CMV), такой как промотор гена немедленного раннего ответа CMV, промотор вируса Эпштейна-Барр (EBV), промотор U6, такой как промотор U6 человека, или промотор вируса саркомы Рауса (RSV). Промотор также может представлять собой промотор из гена человека, такого как ген убиквитина C человека (hUbC), актина человека, миозина человека, гемоглобина человека, креатина мышц человека или металлотионеина человека. Промотор также может представлять собой тканеспецифичный промотор, такой как промотор, специфичный в отношении мышц или кожи, природный или синтетический. Примеры таких промоторов описаны в публикациях патентных заявок США № US 2004/0175727 и US 2004/0192593, содержание которых включено в данный документ во всей своей полноте. Примеры промоторов, специ
- 42 042798 фичных в отношении мышц, включают промотор Spc5-12 (описанный в публикации патентной заявки США № US 2004/0192593, которая включена в данный документ посредством ссылки во всей своей полноте; Hakim et al., Mol. Ther. Methods Clin. Dev. (2014), 1: 14002; и Lai et al., Hum Mol Genet. (2014), 23(12): 3189-3199), промотор MHCK7 (описанный в Salva et al., Mol. Ther. (2007), 15: 320-329), промотор CK8 (описанный в Park et al., PLoS ONE (2015), 10(4): e0124914) и промотор CK8e (описанный в Muir et al., Mol. Ther. Methods Clin. Dev. (2014), 1: 14025). В некоторых вариантах осуществления экспрессией gRNA и/или белка Cas9 управляют с помощью tRNA.
Каждая из полинуклеотидных последовательностей, кодирующих молекулу gRNA и/или молекулу Cas9, может быть функционально связана с промотором. Промоторы, которые функционально связаны с молекулой gRNA и/или молекулой Cas9, могут представлять собой один и тот же промотор. Промоторы, которые функционально связаны с молекулой gRNA и/или молекулой Cas9, могут представлять собой разные промоторы. Промотор может представлять собой конститутивный промотор, индуцируемый промотор, репрессируемый промотор или регулируемый промотор.
Вектор также может содержать сигнал полиаденилирования, который может располагаться ниже системы редактирования генов на основе CRISPR/Cas9. Сигнал полиаденилирования может представлять собой сигнал полиаденилирования SV40, сигнал полиаденилирования LTR, сигнал полиаденилирования бычьего гормона роста (bGH), сигнал полиаденилирования гормона роста человека (hGH) или сигнал полиаденилирования β-глобина человека. Сигнал полиаденилирования SV40 может представлять собой сигнал полиаденилирования из вектора pCEP4 (Invitrogen, Сан-Диего, Калифорния).
Вектор также может содержать энхансер выше системы редактирования генов на основе CRISPR/Cas9, т.е. кодирующей последовательности белка Cas9, или слитого белка Cas9, или sgRNA, или системы редактирования генов на основе CRISPR/Cas9. Энхансер может быть необходим для экспрессии ДНК. Энхансер может представлять собой энхансер гена актина человека, миозина человека, гемоглобина человека, креатина мышц человека или вирусный энхансер, такой как один из CMV, HA, RSV или EBV. Энхансеры для осуществления функции полинуклеотидов описаны в патентах США № 5593972, 5962428 и в заявке WO 94/016737, содержание каждого из которых полностью включено посредством ссылки. Вектор также может содержать точку начала репликации млекопитающих, чтобы поддерживать вектор вне хромосомы и создавать множественные копии вектора в клетке. Вектор также может содержать регуляторную последовательность, которая может хорошо подходить для экспрессии генов в клетке млекопитающего или человека, в которую вводится вектор. Вектор также может содержать репортерный ген, такой как ген зеленого флуоресцентного белка (GFP), и/или селектируемый маркер, такой как ген резистентности к гигромицину (Hygro).
Вектор может представлять собой векторы экспрессии или системы для получения белка с помощью стандартных методик и с помощью общедоступных исходных материалов, включенных в справочник Sambrook et al., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989), который полностью включен посредством ссылки. В некоторых вариантах осуществления вектор может содержать последовательность нуклеиновой кислоты, кодирующую систему редактирования генов на основе CRISPR/Cas9, в том числе последовательность нуклеиновой кислоты, кодирующую белок Cas9 или слитый белок Cas9, и последовательность нуклеиновой кислоты, кодирующую по меньшей мере одну gRNA, содержащую последовательность нуклеиновой кислоты по меньшей мере под одной из SEQ ID NO: 1-19, 41, 42 или комплементарную ей последовательность. В некоторых вариантах осуществления белок Cas9 или слитый белок Cas9 кодируется последовательностью нуклеиновой кислоты под любой из SEQ ID NO: 26. В некоторых вариантах осуществления вектор содержит последовательность нуклеиновой кислоты под SEQ ID NO: 39 или SEQ ID NO: 40.
10. Фармацевтические композиции.
Раскрытый в настоящем изобретении объект изобретения предусматривает композиции, содержащие вышеописанные генетические конструкции. Фармацевтические композиции в соответствии с настоящим изобретением могут составляться в соответствии с применяемым способом введения. В случаях если фармацевтические композиции представляют собой инъекционные фармацевтические композиции, они являются стерильными, свободными от пирогенов и не содержат частиц. Предпочтительным является использование изотонического состава. Как правило, добавки для изотоничности могут включать хлорид натрия, декстрозу, маннит, сорбит и лактозу. В некоторых случаях предпочтительными являются изотонические растворы, такие как фосфатно-буферный солевой раствор. Стабилизаторы включают в себя желатин и альбумин. В некоторых вариантах осуществления в состав добавляют сосудосуживающее средство.
Композиция может дополнительно содержать фармацевтически приемлемое вспомогательное вещество. Фармацевтически приемлемое вспомогательное вещество может представлять собой функциональные молекулы, такие как наполнители, адъюванты, носители или разбавители. Фармацевтически приемлемое вспомогательное вещество может представлять собой средство, облегчающее трансфекцию, которое может включать поверхностно-активные средства, такие как иммуностимулирующие комплексы (ISCOMS), неполный адъювант Фрейнда, аналог LPS, в том числе монофосфориллипид A, мурамиловые пептиды, аналоги хинона, везикулы, такие как сквален и сквален, гиалуроновая кислота, липиды, липо
- 43 042798 сомы, ионы кальция, вирусные белки, полианионы, поликатионы или наночастицы или другие известные средства, облегчающие трансфекцию.
Средство, облегчающее трансфекцию, представляет собой полианион, поликатион, в том числе поли-L-глутамат (LGS), или липид. Средство, облегчающее трансфекцию, представляет собой поли-Lглутамат, а более предпочтительно, поли-L-глутамат присутствует в композиции для редактирования генома в скелетной мышце или сердечной мышце при концентрации, составляющей менее 6 мг/мл. Средство, облегчающее трансфекцию, может также включать поверхностно-активные средства, такие как иммуностимулирующие комплексы (ISCOMS), неполный адъювант Фрейнда, аналог LPS, в том числе монофосфориллипид A, мурамиловые пептиды, аналоги хинона и везикулы, такие как сквален и сквален, при этом также можно использовать гиалуроновую кислоту при введении в сочетании с генетической конструкцией. В некоторых вариантах осуществления ДНК-вектор, кодирующий композицию, также может включать в себя средство, облегчающее трансфекцию, такое как липиды, липосомы, в том числе лецитиновые липосомы, или другие липосомы, известные в данной области техники, в виде смеси ДНК-липосом (см., например, Международную патентную публикацию № WO 9324640), ионы кальция, вирусные белки, полианионы, поликатионы или наночастицы или другие известные средства, облегчающие трансфекцию. Предпочтительно средство, облегчающее трансфекцию, представляет собой полианион, поликатион, в том числе поли-L-глутамат (LGS), или липид.
11. Способы доставки.
В данном документе предусмотрен способ доставки раскрытой в настоящем изобретении генетической конструкции (например, вектора) или ее композиции в клетку. Доставку композиций можно осуществлять с помощью трансфекции или электропорации композиции, в виде молекулы нуклеиновой кислоты, которая экспрессируется в клетке и доставляется на поверхность клетки. Молекулы нуклеиновых кислот можно подвергать электропорации с использованием устройств BioRad Gene Pulser Xcell или Amaxa Nucleofector IIb. Можно использовать несколько различных буферов, в том числе раствор для электропорации BioRad, фосфатно-буферный солевой раствор от Sigma с № D8537 (PBS), Invitrogen OptiMEM I (OM) или Amaxa Nucleofector solution V (N.V.). Трансфекции могут предусматривать реагент для трансфекции, такой как Lipofectamine 2000.
После доставки раскрытой в настоящем изобретении генетической конструкции или композиции в ткань и как результат вектора в клетки млекопитающего трансфицированные клетки будут экспрессировать молекулу(ы) gRNA и молекулу Cas9. Генетическую конструкцию или композицию можно вводить млекопитающему для изменения экспрессии генов или переконструирования либо изменения генома. Например, генетическую конструкцию или композицию можно вводить млекопитающему для коррекции гена дистрофина у млекопитающего. Млекопитающее может представлять собой человека, примата, отличного от человека, корову, свинью, овцу, козу, антилопу, бизона, водного буйвола, крупный рогатый скот, оленя, ежа, слоновых, ламу, альпаку, мышей, крыс или курицу, предпочтительно человека, корову, свинью или курицу.
Генетическую конструкцию (например, вектор), кодирующую молекулу(ы) gRNA и молекулу Cas9, можно доставлять млекопитающему с помощью инъекции ДНК (также называемой вакцинацией ДНК) с электропорацией in vivo и без нее, опосредованной липосомами, с помощью наночастиц и/или рекомбинантных векторов. Рекомбинантный вектор можно доставлять с помощью любой вирусной формы. Вирусная форма может представлять собой рекомбинантный лентивирус, рекомбинантный аденовирус и/или рекомбинантный аденоассоциированный вирус.
Генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или содержащую ее композицию можно вводить в клетку для генетической коррекции гена дистрофина (например, гена дистрофина человека). В определенных вариантах осуществления генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или содержащую ее композицию вводят в миобласт от пациента с DMD. В определенных вариантах осуществления генетическую конструкцию (например, вектор) или содержащую ее композицию вводят в клетку фибробласта от пациента с DMD, и генетически скорректированная клетка фибробласта может подвергаться обработке с помощью MyoD для индукции дифференцировки в миобласты, которые можно имплантировать субъектам, таким как субъект с поврежденными мышцами, чтобы проверить, что скорректированный белок дистрофина является функциональным и/или для лечения субъекта. Модифицированные клетки могут также являться стволовыми клетками, такими как индуцированные плюрипотентные стволовые клетки, клеткипредшественники, полученные из костного мозга, клетки-предшественники скелетной мышцы, скелетные миобласты человека от пациентов с DMD, клетки CD 133+, мезоангиобласты и трансдуцированные клетки MyoD или Pax7 или другие миогенные клетки-предшественники. Например, система редактирования генов на основе CRISPR/Cas9 может вызывать нейрональную или миогенную дифференцировку индуцированной плюрипотентной стволовой клетки.
12. Пути введения.
Раскрытые в настоящем изобретении генетические конструкции (например, векторы) или содержащую их композицию можно вводить субъекту различными путями, в том числе перорально, парентерально, сублингвально, трансдермально, ректально, трансмукозально, местно, посредством ингаляции,
- 44 042798 посредством буккального введения, внутриплеврально, внутривенным, внутриартериальным, внутрибрюшинным, подкожным, внутримышечным, интраназальным, интратекальным и внутрисуставным или их комбинациями. В определенных вариантах осуществления генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или композицию вводят субъекту (например, субъекту, страдающему от DMD) внутримышечно, внутривенно или с помощью их комбинации. Для ветеринарного применения, генетические конструкции (например, векторы), раскрытые в настоящем изобретении, или содержащие их композиции можно вводить в виде отвечающего требованиям приемлемого состава в соответствии с обычной ветеринарной практикой. Ветеринар может легко определить схему применения и способ введения, которые наиболее подходят для конкретного животного. Композиции можно вводить традиционными шприцами, безыгольными устройствами для инъекций, пушками для проведения баллистической трансфекции или другими физическими способами, такими как электропорация (EP), гидродинамический способ или ультразвук.
Генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или содержащую ее композицию можно доставлять млекопитающему с помощью нескольких технологий, в том числе инъекции ДНК (также называемая вакцинация ДНК) с электропорацией in vivo и без нее, опосредованной липосомами, с помощью наночастиц, рекомбинантных векторов, таких как рекомбинантный лентивирус, рекомбинантный аденовирус и рекомбинантный аденоассоциированный вирус. Композицию можно вводить в скелетную мышцу или сердечную мышцу. Например, композицию можно вводить в переднюю большеберцовую мышцу или хвост.
В некоторых вариантах осуществления генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или ее композицию вводят с помощью
1) инъекций в хвостовую вену взрослых мышей (системных);
2) внутримышечных инъекций, например локальной инъекции в мышцу, такую как TA или икроножная мышца, взрослых мышей;
3) внутрибрюшинных инъекций в мышей P2; или
4) инъекции в лицевую вену в мышей P2 (системной).
13. Типы клеток.
Любые из этих способов доставки и/или путей введения можно использовать с огромным количеством типов клеток, например следующими типами клеток, в настоящее время находящимися под изучением для клеточной терапии DMD, в том числе без ограничения иммортализованными миобластами, такими как миобласты дикого типа и линии клеток, полученные от пациента с DMD, например линии клеток A48-50 DMD, DMD 6594 (del48-50), DMD 8036 (del48-50), C25C14 и DMD-7796, первичными фибробластами кожи при DMD, индуцированными плюрипотентными стволовыми клетками, клеткамипредшественниками, полученными из костного мозга, клетками-предшественниками скелетной мышцы от пациентов с DMD, клетками CD 133+, мезоангиобластами, кардиомиоцитами, гепатоцитами, хондроцитами, мезенхимальными клетками-предшественниками, гематопоэтическими стволовыми клетками, гладкомышечными клетками и трансдуцированными клетками MyoD или Pax7 или другими миогенными клетками-предшественниками. Иммортализацию миогенных клеток человека можно использовать для клонального получения генетически скорректированных миогенных клеток. Клетки могут быть модифицированы ex vivo для выделения и удлинения клональных популяций иммортализованных миобластов DMD, которые включают в себя генетически скорректированный ген дистрофина и не содержат других введенных нуклеазой мутаций в областях генома, кодирующих белок. Как альтернатива временная доставка in vivo систем на основе CRISPR/Cas9 с помощью невирусного или неинтегрирующего вирусного гена-переносчика или с помощью непосредственной доставки очищенных белков и gRNA, содержащей проникающие в клетку мотивы, может обеспечивать высокоспецифическую корреляцию in situ с минимальным риском интеграции экзогенной ДНК или без такового.
14. Наборы.
В данном документе предусмотрен набор, который можно применять для коррекции мутированного гена дистрофина. Набор содержит по меньшей мере gRNA для коррекции мутированного гена дистрофина и инструкции по применению системы редактирования генов на основе CRISPR/Cas9. В данном документе также предусмотрен набор, который можно применять для редактирования гена дистрофина в геноме скелетной мышцы или сердечной мышцы. Набор содержит генетические конструкции (например, векторы) или содержащую их композицию для редактирования генома в скелетной мышце или сердечной мышце, как описано выше, и инструкции по применению указанной композиции.
Инструкции, включенные в наборы, могут быть прикреплены к упаковочному материалу или могут быть включены в виде листка-вкладыша в упаковке. Хотя инструкции обычно представляют собой письменные или печатные материалы, -они не ограничиваются таковыми. В данном изобретении рассматривается любой носитель, способный хранить такие инструкции и сообщать их конечному пользователю. Такие носители включают без ограничения электронные носители (например, магнитные диски, кассеты, картриджи, чипы), оптические носители (например, CD ROM) и т.п. Используемый в данном документе термин инструкции может включать адрес интернет-сайта, который предоставляет инструкции.
Генетические конструкции (например, векторы) или содержащая их композиция для коррекции му
- 45 042798 тированного гена дистрофина или редактирования гена дистрофина в геноме скелетной мышцы или сердечной мышцы могут включать в себя модифицированный вектор на основе AAV, который включает в себя молекулу(ы) gRNA и молекулу Cas9, как описано выше, которые специфично связываются и расщепляют область гена дистрофина. Система редактирования генов на основе CRISPR/Cas9, как описано выше, может быть включена в набор для специфического связывания и нацеливания на конкретную область в мутированном гене дистрофина. Набор может дополнительно включать донорную ДНК, различные gRNA или трансген, как описано выше.
15. Примеры.
Специалистам в данной области техники будет понятно, что другие подходящие модификации и адаптации способов по настоящему изобретению, описанных в данном документе, являются легко применимыми и существенными и могут осуществляться с применением подходящих эквивалентов без отступления от объема настоящего изобретения или аспектов и вариантов осуществления, раскрытых в данном документе. Теперь при наличии подробного описания настоящего изобретения указанное будет более ясно раскрыто при рассмотрении следующих примеров, которые просто подразумеваются для иллюстрации некоторых аспектов и вариантов осуществления настоящего изобретения и не должны рассматриваться как ограничивающие объем изобретения. Раскрытия всех журнальных ссылок, патентов США и публикаций, называемых в данном документе, включены в данный документ посредством ссылки во всей своей полноте.
Настоящее изобретение характеризуется множеством аспектов, проиллюстрированных с помощью следующих неограничивающих примеров.
Пример 1. Нацеливание на ген дистрофина человека.
Систему редактирования генов на основе CRISPR/Cas9 применяли для нацеливания и обеспечения делеции экзона 51 в гене дистрофина человека. Cas9 из S. aureus (SaCas9), размер которой на приблизительно 1 т.о. меньше, чем у Cas9 из S. pyogenes, применяли с аденоассоциированным вирусом (AAV) для доставки системы редактирования генов на основе CRISPR/Cas9. Кодон-оптимизированная последовательность нуклеиновой кислоты, кодирующая молекулу Cas9 из S. aureus, изложена под SEQ ID NO: 43 или SEQ ID NO: 44. На фиг. 3 показано схематическое изображение системы на основе AAV для совместной доставки in vivo SaCas9 и двух gRNA в двух вирусных векторах к мышечным тканям. Каждый вектор содержал копию SaCas9 и одной gRNA, управляемых соответственно промоторами CMV и hU6 (PT366-179 (SEQ ID NO: 39) и PT366-183 (SEQ ID NO: 40)).
Активность отдельных gRNA, нацеливающихся на ген дистрофина человека, JCR89 (осуществляет нацеливание выше экзона 51) и JCR91 (осуществляет нацеливание ниже экзона 51), которые разрабатывали в отношении генома человека, определяли с помощью анализа Surveyor в клетках HEK293T (содержат нормальный вариант гена дистрофина) и линиях миобластов от пациентов с DMD (DMD 8036 и DMD 6594, каждая из которых содержала мутантную форму гена дистрофина) (см. фиг. 1). Посредством анализа Surveyor выявляли ошибочно спаренные основания в геномной ДНК, которые являлись признаком вставок/делеций, внесенных системой редактирования генов на основе CRISPR/Cas9. Что касается JCR89, то размер полосы, соответствующей исходной форме, составлял 555 нт, и применяемые праймеры представляли собой следующие: прямой праймер - aagttacttgtccaggcatga (SEQ ID NO: 91) и обратный праймер - gaaaaacttctgccaacttttatca (SEQ ID NO: 92). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 134 и 421 нт. Что касается JCR91, то размер полосы, соответствующей исходной форме, составлял 632 нт, и применяемые праймеры представляли собой следующие: прямой праймер - tgcaaataacaaaagtagccataca (SEQ ID NO: 93) и обратный праймер - tctttagaaaggcttgaaagctg (SEQ ID NO: 94). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 210 и 422 нт.
Клетки HEK293T и миобласты DMD (DMD 8036 и DMD 6594) обрабатывали с помощью SaCas9 совместно с JCR89 и JCR91 gRNA (SEQ ID NO: 37 и SEQ ID NO: 38). Геномную ДНК амплифицировали с помощью прямого праймера - cttcactgctggccagttta (SEQ ID NO: 95) и обратного праймера - tctttagaaaggcttgaaagctg (SEQ ID NO: 94). Ожидаемый размер полосы, соответствующей исходной форме, составлял 1646 нт, и ожидаемый размер полосы, соответствующей форме с наиболее подходящей делецией, составлял 766 нт (фактический размер делеции между сайтами разрезов gRNA отличался от 766 нт вследствие наличия вставок/делеций). На фиг. 2A показана делеция экзона 51 в геномной ДНК из клеток HEK293T и миобластов DMD. На фиг. 2B показана делеция экзона 51 в кДНК из миобластов DMD. Без RT представляет собой отрицательный контроль, при котором обратная транскриптаза не добавлялась.
Систему редактирования генов на основе CRISPR/Cas9 вводили посредством инъекции в трансгенных мышей, несущих ген DMD человека (мыши hDMD/mdx), для обеспечения делеции экзона 51. Обеспечивали местную доставку вирусных векторов AAV8, несущих SaCas9 и gRNA, в переднюю большеберцовую (TA) мышцу. См. табл. 1. AAV8 вводили посредством инъекции 3 мышам: 1 мыши вводили посредством инъекции высокую дозу AAV8 в обе TA (HH), 1 мыши вводили посредством инъекции низкую дозу AAV8 в обе TA (LL) и 1 мыши вводили посредством инъекции низкую дозу в левую TA и высокую дозу в правую TA (LH). Дозы перечислены в колонке 2 табл. 1. Мышей умерщвляли через
- 46 042798 недель после обработки (недели PT) с целью сбора тканей для анализа. Посредством гнездовой ПЦР выявляли делецию экзона 51 в обеих конечностях у мыши с обработкой HH, в правой TA у мыши с обработкой LL и в правой конечности у мыши с обработкой LH.
Таблица 1
Эксперимент Дозировка AAV8 Недели Доставка РТ Внутримышечная, гнездовая ПЦР - gDNA Δ51
НН: 6.6Е11 в переднюю НН: обе, LL:
НН, LL, LH LL: 1Е11 большеберцовую 8 R, LH: R
Геномную ДНК, выделенную из (ТА) мышцу
TA мышцы мыши, амплифицировали в первом раунде
ПЦР-реакции с применением прямого праймера: cttcactgctggccagttta (SEQ ID NO: 95) и обратного праймера: tctttagaaaggcttgaaagctg (SEQ ID NO: 94). Применяли 1-3 мкл продукта ПЦР во втором раунде ПЦР-реакции (2X ПЦР gDNA) с применением прямого праймера - aagttacttgtccaggcatga (SEQ ID NO: 91) и обратного праймера - ttgaacatggcattgcataaA (SEQ ID NO: 96). Продукты этого второго цикла ПЦР характеризовались ожидаемым размером полосы, соответствующей исходной форме, составляющим 1089 нт, и ожидаемым размером полосы, соответствующей форме с делецией, составляющим 323 нт (фактический размер при делеции между сайтами разрезов gRNA отличался от 323 нт вследствие наличия вставок/делеций). На фиг. 4 показаны результаты второго цикла ПЦР. Дорожки L демонстрируют результаты для левой TA мышцы, которую использовали в качестве контроля и в которую вводили солевой раствор. Дорожки R демонстрируют результаты для правой TA мышцы, в которую вводили посредством инъекции 2 вирусных вектора, которые предварительно смешивали в равных количествах. Систему редактирования генов на основе CRISPR/Cas9 также вводили посредством инъекции в хвостовую вену мышей hDMD/mdx путем системной доставки AAV8 (см. фиг. 5). Геномную ДНК, выделенную из печени (фиг. 5 - левая панель) и сердца мыши (фиг. 5 - правая панель), также амплифицировали с применением аналогичного протокола, как для фиг. 4. Ожидаемая полоса, соответствующая размеру примерно 300 нуклеотидов, свидетельствовала о делеции экзона 51.
Получали и отбирали дополнительные gRNA, которые нацеливались на последовательности гена дистрофина человека и макака-резуса или последовательности гена дистрофина человека (см. фиг. 6 и табл. 2). В табл. 2 приведены основная мишень gRNA, распознаваемая геномная нить, последовательность gRNA и последовательность PAM, связанная с gRNA. Геномные последовательности-мишени для gRNA, указанные в геномной плюс-нити, перечислены в табл. 3. Эти gRNA тестировали на культивируемых клетках человека для выявления оптимальной активности gRNA и их комбинаций для получения делеций. Отобранные gRNA также ранжировали по преимуществу на основании предсказанной специфичности в отношении генома человека (фиг. 8) и подвергали скринингу в отношении оптимальных значений длины целевой последовательности, варьирующих от 19 до 23 нуклеотидов (фиг. 10 и 11). На фиг. 6 показаны различные мишени gRNA, перечисленные в табл. 2, которые являются консервативными среди геномов человека и макака-резуса. Расположение каждой gRNA указано по отношению к экзону 51 гена дистрофина человека.
- 47 042798
Таблица 2
Перечень gRNA
gRNA Основная мишень Нить Последовательность gRNA (5' - 3') SEQ ID Последо вательн SEQ ID
NO: ость NO:
РАМ
JCR8 9 Экзон 51 DMD человека (выше) плюс AAAGATATATААТ GT CAT GAAT 1 AAGAGT 53
JCR91 Экзон 51 DMD человека (ниже) плюс GCAGAATСАААТАТААТА GTCT 2 GGGAAT 54
JCR94 Экзон 52 DMD человека (выше) минус AACAAATATCCCTTAGTA ТС 41 AGG 55
JCR99 Экзон 52 DMD человека (ниже) Экзон 51 DMD минус AATGTATTTCTTCTATTC АА 42 TGG 56
JCR159 человека и макака-резуса (выше) Экзон 51 DMD минус AACAATAAGTCAAATTTA ATTG 3 AAGAGT 53
JCR160 человека и макака-резуса (ниже) Экзон 51 DMD минус GAACTGGTGGGAAATGGT CTAG 4 GAGAGT 57
JCR167 человека и макака-резуса (ниже) Экзон 51 DMD минус TCCTTTGGTAAATAAAAG тест 5 GGGAGT 58
JCR166 человека и макака-резуса (ниже) Экзон 51 DMD минус ТAGGAATCAAATGGACTТ GGAT 6 TTGAAT 59
JCR168 человека и макака-резуса (выше) плюс TAATTCTTTCTAGAAAGA GCCT 7 CAGAGT 60
JCR170 Экзон 51 DMD человека и минус CTCTTGCATCTTGCACAT 8 TGGAGT 61
GTCC макака-резуса
- 48 042798 (выше)
Экзон 51 DMD
JCR171 человека и макака-резуса (выше) Экзон 51 DMD минус ACTTAGAGGTCTTCTACA ТАСА 9 ATGAGT 62
JCR156 человека и макака-резуса (выше) Экзон 51 DMD минус TCAGAGGTGAGTGGTGAG GGGA 10 AGGAAT 63
JCR157 человека и макака-резуса (выше) Экзон 51 DMD минус ACACACAGCTGGGTTATC AGAG 11 GAGAGT 57
JCR176 человека и макака-резуса (выше) Экзон 51 DMD минус CACAGCTGGGTTATCAGA G 12 GAGAGT 57
JCR177 человека и макака-резуса (выше) Экзон 51 DMD минус ACACAGCTGGGTTATCAG AG 13 GAGAGT 57
JCR178 человека и макака-резуса (выше) Экзон 51 DMD минус СACACAGCT GGGT ТАТСА GAG 14 GAGAGT 57
JCR179 человека и макака-резуса (выше) Экзон 51 DMD минус AACACACAGCTGGGTТАТ CAGAG 15 GAGAGT 57
JCR180 человека и макака-резуса (ниже) Экзон 51 DMD минус CTGGTGGGAAATGGTCTA G 16 GAGAGT 57
JCR181 человека и макака-резуса (ниже) минус ACTGGTGGGAAATGGTCT AG 17 GAGAGT 57
JCR182 Экзон 51 DMD человека и минус AACTGGTGGGAAATGGTC TAG 18 GAGAGT 57
макака-резуса (ниже) Экзон 51 DMD AGAACTGGTGGGAAATGG
человека и
JCR183 макака-резуса минус TCTAG 19 GAGAGT 57
(ниже)
- 49 042798
Таблица 3
Целевые последовательности gRNA
Название gRNA Целевая последовательность (плюс-нить 5’ - 3’) SEQ ID NO: Комментарии
JCR8 9 AAAGATАТАТААТG Т CAT GAAT 64
JCR91 GCAGAAT САААТАТААТAG Т С Т 65
JCR159 СААТТАААТТТGAGТТАТТGТТ 66 на 101 выше экзона 51
JCR160 С ТAGAC САТ Т Т С С САС СAG Т Т С 67 на 7 8 ниже экзона 51
JCR167 AG GAC ТТТТАТТТАС СAAAG GA 68 на 1534 ниже экзона 51
JCR166 ATCCAAGTCCATTTGATTCCTA 69 на 1266 ниже экзона 51
JCR168 ТААТТСТТТСTAGAAAGAGCСТ 70 на 1824 выше экзона 51
JCR170 GGACATGTGCAAGATGCAAGAG 71 на 2851 выше экзона 51
JCR171 Т G ТAT G ТAGAAGAC СТС ТAAG Т 72 на 2947 выше экзона 51
JCR156 TCCCCTCACCACTCACCTCTGA 73 на 1300 выше экзона 51
JCR157 CTCTGATAACCCAGCTGTGTGT 74 на 1284 выше экзона 51
JCR176 CTCTGATAACCCAGCTGTG 75 JCR157-19 нуклеотидов
JCR177 CTCTGATAACCCAGCTGTGT 76 JCR157-20 нуклеотидов
JCR178 CTCTGATAACCCAGCTGTGTG 77 JCR157-21
нуклеотид
JCR179 CTCTGATAACCCAGCTGTGTGTT 78 JCR157-23 нуклеотида
JCR180 С ТAGAC САТ Т Т С С САС СAG 79 JCR160-19 нуклеотидов
JCR181 С ТAGAC САТ Т Т С С САС СAG Т 80 JCR160-20 нуклеотидов
JCR182 С ТAGAC САТ Т Т С С САС СAG Т Т 81 JCR160-21 нуклеотид
JCR183 С ТAGAC САТ Т Т С С САС СAG Т Т С Т 82 JCR160-23 нуклеотида
Клетки HEK293T человека трансфицировали отдельными кандидатными gRNA, перечисленными в табл. 2. Активность кандидатных gRNA определяли с помощью анализа Surveyor (см. фиг. 7). Что касается JCR160, то размер полосы, соответствующей исходной форме, составлял 483 нт, и применяемые праймеры представляли собой следующие: прямой праймер - cgggcttggacagaacttac (SEQ ID NO: 97) и обратный праймер - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 192 и 291 нт. Что касается JCR157, то размер полосы, соответствующей исходной форме, составлял 631 нт, и применяемые праймеры представляли собой следующие: прямой праймер - gagatgtcttttgcagctttcc (SEQ ID NO: 99) и обратный праймер - gggaccttggtaaagccaca (SEQ ID NO: 100). Ожидаемые размеры полос после разреза составляли 147 и 484 нт.
Специфичность кандидатных gRNA предсказывали с применением программы CasOFFinder (Bae et al. (2014), Bioinformatics, 30: 1473-1475; см. фиг. 8). Кандидатные gRNA оценивали и выбирали на основании нецелевой активности, целевой активности, измеренных с помощью анализа Surveyor, и расстояния от экзона. JCR157 и JCR160 gRNA имели низкий предсказанный уровень нецелевого связыва
- 50 042798 ния, и их применяли для дальнейшего тестирования.
Ими трансфицировали клетки HEK293T, и клетки DMD 6594 подвергали электропорации с применением модифицированной плазмиды pDO240, содержащей JCR157 gRNA, модифицированной плазмиды pDO240, содержащей JCR160 gRNA, и плазмиды, содержащей SaCas9 (pDO242; SEQ ID NO: 83). Предсказанный размер полосы, соответствующей исходной форме, составлял 2451 нт, и предсказанный размер полосы, соответствующей форме с делецией, составлял приблизительно 840-850 нт. На фиг. 9 показана делеция экзона 51, определенная с помощью ПЦР геномной ДНК (примерно 850 нуклеотидов) с применением прямого праймера - tgcctttcaatcattgtttcg (SEQ ID NO: 101) и обратного праймера agaaggcaaattggcacaga (SEQ ID NO: 102). Делеция, созданная между сайтами разрезов gRNA, составляла примерно 1611 нт.
На фиг. 10 показана активность JCR157 gRNA по отношению к мишеням с различными значениями длины (19, 20, 21, 22 и 23 нуклеотида), определенная с помощью анализа Surveyor в клетках HEK293T с применением праймеров и условий ПЦР, применяемых для JCR157 на фиг. 7. На фиг. 11 показана активность JCR160 gRNA по отношению к мишеням с различными значениями длины (19, 20, 21, 22 и 23 нуклеотида), определенная с помощью анализа Surveyor в клетках HEK293T с применением прямого праймера - cgggcttggacagaacttac (SEQ ID NO: 97) и обратного праймера - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). Предсказанный размер полосы, соответствующей исходной форме, составлял 483 нт, и ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 209 и 274 нт.
Комбинации JCR157 и JCR160 gRNA по отношению к мишеням с различными значениями длины (21, 22 или 23 нуклеотида) применяли в клетках HEK293T с применением условий, применяемых на фиг. 9. На фиг. 12 показаны результаты ПЦР геномной ДНК. Комбинация JCR157 и JCR160, каждая из которых содержала мишени из 23 нуклеотидов, обеспечивала почти 50% делецию.
Каждую gRNA, фланкирующую экзон 51 (JCR179 - выше и JCR183 - ниже), использовали отдельно с SaCas9 с применением целевых последовательностей из 23 нт для демонстрации целевой нуклеазной активности в клетках HEK293T (293s) и клетках DMD6594 (DMD6594s) (см. фиг. 13). Что касается JCR179, то размер полосы, соответствующей исходной форме, составлял 594 нт, и применяемые праймеры представляли собой следующие: прямой праймер - tgcctttcaatcattgtttcg (SEQ ID NO: 101) и обратный праймер - aaggccccaaaatgtgaaat (SEQ ID NO: 103). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 594 и 130 нт. Что касается JCR183, то размер полосы, соответствующей исходной форме, составлял 731 нт, и применяемые праймеры представляли собой следующие: прямой праймер - gagtttggctcaaattgttactctt (SEQ ID NO: 104) и обратный праймер - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 440 и 291 нт. На фиг. 13 показана целевая нуклеазная активность с помощью анализа Surveyor in vitro.
Ими трансфицировали клетки HEK293T человека, и миобласты DMD (DMD 6594) подвергали электропорации с применением плазмид, содержащих SaCas9, и JCR179, и JCR183 gRNA (мишени из 23 нт. JCR157 и JCR160; SEQ ID NO: 37 и SEQ ID NO: 38). Клетки DMD 6594 представляли собой иммортализованные миобласты от пациентов с DMD, которые изначально не содержали экзоны 48-50. Предсказанный размер полосы, соответствующей исходной форме, составлял 2451 нт., и предсказанный размер полосы, соответствующей форме с делецией, составлял приблизительно 823 нт. На фиг. 14 показана делеция in vitro экзона 51 в геномной ДНК клеток HEK293T человека (левые панели) и клеток DMD 6594 (правые панели), определенная с помощью ПЦР геномной ДНК с применением прямого праймера tgcctttcaatcattgtttcg (SEQ ID NO: 101) и обратного праймера - agaaggcaaattggcacaga (SEQ ID NO: 102). Делеция, созданная между сайтами разрезов gRNA, составляла примерно 1628 нт. На верхних панелях показано схематическое изображение гена-мишени для нацеливающихся выше и ниже него gRNA в клетках HEK293T и клетках DMD 6594, где фиолетовым цветом указаны нормально процессированные экзоны, и желтым цветом указаны мутантные экзоны. На средних панелях показан результат ПЦР в пределах области генома, подвергнутой делеции, где звездочкой указана делеция. На нижних панелях показаны данные капельной цифровой ПЦР геномной ДНК. В клетках HEK293T gRNA и SaCas9 обеспечивали 16% делецию, при этом в клетках DMD 6594 они обеспечивали редактирование на уровне приблизительно 10%.
Для определения того, транскрибировались ли изменения в геномной ДНК в РНК, выделяли РНК из миобластов DMD, которые котрансфицировали с помощью SaCas9 и обеих gRNA, и обеспечивали их дифференцировку в течение 7 дней (см. фиг. 15). РНК обратно транскрибировали в кДНК, и кДНК подвергали ПЦР-амплификации с применением стандартных способов, известных из уровня техники. На нижней левой панели фиг. 15 показан результат ПЦР-амплификации в пределах от экзона 44 до экзона 52 с применением прямого праймера - tggcggcgttttcattat (SEQ ID NO: 105) и обратного праймера TTCGATCCGTAATGATTGTTCTAGCC (SEQ ID NO: 106). Предсказанный размер полосы, соответствующей исходной форме, составлял 948 нт, и предсказанный размер полосы, соответствующей форме с делецией, составлял приблизительно 715 нт. На фиг. 15 показана полоса, соответствующая форме с делецией, только в случае клеток, обработанных с помощью SaCas9 и обеих gRNA. На нижней правой панели показаны данные ddPCR, демонстрирующие редактирование кДНК на уровне приблизительно 14%.
- 51 042798
Соединение экзона 47 с 52 в кДНК из миобластов от пациентов с DMD секвенировали in vitro (см. фиг. 16). На фиг. 16 последовательность, соответствующая полосам от необработанных клеток (контрольные клетки A48-50), указывает на то, что экзоны 47 и 51 соединялись, как этого и следовало ожидать, тогда как полоса, соответствующая форме с делецией, в обработанных клетках (A48-50+A51) указывала на соединение экзона 47 с 52. Таким образом, отчетливое отсутствие экзона 51 и результат раскрытой системы, осуществляющей нацеливание на уровне геномной ДНК, обеспечивались посредством транскрипции.
Пример 2. Получение мыши A52/mdx.
На фиг. 17 показана схема получения мыши A52/mdx. Из Лейденского университета получали мышь hDMD/mdx, и осуществляли манипуляции с получением релевантной модели DMD, в которой удален экзон 52, при этом данная делеция приводила к сдвигу рамки считывания и характерному для DMD генотипу. Мышь hDMD/mdx содержала полноразмерный человеческий ген дистрофина дикого типа на хромосоме 5 в окружении mdx, вследствие чего дистрофин мыши не экспрессировался.
Для получения релевантной модели DMD применяли систему редактирования CRISPR/Cas9 на основе SpCas9 и gRNA для нацеливания и обеспечения делеции экзона 52 в гене дистрофина человека. Различные gRNA, осуществляющие нацеливание выше и ниже экзона 52, тестировали и проверяли их соответствие с применением анализа Surveyor (см. фиг. 18). Для gRNA, осуществляющих нацеливание выше, применяли прямой праймер - ctccggaatgtctccatttg (SEQ ID NO: 87) и обратный праймер TTGTGTGTCCCATGCTTGTT (SEQ ID NO: 107), и при этом размер полосы, соответствующей исходной форме, составлял 402 нт. Что касается JCR94 (AACAAATATCCCTTAGTATC (SEQ ID NO: 41)), то ожидаемые размеры форм, полученных после разреза, составляли 243 и 159 нт. Для gRNA, осуществляющих нацеливание ниже, применяли прямой праймер - CAACGCTGAAGAACCCTGAT (SEQ ID NO: 108) и обратный - atgagggagagactggcatc (SEQ ID NO: 88), и при этом размер полосы, соответствующей исходной форме, составлял 509 нт. Что касается JCR99 (AATGTATTTCTTCTATTCAA (SEQ ID NO: 42)), то ожидаемые размеры форм, полученных после разреза, составляли 346 и 163 нт пары gRNA тестировали и проверяли их соответствие путем выявления делеции экзона 51 в геномной ДНК из клеток HEK293T, в том числе JCR94 и JCR99, с применением прямого праймера - ctccggaatgtctccatttg (SEQ ID NO: 87) и обратного праймера - atgagggagagactggcatc (SEQ ID NO: 88) (см. фиг. 19). Размер полосы, соответствующей исходной форме, составлял 718 нт, размер полосы, соответствующей форме с делецией, составлял 392 нт, при этом делеция между gRNA составляла 326 нт пару JCR94 и JCR99 применяли в системе редактирования генома для получения мыши A52/mdx. В частности, мышь создавали путем введения посредством инъекции mRNA JCR94 gRNA, JCR99 gRNA и SaCas9 в эмбрионы мышей.
На фиг. 20 показан протокол осуществления микроинъекции ДНК, который включает использование услуги по рекомбинационной инженерии BAC. День 1: жеребых кобыл внутрибрюшинно обрабатывали гонадотропином сыворотки крови жеребой кобылы для индукции овуляции. День 3: жеребых кобыл внутрибрюшинно обрабатывали хорионическим гонадотропином человека. В 1-м цикле получали 471 эмбрион, однако наблюдали только 5 пробок. Использовали 150 эмбрионов, созданных оплодотворением (от 14 самок, подвергнутых суперовуляции). Инъекции в пронуклеус осуществляли с применением менее чем 50 нг Cas9 и 20 нг каждой направляющей. На фиг. 21 показан протокол скрещивания мышей для получения трансгенных мышей.
Мышей-основателей генотипировали с применением следующего протокола генотипирования. Геномную ДНК (gDNA) экстрагировали из срезанных частей хвоста мышей с применением набора для выделения ДНК из крови и тканей DNEasy (Qiagen). Для генотипирования каждого детеныша gDNA амплифицировали с применением набора AccuPrime HiFi Taq в соответствии с нижеследующим:
i) 100 нг дДНК;
ii) 2,5 мкл буфера II из набора AccuPrime;
iii) 0,1 мкл HiFi Taq из набора AccuPrime;
iv) 1 мкл JRH261 (ctccggaatgtctccatttg (SEQ ID NO: 87)) (10 мкМ);
v) 1 мкл JRH264 (atgagggagagactggcatc (SEQ ID NO: 88)) (10 мкМ); и vi) вода до общего объема 25 мкл.
Реакции осуществляли на термоциклере в соответствии с нижеследующим:
i) 95° в течение 4 минут;
ii) 95° в течение 30 с;
iii) 52° в течение 30 с;
iv) 68° в течение 1:00 мин;
v) циклическое повторение стадий ii)-iv) 35 раз, при этом постоянно при 4°.
Продукты ПЦР-реакций разделяли на геле (фиг. 22). Ожидаемые размеры полос составляли 718 нт в случае отсутствия делеции (т.е. экзон 52 по-прежнему присутствовал) и примерно 392 нт в случае делеции экзона 52. Как показано на фиг. 22, у мышей-основателей 7, 63 и 76 имелась делеция экзона 52.
Полосы амплифицированных продуктов секвенировали с применением праймера для JRH264 (см. фиг. 23) для определения последовательностей воссоединенных концов областей, подвергнутых на
- 52 042798 целиванию. На фиг. 23 показана секвенированная область, где буквы, выделенные жирным шрифтом, подчеркиванием и обычным начертанием, обозначают нативные последовательности, и буквы, выделенные курсивом, обозначают вставки или делеции. В ожидаемой последовательности (дельта 52) буквы, выделенные жирным шрифтом, связаны с буквами, выделенными подчеркиванием. В последовательностях от мышей-основателей в этой области находились вставки (буквы, выделенные курсивом) и делеции (дефисы).
Самцов мышей-основателей спаривали с самками mdx/mdx для селекции химерных организмов (фиг. 24). Представители потомства, полученные от самцов мышей-основателей 76 или самцов мышейоснователей 63 и самок mdx/mdx, подвергали скринингу и генотипированию в отношении делеции экзона 52 с применением условий, используемых на фиг. 22 (фиг. 25 и 26 соответственно). Если экзон 52 был подвергнут делеции, то ожидаемый размер полосы составлял приблизительно 392 нт. Если присутствовал экзон 52, то ожидаемый размер полосы составлял приблизительно 718 нт. У детенышей 54497 и 54498 (от пары скрещивания: самец мыши-основателя 63+самка mdx/mdx) имелась делеция экзона 52, и в отношении нее осуществляли секвенирование (фиг. 27). Детеныши 54497 и 54498 характеризовались 92,86% идентичностью друг с другом согласно прочтению секвенирования размером 392 п.о., при этом вставки/делеции были идентичными.
Уровень экспрессии дистрофина у здоровой мыши hDMD/mdx и мыши A52/mdx сравнивали по результатам флуоресцентной иммуногистохимии. Как показано на фиг. 28, у детенышей 54497 и 54498 от мышей A52/mdx отсутствовал белок дистрофин. В случае окрашивания сердца выдержка для зонда ламинина составляла 100 мс, тогда как выдержка для дистрофина составляла 900 мс. В случае образца TA мышцы выдержка для зонда ламинина и дистрофина составляла 2,0 с. См. также фиг. 29, на которой показано, что у мыши A52/mdx отсутствовал белок дистрофин. Экспрессия дистрофина утрачивалась как в сердце, так и TA мышце мыши A52/mdx. В TA мышце наблюдали несколько самопроизвольно образованных ревертантных волокон (случайные события сплайсинга или соматические мутации), однако это согласовывалось с мышиной моделью mdx. Результаты вестерн-блоттинга также указывали на то, что у мыши A52/mdx отсутствовал белок дистрофин, что согласовывалось с характерным для DMD генотипом, тогда как у здоровой мыши hDMD/mdx дистрофин экспрессировался. См. фиг. 30.
Мышь A52/mdx демонстрировала уровни активности, аналогичные мышам mdx, после первых пяти минут теста открытого поля. В тесте открытого поля мышам давали возможность свободно изучить арену открытого поля (20x20x30 см) в течение 30 мин. Активность и положение животного автоматически контролировали с помощью инфракрасных диодов (по осям x, y и z), сопряженных с запущенным на компьютере программным обеспечением Fusion для анализа активности (версия 5.3, Omnitech, Колумбус, Огайо). На фиг. 31 показана общая активность мыши A52/mdx по сравнению с мышами mdx и мышами hDMD/mdx, указанная на основании двигательной активности и осмотра. Пройденное расстояние и вертикальные активности в виде стойки показаны соответственно на левой и правой панелях.
Пример 3. Восстановление экспрессии дистрофина путем удаления экзона 51.
Посредством удаления экзона 51 у мыши A52/mdx можно создать генотип, подобный таковому для мышечной дистрофии Беккера (BMD), и в теории восстановить экспрессию дистрофина. Мышь A52/mdx использовали для демонстрации восстановления экспрессии дистрофина путем удаления экзона 51 с применением раскрытой системы редактирования генов на основе CRISPR/Cas9. На фиг. 32 показана стратегия коррекций с применением SaCas9 и gRNA для пропуска экзона 51 с помощью нацеливания gRNA выше и ниже экзона 51 в интронной области.
Стандарт: плазмиды, содержащие JCR179 (выше) или JCR183 gRNA (ниже) (SEQ ID NO: 37 и SEQ ID NO: 38 соответственно) и SaCas9, электропорировали в миобласты от пациентов с DMD. Белок выделяли из дифференцированных клеток и анализировали с помощью вестерн-блоттинга с применением антитела к дистрофину. На фиг. 33 показано, что геномная ДНК может быть отредактирована с восстановлением экспрессии белка дистрофина, так как клетки, обработанные с помощью всех 3 компонентов (т.е. обеих gRNA и SaCas9), демонстрировали экспрессию дистрофина.
Затем систему тестировали на мыши A52/mdx. На фиг. 34 показана схема эксперимента по обработке мыши A52/mdx с применением системы на основе gRNA и SaCas9, в том числе схематические изображения 2 вирусных векторов, применяемых в схеме эксперимента. Конструкции на основе рекомбинантного вируса AAV8 создавали с применением векторов PT366-179 (SEQ ID NO: 39) и PT366-183 (SEQ ID NO: 40) и способов получения вирусных частиц, известных из уровня техники. Эти вирусные векторы (AAV8) совместно доставляли in vivo в виде двух вирусных частиц. Каждая вирусная частица содержала SaCas9 и одну из gRNA (см. фиг. 3). Мышей A52/mdx обрабатывали с помощью конструкций на основе рекомбинантного вируса AAV8 в количестве 5E11. Вирус вводили посредством внутримышечной инъекции в правую TA мышцу, при этом левая TA мышца служила в качестве контралатерального контроля, и в нее вводили посредством инъекции PBS. После обработки удаляли как левую, так и правую TA мышцы, и из каждой получали срезы для анализов геномной ДНК. Как показано на фиг. 35, ПЦР осуществляли в пределах представляющей интерес области, и полосы, соответствующие форме с делецией, отмечали в случае обработанной правой TA мышцы на приведенном слева геле, что указывает
- 53 042798 на некоторый уровень редактирования генов. Полосу, соответствующую форме с делецией, секвенировали, и основной продукт представлял собой ожидаемый продукт лигирования 3 пар оснований от PAM каждой gRNA. На фиг. 35 показана делеция экзона 51 in vivo в правой TA мышце.
Аналогично анализировали срезы обработанной правой TA мышцы и контрольной левой TA мышцы для определения того, обеспечивалось ли редактирование посредством РНК. ПЦР осуществляли в пределах экзонов 50-53 в кДНК. Как показано на приведенном справа геле на фиг. 36, в двух из обработанных образцов наблюдалось отсутствие экзона 51 и 52. Полосу, соответствующую форме с делецией, секвенировали, при этом основной продукт представлял собой продукт лигирования экзона 50 с 53, как этого и следовало ожидать с учетом того, что у мыши уже отсутствовал экзон 52, и система редактирования генов на основе CRISPR/Cas9 удаляла экзон 51 (см. хроматограмму результатов секвенирования внизу справа). На фиг. 36 показана делеция экзона 51 in vivo в правой TA мышце.
На фиг. 37 показано иллюстративное флуоресцентное иммуногистохимическое окрашивание, указывающее на присутствие небольшого количества дистрофина в контрольной левой TA мышце, в которую вводили посредством инъекции PBS, у мыши A52/mdx. Причинами некоторой степени зеленого окрашивания на дистрофин в контрольной левой TA могут являться ревертантные волокна или погибшие клетки, которые иногда также окрашиваются в зеленый цвет. Наблюдали четкое повышение степени зеленого окрашивания на дистрофин в обработанной правой TA мышце, как показано на правой фотографии. На фиг. 37 показано восстановление белка дистрофина in vivo в обработанной TA мышце.
Белок экстрагировали из левой и правой TA мышц от 3 тестируемых мышей, при этом осуществляли вестерн-блот-анализ. На фиг. 38 показано восстановление белка дистрофина in vivo в обработанной TA мышце. В контрольных левых TA мышцах не наблюдали экспрессию белка, тогда как все три правые TA мышцы демонстрировали различные уровни экспрессии белка дистрофина. Экспрессия белка в правой TA мыши 1 была наиболее сильной, тогда как у мышей 2 и 3 она была слабой, но тем не менее проявлялась в виде полос. Раскрытая система редактирования генов на основе CRISPR/Cas9 функционировала in vivo с восстановлением экспрессии белка дистрофина до некоторой степени у мыши A52/mdx.
Физиологическое тестирование мышей. Мышей, подлежащих обработке (все самцы hDMDΔ52(гетеро)/mdx(геми) мышей), обрабатывали с помощью конструкций на основе рекомбинантного вируса AAV8 (n=10) или AAV9 (n=10), содержащего SaCas9 и gRNA, и проводили сравнение с необработанными мышами (hDMD-Δ52/mdx) (n=10). Конструкции на основе рекомбинантного вируса AAV создавали с применением векторов PT366-179 (SEQ ID NO: 39) и PT366-183 (SEQ ID NO: 40) и с применением известных из уровня техники способов. Мышам, подлежащим обработке, вводили посредством инъекции 200 мкл вируса в хвостовую вену в возрасте 6-8 недель. Тестирование мышей осуществляли спустя 8 недель.
Тест открытого поля с определением расстояния. Мышам давали возможность свободно изучить арену открытого поля в течение 30 мин. Активность и положение животных автоматически контролировали с помощью инфракрасных диодов, совместимых с запущенным на компьютере программным обеспечением Fusion для анализа активности. Данные собирали непрерывно и группировали за 5-минутные промежутки времени. На фиг. 39 показано среднее значение всех моментов времени для общего пройденного расстояния у 16-недельных мышей, которых обрабатывали в возрасте 8 недель, по сравнению с 16-недельными мышами, которых не обрабатывали. Среднее значение всех моментов времени для общего числа поз со стоянием на задних лапах спустя 16 недель показаны на фиг. 40. Статистическими методами являлись следующие: однофакторный ANOVA, сравнение среднего значения каждого столбца со средним значением для необработанного контроля и апостериорный анализ с помощью критерия Даннета (среднее значение +/-SEM). Мыши, которых обрабатывали с помощью AAV8 и AAV9, демонстрировали статистически значимый результат в виде большего пройденного расстояния, чем необработанные мыши соответствующей возрастной группы (статистическая значимость). Все обработанные мыши демонстрировали статистически значимый результат в виде большего числа поз со стоянием на задних лапах по сравнению с необработанным контролем соответствующей возрастной группы.
Сила хватки. Силу хватки тестировали у 16-недельных необработанных и обработанных мышей. Мыши проходили 3-5 испытаний, каждое из которых предназначалось для тестирования силы хватки передних и задних лап. Средние результаты испытаний показаны на фиг. 41. Силу хватки отмечали в виде грамм-силы. Как показано на фиг. 41, мыши, которых обрабатывали с помощью AAV9, демонстрировали статистически значимый результат в виде повышенного значения силы хватки передними лапами по сравнению с необработанными мышами соответствующей возрастной группы. Статистическими методами были следующие: двухфакторный ANOVA, апостериорный анализ с помощью критерия Тьюки.
кДНК ПЦР. Ткани из образцов сердца мышей подвергали обработке с применением универсального мини-набора RNEasy Plus (Qiagen). Полученную РНК обратно транскрибировали в кДНК с применением набора для синтеза кДНК Superscript VILO. 1 мкл кДНК подвергали ПЦР-амплификации с применением ДНК-полимеразы из набора AccuPrime и праймеров к экзону 48 (прямой праймер: gtttccagagctttacctgagaa (SEQ ID NO: 89)) и экзону 54 (обратный праймер: CTTTTATGAATGCTTCTCCAAG (SEQ ID NO: 90)). Ожидаемые размеры полос составляли 997 нт в случае отсутствия делеции (т.е. экзон 52 по-прежнему
- 54 042798 присутствовал) и примерно 764 нт в случае делеции экзона 52. На фиг. 42 показаны результаты для мышей P2, которым вводили посредством инъекции в лицевую вену AAV9 (JA10 (P2 AAV9)) в возрасте 36-50 часов с момента рождения, и для взрослых мышей, которым вводили посредством инъекции в хвостовую вену AAV8 (JA11 (TV AAV8)) в количестве 3,3-7,7E12 или AAV9 (JA12 (TV AAV9)) в количестве 4,3-7,5E12. Как показано на фиг. 42, редактирование происходило в различной степени у мышей P2 (мыши возрастом 48-54 часов с момента рождения), которых обрабатывали с помощью AAV9, и взрослых мышей, которых обрабатывали с помощью AAV8 и AAV9, что дополнительно подтверждалось путем секвенирования полосы, соответствующей форме с делецией, с применением праймера tttctgtgattttcttttggattg (SEQ ID NO: 109), связывающегося с экзоном 53. На фиг. 43 показана иллюстративная хроматограмма, на которой показана делеция экзонов 51 и 52 в последовательности из полосы, соответствующей форме с делецией, от мыши 1, обработанной с помощью Ja10.
Подразумевается, что вышеприведенное подробное описание и сопровождающие примеры являются лишь иллюстративными и не должны рассматриваться в качестве ограничений объема настоящего изобретения, который определяется исключительно прилагаемой формулой изобретения и ее эквивалентами.
Различные изменения и модификации раскрытых вариантов осуществления будут очевидны для специалистов в данной области техники. Такие изменения и модификации, в том числе без ограничения те, которые связаны с химическими структурами, заместителями, производными, промежуточными соединениями, синтезами, композициями, составами или способами применения настоящего изобретения, могут быть сделаны без отхода от его сути и объема.
В целях обеспечения полноты, различные аспекты настоящего изобретения изложены в следующих пронумерованных пунктах.
1. Направляющая РНК (gRNA), содержащая нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность.
2. Композиция для нацеливания на ДНК, содержащая первую gRNA и вторую gRNA, при этом первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность, где первая молекула gRNA и вторая молекула gRNA содержат разные нацеливающие домены.
3. Композиция для нацеливания на ДНК по п.2, где первая молекула gRNA представлена под SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 или SEQ ID NO: 41, и вторая молекула gRNA представлена под SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 или SEQ ID NO: 42.
4. Композиция для нацеливания на ДНК по п.2 или 3, где первая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 и SEQ ID NO: 15, и вторая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.
5. Композиция для нацеливания на ДНК по любому из пп.2-4, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
- 55 042798 (vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15;
(xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 42.
6. Композиция для нацеливания на ДНК по любому из пп.2-5, дополнительно содержащая белок (Cas), ассоциированный с короткими палиндромными повторами, регулярно расположенными группами.
7. Композиция для нацеливания на ДНК по п.6, где белок Cas предусматривает молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
8. Композиция для нацеливания на ДНК по п.6 или 7, где белок Cas предусматривает молекулу Cas9 из Staphylococcus aureus, содержащую аминокислотную последовательность под SEQ ID NO: 45.
9. Композиция для нацеливания на ДНК по любому из пп.2-8, где композиция для нацеливания на ДНК содержит нуклеотидную последовательность под SEQ ID NO: 83, нуклеотидную последовательность под SEQ ID NO: 84, нуклеотидную последовательность под SEQ ID NO: 37 и/или нуклеотидную последовательность под SEQ ID NO: 38.
10. Выделенный полинуклеотид, содержащий молекулу gRNA по п.1 или композицию для нацеливания на ДНК по любому из пп.2-9.
11. Вектор, содержащий gRNA по п.1, композицию для нацеливания на ДНК по любому из пп.2-9 или выделенный полинуклеотид по п.10.
12. Вектор, содержащий композицию для нацеливания на ДНК по любому из пп.6-9.
13. Вектор, кодирующий (a) первую молекулу направляющей РНК (gRNA);
(b) вторую молекулу gRNA; и (c) по меньшей мере одну молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность, где первая молекула gRNA и вторая молекула gRNA содержат разные нацеливающие домены.
14. Вектор по п.13, где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов в первом и втором интронах, фланкирующих экзон 51 гена DMD человека.
15. Вектор по п.13 или 14, где первая молекула gRNA представлена под SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 или SEQ ID NO: 41, и вторая молекула gRNA представлена под SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 или SEQ ID NO: 42.
16. Вектор по любому из пп.13-15, где первая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 и SEQ ID NO: 15, и вторая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.
17. Вектор по любому из пп.13-16, при этом первая молекула gRNA и вторая молекула gRNA вы
- 56 042798 браны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15; и (xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18.
18. Вектор по любому из пп.11-17, где вектор представляет собой вирусный вектор.
19. Вектор по п.18, где вектор представляет собой вектор на основе аденоассоциированного вируса (AAV).
20. Вектор по п.19, где вектор на основе AAV представляет собой вектор на основе AAV8 или вектор на основе AAV9.
21. Вектор по любому из пп.11-20, где вектор содержит тканеспецифичный промотор, функционально связанный с нуклеотидной последовательностью, кодирующей первую молекулу gRNA, вторую молекулу gRNA и/или молекулу Cas9.
22. Вектор по п.21, где тканеспецифичный промотор представляет собой промотор, специфичный в отношении мышц.
23. Клетка, содержащая gRNA по п.1, композицию для нацеливания на ДНК по любому из пп.2-9, выделенный полинуклеотид по п.10 или вектор по любому из пп.11-22.
24. Набор, содержащий gRNA по п.1, систему для нацеливания на ДНК по любому из пп.2-9, выделенный полинуклеотид по п.10, вектор по любому из пп.11-22 или клетку по п.23 и необязательно инструкции по применению.
25. Способ коррекции мутантного гена дистрофина в клетке, при этом способ предусматривает введение в клетку gRNA по п.1, системы для нацеливания на ДНК по любому из пп.2-9, выделенного полинуклеотида по п.10 или вектора по любому из пп.11-22.
26. Способ редактирования мутантного гена дистрофина в геноме субъекта, при этом способ предусматривает введение субъекту композиции для редактирования генома, содержащей gRNA по п.1, системы для нацеливания на ДНК по любому из пп.2-9, выделенного полинуклеотида по п.10, вектора по любому из пп. 11-22 или клетки по п.23.
27. Способ по п.26, где композицию для редактирования генома вводят субъекту внутримышечно, внутривенно или с помощью их комбинации.
28. Способ по любому из пп.25-27, где коррекция мутантного гена дистрофина предусматривает опосредованное нуклеазой негомологичное соединение концов.
29. Способ лечения субъекта, нуждающегося в этом, у которого имеется мутантный ген дистрофина,
- 57 042798 при этом способ предусматривает введение субъекту gRNA по п.1, системы для нацеливания на ДНК по любому из пп.2-9, выделенного полинуклеотида по п.10, вектора по любому из пп.11-22 или клетки по п.23.
30. Модифицированный вектор на основе аденоассоциированного вируса для редактирования мутантного гена дистрофина в геноме субъекта, содержащий первую полинуклеотидную последовательность, кодирующую gRNA по п.1, и вторую полинуклеотидную последовательность, кодирующую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
31. Модифицированный вектор на основе аденоассоциированного вируса по п.30, где модифицированный вектор на основе аденоассоциированного вируса содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 39 или SEQ ID NO: 40.
32. Композиция для обеспечения делеции сегмента гена дистрофина, содержащего экзон 51, при этом композиция содержит (a) первый вектор, содержащий полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второй вектор, содержащий полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где каждая из первой и второй молекул gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, и где первый вектор и второй вектор сконструированы с возможностью образования первого и второго двухнитевых разрывов в первом интроне и втором интроне, фланкирующих соответственно экзон 51 гена DMD человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.
33. Композиция по п.32, где длина сегмента составляет от приблизительно 50 п.о. до приблизительно 2000 п.о.
34. Композиция по п.33, где длина сегмента составляет приблизительно 118 п.о., приблизительно 233 п.о., приблизительно 326 п.о., приблизительно 766 п.о., приблизительно 805 п.о. или приблизительно 1611 п.о.
35. Композиция по любому из пп.32-34, где первая молекула Cas9 и вторая молекула Cas9 являются идентичными.
36. Композиция по п.35, где первая молекула Cas9 и вторая молекула Cas9 представляют собой молекулу Cas9 из Staphylococcus aureus.
37. Композиция по п.36, где первая молекула Cas9 и вторая молекула Cas9 представляют собой мутантную молекулу Cas9 из Staphylococcus aureus.
38. Композиция по любому из пп.32-34, где первая молекула Cas9 и вторая молекула Cas9 являются разными.
39. Композиция по п.38, где первая молекула Cas9 или вторая молекула Cas9 представляют собой молекулу Cas9 из Staphylococcus aureus.
40. Композиция по любому из пп.32-39, где первая молекула Cas9 и/или вторая молекула Cas9 предусматривают молекулу SaCas9, содержащую аминокислотную последовательность под SEQ ID NO: 45.
41. Композиция по любому из пп.32-40, где первый вектор и/или второй вектор представляют собой вирусный вектор.
42. Композиция по п.41, где первый вектор и/или второй вектор представляют собой вектор на основе аденоассоциированного вируса (AAV).
43. Композиция по п.42, где вектор на основе AAV представляет собой вектор на основе AAV8 или вектор на основе AAV9.
44. Композиция по любому из пп.32-43, где ген дистрофина представляет собой ген дистрофина человека.
45. Композиция по любому из пп.32-44, где первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, или комплементарную ей последовательность, где первая молекула gRNA и вторая молекула gRNA содержат разные нацеливающие домены.
46. Композиция по любому из пп.32-45, где первая молекула gRNA представлена под SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 или SEQ ID NO: 15, и вторая молекула
- 58 042798 gRNA представлена под SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 или SEQ ID NO: 19.
47. Композиция по любому из пп.32-46, где первая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 и SEQ ID NO: 15, и вторая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.
48. Композиция по любому из пп.32-47, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15; и (xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18.
49. Композиция по любому из пп.32-48, где первый вектор содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 39, и второй вектор содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 40.
50. Композиция по любому из пп.32-49 для применения в составе лекарственного препарата.
51. Композиция по любому из пп.32-50 для применения в лечении мышечной дистрофии Дюшенна.
52. Клетка, содержащая композицию по любому из пп.32-51.
53. Способ коррекции мутантного гена дистрофина в клетке, предусматривающий введение в клетку (a) первого вектора, содержащего полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второго вектора, содержащего полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где каждая из первой молекулы gRNA и второй молекулы gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, и где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.
- 59 042798
54. Способ по п.53, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15; и (xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18.
55. Способ по п.53 или 54, где мутантный ген дистрофина содержит преждевременный стоп-кодон, смещенную рамку считывания, аберрантный акцепторный сайт сплайсинга или аберрантный донорный сайт сплайсинга.
56. Способ по любому из пп.53-55, где мутантный ген дистрофина содержит мутацию со сдвигом рамки считывания, которая является причиной преждевременного стоп-кодона и усеченного продукта гена.
57. Способ по любому из пп.53-55, где мутантный ген дистрофина характеризуется делецией одного или нескольких экзонов, которая обеспечивает смещение рамки считывания.
58. Способ по любому из пп.53-57, где коррекция мутантного гена дистрофина предусматривает делецию преждевременного стоп-кодона, коррекцию смещенной рамки считывания или модуляцию сплайсинга путем смещения акцепторного сайта сплайсинга или смещения донорной последовательности сплайсинга.
59. Способ по любому из пп.53-58, где коррекция мутантного гена дистрофина предусматривает делецию экзона 51.
60. Способ по любому из пп.53-59, где коррекция мутантного гена дистрофина предусматривает репарацию с участием гомологичной рекомбинации.
61. Способ по п.60, дополнительно предусматривающий введение в клетку донорной ДНК.
62. Способ по любому из пп.53-61, где коррекция мутантного гена дистрофина предусматривает опосредованное нуклеазой негомологичное соединение концов.
63. Способ по любому из пп.53-62, где клетка представляет собой клетку-миобласт.
64. Способ по любому из пп.53-63, где клетка представляет собой клетку субъекта, страдающего мышечной дистрофией Дюшенна.
65. Способ по любому из пп.53-64, где клетка представляет собой миобласт субъекта-человека, страдающего мышечной дистрофией Дюшенна.
66. Способ по любому из пп.53-65, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из
- 60 042798 (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4; и (iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19.
67. Способ лечения субъекта, нуждающегося в этом, у которого имеется мутантный ген дистрофина, при этом способ предусматривает введение субъекту (a) первого вектора, содержащего полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второго вектора, содержащего полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где каждая из первой молекулы gRNA и второй молекулы gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, и где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.
68. Способ по п.67, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;
(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15; и (xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18.
69. Способ по п.68, где субъект страдает мышечной дистрофией Дюшенна.
70. Способ по любому из пп.67-69, где первый вектор и второй вектор вводят в мышцу субъекта.
- 61 042798
71. Способ по п.70, где мышца представляет собой скелетную мышцу или сердечную мышцу.
72. Способ по п.71, где скелетная мышца представляет собой переднюю большеберцовую мышцу.
73. Способ по любому из пп.67-72, где первый вектор и второй вектор вводят субъекту внутримышечно, внутривенно или с помощью их комбинации.
74. Способ получения трансгенного эмбриона грызуна, у которого имеется ген дистрофина человека (hDMD) с делецией экзона 52 (Δ52), при этом способ предусматривает введение в эмбрион грызуна gRNA по п.1, системы для нацеливания на ДНК по любому из пп.2-9, выделенного полинуклеотида по пункту 10, вектора по любому из пп.11-22, модифицированного вектора на основе аденоассоциированного вируса по п.30 или 31 или композиции по любому из пп.32-51, за счет чего обеспечивается делеция экзона 52 в гене дистрофина человека, и осуществления отбора трансгенного эмбриона грызуна, у которого имеется делеция экзона 52 в гене дистрофина человека, где эмбрион грызуна содержит нормальный ген дистрофина человека.
75. Способ по п.74, где эмбрион грызуна представляет собой эмбрион мыши.
76. Способ по п.74 или 75, где трансгенный эмбрион грызуна является гетерозиготным по hDMD или гетерозиготным по hDMD-A52.
77. Способ по любому из пп.74-76, где первую молекулу gRNA, содержащую нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 41, и вторую молекулу gRNA, содержащую нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 42, вводят в эмбрион грызуна для осуществления делеции экзона 52 гена дистрофина человека.
78. Способ по любому из пп.74-77, дополнительно предусматривающий введение в эмбрион грызуна белка Cas, содержащего аминокислотную последовательность, изложенную под SEQ ID NO: 27.
79. Трансгенный эмбрион грызуна, полученный с помощью способа по любому из пп.74-78.
80. Трансгенный грызун, полученный из трансгенного эмбриона грызуна по п.79.
Приложение pDO240 с JCR179 (SEQ ID NO: 37) (gRNA выделена жирным шрифтом) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccaagcttgcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaat acgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgg actatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaa aggacgaaacaccAACACACAGCTGGGTTATCAGAGgttttagtactctggaaacagaatctac taaaacaaggcaaaatgccgtgtttatctcgtcaacttgttggcgagatttttttgcggccgcc cgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatg gtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccgga agcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgct cactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgc ggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcg gtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaat caggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaa ggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgc tcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagct ccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttc gggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgc
- 62 042798 tccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaact atcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacag gattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggc tacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagag ttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagca gcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgac gctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttca cctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttg gtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttca tccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggcc ccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaacca gccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctatt aattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgcca ttgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttccca acgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcct ccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcata attctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtc attctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataatacc gcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactct caaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttc agcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaa aagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaa gcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaaca aataggggttccgcgcacatttccccgaaaagtgccac pDO240 c JCR183 (SEQ ID NO: 38) (gRNA выделена жирным шрифтом) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccaagcttgcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaat acgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgg actatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaa aggacgaaacaccAGAACTGGTGGGAAATGGTCTAGgttttagtactctggaaacagaatctac taaaacaaggcaaaatgccgtgtttatctcgtcaacttgttggcgagatttttttgcggccgcc
- 63 042798 cgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatg gtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccgga agcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgct cactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgc ggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcg gtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaat caggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaa ggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgc tcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagct ccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttc gggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgc tccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaact atcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacag gattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggc tacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagag ttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagca gcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgac gctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttca cctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttg gtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttca tccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggcc ccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaacca gccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctatt aattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgcca ttgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttccca acgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcct ccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcata attctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtc attctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataatacc gcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactct caaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttc agcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaa aagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaa gcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaaca aataggggttccgcgcacatttccccgaaaagtgccac
PT366 c JCR179 - PT366AAV 179 (SEQ ID NO: 39) -плазмида для
- 64 042798
AAV, применяемая для работы in vivo (gRNA выделена жирным шрифтом; SaCas9 выделена верхним регистром; NLS выделена нижним регистром, жирным шрифтом и подчеркиванием) cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtc gcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttc ctgcggcctctagactcgaggcgttgacattgattattgactagttattaatagtaatcaatta cggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggccc gcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagta acgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttgg cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcc cgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgta ttagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggt ttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcacca aaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtagg cgtgtacggtgggaggtctatataagcagagctctctggctaactaccggtgccaccatggccc caaagaagaagcggaaggtcggtatccacggagtcccagcagccAAGCGGAACTACATCCTGGG CCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGACGTGATC GATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGGAGCAAGA GAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGCTGCTGTT CGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGCCAGAGTG AAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTGGCCAAGA GAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCACCAAAGA GCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCTGGAACGG CTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTACGTGAAAG AAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCATCGACAC CTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAGCCCCTTC GGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTCCCCGAGG AACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACCTGAACAA TCTCGTGAT САС CAG G GAC GAGAAC GAGAAG С T G GAATAT TAG GAGAAG T T С CAGAT CATC GAG AAC G T G T T CAAG CAGAAGAAGAAG С С СAC С С T GAAG CAGAT C G С CAAAGAAAT С С T C G T GAAC G AAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACCTGAAGGT GTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCTGCTGGAT CAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTGACCAATC TGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATACCGGCAC CCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAACGACAAC CAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAGCAGAAAG
- 65 042798
AGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCTTCATCCA GAG CAT CAAAG T GAT GAAC G C CAT CAT CAAGAAGTACGGCCTGCCGAACGAGAT CAT TAT C GAG CTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAGCGGAACC GGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCAAGTACCT GATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGAAGCCATC CCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCCAGAAGCG TGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCAAGAAGGG CAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAACCTTCAAG AAGCACATCCTGAATСTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAGTATСTGC TGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACCTGGTGGA TACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAACAACCTG GACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGGAAGTTTA AGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCAACGCCGA T T T CAT С T T CAAAGAGT GGAAGAAAC T GGACAAGGCCAAAAAAGT GAT GGAAAACCAGATG T T C GAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAGATCTTCA TCACCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACCGGGTGGA CAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGACAAGGGC AACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACΑΆΤGACAAGCTGAAAAAGC T GAT CAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC CAGAAAC T GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGAGGAAACC GGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATTAAGTATT ACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAAACAAGGT CGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTACAAGTTC G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAAT AG GAAG T G С T ATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCTTCTACAA CAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGACCTGCTG AAC C G GAT C GAAG T GAACATGAT CGACAT СACС TACCGCGAGTACС T GGAAAAGATGAACGAGA AGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGTACAGCAC AGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCCTCAGATCATCAAAAAGGGC aaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaaaaqqgatcctacccatacg atgttccagattacgcttacccatacgatgttccagattacgcttacccatacgatgttccaga ttacgcttaagaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccat ctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttc ctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggg gtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctggggaggtaccga gggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataatt
- 66 042798 ggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataat ttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaac ttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgAACACACA GCTGGGTTATCAGAGgttttagtactctggaaacagaatctactaaaacaaggcaaaatgccgt gtttatctcgtcaacttgttggcgagatttttgcggccgcaggaacccctagtgatggagttgg ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgccc gggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggggcgcctgatg cggtattttctccttacgcatctgtgcggtatttcacaccgcatacgtcaaagcaaccatagta cgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctaca cttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccg gctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggca cctcgaccccaaaaaacttgatttgggtgatggttcacgtagtgggccatcgccctgatagacg gtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaa caacactcaaccctatctcgggctattcttttgatttataagggattttgccgatttcggccta ttggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgttt acaattttatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgac acccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagaca agctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcg agacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttctt agacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaat acattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaa aggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgcc ttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgc acgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaa gaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattg acgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactc accagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccata accatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaa ccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaa tgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgc aaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggagg cggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataa atctggagccggtgagcgtggaagccgcggtatcattgcagcactggggccagatggtaagccc tcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacaga tcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatat actttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgat
- 67 042798 aatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaa agatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaa accaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggta actggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccacc acttcaagaactctgtagcaccgcctacatacctcgctctgetaatcctgttaccagtggctgc tgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcg cagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccg aactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcgga caggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaac gcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgat gctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggc cttttgctggccttttgctcacatgt
PT366 c JCR183 (SEQ ID NO: 40) -применяемая для работы in vivo (gRNA выделена жирным шрифтом; SaCas9 выделена верхним регистром; NLS выделена нижним регистром, жирным шрифтом и подчеркиванием) cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtc gcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttc ctgcggcctctagactcgaggcgttgacattgattattgactagttattaatagtaatcaatta cggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggccc gcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagta acgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttgg cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcc cgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgta ttagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggt ttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcacca aaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtagg cgtgtacggtgggaggtctatataagcagagctctctggctaactaccggtgccaccatggccc caaagaagaagcggaaggtcggtatccacggagtcccagcagccAAGCGGAACTACATCCTGGG CCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGACGTGATC GATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGGAGCAAGA GAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGCTGCTGTT CGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGCCAGAGTG AAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTGGCCAAGA GAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCACCAAAGA GCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCTGGAACGG
- 68 042798
CTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTACGTGAAAG AAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCATCGACAC CTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAGCCCCTTC GGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTCCCCGAGG AACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACCTGAACAA TCTCGTGAT СAC CAG G GAC GAGAAC GAGAAG С T G GAATAT TAG GAGAAG T T С CAGAT CATC GAG AAC G T G T T CAAG CAGAAGAAGAAG С С СAC С С T GAAG CAGAT C G С CAAAGAAAT С С T C G T GAAC G AAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACCTGAAGGT GTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCTGCTGGAT CAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTGACCAATC TGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATACCGGCAC CCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAACGACAAC CAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAGCAGAAAG AGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCTTCATCCA GAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCATTATCGAG CTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAGCGGAACC GGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCAAGTACCT GATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGAAGCCATC CCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCCAGAAGCG TGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCAAGAAGGG CAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAACCTTCAAG AAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAGTATCTGC TGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACCTGGTGGA TACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAACAACCTG GACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGGAAGTTTA AGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCAACGCCGA TTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGTGATGGAAAACCAGATGTTC GAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAGATCTTCA TCACCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACCGGGTGGA CAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGACAAGGGC AACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTGAAAAAGC T GAT CAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC CAGAAAC T GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGAGGAAACC GGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATTAAGTATT ACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAAACAAGGT CGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTACAAGTTC
- 69 042798
G T GAG C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAATAG CAAG T G С T ATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCTTCTACAA CAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGACCTGCTG AAG C G GAT C GAAG T GAACAT GAT C GAGAT СAC С TAC C G C GAG TAC С T G GAAAACAT GAAC GACA AGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGTACAGCAC AGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCCTCAGATCATCAAAAAGGGC aaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaaaaqg gatcctacccatacg atgttccagattacgcttacccatacgatgttccagattacgcttacccatacgatgttccaga ttacgcttaagaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccat ctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttc ctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggg gtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctggggaggtaccga gggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataatt ggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataat ttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaac ttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgAGAACTGG TGGGAAATGGTCTAGgttttagtactctggaaacagaatctactaaaacaaggcaaaatgccgt gtttatctcgtcaacttgttggcgagatttttgcggccgcaggaacccctagtgatggagttgg ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgccc gggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggggcgcctgatg cggtattttctccttacgcatctgtgcggtatttcacaccgcatacgtcaaagcaaccatagta cgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctaca cttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccg gctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggca cctcgaccccaaaaaacttgatttgggtgatggttcacgtagtgggccatcgccctgatagacg gtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaa caacactcaaccctatctcgggctattcttttgatttataagggattttgccgatttcggccta ttggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgttt acaattttatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgac acccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagaca agctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcg agacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttctt agacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaat acattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaa aggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgcc ttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgc
- 70 042798 acgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaa gaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattg acgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactc accagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccata accatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaa ccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaa tgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgc aaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggagg cggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataa atctggagccggtgagcgtggaagccgcggtatcattgcagcactggggccagatggtaagccc tcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacaga tcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatat actttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgat aatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaa agatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaa accaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggta actggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccacc acttcaagaactctgtagcaccgcctacatacctcgctctgetaatcctgttaccagtggctgc tgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcg cagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccg aactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcgga caggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaac gcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgat gctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggc cttttgctggccttttgctcacatgt pDO242 (SaCas9, применяемая во всех объектах с JCR89/91 и объектах с JCR157/160 для работы in vitro; SaCas9 выделена верхним регистром) (SEQ ID NO: 83) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct
- 71 042798 cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtacCtttaattctagtactatgcaTgcgttgacattgattattgactagt tattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacat aacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataat gacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtattta cggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacg tcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctac ttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatc aatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatg ggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccatt gacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaact accggtgccaccATGAAAAGGAACTACATTCTGGGGCTGGACATCGGGATTACAAGCGTGGGGT ATGGGATTATTGACTATGAAACAAGGGACGTGATCGACGCAGGCGTCAGACTGTTCAAGGAGGC CAACGTGGAAAACAATGAGGGACGGAGAAGCAAGAGGGGAGCCAGGCGCCTGAAACGACGGAGA AGGCACAGAATCCAGAGGGTGAAGAAACTGCTGTTCGATTACAACCTGCTGACCGACCATTCTG AGCTGAGTGGAATTAATCCTTATGAAGCCAGGGTGAAAGGCCTGAGTCAGAAGCTGTCAGAGGA AGAGTTTTCCGCAGCTCTGCTGCACCTGGCTAAGCGCCGAGGAGTGCATAACGTCAATGAGGTG GAAGAGGACACCGGCAACGAGCTGTCTACAAAGGAACAGATCTCACGCAATAGCAAAGCTCTGG AAGAGAAGTATGTCGCAGAGCTGCAGCTGGAACGGCTGAAGAAAGATGGCGAGGTGAGAGGGTC AATTAATAGGTTCAAGACAAGCGACTACGTCAAAGAAGCCAAGCAGCTGCTGAAAGTGCAGAAG GCTTACCACCAGCTGGATCAGAGCTTCATCGATACTTATATCGACCTGCTGGAGACTCGGAGAA CCTACTATGAGGGACCAGGAGAAGGGAGCCCCTTCGGATGGAAAGACATCAAGGAATGGTACGA GATGCTGATGGGACATTGCACCTATTTTCCAGAAGAGCTGAGAAGCGTCAAGTACGCTTATAAC GCAGATCTGTACAACGCCCTGAATGACCTGAACAACCTGGTCATCACCAGGGATGAAAACGAGA AAC T G GAATACTAT GAGAAGT T СCAGAT CATCGAAAACGT GT T TAAGCAGAAGAAAAAGСС TAC ACTGAAACAGATTGCTAAGGAGATCCTGGTCAACGAAGAGGACATCAAGGGCTACCGGGTGACA AG СAC T G GAAAAC CAGAG T T СAC СAAT С T GAAAG T G TAT CAC GATAT TAAG GACAT CACAG CAC GGAAAGAAATCATTGAGAACGCCGAACTGCTGGATCAGATTGCTAAGATCCTGACTATCTACCA GAGCTCCGAGGACATCCAGGAAGAGCTGACTAACCTGAACAGCGAGCTGACCCAGGAAGAGATC GAACAGATTAGTAATCTGAAGGGGTACACCGGAACACACAACCTGTCCCTGAAAGCTATCAATC TGATTСTGGATGAGCTGTGGCATACAAACGACAATCAGATTGCAATСTTTAACCGGCTGAAGCT GGTCCCAAAAAAGGTGGACCTGAGTCAGCAGAAAGAGATCCCAACCACACTGGTGGACGATTTC ATTCTGTCACCCGTGGTCAAGCGGAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCA AGAAGTACGGCCTGCCCAATGATATCATTATCGAGCTGGCTAGGGAGAAGAACAGCAAGGACGC AC AGAAGAT GAT C AAT GAGAT G C AGAAAC GAAAC C G G C AGAC C AAT GAAC G C AT T GAAGAGAT T
- 72 042798
ATCCGAACTACCGGGAAAGAGAACGCAAAGTACCTGATTGAAAAAATCAAGCTGCACGATATGC AGGAGGGAAAGTGTCTGTATTCTCTGGAGGCCATCCCCCTGGAGGACCTGCTGAACAATCCATT СAACTAGGAGGTCGATCATATTATCCCCAGAAGCGTGTCCTTCGAGAAT T СС T T TAACAACAAG GTGCTGGTCAAGCAGGAAGAGAACTCTAAAAAGGGCAATAGGACTCCTTTCCAGTACCTGTCTA GTTCAGATTCCAAGATСTСTTACGAAACСTTTAAAAAGCACATTСTGAATСTGGCCAAAGGAAA GGGCCGCATCAGCAAGACCAAAAAGGAGTACCTGCTGGAAGAGCGGGACATCAACAGATTCTCC GTCCAGAAGGATTTTATTAACCGGAATCTGGTGGACACAAGATACGCTACTCGCGGCCTGATGA ATCTGCTGCGATCCTATTTCCGGGTGAACAATCTGGATGTGAAAGTCAAGTCCATCAACGGCGG GTTCACATCTTTTCTGAGGCGCAAATGGAAGTTTAAAAAGGAGCGCAACAAAGGGTACAAGCAC CATGCCGAAGATGCTCTGATTATCGCAAATGCCGACTTCATCTTTAAGGAGTGGAAAAAGCTGG ACAAAGCCAAGAAAGTGATGGAGAACCAGATGTTCGAAGAGAAGCAGGCCGAATCTATGCCCGA AAT C GAGACAGAACAG GAG TAGAAG GAGAT T T T CAT СAC T С С T CAC CAGAT CAAG CATAT CAAG GATTTCAAGGACTACAAGTACTCTCACCGGGTGGATAAAAAGCCCAACAGAGAGCTGATCAATG AC AC CCTGTATAG T AC AAGAAAAGAC GAT AAG G G GAAT AC CCTGATTGT GAAC AAT С T GAAC G G AC T G TAC GACAAAGATAAT GACAAG С T GAAAAAG С T GAT CAACAAAAG T С С C GAGAAG С T G С T G ATGTACCACCATGATCCTCAGACATATCAGAAACTGAAGCTGATTATGGAGCAGTACGGCGACG AGAAGAAC С СAC T G TATAAG TAG TAT GAAGAGAC T G G GAAC TAC С T GAC CAAG TATAG СAAAAA GGATAATGGCCCCGTGATCAAGAAGATCAAGTACTATGGGAACAAGCTGAATGCCCATCTGGAC ATCACAGACGATTACCCTAACAGTCGCAACAAGGTGGTCAAGCTGTCACTGAAGCCATACAGAT TCGATGTCTATCTGGACAACGGCGTGTATAAATTTGTGACTGTCAAGAATCTGGATGTCATCAA AAAGGAGAAC TAG TAT GAAGT GAATAGCAAGT GC TAGGAAGAGGC TAAAAAGC T GAAAAAGAT T AGCAACCAGGCAGAGTTCATCGCCTCCTTTTACAACAACGACCTGATTAAGATCAATGGCGAAC TGTATAGGGTCATCGGGGTGAACAATGATCTGCTGAACCGCATTGAAGTGAATATGATTGACAT СAC T TAC C GAGAG TAT С T G GAAAACAT GAAT GATAAG CGCCCCCCTC GAAT TAT СAAAACAAT T G С С T С TAAGAC T CAGAG TAT CAAAAAG TACT C AACCGACAT T С T GGGAAACС T GTAT GAGGT GA AGAGCAAAAAGCACCCTCAGATTATCAAAAAGGGCagcggaggcaagcgtcctgctgctactaa gaaagctggtcaagctaagaaaaagaaaggatcctacccatacgatgttccagattacgcttaa gaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttg cccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaat gaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcagg acagcaagggggaggattgggaagagaatagcaggcatgctggggaggtagcggccgcCCgcgg tggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcat agctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcat aaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactg cccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcgggga gaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgt
- 73 042798 tcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggg gataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccg cgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaag tcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctc gtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaa gcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaa gctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgt cttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggatta gcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacac tagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggt agctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcaga ttacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctca gtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctag atccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctg acagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccat agttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagt gctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccag ccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattg ttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgct acaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgat caaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgat cgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattct cttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattct gagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgcc acatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaagg atcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcat cttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaaggg aataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatt tatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaatag gggttccgcgcacatttccccgaaaagtgccac pJRHl (SaCas9, применяемая для всех объектов с JCR179/183, SaCas9 выделена верхним регистром; NLS выделена нижним регистром, жирным шрифтом и подчеркиванием) (SEQ ID NO: 84) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg
- 74 042798 gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtacctttaattctagtactatgcatgcgttgacattgattattgactagt tattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacat aacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataat gacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtattta cggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacg tcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctac ttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatc aatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatg ggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccatt gacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaact accggtgccaccatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccA AGCGGAACTACATCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTA CGAGACACGGGACGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAAC GAGGGCAGGCGGAGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGA GAGTGAAGAAGCTGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAA CCCCTACGAGGCCAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCC CTGCTGCACCTGGCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCA ACGAGCTGTCCACCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGC CGAACTGCAGCTGGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAG ACCAGCGACTACGTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGG ACCAGAGCTTCATCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACC TGGCGAGGGCAGCCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCAC TGCACCTACTTCCCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACG С С С T GAAC GAG С T GAACAAT С T C G T GAT GAG GAG G GAG GAGAAC GAGAAG С T G GAATAT TAG GA GAAG T T С C AGAT CATC GAGAAC G T G T T C AAG C AGAAGAAGAAG С С С AC С С T GAAG C AGAT C G С C AAAGAAATCCTCGTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCG AG T T СAC СAAC С T GAAG G T G TAC CAC GACAT CAAGGACAT TACCGCCCGGAAAGAGATTAT T GA GAACGCCGAGCTGCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATC CAG GAAGAAC T GAC CAAT С T GAAC T С C GAG С T GAC С CAG GAAGAGAT C GAG CAGAT С T С TAAT C
- 75 042798
TGAAGGGCTATACCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCT GTGGCACACCAACGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTG GACCTGTCCCAGCAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCG TGAAGAGAAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCC CAACGACATCATTATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAAC GAGATGCAGAAGCGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCA AAGAGAACGCCAAGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCT GTACAGCCTGGAAGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGAC CACATCATCCCCAGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGG AAGAAAACAGCAAGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGAT CAGCTACGAAACCTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAG ACCAAGAAAGAGTATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCA TCAACCGGAACCTGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTA CTTCAGAGTGAACAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTG CGGCGGAAGTGGAAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCC TGATCATTGCCAACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGT GATGGAAAACCAGATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAG GAG T AC AAAGAGAT С T T C AT С AC С С С С С AC C AGAT C AAG C AC AT T AAG GAC T T C AAG GAC TACA AGTACAGCCACCGGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCAC CCGGAAGGACGACAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGAC AATGACAAGCTGAAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGACC С С CAGAC С TAC CAGAAAC T GAAG CTGATTATG GAACAG TAC G G C GAC GAGAAGAAT CCCCTGTA CAAGTACTACGAGGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTG AT CAAGAAGAT TAAG TAT TAC G G CAACAAAC T GAAC GCCCATCTG GACAT СAC C GAC GAC TAC C CCAACAGCAGAAACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGA СAAT G G C G T G TAGAAG T T C G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAGTGAATAGCAAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGT TTATCGCCTCCTTCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGG C G T GAACAAC GAC С T G С T GAAC C G GAT C GAAG T GAACAT GAT C GACAT СAC С TAC C G C GAG TAG С T G GAAAACAT GAAC GACAAGAG G С С С С С CAG GAT CAT TAAGACAAT C G С С T С CAAGAC С CAGA GCATTAAGAAGTACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCC T CAGAT CAT CAAAAAG G G Caaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaa aaqggatcctacccatacgatgttccagattacgcttaagaattcctagagctcgctgatcage ctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgacc ctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctga gtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaaga
- 76 042798 gaatagcaggcatgctggggaggtagcggccgcccgcggtggagctccagcttttgttcccttt agtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgtta tccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaa tgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgt cgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctc ttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagct cactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgag caaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggct ccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacagga ctataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgc cgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacg ctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacccccc gttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacg acttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgc tacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgc getctgetgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaacca ccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctca agaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaaggg attttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagtt ttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtga ggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtag ataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccac gctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtgg tcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagt tcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgt cgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccat gttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgca gtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagat gcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgag ttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctc atcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagtt cgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgg gtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttga atactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcg gatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaa agtgccac
- 77 042798
Последовательность NLS в РТ366 (SEQ ID NO: 85)
AAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG pDO203 - типичный каркас для клонирования gRNA с SpCas9;
JCR94 и JCR99 помещали в сайт, выделенный жирным шрифтом, для тестирования в клетках, с последующим получением mRNA для получения мыши hDMD-flenbTa52/mdx (SEQ ID NO: 86) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccgagggcctatttcccatgattccttcatatttgcatatacgataca aggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatac gtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggac tatcatatgcttatcgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaag gacgaaacaccGGGTCTTCGAGAAGACCTgttttagagctagaaatagcaagttaaaataaggc tagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttttccgcggtggagctcca gcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcc tgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaa gcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttcc agtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggttt gcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcgg cgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcag gaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggc gtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtgg cgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctc ctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgct ttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgt gtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtcca acccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgag gtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggaca
- 78 042798 gtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgat ccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcag aaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaa aactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaa attaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttacca atgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctga ctccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatga taccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggc cgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaa gctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcg tggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagt tасаtgatcccccatgttgtgcaaaaaagcggttagetccttcggtcctccgatcgttgtсада agtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtca tgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtg tatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcaga actttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgc tgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttacttt caccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcg acacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggtt attgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcg cacatttccccgaaaagtgccac

Claims (18)

1. Композиция для нацеливания на ДНК, содержащая первую молекулу gRNA и вторую молекулу gRNA, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(vi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим
- 79 042798 нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
(x) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15;
(xi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.
2. Композиция для нацеливания на ДНК по п.1, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19; и (iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.
3. Композиция для нацеливания на ДНК по п.1 или 2, дополнительно содержащая белок, ассоциированный с короткими палиндромными повторами, регулярно расположенными группами, (Cas).
4. Композиция для нацеливания на ДНК по п.3, где белок Cas содержит молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
5. Выделенный полинуклеотид, содержащий первую молекулу gRNA и вторую молекулу gRNA, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
- 80 042798 (vi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
(x) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15;
(xi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.
6. Выделенный полинуклеотид по п.5, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19; и (iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.
7. Выделенный полинуклеотид по п.5 или 6, дополнительно кодирующий белок, ассоциированный с короткими палиндромными повторами, регулярно расположенными группами, (Cas).
8. Выделенный полинуклеотид по п.7, где белок Cas содержит молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).
9. Вектор, содержащий выделенный полинуклеотид по любому из пп.5-8.
10. Вектор по п.9, где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов в первом и втором интронах, фланкирующих экзон 51 гена DMD человека.
11. Вектор по п.9 или 10, где вектор представляет собой вирусный вектор.
12. Вектор по любому из пп.9-11, где вектор содержит тканеспецифичный промотор, функционально связанный с нуклеотидной последовательностью, кодирующей первую молекулу gRNA, вторую молекулу gRNA и/или молекулу Cas9.
13. Клетка, содержащая композицию для нацеливания на ДНК по любому из пп.1-4, или выделенный полинуклеотид по любому из пп.5-8, или вектор по любому из пп.9-12.
14. Набор для обеспечения делеции сегмента гена дистрофина, содержащего экзон 51 или экзон 52, где набор содержит композицию для нацеливания на ДНК по любому из пп.1-4, или выделенный полинуклеотид по любому из пп.1-4, или вектор по любому из пп.9-12, или клетку по п.13.
- 81 042798
15. Набор по п.14, дополнительно содержащий инструкции по применению.
16. Способ обеспечения делеции сегмента гена дистрофина, содержащего экзон 51 или экзон 52 в клетке, при этом способ предусматривает введение в клетку композиции для нацеливания на ДНК по любому из пп.1-4, или выделенного полинуклеотида по любому из пп.5-8, или вектора по любому из пп.9-12.
17. Способ обеспечения делеции сегмента гена дистрофина, содержащего экзон 51 или экзон 52 у субъекта, при этом способ предусматривает введение субъекту композиции для нацеливания на ДНК по любому из пп.1-4, или выделенного полинуклеотида, кодирующего композицию для нацеливания на ДНК по любому из пп.5-8, или вектора по любому из пп.9-12, или клетки по п.13.
18. Композиция для обеспечения делеции сегмента гена дистрофина, содержащего экзон 51 или экзон 52, при этом композиция содержит (a) первый вектор, содержащий полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второй вектор, содержащий полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где каждая из первой и второй молекул gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, и где первый вектор и второй вектор сконструированы с возможностью образования первого и второго двухнитевых разрывов соответственно в первом интроне и втором интроне, фланкирующих экзон 51 или экзон 52 гена DMD человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51 или экзон 52, и где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;
(ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
(iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;
(v) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(vi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
(vii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;
(viii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;
(ix) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;
- 82 042798 (x) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15;
(xi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.
EA201891317 2015-11-30 2016-11-30 Терапевтические мишени для коррекции гена дистрофина человека с помощью редактирования генов и способы их применения EA042798B1 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/260,712 2015-11-30
US62/330,336 2016-05-02

Publications (1)

Publication Number Publication Date
EA042798B1 true EA042798B1 (ru) 2023-03-27

Family

ID=

Similar Documents

Publication Publication Date Title
CN108779466B (zh) 用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法
JP7075597B2 (ja) デュシェンヌ型筋ジストロフィーを治療するためのcrispr/cas関連の方法および組成物
JP7490211B2 (ja) Cpf1に基づくゲノム編集の治療適用
CN105658805B (zh) Rna指导的基因编辑和基因调节
US20220184229A1 (en) Aav vector-mediated deletion of large mutational hotspot for treatment of duchenne muscular dystrophy
US20230257723A1 (en) Crispr/cas9 therapies for correcting duchenne muscular dystrophy by targeted genomic integration
US20220195406A1 (en) Crispr/cas-based genome editing composition for restoring dystrophin function
US20150196670A1 (en) Compositions and methods for duchenne muscular dystrophy gene therapy
US20230349888A1 (en) A high-throughput screening method to discover optimal grna pairs for crispr-mediated exon deletion
US20230348870A1 (en) Gene editing of satellite cells in vivo using aav vectors encoding muscle-specific promoters
US20210163939A1 (en) Improved crispr therapy
US20230392132A1 (en) Dual aav vector-mediated deletion of large mutational hotspot for treatment of duchenne muscular dystrophy
US20230102342A1 (en) Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use
EA042798B1 (ru) Терапевтические мишени для коррекции гена дистрофина человека с помощью редактирования генов и способы их применения