EA042798B1 - THERAPEUTIC TARGETS FOR CORRECTION OF THE HUMAN DYSTROFIN GENE USING GENE EDITING AND METHODS FOR THEIR APPLICATION - Google Patents

THERAPEUTIC TARGETS FOR CORRECTION OF THE HUMAN DYSTROFIN GENE USING GENE EDITING AND METHODS FOR THEIR APPLICATION Download PDF

Info

Publication number
EA042798B1
EA042798B1 EA201891317 EA042798B1 EA 042798 B1 EA042798 B1 EA 042798B1 EA 201891317 EA201891317 EA 201891317 EA 042798 B1 EA042798 B1 EA 042798B1
Authority
EA
Eurasian Patent Office
Prior art keywords
seq
grna molecule
nucleotide sequence
encoded
sequence shown
Prior art date
Application number
EA201891317
Other languages
Russian (ru)
Inventor
Чарльз А. Герсбах
Жаклин Н. Робинсон-Хамм
Original Assignee
Дьюк Юниверсити
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Дьюк Юниверсити filed Critical Дьюк Юниверсити
Publication of EA042798B1 publication Critical patent/EA042798B1/en

Links

Description

Перекрестная ссылка на родственные заявкиCross-reference to related applications

Данная заявка заявляет приоритет по предварительной заявке на патент США № 62/260712, поданной 30 ноября 2015 г., и предварительной заявке на патент США № 62/330336, поданной 2 мая 2016 г., все из которых включены в данный документ посредством ссылки во всей своей полноте.This application claims priority over U.S. Provisional Application No. 62/260,712, filed November 30, 2015, and U.S. Provisional Application No. 62/330,336, filed May 2, 2016, all of which are incorporated herein by reference in in all its fullness.

Заявление о государственной заинтересованностиDeclaration of State Interest

Настоящее изобретение было создано при государственной поддержке в соответствии с программой стипендий для выпускников, присужденной Национальным научным фондом. Правительство США обладает определенными правами на настоящее изобретение.The present invention was made with government support in accordance with the graduate scholarship program awarded by the National Science Foundation. The US Government has certain rights to the present invention.

Область техники изобретенияField of invention

Настоящее изобретение относится к области изменения экспрессии гена, конструирования генома и геномной перестройки генов с применением систем на основе коротких палиндромных повторов, регулярно расположенных группами, на основе систем (CRISPR)/CRISPR-ассоциированного белка (Cas) 9 и вирусных систем доставки. Настоящее изобретение также относится к области геномной инженерии и геномной перестройки генов в мышце, такой как скелетная мышца и сердечная мышца.The present invention relates to the field of gene expression alteration, genome engineering and genomic rearrangement of genes using regularly spaced short palindromic repeat systems based on (CRISPR)/CRISPR-associated protein (Cas) 9 systems and viral delivery systems. The present invention also relates to the field of genomic engineering and genomic rearrangement of genes in muscle such as skeletal muscle and cardiac muscle.

Предпосылки изобретенияBackground of the invention

Синтетические факторы транскрипции были разработаны для контроля экспрессии генов для многих различных медицинских и научных применений в системах, относящихся к млекопитающим, включая стимуляцию регенерации тканей, отбор лекарственных средств, компенсацию генетических дефектов, активацию молчащих онкосупрессоров, контроль дифференцировки стволовых клеток, проведение генетических скринингов и создание синтетических генных сетей. Эти факторы транскрипции способны целенаправленно воздействовать на промоторы или энхансеры эндогенных генов или могут быть целенаправленно сконструированы для распознавания последовательностей, ортогональных к геномам млекопитающих, для трансгенной регуляции. Наиболее общие стратегии конструирования новых факторов транскрипции, нацеленных на определяемые пользователем последовательности, основывались на программируемых ДНК-связывающих доменах белков цинковых пальцев и эффекторах, подобных активаторам транскрипции (TALE). Оба эти подхода предусматривают применение принципов взаимодействий белок-ДНК этих доменов с конструированием новых белков с уникальной ДНК-связывающей специфичностью. Хотя эти способы были очень успешны в большом числе применений, белковая инженерия, необходимая для манипулирования взаимодействиями белок-ДНК, может быть трудоемкой и нуждаться в специальных знаниях и навыках.Synthetic transcription factors have been developed to control gene expression for many different medical and scientific applications in mammalian systems, including stimulation of tissue regeneration, drug selection, compensation for genetic defects, activation of silent tumor suppressors, control of stem cell differentiation, genetic screening, and generation synthetic gene networks. These transcription factors are capable of targeting promoters or enhancers of endogenous genes or can be targeted to recognize sequences orthogonal to mammalian genomes for transgenic regulation. The most common strategies for constructing novel transcription factors targeting user-defined sequences have been based on programmable DNA-binding domains of zinc finger proteins and transcription activator-like effectors (TALEs). Both of these approaches involve the application of the principles of protein-DNA interactions of these domains with the construction of new proteins with unique DNA-binding specificity. Although these methods have been very successful in a large number of applications, the protein engineering required to manipulate protein-DNA interactions can be labor intensive and require specialized knowledge and skills.

Кроме того, эти новые белки не всегда являются эффективными. Причины этого еще не известны, но могут быть связаны с эффектами эпигенетических модификаций и состоянием хроматина при связывании белка с целевым сайтом в геноме. Кроме того, существуют проблемы в обеспечении того, чтобы эти новые белки, а также другие компоненты доставлялись в каждую клетку. Существующие способы доставки этих новых белков и множества их компонентов включают доставку к клеткам в отдельных плазмидах или векторах, что приводит к высоковариабельным уровням экспрессии в каждой клетке из-за различий в количестве копий. Кроме того, активация генов после трансфекции является временной вследствие растворения плазмидной ДНК, а непостоянная экспрессия генов может быть недостаточной для индукции терапевтических эффектов. Более того, данный подход не подходит для типов клеток, которые не легко трансфицировать. Таким образом, другим ограничением этих новых белков является эффективность активации транскрипции.In addition, these new proteins are not always effective. The reasons for this are not yet known, but may be related to the effects of epigenetic modifications and the state of chromatin when a protein binds to a target site in the genome. In addition, there are challenges in ensuring that these new proteins, as well as other components, are delivered to every cell. Existing methods for delivering these new proteins and many of their components involve delivery to cells in separate plasmids or vectors, resulting in highly variable levels of expression in each cell due to copy number differences. In addition, gene activation after transfection is transient due to the dissolution of plasmid DNA, and transient gene expression may not be sufficient to induce therapeutic effects. Moreover, this approach is not suitable for cell types that are not easily transfected. Thus, another limitation of these new proteins is the efficiency of transcriptional activation.

Системы редактирования генов на основе CRISPR/Cas9 могут использоваться для введения сайтспецифических двухнитевых разрывов в целевые геномные локусы. Такое расщепление ДНК стимулирует естественный механизм репарации ДНК, сводящийся к одному из двух возможных путей репарации. При отсутствии донорной матрицы разрыв подвергают репарации посредством негомологичного соединения концов (NHEJ), подверженного погрешностям пути репарации, что приводит к небольшим вставкам или делециям ДНК. Данный способ можно использовать для намеренного разрушения, делеции или изменения рамки считывания последовательностей целевых генов. Однако если донорная матрица предоставляется вместе с нуклеазами, то клеточный аппарат осуществляет репарацию разрыва путем гомологичной рекомбинации, которая усиливается на несколько порядков в присутствии расщепления ДНК. Данный способ можно применять для введения специфических изменений в последовательность ДНК в целевых сайтах. Сконструированные нуклеазы применялись для редактирования генов в различных стволовых клетках и линиях клеток человека, а также для редактирования генов в печени мыши. Однако основной преградой для реализации этих технологий является доставка к конкретным тканям in vivo таким образом, который является эффективным, действенным и способствует успешной модификации генома.CRISPR/Cas9-based gene editing systems can be used to introduce site-specific double-strand breaks at target genomic loci. This DNA cleavage stimulates the natural DNA repair mechanism, which is reduced to one of two possible repair pathways. In the absence of a donor template, the break is repaired by non-homologous end joining (NHEJ), prone to errors in the repair pathway, resulting in small DNA insertions or deletions. This method can be used to deliberately destroy, delete or change the reading frame of target gene sequences. However, if the donor template is provided together with nucleases, then the cellular machinery performs repair of the break by homologous recombination, which is enhanced by several orders of magnitude in the presence of DNA cleavage. This method can be used to introduce specific changes to the DNA sequence at target sites. The engineered nucleases have been used to edit genes in various human stem cells and cell lines, and to edit genes in mouse livers. However, the main barrier to the implementation of these technologies is in vivo delivery to specific tissues in a manner that is efficient, effective, and promotes successful genome modification.

Наследственные генетические заболевания характеризуются разрушающими эффектами по отношению к детям в Соединенных Штатах. Эти заболевания в настоящее время не поддаются лечению и можно лишь оказывать помощь, пытаясь облегчить симптомы. В течение нескольких десятилетий в области генной терапии обещали обеспечить лечение этих заболеваний. Однако технические преграды, связанные с безопасностью и действенностью доставки терапевтических генов к клеткам и пациентам, ограничивали данный подход. Мышечная дистрофия Дюшенна (DMD) представляет собой смертельноеHereditary genetic diseases are characterized by devastating effects on children in the United States. These diseases are currently not treatable and can only be treated by trying to alleviate the symptoms. For several decades, the field of gene therapy has promised to provide treatments for these diseases. However, technical barriers related to the safety and efficacy of delivering therapeutic genes to cells and patients have limited this approach. Duchenne muscular dystrophy (DMD) is a fatal

- 1 042798 генетическое заболевание, клинически характеризующееся мышечной атрофией, потерей способности к передвижению и смертью, как правило на третьем десятилетии жизни вследствие функциональной дистрофии. DMD является результатом врожденных или спонтанных мутаций в гене дистрофина. Большая часть мутаций, вызывающих DMD, является результатом делеций экзона(ов), сдвигая трансляционную рамку считывания за пределы рамки.- 1 042798 genetic disease, clinically characterized by muscle atrophy, loss of the ability to move and death, usually in the third decade of life due to functional dystrophy. DMD is the result of congenital or spontaneous mutations in the dystrophin gene. Most of the mutations that cause DMD are the result of exon(s) deletions, shifting the translational reading frame out of frame.

Дистрофин является ключевым компонентом белкового комплекса, который отвечает за регуляцию целостности и функции мышечных клеток. Пациенты с DMD обычно теряют способность физически поддерживать себя на протяжении детства, постепенно становятся слабее в подростковом возрасте и умирают в возрасте от двадцати до тридцати лет. Существующие на данный момент стратегии экспериментальной генной терапии по отношению к DMD требуют повторного введения средств доставки временных генов или полагаются на постоянное включение чужеродного генетического материала в геномную ДНК. Оба данных способа имеют серьезные проблемы с безопасностью. Более того, эти стратегии ограничивались неспособностью доставлять крупную и сложную последовательность гена дистрофина. Остается потребность в более точном и действенном инструменте для редактирования генов для коррекции и лечения пациентов с мутациями в гене дистрофина.Dystrophin is a key component of a protein complex that is responsible for regulating the integrity and function of muscle cells. Patients with DMD usually lose the ability to physically support themselves during childhood, gradually become weaker during adolescence, and die in their twenties and thirties. Current experimental gene therapy strategies for DMD require reintroduction of transient gene delivery vehicles or rely on the permanent incorporation of foreign genetic material into genomic DNA. Both of these methods have serious security problems. Moreover, these strategies were limited by the inability to deliver the large and complex dystrophin gene sequence. There remains a need for a more accurate and efficient gene editing tool to correct and treat patients with mutations in the dystrophin gene.

Краткое описание изобретенияBrief description of the invention

Настоящее изобретение направлено на направляющую РНК (gRNA), содержащую нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность.The present invention is directed to a guide RNA (gRNA) containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 , SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, or its complementary subsequence.

Настоящее изобретение также относится к композиции для нацеливания на ДНК, содержащей первую gRNA и вторую gRNA. Первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность. Первая молекула gRNA и вторая молекула gRNA содержат нацеливающие домены.The present invention also relates to a DNA targeting composition comprising a first gRNA and a second gRNA. The first gRNA molecule and the second gRNA molecule contain a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, or its complementary sequence. The first gRNA molecule and the second gRNA molecule contain targeting domains.

Настоящее изобретение также относится к выделенному полинуклеотиду, содержащему вышеописанную молекулу gRNA или вышеописанную композицию для нацеливания на ДНК.The present invention also relates to an isolated polynucleotide containing the above-described gRNA molecule or the above-described DNA targeting composition.

Настоящее изобретение относится к вектору, содержащему вышеописанную gRNA, вышеописанную композицию для нацеливания на ДНК или вышеописанный выделенный полинуклеотид.The present invention relates to a vector containing the above-described gRNA, the above-described DNA targeting composition, or the above-described isolated polynucleotide.

Настоящее изобретение также относится к вектору, содержащему вышеописанную композицию для нацеливания на ДНК.The present invention also relates to a vector containing the above composition for targeting DNA.

Настоящее изобретение также относится к вектору, кодирующему (a) первую молекулу направляющей РНК (gRNA);The present invention also relates to a vector encoding (a) a first guide RNA (gRNA) molecule;

(b) вторую молекулу gRNA; и (c) по меньшей мере одну молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).(b) a second gRNA molecule; and (c) at least one Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25).

Первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность. Первая молекула gRNA и вторая молекула gRNA содержат нацеливающие домены.The first gRNA molecule and the second gRNA molecule contain a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, or its complementary sequence. The first gRNA molecule and the second gRNA molecule contain targeting domains.

Настоящее изобретение также относится к клетке, содержащей вышеописанную gRNA, вышеописанную композицию для нацеливания на ДНК, вышеописанный выделенный полинуклеотид или вышеописанный вектор.The present invention also relates to a cell containing the above-described gRNA, the above-described DNA targeting composition, the above-described isolated polynucleotide, or the above-described vector.

Настоящее изобретение также относится к набору, содержащему вышеописанную gRNA, вышеописанную систему для нацеливания на ДНК, вышеописанный выделенный полинуклеотид, вышеописанный вектор или вышеописанную клетку и необязательно инструкции по применению.The present invention also relates to a kit containing the above-described gRNA, the above-described DNA targeting system, the above-described isolated polynucleotide, the above-described vector or the above-described cell, and optionally instructions for use.

Настоящее изобретение также относится к способу коррекции мутантного гена дистрофина в клетке. Способ предусматривает введение в клетку вышеописанной gRNA, вышеописанной системы для нацеливания на ДНК, вышеописанного выделенного полинуклеотида или вышеописанного вектора.The present invention also relates to a method for correcting a mutant dystrophin gene in a cell. The method involves introducing into a cell the above-described gRNA, the above-described DNA targeting system, the above-described isolated polynucleotide, or the above-described vector.

Настоящее изобретение также относится к способу редактирования мутантного гена дистрофина в геноме субъекта. Способ предусматривает введение субъекту композиции для редактирования генома, содержащей вышеописанную gRNA, вышеописанную систему для нацеливания на ДНК, вышеописанный выделенный полинуклеотид или вышеописанный вектор.The present invention also relates to a method for editing a mutant dystrophin gene in a subject's genome. The method involves administering to a subject a genome editing composition comprising the above-described gRNA, the above-described DNA targeting system, the above-described isolated polynucleotide, or the above-described vector.

Настоящее изобретение также относится к способу лечения субъекта, нуждающегося в этом, у коThe present invention also relates to a method of treating a subject in need thereof who has

- 2 042798 торого имеется мутантный ген дистрофина. Способ предусматривает введение субъекту вышеописанной gRNA, вышеописанной системы для нацеливания на ДНК, вышеописанного выделенного полинуклеотида или вышеописанного вектора.- 2 042798 which has a mutant dystrophin gene. The method involves administering to the subject the above-described gRNA, the above-described DNA targeting system, the above-described isolated polynucleotide, or the above-described vector.

Настоящее изобретение также относится к модифицированному вектору на основе аденоассоциированного вируса для редактирования мутантного гена дистрофина в геноме субъекта, содержащего первую полинуклеотидную последовательность, кодирующую вышеописанную gRNA, и вторую полинуклеотидную последовательность, кодирующую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).The present invention also relates to a modified adeno-associated virus vector for editing a mutant dystrophin gene in the genome of a subject, containing a first polynucleotide sequence encoding the above-described gRNA and a second polynucleotide sequence encoding a Cas9 molecule that recognizes a protospacer adjacent motif (PAM) or NNGRRT ( SEQ ID NO: 24), or NNGRRV (SEQ ID NO: 25).

Настоящее изобретение также относится к композиции для обеспечения делеции сегмента гена дистрофина, содержащей экзон 51, при этом композиция содержит (a) первый вектор, содержащий полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второй вектор, содержащий полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).The present invention also relates to a composition for providing a deletion of a dystrophin gene segment containing exon 51, the composition comprising (a) a first vector containing a polynucleotide sequence encoding a first guide RNA (gRNA) molecule and a polynucleotide sequence encoding a first Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25); and (b) a second vector containing a polynucleotide sequence encoding a second gRNA molecule and a polynucleotide sequence encoding a second Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO : 25).

Каждая из первой и второй молекул gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, где первый вектор и второй вектор сконструированы с возможностью образования первого и второго двухнитевых разрывов в первом интроне и втором интроне, фланкирующих соответственно экзон 51 гена DMD человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.Each of the first and second gRNA molecules contains a targeting domain, the length of which is from 19 to 24 nucleotides, where the first vector and the second vector are designed to form the first and second double-strand breaks in the first intron and second intron flanking, respectively, exon 51 of the human DMD gene, due to which the deletion of the dystrophin gene segment containing exon 51 is ensured.

Настоящее изобретение также относится к клетке, содержащей вышеописанную композицию.The present invention also relates to a cell containing the above composition.

Настоящее изобретение также относится к способу коррекции мутантного гена дистрофина в клетке, предусматривающему введение в клетку (a) первого вектора, содержащего полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второго вектора, содержащего полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).The present invention also relates to a method for correcting a mutant dystrophin gene in a cell, comprising introducing into the cell (a) a first vector containing a polynucleotide sequence encoding a first guide RNA (gRNA) molecule and a polynucleotide sequence encoding a first Cas9 molecule that recognizes an adjacent protospacer motif (PAM) either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25); and (b) a second vector containing a polynucleotide sequence encoding a second gRNA molecule and a polynucleotide sequence encoding a second Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO : 25).

Каждая из первой молекулы gRNA и второй молекулы gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.Each of the first gRNA molecule and the second gRNA molecule contains a targeting domain, the length of which is from 19 to 24 nucleotides, where the vector is designed to form the first and second double-strand breaks, respectively, in the first and second introns flanking exon 51 of the human dystrophin gene, due to which a deletion of the dystrophin gene segment containing exon 51 is provided.

Настоящее изобретение также относится к способу лечения субъекта, нуждающегося в этом, у которого имеется мутантный ген дистрофина. Способ предусматривает введение субъекту (a) первого вектора, содержащего полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второго вектора, содержащего полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).The present invention also relates to a method of treating a subject in need thereof who has a mutated dystrophin gene. The method involves administering to the subject (a) a first vector containing a polynucleotide sequence encoding a first guide RNA molecule (gRNA) and a polynucleotide sequence encoding a first Cas9 molecule that recognizes a protospacer adjacent motif (PAM) or NNGRRT (SEQ ID NO: 24) , or NNGRRV (SEQ ID NO: 25); and (b) a second vector containing a polynucleotide sequence encoding a second gRNA molecule and a polynucleotide sequence encoding a second Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO : 25).

Каждая из первой молекулы gRNA и второй молекулы gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.Each of the first gRNA molecule and the second gRNA molecule contains a targeting domain, the length of which is from 19 to 24 nucleotides, where the vector is designed to form the first and second double-strand breaks, respectively, in the first and second introns flanking exon 51 of the human dystrophin gene, due to which a deletion of the dystrophin gene segment containing exon 51 is provided.

Настоящее изобретение также относится к способу получения трансгенного эмбриона грызуна, у которого имеется ген дистрофина человека (hDMD), с делецией экзона 52 (Δ52). Способ предусматривает введение эмбриону грызуна вышеописанной gRNA, вышеописанной системы для нацеливания на ДНК, вышеописанного выделенного полинуклеотида, вышеописанного вектора, вышеописанного модифицированного вектора на основе аденоассоциированного вируса или вышеописанной композиции, за счет чего обеспечивается делеция экзона 52 из гена дистрофина человека, и отбор трансгенного эмбриона грызуна, у которого имеется делеция экзона 52 гена дистрофина человека, где эмбрион грызуна содержит нормальный ген дистрофина человека.The present invention also relates to a method for producing a transgenic rodent embryo that has the human dystrophin gene (hDMD) with a deletion of exon 52 (Δ52). The method involves administering to a rodent embryo the above-described gRNA, the above-described DNA targeting system, the above-described isolated polynucleotide, the above-described vector, the above-described modified adeno-associated virus-based vector, or the above-described composition, thereby ensuring the deletion of exon 52 from the human dystrophin gene, and selection of a transgenic rodent embryo , which has a deletion of exon 52 of the human dystrophin gene, where the rodent embryo contains the normal human dystrophin gene.

- 3 042798- 3 042798

Настоящее изобретение также относится к трансгенному эмбриону грызуна, полученному с помощью вышеописанного способа.The present invention also relates to a transgenic rodent embryo obtained using the method described above.

Настоящее изобретение также относится к трансгенному грызуну, полученному из вышеописанного трансгенного эмбриона грызуна.The present invention also relates to a transgenic rodent derived from the transgenic rodent embryo described above.

Краткое описание графических материаловBrief description of graphic materials

На фиг. 1 показана активность отдельных JCR89 и JCR91 gRNA, которые нацеливают ген дистрофина человека в клетках HEK293T (ген дистрофина дикого типа) и линии миобластов пациентов с DMD (DMD 8036 и DMD 6594, каждый из которых обладает мутантной формой гена дистрофина), определенной с помощью анализа Surveyor.In FIG. 1 shows the activity of individual JCR89 and JCR91 gRNAs that target the human dystrophin gene in HEK293T cells (wild-type dystrophin gene) and a DMD patient myoblast line (DMD 8036 and DMD 6594, each with a mutant form of the dystrophin gene) determined by analysis. surveyor.

На фиг. 2A и 2B показана делеция экзона 51 в геномной ДНК клеток HEK293T и миобластах пациентов с DMD (DMD 8036 и DMD 6594) (фиг. 2A) и кДНК из миобластов миобластов пациентов с DMD (фиг. 2B) с помощью совместной обработки SaCas9, и gRNA JCR89, и JCR91.In FIG. 2A and 2B show exon 51 deletion in genomic DNA of HEK293T cells and DMD patient myoblasts (DMD 8036 and DMD 6594) (Fig. 2A) and cDNA from DMD patient myoblast myoblasts (Fig. 2B) by co-processing SaCas9, and gRNA JCR89, and JCR91.

На фиг. 3 показана система на основе AAV in vivo для совместной доставки SaCas9 и JCR89 и JCR91 gRNA в двух вирусных векторах к мышечным тканям.In FIG. 3 shows an in vivo AAV-based system for co-delivery of SaCas9 and JCR89 and JCR91 gRNA in two viral vectors to muscle tissues.

На фиг. 4 показано выявление делеции экзона 51 человека у трансгенных мышей, несущих ген DMD человека (hDMD/mdx мышей), после местной доставки вирусных векторов AAV8, несущих SaCas9 и gRNA, в переднюю большеберцовую мышцу (TA).In FIG. 4 shows the detection of human exon 51 deletion in transgenic mice carrying the human DMD gene (hDMD/mdx mice) following local delivery of AAV8 viral vectors carrying SaCas9 and gRNA to the tibialis anterior (TA).

На фиг. 5 показано выявление делеции экзона 51 человека у трансгенных мышей, несущих ген hDMD, после системной доставки AAV8 с помощью инъекции в хвостовую вену.In FIG. 5 shows the detection of human exon 51 deletion in transgenic mice carrying the hDMD gene following systemic delivery of AAV8 by tail vein injection.

На фиг. 6 показаны различные мишени gRNA, которые сохраняются между геномами человека и макака-резуса (см. последовательности gRNA в табл. 2). Расположение каждой gRNA указано по отношению к экзону 51 гена дистрофина человека.In FIG. 6 shows the various gRNA targets that persist between the human and rhesus monkey genomes (see gRNA sequences in Table 2). The location of each gRNA is indicated relative to exon 51 of the human dystrophin gene.

На фиг. 7 показана активность отдельных gRNA после трансфекции клеток HEK293T человека, определенных с помощью анализа Surveyor.In FIG. 7 shows the activity of individual gRNAs after transfection of human HEK293T cells determined using the Surveyor assay.

На фиг. 8 показана специфичность кандидатных gRNA, предсказанных с применением программы CasOFFinder (Bae et al. (2014), Bioinformatics, 30: 147 3-1475).In FIG. 8 shows the specificity of candidate gRNAs predicted using the CasOFFinder program (Bae et al. (2014), Bioinformatics, 30: 147 3-1475).

На фиг. 9 показана делеция экзона 51 с помощью JCR157 и JCR160 gRNA в клетках HEK293T и клетках DMD 6594, как определено с помощью ПЦР геномной ДНК.In FIG. 9 shows exon 51 deletion by JCR157 and JCR160 gRNA in HEK293T cells and DMD 6594 cells as determined by genomic DNA PCR.

На фиг. 10 показана активность, определенная с помощью Surveyor, различных целевых длин gRNA JCR157: 19, 20, 21, 22 и 23 нуклеотидов.In FIG. 10 shows the Surveyor activity of various JCR157 gRNA target lengths: 19, 20, 21, 22, and 23 nucleotides.

На фиг. 11 показана активность, определенная с помощью Surveyor, различных целевых длин gRNA JCR160: 19, 20, 21, 22 и 23 нуклеотидов.In FIG. 11 shows the Surveyor activity of various JCR160 gRNA target lengths: 19, 20, 21, 22, and 23 nucleotides.

На фиг. 12 показаны делеции, полученные путем объединения JCR157 и JCR160 различной длины (21, 22 или 23 нуклеотида), как определено с помощью ПЦР геномной ДНК.In FIG. 12 shows deletions obtained by combining JCR157 and JCR160 of various lengths (21, 22 or 23 nucleotides) as determined by genomic DNA PCR.

На фиг. 13 показана целевая нуклеазная активность с помощью анализа Surveyor in vitro.In FIG. 13 shows targeted nuclease activity using the Surveyor in vitro assay.

На фиг. 14 показана делеция экзона 51 в геномной ДНК in vitro.In FIG. 14 shows exon 51 deletion in genomic DNA in vitro.

На фиг. 15 показана делеция экзона 51 в кДНК миобластов DMD человека in vitro, дифференцированных в течение 7 дней.In FIG. 15 shows exon 51 deletion in in vitro human DMD myoblast cDNA differentiated for 7 days.

На фиг. 16 показано соединение экзонов 47-52 в кДНК миобластов пациентов с DMD in vitro.In FIG. 16 shows the splicing of exons 47-52 in myoblast cDNA from patients with DMD in vitro.

На фиг. 17 показана конструкция мыши A52/mdx начиная со здоровой мыши hDMD/mdx.In FIG. 17 shows the construction of an A52/mdx mouse starting from a healthy hDMD/mdx mouse.

На фиг. 18 показана проверка соответствия направляющей последовательности in vitro: индивидуальная (анализ Surveyor).In FIG. 18 shows an in vitro guideline compliance test: individual (Surveillor analysis).

На фиг. 19 показана проверка соответствия направляющей последовательности in vitro: парная, при этом делецию экзона 51 в геномной ДНК клеток HEK293T создавали с использованием пары gRNA.In FIG. 19 shows in vitro guideline matching: paired, where a deletion of exon 51 in the genomic DNA of HEK293T cells was created using a gRNA pair.

На фиг. 20 показан схематический протокол для микроинъекций ДНК.In FIG. 20 shows a schematic protocol for DNA microinjection.

На фиг. 21 показано схематическое скрещивание мышей.In FIG. 21 shows a schematic crossbreeding of mice.

На фиг. 22 показаны результаты генотипирования мышей-основателей.In FIG. 22 shows the results of genotyping founding mice.

На фиг. 23 показана часть результатов секвенирования у мышей-основателей 7, 63 и 76.In FIG. 23 shows a portion of the sequencing results for founding mice 7, 63, and 76.

На фиг. 24 показано схематическое дополнительное скрещивание мышей.In FIG. 24 shows a schematic of additional crossing of mice.

На фиг. 25 показано генотипирование помета 5 (только самцы) в результате скрещивания самца основателя 76+mdx/mdx. 63 представляет собой самца основателя (однако в данном случае не родителя). 293 представляет клетку HEK293T геномной контрольной ДНК.In FIG. 25 shows the genotyping of litter 5 (males only) from a 76 + mdx/mdx founder male. 63 represents the male founder (however, in this case, not the parent). 293 represents the HEK293T cell of the genomic control DNA.

На фиг. 26 показано генотипирование помета 1 в результате скрещивания самца основателя 63+mdx/mdx.In FIG. 26 shows the genotyping of litter 1 from a 63+mdx/mdx founder male.

На фиг. 27 показана часть прочтения секвенирования размером 392 п.о. детенышей 54497 и 54498.In FIG. 27 shows a portion of a 392 bp sequencing read. cubs 54497 and 54498.

На фиг. 28 показано иммуногистохимическое окрашивание сердца и TA из детенышей 54497 и 54498.In FIG. 28 shows immunohistochemical staining of the heart and TA from pups 54497 and 54498.

На фиг. 29 показано, что у мыши A52/mdx отсутствует белок дистрофин.In FIG. 29 shows that the A52/mdx mouse lacks the dystrophin protein.

На фиг. 30 показан вестерн-блоттинг, указывающий на то, что у мыши A52/mdx отсутствует белок дистрофин, что согласуется с генотипом DMD, тогда как у здоровой мыши hDMD/mdx экспрессировался дистрофин.In FIG. 30 shows a Western blot indicating that the A52/mdx mouse lacks the dystrophin protein, consistent with the DMD genotype, while the healthy hDMD/mdx mouse expressed dystrophin.

- 4 042798- 4 042798

На фиг. 31 показана общая активность мыши A52/mdx по сравнению с мышами mdx и мышами hDMD/mdx, указанная на основании двигательной активности и осмотра.In FIG. 31 shows the overall activity of an A52/mdx mouse compared to mdx mice and hDMD/mdx mice based on locomotor activity and visual inspection.

На фиг. 32 показана стратегия коррекции мыши A52/mdx с применением SaCas9 и gRNA для пропуска экзона 51 с помощью нацеливания gRNA выше и ниже экзона 51 в интронной области для удаления.In FIG. 32 shows a strategy to correct the A52/mdx mouse using SaCas9 and gRNA to skip exon 51 by targeting gRNA upstream and downstream of exon 51 in the intron region for deletion.

На фиг. 33 показано восстановление белка дистрофина in vitro из делеции экзона 51 в миобластах пациента с DMD (клетки DMD 6594) с применением SaCas9 и JCR179 и JCR183 gRNA.In FIG. 33 shows in vitro recovery of dystrophin protein from an exon 51 deletion in DMD patient myoblasts (DMD 6594 cells) using SaCas9 and JCR179 and JCR183 gRNA.

На фиг. 34 показана схема эксперимента по обработке мыши A52/mdx с применением gRNA и системы SaCas9.In FIG. 34 shows a schematic of an A52/mdx mouse processing experiment using gRNA and the SaCas9 system.

На фиг. 35 показана делеция экзона 51 in vivo в правой TA мышце.In FIG. 35 shows an in vivo exon 51 deletion in the right TA muscle.

На фиг. 36 показана делеция экзона 51 in vivo в правой TA мышце.In FIG. 36 shows an in vivo exon 51 deletion in the right TA muscle.

На фиг. 37 показано восстановление белка дистрофина in vivo в обработанной TA мышце.In FIG. 37 shows in vivo recovery of dystrophin protein in TA-treated muscle.

На фиг. 38 показано восстановление белка дистрофина in vivo в обработанной TA мышце.In FIG. 38 shows in vivo recovery of dystrophin protein in TA-treated muscle.

На фиг. 39 показано среднее значение всех моментов времени для общего пройденного расстояния.In FIG. 39 shows the average of all times for the total distance travelled.

На фиг. 40 показано среднее значение всех моментов времени для общего количества поз со стоянием на задних лапах.In FIG. 40 shows the average of all time points for the total number of rear-legged postures.

На фиг. 41 показана сила хватки 16-недельных необработанных и обработанных мышей.In FIG. 41 shows the grip strength of 16 week old untreated and treated mice.

На фиг. 42 показаны результаты ПЦР кДНК сердечной ткани.In FIG. 42 shows the results of PCR cDNA of cardiac tissue.

На фиг. 43 показано секвенирование кДНК, амплифицированной с помощью ПЦР, на основании полос из фиг. 42.In FIG. 43 shows sequencing of cDNA amplified by PCR based on the bands from FIG. 42.

Подробное описание изобретенияDetailed description of the invention

Описанные в данном документе определенные способы и сконструированные gRNA были раскрыты для того, чтобы быть полезными для систем редактирования генов на основе CRISPR/CRISPRассоциированной (Cas) 9 для изменения экспрессии, конструирования генома и коррекции или уменьшения эффектов мутаций в гене дистрофина, вовлеченном в генетические заболевания, например DMD. Раскрытые gRNA получали для целевых сайтов, которые больше поддаются переходу к клиническому применению. Например, ген, кодирующий Cas9 (SpCas9) S. pyogenes, слишком большой для доставки с помощью аденоассоциированного вируса (AAV), вектора, применяемого для системной доставки в мышцы, в случае если включены все другие необходимые регуляторные последовательности. Вместо этого раскрытые gRNA отбирали и подвергали скринингу для использования с Cas9 (SaCas9) S. aureus, который приблизительно на 1 т.о. меньше, чем SpCas9. Целевые отборы подвергали скринингу, для того чтобы быть совместимыми с мишенями SaCas9 в последовательностях, которые сохранялись между геномами человека и макаков-резусов, что значительно ограничивает количество возможных генных мишеней. Этот критерий отбора был выбран с тем, чтобы обеспечить возможность кандидатам gRNA, которые могут быть активными как у людей, так и у макаков-резусов, облегчить доклиническое тестирование на моделях приматов, отличных от человека. Раскрытые gRNA, которые нацеливаются на последовательности гена дистрофина как человека, так и макака-резуса, могут применяться с системой на основе CRISPR/Cas9 для нацеливания на интронные области вокруг экзона 51 гена дистрофина человека, вызывая геномные делеции этой области, для восстановления экспрессии функционального дистрофина в клетках от пациентов с DMD.Certain methods and engineered gRNAs described herein have been disclosed to be useful for CRISPR/CRISPR-associated (Cas)9 based gene editing systems for altering expression, genome engineering, and correcting or reducing the effects of mutations in the dystrophin gene involved in genetic diseases. , such as DMD. Opened gRNAs were generated for target sites that are more amenable to transition to clinical use. For example, the gene encoding Cas9 (SpCas9) of S. pyogenes is too large to be delivered by adeno-associated virus (AAV), a vector used for systemic muscle delivery, when all other necessary regulatory sequences are included. Instead, the opened gRNAs were selected and screened for use with S. aureus Cas9 (SaCas9), which is approximately 1 kb. less than SpCas9. Target selections have been screened to be compatible with SaCas9 targets in sequences that are conserved between the human and rhesus monkey genomes, greatly limiting the number of possible gene targets. This selection criterion was chosen to allow gRNA candidates that may be active in both humans and rhesus monkeys to facilitate preclinical testing in non-human primate models. The disclosed gRNAs that target both human and rhesus dystrophin gene sequences can be used with a CRISPR/Cas9 based system to target the intron regions around exon 51 of the human dystrophin gene, causing genomic deletions in this region, to restore functional dystrophin expression in cells from patients with DMD.

Также в данном документе описаны генетические конструкции, композиции и способы доставки систем редактирования генов на основе CRISPR/Cas9 и множество gRNA для нацеливания на ген дистрофина. Раскрытый в настоящем изобретении объект изобретения также предусматривает способы доставки генетических конструкций (например, векторов) или содержащих их композиций в скелетную мышцу и сердечную мышцу. Вектор может представлять собой AAV, в том числе модифицированные векторы на основе AAV. Раскрытый в настоящем изобретении объект изобретения описывает способ доставки активных форм лекарственных средств данного класса в скелетную мышцу и сердечную мышцу, которые являются эффективными, действенными и способствуют успешной модификации генома, а также обеспечивает средства для исправления генома человека для терапевтических применений и целевых модельных видов для фундаментальных научных применений.Also described herein are genetic constructs, compositions, and methods for delivering CRISPR/Cas9-based gene editing systems and multiple gRNAs for targeting the dystrophin gene. The object of the invention disclosed in the present invention also provides methods for delivering genetic constructs (eg, vectors) or compositions containing them to skeletal muscle and cardiac muscle. The vector may be an AAV, including modified AAV-based vectors. The object of the invention disclosed in the present invention describes a method for delivering active forms of drugs of this class to skeletal muscle and cardiac muscle that are effective, efficient and contribute to successful modification of the genome, and also provides a means to correct the human genome for therapeutic applications and target model species for fundamental scientific applications.

Заголовки разделов, используемые в данном разделе, и полное раскрытие данного документа представлены просто для организационных целей и не подразумеваются как ограничивающие.The section headings used in this section and the full disclosures in this document are provided for organizational purposes only and are not intended to be limiting.

1. Определения.1. Definitions.

Если не определено иное, то все технические и научные термины, используемые в данном документе, имеют такое же значение, как обычно понятно специалисту в данной области техники. В случае противоречий преимущественную силу будет иметь данный документ, содержащий определения. Предпочтительные способы и материалы описаны ниже, хотя при практическом осуществлении или тестировании настоящего изобретения можно использовать способы и материалы, аналогичные или эквивалентные описанным в данном документе. Все публикации, заявки на патенты, патенты и другие ссылочные материалы, упомянутые в данном документе, включены посредством ссылки во всей своей полноте. Материалы, способы и примеры, раскрытые в данном документе, являются лишь иллюстративными и неUnless otherwise defined, all technical and scientific terms used in this document have the same meaning as is commonly understood by a person skilled in the art. In the event of any conflict, this definition document shall prevail. Preferred methods and materials are described below, although similar or equivalent methods and materials to those described herein may be used in the practice or testing of the present invention. All publications, patent applications, patents and other references mentioned in this document are incorporated by reference in their entirety. The materials, methods, and examples disclosed herein are illustrative only and are not

- 5 042798 подразумеваются как ограничивающие.- 5 042798 are intended to be limiting.

Подразумевается, что термины содержат(ит), в том числе, имеющий, имеет, может, включает(ют) и их варианты, используемые в данном документе, являются открытыми переходными фразами, терминами или словами, которые не исключают возможность наличия дополнительных действий или структур. Формы единственного числа включают ссылки на множественное число, если контекст явно не указывает на иное. Настоящее изобретение также охватывает другие варианты осуществления, содержащие варианты осуществления или элементы, представленные в данном документе, состоящие из них и фактически состоящие из них, независимо от того, изложены они явным образом или нет.The terms contain(s), including, has, has, may, includes(s) and their variations used in this document are open transitional phrases, terms or words that do not exclude the possibility of additional actions or structures . The singular forms include references to the plural unless the context clearly indicates otherwise. The present invention also covers other embodiments that comprise, comprise, and actually consist of the embodiments or elements presented herein, whether or not they are expressly stated.

При упоминании в данном документе числовых диапазонов каждое промежуточное число в них охватывается явным образом с той же степенью точности. Например, в случае диапазона 6-9 в дополнение к 6 и 9 охватываются числа 7 и 8, а в случае диапазона 6,0-7,0 явным образом охватываются числа 6,0, 6,1, 6,2, 6,3, 6,4, 6,5, 6,6, 6,7, 6,8, 6,9 и 7,0.Whenever numeric ranges are mentioned in this document, each intermediate number is explicitly covered within the range to the same degree of precision. For example, in the case of the range 6-9, the numbers 7 and 8 are covered in addition to 6 and 9, and in the case of the range 6.0-7.0, the numbers 6.0, 6.1, 6.2, 6.3 are explicitly covered. , 6.4, 6.5, 6.6, 6.7, 6.8, 6.9 and 7.0.

Используемый в данном документе термин приблизительно или примерно означает допустимый диапазон ошибок для конкретного уровня, определенного специалистом в данной области техники, который частично будет зависеть от того, как измеряют или определяют уровень, т.е. ограничений в системе измерения. Например, приблизительно может означать 3 или более 3 стандартных отклонений в соответствии с практикой в данной области техники. В качестве альтернативы приблизительно может означать диапазон до 20%, предпочтительно до 10%, более предпочтительно до 5% и более предпочтительно до 1% от данного уровня. В качестве альтернативы, в частности, в соответствии с биологическими системами или процессами термин может означать в пределах одного порядка величины предпочтительно в 5 раз и более предпочтительно в 2 раза от значения.As used herein, approximately or approximately means the allowable error range for a particular level as determined by one of ordinary skill in the art, which will depend in part on how the level is measured or determined, ie. limitations in the measurement system. For example, approximately can mean 3 or more than 3 standard deviations, in accordance with practice in the art. Alternatively, approximately can mean a range of up to 20%, preferably up to 10%, more preferably up to 5%, and more preferably up to 1% of this level. Alternatively, in particular in accordance with biological systems or processes, the term may mean within one order of magnitude, preferably 5 times and more preferably 2 times the meaning.

Термины аденоассоциированный вирус или AAV, используемые в данном документе взаимозаменяемо, относятся к небольшому вирусу, принадлежащему к роду Dependovirus семейства Parvoviridae, который инфицирует людей и некоторые другие виды приматов. В настоящее время AAV не вызывает болезни, а следовательно вирус вызывает очень умеренный иммунный ответ.The terms adeno-associated virus or AAV, used interchangeably herein, refer to a small virus belonging to the Dependovirus genus of the Parvoviridae family that infects humans and certain other primate species. Currently, AAV does not cause disease, and therefore the virus elicits a very mild immune response.

Используемый в данном документе термин область связывания относится к области в целевой области для нуклеазы, которая распознается и связывается нуклеазой.As used herein, the term binding region refers to the region within the target region for a nuclease that is recognized and bound by the nuclease.

Термины сердечная мышца или мышца сердца, используемые в данном документе взаимозаменяемо, означают тип рефлективной поперечно-полосатой мышцы, обнаруженной в стенках и гистологической основе сердца - миокарде. Сердечная мышца состоит из кардиомиоцитов или миокардиоцитов. Миокардиоциты демонстрируют полосатость, сходную с таковой в скелетных мышечных клетках, однако содержат лишь одно уникальное ядро в отличие от многоядерных скелетных мышц. В определенных вариантах осуществления термин состояние сердечной мышцы относится к состоянию, связанному с сердечной мышцей, такому как кардиомиопатия, сердечная недостаточность, аритмия и воспалительная болезнь сердца.The terms cardiac muscle or cardiac muscle, used interchangeably herein, refer to the type of reflective striated muscle found in the walls and histological basis of the heart, the myocardium. The heart muscle is made up of cardiomyocytes or myocardiocytes. Myocardiocytes show banding similar to that of skeletal muscle cells, but contain only one unique nucleus, unlike multinucleated skeletal muscle. In certain embodiments, the term heart muscle condition refers to a condition associated with the heart muscle, such as cardiomyopathy, heart failure, arrhythmia, and inflammatory heart disease.

Используемый в данном документе термин кодирующая последовательность или кодирующая нуклеиновая кислота означает нуклеиновые кислоты (молекулу РНК или ДНК), которые содержат нуклеотидную последовательность, кодирующую белок. Кодирующая последовательность может дополнительно включать в себя сигналы инициации и терминации, функционально связанные с регуляторными элементами, в том числе промотор и сигнал полиаденилирования, способные управлять экспрессией в клетках индивидуума или млекопитающего, которому вводят нуклеиновую кислоту. Кодирующая последовательность может являться кодон-оптимизированной.As used herein, the term coding sequence or coding nucleic acid refers to nucleic acids (an RNA or DNA molecule) that contain a nucleotide sequence encoding a protein. The coding sequence may further include initiation and termination signals operably linked to regulatory elements, including a promoter and a polyadenylation signal capable of directing expression in cells of the individual or mammal receiving the nucleic acid. The coding sequence may be codon-optimized.

Используемый в данном документе термин комплементарная последовательность или комплементарный означает, что нуклеиновая кислота может образовывать пары оснований согласно УотсонуКрику (например, A-T/U и C-G) или Хугстену между нуклеотидами или нуклеотидными аналогами молекул нуклеиновых кислот. Термин комплементарность относится к свойству, разделяемому двумя последовательностями нуклеиновой кислоты, за счет которого, в случае если они выровнены антипараллельно друг другу, нуклеотидные основания в каждом положении будут комплементарными.As used herein, the term complementary sequence or complementary means that a nucleic acid can form base pairs according to Watson Crick (eg, A-T/U and C-G) or Hoogsten between nucleotides or nucleotide analogs of nucleic acid molecules. The term complementarity refers to the property shared by two nucleic acid sequences, due to which, if they are aligned antiparallel to each other, the nucleotide bases at each position will be complementary.

Термины коррекция, редактирование генома и восстановление, используемые в данном документе, относятся к изменению мутантного гена, который кодирует усеченный белок или вообще не кодирует какой-либо белок, за счет чего достигается экспрессия полноразмерного функционального или частично полноразмерного функционального белка. Коррекция или восстановление мутантного гена может предусматривать замену области гена, в которой имеется мутация, или замену всего мутантного гена копией гена, в которой мутация отсутствует, с помощью механизма репарации, такого как репарация с участием гомологичной рекомбинации (HDR). Коррекция или восстановление мутантного гена может также предусматривать репарацию мутации со сдвигом рамки, которая является причиной преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга, путем создания двухнитевого разрыва в гене, который затем репарируют с использованием негомологичного соединения концов (NHEJ). За счет NHEJ может добавляться или удаляться по меньшей мере одна пара оснований в ходе репарации, что может восстанавливать соответствующую рамку считывания и устранять преждевременный стоп-кодон. Коррекция или восстановление мутантного гена такжеThe terms repair, genome editing, and repair, as used herein, refer to altering a mutant gene that encodes a truncated protein or no protein at all, thereby achieving the expression of a full-length functional or partially full-length functional protein. Correcting or restoring a mutated gene may involve replacing a region of a gene that has a mutation, or replacing the entire mutated gene with a copy of a gene that does not have the mutation, using a repair mechanism such as homologous recombination repair (HDR). Correcting or repairing a mutant gene may also involve repairing the frameshift mutation that causes the premature stop codon, aberrant splice acceptor site, or aberrant splice donor site by creating a double-strand break in the gene, which is then repaired using non-homologous end joining (NHEJ) . At least one base pair can be added or removed by NHEJ during repair, which can restore the appropriate reading frame and eliminate the premature stop codon. Correction or restoration of the mutant gene is also

- 6 042798 может предусматривать разрушение аберрантного сайта акцептора сплайсинга или последовательности донора сплайсинга. Коррекция или восстановление мутантного гена может также предусматривать удаление сегмента гена, не являющегося существенно важным, путем одновременного воздействия двух нуклеаз на одну и ту же нить ДНК, для того чтобы восстановить соответствующую рамку считывания путем удаления ДНК между двумя сайтами-мишенями для нуклеаз и репарации разрыва ДНК с помощью NHEJ.- 6 042798 may involve the destruction of an aberrant splice acceptor site or splice donor sequence. Correction or repair of a mutated gene may also involve the removal of a non-essential segment of the gene by simultaneously exposing the same DNA strand to two nucleases in order to restore the appropriate reading frame by removing the DNA between the two nuclease target sites and repairing the break. DNA with NHEJ.

Термины донорная ДНК, донорная матрица и матрица репарации, используемые в данном документе взаимозаменяемо, относятся к фрагменту или молекуле двухнитевой ДНК, которая включает в себя по меньшей мере часть представляющего интерес гена. Донорная ДНК может кодировать полнофункциональный белок или частично функциональный белок.The terms donor DNA, donor template, and repair template, used interchangeably herein, refer to a double-stranded DNA fragment or molecule that includes at least a portion of a gene of interest. The donor DNA may encode a fully functional protein or a partially functional protein.

Термин мышечная дистрофия Дюшенна или DMD, используемый в данном документе взаимозаменяемо, относится к рецессивному, фатальному, X-сцепленному нарушению, которое приводит к дегенерации мышц и впоследствии смертельному исходу. DMD является распространенным наследственным моногенным заболеванием и встречается у 1 из 3500 мужчин. DMD является результатом врожденных или спонтанных мутаций, которые вызывают нонсенс-мутации или мутации со сдвигом рамки в гене дистрофина. Большинство мутаций дистрофина, которые являются причиной DMD, представляют собой делеции экзонов, которые разрушают рамку считывания и приводят к преждевременной терминации трансляции в гене дистрофина. Пациенты с DMD обычно теряют способность физически поддерживать себя на протяжении детства, постепенно становятся слабее в подростковом возрасте и умирают в возрасте от двадцати до тридцати лет.The term Duchenne muscular dystrophy or DMD, used interchangeably herein, refers to a recessive, fatal, X-linked disorder that results in muscle degeneration and subsequently death. DMD is a common hereditary monogenic disorder and occurs in 1 in 3500 men. DMD is the result of congenital or spontaneous mutations that cause nonsense or frameshift mutations in the dystrophin gene. Most of the dystrophin mutations that cause DMD are exon deletions that destroy the reading frame and lead to premature termination of translation in the dystrophin gene. Patients with DMD usually lose the ability to physically support themselves during childhood, gradually become weaker during adolescence, and die in their twenties and thirties.

Используемый в данном документе термин дистрофин относится к стержнеобразному цитоплазматическому белку, который является частью белкового комплекса, соединяющего цитоскелет мышечного волокна с окружающим внеклеточным матриксом через клеточную мембрану. Дистрофин обеспечивает структурную стабильность дистрогликанового комплекса клеточной мембраны, который отвечает за регуляцию целостности и функции мышечных клеток. Ген дистрофина или ген DMD, используемые в данном документе взаимозаменяемо, образован 2,2 млн пар оснований в локусе Xp21. Размер первичного транскрипта составляет приблизительно 2400 т.о., при этом размер зрелой mRNA составляет приблизительно 14 т.о. 79 экзонов кодируют белок, образованный более чем 3500 аминокислотами.As used herein, the term dystrophin refers to a rod-shaped cytoplasmic protein that is part of the protein complex that connects the muscle fiber cytoskeleton to the surrounding extracellular matrix across the cell membrane. Dystrophin provides structural stability to the cell membrane dystroglycan complex, which is responsible for regulating the integrity and function of muscle cells. The dystrophin gene or DMD gene, used interchangeably herein, is formed at 2.2 million base pairs at the Xp21 locus. The primary transcript is approximately 2400 kb, while the mature mRNA is approximately 14 kb. 79 exons code for a protein made up of more than 3500 amino acids.

Термин экзон 51, используемый в данном документе, относится к 51-му экзону гена дистрофина. Экзон 51 у пациентов с DMD часто является смежным с положениями делеций, разрушающих рамку считывания, и в клинических испытаниях на него был направлен пропуск экзона, основанный на применении олигонуклеотидов. Недавно в клиническом испытании с пропуском экзона 51 с помощью соединения этерлипсена сообщалось о значительном положительном функциональном эффекте в течение 48 недель со средним количеством дистрофин-положительных волокон 47% по сравнению с исходным уровнем. Мутации в экзоне 51 идеально подходят для устойчивой коррекции посредством редактирования генома на основе NHEJ.The term exon 51 as used herein refers to exon 51 of the dystrophin gene. Exon 51 in DMD patients is often adjacent to in-frame deletion positions and has been targeted by oligonucleotide-based exon skipping in clinical trials. Recently, an exon 51 skipping clinical trial with an Eterlipsen compound reported a significant functional benefit over 48 weeks with a mean dystrophin-positive fiber count of 47% from baseline. Mutations in exon 51 are ideally suited for robust correction through NHEJ-based genome editing.

Термины сдвиг рамки или мутация сдвига рамки, используемые в данном документе взаимозаменяемо, относятся к типу мутации гена, при которой добавление или делеция одного или нескольких нуклеотидов вызывает сдвиг в рамке считывания кодонов в mRNA. Сдвиг в рамке считывания может привести к изменению аминокислотной последовательности при трансляции белка, такой как миссенсмутация или преждевременный стоп-кодон.The terms frameshift or frameshift mutation, used interchangeably herein, refer to a type of gene mutation in which the addition or deletion of one or more nucleotides causes a shift in the reading frame of codons in mRNA. A shift in reading frame can result in an amino acid sequence change during protein translation, such as a missense mutation or a premature stop codon.

Термины функциональный и полнофункциональный, используемые в данном документе взаимозаменяемо, описывают белок, который обладает биологической активностью. Термин функциональный ген относится к гену, транскрибируемому в mRNA, которая подвергается трансляции в функциональный белок.The terms functional and fully functional, used interchangeably herein, describe a protein that has biological activity. The term functional gene refers to a gene transcribed into an mRNA that undergoes translation into a functional protein.

Термин слитый белок, используемый в данном документе, относится к химерному белку, созданному путем соединения двух или более генов, которые исходно кодировали отдельные белки. Трансляция гибридного гена приводит к получению одного полипептида с функциональными свойствами, полученными от каждого из исходных белков.The term fusion protein as used herein refers to a chimeric protein created by joining two or more genes that originally coded for separate proteins. Translation of the hybrid gene results in a single polypeptide with functional properties derived from each of the original proteins.

Термин генетическая конструкция, используемый в данном документе, относится к молекулам ДНК или РНК, которые содержат нуклеотидную последовательность, кодирующую белок. Кодирующая последовательность включает в себя сигналы инициации и терминации, функционально связанные с регуляторными элементами, в том числе промотор и сигнал полиаденилирования, способные управлять экспрессией в клетках индивидуума, которому вводят молекулу нуклеиновой кислоты. Используемый в данном документе термин экспрессируемая форма относится к генным конструкциям, которые содержат необходимые регуляторные элементы, функционально связанные с кодирующей последовательностью, которая кодирует белок, за счет чего, в случае если он присутствует в клетке индивидуума, кодирующая последовательность будет экспрессироваться.The term genetic construct as used herein refers to DNA or RNA molecules that contain a nucleotide sequence encoding a protein. The coding sequence includes initiation and termination signals operably linked to regulatory elements, including a promoter and a polyadenylation signal capable of directing expression in the cells of an individual to whom the nucleic acid molecule is administered. As used herein, the term expressed form refers to gene constructs that contain the necessary regulatory elements operably linked to a coding sequence that encodes a protein such that, if present in a cell of an individual, the coding sequence will be expressed.

Используемый в данном документе термин генетическое заболевание относится к заболеванию, частично или полностью, непосредственно или косвенно вызванному одним или несколькими нарушениями в геноме, особенно к состоянию, которое присутствует от рождения. Нарушение может являться мутацией, вставкой или делецией. Нарушение может влиять на кодирующую последовательность генаAs used herein, the term genetic disease refers to a disease, in whole or in part, directly or indirectly caused by one or more disorders in the genome, especially a condition that is present from birth. The disorder may be a mutation, insertion, or deletion. The disorder can affect the coding sequence of a gene

- 7 042798 или его регуляторную последовательность. Генетическое заболевание может представлять собой без ограничения DMD, мышечную дистрофию Беккера (BMD), гемофилию, кистозный фиброз, хорею Гантингтона, семейную гиперхолестеринемию (дефект рецептора LDL), гепатобластому, болезнь Вилсона, врожденную печеночную порфирию, наследственные нарушения обменных процессов в печени, синдром Леша-Нихана, серповидно-клеточную анемию, талассемию, пигментную ксеродермию, анемию Фанкони, пигментный ретинит, атаксию телеангиэктазию, синдром Блума, ретинобластому и болезнь ТайСакса.- 7 042798 or its regulatory sequence. The genetic disorder may be, but is not limited to, DMD, Becker muscular dystrophy (BMD), hemophilia, cystic fibrosis, Huntington's chorea, familial hypercholesterolemia (LDL receptor defect), hepatoblastoma, Wilson's disease, congenital hepatic porphyria, inherited liver metabolic disorders, Lesch's syndrome - Nihana, sickle cell disease, thalassemia, xeroderma pigmentosa, Fanconi anemia, retinitis pigmentosa, ataxia telangiectasia, Bloom's syndrome, retinoblastoma, and Ty-Sachs disease.

Термин репарация с участием гомологичной рекомбинации или HDR, используемый в данном документе взаимозаменяемо, относится к механизму в клетках для репарации двухнитевых повреждений ДНК, в случае если в ядре присутствует гомологичная часть ДНК, в основном в фазах G2 и S клеточного цикла. В HDR используется матрица донорной ДНК для управления репарацией, и ее можно использовать для создания специфических изменений последовательности в геноме, включая целенаправленное добавление целых генов. Если донорная матрица предоставляется вместе с системой редактирования генов на основе CRISPR/Cas9, то клеточный аппарат осуществляет репарацию разрыва путем гомологичной рекомбинации, которая усиливается на несколько порядков в присутствии расщепления ДНК. В случае если фрагмент гомологичной ДНК отсутствует, вместо этого может происходить негомологичное соединение концов.The term homologous recombination repair or HDR, used interchangeably herein, refers to a mechanism in cells to repair double-stranded DNA damage when a homologous portion of DNA is present in the nucleus, primarily during the G2 and S phases of the cell cycle. HDR uses a donor DNA template to guide repair and can be used to create specific sequence changes in the genome, including the targeted addition of entire genes. If the donor template is provided along with a CRISPR/Cas9-based gene editing system, then the cellular machinery performs rupture repair by homologous recombination, which is enhanced by several orders of magnitude in the presence of DNA cleavage. In the event that a fragment of homologous DNA is missing, non-homologous end joining may occur instead.

Термин редактирование генома, используемый в данном документе, относится к изменению гена. Редактирование генома может предусматривать коррекцию или восстановление мутантного гена. Редактирование генома может предусматривать нокаут гена, такого как мутантный ген или нормальный ген. Редактирование генома можно использовать для лечения заболеваний или улучшения восстановления мышц путем изменения представляющего интерес гена.The term genome editing, as used herein, refers to changing a gene. Genome editing may involve correcting or restoring a mutated gene. Genome editing may involve knocking out a gene, such as a mutated gene or a normal gene. Genome editing can be used to treat diseases or improve muscle recovery by altering a gene of interest.

Термины идентичный или идентичность, используемые в данном документе в контексте двух или более нуклеиновых кислот или полипептидных последовательностей, означают, что последовательности имеют определенный процент остатков, которые являются идентичными в указанной области. Процент может быть рассчитан путем оптимального выравнивания двух последовательностей, сравнения двух последовательностей в указанной области, определения количества положений, в которых одинаковый остаток встречается в обеих последовательностях, с получением количества совпадающих положений, разделяя количество совпадающих положений на общее количество положений в указанной области и умножая результат на 100, чтобы получить процент идентичности последовательности. В случаях если две последовательности имеют разную длину или выравнивание дает в результате одну или несколько ступеней в шахматном порядке, а указанная область сравнения включает в себя только одну последовательность, при расчете эти остатки одной последовательности включаются в знаменатель, но не в числитель. При сравнении ДНК и РНК тимин (T) и урацил (U) можно считать эквивалентом. Идентификацию можно осуществлять вручную или с использованием компьютерного алгоритма для работы с последовательностями, такого как BLAST или BLAST 2.0.The terms identical or identity, as used herein in the context of two or more nucleic acids or polypeptide sequences, means that the sequences have a certain percentage of residues that are identical in a specified region. The percentage can be calculated by optimally aligning two sequences, comparing the two sequences in the specified region, determining the number of positions where the same residue occurs in both sequences to obtain the number of matching positions, dividing the number of matching positions by the total number of positions in the specified region, and multiplying the result by 100 to get percent sequence identity. In cases where two sequences are of different lengths or the alignment results in one or more steps in a checkerboard pattern, and the specified area of comparison includes only one sequence, these remainders of one sequence are included in the denominator, but not in the numerator, in the calculation. When comparing DNA and RNA, thymine (T) and uracil (U) can be considered equivalent. Identification can be done manually or using a computer sequence algorithm such as BLAST or BLAST 2.0.

Термины мутантный ген или мутированный ген, используемые в данном документе взаимозаменяемо, относятся к гену, который был подвергнут выявляемой мутации. Мутантный ген подвергся изменению, такому как потеря, получение или обмен генетического материала, что влияет на нормальную передачу и экспрессию гена. Термин разрушенный ген, используемый в данном документе, относится к мутантному гену, в котором имеется мутация, являющаяся причиной преждевременного стоп-кодона. Продукт разрушенного гена усечен по сравнению с продуктом полноразмерного неразрушенного гена.The terms mutant gene or mutated gene, used interchangeably herein, refer to a gene that has been subjected to a detectable mutation. The mutant gene has undergone a change, such as the loss, gain or exchange of genetic material, which affects the normal transmission and expression of the gene. The term disrupted gene as used herein refers to a mutated gene that has a mutation that causes a premature stop codon. The disrupted gene product is truncated compared to the full length undisrupted gene product.

Термин путь негомологичного соединения концов (NHEJ), используемый в данном документе, относится к пути репарации двухнитевых разрывов ДНК путем прямого лигирования концов разрыва без необходимости в гомологичной матрице. Независимое от матрицы повторное лигирование концов ДНК с помощью NHEJ представляет собой стохастический, подверженный ошибкам процесс репарации, который вводит случайные микровставки и микроделеции (вставки-делеции) в точке разрыва ДНК. Данный способ можно использовать для намеренного разрушения, делеции или изменения рамки считывания последовательностей целевых генов. Для управления репарацией в NHEJ обычно используются короткие гомологичные последовательности ДНК, называемые микрогомологиями. Эти микрогомологии часто присутствуют в однонитевых липких концах на конце двухнитевых разрывов. В случае если липкие концы идеально совместимы, то NHEJ обычно репарирует разрыв точно, однако может иметь место неточная репарация, приводящая к потере нуклеотидов, однако гораздо более часто липкие концы несовместимы.The term non-homologous end joining (NHEJ) pathway as used herein refers to a DNA double-strand break repair pathway by direct ligation of the ends of the break without the need for a homologous template. Template-independent religation of DNA ends with NHEJ is a stochastic, error-prone repair process that introduces random microinsertions and microdeletions (insert-deletions) at the DNA break point. This method can be used to deliberately destroy, delete or change the reading frame of target gene sequences. To guide repair in NHEJ, short homologous DNA sequences, called microhomologies, are commonly used. These microhomologies are often present in single strand sticky ends at the end of double strand breaks. If the sticky ends are perfectly matched, then NHEJ usually repairs the gap accurately, however there may be inaccurate repair resulting in loss of nucleotides, but much more often the sticky ends are mismatched.

Используемый в данном документе термин нормальный ген относится к гену, который не подвергался изменениям, таким как потеря, получение или обмен генетического материала. Нормальный ген подвергается нормальной передаче генов и экспрессии генов.As used herein, the term normal gene refers to a gene that has not undergone changes such as loss, gain or exchange of genetic material. A normal gene undergoes normal gene transfer and gene expression.

Термин опосредованный нуклеазой NHEJ, используемый в данном документе, относится к NHEJ, который инициируется после того, как нуклеаза, такая как молекула Cas9, разрезает двухнитевую ДНК.The term nuclease-mediated NHEJ as used herein refers to NHEJ that is initiated after a nuclease, such as a Cas9 molecule, cuts double-stranded DNA.

Используемые в данном документе термины нуклеиновая кислота, или олигонуклеотид, или полинуклеотид означают по меньшей мере два нуклеотида, ковалентно связанных друг с другом. Изображение одиночной нити также определяет последовательность комплементарной нити. Таким образом,As used herein, the terms nucleic acid or oligonucleotide or polynucleotide means at least two nucleotides covalently linked to each other. The image of a single strand also determines the sequence of the complementary strand. Thus,

- 8 042798 нуклеиновая кислота также охватывает комплементарную нить изображенной одиночной нити. Множество вариантов нуклеиновой кислоты можно использовать для той же цели, что и указанную нуклеиновую кислоту. Таким образом, нуклеиновая кислота также охватывает практически идентичные нуклеиновые кислоты и их комплементарные нити. Одиночная нить обеспечивает зонд, который может гибридизоваться с целевой последовательностью в жестких условиях гибридизации. Таким образом, нуклеиновая кислота также охватывает зонд, который гибридизуется в жестких условиях гибридизации.- 8 042798 nucleic acid also spans the complementary strand of the depicted single strand. Many nucleic acid variants can be used for the same purpose as the specified nucleic acid. Thus, a nucleic acid also encompasses substantially identical nucleic acids and their complementary strands. The single strand provides a probe that can hybridize to the target sequence under stringent hybridization conditions. Thus, the nucleic acid also encompasses a probe that hybridizes under stringent hybridization conditions.

Нуклеиновая кислота может быть однонитевой или двухнитевой или может содержать части как двухнитевой, так и однонитевой последовательности. Нуклеиновая кислота может представлять собой ДНК, как геномную, так и кДНК, РНК или гибридную молекулу, где нуклеиновая кислота может содержать комбинации дезоксирибо- и рибонуклеотидов, при этом комбинации оснований включают урацил, аденин, тимин, цитозин, гуанин, инозин, ксантин, гипоксантин, изоцитозин и изогуанин. Нуклеиновые кислоты можно получать с помощью способов химического синтеза или с помощью рекомбинантных способов.The nucleic acid may be single-stranded or double-stranded, or may contain portions of both double-stranded and single-stranded sequences. The nucleic acid may be DNA, either genomic or cDNA, RNA or a hybrid molecule, where the nucleic acid may contain combinations of deoxyribo- and ribonucleotides, base combinations including uracil, adenine, thymine, cytosine, guanine, inosine, xanthine, hypoxanthine , isocytosine and isoguanine. Nucleic acids can be produced by chemical synthesis methods or by recombinant methods.

Используемый в данном документе термин функционально связанный означает, что экспрессия гена находится под контролем промотора, с которым он пространственно соединен. Промотор может располагаться 5'-конце (выше) или 3'-конце (ниже) относительно гена под его контролем. Расстояние между промотором и геном может быть приблизительно таким же, как и расстояние между тем промотором и геном, который он контролирует, в гене, из которого получен промотор. Как известно из уровня техники, изменение этого расстояния может быть осуществлено без потери промоторной функции.As used herein, the term operably linked means that the expression of a gene is under the control of the promoter to which it is spatially linked. A promoter can be located 5'-end (above) or 3'-end (below) relative to the gene under its control. The distance between a promoter and a gene may be approximately the same as the distance between that promoter and the gene it controls in the gene from which the promoter is derived. As is known in the art, this distance can be changed without loss of promoter function.

Термин частично функциональный, используемый в данном документе, описывает белок, который кодируется мутантным геном и характеризуется меньшей биологической активностью, чем функциональный белок, но большей, чем нефункциональный белок.The term partially functional as used herein describes a protein that is encoded by a mutant gene and has less biological activity than a functional protein but more than a non-functional protein.

Термин преждевременный стоп-кодон или стоп-кодон вне рамки, используемый в данном документе взаимозаменяемо, относится к нонсенс-мутации в последовательности ДНК, которая является причиной стоп-кодона в месте, которое обычно не обнаруживается в гене дикого типа. Преждевременный стоп-кодон может приводить к усечению или укорочению белка по сравнению с полноразмерной версией белка.The term premature stop codon or out-of-frame stop codon, used interchangeably herein, refers to a nonsense mutation in a DNA sequence that causes a stop codon at a location not normally found in the wild-type gene. A premature stop codon can result in a truncation or shortening of the protein compared to the full length version of the protein.

Используемый в данном документе термин промотор означает молекулу синтетического или природного происхождения, которая способна обеспечивать, активировать или усиливать экспрессию нуклеиновой кислоты в клетке. Промотор может содержать одну или несколько специфических последовательностей регуляции транскрипции для дополнительного усиления экспрессии и/или для изменения пространственной экспрессии и/или временной экспрессии. Промотор может также содержать дистальные энхансерные или репрессорные элементы, которые могут располагаться в нескольких тысячах пар оснований от сайта инициации транскрипции. Промотор может быть получен из источников, в том числе вирусов, бактерий, грибов, растений, насекомых и животных. Промотор может регулировать экспрессию генетического компонента конститутивно или дифференциально с учетом клетки, ткани или органа, в которых происходит экспрессия, или с учетом стадии развития, на которой происходит экспрессия, или в ответ на внешние раздражители, такие как физиологические стрессы, патогены, ионы металлов или индуцирующие средства. Типичные примеры промоторов включают промотор бактериофага T7, промотор бактериофага T3, промотор SP6, промотор лактозного оперона, промотор tac, поздний промотор SV40, ранний промотор SV40, промотор RSV-LTR, промотор IE CMV, ранний промотор SV40 или поздний промотор SV40, промотор человека U6 (hU6) и промотор IE CMV.As used herein, the term promoter means a molecule of synthetic or natural origin that is capable of providing, activating or enhancing the expression of a nucleic acid in a cell. The promoter may contain one or more specific transcription regulation sequences to further enhance expression and/or to alter spatial expression and/or temporal expression. The promoter may also contain distal enhancer or repressor elements, which may be located several thousand base pairs from the site of transcription initiation. The promoter can be obtained from sources including viruses, bacteria, fungi, plants, insects and animals. A promoter may regulate the expression of a genetic component constitutively or differentially according to the cell, tissue, or organ in which expression occurs, or according to the developmental stage at which expression occurs, or in response to external stimuli such as physiological stress, pathogens, metal ions, or inducing agents. Representative examples of promoters include bacteriophage T7 promoter, bacteriophage T3 promoter, SP6 promoter, lactose operon promoter, tac promoter, SV40 late promoter, SV40 early promoter, RSV-LTR promoter, CMV IE promoter, SV40 early promoter or SV40 late promoter, human U6 promoter (hU6) and IE CMV promoter.

Термин скелетная мышца, используемый в данном документе, относится к типу поперечнополосатой мышцы, которая находится под контролем соматической нервной системы и прикреплена к костям пучками коллагеновых волокон, известных как сухожилия. Скелетная мышца состоит из отдельных компонентов, известных как миоциты или мышечные клетки, иногда в разговорной речи называемые мышечными волокнами. Миоциты образуются в результате слияния развивающихся миобластов (тип эмбриональной клетки-предшественника, из которой возникает мышечная клетка) в процессе, известном как миогенез. Эти длинные цилиндрические многоядерные клетки также называются мышечными волокнами.The term skeletal muscle as used herein refers to a type of striated muscle that is under the control of the somatic nervous system and is attached to bones by bundles of collagen fibers known as tendons. Skeletal muscle is made up of individual components known as myocytes or muscle cells, sometimes colloquially referred to as muscle fibers. Myocytes are formed by the fusion of developing myoblasts (the type of embryonic progenitor cell from which a muscle cell arises) in a process known as myogenesis. These long, cylindrical, multinucleated cells are also called muscle fibers.

Термин состояние скелетных мышц, используемый в данном документе, относится к состоянию, связанному со скелетной мышцей, как например: мышечные дистрофии, старение, дегенерация мышц, заживление ран и мышечная слабость или атрофия.The term skeletal muscle condition as used herein refers to a condition associated with skeletal muscle, such as muscular dystrophies, aging, muscle degeneration, wound healing, and muscle weakness or atrophy.

Термины субъект и пациент, используемые в данном документе взаимозаменяемо, относятся к любому позвоночному животному, в том числе без ограничения млекопитающему (например, корове, свинье, верблюду, ламе, лошади, козе, кролику, овце, хомякам, морской свинке, кошке, собаке, крысе и мыши, приматам, не относящимся к человеку (например, обезьяне, такой как яванский макак или макакрезус, шимпанзе и т.д.), а также человеку). В некоторых вариантах осуществления субъект может являться человеком или не являться человеком. Субъекта или пациента можно подвергать другим формам лечения.The terms subject and patient, used interchangeably herein, refer to any vertebrate animal, including, without limitation, a mammal (e.g., cow, pig, camel, llama, horse, goat, rabbit, sheep, hamster, guinea pig, cat, dog). , rat and mouse, non-human primates (eg, monkeys such as cynomolgus or rhesus macaques, chimpanzees, etc.), and humans). In some embodiments, the subject may or may not be human. The subject or patient may be subjected to other forms of treatment.

Термин ген-мишень, используемый в данном документе, относится к любой нуклеотидной последовательности, кодирующей известный или предполагаемый генный продукт. Ген-мишень может предThe term target gene as used herein refers to any nucleotide sequence encoding a known or suspected gene product. The target gene may

- 9 042798 ставлять собой мутированный ген, вовлеченный в генетическое заболевание. В определенных вариантах осуществления ген-мишень представляет собой ген дистрофина человека. В определенных вариантах осуществления ген-мишень представляет собой мутантный ген дистрофина человека.- 9 042798 be a mutated gene involved in a genetic disease. In certain embodiments, the target gene is a human dystrophin gene. In certain embodiments, the target gene is a mutated human dystrophin gene.

Термин целевая область, используемый в данном документе, относится к области гена-мишени, для которой сконструирована система редактирования генов на основе CRISPR/Cas9 для связывания и расщепления.The term target region as used herein refers to the region of a target gene for which a CRISPR/Cas9 based gene editing system has been designed for binding and cleavage.

Используемый в данном документе термин трансген относится к гену или генетическому материалу, содержащему последовательность гена, которая была выделена из одного организма и введена в другой отличающийся организм. Этот ненативный сегмент ДНК может сохранять способность продуцировать РНК или белок в трансгенном организме или может изменять нормальную функцию генетического кода трансгенного организма. Введение трансгена может изменить фенотип организма.As used herein, the term transgene refers to a gene or genetic material containing a gene sequence that has been isolated from one organism and introduced into another distinct organism. This non-native DNA segment may retain the ability to produce RNA or protein in the transgenic organism or may alter the normal function of the genetic code of the transgenic organism. The introduction of a transgene can change the phenotype of an organism.

Термин вариант, используемый в данном документе в отношении нуклеиновой кислоты, означает (i) часть или фрагмент эталонной нуклеотидной последовательности;The term variant as used herein in relation to a nucleic acid means (i) a portion or fragment of a reference nucleotide sequence;

(ii) последовательность, комплементарную эталонной нуклеотидной последовательности или ее части;(ii) a sequence that is complementary to a reference nucleotide sequence or a portion thereof;

(iii) нуклеиновую кислоту, которая практически идентична эталонной нуклеиновой кислоте или комплементарной ей последовательности; или (iv) нуклеиновую кислоту, которая гибридизуется в жестких условиях с эталонной нуклеиновой кислотой, комплементарной ей последовательностью или последовательностями, практически идентичными им.(iii) a nucleic acid that is substantially identical to the reference nucleic acid or its complementary sequence; or (iv) a nucleic acid that hybridizes under stringent conditions to a reference nucleic acid, its complementary sequence, or sequences substantially identical thereto.

Вариант в отношении пептида или полипептида за счет вставки, делеции или консервативной замены аминокислот отличается по аминокислотной последовательности, однако сохраняет по меньшей мере один тип биологической активности. Вариант также может означать белок с аминокислотной последовательностью, которая практически идентична аминокислотной последовательности эталонного белка, который сохраняет по меньшей мере один тип биологической активности. В данной области техники признается, что консервативная замена аминокислоты, т.е. замена аминокислоты на другую аминокислоту с аналогичными свойствами (например, гидрофильностью, относительным количеством и распределением заряженных областей), обычно предусматривает незначительное изменение. Эти незначительные изменения можно частично идентифицировать, учитывая индекс гидропатичности аминокислот, как это понимается в данной области техники. Kyte et al., J. Mol. Biol., 157: 105-132 (1982). Индекс гидропатичности аминокислоты определяется с учетом гидрофобности и заряда. Из уровня техники известно, что аминокислоты с аналогичными индексами гидропатичности можно заменять, при этом функция белка по-прежнему будет сохраняться. В одном аспекте заменяют аминокислоты с индексами гидропатичности, составляющими ±2. Гидрофобность аминокислот также можно использовать для выявления замен, которые в результате будут давать белки, сохраняющие биологическую функцию. Учет гидрофильности аминокислот в контексте пептида позволяет рассчитывать наибольшую локальную усредненную гидрофильность этого пептида. Замены можно осуществлять с аминокислотами, у которых различие значений гидрофильности находится в пределах ±2. Как на индекс гидрофобности, так и на значение гидрофильности аминокислот влияет определенная боковая цепь этой аминокислоты. В соответствии с этим наблюдением совместимость аминокислотных замен с биологической функцией зависит от относительного сходства аминокислот и, в частности, боковых цепей этих аминокислот, что выявляют на основе гидрофобности, гидрофильности, заряда, размера и других свойств.A peptide or polypeptide variant differs in amino acid sequence by insertion, deletion, or conservative amino acid substitution, but retains at least one type of biological activity. Variant can also mean a protein with an amino acid sequence that is substantially identical to the amino acid sequence of a reference protein that retains at least one type of biological activity. It is recognized in the art that a conservative amino acid substitution, i. replacing an amino acid with another amino acid with similar properties (eg, hydrophilicity, relative number and distribution of charged regions) usually involves little change. These minor changes can be partly identified by considering the hydropathic index of amino acids, as understood in the art. Kyte et al., J. Mol. Biol., 157: 105-132 (1982). The hydropathic index of an amino acid is determined taking into account hydrophobicity and charge. It is known in the art that amino acids with similar hydropathic indices can be substituted while still maintaining protein function. In one aspect, amino acids with hydropathic indices of ±2 are substituted. The hydrophobicity of amino acids can also be used to identify substitutions that will result in proteins that retain biological function. Accounting for the hydrophilicity of amino acids in the context of the peptide allows us to calculate the highest local averaged hydrophilicity of this peptide. Substitutions can be made with amino acids in which the difference in hydrophilicity values is within ±2. Both the hydrophobicity index and the hydrophilicity value of amino acids are affected by the specific side chain of that amino acid. In accordance with this observation, the compatibility of amino acid substitutions with biological function depends on the relative similarity of amino acids and, in particular, the side chains of these amino acids, which is revealed on the basis of hydrophobicity, hydrophilicity, charge, size and other properties.

Термин вектор, используемый в данном документе, означает последовательность нуклеиновой кислоты, содержащую точку начала репликации. Вектор может представлять собой вирусный вектор, бактериофаг, бактериальную искусственную хромосому или искусственную хромосому дрожжей. Вектор может представлять собой ДНК- или РНК-вектор. Вектор может представлять собой самореплицирующийся внехромосомный вектор, и предпочтительно представляет собой плазмидную ДНК. Например, вектор может кодировать белок Cas9 и по меньшей мере одну молекулу gRNA, такую как gRNA, содержащую нацеливающий домен под любой из SEQ ID NO: 1-19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарной ей последовательности. В некоторых вариантах осуществления белок Cas9 может характеризоваться аминокислотной последовательностью под SEQ ID NO: 27, SEQ ID NO: 33 или SEQ ID NO: 45. В некоторых вариантах осуществления белок Cas9 может представлять собой Cas9 S. aureus, такой как SaCas9 с аминокислотной последовательностью под SEQ ID NO: 33 или SEQ ID NO: 45. В некоторых вариантах осуществления белок Cas9 кодируется последовательностью нуклеиновой кислоты, содержащей нуклеиновую последовательность под SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 43 или SEQ ID NO: 44.The term vector as used herein means a nucleic acid sequence containing an origin of replication. The vector may be a viral vector, a bacteriophage, a bacterial artificial chromosome, or a yeast artificial chromosome. The vector may be a DNA or RNA vector. The vector may be a self-replicating extrachromosomal vector, and preferably is plasmid DNA. For example, the vector may encode a Cas9 protein and at least one gRNA molecule, such as a gRNA containing a targeting domain under any of SEQ ID NO: 1-19, SEQ ID NO: 41, SEQ ID NO: 42, or its complementary sequence. In some embodiments, the Cas9 protein may be characterized by the amino acid sequence of SEQ ID NO: 27, SEQ ID NO: 33, or SEQ ID NO: 45. In some embodiments, the Cas9 protein may be S. aureus Cas9, such as SaCas9 with the amino acid sequence of SEQ ID NO: 33 or SEQ ID NO: 45. In some embodiments, the Cas9 protein is encoded by a nucleic acid sequence comprising the nucleic sequence under SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30 , SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 43 or SEQ ID NO: 44.

Если не указано иное, то научные и технические термины, используемые применительно к настоящему изобретению, должны иметь значения, которые обычно понимаются специалистами в данной области техники. Например, любые цифровые или словесные обозначения на иллюстрациях и методики, используемые применительно к клеточной и тканевой культуре, молекулярной биологии, иммунологии, микробиологии, генетике, химии и гибридизации белка и нуклеиновых кислот, описанные в данном доUnless otherwise indicated, the scientific and technical terms used in connection with the present invention shall have the meanings commonly understood by those skilled in the art. For example, any numerical or word designations in illustrations and techniques used in relation to cell and tissue culture, molecular biology, immunology, microbiology, genetics, chemistry and hybridization of protein and nucleic acids described in this document

- 10 042798 кументе, являются такими, которые хорошо известны и обычно используются в данной области техники. Смысл и объем терминов должны быть четкими и понятными; однако в случае любой скрытой двусмысленности определения, представленные в данном документе, превалируют над любым словарным или внешним определением. Кроме того, если иное не требуется по контексту, термины единственного числа включают множественное число, а термины множественного числа включают единственное число.- 10 042798 documents are those that are well known and commonly used in the art. The meaning and scope of terms should be clear and understandable; however, in the event of any implicit ambiguity, the definitions provided herein take precedence over any dictionary or external definition. In addition, unless otherwise required by context, singular terms include the plural and plural terms include the singular.

2. Генетические конструкции для редактирования гена дистрофина в геноме.2. Genetic constructs for editing the dystrophin gene in the genome.

Настоящее изобретение направлено на генетические конструкции для редактирования генома, геномной перестройки или изменения экспрессии гена дистрофина (например, гена дистрофина человека). Генетические конструкции включают в себя по меньшей мере одну gRNA, которая нацеливается на последовательности гена дистрофина как человека, так и макака-резуса, такие как совместимые мишени SaCas9. Раскрытые gRNA могут включаться в систему редактирования генов на основе CRISPR/Cas9, в том числе системы, в которых применяется SaCas9, для нацеливания на интронные области вокруг экзона 51 гена дистрофина человека, вызывая геномные делеции этой области, для восстановления экспрессии функционального дистрофина в клетках от пациентов с DMD.The present invention is directed to genetic constructs for genome editing, genomic rearrangement, or altering the expression of a dystrophin gene (eg, the human dystrophin gene). The genetic constructs include at least one gRNA that targets both human and rhesus monkey dystrophin gene sequences, such as SaCas9 compatible targets. The disclosed gRNAs can be incorporated into a CRISPR/Cas9-based gene editing system, including systems that use SaCas9, to target the intron regions around exon 51 of the human dystrophin gene, causing genomic deletions in that region, to restore functional dystrophin expression in cells from patients with DMD.

a. Ген дистрофина.a. dystrophin gene.

Термин дистрофин представляет собой стержнеобразный цитоплазматический белок, который является частью белкового комплекса, соединяющего цитоскелет мышечного волокна с окружающим внеклеточным матриксом через клеточную мембрану. Дистрофин обеспечивает структурную стабильность дистрогликанового комплекса клеточной мембраны. Ген дистрофина образован 2,2 млн пар оснований в локусе Xp21. Размер первичного транскрипта составляет приблизительно 2400 т.о., при этом размер зрелой mRNA составляет приблизительно 14 т.о. 79 экзонов кодируют белок, образованный более чем 3500 аминокислотами. Нормальная скелетная мышечная ткань содержит лишь небольшое количество дистрофина, однако отсутствие его нормальной экспрессии приводит к развитию тяжелых и неизлечимых симптомов. Некоторые мутации в гене дистрофина приводят к образованию неполноценного дистрофина и тяжелому дистрофическому фенотипу у пораженных пациентов. Некоторые мутации в гене дистрофина приводят к образованию полнофункционального белка дистрофина и проявлению более мягкого дистрофического фенотипа у пораженных пациентов.The term dystrophin is a rod-shaped cytoplasmic protein that is part of the protein complex that connects the muscle fiber cytoskeleton to the surrounding extracellular matrix through the cell membrane. Dystrophin provides the structural stability of the dystroglycan complex of the cell membrane. The dystrophin gene is formed at 2.2 million base pairs at the Xp21 locus. The primary transcript is approximately 2400 kb, while the mature mRNA is approximately 14 kb. 79 exons code for a protein made up of more than 3500 amino acids. Normal skeletal muscle tissue contains only a small amount of dystrophin, but the absence of its normal expression leads to the development of severe and incurable symptoms. Some mutations in the dystrophin gene result in defective dystrophin and a severe dystrophic phenotype in affected patients. Some mutations in the dystrophin gene result in the production of a fully functional dystrophin protein and a milder dystrophic phenotype in affected patients.

DMD является результатом врожденных или спонтанных мутаций, которые вызывают нонсенсмутации или мутации со сдвигом рамки в гене дистрофина. Встречающиеся в природе мутации и их последствия относительно хорошо понятны в случае DMD. Известно, что делеции внутри рамки, которые происходят в областях экзонов 45-55 (например, экзона 51), содержащихся в пределах стержневого домена, могут обеспечивать образование высокофункциональных белков дистрофина, и многие носители являются бессимптомными или проявляют слабо выраженные симптомы. Более того, более 60% пациентов могут теоретически лечиться путем нацеливания на экзоны в данной области гена дистрофина (например, нацеливания на экзон 51). Усилия были предприняты для того, чтобы восстановить рамку считывания нарушенного дистрофина у пациентов с DMD посредством пропуска несущественного(ых) важного(ых) экзона(ов) (например, пропуск экзона 51) через сплайсинг mRNA с получением делетированых внутри, однако функциональных белков дистрофина. Делеция внутреннего(их) экзона(ов) дистрофина (например, делеция экзона 51) сохраняет соответствующую рамку считывания, однако обусловливает менее тяжелое проявление мышечной дистрофии Беккера или BMD. Генотип при мышечной дистрофии Беккера или BMD сходный с DMD в том, что делеции присутствуют в гене дистрофина. Однако эти делеции оставляют рамку считывания интактной. Таким образом, создается внутренне усеченный, однако частично функциональный белок дистрофина. BMD характеризуется широким спектром фенотипов, однако часто, если делеции находятся между экзонами 45-55 дистрофина, фенотип намного мягче по сравнению с DMD. Таким образом, изменение генотипа DMD на генотип BMD является распространенной стратегией для коррекции дистрофина. Существует много стратегий для коррекции дистрофина, многие из которых полагаются на восстановление рамки считывания эндогенного дистрофина. Это обеспечивает изменение генотипа заболевания от DMD до мышечной дистрофии Беккера. У многих пациентов с BMD имеются внутригенные делеции, которые сохраняют трансляционную рамку считывания, что приводит к образованию более короткого, однако в большинстве случаев функционального, белка дистрофина.DMD is the result of congenital or spontaneous mutations that cause nonsense or frameshift mutations in the dystrophin gene. Naturally occurring mutations and their consequences are relatively well understood in the case of DMD. It is known that in-frame deletions that occur in regions of exons 45-55 (eg, exon 51) contained within the core domain can generate highly functional dystrophin proteins, and many carriers are asymptomatic or exhibit mild symptoms. Moreover, more than 60% of patients could theoretically be treated by targeting exons in a given region of the dystrophin gene (eg, targeting exon 51). Efforts have been made to restore the reading frame of impaired dystrophin in DMD patients by skipping non-essential critical exon(s) (e.g. skipping exon 51) via mRNA splicing to produce internally deleted but functional dystrophin proteins. Deletion of the inner(their) exon(s) of dystrophin (eg, deletion of exon 51) retains the corresponding reading frame, but causes a less severe manifestation of Becker muscular dystrophy or BMD. The genotype in Becker muscular dystrophy or BMD is similar to DMD in that deletions are present in the dystrophin gene. However, these deletions leave the reading frame intact. Thus, an internally truncated but partially functional dystrophin protein is created. BMD is characterized by a wide range of phenotypes, however often, if the deletions are between dystrophin exons 45-55, the phenotype is much milder compared to DMD. Thus, changing the DMD genotype to the BMD genotype is a common strategy for correcting dystrophin. There are many strategies for correcting dystrophin, many of which rely on restoration of the endogenous dystrophin reading frame. This provides a change in the genotype of the disease from DMD to Becker muscular dystrophy. Many patients with BMD have intragene deletions that retain the translational reading frame, resulting in the formation of a shorter, but in most cases functional, dystrophin protein.

В определенных вариантах осуществления модификация экзона 51 (например, делеция или удаление экзона 51, например с помощью NHEJ) для восстановления рамки считывания ослабляет проявление фенотипа у субъектов с DMD, включая субъектов с DMD с мутациями в виде делеции. В определенных вариантах осуществления экзон 51 гена дистрофина относится к 51-му экзону гена дистрофина. Экзон 51 у пациентов с DMD часто является смежным с положениями делеций, разрушающих рамку считывания, и в клинических испытаниях на него был направлен пропуск экзона, основанный на применении олигонуклеотидов. В клиническом испытании с пропуском экзона 51 с помощью соединения этерлипсена сообщалось о значительном положительном функциональном эффекте в течение 48 недель со средним количеством дистрофин-положительных волокон, составляющим 47% по сравнению с исходным уровнем. Мутации в экзоне 51 идеально подходят для устойчивой коррекции посредством редактирования генома на основе NHEJ.In certain embodiments, modification of exon 51 (eg, deletion or deletion of exon 51, eg, with NHEJ) to restore the reading frame reduces the expression of the phenotype in subjects with DMD, including subjects with DMD with deletion mutations. In certain embodiments, exon 51 of the dystrophin gene refers to exon 51 of the dystrophin gene. Exon 51 in DMD patients is often adjacent to in-frame deletion positions and has been targeted by oligonucleotide-based exon skipping in clinical trials. In the exon 51 skipping clinical trial with the Eterlipsen Compound, a significant positive functional effect was reported at 48 weeks with a mean dystrophin-positive fiber count of 47% from baseline. Mutations in exon 51 are ideally suited for robust correction through NHEJ-based genome editing.

Раскрытые в настоящем изобретении векторы могут образовывать делеции в гене дистрофина, наThe vectors disclosed in the present invention can form deletions in the dystrophin gene, on

- 11 042798 пример гене дистрофина человека. В определенных вариантах осуществления вектор сконструирован с возможностью образования двух двухнитевых разрывов (первый двухнитевой разрыв и второй двухнитевой разрыв) в двух интронах (первом интроне и втором интроне) фланкирующих ген дистрофина, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего целевое положение. Целевое положение дистрофина может представлять собой экзонное целевое положение дистрофина или внутриэкзонное целевое положение дистрофина, как описано в данном документе. Делеция экзонного целевого положения дистрофина может обеспечить оптимизацию последовательности дистрофина у субъекта, страдающего от мышечной дистрофии Дюшенна, например она может улучшить действие или активность кодируемого белка дистрофина или привести к улучшению состояния заболевания у субъекта. В определенных вариантах осуществления удаление экзонного целевого положения дистрофина восстанавливает рамку считывания. Экзонное целевое положение дистрофина может содержать один или несколько экзонов гена дистрофина. В определенных вариантах осуществления целевое положение дистрофина содержит экзон 51 гена дистрофина (например, гена дистрофина человека).- 11 042798 an example of the human dystrophin gene. In certain embodiments, the vector is designed to form two double strand breaks (first double strand break and second double strand break) in two introns (first intron and second intron) flanking the dystrophin gene, thereby allowing the deletion of the segment of the dystrophin gene containing the target position. The dystrophin target can be an exon dystrophin target or an intra-exon dystrophin target, as described herein. Deletion of an exon target position of dystrophin may provide optimization of the dystrophin sequence in a subject suffering from Duchenne muscular dystrophy, for example, it may improve the action or activity of the encoded dystrophin protein or lead to an improvement in the subject's disease state. In certain embodiments, the removal of the exon target position of the dystrophin restores the reading frame. The exon target position of dystrophin may contain one or more exons of the dystrophin gene. In certain embodiments, the dystrophin target position contains exon 51 of a dystrophin gene (eg, the human dystrophin gene).

Раскрытая в настоящем изобретении генетическая конструкция (например, вектор) может опосредовать высокоэффективное редактирование генов в экзоне 51 гена дистрофина (например, гена дистрофина человека). Раскрытая в настоящем изобретении генетическая конструкция (например, вектор) восстанавливает экспрессию белка дистрофина в клетках пациентов с DMD.The genetic construct (eg, a vector) disclosed herein can mediate highly efficient gene editing in exon 51 of a dystrophin gene (eg, the human dystrophin gene). The genetic construct (eg, vector) disclosed herein restores dystrophin protein expression in DMD patient cells.

Экзон 51 у пациентов с DMD часто является смежным с положениями делеций, разрушающих рамку считывания. Элиминация экзона 51 из транскрипта дистрофина с помощью пропуска экзона может использоваться для лечения примерно 15% из всех пациентов с DMD. Данный класс мутаций дистрофина идеально подходит для устойчивой коррекции с помощью редактирования генома на основе NHEJ и HDR. Генетические конструкции (например, векторы), описанные в данном документе, разрабатывались для целенаправленной модификации экзона 51 в гене дистрофина человека. Раскрытая в настоящем изобретении генетическая конструкция (например, вектор) трансфицируется в клетки DMD человека и опосредует действенную модификацию генов и превращение в соответствующую рамку считывания. Восстановление белка сопутствует восстановлению рамки и обнаруживается в крупной популяции клеток, обработанных системой редактирования генов на основе CRISPR/Cas9.Exon 51 in DMD patients is often contiguous with in-frame deletion positions. Elimination of exon 51 from the dystrophin transcript by exon skipping can be used to treat approximately 15% of all patients with DMD. This class of dystrophin mutations is ideally suited for sustained correction by NHEJ and HDR-based genome editing. The genetic constructs (eg, vectors) described herein were designed to target modification of exon 51 in the human dystrophin gene. The genetic construct (eg, vector) disclosed in the present invention is transfected into human DMD cells and mediates efficient gene modification and conversion into the appropriate reading frame. Protein repair accompanies frame repair and is found in a large population of cells treated with a CRISPR/Cas9 based gene editing system.

b. Система CRISPR.b. CRISPR system.

Раскрытая в настоящем изобретении генетическая конструкция (например, вектор) кодируется системой редактирования генов на основе CRISPR/Cas9, специфичной в отношении гена дистрофина (например, гену дистрофина человека). Короткие палиндромные повторы, регулярно расположенные группами и CRISPR, используемые в данном документе взаимозаменяемо, относятся к локусам, содержащим множественные короткие прямые повторы, которые встречаются в геномах примерно 40% секвенированных бактерий и 90% секвенированных архей. Система CRISPR представляет собой нуклеазную систему микроорганизмов, вовлеченную в защиту от встраивающихся фагов и плазмид, что обеспечивает форму приобретенного иммунитета. Локусы CRISPR в микробных хозяевах содержат комбинацию CRISPR-ассоциированных (Cas) генов, а также элементов некодирующей РНК, способных программировать специфичность CRISPR-опосредованного расщепления нуклеиновой кислоты. Короткие сегменты чужеродной ДНК, называемые спейсерами, включаются в состав генома между повторами CRISPR и служат в качестве памяти о прошлых воздействиях. Cas9 образует комплекс с 3'-концом sgRNA (также взаимозаменяемо называемой в данном документе как gRNA), и пара белок-РНК распознает свою геномную мишень посредством комплементарного спаривания оснований между 5'-концом последовательности sgRNA и предварительно определенной последовательностью ДНК размером 20 п.о., известной как протоспейсер. Этот комплекс направлен на гомологичные локусы патогенной ДНК через области, кодируемые в crRNA, т.е. протоспейсеры и мотивы, смежные с протоспейсером (PAM), в патогенном геноме. Некодирующая матрица CRISPR транскрибируется и расщепляется в пределах прямых повторов на короткие crRNA, содержащие отдельные спейсерные последовательности, которые направляют Cas-нуклеазы на целевой сайт (протоспейсер). Путем простого обмена последовательности распознавания размером 20 п.о. экспрессированной sgRNA, нуклеазу Cas9 можно направлять на новые мишени в геноме. Спейсеры CRISPR используются для распознавания и сайленсинга экзогенных генетических элементов с помощью способа, аналогичного RNAi у эукариотических организмов.A genetic construct (eg, a vector) disclosed herein is encoded by a CRISPR/Cas9-based gene editing system specific for a dystrophin gene (eg, the human dystrophin gene). Regularly arrayed short palindromic repeats and CRISPR, used interchangeably herein, refer to loci containing multiple short direct repeats that occur in the genomes of approximately 40% of sequenced bacteria and 90% of sequenced archaea. The CRISPR system is a microbial nuclease system involved in defense against embedding phages and plasmids that provides a form of acquired immunity. CRISPR loci in microbial hosts contain a combination of CRISPR-associated (Cas) genes as well as non-coding RNA elements capable of programming the specificity of CRISPR-mediated nucleic acid cleavage. Short segments of foreign DNA, called spacers, are incorporated into the genome between CRISPR repeats and serve as a memory of past exposures. Cas9 forms a complex with the 3' end of sgRNA (also referred to interchangeably herein as gRNA), and the protein-RNA pair recognizes its genomic target through complementary base pairing between the 5' end of the sgRNA sequence and a predetermined 20 bp DNA sequence ., known as the protospacer. This complex is directed to homologous loci of pathogenic DNA through the regions encoded in crRNA, i.e. protospacers and protospacer-adjacent motifs (PAM) in the pathogenic genome. The non-coding CRISPR template is transcribed and cleaved within direct repeats into short crRNAs containing individual spacer sequences that direct Cas nucleases to a target site (protospacer). By simply exchanging a 20 bp recognition sequence. expressed sgRNA, Cas9 nuclease can be directed to new targets in the genome. CRISPR spacers are used to recognize and silence exogenous genetic elements in a manner similar to RNAi in eukaryotic organisms.

Известны три класса систем CRISPR (эффекторные системы типов I, II и III). Эффекторная система типа II осуществляет двухнитевой разрыв в целевой ДНК на четырех последовательных стадиях с использованием одного эффекторного фермента Cas9 для расщепления dsDNA. По сравнению с эффекторными системами типа I и типа III, для которых требуется несколько различных эффекторов, действующих как комплекс, эффекторная система типа II может функционировать в альтернативной среде, такой как эукариотические клетки. Эффекторная система типа II состоит из длинной pre-crRNA, которая транскрибируется из спейсер-содержащего локуса CRISPR, белка Cas9 и tracrRNA, которая участвует в процессинге pre-crRNA. При этом tracrRNA гибридизуются с областями повторов, разделяющими спейсеры pre-crRNA, инициируя тем самым расщепление dsRNA с помощью эндогенной РНКазы III. Это расщепление сопровождается вторым событием расщепления внутри каждого спейсера Cas9, производя зрелые crRNA, которые остаются связанными с tracrRNA и Cas9, образуя комплекс Cas9:crRNA-tracrRNA.Three classes of CRISPR systems (type I, II and III effector systems) are known. The type II effector system performs a double-strand break in the target DNA in four successive steps using a single Cas9 effector enzyme to cleave dsDNA. Compared to type I and type III effector systems, which require several different effectors to act as a complex, the type II effector system can function in an alternative environment such as eukaryotic cells. The type II effector system consists of a long pre-crRNA that is transcribed from the spacer-containing CRISPR locus, the Cas9 protein, and tracrRNA that is involved in pre-crRNA processing. At the same time, tracrRNAs hybridize with repeat regions separating pre-crRNA spacers, thereby initiating dsRNA cleavage by endogenous RNase III. This cleavage is followed by a second cleavage event within each Cas9 spacer, producing mature crRNAs that remain associated with tracrRNA and Cas9, forming the Cas9:crRNA-tracrRNA complex.

- 12 042798- 12 042798

Комплекс Cas9:crRNA-tracrRNA раскручивает ДНК-дуплекс и ищет последовательности для расщепления, соответствующие crRNA. Распознавание мишени происходит при выявлении комплементарности между последовательностью протоспейсера в последовательности целевой ДНК и оставшейся спейсерной последовательности в crRNA. Cas9 опосредует расщепление целевой ДНК, если на 3'-конце протоспейсера также присутствует мотив, смежный с протоспейсером (PAM). Для нацеливания на протоспейсер последовательность должна непосредственно сопровождаться мотивом, смежным с протоспейсером (PAM), короткой последовательностью, распознаваемой нуклеазой Cas9, которая требуется для расщепления ДНК. Различные системы типа II имеют разные требования к PAM. Система CRISPR из S. pyogenes может содержать последовательность PAM для этой Cas9 (SpCas9) в виде 5'-NRG-3', где R представляет собой либо A, либо G, и характеризующей специфичность этой системы в клетках человека. Уникальной способностью системы редактирования генов на основе CRISPR/Cas9 является эффективная способность одновременно нацеливаться на несколько различных геномных локусов путем совместной экспрессии одного белка Cas9 с двумя или более sgRNA. Например, система типа II из Streptococcus pyogenes в естественных условиях предпочитает применение последовательности NGG, где N может представлять собой любой нуклеотид, но также принимает другие последовательности PAM, такие как NAG, в сконструированных системах (Hsu et al., Nature Biotechnology (2013) DOI: 10.1038/nbt.2647). Аналогично Cas9, полученная из Neisseria meningitidis (NmCas9), как правило, содержит нативный PAM из NNNNGATT, однако обладает активностью со множеством PAM, включая PAM NNNNGNNN с высокой степенью вырожденности (Esvelt et al., Nature Methods (2013), DOI: 10.1038/nmeth.2681).The Cas9:crRNA-tracrRNA complex unwinds the DNA duplex and searches for cleavage sequences corresponding to crRNA. Target recognition occurs by detecting complementarity between the protospacer sequence in the target DNA sequence and the remaining spacer sequence in the crRNA. Cas9 mediates target DNA cleavage if a protospacer adjacent motif (PAM) is also present at the 3' end of the protospacer. To target a protospacer, the sequence must be directly followed by a protospacer adjacent motif (PAM), a short sequence recognized by the Cas9 nuclease that is required for DNA cleavage. Different Type II systems have different PAM requirements. The S. pyogenes CRISPR system may contain the PAM sequence for this Cas9 (SpCas9) as 5'-NRG-3', where R is either A or G, characterizing the specificity of this system in human cells. The unique capability of the CRISPR/Cas9-based gene editing system is the efficient ability to simultaneously target multiple different genomic loci by co-expressing a single Cas9 protein with two or more sgRNAs. For example, the type II system from Streptococcus pyogenes naturally prefers the use of the NGG sequence, where N can be any nucleotide, but also accepts other PAM sequences such as NAG in engineered systems (Hsu et al., Nature Biotechnology (2013) DOI : 10.1038/nbt.2647). Similarly, Cas9 derived from Neisseria meningitidis (NmCas9) typically contains the native PAM from NNNNGATT but has activity with multiple PAMs, including the highly degenerate PAM NNNNGNNN (Esvelt et al., Nature Methods (2013), DOI: 10.1038/ nmeth.2681).

Молекула Cas9 S. aureus распознает мотив последовательности NNGRR (R=A или G) (SEQ ID NO: 22) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10, например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRN (R=A или G) (SEQ ID NO: 23) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10, например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRT (R=A или G) (SEQ ID NO: 24) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10, например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRV (R=A или G) (SEQ ID NO: 25) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10, например от 3 до 5 п.о., выше этой последовательности. В вышеупомянутых вариантах осуществления N может представлять собой нуклеотидный остаток, например любой из A, G, C или T. Молекулы Cas9 могут быть сконструированы для изменения специфичности PAM молекулы Cas9.The S. aureus Cas9 molecule recognizes the NNGRR (R=A or G) sequence motif (SEQ ID NO: 22) and directs cleavage of the target nucleic acid sequence 1 to 10, eg 3 to 5 bp, upstream of that sequence. In certain embodiments, the S. aureus Cas9 molecule recognizes the NNGRRN (R=A or G) sequence motif (SEQ ID NO: 23) and directs cleavage of the target nucleic acid sequence from 1 to 10, e.g., 3 to 5 bp, above this sequence. In certain embodiments, the S. aureus Cas9 molecule recognizes the NNGRRT (R=A or G) sequence motif (SEQ ID NO: 24) and directs cleavage of the target nucleic acid sequence from 1 to 10, e.g., 3 to 5 bp, above this sequence. In certain embodiments, the S. aureus Cas9 molecule recognizes the NNGRRV sequence motif (R=A or G) (SEQ ID NO: 25) and directs cleavage of the target nucleic acid sequence from 1 to 10, e.g., 3 to 5 bp, above this sequence. In the above embodiments, N may be a nucleotide residue, such as any of A, G, C, or T. Cas9 molecules can be designed to change the PAM specificity of a Cas9 molecule.

(1) Система редактирования генов на основе CRISPR/Cas9.(1) Gene editing system based on CRISPR/Cas9.

Было показано, что разработанная форма эффекторной системы типа II из Streptococcus pyogenes функционирует в клетках человека для конструирования генома. В этой системе белок Cas9 направляли на геномные целевые сайты с помощью синтетически восстановленной направляющей РНК (gRNA, также используемой в данном документе взаимозаменяемо как химерная одиночная направляющая РНК (sgRNA)), которая представляет собой слитую конструкцию crRNA-tracrRNA, которая устраняет необходимость в РНКазе III и процессинге crRNA в целом. В данном документе представлены сконструированные системы на основе CRISPR/Cas9 для применения в редактировании генома и лечении генетических заболеваний. Сконструированные системы на основе CRISPR/Cas9 могут быть сконструированы для нацеливания на любой ген, в том числе гены, вовлеченные в генетическое заболевание, старение, регенерацию тканей или заживление ран. Системы редактирования генов на основе CRISPR/Cas9 могут включать в себя белок Cas9 или слитый белок Cas9 и по меньшей мере одну gRNA. В определенных вариантах осуществления система включает две молекулы gRNA. Слитый белок Cas9 может, например, включать в себя домен с активностью, отличающейся от той, которая является эндогенной для Cas9, такой как домен трансактивации.An engineered form of the type II effector system from Streptococcus pyogenes has been shown to function in human cells for genome engineering. In this system, the Cas9 protein was directed to genomic target sites using a synthetically reduced guide RNA (gRNA, also used interchangeably herein as chimeric single guide RNA (sgRNA)), which is a crRNA-tracrRNA fusion construct that eliminates the need for RNase III and crRNA processing in general. This paper presents engineered CRISPR/Cas9 based systems for use in genome editing and treatment of genetic diseases. Designed systems based on CRISPR/Cas9 can be designed to target any gene, including genes involved in genetic disease, aging, tissue regeneration or wound healing. CRISPR/Cas9 based gene editing systems may include a Cas9 protein or a Cas9 fusion protein and at least one gRNA. In certain embodiments, the system includes two gRNA molecules. A Cas9 fusion protein may, for example, include a domain with an activity different from that which is endogenous to Cas9, such as a transactivation domain.

Ген-мишень (например, ген дистрофина, например ген дистрофина человека) может быть вовлечен в дифференцировку клетки или любой другой процесс, в котором может требоваться активация, или может содержать мутацию, такую как мутация со сдвигом рамки или нонсенс-мутация. Если ген-мишень содержит мутацию, которая является причиной преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга, то система редактирования генов на основе CRISPR/Cas9 может быть сконструирована для распознавания и связывания нуклеотидной последовательности выше или ниже преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга. Система на основе CRISPR-Cas9 может также использоваться для разрушения нормального сплайсинга гена путем целенаправленного воздействия на акцепторы и доноры сплайсинга, чтобы вызвать пропуск преждевременных стоп-кодонов или восстановить поврежденную рамку считывания. Система редактирования генов на основе CRISPR/Cas9 может опосредовать или не опосредовать нецелевые изменения в областях генома, кодирующих белок.The target gene (eg, a dystrophin gene, eg, the human dystrophin gene) may be involved in cell differentiation or any other process that may require activation, or may contain a mutation, such as a frameshift or nonsense mutation. If the target gene contains a mutation that causes a premature stop codon, an aberrant splice acceptor site, or an aberrant splice donor site, then a CRISPR/Cas9-based gene editing system can be designed to recognize and bind a nucleotide sequence above or below the premature stop codon. , an aberrant splicing acceptor site, or an aberrant splicing donor site. The CRISPR-Cas9-based system can also be used to disrupt normal gene splicing by targeting splicing acceptors and donors to induce skipping of premature stop codons or repair a damaged reading frame. The CRISPR/Cas9 based gene editing system may or may not mediate off-target changes in protein-coding regions of the genome.

(a) Молекулы Cas9 и слитые белки Cas9.(a) Cas9 molecules and Cas9 fusion proteins.

Система редактирования генов на основе CRISPR/Cas9 может включать в себя белок Cas9 или слиA CRISPR/Cas9 based gene editing system can include the Cas9 protein or fusion

- 13 042798 тый белок Cas9. Белок Cas9 представляет собой эндонуклеазу, которая расщепляет нуклеиновую кислоту и кодируется локусами CRISPR, а также принимает участие в системе CRISPR типа II. Белок Cas9 может быть из любых видов бактерий или архей, в том числе без ограничения- 13 042798 Cas9 protein. The Cas9 protein is a nucleic acid cleaving endonuclease and is encoded by CRISPR loci and also participates in the type II CRISPR system. Cas9 protein can be from any species of bacteria or archaea, including but not limited to

Streptococcus pyogenes, Staphylococcus aureus (S. aureus), Acidovorax avenae, Actinobacillus pleuropneumoniae, Actinobacillus succinogenes, Actinobacillus suis, Actinomyces sp. , cycliphilus denitrifleans, Aminomonas paucivorans, Bacillus cereus, Bacillus smith!!. Bacillus thuringiensis, Bacteroides sp. r Blastopirellula marina, Bradyrhizobium sp. , Brevibacillus laterosporus, Campylobacter coll, Campylobacter jejuni, Campylobacter lari, Candidatus Punice!spirillum, Clostridium cellulolyticum, Clostridium perfringens, Corynebacterium accolens, Corynebacterium diphtheria, Corynebacterium matruchotii, Dinoroseobacter shibae, Eubacterium dolichum, gamma proteobacterium, Gluconacetobacter diazotrophicus, Haemophilus parainfluenzas , Haemophilus sputorum, Helicobacter canadensis, Helicobacter cinaedi, Helicobacter mustelae, Ilyobacter polytropus, Kingella kingae, Lactobacillus crispatus, Listeria ivanovii , Listeria monocytogenes, Listeriaceae bacterium, Methylocystis sp., Methylosinus trichosporium, Mobiluncus mulieris, Neisseria bacilliformis, Neisseria cinerea, Neisseria flavescens, Neisseria lactamica, Neisseria sp. , Neisseria wadsworthii, Nitrosomonas sp. , Parvibaculum lavamentivorans, Pasteurella multocida, Phascolarctobacterium succinatutens, Ralstonia syzygii, Rhodopseudomonas palustris, Rhodovulum sp. , Simonsiella muelleri, Sphingomonas sp., Sporolactobacillus vineae, Staphylococcus lugdunensis, Streptococcus sp. , Subdoligranulum sp. , Tistrella mobilis, Treponema sp. или Verminephrobacter eiseniae.Streptococcus pyogenes, Staphylococcus aureus (S. aureus), Acidovorax avenae, Actinobacillus pleuropneumoniae, Actinobacillus succinogenes, Actinobacillus suis, Actinomyces sp. , cycliphilus denitrifleans, Aminomonas paucivorans, Bacillus cereus, Bacillus smith!!. Bacillus thuringiensis, Bacteroides sp. r Blastopirellula marina, Bradyrhizobium sp. , Brevibacillus laterosporus, Campylobacter coll, Campylobacter jejuni, Campylobacter lari, Candidatus Punice!spirillum, Clostridium cellulolyticum, Clostridium perfringens, Corynebacterium accolens, Corynebacterium diphtheria, Corynebacterium matruchotii, Dinoroseobacter shibae, Eubacterium dolichum, gamma proteobacterium, Gluconacetobacter diazotrophicus, Haemophilus parainfluenzas , Haemophilus sputorum , Helicobacter canadensis, Helicobacter cinaedi, Helicobacter mustelae, Ilyobacter polytropus, Kingella kingae, Lactobacillus crispatus, Listeria ivanovii , Listeria monocytogenes, Listeriaceae bacterium, Methylocystis sp., Methylosinus trichosporium, Mobiluncus mulieris, Neisseria bacilliformis, Neiscenisseria cinereaves, Neisseria sp. , Neisseria wadsworthii, Nitrosomonas sp. , Parvibaculum lavamentivorans, Pasteurella multocida, Phascolarctobacterium succinatutens, Ralstonia syzygii, Rhodopseudomonas palustris, Rhodovulum sp. , Simonsiella muelleri, Sphingomonas sp., Sporolactobacillus vineae, Staphylococcus lugdunensis, Streptococcus sp. , Subdoligranulum sp. , Tistrella mobilis, Treponema sp. or Verminephrobacter eiseniae.

В определенных вариантах осуществления молекула Cas9 представляет собой белок Cas9, который представляет собой молекулу Cas9 Streptococcus pyogenes (также называемую в данном документе SpCas9). В определенных вариантах осуществления молекула Cas9 представляет собой молекулу Cas9 Staphylococcus aureus (также называемую в данном документе SaCas9).In certain embodiments, the Cas9 molecule is a Cas9 protein, which is a Streptococcus pyogenes Cas9 molecule (also referred to herein as SpCas9). In certain embodiments, the Cas9 molecule is a Staphylococcus aureus Cas9 molecule (also referred to herein as SaCas9).

Молекула Cas9 или слитый белок Cas9 могут взаимодействовать с одной или несколькими молекулами gRNA и совместно с молекулой(ами) gRNA, расположенными в сайте, который включает целевой домен и в определенных вариантах осуществления последовательность PAM. Способность молекулы Cas9 или слитого белка Cas9 распознавать последовательность PAM может определяться, например, с применением анализа трансформации, как описано ранее (Jinek 2012).A Cas9 molecule or a Cas9 fusion protein can interact with one or more gRNA molecules and together with the gRNA molecule(s) located at a site that includes a target domain and, in certain embodiments, a PAM sequence. The ability of a Cas9 molecule or a Cas9 fusion protein to recognize a PAM sequence can be determined, for example, using transformation analysis as described previously (Jinek 2012).

В определенных вариантах осуществления способность молекулы Cas9 или слитого белка Cas9 взаимодействовать с целевой нуклеиновой кислотой и расщеплять ее зависит от последовательности PAM. Последовательность PAM представляет собой последовательность в целевой нуклеиновой кислоте. В определенных вариантах осуществления расщепление целевой нуклеиновой кислоты происходит выше последовательности PAM. Молекулы Cas9 из различных видов бактерий могут распознавать различные мотивы последовательностей (например, последовательностей PAM). В определенных вариантах осуществления молекула Cas9 S. pyogenes узнает мотив последовательности NGG и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности (см., например, Mali, 2013). В определенных вариантах осуществления молекула Cas9 S. thermophilus распознает мотив последовательности NGGNG (SEQ ID NO: 36) и/или NNAGAAW (W=A или T) (SEQ ID NO: 20) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этих последовательностей (см., например Horvath, 2010; Deveau, 2008). В определенных вариантах осуществления молекула Cas9 S. mutans распознает мотив последовательности NGG и/или NAAR (R=A или G) (SEQ ID NO: 21) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности (см., например Deveau 2008). В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRR (R=A или G) (SEQ ID NO: 22) и управляетIn certain embodiments, the ability of the Cas9 molecule or Cas9 fusion protein to interact with and cleave the target nucleic acid is dependent on the PAM sequence. The PAM sequence is the sequence in the target nucleic acid. In certain embodiments, the target nucleic acid is cleaved upstream of the PAM sequence. Cas9 molecules from different bacterial species can recognize different sequence motifs (eg, PAM sequences). In certain embodiments, the S. pyogenes Cas9 molecule recognizes the NGG sequence motif and directs cleavage of the target nucleic acid sequence 1 to 10 bp, e.g. 3 to 5 bp, upstream of that sequence (see, e.g., Mali, 2013). In certain embodiments, the S. thermophilus Cas9 molecule recognizes the sequence motif NGGNG (SEQ ID NO: 36) and/or NNAGAAW (W=A or T) (SEQ ID NO: 20) and directs the cleavage of the target nucleic acid sequence from 1 to 10 bp .o., for example, 3 to 5 bp, above these sequences (see, for example, Horvath, 2010; Deveau, 2008). In certain embodiments, the S. mutans Cas9 molecule recognizes the NGG and/or NAAR (R=A or G) sequence motif (SEQ ID NO: 21) and directs cleavage of the target nucleic acid sequence from 1 to 10 bp, e.g. from 3 up to 5 bp, above this sequence (see, for example, Deveau 2008). In certain embodiments, the S. aureus Cas9 molecule recognizes the NNGRR (R=A or G) sequence motif (SEQ ID NO: 22) and controls

- 14 042798 расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRN (R=A или G) (SEQ ID NO: 23) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRT (R=A или G) (SEQ ID NO: 24) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности. В определенных вариантах осуществления молекула Cas9 S. aureus распознает мотив последовательности NNGRRV (R=A или G; V=A, или C, или G) (SEQ ID NO: 25) и управляет расщеплением целевой последовательности нуклеиновой кислоты от 1 до 10 п.о., например от 3 до 5 п.о., выше этой последовательности. В вышеупомянутых вариантах осуществления N может представлять собой нуклеотидный остаток, например, любой из A, G, C или T. Молекулы Cas9 могут быть сконструированы для изменения специфичности PAM молекулы Cas9.- 14 042798 cleavage of the target nucleic acid sequence from 1 to 10 bp, for example from 3 to 5 bp, above this sequence. In certain embodiments, the S. aureus Cas9 molecule recognizes the NNGRRN sequence motif (R=A or G) (SEQ ID NO: 23) and directs cleavage of the target nucleic acid sequence from 1 to 10 bp, e.g., from 3 to 5 bp. o., above this sequence. In certain embodiments, the S. aureus Cas9 molecule recognizes the NNGRRT (R=A or G) sequence motif (SEQ ID NO: 24) and directs cleavage of the target nucleic acid sequence from 1 to 10 bp, e.g., from 3 to 5 bp. o., above this sequence. In certain embodiments, the S. aureus Cas9 molecule recognizes the NNGRRV sequence motif (R=A or G; V=A or C or G) (SEQ ID NO: 25) and directs 1 to 10 bp cleavage of the target nucleic acid sequence. o., for example, from 3 to 5 bp, above this sequence. In the above embodiments, N may be a nucleotide residue, eg, any of A, G, C, or T. Cas9 molecules can be designed to change the PAM specificity of the Cas9 molecule.

В определенных вариантах осуществления вектор кодирует по меньшей мере одну молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25). В определенных вариантах осуществления по меньшей мере одна молекула Cas9 представляет собой молекулу Cas9 S. aureus. В определенных вариантах осуществления по меньшей мере одна молекула Cas9 представляет собой мутантную молекулу Cas9 S. aureus.In certain embodiments, the vector encodes at least one Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25). In certain embodiments, at least one Cas9 molecule is a S. aureus Cas9 molecule. In certain embodiments, at least one Cas9 molecule is a mutant S. aureus Cas9 molecule.

Белок Cas9 может быть мутирован таким образом, что нуклеазная активность инактивирована. Инактивированный белок Cas9 (iCas9, также называемый dCas9) без эндонуклеазной активности ранее нацеливали на гены в клетках бактерий, дрожжей и человека с помощью gRNA для сайленсинга экспрессии генов посредством стерических затруднений. Иллюстративные мутации по отношению к последовательности Cas9 S. pyogenes включают D10A, E762A, H840A, N854A, N863A и/или D986A. Иллюстративные мутации по отношению к последовательности Cas9 S. aureus включают D10A и N580A. В определенных вариантах осуществления молекула Cas9 представляет собой мутантную молекулу Cas9 S. aureus. В определенных вариантах осуществления мутантная молекула Cas9 S. aureus содержит мутацию D10A. Нуклеотидная последовательность, кодирующая данную мутантную Cas9 S. aureus, изложена под SEQ ID NO: 34, которая представлена ниже.The Cas9 protein can be mutated such that nuclease activity is inactivated. An inactivated Cas9 protein (iCas9, also referred to as dCas9) without endonuclease activity has previously been targeted to genes in bacteria, yeast, and human cells with gRNA to silence gene expression through steric hindrance. Exemplary mutations to the S. pyogenes Cas9 sequence include D10A, E762A, H840A, N854A, N863A and/or D986A. Illustrative mutations to the S. aureus Cas9 sequence include D10A and N580A. In certain embodiments, the Cas9 molecule is a mutant S. aureus Cas9 molecule. In certain embodiments, the mutant S. aureus Cas9 molecule contains the D10A mutation. The nucleotide sequence encoding this S. aureus mutant Cas9 is set forth under SEQ ID NO: 34, which is shown below.

atgaaaagga atgaaaagga actacattct actacattct ggggctggcc ggggctggcc atcgggatta atcgggatta caagcgtggg caagcgtggg gtatgggatt gtatgggatt attgactatg attgactatg aaacaaggga aaaaaggga cgtgatcgac cgtgatcgac gcaggcgtca gcaggcgtca gactgttcaa gactgttcaa ggaggccaac ggaggccaac gtggaaaaca gtggaaaaca atgagggacg atgagggacg gagaagcaag gagaagcaag aggggagcca aggggagcca ggcgcctgaa ggcgcctgaa acgacggaga acgacggaga aggcacagaa aggcacagaa tccagagggt tccagagggt gaagaaactg gaagaaactg ctgttcgatt ctgttcgatt acaacctgct acaacctgct gaccgaccat gaccgaccat tctgagctga tctgagctga gtggaattaa gtggaattaa tccttatgaa tccttatgaa gccagggtga gccagggtga aaggcctgag aaggcctgag tcagaagctg tcagaagctg tcagaggaag tcagaggaag agttttccgc agttttccgc agctctgctg agctctgctg cacctggcta cacctggcta agcgccgagg agcgccgagg agtgcataac agtgcataac gtcaatgagg gtcaatgagg tggaagagga tggaagagga caccggcaac caccggcaac gagctgtcta gagctgtcta caaaggaaca caaaggaaca gatctcacgc gatctcacgc aatagcaaag aatagcaaag ctctggaaga ctctggaaga gaagtatgtc gaagtatgtc gcagagctgc gcagagctgc agctggaacg agctggaacg gctgaagaaa gctgaagaaa gatggcgagg gatggcgagg tgagagggtc tgaggggtc aattaatagg aattaatagg ttcaagacaa ttcaagacaa gcgactacgt gcgactacgt caaagaagcc caaagaagcc aagcagctgc aagcagctgc tgaaagtgca tgaaagtgca gaaggcttac gaaggcttac caccagctgg caccagctgg atcagagctt atcagagctt catcgatact catcgatact tatatcgacc tatatcgacc tgctggagac tgctggagac tcggagaacc tcggagaacc tactatgagg tactatgagg gaccaggaga gaccaggaga agggagcccc agggagcccc ttcggatgga ttcggatgga aagacatcaa aagacatcaa ggaatggtac ggaatggtac gagatgctga gagatgctga tgggacattg tgggacattg cacctatttt cacctatttt ccagaagagc ccagaagagc tgagaagcgt tgagaagcgt caagtacgct caagtacgct tataacgcag tataacgcag atctgtacaa atctgtacaa cgccctgaat cgccctgaat gacctgaaca gacctgaaca acctggtcat acctggtcat caccagggat caccagggat gaaaacgaga gaaaacgaga aactggaata aactggaata ctatgagaag ctatgagaag ttccagatca ttccagatca tcgaaaacgt tcgaaaacgt gtttaagcag gtttaagcag aagaaaaagc aagaaaaagc ctacactgaa ctacactgaa acagattgct acagattgct aaggagatcc aggagatcc tggtcaacga tggtcaacga agaggacatc aggagacatc aagggctacc aagggctacc gggtgacaag gggtgacaag cactggaaaa cactggaaaa ccagagttca ccagagttca ccaatctgaa ccaatctgaa agtgtatcac agtgtatcac gatattaagg gatattaagg acatcacagc acatcacagc acggaaagaa acggaaagaa atcattgaga atcattgaga acgccgaact acgccgaact gctggatcag gctggatcag attgctaaga attgctaaga tcctgactat tcctgactat ctaccagagc ctaccagagc tccgaggaca tccgaggaca tccaggaaga tccaggaaga gctgactaac gctgactaac ctgaacagcg ctgaacagcg agctgaccca agctgaccca ggaagagatc ggaagagatc gaacagatta gaacagatta gtaatctgaa gtaatctgaa ggggtacacc ggggtacacc ggaacacaca ggaacacaca acctgtccct acctgtccct gaaagctatc gaaagctatc

- 15 042798- 15 042798

aatctgattc aatctgattc tggatgagct tggatgagct gtggcataca gtggcataca aacgacaatc aacgacaatc agattgcaat agattgcaat ctttaaccgg ctttaaccgg ctgaagctgg ctgaagctgg tcccaaaaaa tcccaaaaaa ggtggacctg ggtggacctg agtcagcaga agtcagcaga aagagatccc aagagatccc aaccacactg aaccacactg gtggacgatt gtggacgatt tcattctgtc tcattctgtc acccgtggtc acccgtggtc aagcggagct aagcggagct tcatccagag tcatccagag catcaaagtg catcaaagtg atcaacgcca atcaacgcca tcatcaagaa tcatcaagaa gtacggcctg gtacggcctg cccaatgata cccaatgata tcattatcga tcattatcga gctggctagg gctgctaggg gagaagaaca gagaagaaca gcaaggacgc gcaaggacgc acagaagatg acagaagatg atcaatgaga atcaatgaga tgcagaaacg tgcagaaacg aaaccggcag aaaccggcag accaatgaac accaatgaac gcattgaaga gcattgaaga gattatccga gattatccga actaccggga actaccggga aagagaacgc aagagaacgc aaagtacctg aaagtacctg attgaaaaaa attgaaaaaa tcaagctgca tcaagctgca cgatatgcag cgatatgcag gagggaaagt gagggaaagt gtctgtattc gtctgtattc tctggaggcc tctggaggcc atccccctgg atccccctgg aggacctgct aggacctgct gaacaatcca gaacaatcca ttcaactacg ttcaactacg aggtcgatca aggtcgatca tattatcccc tattatcccc agaagcgtgt agaagcgtgt ccttcgacaa ccttcgacaa ttcctttaac ttcctttaac aacaaggtgc aacaaggtgc tggtcaagca tggtcaagca ggaagagaac ggaagagaac tctaaaaagg tctaaaaagg gcaataggac gcaataggac tcctttccag tcctttccag tacctgtcta tacctgtcta gttcagattc gttcagattc caagatctct caagatctct tacgaaacct tacgaaacct ttaaaaagca ttaaaaagca cattctgaat cattctgaat ctggccaaag ctggccaaag gaaagggccg gaaagggccg catcagcaag catcagcaag accaaaaagg accaaaaagg agtacctgct agtacctgct ggaagagcgg ggaagagcgg gacatcaaca gacatcaaca gattctccgt gattctccgt ccagaaggat ccagaaggat tttattaacc tttattaacc ggaatctggt ggaatctggt ggacacaaga ggacacaaga tacgctactc tacgctactc gcggcctgat gcggcctgat gaatctgctg gaatctgctg cgatcctatt cgatcctatt tccgggtgaa tccgggtgaa caatctggat catctggat gtgaaagtca gtgaaagtca agtccatcaa agtccatcaa cggcgggttc cggcggttc acatcttttc acatcttttc tgaggcgcaa tgaggcgcaa atggaagttt atggaagttt aaaaaggagc aaaaaggagc gcaacaaagg gcaacaaagg gtacaagcac gtacaagcac catgccgaag catgccgaag atgctctgat atgctctgat tatcgcaaat tatcgcaaat gccgacttca gccgacttca tctttaagga tctttaagga gtggaaaaag gtggaaaaag ctggacaaag ctggacaaag ccaagaaagt ccaagaaagt gatggagaac gatggagaac cagatgttcg cagatgttcg aagagaagca aagagaagca ggccgaatct ggccgaatct atgcccgaaa atgcccgaaa tcgagacaga tcgagacaga acaggagtac acaggagtac aaggagattt aggagattt tcatcactcc tcatcactcc tcaccagatc tcaccagatc aagcatatca aagcatatca aggatttcaa aggatttcaa ggactacaag ggactacaag tactctcacc tactctcacc gggtggataa gggtggataa aaagcccaac aaagcccaac agagagctga agagagctga tcaatgacac tcaatgacac cctgtatagt cctgtatagt acaagaaaag acaagaaaag acgataaggg acgataaggg gaataccctg gaataccctg attgtgaaca attgtgaaca atctgaacgg atctgaacgg actgtacgac actgtacgac aaagataatg aaagataatg acaagctgaa acaagctgaa aaagctgatc aaagctgatc aacaaaagtc aacaaaagtc ccgagaagct ccgagaagct gctgatgtac gctgatgtac caccatgatc caccatgatc ctcagacata ctcagacata tcagaaactg tcagaaactg aagctgatta aagctgatta tggagcagta tggagcagta cggcgacgag cggcgacgag aagaacccac aagaacccac tgtataagta tgtataagta ctatgaagag ctatgaagag actgggaact actgggaact acctgaccaa acctgaccaa gtatagcaaa gtatagcaaa aaggataatg aaggataatg gccccgtgat gccccgtgat caagaagatc caagaagatc aagtactatg aagtactatg ggaacaagct ggaacaagct gaatgcccat gaatgcccat ctggacatca ctggacatca cagacgatta cagacgatta ccctaacagt ccctaacagt cgcaacaagg cgcaacaagg tggtcaagct tggtcaagct gtcactgaag gtcactgaag ccatacagat ccatacagat tcgatgtcta tcgatgtcta tctggacaac tctggacaac ggcgtgtata ggcgtgtata aatttgtgac aatttgtgac tgtcaagaat tgtcaagaat ctggatgtca ctggatgtca tcaaaaagga tcaaaaagga gaactactat gaactactat gaagtgaata gaagtgaata gcaagtgcta gcaagtgcta cgaagaggct cgaagaggct aaaaagctga aaaaagctga aaaagattag aaaagattag caaccaggca caaccaggca gagttcatcg gagttcatcg cctcctttta ccctcctttta caacaacgac caacaacgac ctgattaaga ctgattaaga tcaatggcga tcaatggcga actgtatagg actgtatagg gtcatcgggg gtcatcgggg tgaacaatga tgaacaatga tctgctgaac tctgctgaac cgcattgaag cgcattgaag tgaatatgat tgaatatgat tgacatcact tgacatcact taccgagagt taxgagagt atctggaaaa atctggaaaa catgaatgat catgaatgat aagcgccccc aagcgccccc ctcgaattat ctcgaattat caaaacaatt caaaacaatt gcctctaaga gcctctaaga ctcagagtat ctcagagtat caaaaagtac caaaaagtac tcaaccgaca tcaaccgaca

ttctgggaaa cctgtatgag gtgaagagca aaaagcaccc tcagattatc aaaaagggc [SEQ ID NO: 34].ttctgggaaa cctgtatgag gtgaagagca aaaagcaccc tcagattatc aaaaagggc [SEQ ID NO: 34].

В определенных вариантах осуществления мутантная молекула Cas9 S. aureus содержит мутацию N580A. Нуклеотидная последовательность, кодирующая эту мутантную молекулу Cas9 S. aureus, изложена под SEQ ID NO: 35, которая представлена ниже.In certain embodiments, the mutant S. aureus Cas9 molecule contains the N580A mutation. The nucleotide sequence encoding this mutant S. aureus Cas9 molecule is set forth under SEQ ID NO: 35, which is shown below.

- 16 042798- 16 042798

atgaaaagga atgaaaagga actacattct actacattct ggggctggac ggggctggac atcgggatta atcgggatta caagcgtggg caagcgtggg gtatgggatt gtatgggatt attgactatg attgactatg aaacaaggga aaaaaggga cgtgatcgac cgtgatcgac gcaggcgtca gcaggcgtca gactgttcaa gactgttcaa ggaggccaac ggaggccaac gtggaaaaca gtggaaaaca atgagggacg atgagggacg gagaagcaag gagaagcaag aggggagcca aggggagcca ggcgcctgaa ggcgcctgaa acgacggaga acgacggaga aggcacagaa aggcacagaa tccagagggt tccagagggt gaagaaactg gaagaaactg ctgttcgatt ctgttcgatt acaacctgct acaacctgct gaccgaccat gaccgaccat tctgagctga tctgagctga gtggaattaa gtggaattaa tccttatgaa tccttatgaa gccagggtga gccagggtga aaggcctgag aaggcctgag tcagaagctg tcagaagctg tcagaggaag tcagaggaag agttttccgc agttttccgc agctctgctg agctctgctg cacctggcta cacctggcta agcgccgagg agcgccgagg agtgcataac agtgcataac gtcaatgagg gtcaatgagg tggaagagga tggaagagga caccggcaac caccggcaac gagctgtcta gagctgtcta caaaggaaca caaaggaaca gatctcacgc gatctcacgc aatagcaaag aatagcaaag ctctggaaga ctctggaaga gaagtatgtc gaagtatgtc gcagagctgc gcagagctgc agctggaacg agctggaacg gctgaagaaa gctgaagaaa gatggcgagg gatggcgagg tgagagggtc tgaggggtc aattaatagg aattaatagg ttcaagacaa ttcaagacaa gcgactacgt gcgactacgt caaagaagcc caaagaagcc aagcagctgc aagcagctgc tgaaagtgca tgaaagtgca gaaggcttac gaaggcttac caccagctgg caccagctgg atcagagctt atcagagctt catcgatact catcgatact tatatcgacc tatatcgacc tgctggagac tgctggagac tcggagaacc tcggagaacc tactatgagg tactatgagg gaccaggaga gaccaggaga agggagcccc agggagcccc ttcggatgga ttcggatgga aagacatcaa aagacatcaa ggaatggtac ggaatggtac gagatgctga gagatgctga tgggacattg tgggacattg cacctatttt cacctatttt ccagaagagc ccagaagagc tgagaagcgt tgagaagcgt caagtacgct caagtacgct tataacgcag tataacgcag atctgtacaa atctgtacaa cgccctgaat cgccctgaat gacctgaaca gacctgaaca acctggtcat acctggtcat caccagggat caccagggat gaaaacgaga gaaaacgaga aactggaata aactggaata ctatgagaag ctatgagaag ttccagatca ttccagatca tcgaaaacgt tcgaaaacgt gtttaagcag gtttaagcag aagaaaaagc aagaaaaagc ctacactgaa ctacactgaa acagattgct acagattgct aaggagatcc aggagatcc tggtcaacga tggtcaacga agaggacatc aggagacatc aagggctacc aagggctacc gggtgacaag gggtgacaag cactggaaaa cactggaaaa ccagagttca ccagagttca ccaatctgaa ccaatctgaa agtgtatcac agtgtatcac gatattaagg gatattaagg acatcacagc acatcacagc acggaaagaa acggaaagaa atcattgaga atcattgaga acgccgaact acgccgaact gctggatcag gctggatcag attgctaaga attgctaaga tcctgactat tcctgactat ctaccagagc ctaccagagc tccgaggaca tccgaggaca tccaggaaga tccaggaaga gctgactaac gctgactaac ctgaacagcg ctgaacagcg agctgaccca agctgaccca ggaagagatc ggaagagatc gaacagatta gaacagatta gtaatctgaa gtaatctgaa ggggtacacc ggggtacacc ggaacacaca ggaacacaca acctgtccct acctgtccct gaaagctatc gaaagctatc aatctgattc aatctgattc tggatgagct tggatgagct gtggcataca gtggcataca aacgacaatc aacgacaatc agattgcaat agattgcaat ctttaaccgg ctttaaccgg ctgaagctgg ctgaagctgg tcccaaaaaa tcccaaaaaa ggtggacctg ggtggacctg agtcagcaga agtcagcaga aagagatccc aagagatccc aaccacactg aaccacactg gtggacgatt gtggacgatt tcattctgtc tcattctgtc acccgtggtc acccgtggtc aagcggagct aagcggagct tcatccagag tcatccagag catcaaagtg catcaaagtg atcaacgcca atcaacgcca tcatcaagaa tcatcaagaa gtacggcctg gtacggcctg cccaatgata cccaatgata tcattatcga tcattatcga gctggctagg gctgctaggg gagaagaaca gagaagaaca gcaaggacgc gcaaggacgc acagaagatg acagaagatg atcaatgaga atcaatgaga tgcagaaacg tgcagaaacg aaaccggcag aaaccggcag accaatgaac accaatgaac gcattgaaga gcattgaaga gattatccga gattatccga actaccggga actaccggga aagagaacgc aagagaacgc aaagtacctg aaagtacctg attgaaaaaa attgaaaaaa tcaagctgca tcaagctgca cgatatgcag cgatatgcag gagggaaagt gagggaaagt gtctgtattc gtctgtattc tctggaggcc tctggaggcc atccccctgg atccccctgg aggacctgct aggacctgct gaacaatcca gaacaatcca

- 17 042798- 17 042798

ttcaactacg ttcaactacg aggtcgatca aggtcgatca tattatcccc tattatcccc agaagcgtgt agaagcgtgt ccttcgacaa ccttcgacaa ttcctttaac ttcctttaac aacaaggtgc aacaaggtgc tggtcaagca tggtcaagca ggaagaggcc ggaagaggcc tctaaaaagg tctaaaaagg gcaataggac gcaataggac tcctttccag tcctttccag tacctgtcta tacctgtcta gttcagattc gttcagattc caagatctct caagatctct tacgaaacct tacgaaacct ttaaaaagca ttaaaaagca cattctgaat cattctgaat ctggccaaag ctggccaaag gaaagggccg gaaagggccg catcagcaag catcagcaag accaaaaagg accaaaaagg agtacctgct agtacctgct ggaagagcgg ggaagagcgg gacatcaaca gacatcaaca gattctccgt gattctccgt ccagaaggat ccagaaggat tttattaacc tttattaacc ggaatctggt ggaatctggt ggacacaaga ggacacaaga tacgctactc tacgctactc gcggcctgat gcggcctgat gaatctgctg gaatctgctg cgatcctatt cgatcctatt tccgggtgaa tccgggtgaa caatctggat catctggat gtgaaagtca gtgaaagtca agtccatcaa agtccatcaa cggcgggttc cggcggttc acatcttttc acatcttttc tgaggcgcaa tgaggcgcaa atggaagttt atggaagttt aaaaaggagc aaaaaggagc gcaacaaagg gcaacaaagg gtacaagcac gtacaagcac catgccgaag catgccgaag atgctctgat atgctctgat tatcgcaaat tatcgcaaat gccgacttca gccgacttca tctttaagga tctttaagga gtggaaaaag gtggaaaaag ctggacaaag ctggacaaag ccaagaaagt ccaagaaagt gatggagaac gatggagaac cagatgttcg cagatgttcg aagagaagca aagagaagca ggccgaatct ggccgaatct atgcccgaaa atgcccgaaa tcgagacaga tcgagacaga acaggagtac acaggagtac aaggagattt aggagattt tcatcactcc tcatcactcc tcaccagatc tcaccagatc aagcatatca aagcatatca aggatttcaa aggatttcaa ggactacaag ggactacaag tactctcacc tactctcacc gggtggataa gggtggataa aaagcccaac aaagcccaac agagagctga agagagctga tcaatgacac tcaatgacac cctgtatagt cctgtatagt acaagaaaag acaagaaaag acgataaggg acgataaggg gaataccctg gaataccctg attgtgaaca attgtgaaca atctgaacgg atctgaacgg actgtacgac actgtacgac aaagataatg aaagataatg acaagctgaa acaagctgaa aaagctgatc aaagctgatc aacaaaagtc aacaaaagtc ccgagaagct ccgagaagct gctgatgtac gctgatgtac caccatgatc caccatgatc ctcagacata ctcagacata tcagaaactg tcagaaactg aagctgatta aagctgatta tggagcagta tggagcagta cggcgacgag cggcgacgag aagaacccac aagaacccac tgtataagta tgtataagta ctatgaagag ctatgaagag actgggaact actgggaact acctgaccaa acctgaccaa gtatagcaaa gtatagcaaa aaggataatg aaggataatg gccccgtgat gccccgtgat caagaagatc caagaagatc aagtactatg aagtactatg ggaacaagct ggaacaagct gaatgcccat gaatgcccat ctggacatca ctggacatca cagacgatta cagacgatta ccctaacagt ccctaacagt cgcaacaagg cgcaacaagg tggtcaagct tggtcaagct gtcactgaag gtcactgaag ccatacagat ccatacagat tcgatgtcta tcgatgtcta tctggacaac tctggacaac ggcgtgtata ggcgtgtata aatttgtgac aatttgtgac tgtcaagaat tgtcaagaat ctggatgtca ctggatgtca tcaaaaagga tcaaaaagga gaactactat gaactactat gaagtgaata gaagtgaata gcaagtgcta gcaagtgcta cgaagaggct cgaagaggct aaaaagctga aaaaagctga aaaagattag aaaagattag caaccaggca caaccaggca gagttcatcg gagttcatcg cctcctttta ccctcctttta caacaacgac caacaacgac ctgattaaga ctgattaaga tcaatggcga tcaatggcga actgtatagg actgtatagg gtcatcgggg gtcatcgggg tgaacaatga tgaacaatga tctgctgaac tctgctgaac cgcattgaag cgcattgaag tgaatatgat tgaatatgat tgacatcact tgacatcact taccgagagt taxgagagt atctggaaaa atctggaaaa catgaatgat catgaatgat aagcgccccc aagcgccccc ctcgaattat ctcgaattat caaaacaatt caaaacaatt gcctctaaga gcctctaaga ctcagagtat ctcagagtat caaaaagtac caaaaagtac tcaaccgaca tcaaccgaca ttctgggaaa ttctgggaaa cctgtatgag gtgaagagca aaaagcaccc tcagattatc cctgtatgag gtgaagagca aaaagcaccc tcagattatc : aaaaagggc : aaaaagggc

[SEQ ID NO: 35].[SEQ ID NO: 35].

Нуклеиновая кислота, кодирующая молекулу Cas9, может представлять собой синтетическую последовательность нуклеиновой кислоты. Например, синтетическая молекула нуклеиновой кислоты может быть химически модифицирована. Синтетическая последовательность нуклеиновой кислоты может быть кодон-оптимизированной, например, по меньшей мере один необычный кодон или малораспространенный кодон замещали обычным кодоном Например, синтетическая нуклеиновая кислота может управлять синтезом оптимизированной информационной mRNA, например, оптимизированной для экспрессии в системе экспрессии млекопитающих, например, описанной в данном документе.The nucleic acid encoding the Cas9 molecule may be a synthetic nucleic acid sequence. For example, a synthetic nucleic acid molecule may be chemically modified. The synthetic nucleic acid sequence may be codon-optimized, e.g., at least one unusual codon or an uncommon codon has been replaced with a common codon. this document.

Дополнительно или как альтернатива нуклеиновая кислота, кодирующая молекулу Cas9 или полипептид Cas9, может содержать последовательность ядерной локализации (NLS). Последовательности ядерной локализации известны из уровня техники.Additionally or alternatively, the nucleic acid encoding a Cas9 molecule or a Cas9 polypeptide may comprise a nuclear localization sequence (NLS). Nuclear localization sequences are known in the art.

Иллюстративная кодон-оптимизированная последовательность нуклеиновой кислоты, кодирующая молекулу Cas9 S. pyogenes, изложена под SEQ ID NO: 26, которая представлена ниже.An exemplary codon-optimized nucleic acid sequence encoding the S. pyogenes Cas9 molecule is set forth under SEQ ID NO: 26, which is shown below.

- 18 042798- 18 042798

atggataaaa atggataaaa agtacagcat agtacagcat cgggctggac cgggctggac atcggtacaa atcggtacaa actcagtggg actcagtggg gtgggccgtg gtgggccgtg attacggacg attacggacg agtacaaggt agtacaaggt accctccaaa accctccaaa aaatttaaag aaatttaaag tgctgggtaa tgctgggtaa cacggacaga cacggacaga cactctataa cactctataa agaaaaatct agaaaaatct tattggagcc tattggagcc ttgctgttcg ttgctgttcg actcaggcga actcaggcga gacagccgaa gacagccgaa gccacaaggt gccacaaggt tgaagcggac tgaagcggac cgccaggagg cgccaggagg cggtatacca cggtatacca ggagaaagaa ggagaaagaa ccgcatatgc ccgcatatgc tacctgcaag tacctgcaag aaatcttcag aaatcttcag taacgagatg taacgagatg gcaaaggttg gcaaaggttg acgatagctt acgatagctt tttccatcgc tttccatcgc ctggaagaat ctggaagaat cctttcttgt ccttttcttgt tgaggaagac tgaggaagac aagaagcacg aagaagcacg aacggcaccc aacggcaccc catctttggc catctttggc aatattgtcg aatattgtcg acgaagtggc acgaagtggc atatcacgaa atatcacgaa aagtacccga aagtacccga ctatctacca ctatctacca cctcaggaag ccctcaggaag aagctggtgg aagctggtgg actctaccga actactaccga taaggcggac taaggcggac ctcagactta ctcagactta tttatttggc ttttttggc actcgcccac actcgcccac atgattaaat atgattaaat ttagaggaca ttagaggaca tttcttgatc ttctttgatc gagggcgacc gagggcgacc tgaacccgga tgaacccgga caacagtgac caacagtgac gtcgataagc gtcgataagc tgttcatcca tgttcatcca acttgtgcag acttgtgcag acctacaatc acctacaatc aactgttcga aactgttcga agaaaaccct agaaaaccct ataaatgctt ataaatgctt caggagtcga caggagtcga cgctaaagca cgctaaagca atcctgtccg atcctgtccg cgcgcctctc cgcgcctctc aaaatctaga aaaatctaga agacttgaga agacttgaga atctgattgc atctgattgc tcagttgccc tcagttgccc ggggaaaaga ggggaaaaga aaaatggatt aaaatggatt gtttggcaac gttggcaac ctgatcgccc ctgatcgcc tcagtctcgg tcagtctcgg actgacccca actgacccca aatttcaaaa aatttcaaaa gtaacttcga gtaacttcga cctggccgaa cctggccgaa gacgctaagc gacgctaagc tccagctgtc tccagctgtc caaggacaca caaggacaca tacgatgacg tacgatgacg acctcgacaa acctcgacaa tctgctggcc tctgctggcc cagattgggg cagattgggg atcagtacgc atcagtacgc cgatctcttt cgatctcttt ttggcagcaa ttggcagcaa agaacctgtc agaacctgtc cgacgccatc cgacgccatc ctgttgagcg ctgttgagcg atatcttgag atatcttgag agtgaacacc agtgaacacc gaaattacta gaaattacta aagcacccct aagcaccct tagcgcatct tagcgcatct atgatcaagc atgatcaagc ggtacgacga ggtacgacga gcatcatcag gcatcatcag gatctgaccc gatctgaccc tgctgaaggc tgctgaaggc tcttgtgagg tcttgtgagg caacagctcc caacagctcc ccgaaaaata ccgaaaaata caaggaaatc caaggaaatc ttctttgacc ttctttgacc agagcaaaaa aggcaaaaa cggctacgct cggctacgct ggctatatag ggctatatag atggtggggc atggtggggc cagtcaggag cagtcaggag gaattctata gaattctata aattcatcaa aattcatcaa gcccattctc gcccattctc gagaaaatgg gagaaaatgg acggcacaga acggcacaga ggagttgctg ggagttgctg gtcaaactta gtcaaactta acagggagga acagggagga cctgctgcgg ccctgctgcgg aagcagcgga aagcagcgga cctttgacaa ccttgacaa cgggtctatc cgggtctatc ccccaccaga ccccaccaga ttcatctggg ttcatctggg cgaactgcac cgaactgcac gcaatcctga gcaatcctga ggaggcagga ggaggcagga ggatttttat ggatttttat ccttttctta ccttttctta aagataaccg aagataaccg cgagaaaata cgagaaaata gaaaagattc gaaaagattc ttacattcag ttacattcag gatcccgtac gatcccgtac tacgtgggac tacgtgggac ctctcgcccg ctctcgccg gggcaattca gggcaattca cggtttgcct cggtttgcct ggatgacaag ggatgacaag gaagtcagag gaagtcagag gagactatta gagactatta caccttggaa caccttggaa cttcgaagaa cttcgaagaa gtggtggaca gtggtggaca agggtgcatc agggtgcatc tgcccagtct tgccgtct ttcatcgagc ttcatcgagc ggatgacaaa ggatgacaaa ttttgacaag ttttgacaag aacctcccta aacctccta atgagaaggt atgagaaggt gctgcccaaa gctgcccaaa cattctctgc cattctctgc tctacgagta tctacgagta ctttaccgtc ctttaccgtc tacaatgaac tacaatgaac tgactaaagt tgactaaagt caagtacgtc caagtacgtc accgagggaa accgagggaa tgaggaagcc tgaggaagcc ggcattcctt ggcattcctt agtggagaac agtggagaac agaagaaggc agaagaaggc gattgtagac gattgtagac ctgttgttca ctgttgttca agaccaacag agaccaacag gaaggtgact gaaggtgact gtgaagcaac gtgaagcaac ttaaagaaga ttaaagaaga ctactttaag ctactttaag aagatcgaat aagatcgaat gttttgacag gtttgacag tgtggaaatt tgtggaaatt tcaggggttg tcaggggttg aagaccgctt aagaccgctt caatgcgtca caatgcgtca ttggggactt ttggggactt accatgatct accatgatct tctcaagatc tctcaagatc ataaaggaca ataaaggaca aagacttcct aagacttcct ggacaacgaa ggacaacgaa gaaaatgagg gaaaatgagg atattctcga atattctcga agacatcgtc agacatcgtc ctcaccctga ctcaccctga ccctgttcga ccctgttcga agacagggaa agacagggaa atgatagaag atgatagaag agcgcttgaa agcgcttgaa aacctatgcc aacctatgcc cacctcttcg caccctcttcg acgataaagt acgataaagt tatgaagcag tatgaagcag ctgaagcgca ctgaagcgca ggagatacac ggagatacac aggatgggga aggatgggga agattgtcaa agattgtcaa ggaagctgat ggaagctgat caatggaatt caatggaatt agggataaac agggataaac agagtggcaa aggtggcaa gaccatactg gaccatactg gatttcctca gattcctca aatctgatgg aatctgatgg cttcgccaat cttcgccaat aggaacttca aggaacttca tgcaactgat tgcaactgat tcacgatgac tcacgatgac tctcttacct tctcttacct tcaaggagga tcaaggagga cattcaaaag cattcaaaag gctcaggtga gctcaggtga gcgggcaggg gcgggcaggg

- 19 042798- 19 042798

agactccctt agactcctt catgaacaca catgaacaca tcgcgaattt tcgcgaattt ggcaggttcc ggcaggttcc cccgctatta cccgctatta aaaagggcat aaaagggcat ccttcaaact ccttcaaact gtcaaggtgg gtcaaggtgg tggatgaatt tggatgaatt ggtcaaggta ggtcaaggta atgggcagac atgggcagac ataagccaga ataagccaga aaatattgtg aaatattgtg atcgagatgg atcgagatgg cccgcgaaaa cccgcgaaaa ccagaccaca ccagaccaca cagaagggcc cagaagggcc agaaaaatag agaaaaatag tagagagcgg tagagagcgg atgaagagga atgaagagga tcgaggaggg tcgaggaggg catcaaagag catcaaagag ctgggatctc ctgggatctc agattctcaa agattctcaa agaacacccc agaacaccc gtagaaaaca gtagaaaaca cacagctgca cacagctgca gaacgaaaaa gaacgaaaaa ttgtacttgt ttgtacttgt actatctgca actatctgca gaacggcaga gaacggcaga gacatgtacg gacatgtacg tcgaccaaga tcgaccaaga acttgatatt acttgatatt aatagactgt aatagactgt ccgactatga ccgactatga cgtagaccat cgtagaccat atcgtgcccc atcgtgcccc agtccttcct agtccttcct gaaggacgac gaaggacgac tccattgata tccattgata acaaagtctt acaaagtctt gacaagaagc gacaagaagc gacaagaaca gacaagaaca ggggtaaaag ggggtaaaag tgataatgtg tgataatgtg cctagcgagg cctagcgagg aggtggtgaa aggtggtgaa aaaaatgaag aaaaatgaag aactactggc aactactggc gacagctgct gacagctgct taatgcaaag taatgcaaag ctcattacac ctcattacac aacggaagtt aacggaagtt cgataatctg cgataatctg acgaaagcag acgaaagcag agagaggtgg agagaggtgg cttgtctgag cttgtctgag ttggacaagg ttggacaagg cagggtttat cagggtttat taagcggcag taagcggcag ctggtggaaa ctggtggaaa ctaggcagat ctaggcagat cacaaagcac cacaaagcac gtggcgcaga gtggcgcaga ttttggacag ttttggacag ccggatgaac ccggatgaac acaaaatacg acaaaatacg acgaaaatga acgaaaatga taaactgata taaactgata cgagaggtca cgagaggtca aagttatcac aagttatcac gctgaaaagc gctgaaaagc aagctggtgt aagctggtgt ccgattttcg ccgattttcg gaaagacttc gaaagacttc cagttctaca cagttctaca aagttcgcga aagttcgcga gattaataac gattaataac taccatcatg taccatcatg ctcacgatgc ctcacgatgc gtacctgaac gtacctgaac gctgttgtcg gctgttgtcg ggaccgcctt ggaccgcctt gataaagaag gataaagaag tacccaaagc taccaaagc tggaatccga tggaatccga gttcgtatac gttcgtatac ggggattaca ggggattaca aagtgtacga aagtgtacga tgtgaggaaa tgtgaggaaa atgatagcca atgatagcca agtccgagca agtccgagca ggagattgga ggagattgga aaggccacag aaggccacag ctaagtactt ctaagtactt cttttattct ctttttttct aacatcatga aacatcatga atttttttaa atttttttaa gacggaaatt gacggaaatt accctggcca accctggcca acggagagat acggagagat cagaaagcgg cagaaagcgg ccccttatag ccccttatag agacaaatgg agacaaatgg tgaaacaggt tgaaacaggt gaaatcgtct gaaatcgtct gggataaggg gggataaggg cagggatttc cagggattc gctactgtga gctactgtga ggaaggtgct ggaaggtgct gagtatgcca gagtatgcca caggtaaata caggtaaata tcgtgaaaaa tcgtgaaaaa aaccgaagta aaccgaagta cagaccggag cagaccggag gattttccaa gattttccaa ggaaagcatt ggaaagcatt ttgcctaaaa ttgcctaaaa gaaactcaga gaaactcaga caagctcatc caagctcatc gcccgcaaga gcccgcaaga aagattggga aagattggga ccctaagaaa ccctaagaaa tacgggggat tacgggggat ttgactcacc ttgactcacc caccgtagcc caccgtagcc tattctgtgc tattctgtgc tggtggtagc tggtggtagc taaggtggaa taaggtggaa aaaggaaagt aaaggaaagt ctaagaagct ctaagaagct gaagtccgtg gaagtccgtg aaggaactct aaggaactct tgggaatcac tgggaatcac tatcatggaa tatcatggaa agatcatcct agatecatcct ttgaaaagaa ttgaaaagaa ccctatcgat ccctatcgat ttcctggagg ttcctggagg ctaagggtta ctaagggtta caaggaggtc caaggaggtc aagaaagacc aagaaagacc tcatcattaa tcatcattaa actgccaaaa actgccaaaa tactctctct tactctctct tcgagctgga tcgagctgga aaatggcagg aaatggcagg aagagaatgt aagagaatgt tggccagcgc tggccagcgc cggagagctg cggagagctg caaaagggaa caaaagggaa acgagcttgc acgagcttgc tctgccctcc tctgccctcc aaatatgtta aaatatgtta attttctcta attttctcta tctcgcttcc tctcgcttcc cactatgaaa cactatgaaa agctgaaagg agctgaaagg gtctcccgaa gtctcccgaa gataacgagc gataacgagc agaagcagct agaagcagct gttcgtcgaa gttcgtcgaa cagcacaagc cagcacaagc actatctgga actatctgga tgaaataatc tgaaataatc gaacaaataa gaacaaataa gcgagttcag gcgagttcag caaaagggtt caaaagggtt atcctggcgg atcctggcgg atgctaattt atgctaattt ggacaaagta ggacaaagta ctgtctgctt ctgtctgctt ataacaagca ataacaagca ccgggataag ccgggataag cctattaggg cctattaggg aacaagccga aacaagccga gaatataatt gaatataatt cacctcttta cacctcttta cactcacgaa cactcacgaa tctcggagcc tctcggagcc cccgccgcct ccgccgcct tcaaatactt tcaaatactt tgatacgact tgatacgact atcgaccgga atcgaccgga aacggtatac aacggtatac cagtaccaaa cagtaccaaa gaggtcctcg gaggtcctcg atgccaccct atgccaccct catccaccag catccaccag

tcaattactg gcctgtacga aacacggatcgacctctctc aactgggcgg cgactag [SEQ ID NO: 26].tcaattactg gcctgtacga aacacggatcgacctctctc aactgggcgg cgactag [SEQ ID NO: 26].

Соответствующая аминокислотная последовательность молекулы Cas9 S. pyogenes изложена под SEQ ID NO: 27, которая представлена ниже.The corresponding amino acid sequence of the S. pyogenes Cas9 molecule is set forth under SEQ ID NO: 27, which is shown below.

MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLMDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRL

KRTARRRYTRRKNRICYLQEIFSNEMAKVDDS FFHRLEES FLVEEDKKHERHPIFGNIVDEVAY HEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTY NQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNF DLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMD GTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIKRTARRRYTRRKNRICYLQEIFSNEMAKVDDS FFHRLEES FLVEEDKKHERHPIFGNIVDEVAY HEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTY NQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNF DLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMD GTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRI

- 20 042798- 20 042798

PYYVGPLARGNSRFAWMTRKSEETITPWNFEEWDKGASAQSFIERMTNFDKNLPNEKVLPKHS LLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFD SVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTF KEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKWDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINR LSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEWKKMKNYWRQLLNAKLITQRK FDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAWGTALIKKYPKLESEFVYGDYKVYDVRKMIAK SEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLS MPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLWAKVEKG KSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLAS AGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLD ATLIHQSITGLYETRIDLSQLGGD [SEQ ID NO: 27]PYYVGPLARGNSRFAWMTRKSEETITPWNFEEWDKGASAQSFIERMTNFDKNLPNEKVLPKHS LLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFD SVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTF KEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKWDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINR LSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEWKKMKNYWRQLLNAKLITQRK FDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAWGTALIKKYPKLESEFVYGDYKVYDVRKMIAK SEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLS MPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLWAKVEKG KSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLAS AGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLD ATLIHQSITGLYETRIDLSQLGGD [SEQ ID NO: 27]

Иллюстративные кодон-оптимизированные последовательности нуклеиновой кислоты, кодирующие молекулу Cas9 S. aureus и необязательно содержащие последовательности ядерной локализации (NLS), изложены под SEQ ID NO: 28-32, 43 и 44, которые представлены ниже. Другая иллюстративная кодон-оптимизированная последовательность нуклеиновой кислоты, кодирующая молекулу Cas9 S. pyogenes, предусматривает нуклеотиды 1293-4451 под SEQ ID NO: 83.Exemplary codon-optimized nucleic acid sequences encoding the S. aureus Cas9 molecule and optionally containing nuclear localization sequences (NLS) are set forth under SEQ ID NOS: 28-32, 43 and 44, which are presented below. Another exemplary codon-optimized nucleic acid sequence encoding the S. pyogenes Cas9 molecule provides nucleotides 1293-4451 under SEQ ID NO: 83.

SEQ ID NO: 28 изложена ниже.SEQ ID NO: 28 is set forth below.

atgaaaagga atgaaaagga actacattct actacattct ggggctggac ggggctggac atcgggatta atcgggatta caagcgtggg caagcgtggg gtatgggatt gtatgggatt attgactatg attgactatg aaacaaggga aaaaaggga cgtgatcgac cgtgatcgac gcaggcgtca gcaggcgtca gactgttcaa gactgttcaa ggaggccaac ggaggccaac gtggaaaaca gtggaaaaca atgagggacg atgagggacg gagaagcaag gagaagcaag aggggagcca aggggagcca ggcgcctgaa ggcgcctgaa acgacggaga acgacggaga aggcacagaa aggcacagaa tccagagggt tccagagggt gaagaaactg gaagaaactg ctgttcgatt ctgttcgatt acaacctgct acaacctgct gaccgaccat gaccgaccat tctgagctga tctgagctga gtggaattaa gtggaattaa tccttatgaa tccttatgaa gccagggtga gccagggtga aaggcctgag aaggcctgag tcagaagctg tcagaagctg tcagaggaag tcagaggaag agttttccgc agttttccgc agctctgctg agctctgctg cacctggcta cacctggcta agcgccgagg agcgccgagg agtgcataac agtgcataac gtcaatgagg gtcaatgagg tggaagagga tggaagagga caccggcaac caccggcaac gagctgtcta gagctgtcta caaaggaaca caaaggaaca gatctcacgc gatctcacgc aatagcaaag aatagcaaag ctctggaaga ctctggaaga gaagtatgtc gaagtatgtc gcagagctgc gcagagctgc agctggaacg agctggaacg gctgaagaaa gctgaagaaa gatggcgagg gatggcgagg tgagagggtc tgaggggtc aattaatagg aattaatagg ttcaagacaa ttcaagacaa gcgactacgt gcgactacgt caaagaagcc caaagaagcc aagcagctgc aagcagctgc tgaaagtgca tgaaagtgca gaaggcttac gaaggcttac caccagctgg caccagctgg atcagagctt atcagagctt catcgatact catcgatact

- 21 042798- 21 042798

tatatcgacc tatatcgacc tgctggagac tgctggagac tcggagaacc tcggagaacc tactatgagg tactatgagg gaccaggaga gaccaggaga agggagcccc agggagcccc ttcggatgga ttcggatgga aagacatcaa aagacatcaa ggaatggtac ggaatggtac gagatgctga gagatgctga tgggacattg tgggacattg cacctatttt cacctatttt ccagaagagc ccagaagagc tgagaagcgt tgagaagcgt caagtacgct caagtacgct tataacgcag tataacgcag atctgtacaa atctgtacaa cgccctgaat cgccctgaat gacctgaaca gacctgaaca acctggtcat acctggtcat caccagggat caccagggat gaaaacgaga gaaaacgaga aactggaata aactggaata ctatgagaag ctatgagaag ttccagatca ttccagatca tcgaaaacgt tcgaaaacgt gtttaagcag gtttaagcag aagaaaaagc aagaaaaagc ctacactgaa ctacactgaa acagattgct acagattgct aaggagatcc aggagatcc tggtcaacga tggtcaacga agaggacatc aggagacatc aagggctacc aagggctacc gggtgacaag gggtgacaag cactggaaaa cactggaaaa ccagagttca ccagagttca ccaatctgaa ccaatctgaa agtgtatcac agtgtatcac gatattaagg gatattaagg acatcacagc acatcacagc acggaaagaa acggaaagaa atcattgaga atcattgaga acgccgaact acgccgaact gctggatcag gctggatcag attgctaaga attgctaaga tcctgactat tcctgactat ctaccagagc ctaccagagc tccgaggaca tccgaggaca tccaggaaga tccaggaaga gctgactaac gctgactaac ctgaacagcg ctgaacagcg agctgaccca agctgaccca ggaagagatc ggaagagatc gaacagatta gaacagatta gtaatctgaa gtaatctgaa ggggtacacc ggggtacacc ggaacacaca ggaacacaca acctgtccct acctgtccct gaaagctatc gaaagctatc aatctgattc aatctgattc tggatgagct tggatgagct gtggcataca gtggcataca aacgacaatc aacgacaatc agattgcaat agattgcaat ctttaaccgg ctttaaccgg ctgaagctgg ctgaagctgg tcccaaaaaa tcccaaaaaa ggtggacctg ggtggacctg agtcagcaga agtcagcaga aagagatccc aagagatccc aaccacactg aaccacactg gtggacgatt gtggacgatt tcattctgtc tcattctgtc acccgtggtc acccgtggtc aagcggagct aagcggagct tcatccagag tcatccagag catcaaagtg catcaaagtg atcaacgcca atcaacgcca tcatcaagaa tcatcaagaa gtacggcctg gtacggcctg cccaatgata cccaatgata tcattatcga tcattatcga gctggctagg gctgctaggg gagaagaaca gagaagaaca gcaaggacgc gcaaggacgc acagaagatg acagaagatg atcaatgaga atcaatgaga tgcagaaacg tgcagaaacg aaaccggcag aaaccggcag accaatgaac accaatgaac gcattgaaga gcattgaaga gattatccga gattatccga actaccggga actaccggga aagagaacgc aagagaacgc aaagtacctg aaagtacctg attgaaaaaa attgaaaaaa tcaagctgca tcaagctgca cgatatgcag cgatatgcag gagggaaagt gagggaaagt gtctgtattc gtctgtattc tctggaggcc tccccctgg aggacctgct gaacaatcca tctggaggcc tccccctgg aggacctgct gaacaatcca ttcaactacg ttcaactacg aggtcgatca aggtcgatca tattatcccc tattatcccc agaagcgtgt agaagcgtgt ccttcgacaa ccttcgacaa ttcctttaac ttcctttaac aacaaggtgc aacaaggtgc tggtcaagca tggtcaagca ggaagagaac ggaagagaac tctaaaaagg tctaaaaagg gcaataggac gcaataggac tcctttccag tcctttccag tacctgtcta tacctgtcta gttcagattc gttcagattc caagatctct caagatctct tacgaaacct tacgaaacct ttaaaaagca ttaaaaagca cattctgaat cattctgaat ctggccaaag ctggccaaag gaaagggccg gaaagggccg catcagcaag catcagcaag accaaaaagg accaaaaagg agtacctgct agtacctgct ggaagagcgg ggaagagcgg gacatcaaca gacatcaaca gattctccgt gattctccgt ccagaaggat ccagaaggat tttattaacc tttattaacc ggaatctggt ggaatctggt ggacacaaga ggacacaaga tacgctactc tacgctactc gcggcctgat gcggcctgat gaatctgctg gaatctgctg cgatcctatt cgatcctatt tccgggtgaa tccgggtgaa caatctggat catctggat gtgaaagtca gtgaaagtca agtccatcaa agtccatcaa cggcgggttc cggcggttc acatcttttc acatcttttc tgaggcgcaa tgaggcgcaa atggaagttt atggaagttt aaaaaggagc aaaaaggagc gcaacaaagg gcaacaaagg gtacaagcac gtacaagcac catgccgaag catgccgaag atgctctgat atgctctgat tatcgcaaat tatcgcaaat gccgacttca gccgacttca tctttaagga tctttaagga gtggaaaaag gtggaaaaag ctggacaaag ctggacaaag ccaagaaagt ccaagaaagt gatggagaac gatggagaac cagatgttcg cagatgttcg aagagaagca aagagaagca ggccgaatct ggccgaatct atgcccgaaa atgcccgaaa tcgagacaga tcgagacaga acaggagtac acaggagtac aaggagattt aggagattt tcatcactcc tcatcactcc tcaccagatc tcaccagatc aagcatatca aagcatatca aggatttcaa aggatttcaa ggactacaag ggactacaag tactctcacc tactctcacc gggtggataa gggtggataa aaagcccaac aaagcccaac agagagctga agagagctga tcaatgacac tcaatgacac cctgtatagt cctgtatagt acaagaaaag acaagaaaag acgataaggg acgataaggg gaataccctg gaataccctg attgtgaaca attgtgaaca

- 22 042798- 22 042798

atctgaacgg atctgaacgg actgtacgac actgtacgac aaagataatg aaagataatg acaagctgaa acaagctgaa aaagctgatc aaagctgatc aacaaaagtc aacaaaagtc ccgagaagct ccgagaagct gctgatgtac gctgatgtac caccatgatc caccatgatc ctcagacata ctcagacata tcagaaactg tcagaaactg aagctgatta aagctgatta tggagcagta tggagcagta cggcgacgag cggcgacgag aagaacccac aagaacccac tgtataagta tgtataagta ctatgaagag ctatgaagag actgggaact actgggaact acctgaccaa acctgaccaa gtatagcaaa gtatagcaaa aaggataatg aaggataatg gccccgtgat gccccgtgat caagaagatc caagaagatc aagtactatg aagtactatg ggaacaagct ggaacaagct gaatgcccat gaatgcccat ctggacatca ctggacatca cagacgatta cagacgatta ccctaacagt ccctaacagt cgcaacaagg cgcaacaagg tggtcaagct tggtcaagct gtcactgaag gtcactgaag ccatacagat ccatacagat tcgatgtcta tcgatgtcta tctggacaac tctggacaac ggcgtgtata ggcgtgtata aatttgtgac aatttgtgac tgtcaagaat tgtcaagaat ctggatgtca ctggatgtca tcaaaaagga tcaaaaagga gaactactat gaactactat gaagtgaata gaagtgaata gcaagtgcta gcaagtgcta cgaagaggct cgaagaggct aaaaagctga aaaaagctga aaaagattag aaaagattag caaccaggca caaccaggca gagttcatcg gagttcatcg cctcctttta ccctcctttta caacaacgac caacaacgac ctgattaaga ctgattaaga tcaatggcga tcaatggcga actgtatagg actgtatagg gtcatcgggg gtcatcgggg tgaacaatga tgaacaatga tctgctgaac tctgctgaac cgcattgaag cgcattgaag tgaatatgat tgaatatgat tgacatcact tgacatcact taccgagagt taxgagagt atctggaaaa atctggaaaa catgaatgat catgaatgat aagcgccccc aagcgccccc ctcgaattat ctcgaattat caaaacaatt caaaacaatt gcctctaaga gcctctaaga ctcagagtat ctcagagtat caaaaagtac caaaaagtac tcaaccgaca tcaaccgaca ttctgggaaa ttctgggaaa cctgtatgag gtgaagagca aaaagcaccc tcagattatc aaaaagggc [SEQ ID NO: 2 8] SEQ ID NO: 29 изложена ниже. cctgtatgag gtgaagagca aaaagcaccc tcagattatc aaaaagggc [SEQ ID NO: 2 8] SEQ ID NO: 29 is set forth below. atgaagcgga atgaagcgga actacatcct actacatcct gggcctggac gggcctggac atcggcatca atcggcatca ccagcgtggg ccagcgtggg ctacggcatc ctacggcatc atcgactacg atcgactacg agacacggga agacacggga cgtgatcgat cgtgatcgat gccggcgtgc gccggcgtgc ggctgttcaa ggctgttcaa agaggccaac agaggccaac gtggaaaaca gtggaaaaca acgagggcag acgaggggcag gcggagcaag gcggagcaag agaggcgcca agaggcgcca gaaggctgaa gaaggctgaa gcggcggagg gcggcgggagg cggcatagaa cggcatagaa tccagagagt tccagagagt gaagaagctg gaagaagctg ctgttcgact ctgttcgact acaacctgct acaacctgct gaccgaccac gaccgaccac agcgagctga agcgagctga gcggcatcaa gcggcatcaa cccctacgag cccctacgag gccagagtga gccagagtga agggcctgag agggcctgag ccagaagctg ccagaagctg agcgaggaag agcgaggaag agttctctgc agttctctgc cgccctgctg cgccctgctg cacctggcca cacctggcca agagaagagg agagaagagg cgtgcacaac cgtgcacaac gtgaacgagg gtgaacgagg tggaagagga tggaagagga caccggcaac caccggcaac gagctgtcca gagctgtcca ccaaagagca ccaaagagca gatcagccgg gatcagccgg aacagcaagg aacagcaagg ccctggaaga ccctgaaga gaaatacgtg gaaatacgtg gccgaactgc gccgaactgc agctggaacg agctggaacg gctgaagaaa gctgaagaaa gacggcgaag gacggcgaag tgcggggcag tgcggggcag catcaacaga catcaacaga ttcaagacca ttcaagacca gcgactacgt gcgactacgt gaaagaagcc gaaagaagcc aaacagctgc aaacagctgc tgaaggtgca tgaaggtgca gaaggcctac gaaggcctac caccagctgg caccagctgg accagagctt accagagctt catcgacacc catcgacacc tacatcgacc tacatcgacc tgctggaaac tgctggaaac ccggcggacc ccggcggacc tactatgagg tactatgagg gacctggcga gacctggcga gggcagcccc gggcagcccc ttcggctgga ttcggctgga aggacatcaa aggacatcaa agaatggtac agaatggtac gagatgctga gagatgctga tgggccactg tgggccactg cacctacttc cacctacttc cccgaggaac cccgaggaac tgcggagcgt tgcggagcgt gaagtacgcc gaagtacgcc tacaacgccg tacaacgccg acctgtacaa acctgtacaa cgccctgaac cgccctgaac gacctgaaca gacctgaaca atctcgtgat atctcgtgat caccagggac caccagggac gagaacgaga gagaacgaga agctggaata agctggaata ttacgagaag ttacgagaag ttccagatca ttccagatca tcgagaacgt tcgagaacgt gttcaagcag gttcaagcag aagaagaagc aagaagaagc ccaccctgaa ccaccctgaa gcagatcgcc gcagatcgcc aaagaaatcc aaagaaatcc tcgtgaacga tcgtgaacga agaggatatt aggatatt aagggctaca aagggctaca gagtgaccag gagtgaccag

- 23 042798- 23 042798

caccggcaag caccggcaag cccgagttca cccgagttca ccaacctgaa ccaacctgaa ggtgtaccac ggtgtaccac gacatcaagg gacatcaagg acattaccgc acattaccgc ccggaaagag ccggaaagag attattgaga attattgaga acgccgagct acgccgagct gctggatcag gctggatcag attgccaaga attgccaaga tcctgaccat tcctgaccat ctaccagagc ctaccagagc agcgaggaca agcgaggaca tccaggaaga tccaggaaga actgaccaat actgaccaat ctgaactccg ctgaactccg agctgaccca agctgaccca ggaagagatc ggaagagatc gagcagatct gagcagatct ctaatctgaa ctaatctgaa gggctatacc gggctatacc ggcacccaca ggcacccaca acctgagcct acctgagcct gaaggccatc gaaggccatc aacctgatcc aacctgatcc tggacgagct tggacgagct gtggcacacc gtggcacacc aacgacaacc aacgacaacc agatcgctat agatcgctat cttcaaccgg cttcaaccgg ctgaagctgg ctgaagctgg tgcccaagaa tgcccaagaa ggtggacctg ggtggacctg tcccagcaga tccagcaga aagagatccc aagagatccc caccaccctg caccaccctg gtggacgact gtggacgact tcatcctgag tcatcctgag ccccgtcgtg ccccgtcgtg aagagaagct aagagaagct tcatccagag tcatccagag catcaaagtg catcaaagtg atcaacgcca atcaacgcca tcatcaagaa tcatcaagaa gtacggcctg gtacggcctg cccaacgaca cccaacgaca tcattatcga tcattatcga gctggcccgc gctggcccgc gagaagaact gagaagaact ccaaggacgc ccaaggacgc ccagaaaatg ccagaaaatg atcaacgaga atcaacgaga tgcagaagcg tgcagaagcg gaaccggcag gaaccggcag accaacgagc accaacgagc ggatcgagga ggatcgagga aatcatccgg aatcatccgg accaccggca acccggca aagagaacgc aagagaacgc caagtacctg caagtacctg atcgagaaga atcgagaaga tcaagctgca tcaagctgca cgacatgcag cgacatgcag gaaggcaagt gaaggcaagt gcctgtacag gcctgtacag cctggaagcc cctggaagcc atccctctgg atccctctgg aagatctgct aagatctgct gaacaacccc gaacaacccc ttcaactatg ttcaactatg aggtggacca aggtggacca catcatcccc catcatcccc agaagcgtgt agaagcgtgt ccttcgacaa ccttcgacaa cagcttcaac cagcttcaac aacaaggtgc aacaaggtgc tcgtgaagca tcgtgaagca ggaagaaaac ggaagaaaac agcaagaagg agcaagaagg gcaaccggac gcaaccggac cccattccag cccattccag tacctgagca tacctgagca gcagcgacag gcagcgacag caagatcagc caagatcagc tacgaaacct tacgaaacct tcaagaagca tcaagaagca catcctgaat catcctgaat ctggccaagg ctggccaagg gcaagggcag gcaagggcag aatcagcaag aatcagcaag accaagaaag accaagaaag agtatctgct agtatctgct ggaagaacgg ggaagaacgg gacatcaaca gacatcaaca ggttctccgt ggttctccgt gcagaaagac gcagaaagac ttcatcaacc ttcatcaacc ggaacctggt ggaacctggt ggataccaga ggataccaga tacgccacca tacgccacca gaggcctgat gaggcctgat gaacctgctg gaacctgctg cggagctact cggagctact tcagagtgaa tcagagtgaa caacctggac caacctggac gtgaaagtga gtgaaagtga agtccatcaa agtccatcaa tggcggcttc tggcggcttc accagctttc accagctttc tgcggcggaa tgcggcggaa gtggaagttt gtggaagttt aagaaagagc aagaaagagc ggaacaaggg ggaacaaggg gtacaagcac gtacaagcac cacgccgagg cacgccgagg acgccctgat acgccctgat cattgccaac cattgccaac gccgatttca gccgattca tcttcaaaga tcttcaaaga gtggaagaaa gtggaagaaa ctggacaagg ctggacaagg ccaaaaaagt ccaaaaaagt gatggaaaac gatggaaaac cagatgttcg cagatgttcg aggaaaagca aggaaaagca ggccgagagc ggccgagagc atgcccgaga atgcccgaga tcgaaaccga tcgaaaccga gcaggagtac gcaggagtac aaagagatct aaagagatct tcatcacccc tcatcacccc ccaccagatc ccaccagatc aagcacatta aagcacatta aggacttcaa aggacttcaa ggactacaag ggactacaag tacagccacc tacagccacc gggtggacaa gggtggacaa gaagcctaat gaagcctaat agagagctga agagagctga ttaacgacac ttaacgacac cctgtactcc cctgtactcc acccggaagg acccgggaagg acgacaaggg acgacaaggg caacaccctg caacaccctg atcgtgaaca atcgtgaaca atctgaacgg atctgaacgg cctgtacgac cctgtacgac aaggacaatg aaggacaatg acaagctgaa acaagctgaa aaagctgatc aaagctgatc aacaagagcc aacaagagcc ccgaaaagct ccgaaaagct gctgatgtac gctgatgtac caccacgacc caccacgacc cccagaccta ccgaccta ccagaaactg ccagaaactg aagctgatta aagctgatta tggaacagta tggaacagta cggcgacgag cggcgacgag aagaatcccc aagaatcccc tgtacaagta tgtacaagta ctacgaggaa ctacgaggaa accgggaact accgggaact acctgaccaa acctgaccaa gtactccaaa gtactccaaa aaggacaacg aaggacaacg gccccgtgat gccccgtgat caagaagatt caagaagatt aagtattacg aagtattacg gcaacaaact gcaacaaact gaacgcccat gaacgcccat ctggacatca ctggacatca ccgacgacta ccgacgacta ccccaacagc ccccaacagc agaaacaagg agaaacaagg tcgtgaagct tcgtgaagct gtccctgaag gtccctgaag ccctacagat ccctacagat tcgacgtgta tcgacgtgta cctggacaat cctggacaat ggcgtgtaca ggcgtgtaca agttcgtgac agttcgtgac cgtgaagaat cgtgaagaat ctggatgtga ctggatgtga tcaaaaaaga tcaaaaaaga aaactactac aaactactac gaagtgaata gaagtgaata gcaagtgcta gcaagtgcta tgaggaagct tgaggaagct aagaagctga aagaagctga agaagatcag agaagatcag caaccaggcc caaccaggcc gagtttatcg gagttttcg cctccttcta cctccttcta caacaacgat caacaacgat ctgatcaaga ctgatcaaga tcaacggcga tcaacggcga gctgtataga gctgtataga gtgatcggcg gtgatcggcg tgaacaacga tgaacaacga cctgctgaac cctgctgaac cggatcgaag cggatcgaag tgaacatgat tgaacatgat cgacatcacc cgacatcacc taccgcgagt taccgcgagt acctggaaaa acctggaaaa catgaacgac catgaacgac aagaggcccc aagaggcccc ccaggatcat ccaggatcat taagacaatc taagacaatc gcctccaaga gcctccaaga cccagagcat ccgagcat taagaagtac taagaagtac agcacagaca agcacagaca

ttctgggcaa cctgtatgaa gtgaaatcta agaagcaccc tcagatcatc aaaaagggcttctgggcaa cctgtatgaa gtgaaatcta agaagcaccc tcagatcatc aaaaagggc

[SEQ ID NO: 29][SEQ ID NO: 29]

- 24 042798- 24 042798

SEQ ID NO: 30 изложена ниже.SEQ ID NO: 30 is set forth below.

atgaagcgca atgaagcgca actacatcct actacatcct cggactggac cggactggac atcggcatta atcggcatta cctccgtggg ccctccgtggg atacggcatc atacggcatc atcgattacg atcgattacg aaactaggga aaactaggga tgtgatcgac tgtgatcgac gctggagtca gctggagtca ggctgttcaa ggctgttcaa agaggcgaac agaggcgaac gtggagaaca gtggagaaca acgaggggcg acgaggggcg gcgctcaaag gcgctcaaag aggggggccc aggggggcc gccggctgaa gccggctgaa gcgccgccgc gcgccgccgc agacatagaa agacatagaa tccagcgcgt tccagcgcgt gaagaagctg gaagaagctg ctgttcgact ctgttcgact acaaccttct acaaccttct gaccgaccac gaccgaccac tccgaacttt tccgaacttt ccggcatcaa ccggcatcaa cccatatgag cccatatgag gctagagtga gctagagtga agggattgtc agggattgtc ccaaaagctg ccaaaagctg tccgaggaag tccgaggaag agttctccgc agttctccgc cgcgttgctc cgcgttgctc cacctcgcca cacctcgcca agcgcagggg agcgcagggg agtgcacaat agtgcacaat gtgaacgaag gtgaacgaag tggaagaaga tggaagaaga taccggaaac taccggaaac gagctgtcca gagctgtcca ccaaggagca ccaaggagca gatcagccgg gatcagccgg aactccaagg aactccaagg ccctggaaga ccctgaaga gaaatacgtg gaaatacgtg gcggaactgc gcggaactgc aactggagcg aactggagcg gctgaagaaa gctgaagaaa gacggagaag gacggagaag tgcgcggctc tgcgcggctc gatcaaccgc gatcaaccgc ttcaagacct ttcaagacct cggactacgt cggactacgt gaaggaggcc gaaggaggcc aagcagctcc aagcagctcc tgaaagtgca tgaaagtgca aaaggcctat aaaggcctat caccaacttg caccaacttg accagtcctt accagtcctt tatcgatacc tatcgatacc tacatcgatc tacatcgatc tgctcgagac tgctcgagac tcggcggact tcggcggact tactacgagg tactacgagg gtccagggga gtcggggga gggctcccca gggctcccca tttggttgga ttttggttgga aggatattaa aggatattaa ggagtggtac ggagtggtac gaaatgctga gaaatgctga tgggacactg tggacactg cacatacttc cacatacttc cctgaggagc cctgaggagc tgcggagcgt tgcggagcgt gaaatacgca gaaatacgca tacaacgcag tacaacgcag acctgtacaa acctgtacaa cgcgctgaac cgcgctgaac gacctgaaca gacctgaaca atctcgtgat atctcgtgat cacccgggac cacccgggac gagaacgaaa gagaacgaaa agctcgagta agctcgagta ttacgaaaag ttacgaaaag ttccagatta ttccagatta ttgagaacgt ttgagaacgt gttcaaacag gttcaaacag aagaagaagc aagaagaagc cgacactgaa cgacactgaa gcagattgcc gcagattgcc aaggaaatcc aaggaaatcc tcgtgaacga tcgtgaacga agaggacatc aggagacatc aagggctatc aagggctatc gagtgacctc gagtgacctc aacgggaaag aacgggaaag ccggagttca ccggagttca ccaatctgaa ccaatctgaa ggtctaccac ggtctaccac gacatcaaag gacatcaaag acattaccgc acattaccgc ccggaaggag ccggaaggag atcattgaga atcattgaga acgcggagct acgcggagct gttggaccag gttggaccag attgcgaaga attgcgaaga ttctgaccat ttctgaccat ctaccaatcc ctaccaatcc tccgaggata tccgaggata ttcaggaaga ttcaggaaga actcaccaac actcaccaac ctcaacagcg ctcaacagcg aactgaccca aactgaccca ggaggagata ggaggagata gagcaaatct gagcaaatct ccaacctgaa ccaacctgaa gggctacacc gggctacacc ggaactcata ggaactcata acctgagcct acctgagcct gaaggccatc gaaggccatc aacttgatcc aacttgatcc tggacgagct tggacgagct gtggcacacc gtggcacacc aacgataacc aacgataacc agatcgctat agatcgctat tttcaatcgg tttcaatcgg ctgaagctgg ctgaagctgg tccccaagaa tccccaagaa agtggacctc agtggacctc tcacaacaaa tcacaacaaa

- 25 042798- 25 042798

aggagatccc aggagatccc tactaccctt tactaccctt gtggacgatt gtggacgatt tcattctgtc tcattctgtc ccccgtggtc ccccgtggtc aagagaagct aagagaagct tcatacagtc tcatacagtc aatcaaagtg aatcaaagtg atcaatgcca atcaatgcca ttatcaagaa ttatcaagaa atacggtctg atacggtctg cccaacgaca cccaacgaca ttatcattga ttatcattga gctcgcccgc gctcgcccgc gagaagaact gagaagaact cgaaggacgc cgaaggacgc ccagaagatg ccagaagatg attaacgaaa attaacgaaa tgcagaagag tgcagaagag gaaccgacag gaaccgacag actaacgaac actaacgaac ggatcgaaga ggatcgaaga aatcatccgg aatcatccgg accaccggga acccggga aggaaaacgc aggaaaacgc gaagtacctg gaagtacctg atcgaaaaga atcgaaaaga tcaagctcca tcaagctcca tgacatgcag tgacatgcag gaaggaaagt gaaggaaagt gtctgtactc gtctgtactc gctggaggcc gctggaggcc attccgctgg attccgctgg aggacttgct aggacttgct gaacaaccct gaacaaccct tttaactacg tttaactacg aagtggatca aagtggatca tatcattccg tatcattccg aggagcgtgt aggagcgtgt cattcgacaa cattcgacaa ttccttcaac ttccttcaac aacaaggtcc aacaaggtcc tcgtgaagca tcgtgaagca ggaggaaaac ggaggaaaac tcgaagaagg tcgaagaagg gaaaccgcac gaaaccgcac gccgttccag gccgttccag tacctgagca tacctgagca gcagcgactc gcagcgactc caagatttcc caagatttcc tacgaaacct tacgaaacct tcaagaagca tcaagaagca catcctcaac catcctcaac ctggcaaagg ctggcaaagg ggaagggtcg ggaagggtcg catctccaag catctccaag accaagaagg accaagaagg aatatctgct aatatctgct ggaagaaaga ggaagaaaga gacatcaaca gacatcaaca gattctccgt gattctccgt gcaaaaggac gcaaaaggac ttcatcaacc ttcatcaacc gcaacctcgt gcaacctcgt ggatactaga ggatactaga tacgctactc tacgctactc ggggtctgat ggggtctgat gaacctcctg gaacctcctg agaagctact agaagactact ttagagtgaa ttagagtgaa caatctggac catctggac gtgaaggtca gtgaaggtca agtcgattaa agtcgattaa cggaggtttc cggaggtttc acctccttcc acctccttcc tgcggcgcaa tgcggcgcaa gtggaagttc gtggaagttc aagaaggaac aagaaggaac ggaacaaggg ggaacaaggg ctacaagcac ctacaagcac cacgccgagg cacgccgagg acgccctgat acgccctgat cattgccaac cattgccaac gccgacttca gccgacttca tcttcaaaga tcttcaaaga atggaagaaa atggaagaaa cttgacaagg cttgacaagg ctaagaaggt ctaagaaggt catggaaaac catggaaaac cagatgttcg cagatgttcg aagaaaagca aagaaaagca ggccgagtct ggccgagtct atgcctgaaa atgcctgaaa tcgagactga tcgagactga acaggagtac acaggagtac aaggaaatct aaggaaatct ttattacgcc ttattacgcc acaccagatc acaccagatc aaacacatca aaacacatca aggatttcaa aggatttcaa ggattacaag ggattacaag tactcacatc tactcacatc gcgtggacaa gcgtggacaa aaagccgaac aaagccgaac agggaactga agggaactga tcaacgacac tcaacgacac cctctactcc ccctctactcc acccggaagg acccgggaagg atgacaaagg atgacaaagg gaataccctc gaataccctc atcgtcaaca atcgtcaaca accttaacgg accttaacgg cctgtacgac cctgtacgac aaggacaacg aaggacaacg ataagctgaa ataagctgaa gaagctcatt gaagctcatt aacaagtcgc aacaagtcgc ccgaaaagtt ccgaaaagtt gctgatgtac gctgatgtac caccacgacc caccacgacc ctcagactta ctcagactta ccagaagctc ccagaagctc aagctgatca aagctgatca tggagcagta tggagcagta tggggacgag tggggacgag aaaaacccgt aaaaacccgt tgtacaagta tgtacaagta ctacgaagaa ctacgaagaa actgggaatt actgggaatt atctgactaa atctgactaa gtactccaag gtactccaag aaagataacg aaagataacg gccccgtgat gccccgtgat taagaagatt taagaagatt aagtactacg aagtactacg gcaacaagct gcaacaagct gaacgcccat gaacgcccat ctggacatca ctggacatca ccgatgacta ccgatgacta ccctaattcc ccctaattcc cgcaacaagg cgcaacaagg tcgtcaagct tcgtcaagct gagcctcaag gagcctcaag ccctaccggt ccctaccggt ttgatgtgta ttgatgtgta ccttgacaat ccttgacaat ggagtgtaca ggagtgtaca agttcgtgac agttcgtgac tgtgaagaac tgtgaagaac cttgacgtga cttgacgtga tcaagaagga tcaagaagga gaactactac gaactactac gaagtcaact gaagtcaact ccaagtgcta ccaagtgcta cgaggaagca cgaggaagca aagaagttga aagaagttga agaagatctc agaagatctc gaaccaggcc gaaccaggcc gagttcattg gagttcattg cctccttcta cctccttcta taacaacgac taacaacgac ctgattaaga ctgattaaga tcaacggcga tcaacggcga actgtaccgc actgtaccgc gtcattggcg gtcattggcg tgaacaacga tgaacaacga tctcctgaac tctcctgaac cgcatcgaag cgcatcgaag tgaacatgat tgaacatgat cgacatcact cgacatcact taccgggaat taccgggaat acctggagaa acctggagaa tatgaacgac tatgaacgac aagcgcccgc aagcgcccgc cccggatcat cccggatcat taagactatc taagactatc gcctcaaaga gcctcaaaga cccagtcgat cccagtcgat caagaagtac caagaagtac agcaccgaca agcaccgaca

tcctgggcaa cctgtacgag gtcaaatcga agaagcaccc ccagatcatc aagaagggatcctgggcaa cctgtacgag gtcaaatcga agaagcaccc ccagatcatc aagaaggga

[SEQ ID NO: 30][SEQ ID NO: 30]

- 26 042798- 26 042798

SEQ ID NO: 31 изложена ниже.SEQ ID NO: 31 is set forth below.

ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCAAGCGGAACTACA TCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGA CGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGG AGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGC TGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGC CAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTG GCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCA CCAGAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCT GGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTAC GTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCA TCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAG CCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTC CCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACC T GAAC AAT С T C G T GAT С AC C AG G GAG GAGAAC GAGAAG С T G GAAT AT TAG GAGAAG T T С C AGAT CATC GAGAAC G T G T T CAAG CAGAAGAAGAAGС С СAC С С T GAAGCAGAT C GС CAAAGAAAT С С T C GTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACC TGAAGGTGTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCT GCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTG ACCAATCTGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATA CCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAA CGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAG CAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCT TCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCAT TATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAG CGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCA AGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGA AGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCC AGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCA AGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAAC СTTCAAGAAGCACATССTGAATСTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAG TATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACC TGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAA CAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCAAGCGGAACTACA TCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGA CGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGG AGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGC TGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGC CAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTG GCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCA CCAGAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCT GGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTAC GTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCA TCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAG CCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTC CCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACC T GAAC AAT С T C G T GAT С AC C AG G GAG GAGAAC GAGAAG С T G GAAT AT TAG GAGAAG T T С C AGAT CATC GAGAAC G T G T T CAAG CAGAAGAAGAAGС С СAC С С T GAAGCAGAT C GС CAAAGAAAT С С T C GTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACC TGAAGGTGTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCT GCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTG ACCAATCTGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATA CCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAA CGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAG CAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCT TCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCAT TATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAG CGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCA AGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGA AGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCC AGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCA AGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAAC СTTCAAGAAGCACATССTGAATСTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAG TATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACC TGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAA CAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGG

- 27 042798- 27 042798

AAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCA ACGCCGATTTCATCTT CAAAGAG T G GAAGAAAC T G GAGAAG G С CAAAAAAGT GAT GGAAAACGA GATGTTCGAGGAAAGGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAG AT С T T CAT САС С С С С САС CAGAT CAAG GAGAT TAAG GAG T T CAAG GAG TACAAGTAGAGССАСC GGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGA CAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTG AAAAAG С T GAT СAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC C AGAAACT GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAAT ССС С T GTACAAGTAG TAGGA GGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATT AAG TAT TAG G G CAACAAAC T GAAC GCCCATCTG GACAT СAC C GAC GAC TAC С С CAACAG CAGAA ACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTA C AAG T T C G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAAT AG C AAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCT TCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGA С С T G С T GAAC C G GAT C GAAG T GAACATGAT CGACAT СACС TACCGCGAGTACС T GGAAAACATG AACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGT ACAG CACAGACAT T С T G G G CAAC С T G TAT GAAG T GAAAT С TAAGAAG СAC С С T CAGAT CAT СAA AAAGGGCAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG [SEQ ID NO: 31]AAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCA ACGCCGATTTCATCTT CAAAGAG T G GAAGAAAC T G GAGAAG G С CAAAAAAGT GAT GGAAAACGA GATGTTCGAGGAAAGGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAG AT С T T CAT САС С С С С САС CAGAT CAAG GAGAT TAAG GAG T T CAAG GAG TACAAGTAGAGССАСC GGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGA CAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTG AAAAAG С T GAT СAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC C AGAAACT GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAAT ССС С T GTACAAGTAG TAGGA GGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATT AAG TAT TAG G G CAACAAAC T GAAC GCCCATCTG GACAT СAC C GAC GAC TAC С С CAACAG CAGAA ACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTA C AAG T T C G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAAT AG C AAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCT TCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGA С С T G С T GAAC C G GAT C GAAG T GAACATGAT CGACAT СACС TACCGCGAGTACС T GGAAAACATG AACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGT ACAG CACAGACAT T С T G G G CAAC С T G TAT GAAG T GAAAT С TAAGAAG СAC С С T CAGAT CAT СAA AAAGGGCAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG [SEQ ID NO: 31]

SEQ ID NO: 32 изложена ниже.SEQ ID NO: 32 is set out below.

ACCGGTGCCA ACCGGTGCCA CCATGTACCC CCATGTACCCC ATACGATGTT ATACGATGTT СCAGATTAGG CCAGATTAGG CTTCGCCGAA CTTCGCCGAA GAAAAAGCGC GAAAAAGCGC AAGGTCGAAG AAGGTCGAAG CGTCCATGAA CGTCCATGAA AAGGAACTAC AAGGAACTAC ATTCTGGGGC ATTCTGGGGC TGGACATCGG TGGACATCGG GATTACAAGC GATTACAAGC GTGGGGTATG GTGGGGTATG GGATTATTGA GGATTATTGA CTATGAAACA CTATGAAACA AGGGACGTGA AGGGACGTGA TCGACGCAGG TCGACGCAGG CGTCAGACTG CGTCAGACTG TTCAAGGAGG TTCAAGGAGG CCAACGTGGA CCAACGTGGA AAACAATGAG AAACAATGAG GGACGGAGAA GGACGGAGAA GCAAGAGGGG GCAAGAGGGG AGCCAGGCGC AGCCAGGCGC CTGAAACGAC CTGAAACGAC GGAGAAGGCA GGAGAAGGCA CAGAATCCAG CAGAATCCAG AGGGTGAAGA AGGGTGAAGA AACTGCTGTT AACTGCTGTT CGATTAGAAC CGATTAGAAC CTGCTGACCG CTGCTGACCG ACCATTCTGA ACCATTCTG GCTGAGTGGA GCTGAGTGGA ATTAATCCTT ATTAATCCTT ATGAAGCCAG ATGAAGCCAG GGTGAAAGGC GGTGAAAGGC CTGAGTCAGA CTGAGTCAG AGCTGTCAGA AGCTGTCAG GGAAGAGTTT GGAAGAGTTT TCCGCAGCTC TCCGCAGCTC TGCTGCACCT TGCTGCACCT GGCTAAGCGC GGCTAAGGCGC CGAGGAGTGC CGAGGAGTGC ATAACGTCAA ATAACGTCAA TGAGGTGGAA TGAGGTGGAA GAGGACACCG GAGGACACCG GCAACGAGCT GCAACGAGCT GTCTACAAAG GTCTACAAAG GAACAGATCT GAACAGATCT CACGCAATAG CACGCAATAG CAAAGCTCTG CAAAGCTCTG GAAGAGAAGT GAAGAGAAGT ATGTCGCAGA ATGTCGCAGA GCTGCAGCTG GCTGCAGCTG GAACGGCTGA GAACGGCTGA AGAAAGATGG AGAAAGATGG CGAGGTGAGA CGAGGTGAGA GGGTCAATTA GGGTCAATTA ATAGGTTCAA ATAGGTTCAA GACAAGCGAC GACAAGCGAC TACGTCAAAG TACGTCAAAG AAGCCAAGCA AAGCCAAGCA GCTGCTGAAA GCTGCTGAAA GTGCAGAAGG GTGCAGAAGG CTTACCACCA CTTACCACCA GCTGGATCAG GCTGGATCAG AGCTTCATCG AGCTTCATCG ATACTTATAT ATACTTATAT CGACCTGCTG CGACCTGCTG GAGACTCGGA GAGACTCGGA GAACСТАСTA GAACSTASTA TGAGGGACCA TGAGGGACCA GGAGAAGGGA GGAGAAGGGA GCCCCTTCGG GCCCCTTCGG ATGGAAAGAC ATGGAAAAGAC ATCAAGGAAT ATCAAGGAAT GGTACGAGAT GGTACGAGAT GCTGATGGGA GCTGATGGGA CATTGCACCT CATTCACCT ATTTTCCAGA ATTTTCCAGA

- 28 042798- 28 042798

AGAGCTGAGA AGCGTCAAGT ACGCTTATAA CGCAGATCT TACAACGCCC TGAATGACCTAGAGCTGAGA AGCGTCAAGT ACGCTTATAA CGCAGATCT TACAACGCCC TGAATGACCT

GAACAACCTG GAACAACCTG GTCATСАССА GTCATCACA GGGATGAAAA GGGATGAAAA CGAGAAACTG CGAGAAACTG GAATACTATG GAATACTATG AGAAGTTCCA AGAAGTTCCA GATCATCGAA GATCATCGAA AACGTGTTTA AACGTGTTTA AGCAGAAGAA AGCAGAAGAA AAAGCСТАСА AAAGCSTASA CTGAAACAGA CTGAAACAGA TTGCTAAGGA TTGCTAAGGA GATCCTGGTC GATCCTGGTC AACGAAGAGG AACGAAGAGG ACATCAAGGG ACATCAAGGG CTACCGGGTG CTACCGGGTG ACAAGCACTG ACAAGCACTG GAAAACGAGA GAAAACGAGA GTTCACCAAT GTTCACCAAT CTGAAAGTGT CTGAAAGTGT ATCACGATAT ATCACGATAT TAAGGACATC TAAGGACATC ACAGCACGGA ACAGCACGGA AAGAAATCAT AAGAAATCAT TGAGAACGCC TGAGAACGCC GAACTGCTGG GAACTGCTGG ATCAGATTGC ATCAGATTGC TAAGATCCTG TAAGATCCTG ACTATСТАСC ACTATSTACC AGAGCTCCGA AGAGCTCCGA GGACATCCAG GGACATCCAG GAAGAGCTGA GAAGAGCTGA CTAACCTGAA CTAACCTGAA CAGCGAGCTG CAGCGAGCTG ACCCAGGAAG ACCCAGGAAG AGATCGAACA AGATCGAACA GATTAGTAAT GATTAGTAAT CTGAAGGGGT CTGAAGGGGT ACACCGGAAC ACACCGGAAC ACACAACCTG ACACAACCTG TCCCTGAAAG TCCCTGAAAG CTATCAATCT CTATCAATCT GATTCTGGAT GATTCTGGAT GAGCTGTGGC GAGCTGTGGC ATACAAACGA ATACAAAACGA CAATCAGATT CAATCAGATT GCAATCTTTA GCAATCTTTA ACCGGCTGAA ACCGGCTGAA GCTGGTCCCA GCTGGTCCCA AAAAAGGTGG AAAAAGGTGG ACCTGAGTCA ACCTGAGTCA GCAGAAAGAG GCAGAAAGAG ATCCCAACCA ATCCCAACCA CACTGGTGGA CACTGGTGGA CGATTTCATT CGATTTCATT CTGTCACCCG CTGTCACCCG TGGTCAAGCG TGGTCAACGCG GAGCTTCATC GAGCTTCATC CAGAGCATCA CAGAGCATCA AAGTGATCAA AAGTGATCAA CGCCATCATC CGCCATCATC AAGAAGTACG AAGAAGTACG GCCTGCCCAA GCCTGCCCAA TGATATCATT TGATATCATT ATCGAGCTGG ATCGAGCTGG CTAGGGAGAA CTAGGGAGAA GAACAGCAAG GAACAGCAAG GACGCACAGA GACGCACAGA AGATGATCAA AGATGATCAA TGAGATGCAG TGAGATGCAG AAACGAAACC AAACGAAACC GGCAGACCAA GGCAGACCAA TGAACGCATT TGAACGCATT GAAGAGATTA GAAGAGATTA TCCGAACTAC TCCGAACTAC CGGGAAAGAG CGGGAAAAGAG AACGCAAAGT AACGCAAAGT ACCTGATTGA ACCTGATTGA AAAAATCAAG AAAAATCAAG CTGCACGATA CTGCACGATA TGCAGGAGGG TGCAGGAGGG AAAGTGTCTG AAAGTGTCTG TATTCTCTGG TATTTCTCTGG AGGCCATCCC AGGCCATCCC CCTGGAGGAC CCTGGAGGAC CTGCTGAACA CTGCTGAACA ATCCATTCAA ATCCATTCAA CTACGAGGTC CTACGAGGTC GATCATATTA GATCATATTA TCCCCAGAAG TCCCCAGAAG CGTGTCCTTC CGTGTCCTTC GACAATTCCT GACAATTCCT TTAACAACAA TTAACAACAA GGTGCTGGTC GGTGCTGGTC AAGCAGGAAG AAGCAGGAAG AGAACTCTAA AGAACTCTAA AAAGGGCAAT AAAGGGCAAT AGGACTCCTT AGGACTCCTT TCCAGTACCT TCCAGTACCCT GTCTAGTTCA GTCTAGTTCA GATTCCAAGA GATTCCAAGA TCTCTTACGA TCTCTTACGA AACCTTTAAA AACCTTTAAA AAGCACATTC AAGCACATTC TGAATCTGGC TGAATCTGGC CAAAGGAAAG CAAAGGAAAG GGCCGCATCA GGCCGCATCA GCAAGACCAA GCAAGACCAA AAAGGAGTAC AAAGGAGTAC CTGCTGGAAG CTGCTGGAAG AGCGGGACAT AGCGGGACAT CAACAGATTC CAACAGATTC TCCGTCCAGA TCCGTCCAGA AGGATTTTAT AGGATTTTAT TAACCGGAAT TAACCGGAAT CTGGTGGACA CTGGTGGACA CAAGATACGC CAAGATACGC TACTCGCGGC TACTCGCGGC CTGATGAATC CTGATGAATC TGCTGCGATC TGCTGCGATC CTATTTCCGG CTATTTTCCGG GTGAACAATC GTGAACAATC TGGATGTGAA TGGATGTGAA AGTCAAGTCC AGTCAAGTCC ATCAACGGCG ATCACGGCG GGTTCACATC GGTTCACATC TTTTCTGAGG TTTTCTGAGG CGCAAATGGA CGCAAATGGA AGTTTAAAAA AGTTTAAAAA GGAGCGCAAC GGAGCCGCAAC AAAGGGTACA AAAGGGTACA AGCACCATGC AGCACCATGC CGAAGATGCT CGAAGATGCT CTGATTATCG CTGATTATCG CAAATGCCGA CAAATGCCGA CTTCATCTTT CTTCATCTTT AAGGAGTGGA AAGGAGTGGA AAAAGCTGGA AAAAGCTGGA CAAAGCCAAG CAAAGCCAAG AAAGTGATGG AAAGTGATGG AGAACCAGAT AGAACCAGAT GTTCGAAGAG GTTCGAAGAG AAGCAGGCCG AAGCAGGCCG AATCTATGCC AATCTATGCC CGAAATCGAG CGAAATCGAG ACAGAACAGG ACAGAACAGG AGTACAAGGA AGTACAAGGA GATTTTCATC GATTTTCATC ACTCCTCACC ACTCCTCACC AGATCAAGCA AGATCAAGCA TATCAAGGAT TATCAAGGAT TTCAAGGACT TTCAAGGACT ACAAGTACTC ACAAGTACTC TCACCGGGTG TCACCGGGTG GATAAAAAGC GATAAAAAGC CCAACAGAGA CCAACAGAGA GCTGATCAAT GCTGATCAAT GACACCCTGT GACACCCTGT ATAGTACAAG ATAGTACAAG AAAAGACGAT AAAAGACGAT AAGGGGAATA AAGGGGAATA CCCTGATTGT CCCTGATTGT GAACAATCTG GAACAATCTG AACGGACTGT AACGGACTGT ACGACAAAGA ACGACAAAGA TAATGACAAG TAATGACAAG CTGAAAAAGC CTGAAAAAGC TGATCAACAA TGATCAACAA AAGTCCCGAG AAGTCCCGAG AAGCTGCTGA AAGCTGCTGA TGTACСАССА TGTACCACCA TGATCCTCAG TGATCCTCAG ACATATCAGA ACATATCAGA AACTGAAGCT AACTGAAGCT GATTATGGAG GATTATGGAG CAGTACGGCG CAGTACGGCG ACGAGAAGAA ACGAGAAGAA CCCACTGTAT CCCACTGTAT AAGTACTATG AAGTACTATG AAGAGACTGG AAGAGACTGG GAACTACCTG GAACTACTG ACCAAGTATA ACCAAGTATA GCAAAAAGGA GCAAAAAGGA TAATGGCCCC TAATGGCCCC GTGATCAAGA GTGATCAAGA AGATCAAGTA AGATCAAGTA CTATGGGAAC CTATGGGAAC AAGCTGAATG AAGCTGAATG CCCATCTGGA CCCATCTGGA CATCACAGAC CATCACAGAC GATTACCCTA GATTACCCTA ACAGTCGCAA ACAGTCGCAA CAAGGTGGTC CAAGGTGGTC AAGCTGTCAC AAGCTGTCAC TGAAGCCATA TGAAGCCATA CAGATTCGAT CAGATTCGAT GTCTATCTGG GTCTATCTGG ACAACGGCGT ACAACGGCGT GTATAAATTT GTATAAATTT GTGACTGTCA GTGACTGTCA AGAATCTGGA AGAATCTGGA TGTCATCAAA TGTCATCAAA AAGGAGAACT AAGGAGAACT ACTATGAAGT ACTATGAAGT GAATAGCAAG GAATAGCAAG TGCTACGAAG TGCTACGAAG AGGCTAAAAA AGGCTAAAAA GCTGAAAAAG GCTGAAAAAG ATTAGCAACC ATTAGCAACC AGGCAGAGTT AGGCAGAGTT CATCGCCTCC CATCGCCTCC TTTTACAACA TTTTACAACA ACGACCTGAT ACGACCTGAT TAAGATCAAT TAAGATCAAT GGCGAACTGT GGCGAACTGT ATAGGGTCAT ATAGGGTCAT CGGGGTGAAC CGGGGTGAAC AATGATCTGC AATGATCTGC TGAACCGCAT TGAACCGCAT TGAAGTGAAT TGAAGTGAAT ATGATTGACA ATGATTGACA TCACTTACCG TCACTTACCG AGAGTATCTG AGAGTATCTG GAAAACATGA GAAAACATGA ATGATAAGCG ATGATAAGCG CCCCCCTCGA CCCCCCTCGA ATTATCAAAA ATTATCAAAA CAATTGCCTC CAATTGCCTC TAAGACTCAG TAAGACTCAG AGTATCAAAA AGTATCAAAA AGTACTCAAC AGTACTCAAC CGACATTCTG CGACATTCTG GGAAACCTGT GGAAACCTGT ATGAGGTGAA ATGAGGTGAA GAGCAAAAAG GAGCAAAAAG

CACCCTCAGA TTATCAAAAA GGGCTAAGAA TTC [SEQ ID NO: 32]CACCCTCAGA TTATCAAAAA GGGCTAAGAA TTC [SEQ ID NO: 32]

- 29 042798- 29 042798

SEQ ID NO: 43 изложена ниже.SEQ ID NO: 43 is set forth below.

ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCAAGCGGAACTACAATGGCCCCAAAAGAAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCAAGCGGAACTACA

TCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGATCCTGGGCCTGGACATCGGCATCACCAGCGTGTGGGCTACGGCATCATCGACTACGAGACACGGGA

CGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGGCGTGATCGATGCCGGCGTGCGGCTGTTCAAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGG

AGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGCAGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGC

TGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGCTGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGC

CAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTGCAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTG

GCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCAGCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCA

CCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCTCCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCT

GGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTACGGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTAC

GTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCAGTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCA

TCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAGTCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAG

CCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTCCCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCCTGATGGGCCACTGCACCTACTTC

CCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACCCCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACC

TGAACAATCTCGTGATCACCAGGGACGAGAACGAGAAGCTGGAATATTACGAGAAGTTCCAGATTGAACAATCTCGTGATCACCAGGGACGAGAACGAGAAGCTGGAATATTACGAGAAGTTCCAGAT

CATCGAGAACGTGTTCAAGCAGAAGAAGAAGCCCACCCTGAAGCAGATCGCCAAAGAAATCCTCCATCGGAAACGTGTTCAAGCAGAAGAAGAAGCCCACCCTGAAGCAGATCGCCAAAGAAATCCTC

GTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACCGTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACC

TGAAGGTGTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCTTGAAGGTGTACCACGACATCAAGGACATTACCGCCCGGAAAAGAGATTATTGAGAACGCCGAGCT

GCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTGGCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTG

ACCAATCTGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATAACCAATCTGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATA

CCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAACCGGCACCCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAA

CGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAGCGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAG

CAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCT TCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCATCAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCT TCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCAT

TATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAGTATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAG

CGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCACGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCA

AGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGAAGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGA

AGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCCAGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCC

AGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCAAGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAAACAGCA

AGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAACAGAAGGGCAACCGGACCCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAAC

CTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAGCTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAG

TATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACCTATCTGCGTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACC

TGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAATGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAA

CAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGGCAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGG

AAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCAAAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCA

ACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGTGATGGAAAACCAACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGTGATGGAAAACCA

GATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAGGATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAG

ATCTTCATCACCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACCATCTTCATCACCCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACC

GGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGAGGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGA

CAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTGCAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTG

AAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGACCCCCAGACCTACCAAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGACCCCCAGACCTACC

AGAAACTGAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGAAGAAACTGAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGA

GGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATTGGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATT

AAGTATTACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAAAAGTATTACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAA

ACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTAACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTA

CAAGTTCGTGACCGTGAAGAATCTGGATGTGATCAAAAAAGAAAACTACTACGAAGTGAATAGCCAAGTTCGTGACCGTGAAGAATCTGGATGTGATCAAAAAAAGAAAACTACTACGAAGTGAATAGC

AAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCTAAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCT

TCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGATCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGA

- 30 042798- 30 042798

CCTGCTGAACCGGATCGAAGTGAACATGATCGACATCACCTACCGCGAGTACCTGGAAAACATG AACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGT ACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCCTCAGATCATCAA AAAGGGCAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG [SEQ ID NO: 43]CCTGCTGAACCGGATCGAAGTGAACATGATCGACATCACCTACCGCGAGTACCTGGAAAACATG AACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGT ACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCTCAGATCATCAAA AAAGGGCAAAQGCCGGGCCACGAAAAAGGCCGGCCAGGCAAA ID4

В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая молекулу Cas9 S. aureus, предусматривает нуклеотидную последовательность под SEQ ID NO: 44, которая представлена ниже.In some embodiments, the nucleotide sequence encoding the S. aureus Cas9 molecule provides for the nucleotide sequence of SEQ ID NO: 44 as shown below.

AAGCGGAACTACATCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACT ACGAGACACGGGACGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAA CGAGGGCAGGCGGAGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAG AGAGTGAAGAAGCTGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCA ACCCCTACGAGGCCAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGC CCTGCTGCACCTGGCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGC AACGAGCTGTCCACCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGG CCGAACTGCAGCTGGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAA GACCAGCGACTACGTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTG GACCAGAGCTTCATCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGAC CTGGCGAGGGCAGCCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCA CTGCACCTACTTCCCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAAC GCCCTGAACGACCTGAACAATCTCGTGATCACCAGGGACGAGAACGAGAAGCTGGAATATTACG AGAAG Т Т С СAGAT CATC GAGAAC G Т G Т Т СAAG СAGAAGAAGAAG С С САС С С Т GAAG СAGAT С G С CAAAGAAATCCTCGTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCC GAG Т Т САС СААС С Т GAAG G Т G ТАС САС GACАТ СAAG GACAT TACCGCCCG GAAAGAGAT ТАТ Т G AGAACGCCGAGCTGCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACAT С СAG GAAGAAC Т GAC СААТ С Т GAAC ТСС GAG С Т GAC С СAG GAAGAGAT С GAG СAGAT С Т С ТААТ CTGAAGGGCTATACCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGC TGTGGCACACCAACGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGT GGACCTGTCCCAGCAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTC GTGAAGAGAAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGC CCAACGACATCATTATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAA CGAGATGCAGAAGCGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGC AAAGAGAACGCCAAGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCC TGTACAGCCTGGAAGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGA С САСАТ САТ С С С СAGAAG CGTGTCCTTC GACААСAG С Т Т СААСААСAAG GTGCTCGT GAAG СAG GAAGAAAACAGCAAGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGA TCAGCTACGAAACCTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAA GACCAAGAAAGAGTATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTC ATCAACCGGAACCTGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCT ACTTCAGAGTGAACAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCT GCGGCGGAAGTGGAAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCC CTGATCATTGCCAACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAG TGATGGAAAACCAGATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCA G GAG T AC AAAGAGAT С T T C AT С AC С С С С С AC C AGAT C AAG C AC AT T AAG GAC T T C AAG GAC TAG AAGTACAGCCACCGGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCA CCCGGAAGGACGACAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGAAAGCGGAACTACATCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACT ACGAGACACGGGACGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAA CGAGGGCAGGCGGAGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAG AGAGTGAAGAAGCTGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCA ACCCCTACGAGGCCAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGC CCTGCTGCACCTGGCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGC AACGAGCTGTCCACCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGG CCGAACTGCAGCTGGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAA GACCAGCGACTACGTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTG GACCAGAGCTTCATCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGAC CTGGCGAGGGCAGCCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCA CTGCACCTACTTCCCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAAC GCCCTGAACGACCTGAACAATCTCGTGATCACCAGGGACGAGAACGAGAAGCTGGAATATTACG AGAAG Т Т С СAGAT CATC GAGAAC G Т G Т Т СAAG СAGAAGAAGAAG С С САС С С Т GAAG СAGAT С G С CAAAGAAATCCTCGTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCC GAG Т Т САС СААС С Т GAAG G Т G ТАС САС GACАТ СAAG GACAT TACCGCCCG GAAAGAGAT ТАТ Т G AGAACGCCGAGCTGCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACAT С СAG GAAGAAC Т GAC СААТ С Т GAAC ТСС GAG С Т GAC С СAG GAAGAGAT С GAG СAGAT С Т С ТААТ CTGAAGGGCTATACCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGC TGTGGCACACCAACGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGT GGACCTGTCCCAGCAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTC GTGAAGAGAAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGC CCAACGACATCATTATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAA CGAGATGCAGAAGCGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGC AAAGAGAACGCCAAGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCC TGTACAGCCTGGAAGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGA С САСАТ САТ С С С СAGAAG CGTGTCCTTC GACААСAG С Т Т СААСААСAAG GTGCTCGT GAAG СAG GAAGAAAACAGCAAGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGA TCAGCTACGAAACCTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAA GACCAAGAAAGAGTATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTC ATCAACCGGAACCTGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCT ACTTCAGAGTGAACAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCT GCGGCGGAAGTGGAAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCC CTGATCATTGCCAACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAG TGATGGAAAACCAGATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCA G GAG T AC AAAGAGAT С T T C AT С AC С С С С С AC C AGAT C AAG C AC AT T AAG GAC T T C AAG GAC TAG AAGTACAGCCACCGGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCA CCCGGAAGGACGACAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGA

- 31 042798- 31 042798

CAATGACAAGCTGAAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGAC С С С СAGAC СТАС СAGAAAC Т GAAG CTGATTATG GAACAG ТAC G G С GAC GAGAAGAAT С С С С Т G Т ACAAGTACTACGAGGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGT GAT СAAGAAGAT ТAAG ТАТ ТАС G G СААСАААС Т GAAC GCCCATCTG GACАТ САС С GAC GAC ТАС CCCAACAGCAGAAACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGG АСААТ G G С G Т G ТACAAG Т Т С G Т GAC С G Т GAAGAAT CTGGATGTGAT СAAAAAAGAAAAC ТАС ТА CGAAGTGAATAGCAAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAG TTTATCGCCTCCTTC ТАСААСААС GAT С Т GAT СAAGAT СААС G G С GAG С Т G ТATAGAG Т GAT С G G С G Т GAACААСGACС Т GС Т GAACСGGAT СGAAGТ GAACAT GAT С GACАТ САСС ТАССGСGAGТА CCTGGAAAACATGAACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAG AGCATTAAGAAGTACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACC CTCAGATCATCAAAAAGGGC [SEQ ID NO: 44]CAATGACAAGCTGAAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGAC С С С СAGAC СТАС СAGAAAC Т GAAG CTGATTATG GAACAG ТAC G G С GAC GAGAAGAAT С С С С Т G Т ACAAGTACTACGAGGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGT GAT СAAGAAGAT ТAAG ТАТ ТАС G G СААСАААС Т GAAC GCCCATCTG GACАТ САС С GAC GAC ТАС CCCAACAGCAGAAACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGG АСААТ G G С G Т G ТACAAG Т Т С G Т GAC С G Т GAAGAAT CTGGATGTGAT СAAAAAAGAAAAC ТАС ТА CGAAGTGAATAGCAAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAG TTTATCGCCTCCTTC ТАСААСААС GAT С Т GAT СAAGAT СААС G G С GAG С Т G ТATAGAG Т GAT С G G С G Т GAACААСGACС Т GС Т GAACСGGAT СGAAGТ GAACAT GAT С GACАТ САСС ТАССGСGAGТА CCTGGAAAACATGAACGACAAGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAG AGCATTAAGAAGTACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACC CTCAGATCATCAAAAAGGGC [SEQ ID NO: 44]

Аминокислотная последовательность молекулы Cas9 S. aureus изложена под SEQ ID NO: 33, которая представлена ниже.The amino acid sequence of the S. aureus Cas9 molecule is set forth under SEQ ID NO: 33, which is shown below.

MKRNYILGLDIGIТSVGYG11DYE TRDVIDAGVRL EKEANVENNEGRRS KRGARRLKRRRRHRI QRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDT GNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQ LDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLY NALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGK PEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQIS NLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSP WKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTT GKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVK QEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKD FINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAED ALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKD YKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHH DPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDD YPNSRNKWKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQA EFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKT QSIKKYSTDILGNLYEVKSKKHPQIIKKG [SEQ ID NO: 33]MKRNYILGLDIGIТSVGYG11DYE TRDVIDAGVRL EKEANVENNEGRRS KRGARRLKRRRRHRI QRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDT GNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQ LDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLY NALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGK PEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQIS NLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSP WKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTT GKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVK QEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKD FINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAED ALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKD YKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHH DPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDD YPNSRNKWKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQA EFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKT QSIKKYSTDILGNLYEVKSKKHPQIIKKG [SEQ ID NO: 33]

Аминокислотная последовательность молекулы Cas9 S. aureus изложена под SEQ ID NO: 45, которая представлена ниже.The amino acid sequence of the S. aureus Cas9 molecule is set forth under SEQ ID NO: 45, which is shown below.

KRNYILGLDIGIT SVGYG11DYE TRDVIDAGVRL FKEANVENNE GRRS KRGARRLKRRRRHRIQ RVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTG NELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQL DQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYN ALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISN LKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPV VKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTG KENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQ EENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDA LIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDY KYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHD PQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDY PNSRNKWKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE FIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQ SIKKYSTDILGNLYEVKSKKHPQIIKKG [SEQ ID NO: 45]KRNYILGLDIGIT SVGYG11DYE TRDVIDAGVRL FKEANVENNE GRRS KRGARRLKRRRRHRIQ RVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTG NELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQL DQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYN ALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISN LKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPV VKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTG KENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQ EENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDA LIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDY KYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHD PQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDY PNSRNKWKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE FIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQ SIKKYSTDILGNLYEVKSKKHPQIIKKG [SEQ ID NO: 45]

- 32 042798- 32 042798

Как альтернатива или дополнительно система редактирования генов на основе CRISPR/Cas9 может включать в себя слитый белок. Слитый белок может содержать два гетерологичных полипептидных домена, где первый полипептидный домен содержит белок Cas и второй полипептидный домен обладает активностью, такой как активность по отношению к активации транскрипции, активность по отношению к репрессии транскрипции, активность по отношению к фактору освобождения транскриптов, активность по отношению к модификации гистонов, нуклеазная активность, активность по отношению к ассоциации нуклеиновых кислот, метилазная активность или деметилазная активность. Слитый белок может предусматривать белок Cas9 или мутированный белок Cas9, слитый со вторым полипептидным доменом, который обладает активностью, такой как активность по отношению к активации транскрипции, активность по отношению к репрессии транскрипции, активность по отношению к фактору освобождения транскриптов, активность по отношению к модификации гистонов, нуклеазная активность, активность по отношению к ассоциации нуклеиновых кислот, метилазная активность или деметилазная активность.Alternatively or additionally, the CRISPR/Cas9 based gene editing system may include a fusion protein. The fusion protein may contain two heterologous polypeptide domains, where the first polypeptide domain contains the Cas protein and the second polypeptide domain has an activity such as activity for transcription activation, activity for transcriptional repression, activity for transcript release factor, activity for histone modification, nuclease activity, nucleic acid association activity, methylase activity or demethylase activity. The fusion protein may comprise a Cas9 protein or a mutated Cas9 protein fused to a second polypeptide domain that has an activity such as transcription activation activity, transcriptional repression activity, transcription release factor activity, modification activity. histones, nuclease activity, nucleic acid association activity, methylase activity or demethylase activity.

(a) Активность по отношению к активации транскрипции.(a) Transcriptional activation activity.

Второй полипептидный домен может обладать активностью по отношению к активации транскрипции, т.е. трансактивирующим доменом. Например, экспрессия эндогенных генов млекопитающих, таких как гены человека, может достигаться за счет нацеливания слитого белка iCas9 и трансактивирующего домена на промоторы млекопитающих посредством комбинации gRNA. Трансактивирующий домен может включать в себя белок VP 16, множество белков VP 16, таких как домен VP48, или домен VP64, или домен p65 активатора активности транскрипции NF каппа B. Например, слитый белок может представлять собой iCas9-VP64.The second polypeptide domain may have transcriptional activation activity, ie. transactivating domain. For example, expression of endogenous mammalian genes, such as human genes, can be achieved by targeting the iCas9 fusion protein and the transactivation domain to mammalian promoters through a combination of gRNA. The transactivating domain may include the VP 16 protein, a variety of VP 16 proteins such as the VP48 domain, or the VP64 domain, or the kappa B NF transcription activity activator p65 domain. For example, the fusion protein may be iCas9-VP64.

(b) Активность по отношению к репрессии транскрипции.(b) Transcriptional repression activity.

Второй полипептидный домен может обладать активностью по отношению к репрессии транскрипции. Второй полипептидный домен может обладать активностью, связанной с Kruppel-боксом, таким как KRAB-домен, активностью по отношению к репрессии ERF-домена, активностью по отношению к репрессии Mxil-домена, активностью по отношению к репрессии SID4X-домена, активностью по отношению к репрессии Mad-SID-домена или активностью по отношению к белку, связывающему TATA-бокс. Например, слитый белок может представлять собой dCas9-KRAB.The second polypeptide domain may have transcriptional repression activity. The second polypeptide domain may have Kruppel box related activity such as KRAB domain, ERF domain repression activity, Mxil domain repression activity, SID4X domain repression activity, repression of the Mad-SID domain or activity against the protein that binds the TATA box. For example, the fusion protein may be dCas9-KRAB.

(c) Активность по отношению к фактору освобождения транскриптов.(c) Activity against transcript release factor.

Второй полипептидный домен может обладать активностью по отношению к фактору освобождения транскриптов. Второй полипептидный домен может обладать активностью по отношению к эукариотическому фактору высвобождения 1 (ERF1) или активностью по отношению к эукариотическому фактору высвобождения 3 (ERF3).The second polypeptide domain may have activity against a transcript release factor. The second polypeptide domain may have eukaryotic release factor 1 (ERF1) activity or eukaryotic release factor 3 (ERF3) activity.

(d) Активность по отношению к модификации гистонов.(d) Histone modification activity.

Второй полипептидный домен может обладать активностью по отношению к модификации гистонов. Второй полипептидный домен может обладать гистондеацетилазной, гистонацетилтрансферазной, гистондеметилазной или гистонметилтрансферазной активностью. Гистонацетилтрансфераза может представлять собой p300 или CREB-связывающий белок (CBP белок) или их фрагмент. Например, слитый белок может представлять собой dCas9-p300.The second polypeptide domain may have histone modification activity. The second polypeptide domain may have histone deacetylase, histone acetyltransferase, histone demethylase, or histone methyltransferase activity. The histone acetyltransferase may be p300 or CREB binding protein (CBP protein) or a fragment thereof. For example, the fusion protein may be dCas9-p300.

(e) Нуклеазная активность.(e) Nuclease activity.

Второй полипептидный домен может обладать нуклеазной активностью, которая отличается от нуклеазной активности белка Cas9. Нуклеазой или белком, обладающим нуклеазной активностью, является фермент, способный расщеплять фосфодиэфирные связи между нуклеотидными субъединицами нуклеиновых кислот. Нуклеазы обычно дополнительно разделяются на эндонуклеазы и экзонуклеазы, хотя некоторые из ферментов могут попадать в обе категории. Хорошо известными нуклеазами являются дезоксирибонуклеаза и рибонуклеаза.The second polypeptide domain may have a nuclease activity that is different from the nuclease activity of the Cas9 protein. A nuclease or protein having nuclease activity is an enzyme capable of cleaving phosphodiester bonds between nucleotide subunits of nucleic acids. Nucleases are usually further divided into endonucleases and exonucleases, although some of the enzymes may fall into both categories. Well-known nucleases are deoxyribonuclease and ribonuclease.

(f) Активность по отношению к ассоциации нуклеиновых кислот.(f) Nucleic acid association activity.

Второй полипептидный домен может обладать активностью по отношению к ассоциации нуклеиновых кислот или ДНК-связывающего домена (DBD) белка, связывающего нуклеиновую кислоту, который представляет собой независимо уложенный домен белка, который содержит по меньшей мере один мотив, распознающий двухнитевую или однонитевую молекулу ДНК. DBD может распознавать конкретную последовательность ДНК (распознавание последовательности) или обладать общей аффинностью к ДНК. При этом область ассоциации нуклеиновых кислот выбрана из группы, состоящей из области спираль-поворот-спираль, области лейциновой застежки, области крылатая спираль, области крылатая спираль-поворот-спираль, области спираль-петля-спираль, укладки цепи иммуноглобулинов, B3-домена, домена с цинковыми пальцами, HMG-бокса, Wor3-домена, TAL-эффектора ДНК-связывающего домена.The second polypeptide domain may have activity for association of nucleic acids or a DNA binding domain (DBD) of a nucleic acid binding protein, which is an independently folded domain of a protein that contains at least one motif that recognizes a double-stranded or single-stranded DNA molecule. The DBD may recognize a specific DNA sequence (sequence recognition) or have a general affinity for DNA. The nucleic acid association region is selected from the group consisting of the helix-turn-helix region, the leucine zipper region, the winged helix region, the winged helix-turn-helix region, the helix-loop-helix region, the immunoglobulin chain fold, the B3 domain, zinc finger domain, HMG box, Wor3 domain, TAL effector of the DNA binding domain.

(g) Метилазная активность.(g) Methylase activity.

Второй полипептидный домен может обладать метилазной активностью, которая предусматривает перенос метильной группы на ДНК, РНК, белок, малую молекулу, цитозин или аденин. Второй полипептидный домен может включать ДНК-метилтрансферазу.The second polypeptide domain may have methylase activity, which involves the transfer of a methyl group to DNA, RNA, protein, small molecule, cytosine, or adenine. The second polypeptide domain may include DNA methyltransferase.

(h) Деметилазная активность.(h) Demethylase activity.

Второй полипептидный домен может обладать деметилазной активностью. Второй полипептидныйThe second polypeptide domain may have demethylase activity. Second polypeptide

- 33 042798 домен может включать в себя фермент, который удаляет метильные (CH3-) группы из нуклеиновых кислот, белков (в частности, гистонов) и других молекул. Как альтернатива второй полипептид может скрывать метильную группу к гидроксиметилцитозину в механизме деметилирования ДНК. Второй полипептид может катализировать данную реакцию. Например, второй полипептид, который катализирует данную реакцию, может представлять собой Tet1.- 33 042798 the domain may include an enzyme that removes methyl (CH3-) groups from nucleic acids, proteins (particularly histones) and other molecules. Alternatively, the second polypeptide can harbor a methyl group to hydroxymethylcytosine in the DNA demethylation mechanism. The second polypeptide can catalyze this reaction. For example, the second polypeptide that catalyzes this reaction may be Tet1.

(b ) gRNA, нацеливающая на ген дистрофина.(b) gRNA targeting the dystrophin gene.

Система редактирования генов на основе CRISPR/Cas9 включает в себя по меньшей мере одну молекулу gRNA, например две молекулы gRNA. gRNA обеспечивает нацеливание системы редактирования генов на основе CRISPR/Cas9. gRNA является слитой конструкцией из двух некодирующих РНК: crRNA и tracrRNA. sgRNA может нацеливаться на любую требуемую последовательность ДНК путем обмена последовательности, кодирующей протоспейсер размером 20 п.о., который обеспечивает специфичность нацеливания, посредством комплементарного спаривания оснований с требуемой целевой ДНК. При этом gRNA имитирует встречающийся в природе дуплекс crRNA:tracrRNA, принимающий участие в эффекторной системе типа II. Этот дуплекс, который может включать в себя, например, 42-нуклеотидную crRNA и 75-нуклеотидную tracrRNA, действует как направляющий для Cas9 для расщепления целевой нуклеиновой кислоты. Термины целевая область, целевая последовательность или протоспейсер, используемые в данном документе взаимозаменяемо, относятся к области гена-мишени (например, гена дистрофина), на которую нацеливается система редактирования генов на основе CRISPR/Cas9. Система редактирования генов на основе CRISPR/Cas9 может включать в себя по меньшей мере одну gRNA, где gRNA нацеливаются на различные последовательности ДНК. Целевые последовательности ДНК могут быть перекрывающимися. После целевой последовательности или протоспейсера следует последовательность PAM на 3'-конце протоспейсера. Различные системы типа II имеют разные требования к PAM. Например, в системе типа II из Streptococcus pyogenes используется последовательность NGG, где N может представлять собой любой нуклеотид. В некоторых вариантах осуществления последовательность PAM может представлять собой NGG, где N может представлять собой любой нуклеотид. В некоторых вариантах осуществления последовательность PAM может представлять собой NNGRRT (SEQ ID NO: 24) или NNGRRV (SEQ ID NO: 25).The CRISPR/Cas9 based gene editing system includes at least one gRNA molecule, eg two gRNA molecules. gRNA provides targeting of the CRISPR/Cas9 based gene editing system. gRNA is a fusion of two non-coding RNAs, crRNA and tracrRNA. The sgRNA can target any desired DNA sequence by exchanging the 20 bp protospacer coding sequence that provides targeting specificity through complementary base pairing with the desired target DNA. In this case, gRNA mimics the naturally occurring crRNA:tracrRNA duplex involved in the type II effector system. This duplex, which may include, for example, a 42 bp crRNA and a 75 bp tracrRNA, acts as a guide for Cas9 to cleave the target nucleic acid. The terms target region, target sequence, or protospacer, used interchangeably herein, refer to the region of a target gene (eg, dystrophin gene) that is targeted by a CRISPR/Cas9 based gene editing system. A CRISPR/Cas9 based gene editing system may include at least one gRNA where the gRNAs are targeted to different DNA sequences. Target DNA sequences may be overlapping. The target sequence or protospacer is followed by a PAM sequence at the 3' end of the protospacer. Different Type II systems have different PAM requirements. For example, in the type II system from Streptococcus pyogenes, the sequence NGG is used, where N can be any nucleotide. In some embodiments, the PAM sequence may be NGG, where N may be any nucleotide. In some embodiments, the PAM sequence may be NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25).

Количество молекул gRNA, кодируемых раскрытой в настоящем изобретении генетической конструкцией (например, вектор на основе AAV) может представлять собой по меньшей мере 1 gRNA, по меньшей мере 2 различные gRNA, по меньшей мере 3 различные gRNA, по меньшей мере 4 различные gRNA, по меньшей мере 5 различных gRNA, по меньшей мере 6 различных gRNA, по меньшей мере 7 различных gRNA, по меньшей мере 8 различных gRNA, по меньшей мере 9 различных gRNA, по меньшей мере 10 различных gRNA, по меньшей мере 11 различных gRNA, по меньшей мере 12 различных gRNA, по меньшей мере 13 различных gRNA, по меньшей мере 14 различных gRNA, по меньшей мере 15 различных gRNA, по меньшей мере 16 различных gRNA, по меньшей мере 17 различных gRNA, по меньшей мере 18 различных gRNA, по меньшей мере 19 различных gRNA, по меньшей мере 20 различных gRNA, по меньшей мере 25 различных gRNA, по меньшей мере 30 различных gRNA, по меньшей мере 35 различных gRNA, по меньшей мере 40 различных gRNA, по меньшей мере 45 различных gRNA или по меньшей мере 50 различных gRNA. Количество gRNA, кодируемых вектором, раскрытым в настоящем изобретении, может составлять от по меньшей мере 1 gRNA до по меньшей мере 50 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 45 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 40 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 35 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 30 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 25 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 20 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 16 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 12 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 8 различных gRNA, от по меньшей мере 1 gRNA до по меньшей мере 4 различных gRNA, от по меньшей мере 4 gRNA до по меньшей мере 50 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 45 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 40 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 35 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 30 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 25 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 20 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 16 различных gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 12 различные gRNA, от по меньшей мере 4 различных gRNA до по меньшей мере 8 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 50 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 45 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 40 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 35 различных gRNA, от 8 различных gRNA до по меньшей мере 30 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 25 различных gRNA, от 8 различных gRNA до по меньшей мере 20 различных gRNA, от по меньшей мере 8 различных gRNA до по меньшей мере 16 различных gRNA или от 8 различных gRNA до по меньшей мере 12 различных gRNA. В определенных вариантах осуществления генеThe number of gRNA molecules encoded by a genetic construct disclosed herein (e.g., an AAV vector) may be at least 1 gRNA, at least 2 different gRNAs, at least 3 different gRNAs, at least 4 different gRNAs, at least 5 different gRNAs, at least 6 different gRNAs, at least 7 different gRNAs, at least 8 different gRNAs, at least 9 different gRNAs, at least 10 different gRNAs, at least 11 different gRNAs, at least at least 12 different gRNAs, at least 13 different gRNAs, at least 14 different gRNAs, at least 15 different gRNAs, at least 16 different gRNAs, at least 17 different gRNAs, at least 18 different gRNAs, at least 19 different gRNAs, at least 20 different gRNAs, at least 25 different gRNAs, at least 30 different gRNAs, at least 35 different gRNAs, at least 40 different gRNAs, at least 45 different gRNAs, or at least 50 different gRNAs. The number of gRNAs encoded by the vector disclosed in the present invention may be from at least 1 gRNA to at least 50 different gRNAs, from at least 1 gRNA to at least 45 different gRNAs, from at least 1 gRNA to at least at least 40 different gRNAs, from at least 1 gRNA to at least 35 different gRNAs, from at least 1 gRNA to at least 30 different gRNAs, from at least 1 gRNA to at least 25 different gRNAs, from at least at least 1 gRNA to at least 20 different gRNAs, from at least 1 gRNA to at least 16 different gRNAs, from at least 1 gRNA to at least 12 different gRNAs, from at least 1 gRNA to at least 8 different gRNAs, at least 1 gRNA to at least 4 different gRNAs, from at least 4 gRNAs to at least 50 different gRNAs, from at least 4 different gRNAs to at least 45 different gRNAs, from at least 4 different gRNAs to at least 40 different gRNAs, from at least 4 different gRNAs to at least 35 different gRNAs, from at least 4 different gRNAs to at least 30 different gRNAs, from at least 4 different gRNAs to up to at least 25 different gRNAs, from at least 4 different gRNAs to at least 20 different gRNAs, from at least 4 different gRNAs to at least 16 different gRNAs, from at least 4 different gRNAs to at least 12 different gRNAs , at least 4 different gRNAs to at least 8 different gRNAs, from at least 8 different gRNAs to at least 50 different gRNAs, from at least 8 different gRNAs to at least 45 different gRNAs, from at least 8 different gRNAs to at least 40 different gRNAs, from at least 8 different gRNAs to at least 35 different gRNAs, from 8 different gRNAs to at least 30 different gRNAs, from at least 8 different gRNAs to at least 25 different gRNAs, from 8 different gRNAs to at least 20 different gRNAs, from at least 8 different gRNAs to at least 16 different gRNAs, or from 8 different gRNAs to at least 12 different gRNAs. In certain embodiments, a gene

- 34 042798 тическая конструкция (например, вектор AAV) кодируется одной молекулой gRNA, т.е. первой молекулой gRNA и необязательно молекулой Cas9. В определенных вариантах осуществления первая генетическая конструкция (например, первый вектор на основе AAV) кодируется одной молекулой gRNA, т.е. первой молекулой gRNA и необязательно молекулой Cas9, и вторая генетическая конструкция (например, второй вектор AAV) кодируется одной молекулой gRNA, т.е. второй молекулой gRNA и необязательно молекулой Cas9.- 34 042798 The tic construct (eg AAV vector) is encoded by a single gRNA molecule, i.e. the first gRNA molecule and optionally the Cas9 molecule. In certain embodiments, the first genetic construct (eg, the first AAV-based vector) is encoded by a single gRNA molecule, ie. the first gRNA molecule and optionally the Cas9 molecule, and the second genetic construct (eg, the second AAV vector) is encoded by one gRNA molecule, i.e. a second gRNA molecule and optionally a Cas9 molecule.

Молекула gRNA содержит нацеливающий домен, который комплементарен полинуклеотидной последовательности целевой ДНК, после которой следует последовательность PAM. При этом gRNA может содержать G на 5'-конце нацеливающего домена или комплементарной полинуклеотидной последовательности. Нацеливающий домен молекулы gRNA может содержать по меньшей мере 10 пар оснований, по меньшей мере 11 пар оснований, по меньшей мере 12 пар оснований, по меньшей мере 13 пар оснований, по меньшей мере 14 пар оснований, по меньшей мере 15 пар оснований, по меньшей мере 16 пар оснований, по меньшей мере 17 пар оснований, по меньшей мере 18 пар оснований, по меньшей мере 19 пар оснований, по меньшей мере 20 пар оснований, по меньшей мере 21 пару оснований, по меньшей мере 22 пары оснований, по меньшей мере 23 пары оснований, по меньшей мере 24 пары оснований, по меньшей мере 25 пар оснований, по меньшей мере 30 пар оснований или по меньшей мере 35 пар оснований, комплементарных последовательности целевой ДНК, после которой следует последовательность PAM. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 19-25 нуклеотидов. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 20 нуклеотидов. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 21 нуклеотид. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 22 нуклеотида. В определенных вариантах осуществления длина нацеливающего домена молекулы gRNA составляет 23 нуклеотида.The gRNA molecule contains a targeting domain that is complementary to the target DNA polynucleotide sequence followed by the PAM sequence. While gRNA may contain G at the 5'end of the targeting domain or complementary polynucleotide sequence. The targeting domain of a gRNA molecule may be at least 10 base pairs, at least 11 base pairs, at least 12 base pairs, at least 13 base pairs, at least 14 base pairs, at least 15 base pairs, at least at least 16 base pairs, at least 17 base pairs, at least 18 base pairs, at least 19 base pairs, at least 20 base pairs, at least 21 base pairs, at least 22 base pairs, at least 23 base pairs, at least 24 base pairs, at least 25 base pairs, at least 30 base pairs, or at least 35 base pairs complementary to the target DNA sequence followed by a PAM sequence. In certain embodiments, the length of the targeting domain of the gRNA molecule is 19-25 nucleotides. In certain embodiments, the targeting domain of the gRNA molecule is 20 nucleotides long. In certain embodiments, the targeting domain of the gRNA molecule is 21 nucleotides long. In certain embodiments, the targeting domain of the gRNA molecule is 22 nucleotides long. In certain embodiments, the targeting domain of the gRNA molecule is 23 nucleotides long.

gRNA может нацеливаться на область гена дистрофина (DMD). В определенных вариантах осуществления gRNA может нацеливаться на по меньшей мере одно из экзонов, интронов, промоторной области, энхансерной области, транскрибируемой области гена дистрофина. В определенных вариантах осуществления молекула gRNA нацеливается на интрон 50 гена дистрофина человека. В определенных вариантах осуществления молекула gRNA нацеливается на интрон 51 гена дистрофина человека. В определенных вариантах осуществления молекула gRNA нацеливается на экзон 51 гена дистрофина человека. gRNA может включать в себя нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, или комплементарную ей последовательность.gRNA can target the dystrophin (DMD) gene region. In certain embodiments, the gRNA may target at least one of the exons, introns, promoter region, enhancer region, transcribed region of the dystrophin gene. In certain embodiments, the gRNA molecule targets intron 50 of the human dystrophin gene. In certain embodiments, the gRNA molecule targets intron 51 of the human dystrophin gene. In certain embodiments, the gRNA molecule targets exon 51 of the human dystrophin gene. gRNA may include a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 , SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, or its complementary sequence.

Одиночную или мультиплексную gRNA можно сконструировать для восстановления рамки считывания дистрофина путем нацеливания мутационного участка горячих точек в экзоне 51 или как введение либо внутриэкзонных небольших вставок, так и делеций, либо удаление экзона 51. После лечения с помощью вектора, раскрытого в настоящем изобретении, может восстанавливаться экспрессия дистрофина в мышечных клетках пациента с Duchenne in vitro. Дистрофин человека был выявлен in vivo после трансплантации генетически скорректированных клеток пациента в иммунодефицитных мышей. Особенно важно то, что уникальные возможности многократного редактирования генов системы редактирования генов на основе CRISPR/Cas9 позволяют эффективно получать большие делеции этого мутационного участка горячих точек, которые могут корректировать до 62% мутаций пациента универсальными или специфичными для пациента подходами для редактирования гена. В некоторых вариантах осуществления кандидатные gRNA оценивали и выбирали на основании нецелевой активности, целевой активности, измеренных с помощью анализа Surveyor, а также расстояния от экзона.A single or multiplex gRNA can be engineered to restore the dystrophin reading frame by targeting a hotspot mutation site in exon 51, or as either intra-exon small inserts or deletions, or exon 51 deletion. dystrophin expression in muscle cells of a Duchenne patient in vitro. Human dystrophin has been identified in vivo following transplantation of genetically engineered patient cells into immunodeficient mice. Most importantly, the unique multiple gene-editing capabilities of the CRISPR/Cas9-based gene-editing system make it possible to efficiently generate large deletions of this mutational hotspot region, which can correct up to 62% of patient mutations with generic or patient-specific gene editing approaches. In some embodiments, candidate gRNAs are evaluated and selected based on non-target activity, target activity as measured by the Surveyor assay, and distance from the exon.

3. Композиции для нацеливания на ДНК.3. DNA targeting compositions.

Настоящее изобретение также относится к композициям для нацеливания на ДНК, которые содержат данные генетические конструкции. Композиции для нацеливания на ДНК содержат по меньшей мере одну молекулу gRNA (например, две молекулы gRNA), которая нацеливается на ген дистрофина (например, ген дистрофина человека), как описано выше. По меньшей мере одна молекула gRNA может связывать и распознавать целевую область. Целевые области можно выбирать непосредственно выше возможных стоп-кодонов за пределами рамки считывания, так что вставки или делеции во время процесса репарации восстанавливают рамку считывания дистрофина путем преобразования рамки считывания. Целевые области также могут представлять собой сайты акцепторов сплайсинга или сайты доноров сплайсинга, так что вставки или делеции во время процесса репарации нарушают сплайсинг и восстанавливают рамку считывания дистрофина с помощью разрушения сайта сплайсинга и исключения экзона. Целевые области также могут представлять собой аберрантные стоп-кодоны, так что вставки или делеции во время процесса репарации восстанавливают рамку считывания дистрофина, устраняя или разрушая стопкодон.The present invention also relates to DNA targeting compositions that contain these genetic constructs. DNA targeting compositions comprise at least one gRNA molecule (eg, two gRNA molecules) that targets a dystrophin gene (eg, the human dystrophin gene) as described above. At least one gRNA molecule can bind and recognize the target region. Target regions can be chosen directly above possible out-of-frame stop codons so that insertions or deletions during the repair process restore the dystrophin reading frame by in-frame transformation. Target regions can also be splice acceptor sites or splice donor sites such that insertions or deletions during the repair process disrupt splicing and restore the dystrophin reading frame by destroying the splice site and exonating the exon. The target regions can also be aberrant stop codons, so that insertions or deletions during the repair process restore the dystrophin reading frame, eliminating or destroying the stop codon.

В определенных вариантах осуществления композиция для нацеливания на ДНК, раскрытая в настоящем изобретении, включает в себя первую gRNA и вторую gRNA, где первая молекула gRNA и втоIn certain embodiments, a DNA targeting composition disclosed herein comprises a first gRNA and a second gRNA, wherein the first gRNA molecule and the second

- 35 042798 рая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, или комплементарную ей последовательность. В определенных вариантах осуществления первая молекула gRNA и вторая молекула gRNA содержат нацеливающие домены. В определенных вариантах осуществления первая молекула gRNA представлена под SEQ ID NO: 1 SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 или SEQ ID NO: 15 и вторая молекула gRNA представлена под SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 или SEQ ID NO: 19. В определенных вариантах осуществления первая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 и SEQ ID NO: 15 и вторая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.- 35 042798 each gRNA molecule contains a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO : 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 , SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, or its complementary sequence. In certain embodiments, the first gRNA molecule and the second gRNA molecule contain targeting domains. In certain embodiments, the first gRNA molecule is represented under SEQ ID NO: 1 SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 or SEQ ID NO: 15 and the second gRNA molecule is shown under SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO : 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, or SEQ ID NO: 19. In certain embodiments, the first gRNA molecule is selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 and SEQ ID NO: 15 and the second gRNA molecule is selected from the group consisting of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO : 16, SEQ ID NO: 17, SEQ ID NO: 18 and SEQ ID NO: 19.

В определенных вариантах осуществления первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;In certain embodiments, the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain, which contains the nucleotide sequence set forth under SEQ ID NO: 2;

(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(vi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(viii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15;(x) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15;

(xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 42.(xi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18; and (xii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 41 and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 42.

В некоторых вариантах осуществления композиция для нацеливания на ДНК содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 37, и/или нуклеотидную последовательность, изложенную под SEQ ID NO: 38.In some embodiments, the DNA targeting composition comprises the nucleotide sequence set forth in SEQ ID NO: 37 and/or the nucleotide sequence set forth in SEQ ID NO: 38.

В определенных вариантах осуществления композиция для нацеливания на ДНК может дополнительно включать в себя по меньшей мере одну молекулу Cas9 или слитый белок Cas9, который распознается PAM либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25). В некоторых вариантах осуществления композиция для нацеливания на ДНК содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 83 или SEQ ID NO: 84. В определенных вариантах осуществления вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно вIn certain embodiments, the DNA targeting composition may further comprise at least one Cas9 molecule or a Cas9 fusion protein that is recognized by either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25) PAM. In some embodiments, the DNA targeting composition comprises the nucleotide sequence set forth under SEQ ID NO: 83 or SEQ ID NO: 84. In certain embodiments, the vector is designed to form first and second double strand breaks, respectively, in

- 36 042798 первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.- 36 042798 the first and second introns flanking exon 51 of the human dystrophin gene, which ensures the deletion of the dystrophin gene segment containing exon 51.

Эффективность делеции векторов, раскрытых в настоящем изобретении, может быть связана с размером делеции, т.е. размером сегмента, подвергнутого делеции с помощью векторов. В определенных вариантах осуществления длину или размер определенных делеций определяют с помощью расстояния между последовательностями PAM в подлежащем нацеливанию гене (например, гене дистрофина). В определенных вариантах осуществления определенная делеция сегмента гена дистрофина, которую определяют с точки зрения ее длины и содержащей ее последовательности (например, экзон 51), происходит в результате разрывов, смежных с определенными последовательностями PAM, в пределах генамишени (например, гена дистрофина).The deletion efficiency of the vectors disclosed in the present invention may be related to the size of the deletion, ie. the size of the segment deleted by the vectors. In certain embodiments, the length or size of certain deletions is determined by the distance between PAM sequences in the gene to be targeted (eg, the dystrophin gene). In certain embodiments, a specific deletion of a segment of the dystrophin gene, as defined in terms of its length and its containing sequence (e.g., exon 51), results from breaks adjacent to certain PAM sequences within the target gene (e.g., the dystrophin gene).

В определенных вариантах осуществления размер делеции составляет от приблизительно 50 пар оснований до приблизительно 2000 пар оснований (п.о.), например от приблизительно 50 п.о. до приблизительно 1999 п.о., от приблизительно 50 п.о. до приблизительно 1900 п.о., от приблизительно 50 п.о. до приблизительно 1800 п.о., от приблизительно 50 п.о. до приблизительно 1700 п.о., от приблизительно 50 п.о. до приблизительно 1650 п.о., от приблизительно 50 п.о. до приблизительно 1600 п.о., от приблизительно 50 п.о. до приблизительно 1500 п.о., от приблизительно 50 п.о. до приблизительно 1400 п.о., от приблизительно 50 п.о. до приблизительно 1300 п.о., от приблизительно 50 п.о. до приблизительно 1200 п.о., от приблизительно 50 п.о. до приблизительно 1150 п.о., от приблизительно 50 п.о. до приблизительно 1100 п.о., от приблизительно 50 п.о. до приблизительно 1000 п.о., от приблизительно 50 п.о. до приблизительно 900 п.о., от приблизительно 50 п.о. до приблизительно 850 п.о., от приблизительно 50 п.о. до приблизительно 800 п.о., от приблизительно 50 п.о. до приблизительно 750 п.о., от приблизительно 50 п.о. до приблизительно 700 п.о., от приблизительно 50 п.о. до приблизительно 600 п.о., от приблизительно 50 п.о. до приблизительно 500 п.о., от приблизительно 50 п.о. до приблизительно 400 п.о., от приблизительно 50 п.о. до приблизительно 350 п.о., от приблизительно 50 п.о. до приблизительно 300 п.о., от приблизительно 50 п.о. до приблизительно 250 п.о., от приблизительно 50 п.о. до приблизительно 200 п.о., от приблизительно 50 п.о. до приблизительно 150 п.о., от приблизительно 50 п.о. до приблизительно 100 п.о., от приблизительно 100 п.о. до приблизительно 1999 п.о., от приблизительно 100 п.о. до приблизительно 1900 п.о., от приблизительно 100 п.о. до приблизительно 1800 п.о., от приблизительно 100 п.о. до приблизительно 1700 п.о., от приблизительно 100 п.о. до приблизительно 1650 п.о., от приблизительно 100 п.о. до приблизительно 1600 п.о., от приблизительно 100 п.о. до приблизительно 1500 п.о., от приблизительно 100 п.о. до приблизительно 1400 п.о., от приблизительно 100 п.о. до приблизительно 1300 п.о., от приблизительно 100 п.о. до приблизительно 1200 п.о., от приблизительно 100 п.о. до приблизительно 1150 п.о., от приблизительно 100 п.о. до приблизительно 1100 п.о., от приблизительно 100 п.о. до приблизительно 1000 п.о., от приблизительно 100 п.о. до приблизительно 900 п.о., от приблизительно 100 п.о. до приблизительно 850 п.о., от приблизительно 100 п.о. до приблизительно 800 п.о., от приблизительно 100 п.о. до приблизительно 750 п.о., от приблизительно 100 п.о. до приблизительно 700 п.о., от приблизительно 100 п.о. до приблизительно 600 п.о., от приблизительно 100 п.о. до приблизительно 1000 п.о., от приблизительно 100 п.о. до приблизительно 400 п.о., от приблизительно 100 п.о. до приблизительно 350 п.о., от приблизительно 100 п.о. до приблизительно 300 п.о., от приблизительно 100 п.о. до приблизительно 250 п.о., от приблизительно 100 п.о. до приблизительно 200 п.о., от приблизительно 100 п.о. до приблизительно 150 п.о., от приблизительно 200 п.о. до приблизительно 1999 п.о., от приблизительно 200 п.о. до приблизительно 1900 п.о., от приблизительно 200 п.о. до приблизительно 1800 п.о., от приблизительно 200 п.о. до приблизительно 1700 п.о., от приблизительно 200 п.о. до приблизительно 1650 п.о., от приблизительно 200 п.о. до приблизительно 1600 п.о., от приблизительно 200 п.о. до приблизительно 1500 п.о., от приблизительно 200 п.о. до приблизительно 1400 п.о., от приблизительно 200 п.о. до приблизительно 1300 п.о., от приблизительно 200 п.о. до приблизительно 1200 п.о., от приблизительно 200 п.о. до приблизительно 1150 п.о., от приблизительно 200 п.о. до приблизительно 1100 п.о., от приблизительно 200 п.о. до приблизительно 1000 п.о., от приблизительно 200 п.о. до приблизительно 900 п.о., от приблизительно 200 п.о. до приблизительно 850 п.о., от приблизительно 200 п.о. до приблизительно 800 п.о., от приблизительно 200 п.о. до приблизительно 750 п.о., от приблизительно 200 п.о. до приблизительно 700 п.о., от приблизительно 200 п.о. до приблизительно 600 п.о., от приблизительно 200 п.о. до приблизительно 2000 п.о., от приблизительно 200 п.о. до приблизительно 400 п.о., от приблизительно 200 п.о. до приблизительно 350 п.о., от приблизительно 200 п.о. до приблизительно 300 п.о., от приблизительно 200 п.о. до приблизительно 250 п.о., от приблизительно 300 п.о. до приблизительно 1999 п.о., от приблизительно 300 п.о. до приблизительно 1900 п.о., от приблизительно 300 п.о. до приблизительно 1800 п.о., от приблизительно 300 п.о. до приблизительно 1700 п.о., от приблизительно 300 п.о. до приблизительно 1650 п.о., от приблизительно 300 п.о. до приблизительно 1600 п.о., от приблизительно 300 п.о. до приблизительно 1500 п.о., от приблизительно 300 п.о. до приблизительно 1400 п.о., от приблизительно 300 п.о. до приблизительно 1300 п.о., от приблизительно 300 п.о. до приблизительно 1200 п.о., от приблизительно 300 п.о. до приблизительно 1150 п.о., от приблизительно 300 п.о. до приблизительно 1100 п.о., от приблизительно 300 п.о. до приблизительно 1000 п.о., от приблизительно 300 п.о. до приблизительно 900 п.о., от приблиIn certain embodiments, the size of the deletion is from about 50 base pairs to about 2000 base pairs (bp), for example from about 50 bp. to about 1999 bp, from about 50 bp to about 1900 bp, from about 50 bp to about 1800 bp, from about 50 bp to about 1700 bp, from about 50 bp to about 1650 bp, from about 50 bp to about 1600 bp, from about 50 bp up to about 1500 bp, from about 50 bp to about 1400 bp, from about 50 bp to about 1300 bp, from about 50 bp to about 1200 bp, from about 50 bp to about 1150 bp, from about 50 bp to about 1100 bp, from about 50 bp up to about 1000 bp, from about 50 bp to about 900 bp, from about 50 bp to about 850 bp, from about 50 bp to about 800 bp, from about 50 bp up to about 750 bp, from about 50 bp up to about 700 bp, from about 50 bp to about 600 bp, from about 50 bp up to about 500 bp, from about 50 bp up to about 400 bp, from about 50 bp up to about 350 bp, from about 50 bp up to about 300 bp, from about 50 bp up to about 250 bp, from about 50 bp up to about 200 bp, from about 50 bp up to about 150 bp, from about 50 bp up to about 100 bp, from about 100 bp to about 1999 bp, from about 100 bp to about 1900 bp, from about 100 bp to about 1800 bp, from about 100 bp to about 1700 bp, from about 100 bp to about 1650 bp, from about 100 bp to about 1600 bp, from about 100 bp to about 1500 bp, from about 100 bp to about 1400 bp, from about 100 bp to about 1300 bp, from about 100 bp to about 1200 bp, from about 100 bp to about 1150 bp, from about 100 bp to about 1100 bp, from about 100 bp up to about 1000 bp, from about 100 bp to about 900 bp, from about 100 bp to about 850 bp, from about 100 bp to about 800 bp, from about 100 bp up to about 750 bp, from about 100 bp to about 700 bp, from about 100 bp up to about 600 bp, from about 100 bp up to about 1000 bp, from about 100 bp up to about 400 bp, from about 100 bp up to about 350 bp, from about 100 bp up to about 300 bp, from about 100 bp up to about 250 bp, from about 100 bp up to about 200 bp, from about 100 bp up to about 150 bp, from about 200 bp to about 1999 bp, from about 200 bp to about 1900 bp, from about 200 bp to about 1800 bp, from about 200 bp to about 1700 bp, from about 200 bp to about 1650 bp, from about 200 bp to about 1600 bp, from about 200 bp up to about 1500 bp, from about 200 bp to about 1400 bp, from about 200 bp to about 1300 bp, from about 200 bp to about 1200 bp, from about 200 bp to about 1150 bp, from about 200 bp to about 1100 bp, from about 200 bp up to about 1000 bp, from about 200 bp to about 900 bp, from about 200 bp to about 850 bp, from about 200 bp to about 800 bp, from about 200 bp up to about 750 bp, from about 200 bp up to about 700 bp, from about 200 bp up to about 600 bp, from about 200 bp up to about 2000 bp, from about 200 bp up to about 400 bp, from about 200 bp up to about 350 bp, from about 200 bp up to about 300 bp, from about 200 bp up to about 250 bp, from about 300 bp to about 1999 bp, from about 300 bp to about 1900 bp, from about 300 bp to about 1800 bp, from about 300 bp to about 1700 bp, from about 300 bp to about 1650 bp, from about 300 bp to about 1600 bp, from about 300 bp up to about 1500 bp, from about 300 bp to about 1400 bp, from about 300 bp to about 1300 bp, from about 300 bp to about 1200 bp, from about 300 bp to about 1150 bp, from about 300 bp to about 1100 bp, from about 300 bp up to about 1000 bp, from about 300 bp up to about 900 bp, from approx.

- 37 042798 зительно 300 п.о. до приблизительно 850 п.о., от приблизительно 300 п.о. до приблизительно 800 п.о., от приблизительно 300 п.о. до приблизительно 750 п.о., от приблизительно 300 п.о. до приблизительно 700 п.о., от приблизительно 300 п.о. до приблизительно 600 п.о., от приблизительно 300 п.о. до приблизительно 3000 п.о., от приблизительно 300 п.о. до приблизительно 400 п.о. или от приблизительно 300 п.о. до приблизительно 350 п.о. В определенных вариантах осуществления размер делеции может составлять приблизительно 118 п.о., приблизительно 233 п.о., приблизительно 326 п.о., приблизительно 766 п.о., приблизительно 805 п.о. или приблизительно 1611 п.о.- 37 042798 positively 300 b.p. to about 850 bp, from about 300 bp up to about 800 bp, from about 300 bp to about 750 bp, from about 300 bp up to about 700 bp, from about 300 bp up to about 600 bp, from about 300 bp up to about 3000 bp, from about 300 bp up to about 400 p. or from about 300 p. up to about 350 p. In certain embodiments, the size of the deletion may be about 118 bp, about 233 bp, about 326 bp, about 766 bp, about 805 bp. or approximately 1611 p.

4. Композиции для редактирования генома в мышце.4. Compositions for editing the genome in muscle.

Настоящее изобретение направлено на генетические конструкции (например, векторы) или их композицию для редактирования гена-мишени в скелетной мышце или сердечной мышце в геноме субъекта. Композиция включает в себя модифицированный вектор на основе AAV и нуклеотидную последовательность, кодирующую систему редактирования генов на основе CRISPR/Cas9, например молекулу gRNA и молекулу Cas9. Композиция доставляет активные формы системы редактирования генов на основе CRISPR/Cas9 в скелетную мышцу или сердечную мышцу. Раскрытые в настоящем изобретении генетические конструкции (например, векторы) могут применяться в коррекции или уменьшении эффектов мутаций в гене дистрофина, вовлеченном в генетические заболевания и/или другие состояния, связанные со скелетной мышцей или сердечной мышцей, например DMD. Композиция может дополнительно содержать донорную ДНК или трансген. Эти композиции могут применяться в редактировании генома, в конструировании генома и коррекции или уменьшении эффектов мутаций в генах, вовлеченных в генетические заболевания и/или другие состояния, связанные со скелетной мышцей или сердечной мышцей.The present invention is directed to genetic constructs (eg vectors) or composition thereof for editing a target gene in skeletal muscle or cardiac muscle in the genome of a subject. The composition includes a modified AAV-based vector and a nucleotide sequence encoding a CRISPR/Cas9-based gene editing system, such as a gRNA molecule and a Cas9 molecule. The composition delivers active forms of the CRISPR/Cas9 based gene editing system to skeletal muscle or cardiac muscle. The genetic constructs (eg, vectors) disclosed herein can be used to correct or reduce the effects of mutations in the dystrophin gene implicated in genetic diseases and/or other conditions associated with skeletal muscle or cardiac muscle, such as DMD. The composition may further comprise a donor DNA or a transgene. These compositions can be used in genome editing, in genome engineering, and in correcting or reducing the effects of mutations in genes involved in genetic diseases and/or other conditions associated with skeletal muscle or cardiac muscle.

a. Система редактирования генов на основе CRISPR/Cas9 для нацеливания на ген дистрофина.a. CRISPR/Cas9 based gene editing system for targeting the dystrophin gene.

В данном документе раскрыта система редактирования генов на основе CRISPR/Cas9, специфичная в отношении гена дистрофина. Система редактирования генов на основе CRISPR/Cas9 может включать в себя Cas9 и по меньшей мере одну gRNA для нацеливания на ген дистрофина. Система редактирования генов на основе CRISPR/Cas9 может связываться и распознавать целевую область. Целевые области можно выбирать непосредственно выше возможных стоп-кодонов за пределами рамки считывания, так что вставки или делеции во время процесса репарации восстанавливают рамку считывания дистрофина путем преобразования рамки считывания. Целевые области также могут представлять собой сайты акцепторов сплайсинга или сайты доноров сплайсинга, так что вставки или делеции во время процесса репарации нарушают сплайсинг и восстанавливают рамку считывания дистрофина с помощью разрушения сайта сплайсинга и исключения экзона. Целевые области также могут представлять собой аберрантные стоп-кодоны, так что вставки или делеции во время процесса репарации восстанавливают рамку считывания дистрофина, устраняя или разрушая стоп-кодон.This document discloses a CRISPR/Cas9 based gene editing system specific for the dystrophin gene. A CRISPR/Cas9 based gene editing system may include Cas9 and at least one gRNA to target the dystrophin gene. The CRISPR/Cas9 based gene editing system can bind and recognize the target region. Target regions can be chosen directly above possible out-of-frame stop codons so that insertions or deletions during the repair process restore the dystrophin's reading frame by in-frame transformation. The target regions can also be splice acceptor sites or splice donor sites such that insertions or deletions during the repair process disrupt splicing and restore the dystrophin reading frame by destroying the splice site and deleting the exon. The target regions can also be aberrant stop codons, so that insertions or deletions during the repair process restore the dystrophin reading frame, eliminating or destroying the stop codon.

gRNA может нацеливаться на нуклеотидную последовательность, выбранную из группы, состоящей из SEQ ID NO: 1-19, 41, 42, или комплементарную ей последовательность. Например, раскрытую систему редактирования генов на основе CRISPR/Cas9 конструировали с тем, чтобы опосредовать высокоэффективное редактирование генов в экзоне 51 гена дистрофина. Эта система редактирования генов на основе CRISPR/Cas9 восстанавливает экспрессию белка дистрофина в клетках пациентов с DMD. В некоторых вариантах осуществления композиция для нацеливания на ДНК содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 37, нуклеотидную последовательность, изложенную под SEQ ID NO: 38, нуклеотидную последовательность, изложенную под SEQ ID NO: 83 и/или нуклеотидную последовательность, изложенную под SEQ ID NO: 84. Например, композиция для нацеливания на ДНК включает нуклеотидную последовательность, изложенную под SEQ ID NO: 37, нуклеотидную последовательность, изложенную под SEQ ID NO: 38 и нуклеотидную последовательность, изложенную под SEQ ID NO: 83, или композиция для нацеливания на ДНК включает нуклеотидную последовательность, изложенную под SEQ ID NO: 37, нуклеотидную последовательность, изложенную под SEQ ID NO: 38 и нуклеотидную последовательность, изложенную под SEQ ID NO: 84.gRNA can target a nucleotide sequence selected from the group consisting of SEQ ID NOs: 1-19, 41, 42, or its complementary sequence. For example, the disclosed CRISPR/Cas9 based gene editing system was designed to mediate highly efficient gene editing in exon 51 of the dystrophin gene. This CRISPR/Cas9-based gene-editing system restores dystrophin protein expression in DMD patient cells. In some embodiments, the DNA targeting composition comprises the nucleotide sequence set forth under SEQ ID NO: 37, the nucleotide sequence set forth under SEQ ID NO: 38, the nucleotide sequence set forth under SEQ ID NO: 83, and/or the nucleotide sequence set forth under SEQ ID NO: 83, and/or the nucleotide sequence set forth under SEQ ID NO: 84. For example, a DNA targeting composition comprises the nucleotide sequence set forth under SEQ ID NO: 37, the nucleotide sequence set forth under SEQ ID NO: 38, and the nucleotide sequence set forth under SEQ ID NO: 83, or a composition for DNA targeting includes the nucleotide sequence set forth in SEQ ID NO: 37, the nucleotide sequence set forth in SEQ ID NO: 38, and the nucleotide sequence set forth in SEQ ID NO: 84.

b. Векторы на основе аденоассоциированного вируса.b. Vectors based on adeno-associated virus.

Композиция может также включать в себя вирусную систему доставки. В определенных вариантах осуществления вектор представляет собой вектор на основе аденоассоциированного вируса (AAV). Вектор на основе AAV представляет собой небольшой вирус, принадлежащий к роду Dependovirus семейства Parvoviridae, который инфицирует людей и некоторые другие виды приматов. Векторы на основе AAV можно использовать для доставки системы редактирования генов на основе CRISPR/Cas9 с применением различных конфигураций конструкции. Например, векторы на основе AAV могут доставлять кассеты экспрессии Cas9 и gRNA на отдельные векторы или на тот же вектор. Как альтернатива, если используются небольшие белки Cas9, полученные из таких видов как Staphylococcus aureus или Neisseria meningitidis, то и кассета экспрессии Cas9, и не менее двух кассет экспрессии gRNA могут быть объединены в одном векторе на основе AAV с пределом упаковки, составляющим 4,7 т.о.The composition may also include a viral delivery system. In certain embodiments, the vector is an adeno-associated virus (AAV) vector. The AAV-based vector is a small virus belonging to the Dependovirus genus of the Parvoviridae family that infects humans and some other primate species. AAV-based vectors can be used to deliver a CRISPR/Cas9-based gene editing system using various construct configurations. For example, AAV-based vectors can deliver Cas9 and gRNA expression cassettes on separate vectors or on the same vector. Alternatively, if small Cas9 proteins derived from species such as Staphylococcus aureus or Neisseria meningitidis are used, both the Cas9 expression cassette and at least two gRNA expression cassettes can be combined in a single AAV-based vector with a packing limit of 4.7 That.

В определенных вариантах осуществления вектор на основе AAV представляет собой модифицированный вектор на основе AAV. Модифицированный вектор на основе AAV может обладать повышенным тропизмом к сердечной и скелетной мышечным тканям. Модифицированный вектор на основе AAV может быть способен к доставке и экспрессировать систему редактирования генов на основеIn certain embodiments, the AAV-based vector is a modified AAV-based vector. The modified AAV-based vector may have increased tropism for cardiac and skeletal muscle tissues. A modified AAV-based vector may be capable of delivering and expressing a gene-editing system based on

- 38 042798- 38 042798

CRISPR/Cas9 в клетке млекопитающего. Например, модифицированный вектор на основе AAV может представлять собой вектор AAV-SASTG (Piacentino et al. (2012), Human Gene Therapy, 23: 635-646). Модифицированный вектор на основе AAV может доставлять нуклеазы в скелетную и сердечную мышцы in vivo. Модифицированный вектор на основе AAV может быть на основе одного или нескольких из ряда типов капсида, в том числе AAV1, AAV2, AAV5, AAV6, AAV8 и AAV9. Модифицированный вектор на основе AAV может быть на основе псевдотипа AAV2 с альтернативными тропными к мышцам капсидами AAV, таким как векторы AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5 и AAV/SASTG, которые эффективно трансдуцируют скелетную мышцу или сердечную мышцу путем системной и местной доставки (Seto et al., Current Gene Therapy (2012), 12: 139-151). Модифицированный вектор на основе AAV может представлять собой AAV2i8G9 (Shen et al., J. Biol. Chem. (2013), 288: 28814-28823). В некоторых вариантах осуществления композиция содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 39, и/или нуклеотидную последовательность, изложенную под SEQ ID NO: 40. В некоторых вариантах осуществления композиция включает в себя первый вектор, содержащий нуклеотидную последовательность, изложенную под SEQ ID NO: 39, и второй вектор, содержащий нуклеотидную последовательность, изложенную под SEQ ID NO: 40.CRISPR/Cas9 in a mammalian cell. For example, a modified AAV-based vector may be an AAV-SASTG vector (Piacentino et al. (2012), Human Gene Therapy, 23: 635-646). The modified AAV-based vector can deliver nucleases to skeletal and cardiac muscle in vivo. The modified AAV-based vector may be based on one or more of a number of capsid types, including AAV1, AAV2, AAV5, AAV6, AAV8 and AAV9. The modified AAV vector may be based on the AAV2 pseudotype with alternative AAV muscle tropic capsids such as the AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5 and AAV/SASTG vectors, which effectively transduce skeletal muscle or cardiac muscle by systemic and local delivery (Seto et al., Current Gene Therapy (2012), 12: 139-151). The modified AAV vector may be AAV2i8G9 (Shen et al., J. Biol. Chem. (2013) 288: 28814-28823). In some embodiments, the composition comprises the nucleotide sequence set forth under SEQ ID NO: 39 and/or the nucleotide sequence set forth under SEQ ID NO: 40. In some embodiments, the composition includes a first vector containing the nucleotide sequence set forth under SEQ ID NO: 39, and a second vector containing the nucleotide sequence set forth under SEQ ID NO: 40.

5. Способы редактирования генома в мышце.5. Methods for editing the genome in muscle.

Настоящее изобретение направлено на способ редактирования генома в скелетной мышце или сердечной мышце субъекта. Способ предусматривает введение в скелетную мышцу или сердечную мышцу субъекта композиции для редактирования генома в скелетной мышце или сердечной мышце, как описано выше. Редактирование генома может предусматривать коррекцию мутантного гена или вставку трансгена. Коррекция мутантного гена может предусматривать удаление, перестройку или замену мутантного гена. Коррекция мутантного гена может включать опосредованный нуклеазой NHEJ или HDR.The present invention is directed to a method for editing the genome in the skeletal muscle or cardiac muscle of a subject. The method involves administering to the skeletal muscle or cardiac muscle of a subject a genome editing composition in skeletal muscle or cardiac muscle as described above. Genome editing may involve editing a mutant gene or inserting a transgene. Correction of the mutant gene may involve the removal, rearrangement or replacement of the mutant gene. Correction of the mutant gene may include nuclease-mediated NHEJ or HDR.

6. Способы коррекции мутантного гена и лечения субъекта.6. Methods for correcting a mutant gene and treating a subject.

Раскрытый в настоящем изобретении объект изобретения также предусматривает способы коррекции мутантного гена (например, мутантного гена дистрофина, например мутантного гена дистрофина человека) в клетке и лечение субъекта, страдающего от генетического заболевания, такого как DMD. Способ может предусматривать введение в клетку или субъекту генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции, как описано выше. Способ может предусматривать введение в скелетную мышцу или сердечную мышцу субъекта генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции для редактирования генома в скелетной мышце или сердечной мышце, как описано выше. Применение генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции для доставки системы редактирования генов на основе CRISPR/Cas9 в скелетную мышцу или сердечную мышцу может восстанавливать экспрессию полнофункционального или частично функционального белка с использованием матрицы репарации или донорной ДНК, которая может заменить весь ген или область, содержащую мутацию. Система редактирования генов на основе CRISPR/Cas9 может использоваться для введения сайт-специфических двухнитевых разрывов в целевые геномные локусы. Сайт-специфичные двухнитевые разрывы создаются тогда, когда система редактирования генов на основе CRISPR/Cas9 связывается с последовательностями целевой ДНК, обеспечивая тем самым возможность расщепления целевой ДНК. Такое расщепление ДНК может стимулировать естественный механизм репарации ДНК, сводящийся к одному из двух возможных путей репарации: репарации с участием гомологичной рекомбинации (HDR) или негомологичного соединения концов (NHEJ).The subject matter disclosed herein also provides methods for correcting a mutant gene (eg, a mutant dystrophin gene, eg, a mutant human dystrophin gene) in a cell, and treating a subject suffering from a genetic disease such as DMD. The method may involve introducing into a cell or subject a genetic construct (eg, a vector) disclosed in the present invention, or a composition containing it, as described above. The method may include introducing into the subject's skeletal muscle or cardiac muscle a genetic construct (e.g., a vector) disclosed in the present invention, or a composition containing it, to edit the genome in skeletal muscle or cardiac muscle, as described above. The use of a genetic construct (e.g., a vector) disclosed in the present invention, or a composition containing it, to deliver a CRISPR/Cas9-based gene editing system to skeletal muscle or cardiac muscle can restore the expression of a fully functional or partially functional protein using a repair template or donor DNA, which can replace the entire gene or region containing the mutation. A CRISPR/Cas9 based gene editing system can be used to introduce site-specific double-strand breaks at target genomic loci. Site-specific double-strand breaks are created when the CRISPR/Cas9-based gene editing system binds to target DNA sequences, thereby allowing the target DNA to be cleaved. Such DNA cleavage can stimulate the natural mechanism of DNA repair, which is reduced to one of two possible repair pathways: repair involving homologous recombination (HDR) or non-homologous end joining (NHEJ).

Настоящее изобретение направлено на редактирование генома с использованием системы редактирования генов на основе CRISPR/Cas9 без матрицы репарации, которая может эффективно корректировать рамку считывания и восстанавливать экспрессию функционального белка, вовлеченного в генетическое заболевание. Раскрытые системы редактирования генов на основе CRISPR/Cas9 могут предусматривать использование подходов коррекции на основе репарации с участием гомологичной рекомбинации или опосредованного нуклеазой негомологичного соединения концов (NHEJ), что обеспечивает возможность эффективной коррекции в линиях первичных клеток с ограниченной пролиферацией, которые могут не поддаваться гомологичной рекомбинации или генной коррекции на основе отбора. Эта стратегия объединяет быструю и надежную сборку активных систем редактирования генов на основе CRISPR/Cas9 с эффективным способом редактирования генов для лечения генетических заболеваний, вызванных мутациями в несущественных кодирующих областях, которые являются причиной сдвига рамки, преждевременных стоп-кодонов, аберрантных сайтов доноров сплайсинга или аберрантных сайтов акцепторов сплайсинга.The present invention is directed to genome editing using a CRISPR/Cas9 based gene editing system without a repair template that can effectively correct the reading frame and restore the expression of a functional protein involved in a genetic disease. The disclosed CRISPR/Cas9-based gene editing systems can utilize repair-based repair approaches involving homologous recombination or nuclease-mediated non-homologous end joining (NHEJ), which allows efficient correction in proliferation-limited primary cell lines that may not be amenable to homologous recombination. or gene correction based on selection. This strategy combines the fast and reliable assembly of CRISPR/Cas9-based active gene editing systems with an efficient gene editing method for treating genetic diseases caused by mutations in non-essential coding regions that cause frameshifts, premature stop codons, aberrant splice donor sites, or aberrant splicing acceptor sites.

a. Опосредованное нуклеазой негомологичное соединение концов.a. Nuclease-mediated non-homologous end joining.

Восстановление экспрессии белка из эндогенного мутированного гена может проводиться путем NHEJ-опосредованной репарации ДНК без участия матрицы. В отличие от временного способа нацеливания на РНК гена-мишени коррекция рамки считывания гена-мишени в геноме с помощью временно экспрессируемой системы редактирования генов на основе CRISPR/Cas9 может приводить к полному восстановлению экспрессии целевого гена каждой модифицированной клеткой и во всем ее потомстве. В определенных вариантах осуществления NHEJ представляет собой опосредованный нуклеазой NHEJ,Restoration of protein expression from an endogenous mutated gene can be carried out by NHEJ-mediated DNA repair without template involvement. In contrast to the temporal method of targeting the target gene to RNA, the correction of the target gene reading frame in the genome using a transiently expressed CRISPR/Cas9-based gene editing system can lead to a complete restoration of the expression of the target gene in each modified cell and in all its progeny. In certain embodiments, the NHEJ is nuclease-mediated NHEJ,

- 39 042798 который в определенных вариантах осуществления относится к NHEJ, инициируемому молекулой Cas9, которая разрезает двухнитевую ДНК. Способ предусматривает введение генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции в скелетную мышцу или сердечную мышцу субъекта для редактирования генома в скелетной мышце или сердечной мышце.- 39 042798 which in certain embodiments refers to NHEJ initiated by a Cas9 molecule that cuts double stranded DNA. The method involves introducing a genetic construct (eg, a vector) disclosed in the present invention, or compositions containing it, into the skeletal muscle or cardiac muscle of a subject to edit the genome in the skeletal muscle or cardiac muscle.

Коррекция гена с помощью опосредованного нуклеазой NHEJ может исправлять мутированный ген-мишень и предлагает несколько потенциальных преимуществ над путем HDR. Например, для NHEJ не требуется донорная матрица, которая может вызывать неспецифический инсерционный мутагенез. В отличие от HDR, NHEJ эффективно работает на всех стадиях клеточного цикла и поэтому может эффективно использоваться как в делящихся, так и в постмитотических клетках, таких как мышечные волокна. Это обеспечивает надежное, полное восстановление гена, являющееся альтернативой пропуску экзонов на основе олигонуклеотидов или фармакологически инициируемому сквозному прохождению стопкодонов, и теоретически могла бы требоваться обработка всего лишь одним лекарственным средством. Коррекцию гена на основе NHEJ с использованием системы редактирования генов на основе CRISPR/Cas9, а также других сконструированных нуклеаз, включая мегануклеазы и нуклеазы типа цинковые пальцы, можно комбинировать с другими существующими платформами ex vivo и in vivo для клеточной и генной видов терапии в дополнение к описанному в данном документе способу электропорации плазмид. Например, доставка системы редактирования генов на основе CRISPR/Cas9 путем переноса генов на основе mRNA или в виде очищенных белков, способных проникать в клетку, может обеспечить возможность использования подхода к редактированию генома без ДНК, что позволит избегать любой возможности инсерционного мутагенеза.Gene repair with nuclease-mediated NHEJ can correct a mutated target gene and offers several potential advantages over the HDR pathway. For example, NHEJ does not require a donor template that can cause non-specific insertional mutagenesis. Unlike HDR, NHEJ is effective at all stages of the cell cycle and can therefore be used effectively in both dividing and post-mitotic cells such as muscle fibers. This provides a robust, complete gene repair alternative to oligonucleotide-based exon skipping or pharmacologically initiated stop codon passthrough, and theoretically only one drug treatment would be required. NHEJ-based gene editing using the CRISPR/Cas9-based gene editing system, as well as other engineered nucleases, including meganucleases and zinc finger nucleases, can be combined with other existing ex vivo and in vivo platforms for cell and gene therapies in addition to described in this document, the method of electroporation of plasmids. For example, delivery of a CRISPR/Cas9-based gene editing system by mRNA-based gene transfer or as purified proteins capable of entering the cell may allow a DNA-free genome editing approach to be used, thus avoiding any possibility of insertional mutagenesis.

b. Репарация с участием гомологичной рекомбинации.b. Repair involving homologous recombination.

Восстановление экспрессии белка из эндогенного мутированного гена может предусматривать репарацию с участием гомологичной рекомбинации. Вышеописанный способ дополнительно предусматривает введение донорной матрицы в клетку. Донорная матрица может включать в себя нуклеотидную последовательность, кодирующую полнофункциональный белок или частично функциональный белок. Например, донорная матрица может включать в себя конструкцию дистрофина с уменьшенным размером, называемую минидистрофином (минидис), полнофункциональную конструкцию дистрофина для восстановления мутантного гена дистрофина или фрагмент гена дистрофина, который после гомологичной репарации приводит к восстановлению мутантного гена дистрофина.Restoration of protein expression from an endogenous mutated gene may involve repair involving homologous recombination. The above method further involves introducing a donor matrix into the cell. The donor matrix may include a nucleotide sequence encoding a fully functional protein or a partially functional protein. For example, the donor template may include a reduced size dystrophin construct called a minidystrophin (minidis), a fully functional dystrophin construct to repair a mutant dystrophin gene, or a fragment of a dystrophin gene that, after homologous repair, results in the restoration of a mutant dystrophin gene.

c. Способы коррекции мутантного гена и лечения субъекта с применением CRISPR/Cas9.c. Methods for correcting a mutant gene and treating a subject using CRISPR/Cas9.

Настоящее изобретение также направлено на редактирование генома с помощью системы редактирования генов на основе CRISPR/Cas9 для восстановления экспрессии полнофункционального или частично функционального белка с использованием матрицы репарации или донорной ДНК, которая может заменить весь ген или область, содержащую мутацию. Система редактирования генов на основе CRISPR/Cas9 может использоваться для введения сайт-специфических двухнитевых разрывов в целевые геномные локусы. Сайт-специфичные двухнитевые разрывы создаются тогда, когда система редактирования генов на основе CRISPR/Cas9 связывается с последовательностями целевой ДНК с помощью gRNA, обеспечивая тем самым возможность расщепления целевой ДНК. Система редактирования генов на основе CRISPR/Cas9 обладает преимуществом в отношении усовершенствованного редактирования генома из-за их высокого уровня успешной и эффективной генетической модификации. Такое расщепление ДНК может стимулировать естественный механизм репарации ДНК, сводящийся к одному из двух возможных путей репарации: репарации с участием гомологичной рекомбинации (HDR) или негомологичного соединения концов (NHEJ). Например, система редактирования генов на основе CRISPR/Cas9, направленная на ген дистрофина, может включать в себя gRNA, содержащую последовательность нуклеиновой кислоты под любой из SEQ ID NO: 1-19, 41, 42 или комплементарную ей последовательность.The present invention is also directed to genome editing with a CRISPR/Cas9 based gene editing system to restore the expression of a fully functional or partially functional protein using a repair template or donor DNA that can replace the entire gene or region containing the mutation. A CRISPR/Cas9 based gene editing system can be used to introduce site-specific double-strand breaks at target genomic loci. Site-specific double-strand breaks are created when the CRISPR/Cas9-based gene editing system binds to target DNA sequences with gRNA, thereby allowing the target DNA to be cleaved. The CRISPR/Cas9 based gene editing system has the advantage of advanced genome editing due to their high rate of successful and efficient genetic modification. Such DNA cleavage can stimulate the natural mechanism of DNA repair, which is reduced to one of two possible repair pathways: repair involving homologous recombination (HDR) or non-homologous end joining (NHEJ). For example, a CRISPR/Cas9 based gene editing system targeting a dystrophin gene may include a gRNA containing the nucleic acid sequence of any of SEQ ID NOs: 1-19, 41, 42 or its complementary sequence.

Настоящее изобретение направлено на редактирование генома с использованием системы редактирования генов на основе CRISPR/Cas9 без матрицы репарации, которая может эффективно корректировать рамку считывания и восстанавливать экспрессию функционального белка, вовлеченного в генетическое заболевание. Раскрытая система редактирования генов на основе CRISPR/Cas9 может предусматривать использование подходов с коррекцией на основе репарации с участием гомологичной рекомбинации или опосредованного нуклеазой негомологичного соединения концов (NHEJ), что обеспечивает возможность эффективной коррекции в линиях первичных клеток с ограниченной пролиферацией, которые могут не поддаваться гомологичной рекомбинации или генной коррекции на основе отбора. Эта стратегия объединяет быструю и надежную сборку активной системы редактирования генов на основе CRISPR/Cas9 с эффективным способом редактирования генов для лечения генетических заболеваний, вызванных мутациями в несущественных кодирующих областях, которые являются причиной сдвига рамки, преждевременных стоп-кодонов, аберрантных сайтов доноров сплайсинга или аберрантных сайтов акцепторов сплайсинга.The present invention is directed to genome editing using a CRISPR/Cas9 based gene editing system without a repair template that can effectively correct the reading frame and restore the expression of a functional protein involved in a genetic disease. The disclosed CRISPR/Cas9-based gene editing system can utilize repair-based repair approaches involving homologous recombination or nuclease-mediated non-homologous end joining (NHEJ), which allows efficient correction in primary cell lines with limited proliferation that may not be amenable to homologous recombination. recombination or gene correction based on selection. This strategy combines the fast and reliable assembly of a CRISPR/Cas9-based active gene editing system with an efficient gene editing method for treating genetic diseases caused by mutations in non-essential coding regions that cause frameshifts, premature stop codons, aberrant splicing donor sites, or aberrant splicing acceptor sites.

Настоящее изобретение предусматривает способы коррекции мутантного гена в клетке и лечения субъекта, страдающего от генетического заболевания, такого как DMD. Способ может предусматривать введение в клетку или субъекту системы редактирования генов на основе CRISPR/Cas9, полинуклеотидаThe present invention provides methods for correcting a mutated gene in a cell and treating a subject suffering from a genetic disorder such as DMD. The method may involve introducing into a cell or subject a CRISPR/Cas9 based gene editing system, a polynucleotide

- 40 042798 или вектора, кодирующего указанную систему редактирования генов на основе CRISPR/Cas9, или композиции, содержащей указанную систему редактирования генов на основе CRISPR/Cas9, как описано выше. Способ может предусматривать введение системы редактирования генов на основе CRISPR/Cas9, как например, введение белка Cas9 или слитого белка Cas9, содержащего второй домен, обладающий нуклеазной активностью, нуклеотидной последовательности, кодирующей указанный белок Cas9 или слитый белок Cas9, и/или по меньшей мере одной gRNA, где gRNA нацеливаются на различные последовательности ДНК. Целевые последовательности ДНК могут быть перекрывающимися. Количество gRNA, вводимой в клетку, может составлять по меньшей мере 1 gRNA, по меньшей мере 2 разные gRNA, по меньшей мере 3 разные gRNA, по меньшей мере 4 разные gRNA, по меньшей мере 5 разных gRNA, по меньшей мере 6 разных gRNA, по меньшей мере 7 разных gRNA, по меньшей мере 8 разных gRNA, по меньшей мере 9 разных gRNA, по меньшей мере 10 разных gRNA, по меньшей мере 15 разных gRNA, по меньшей мере 20 разных gRNA, по меньшей мере 30 разных gRNA или по меньшей мере 50 разных gRNA, описанных выше. gRNA может включать в себя последовательность нуклеиновой кислоты по меньшей мере одной из SEQ ID NO: 1-19, 41, 42 или комплементарную ей последовательность. Способ может предусматривать репарацию с участием гомологичной рекомбинации или негомологичное соединение концов.- 40 042798 or a vector encoding said CRISPR/Cas9 based gene editing system or a composition containing said CRISPR/Cas9 based gene editing system as described above. The method may include introducing a CRISPR/Cas9-based gene editing system, such as introducing a Cas9 protein or a Cas9 fusion protein containing a second domain having nuclease activity, a nucleotide sequence encoding said Cas9 protein or a Cas9 fusion protein, and/or at least one gRNA, where the gRNAs target different DNA sequences. Target DNA sequences may be overlapping. The amount of gRNA introduced into the cell may be at least 1 gRNA, at least 2 different gRNAs, at least 3 different gRNAs, at least 4 different gRNAs, at least 5 different gRNAs, at least 6 different gRNAs, at least 7 different gRNAs, at least 8 different gRNAs, at least 9 different gRNAs, at least 10 different gRNAs, at least 15 different gRNAs, at least 20 different gRNAs, at least 30 different gRNAs, or at least 50 different gRNAs described above. The gRNA may include the nucleic acid sequence of at least one of SEQ ID NOs: 1-19, 41, 42, or its complementary sequence. The method may involve repair involving homologous recombination or non-homologous end joining.

7. Способы лечения заболевания.7. Ways to treat the disease.

Настоящее изобретение направлено на способ лечения заболевания у субъекта, нуждающегося в этом. Способ предусматривает введение в ткань или субъекту генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции, как описано выше. В определенных вариантах осуществления способ может предусматривать введение в скелетную мышцу или сердечную мышцу субъекта генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции, как описано выше. В определенных вариантах осуществления способ может предусматривать введение в вену субъекта генетической конструкции (например, вектора), раскрытой в настоящем изобретении, или содержащей ее композиции, как описано выше. В определенных вариантах осуществления субъект страдает от состояния, связанного со скелетной мышцей или сердечной мышцей, вызывающих дегенерацию, или слабость, или генетическое заболевание. Например, субъект может страдать от мышечной дистрофии Дюшенна, как описано выше.The present invention is directed to a method of treating a disease in a subject in need thereof. The method involves introducing into a tissue or subject a genetic construct (eg, a vector) disclosed in the present invention, or a composition containing it, as described above. In certain embodiments, the implementation of the method may include introducing into the skeletal muscle or cardiac muscle of the subject of the genetic construct (eg, vector) disclosed in the present invention, or a composition containing it, as described above. In certain embodiments, the implementation of the method may include the introduction into the vein of the subject of a genetic construct (eg, vector) disclosed in the present invention, or a composition containing it, as described above. In certain embodiments, the subject suffers from a skeletal muscle or cardiac muscle condition causing degeneration or weakness or a genetic disease. For example, the subject may be suffering from Duchenne muscular dystrophy, as described above.

a. Мышечная дистрофия Дюшенна.a. Duchenne muscular dystrophy.

Как описано выше, способ можно применять для коррекции гена дистрофина и удаления полнофункциональной или частично функциональной экспрессии белка указанного мутированного гена дистрофина. В некоторых аспектах и вариантах осуществления изобретение предусматривает способ уменьшения эффектов (например, клинических симптомов/признаков) DMD у пациента. В некоторых аспектах и вариантах осуществления изобретение предусматривает способ лечения DMD у пациента. В некоторых аспектах и вариантах осуществления изобретение предусматривает способ предупреждения DMD у пациента. В некоторых аспектах и вариантах осуществления изобретение предусматривает способ предупреждения дальнейшего прогрессирования DMD у пациента.As described above, the method can be used to correct the dystrophin gene and remove fully functional or partially functional protein expression of said mutated dystrophin gene. In some aspects and embodiments, the invention provides a method for reducing the effects (eg, clinical symptoms/signs) of DMD in a patient. In some aspects and embodiments, the invention provides a method for treating DMD in a patient. In some aspects and embodiments, the invention provides a method for preventing DMD in a patient. In some aspects and embodiments, the invention provides a method for preventing further progression of DMD in a patient.

8. Способы получения трансгенного грызуна с Δ52 hDMD.8. Methods for obtaining a transgenic rodent with Δ52 hDMD.

Настоящее изобретение относится к способу получения трансгенного эмбриона грызуна, у которого имеется ген дистрофина человека с делецией экзона 52. Способ предусматривает введение эмбриону грызуна gRNA, за счет чего обеспечивается делеция экзона 52 из гена дистрофина человека, и отбор трансгенного эмбриона грызуна, у которого имеется делеция экзона 52 гена дистрофина человека, где эмбрион грызуна содержит нормальный ген дистрофина человека. В некоторых вариантах осуществления эмбрион грызуна представляет собой эмбрион мыши. В некоторых вариантах осуществления трансгенный эмбрион грызуна является гетерозиготным hDMD или гетерозиготным hDMD-Δ52. В некоторых вариантах осуществления первую молекулу gRNA, содержащую нацеливающий домен, который включает в себя нуклеотидную последовательность, изложенную под SEQ ID NO: 41, и вторую молекулу gRNA, содержащую нацеливающий домен, который включает в себя нуклеотидную последовательность, изложенную под SEQ ID NO: 42, вводят в эмбрион грызуна для осуществления делеции экзона 52 гена дистрофина человека. В некоторых вариантах осуществления способ дополнительно включает введение в эмбрион грызуна белка Cas, содержащего аминокислотную последовательность, изложенную под SEQ ID NO: 27. Настоящее изобретение направлено на трансгенный эмбрион грызуна, который получают с помощью данного способа. Настоящее изобретение также относится к трансгенному грызуну, полученному из трансгенного эмбриона грызуна.The present invention relates to a method for obtaining a transgenic rodent embryo that has a human dystrophin gene with a deletion of exon 52. The method involves injecting a gRNA into a rodent embryo, thereby providing a deletion of exon 52 from the human dystrophin gene, and selecting a transgenic rodent embryo that has a deletion exon 52 of the human dystrophin gene, where the rodent embryo contains the normal human dystrophin gene. In some embodiments, the rodent embryo is a mouse embryo. In some embodiments, the transgenic rodent embryo is heterozygous hDMD or heterozygous hDMD-Δ52. In some embodiments, a first gRNA molecule containing a targeting domain that includes the nucleotide sequence set forth under SEQ ID NO: 41 and a second gRNA molecule containing a targeting domain that includes the nucleotide sequence set forth under SEQ ID NO: 42 , is introduced into a rodent embryo to carry out the deletion of exon 52 of the human dystrophin gene. In some embodiments, the method further comprises administering to the rodent embryo a Cas protein comprising the amino acid sequence set forth in SEQ ID NO: 27. The present invention is directed to a transgenic rodent embryo that is produced by the method. The present invention also relates to a transgenic rodent derived from a transgenic rodent embryo.

9. Конструкции и плазмиды.9. Constructs and plasmids.

Вышеописанные композиции могут содержать генетические конструкции, которые кодируют систему редактирования генов на основе CRISPR/Cas9, как раскрыто в данном документе. Генетическая конструкция, такая как плазмида, может содержать нуклеиновую кислоту, которая кодирует систему редактирования генов на основе CRISPR/Cas9, такую как белок Cas9 и слитые белки Cas9 и/или по меньшей мере одну из gRNA. Вышеописанные композиции могут содержать генетические конструкции, которые кодируют модифицированный вектор на основе AAV и последовательность нуклеиновой кислоты,The compositions described above may contain genetic constructs that encode a CRISPR/Cas9 based gene editing system as disclosed herein. The genetic construct, such as a plasmid, may contain a nucleic acid that encodes a CRISPR/Cas9 based gene editing system, such as a Cas9 protein and Cas9 fusion proteins and/or at least one of the gRNAs. The above compositions may contain genetic constructs that encode a modified AAV-based vector and a nucleic acid sequence,

- 41 042798 которая кодирует систему редактирования генов на основе CRISPR/Cas9, как раскрыто в данном документе. Генетическая конструкция, такая как плазмида, может содержать нуклеиновую кислоту, которая кодирует систему редактирования генов на основе CRISPR/Cas9. Вышеописанные композиции могут содержать генетические конструкции, которые кодируют модифицированный лентивирусный вектор, раскрытый в данном документе.- 41 042798 which encodes a CRISPR/Cas9 based gene editing system as disclosed herein. The genetic construct, such as a plasmid, may contain a nucleic acid that encodes a CRISPR/Cas9 based gene editing system. The compositions described above may contain genetic constructs that encode the modified lentiviral vector disclosed herein.

Генетическая конструкция, такая как рекомбинантная плазмида или рекомбинантная вирусная частица, может содержать нуклеиновую кислоту, которая кодирует слитый белок Cas9, и по меньшей мере одну gRNA. В некоторых вариантах осуществления генетическая конструкция может содержать нуклеиновую кислоту, которая кодирует слитый белок Cas9 и по меньшей мере две различные gRNA. В некоторых вариантах осуществления генетическая конструкция может содержать нуклеиновую кислоту, которая кодирует слитый белок Cas9 и более двух различных gRNA. В некоторых вариантах осуществления генетическая конструкция может содержать промотор, который функционально связан с нуклеотидной последовательностью, кодирующей по меньшей мере одну молекулу gRNA и/или молекулу Cas9. В некоторых вариантах осуществления промотор функционально связан с нуклеотидной последовательностью, кодирующей первую молекулу gRNA, вторую молекулу gRNA и/или молекулу Cas9. Генетическая конструкция может присутствовать в клетке в виде функционирующей внехромосомной молекулы. Генетическая конструкция может представлять собой линейную минихромосому, включающую в себя центромеру, теломеры или плазмиды или космиды.The genetic construct, such as a recombinant plasmid or recombinant viral particle, may contain a nucleic acid that encodes a Cas9 fusion protein and at least one gRNA. In some embodiments, the genetic construct may comprise a nucleic acid that encodes a Cas9 fusion protein and at least two different gRNAs. In some embodiments, the genetic construct may comprise a nucleic acid that encodes a Cas9 fusion protein and more than two different gRNAs. In some embodiments, the genetic construct may comprise a promoter that is operably linked to a nucleotide sequence encoding at least one gRNA molecule and/or a Cas9 molecule. In some embodiments, the promoter is operably linked to a nucleotide sequence encoding a first gRNA molecule, a second gRNA molecule, and/or a Cas9 molecule. The genetic construct may be present in the cell as a functioning extrachromosomal molecule. The genetic construct may be a linear minichromosome including a centromere, telomeres, or plasmids or cosmids.

Генетическая конструкция также может представлять собой часть генома рекомбинантного вирусного вектора, в том числе рекомбинантного лентивируса, рекомбинантного аденовируса и рекомбинантного аденоассоциированного вируса. Генетическая конструкция может представлять собой генетического материала в аттенуированных живых микроорганизмах или рекомбинантных микробных векторах, которые заселяют клетки. Генетические конструкции могут содержать регуляторные элементы для экспрессии генов кодирующих последовательностей нуклеиновой кислоты. Регуляторные элементы могут представлять собой промотор, энхансер, инициирующий кодон, стоп-кодон или сигнал полиаденилирования.The genetic construct may also be part of the genome of a recombinant viral vector, including recombinant lentivirus, recombinant adenovirus, and recombinant adeno-associated virus. The genetic construct may be the genetic material in attenuated live microorganisms or recombinant microbial vectors that colonize cells. Genetic constructs may contain regulatory elements for the expression of genes encoding nucleic acid sequences. The regulatory elements may be a promoter, enhancer, start codon, stop codon, or polyadenylation signal.

В определенных вариантах осуществления генетическая конструкция представляет собой вектор. Вектор может представлять собой вектор на основе аденоассоциированного вируса (AAV), который кодирует по меньшей мере одну молекулу Cas9 и по меньшей мере одну молекулу gRNA; при этом вектор способен экспрессировать по меньшей мере одну молекулу Cas9 и по меньшей мере молекулу gRNA в клетке млекопитающего. Вектор может представлять собой плазмиду. Векторы можно применять для генной терапии in vivo. Вектор может являться рекомбинантным. Вектор может содержать гетерологичную нуклеиновую кислоту, кодирующую слитый белок, такой как слитый белок Cas9 или система редактирования генов на основе CRISPR/Cas9. Вектор может представлять собой плазмиду. Вектор может быть применим для трансфекции клеток нуклеиновой кислотой, кодирующей слитый белок Cas9 или систему редактирования генов на основе CRISPR/Cas9, при этом трансформированную клетку-хозяина культивируют и поддерживают в условиях, при которых происходит экспрессия слитого белка Cas9 или системы редактирования генов на основе CRISPR/Cas9.In certain embodiments, the genetic construct is a vector. The vector may be an adeno-associated virus (AAV) vector that encodes at least one Cas9 molecule and at least one gRNA molecule; wherein the vector is capable of expressing at least one Cas9 molecule and at least one gRNA molecule in a mammalian cell. The vector may be a plasmid. Vectors can be used for in vivo gene therapy. The vector may be recombinant. The vector may contain a heterologous nucleic acid encoding a fusion protein, such as a Cas9 fusion protein or a CRISPR/Cas9 based gene editing system. The vector may be a plasmid. The vector can be used to transfect cells with a nucleic acid encoding a Cas9 fusion protein or a CRISPR/Cas9 gene editing system, wherein the transformed host cell is cultured and maintained under conditions that express the Cas9 fusion protein or CRISPR based gene editing system. /Cas9.

Кодирующие последовательности могут быть оптимизированы для стабильности и высоких уровней экспрессии. В некоторых случаях кодоны выбирают для уменьшения образования вторичной структуры РНК, такой как структура, образовавшаяся вследствие внутримолекулярного связывания.Coding sequences can be optimized for stability and high levels of expression. In some cases, codons are chosen to reduce the formation of an RNA secondary structure, such as a structure formed due to intramolecular binding.

Вектор может содержать гетерологичную нуклеиновую кислоту, кодирующую систему редактирования генов на основе CRISPR/Cas9, и может дополнительно содержать инициирующий кодон, который может располагаться выше кодирующей последовательности системы редактирования генов на основе CRISPR/Cas9, а также стоп-кодон, который может располагаться ниже кодирующей последовательности системы редактирования генов на основе CRISPR/Cas9. Инициирующий кодон и кодон терминации могут находиться в рамке с кодирующей последовательностью системы редактирования генов на основе CRISPR/Cas9. Вектор также может содержать промотор, который функционально связан с кодирующей последовательностью системы редактирования генов на основе CRISPR/Cas9. Промотор, который функционально связан с кодирующей последовательностью системы редактирования генов на основе CRISPR/Cas9, может представлять собой промотор из вируса обезьяны 40 (SV40), промотор вируса опухоли молочной железы мыши (MMTV), промотор вируса иммунодефицита человека (HIV), такой как промотор длинного концевого повтора (LTR) вируса иммунодефицита крупного рогатого скота (BIV), промотор вируса Молони, промотор вируса птичьего лейкоза (ALV), промотор цитомегаловируса (CMV), такой как промотор гена немедленного раннего ответа CMV, промотор вируса Эпштейна-Барр (EBV), промотор U6, такой как промотор U6 человека, или промотор вируса саркомы Рауса (RSV). Промотор также может представлять собой промотор из гена человека, такого как ген убиквитина C человека (hUbC), актина человека, миозина человека, гемоглобина человека, креатина мышц человека или металлотионеина человека. Промотор также может представлять собой тканеспецифичный промотор, такой как промотор, специфичный в отношении мышц или кожи, природный или синтетический. Примеры таких промоторов описаны в публикациях патентных заявок США № US 2004/0175727 и US 2004/0192593, содержание которых включено в данный документ во всей своей полноте. Примеры промоторов, специThe vector may contain a heterologous nucleic acid encoding a CRISPR/Cas9 gene editing system and may further contain a start codon that may be upstream of the CRISPR/Cas9 gene editing system coding sequence, as well as a stop codon that may be downstream of the coding gene editing system sequences based on CRISPR/Cas9. The start codon and the termination codon may be in frame with the coding sequence of a CRISPR/Cas9 based gene editing system. The vector may also contain a promoter that is operably linked to the coding sequence of a CRISPR/Cas9 based gene editing system. The promoter that is operably linked to the coding sequence of the CRISPR/Cas9 gene editing system can be the simian virus 40 (SV40) promoter, the mouse mammary tumor virus (MMTV) promoter, the human immunodeficiency virus (HIV) promoter, such as the bovine immunodeficiency virus (BIV) long terminal repeat (LTR), Moloney virus promoter, avian leukemia virus (ALV) promoter, cytomegalovirus (CMV) promoter such as CMV immediate early response gene promoter, Epstein-Barr virus (EBV) promoter , a U6 promoter such as the human U6 promoter or the Rous sarcoma virus (RSV) promoter. The promoter can also be a promoter from a human gene such as human ubiquitin C (hUbC), human actin, human myosin, human hemoglobin, human muscle creatine, or human metallothionein. The promoter may also be a tissue-specific promoter, such as a muscle- or skin-specific promoter, natural or synthetic. Examples of such promoters are described in US Patent Application Publication No. US 2004/0175727 and US 2004/0192593, the contents of which are incorporated herein in their entirety. Examples of promoters, spec.

- 42 042798 фичных в отношении мышц, включают промотор Spc5-12 (описанный в публикации патентной заявки США № US 2004/0192593, которая включена в данный документ посредством ссылки во всей своей полноте; Hakim et al., Mol. Ther. Methods Clin. Dev. (2014), 1: 14002; и Lai et al., Hum Mol Genet. (2014), 23(12): 3189-3199), промотор MHCK7 (описанный в Salva et al., Mol. Ther. (2007), 15: 320-329), промотор CK8 (описанный в Park et al., PLoS ONE (2015), 10(4): e0124914) и промотор CK8e (описанный в Muir et al., Mol. Ther. Methods Clin. Dev. (2014), 1: 14025). В некоторых вариантах осуществления экспрессией gRNA и/или белка Cas9 управляют с помощью tRNA.- 42 042798 muscle-specific include the Spc5-12 promoter (described in US Patent Application Publication No. US 2004/0192593, which is incorporated herein by reference in its entirety; Hakim et al., Mol. Ther. Methods Clin. Dev. (2014), 1: 14002; and Lai et al., Hum Mol Genet. (2014), 23(12): 3189-3199), the MHCK7 promoter (described in Salva et al., Mol. Ther. (2007 ), 15: 320-329), the CK8 promoter (described in Park et al., PLoS ONE (2015), 10(4): e0124914) and the CK8e promoter (described in Muir et al., Mol. Ther. Methods Clin. Dev. (2014), 1: 14025). In some embodiments, expression of gRNA and/or Cas9 protein is controlled by tRNA.

Каждая из полинуклеотидных последовательностей, кодирующих молекулу gRNA и/или молекулу Cas9, может быть функционально связана с промотором. Промоторы, которые функционально связаны с молекулой gRNA и/или молекулой Cas9, могут представлять собой один и тот же промотор. Промоторы, которые функционально связаны с молекулой gRNA и/или молекулой Cas9, могут представлять собой разные промоторы. Промотор может представлять собой конститутивный промотор, индуцируемый промотор, репрессируемый промотор или регулируемый промотор.Each of the polynucleotide sequences encoding the gRNA molecule and/or the Cas9 molecule may be operably linked to a promoter. Promoters that are operably linked to a gRNA molecule and/or a Cas9 molecule may be the same promoter. The promoters that are operably linked to the gRNA molecule and/or the Cas9 molecule may be different promoters. The promoter may be a constitutive promoter, an inducible promoter, a repressible promoter, or a regulated promoter.

Вектор также может содержать сигнал полиаденилирования, который может располагаться ниже системы редактирования генов на основе CRISPR/Cas9. Сигнал полиаденилирования может представлять собой сигнал полиаденилирования SV40, сигнал полиаденилирования LTR, сигнал полиаденилирования бычьего гормона роста (bGH), сигнал полиаденилирования гормона роста человека (hGH) или сигнал полиаденилирования β-глобина человека. Сигнал полиаденилирования SV40 может представлять собой сигнал полиаденилирования из вектора pCEP4 (Invitrogen, Сан-Диего, Калифорния).The vector may also contain a polyadenylation signal, which may be downstream of a CRISPR/Cas9 based gene editing system. The polyadenylation signal can be an SV40 polyadenylation signal, an LTR polyadenylation signal, a bovine growth hormone (bGH) polyadenylation signal, a human growth hormone (hGH) polyadenylation signal, or a human β-globin polyadenylation signal. The SV40 polyadenylation signal may be the polyadenylation signal from the pCEP4 vector (Invitrogen, San Diego, CA).

Вектор также может содержать энхансер выше системы редактирования генов на основе CRISPR/Cas9, т.е. кодирующей последовательности белка Cas9, или слитого белка Cas9, или sgRNA, или системы редактирования генов на основе CRISPR/Cas9. Энхансер может быть необходим для экспрессии ДНК. Энхансер может представлять собой энхансер гена актина человека, миозина человека, гемоглобина человека, креатина мышц человека или вирусный энхансер, такой как один из CMV, HA, RSV или EBV. Энхансеры для осуществления функции полинуклеотидов описаны в патентах США № 5593972, 5962428 и в заявке WO 94/016737, содержание каждого из которых полностью включено посредством ссылки. Вектор также может содержать точку начала репликации млекопитающих, чтобы поддерживать вектор вне хромосомы и создавать множественные копии вектора в клетке. Вектор также может содержать регуляторную последовательность, которая может хорошо подходить для экспрессии генов в клетке млекопитающего или человека, в которую вводится вектор. Вектор также может содержать репортерный ген, такой как ген зеленого флуоресцентного белка (GFP), и/или селектируемый маркер, такой как ген резистентности к гигромицину (Hygro).The vector may also contain an enhancer upstream of the CRISPR/Cas9 based gene editing system, ie. the coding sequence of a Cas9 protein or a Cas9 fusion protein or sgRNA or a CRISPR/Cas9 based gene editing system. An enhancer may be required for DNA expression. The enhancer may be a gene enhancer for human actin, human myosin, human hemoglobin, human muscle creatine, or a viral enhancer such as one of CMV, HA, RSV, or EBV. Enhancers for performing polynucleotide function are described in US Pat. The vector may also contain a mammalian origin of replication to maintain the vector off the chromosome and to create multiple copies of the vector in the cell. The vector may also contain a regulatory sequence that may be well suited for gene expression in a mammalian or human cell into which the vector is introduced. The vector may also contain a reporter gene such as the green fluorescent protein (GFP) gene and/or a selectable marker such as the hygromycin resistance gene (Hygro).

Вектор может представлять собой векторы экспрессии или системы для получения белка с помощью стандартных методик и с помощью общедоступных исходных материалов, включенных в справочник Sambrook et al., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989), который полностью включен посредством ссылки. В некоторых вариантах осуществления вектор может содержать последовательность нуклеиновой кислоты, кодирующую систему редактирования генов на основе CRISPR/Cas9, в том числе последовательность нуклеиновой кислоты, кодирующую белок Cas9 или слитый белок Cas9, и последовательность нуклеиновой кислоты, кодирующую по меньшей мере одну gRNA, содержащую последовательность нуклеиновой кислоты по меньшей мере под одной из SEQ ID NO: 1-19, 41, 42 или комплементарную ей последовательность. В некоторых вариантах осуществления белок Cas9 или слитый белок Cas9 кодируется последовательностью нуклеиновой кислоты под любой из SEQ ID NO: 26. В некоторых вариантах осуществления вектор содержит последовательность нуклеиновой кислоты под SEQ ID NO: 39 или SEQ ID NO: 40.The vector may be expression vectors or systems for producing a protein using standard techniques and publicly available starting materials included in Sambrook et al., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989), which is included in its entirety. through a link. In some embodiments, the vector may contain a nucleic acid sequence encoding a CRISPR/Cas9-based gene editing system, including a nucleic acid sequence encoding a Cas9 protein or a Cas9 fusion protein, and a nucleic acid sequence encoding at least one gRNA containing the sequence nucleic acid under at least one of SEQ ID NO: 1-19, 41, 42 or its complementary sequence. In some embodiments, the Cas9 protein or Cas9 fusion protein is encoded by the nucleic acid sequence of any of SEQ ID NO: 26. In some embodiments, the vector contains the nucleic acid sequence of SEQ ID NO: 39 or SEQ ID NO: 40.

10. Фармацевтические композиции.10. Pharmaceutical compositions.

Раскрытый в настоящем изобретении объект изобретения предусматривает композиции, содержащие вышеописанные генетические конструкции. Фармацевтические композиции в соответствии с настоящим изобретением могут составляться в соответствии с применяемым способом введения. В случаях если фармацевтические композиции представляют собой инъекционные фармацевтические композиции, они являются стерильными, свободными от пирогенов и не содержат частиц. Предпочтительным является использование изотонического состава. Как правило, добавки для изотоничности могут включать хлорид натрия, декстрозу, маннит, сорбит и лактозу. В некоторых случаях предпочтительными являются изотонические растворы, такие как фосфатно-буферный солевой раствор. Стабилизаторы включают в себя желатин и альбумин. В некоторых вариантах осуществления в состав добавляют сосудосуживающее средство.Disclosed in the present invention, the object of the invention provides compositions containing the above-described genetic constructs. Pharmaceutical compositions according to the present invention may be formulated according to the route of administration employed. In cases where the pharmaceutical compositions are injectable pharmaceutical compositions, they are sterile, free from pyrogens and do not contain particles. The use of an isotonic formulation is preferred. Typically, isotonicity additives may include sodium chloride, dextrose, mannitol, sorbitol, and lactose. In some cases, isotonic solutions such as phosphate buffered saline are preferred. Stabilizers include gelatin and albumin. In some embodiments, a vasoconstrictor is added to the composition.

Композиция может дополнительно содержать фармацевтически приемлемое вспомогательное вещество. Фармацевтически приемлемое вспомогательное вещество может представлять собой функциональные молекулы, такие как наполнители, адъюванты, носители или разбавители. Фармацевтически приемлемое вспомогательное вещество может представлять собой средство, облегчающее трансфекцию, которое может включать поверхностно-активные средства, такие как иммуностимулирующие комплексы (ISCOMS), неполный адъювант Фрейнда, аналог LPS, в том числе монофосфориллипид A, мурамиловые пептиды, аналоги хинона, везикулы, такие как сквален и сквален, гиалуроновая кислота, липиды, липоThe composition may further contain a pharmaceutically acceptable excipient. The pharmaceutically acceptable excipient may be functional molecules such as excipients, adjuvants, carriers or diluents. The pharmaceutically acceptable adjuvant may be a transfection facilitator which may include surface active agents such as immunostimulatory complexes (ISCOMS), incomplete Freund's adjuvant, LPS analog, including monophosphoryl lipid A, muramyl peptides, quinone analogs, vesicles, such like squalene and squalene, hyaluronic acid, lipids, lipo

- 43 042798 сомы, ионы кальция, вирусные белки, полианионы, поликатионы или наночастицы или другие известные средства, облегчающие трансфекцию.- 43 042798 soma, calcium ions, viral proteins, polyanions, polycations or nanoparticles or other known agents that facilitate transfection.

Средство, облегчающее трансфекцию, представляет собой полианион, поликатион, в том числе поли-L-глутамат (LGS), или липид. Средство, облегчающее трансфекцию, представляет собой поли-Lглутамат, а более предпочтительно, поли-L-глутамат присутствует в композиции для редактирования генома в скелетной мышце или сердечной мышце при концентрации, составляющей менее 6 мг/мл. Средство, облегчающее трансфекцию, может также включать поверхностно-активные средства, такие как иммуностимулирующие комплексы (ISCOMS), неполный адъювант Фрейнда, аналог LPS, в том числе монофосфориллипид A, мурамиловые пептиды, аналоги хинона и везикулы, такие как сквален и сквален, при этом также можно использовать гиалуроновую кислоту при введении в сочетании с генетической конструкцией. В некоторых вариантах осуществления ДНК-вектор, кодирующий композицию, также может включать в себя средство, облегчающее трансфекцию, такое как липиды, липосомы, в том числе лецитиновые липосомы, или другие липосомы, известные в данной области техники, в виде смеси ДНК-липосом (см., например, Международную патентную публикацию № WO 9324640), ионы кальция, вирусные белки, полианионы, поликатионы или наночастицы или другие известные средства, облегчающие трансфекцию. Предпочтительно средство, облегчающее трансфекцию, представляет собой полианион, поликатион, в том числе поли-L-глутамат (LGS), или липид.The transfection facilitator is a polyanion, a polycation, including poly-L-glutamate (LGS), or a lipid. The transfection facilitator is poly-L-glutamate, and more preferably, poly-L-glutamate is present in the skeletal muscle or cardiac muscle genome-editing composition at a concentration of less than 6 mg/mL. The transfection facilitator may also include surfactants such as immunostimulatory complexes (ISCOMS), incomplete Freund's adjuvant, an LPS analog, including monophosphoryl lipid A, muramyl peptides, quinone analogs, and vesicles such as squalene and squalene, wherein it is also possible to use hyaluronic acid when administered in combination with a genetic construct. In some embodiments, the DNA vector encoding the composition may also include a transfection facilitator such as lipids, liposomes, including lecithin liposomes, or other liposomes known in the art, as a mixture of DNA-liposomes ( see, for example, International Patent Publication No. WO 9324640), calcium ions, viral proteins, polyanions, polycations or nanoparticles, or other known transfection aids. Preferably, the transfection aid is a polyanion, a polycation, including poly-L-glutamate (LGS), or a lipid.

11. Способы доставки.11. Delivery methods.

В данном документе предусмотрен способ доставки раскрытой в настоящем изобретении генетической конструкции (например, вектора) или ее композиции в клетку. Доставку композиций можно осуществлять с помощью трансфекции или электропорации композиции, в виде молекулы нуклеиновой кислоты, которая экспрессируется в клетке и доставляется на поверхность клетки. Молекулы нуклеиновых кислот можно подвергать электропорации с использованием устройств BioRad Gene Pulser Xcell или Amaxa Nucleofector IIb. Можно использовать несколько различных буферов, в том числе раствор для электропорации BioRad, фосфатно-буферный солевой раствор от Sigma с № D8537 (PBS), Invitrogen OptiMEM I (OM) или Amaxa Nucleofector solution V (N.V.). Трансфекции могут предусматривать реагент для трансфекции, такой как Lipofectamine 2000.Provided herein is a method for delivering a genetic construct (eg, vector) or composition thereof disclosed in the present invention into a cell. Delivery of the compositions can be accomplished by transfection or electroporation of the composition, in the form of a nucleic acid molecule that is expressed in the cell and delivered to the cell surface. Nucleic acid molecules can be electroporated using the BioRad Gene Pulser Xcell or Amaxa Nucleofector IIb devices. Several different buffers can be used, including BioRad electroporation solution, Sigma phosphate buffered saline #D8537 (PBS), Invitrogen OptiMEM I (OM), or Amaxa Nucleofector solution V (N.V.). Transfections may include a transfection reagent such as Lipofectamine 2000.

После доставки раскрытой в настоящем изобретении генетической конструкции или композиции в ткань и как результат вектора в клетки млекопитающего трансфицированные клетки будут экспрессировать молекулу(ы) gRNA и молекулу Cas9. Генетическую конструкцию или композицию можно вводить млекопитающему для изменения экспрессии генов или переконструирования либо изменения генома. Например, генетическую конструкцию или композицию можно вводить млекопитающему для коррекции гена дистрофина у млекопитающего. Млекопитающее может представлять собой человека, примата, отличного от человека, корову, свинью, овцу, козу, антилопу, бизона, водного буйвола, крупный рогатый скот, оленя, ежа, слоновых, ламу, альпаку, мышей, крыс или курицу, предпочтительно человека, корову, свинью или курицу.Upon delivery of the genetic construct or composition disclosed herein into tissue and as a result of the vector into mammalian cells, the transfected cells will express the gRNA molecule(s) and the Cas9 molecule. The genetic construct or composition can be administered to a mammal to alter gene expression or to redesign or alter the genome. For example, the genetic construct or composition can be administered to a mammal to correct a dystrophin gene in the mammal. The mammal may be a human, a non-human primate, a cow, a pig, a sheep, a goat, an antelope, a bison, a water buffalo, a cattle, a deer, a hedgehog, an elephant, a llama, an alpaca, a mouse, a rat, or a chicken, preferably a human, cow, pig or chicken.

Генетическую конструкцию (например, вектор), кодирующую молекулу(ы) gRNA и молекулу Cas9, можно доставлять млекопитающему с помощью инъекции ДНК (также называемой вакцинацией ДНК) с электропорацией in vivo и без нее, опосредованной липосомами, с помощью наночастиц и/или рекомбинантных векторов. Рекомбинантный вектор можно доставлять с помощью любой вирусной формы. Вирусная форма может представлять собой рекомбинантный лентивирус, рекомбинантный аденовирус и/или рекомбинантный аденоассоциированный вирус.A genetic construct (e.g., a vector) encoding a gRNA molecule(s) and a Cas9 molecule can be delivered to a mammal by DNA injection (also referred to as DNA vaccination) with and without in vivo electroporation, mediated by liposomes, using nanoparticles and/or recombinant vectors . The recombinant vector can be delivered using any viral form. The viral form may be a recombinant lentivirus, a recombinant adenovirus, and/or a recombinant adeno-associated virus.

Генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или содержащую ее композицию можно вводить в клетку для генетической коррекции гена дистрофина (например, гена дистрофина человека). В определенных вариантах осуществления генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или содержащую ее композицию вводят в миобласт от пациента с DMD. В определенных вариантах осуществления генетическую конструкцию (например, вектор) или содержащую ее композицию вводят в клетку фибробласта от пациента с DMD, и генетически скорректированная клетка фибробласта может подвергаться обработке с помощью MyoD для индукции дифференцировки в миобласты, которые можно имплантировать субъектам, таким как субъект с поврежденными мышцами, чтобы проверить, что скорректированный белок дистрофина является функциональным и/или для лечения субъекта. Модифицированные клетки могут также являться стволовыми клетками, такими как индуцированные плюрипотентные стволовые клетки, клеткипредшественники, полученные из костного мозга, клетки-предшественники скелетной мышцы, скелетные миобласты человека от пациентов с DMD, клетки CD 133+, мезоангиобласты и трансдуцированные клетки MyoD или Pax7 или другие миогенные клетки-предшественники. Например, система редактирования генов на основе CRISPR/Cas9 может вызывать нейрональную или миогенную дифференцировку индуцированной плюрипотентной стволовой клетки.The genetic construct (eg, vector) disclosed in the present invention, or a composition containing it, can be introduced into a cell to genetically correct a dystrophin gene (eg, a human dystrophin gene). In certain embodiments, a genetic construct (eg, a vector) disclosed in the present invention, or a composition containing it, is introduced into a myoblast from a DMD patient. In certain embodiments, a genetic construct (e.g., a vector) or composition containing it is introduced into a fibroblast cell from a DMD patient, and the genetically engineered fibroblast cell can be treated with MyoD to induce differentiation into myoblasts that can be implanted in subjects, such as a subject with injured muscles to verify that the corrected dystrophin protein is functional and/or to treat the subject. The modified cells may also be stem cells, such as induced pluripotent stem cells, bone marrow-derived progenitor cells, skeletal muscle progenitor cells, human skeletal myoblasts from DMD patients, CD 133+ cells, mesoangioblasts, and transduced MyoD or Pax7 cells, or others. myogenic progenitor cells. For example, a CRISPR/Cas9 based gene editing system can induce neuronal or myogenic differentiation of an induced pluripotent stem cell.

12. Пути введения.12. Routes of administration.

Раскрытые в настоящем изобретении генетические конструкции (например, векторы) или содержащую их композицию можно вводить субъекту различными путями, в том числе перорально, парентерально, сублингвально, трансдермально, ректально, трансмукозально, местно, посредством ингаляции,The genetic constructs (e.g., vectors) disclosed herein, or a composition comprising them, may be administered to a subject in a variety of ways, including orally, parenterally, sublingually, transdermally, rectally, transmucosally, topically, by inhalation,

- 44 042798 посредством буккального введения, внутриплеврально, внутривенным, внутриартериальным, внутрибрюшинным, подкожным, внутримышечным, интраназальным, интратекальным и внутрисуставным или их комбинациями. В определенных вариантах осуществления генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или композицию вводят субъекту (например, субъекту, страдающему от DMD) внутримышечно, внутривенно или с помощью их комбинации. Для ветеринарного применения, генетические конструкции (например, векторы), раскрытые в настоящем изобретении, или содержащие их композиции можно вводить в виде отвечающего требованиям приемлемого состава в соответствии с обычной ветеринарной практикой. Ветеринар может легко определить схему применения и способ введения, которые наиболее подходят для конкретного животного. Композиции можно вводить традиционными шприцами, безыгольными устройствами для инъекций, пушками для проведения баллистической трансфекции или другими физическими способами, такими как электропорация (EP), гидродинамический способ или ультразвук.- 44 042798 by buccal administration, intrapleural, intravenous, intraarterial, intraperitoneal, subcutaneous, intramuscular, intranasal, intrathecal and intraarticular, or combinations thereof. In certain embodiments, a genetic construct (eg, a vector) disclosed herein or a composition is administered to a subject (eg, a subject suffering from DMD) intramuscularly, intravenously, or a combination thereof. For veterinary use, genetic constructs (eg, vectors) disclosed in the present invention, or compositions containing them, can be administered in the form of a suitable acceptable formulation in accordance with normal veterinary practice. The veterinarian can easily determine the regimen and route of administration that is most appropriate for a particular animal. The compositions can be administered by conventional syringes, needleless injection devices, ballistic transfection guns, or other physical methods such as electroporation (EP), hydrodynamics, or ultrasound.

Генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или содержащую ее композицию можно доставлять млекопитающему с помощью нескольких технологий, в том числе инъекции ДНК (также называемая вакцинация ДНК) с электропорацией in vivo и без нее, опосредованной липосомами, с помощью наночастиц, рекомбинантных векторов, таких как рекомбинантный лентивирус, рекомбинантный аденовирус и рекомбинантный аденоассоциированный вирус. Композицию можно вводить в скелетную мышцу или сердечную мышцу. Например, композицию можно вводить в переднюю большеберцовую мышцу или хвост.The genetic construct (e.g., vector) disclosed in the present invention, or a composition containing it, can be delivered to a mammal using several technologies, including DNA injection (also called DNA vaccination) with and without in vivo electroporation, mediated by liposomes, using nanoparticles , recombinant vectors such as recombinant lentivirus, recombinant adenovirus and recombinant adeno-associated virus. The composition can be administered to skeletal muscle or cardiac muscle. For example, the composition may be administered to the tibialis anterior or tail.

В некоторых вариантах осуществления генетическую конструкцию (например, вектор), раскрытую в настоящем изобретении, или ее композицию вводят с помощьюIn some embodiments, a genetic construct (e.g., a vector) disclosed in the present invention, or a composition thereof, is administered via

1) инъекций в хвостовую вену взрослых мышей (системных);1) injection into the tail vein of adult mice (systemic);

2) внутримышечных инъекций, например локальной инъекции в мышцу, такую как TA или икроножная мышца, взрослых мышей;2) intramuscular injections, eg local injection into a muscle, such as TA or gastrocnemius, of adult mice;

3) внутрибрюшинных инъекций в мышей P2; или3) intraperitoneal injection into P2 mice; or

4) инъекции в лицевую вену в мышей P2 (системной).4) Injection into the facial vein in P2 (systemic) mice.

13. Типы клеток.13. Cell types.

Любые из этих способов доставки и/или путей введения можно использовать с огромным количеством типов клеток, например следующими типами клеток, в настоящее время находящимися под изучением для клеточной терапии DMD, в том числе без ограничения иммортализованными миобластами, такими как миобласты дикого типа и линии клеток, полученные от пациента с DMD, например линии клеток A48-50 DMD, DMD 6594 (del48-50), DMD 8036 (del48-50), C25C14 и DMD-7796, первичными фибробластами кожи при DMD, индуцированными плюрипотентными стволовыми клетками, клеткамипредшественниками, полученными из костного мозга, клетками-предшественниками скелетной мышцы от пациентов с DMD, клетками CD 133+, мезоангиобластами, кардиомиоцитами, гепатоцитами, хондроцитами, мезенхимальными клетками-предшественниками, гематопоэтическими стволовыми клетками, гладкомышечными клетками и трансдуцированными клетками MyoD или Pax7 или другими миогенными клетками-предшественниками. Иммортализацию миогенных клеток человека можно использовать для клонального получения генетически скорректированных миогенных клеток. Клетки могут быть модифицированы ex vivo для выделения и удлинения клональных популяций иммортализованных миобластов DMD, которые включают в себя генетически скорректированный ген дистрофина и не содержат других введенных нуклеазой мутаций в областях генома, кодирующих белок. Как альтернатива временная доставка in vivo систем на основе CRISPR/Cas9 с помощью невирусного или неинтегрирующего вирусного гена-переносчика или с помощью непосредственной доставки очищенных белков и gRNA, содержащей проникающие в клетку мотивы, может обеспечивать высокоспецифическую корреляцию in situ с минимальным риском интеграции экзогенной ДНК или без такового.Any of these delivery methods and/or routes of administration can be used with a wide variety of cell types, such as the following cell types currently under study for DMD cell therapy, including, but not limited to, immortalized myoblasts such as wild-type myoblasts and cell lines derived from a patient with DMD, e.g. cell lines A48-50 DMD, DMD 6594 (del48-50), DMD 8036 (del48-50), C25C14, and DMD-7796, primary skin fibroblasts in DMD, induced pluripotent stem cells, progenitor cells, bone marrow-derived, skeletal muscle progenitor cells from DMD patients, CD 133+ cells, mesoangioblasts, cardiomyocytes, hepatocytes, chondrocytes, mesenchymal progenitor cells, hematopoietic stem cells, smooth muscle cells, and transduced MyoD or Pax7 cells or other myogenic cells- predecessors. Immortalization of human myogenic cells can be used for clonal production of genetically corrected myogenic cells. Cells can be modified ex vivo to isolate and extend clonal populations of immortalized DMD myoblasts that include the genetically altered dystrophin gene and do not contain other nuclease-introduced mutations in protein-coding regions of the genome. Alternatively, transient in vivo delivery of CRISPR/Cas9 based systems with a non-viral or non-integrating viral transfer gene or direct delivery of purified proteins and gRNA containing cell-penetrating motifs can provide highly specific in situ correlation with minimal risk of exogenous DNA integration or without one.

14. Наборы.14. Sets.

В данном документе предусмотрен набор, который можно применять для коррекции мутированного гена дистрофина. Набор содержит по меньшей мере gRNA для коррекции мутированного гена дистрофина и инструкции по применению системы редактирования генов на основе CRISPR/Cas9. В данном документе также предусмотрен набор, который можно применять для редактирования гена дистрофина в геноме скелетной мышцы или сердечной мышцы. Набор содержит генетические конструкции (например, векторы) или содержащую их композицию для редактирования генома в скелетной мышце или сердечной мышце, как описано выше, и инструкции по применению указанной композиции.Provided herein is a kit that can be used to correct a mutated dystrophin gene. The kit contains at least a gRNA for correcting a mutated dystrophin gene and instructions for using a CRISPR/Cas9 based gene editing system. This document also provides a kit that can be used to edit the dystrophin gene in the genome of skeletal muscle or cardiac muscle. The kit contains genetic constructs (eg, vectors) or a composition containing them for editing the genome in skeletal muscle or cardiac muscle, as described above, and instructions for use of said composition.

Инструкции, включенные в наборы, могут быть прикреплены к упаковочному материалу или могут быть включены в виде листка-вкладыша в упаковке. Хотя инструкции обычно представляют собой письменные или печатные материалы, -они не ограничиваются таковыми. В данном изобретении рассматривается любой носитель, способный хранить такие инструкции и сообщать их конечному пользователю. Такие носители включают без ограничения электронные носители (например, магнитные диски, кассеты, картриджи, чипы), оптические носители (например, CD ROM) и т.п. Используемый в данном документе термин инструкции может включать адрес интернет-сайта, который предоставляет инструкции.The instructions included in the kits may be attached to the packaging material or may be included as a package insert. Although instructions are usually written or printed materials, they are not limited to such. The present invention contemplates any medium capable of storing such instructions and communicating them to the end user. Such media include, without limitation, electronic media (eg, magnetic disks, cassettes, cartridges, chips), optical media (eg, CD ROM), and the like. As used herein, the term instructions may include the address of an Internet site that provides instructions.

Генетические конструкции (например, векторы) или содержащая их композиция для коррекции муGenetic constructs (for example, vectors) or a composition containing them for the correction of mu

- 45 042798 тированного гена дистрофина или редактирования гена дистрофина в геноме скелетной мышцы или сердечной мышцы могут включать в себя модифицированный вектор на основе AAV, который включает в себя молекулу(ы) gRNA и молекулу Cas9, как описано выше, которые специфично связываются и расщепляют область гена дистрофина. Система редактирования генов на основе CRISPR/Cas9, как описано выше, может быть включена в набор для специфического связывания и нацеливания на конкретную область в мутированном гене дистрофина. Набор может дополнительно включать донорную ДНК, различные gRNA или трансген, как описано выше.- 45 042798 dystrophin gene editing or editing of a dystrophin gene in the skeletal muscle or cardiac muscle genome may include a modified AAV-based vector that includes a gRNA molecule(s) and a Cas9 molecule, as described above, that specifically bind and cleave the region dystrophin gene. A CRISPR/Cas9 based gene editing system, as described above, can be included in a kit to specifically bind and target a specific region in the mutated dystrophin gene. The kit may further include donor DNA, various gRNAs, or a transgene as described above.

15. Примеры.15. Examples.

Специалистам в данной области техники будет понятно, что другие подходящие модификации и адаптации способов по настоящему изобретению, описанных в данном документе, являются легко применимыми и существенными и могут осуществляться с применением подходящих эквивалентов без отступления от объема настоящего изобретения или аспектов и вариантов осуществления, раскрытых в данном документе. Теперь при наличии подробного описания настоящего изобретения указанное будет более ясно раскрыто при рассмотрении следующих примеров, которые просто подразумеваются для иллюстрации некоторых аспектов и вариантов осуществления настоящего изобретения и не должны рассматриваться как ограничивающие объем изобретения. Раскрытия всех журнальных ссылок, патентов США и публикаций, называемых в данном документе, включены в данный документ посредством ссылки во всей своей полноте.Those skilled in the art will appreciate that other suitable modifications and adaptations of the methods of the present invention described herein are readily applicable and essential and may be carried out using suitable equivalents without departing from the scope of the present invention or the aspects and embodiments disclosed in this document. Now that a detailed description of the present invention is available, this will be more clearly disclosed by considering the following examples, which are simply meant to illustrate certain aspects and embodiments of the present invention and should not be construed as limiting the scope of the invention. Disclosures of all journal references, US patents, and publications cited herein are incorporated herein by reference in their entirety.

Настоящее изобретение характеризуется множеством аспектов, проиллюстрированных с помощью следующих неограничивающих примеров.The present invention is characterized by many aspects, illustrated by the following non-limiting examples.

Пример 1. Нацеливание на ген дистрофина человека.Example 1 Targeting the human dystrophin gene.

Систему редактирования генов на основе CRISPR/Cas9 применяли для нацеливания и обеспечения делеции экзона 51 в гене дистрофина человека. Cas9 из S. aureus (SaCas9), размер которой на приблизительно 1 т.о. меньше, чем у Cas9 из S. pyogenes, применяли с аденоассоциированным вирусом (AAV) для доставки системы редактирования генов на основе CRISPR/Cas9. Кодон-оптимизированная последовательность нуклеиновой кислоты, кодирующая молекулу Cas9 из S. aureus, изложена под SEQ ID NO: 43 или SEQ ID NO: 44. На фиг. 3 показано схематическое изображение системы на основе AAV для совместной доставки in vivo SaCas9 и двух gRNA в двух вирусных векторах к мышечным тканям. Каждый вектор содержал копию SaCas9 и одной gRNA, управляемых соответственно промоторами CMV и hU6 (PT366-179 (SEQ ID NO: 39) и PT366-183 (SEQ ID NO: 40)).A CRISPR/Cas9 based gene editing system was used to target and secure the deletion of exon 51 in the human dystrophin gene. Cas9 from S. aureus (SaCas9), which is approximately 1 kb. less than Cas9 from S. pyogenes was used with adeno-associated virus (AAV) to deliver a CRISPR/Cas9 based gene editing system. The codon-optimized nucleic acid sequence encoding the Cas9 molecule from S. aureus is set forth under SEQ ID NO: 43 or SEQ ID NO: 44. FIG. 3 shows a schematic of an AAV-based system for in vivo co-delivery of SaCas9 and two gRNAs in two viral vectors to muscle tissues. Each vector contained a copy of SaCas9 and one gRNA driven by the CMV and hU6 promoters, respectively (PT366-179 (SEQ ID NO: 39) and PT366-183 (SEQ ID NO: 40)).

Активность отдельных gRNA, нацеливающихся на ген дистрофина человека, JCR89 (осуществляет нацеливание выше экзона 51) и JCR91 (осуществляет нацеливание ниже экзона 51), которые разрабатывали в отношении генома человека, определяли с помощью анализа Surveyor в клетках HEK293T (содержат нормальный вариант гена дистрофина) и линиях миобластов от пациентов с DMD (DMD 8036 и DMD 6594, каждая из которых содержала мутантную форму гена дистрофина) (см. фиг. 1). Посредством анализа Surveyor выявляли ошибочно спаренные основания в геномной ДНК, которые являлись признаком вставок/делеций, внесенных системой редактирования генов на основе CRISPR/Cas9. Что касается JCR89, то размер полосы, соответствующей исходной форме, составлял 555 нт, и применяемые праймеры представляли собой следующие: прямой праймер - aagttacttgtccaggcatga (SEQ ID NO: 91) и обратный праймер - gaaaaacttctgccaacttttatca (SEQ ID NO: 92). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 134 и 421 нт. Что касается JCR91, то размер полосы, соответствующей исходной форме, составлял 632 нт, и применяемые праймеры представляли собой следующие: прямой праймер - tgcaaataacaaaagtagccataca (SEQ ID NO: 93) и обратный праймер - tctttagaaaggcttgaaagctg (SEQ ID NO: 94). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 210 и 422 нт.The activity of individual gRNAs targeting the human dystrophin gene, JCR89 (targets up to exon 51) and JCR91 (targets down to exon 51), which were designed for the human genome, was determined by the Surveyor assay in HEK293T cells (containing the normal variant of the dystrophin gene) and myoblast lines from DMD patients (DMD 8036 and DMD 6594, each containing a dystrophin gene mutant) (see FIG. 1). Surveyor analysis identified mismatches in genomic DNA that were indicative of insertions/deletions introduced by the CRISPR/Cas9-based gene editing system. For JCR89, the size of the band corresponding to the original form was 555 nt, and the primers used were the following: forward primer - aagttacttgtccaggcatga (SEQ ID NO: 91) and reverse primer - gaaaaacttctgccaacttttatca (SEQ ID NO: 92). The expected sizes of the bands corresponding to the shapes obtained after the cut were 134 and 421 nt. For JCR91, the size of the band corresponding to the original form was 632 nt, and the primers used were the following: forward primer - tgcaaataacaaaagtagccataca (SEQ ID NO: 93) and reverse primer - tctttagaaaggcttgaaagctg (SEQ ID NO: 94). The expected sizes of the bands corresponding to the shapes obtained after the cut were 210 and 422 nt.

Клетки HEK293T и миобласты DMD (DMD 8036 и DMD 6594) обрабатывали с помощью SaCas9 совместно с JCR89 и JCR91 gRNA (SEQ ID NO: 37 и SEQ ID NO: 38). Геномную ДНК амплифицировали с помощью прямого праймера - cttcactgctggccagttta (SEQ ID NO: 95) и обратного праймера - tctttagaaaggcttgaaagctg (SEQ ID NO: 94). Ожидаемый размер полосы, соответствующей исходной форме, составлял 1646 нт, и ожидаемый размер полосы, соответствующей форме с наиболее подходящей делецией, составлял 766 нт (фактический размер делеции между сайтами разрезов gRNA отличался от 766 нт вследствие наличия вставок/делеций). На фиг. 2A показана делеция экзона 51 в геномной ДНК из клеток HEK293T и миобластов DMD. На фиг. 2B показана делеция экзона 51 в кДНК из миобластов DMD. Без RT представляет собой отрицательный контроль, при котором обратная транскриптаза не добавлялась.HEK293T cells and DMD myoblasts (DMD 8036 and DMD 6594) were treated with SaCas9 in conjunction with JCR89 and JCR91 gRNA (SEQ ID NO: 37 and SEQ ID NO: 38). Genomic DNA was amplified with forward primer - cttcactgctggccagttta (SEQ ID NO: 95) and reverse primer - tctttagaaaggcttgaaagctg (SEQ ID NO: 94). The expected band size corresponding to the original form was 1646 nt, and the expected band size corresponding to the form with the most appropriate deletion was 766 nt (the actual size of the deletion between gRNA cut sites differed from 766 nt due to the presence of inserts/deletions). In FIG. 2A shows exon 51 deletion in genomic DNA from HEK293T cells and DMD myoblasts. In FIG. 2B shows the deletion of exon 51 in cDNA from DMD myoblasts. Without RT is a negative control in which no reverse transcriptase was added.

Систему редактирования генов на основе CRISPR/Cas9 вводили посредством инъекции в трансгенных мышей, несущих ген DMD человека (мыши hDMD/mdx), для обеспечения делеции экзона 51. Обеспечивали местную доставку вирусных векторов AAV8, несущих SaCas9 и gRNA, в переднюю большеберцовую (TA) мышцу. См. табл. 1. AAV8 вводили посредством инъекции 3 мышам: 1 мыши вводили посредством инъекции высокую дозу AAV8 в обе TA (HH), 1 мыши вводили посредством инъекции низкую дозу AAV8 в обе TA (LL) и 1 мыши вводили посредством инъекции низкую дозу в левую TA и высокую дозу в правую TA (LH). Дозы перечислены в колонке 2 табл. 1. Мышей умерщвляли черезA CRISPR/Cas9-based gene editing system was injected into transgenic mice carrying the human DMD gene (hDMD/mdx mice) to allow exon 51 deletion. AAV8 viral vectors carrying SaCas9 and gRNA were locally delivered to the tibialis anterior (TA) muscle. See table. 1. AAV8 was injected into 3 mice: 1 mice were injected with a high dose of AAV8 into both TAs (HH), 1 mice were injected with a low dose of AAV8 into both TAs (LL) and 1 mice were injected with a low dose into both TAs (HH) and high dose into the right TA (LH). Doses are listed in column 2 of the table. 1. Mice were sacrificed through

- 46 042798 недель после обработки (недели PT) с целью сбора тканей для анализа. Посредством гнездовой ПЦР выявляли делецию экзона 51 в обеих конечностях у мыши с обработкой HH, в правой TA у мыши с обработкой LL и в правой конечности у мыши с обработкой LH.- 46042798 weeks after treatment (weeks PT) in order to collect tissues for analysis. Nested PCR detected a deletion of exon 51 in both limbs in the HH-treated mouse, in the right TA in the LL-treated mouse, and in the right limb in the LH-treated mouse.

Таблица 1Table 1

Эксперимент Experiment Дозировка AAV8 Dosage AAV8 Недели Доставка РТ Внутримышечная, weeks Delivery RT intramuscular, гнездовая ПЦР - gDNA Δ51 nesting PCR - gDNA Δ51 НН: 6.6Е11 HH: 6.6E11 в переднюю to the front НН: обе, LL: HH: both, LL: НН, LL, LH HH, LL, LH LL: 1Е11 LL: 1E11 большеберцовую tibial 8 8 R, LH: R R,LH:R

Геномную ДНК, выделенную из (ТА) мышцуGenomic DNA isolated from (TA) muscle

TA мышцы мыши, амплифицировали в первом раундеTA mouse muscles amplified in the first round

ПЦР-реакции с применением прямого праймера: cttcactgctggccagttta (SEQ ID NO: 95) и обратного праймера: tctttagaaaggcttgaaagctg (SEQ ID NO: 94). Применяли 1-3 мкл продукта ПЦР во втором раунде ПЦР-реакции (2X ПЦР gDNA) с применением прямого праймера - aagttacttgtccaggcatga (SEQ ID NO: 91) и обратного праймера - ttgaacatggcattgcataaA (SEQ ID NO: 96). Продукты этого второго цикла ПЦР характеризовались ожидаемым размером полосы, соответствующей исходной форме, составляющим 1089 нт, и ожидаемым размером полосы, соответствующей форме с делецией, составляющим 323 нт (фактический размер при делеции между сайтами разрезов gRNA отличался от 323 нт вследствие наличия вставок/делеций). На фиг. 4 показаны результаты второго цикла ПЦР. Дорожки L демонстрируют результаты для левой TA мышцы, которую использовали в качестве контроля и в которую вводили солевой раствор. Дорожки R демонстрируют результаты для правой TA мышцы, в которую вводили посредством инъекции 2 вирусных вектора, которые предварительно смешивали в равных количествах. Систему редактирования генов на основе CRISPR/Cas9 также вводили посредством инъекции в хвостовую вену мышей hDMD/mdx путем системной доставки AAV8 (см. фиг. 5). Геномную ДНК, выделенную из печени (фиг. 5 - левая панель) и сердца мыши (фиг. 5 - правая панель), также амплифицировали с применением аналогичного протокола, как для фиг. 4. Ожидаемая полоса, соответствующая размеру примерно 300 нуклеотидов, свидетельствовала о делеции экзона 51.PCR reactions using forward primer: cttcactgctggccagttta (SEQ ID NO: 95) and reverse primer: tctttagaaaggcttgaaagctg (SEQ ID NO: 94). 1-3 µl of the PCR product was applied in the second round of the PCR reaction (2X gDNA PCR) using forward primer - aagttacttgtccaggcatga (SEQ ID NO: 91) and reverse primer - ttgaacatggcattgcataaA (SEQ ID NO: 96). The products of this second PCR cycle had an expected band size corresponding to the original form of 1089 nt and an expected band size corresponding to the deletion form of 323 nt (the actual size at deletion between gRNA cut sites differed from 323 nt due to the presence of inserts/deletions) . In FIG. 4 shows the results of the second PCR cycle. Lanes L show the results for the left TA muscle, which was used as a control and injected with saline. Lanes R show the results for the right TA muscle, which was injected with 2 viral vectors that were premixed in equal amounts. The CRISPR/Cas9 based gene editing system was also injected into the tail vein of hDMD/mdx mice by systemic delivery of AAV8 (see FIG. 5). Genomic DNA isolated from mouse liver (FIG. 5 - left panel) and mouse heart (FIG. 5 - right panel) was also amplified using the same protocol as for FIG. 4. The expected band, corresponding to a size of approximately 300 nucleotides, indicated a deletion of exon 51.

Получали и отбирали дополнительные gRNA, которые нацеливались на последовательности гена дистрофина человека и макака-резуса или последовательности гена дистрофина человека (см. фиг. 6 и табл. 2). В табл. 2 приведены основная мишень gRNA, распознаваемая геномная нить, последовательность gRNA и последовательность PAM, связанная с gRNA. Геномные последовательности-мишени для gRNA, указанные в геномной плюс-нити, перечислены в табл. 3. Эти gRNA тестировали на культивируемых клетках человека для выявления оптимальной активности gRNA и их комбинаций для получения делеций. Отобранные gRNA также ранжировали по преимуществу на основании предсказанной специфичности в отношении генома человека (фиг. 8) и подвергали скринингу в отношении оптимальных значений длины целевой последовательности, варьирующих от 19 до 23 нуклеотидов (фиг. 10 и 11). На фиг. 6 показаны различные мишени gRNA, перечисленные в табл. 2, которые являются консервативными среди геномов человека и макака-резуса. Расположение каждой gRNA указано по отношению к экзону 51 гена дистрофина человека.Additional gRNAs were generated and selected that targeted the human and rhesus monkey dystrophin gene sequences or human dystrophin gene sequences (see Figure 6 and Table 2). In table. 2 shows the main gRNA target, the recognized genomic strand, the gRNA sequence and the PAM sequence associated with the gRNA. Genomic target sequences for gRNA, indicated in the genomic plus strand, are listed in table. 3. These gRNAs were tested on cultured human cells to determine the optimal activity of gRNAs and their combinations to obtain deletions. The selected gRNAs were also ranked predominantly based on predicted specificity for the human genome (FIG. 8) and screened for optimal target sequence lengths ranging from 19 to 23 nucleotides (FIGS. 10 and 11). In FIG. 6 shows the various gRNA targets listed in Table 1. 2, which are conserved among the human and rhesus monkey genomes. The location of each gRNA is indicated relative to exon 51 of the human dystrophin gene.

- 47 042798- 47 042798

Таблица 2table 2

Перечень gRNAgRNA list

gRNA gRNA Основная мишень Main target Нить A thread Последовательность gRNA (5' - 3') gRNA sequence (5' - 3') SEQ ID SEQ ID Последо вательн Consistently SEQ ID SEQ ID NO: NO: ость awn NO: NO: РАМ RAM JCR8 9 JCR89 Экзон 51 DMD человека (выше) Exon 51 human DMD (above) плюс plus AAAGATATATААТ GT CAT GAAT AAAGATATATAAT GT CAT GAAT 1 1 AAGAGT AAGAGT 53 53 JCR91 JCR91 Экзон 51 DMD человека (ниже) Exon 51 DMD person (below) плюс plus GCAGAATСАААТАТААТА GTCT GCAGAATSAAAATAATAATA GTCT 2 2 GGGAAT GGGAAT 54 54 JCR94 JCR94 Экзон 52 DMD человека (выше) Exon 52 human DMD (above) минус minus AACAAATATCCCTTAGTA ТС AACAAATATCCCTTAGTA TS 41 41 AGG AGG 55 55 JCR99 JCR99 Экзон 52 DMD человека (ниже) Экзон 51 DMD Human exon 52 DMD (below) Exon 51 DMD минус minus AATGTATTTCTTCTATTC АА AATGTATTTCTTCTATTC AA 42 42 TGG TGG 56 56 JCR159 JCR159 человека и макака-резуса (выше) Экзон 51 DMD human and rhesus monkey (higher) Exon 51 DMD минус minus AACAATAAGTCAAATTTA ATTG AACAATAAGTCAAATTTA ATTG 3 3 AAGAGT AAGAGT 53 53 JCR160 JCR160 человека и макака-резуса (ниже) Экзон 51 DMD human and rhesus monkey (below) Exon 51 DMD минус minus GAACTGGTGGGAAATGGT CTAG GAACTGGTGGGAAATGGT CTAG 4 4 GAGAGT GAGAGT 57 57 JCR167 JCR167 человека и макака-резуса (ниже) Экзон 51 DMD human and rhesus monkey (below) Exon 51 DMD минус minus TCCTTTGGTAAATAAAAG тест TCCTTTGGTAAATAAAAG test 5 5 GGGAGT GGGAGT 58 58 JCR166 JCR166 человека и макака-резуса (ниже) Экзон 51 DMD human and rhesus monkey (below) Exon 51 DMD минус minus ТAGGAATCAAATGGACTТ GGAT TAGGAATCAAATGGACT GGAT 6 6 TTGAAT TTGAAT 59 59 JCR168 JCR168 человека и макака-резуса (выше) human and rhesus monkey (higher) плюс plus TAATTCTTTCTAGAAAGA GCCT TAATTCTTTCTAGAAAGA GCCT 7 7 CAGAGT CAGAGT 60 60 JCR170 JCR170 Экзон 51 DMD человека и Exon 51 DMD human and минус minus CTCTTGCATCTTGCACAT CTCTTGCATCTTGCACAT 8 8 TGGAGT TGGAGT 61 61

GTCC макака-резусаGTCC rhesus monkey

- 48 042798 (выше)- 48 042798 (above)

Экзон 51 DMDExon 51 DMD

JCR171 JCR171 человека и макака-резуса (выше) Экзон 51 DMD human and rhesus monkey (higher) Exon 51 DMD минус minus ACTTAGAGGTCTTCTACA ТАСА ACTTAGAGGTCTTTCTACA TASA 9 9 ATGAGT ATGAGT 62 62 JCR156 JCR156 человека и макака-резуса (выше) Экзон 51 DMD human and rhesus monkey (higher) Exon 51 DMD минус minus TCAGAGGTGAGTGGTGAG GGGA TCAGAGGTGAGTGGTGAG GGGA 10 10 AGGAAT AGGAAT 63 63 JCR157 JCR157 человека и макака-резуса (выше) Экзон 51 DMD human and rhesus monkey (higher) Exon 51 DMD минус minus ACACACAGCTGGGTTATC AGAG ACACACAGCTGGGTTATC AGAG 11 eleven GAGAGT GAGAGT 57 57 JCR176 JCR176 человека и макака-резуса (выше) Экзон 51 DMD human and rhesus monkey (higher) Exon 51 DMD минус minus CACAGCTGGGTTATCAGA G CACAGCTGGGTTATCAGA G 12 12 GAGAGT GAGAGT 57 57 JCR177 JCR177 человека и макака-резуса (выше) Экзон 51 DMD human and rhesus monkey (higher) Exon 51 DMD минус minus ACACAGCTGGGTTATCAG AG ACACAGCTGGGTTATCAG AG 13 13 GAGAGT GAGAGT 57 57 JCR178 JCR178 человека и макака-резуса (выше) Экзон 51 DMD human and rhesus monkey (higher) Exon 51 DMD минус minus СACACAGCT GGGT ТАТСА GAG CACACAGCT GGGT TATSA GAG 14 14 GAGAGT GAGAGT 57 57 JCR179 JCR179 человека и макака-резуса (выше) Экзон 51 DMD human and rhesus monkey (higher) Exon 51 DMD минус minus AACACACAGCTGGGTТАТ CAGAG AACACACAGCTGGGTTAT CAGAG 15 15 GAGAGT GAGAGT 57 57 JCR180 JCR180 человека и макака-резуса (ниже) Экзон 51 DMD human and rhesus monkey (below) Exon 51 DMD минус minus CTGGTGGGAAATGGTCTA G CTGGTGGGAAATGGTCTA G 16 16 GAGAGT GAGAGT 57 57 JCR181 JCR181 человека и макака-резуса (ниже) human and rhesus monkey (below) минус minus ACTGGTGGGAAATGGTCT AG ACTGGTGGGAAATGGTCT AG 17 17 GAGAGT GAGAGT 57 57 JCR182 Экзон 51 DMD человека и JCR182 Exon 51 DMD human and минус minus AACTGGTGGGAAATGGTC TAG AACTGGTGGGAAATGGTC TAG 18 18 GAGAGT GAGAGT 57 57

макака-резуса (ниже) Экзон 51 DMD rhesus monkey (below) Exon 51 DMD AGAACTGGTGGGAAATGG AGAACTGGTGGGAAATGG человека и human and JCR183 JCR183 макака-резуса rhesus monkey минус minus TCTAG TCTAG 19 19 GAGAGT GAGAGT 57 57

(ниже)(below)

- 49 042798- 49 042798

Таблица 3Table 3

Целевые последовательности gRNATarget gRNA sequences

Название gRNA gRNA name Целевая последовательность (плюс-нить 5’ - 3’) Target sequence (plus thread 5' - 3') SEQ ID NO: SEQ ID NO: Комментарии Comments JCR8 9 JCR89 AAAGATАТАТААТG Т CAT GAAT AAAGATATATAATG T CAT GAAT 64 64 JCR91 JCR91 GCAGAAT САААТАТААТAG Т С Т GCAGAAT CAAAATATAATAAG T S T 65 65 JCR159 JCR159 СААТТАААТТТGAGТТАТТGТТ SAATTAAAATTTGAGTTATTTGTT 66 66 на 101 выше экзона 51 101 up exon 51 JCR160 JCR160 С ТAGAC САТ Т Т С С САС СAG Т Т С C TAGAC CAT T T C C CAC CAG T T C 67 67 на 7 8 ниже экзона 51 7 8 below exon 51 JCR167 JCR167 AG GAC ТТТТАТТТАС СAAAG GA AG GAC TTTTTTTAC CAAAG GA 68 68 на 1534 ниже экзона 51 1534 below exon 51 JCR166 JCR166 ATCCAAGTCCATTTGATTCCTA ATCCAAGTCCATTTGATTCCTA 69 69 на 1266 ниже экзона 51 1266 below exon 51 JCR168 JCR168 ТААТТСТТТСTAGAAAGAGCСТ TAATTTTTSTAGAAAGAGCST 70 70 на 1824 выше экзона 51 1824 above exon 51 JCR170 JCR170 GGACATGTGCAAGATGCAAGAG GGACATGTGCAAGATGCAAGAG 71 71 на 2851 выше экзона 51 2851 upstream of exon 51 JCR171 JCR171 Т G ТAT G ТAGAAGAC СТС ТAAG Т T G TAT G TAGAAGAC CTC TAAG T 72 72 на 2947 выше экзона 51 2947 higher exon 51 JCR156 JCR156 TCCCCTCACCACTCACCTCTGA TCCCTCACCACTCACCCTGA 73 73 на 1300 выше экзона 51 1300 higher exon 51 JCR157 JCR157 CTCTGATAACCCAGCTGTGTGT CTCTGATAACCCAGCTGTGTGT 74 74 на 1284 выше экзона 51 1284 higher exon 51 JCR176 JCR176 CTCTGATAACCCAGCTGTG CTCTGATAACCCAGCTGTG 75 75 JCR157-19 нуклеотидов JCR157-19 nucleotides JCR177 JCR177 CTCTGATAACCCAGCTGTGT CTCTGATAACCCAGCTGTGT 76 76 JCR157-20 нуклеотидов JCR157-20 nucleotides JCR178 JCR178 CTCTGATAACCCAGCTGTGTG CTCTGATAACCCAGCTGTGTG 77 77 JCR157-21 JCR157-21 нуклеотид nucleotide JCR179 JCR179 CTCTGATAACCCAGCTGTGTGTT CTCTGATAACCCAGCTGTGTGTT 78 78 JCR157-23 нуклеотида JCR157-23 nucleotide JCR180 JCR180 С ТAGAC САТ Т Т С С САС СAG C TAGAC SAT T T C C CAC CAG 79 79 JCR160-19 нуклеотидов JCR160-19 nucleotides JCR181 JCR181 С ТAGAC САТ Т Т С С САС СAG Т C TAGAC SAT T T C C CAC CAG T 80 80 JCR160-20 нуклеотидов JCR160-20 nucleotides JCR182 JCR182 С ТAGAC САТ Т Т С С САС СAG Т Т C TAGAC SAT T T C C CAC CAG T T 81 81 JCR160-21 нуклеотид JCR160-21 nucleotide JCR183 JCR183 С ТAGAC САТ Т Т С С САС СAG Т Т С Т C TAGAC SAT T T C C CAC CAG T T S T 82 82 JCR160-23 нуклеотида JCR160-23 nucleotide

Клетки HEK293T человека трансфицировали отдельными кандидатными gRNA, перечисленными в табл. 2. Активность кандидатных gRNA определяли с помощью анализа Surveyor (см. фиг. 7). Что касается JCR160, то размер полосы, соответствующей исходной форме, составлял 483 нт, и применяемые праймеры представляли собой следующие: прямой праймер - cgggcttggacagaacttac (SEQ ID NO: 97) и обратный праймер - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 192 и 291 нт. Что касается JCR157, то размер полосы, соответствующей исходной форме, составлял 631 нт, и применяемые праймеры представляли собой следующие: прямой праймер - gagatgtcttttgcagctttcc (SEQ ID NO: 99) и обратный праймер - gggaccttggtaaagccaca (SEQ ID NO: 100). Ожидаемые размеры полос после разреза составляли 147 и 484 нт.Human HEK293T cells were transfected with the individual candidate gRNAs listed in Table 1. 2. Candidate gRNA activity was determined using the Surveyor assay (see FIG. 7). For JCR160, the size of the band corresponding to the original form was 483 nt, and the primers used were the following: forward primer - cgggcttggacagaacttac (SEQ ID NO: 97) and reverse primer - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). The expected sizes of the bands corresponding to the shapes obtained after the cut were 192 and 291 nt. For JCR157, the size of the band corresponding to the original form was 631 nt, and the primers used were the following: forward primer - gagatgtcttttgcagctttcc (SEQ ID NO: 99) and reverse primer - gggaccttggtaaagccaca (SEQ ID NO: 100). The expected band sizes after cutting were 147 and 484 nt.

Специфичность кандидатных gRNA предсказывали с применением программы CasOFFinder (Bae et al. (2014), Bioinformatics, 30: 1473-1475; см. фиг. 8). Кандидатные gRNA оценивали и выбирали на основании нецелевой активности, целевой активности, измеренных с помощью анализа Surveyor, и расстояния от экзона. JCR157 и JCR160 gRNA имели низкий предсказанный уровень нецелевого связываThe specificity of candidate gRNAs was predicted using the CasOFFinder program (Bae et al. (2014), Bioinformatics, 30: 1473-1475; see Fig. 8). Candidate gRNAs were evaluated and selected based on non-target activity, target activity as measured by the Surveyor assay, and distance from the exon. JCR157 and JCR160 gRNA had a low predicted level of off-target binding

- 50 042798 ния, и их применяли для дальнейшего тестирования.- 50 042798, and they were used for further testing.

Ими трансфицировали клетки HEK293T, и клетки DMD 6594 подвергали электропорации с применением модифицированной плазмиды pDO240, содержащей JCR157 gRNA, модифицированной плазмиды pDO240, содержащей JCR160 gRNA, и плазмиды, содержащей SaCas9 (pDO242; SEQ ID NO: 83). Предсказанный размер полосы, соответствующей исходной форме, составлял 2451 нт, и предсказанный размер полосы, соответствующей форме с делецией, составлял приблизительно 840-850 нт. На фиг. 9 показана делеция экзона 51, определенная с помощью ПЦР геномной ДНК (примерно 850 нуклеотидов) с применением прямого праймера - tgcctttcaatcattgtttcg (SEQ ID NO: 101) и обратного праймера agaaggcaaattggcacaga (SEQ ID NO: 102). Делеция, созданная между сайтами разрезов gRNA, составляла примерно 1611 нт.They were transfected into HEK293T cells and DMD 6594 cells were electroporated using a modified pDO240 plasmid containing JCR157 gRNA, a modified pDO240 plasmid containing JCR160 gRNA, and a plasmid containing SaCas9 (pDO242; SEQ ID NO: 83). The predicted band size corresponding to the original form was 2451 nt, and the predicted band size corresponding to the deletion form was approximately 840-850 nt. In FIG. 9 shows the exon 51 deletion determined by PCR of genomic DNA (approximately 850 nucleotides) using the forward primer tgcctttcaatcattgtttcg (SEQ ID NO: 101) and the reverse primer agaaggcaaattggcacaga (SEQ ID NO: 102). The deletion created between the gRNA cut sites was approximately 1611 nt.

На фиг. 10 показана активность JCR157 gRNA по отношению к мишеням с различными значениями длины (19, 20, 21, 22 и 23 нуклеотида), определенная с помощью анализа Surveyor в клетках HEK293T с применением праймеров и условий ПЦР, применяемых для JCR157 на фиг. 7. На фиг. 11 показана активность JCR160 gRNA по отношению к мишеням с различными значениями длины (19, 20, 21, 22 и 23 нуклеотида), определенная с помощью анализа Surveyor в клетках HEK293T с применением прямого праймера - cgggcttggacagaacttac (SEQ ID NO: 97) и обратного праймера - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). Предсказанный размер полосы, соответствующей исходной форме, составлял 483 нт, и ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 209 и 274 нт.In FIG. 10 shows the activity of JCR157 gRNA against targets of various lengths (19, 20, 21, 22, and 23 nucleotides) as determined by the Surveyor assay in HEK293T cells using the primers and PCR conditions used for JCR157 in FIG. 7. In FIG. 11 shows activity of JCR160 gRNA against targets of different lengths (19, 20, 21, 22 and 23 nucleotides) as determined by Surveyor assay in HEK293T cells using forward primer - cgggcttggacagaacttac (SEQ ID NO: 97) and reverse primer. - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). The predicted stripe size corresponding to the original shape was 483 nt, and the expected stripe sizes corresponding to the cut shapes were 209 and 274 nt.

Комбинации JCR157 и JCR160 gRNA по отношению к мишеням с различными значениями длины (21, 22 или 23 нуклеотида) применяли в клетках HEK293T с применением условий, применяемых на фиг. 9. На фиг. 12 показаны результаты ПЦР геномной ДНК. Комбинация JCR157 и JCR160, каждая из которых содержала мишени из 23 нуклеотидов, обеспечивала почти 50% делецию.Combinations of JCR157 and JCR160 gRNA against targets of different lengths (21, 22 or 23 nucleotides) were used in HEK293T cells using the conditions used in FIG. 9. In FIG. 12 shows PCR results of genomic DNA. The combination of JCR157 and JCR160, each containing 23 nucleotide targets, provided almost a 50% deletion.

Каждую gRNA, фланкирующую экзон 51 (JCR179 - выше и JCR183 - ниже), использовали отдельно с SaCas9 с применением целевых последовательностей из 23 нт для демонстрации целевой нуклеазной активности в клетках HEK293T (293s) и клетках DMD6594 (DMD6594s) (см. фиг. 13). Что касается JCR179, то размер полосы, соответствующей исходной форме, составлял 594 нт, и применяемые праймеры представляли собой следующие: прямой праймер - tgcctttcaatcattgtttcg (SEQ ID NO: 101) и обратный праймер - aaggccccaaaatgtgaaat (SEQ ID NO: 103). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 594 и 130 нт. Что касается JCR183, то размер полосы, соответствующей исходной форме, составлял 731 нт, и применяемые праймеры представляли собой следующие: прямой праймер - gagtttggctcaaattgttactctt (SEQ ID NO: 104) и обратный праймер - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). Ожидаемые размеры полос, соответствующих формам, полученным после разреза, составляли 440 и 291 нт. На фиг. 13 показана целевая нуклеазная активность с помощью анализа Surveyor in vitro.Each gRNA flanking exon 51 (JCR179 upstream and JCR183 downstream) was used alone with SaCas9 using 23 nt target sequences to demonstrate targeted nuclease activity in HEK293T (293s) and DMD6594 (DMD6594s) cells (see Fig. 13 ). For JCR179, the size of the band corresponding to the original form was 594 nt, and the primers used were the following: forward primer - tgcctttcaatcattgtttcg (SEQ ID NO: 101) and reverse primer - aaggccccaaaatgtgaaat (SEQ ID NO: 103). The expected sizes of the bands corresponding to the shapes obtained after the cut were 594 and 130 nt. For JCR183, the size of the band corresponding to the original form was 731 nt, and the primers used were the following: forward primer - gagtttggctcaaattgttactctt (SEQ ID NO: 104) and reverse primer - ctgcgtagtgccaaaacaaa (SEQ ID NO: 98). The expected sizes of the bands corresponding to the shapes obtained after the cut were 440 and 291 nt. In FIG. 13 shows targeted nuclease activity using the Surveyor in vitro assay.

Ими трансфицировали клетки HEK293T человека, и миобласты DMD (DMD 6594) подвергали электропорации с применением плазмид, содержащих SaCas9, и JCR179, и JCR183 gRNA (мишени из 23 нт. JCR157 и JCR160; SEQ ID NO: 37 и SEQ ID NO: 38). Клетки DMD 6594 представляли собой иммортализованные миобласты от пациентов с DMD, которые изначально не содержали экзоны 48-50. Предсказанный размер полосы, соответствующей исходной форме, составлял 2451 нт., и предсказанный размер полосы, соответствующей форме с делецией, составлял приблизительно 823 нт. На фиг. 14 показана делеция in vitro экзона 51 в геномной ДНК клеток HEK293T человека (левые панели) и клеток DMD 6594 (правые панели), определенная с помощью ПЦР геномной ДНК с применением прямого праймера tgcctttcaatcattgtttcg (SEQ ID NO: 101) и обратного праймера - agaaggcaaattggcacaga (SEQ ID NO: 102). Делеция, созданная между сайтами разрезов gRNA, составляла примерно 1628 нт. На верхних панелях показано схематическое изображение гена-мишени для нацеливающихся выше и ниже него gRNA в клетках HEK293T и клетках DMD 6594, где фиолетовым цветом указаны нормально процессированные экзоны, и желтым цветом указаны мутантные экзоны. На средних панелях показан результат ПЦР в пределах области генома, подвергнутой делеции, где звездочкой указана делеция. На нижних панелях показаны данные капельной цифровой ПЦР геномной ДНК. В клетках HEK293T gRNA и SaCas9 обеспечивали 16% делецию, при этом в клетках DMD 6594 они обеспечивали редактирование на уровне приблизительно 10%.They were transfected into human HEK293T cells and DMD myoblasts (DMD 6594) were electroporated using plasmids containing SaCas9 and JCR179 and JCR183 gRNA (23 nt JCR157 and JCR160 targets; SEQ ID NO: 37 and SEQ ID NO: 38) . DMD 6594 cells were immortalized myoblasts from DMD patients that initially did not contain exons 48-50. The predicted band size corresponding to the original form was 2451 nt and the predicted band size corresponding to the deletion form was approximately 823 nt. In FIG. 14 shows the in vitro deletion of exon 51 in the genomic DNA of human HEK293T cells (left panels) and DMD 6594 cells (right panels) determined by genomic DNA PCR using forward primer tgcctttcaatcattgtttcg (SEQ ID NO: 101) and reverse primer agaaggcaaattggcacaga ( SEQ ID NO: 102). The deletion created between the gRNA cut sites was approximately 1628 nt. Upper panels show a schematic representation of the target gene for upstream and downstream targeting gRNAs in HEK293T cells and DMD 6594 cells, with normally processed exons in purple and mutated exons in yellow. The middle panels show the PCR result within the deletion region of the genome, where the deletion is indicated by an asterisk. Bottom panels show genomic DNA spot digital PCR data. In HEK293T cells, gRNA and SaCas9 provided a 16% deletion, while in DMD 6594 cells they provided approximately 10% editing.

Для определения того, транскрибировались ли изменения в геномной ДНК в РНК, выделяли РНК из миобластов DMD, которые котрансфицировали с помощью SaCas9 и обеих gRNA, и обеспечивали их дифференцировку в течение 7 дней (см. фиг. 15). РНК обратно транскрибировали в кДНК, и кДНК подвергали ПЦР-амплификации с применением стандартных способов, известных из уровня техники. На нижней левой панели фиг. 15 показан результат ПЦР-амплификации в пределах от экзона 44 до экзона 52 с применением прямого праймера - tggcggcgttttcattat (SEQ ID NO: 105) и обратного праймера TTCGATCCGTAATGATTGTTCTAGCC (SEQ ID NO: 106). Предсказанный размер полосы, соответствующей исходной форме, составлял 948 нт, и предсказанный размер полосы, соответствующей форме с делецией, составлял приблизительно 715 нт. На фиг. 15 показана полоса, соответствующая форме с делецией, только в случае клеток, обработанных с помощью SaCas9 и обеих gRNA. На нижней правой панели показаны данные ddPCR, демонстрирующие редактирование кДНК на уровне приблизительно 14%.To determine if changes in genomic DNA were transcribed into RNA, RNA was isolated from DMD myoblasts, which were co-transfected with SaCas9 and both gRNAs and allowed to differentiate for 7 days (see FIG. 15). The RNA was reverse transcribed into cDNA and the cDNA was subjected to PCR amplification using standard methods known in the art. In the lower left panel of Fig. 15 shows the result of PCR amplification from exon 44 to exon 52 using forward primer tggcggcgttttcattat (SEQ ID NO: 105) and reverse primer TTCGATCCGTAATGATTGTTCTAGCC (SEQ ID NO: 106). The predicted band size corresponding to the original form was 948 nt and the predicted band size corresponding to the deletion form was approximately 715 nt. In FIG. 15 shows the deletion band only for cells treated with SaCas9 and both gRNAs. The lower right panel shows ddPCR data demonstrating cDNA editing at approximately 14%.

- 51 042798- 51 042798

Соединение экзона 47 с 52 в кДНК из миобластов от пациентов с DMD секвенировали in vitro (см. фиг. 16). На фиг. 16 последовательность, соответствующая полосам от необработанных клеток (контрольные клетки A48-50), указывает на то, что экзоны 47 и 51 соединялись, как этого и следовало ожидать, тогда как полоса, соответствующая форме с делецией, в обработанных клетках (A48-50+A51) указывала на соединение экзона 47 с 52. Таким образом, отчетливое отсутствие экзона 51 и результат раскрытой системы, осуществляющей нацеливание на уровне геномной ДНК, обеспечивались посредством транскрипции.The junction of exon 47 to 52 in cDNA from myoblasts from DMD patients was sequenced in vitro (see Fig. 16). In FIG. 16, the sequence corresponding to the bands from untreated cells (control cells A48-50) indicates that exons 47 and 51 joined as expected, while the band corresponding to the deletion form in treated cells (A48-50+ A51) indicated the connection of exon 47 to 52. Thus, the distinct absence of exon 51 and the result of the disclosed targeting system at the genomic DNA level was provided by transcription.

Пример 2. Получение мыши A52/mdx.Example 2 Obtaining an A52/mdx mouse.

На фиг. 17 показана схема получения мыши A52/mdx. Из Лейденского университета получали мышь hDMD/mdx, и осуществляли манипуляции с получением релевантной модели DMD, в которой удален экзон 52, при этом данная делеция приводила к сдвигу рамки считывания и характерному для DMD генотипу. Мышь hDMD/mdx содержала полноразмерный человеческий ген дистрофина дикого типа на хромосоме 5 в окружении mdx, вследствие чего дистрофин мыши не экспрессировался.In FIG. 17 shows the scheme for obtaining an A52/mdx mouse. An hDMD/mdx mouse was obtained from the University of Leiden and manipulated to obtain a relevant DMD model in which exon 52 was deleted, this deletion resulting in a frameshift and DMD-specific genotype. The hDMD/mdx mouse contained the full length human wild-type dystrophin gene on chromosome 5 surrounded by mdx, resulting in no mouse dystrophin expression.

Для получения релевантной модели DMD применяли систему редактирования CRISPR/Cas9 на основе SpCas9 и gRNA для нацеливания и обеспечения делеции экзона 52 в гене дистрофина человека. Различные gRNA, осуществляющие нацеливание выше и ниже экзона 52, тестировали и проверяли их соответствие с применением анализа Surveyor (см. фиг. 18). Для gRNA, осуществляющих нацеливание выше, применяли прямой праймер - ctccggaatgtctccatttg (SEQ ID NO: 87) и обратный праймер TTGTGTGTCCCATGCTTGTT (SEQ ID NO: 107), и при этом размер полосы, соответствующей исходной форме, составлял 402 нт. Что касается JCR94 (AACAAATATCCCTTAGTATC (SEQ ID NO: 41)), то ожидаемые размеры форм, полученных после разреза, составляли 243 и 159 нт. Для gRNA, осуществляющих нацеливание ниже, применяли прямой праймер - CAACGCTGAAGAACCCTGAT (SEQ ID NO: 108) и обратный - atgagggagagactggcatc (SEQ ID NO: 88), и при этом размер полосы, соответствующей исходной форме, составлял 509 нт. Что касается JCR99 (AATGTATTTCTTCTATTCAA (SEQ ID NO: 42)), то ожидаемые размеры форм, полученных после разреза, составляли 346 и 163 нт пары gRNA тестировали и проверяли их соответствие путем выявления делеции экзона 51 в геномной ДНК из клеток HEK293T, в том числе JCR94 и JCR99, с применением прямого праймера - ctccggaatgtctccatttg (SEQ ID NO: 87) и обратного праймера - atgagggagagactggcatc (SEQ ID NO: 88) (см. фиг. 19). Размер полосы, соответствующей исходной форме, составлял 718 нт, размер полосы, соответствующей форме с делецией, составлял 392 нт, при этом делеция между gRNA составляла 326 нт пару JCR94 и JCR99 применяли в системе редактирования генома для получения мыши A52/mdx. В частности, мышь создавали путем введения посредством инъекции mRNA JCR94 gRNA, JCR99 gRNA и SaCas9 в эмбрионы мышей.To obtain a relevant DMD model, a CRISPR/Cas9 editing system based on SpCas9 and gRNA was used to target and provide for the deletion of exon 52 in the human dystrophin gene. Various gRNAs targeting upstream and downstream of exon 52 were tested and checked for consistency using Surveyor analysis (see FIG. 18). For gRNAs targeting above, forward primer - ctccggaatgtctccatttg (SEQ ID NO: 87) and reverse primer TTGTGTGTCCCATGCTTGTT (SEQ ID NO: 107) were used, and the band size corresponding to the original form was 402 nt. With respect to JCR94 (AACAAATATCCCTTAGTATC (SEQ ID NO: 41)), the expected mold sizes obtained after cutting were 243 and 159 nt. For gRNAs targeting downstream, forward primer CAACGCTGAAGAACCCTGAT (SEQ ID NO: 108) and reverse primer atgagggaggactggcatc (SEQ ID NO: 88) were used, and the size of the band corresponding to the original form was 509 nt. As for JCR99 (AATGTATTTCTTCTATTCAA (SEQ ID NO: 42)), the expected sizes of the forms obtained after cutting were 346 and 163 nt gRNA pairs were tested and checked for compliance by detecting exon 51 deletion in genomic DNA from HEK293T cells, including JCR94 and JCR99 using forward primer - ctccggaatgtctccatttg (SEQ ID NO: 87) and reverse primer - atgagggagactggcatc (SEQ ID NO: 88) (see Fig. 19). The band size corresponding to the original form was 718 nt, the band size corresponding to the deletion form was 392 nt, and the deletion between the gRNA was 326 nt. Specifically, a mouse was generated by injecting JCR94 gRNA, JCR99 gRNA, and SaCas9 mRNA into mouse embryos.

На фиг. 20 показан протокол осуществления микроинъекции ДНК, который включает использование услуги по рекомбинационной инженерии BAC. День 1: жеребых кобыл внутрибрюшинно обрабатывали гонадотропином сыворотки крови жеребой кобылы для индукции овуляции. День 3: жеребых кобыл внутрибрюшинно обрабатывали хорионическим гонадотропином человека. В 1-м цикле получали 471 эмбрион, однако наблюдали только 5 пробок. Использовали 150 эмбрионов, созданных оплодотворением (от 14 самок, подвергнутых суперовуляции). Инъекции в пронуклеус осуществляли с применением менее чем 50 нг Cas9 и 20 нг каждой направляющей. На фиг. 21 показан протокол скрещивания мышей для получения трансгенных мышей.In FIG. 20 shows a DNA microinjection protocol that includes the use of a BAC recombination engineering service. Day 1: Pregnant mares were treated intraperitoneally with foal mare serum gonadotropin to induce ovulation. Day 3: Pregnant mares were treated intraperitoneally with human chorionic gonadotropin. In cycle 1, 471 embryos were obtained, but only 5 plugs were observed. Used 150 embryos created by fertilization (from 14 females subjected to superovulation). Injections into the pronucleus were performed using less than 50 ng of Cas9 and 20 ng of each guide. In FIG. 21 shows a protocol for crossing mice to produce transgenic mice.

Мышей-основателей генотипировали с применением следующего протокола генотипирования. Геномную ДНК (gDNA) экстрагировали из срезанных частей хвоста мышей с применением набора для выделения ДНК из крови и тканей DNEasy (Qiagen). Для генотипирования каждого детеныша gDNA амплифицировали с применением набора AccuPrime HiFi Taq в соответствии с нижеследующим:Founder mice were genotyped using the following genotyping protocol. Genomic DNA (gDNA) was extracted from mouse tail cuts using the DNEasy Blood and Tissue DNA Extraction Kit (Qiagen). For genotyping each pup, gDNA was amplified using the AccuPrime HiFi Taq kit as follows:

i) 100 нг дДНК;i) 100 ng dDNA;

ii) 2,5 мкл буфера II из набора AccuPrime;ii) 2.5 µl of buffer II from the AccuPrime kit;

iii) 0,1 мкл HiFi Taq из набора AccuPrime;iii) 0.1 µl HiFi Taq from the AccuPrime kit;

iv) 1 мкл JRH261 (ctccggaatgtctccatttg (SEQ ID NO: 87)) (10 мкМ);iv) 1 µl JRH261 (ctccggaatgtctccatttg (SEQ ID NO: 87)) (10 µM);

v) 1 мкл JRH264 (atgagggagagactggcatc (SEQ ID NO: 88)) (10 мкМ); и vi) вода до общего объема 25 мкл.v) 1 µl JRH264 (atgagggaggactggcatc (SEQ ID NO: 88)) (10 µM); and vi) water to a total volume of 25 μl.

Реакции осуществляли на термоциклере в соответствии с нижеследующим:The reactions were carried out on a thermal cycler according to the following:

i) 95° в течение 4 минут;i) 95° for 4 minutes;

ii) 95° в течение 30 с;ii) 95° for 30 s;

iii) 52° в течение 30 с;iii) 52° for 30 s;

iv) 68° в течение 1:00 мин;iv) 68° for 1:00 min;

v) циклическое повторение стадий ii)-iv) 35 раз, при этом постоянно при 4°.v) cycling steps ii)-iv) 35 times, while constantly at 4°.

Продукты ПЦР-реакций разделяли на геле (фиг. 22). Ожидаемые размеры полос составляли 718 нт в случае отсутствия делеции (т.е. экзон 52 по-прежнему присутствовал) и примерно 392 нт в случае делеции экзона 52. Как показано на фиг. 22, у мышей-основателей 7, 63 и 76 имелась делеция экзона 52.The products of PCR reactions were separated on the gel (Fig. 22). The expected band sizes were 718 nt in the case of no deletion (ie, exon 52 was still present) and approximately 392 nt in the case of exon 52 deletion. As shown in FIG. 22, founder mice 7, 63, and 76 had a deletion of exon 52.

Полосы амплифицированных продуктов секвенировали с применением праймера для JRH264 (см. фиг. 23) для определения последовательностей воссоединенных концов областей, подвергнутых наThe bands of the amplified products were sequenced using primer for JRH264 (see Fig. 23) to determine the sequences of the rejoined ends of the regions subjected to

- 52 042798 целиванию. На фиг. 23 показана секвенированная область, где буквы, выделенные жирным шрифтом, подчеркиванием и обычным начертанием, обозначают нативные последовательности, и буквы, выделенные курсивом, обозначают вставки или делеции. В ожидаемой последовательности (дельта 52) буквы, выделенные жирным шрифтом, связаны с буквами, выделенными подчеркиванием. В последовательностях от мышей-основателей в этой области находились вставки (буквы, выделенные курсивом) и делеции (дефисы).- 52 042798 healing. In FIG. 23 shows a sequenced region where letters in bold, underline and normal indicate native sequences and letters in italics indicate insertions or deletions. In the expected sequence (delta 52), bold letters are related to underlined letters. The sequences from founding mice had insertions (letters in italics) and deletions (hyphens) in this region.

Самцов мышей-основателей спаривали с самками mdx/mdx для селекции химерных организмов (фиг. 24). Представители потомства, полученные от самцов мышей-основателей 76 или самцов мышейоснователей 63 и самок mdx/mdx, подвергали скринингу и генотипированию в отношении делеции экзона 52 с применением условий, используемых на фиг. 22 (фиг. 25 и 26 соответственно). Если экзон 52 был подвергнут делеции, то ожидаемый размер полосы составлял приблизительно 392 нт. Если присутствовал экзон 52, то ожидаемый размер полосы составлял приблизительно 718 нт. У детенышей 54497 и 54498 (от пары скрещивания: самец мыши-основателя 63+самка mdx/mdx) имелась делеция экзона 52, и в отношении нее осуществляли секвенирование (фиг. 27). Детеныши 54497 и 54498 характеризовались 92,86% идентичностью друг с другом согласно прочтению секвенирования размером 392 п.о., при этом вставки/делеции были идентичными.Male founding mice were mated with mdx/mdx females to select for chimeric organisms (FIG. 24). Progeny derived from male 76 founder mice or male 63 founder mice and mdx/mdx females were screened and genotyped for exon 52 deletion using the conditions used in FIG. 22 (FIGS. 25 and 26, respectively). If exon 52 was deleted, the expected band size was approximately 392 nt. If exon 52 was present, the expected band size was approximately 718 nt. Pups 54497 and 54498 (from the mating pair: male founding mouse 63 + female mdx/mdx) had a deletion of exon 52 and were sequenced (FIG. 27). Pups 54497 and 54498 had 92.86% identity with each other according to a 392 bp sequencing read, with inserts/deletions being identical.

Уровень экспрессии дистрофина у здоровой мыши hDMD/mdx и мыши A52/mdx сравнивали по результатам флуоресцентной иммуногистохимии. Как показано на фиг. 28, у детенышей 54497 и 54498 от мышей A52/mdx отсутствовал белок дистрофин. В случае окрашивания сердца выдержка для зонда ламинина составляла 100 мс, тогда как выдержка для дистрофина составляла 900 мс. В случае образца TA мышцы выдержка для зонда ламинина и дистрофина составляла 2,0 с. См. также фиг. 29, на которой показано, что у мыши A52/mdx отсутствовал белок дистрофин. Экспрессия дистрофина утрачивалась как в сердце, так и TA мышце мыши A52/mdx. В TA мышце наблюдали несколько самопроизвольно образованных ревертантных волокон (случайные события сплайсинга или соматические мутации), однако это согласовывалось с мышиной моделью mdx. Результаты вестерн-блоттинга также указывали на то, что у мыши A52/mdx отсутствовал белок дистрофин, что согласовывалось с характерным для DMD генотипом, тогда как у здоровой мыши hDMD/mdx дистрофин экспрессировался. См. фиг. 30.The expression level of dystrophin in a healthy hDMD/mdx mouse and A52/mdx mouse was compared by fluorescent immunohistochemistry. As shown in FIG. 28, pups 54497 and 54498 from A52/mdx mice lacked the dystrophin protein. In the case of heart staining, the exposure for the laminin probe was 100 ms, while the exposure for dystrophin was 900 ms. In the case of the TA muscle sample, the exposure time for the laminin and dystrophin probe was 2.0 s. See also FIG. 29, which shows that the A52/mdx mouse lacked the dystrophin protein. Dystrophin expression was lost in both the heart and TA muscle of the A52/mdx mouse. Several spontaneously formed revertant fibers (random splicing events or somatic mutations) were observed in TA muscle, however, this was consistent with the mdx mouse model. Western blot results also indicated that the A52/mdx mouse lacked the dystrophin protein, consistent with the characteristic DMD genotype, while the healthy hDMD/mdx mouse expressed dystrophin. See fig. thirty.

Мышь A52/mdx демонстрировала уровни активности, аналогичные мышам mdx, после первых пяти минут теста открытого поля. В тесте открытого поля мышам давали возможность свободно изучить арену открытого поля (20x20x30 см) в течение 30 мин. Активность и положение животного автоматически контролировали с помощью инфракрасных диодов (по осям x, y и z), сопряженных с запущенным на компьютере программным обеспечением Fusion для анализа активности (версия 5.3, Omnitech, Колумбус, Огайо). На фиг. 31 показана общая активность мыши A52/mdx по сравнению с мышами mdx и мышами hDMD/mdx, указанная на основании двигательной активности и осмотра. Пройденное расстояние и вертикальные активности в виде стойки показаны соответственно на левой и правой панелях.The A52/mdx mouse exhibited activity levels similar to mdx mice after the first five minutes of the open field test. In the open field test, mice were allowed to freely explore an open field arena (20x20x30 cm) for 30 minutes. Animal activity and position were automatically monitored using infrared diodes (in x, y, and z axes) coupled to Fusion activity analysis software (version 5.3, Omnitech, Columbus, Ohio) running on a computer. In FIG. 31 shows the overall activity of an A52/mdx mouse compared to mdx mice and hDMD/mdx mice based on locomotor activity and visual inspection. The distance traveled and vertical rack activities are shown in the left and right panels, respectively.

Пример 3. Восстановление экспрессии дистрофина путем удаления экзона 51.Example 3 Restoration of dystrophin expression by removing exon 51.

Посредством удаления экзона 51 у мыши A52/mdx можно создать генотип, подобный таковому для мышечной дистрофии Беккера (BMD), и в теории восстановить экспрессию дистрофина. Мышь A52/mdx использовали для демонстрации восстановления экспрессии дистрофина путем удаления экзона 51 с применением раскрытой системы редактирования генов на основе CRISPR/Cas9. На фиг. 32 показана стратегия коррекций с применением SaCas9 и gRNA для пропуска экзона 51 с помощью нацеливания gRNA выше и ниже экзона 51 в интронной области.By deleting exon 51 in the A52/mdx mouse, one could create a genotype similar to that of Becker muscular dystrophy (BMD) and theoretically restore dystrophin expression. An A52/mdx mouse was used to demonstrate restoration of dystrophin expression by deleting exon 51 using the disclosed CRISPR/Cas9 based gene editing system. In FIG. 32 shows a strategy for corrections using SaCas9 and gRNA to skip exon 51 by targeting gRNA upstream and downstream of exon 51 in the intron region.

Стандарт: плазмиды, содержащие JCR179 (выше) или JCR183 gRNA (ниже) (SEQ ID NO: 37 и SEQ ID NO: 38 соответственно) и SaCas9, электропорировали в миобласты от пациентов с DMD. Белок выделяли из дифференцированных клеток и анализировали с помощью вестерн-блоттинга с применением антитела к дистрофину. На фиг. 33 показано, что геномная ДНК может быть отредактирована с восстановлением экспрессии белка дистрофина, так как клетки, обработанные с помощью всех 3 компонентов (т.е. обеих gRNA и SaCas9), демонстрировали экспрессию дистрофина.Standard: Plasmids containing JCR179 (above) or JCR183 gRNA (below) (SEQ ID NO: 37 and SEQ ID NO: 38, respectively) and SaCas9 were electroporated into myoblasts from DMD patients. The protein was isolated from differentiated cells and analyzed by Western blotting using an antibody to dystrophin. In FIG. 33 shows that genomic DNA can be edited to restore dystrophin protein expression, as cells treated with all 3 components (ie both gRNA and SaCas9) showed dystrophin expression.

Затем систему тестировали на мыши A52/mdx. На фиг. 34 показана схема эксперимента по обработке мыши A52/mdx с применением системы на основе gRNA и SaCas9, в том числе схематические изображения 2 вирусных векторов, применяемых в схеме эксперимента. Конструкции на основе рекомбинантного вируса AAV8 создавали с применением векторов PT366-179 (SEQ ID NO: 39) и PT366-183 (SEQ ID NO: 40) и способов получения вирусных частиц, известных из уровня техники. Эти вирусные векторы (AAV8) совместно доставляли in vivo в виде двух вирусных частиц. Каждая вирусная частица содержала SaCas9 и одну из gRNA (см. фиг. 3). Мышей A52/mdx обрабатывали с помощью конструкций на основе рекомбинантного вируса AAV8 в количестве 5E11. Вирус вводили посредством внутримышечной инъекции в правую TA мышцу, при этом левая TA мышца служила в качестве контралатерального контроля, и в нее вводили посредством инъекции PBS. После обработки удаляли как левую, так и правую TA мышцы, и из каждой получали срезы для анализов геномной ДНК. Как показано на фиг. 35, ПЦР осуществляли в пределах представляющей интерес области, и полосы, соответствующие форме с делецией, отмечали в случае обработанной правой TA мышцы на приведенном слева геле, что указываетThe system was then tested on an A52/mdx mouse. In FIG. 34 shows a design of an A52/mdx mouse processing experiment using a gRNA and SaCas9 based system, including schematics of the 2 viral vectors used in the design of the experiment. Recombinant AAV8 constructs were generated using the PT366-179 (SEQ ID NO: 39) and PT366-183 (SEQ ID NO: 40) vectors and methods for preparing virus particles known in the art. These viral vectors (AAV8) were co-delivered in vivo as two viral particles. Each viral particle contained SaCas9 and one of the gRNAs (see Fig. 3). A52/mdx mice were treated with 5E11 recombinant AAV8 virus constructs. The virus was injected intramuscularly into the right TA muscle, with the left TA muscle serving as a contralateral control, and injected with PBS. After treatment, both left and right TA muscles were removed and sections were obtained from each for genomic DNA analyses. As shown in FIG. 35, PCR was performed within the region of interest, and bands corresponding to the deletion shape were noted in the case of the right TA-treated muscle on the gel shown on the left, indicating

- 53 042798 на некоторый уровень редактирования генов. Полосу, соответствующую форме с делецией, секвенировали, и основной продукт представлял собой ожидаемый продукт лигирования 3 пар оснований от PAM каждой gRNA. На фиг. 35 показана делеция экзона 51 in vivo в правой TA мышце.- 53 042798 to some level of gene editing. The band corresponding to the deletion form was sequenced and the main product was the expected 3 bp ligation product from the PAM of each gRNA. In FIG. 35 shows an in vivo exon 51 deletion in the right TA muscle.

Аналогично анализировали срезы обработанной правой TA мышцы и контрольной левой TA мышцы для определения того, обеспечивалось ли редактирование посредством РНК. ПЦР осуществляли в пределах экзонов 50-53 в кДНК. Как показано на приведенном справа геле на фиг. 36, в двух из обработанных образцов наблюдалось отсутствие экзона 51 и 52. Полосу, соответствующую форме с делецией, секвенировали, при этом основной продукт представлял собой продукт лигирования экзона 50 с 53, как этого и следовало ожидать с учетом того, что у мыши уже отсутствовал экзон 52, и система редактирования генов на основе CRISPR/Cas9 удаляла экзон 51 (см. хроматограмму результатов секвенирования внизу справа). На фиг. 36 показана делеция экзона 51 in vivo в правой TA мышце.Similarly, sections of treated right TA muscle and control left TA muscle were analyzed to determine if RNA editing was provided. PCR was performed within exons 50-53 in cDNA. As shown in the gel shown on the right in FIG. 36, exon 51 and 52 were missing in two of the treated samples. The deletion band was sequenced, with the main product being the ligation of exon 50 to 53, as would be expected given that the mouse already lacked exon 52, and a CRISPR/Cas9 based gene editing system deleted exon 51 (see chromatogram of sequencing results, bottom right). In FIG. 36 shows an in vivo exon 51 deletion in the right TA muscle.

На фиг. 37 показано иллюстративное флуоресцентное иммуногистохимическое окрашивание, указывающее на присутствие небольшого количества дистрофина в контрольной левой TA мышце, в которую вводили посредством инъекции PBS, у мыши A52/mdx. Причинами некоторой степени зеленого окрашивания на дистрофин в контрольной левой TA могут являться ревертантные волокна или погибшие клетки, которые иногда также окрашиваются в зеленый цвет. Наблюдали четкое повышение степени зеленого окрашивания на дистрофин в обработанной правой TA мышце, как показано на правой фотографии. На фиг. 37 показано восстановление белка дистрофина in vivo в обработанной TA мышце.In FIG. 37 shows exemplary fluorescent immunohistochemical staining indicating the presence of a small amount of dystrophin in the PBS-injected control left TA muscle in an A52/mdx mouse. Reasons for some green staining for dystrophin in the control left TA may be reverted fibers or dead cells, which sometimes also stain green. A clear increase in the degree of green staining for dystrophin was observed in the treated right TA muscle, as shown in the right photo. In FIG. 37 shows in vivo recovery of dystrophin protein in TA-treated muscle.

Белок экстрагировали из левой и правой TA мышц от 3 тестируемых мышей, при этом осуществляли вестерн-блот-анализ. На фиг. 38 показано восстановление белка дистрофина in vivo в обработанной TA мышце. В контрольных левых TA мышцах не наблюдали экспрессию белка, тогда как все три правые TA мышцы демонстрировали различные уровни экспрессии белка дистрофина. Экспрессия белка в правой TA мыши 1 была наиболее сильной, тогда как у мышей 2 и 3 она была слабой, но тем не менее проявлялась в виде полос. Раскрытая система редактирования генов на основе CRISPR/Cas9 функционировала in vivo с восстановлением экспрессии белка дистрофина до некоторой степени у мыши A52/mdx.Protein was extracted from the left and right TA muscles from 3 test mice, and Western blot analysis was performed. In FIG. 38 shows in vivo recovery of dystrophin protein in TA-treated muscle. In the control left TA muscles, no protein expression was observed, while all three right TA muscles showed different levels of dystrophin protein expression. The expression of the protein in the right TA mouse 1 was the strongest, while in mice 2 and 3 it was weak, but nevertheless appeared as bands. The disclosed CRISPR/Cas9 based gene editing system functioned in vivo to restore dystrophin protein expression to some extent in the A52/mdx mouse.

Физиологическое тестирование мышей. Мышей, подлежащих обработке (все самцы hDMDΔ52(гетеро)/mdx(геми) мышей), обрабатывали с помощью конструкций на основе рекомбинантного вируса AAV8 (n=10) или AAV9 (n=10), содержащего SaCas9 и gRNA, и проводили сравнение с необработанными мышами (hDMD-Δ52/mdx) (n=10). Конструкции на основе рекомбинантного вируса AAV создавали с применением векторов PT366-179 (SEQ ID NO: 39) и PT366-183 (SEQ ID NO: 40) и с применением известных из уровня техники способов. Мышам, подлежащим обработке, вводили посредством инъекции 200 мкл вируса в хвостовую вену в возрасте 6-8 недель. Тестирование мышей осуществляли спустя 8 недель.Physiological testing of mice. The mice to be treated (all male hDMDΔ52(hetero)/mdx(hemi) mice) were treated with recombinant AAV8 (n=10) or AAV9 (n=10) virus constructs containing SaCas9 and gRNA and compared with untreated mice (hDMD-Δ52/mdx) (n=10). Recombinant AAV constructs were generated using vectors PT366-179 (SEQ ID NO: 39) and PT366-183 (SEQ ID NO: 40) and using methods known in the art. Mice to be treated were injected with 200 μl of virus into the tail vein at 6-8 weeks of age. Mice were tested after 8 weeks.

Тест открытого поля с определением расстояния. Мышам давали возможность свободно изучить арену открытого поля в течение 30 мин. Активность и положение животных автоматически контролировали с помощью инфракрасных диодов, совместимых с запущенным на компьютере программным обеспечением Fusion для анализа активности. Данные собирали непрерывно и группировали за 5-минутные промежутки времени. На фиг. 39 показано среднее значение всех моментов времени для общего пройденного расстояния у 16-недельных мышей, которых обрабатывали в возрасте 8 недель, по сравнению с 16-недельными мышами, которых не обрабатывали. Среднее значение всех моментов времени для общего числа поз со стоянием на задних лапах спустя 16 недель показаны на фиг. 40. Статистическими методами являлись следующие: однофакторный ANOVA, сравнение среднего значения каждого столбца со средним значением для необработанного контроля и апостериорный анализ с помощью критерия Даннета (среднее значение +/-SEM). Мыши, которых обрабатывали с помощью AAV8 и AAV9, демонстрировали статистически значимый результат в виде большего пройденного расстояния, чем необработанные мыши соответствующей возрастной группы (статистическая значимость). Все обработанные мыши демонстрировали статистически значимый результат в виде большего числа поз со стоянием на задних лапах по сравнению с необработанным контролем соответствующей возрастной группы.Open field test with distance determination. The mice were allowed to freely explore the open field arena for 30 min. The activity and position of the animals were automatically monitored using infrared diodes compatible with the Fusion activity analysis software running on a computer. Data was collected continuously and grouped at 5 minute intervals. In FIG. 39 shows the mean of all time points for total distance traveled in 16 week old mice treated at 8 weeks of age compared to 16 week old mice not treated. The average of all time points for the total number of rearing postures after 16 weeks is shown in FIG. 40. Statistical methods were as follows: one-way ANOVA, comparison of the mean of each column with the mean of the raw control, and post hoc analysis using Dunnett's test (mean +/-SEM). Mice treated with AAV8 and AAV9 showed a statistically significant result in terms of greater walking distance than untreated mice of the corresponding age group (statistically significant). All treated mice showed a statistically significant result in more rearing postures compared to untreated age-matched controls.

Сила хватки. Силу хватки тестировали у 16-недельных необработанных и обработанных мышей. Мыши проходили 3-5 испытаний, каждое из которых предназначалось для тестирования силы хватки передних и задних лап. Средние результаты испытаний показаны на фиг. 41. Силу хватки отмечали в виде грамм-силы. Как показано на фиг. 41, мыши, которых обрабатывали с помощью AAV9, демонстрировали статистически значимый результат в виде повышенного значения силы хватки передними лапами по сравнению с необработанными мышами соответствующей возрастной группы. Статистическими методами были следующие: двухфакторный ANOVA, апостериорный анализ с помощью критерия Тьюки.Grip strength. Grip strength was tested in 16 week old untreated and treated mice. The mice underwent 3-5 trials, each of which was designed to test the grip strength of the front and hind legs. The average test results are shown in FIG. 41. The strength of the grip was noted as a gram-force. As shown in FIG. 41, mice treated with AAV9 showed a statistically significant result of increased forepaw grip strength compared to age-matched untreated mice. Statistical methods were as follows: two-way ANOVA, post hoc analysis using Tukey's test.

кДНК ПЦР. Ткани из образцов сердца мышей подвергали обработке с применением универсального мини-набора RNEasy Plus (Qiagen). Полученную РНК обратно транскрибировали в кДНК с применением набора для синтеза кДНК Superscript VILO. 1 мкл кДНК подвергали ПЦР-амплификации с применением ДНК-полимеразы из набора AccuPrime и праймеров к экзону 48 (прямой праймер: gtttccagagctttacctgagaa (SEQ ID NO: 89)) и экзону 54 (обратный праймер: CTTTTATGAATGCTTCTCCAAG (SEQ ID NO: 90)). Ожидаемые размеры полос составляли 997 нт в случае отсутствия делеции (т.е. экзон 52 по-прежнемуcDNA PCR. Tissues from mouse heart samples were processed using the RNEasy Plus Universal Mini Kit (Qiagen). The resulting RNA was reverse transcribed into cDNA using the Superscript VILO cDNA synthesis kit. 1 µl of cDNA was subjected to PCR amplification using DNA polymerase from the AccuPrime kit and primers for exon 48 (forward primer: gtttccagagctttacctgagaa (SEQ ID NO: 89)) and exon 54 (reverse primer: CTTTTATGAATGCTTCTCCAAG (SEQ ID NO: 90)). The expected band sizes were 997 nt in the absence of a deletion (i.e., exon 52 is still

- 54 042798 присутствовал) и примерно 764 нт в случае делеции экзона 52. На фиг. 42 показаны результаты для мышей P2, которым вводили посредством инъекции в лицевую вену AAV9 (JA10 (P2 AAV9)) в возрасте 36-50 часов с момента рождения, и для взрослых мышей, которым вводили посредством инъекции в хвостовую вену AAV8 (JA11 (TV AAV8)) в количестве 3,3-7,7E12 или AAV9 (JA12 (TV AAV9)) в количестве 4,3-7,5E12. Как показано на фиг. 42, редактирование происходило в различной степени у мышей P2 (мыши возрастом 48-54 часов с момента рождения), которых обрабатывали с помощью AAV9, и взрослых мышей, которых обрабатывали с помощью AAV8 и AAV9, что дополнительно подтверждалось путем секвенирования полосы, соответствующей форме с делецией, с применением праймера tttctgtgattttcttttggattg (SEQ ID NO: 109), связывающегося с экзоном 53. На фиг. 43 показана иллюстративная хроматограмма, на которой показана делеция экзонов 51 и 52 в последовательности из полосы, соответствующей форме с делецией, от мыши 1, обработанной с помощью Ja10.- 54 042798 was present) and approximately 764 nt in the case of a deletion of exon 52. FIG. 42 shows results for P2 mice injected with facial vein injection of AAV9 (JA10 (P2 AAV9)) at 36-50 hours of age from birth and adult mice injected with tail vein of AAV8 (JA11 (TV AAV8 )) in the amount of 3.3-7.7E12 or AAV9 (JA12 (TV AAV9)) in the amount of 4.3-7.5E12. As shown in FIG. 42, editing occurred to varying degrees in P2 mice (mice 48-54 hours old from birth) that were treated with AAV9 and adult mice that were treated with AAV8 and AAV9, which was further confirmed by sequencing the band corresponding to the form c deletion using primer tttctgtgattttcttttggattg (SEQ ID NO: 109) binding to exon 53. FIG. 43 shows an exemplary chromatogram showing the deletion of exons 51 and 52 in sequence from the band corresponding to the deletion form from mouse 1 treated with Ja10.

Подразумевается, что вышеприведенное подробное описание и сопровождающие примеры являются лишь иллюстративными и не должны рассматриваться в качестве ограничений объема настоящего изобретения, который определяется исключительно прилагаемой формулой изобретения и ее эквивалентами.The foregoing detailed description and accompanying examples are intended to be illustrative only and should not be construed as limiting the scope of the present invention, which is defined solely by the appended claims and their equivalents.

Различные изменения и модификации раскрытых вариантов осуществления будут очевидны для специалистов в данной области техники. Такие изменения и модификации, в том числе без ограничения те, которые связаны с химическими структурами, заместителями, производными, промежуточными соединениями, синтезами, композициями, составами или способами применения настоящего изобретения, могут быть сделаны без отхода от его сути и объема.Various changes and modifications to the disclosed embodiments will be apparent to those skilled in the art. Such changes and modifications, including without limitation those related to the chemical structures, substituents, derivatives, intermediates, syntheses, compositions, formulations, or uses of the present invention, may be made without departing from its spirit and scope.

В целях обеспечения полноты, различные аспекты настоящего изобретения изложены в следующих пронумерованных пунктах.For the sake of completeness, various aspects of the present invention are set forth in the following numbered paragraphs.

1. Направляющая РНК (gRNA), содержащая нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность.1. Guide RNA (gRNA) containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO : 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, or its complementary sequence.

2. Композиция для нацеливания на ДНК, содержащая первую gRNA и вторую gRNA, при этом первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность, где первая молекула gRNA и вторая молекула gRNA содержат разные нацеливающие домены.2. DNA targeting composition comprising a first gRNA and a second gRNA, wherein the first gRNA molecule and the second gRNA molecule contain a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO : 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11 , SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, or its complementary sequence, where the first gRNA molecule and the second gRNA molecule contain different targeting domains.

3. Композиция для нацеливания на ДНК по п.2, где первая молекула gRNA представлена под SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 или SEQ ID NO: 41, и вторая молекула gRNA представлена под SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 или SEQ ID NO: 42.3. The DNA targeting composition of claim 2, wherein the first gRNA molecule is listed under SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 or SEQ ID NO: 41, and the second gRNA molecule is shown under SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, or SEQ ID NO: 42.

4. Композиция для нацеливания на ДНК по п.2 или 3, где первая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 и SEQ ID NO: 15, и вторая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.4. A DNA targeting composition according to claim 2 or 3, wherein the first gRNA molecule is selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 and SEQ ID NO: 15, and the second gRNA molecule is selected from the group consisting of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 and SEQ ID NO: 19.

5. Композиция для нацеливания на ДНК по любому из пп.2-4, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;5. A DNA targeting composition according to any one of claims 2-4, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 2;

(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

- 55 042798 (vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;- 55 042798 (vi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(viii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15;(x) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15;

(xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 42.(xi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18; and (xii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 41 and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 42.

6. Композиция для нацеливания на ДНК по любому из пп.2-5, дополнительно содержащая белок (Cas), ассоциированный с короткими палиндромными повторами, регулярно расположенными группами.6. A DNA targeting composition according to any one of claims 2 to 5, further comprising a protein (Cas) associated with short palindromic repeats in regularly arranged groups.

7. Композиция для нацеливания на ДНК по п.6, где белок Cas предусматривает молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).7. The DNA targeting composition of claim 6, wherein the Cas protein comprises a Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25).

8. Композиция для нацеливания на ДНК по п.6 или 7, где белок Cas предусматривает молекулу Cas9 из Staphylococcus aureus, содержащую аминокислотную последовательность под SEQ ID NO: 45.8. A DNA targeting composition according to claim 6 or 7, wherein the Cas protein comprises a Cas9 molecule from Staphylococcus aureus comprising the amino acid sequence of SEQ ID NO: 45.

9. Композиция для нацеливания на ДНК по любому из пп.2-8, где композиция для нацеливания на ДНК содержит нуклеотидную последовательность под SEQ ID NO: 83, нуклеотидную последовательность под SEQ ID NO: 84, нуклеотидную последовательность под SEQ ID NO: 37 и/или нуклеотидную последовательность под SEQ ID NO: 38.9. A DNA targeting composition according to any one of claims 2 to 8, wherein the DNA targeting composition comprises the nucleotide sequence of SEQ ID NO: 83, the nucleotide sequence of SEQ ID NO: 84, the nucleotide sequence of SEQ ID NO: 37, and /or a nucleotide sequence under SEQ ID NO: 38.

10. Выделенный полинуклеотид, содержащий молекулу gRNA по п.1 или композицию для нацеливания на ДНК по любому из пп.2-9.10. An isolated polynucleotide comprising a gRNA molecule according to claim 1 or a DNA targeting composition according to any one of claims 2-9.

11. Вектор, содержащий gRNA по п.1, композицию для нацеливания на ДНК по любому из пп.2-9 или выделенный полинуклеотид по п.10.11. A vector containing a gRNA according to claim 1, a DNA targeting composition according to any one of claims 2-9, or an isolated polynucleotide according to claim 10.

12. Вектор, содержащий композицию для нацеливания на ДНК по любому из пп.6-9.12. A vector containing a DNA targeting composition according to any one of claims 6-9.

13. Вектор, кодирующий (a) первую молекулу направляющей РНК (gRNA);13. Vector encoding (a) the first guide RNA molecule (gRNA);

(b) вторую молекулу gRNA; и (c) по меньшей мере одну молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, или комплементарную ей последовательность, где первая молекула gRNA и вторая молекула gRNA содержат разные нацеливающие домены.(b) a second gRNA molecule; and (c) at least one Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25), wherein the first gRNA molecule and the second gRNA molecule contain a targeting a domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7 , SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 41, SEQ ID NO: 42, or its complementary sequence, where the first gRNA molecule and the second gRNA molecule contain different targeting domains.

14. Вектор по п.13, где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов в первом и втором интронах, фланкирующих экзон 51 гена DMD человека.14. The vector of claim 13, wherein the vector is constructed to form first and second double strand breaks in the first and second introns flanking exon 51 of the human DMD gene.

15. Вектор по п.13 или 14, где первая молекула gRNA представлена под SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 или SEQ ID NO: 41, и вторая молекула gRNA представлена под SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 или SEQ ID NO: 42.15. The vector according to claim 13 or 14, where the first gRNA molecule is presented under SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 or SEQ ID NO: 41, and the second gRNA molecule is shown under SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, or SEQ ID NO: 42.

16. Вектор по любому из пп.13-15, где первая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 и SEQ ID NO: 15, и вторая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.16. The vector according to any one of claims 13-15, wherein the first gRNA molecule is selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 and SEQ ID NO: 15, and the second gRNA molecule is selected from the group consisting of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 and SEQ ID NO: 19.

17. Вектор по любому из пп.13-16, при этом первая молекула gRNA и вторая молекула gRNA вы17. The vector according to any one of claims 13-16, wherein the first gRNA molecule and the second gRNA molecule are

- 56 042798 браны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;- 56 042798 branes from the group consisting of (i) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 2;

(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(vi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(viii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15; и (xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18.(x) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15; and (xi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18.

18. Вектор по любому из пп.11-17, где вектор представляет собой вирусный вектор.18. A vector according to any one of claims 11-17, wherein the vector is a viral vector.

19. Вектор по п.18, где вектор представляет собой вектор на основе аденоассоциированного вируса (AAV).19. The vector of claim 18, wherein the vector is an adeno-associated virus (AAV) vector.

20. Вектор по п.19, где вектор на основе AAV представляет собой вектор на основе AAV8 или вектор на основе AAV9.20. The vector of claim 19, wherein the AAV-based vector is an AAV8-based vector or an AAV9-based vector.

21. Вектор по любому из пп.11-20, где вектор содержит тканеспецифичный промотор, функционально связанный с нуклеотидной последовательностью, кодирующей первую молекулу gRNA, вторую молекулу gRNA и/или молекулу Cas9.21. A vector according to any one of claims 11-20, wherein the vector contains a tissue-specific promoter operably linked to a nucleotide sequence encoding a first gRNA molecule, a second gRNA molecule and/or a Cas9 molecule.

22. Вектор по п.21, где тканеспецифичный промотор представляет собой промотор, специфичный в отношении мышц.22. The vector of claim 21, wherein the tissue-specific promoter is a muscle-specific promoter.

23. Клетка, содержащая gRNA по п.1, композицию для нацеливания на ДНК по любому из пп.2-9, выделенный полинуклеотид по п.10 или вектор по любому из пп.11-22.23. A cell comprising a gRNA according to claim 1, a DNA targeting composition according to any one of claims 2-9, an isolated polynucleotide according to claim 10, or a vector according to any one of claims 11-22.

24. Набор, содержащий gRNA по п.1, систему для нацеливания на ДНК по любому из пп.2-9, выделенный полинуклеотид по п.10, вектор по любому из пп.11-22 или клетку по п.23 и необязательно инструкции по применению.24. A kit containing a gRNA according to claim 1, a DNA targeting system according to any one of claims 2-9, an isolated polynucleotide according to claim 10, a vector according to any one of claims 11-22 or a cell according to claim 23, and optionally instructions by application.

25. Способ коррекции мутантного гена дистрофина в клетке, при этом способ предусматривает введение в клетку gRNA по п.1, системы для нацеливания на ДНК по любому из пп.2-9, выделенного полинуклеотида по п.10 или вектора по любому из пп.11-22.25. A method for correcting a mutant dystrophin gene in a cell, wherein the method involves introducing into the cell a gRNA according to claim 1, a DNA targeting system according to any one of claims 2-9, an isolated polynucleotide according to claim 10, or a vector according to any one of claims. 11-22.

26. Способ редактирования мутантного гена дистрофина в геноме субъекта, при этом способ предусматривает введение субъекту композиции для редактирования генома, содержащей gRNA по п.1, системы для нацеливания на ДНК по любому из пп.2-9, выделенного полинуклеотида по п.10, вектора по любому из пп. 11-22 или клетки по п.23.26. A method for editing a mutant dystrophin gene in the genome of a subject, the method comprising administering to the subject a genome editing composition comprising a gRNA according to claim 1, a DNA targeting system according to any one of claims 2 to 9, an isolated polynucleotide according to claim 10, vector according to any one of paragraphs. 11-22 or cells according to item 23.

27. Способ по п.26, где композицию для редактирования генома вводят субъекту внутримышечно, внутривенно или с помощью их комбинации.27. The method of claim 26, wherein the genome editing composition is administered to the subject intramuscularly, intravenously, or a combination thereof.

28. Способ по любому из пп.25-27, где коррекция мутантного гена дистрофина предусматривает опосредованное нуклеазой негомологичное соединение концов.28. The method of any one of claims 25-27, wherein the correction of the mutant dystrophin gene involves nuclease-mediated non-homologous end joining.

29. Способ лечения субъекта, нуждающегося в этом, у которого имеется мутантный ген дистрофина,29. A method of treating a subject in need thereof who has a mutated dystrophin gene,

- 57 042798 при этом способ предусматривает введение субъекту gRNA по п.1, системы для нацеливания на ДНК по любому из пп.2-9, выделенного полинуклеотида по п.10, вектора по любому из пп.11-22 или клетки по п.23.- 57 042798, wherein the method comprises administering to the subject a gRNA according to claim 1, a DNA targeting system according to any one of claims 2-9, an isolated polynucleotide according to claim 10, a vector according to any one of claims 11-22, or a cell according to claim 23.

30. Модифицированный вектор на основе аденоассоциированного вируса для редактирования мутантного гена дистрофина в геноме субъекта, содержащий первую полинуклеотидную последовательность, кодирующую gRNA по п.1, и вторую полинуклеотидную последовательность, кодирующую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).30. A modified vector based on adeno-associated virus for editing the mutant dystrophin gene in the subject's genome, containing the first polynucleotide sequence encoding the gRNA according to claim 1, and the second polynucleotide sequence encoding the Cas9 molecule, which recognizes the motif adjacent to the protospacer (PAM) or NNGRRT ( SEQ ID NO: 24), or NNGRRV (SEQ ID NO: 25).

31. Модифицированный вектор на основе аденоассоциированного вируса по п.30, где модифицированный вектор на основе аденоассоциированного вируса содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 39 или SEQ ID NO: 40.31. The modified adeno-associated virus vector according to claim 30, wherein the modified adeno-associated virus vector contains the nucleotide sequence set forth under SEQ ID NO: 39 or SEQ ID NO: 40.

32. Композиция для обеспечения делеции сегмента гена дистрофина, содержащего экзон 51, при этом композиция содержит (a) первый вектор, содержащий полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второй вектор, содержащий полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где каждая из первой и второй молекул gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, и где первый вектор и второй вектор сконструированы с возможностью образования первого и второго двухнитевых разрывов в первом интроне и втором интроне, фланкирующих соответственно экзон 51 гена DMD человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.32. A composition for providing a deletion of a dystrophin gene segment containing exon 51, wherein the composition comprises (a) a first vector containing a polynucleotide sequence encoding a first guide RNA (gRNA) molecule and a polynucleotide sequence encoding a first Cas9 molecule that recognizes an adjacent a protospacer motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25); and (b) a second vector containing a polynucleotide sequence encoding a second gRNA molecule and a polynucleotide sequence encoding a second Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO : 25), where each of the first and second gRNA molecules contains a targeting domain, the length of which is from 19 to 24 nucleotides, and where the first vector and the second vector are designed to form the first and second double-strand breaks in the first intron and the second intron, flanking, respectively exon 51 of the human DMD gene, thereby providing a deletion of the segment of the dystrophin gene containing exon 51.

33. Композиция по п.32, где длина сегмента составляет от приблизительно 50 п.о. до приблизительно 2000 п.о.33. The composition according to claim 32, where the length of the segment is from about 50 p. up to about 2000 bp

34. Композиция по п.33, где длина сегмента составляет приблизительно 118 п.о., приблизительно 233 п.о., приблизительно 326 п.о., приблизительно 766 п.о., приблизительно 805 п.о. или приблизительно 1611 п.о.34. The composition of claim 33, wherein the segment length is about 118 bp, about 233 bp, about 326 bp, about 766 bp, about 805 bp. or approximately 1611 p.

35. Композиция по любому из пп.32-34, где первая молекула Cas9 и вторая молекула Cas9 являются идентичными.35. A composition according to any one of claims 32-34, wherein the first Cas9 molecule and the second Cas9 molecule are identical.

36. Композиция по п.35, где первая молекула Cas9 и вторая молекула Cas9 представляют собой молекулу Cas9 из Staphylococcus aureus.36. The composition of claim 35, wherein the first Cas9 molecule and the second Cas9 molecule are a Cas9 molecule from Staphylococcus aureus.

37. Композиция по п.36, где первая молекула Cas9 и вторая молекула Cas9 представляют собой мутантную молекулу Cas9 из Staphylococcus aureus.37. The composition of claim 36, wherein the first Cas9 molecule and the second Cas9 molecule are a mutant Cas9 molecule from Staphylococcus aureus.

38. Композиция по любому из пп.32-34, где первая молекула Cas9 и вторая молекула Cas9 являются разными.38. A composition according to any one of claims 32-34, wherein the first Cas9 molecule and the second Cas9 molecule are different.

39. Композиция по п.38, где первая молекула Cas9 или вторая молекула Cas9 представляют собой молекулу Cas9 из Staphylococcus aureus.39. The composition of claim 38, wherein the first Cas9 molecule or the second Cas9 molecule is a Cas9 molecule from Staphylococcus aureus.

40. Композиция по любому из пп.32-39, где первая молекула Cas9 и/или вторая молекула Cas9 предусматривают молекулу SaCas9, содержащую аминокислотную последовательность под SEQ ID NO: 45.40. The composition according to any one of claims 32-39, wherein the first Cas9 molecule and/or the second Cas9 molecule provide a SaCas9 molecule containing the amino acid sequence under SEQ ID NO: 45.

41. Композиция по любому из пп.32-40, где первый вектор и/или второй вектор представляют собой вирусный вектор.41. A composition according to any one of claims 32-40, wherein the first vector and/or the second vector is a viral vector.

42. Композиция по п.41, где первый вектор и/или второй вектор представляют собой вектор на основе аденоассоциированного вируса (AAV).42. The composition of claim 41, wherein the first vector and/or the second vector is an adeno-associated virus (AAV) vector.

43. Композиция по п.42, где вектор на основе AAV представляет собой вектор на основе AAV8 или вектор на основе AAV9.43. The composition of claim 42, wherein the AAV-based vector is an AAV8-based vector or an AAV9-based vector.

44. Композиция по любому из пп.32-43, где ген дистрофина представляет собой ген дистрофина человека.44. A composition according to any one of claims 32-43, wherein the dystrophin gene is a human dystrophin gene.

45. Композиция по любому из пп.32-44, где первая молекула gRNA и вторая молекула gRNA содержат нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, или комплементарную ей последовательность, где первая молекула gRNA и вторая молекула gRNA содержат разные нацеливающие домены.45. The composition according to any one of claims 32-44, where the first gRNA molecule and the second gRNA molecule contain a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO : 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, or its complementary sequence, where the first gRNA molecule and the second gRNA molecule contain different targeting domains.

46. Композиция по любому из пп.32-45, где первая молекула gRNA представлена под SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 или SEQ ID NO: 15, и вторая молекула46. The composition according to any one of claims 32-45, where the first gRNA molecule is presented under SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 or SEQ ID NO: 15, and the second molecule

- 58 042798 gRNA представлена под SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 или SEQ ID NO: 19.- 58 042798 gRNA is listed under SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 or SEQ ID NO: 19.

47. Композиция по любому из пп.32-46, где первая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 и SEQ ID NO: 15, и вторая молекула gRNA выбрана из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.47. The composition according to any one of claims 32-46, wherein the first gRNA molecule is selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14 and SEQ ID NO: 15, and the second gRNA molecule is selected from the group consisting of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 and SEQ ID NO: 19.

48. Композиция по любому из пп.32-47, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;48. The composition according to any one of claims 32-47, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 2;

(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(vi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(viii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15; и (xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18.(x) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15; and (xi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18.

49. Композиция по любому из пп.32-48, где первый вектор содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 39, и второй вектор содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 40.49. The composition according to any one of claims 32-48, wherein the first vector contains the nucleotide sequence set forth under SEQ ID NO: 39 and the second vector contains the nucleotide sequence set forth under SEQ ID NO: 40.

50. Композиция по любому из пп.32-49 для применения в составе лекарственного препарата.50. A composition according to any one of claims 32-49 for use in a medicinal product.

51. Композиция по любому из пп.32-50 для применения в лечении мышечной дистрофии Дюшенна.51. A composition according to any one of claims 32-50 for use in the treatment of Duchenne muscular dystrophy.

52. Клетка, содержащая композицию по любому из пп.32-51.52. A cell containing a composition according to any one of claims 32-51.

53. Способ коррекции мутантного гена дистрофина в клетке, предусматривающий введение в клетку (a) первого вектора, содержащего полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второго вектора, содержащего полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где каждая из первой молекулы gRNA и второй молекулы gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, и где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.53. A method for correcting a mutant dystrophin gene in a cell, comprising introducing into the cell (a) a first vector containing a polynucleotide sequence encoding the first guide RNA molecule (gRNA) and a polynucleotide sequence encoding the first Cas9 molecule that recognizes a motif adjacent to the protospacer (PAM ) either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25); and (b) a second vector containing a polynucleotide sequence encoding a second gRNA molecule and a polynucleotide sequence encoding a second Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO : 25), where each of the first gRNA molecule and the second gRNA molecule contains a targeting domain, the length of which is from 19 to 24 nucleotides, and where the vector is designed to form the first and second double-strand breaks, respectively, in the first and second introns flanking exon 51 of the gene human dystrophin, which ensures the deletion of the dystrophin gene segment containing exon 51.

- 59 042798- 59 042798

54. Способ по п.53, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;54. The method of claim 53, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1 and a second gRNA molecule containing targeting domain, which contains the nucleotide sequence set forth under SEQ ID NO: 2;

(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(vi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(viii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15; и (xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18.(x) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15; and (xi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18.

55. Способ по п.53 или 54, где мутантный ген дистрофина содержит преждевременный стоп-кодон, смещенную рамку считывания, аберрантный акцепторный сайт сплайсинга или аберрантный донорный сайт сплайсинга.55. The method according to claim 53 or 54, wherein the mutant dystrophin gene contains a premature stop codon, a misaligned reading frame, an aberrant splice acceptor site, or an aberrant splice donor site.

56. Способ по любому из пп.53-55, где мутантный ген дистрофина содержит мутацию со сдвигом рамки считывания, которая является причиной преждевременного стоп-кодона и усеченного продукта гена.56. The method of any one of claims 53-55, wherein the mutant dystrophin gene contains a frameshift mutation that causes a premature stop codon and a truncated gene product.

57. Способ по любому из пп.53-55, где мутантный ген дистрофина характеризуется делецией одного или нескольких экзонов, которая обеспечивает смещение рамки считывания.57. The method of any one of claims 53-55, wherein the mutant dystrophin gene is characterized by a deletion of one or more exons that provides a frameshift.

58. Способ по любому из пп.53-57, где коррекция мутантного гена дистрофина предусматривает делецию преждевременного стоп-кодона, коррекцию смещенной рамки считывания или модуляцию сплайсинга путем смещения акцепторного сайта сплайсинга или смещения донорной последовательности сплайсинга.58. The method of any one of claims 53-57, wherein correcting the mutant dystrophin gene comprises deleting a premature stop codon, correcting a misaligned reading frame, or modulating splicing by misplacing a splice acceptor site or misplacing a donor splice sequence.

59. Способ по любому из пп.53-58, где коррекция мутантного гена дистрофина предусматривает делецию экзона 51.59. The method according to any one of claims 53-58, wherein the correction of the mutant dystrophin gene involves the deletion of exon 51.

60. Способ по любому из пп.53-59, где коррекция мутантного гена дистрофина предусматривает репарацию с участием гомологичной рекомбинации.60. The method of any one of claims 53-59, wherein the repair of the mutant dystrophin gene involves repair involving homologous recombination.

61. Способ по п.60, дополнительно предусматривающий введение в клетку донорной ДНК.61. The method of claim 60, further comprising introducing donor DNA into the cell.

62. Способ по любому из пп.53-61, где коррекция мутантного гена дистрофина предусматривает опосредованное нуклеазой негомологичное соединение концов.62. The method of any one of claims 53-61, wherein the correction of the mutant dystrophin gene involves nuclease-mediated non-homologous end joining.

63. Способ по любому из пп.53-62, где клетка представляет собой клетку-миобласт.63. The method of any one of claims 53-62, wherein the cell is a myoblast cell.

64. Способ по любому из пп.53-63, где клетка представляет собой клетку субъекта, страдающего мышечной дистрофией Дюшенна.64. The method of any one of claims 53-63, wherein the cell is a cell of a subject suffering from Duchenne muscular dystrophy.

65. Способ по любому из пп.53-64, где клетка представляет собой миобласт субъекта-человека, страдающего мышечной дистрофией Дюшенна.65. The method of any one of claims 53-64, wherein the cell is a myoblast of a human subject suffering from Duchenne muscular dystrophy.

66. Способ по любому из пп.53-65, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из66. The method according to any one of claims 53-65, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of

- 60 042798 (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;- 60 042798 (i) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 2;

(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4; и (iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19.(ii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4; and (iii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19.

67. Способ лечения субъекта, нуждающегося в этом, у которого имеется мутантный ген дистрофина, при этом способ предусматривает введение субъекту (a) первого вектора, содержащего полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второго вектора, содержащего полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где каждая из первой молекулы gRNA и второй молекулы gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, и где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов соответственно в первом и втором интронах, фланкирующих экзон 51 гена дистрофина человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51.67. A method of treating a subject in need thereof who has a mutant dystrophin gene, the method comprising administering to the subject (a) a first vector containing a polynucleotide sequence encoding a first guide RNA (gRNA) molecule and a polynucleotide sequence encoding a first Cas9 molecule which recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25); and (b) a second vector containing a polynucleotide sequence encoding a second gRNA molecule and a polynucleotide sequence encoding a second Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO : 25), where each of the first gRNA molecule and the second gRNA molecule contains a targeting domain, the length of which is from 19 to 24 nucleotides, and where the vector is designed to form the first and second double-strand breaks, respectively, in the first and second introns flanking exon 51 of the gene human dystrophin, which ensures the deletion of the dystrophin gene segment containing exon 51.

68. Способ по п.67, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 2;68. The method of claim 67, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 1 and a second gRNA molecule containing targeting domain, which contains the nucleotide sequence set forth under SEQ ID NO: 2;

(ii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(iii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(iv) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(v) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(vi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(vi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(vii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18;

(viii) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 4;(viii) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 4;

(ix) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 19;

(x) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 15; и (xi) первой молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 18.(x) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 15; and (xi) a first gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that contains the nucleotide sequence set forth under SEQ ID NO: 18.

69. Способ по п.68, где субъект страдает мышечной дистрофией Дюшенна.69. The method of claim 68 wherein the subject suffers from Duchenne muscular dystrophy.

70. Способ по любому из пп.67-69, где первый вектор и второй вектор вводят в мышцу субъекта.70. The method of any one of claims 67-69, wherein the first vector and the second vector are administered to a muscle of a subject.

- 61 042798- 61 042798

71. Способ по п.70, где мышца представляет собой скелетную мышцу или сердечную мышцу.71. The method of claim 70 wherein the muscle is skeletal muscle or cardiac muscle.

72. Способ по п.71, где скелетная мышца представляет собой переднюю большеберцовую мышцу.72. The method of claim 71 wherein the skeletal muscle is the tibialis anterior.

73. Способ по любому из пп.67-72, где первый вектор и второй вектор вводят субъекту внутримышечно, внутривенно или с помощью их комбинации.73. The method of any one of claims 67-72, wherein the first vector and the second vector are administered to the subject intramuscularly, intravenously, or a combination thereof.

74. Способ получения трансгенного эмбриона грызуна, у которого имеется ген дистрофина человека (hDMD) с делецией экзона 52 (Δ52), при этом способ предусматривает введение в эмбрион грызуна gRNA по п.1, системы для нацеливания на ДНК по любому из пп.2-9, выделенного полинуклеотида по пункту 10, вектора по любому из пп.11-22, модифицированного вектора на основе аденоассоциированного вируса по п.30 или 31 или композиции по любому из пп.32-51, за счет чего обеспечивается делеция экзона 52 в гене дистрофина человека, и осуществления отбора трансгенного эмбриона грызуна, у которого имеется делеция экзона 52 в гене дистрофина человека, где эмбрион грызуна содержит нормальный ген дистрофина человека.74. A method for producing a transgenic rodent embryo having a human dystrophin gene (hDMD) with a deletion of exon 52 (Δ52), the method comprising introducing into the rodent embryo a gRNA according to claim 1, a DNA targeting system according to any one of claims 2 -9, an isolated polynucleotide according to paragraph 10, a vector according to any one of paragraphs 11-22, a modified adeno-associated virus vector according to paragraph 30 or 31, or a composition according to any one of paragraphs 32-51, thereby ensuring the deletion of exon 52 in a human dystrophin gene; and selecting a transgenic rodent embryo having an exon 52 deletion in the human dystrophin gene, wherein the rodent embryo contains a normal human dystrophin gene.

75. Способ по п.74, где эмбрион грызуна представляет собой эмбрион мыши.75. The method of claim 74 wherein the rodent embryo is a mouse embryo.

76. Способ по п.74 или 75, где трансгенный эмбрион грызуна является гетерозиготным по hDMD или гетерозиготным по hDMD-A52.76. The method of claim 74 or 75, wherein the transgenic rodent embryo is heterozygous for hDMD or heterozygous for hDMD-A52.

77. Способ по любому из пп.74-76, где первую молекулу gRNA, содержащую нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 41, и вторую молекулу gRNA, содержащую нацеливающий домен, который содержит нуклеотидную последовательность, изложенную под SEQ ID NO: 42, вводят в эмбрион грызуна для осуществления делеции экзона 52 гена дистрофина человека.77. The method according to any one of paragraphs 74-76, where the first gRNA molecule containing the targeting domain, which contains the nucleotide sequence set forth under SEQ ID NO: 41, and the second gRNA molecule containing the targeting domain, which contains the nucleotide sequence set forth under SEQ ID NO: 42 is introduced into a rodent embryo to effect a deletion of exon 52 of the human dystrophin gene.

78. Способ по любому из пп.74-77, дополнительно предусматривающий введение в эмбрион грызуна белка Cas, содержащего аминокислотную последовательность, изложенную под SEQ ID NO: 27.78. The method according to any one of claims 74-77, further comprising introducing into the rodent embryo a Cas protein containing the amino acid sequence set forth under SEQ ID NO: 27.

79. Трансгенный эмбрион грызуна, полученный с помощью способа по любому из пп.74-78.79. A transgenic rodent embryo obtained using the method of any one of claims 74-78.

80. Трансгенный грызун, полученный из трансгенного эмбриона грызуна по п.79.80. A transgenic rodent derived from a transgenic rodent embryo according to claim 79.

Приложение pDO240 с JCR179 (SEQ ID NO: 37) (gRNA выделена жирным шрифтом) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccaagcttgcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaat acgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgg actatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaa aggacgaaacaccAACACACAGCTGGGTTATCAGAGgttttagtactctggaaacagaatctac taaaacaaggcaaaatgccgtgtttatctcgtcaacttgttggcgagatttttttgcggccgcc cgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatg gtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccgga agcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgct cactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgc ggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcg gtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaat caggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaa ggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgc tcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagct ccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttc gggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgcПриложение pDO240 с JCR179 (SEQ ID NO: 37) (gRNA выделена жирным шрифтом) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccaagcttgcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaat acgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgg actatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaa aggacgaaacaccAACACACAGCTGGGTTATCAGAGgttttagtactctggaaacagaatctac taaaacaaggcaaaatgccgtgtttatctcgtcaacttgttggcgagatttttttgcggccgcc cgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatg gtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccgga agcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgct cactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgc ggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcg gtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaat caggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaa ggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgc tcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagct ccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttc gggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgc

- 62 042798 tccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaact atcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacag gattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggc tacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagag ttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagca gcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgac gctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttca cctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttg gtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttca tccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggcc ccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaacca gccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctatt aattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgcca ttgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttccca acgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcct ccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcata attctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtc attctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataatacc gcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactct caaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttc agcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaa aagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaa gcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaaca aataggggttccgcgcacatttccccgaaaagtgccac pDO240 c JCR183 (SEQ ID NO: 38) (gRNA выделена жирным шрифтом) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccaagcttgcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaat acgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgg actatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaa aggacgaaacaccAGAACTGGTGGGAAATGGTCTAGgttttagtactctggaaacagaatctac taaaacaaggcaaaatgccgtgtttatctcgtcaacttgttggcgagatttttttgcggccgcc- 62 042798 tccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaact atcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacag gattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggc tacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagag ttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagca gcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgac gctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttca cctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttg gtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttca tccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggcc ccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaacca gccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctatt aattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgcca ttgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttccca acgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcct ccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcata attctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtc attctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataatacc gcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactct caaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttc agcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaa aagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaa gcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaaca aataggggttccgcgcacatttccccgaaaagtgccac pDO240 c JCR183 (SEQ ID NO: 38) (gRNA выделена жирным шрифтом) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccaagcttgcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaat acgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgg actatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaa aggacgaaacaccAGAACTGGTGGGAAATGGTCTAGgttttagtactctggaaacagaatctac taaaacaaggcaaaatgccgtgtttatctcgtcaacttgttggcgagatttttttgcggccgcc

- 63 042798 cgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatg gtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccgga agcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgct cactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgc ggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcg gtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaat caggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaa ggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgc tcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagct ccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttc gggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgc tccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaact atcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacag gattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggc tacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagag ttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagca gcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgac gctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttca cctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttg gtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttca tccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggcc ccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaacca gccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctatt aattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgcca ttgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttccca acgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcct ccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcata attctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtc attctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataatacc gcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactct caaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttc agcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaa aagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaa gcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaaca aataggggttccgcgcacatttccccgaaaagtgccac- 63 042798 cgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatg gtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccgga agcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgct cactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgc ggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcg gtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaat caggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaa ggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgc tcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagct ccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttc gggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgc tccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaact atcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacag gattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggc tacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagag ttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagca gcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgac gctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttca cctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttg gtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttca tccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggcc ccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaacca gccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctatt aattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgcca ttgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttccca acgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcct ccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcata attctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtc attctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataatacc gcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactct caaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttc agcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaa aagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaa gcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaaca aataggggttccgcgcacatttccccgaaaagtgccac

PT366 c JCR179 - PT366AAV 179 (SEQ ID NO: 39) -плазмида дляPT366 c JCR179 - PT366AAV 179 (SEQ ID NO: 39) - plasmid for

- 64 042798- 64 042798

AAV, применяемая для работы in vivo (gRNA выделена жирным шрифтом; SaCas9 выделена верхним регистром; NLS выделена нижним регистром, жирным шрифтом и подчеркиванием) cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtc gcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttc ctgcggcctctagactcgaggcgttgacattgattattgactagttattaatagtaatcaatta cggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggccc gcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagta acgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttgg cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcc cgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgta ttagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggt ttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcacca aaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtagg cgtgtacggtgggaggtctatataagcagagctctctggctaactaccggtgccaccatggccc caaagaagaagcggaaggtcggtatccacggagtcccagcagccAAGCGGAACTACATCCTGGG CCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGACGTGATC GATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGGAGCAAGA GAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGCTGCTGTT CGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGCCAGAGTG AAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTGGCCAAGA GAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCACCAAAGA GCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCTGGAACGG CTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTACGTGAAAG AAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCATCGACAC CTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAGCCCCTTC GGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTCCCCGAGG AACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACCTGAACAA TCTCGTGAT САС CAG G GAC GAGAAC GAGAAG С T G GAATAT TAG GAGAAG T T С CAGAT CATC GAG AAC G T G T T CAAG CAGAAGAAGAAG С С СAC С С T GAAG CAGAT C G С CAAAGAAAT С С T C G T GAAC G AAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACCTGAAGGT GTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCTGCTGGAT CAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTGACCAATC TGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATACCGGCAC CCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAACGACAAC CAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAGCAGAAAGAAV, применяемая для работы in vivo (gRNA выделена жирным шрифтом; SaCas9 выделена верхним регистром; NLS выделена нижним регистром, жирным шрифтом и подчеркиванием) cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtc gcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttc ctgcggcctctagactcgaggcgttgacattgattattgactagttattaatagtaatcaatta cggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggccc gcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagta acgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttgg cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcc cgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgta ttagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggt ttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcacca aaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtagg cgtgtacggtgggaggtctatataagcagagctctctggctaactaccggtgccaccatggccc caaagaagaagcggaaggtcggtatccacggagtcccagcagccAAGCGGAACTACATCCTGGG CCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGACGTGATC GATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGGAGCAAGA GAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGCTGCTGTT CGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGCCAGAGTG AAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTGGCCAAGA GAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCACCAAAGA GCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCTGGAACGG CTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTACGTGAAAG AAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCATCGACAC CTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAGCCCCTTC GGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTCCCCGAGG AACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACCTGAACAA TCTCGTGAT САС CAG G GAC GAGAAC GAGAAG С T G GAATAT TAG GAGAAG T T С CAGAT CATC GAG AAC G T G T T CAAG CAGAAGAAGAAG С С СAC С С T GAAG CAGAT C G С CAAAGAAAT С С T C G T GAAC G AAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACCTGAAGGT GTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCTGCTGGAT CAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTGACCAATC TGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATACCGGCAC CCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAACGACAAC CAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAGCAGAAAG

- 65 042798- 65 042798

AGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCTTCATCCA GAG CAT CAAAG T GAT GAAC G C CAT CAT CAAGAAGTACGGCCTGCCGAACGAGAT CAT TAT C GAG CTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAGCGGAACC GGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCAAGTACCT GATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGAAGCCATC CCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCCAGAAGCG TGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCAAGAAGGG CAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAACCTTCAAG AAGCACATCCTGAATСTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAGTATСTGC TGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACCTGGTGGA TACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAACAACCTG GACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGGAAGTTTA AGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCAACGCCGA T T T CAT С T T CAAAGAGT GGAAGAAAC T GGACAAGGCCAAAAAAGT GAT GGAAAACCAGATG T T C GAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAGATCTTCA TCACCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACCGGGTGGA CAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGACAAGGGC AACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACΑΆΤGACAAGCTGAAAAAGC T GAT CAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC CAGAAAC T GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGAGGAAACC GGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATTAAGTATT ACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAAACAAGGT CGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTACAAGTTC G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAAT AG GAAG T G С T ATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCTTCTACAA CAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGACCTGCTG AAC C G GAT C GAAG T GAACATGAT CGACAT СACС TACCGCGAGTACС T GGAAAAGATGAACGAGA AGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGTACAGCAC AGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCCTCAGATCATCAAAAAGGGC aaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaaaaqqgatcctacccatacg atgttccagattacgcttacccatacgatgttccagattacgcttacccatacgatgttccaga ttacgcttaagaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccat ctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttc ctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggg gtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctggggaggtaccga gggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCTTCATCCA GAG CAT CAAAG T GAT GAAC G C CAT CAT CAAGAAGTACGGCCTGCCGAACGAGAT CAT TAT C GAG CTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAGCGGAACC GGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCAAGTACCT GATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGAAGCCATC CCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCCAGAAGCG TGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCAAGAAGGG CAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAACCTTCAAG AAGCACATCCTGAATСTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAGTATСTGC TGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACCTGGTGGA TACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAACAACCTG GACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGGAAGTTTA AGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCAACGCCGA T T T CAT С T T CAAAGAGT GGAAGAAAC T GGACAAGGCCAAAAAAGT GAT GGAAAACCAGATG T T C GAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAGATCTTCA TCACCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACCGGGTGGA CAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGACAAGGGC AACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACΑΆΤGACAAGCTGAAAAAGC T GAT CAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC CAGAAAC T GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGAGGAAACC GGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATTAAGTATT ACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAAACAAGGT CGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTACAAGTTC G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAAT AG GAAG T G С T ATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCTTCTACAA CAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGACCTGCTG AAC C G GAT C GAAG T GAACATGAT CGACAT СACС TACCGCGAGTACС T GGAAAAGATGAACGAGA AGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGTACAGCAC AGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCCTCAGATCATCAAAAAGGGC aaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaaaaqqgatcctacccatacg atgttccagattacgcttacccatacgatgttccagattacgcttacccatacgatgttccaga ttacgcttaagaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccat ctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttc ctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggg gtggggcaggacagcaaggggggattgggaagataagaatagcaggcatgctggggaggtaccga gggcctatttcccattgcattcattactg

- 66 042798 ggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataat ttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaac ttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgAACACACA GCTGGGTTATCAGAGgttttagtactctggaaacagaatctactaaaacaaggcaaaatgccgt gtttatctcgtcaacttgttggcgagatttttgcggccgcaggaacccctagtgatggagttgg ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgccc gggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggggcgcctgatg cggtattttctccttacgcatctgtgcggtatttcacaccgcatacgtcaaagcaaccatagta cgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctaca cttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccg gctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggca cctcgaccccaaaaaacttgatttgggtgatggttcacgtagtgggccatcgccctgatagacg gtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaa caacactcaaccctatctcgggctattcttttgatttataagggattttgccgatttcggccta ttggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgttt acaattttatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgac acccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagaca agctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcg agacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttctt agacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaat acattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaa aggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgcc ttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgc acgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaa gaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattg acgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactc accagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccata accatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaa ccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaa tgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgc aaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggagg cggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataa atctggagccggtgagcgtggaagccgcggtatcattgcagcactggggccagatggtaagccc tcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacaga tcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatat actttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgat- 66 042798 ggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataat ttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaac ttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgAACACACA GCTGGGTTATCAGAGgttttagtactctggaaacagaatctactaaaacaaggcaaaatgccgt gtttatctcgtcaacttgttggcgagatttttgcggccgcaggaacccctagtgatggagttgg ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgccc gggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggggcgcctgatg cggtattttctccttacgcatctgtgcggtatttcacaccgcatacgtcaaagcaaccatagta cgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctaca cttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccg gctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggca cctcgaccccaaaaaacttgatttgggtgatggttcacgtagtgggccatcgccctgatagacg gtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaa caacactcaaccctatctcgggctattcttttgatttataagggattttgccgatttcggccta ttggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgttt acaattttatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgac acccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagaca agctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcg agacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttctt agacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaat acattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaa aggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgcc ttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgc acgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaa gaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattg acgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactc accagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccata accatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaa ccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaa tgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgc aaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggagg cggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataa atctggagccggtgagcgtggaagccgcggtatcattgcagcactggggccagatggtaagccc tcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacaga tcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatat actttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgat

- 67 042798 aatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaa agatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaa accaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggta actggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccacc acttcaagaactctgtagcaccgcctacatacctcgctctgetaatcctgttaccagtggctgc tgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcg cagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccg aactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcgga caggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaac gcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgat gctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggc cttttgctggccttttgctcacatgt- 67 042798 aatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaa agatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaa accaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggta actggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccacc acttcaagaactctgtagcaccgcctacatacctcgctctgetaatcctgttaccagtggctgc tgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcg cagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccg aactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcgga caggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaac gcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgat gctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggc cttttgctggccttttgctcacatgt

PT366 c JCR183 (SEQ ID NO: 40) -применяемая для работы in vivo (gRNA выделена жирным шрифтом; SaCas9 выделена верхним регистром; NLS выделена нижним регистром, жирным шрифтом и подчеркиванием) cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtc gcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttc ctgcggcctctagactcgaggcgttgacattgattattgactagttattaatagtaatcaatta cggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggccc gcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagta acgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttgg cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcc cgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgta ttagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggt ttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcacca aaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtagg cgtgtacggtgggaggtctatataagcagagctctctggctaactaccggtgccaccatggccc caaagaagaagcggaaggtcggtatccacggagtcccagcagccAAGCGGAACTACATCCTGGG CCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGACGTGATC GATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGGAGCAAGA GAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGCTGCTGTT CGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGCCAGAGTG AAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTGGCCAAGA GAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCACCAAAGA GCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCTGGAACGGPT366 c JCR183 (SEQ ID NO: 40) -применяемая для работы in vivo (gRNA выделена жирным шрифтом; SaCas9 выделена верхним регистром; NLS выделена нижним регистром, жирным шрифтом и подчеркиванием) cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtc gcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttc ctgcggcctctagactcgaggcgttgacattgattattgactagttattaatagtaatcaatta cggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggccc gcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagta acgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttgg cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcc cgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgta ttagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggt ttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcacca aaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtagg cgtgtacggtgggaggtctatataagcagagctctctggctaactaccggtgccaccatggccc caaagaagaagcggaaggtcggtatccacggagtcccagcagccAAGCGGAACTACATCCTGGG CCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTACGAGACACGGGACGTGATC GATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAACGAGGGCAGGCGGAGCAAGA GAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGAGAGTGAAGAAGCTGCTGTT CGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAACCCCTACGAGGCCAGAGTG AAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCCCTGCTGCACCTGGCCAAGA GAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCAACGAGCTGTCCACCAAAGA GCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGCCGAACTGCAGCTGGAACGG

- 68 042798- 68 042798

CTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTACGTGAAAG AAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCATCGACAC CTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAGCCCCTTC GGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTCCCCGAGG AACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACCTGAACAA TCTCGTGAT СAC CAG G GAC GAGAAC GAGAAG С T G GAATAT TAG GAGAAG T T С CAGAT CATC GAG AAC G T G T T CAAG CAGAAGAAGAAG С С СAC С С T GAAG CAGAT C G С CAAAGAAAT С С T C G T GAAC G AAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACCTGAAGGT GTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCTGCTGGAT CAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTGACCAATC TGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATACCGGCAC CCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAACGACAAC CAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAGCAGAAAG AGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCTTCATCCA GAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCATTATCGAG CTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAGCGGAACC GGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCAAGTACCT GATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGAAGCCATC CCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCCAGAAGCG TGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCAAGAAGGG CAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAACCTTCAAG AAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAGTATCTGC TGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACCTGGTGGA TACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAACAACCTG GACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGGAAGTTTA AGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCAACGCCGA TTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGTGATGGAAAACCAGATGTTC GAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAGATCTTCA TCACCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACCGGGTGGA CAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGACAAGGGC AACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTGAAAAAGC T GAT CAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC CAGAAAC T GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGAGGAAACC GGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATTAAGTATT ACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAAACAAGGT CGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTACAAGTTCCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAGACCAGCGACTACGTGAAAG AAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGGACCAGAGCTTCATCGACAC CTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACCTGGCGAGGGCAGCCCCTTC GGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCACTGCACCTACTTCCCCGAGG AACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACGCCCTGAACGACCTGAACAA TCTCGTGAT СAC CAG G GAC GAGAAC GAGAAG С T G GAATAT TAG GAGAAG T T С CAGAT CATC GAG AAC G T G T T CAAG CAGAAGAAGAAG С С СAC С С T GAAG CAGAT C G С CAAAGAAAT С С T C G T GAAC G AAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCGAGTTCACCAACCTGAAGGT GTACCACGACATCAAGGACATTACCGCCCGGAAAGAGATTATTGAGAACGCCGAGCTGCTGGAT CAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATCCAGGAAGAACTGACCAATC TGAACTCCGAGCTGACCCAGGAAGAGATCGAGCAGATCTCTAATCTGAAGGGCTATACCGGCAC CCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCTGTGGCACACCAACGACAAC CAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTGGACCTGTCCCAGCAGAAAG AGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCGTGAAGAGAAGCTTCATCCA GAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAACGACATCATTATCGAG CTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAACGAGATGCAGAAGCGGAACC GGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCAAAGAGAACGCCAAGTACCT GATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCTGTACAGCCTGGAAGCCATC CCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGACCACATCATCCCCAGAAGCG TGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGGAAGAAAACAGCAAGAAGGG CAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGATCAGCTACGAAACCTTCAAG AAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAGACCAAGAAAGAGTATCTGC TGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCATCAACCGGAACCTGGTGGA TACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTACTTCAGAGTGAACAACCTG GACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTGCGGCGGAAGTGGAAGTTTA AGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCCTGATCATTGCCAACGCCGA TTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGTGATGGAAAACCAGATGTTC GAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAGGAGTACAAAGAGATCTTCA TCACCCCCCACCAGATCAAGCACATTAAGGACTTCAAGGACTACAAGTACAGCCACCGGGTGGA CAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCACCCGGAAGGACGACAAGGGC AACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGACAATGACAAGCTGAAAAAGC T GAT CAACAAGAG С С С C GAAAAG CTGCTGATGTAC СAC CAC GAC С С С CAGAC С TAC CAGAAAC T GAAGCTGATTATGGAACAGTACGGCGACGAGAAGAATCCCCTGTACAAGTACTACGAGGAAACC GGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTGATCAAGAAGATTAAGTATT ACGGCAACAAACTGAACGCCCATCTGGACATCACCGACGACTACCCCAACAGCAGAAACAAGGT CGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGACAATGGCGTGTACAAGTTC

- 69 042798- 69 042798

G T GAG C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAATAG CAAG T G С T ATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCTTCTACAA CAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGACCTGCTG AAG C G GAT C GAAG T GAACAT GAT C GAGAT СAC С TAC C G C GAG TAC С T G GAAAACAT GAAC GACA AGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGTACAGCAC AGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCCTCAGATCATCAAAAAGGGC aaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaaaaqg gatcctacccatacg atgttccagattacgcttacccatacgatgttccagattacgcttacccatacgatgttccaga ttacgcttaagaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccat ctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttc ctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggg gtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctggggaggtaccga gggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataatt ggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataat ttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaac ttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgAGAACTGG TGGGAAATGGTCTAGgttttagtactctggaaacagaatctactaaaacaaggcaaaatgccgt gtttatctcgtcaacttgttggcgagatttttgcggccgcaggaacccctagtgatggagttgg ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgccc gggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggggcgcctgatg cggtattttctccttacgcatctgtgcggtatttcacaccgcatacgtcaaagcaaccatagta cgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctaca cttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccg gctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggca cctcgaccccaaaaaacttgatttgggtgatggttcacgtagtgggccatcgccctgatagacg gtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaa caacactcaaccctatctcgggctattcttttgatttataagggattttgccgatttcggccta ttggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgttt acaattttatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgac acccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagaca agctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcg agacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttctt agacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaat acattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaa aggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgcc ttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcG T GAG C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAG T GAATAG CAAG T G С T ATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGTTTATCGCCTCCTTCTACAA CAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGGCGTGAACAACGACCTGCTG AAG C G GAT C GAAG T GAACAT GAT C GAGAT СAC С TAC C G C GAG TAC С T G GAAAACAT GAAC GACA AGAGGCCCCCCAGGATCATTAAGACAATCGCCTCCAAGACCCAGAGCATTAAGAAGTACAGCAC AGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCCTCAGATCATCAAAAAGGGC aaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaaaaqg gatcctacccatacg atgttccagattacgcttacccatacgatgttccagattacgcttacccatacgatgttccaga ttacgcttaagaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccat ctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttc ctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggg gtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctggggaggtaccga gggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataatt ggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataat ttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaac ttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgAGAACTGG TGGGAAATGGTCTAGgttttagtactctggaaacagaatctactaaaacaaggcaaaatgccgt gtttatctcgtcaacttgttggcgagatttttgcggccgcaggaacccctagtgatggagttgg ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgccc gggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggggcgcctgatg cggtattttctccttacgcatctgtgcggtatttcacaccgcatacgtcaaagcaaccatagta cgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctaca cttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccg gctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggca cctcgaccccaaaaaacttgatttgggtgatggttcacgtagtgggccatcgccctgatagacg gtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaa caacactcaaccctatctcgggctattcttttgatttataagggattttgccgatttcggccta ttggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgttt acaattttatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgac acccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagaca agctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcg agacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttctt agacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaat acattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaa aggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgcc ttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgc

- 70 042798 acgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaa gaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattg acgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactc accagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccata accatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaa ccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaa tgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgc aaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggagg cggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataa atctggagccggtgagcgtggaagccgcggtatcattgcagcactggggccagatggtaagccc tcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacaga tcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatat actttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgat aatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaa agatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaa accaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggta actggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccacc acttcaagaactctgtagcaccgcctacatacctcgctctgetaatcctgttaccagtggctgc tgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcg cagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccg aactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcgga caggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaac gcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgat gctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggc cttttgctggccttttgctcacatgt pDO242 (SaCas9, применяемая во всех объектах с JCR89/91 и объектах с JCR157/160 для работы in vitro; SaCas9 выделена верхним регистром) (SEQ ID NO: 83) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct- 70 042798 acgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaa gaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattg acgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactc accagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccata accatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaa ccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaa tgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgc aaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggagg cggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataa atctggagccggtgagcgtggaagccgcggtatcattgcagcactggggccagatggtaagccc tcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacaga tcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatat actttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgat aatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaa agatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaa accaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggta actggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccacc acttcaagaactctgtagcaccgcctacatacctcgctctgetaatcctgttaccagtggctgc tgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcg cagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccg aactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcgga caggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaac gcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgat gctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggc cttttgctggccttttgctcacatgt pDO242 (SaCas9, применяемая во всех объектах с JCR89/91 и объектах с JCR157/160 для работы in vitro ; SaCas9 выделена верхним регистром) (SEQ ID NO: 83) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct

- 71 042798 cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtacCtttaattctagtactatgcaTgcgttgacattgattattgactagt tattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacat aacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataat gacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtattta cggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacg tcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctac ttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatc aatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatg ggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccatt gacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaact accggtgccaccATGAAAAGGAACTACATTCTGGGGCTGGACATCGGGATTACAAGCGTGGGGT ATGGGATTATTGACTATGAAACAAGGGACGTGATCGACGCAGGCGTCAGACTGTTCAAGGAGGC CAACGTGGAAAACAATGAGGGACGGAGAAGCAAGAGGGGAGCCAGGCGCCTGAAACGACGGAGA AGGCACAGAATCCAGAGGGTGAAGAAACTGCTGTTCGATTACAACCTGCTGACCGACCATTCTG AGCTGAGTGGAATTAATCCTTATGAAGCCAGGGTGAAAGGCCTGAGTCAGAAGCTGTCAGAGGA AGAGTTTTCCGCAGCTCTGCTGCACCTGGCTAAGCGCCGAGGAGTGCATAACGTCAATGAGGTG GAAGAGGACACCGGCAACGAGCTGTCTACAAAGGAACAGATCTCACGCAATAGCAAAGCTCTGG AAGAGAAGTATGTCGCAGAGCTGCAGCTGGAACGGCTGAAGAAAGATGGCGAGGTGAGAGGGTC AATTAATAGGTTCAAGACAAGCGACTACGTCAAAGAAGCCAAGCAGCTGCTGAAAGTGCAGAAG GCTTACCACCAGCTGGATCAGAGCTTCATCGATACTTATATCGACCTGCTGGAGACTCGGAGAA CCTACTATGAGGGACCAGGAGAAGGGAGCCCCTTCGGATGGAAAGACATCAAGGAATGGTACGA GATGCTGATGGGACATTGCACCTATTTTCCAGAAGAGCTGAGAAGCGTCAAGTACGCTTATAAC GCAGATCTGTACAACGCCCTGAATGACCTGAACAACCTGGTCATCACCAGGGATGAAAACGAGA AAC T G GAATACTAT GAGAAGT T СCAGAT CATCGAAAACGT GT T TAAGCAGAAGAAAAAGСС TAC ACTGAAACAGATTGCTAAGGAGATCCTGGTCAACGAAGAGGACATCAAGGGCTACCGGGTGACA AG СAC T G GAAAAC CAGAG T T СAC СAAT С T GAAAG T G TAT CAC GATAT TAAG GACAT CACAG CAC GGAAAGAAATCATTGAGAACGCCGAACTGCTGGATCAGATTGCTAAGATCCTGACTATCTACCA GAGCTCCGAGGACATCCAGGAAGAGCTGACTAACCTGAACAGCGAGCTGACCCAGGAAGAGATC GAACAGATTAGTAATCTGAAGGGGTACACCGGAACACACAACCTGTCCCTGAAAGCTATCAATC TGATTСTGGATGAGCTGTGGCATACAAACGACAATCAGATTGCAATСTTTAACCGGCTGAAGCT GGTCCCAAAAAAGGTGGACCTGAGTCAGCAGAAAGAGATCCCAACCACACTGGTGGACGATTTC ATTCTGTCACCCGTGGTCAAGCGGAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCA AGAAGTACGGCCTGCCCAATGATATCATTATCGAGCTGGCTAGGGAGAAGAACAGCAAGGACGC AC AGAAGAT GAT C AAT GAGAT G C AGAAAC GAAAC C G G C AGAC C AAT GAAC G C AT T GAAGAGAT T- 71 042798 cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtacCtttaattctagtactatgcaTgcgttgacattgattattgactagt tattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacat aacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataat gacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtattta cggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacg tcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctac ttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatc aatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatg ggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccatt gacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaact accggtgccaccATGAAAAGGAACTACATTCTGGGGCTGGACATCGGGATTACAAGCGTGGGGT ATGGGATTATTGACTATGAAACAAGGGACGTGATCGACGCAGGCGTCAGACTGTTCAAGGAGGC CAACGTGGAAAACAATGAGGGACGGAGAAGCAAGAGGGGAGCCAGGCGCCTGAAACGACGGAGA AGGCACAGAATCCAGAGGGTGAAGAAACTGCTGTTCGATTACAACCTGCTGACCGACCATTCTG AGCTGAGTGGAATTAATCCTTATGAAGCCAGGGTGAAAGGCCTGAGTCAGAAGCTGTCAGAGGA AGAGTTTTCCGCAGCTCTGCTGCACCTGGCTAAGCGCCGAGGAGTGCATAACGTCAATGAGGTG GAAGAGGACACCGGCAACGAGCTGTCTACAAAGGAACAGATCTCACGCAATAGCAAAGCTCTGG AAGAGAAGTATGTCGCAGAGCTGCAGCTGGAACGGCTGAAGAAAGATGGCGAGGTGAGAGGGTC AATTAATAGGTTCAAGACAAGCGACTACGTCAAAGAAGCCAAGCAGCTGCTGAAAGTGCAGAAG GCTTACCACCAGCTGGATCAGAGCTTCATCGATACTTATATCGACCTGCTGGAGACTCGGAGAA CCTACTATGAGGGACCAGGAGAAGGGAGCCCCTTCGGATGGAAAGACATCAAGGAATGGTACGA GATGCTGATGGGACATTGCACCTATTTTCCAGAAGAGCTGAGAAGCGTCAAGTACGCTTATAAC GCAGATCTGTACAACGCCCTGAATGACCTGAACAACCTGGTCATCACCAGGGATGAAAACGAGA AAC T G GAATACTAT GAGAAGT T СCAGAT CATCGAAAACGT GT T TAAGCAGAAGAAAAAGСС TAC ACTGAAACAGATTGCTAAGGAGATCCTGGTCAACGAAGAGGACATCAAGGGCTACCGGGTGACA AG СAC T G GAAAAC CAGAG T T СAC СAAT С T GAAAG T G TAT CAC GATAT TAAG GACAT CACAG CAC GGAAAGAAATCATTGAGAACGCCGAACTGCTGGATCAGATTGCTAAGATCCTGACTATCTACCA GAGCTCCGAGGACATCCAGGAAGAGCTGACTAACCTGAACAGCGAGCTGACCCAGGAAGAGATC GAACAGATTAGTAATCTGAAGGGGTACACCGGAACACACAACCTGTCCCTGAAAGCTATCAATC TGATTСTGGATGAGCTGTGGCATACAAACGACAATCAGATTGCAATСTTTAACCGGCTGAAGCT GGTCCCAAAAAAGGTGGACCTGAGTCAGCAGAAAGAGATCCCAACCACACTGGTGGACGATTTC ATTCTGTCACCCGTGGTCAAGCGGAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCA AGAAGTACGGCCTGCCCAATGATATCATTATCGAGCTGGCTAGGGAGAAGAACAGCAAGGACGC AC AGAAGAT GAT C AAT GAGAT G C AGAAAC GAAAC C G G C AGAC C AAT GAAC G C AT T GAAGAGAT T

- 72 042798- 72 042798

ATCCGAACTACCGGGAAAGAGAACGCAAAGTACCTGATTGAAAAAATCAAGCTGCACGATATGC AGGAGGGAAAGTGTCTGTATTCTCTGGAGGCCATCCCCCTGGAGGACCTGCTGAACAATCCATT СAACTAGGAGGTCGATCATATTATCCCCAGAAGCGTGTCCTTCGAGAAT T СС T T TAACAACAAG GTGCTGGTCAAGCAGGAAGAGAACTCTAAAAAGGGCAATAGGACTCCTTTCCAGTACCTGTCTA GTTCAGATTCCAAGATСTСTTACGAAACСTTTAAAAAGCACATTСTGAATСTGGCCAAAGGAAA GGGCCGCATCAGCAAGACCAAAAAGGAGTACCTGCTGGAAGAGCGGGACATCAACAGATTCTCC GTCCAGAAGGATTTTATTAACCGGAATCTGGTGGACACAAGATACGCTACTCGCGGCCTGATGA ATCTGCTGCGATCCTATTTCCGGGTGAACAATCTGGATGTGAAAGTCAAGTCCATCAACGGCGG GTTCACATCTTTTCTGAGGCGCAAATGGAAGTTTAAAAAGGAGCGCAACAAAGGGTACAAGCAC CATGCCGAAGATGCTCTGATTATCGCAAATGCCGACTTCATCTTTAAGGAGTGGAAAAAGCTGG ACAAAGCCAAGAAAGTGATGGAGAACCAGATGTTCGAAGAGAAGCAGGCCGAATCTATGCCCGA AAT C GAGACAGAACAG GAG TAGAAG GAGAT T T T CAT СAC T С С T CAC CAGAT CAAG CATAT CAAG GATTTCAAGGACTACAAGTACTCTCACCGGGTGGATAAAAAGCCCAACAGAGAGCTGATCAATG AC AC CCTGTATAG T AC AAGAAAAGAC GAT AAG G G GAAT AC CCTGATTGT GAAC AAT С T GAAC G G AC T G TAC GACAAAGATAAT GACAAG С T GAAAAAG С T GAT CAACAAAAG T С С C GAGAAG С T G С T G ATGTACCACCATGATCCTCAGACATATCAGAAACTGAAGCTGATTATGGAGCAGTACGGCGACG AGAAGAAC С СAC T G TATAAG TAG TAT GAAGAGAC T G G GAAC TAC С T GAC CAAG TATAG СAAAAA GGATAATGGCCCCGTGATCAAGAAGATCAAGTACTATGGGAACAAGCTGAATGCCCATCTGGAC ATCACAGACGATTACCCTAACAGTCGCAACAAGGTGGTCAAGCTGTCACTGAAGCCATACAGAT TCGATGTCTATCTGGACAACGGCGTGTATAAATTTGTGACTGTCAAGAATCTGGATGTCATCAA AAAGGAGAAC TAG TAT GAAGT GAATAGCAAGT GC TAGGAAGAGGC TAAAAAGC T GAAAAAGAT T AGCAACCAGGCAGAGTTCATCGCCTCCTTTTACAACAACGACCTGATTAAGATCAATGGCGAAC TGTATAGGGTCATCGGGGTGAACAATGATCTGCTGAACCGCATTGAAGTGAATATGATTGACAT СAC T TAC C GAGAG TAT С T G GAAAACAT GAAT GATAAG CGCCCCCCTC GAAT TAT СAAAACAAT T G С С T С TAAGAC T CAGAG TAT CAAAAAG TACT C AACCGACAT T С T GGGAAACС T GTAT GAGGT GA AGAGCAAAAAGCACCCTCAGATTATCAAAAAGGGCagcggaggcaagcgtcctgctgctactaa gaaagctggtcaagctaagaaaaagaaaggatcctacccatacgatgttccagattacgcttaa gaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttg cccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaat gaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcagg acagcaagggggaggattgggaagagaatagcaggcatgctggggaggtagcggccgcCCgcgg tggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcat agctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcat aaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactg cccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcgggga gaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgtATCCGAACTACCGGGAAAGAGAACGCAAAGTACCTGATTGAAAAAATCAAGCTGCACGATATGC AGGAGGGAAAGTGTCTGTATTCTCTGGAGGCCATCCCCCTGGAGGACCTGCTGAACAATCCATT СAACTAGGAGGTCGATCATATTATCCCCAGAAGCGTGTCCTTCGAGAAT T СС T T TAACAACAAG GTGCTGGTCAAGCAGGAAGAGAACTCTAAAAAGGGCAATAGGACTCCTTTCCAGTACCTGTCTA GTTCAGATTCCAAGATСTСTTACGAAACСTTTAAAAAGCACATTСTGAATСTGGCCAAAGGAAA GGGCCGCATCAGCAAGACCAAAAAGGAGTACCTGCTGGAAGAGCGGGACATCAACAGATTCTCC GTCCAGAAGGATTTTATTAACCGGAATCTGGTGGACACAAGATACGCTACTCGCGGCCTGATGA ATCTGCTGCGATCCTATTTCCGGGTGAACAATCTGGATGTGAAAGTCAAGTCCATCAACGGCGG GTTCACATCTTTTCTGAGGCGCAAATGGAAGTTTAAAAAGGAGCGCAACAAAGGGTACAAGCAC CATGCCGAAGATGCTCTGATTATCGCAAATGCCGACTTCATCTTTAAGGAGTGGAAAAAGCTGG ACAAAGCCAAGAAAGTGATGGAGAACCAGATGTTCGAAGAGAAGCAGGCCGAATCTATGCCCGA AAT C GAGACAGAACAG GAG TAGAAG GAGAT T T T CAT СAC T С С T CAC CAGAT CAAG CATAT CAAG GATTTCAAGGACTACAAGTACTCTCACCGGGTGGATAAAAAGCCCAACAGAGAGCTGATCAATG AC AC CCTGTATAG T AC AAGAAAAGAC GAT AAG G G GAAT AC CCTGATTGT GAAC AAT С T GAAC G G AC T G TAC GACAAAGATAAT GACAAG С T GAAAAAG С T GAT CAACAAAAG T С С C GAGAAG С T G С T G ATGTACCACCATGATCCTCAGACATATCAGAAACTGAAGCTGATTATGGAGCAGTACGGCGACG AGAAGAAC С СAC T G TATAAG TAG TAT GAAGAGAC T G G GAAC TAC С T GAC CAAG TATAG СAAAAA GGATAATGGCCCCGTGATCAAGAAGATCAAGTACTATGGGAACAAGCTGAATGCCCATCTGGAC ATCACAGACGATTACCCTAACAGTCGCAACAAGGTGGTCAAGCTGTCACTGAAGCCATACAGAT TCGATGTCTATCTGGACAACGGCGTGTATAAATTTGTGACTGTCAAGAATCTGGATGTCATCAA AAAGGAGAAC TAG TAT GAAGT GAATAGCAAGT GC TAGGAAGAGGC TAAAAAGC T GAAAAAGAT T AGCAACCAGGCAGAGTTCATCGCCTCCTTTTACAACAACGACCTGATTAAGATCAATGGCGAAC TGTATAGGGTCATCGGGGTGAACAATGATCTGCTGAACCGCATTGAAGTGAATATGATTGACAT СAC T TAC C GAGAG TAT С T G GAAAACAT GAAT GATAAG CGCCCCCCTC GAAT TAT СAAAACAAT T G С С T С TAAGAC T CAGAG TAT CAAAAAG TACT C AACCGACAT T С T GGGAAACС T GTAT GAGGT GA AGAGCAAAAAGCACCCTCAGATTATCAAAAAGGGCagcggaggcaagcgtcctgctgctactaa gaaagctggtcaagctaagaaaaagaaaggatcctacccatacgatgttccagattacgcttaa gaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttg cccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaat gaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcagg acagcaagggggaggattgggaagagaatagcaggcatgctggggaggtagcggccgcCCgcgg tggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcat agctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcat aaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactg cccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcgggga gaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgt

- 73 042798 tcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggg gataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccg cgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaag tcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctc gtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaa gcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaa gctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgt cttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggatta gcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacac tagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggt agctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcaga ttacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctca gtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctag atccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctg acagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccat agttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagt gctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccag ccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattg ttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgct acaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgat caaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgat cgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattct cttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattct gagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgcc acatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaagg atcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcat cttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaaggg aataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatt tatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaatag gggttccgcgcacatttccccgaaaagtgccac pJRHl (SaCas9, применяемая для всех объектов с JCR179/183, SaCas9 выделена верхним регистром; NLS выделена нижним регистром, жирным шрифтом и подчеркиванием) (SEQ ID NO: 84) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg- 73 042798 tcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggg gataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccg cgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaag tcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctc gtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaa gcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaa gctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgt cttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggatta gcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacac tagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggt agctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcaga ttacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctca gtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctag atccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctg acagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccat agttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagt gctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccag ccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattg ttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgct acaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgat caaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgat cgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattct cttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattct gagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgcc acatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaagg atcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcat cttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaaggg aataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatt tatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaatag gggttccgcgcacatttccccgaaaagtgccac pJRHl (SaCas9, применяемая для всех объектов с JCR179/183, SaCas9 выделена верхним регистром ; NLS is in lower case, bold and underline) (SEQ ID NO: 84)

- 74 042798 gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtacctttaattctagtactatgcatgcgttgacattgattattgactagt tattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacat aacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataat gacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtattta cggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacg tcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctac ttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatc aatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatg ggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccatt gacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaact accggtgccaccatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccA AGCGGAACTACATCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTA CGAGACACGGGACGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAAC GAGGGCAGGCGGAGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGA GAGTGAAGAAGCTGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAA CCCCTACGAGGCCAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCC CTGCTGCACCTGGCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCA ACGAGCTGTCCACCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGC CGAACTGCAGCTGGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAG ACCAGCGACTACGTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGG ACCAGAGCTTCATCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACC TGGCGAGGGCAGCCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCAC TGCACCTACTTCCCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACG С С С T GAAC GAG С T GAACAAT С T C G T GAT GAG GAG G GAG GAGAAC GAGAAG С T G GAATAT TAG GA GAAG T T С C AGAT CATC GAGAAC G T G T T C AAG C AGAAGAAGAAG С С С AC С С T GAAG C AGAT C G С C AAAGAAATCCTCGTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCG AG T T СAC СAAC С T GAAG G T G TAC CAC GACAT CAAGGACAT TACCGCCCGGAAAGAGATTAT T GA GAACGCCGAGCTGCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATC CAG GAAGAAC T GAC CAAT С T GAAC T С C GAG С T GAC С CAG GAAGAGAT C GAG CAGAT С T С TAAT C- 74 042798 gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtacctttaattctagtactatgcatgcgttgacattgattattgactagt tattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacat aacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataat gacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtattta cggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacg tcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctac ttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatc aatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatg ggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccatt gacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaact accggtgccaccatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccA AGCGGAACTACATCCTGGGCCTGGACATCGGCATCACCAGCGTGGGCTACGGCATCATCGACTA CGAGACACGGGACGTGATCGATGCCGGCGTGCGGCTGTTCAAAGAGGCCAACGTGGAAAACAAC GAGGGCAGGCGGAGCAAGAGAGGCGCCAGAAGGCTGAAGCGGCGGAGGCGGCATAGAATCCAGA GAGTGAAGAAGCTGCTGTTCGACTACAACCTGCTGACCGACCACAGCGAGCTGAGCGGCATCAA CCCCTACGAGGCCAGAGTGAAGGGCCTGAGCCAGAAGCTGAGCGAGGAAGAGTTCTCTGCCGCC CTGCTGCACCTGGCCAAGAGAAGAGGCGTGCACAACGTGAACGAGGTGGAAGAGGACACCGGCA ACGAGCTGTCCACCAAAGAGCAGATCAGCCGGAACAGCAAGGCCCTGGAAGAGAAATACGTGGC CGAACTGCAGCTGGAACGGCTGAAGAAAGACGGCGAAGTGCGGGGCAGCATCAACAGATTCAAG ACCAGCGACTACGTGAAAGAAGCCAAACAGCTGCTGAAGGTGCAGAAGGCCTACCACCAGCTGG ACCAGAGCTTCATCGACACCTACATCGACCTGCTGGAAACCCGGCGGACCTACTATGAGGGACC TGGCGAGGGCAGCCCCTTCGGCTGGAAGGACATCAAAGAATGGTACGAGATGCTGATGGGCCAC TGCACCTACTTCCCCGAGGAACTGCGGAGCGTGAAGTACGCCTACAACGCCGACCTGTACAACG С С С T GAAC GAG С T GAACAAT С T C G T GAT GAG GAG G GAG GAGAAC GAGAAG С T G GAATAT TAG GA GAAG T T С C AGAT CATC GAGAAC G T G T T C AAG C AGAAGAAGAAG С С С AC С С T GAAG C AGAT C G С C AAAGAAATCCTCGTGAACGAAGAGGATATTAAGGGCTACAGAGTGACCAGCACCGGCAAGCCCG AG T T СAC СAAC С T GAAG G T G TAC CAC GACAT CAAGGACAT TACCGCCCGGAAAGAGATTAT T GA GAACGCCGAGCTGCTGGATCAGATTGCCAAGATCCTGACCATCTACCAGAGCAGCGAGGACATC CAG GAAGAAC T GAC CAAT C T GAAC T C C GAG C T GAC C CAG GAAGAGAT C GAG CAGAT C T C TAAT C

- 75 042798- 75 042798

TGAAGGGCTATACCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCT GTGGCACACCAACGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTG GACCTGTCCCAGCAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCG TGAAGAGAAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCC CAACGACATCATTATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAAC GAGATGCAGAAGCGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCA AAGAGAACGCCAAGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCT GTACAGCCTGGAAGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGAC CACATCATCCCCAGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGG AAGAAAACAGCAAGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGAT CAGCTACGAAACCTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAG ACCAAGAAAGAGTATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCA TCAACCGGAACCTGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTA CTTCAGAGTGAACAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTG CGGCGGAAGTGGAAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCC TGATCATTGCCAACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGT GATGGAAAACCAGATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAG GAG T AC AAAGAGAT С T T C AT С AC С С С С С AC C AGAT C AAG C AC AT T AAG GAC T T C AAG GAC TACA AGTACAGCCACCGGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCAC CCGGAAGGACGACAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGAC AATGACAAGCTGAAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGACC С С CAGAC С TAC CAGAAAC T GAAG CTGATTATG GAACAG TAC G G C GAC GAGAAGAAT CCCCTGTA CAAGTACTACGAGGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTG AT CAAGAAGAT TAAG TAT TAC G G CAACAAAC T GAAC GCCCATCTG GACAT СAC C GAC GAC TAC C CCAACAGCAGAAACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGA СAAT G G C G T G TAGAAG T T C G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAGTGAATAGCAAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGT TTATCGCCTCCTTCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGG C G T GAACAAC GAC С T G С T GAAC C G GAT C GAAG T GAACAT GAT C GACAT СAC С TAC C G C GAG TAG С T G GAAAACAT GAAC GACAAGAG G С С С С С CAG GAT CAT TAAGACAAT C G С С T С CAAGAC С CAGA GCATTAAGAAGTACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCC T CAGAT CAT CAAAAAG G G Caaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaa aaqggatcctacccatacgatgttccagattacgcttaagaattcctagagctcgctgatcage ctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgacc ctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctga gtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagaTGAAGGGCTATACCGGCACCCACAACCTGAGCCTGAAGGCCATCAACCTGATCCTGGACGAGCT GTGGCACACCAACGACAACCAGATCGCTATCTTCAACCGGCTGAAGCTGGTGCCCAAGAAGGTG GACCTGTCCCAGCAGAAAGAGATCCCCACCACCCTGGTGGACGACTTCATCCTGAGCCCCGTCG TGAAGAGAAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCC CAACGACATCATTATCGAGCTGGCCCGCGAGAAGAACTCCAAGGACGCCCAGAAAATGATCAAC GAGATGCAGAAGCGGAACCGGCAGACCAACGAGCGGATCGAGGAAATCATCCGGACCACCGGCA AAGAGAACGCCAAGTACCTGATCGAGAAGATCAAGCTGCACGACATGCAGGAAGGCAAGTGCCT GTACAGCCTGGAAGCCATCCCTCTGGAAGATCTGCTGAACAACCCCTTCAACTATGAGGTGGAC CACATCATCCCCAGAAGCGTGTCCTTCGACAACAGCTTCAACAACAAGGTGCTCGTGAAGCAGG AAGAAAACAGCAAGAAGGGCAACCGGACCCCATTCCAGTACCTGAGCAGCAGCGACAGCAAGAT CAGCTACGAAACCTTCAAGAAGCACATCCTGAATCTGGCCAAGGGCAAGGGCAGAATCAGCAAG ACCAAGAAAGAGTATCTGCTGGAAGAACGGGACATCAACAGGTTCTCCGTGCAGAAAGACTTCA TCAACCGGAACCTGGTGGATACCAGATACGCCACCAGAGGCCTGATGAACCTGCTGCGGAGCTA CTTCAGAGTGAACAACCTGGACGTGAAAGTGAAGTCCATCAATGGCGGCTTCACCAGCTTTCTG CGGCGGAAGTGGAAGTTTAAGAAAGAGCGGAACAAGGGGTACAAGCACCACGCCGAGGACGCCC TGATCATTGCCAACGCCGATTTCATCTTCAAAGAGTGGAAGAAACTGGACAAGGCCAAAAAAGT GATGGAAAACCAGATGTTCGAGGAAAAGCAGGCCGAGAGCATGCCCGAGATCGAAACCGAGCAG GAG T AC AAAGAGAT С T T C AT С AC С С С С С AC C AGAT C AAG C AC AT T AAG GAC T T C AAG GAC TACA AGTACAGCCACCGGGTGGACAAGAAGCCTAATAGAGAGCTGATTAACGACACCCTGTACTCCAC CCGGAAGGACGACAAGGGCAACACCCTGATCGTGAACAATCTGAACGGCCTGTACGACAAGGAC AATGACAAGCTGAAAAAGCTGATCAACAAGAGCCCCGAAAAGCTGCTGATGTACCACCACGACC С С CAGAC С TAC CAGAAAC T GAAG CTGATTATG GAACAG TAC G G C GAC GAGAAGAAT CCCCTGTA CAAGTACTACGAGGAAACCGGGAACTACCTGACCAAGTACTCCAAAAAGGACAACGGCCCCGTG AT CAAGAAGAT TAAG TAT TAC G G CAACAAAC T GAAC GCCCATCTG GACAT СAC C GAC GAC TAC C CCAACAGCAGAAACAAGGTCGTGAAGCTGTCCCTGAAGCCCTACAGATTCGACGTGTACCTGGA СAAT G G C G T G TAGAAG T T C G T GAC C G T GAAGAAT CTGGATGTGAT CAAAAAAGAAAAC TAG TAG GAAGTGAATAGCAAGTGCTATGAGGAAGCTAAGAAGCTGAAGAAGATCAGCAACCAGGCCGAGT TTATCGCCTCCTTCTACAACAACGATCTGATCAAGATCAACGGCGAGCTGTATAGAGTGATCGG C G T GAACAAC GAC С T G С T GAAC C G GAT C GAAG T GAACAT GAT C GACAT СAC С TAC C G C GAG TAG С T G GAAAACAT GAAC GACAAGAG G С С С С С CAG GAT CAT TAAGACAAT C G С С T С CAAGAC С CAGA GCATTAAGAAGTACAGCACAGACATTCTGGGCAACCTGTATGAAGTGAAATCTAAGAAGCACCC T CAGAT CAT CAAAAAG G G Caaaaqqccqqcqqccacqaaaaaqqccqqccaqqcaaaaaaqaaa aaqggatcctacccatacgatgttccagattacgcttaagaattcctagagctcgctgatcage ctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgacc

- 76 042798 gaatagcaggcatgctggggaggtagcggccgcccgcggtggagctccagcttttgttcccttt agtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgtta tccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaa tgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgt cgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctc ttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagct cactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgag caaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggct ccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacagga ctataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgc cgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacg ctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacccccc gttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacg acttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgc tacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgc getctgetgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaacca ccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctca agaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaaggg attttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagtt ttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtga ggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtag ataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccac gctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtgg tcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagt tcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgt cgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccat gttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgca gtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagat gcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgag ttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctc atcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagtt cgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgg gtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttga atactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcg gatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaa agtgccac- 76 042798 gaatagcaggcatgctggggaggtagcggccgcccgcggtggagctccagcttttgttcccttt agtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgtta tccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaa tgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgt cgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctc ttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagct cactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgag caaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggct ccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacagga ctataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgc cgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacg ctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacccccc gttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacg acttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgc tacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgc getctgetgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaacca ccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctca agaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaaggg attttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagtt ttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtga ggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtag ataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccac gctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtgg tcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagt tcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgt cgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccat gttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgca gtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagat gcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgag ttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctc atcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagtt cgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgg gtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttga atactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcg gatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaa agtgccac

- 77 042798- 77 042798

Последовательность NLS в РТ366 (SEQ ID NO: 85)NLS sequence in PT366 (SEQ ID NO: 85)

AAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG pDO203 - типичный каркас для клонирования gRNA с SpCas9;AAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG pDO203 - typical scaffold for gRNA cloning with SpCas9;

JCR94 и JCR99 помещали в сайт, выделенный жирным шрифтом, для тестирования в клетках, с последующим получением mRNA для получения мыши hDMD-flenbTa52/mdx (SEQ ID NO: 86) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccgagggcctatttcccatgattccttcatatttgcatatacgataca aggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatac gtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggac tatcatatgcttatcgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaag gacgaaacaccGGGTCTTCGAGAAGACCTgttttagagctagaaatagcaagttaaaataaggc tagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttttccgcggtggagctcca gcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcc tgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaa gcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttcc agtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggttt gcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcgg cgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcag gaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggc gtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtgg cgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctc ctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgct ttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgt gtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtcca acccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgag gtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacaJCR94 и JCR99 помещали в сайт, выделенный жирным шрифтом, для тестирования в клетках, с последующим получением mRNA для получения мыши hDMD-flenbTa52/mdx (SEQ ID NO: 86) ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattt tttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggt tgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagg gcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttg gggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgac ggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggc gctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgcta cagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcct cttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgcc agggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcacta tagggcgaattgggtaccgagggcctatttcccatgattccttcatatttgcatatacgataca aggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatac gtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggac tatcatatgcttatcgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaag gacgaaacaccGGGTCTTCGAGAAGACCTgttttagagctagaaatagcaagttaaaataaggc tagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttttccgcggtggagctcca gcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcc tgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaa gcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttcc agtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggttt gcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcgg cgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcag gaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggc gtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtgg cgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctc ctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgct ttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgt gtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtcca acccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgag gtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggaca

- 78 042798 gtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgat ccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcag aaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaa aactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaa attaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttacca atgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctga ctccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatga taccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggc cgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaa gctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcg tggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagt tасаtgatcccccatgttgtgcaaaaaagcggttagetccttcggtcctccgatcgttgtсада agtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtca tgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtg tatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcaga actttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgc tgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttacttt caccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcg acacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggtt attgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcg cacatttccccgaaaagtgccac- 78 042798 gtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgat ccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcag aaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaa aactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaa attaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttacca atgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctga ctccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatga taccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggc cgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaa gctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcg tggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagt tасаtgatcccccatgttgtgcaaaaaagcggttagetccttcggtcctccgatcgttgtсада agtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtca tgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtg tatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcaga actttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgc tgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttacttt caccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcg acacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggtt attgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcg cacatttccccgaaaagtgccac

Claims (18)

1. Композиция для нацеливания на ДНК, содержащая первую молекулу gRNA и вторую молекулу gRNA, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;1. A DNA targeting composition comprising a first gRNA molecule and a second gRNA molecule, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain encoded by a polynucleotide containing a nucleotide sequence, presented in SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain, which is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 2; (ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; (iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; (v) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (vi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;(vi) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; (vii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; (viii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим (viii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing - 79 042798 нуклеотидную последовательность, представленную в SEQ ID NO: 4;- 79 042798 nucleotide sequence shown in SEQ ID NO: 4; (ix) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; (x) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15;(x) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15; (xi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.(xi) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; and (xii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 41 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: :42. 2. Композиция для нацеливания на ДНК по п.1, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;2. The DNA targeting composition of claim 1, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO : 1, and a second gRNA molecule containing a targeting domain encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 2; (ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19; и (iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.(iii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; and (iv) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 41 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: :42. 3. Композиция для нацеливания на ДНК по п.1 или 2, дополнительно содержащая белок, ассоциированный с короткими палиндромными повторами, регулярно расположенными группами, (Cas).3. A DNA targeting composition according to claim 1 or 2, further comprising a protein associated with regularly spaced short palindromic repeats (Cas). 4. Композиция для нацеливания на ДНК по п.3, где белок Cas содержит молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).4. The DNA targeting composition of claim 3, wherein the Cas protein comprises a Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25). 5. Выделенный полинуклеотид, содержащий первую молекулу gRNA и вторую молекулу gRNA, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;5. An isolated polynucleotide comprising a first gRNA molecule and a second gRNA molecule, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 2; (ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; (iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; (v) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; - 80 042798 (vi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;- 80 042798 (vi) a first gRNA molecule containing a targeting domain encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14 and a second gRNA molecule containing a targeting domain encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; (vii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; (viii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(viii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (ix) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; (x) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15;(x) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15; (xi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.(xi) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; and (xii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 41 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: :42. 6. Выделенный полинуклеотид по п.5, где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;6. The isolated polynucleotide of claim 5, wherein the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) a first gRNA molecule containing a targeting domain encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 2; (ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19; и (iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.(iii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; and (iv) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 41 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: :42. 7. Выделенный полинуклеотид по п.5 или 6, дополнительно кодирующий белок, ассоциированный с короткими палиндромными повторами, регулярно расположенными группами, (Cas).7. An isolated polynucleotide according to claim 5 or 6, further encoding a protein associated with regularly spaced short palindromic repeats (Cas). 8. Выделенный полинуклеотид по п.7, где белок Cas содержит молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25).8. The isolated polynucleotide of claim 7, wherein the Cas protein comprises a Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25). 9. Вектор, содержащий выделенный полинуклеотид по любому из пп.5-8.9. A vector containing an isolated polynucleotide according to any one of claims 5-8. 10. Вектор по п.9, где вектор сконструирован с возможностью образования первого и второго двухнитевых разрывов в первом и втором интронах, фланкирующих экзон 51 гена DMD человека.10. The vector of claim 9, wherein the vector is constructed to form first and second double strand breaks in the first and second introns flanking exon 51 of the human DMD gene. 11. Вектор по п.9 или 10, где вектор представляет собой вирусный вектор.11. A vector according to claim 9 or 10, wherein the vector is a viral vector. 12. Вектор по любому из пп.9-11, где вектор содержит тканеспецифичный промотор, функционально связанный с нуклеотидной последовательностью, кодирующей первую молекулу gRNA, вторую молекулу gRNA и/или молекулу Cas9.12. A vector according to any one of claims 9-11, wherein the vector contains a tissue-specific promoter operably linked to a nucleotide sequence encoding a first gRNA molecule, a second gRNA molecule and/or a Cas9 molecule. 13. Клетка, содержащая композицию для нацеливания на ДНК по любому из пп.1-4, или выделенный полинуклеотид по любому из пп.5-8, или вектор по любому из пп.9-12.13. A cell comprising a DNA targeting composition according to any one of claims 1-4, or an isolated polynucleotide according to any one of claims 5-8, or a vector according to any one of claims 9-12. 14. Набор для обеспечения делеции сегмента гена дистрофина, содержащего экзон 51 или экзон 52, где набор содержит композицию для нацеливания на ДНК по любому из пп.1-4, или выделенный полинуклеотид по любому из пп.1-4, или вектор по любому из пп.9-12, или клетку по п.13.14. A kit for providing a deletion of a dystrophin gene segment containing exon 51 or exon 52, where the kit contains a composition for targeting DNA according to any one of claims 1-4, or an isolated polynucleotide according to any one of claims 1-4, or a vector according to any from claims 9-12, or a cage according to claim 13. - 81 042798- 81 042798 15. Набор по п.14, дополнительно содержащий инструкции по применению.15. The kit according to claim 14, further containing instructions for use. 16. Способ обеспечения делеции сегмента гена дистрофина, содержащего экзон 51 или экзон 52 в клетке, при этом способ предусматривает введение в клетку композиции для нацеливания на ДНК по любому из пп.1-4, или выделенного полинуклеотида по любому из пп.5-8, или вектора по любому из пп.9-12.16. A method of providing a deletion of a dystrophin gene segment containing exon 51 or exon 52 in a cell, the method comprising introducing into the cell a DNA targeting composition according to any one of claims 1-4, or an isolated polynucleotide according to any one of claims 5-8 , or a vector according to any one of claims 9-12. 17. Способ обеспечения делеции сегмента гена дистрофина, содержащего экзон 51 или экзон 52 у субъекта, при этом способ предусматривает введение субъекту композиции для нацеливания на ДНК по любому из пп.1-4, или выделенного полинуклеотида, кодирующего композицию для нацеливания на ДНК по любому из пп.5-8, или вектора по любому из пп.9-12, или клетки по п.13.17. A method of providing a deletion of a dystrophin gene segment containing exon 51 or exon 52 in a subject, the method comprising administering to the subject a DNA targeting composition according to any one of claims 1 to 4, or an isolated polynucleotide encoding a DNA targeting composition according to any from claims 5 to 8, or a vector according to any of claims 9 to 12, or a cell according to claim 13. 18. Композиция для обеспечения делеции сегмента гена дистрофина, содержащего экзон 51 или экзон 52, при этом композиция содержит (a) первый вектор, содержащий полинуклеотидную последовательность, кодирующую первую молекулу направляющей РНК (gRNA), и полинуклеотидную последовательность, кодирующую первую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25); и (b) второй вектор, содержащий полинуклеотидную последовательность, кодирующую вторую молекулу gRNA, и полинуклеотидную последовательность, кодирующую вторую молекулу Cas9, которая распознает смежный с протоспейсером мотив (PAM) либо NNGRRT (SEQ ID NO: 24), либо NNGRRV (SEQ ID NO: 25), где каждая из первой и второй молекул gRNA содержит нацеливающий домен, длина которого составляет от 19 до 24 нуклеотидов, и где первый вектор и второй вектор сконструированы с возможностью образования первого и второго двухнитевых разрывов соответственно в первом интроне и втором интроне, фланкирующих экзон 51 или экзон 52 гена DMD человека, за счет чего обеспечивается делеция сегмента гена дистрофина, содержащего экзон 51 или экзон 52, и где первая молекула gRNA и вторая молекула gRNA выбраны из группы, состоящей из (i) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 1, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 2;18. A composition for providing a deletion of a dystrophin gene segment containing exon 51 or exon 52, wherein the composition comprises (a) a first vector containing a polynucleotide sequence encoding a first guide RNA (gRNA) molecule and a polynucleotide sequence encoding a first Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO: 25); and (b) a second vector containing a polynucleotide sequence encoding a second gRNA molecule and a polynucleotide sequence encoding a second Cas9 molecule that recognizes a protospacer adjacent motif (PAM) of either NNGRRT (SEQ ID NO: 24) or NNGRRV (SEQ ID NO : 25), where each of the first and second gRNA molecules contains a targeting domain, the length of which is from 19 to 24 nucleotides, and where the first vector and the second vector are designed to form the first and second double-strand breaks, respectively, in the first intron and second intron, flanking exon 51 or exon 52 of the human DMD gene, thereby providing a deletion of the dystrophin gene segment containing exon 51 or exon 52, and where the first gRNA molecule and the second gRNA molecule are selected from the group consisting of (i) the first gRNA molecule containing a targeting domain , which is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 1, and a second gRNA molecule containing a targeting domain, which is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 2; (ii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(ii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (iii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;(iii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; (iv) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;(iv) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; (v) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(v) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (vi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;(vi) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; (vii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18;(vii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; (viii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 4;(viii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 4; (ix) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 19;(ix) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 19; - 82 042798 (x) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 14, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 15;- 82 042798 (x) the first gRNA molecule containing the targeting domain, which is encoded by the polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 14, and the second gRNA molecule containing the targeting domain, which is encoded by the polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 15; (xi) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 11, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 18; и (xii) первой молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 41, и второй молекулы gRNA, содержащей нацеливающий домен, который кодируется полинуклеотидом, содержащим нуклеотидную последовательность, представленную в SEQ ID NO: 42.(xi) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 11, and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 18; and (xii) a first gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: 41 and a second gRNA molecule containing a targeting domain that is encoded by a polynucleotide containing the nucleotide sequence shown in SEQ ID NO: :42.
EA201891317 2015-11-30 2016-11-30 THERAPEUTIC TARGETS FOR CORRECTION OF THE HUMAN DYSTROFIN GENE USING GENE EDITING AND METHODS FOR THEIR APPLICATION EA042798B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/260,712 2015-11-30
US62/330,336 2016-05-02

Publications (1)

Publication Number Publication Date
EA042798B1 true EA042798B1 (en) 2023-03-27

Family

ID=

Similar Documents

Publication Publication Date Title
JP7517724B2 (en) Therapeutic targets and methods of use for correction of the human dystrophin gene by gene editing
JP7075597B2 (en) CRISPR / CAS-related methods and compositions for treating Duchenne muscular dystrophy
JP7490211B2 (en) Therapeutic Applications of CPF1-Based Genome Editing
CN105658805B (en) RNA-guided gene editing and gene regulation
US20220184229A1 (en) Aav vector-mediated deletion of large mutational hotspot for treatment of duchenne muscular dystrophy
US20230257723A1 (en) Crispr/cas9 therapies for correcting duchenne muscular dystrophy by targeted genomic integration
US20220195406A1 (en) Crispr/cas-based genome editing composition for restoring dystrophin function
US20150196670A1 (en) Compositions and methods for duchenne muscular dystrophy gene therapy
US20230349888A1 (en) A high-throughput screening method to discover optimal grna pairs for crispr-mediated exon deletion
US20230102342A1 (en) Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use
US20210163939A1 (en) Improved crispr therapy
JP2023515709A (en) Gene editing of satellite cells in vivo using AAV vectors encoding muscle-specific promoters
US20230392132A1 (en) Dual aav vector-mediated deletion of large mutational hotspot for treatment of duchenne muscular dystrophy
EA042798B1 (en) THERAPEUTIC TARGETS FOR CORRECTION OF THE HUMAN DYSTROFIN GENE USING GENE EDITING AND METHODS FOR THEIR APPLICATION