EA045749B1

EA045749B1 - CODON-OPTIMIZED NUCLEIC ACID ENCODING THE SMN1 PROTEIN AND ITS APPLICATION

Info

Publication number: EA045749B1
Application number: EA202293188
Authority: EA
Inventors: Дмитрий Александрович Мадера; Павел Михайлович Гершович; Анна Сергеевна Веселова; Татьяна Евгеньевна Шугаева; Мария Андреевна Ломунова; Маргарита Александровна Шкляева; Дмитрий Валентинович Морозов
Original assignee: Акционерное общество "БИОКАД"
Priority date: 2020-06-02
Filing date: 2021-06-02
Publication date: 2023-12-22

Description

Область техникиField of technology

Настоящее изобретение относится к области генетики, генной терапии и молекулярной биологии. Более конкретно, настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных (двигательных) нейронов), экспрессионной кассете и вектору на ее основе, а также к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках и их применению.The present invention relates to the fields of genetics, gene therapy and molecular biology. More specifically, the present invention relates to an isolated codon-optimized nucleic acid that encodes the SMN1 (motor neuron survival protein) protein, an expression cassette and a vector based thereon, as well as a recombinant virus based on AAV9 (adeno-associated virus serotype 9) to increase the expression of the SMN1 gene in target cells and their application.

Уровень техникиState of the art

Спинальная мышечная атрофия (SMA) представляет собой аутосомное рецессивное нервномышечное нарушение, вызванное мутациями в гене выживаемости моторных (двигательных) нейронов 1 (SMN1) и утратой кодируемого SMN белка (Lefebvre et al., Cell (1995).ю 80:155-165). Отсутствие SMN ведет к дегенерации двигательных нейронов в брюшном (переднем) роге спинного мозга, что ведет к слабости проксимальных мышц, отвечающих за ползание, ходьбу, движение шеи и глотание, и непроизвольно сокращающихся мышц, которые управляют дыханием и кашлем (Sumner C.J., NeuroRx (2006), 3:235-245). Таким образом, пациенты с SMA предрасположены к пневмониям и другим пульмональным проблемам, таким как рестриктивное легочное заболевание.Spinal muscular atrophy (SMA) is an autosomal recessive neuromuscular disorder caused by mutations in the survival motor neuron 1 (SMN1) gene and loss of the SMN-encoded protein (Lefebvre et al., Cell (1995). 80:155-165) . The absence of SMN leads to degeneration of motor neurons in the ventral (anterior) horn of the spinal cord, which leads to weakness of the proximal muscles responsible for crawling, walking, neck movement and swallowing, and the involuntary muscles that control breathing and coughing (Sumner C.J., NeuroRx ( 2006), 3:235-245). Thus, patients with SMA are predisposed to pneumonia and other pulmonary problems such as restrictive pulmonary disease.

Генная терапия представляет собой перспективный способ лечения спинальной мышечной атрофии (SMA).Gene therapy represents a promising treatment option for spinal muscular atrophy (SMA).

Аденоассоциированные вирусные (AAV) векторы считаются эффективными для генной терапии ЦНС, поскольку они обладают подходящим профилем токсичности и иммуногенности, их можно использовать в трансдукции нервных клеток, и они способны опосредовать длительную экспрессию в ЦНС.Adeno-associated viral (AAV) vectors are considered effective for CNS gene therapy because they have a suitable toxicity and immunogenicity profile, can be used in neural cell transduction, and are capable of mediating long-lasting expression in the CNS.

Аденоассоциированный вирус (AAV) представляет собой небольшой (20 нм), неспособный к самостоятельной репликации, безоболочечный вирус. У человека и приматов описано множество различных серотипов AAV. Геном аденоассоциированного вируса содержит (+ или -) одноцепочечную ДНК (ssDNA) длиной около 4,7 тысяч нуклеотидов. На концах молекулы геномной ДНК располагаются инвертированные концевые повторы (англ. inverted terminal repeats, ITRs). Геном содержит две открытые рамки считывания (англ. ORF): Rep и Сар, содержащие в себе несколько альтернативных рамок считывания, кодирующих различные белковые продукты. Продукты Rep имеют важное значение для репликации AAV, при этом ген Сар, помимо других альтернативных продуктов, кодирует 3 капсидных белка (VP1, VP2 и VP3). Белки VP1, VP2 и VP3 находятся в соотношении 1:1:10, образуя икосаэдрический капсид (Xie Q. et al., The atomic structure of adeno-associated vims (AAV-2), a vector for human gene therapy, Proc. Natl. Acad. Sci., USA, 2002, 99:10405-10410). При образовании рекомбинантного вектора AAV (rAAV) кассета экспрессии, фланкированная ITR, упаковывается в капсид AAV. Гены, необходимые для репликации AAV, не входят в кассету. Рекомбинантный AAV считается самым безопасным и одним из наиболее широко используемых вирусных векторов для переноса генов in vivo. Векторы могут инфицировать клетки из тканей множества типов, обеспечивая мощную и устойчивую трансгенную экспрессию. Они также являются непатогенными и имеют низкий профиль иммуногенности (High K.A. et al., rAAV human trial experience, Methods Mol. Biol., 2011, 807:429-57).Adeno-associated virus (AAV) is a small (20 nm), non-replicating, non-enveloped virus. Many different serotypes of AAV have been described in humans and primates. The genome of the adeno-associated virus contains (+ or -) single-stranded DNA (ssDNA) about 4.7 thousand nucleotides in length. At the ends of the genomic DNA molecule there are inverted terminal repeats (ITRs). The genome contains two open reading frames (ORFs): Rep and Car, which contain several alternative reading frames encoding various protein products. Rep products are essential for AAV replication, with the Cap gene encoding 3 capsid proteins (VP1, VP2, and VP3) among other alternative products. Proteins VP1, VP2 and VP3 are in a ratio of 1:1:10, forming an icosahedral capsid (Xie Q. et al., The atomic structure of adeno-associated vims (AAV-2), a vector for human gene therapy, Proc. Natl Acad. Sci., USA, 2002, 99:10405-10410). During the formation of a recombinant AAV vector (rAAV), an ITR-flanked expression cassette is packaged into the AAV capsid. Genes required for AAV replication are not included in the cassette. Recombinant AAV is considered the safest and one of the most widely used viral vectors for in vivo gene transfer. Vectors can infect cells from a variety of tissue types, providing potent and sustained transgene expression. They are also non-pathogenic and have a low immunogenicity profile (High K.A. et al., rAAV human trial experience, Methods Mol. Biol., 2011, 807:429-57).

Одной из насущных целей исследований в области разработки эффективной генотерапии является кодон-оптимизация генов интереса в составе векторов для получения максимального уровня экспрессии генов интереса, что, в свою очередь, позволит использовать для достижения значимого эффекта более низкие дозы вектора.One of the urgent goals of research in the development of effective gene therapy is codon optimization of genes of interest in vectors to obtain the maximum level of expression of genes of interest, which, in turn, will allow the use of lower doses of the vector to achieve a significant effect.

Одним из свойств генетического кода является вырожденность - способность разных кодонов (тринуклеотидов) кодировать одну и ту же аминокислоту. Такие кодоны, которые дают одну и ту же аминокислоту в процессе трансляции, называются синонимичными. В природных последовательностях выбор одного из синонимичных кодонов осуществляется случайным образом в процессе эволюции, однако частоты использования синонимичных кодонов отличаются: для каждой аминокислоты есть более и менее предпочтительные. Кодон-оптимизация - это широко используемая в мире техника, направленная на повышение продуктивности наработки белковых молекул, которая заключается в рациональном сопоставлении каждой аминокислоте в белковой последовательности одного из подходящих синонимичных кодонов. Один из распространенных принципов кодон-оптимизации подразумевает использование наиболее частых кодонов, впоследствии были предложены и другие подходы, такие как гармонизация (воспроизведение распределения частот используемых кодонов), но и они не всегда дают увеличение продуктивности. Помимо частот кодонов на эффективность наработки может влиять GC-состав последовательности (отношение количества гуанинов и цитозинов к суммарной длине последовательности), в частности, было показано, что завышенный GC-состав ассоциирован с повышением количества мРНК в клетках млекопитающих Grzegorz Kudla ET AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, volume 4, issue 6, e180, p. 933-942). Также стоит отметить, что устойчивые элементы вторичной структуры мРНК, т.е. имеющие низкую свободную энергию фолдинга, могут снижать эффективность.One of the properties of the genetic code is degeneracy - the ability of different codons (trinucleotides) to encode the same amino acid. Such codons that give the same amino acid during translation are called synonymous. In natural sequences, the choice of one of the synonymous codons is carried out randomly in the process of evolution, but the frequencies of use of synonymous codons differ: for each amino acid there are more and less preferable ones. Codon optimization is a technique widely used in the world aimed at increasing the productivity of protein molecules, which consists in rationally matching each amino acid in the protein sequence with one of the suitable synonymous codons. One of the common principles of codon optimization involves the use of the most frequent codons; subsequently, other approaches were proposed, such as harmonization (reproducing the distribution of frequencies of used codons), but they do not always increase productivity. In addition to codon frequencies, the production efficiency can be influenced by the GC composition of the sequence (the ratio of the number of guanines and cytosines to the total length of the sequence); in particular, it has been shown that an increased GC composition is associated with an increase in the amount of mRNA in mammalian cells Grzegorz Kudla ET AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, volume 4, issue 6, e180, p. 933-942). It is also worth noting that stable elements of the secondary structure of mRNA, i.e. having low free energy of folding may reduce efficiency.

Различные варианты кодон-оптимизации последовательности гена интереса могут приводить к следующему (в сравнение с геном дикого типа):Various options for codon optimization of the sequence of the gene of interest can lead to the following (compared to the wild type gene):

- 1 045749- 1 045749

а) уровень экспрессии генов интереса будет незначительно увеличен;a) the level of expression of genes of interest will be slightly increased;

б) уровень экспрессии генов интереса будет значительно увеличен;b) the level of expression of genes of interest will be significantly increased;

в) уровень экспрессии генов интереса останется приблизительно на том же уровне;c) the level of expression of genes of interest will remain approximately at the same level;

г) уровень экспрессии генов интереса будет понижен.d) the level of expression of genes of interest will be reduced.

Таким образом, есть потребность в получении кодон-оптимизированной последовательности гена SMN1 для увеличения экспрессии гена SMN1 в целевых клетках.Thus, there is a need to obtain a codon-optimized sequence of the SMN1 gene to increase the expression of the SMN1 gene in target cells.

Было установлено, что кодон-оптимизированная последовательность SMN1 (SMN1-GeneBeam (или сокращенно SMN1-GB)), которая имеет нуклеотидную последовательность SEQ ID NO: 2, неожиданно увеличивает транскрипцию гена SMN1 более чем в 3 раза, т.е. неожиданно увеличивает количество копий мРНК SMN1-GeneBeam в более чем 3 раза по сравнению с SMN1-WT (дикого типа), что в свою очередь приводит к значительному увеличению экспрессии гена SMN1 и, соответственно SMN белка.It was found that the codon-optimized sequence of SMN1 (SMN1-GeneBeam (or SMN1-GB for short)), which has the nucleotide sequence SEQ ID NO: 2, unexpectedly increases the transcription of the SMN1 gene by more than 3-fold, i.e. unexpectedly increases the number of copies of SMN1-GeneBeam mRNA by more than 3 times compared to SMN1-WT (wild type), which in turn leads to a significant increase in the expression of the SMN1 gene and, accordingly, SMN protein.

Краткое описание изобретенияBrief description of the invention

В одном из аспектов настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных нейронов) с SEQ ID NO: 1, и включает последовательность нуклеиновой кислоты SEQ ID NO: 2.In one aspect, the present invention provides an isolated codon-optimized nucleic acid that encodes the SMN1 (survival motor neuron protein) protein of SEQ ID NO: 1, and includes the nucleic acid sequence of SEQ ID NO: 2.

В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту.In one aspect, the present invention provides an expression cassette that includes the above codon-optimized nucleic acid.

В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the expression cassette includes the following elements in a 5' to 3' direction:

левый (первый) ITR (инвертированные концевые повторы);left (first) ITR (inverted terminal repeats);

CMV (цитомегаловирусный) энхансер;CMV (cytomegalovirus) enhancer;

CMV (цитомегаловирусный) промотер;CMV (cytomegalovirus) promoter;

интрон гена hBG1 (ген субъединицы гемоглобина гамма-1);intron of the hBG1 gene (hemoglobin subunit gamma-1 gene);

вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;

сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека); правый (второй) ITR.hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal); right (second) ITR.

В некоторых вариантах экспрессионная кассета включает нуклеиновую кислоту с последовательностью SEQ ID NO: 4.In some embodiments, the expression cassette includes a nucleic acid having the sequence of SEQ ID NO: 4.

В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту или вышеуказанную кассету.In one aspect, the present invention relates to an expression vector that includes the above codon-optimized nucleic acid or cassette.

В одном из аспектов настоящее изобретение относится к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, который включает капсид и вышеуказанную экспрессионную кассету.In one aspect, the present invention relates to a recombinant virus based on AAV9 (adeno-associated virus serotype 9) for increasing the expression of the SMN1 gene in target cells, which includes a capsid and the above expression cassette.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5.In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 with one or more point mutations.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the following elements in the direction from 5 '-end to 3'-end:

CMV энхансер;CMV enhancer;

CMV промотер;CMV promoter;

интрон гена hBG1;hBG1 gene intron;

сигнал полиаденилирования hGH1;hGH1 polyadenylation signal;

правый ITR.right ITR.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: : 4.

В одном из аспектов настоящее изобретение относится к фармацевтической композиции для доставки гена SMN1 в целевые клетки, которая включает вышеуказанный рекомбинантный вирус на основе AAV9 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.In one aspect, the present invention relates to a pharmaceutical composition for delivering the SMN1 gene to target cells, which includes the above-mentioned AAV9-based recombinant virus in combination with one or more pharmaceutically acceptable excipients.

В одном из аспектов настоящее изобретение относится к применению вышеуказанного рекомбинантного вируса на основе AAV9 или вышеуказанной композиции для доставки гена SMN1 в целевые клетки.In one aspect, the present invention relates to the use of the above recombinant AAV9 virus or the above composition for delivering the SMN1 gene to target cells.

Краткое описание чертежейBrief description of drawings

На фиг. 1 показана экспрессия SMN1 на уровне мРНК после трансфекции. Клетки HEK293 и HSMCIn fig. Figure 1 shows SMN1 expression at the mRNA level after transfection. HEK293 and HSMC cells

- 2 045749 были трансфецированы 5 мкг плазмид pAAV-SMN1-WT и pAAV-SMN1-GB (кодирующих ген SMN1 без кодон-оптимизации и с кодон-оптимизацией по алгоритму GeneBeam). Через 72 ч количество копий гена SMN1 в каждом образце было определено с помощью количественной ПЦР (n=3). Также было определено количество копий гена домашнего хозяйства GAPDH. Все полученные количества для SMN1 были нормализованы на 10000 копий гена GAPDH в каждом образце. Представлены данные по нормализованному среднему количеству копий SMN1-WT, SMN-GB для обеих клеточных линий, с указанием стандартного отклонения. Также представлено соотношение нормализованного количества копий SMN1-GB и SMN1-WT в каждой линии.- 2 045749 were transfected with 5 μg of plasmids pAAV-SMN1-WT and pAAV-SMN1-GB (encoding the SMN1 gene without codon optimization and with codon optimization using the GeneBeam algorithm). After 72 h, the copy number of the SMN1 gene in each sample was determined using quantitative PCR (n=3). The copy number of the housekeeping gene GAPDH was also determined. All obtained quantities for SMN1 were normalized to 10,000 copies of the GAPDH gene in each sample. Data are presented on the normalized mean copy number of SMN1-WT, SMN-GB for both cell lines, with standard deviation indicated. The ratio of normalized copy numbers of SMN1-GB and SMN1-WT in each line is also presented.

На фиг. 2 показана экспрессия SMN1 на уровне белка после трансфекции. Клетки HSMC были трансфецированы 5 мкг плазмид pAAV-SMN1-WT и pAAV-SMN1-GB (кодирующих ген SMN1 без кодон-оптимизации и с кодон-оптимизацией по алгоритму GeneBeam). Через 72 ч клетки были покрашены первичными антителами к белку SMN1 и вторичными антителами, мечеными Alexa Fluor 488, в каждом образце (n=3). Представлена средняя интенсивность флуоресцентного сигнала для живых клеток в образцах за вычетом фонового сигнала, полученного на клетках, окрашенных вторичными антителами без первичных антител, с указанием стандартного отклонения.In fig. Figure 2 shows the expression of SMN1 at the protein level after transfection. HSMC cells were transfected with 5 μg of plasmids pAAV-SMN1-WT and pAAV-SMN1-GB (encoding the SMN1 gene without codon optimization and with codon optimization using the GeneBeam algorithm). After 72 h, cells were stained with primary antibodies to the SMN1 protein and secondary antibodies labeled with Alexa Fluor 488 in each sample (n=3). The average fluorescent signal intensity for live cells in the samples minus the background signal obtained from cells stained with secondary antibodies without primary antibodies is presented, with the standard deviation indicated.

На фиг. 3 показано соотношение экспрессии SMN1 на уровне мРНК и белка после трансдукции. Клетки HSMC были трансдуцированы вирусами AAV9-SMN1-WT и AAV9-SMN1-GB в 3 независимых экспериментах, в каждом из которых эффективность трансдукции составила не менее 50% по контрольному GFP-содержащему вирусу. Экспрессия SMN1 была определена на уровне мРНК и белка (см. выше), после чего посчитано соотношение экспрессии SMN1-GB и SMN1-WT. Средние соотношения вместе со стандартными отклонениями представлены на фигуре.In fig. Figure 3 shows the ratio of SMN1 expression at the mRNA and protein levels after transduction. HSMC cells were transduced with AAV9-SMN1-WT and AAV9-SMN1-GB viruses in 3 independent experiments, in each of which the transduction efficiency was at least 50% of the control GFP-containing virus. SMN1 expression was determined at the mRNA and protein levels (see above), after which the ratio of SMN1-GB and SMN1-WT expression was calculated. The average ratios along with standard deviations are presented in the figure.

Определения и общие методыDefinitions and general methods

Если иное не определено в настоящем изобретении, научные и технические термины, используемые в связи с настоящим изобретением, будут иметь значения, которые обычно понятны специалистам в данной области.Unless otherwise defined in the present invention, scientific and technical terms used in connection with the present invention will have the meanings that are commonly understood by those skilled in the art.

Кроме того, если по контексту не требуется иное, термины в единственном числе включают в себя термины во множественном числе, и термины во множественном числе включают в себя термины в единственном числе. Как правило, используемая классификация и методы культивирования клеток, молекулярной биологии, иммунологии, микробиологии, генетики, аналитической химии, химии органического синтеза, медицинской и фармацевтической химии, а также гибридизации и химии белка и нуклеиновых кислот, описанные в настоящем изобретении, хорошо известны специалистам и широко применяются в данной области. Ферментативные реакции и способы очистки осуществляют в соответствии с инструкциями производителя, как это обычно осуществляется в данной области, или как описано в настоящем изобретении.In addition, unless the context otherwise requires, terms in the singular include plural terms, and plural terms include singular terms. In general, the classification and methods of cell culture, molecular biology, immunology, microbiology, genetics, analytical chemistry, organic synthesis chemistry, medicinal and pharmaceutical chemistry, as well as hybridization and protein and nucleic acid chemistry described in the present invention are well known to those skilled in the art. widely used in this field. Enzymatic reactions and purification methods are carried out in accordance with the manufacturer's instructions, as is usually carried out in the art, or as described in the present invention.

Выделенный означает измененный или удаленный из природного состояния. Например, нуклеиновая кислота или пептид, в природе присутствующие в животном, не являются выделенными, но те же нуклеиновая кислота или пептид, частично или полностью отделенные от материалов, сопутствующих им в их природном состоянии, являются выделенными. Выделенная нуклеиновая кислота или белок могут существовать, по существу, в очищенной форме или могут существовать в неприродном окружении, таком как, например, генетически модифицированной клетке.Separated means altered or removed from the natural state. For example, a nucleic acid or peptide naturally present in an animal is not isolated, but the same nucleic acid or peptide, partially or completely separated from the materials accompanying it in its natural state, is isolated. The isolated nucleic acid or protein may exist in substantially purified form or may exist in a non-natural environment, such as, for example, a genetically modified cell.

Определения встречающийся в природе, нативный или дикого типа используют для описания объекта, который можно обнаружить в природе как отличающийся от получаемого искусственно. Например, белок или нуклеотидная последовательность, присутствующие в организме (включая вирус), которые можно изолировать из источника в природе, и которые не модифицированы умышленно специалистом в лаборатории, являются встречающимися в природе.The terms naturally occurring, native, or wild type are used to describe an entity that can be found in nature to be different from that produced artificially. For example, a protein or nucleotide sequence present in an organism (including a virus) that can be isolated from a source in nature, and that has not been intentionally modified by a person skilled in the laboratory, is naturally occurring.

Термин геном относится к полному генетическому материалу организма.The term genome refers to the complete genetic material of an organism.

В настоящем описании и в последующей формуле изобретения, если контекстом не предусмотрено иное, слова включать и содержать или их вариации, такие как имеющий, включает, включающий, содержит или содержащий, следует понимать как включение указанного целого или группы целых, но не исключение любого другого целого или группы целых.In the present specification and in the following claims, unless the context otherwise requires, the words include and contain, or variations thereof such as having, comprises, including, contains or containing, are to be understood as including the specified whole or group of wholes, but not excluding any other whole or group of wholes.

Белок (пептид).Protein (peptide).

В настоящем описании, термины пептид, полипептид и белок используют взаимозаменяемо, и они относятся к соединению, состоящему из аминокислотных остатков, ковалентно связанных пептидными связями. Белок или пептид должен содержать по меньшей мере две аминокислоты, и не существует ограничений по максимальному количеству аминокислот, которые может содержать последовательность белка или пептида. Полипептиды включают любой пептид или белок, содержащий две или более аминокислот, соединенных друг с другом пептидными связями. Как применяют в настоящем описании, термин относится и к коротким цепям, также общепринято обозначаемым в этой области, например, как пептиды, олигопептиды и олигомеры, и к более длинным цепям, как правило, обозначаемым в этой области как белки, множество типов которых существует. Полипептиды включают, помимо прочего, например, биологически активные фрагменты, по существу, гомологичные полипептиды, олигопептиды, гомодимеры, гетеродимеры, варианты полипептидов, модифицированные полипептиды, производные,As used herein, the terms peptide, polypeptide and protein are used interchangeably and refer to a compound consisting of amino acid residues covalently linked by peptide bonds. A protein or peptide must contain at least two amino acids, and there is no limit to the maximum number of amino acids that a protein or peptide sequence can contain. Polypeptides include any peptide or protein containing two or more amino acids linked together by peptide bonds. As used herein, the term refers to both short chains, also commonly referred to in the art, such as peptides, oligopeptides and oligomers, and longer chains, generally referred to in the art as proteins, of which there are many types. Polypeptides include, but are not limited to, for example, biologically active fragments, substantially homologous polypeptides, oligopeptides, homodimers, heterodimers, polypeptide variants, modified polypeptides, derivatives,

- 3 045749 аналоги, слитные белки. Полипептиды включают природные пептиды, рекомбинантные пептиды, синтетические пептиды или их комбинацию.- 3 045749 analogues, fusion proteins. Polypeptides include natural peptides, recombinant peptides, synthetic peptides, or a combination thereof.

Молекулы нуклеиновых кислот.Nucleic acid molecules.

Термины нуклеиновая кислота, нуклеиновая последовательность или нуклеиновокислотная последовательность, полинуклеотид, олигонуклеотид, полинуклеотидная последовательность и нуклеотидная последовательность, которые используются равнозначно в данном описании, обозначают четкую последовательность нуклеотидов, модифицированных или не модифицированных, определяющую фрагмент или участок нуклеиновой кислоты, содержащую или не содержащую неприродные нуклеотиды и являющуюся либо двухцепочечной ДНК или РНК, либо одноцепочечной ДНК или РНК, либо продуктами транскрипции указанных ДНК.The terms nucleic acid, nucleic sequence or nucleic acid sequence, polynucleotide, oligonucleotide, polynucleotide sequence and nucleotide sequence, as used interchangeably herein, refer to a distinct sequence of nucleotides, modified or unmodified, defining a fragment or region of nucleic acid, whether or not containing unnatural nucleotides. and being either double-stranded DNA or RNA, or single-stranded DNA or RNA, or transcription products of these DNAs.

Специалист в этой области имеет общие знания о том, что нуклеиновые кислоты являются полинуклеотидами, которые можно гидролизовать до мономерных нуклеотидов. Мономерные нуклеотиды можно гидролизовать в нуклеозиды. Как применяют в настоящем описании, полинуклеотиды включают, в качестве неограничивающих примеров, все последовательности нуклеиновой кислоты, получаемые любыми способами, доступными в этой области, включая, в качестве неограничивающих примеров, рекомбинантные способы, т.е. клонирование последовательностей нуклеиновой кислоты из рекомбинантной библиотеки или генома клетки, использование обычной технологии клонирования и ПЦР и т.п., и способами синтеза.One skilled in the art will have general knowledge that nucleic acids are polynucleotides that can be hydrolyzed to monomeric nucleotides. Monomeric nucleotides can be hydrolyzed into nucleosides. As used herein, polynucleotides include, but are not limited to, all nucleic acid sequences produced by any methods available in the art, including, but not limited to, recombinant methods, i.e. cloning nucleic acid sequences from a recombinant library or cell genome, using conventional cloning and PCR technology, etc., and synthesis methods.

Здесь также следует упомянуть, что данное изобретение не относится к нуклеотидным последовательностям в их природной хромосомной среде, т.е. в природном состоянии. Последовательности данного изобретения были выделены и/или очищены, т.е. были взяты прямо или косвенно, например, путем копирования, при этом их среда была по меньшей мере частично модифицирована. Таким образом, также здесь следует подразумевать изолированные нуклеиновые кислоты, полученные путем генетической рекомбинации, например, с помощью принимающих клеток (клеток-хозяев), или полученные путем химического синтеза.It should also be mentioned here that this invention does not relate to nucleotide sequences in their natural chromosomal environment, i.e. in its natural state. The sequences of the present invention have been isolated and/or purified, i.e. were taken directly or indirectly, for example by copying, and their environment was at least partially modified. Thus, it should also be understood here as isolated nucleic acids obtained by genetic recombination, for example by host cells, or obtained by chemical synthesis.

Выделенная молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, которая идентифицирована и отделена от по меньшей мере одной молекулы нуклеиновой кислотыпримеси, с которой она обычно связана в естественном источнике нуклеиновой кислоты нуклеазы. Выделенная молекула нуклеиновой кислоты отличается от той формы или набора, в которых она находится в естественных условиях. Таким образом, выделенная молекула нуклеиновой кислоты отличается от молекулы нуклеиновой кислоты, существующей в клетках в естественных условиях. Однако выделенная молекула нуклеиновой кислоты включает молекулу нуклеиновой кислоты, находящуюся в клетках, в которых в норме происходит экспрессия нуклеазы, например, в случае, если молекула нуклеиновой кислоты имеет локализацию в хромосоме, отличную от ее локализации в клетках в естественных условиях.An isolated nucleic acid molecule is a nucleic acid molecule that has been identified and separated from at least one nucleic acid molecule contaminant with which it is typically associated in a natural nucleic acid source. The isolated nucleic acid molecule differs from the form or set in which it occurs naturally. Thus, the isolated nucleic acid molecule is different from the nucleic acid molecule that naturally exists in cells. However, an isolated nucleic acid molecule includes a nucleic acid molecule found in cells that normally express the nuclease, for example, if the nucleic acid molecule has a chromosomal location that is different from its location in the cells under natural conditions.

Термин нуклеотидная последовательность охватывает его комплемент, если не указано иное. Таким образом, нуклеиновую кислоту, имеющую определенную последовательность следует понимать как охватывающие ее комплементарную цепь с ее комплементарной последовательностью.The term nucleotide sequence covers its complement unless otherwise specified. Thus, a nucleic acid having a specific sequence should be understood as comprising its complementary strand with its complementary sequence.

Термины трасформация, трансфекция, трансдукция относятся к любому способу или средствам, с помощью которых нуклеиновая кислота вводится в клетку или организм-хозяин, и могут быть использованы взаимозаменяемо для передачи аналогичного значения. Такие способы включают в себя без ограничения трансфекцию, электропорацию, микроинъекции, инфицирование, ПЭГ-сплавление и т.п.The terms transformation, transfection, transduction refer to any method or means by which a nucleic acid is introduced into a cell or host organism, and can be used interchangeably to convey a similar meaning. Such methods include, but are not limited to, transfection, electroporation, microinjection, infection, PEG fusion, and the like.

Аденоассоциированный вирус (AAV).Adeno-associated virus (AAV).

Вирусы семейства Parvoviridae представляют собой небольшие ДНК-содержащие вирусы животных. Семейство Parvoviridae может быть разделено на два подсемейства: Parvovirinae, представители которого инфицируют позвоночных животных, и Densovirinae, представители которого инфицируют насекомых. К 2006 г. были описаны 11 серотипов аденоассоциированного вируса (Mori, S. et al., 2004, Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein, Virology, T., 330(2):375-83). Все известные серотипы могут инфицировать клетки многих видов тканей. Тканевая специфичность определяется серотипом белков капсида, поэтому векторы на основе аденоассоциированого вируса конструируют, задавая необходимый серотип. Дополнительная информация по парвовирусам и другим представителям Parvoviridae описана в литературе (Kenneth I. Berns, Parvoviridae: The Viruses and Their Replication, chapter 69 in Fields Virology (3d ed. 1996)).Viruses of the Parvoviridae family are small DNA-containing animal viruses. The family Parvoviridae can be divided into two subfamilies: Parvovirinae, whose members infect vertebrates, and Densovirinae, whose members infect insects. By 2006, 11 serotypes of adeno-associated virus had been described (Mori, S. et al., 2004, Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein, Virology, T., 330(2):375-83 ). All known serotypes can infect cells of many tissue types. Tissue specificity is determined by the serotype of the capsid proteins, so vectors based on adeno-associated virus are constructed by specifying the required serotype. Additional information on parvoviruses and other members of the Parvoviridae is described in the literature (Kenneth I. Berns, Parvoviridae: The Viruses and Their Replication, chapter 69 in Fields Virology (3d ed. 1996)).

Геномная организация всех известных серотипов AAV очень сходна. Геном AAV представляет собой линейную одноцепочечную молекулу ДНК, которая содержит менее чем примерно 5000 нуклеотидов (нт) в длину. Инвертированные концевые повторы (ITR) фланкируют уникальные кодирующие нуклеотидные последовательности репликации неструктурных белков (Rep) и структурных белков (Сар). Ген Сар кодирует белки VP (VP1, VP2 и VP3), которые образуют капсид. Концевые 145 нуклеотидов являются самокомплементарными и организованы таким образом, что может быть сформирован энергетически стабильный внутримолекулярный дуплекс, образующий Т-образную шпилечную структуру. Такие шпилечные структуры функционируют как точки начала репликации ДНК вируса, являясь праймерами для клеточного ДНК-полимеразного комплекса. После инфекции клеток млекопитающих AAV дикого типа (wtAAV) гены Rep (например, Rep78 и Rep52) экспрессируются с помощью Р5 промотора иThe genomic organization of all known AAV serotypes is very similar. The AAV genome is a linear, single-stranded DNA molecule that is less than approximately 5,000 nucleotides (nt) in length. Inverted terminal repeats (ITRs) flank the unique replication nucleotide sequences of nonstructural proteins (Rep) and structural proteins (Sp). The Sar gene encodes the VP proteins (VP1, VP2 and VP3), which form the capsid. The terminal 145 nucleotides are self-complementary and are organized in such a way that an energetically stable intramolecular duplex can be formed, forming a T-shaped hairpin structure. Such hairpin structures function as origins of viral DNA replication, serving as primers for the cellular DNA polymerase complex. Following infection of mammalian cells by wild-type AAV (wtAAV), Rep genes (e.g., Rep78 and Rep52) are expressed through the P5 promoter and

- 4 045749- 4 045749

Р19 промотора, соответственно, и оба белка Rep выполняют определенную функцию в репликации генома вируса. Сплайсинг в открытой рамке считывания Rep (Rep ORF) приводит к экспрессии фактически четырех белков Rep (например, Rep78, Rep68, Rep52 и Rep40). Однако было показано, что несплайсированная мРНК, кодирующая белки Rep78 и Rep52, является достаточной для продукции вектора AAV в клетках млекопитающих.The P19 promoter, respectively, and both Rep proteins perform a specific function in the replication of the viral genome. Splicing in the Rep open reading frame (Rep ORF) results in the expression of essentially four Rep proteins (e.g., Rep78, Rep68, Rep52, and Rep40). However, unspliced mRNA encoding the Rep78 and Rep52 proteins has been shown to be sufficient for AAV vector production in mammalian cells.

Вектор.Vector.

Термин вектор при использовании в настоящем изобретении означает молекулу нуклеиновой кислоты, способную транспортировать другую нуклеиновую кислоту, с которой она соединена.The term vector as used in the present invention means a nucleic acid molecule capable of transporting another nucleic acid to which it is linked.

Термины инфекционная единица (ие), инфекционная частица или репликационная единица, как используется в отношении вирусного титра, относятся к числу инфекционных частиц рекомбинантного вектора AAV, которое измеряют посредством анализа инфекционных центров, также известного как анализ репликационных центров, описанный, например, в публикации McLaughlin et al., J. Virol. (1988), 62:1963-1973.The terms infectious unit(s), infectious particle, or replication unit, as used in relation to viral titer, refer to the number of infectious particles of a recombinant AAV vector, which is measured by an infectious center assay, also known as a replication center assay, as described, for example, in McLaughlin et al., J. Virol. (1988), 62:1963-1973.

Термин гетерологичный, когда он относится к последовательностям нуклеиновых кислот, таким как кодирующие последовательности и последовательности регуляции, обозначает последовательности, которые обычно не соединены вместе и/или обычно не связаны с конкретной клеткой. Таким образом, гетерологичная область конструкции нуклеиновой кислоты или вектора представляет собой фрагмент нуклеиновой кислоты, расположенный внутри или присоединенный к другой молекуле нуклеиновой кислоты, которая в природе не найдена совместно с другой молекулой. Например, гетерологичная область конструкции нуклеиновой кислоты может содержать кодирующую последовательность, фланкированную последовательностями, которые в природе не найдены совместно с кодирующей последовательностью. Другой пример гетерологичной кодирующей последовательности представляет собой конструкцию, где сама кодирующая последовательность не найдена в природе (например, синтетические последовательности, которые содержат кодоны, отличные от нативного гена).The term heterologous, when referring to nucleic acid sequences such as coding sequences and regulatory sequences, refers to sequences that are not typically linked together and/or are not typically associated with a particular cell. Thus, a heterologous region of a nucleic acid or vector construct is a fragment of a nucleic acid located within or attached to another nucleic acid molecule that is not naturally found together with another molecule. For example, a heterologous region of a nucleic acid construct may contain a coding sequence flanked by sequences that are not naturally found in association with the coding sequence. Another example of a heterologous coding sequence is a construct where the coding sequence itself is not found in nature (eg, synthetic sequences that contain codons different from the native gene).

Как применяют в настоящем описании, термин экспрессия определяют как транскрипцию и/или трансляцию конкретной нуклеотидной последовательности, запускаемую ее промотором.As used herein, the term expression is defined as the transcription and/or translation of a particular nucleotide sequence driven by its promoter.

Применение.Application.

Генная терапия представляет собой вставку генов в клетки и/или тканей субъекта для лечения заболевания, обычно, наследственных заболеваний, при этом дефектный мутантный аллель заменяется или дополняется функциональным аллелем.Gene therapy is the insertion of genes into the cells and/or tissues of a subject to treat a disease, usually an inherited disease, whereby a defective mutant allele is replaced or supplemented with a functional allele.

Лечить, лечение и терапия относятся к методу смягчения или устранения биологического расстройства и/или по меньшей мере одного из сопутствующих ему симптомов. Используемый в данном изобретении термин облегчить болезнь, заболевание или состояние, означает уменьшение тяжести и/или частоты возникновения симптомов заболевания, расстройства или состояния. Кроме того, содержащиеся в данном изобретении ссылки на лечение включает ссылки на лечебную, паллиативную и профилактическую терапию.Treat, cure, and therapy refer to a method of alleviating or eliminating a biological disorder and/or at least one of its accompanying symptoms. As used herein, the term ameliorate a disease, disorder, or condition means reducing the severity and/or frequency of symptoms of the disease, disorder, or condition. In addition, references to treatment contained herein include references to curative, palliative and prophylactic therapy.

В одном аспекте субъект лечения или пациент является млекопитающим, предпочтительно человеческим субъектом. Вышеупомянутый субъект может быть мужского или женского пола любого возраста.In one aspect, the subject of treatment or patient is a mammal, preferably a human subject. The above subject may be male or female of any age.

Термин нарушение означает любое состояние, которое можно улучшить в результате лечения по настоящему изобретению. В определение данного термина входят хронические и острые нарушения или заболевания, включающие в себя патологические состояния, которые вызывают предрасположенность млекопитающего к возникновению данного нарушения.The term disorder means any condition that can be improved by treatment according to the present invention. The definition of this term includes chronic and acute disorders or diseases, including pathological conditions that predispose a mammal to the occurrence of a given disorder.

Заболевание является состоянием здоровья животного, где животное не может поддерживать гомеостаз, и где, если заболевание не облегчают, то здоровье животного продолжает ухудшаться.Disease is a state of animal health where the animal is unable to maintain homeostasis, and where, if the disease is not alleviated, the animal's health continues to deteriorate.

Термин субъект, пациент, индивидуум и т.п. используют в настоящем описании взаимозаменяемо, и они относятся к любому животному, поддающимуся воздействию способами, представленными в настоящем описании. В конкретных неограничивающих вариантах осуществления субъект, пациент или индивидуум является человеком.The term subject, patient, individual, etc. are used interchangeably herein and refer to any animal amenable to treatment by the methods presented herein. In specific non-limiting embodiments, the subject, patient, or individual is a human.

Терапевтически эффективным количеством считается количество вводимого в процессе лечения терапевтического агента, которое избавит в определенной степени от одного или нескольких симптомов заболевания, по поводу которого проводится лечение.A therapeutically effective amount is the amount of therapeutic agent administered during treatment that will relieve, to a certain extent, one or more symptoms of the disease being treated.

Подробное описание изобретенияDetailed Description of the Invention

Кодон-оптимизированная нуклеиновой кислоте.Codon-optimized nucleic acid.

В одном из аспектов настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных нейронов) с SEQ ID NO: 1 и включает последовательность нуклеиновой кислоты SEQ ID NO: 2.In one aspect, the present invention provides an isolated codon-optimized nucleic acid that encodes the SMN1 (survival motor neuron protein) protein of SEQ ID NO: 1 and includes the nucleic acid sequence of SEQ ID NO: 2.

Для получения кодон-оптимизированного гена SMN1 за основу была взята соответствующая аминокислотная последовательность белка SMN_HUMAN:To obtain the codon-optimized SMN1 gene, the corresponding amino acid sequence of the SMN_HUMAN protein was taken as a basis:

- 5 045749- 5 045749

MAMSSGGSGGGVPEQEDSVLFRRGTGQSDDSDIWDDTALIKAYDKAVASFKHALKNG DICETSGKPKTTPKRKPAKKNKSQKKNTAASLQQWKVGDKCSAIWSEDGCIYPATIASI DFKRETCVVVYTGYGNREEQNLSDLLSPICEVANNIEQNAQENENESQVSTDESENSRSP GNKSDNIKPKSAPWNSFLPPPPPMPGPRLGPGKPGLKFNGPPPPPPPPPPHLLSCWLPPFPS GPPIIPPPPPICPDSLDDADALGSMLISWYMSGYHTGYYMGFRQNQKEGRCSHSLN (SEQ IDNO:1)MAMSSGGSGGGVPEQEDSVLFRRGTGQSDDSDIWDDTALIKAYDKAVASFKHALKNG DICETSGKPKTTPKRKPAKKNKSQKKNTAASLQQWKVGDKCSAIWSEDGCIYPATIASI DFKRETCVVVYTGYGNREEQNLSDLLSPICEVANNIEQNAQENENESQVSTDESENSRSP GNKSDNIKPKSAPWNSFLPP PPPMPGPRLGPGKPGLKFNGPPPPPPPPPPHLLSCWLPPFPS GPPIIPPPPPICPDSLDDADALGSMLISWYMSGYHTGYYMGFRQNQKEGRCSHSLN (SEQ IDNO:1)

Данная аминокислотная последовательность SEQ ID NO: 1 переводилась в нуклеотидную последовательность путем последовательного сопоставления каждой аминокислоте начиная с N-конца одного из кодирующих ее синонимичных кодонов.This amino acid sequence SEQ ID NO: 1 was translated into a nucleotide sequence by sequentially assigning each amino acid starting from the N-terminus of one of the synonymous codons encoding it.

Подробно по кодон-оптимизированного гена SMN1 и отбор финальной последовательности описано в примере 1.The details of the codon-optimized SMN1 gene and the selection of the final sequence are described in example 1.

Финальная кодон-оптимизированная последовательность SMN1 (SMN1-GeneBeam) имеет следующую нуклеотидную последовательность: ATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGAGCAAGAGGACThe final codon-optimized sequence of SMN1 (SMN1-GeneBeam) has the following nucleotide sequence: ATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGAGCAAGAGGAC

AGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGACATCTGGGACGA CACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAAGCACGCCCTGA AGAACGGCGACATCTGCGAGACCAGCGGCAAGCCCAAGACCACCCCCAAGAGAAA GCCCGCCAAGAAGAACAAGAGCCAGAAGAAGAACACCGCCGCCAGCCTGCAGCAG TGGAAGGTGGGCGACAAGTGCAGCGCCATCTGGAGCGAGGACGGCTGCATCTACCC CGCCACCATCGCCAGCATCGACTTCAAGAGAGAGACCTGCGTGGTGGTGTACACCG GCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCCCATCTGCGAG GTGGCCAACAACATCGAGCAGAACGCCCAAGAGAACGAGAACGAGAGCCAAGTGA GCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAAGAGCGACAACATCAA GCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTATGCCCGGCCC TAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCCCCCCTCCTCC TCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAGCGGCCCTCCT ATCATCCCTCCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGCCGACGCCCTG GGCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCTACTACATGGG CTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAACTAG (SEQ Ш NO:2).AGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGACATCTGGGACGA CACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAAGCACGCCCTGA AGAACGGCGACATCTGCGAGACCAGCGCAAGCCCAAGACCACCCAAGAGAAA GCCCGCCAAGAAGAACAAGAGCCAGAAGAAGAACACCGCCGCCAGCCTGCAGCAG TGGAAGGTGGGCGACAAG TGCAGCGCCATCTGGAGCGAGGACGGCTGCATCTACCC CGCCACCATCGCCAGCATCGACTTCAAGAGAGACCTGCGTGGTGGTGTACACCG GCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCCCATCTGCGAG GTGGCCAACAACATCGAGCAGAACGCCCAAGAGAACGAGAACGAGAGCCAAGTGA GCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAA GAGCGACAACATCAA GCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTATGCCCGGCCC TAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCCCCCCTCCTCC TCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAGCGGCCCTCCT ATCATCCCTCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGCCGACGCCCTG G GCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCTACTACATGGG CTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAACTAG (SEQ Ш NO:2).

Данная финальная кодон-оптимизированная нуклеотидная последовательность SMN1 (SMN1GeneBeam) характеризуется повышенным индексом адаптации кодонов (стандартная метрика для оценки последовательности на предмет частот использованных кодонов) по сравнению с кодирующей последовательностью гена SMN дикого типа (SMN1-WT):This final codon-optimized nucleotide sequence of SMN1 (SMN1GeneBeam) is characterized by an increased codon adaptation index (a standard metric for evaluating a sequence for the frequencies of codons used) compared to the coding sequence of the wild-type SMN gene (SMN1-WT):

ATGGCGATGAGCAGCGGCGGCAGTGGTGGCGGCGTCCCGGAGCAGGAGGATTCCGT GCTGTTCCGGCGCGGCACAGGCCAGAGCGATGATTCTGACATTTGGGATGATACAG CACTGATAAAAGCATATGATAAAGCTGTGGCTTCATTTAAGCATGCTCTAAAGAATG GTGACATTTGTGAAACTTCGGGTAAACCAAAAACCACACCTAAAAGAAAACCTGCT AAGAAGAATAAAAGCCAAAAGAAGAATACTGCAGCTTCCTTACAACAGTGGAAAGT TGGGGACAAATGTTCTGCCATTTGGTCAGAAGACGGTTGCATTTACCCAGCTACCAT TGCTTCAATTGATTTTAAGAGAGAAACCTGTGTTGTGGTTTACACTGGATATGGAAA TAGAGAGGAGCAAAATCTGTCCGATCTACTTTCCCCAATCTGTGAAGTAGCTAATAA TATAGAACAAAATGCTCAAGAGAATGAAAATGAAAGCCAAGTTTCAACAGATGAAA GTGAGAACTCCAGGTCTCCTGGAAATAAATCAGATAACATCAAGCCCAAATCTGCT CCATGGAACTCTTTTCTCCCTCCACCACCCCCCATGCCAGGGCCAAGACTGGGACCA GGAAAGCCAGGTCTAAAATTCAATGGCCCACCACCGCCACCGCCACCACCACCACC CCACTTACTATCATGCTGGCTGCCTCCATTTCCTTCTGGACCACCAATAATTCCCCCA CCACCTCCCATATGTCCAGATTCTCTTGATGATGCTGATGCTTTGGGAAGTATGTTAA TTTCATGGTACATGAGTGGCTATCATACTGGCTATTATATGGGTTTCAGACAAAATC AAAAAGAAGGAAGGTGCTCACATTCCTTAAATTAA (SEQ ID NO:3).ATGGCGATGAGCAGCGGCGGCAGTGGTGGCGGCGTCCCGGAGCAGGAGGATTCCGT GCTGTTCCGGCGCGGCACAGGCCAGAGCGATGATTCTGACATTTGGGATGATACAG CACTGATAAAAGCATATGATAAAGCTGTGGCTTCATTTAAGCATGCTCTAAAGAATG GTGACATTTGTGAAACTTCGGGTAAACCAAAAACCACACCTAAAAGAAAACCTGCT AAGAAGAATAAAAGCCAAAAGAA GAATACTGCAGCTTCCTTACAACAGTGGAAAGT TGGGGACAAATGTTCTGCCATTTGGTCAGAAGACGGTTGCATTTACCCAGCTACCAT TGCTTCAATTGATTTTAAGAGAGAAACCTGTGTTGTGGTTTACACTGGATATGGAAA TAGAGAGGAGCAAAATCTGTCCGATCTACTTTCCCCAATCTGTGAAGTAGCTAATAA TATAGAACAAAATGCTCAAGAGAATGAAAATGAAAGCCAAGTTTCAA CAGATGAAA GTGAGAACTCCAGGTCTCCTGGAAATAAATCAGATAACATCAAGCCCAAATCTGCT CCATGGAACTCTTTTCTCCCTCCACCACCCCCCATGCCAGGGCCAAGACTGGGACCA GGAAAGCCAGGTCTAAAATTCAATGGCCCACCACCGCCACCGCCACCACCACCACC CCACTTACTATGCTGGCTGCCTCCATTTCCTTCTGGACCACCAATAATTCCCCCA CCACCTCCCATATGTCCAGA TTCTCTTGATGATGCTGATGCTTTGGGAAGTATGTTAA TTTCATGGTACATGAGTGGCTATCATACTGGCTATTATGGGTTTCAGACAAAATC AAAAGAAGGAAGGTGCTCACATTCCTTAAAATTAA (SEQ ID NO:3).

Индекс адаптации кодонов для финальной кодон-оптимизированной нуклеотидной последователь- 6 045749 ности гена SMN1 (SEQ ID NO: 2) нашей последовательности равен 98%, для последовательности дикого типа - 75%.The codon adaptation index for the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) of our sequence is 98%, for the wild-type sequence - 75%.

GC-состав последовательности дикого типа равен 45%, т.е. отличается от целевого значения на 15%, GC-состав финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO: 2) оптимизированной последовательности равен 64%, т.е. отличается от целевого значения на 4%.The GC composition of the wild type sequence is 45%, i.e. differs from the target value by 15%, the GC composition of the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) of the optimized sequence is 64%, i.e. differs from the target value by 4%.

Финальная кодон-оптимизированная нуклеотидная последовательность гена SMN1 (SEQ ID NO: 2) и нуклеотидная последовательность гена SMN1 дикого типа (SEQ ID NO: 3). Последовательности идентичны на 71%.Final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) and nucleotide sequence of the wild-type SMN1 gene (SEQ ID NO: 3). The sequences are 71% identical.

Экспрессионная кассета. Экспрессионный вектор.Expression cassette. Expression vector.

Термин экспрессионная кассета при использовании в данном изобретении, в частности, относится к фрагменту ДНК, который способен в соответствующей обстановке запускать экспрессию полинуклеотида, кодирующего представляющий интерес полипептид, который включен в указанную экспрессионную кассету. При введении в клетку-хозяина экспрессионная кассета помимо прочего способна задействовать клеточные механизмы для транскрипции полинуклеотида, кодирующего представляющий интерес полипептид, в РНК, которая затем обычно дополнительно процессируется и, наконец, транслируется в представляющий интерес полипептид. Экспрессионная кассета может содержаться в экспрессионном векторе.The term expression cassette as used herein specifically refers to a fragment of DNA that is capable, under appropriate circumstances, of driving the expression of a polynucleotide encoding a polypeptide of interest that is included in said expression cassette. When introduced into a host cell, the expression cassette is, among other things, capable of engaging cellular machinery to transcribe the polynucleotide encoding the polypeptide of interest into RNA, which is then typically further processed and finally translated into the polypeptide of interest. The expression cassette may be contained in an expression vector.

Экспрессионная кассета по настоящему изобретению содержит в качестве элемента промотор. Термин промотор, используемый в настоящем изобретении, в частности, относится к элементу ДНК, который способствует транскрипции полинуклеотида, с которым функционально связан промотор. Промотор может также составлять часть элемента промотор/энхансер. Хотя физические границы между элементами промотор и энхансер не всегда ясны, термин промотор обычно относится к месту на молекуле нуклеиновой кислоты, с которым связывается РНК-полимераза и/или связанные с ней факторы, и с которого инициируется транскрипция. Энхансеры усиливают активность промотора во времени, а также пространственно. В данной области известно множество промоторов, которые транскрипционно активны в широком диапазоне типов клеток. Промоторы могут быть разделены на два класса: на тех, которые функционируют конститутивно, и тех, которые регулируются индукцией или снятием репрессии. Для экспрессии белка пригодны оба класса. Промоторы, которые используются для продукции высокого уровня полипептидов в эукариотических клетках и, в частности, в клетках млекопитающих, должны быть сильными и, предпочтительно, должны быть активными в широком диапазоне типов клеток. Сильные конститутивные промоторы, которые способны запускать экспрессию во многих типах клеток, хорошо известны в данной области и, поэтому, нет необходимости в их подробном описании в данном изобретении. В соответствии с идеей настоящего изобретения предпочтительно использовать промотор цитомегаловируса (CMV). Промотор или промотор/энхансер, полученные из немедленной ранней (IE) области цитомегаловируса (hCMV) человека, в особенности подходят в качестве промотора в экспрессионной кассете по настоящему изобретению. Немедленная ранняя (IE) область цитомегаловируса (hCMV) человека и полученные из нее функциональные запускающие экспрессию фрагменты и/или функциональные усиливающие экспрессию фрагменты, например, описаны в ЕР 0173177 и ЕР 0323997, а также хорошо известны в данной области. Таким образом, несколько фрагментов немедленной ранней (IE) области hCMV могут использоваться в качестве промотора и/или промотора/энхансера. Согласно одному варианту осуществления изобретения промотор CMV человека используется в экспрессионной кассете по настоящему изобретению.The expression cassette of the present invention contains a promoter element. The term promoter as used in the present invention specifically refers to a DNA element that promotes transcription of the polynucleotide to which the promoter is operably linked. A promoter may also form part of a promoter/enhancer element. Although the physical boundaries between promoter and enhancer elements are not always clear, the term promoter generally refers to the location on a nucleic acid molecule to which RNA polymerase and/or associated factors bind and from which transcription is initiated. Enhancers enhance promoter activity temporally as well as spatially. There are many promoters known in the art that are transcriptionally active in a wide range of cell types. Promoters can be divided into two classes: those that function constitutively and those that are regulated by induction or release of repression. Both classes are suitable for protein expression. Promoters that are used to produce high levels of polypeptides in eukaryotic cells and, in particular, mammalian cells must be strong and preferably must be active in a wide range of cell types. Strong constitutive promoters that are capable of driving expression in many cell types are well known in the art and therefore need not be described in detail herein. In accordance with the idea of the present invention, it is preferable to use a cytomegalovirus (CMV) promoter. A promoter or promoter/enhancer derived from the immediate early (IE) region of human cytomegalovirus (hCMV) is particularly suitable as a promoter in the expression cassette of the present invention. The human cytomegalovirus (hCMV) immediate early (IE) region and functional expression-triggering fragments and/or functional expression-enhancing fragments derived therefrom are, for example, described in EP 0173177 and EP 0323997 and are also well known in the art. Thus, several fragments of the hCMV immediate early (IE) region can be used as a promoter and/or promoter/enhancer. In one embodiment, a human CMV promoter is used in an expression cassette of the present invention.

вышеуказанная кодон-оптимизированная нуклеиновая кислота гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;

В некоторых вариантах левый (первый) ITR (инвертированные концевые повторы) имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the left (first) ITR (inverted terminal repeats) has the following nucleic acid sequence:

Cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcct (SEQ ID NO: 8).(SEQ ID NO: 8).

- 7 045749- 7 045749

В некоторых вариантах CMV (цитомегаловирусный) энхансер имеет следующую последовательность нуклеиновой кислоты: cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaac gCcaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtac gccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctac gtattagtcatcgctattaccatg (SEQ ID NO: 9).In some embodiments, the CMV (cytomegalovirus) enhancer has the following nucleic acid sequence: cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaac gCcaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatca (SEQ ID NO: 9).

В некоторых вариантах CMV (цитомегаловирусный) промотер имеет следующую последовательность нуклеиновой кислоты: gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagt ttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtggga ggtctatataagcagagct (SEQ ID NO: 10).In some embodiments, the CMV (cytomegalovirus) promoter has the following nucleic acid sequence: gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagt ttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacg caaatgggcggtaggcgtgtacggtggga ggtctatataagcagagct (SEQ ID NO: 10).

В некоторых вариантах интрон гена hBG1 (ген субъединицы гемоглобина гамма-1) имеет следующую последовательность нуклеиновой кислоты: cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaa aaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctcttt gcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaa gaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctagg cccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaatt gggat (SEQ ID NO: 11).In some embodiments, the intron of the hBG1 gene (hemoglobin subunit gamma-1 gene) has the following nucleic acid sequence: cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaa aaaatgctttcttcttttaatatactttttttgtttatcttatttctaatactt tccctaatctctttctttcagggcaataatgatacaatgtatcatgcctcttt gcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaa gaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataa ggctggattattctgagtccaagctagg cccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaatt gggat (SEQ ID NO: 11).

В некоторых вариантах сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека) имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal) has the following nucleic acid sequence:

Acgggtggcatccctgtgacccctccccagtgcctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaat aaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaag acaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttca agcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggttt caccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccact gctcccttccctgtcctt (SEQ ID NO: 12).Acgggtggcatccctgtgacccctccccagtgcctctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaat aaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaag acaacctgtagggcctgcggggtctatt gggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttca agcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggttt caccatattggccaggctggtctccaactcctaatctcaggtgatctacccacc ttggcctcccaaattgctgggattacaggcgtgaaccact gctcccttccctgtcctt (SEQ ID NO: 12).

В некоторых вариантах правый (второй) ITR имеет следующую последовательность нуклеиновой кислоты: aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccg ggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 13).In some embodiments, the right (second) ITR has the following nucleic acid sequence: aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccg ggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 1 3).

В некоторых вариантах экспрессионная кассета имеет следующую последовательность нуклеиновой кислоты: cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtctagttattaatagtaatcaattacggggtcattag ttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtca ataatgacgtatgttcccatagtaacgCcaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtac atcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatggg actttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttg actcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaaca actccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctg gagacgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctccgcggattcgaatcccggccgggaacggtgc attggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatactttt ttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtg ataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagc tacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctc ttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatCGATTGTIn some embodiments, the expression cassette has the following nucleic acid sequence: cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtctagttatta atcaag tgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatggg actttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttg actcacggggatttccaagtctccaccccattga cgtcaatgggagtttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaaca actccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctg gagacgccatccacgctgttttgacctccatagaagacaccgggaccga tccagcctccgcggattcgaatcccggccgggaacggtgc attggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatactttt ttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatg cctctttgcaccattctaaagaataacagtg ataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagc tacaatccagctaccattctgcttttattttatggttgggataaggctggattattctctgagtccaagctaggcccttttgctaatcatgtt catacctc ttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatCGATTGT

- 8 045749- 8 045749

AATTCATGAGCCACCATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGA GCAAGAGGACAGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGAC ATCTGGGACGACACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAA GCACGCCCTGAAGAACGGCGACATCTGCGAGACCAGCGGCAAGCCCAAGACCACCC CCAAGAGAAAGCCCGCCAAGAAGAACAAGAGCCAGAAGAAGAACACCGCCGCCAG CCTGCAGCAGTGGAAGGTGGGCGACAAGTGCAGCGCCATCTGGAGCGAGGACGGCT GCATCTACCCCGCCACCATCGCCAGCATCGACTTCAAGAGAGAGACCTGCGTGGTG GTGTACACCGGCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCC CATCTGCGAGGTGGCCAACAACATCGAGCAGAACGCCCAAGAGAACGAGAACGAG AGCCAAGTGAGCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAAGAGCG ACAACATCAAGCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTA TGCCCGGCCCTAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCC CCCCTCCTCCTCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAG CGGCCCTCCTATCATCCCTCCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGC CGACGCCCTGGGCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCT ACTACATGGGCTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAAC TGATctagagtcgacctgcagaagcttgcctcgagcagcgctgctcgagagatctacgggtggcatccctgtgacccctccccagtgc ctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataa tattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagct ggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattcca ggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggt gatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcg gaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaagg tcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 4).AATTCATGAGCCACCATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGA GCAAGAGGACAGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGAC ATCTGGGACGACACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAA GCACGCCCTGAAGAACGGCGACATCTGCGAGACCAGCGGCAAGCCCAAGACCACCC CCAAGAGAAAGCCCGCCA AGAAGAAACAAGAGCCAGAAGAAGAACACCGCCGCCAG CCTGCAGCAGTGGAAGGTGGGCGACAAGTGCAGCGCCATCTGGAGCGAGGACGGCT GCATCTACCCCGCCACCATCGCCAGCATCGACTTCAAGAGAGAGACCTGCGTGGTG GTGTACACCGGCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCC CATCTGCGAGGTGGCCAACAACATCGAGCAGAACGCCCAAGA GAACGAGAACGAG AGCCAAGTGAGCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAAGAGCG ACAACATCAAGCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTA TGCCCGGCCCTAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCC CCCCTCCTCCTCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAG CGGCCC TCCTATCATCCCTCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGC CGACGCCCTGGGCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCT ACTACATGGGCTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAAC TGATctagagtcgacctgcagaagcttgcctcgagcagctgctgctcgagagatctacgggtggcatccct gtgacccctccccagtgc ctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataa tattatggggtggaggggggtggtatggagcaaggggcaagtttgggaagacaacctgtagggcctgcggggtctattggaaccaagct ggag tgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattcca ggcatgcatgaccaggctcagctaatttttgttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggt gatctacccaccttggcctcccaa attgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcg gaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaagg tcgcccgacgcccgggctttgcccgggcggcctcagtgag cgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 4).

В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту или вышеуказанную экспрессионную кассету.In one aspect, the present invention relates to an expression vector that includes the above codon-optimized nucleic acid or the above expression cassette.

В некоторых вариантах осуществления изобретения вектор представляет собой плазмиду, т.е. кольцевую двухцепочечную часть ДНК, в которую могут быть лигированы дополнительные сегменты ДНК.In some embodiments, the vector is a plasmid, i.e. a circular, double-stranded portion of DNA into which additional DNA segments can be ligated.

В некоторых вариантах осуществления изобретения вектор представляет собой вирусный вектор, в котором дополнительные сегменты ДНК могут быть лигированы в вирусный геном.In some embodiments, the vector is a viral vector in which additional DNA segments can be ligated into the viral genome.

В некоторых вариантах осуществления изобретения векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальный сайт инициации репликации и эписомные векторы млекопитающих). В других вариантах осуществления изобретения векторы (например, неэписомальные векторы млекопитающих) могут быть интегрированы в геном клетки-хозяина при введении в клетку-хозяина, и таким образом реплицируются вместе с геном хозяина. Более того, некоторые векторы способны направлять экспрессию генов, с которыми они функционально соединены. Такие векторы упоминаются в данном изобретении как рекомбинантные экспрессирующие векторы (или просто экспрессирующие векторы (вектор экспрессии или экспрессионный вектор)).In some embodiments, the vectors are capable of autonomous replication in the host cell into which they are introduced (eg, bacterial vectors having a bacterial origin of replication and mammalian episomal vectors). In other embodiments, vectors (eg, non-episomal mammalian vectors) can be integrated into the host cell genome upon introduction into the host cell, and thus replicate along with the host gene. Moreover, some vectors are capable of directing the expression of genes to which they are operably linked. Such vectors are referred to in this invention as recombinant expression vectors (or simply expression vectors (expression vector or expression vector)).

Экспрессионные векторы включают плазмиды, ретровирусы, аденовирусы, аденоассоциированные вирусы (AAV), вирусы растений, такие как вирус мозаики цветной капусты, вирусы табачной мозаики, космиды, YAC, EBV полученные эписомы и т.п. Молекулы ДНК могут быть лигированы в вектор таким образом, что последовательности, контролирующие транскрипцию и трансляцию в векторе, выполняют предусмотренную функцию регуляции транскрипции и трансляции ДНК. Экспрессионный вектор и последовательности контроля экспрессии могут быть выбраны таким образом, чтобы быть совместимыми с используемой экспрессирующей клеткой-хозяином. Молекулы ДНК могут быть введены в экспрессионный вектор стандартными способами (например, лигированием комплементарных сайтов рестрикции или лигированием тупых концов, если сайты рестрикции отсутствуют).Expression vectors include plasmids, retroviruses, adenoviruses, adeno-associated viruses (AAV), plant viruses such as cauliflower mosaic virus, tobacco mosaic virus, cosmids, YAC, EBV-derived episomes, and the like. DNA molecules can be ligated into a vector such that the transcription and translation control sequences in the vector perform the intended function of regulating DNA transcription and translation. The expression vector and expression control sequences can be selected to be compatible with the expression host cell used. DNA molecules can be introduced into an expression vector by standard methods (eg, ligation of complementary restriction sites or blunt-end ligation if restriction sites are missing).

Рекомбинантный экспрессионный вектор также может кодировать сигнальный пептид, который облегчает выработку белка-интереса клеткой-хозяином. Ген белка-интереса может быть клонирован в вектор таким образом, что сигнальный пептид соединен с рамкой считывания аминоконца белка-интереса. Сигнальным пептидом может быть сигнальный пептид иммуноглобулина или гетерологичный сигнальный пептид (т.е. сигнальный пептид белка не иммуноглобулиновой природы).The recombinant expression vector may also encode a signal peptide that facilitates production of the protein of interest by the host cell. The gene for the protein of interest can be cloned into a vector such that the signal peptide is linked to the amino terminus of the protein of interest. The signal peptide may be an immunoglobulin signal peptide or a heterologous signal peptide (ie, a non-immunoglobulin protein signal peptide).

Помимо гена SMN1-GB по данному изобретению, рекомбинантная экспрессия векторов по данномуIn addition to the SMN1-GB gene according to this invention, recombinant expression of vectors according to this

- 9 045749 изобретению может нести регулирующие последовательности, которые контролируют экспрессию гена SMN1-GB в клетке-хозяине. Специалистам в этой области будет понятно, что дизайн экспрессионного вектора, включая выбор регулирующих последовательностей, может зависеть от таких факторов, как селекция клетки-хозяина для трансформации, уровень экспрессии желаемого белка и т.д. Предпочтительные регулирующие последовательности для экспрессирующей клетки-хозяина млекопитающих включают вирусные элементы обеспечивающие высокий уровень экспрессии белков в клетках млекопитающих, таких как промоторы и/или энхансеры, полученные из ретровирусной LTR, цитомегаловируса (CMV) (например, CMV промотора/энхансера), обезьяньего вируса 40 (SV40) (например, SV40 промотора/энхансера), аденовируса, (например, большого позднего промотора аденовируса (AdMLP)), вирус полиомы, а также сильных промоторов млекопитающих, таких как промотор нативных иммуноглобулинов или промотор актина.- 9045749 of the invention may carry regulatory sequences that control the expression of the SMN1-GB gene in a host cell. Those skilled in the art will appreciate that the design of an expression vector, including the choice of regulatory sequences, may depend on factors such as the selection of the host cell for transformation, the level of expression of the desired protein, etc. Preferred regulatory sequences for a mammalian host expression cell include viral elements that provide high level expression of proteins in mammalian cells, such as promoters and/or enhancers derived from a retroviral LTR, cytomegalovirus (CMV) (eg, CMV promoter/enhancer), simian virus 40 (SV40) (eg, SV40 promoter/enhancer), adenovirus (eg, adenovirus large late promoter (AdMLP)), polyoma virus, as well as strong mammalian promoters such as the native immunoglobulin promoter or the actin promoter.

Выражение контролирующие последовательности относится к последовательностям ДНК, необходимым для экспрессии функционально связанной кодирующей последовательности в определенном организме-хозяине. Пригодные для прокариот контролирующие последовательности представляют собой, например, промотор, необязательно оператор и сайт связывания рибосомы. Как известно, в эукариотических клетках присутствуют промоторы, сигналы полиаденилирования и энхансеры.The expression control sequences refers to DNA sequences necessary for the expression of an operably linked coding sequence in a particular host organism. Suitable control sequences for prokaryotes are, for example, a promoter, optionally an operator and a ribosome binding site. As is known, promoters, polyadenylation signals and enhancers are present in eukaryotic cells.

В контексте настоящего описания термин промотор или регуляторная последовательность транскрипции или регуляторная последовательность относится к фрагменту нуклеиновой кислоты, который контролирует транскрипцию одной или нескольких кодирующих последовательностей, и который расположен против направления считывания информации относительно направления транскрипции от сайта инициации транскрипции кодирующей последовательности, а также который структурно идентифицируется по наличию сайта связывания для ДНК-зависимой РНК-полимеразы, сайтов инициации транскрипции и других последовательностей ДНК, включающих, без ограничения, сайты связывания фактора транскрипции, сайты связывания репрессора и активатора белка, а также любые другие последовательности нуклеотидов, известные специалистам в данной области, которые непосредственно или опосредованно регулируют уровень транскрипции с данным промотором. Конститутивный промотор представляет собой такой промотор, который активен в большинстве тканей в обычных физиологических условиях и условиях развития. Индуцибельный промотор представляет собой промотор, который подвергается физиологической регуляции или регуляции в ходе развития, например, при воздействии химического индуктора. Тканеспецифичный промотор активен только в конкретных типах тканей или клеток.As used herein, the term promoter or transcriptional control sequence or regulatory sequence refers to a nucleic acid fragment that controls the transcription of one or more coding sequences, and that is located upstream of the transcriptional start site of the coding sequence, and that is structurally identifiable by the presence of a binding site for DNA-dependent RNA polymerase, transcription initiation sites and other DNA sequences, including, without limitation, transcription factor binding sites, repressor and protein activator binding sites, as well as any other nucleotide sequences known to those skilled in the art, which directly or indirectly regulate the level of transcription with a given promoter. A constitutive promoter is one that is active in most tissues under normal physiological and developmental conditions. An inducible promoter is a promoter that is subject to physiological or developmental regulation, such as upon exposure to a chemical inducer. A tissue-specific promoter is active only in specific types of tissues or cells.

Термины энхансеры или энхансер, используемые в изобретении, могут относиться к последовательности ДНК, которая расположена как смежная с последовательностью ДНК, кодирующей рекомбинантный продукт. Энхансерные элементы обычно расположены в 5'-направлении от промоторного элемента или могут быть расположены ниже или в пределах кодирующей последовательности ДНК (например, последовательности ДНК, транскрибированной или транслированной в рекомбинантный продукт или продукты). Таким образом, энхансерный элемент может быть расположен на расстоянии 100 пар оснований, 200 пар оснований или 300 или больше пар оснований перед последовательностью ДНК, которая кодирует рекомбинантный продукт, или после этой последовательности. Энхансерные элементы могут увеличивать количество экспрессируемого рекомбинантного продукта от последовательности ДНК, превышая экспрессию, обусловленную одиночным промоторным элементом. Специалистам в данной области техники доступно множество энхансерных элементов.The terms enhancers or enhancer as used in the invention may refer to a DNA sequence that is located adjacent to the DNA sequence encoding the recombinant product. Enhancer elements are typically located 5' of a promoter element or may be located downstream of or within a coding DNA sequence (eg, the DNA sequence transcribed or translated into the recombinant product or products). Thus, the enhancer element may be located 100 base pairs, 200 base pairs, or 300 base pairs or more before or after the DNA sequence that encodes the recombinant product. Enhancer elements can increase the amount of recombinant product expressed from a DNA sequence beyond the expression driven by a single promoter element. A variety of enhancer elements are available to those skilled in the art.

В дополнение к вышеуказанным генам и регулирующим последовательностям, рекомбинантные векторы экспрессии изобретения могут нести дополнительные последовательности, такие как последовательности, которые регулируют репликацию вектора в клетках-хозяевах (например, точки начала репликации) и гены селектируемого маркера. Ген селектируемого маркера облегчает селекцию клеток-хозяев, в которые был введен вектор (см., например, патенты США 4399216, 4634665 и 5179017). Например, обычно ген селектируемого маркера придает устойчивость к лекарственным средствам, таким как G418, гигромицин или метотрексат, клетке-хозяину, в которую вектор введен. Например, гены селектируемого маркера включают ген дигидрофолат редуктазы (DHFR) (для использования в dhfr-клетках-хозяевах при селекции/амплификации метотрексата), ген нео (для селекции G418) и ген синтетазы глутамата.In addition to the above genes and regulatory sequences, the recombinant expression vectors of the invention may carry additional sequences, such as sequences that regulate the replication of the vector in host cells (eg, origins of replication) and selectable marker genes. The selectable marker gene facilitates selection of host cells into which the vector has been introduced (see, for example, US Pat. Nos. 4,399,216, 4,634,665, and 5,179,017). For example, typically a selectable marker gene confers resistance to drugs, such as G418, hygromycin, or methotrexate, to the host cell into which the vector is introduced. For example, selectable marker genes include the dihydrofolate reductase (DHFR) gene (for use in dhfr host cells for methotrexate selection/amplification), the neo gene (for G418 selection) and the glutamate synthetase gene.

Термин последовательность контроля экспрессии, используемый в данном описании, означает полинуклеотидные последовательности, которые необходимы для воздействия на экспрессию и процессинг кодирующих последовательностей, к которым они лигированы. Контролирующие экспрессию последовательности включают соответствующие последовательности инициации транскрипции, терминации, промотора и энхансера; эффективные сигналы процессинга РНК, такие как сплайсинг и сигналы полиаденилирования; последовательности, которые стабилизируют цитоплазматическую мРНК; последовательности, которые повышают эффективность трансляции (т.е. консенсусная последовательность Козака); последовательности, которые повышают стабильность белка; и, при желании, последовательности, которые усиливают секрецию белка. Характер таких контролирующих последовательностей различается в зависимости от организма-хозяина; в прокариотах такие контролирующие последовательности, как правило, включают промотор, сайт связывания рибосомы, а также последовательности терминацииThe term expression control sequence as used herein refers to polynucleotide sequences that are necessary to influence the expression and processing of the coding sequences to which they are ligated. Expression control sequences include the corresponding transcription initiation, termination, promoter and enhancer sequences; efficient RNA processing signals such as splicing and polyadenylation signals; sequences that stabilize cytoplasmic mRNA; sequences that increase translation efficiency (ie, the Kozak consensus sequence); sequences that increase protein stability; and, if desired, sequences that enhance protein secretion. The nature of such control sequences varies depending on the host organism; in prokaryotes, such control sequences typically include a promoter, ribosome binding site, and termination sequences

- 10 045749 транскрипции; в эукариотах, как правило, такие контролирующие последовательности включают промоторы и последовательности терминации транскрипции. Термин контролирующие последовательности включает, как минимум, все компоненты, наличие которых имеет важное значение для экспрессии и процессинга, и может также включать дополнительные компоненты, чье присутствие является полезным, например, лидирующие последовательности и последовательности слившихся клеток.- 10 045749 transcriptions; in eukaryotes, such control sequences typically include promoters and transcription termination sequences. The term control sequences includes, at a minimum, all components whose presence is essential for expression and processing, and may also include additional components whose presence is beneficial, such as leader sequences and fusion sequences.

В контексте настоящего описания термин функционально связанный относится к связи полинуклеотидных (или полипептидных) элементов в функциональную связь. Нуклеиновая кислота является функционально связанной, если она находится в условиях функциональной связи с другой последовательностью нуклеиновой кислоты. Например, регуляторная последовательность транскрипции функционально связана с кодирующей последовательностью, если она влияет на транскрипцию указанной кодирующей последовательности. Термин функционально связанный означает, что связанные последовательности ДНК являются, как правило, непрерывными, и при необходимости соединения двух участков, кодирующих белок, являются также непрерывными и находятся в рамке считывания.As used herein, the term operably linked refers to the linking of polynucleotide (or polypeptide) elements into a functional link. A nucleic acid is operably linked if it is in a functional relationship with another nucleic acid sequence. For example, a transcription control sequence is operably linked to a coding sequence if it affects the transcription of said coding sequence. The term operably linked means that the linked DNA sequences are generally contiguous and, where appropriate, junctions of two protein coding regions are also contiguous and in frame.

В одном из вариантов настоящего изобретения экспрессионный вектор относится к вектору, содержащему одну или несколько интересующих полинуклеотидных последовательностей, интересующих генов или трансгенов, которые фланкированы парвовирусными или инвертированными концевыми повторяющимися последовательностями (ITR).In one embodiment of the present invention, an expression vector refers to a vector containing one or more polynucleotide sequences of interest, genes or transgenes of interest that are flanked by parvovirus or inverted terminal repeat (ITR) sequences.

Ни кассета, ни вектор по изобретению не содержит нуклеотидные последовательности генов, кодирующих неструктурные белки (Rep) и структурные белки (Сар) аденоассоциированного вируса.Neither the cassette nor the vector according to the invention contains nucleotide sequences of genes encoding non-structural proteins (Rep) and structural proteins (Cap) of the adeno-associated virus.

Рекомбинантный вирус на основе AAV9 (аденоассоциированный вирус 9 серотипа).Recombinant virus based on AAV9 (adeno-associated virus serotype 9).

В одном из аспектов настоящее изобретение относится к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, который включает капсид и вышеуказанную экспрессионную кассету.In one aspect, the present invention provides a recombinant virus based on AAV9 (adeno-associated virus serotype 9) for increasing the expression of the SMN1 gene in target cells, which includes a capsid and the above expression cassette.

Термин рекомбинантный вирус на основе AAV (или вирусоподобная частица на основе AAV, или рекомбинантный вирусный штамм AAV, или рекомбинантный вектор AAV, или вектор rAAV) в контексте настоящего описания относится к вышеуказанной экспрессионной кассете (или вышеуказанному экспрессионному вектору), которая заключена внутри капсида AAV.The term recombinant AAV virus (or AAV virus-like particle, or recombinant AAV viral strain, or recombinant AAV vector, or rAAV vector) as used herein refers to the above expression cassette (or the above expression vector) that is contained within the AAV capsid .

Ген Сар, помимо других альтернативных продуктов, кодирует 3 капсидных белка (VP1, VP2 и VP3). Белки VP1, VP2 и VP3 находятся в соотношении 1:1:10, образуя икосаэдрический капсид (Xie Q. et al., The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy, Proc. Natl. Acad. Sci., USA, 2002, 99:10405-10410). Транскрипция этих генов начинается с одного промотора, р40. Молекулярная масса соответствующих белков (VP1, VP2 и VP3) составляет 87, 72 и 62 кДа соответственно. Все три белка транслируются с одной мРНК. После транскрипции пре-мРНК может подвергаться сплайсингу двумя разными способами, при этом вырезается более длинный или более короткий интрон и образуются мРНК различной нуклеотидной длины.The Sar gene, in addition to other alternative products, encodes 3 capsid proteins (VP1, VP2 and VP3). Proteins VP1, VP2 and VP3 are in a ratio of 1:1:10, forming an icosahedral capsid (Xie Q. et al., The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy, Proc. Natl Acad. Sci., USA, 2002, 99:10405-10410). Transcription of these genes begins from a single promoter, p40. The molecular weights of the corresponding proteins (VP1, VP2 and VP3) are 87, 72 and 62 kDa, respectively. All three proteins are translated from the same mRNA. After transcription, pre-mRNA can be spliced in two different ways, cutting out a longer or shorter intron and producing mRNAs of different nucleotide lengths.

При образовании рекомбинантного вируса на основе AAV (rAAV) кассета экспрессии, фланкированная ИКП (ITR), упаковывается в капсид AAV. Гены, необходимые для репликации AAV, как было указано выше, не входят в кассету.During the formation of an AAV-derived recombinant virus (rAAV), an ITR-flanked expression cassette is packaged into the AAV capsid. The genes required for AAV replication, as noted above, are not included in the cassette.

ДНК экспрессионной кассеты упакована в вирусный капсид в виде одноцепочечной молекулы ДНК (оцДНК) длиной приблизительно 3000 нуклеотидов. После инфицирования клетки вирусом, одноцепочечную ДНК конвертируют в форму двухцепочечной ДНК (дцДНК). Только дцДНК могут использовать белки клетки, которые транскрибируют содержащийся ген или гены в РНК.The expression cassette DNA is packaged within the viral capsid as a single-stranded DNA (ssDNA) molecule approximately 3000 nucleotides in length. Once a cell is infected with a virus, the single-stranded DNA is converted into double-stranded DNA (dsDNA) form. Only dsDNA can use cell proteins that transcribe the contained gene or genes into RNA.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий следующую аминокислотную последовательность:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP1 protein having the following amino acid sequence:

MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPG NGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGG NLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRL NFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWH CDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFN RFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFT DSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQML RTGNNFQF S YEFENVPFHS S YAHSQ SLDRLMNPLIDQYL YYLSKTINGSGQNQQTLKFS V AGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGP AMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVA TNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFMAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPG NGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGG NLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRL NFGQTGDTESVPDPQPI GEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWH CDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFN RFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFT DSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGS QAVGRSSFYCLEYFPSQML RTGNNFQF S YEFENVPFHS S YAHSQ SLDRLMNPLIDQYL YYLSKTINGSGQNQQTLKFS V AGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGP AMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVA TNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGF

- 11 045749- 11 045749

GMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPE

IQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL (SEQ ID NO: 5).IQYTSNYYKSNNNVEFAVNTEGVYSEPRPIGTRYLTRNL (SEQ ID NO: 5).

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP2 protein.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9, имеющий следующую аминокислотную последовательность:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP2 protein having the following amino acid sequence:

TAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSG VGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNN HLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL NFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVF MIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQS LDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVS TTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGT GRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGM VWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNK DKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSE PRPIGTRYLTRNL (SEQ ID NO: 6).TAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSG VGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNN HLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL NFKLFNIQVKEVTDNNGVKTI ANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVF MIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQS LDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVS TTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGED RFFPLSGSLIFGKQGT GRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGM VWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNK DKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEG VYSE PRPIGTRYLTRNL (SEQ ID NO: 6).

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP2 protein having the amino acid sequence of SEQ ID NO: 6 with one or more point mutations.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP3 protein.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9, имеющий следующую аминокислотную последовательность:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP3 protein having the following amino acid sequence:

MASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYK QISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKL FNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQ YGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRL MNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVT QNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDN VDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQD RDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNS FITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGT RYLTRNL (SEQ ID NO: 7).MASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYK QISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKL FNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQ YGYLTLNDGSQAVGRSSFYCL EYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRL MNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVT QNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDN VDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGW VQNQGILPGMVWQD RDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNS FITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGT RYLTRNL (SEQ ID NO: 7).

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP3 protein having the amino acid sequence of SEQ ID NO: 7 with one or more point mutations.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1, VP2 и VP3 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1, VP2, and VP3 proteins.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7.In some embodiments, the AAV9-based recombinant virus has a capsid that includes proteins VP1 having amino acid sequence SEQ ID NO: 5, VP2 having amino acid sequence SEQ ID NO: 6, and VP3 having amino acid sequence SEQ ID NO: 7.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями.In some embodiments, the recombinant AAV9-based virus has a capsid that includes proteins VP1 of amino acid sequence SEQ ID NO: 5 with one or more point mutations, VP2 of amino acid sequence SEQ ID NO: 6 with one or more point mutations, and VP3 of amino acid sequence SEQ ID NO: 7 with one or more point mutations.

Под несколькими точечными мутациями подразумеваются две, три, четыре, пять, шесть, семь, восемь, девять или десять точечных замен.Multiple point mutations are defined as two, three, four, five, six, seven, eight, nine or ten point substitutions.

Особенно предпочтительные варианты включают замены (мутации), которые являются консервативными по природе, т.е. те замены, которые имеют место в семействе аминокислот, которые объединены по их боковым цепям. В частности, аминокислоты обычно делят на четыре семейства: (1) кислые аспартат и глутамат; (2) основные - лизин, аргинин, гистидин; (3) неполярные - аланин, валин, лейцин,Particularly preferred embodiments include substitutions (mutations) that are conservative in nature, i.e. those substitutions that occur in a family of amino acids that are combined along their side chains. Specifically, amino acids are generally divided into four families: (1) acidic aspartate and glutamate; (2) basic - lysine, arginine, histidine; (3) non-polar - alanine, valine, leucine,

- 12 045749 изолейцин, пролин, фенилаланин, метионин, триптофан; и (4) незаряженные полярные - глицин, аспарагин, глутамин, цистеин, серин треонин, тирозин. Фенилаланин, триптофан и тирозин иногда классифицируют как ароматические аминокислоты. Например, достаточно обосновано предсказание о том, что выделенная замена лейцина на изолейцин или валин, аспартата на глутамат, треонина на серин или схожая консервативная замена аминокислоты на структурно родственную аминокислоту не окажет важного влияния на биологическую активность. Например, полипептид, представляющий интерес, может включать вплоть до приблизительно 5-10 консервативных или неконсервативных аминокислотных замен, при условии, что желаемая функция молекулы остается незатронутой.- 12 045749 isoleucine, proline, phenylalanine, methionine, tryptophan; and (4) uncharged polar ones - glycine, asparagine, glutamine, cysteine, serine threonine, tyrosine. Phenylalanine, tryptophan, and tyrosine are sometimes classified as aromatic amino acids. For example, it is reasonably predicted that a selected substitution of leucine for isoleucine or valine, aspartate for glutamate, threonine for serine, or a similar conservative amino acid substitution for a structurally related amino acid will not have an important effect on biological activity. For example, a polypeptide of interest may include up to about 5-10 conservative or non-conservative amino acid substitutions, so long as the desired function of the molecule remains unaffected.

Вариант точечных мутаций в последовательностях белков VP1, VP2 или VP3 AAV9 с помощью аминокислотных замен представляет собой замену, по меньшей мере, одного аминокислотного остатка в белке VP1, VP2 или VP3 AAV9 на другой аминокислотный остаток.A variant of point mutations in the AAV9 VP1, VP2 or VP3 protein sequences using amino acid substitutions is the replacement of at least one amino acid residue in the AAV9 VP1, VP2 or VP3 protein with another amino acid residue.

Консервативные замены показаны в таблице под заголовком предпочтительные замены.Conservative substitutions are shown in the table under the heading Preferred Substitutions.

Исходный остаток Original remainder Примеры замены Replacement examples Предпочтительные замены Preferred replacements Ala (А) Ala (A) Vai; Leu; He Vai; Leu; He Vai Vai Arg(R) Arg(R) Lys; Gin; Asn Lys; Gin; Asn Lys Lys Asn(N) Asn(N) Gin; His; Asp, Lys; Arg Gin; His; Asp, Lys; Arg Gin Gin Asp (D) Asp (D) Glu; Asn Glu; Asn Glu Glu Cys(C) Cys(C) Ser; Ala Ser; Ala Ser Ser Gln(Q) Gln(Q) Asn; Glu Asn; Glu Asn Asn Glu (E) Glu(E) Asp; Gin Asp; Gin Asp Asp Gly(G) Gly(G) Ala Ala Ala Ala His (H) His(H) Asn; Gin; Lys; Arg Asn; Gin; Lys; Arg Arg Arg He (I) He(I) Leu; Vai; Met; Ala; Phe; Норлейцин Leu; Vai; Met; Ala; Ph; Norleucine Leu Leu Leu (L) Leu (L) Норлейцин; He; Vai; Met; Ala; Phe Norleucine; He; Vai; Met; Ala; Phe lie lie Lys(K) Lys(K) Arg; Gin; Asn Arg; Gin; Asn Arg Arg Met (M) Met(M) Leu; Phe; He Leu; Ph; He Leu Leu Phe(F) Phe(F) Trp; Leu; Vai; He; Ala; Tyr Trp; Leu; Vai; He; Ala; Tyr Tyr Tyr Pro (P) Pro (P) Ala Ala Ala Ala Ser(S) Ser(S) Thr Thr Thr Thr Thr (T) Thr (T) Vai; Ser Vai; Ser Ser Ser Trp(W) Trp(W) Tyr; Phe Tyr; Phe Tyr Tyr Tyr(Y) Tyr(Y) Trp; Phe; Thr; Ser Trp; Ph; Thr; Ser Phe Phe Vai (V) Vai (V) He; Leu; Met; Phe; Ala; Норлейцин He; Leu; Met; Ph; Ala; Norleucine Leu Leu

CMV энхансер;CMV enhancer;

CMV промотер;CMV promoter;

интрон гена hBG1;hBG1 gene intron;

правый ITR.right ITR.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включаетIn some embodiments, the AAV9-based recombinant virus has a capsid that includes

- 13 045749 белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:- 13 045749 proteins VP1 with amino acid sequence SEQ ID NO: 5, VP2 with amino acid sequence SEQ ID NO: 6 and VP3 with amino acid sequence SEQ ID NO: 7, and the expression cassette includes the following elements in the direction from the 5' end to the 3' -end:

CMV энхансер;CMV enhancer;

CMV промотер;CMV promoter;

интрон гена hBG1;hBG1 gene intron;

вышеуказанная кодон-оптимизированная нуклеиновая кислоту гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;

правый ITR.right ITR.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV9-based virus has a capsid that includes proteins VP1 of amino acid sequence SEQ ID NO: 5 with one or more point mutations, VP2 of amino acid sequence SEQ ID NO: 6 with one or more point mutations, and VP3 of amino acid sequence SEQ ID NO: 7 with one or more point mutations, and the expression cassette includes the following elements in the direction from the 5' end to the 3' end:

CMV энхансер;CMV enhancer;

CMV промотер;CMV promoter;

интрон гена hBG1;hBG1 gene intron;

правый ITR.right ITR.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.In some embodiments, the AAV9-based recombinant virus has a capsid that includes proteins VP1 having amino acid sequence SEQ ID NO: 5, VP2 having amino acid sequence SEQ ID NO: 6, and VP3 having amino acid sequence SEQ ID NO: 7, and an expression cassette comprising a nucleic acid with SEQ ID NO: 4.

В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.In some embodiments, the recombinant AAV9-based virus has a capsid that includes proteins VP1 of amino acid sequence SEQ ID NO: 5 with one or more point mutations, VP2 of amino acid sequence SEQ ID NO: 6 with one or more point mutations, and VP3 of amino acid sequence SEQ ID NO: 7 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: 4.

Фармацевтическая композиция.Pharmaceutical composition.

В конкретных вариантах осуществления настоящее изобретение относится к фармацевтической композиции, содержащей рекомбинантный вирус на основе AAV9 по изобретению в фармацевтически приемлемом носителе или в других фармацевтических агентах, адъювантах, разбавителях и т.д. Носитель для инъекций обычно является жидким. Носитель для других способов введения может быть или твердым, или жидким, таким как стерильная апирогенная вода или стерильный апирогенный фосфатносолевой буферный раствор. Для введения путем ингаляции носитель является вдыхаемым и предпочтительно находится в твердой или жидкой дисперсной форме. В качестве инъекционной среды предпочтительно использовать воду, содержащую добавки, общепринятые для инъекционных растворов, такие как стабилизирующие агенты, соли или солевые растворы и/или буферы.In specific embodiments, the present invention provides a pharmaceutical composition comprising a recombinant AAV9 virus of the invention in a pharmaceutically acceptable carrier or other pharmaceutical agents, adjuvants, diluents, etc. The injectable carrier is usually liquid. The carrier for other routes of administration may be either a solid or a liquid, such as sterile pyrogen-free water or sterile pyrogen-free phosphate-buffered saline. For administration by inhalation, the carrier is inhalable and is preferably in solid or liquid dispersed form. As the injection medium, it is preferable to use water containing additives generally accepted for injection solutions, such as stabilizing agents, salts or saline solutions and/or buffers.

Фармацевтическая композиция обозначает композицию, включающую в себя вышеуказанный рекомбинантный вирус на основе AAV9 по изобретению и по крайней мере один из компонентов, выбранных из группы, состоящей из фармацевтически приемлемых и фармакологически совместимых эксипиентов, таких как наполнители, растворители, разбавители, носители, вспомогательные, распределяющие, средства доставки, консерванты, стабилизаторы, эмульгаторы, суспендирующие агенты, загустители, регуляторы пролонгированной доставки, выбор и соотношение которых зависит от природы и способа назначения и дозировки. Фармацевтические композиции по настоящему изобретению и способы их изготовления будут бесспорно очевидными для специалистов в этой области. Производство фармацевтических композиций предпочтительно должно соответствовать требованиям GMP (надлежащей производственной практики). Композиция может включать буферную композицию, тонические агенты, стабилизаторы и солюбилизаторы.Pharmaceutical composition means a composition comprising the above recombinant AAV9 virus of the invention and at least one of the components selected from the group consisting of pharmaceutically acceptable and pharmacologically compatible excipients such as excipients, solvents, diluents, carriers, auxiliaries, dispensers , delivery vehicles, preservatives, stabilizers, emulsifiers, suspending agents, thickeners, prolonged delivery regulators, the choice and ratio of which depends on the nature and method of administration and dosage. The pharmaceutical compositions of the present invention and methods for their manufacture will be readily apparent to those skilled in the art. The production of pharmaceutical compositions should preferably comply with GMP (Good Manufacturing Practices) requirements. The composition may include a buffer composition, tonic agents, stabilizers and solubilizers.

Фармацевтически приемлемым считается материал, который не имеет биологических или других противопоказаний, например, материал можно вводить субъекту без каких-либо нежелательных биологических эффектов. Таким образом, такие фармацевтические композиции можно использовать, например, для трансфекции клетки ех vivo или для введения in vivo рекомбинантного вируса на основе AAV9A pharmaceutically acceptable material is one that has no biological or other contraindications, e.g., the material can be administered to a subject without causing any undesirable biological effects. Thus, such pharmaceutical compositions can be used, for example, for ex vivo transfection of a cell or for in vivo administration of a recombinant AAV9-based virus

- 14 045749 по изобретению непосредственно субъекту.- 14 045749 according to the invention directly to the subject.

Термин эксципиент или вспомогательное вещество используется в данном изобретении для описания любого компонента, отличающегося от ранее описанных по данному изобретению. Это вещества неорганического или органического происхождения, используемые в процессе производства, изготовления лекарственных препаратов для придания им необходимых физико-химических свойств.The term excipient or excipient is used in this invention to describe any component other than those previously described in this invention. These are substances of inorganic or organic origin, used in the production process of medicines to give them the necessary physical and chemical properties.

Под стабилизатором понимается вспомогательное вещество или смесь двух и более вспомогательных веществ, которые обеспечивают физическую и/или химическую стабильность активного агента.By stabilizer is meant an excipient or a mixture of two or more excipients that provide physical and/or chemical stability of the active agent.

Под термином буфер, буферная композиция, буферный агент понимается раствор, способный сохранять значение рН, благодаря взаимодействию кислотных и щелочных компонентов, входящих в его состав, который дает возможность препарату вектора на основе rAAV5, проявлять устойчивость к изменениям рН. В общем случае преимущественными являются значения рН фармацевтической композиции от 4,0 до 8,0. В качестве буферных агентов могут быть использованы, например, ацетатный, фосфатный, цитратный, гистидиновый, сукцинатный и т.п. буферные растворы, но, не ограничиваясь ими.The term buffer, buffer composition, buffer agent refers to a solution capable of maintaining the pH value due to the interaction of the acidic and alkaline components included in its composition, which allows the vector preparation based on rAAV5 to exhibit resistance to changes in pH. In general, pH values of the pharmaceutical composition from 4.0 to 8.0 are preferred. As buffering agents, for example, acetate, phosphate, citrate, histidine, succinate, etc. can be used. buffer solutions, but not limited to them.

Фармацевтическая композиция является стабильной, если активный агент сохраняет свою физическую стабильность и/или химическую стабильность и/или биологическую активность в течение заявленного срока годности при температуре хранения, например при 2-8°C. Предпочтительно, чтобы активный агент сохранял и физическую, и химическую стабильность, а также биологическую активность. Период хранения выбирается на основании результатов исследования стабильности при ускоренном и естественном хранении.A pharmaceutical composition is stable if the active agent maintains its physical stability and/or chemical stability and/or biological activity through its stated shelf life at storage temperature, for example at 2-8°C. It is preferred that the active agent retains both physical and chemical stability as well as biological activity. The storage period is selected based on the results of stability studies during accelerated and natural storage.

Фармацевтическая композиция по данному изобретению может изготавливаться, упаковываться или широко продаваться в виде единичной стандартной дозы или множества единичных стандартных доз в виде готовой лекарственной формы. Используемый в данном изобретении термин единичная стандартная доза означает дискретное количество фармацевтической композиции, содержащей заранее определенное количество активного ингредиента. Количество активного ингредиента обычно равно дозировке активного ингредиента, который будет вводиться субъекту, или удобной части такой дозировки, например, половине или трети такой дозировки.The pharmaceutical composition of this invention may be manufactured, packaged or widely sold as a single unit dose or a plurality of unit dose units in a finished dosage form. As used herein, the term unit dose means a discrete amount of a pharmaceutical composition containing a predetermined amount of the active ingredient. The amount of active ingredient is typically equal to the dosage of the active ingredient to be administered to the subject, or a convenient portion of such dosage, such as one-half or one-third of such dosage.

Применение.Application.

Любой способ введения рекомбинантного вируса на основе AAV9, принятый в данной области, может соответствующим образом использоваться для вышеуказанного рекомбинантного вируса на основе AAV9 по данному изобретению.Any method of administering an AAV9-based recombinant virus accepted in the art can be suitably used for the above-mentioned AAV9-based recombinant virus of the present invention.

Рекомбинантный вирус на основе AAV9 предпочтительно вводят в клетку в биологически эффективном количестве. Биологически эффективное количество рекомбинантного вируса представляет собой количество, которое достаточно, чтобы вызвать инфекцию (или трансдукцию) и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке. Если вирус вводят в клетку in vivo (например, вирус вводят субъекту, как описано ниже), биологически эффективное количество вирусного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке-мишени.The AAV9-based recombinant virus is preferably introduced into the cell in a biologically effective amount. A biologically effective amount of a recombinant virus is an amount that is sufficient to cause infection (or transduction) and expression of a heterologous nucleic acid sequence in a cell. If the virus is introduced into a cell in vivo (eg, the virus is administered to a subject as described below), a biologically effective amount of the viral vector is an amount that is sufficient to cause transduction and expression of a heterologous nucleic acid sequence in the target cell.

Клетка для введения вышеуказанного рекомбинантного вируса на основе AAV9 по изобретению может быть клеткой любого типа, включая в себя без ограничения нервные клетки (включающие в себя клетки периферической и центральной нервной системы, в частности, клетки головного мозга), легочные клетки, эпителиальные клетки (например, эпителиальные клетки кишечника и дыхательных путей), мышечные клетки, клетки поджелудочной железы (в том числе островковые клетки), печеночные клетки, клетки миокарда, костные клетки (например, стволовые клетки костного мозга), гемопоэтические стволовые клетки, клетки селезенки, кератиноциты, фибробласты, эндотелиальные клетки, клетки предстательной железы, половые клетки и т.п. Альтернативно клетка для введения вышеуказанного рекомбинантного вируса на основе AAV9 может быть любой клеткой-предшественником. В качестве дополнительной альтернативы, клетки могут представлять собой стволовые клетки (например, нервные стволовые клетки, стволовые клетки печени). Кроме того, клетки могут происходить от любых видов, как указано выше.The cell for introducing the above AAV9-based recombinant virus of the invention may be any type of cell, including but not limited to neural cells (including cells of the peripheral and central nervous system, in particular brain cells), lung cells, epithelial cells (eg , intestinal and respiratory epithelial cells), muscle cells, pancreatic cells (including islet cells), liver cells, myocardial cells, bone cells (eg, bone marrow stem cells), hematopoietic stem cells, spleen cells, keratinocytes, fibroblasts , endothelial cells, prostate cells, germ cells, etc. Alternatively, the cell for introducing the above AAV9-based recombinant virus can be any progenitor cell. As a further alternative, the cells may be stem cells (eg, neural stem cells, liver stem cells). Additionally, the cells can come from any species, as noted above.

Вышеуказанный рекомбинантный вирус на основе AAV9 не используется для модификации генетической целостности клеток зародышевой линии человека.The above AAV9-based recombinant virus is not used to modify the genetic integrity of human germline cells.

ПримерыExamples

Для наилучшего понимания изобретения приводятся следующие примеры. Эти примеры приведены только в иллюстративных целях и не должны толковаться как ограничивающие сферу применения изобретения в любой форме.For a better understanding of the invention, the following examples are provided. These examples are provided for illustrative purposes only and should not be construed as limiting the scope of the invention in any form.

Все публикации, патенты и патентные заявки, указанные в этой спецификации включены в данный документ путем отсылки. Хотя вышеупомянутое изобретение было довольно подробно описано путем иллюстрации и примера в целях исключения двусмысленного толкования, специалистам в данной области на основе идей, раскрытых в данном изобретении, будет вполне понятно, что могут быть внесены оп- 15 045749 ределенные изменения и модификации без отклонения от сущности и объема прилагаемых вариантов осуществления изобретения.All publications, patents and patent applications referenced in this specification are incorporated herein by reference. Although the foregoing invention has been described in some detail by way of illustration and example in order to avoid ambiguity, those skilled in the art will appreciate from the teachings disclosed herein that certain changes and modifications may be made without departing from the spirit. and the scope of the accompanying embodiments of the invention.

Материалы и общие методы.Materials and general methods.

Методы рекомбинантной ДНК.Recombinant DNA methods.

Для манипуляций с ДНК использовали стандартные методы, описанные у Sambrook J. и др., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Реагенты для молекулярной биологии использовали согласно инструкциям производителей. Вкратце плазмидную ДНК нарабатывали для дальнейших манипуляций в клетках Е.coli, выращиваемых под селективным давлением с антибиотиками для того, чтобы плазмиды не терялись в клеточной популяции. Плазмидную ДНК выделяли из клеток коммерческими наборами, измеряли концентрацию и использовали для клонирования с помощью обработки эндонуклеазами рестрикции или методами ПЦРамплификации. Фрагменты ДНК лигировали между собой с помощью лигаз и трансформировали в бактериальные клетки для отбора клонов и дальнейших наработок. Все полученные генетические конструкции подтверждали по паттернам рестрикции и полным секвенированием по Сэнгеру.For DNA manipulation, standard methods were used as described in Sambrook J. et al., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Molecular biology reagents were used according to the manufacturers' instructions. Briefly, plasmid DNA was produced for further manipulation in E. coli cells grown under selective pressure with antibiotics to ensure that plasmids were not lost in the cell population. Plasmid DNA was isolated from cells using commercial kits, the concentration was measured and used for cloning using restriction endonuclease treatment or PCR amplification methods. DNA fragments were ligated with each other using ligases and transformed into bacterial cells for clone selection and further development. All obtained genetic constructs were confirmed by restriction patterns and full Sanger sequencing.

Синтез генов.Gene synthesis.

Требуемые сегменты генов получали из олигонуклеотидов, созданных путем химического синтеза. Генные сегменты длиной от 300 до 1000 п.н., которые фланкированы уникальными сайтами рестрикции, собирали путем ренатурации олигонуклеотидов друг на друге с последующей ПЦР-амплификацией с крайних праймеров. В результате получали смесь фрагментов, включая нужный. Фрагменты клонировали по сайтам рестрикции в промежуточные векторы, после чего последовательности ДНК субклонированных фрагментов подтверждали путем секвенирования ДНК.The required gene segments were obtained from oligonucleotides created by chemical synthesis. Gene segments ranging from 300 to 1000 bp in length, which are flanked by unique restriction sites, were assembled by renaturation of oligonucleotides on each other, followed by PCR amplification from extreme primers. As a result, a mixture of fragments was obtained, including the desired one. The fragments were cloned at restriction sites into intermediate vectors, after which the DNA sequences of the subcloned fragments were confirmed by DNA sequencing.

Определение последовательностей ДНК.Determination of DNA sequences.

Последовательности ДНК определяли путем секвенирования по Сэнгеру. Анализ последовательностей ДНК и белков и обработку данных о последовательностях осуществляли в программе SnapGene 4.2 и выше для создания, картирования, анализа, аннотирования и иллюстрации последовательностей.DNA sequences were determined by Sanger sequencing. DNA and protein sequence analysis and sequence data processing were performed using SnapGene 4.2 and higher to generate, map, analyze, annotate, and illustrate sequences.

Культивирование клеточных культур.Cultivation of cell cultures.

В экспериментах были использованы клеточные линии HEK293 (Human Embryonic Kidney clone 293) и HSMC (Human Skeletal Muscle Cells). Клетки культивировались в стандартных условиях при 370°С и 5% CO₂, на полной питательной среде DMEM с добавлением 10% FBS и антибиотика. Для культивирования HSMC культуральный пластик предварительно покрывался коллагеном (Gibco). Пересев клеток осуществлялся при достижении 80-90% конфлюентности. Жизнеспособность клеток оценивалась с помощью окраски Trypan Blue и камеры Горяева либо с помощью окраски PI и проточной цитометрии.Cell lines HEK293 (Human Embryonic Kidney clone 293) and HSMC (Human Skeletal Muscle Cells) were used in the experiments. Cells were cultured under standard conditions at 370°C and 5% CO ₂ in complete nutrient medium DMEM supplemented with 10% FBS and antibiotic. To culture HSMC, the culture plastic was precoated with collagen (Gibco). Cell reseeding was carried out when 80-90% confluency was achieved. Cell viability was assessed using Trypan Blue staining and a Goryaev chamber or using PI staining and flow cytometry.

Трансфекция клеток.Cell transfection.

Клеточные линии засеивали накануне трансфекции в 6-луночные планшеты таким образом, чтобы они достигали 70-80% конфлюентности к моменту трансфекции. Трансфекцию осуществляли с помощью коммерческих наборов для липофекции по протоколу производителя. Через 72 ч клетки обрабатывали растворами трипсина или аналогичными, снимали с подложки, отмывали в фосфатном буфере и собирали для дальнейшего анализа экспрессии целевых генов и белков. При постановке каждой трансфекции использовали контрольную плазмиду, экспрессирующую GFP, для контроля эффективности трансфекции (доля GFP-позитивных клеток в процентах). Дальнейший анализ проводили только в том случае, если эффективность трансфекции составляла не менее 50%.Cell lines were seeded on the eve of transfection into 6-well plates so that they reached 70-80% confluency at the time of transfection. Transfection was performed using commercial lipofection kits according to the manufacturer's protocol. After 72 h, the cells were treated with trypsin or similar solutions, removed from the substrate, washed in phosphate buffer, and collected for further analysis of the expression of target genes and proteins. During each transfection, a control plasmid expressing GFP was used to control the transfection efficiency (the percentage of GFP-positive cells). Further analysis was performed only if the transfection efficiency was at least 50%.

Все работы проводились в 3 независимых экспериментах.All work was carried out in 3 independent experiments.

Анализ генной экспрессии.Gene expression analysis.

Экспрессию SMN1 на уровне мРНК проверяли с помощью количественной ПЦР. Вкратце использовали праймеры и пробу, специфичные к последовательности SMN1 дикого типа или GeneBeam. Для контроля количества исходной РНК использовали праймеры и пробу, специфичные к гену домашнего хозяйства GAPDH. Для каждого набора праймеров и проб строили калибровочные кривые с применением известного количества копий линеаризованной плазмидной ДНК, содержащей амплифицируемую последовательность соответствующего гена. Анализ экспрессии осуществляли, определяя по калибровочным кривым количество копий SMN1-GeneBeam, SMN1-WT и GAPDH в каждом образце, после чего нормализовали количество копий SMN1 на 10000 копий GAPDH. Полученные значения сравнивали между собой для различных образцов в рамках одного эксперимента.Expression of SMN1 at the mRNA level was tested using quantitative PCR. Briefly, primers and probe specific to the wild-type or GeneBeam SMN1 sequence were used. To control the amount of initial RNA, primers and a probe specific to the housekeeping gene GAPDH were used. For each set of primers and probes, calibration curves were constructed using a known number of copies of linearized plasmid DNA containing the amplifiable sequence of the corresponding gene. Expression analysis was performed by determining the copy numbers of SMN1-GeneBeam, SMN1-WT, and GAPDH in each sample from calibration curves, and then normalizing the copy number of SMN1 per 10,000 copies of GAPDH. The obtained values were compared with each other for different samples within the same experiment.

Определение экспрессии белка SMN1 с помощью проточной цитометрии.Determination of SMN1 protein expression by flow cytometry.

Оценку содержания белка SMN1 в клетках проводили посредством внутриклеточного окрашивания, с последующим анализом с помощью проточной цитометрии. Вкратце клетки снимали с культуральных планшетов с помощью TrypLE, отмывали в PBS, фиксировали в растворе 4% параформальдегида, пермеабилизировали с помощью 0,5% раствора Triton X-100 в PBS, инкубировали в блокирующем буфере с 1-5% BSA и окрашивали двухэтапно с использованием первичных антител к SMN1 и вторичных антител, меченных Alexa Fluor 488. После окрашивания клетки однократно промывали в PBS и анализировали на проточном цитометре. Оценивали среднюю интенсивность сигнала за вычетом сигнала, окрашенного вторичными антителами без добавления первичных антител.SMN1 protein content in cells was assessed by intracellular staining, followed by flow cytometry analysis. Briefly, cells were removed from culture plates using TrypLE, washed in PBS, fixed in 4% paraformaldehyde, permeabilized with 0.5% Triton X-100 in PBS, incubated in blocking buffer with 1–5% BSA, and stained in two steps with using primary antibodies to SMN1 and secondary antibodies labeled with Alexa Fluor 488. After staining, cells were washed once in PBS and analyzed on a flow cytometer. The average signal intensity was assessed minus the signal stained with secondary antibodies without the addition of primary antibodies.

- 16 045749- 16 045749

Сборка и очистка вирусных частиц рекомбинантных векторов AAV.Assembly and purification of viral particles from recombinant AAV vectors.

Для сборки вирусных частиц AAV, содержащих ген SMN1 или контрольный ген GFP, использовали упаковочные клетки HEK293, в которые трансфецировали 3 следующие плазмиды:To assemble AAV viral particles containing the SMN1 gene or the control GFP gene, HEK293 packaging cells were used, into which the following 3 plasmids were transfected:

плазмида, содержащая геном AAV с кассетой для экспрессии трансгена (SNM1 или GFP);a plasmid containing the AAV genome with a transgene expression cassette (SNM1 or GFP);

плазмида для экспрессии гена Сар серотипа AAV9 и гена Rep серотипа AAV2. Каждый ген с помощью альтернативных рамок считывания кодирует несколько белковых продуктов;plasmid for expression of the Sar gene of serotype AAV9 and the Rep gene of serotype AAV2. Each gene encodes multiple protein products using alternative reading frames;

плазмида для экспрессии генов аденовируса Ad5, необходимых для сборки и упаковки капсидов AAV.plasmid for expression of Ad5 adenovirus genes required for assembly and packaging of AAV capsids.

Через 72 ч клетки лизировали и проводили очистку и концентрирование вирусных частиц с помощью методов фильтрации и хроматографии. Титр вирусных частиц определяли с помощью количественной ПЦР с праймерами и пробой, специфичными к участку рекомбинантного вирусного генома и выражали в виде количества копий вирусных геномов на 1 мл.After 72 h, the cells were lysed and the viral particles were purified and concentrated using filtration and chromatography methods. The titer of viral particles was determined using quantitative PCR with primers and a probe specific to a region of the recombinant viral genome and expressed as the number of copies of viral genomes per 1 ml.

Трансдукция клеточных культур.Transduction of cell cultures.

Клеточные линии засевали аналогично экспериментам для трансфекции, после чего добавляли препарат с вирусными частицами и через 72 ч клетки анализировали. Эффективность трансдукции считали, анализируя процент GFP+ клеток.Cell lines were seeded similarly to the transfection experiments, after which the drug with viral particles was added, and after 72 hours the cells were analyzed. Transduction efficiency was calculated by analyzing the percentage of GFP+ cells.

Для используемых культур предварительно были поставлены эксперименты с проверкой эффективности трансдукции. Кратко, препарат вируса AAV9-GFP трансдуцировали в клеточные линии в различных соотношениях клеток и вирусных частиц. Отношение количества вирусных частиц и клеток называют multiplicity of infection (MOI). MOI вируса AAV9-GFP варьировали от 50000 до 1000000. В результате для каждой линии были определены диапазоны MOI, в пределах которых эффективность трансдукции менялась линейно в зависимости от MOI. Дальнейшие работы с трансдукцией клеточных линий проводили в их линейных диапазонах.For the cultures used, experiments were previously carried out to test the efficiency of transduction. Briefly, the AAV9-GFP virus preparation was transduced into cell lines at various ratios of cells and viral particles. The ratio of the number of viral particles and cells is called multiplicity of infection (MOI). The MOI of the AAV9-GFP virus varied from 50,000 to 1,000,000. As a result, MOI ranges were determined for each line, within which the transduction efficiency varied linearly depending on the MOI. Further work with transduction of cell lines was carried out in their linear ranges.

После трансдукции анализ экспрессии генов и белков осуществляли как описано выше.After transduction, gene and protein expression analysis was performed as described above.

Пример 1. Способ получения кодон-оптимизированного гена SMN1.Example 1. Method for obtaining a codon-optimized SMN1 gene.

Для получения кодон-оптимизированного гена SMN1 за основу была взята соответствующая аминокислотная последовательность белка SMN_HUMAN (SEQ ID NO: 1).To obtain the codon-optimized SMN1 gene, the corresponding amino acid sequence of the SMN_HUMAN protein (SEQ ID NO: 1) was taken as a basis.

Данная аминокислотная последовательность SEQ ID NO: 1 переводилась в нуклеотидную последовательность путем последовательного сопоставления каждой аминокислоте начиная с N-конца одного из кодирующих ее синонимичных кодонов с учетом одного или совокупности следующих признаков:This amino acid sequence SEQ ID NO: 1 was translated into a nucleotide sequence by sequentially matching each amino acid, starting from the N-terminus, with one of the synonymous codons encoding it, taking into account one or a combination of the following features:

1) частоты использования данного кодона (Yasukazu Nakamura et al., Codon usage tabulated from the international DNA sequence databases; its status 1999, Nucleic Acids Research, 1999, vol. 27, № 1, DOI: 10.1093/nar/27.1.292);1) frequency of use of a given codon (Yasukazu Nakamura et al., Codon usage tabulated from the international DNA sequence databases; its status 1999, Nucleic Acids Research, 1999, vol. 27, No. 1, DOI: 10.1093/nar/27.1.292) ;

2) GC-состава концевого участка получаемой нуклеотидной последовательности (целевым значением GC-состава считалось 60% исходя из статьи Grzegorz Kudla et al., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, PLoS Biol, June 2006, volume 4, issue 6, e180, DOI: 10.1371/joumal.pbio.0040180, поэтому кодон был тем предпочтительнее, чем меньше получалась разность текущего GC-состава с целевым);2) GC composition of the terminal region of the resulting nucleotide sequence (the target value of GC composition was considered to be 60% based on the article by Grzegorz Kudla et al., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, PLoS Biol, June 2006, volume 4, issue 6, e180, DOI: 10.1371/joumal.pbio.0040180, therefore the codon was more preferable, the smaller the difference between the current GC composition and the target one);

3) свободной энергии фолдинга концевого участка получаемой нуклеотидной последовательности (вторичные структуры определялись при помощи алгоритма Зукера, Michael Zuker et al., Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information, Nucleic Acids Research, volume 9, issue 1, 10 January 1981, pages 133-148, DOI: 10.1093/nar/9.1.133).3) free energy of folding of the terminal region of the resulting nucleotide sequence (secondary structures were determined using the Zuker algorithm, Michael Zuker et al., Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information, Nucleic Acids Research, volume 9, issue 1, 10 January 1981, pages 133-148, DOI: 10.1093/nar/9.1.133).

В процессе построения также избегалась генерация смысловых нуклеотидных последовательностей, таких как сайты рестрикции, участки внутренней посадки рибосомы, сайты сплайсинга т.д.During the construction process, the generation of sense nucleotide sequences, such as restriction sites, internal ribosome entry sites, splicing sites, etc., was also avoided.

В результате перевода аминокислотной последовательности SEQ ID NO: 1 в нуклеотидную последовательность был получен ряд кодон-оптимизированных нуклеотидных последовательностей гена SMN1.As a result of translating the amino acid sequence of SEQ ID NO: 1 into a nucleotide sequence, a number of codon-optimized nucleotide sequences of the SMN1 gene were obtained.

Из вышеуказанного ряда кодон-оптимизированных нуклеотидных последовательностей SMN1 несколько последовательностей не показывали увеличения транскрипции гена SMN1 в дальнейших исследованиях, т.е. не было достоверного увеличения количества копий мРНК SMN1-opt по сравнению с SMN1-WT на какой-либо из использованных клеточных линий, или данное увеличение было незначительным.Of the above series of codon-optimized SMN1 nucleotide sequences, several sequences did not show an increase in SMN1 gene transcription in further studies, i.e. there was no significant increase in SMN1-opt mRNA copy number compared to SMN1-WT in any of the cell lines used, or the increase was negligible.

Большинство кодон-оптимизированных нуклеотидных последовательностей гена SMN1 показал увеличение транскрипции гена SMN1 в 1,5-2 раза в дальнейших исследованиях, т.е. достоверно увеличивая количество копий мРНК SMN1-opt по сравнению с SMN1-WT на всех использованных клеточных линиях.Most codon-optimized nucleotide sequences of the SMN1 gene showed an increase in SMN1 gene transcription by 1.5-2 times in further studies, i.e. significantly increasing the number of SMN1-opt mRNA copies compared to SMN1-WT in all cell lines used.

Одна из вышеуказанного ряда кодон-оптимизированных нуклеотидных последовательностей гена SMN1 неожиданно показала увеличение транскрипции гена SMN1 более чем в 3 раза в дальнейших исследованиях, т.е. неожиданно увеличивая количество копий мРНК SMN1-opt в более чем 3 раза по сравнению с SMN1-WT на всех использованных клеточных линиях (см. примеры 3-4). Данная финальная кодон-оптимизированная нуклеотидная последовательность гена SMN1 получила условное названиеOne of the above series of codon-optimized nucleotide sequences of the SMN1 gene unexpectedly showed an increase in SMN1 gene transcription by more than 3 times in further studies, i.e. unexpectedly increasing the copy number of SMN1-opt mRNA by more than 3-fold compared to SMN1-WT in all cell lines used (see examples 3-4). This final codon-optimized nucleotide sequence of the SMN1 gene received the code name

- 17 045749- 17 045749

SMN1-GeneBeam (или сокращенно SMN1-GB).SMN1-GeneBeam (or SMN1-GB for short).

Финальная кодон-оптимизированная последовательность SMN1 (SMNl-GeneBeam) имеет нуклеотидную последовательность представленную SEQ ID NO: 2.The final codon-optimized sequence of SMN1 (SMNl-GeneBeam) has the nucleotide sequence shown by SEQ ID NO: 2.

Данная финальная кодон-оптимизированная нуклеотидная последовательность SMN1 (SMN1GeneBeam) характеризуется повышенным индексом адаптации кодонов (Paul М. Sharp et al., The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications, Nucleic Acids Research, volume 15, issue 3,11 February 1987, pages 1281-1295, DOI: 10.1093/nar/15.3.1281 - стандартная метрика для оценки последовательности на предмет частот использованных кодонов) по сравнению с кодирующей последовательностью гена SMN дикого типа (SMN1-WT с SEQ ID NO: 3).This final codon-optimized nucleotide sequence of SMN1 (SMN1GeneBeam) is characterized by an increased codon adaptation index (Paul M. Sharp et al., The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications, Nucleic Acids Research, volume 15 , issue 3,11 February 1987, pages 1281-1295, DOI: 10.1093/nar/15.3.1281 - a standard metric for evaluating a sequence for the frequencies of codons used) compared to the coding sequence of the wild type SMN gene (SMN1-WT with SEQ ID NO: 3).

Индекс адаптации кодонов для финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO: 2) равен 98%, для последовательности дикого типа - 75%.The codon adaptation index for the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) is 98%, for the wild type sequence - 75%.

GC-состав последовательности дикого типа равен 45%, т.е. отличается от целевого значения на 15%, GC-состав финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO: 2) равен 64%, т.е. отличается от целевого значения на 4%.The GC composition of the wild type sequence is 45%, i.e. differs from the target value by 15%, the GC composition of the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) is 64%, i.e. differs from the target value by 4%.

Финальная кодон-оптимизированная нуклеотидная последовательность гена SMN1 (SEQ ID NO: 2) и нуклеотидная последовательность гена SMN1 дикого типа (SEQ ID NO: 3) идентичны на 71%.The final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) and the nucleotide sequence of the wild-type SMN1 gene (SEQ ID NO: 3) are 71% identical.

Пример 2. Сборка генетических конструкций, несущих рекомбинантный геном AAV и кодирующих ген SMN1.Example 2. Assembly of genetic constructs carrying the recombinant AAV genome and encoding the SMN1 gene.

Последовательность гена SMN1 дикого типа была получена путем амплификации со специфическими праймерами с кДНК, синтезированной на основе тотальной РНК клеток HEK293. В процессе амплификации с 5'-конца гена была добавлена последовательность Kozak и сайт рестрикции ClaI, а с 3'-конца - сайт рестрикции XbaI. После этого последовательность гена SMN1 была клонирована рестриктазно-лигазным методом по сайтам ClaI и XbaI в коммерческую конструкцию pAAV-GFP Control plasmid (VPK-402) от CellBiolab (США), с заменой гена GFP на SMN1, получив конструкцию pAAV-SMN1-WT.The wild-type SMN1 gene sequence was obtained by amplification with specific primers from cDNA synthesized from total RNA of HEK293 cells. During the amplification process, a Kozak sequence and a ClaI restriction site were added to the 5' end of the gene, and an XbaI restriction site to the 3' end. After this, the SMN1 gene sequence was cloned using the restriction enzyme ligase method at the ClaI and XbaI sites into the commercial construct pAAV-GFP Control plasmid (VPK-402) from CellBiolab (USA), with the GFP gene replaced by SMN1, obtaining the pAAV-SMN1-WT construct.

Последовательность SMN1-GeneBeam была собрана как описано выше. В силу сложности последовательности, несмотря на ее относительно небольшой размер, провели серию субклонирований фрагментов гена в промежуточных векторах pGEMT с верификацией сиквенсов для каждого вектора. Далее из нескольких промежуточных векторов с помощью ПЦР собрали полноразмерную версию гена и заклонировали в промежуточный вектор pGEMT. В качестве конечной генетической конструкции использовали конструкцию pAAV-SMN1-WT, заменив SMN1 дикого типа на SMN1-GeneBeam по сайтам ClaI и XbaI, добавленным на концы последовательности SMN1-GeneBeam с помощью ПЦР.The SMN1-GeneBeam sequence was assembled as described above. Due to the complexity of the sequence, despite its relatively small size, a series of subcloning of gene fragments was carried out in intermediate pGEMT vectors with sequence verification for each vector. Next, the full-length version of the gene was assembled from several intermediate vectors using PCR and cloned into the intermediate vector pGEMT. The pAAV-SMN1-WT construct was used as the final genetic construct, replacing wild-type SMN1 with SMN1-GeneBeam at the ClaI and XbaI sites added to the ends of the SMN1-GeneBeam sequence using PCR.

Конечный вектор содержит все необходимые элементы для экспрессии гена и сборки в составе генома рекомбинантного AAV:The final vector contains all the necessary elements for gene expression and assembly into the recombinant AAV genome:

1) терминальные повторы ITR на концах последовательности, которая инкапсидируется в вирусный капсид;1) terminal ITR repeats at the ends of the sequence that is encapsidated into the viral capsid;

2) элементы для экспрессии целевого гена (промотор, энхансер, интрон, последовательность Kozak, трансген, сайт полиаденилирования);2) elements for expression of the target gene (promoter, enhancer, intron, Kozak sequence, transgene, polyadenylation site);

3) ориджин бактериальной репликации и ген устойчивости к антибиотику для наработки плазмидной ДНК в бактериальных клетках.3) the origin of bacterial replication and the antibiotic resistance gene for the production of plasmid DNA in bacterial cells.

Важно отметить, что генетические конструкции, содержащие гены SMN1-WT и SMNl-GeneBeam, отличаются только последовательностями генов SMN1, а в остальном полностью идентичны.It is important to note that the genetic constructs containing the SMN1-WT and SMNl-GeneBeam genes differ only in the sequences of the SMN1 genes, and are otherwise completely identical.

Пример 3. Проверка экспрессии SMN1 с генетических конструкций.Example 3. Testing SMN1 expression from genetic constructs.

Генетические конструкции pAAV-GFP, pAAV-SMN1-WT и pAAV-SMN1-GB трансфецировали в клетки HEK293 и HSMC как описано выше. Использовали 5 мкг ДНК на 1 лунку. Через 72 ч клетки собрали и проанализировали экспрессию SMN1 (с нормализацией на GAPDH) как описано выше.Gene constructs pAAV-GFP, pAAV-SMN1-WT, and pAAV-SMN1-GB were transfected into HEK293 and HSMC cells as described above. 5 μg of DNA per well was used. After 72 h, cells were harvested and SMN1 expression was analyzed (normalized to GAPDH) as described above.

Было обнаружено, что кодон-оптимизация гена SMN1 влияет на транскрипцию SMN1, достоверно увеличивая количество копий мРНК SMN1-GB в несколько раз по сравнению с SMN1-WT на обеих использованных клеточных линиях (фиг. 1). В частности, для клеток HEK293 отношение нормализованной экспрессии SMN1-GB к SMN1-WT составило 3,9, а для клеток HSMC - 12,8.Codon optimization of the SMN1 gene was found to affect SMN1 transcription, significantly increasing the copy number of SMN1-GB mRNA severalfold compared to SMN1-WT in both cell lines used (Fig. 1). Specifically, for HEK293 cells the ratio of normalized expression of SMN1-GB to SMN1-WT was 3.9, and for HSMC cells it was 12.8.

Данное свойство SMN1-GeneBeam, как показывают полученные данные, не является клеточноспецифичным, при этом обеспечивает увеличение экспрессии целевого гена в клетках в несколько раз, что может быть важным преимуществом при разработке генотерапевтических препаратов. При этом данное свойство не обусловлено никакими отличиями в кассете генной экспрессии и свойствами возможных вирусных капсидов, несущих геном с генов SMN1-GeneBeam, поскольку данный анализ проводили на генетических конструкциях, которые отличаются только кодон-оптимизацией генов SMN1, а в остальном полностью идентичны.This property of SMN1-GeneBeam, as the data obtained shows, is not cell-specific, but provides a several-fold increase in the expression of the target gene in cells, which can be an important advantage in the development of gene therapy drugs. Moreover, this property is not due to any differences in the gene expression cassette and the properties of possible viral capsids carrying the genome from the SMN1-GeneBeam genes, since this analysis was carried out on genetic constructs that differ only in the codon optimization of the SMN1 genes, and are otherwise completely identical.

Клетки HSMC были выбраны для проверки экспрессии SMN1 на уровне белка с помощью проточной цитометрии, как описано выше. Было показано, что сигнал от SMN1-специфичных антител в клетках, трансфецированных pAAV-SMN1-GB, выше, чем в клетках, трансфецированных pAAV-SMN1-WT, в 12,2 раз при использованном количестве ДНК 5 мкг на 1 лунку (фиг. 2). Данный результат означает, что SMN1-GB не имеет преимуществ в трансляции, однако в силу увеличенной транскрипции количество конечного белка в клетках также увеличивается.HSMC cells were selected to examine SMN1 expression at the protein level using flow cytometry as described above. It was shown that the signal from SMN1-specific antibodies in cells transfected with pAAV-SMN1-GB was higher than in cells transfected with pAAV-SMN1-WT by 12.2 times when the amount of DNA used was 5 μg per well (Fig. 2). This result means that SMN1-GB does not have a translational advantage, but due to increased transcription, the amount of the final protein in cells also increases.

- 18 045749- 18 045749

Пример 4. Создание вирусных препаратов, экспрессирующих SMN1.Example 4. Creation of viral preparations expressing SMN1.

Плазмиды pAAV-SMN1-WT и pAAV-SMN1-GB вместе с остальными плазмидами, необходимыми для получения вирусных частиц рекомбинантного AAV (см. выше), были использованы для биопроцесса получения AAV. В качестве серотипа был выбран серотип AAV9 дикого типа или с одной или несколькими точечными мутациями.Plasmids pAAV-SMN1-WT and pAAV-SMN1-GB, along with the remaining plasmids necessary for the production of recombinant AAV viral particles (see above), were used for the bioprocess of producing AAV. The serotype chosen was AAV9 serotype wild type or with one or more point mutations.

Во всех случаях сравнение свойств SMN1 дикого типа и SMN1-GeneBeam проводили только в случае идентичности используемого серотипа и мутаций капсида, если они присутствовали. Все серотипы на базе AAV9, дикого типа или с мутациями, в дальнейшем обозначаются как AAV9 без указания мутаций.In all cases, comparisons between the properties of wild-type SMN1 and SMN1-GeneBeam were made only in the case of identity of the serotype used and capsid mutations, if present. All AAV9-based serotypes, wild type or with mutations, are hereafter referred to as AAV9 without specifying mutations.

В результате биопроцесса были получены рекомбинантные вирусные частицы, обозначенные как AAV9-SMN1-WT и AAV9-SMN1-GB, а также контрольные частицы AAV9-GFP. После определения титров вирусных частиц, все 3 препарата с одинаковыми MOI (значения MOI варьировали между экспериментами от 50 до 200 тысяч) были использованы для трансдукции пермиссивных клеток - первичных миоцитов человека HSMC. Дальнейший анализ проводили только в том случае, если эффективность трансдукции составляла не менее 50%.The bioprocess resulted in recombinant viral particles designated AAV9-SMN1-WT and AAV9-SMN1-GB, as well as control AAV9-GFP particles. After determining the titers of viral particles, all 3 drugs with the same MOI (MOI values varied between experiments from 50 to 200 thousand) were used for transduction of permissive cells - primary human myocytes HSMC. Further analysis was performed only if the transduction efficiency was at least 50%.

После успешной трансдукции клетки снимали с подложки, отмывали в фосфатном буфере и анализировали экспрессию SMN1 на уровне мРНК и белка как описано выше. Было показано, что увеличение транскрипционной активности SMN1-GeneBeam сохраняется, таким образом, мРНК SMN1-GeneBeam было детектировано в 7,3 раз больше, чем для SMN1 дикого типа. Аналогичное увеличение наблюдалось и на уровне белка (в 6,8 раз) (фиг. 3), что показывает отсутствие преимуществ SMN1-GB на уровне трансляции, однако детектируемое увеличение эффективности транскрипции позволяет с помощью препарата AAV9-SMN1-GB обеспечивать более высокий уровень экспрессии SMN1 в целевых клетках, что является важным преимуществом при лечении, например, спинальной мышечной атрофии, где уровень экспрессии белка SMN1 определяет тип заболевания от 0 (эмбриональная леталь) до 4 (не требует специального лечения).After successful transduction, cells were removed from the support, washed in phosphate buffer, and SMN1 expression was analyzed at the mRNA and protein levels as described above. The increase in SMN1-GeneBeam transcriptional activity was shown to be maintained, such that 7.3-fold more SMN1-GeneBeam mRNA was detected than for wild-type SMN1. A similar increase was observed at the protein level (6.8-fold) (Fig. 3), which shows that SMN1-GB does not benefit at the translation level, however, the detectable increase in transcription efficiency allows AAV9-SMN1-GB to provide a higher level of expression SMN1 in target cells, which is an important advantage in the treatment of, for example, spinal muscular atrophy, where the level of SMN1 protein expression determines the type of disease from 0 (fetal lethal) to 4 (does not require special treatment).

Claims

1. A codon-optimized nucleic acid that encodes the SMN1 (survival motor neuron protein) protein of SEQ ID NO: 1, comprising the nucleic acid sequence of SEQ ID NO: 2.

2. An expression cassette that includes a codon-optimized nucleic acid according to claim 1.

3. Expression cassette according to claim 2, including the following elements in the direction from the 5' end to the 3' end:

left (first) ITR (inverted terminal repeats);

CMV (cytomegalovirus) enhancer;

CMV (cytomegalovirus) promoter;

intron of the hBG1 gene (hemoglobin subunit gamma-1 gene);

codon-optimized nucleic acid according to claim 1;

hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal); right (second) ITR.

4. The expression cassette according to claim 3, which includes the nucleic acid with SEQ ID NO: 4.

5. An expression vector that includes a codon-optimized nucleic acid according to claim 1 or a cassette according to claims 2-4.

6. A recombinant virus based on AAV9 (adeno-associated virus serotype 9) to increase the expression of the SMN1 gene in target cells, which includes a capsid and an expression cassette according to any one of claims 2-4.

7. The AAV9-based recombinant virus according to claim 6, wherein the capsid includes the AAV9 VP1 protein.

8. The AAV9-based recombinant virus according to claim 7, wherein the capsid includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5.

9. The AAV9-based recombinant virus of claim 7, wherein the capsid comprises an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 with one or more point mutations.

10. The AAV9-based recombinant virus according to claims 6 to 9, wherein the capsid includes an AAV9 VP1 protein having the amino acid sequence SEQ ID NO: 5 or the amino acid sequence SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the following elements in the direction from the 5' end to the 3' end:

CMV enhancer;

CMV promoter;

hBG1 gene intron;

codon-optimized nucleic acid according to claim 1;

hGH1 polyadenylation signal;

right ITR.

11. A recombinant virus based on AAV9 according to claim 6, where the capsid includes the AAV9 VP1 protein, having

- 19 045749 amino acid sequence SEQ ID NO: 5 or amino acid sequence

SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: 4.

12. Pharmaceutical composition for delivery of the SMN1 gene to target cells, including a recombinant virus based on AAV9 according to claims 6-11 in combination with one or more pharmaceutically acceptable excipients.

13. Use of a recombinant virus based on AAV9 according to claims 6-11 or a composition according to claim 12 for delivering the SMN1 gene to target cells.