WO2021246909A1 - Кодон-оптимизированная нуклеиновая кислота, кодирующая белок smn1 - Google Patents

Кодон-оптимизированная нуклеиновая кислота, кодирующая белок smn1 Download PDF

Info

Publication number
WO2021246909A1
WO2021246909A1 PCT/RU2021/000238 RU2021000238W WO2021246909A1 WO 2021246909 A1 WO2021246909 A1 WO 2021246909A1 RU 2021000238 W RU2021000238 W RU 2021000238W WO 2021246909 A1 WO2021246909 A1 WO 2021246909A1
Authority
WO
WIPO (PCT)
Prior art keywords
aav9
gene
seq
smn1
nucleic acid
Prior art date
Application number
PCT/RU2021/000238
Other languages
English (en)
French (fr)
Inventor
Дмитрий Александрович МАДЕРА
Павел Михайлович ГЕРШОВИЧ
Анна Сергеевна ВЕСЕЛОВА
Татьяна Евгеньевна ШУГАЕВА
Мария Андреевна ЛОМУНОВА
Маргарита Александровна ШКЛЯЕВА
Дмитрий Валентинович МОРОЗОВ
Original Assignee
Общество С Ограниченной Ответственностью "Анабион"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to AU2021282898A priority Critical patent/AU2021282898A1/en
Priority to CN202180058177.5A priority patent/CN116234914A/zh
Priority to US18/000,612 priority patent/US20230212609A1/en
Priority to CR20220619A priority patent/CR20220619A/es
Application filed by Общество С Ограниченной Ответственностью "Анабион" filed Critical Общество С Ограниченной Ответственностью "Анабион"
Priority to MA58655A priority patent/MA58655B1/fr
Priority to IL298772A priority patent/IL298772A/en
Priority to MX2022015231A priority patent/MX2022015231A/es
Priority to JP2022574544A priority patent/JP2023529855A/ja
Priority to EP21817607.1A priority patent/EP4159863A1/en
Priority to CA3181288A priority patent/CA3181288A1/en
Priority to PE2022002846A priority patent/PE20240079A1/es
Priority to BR112022024708A priority patent/BR112022024708A2/pt
Priority to KR1020227046340A priority patent/KR20230019162A/ko
Publication of WO2021246909A1 publication Critical patent/WO2021246909A1/ru
Priority to CONC2022/0017334A priority patent/CO2022017334A2/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4707Muscular dystrophy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Definitions

  • This application relates to the fields of genetics, gene therapy, and molecular biology. More specifically, the present invention relates to an isolated codon-optimized nucleic acid that encodes the SMN1 (motor neuron survival protein) protein, an expression cassette and a vector based on it, as well as a recombinant virus based on AAV9 (serotype 9 adeno-associated virus) to increase the expression of the SMN1 gene in target cells, and their use.
  • SMN1 motor neuron survival protein
  • AAV9 serotype 9 adeno-associated virus
  • SMA Spinal muscular atrophy
  • SMA is an autosomal recessive neuromuscular disorder caused by mutations in the motor neuron survival 1 (SMN1) gene and loss of an SMN encoded protein (Lefebvre et al., Cell (1995) 80: 155-165) ...
  • SMA motor neuron survival 1
  • the absence of SMN leads to degeneration of motor neurons in the ventral (anterior) horn of the spinal cord, leading to weakness of the proximal muscles responsible for crawling, walking, neck movement and swallowing, and the involuntary muscles that control breathing and coughing (Sumner CJ, NeuroRx ( 2006) 3: 235-245).
  • SMA patients are predisposed to pneumonia and other pulmonary problems such as restrictive pulmonary disease.
  • SMA spinal muscular atrophy
  • Adeno-associated viral (AAV) vectors are considered effective for CNS gene therapy because they have a suitable profile of toxicity and immunogenicity, they can be used in nerve cell transduction, and they are able to mediate long-term expression in the CNS.
  • Adeno-associated virus is a small (20 nm), non-self-replicating, non-enveloped virus. Many different AAV serotypes have been described in humans and primates.
  • the genome of an adeno-associated virus contains (+ or -) single-stranded DNA (ssDNA) about 4.7 thousand nucleotides long. At the ends of the genomic DNA molecule are inverted terminal repeats (ITRs).
  • the genome contains two open reading frames (ORF): Rep and Cap, which contain several alternative reading frames encoding various protein products. Rep products are essential for AAV replication, with the Cap gene, among other alternative products, codes for 3 capsid proteins (VP1, VP2 and VP3).
  • Proteins VP1, VP2 and VP3 are in a ratio of 1: 1: 10, forming an icosahedral capsid (Xie Q. et al. The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy. Proc Natl Acad Sci USA, 2002;
  • rAAV recombinant AAV vector
  • the expression cassette flanked by the ITR is packaged into an AAV capsid.
  • the genes required for AAV replication are not included in the cassette.
  • Recombinant AAV is considered the safest and one of the most widely used viral vectors for in vivo gene transfer.
  • Vectors can infect cells from a variety of tissue types, providing potent and sustained transgenic expression. They are also non-pathogenic and have a low immunogenicity profile (High CA et al., "RAAV human trial experience” Methods Mol Biol.
  • TM the ability of different codons (trinucleotides) to encode the same amino acid.
  • Such codons that give the same amino acid during translation are called synonymous.
  • Codon optimization is a technique widely used in the world aimed at increasing the productivity of the production of protein molecules, which consists in the rational matching of each amino acid in the protein sequence to one of the suitable synonymous codons.
  • codon optimization involves the use of the most frequent codons; later, other approaches were proposed, such as harmonization (reproduction of the frequency distribution of the codons used), but they do not always give an increase in productivity.
  • the efficiency of accumulation can be influenced by the GC composition of the sequence (the ratio of the amount of guanines and cytosines to the total length of the sequence), in particular, it was shown that an overestimated GC composition is associated with an increase in the amount of mRNA in mammalian cells Grzegorz Kudla ET AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, Volume 4, Issue 6, el 80, pp. 933-942). It is also worth noting that the stable elements of the secondary structure of mRNA, i.e. having low free energy of folding can reduce efficiency.
  • codon optimization of the sequence of the gene of interest can lead to the following (in comparison with the wild-type gene): a) the level of expression of the genes of interest will be slightly increased; b) the level of expression of genes of interest will be significantly increased; c) the level of expression of genes of interest will remain approximately at the same level; d) the level of expression of genes of interest will be lowered.
  • SMN1-GeneBeam (or abbreviated SMN1-GB)), which has the nucleotide sequence of SEQ ID NO: 2, unexpectedly increases the transcription of the SMN1 gene by more than 3-fold, that is, unexpectedly increases the number of mRNA copies SMN 1 -GeneBeam is more than 3 times compared to SMN1-WT (wild type), which in turn leads to a significant increase in the expression of the SMN1 gene and, accordingly, the SMN protein.
  • the present invention provides an isolated codon-optimized nucleic acid that encodes the SMN1 (motor neuron survival protein) protein of SEQ ID NO: 1 and comprises the nucleic acid sequence SEQ ID NO: 2.
  • SMN1 motor neuron survival protein
  • the present invention relates to an expression cassette that includes the above codon-optimized nucleic acid.
  • the expression cassette includes the following elements from the 5'-end to the 3'-end: left (first) ITR (inverted terminal repeats);
  • CMV cytomegalovirus
  • the expression cassette comprises a nucleic acid sequence of SEQ ID NO: 4.
  • the present invention relates to an expression vector that includes the above codon-optimized nucleic acid or the above cassette.
  • the present invention relates to a recombinant virus based on AAV9 (serotype 9 adeno-associated virus) for increasing expression of the SMN1 gene in target cells, which comprises a capsid and the above expression cassette.
  • AAV9 serotype 9 adeno-associated virus
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein.
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5.
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein having the amino acid sequence SEQ ID NO: 5 with one or more point mutations.
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the following elements in the 5 direction 'end to 3' end:
  • CMV promoter intron of the hBGl gene; the above codon-optimized nucleic acid of the SMN1 gene; hGHl polyadenylation signal; right ITR.
  • the AAV9-based recombinant virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes a nucleic acid SEQ ID NO. : 4.
  • the present invention relates to a pharmaceutical composition for delivering the SMN1 gene to target cells, which comprises the above an AAV9-based recombinant virus in combination with one or more pharmaceutically acceptable excipients.
  • the present invention relates to the use of the aforementioned AAV9-based recombinant virus or the aforementioned composition for delivering the SMN1 gene to target cells.
  • FIG. 1 Expression of SMN1 at the mRNA level after transfection.
  • HEK293 and HSMC cells were transfected with 5 ⁇ g of plasmids pAAV-SMNl-WT and pAAV-SMNl-GB (encoding the SMN1 gene without codon optimization and with codon optimization according to the GeneBeam algorithm).
  • n 3
  • the number of copies of the housekeeping gene GAPDH was also determined. All SMN1 counts obtained were normalized to 10,000 copies of the GAPDH gene in each sample.
  • FIG. 1 Expression of SMN1 at the protein level after transfection.
  • Figure 3 The ratio of expression of SMN1 at the level of mRNA and protein after transduction.
  • HSMC cells were transduced with AAV9-SMN1-WT and AAV9-SMN1-GB viruses in 3 independent experiments, in each of which the transduction efficiency was at least 50% for the control GFP-containing virus.
  • the expression of SMN1 was determined at the level of mRNA and protein (see above), after which the ratio of the expression of SMN1-GB and SMN1-WT was calculated. Mean ratios along with standard deviations are shown in the figure.
  • Dedicated means altered or removed from the natural state.
  • a nucleic acid or peptide naturally present in an animal is not “isolated”, but the same nucleic acid or peptide, partially or completely separated from materials accompanying them in their natural state, is “isolated”.
  • the isolated nucleic acid or protein may exist in substantially purified form, or may exist in a non-natural environment, such as, for example, a genetically modified cell.
  • Naturally occurring “native” or “wild-type” are used to describe an object that can be found in nature as different from artificially obtained.
  • a protein or nucleotide sequence present in an organism that can be isolated from a naturally occurring source and which is not intentionally modified by a person skilled in the art in a laboratory is naturally occurring.
  • genome refers to the complete genetic material of an organism.
  • Protein (Peptide) b As used herein, the terms “peptide”, “polypeptide” and “protein” are used interchangeably and refer to a compound composed of amino acid residues covalently linked by peptide bonds. The protein or peptide must contain at least two amino acids, and there is no limitation on the maximum number of amino acids that the protein or peptide sequence can contain. Polypeptides include any peptide or protein containing two or more amino acids linked to each other by peptide bonds. As used herein, the term also refers to short chains, also commonly referred to in the art, for example, as peptides, oligopeptides and oligomers, and to longer chains, generally referred to in the art as proteins, of which many types exist.
  • Polypeptides include, but are not limited to, for example, biologically active fragments, substantially homologous polypeptides, oligopeptides, homodimers, heterodimers, variant polypeptides, modified polypeptides, derivatives, analogs, fusion proteins. Polypeptides include natural peptides, recombinant peptides, synthetic peptides, or a combination thereof.
  • nucleic acid denotes a clear sequence of nucleotides, modified or not modified defining a fragment or region of nucleic acid, whether or not containing unnatural nucleotides and which is either double-stranded DNA or RNA, or single-stranded DNA or RNA, or transcription products of said DNA.
  • nucleic acids are polynucleotides that can be hydrolyzed to monomeric "nucleotides". Monomeric nucleotides can be hydrolyzed to nucleosides.
  • polynucleotides include, but are not limited to, all nucleic acid sequences obtainable by any means available in the art, including, but not limited to, recombinant methods, i. E. cloning nucleic acid sequences from a recombinant library or the genome of a cell; using conventional cloning technology and PCR, and the like, and synthetic methods.
  • this invention does not relate to nucleotide sequences in their natural chromosomal environment, i.e. in a natural state.
  • the sequences of the present invention have been isolated and / or purified, i. E. were taken directly or indirectly, for example by copying, and their environment was at least partially modified.
  • isolated nucleic acids obtained by genetic recombination, for example, using host cells (host cells), or obtained by chemical synthesis.
  • nucleic acid molecule is a nucleic acid molecule that has been identified and separated from at least one contaminant nucleic acid molecule with which it is ordinarily associated in a natural source of the nuclease nucleic acid.
  • An isolated nucleic acid molecule differs from the form or set in which it naturally occurs. Thus, the isolated nucleic acid molecule differs from the nucleic acid molecule that naturally exists in cells.
  • an isolated nucleic acid molecule includes a nucleic acid molecule found in cells in which the nuclease is normally expressed, for example, if the nucleic acid molecule has a different localization in the chromosome from its localization in cells in natural conditions.
  • nucleotide sequence encompasses its complement, unless otherwise indicated.
  • a nucleic acid having a specific sequence is to be understood as encompassing its complementary strand with its complementary sequence.
  • transfection refers to any method or means by which a nucleic acid is introduced into a cell or host organism, and can be used interchangeably to convey the same meaning. Such methods include, but are not limited to, transfection, electroporation, microinjection, infection, PEG fusion, and the like.
  • Adeno-associated virus (AA V)
  • Viruses of the Parvoviridae family are small DNA viruses in animals.
  • the Parvoviridae family can be divided into two subfamilies: Parvovirinae, which infects vertebrates, and Densovirinae, which infects insects.
  • Parvovirinae which infects vertebrates
  • Densovirinae which infects insects.
  • 11 serotypes of adeno-associated virus have been described (Mori, S. ET AL., 2004, “Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein ", Virology, T. 330 (2):
  • the genomic organization of all known AAV serotypes is very similar.
  • the AAV genome is a linear, single-stranded DNA molecule that is less than about 5000 nucleotides (nt) in length.
  • Inverted terminal repeats (ITRs) flank the unique replication coding sequences of non-structural proteins (Rep) and structural proteins (Cap).
  • the Cap gene encodes the VP proteins (VP1, VP2, and VP3) that form the capsid.
  • the terminal 145 nucleotides are self-complementary and organized in such a way that an energetically stable intramolecular duplex can be formed, forming a T-shaped hairpin structure. These hairpin structures function as the origin of viral DNA replication, being primers for the cellular DNA polymerase complex.
  • Rep genes eg, Rep78 and Rep52
  • P5 promoter and the P19 promoter both Rep proteins have a specific function in viral genome replication.
  • Rep open reading frame results in the expression of virtually four Rep proteins (eg, Rep78, Rep68, Rep52 and Rep40).
  • Rep78 and Rep52 proteins are sufficient for the production of the AAV vector in mammalian cells.
  • vector means a nucleic acid molecule capable of transporting another nucleic acid to which it is linked.
  • infectious unit refers to the number of infectious particles of the recombinant AAV vector as measured by infection center assay, also known as replication center assay, described , for example, McFaughlin et ah, J. Virol. (1988) 62: 1963-1973.
  • heterologous when it refers to nucleic acid sequences, such as coding and regulation sequences, refers to sequences that are not usually linked together and / or are not usually associated with a particular cell.
  • a heterologous region of a nucleic acid or vector construct is a nucleic acid fragment located within or attached to another nucleic acid molecule that is not found in nature with another molecule.
  • a heterologous region of a nucleic acid construct may contain a coding sequence flanked by sequences not found in nature with a coding sequence.
  • Another example of a heterologous coding sequence is a construct where the coding sequence itself is not found in nature (eg, synthetic sequences that contain codons other than the native gene).
  • expression is defined as the transcription and / or translation of a particular nucleotide sequence triggered by its promoter.
  • Gene therapy is the insertion of genes into cells and / or tissues of a subject to treat a disease, usually inherited diseases, with a defective mutant allele replaced or supplemented with a functional allele.
  • Treatment refers to a method of alleviating or eliminating a biological disorder and / or at least one of its attendant symptoms.
  • alleviate means reducing the severity and / or frequency of the symptoms of a disease, disorder, or condition.
  • references herein to “treatment” include references to curative, palliative and prophylactic therapy.
  • the subject of treatment or patient is a mammal, preferably a human subject.
  • the above subject can be male or female of any age.
  • disorder means any condition that can be improved as a result of the treatment of the present invention.
  • the definition of this term includes chronic and acute disorders or diseases, including pathological conditions that predispose the mammal to the disorder.
  • Disease is a state of animal health where the animal is unable to maintain homeostasis and where, if the disease is not alleviated, the animal's health continues to deteriorate.
  • subject refers to any animal amenable to the methods described herein.
  • patient refers to any animal amenable to the methods described herein.
  • patient refers to any animal amenable to the methods described herein.
  • patient refers to any animal amenable to the methods described herein.
  • patient refers to any animal amenable to the methods described herein.
  • patient refers to any animal amenable to the methods described herein.
  • patient refers to any animal amenable to the methods described herein.
  • individual is a human.
  • a “therapeutically effective amount” is defined as the amount of a therapeutic agent administered during treatment that will relieve to some extent one or more symptoms of the disease being treated.
  • the present invention provides an isolated codon-optimized nucleic acid that encodes the SMN1 (motor neuron survival protein) protein of SEQ ID NO: 1 and comprises the nucleic acid sequence SEQ ID NO: 2.
  • SMN1 motor neuron survival protein
  • SMN1 codon-optimized gene SMN1 was taken as a basis for the corresponding amino acid sequence of protein SMN HUMAN: MAMSSGGSGGGVPEQEDSVLFRRGTGQSDDSDIWDDTALIKAYDKAVASFKHALKNG DICETSGKPKTTPKRKPAKKNKSQKKNTAASLQQWKVGDKCSAIWSEDGCIYPATIASI DFKRETCVVVYTGYGNREEQNLSDLLSPICEVANNIEQNAQENENESQVSTDESENSRSP GNKSDNIKPKSAPWNSFLPPPPPMPGPRLGPGKPGLKFNGPPPPPPPPPPHLLSCWLPPFPS GPPIIPPPPPICPDSLDDADALGSMLISWYMSGYHTGYYMGFRQNQKEGRCSHSLN (SEQ ID NO: 1)
  • This amino acid sequence SEQ ID NO: 1 was translated into the nucleotide sequence by sequentially matching each amino acid starting from the N-terminus of one of the synonymous codons encoding it.
  • the details of the codon-optimized SMN1 gene and the selection of the final sequence are described in Example 1.
  • the final codon-optimized SMN1 sequence (SMNl-GeneBeam) has the following nucleotide sequence:
  • This final codon-optimized SMN1 nucleotide sequence (SMN1-GeneBeam) is characterized by an increased codon adaptation index (a standard metric for evaluating sequence for codon frequencies used) compared to the wild-type SMN gene coding sequence (SMN1-WT):
  • the codon adaptation index for the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) of our sequence is 98%, for the wild-type sequence - 75%.
  • the GC composition of the wild-type sequence is 45%, that is, it differs from the target value by 15%; the GC composition of the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) of the optimized sequence is 64%, i.e. differs from the target value by 4%.
  • the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) and the nucleotide sequence of the wild-type SMN1 gene (SEQ ID NO: 3) The sequences are 71% identical.
  • Expression cassette Expression vector.
  • the present invention relates to an expression cassette that includes the above codon-optimized nucleic acid.
  • expression cassette refers to a DNA fragment that is capable, in an appropriate setting, of triggering the expression of a polynucleotide encoding a polypeptide of interest that is included in said expression cassette.
  • the expression cassette When introduced into a host cell, the expression cassette is, inter alia, capable of using cellular mechanisms to transcribe a polynucleotide encoding a polypeptide of interest into RNA, which is then typically further processed and finally translated into a polypeptide of interest.
  • An expression cassette can be contained in an expression vector.
  • the expression cassette of the present invention contains a promoter as an element.
  • promoter as used herein specifically refers to a DNA element that facilitates the transcription of a polynucleotide to which a promoter is operably linked.
  • a promoter can also form part of a promoter / enhancer element.
  • promoter usually refers to the site on a nucleic acid molecule to which RNA polymerase binds and / or is associated with it. factors, and from which transcription is initiated. Enhancers increase promoter activity over time as well as spatially.
  • promoters are known in the art that are transcriptionally active in a wide range of cell types.
  • Promoters can be divided into two classes: those that function constitutively, and those that are regulated by induction or release of repression. Both classes are suitable for protein expression. Promoters that are used to produce high levels of polypeptides in eukaryotic cells, and in particular mammalian cells, must be strong and, preferably, must be active over a wide range of cell types. Strong constitutive promoters that are capable of driving expression in many cell types are well known in the art and therefore need not be described in detail herein. In accordance with the teachings of the present invention, it is preferable to use a cytomegalovirus (CMV) promoter.
  • CMV cytomegalovirus
  • a promoter or promoter / enhancer derived from the immediate early (IE) region of human cytomegalovirus (hCMV) is particularly suitable as a promoter in an expression cassette of the present invention.
  • the immediate early (IE) region of human cytomegalovirus (hCMV) and functional expression trigger fragments and / or functional expression enhancing fragments derived therefrom are, for example, described in EP0173177 and EP0323997, and are also well known in the art.
  • several fragments of the immediate early (IE) region of hCMV can be used as a promoter and / or promoter / enhancer.
  • the promoter can be used as a promoter and / or promoter / enhancer. According to one embodiment of the invention, the promoter
  • Human CMV is used in the expression cassette of the present invention.
  • the expression cassette includes the following elements from the 5'-end to the 3'-end: left (first) ITR (inverted terminal repeats);
  • CMV cytomegalovirus
  • CMV cytomegalovirus
  • hBGl gene intron hemoglobin gamma-1 subunit gene
  • hGHl polyadenylation signal human growth hormone gene polyadenylation signal
  • right (second) ITR right (second) ITR.
  • the left (first) ITR (Inverted Terminal Repeats) has the following nucleic acid sequence: Cctgcaggcagctgcgcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcct (SEQ ID NO: 8).
  • the CMV (cytomegalovirus) enhancer has the following nucleic acid sequence: cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaac gCcaatagggactttccattgacgtcaatgggtggagtattttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtac gcccctattgacgtcaatgacggtaaatggcccgctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctattaccatg (SEQ ID NO: 9).
  • the CMV (cytomegalovirus) promoter has the following nucleic acid sequence: gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagt ttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgcccattgacgcaaatgggcggtaggcgtgtacggtggga ggtctatataagcagagct (SEQ ID NO: 10).
  • an intron gene hBGl (gamma hemoglobin subunit gene 1) has the following nucleic acid sequence: cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaa aaatgctttcttctttttttaatatactttttttgttttatctttctaatactttccctaatctcttttttcagggcaataatgatacaatgtatcatgcctcttttttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtttcat
  • the hGHl polyadenylation signal (human growth hormone gene polyadenylation signal) has the following nucleic acid sequence:
  • the right (second) ITR has the following nucleic acid sequence: aggaacccctagtgatggagttggccactccctctgcgcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccg ggctttgcccgggcggcctcagtgaggcgctg
  • the expression cassette has the following nucleic acid sequence: cctgcaggcaggcagctgcgcgcgctcgctcgctcactgaggccgcccgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtctagt
  • the present invention relates to an expression vector that includes the above codon-optimized nucleic acid or the above expression cassette.
  • the vector is a plasmid, i. E. a circular double-stranded portion of DNA into which additional DNA segments can be ligated.
  • the vector is a viral vector in which additional DNA segments can be ligated into the viral genome.
  • vectors are capable of autonomous replication in the host cell into which they are introduced (eg, bacterial vectors having a bacterial origin of replication and episomal mammalian vectors).
  • vectors eg, non-episomal mammalian vectors
  • vectors can be integrated into the genome of a host cell upon introduction into a host cell, and thus replicate with the host genome.
  • some vectors are capable of directing the expression of genes to which they are operably linked. Such vectors are referred to herein as “recombinant expression vectors” (or simply “expression vectors" (“expression vector” or “expression vector”)).
  • Expression vectors include plasmids, retroviruses, adenoviruses, adeno-associated viruses (AAVs), plant viruses such as cauliflower mosaic virus, tobacco mosaic viruses, cosmids, YACs, EBV derived episomes, and the like.
  • DNA molecules can be ligated into a vector such that the sequences that control transcription and translation in the vector perform their intended function of regulating DNA transcription and translation.
  • the expression vector and expression control sequences can be selected to be compatible with the expression host cell used.
  • DNA molecules can be introduced into the expression vector by standard methods (eg, ligation of complementary restriction sites or blunt-end ligation if restriction sites are absent).
  • the recombinant expression vector can also encode a signal peptide that facilitates the production of the protein of interest by the host cell.
  • the gene for the protein of interest can be cloned into a vector such that the signal peptide is linked to the amino terminus of the protein of interest.
  • the signal peptide can be an immunoglobulin signal peptide or a heterologous signal peptide (ie, a signal peptide of a non-immunoglobulin protein).
  • the recombinant expression of the vectors of this invention may carry regulatory sequences that control the expression of the SMN 1 -GB gene in a host cell.
  • regulatory sequences that control the expression of the SMN 1 -GB gene in a host cell.
  • Preferred regulatory sequences for a mammalian host cell expression include viral elements for high expression of proteins in mammalian cells, such as promoters and / or enhancers derived from retroviral LTR, cytomegalovirus (CMV) (e.g., CMV promoter / enhancer), simian virus 40 (SV40) (e.g. SV40 promoter / enhancer), adenovirus (e.g., adenovirus large late promoter (AdMLP)), polyoma virus, and strong mammalian promoters such as the native immunoglobulin promoter or actin promoter.
  • CMV cytomegalovirus
  • SV40 simian virus 40
  • AdMLP adenovirus large late promoter
  • AdMLP adenovirus large late promoter
  • strong mammalian promoters such as the native immunoglobulin promoter or actin promoter.
  • control sequences refers to DNA sequences necessary for the expression of an operably linked coding sequence in a particular host organism.
  • Suitable prokaryotic control sequences are, for example, a promoter, optionally an operator, and a ribosome binding site. It is known that promoters, polyadenylation signals, and enhancers are present in eukaryotic cells.
  • promoter or “regulatory transcription sequence” or “regulatory sequence” refers to a nucleic acid fragment that controls the transcription of one or more coding sequences, and which is located upstream of the reading direction of the information relative to the direction of transcription from the transcription initiation site of the coding sequence , as well as which is structurally identified by the presence of a binding site for DNA-dependent RNA polymerase, transcription initiation sites and other DNA sequences, including, without restrictions, transcription factor binding sites, protein repressor and activator binding sites, and any other nucleotide sequences known to those skilled in the art that directly or indirectly regulate the level of transcription with a given promoter.
  • a “constitutive” promoter is one that is active in most tissues under normal physiological and developmental conditions.
  • An “inducible” promoter is a promoter that undergoes physiological or developmental regulation, for example, when exposed to a chemical inducer.
  • a “tissue-specific” promoter is active only in specific types of tissues or cells.
  • enhancers can refer to a DNA sequence that is located adjacent to a DNA sequence encoding a recombinant product.
  • the enhancer elements are usually located 5 'from the promoter element, or may be located below or within the coding DNA sequence (eg, DNA sequence transcribed or translated into a recombinant product or products).
  • the enhancer element can be located 100 bp, 200 bp, or 300 or more bp before or after the DNA sequence that encodes the recombinant product.
  • Enhancer elements can increase the amount of expressed recombinant product from the DNA sequence, exceeding the expression due to a single promoter element. A variety of enhancer elements are available to those skilled in the art.
  • the recombinant expression vectors of the invention may carry additional sequences, such as sequences that regulate the replication of the vector in host cells (eg, origin of replication) and selectable marker genes.
  • the selectable marker gene facilitates the selection of host cells into which the vector has been introduced (see, for example, US patents 4,399,216, 4,634,665 and 5,179,017).
  • typically a selectable marker gene confers resistance to drugs such as G418, hygromycin, or methotrexate to the host cell into which the vector has been introduced.
  • selectable marker genes include a dihydrofolate reductase (DHFR) gene (for use in dhfr host cells for methotrexate selection / amplification), a neo gene (for G418 selection), and a glutamate synthetase gene.
  • DHFR dihydrofolate reductase
  • neo for G418 selection
  • glutamate synthetase gene glutamate synthetase gene
  • expression control sequence means polynucleotide sequences that are necessary for affecting the expression and processing of the coding sequences to which they are ligated.
  • Expression control sequences include the corresponding transcription initiation, termination, promoter and enhancer sequences; efficient RNA processing signals such as splicing and polyadenylation signals; sequences that stabilize cytoplasmic mRNA; sequences that enhance translation efficiency (i.e., Kozak consensus sequence); sequences that increase protein stability; and, if desired, sequences that enhance protein secretion.
  • control sequences differs depending on the host organism; in prokaryotes, such control sequences typically include a promoter, a ribosome binding site, and transcription termination sequences; in eukaryotes, such control sequences generally include promoters and transcription termination sequences.
  • control sequences includes at least all components that are essential for expression and processing, and may also include additional components whose presence is useful, such as leader sequences and fusion cell sequences.
  • operably linked refers to the linking of polynucleotide (or polypeptide) elements into a functional link.
  • a nucleic acid is “operably linked” when it is in a functional relationship with another nucleic acid sequence.
  • a transcriptional regulatory sequence is operably linked to a coding sequence if it affects the transcription of said coding sequence.
  • operably linked means that the linked DNA sequences are generally contiguous and, if necessary, the joins of the two protein-coding regions are also contiguous and in frame.
  • expression vector refers to a vector containing one or more polynucleotide sequences of interest, genes of interest, or “transgenes” that are flanked by parvovirus or inverted terminal repeat sequences (ITRs).
  • cassette nor the vector according to the invention contains the nucleotide sequences of the genes encoding the non-structural proteins (Rep) and structural proteins (Cap) of the adeno-associated virus.
  • Recombinant virus based on AA V9 (serotype 9 adeno-associated virus)
  • the present invention relates to a recombinant virus based on AAV9 (serotype 9 adeno-associated virus) for increasing the expression of the SMN1 gene in target cells, which includes a capsid and the above expression cassette.
  • AAV9 serotype 9 adeno-associated virus
  • recombinant virus based on AAV refers to the above expression cassette (or the above expression vector), which is enclosed within the AAV capsid.
  • the Cap gene encodes 3 capsid proteins (VP1, VP2 and VP3). Proteins VP1, VP2 and VP3 are in a ratio of 1: 1: 10, forming an icosahedral capsid (Xie Q. et al. The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy. Proc Natl Acad Sci USA, 2002; 99: 10405-10410). Transcription of these genes begins with a single promoter, p40. The molecular weights of the corresponding proteins (VP1, VP2 and VP3) are 87, 72 and 62 kDa, respectively. All three proteins are translated from the same mRNA. After transcription, the pre-mRNA can be spliced in two different ways, cutting out a longer or shorter intron and producing mRNAs of different nucleotide lengths.
  • an expression cassette flanked by an ITR is packaged in an AAV capsid.
  • ITR ITR
  • the expression cassette DNA is packaged in a viral capsid in the form of a single-stranded DNA molecule (ssDNA) approximately 3000 nucleotides in length. After a cell is infected with a virus, the single-stranded DNA is converted into double-stranded DNA (dsDNA). Only dsDNA can use cell proteins that transcribe the contained gene or genes into RNA.
  • ssDNA single-stranded DNA molecule
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein.
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein having the following amino acid sequence
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein having the amino acid sequence SEQ ID NO: 5 with one or more point mutations.
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP2 protein.
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP2 protein having the following amino acid sequence:
  • PRPIGTRYLTRNL (SEQ ID NO: 6).
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP2 protein having the amino acid sequence SEQ ID NO: 6 with one or more point mutations.
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP3 protein. In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP3 protein having the following amino acid sequence
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP3 protein having the amino acid sequence SEQ ID NO: 7 with one or more point mutations.
  • the AAV9-based recombinant virus has a capsid that includes the VP1, VP2, and VP3 proteins of AAV9.
  • the AAV9-based recombinant virus has a capsid that includes VP1 proteins with the amino acid sequence SEQ ID NO: 5, VP2 with the amino acid sequence SEQ ID NO: 6, and VP3 with the amino acid sequence SEQ ID NO: 7.
  • the AAV9-based recombinant virus has a capsid that comprises VP1 proteins with the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, VP2 with the amino acid sequence of SEQ ID NO: 6 with one or more point mutations, and VP3 with the amino acid sequence SEQ ID NO: 7 with one or more point mutations.
  • multiple point mutations is meant two, three, four, five, six, seven, eight, nine, or ten point substitutions.
  • amino acids are generally divided into four families: (1) acidic — aspartate and glutamate; (2) basic - lysine, arginine, histidine; (3) non-polar - alanine, valine, leucine, isoleucine, proline, phenylalanine, methionine, tryptophan; and (4) uncharged polar - glycine, asparagine, glutamine, cysteine, serine, threonine, tyrosine.
  • Phenylalanine, tryptophan, and tyrosine are sometimes classified as aromatic amino acids.
  • the prediction that an isolated substitution of leucine for isoleucine or valine, aspartate for glutamate, threonine for serine, or a similar conservative substitution of an amino acid for a structurally related amino acid will not have an important effect on biological activity is well-founded.
  • a polypeptide of interest can include up to about 5-10 conservative or non-conservative amino acid substitutions, provided that the desired function of the molecule is not affected.
  • Amino acid substitution point mutations in the VP1, VP2, or VP3 AAV9 protein sequences are substitutions of at least one amino acid residue in the AAV9 VP1, VP2, or VP3 protein with a different amino acid residue.
  • the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the following elements in the 5 direction '-end to Z'-end:
  • CMV promoter intron of the hBGl gene; the above codon-optimized nucleic acid of the SMN 1 gene; hGH 1 polyadenylation signal; right ITR.
  • the AAV9-based recombinant virus has a capsid that includes the VP1 proteins with the amino acid sequence of SEQ ID NO: 5, VP2 with the amino acid sequence of SEQ ID NO: 6, and VP3 with the amino acid sequence of SEQ ID NO: 7, and the expression cassette includes the following elements in the direction from the 5'-end to the 3'-end:
  • the AAV9-based recombinant virus has a capsid that comprises VP1 proteins with the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, VP2 with the amino acid sequence of SEQ ID NO: 6 with one or more point mutations, and VP3 with the amino acid sequence SEQ ID NO: 7 with one or more point mutations and the expression cassette comprises the following elements from the 5 'end to the 3' end:
  • CMV promoter intron of the hBGl gene; the above codon-optimized nucleic acid of the SMN1 gene; hGHl polyadenylation signal; right ITR.
  • the AAV9-based recombinant virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes a nucleic acid SEQ ID NO. : 4.
  • the AAV9-based recombinant virus has a capsid that includes proteins VP1 with the amino acid sequence of SEQ ID NO: 5, VP2 with the amino acid sequence of SEQ ID NO: 6, and VP3 with the amino acid sequence of SEQ ID NO: 7, and the expression cassette comprises nucleic acid with SEQ ID NO: 4.
  • the AAV9-based recombinant virus has a capsid that comprises VP1 proteins with the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, VP2 with the amino acid sequence of SEQ ID NO: 6 with one or more point mutations, and VP3 with the amino acid sequence SEQ ID NO: 7 with one or more point mutations, and the expression cassette comprises the nucleic acid of SEQ ID NO: 4.
  • the present invention relates to a pharmaceutical composition for delivering the SMN1 gene to target cells, which comprises the above an AAV9-based recombinant virus in combination with one or more pharmaceutically acceptable excipients.
  • the present invention provides a pharmaceutical composition
  • a pharmaceutical composition comprising a recombinant AAV9-based virus of the invention in a pharmaceutically acceptable carrier or other pharmaceutical agents, adjuvants, diluents, etc.
  • the injection vehicle is usually liquid.
  • the carrier for other routes of administration can be either solid or liquid, such as sterile pyrogen-free water or sterile pyrogen-free phosphate buffered saline.
  • the carrier is respirable and is preferably in solid or liquid particulate form.
  • water containing additives conventional for injection solutions such as stabilizing agents, salts or saline solutions and / or buffers.
  • “Pharmaceutical composition” means a composition comprising the aforementioned recombinant virus based on AAV9 according to the invention and at least one of the components selected from the group consisting of pharmaceutically acceptable and pharmacologically compatible excipients such as fillers, solvents, diluents, carriers , auxiliary, distribution, delivery vehicles, preservatives, stabilizers, emulsifiers, suspending agents, thickeners, regulators of prolonged delivery, the choice and ratio of which depends on the nature and method of administration and dosage.
  • the pharmaceutical compositions of the present invention and methods of making them will be readily apparent to those skilled in the art.
  • the manufacture of pharmaceutical compositions should preferably be in accordance with GMP (Good Manufacturing Practice) requirements.
  • the composition may include a buffering composition, tonic agents, stabilizers, and solubilizers.
  • “Pharmaceutically acceptable” is a material that has no biological or other contraindications, for example, the material can be administered to a subject without any undesirable biological effects.
  • such pharmaceutical compositions can be used, for example, to transfect a cell ex vivo or to administer in vivo a recombinant AAV9 virus of the invention directly to a subject.
  • excipient or “excipient” is used herein to describe any component other than those previously described in this invention. These are substances of inorganic or organic origin, used in the production process, manufacture of drugs to give them the necessary physical and chemical properties.
  • stabilizer is meant an excipient or a mixture of two or more excipients that provide the physical and / or chemical stability of the active agent.
  • buffer means a solution that is able to maintain the pH value due to the interaction of acid and alkaline components that make up its composition, which enables the vector preparation based on rAAV5 to exhibit resistance to pH changes.
  • the pH values of the pharmaceutical composition are preferably between 4.0 and 8.0.
  • buffering agents for example, acetate, phosphate, nitrate, histidine, succinate and the like can be used. buffer solutions, but not limited to them.
  • a pharmaceutical composition is "stable" if the active agent maintains its physical stability and / or chemical stability and / or biological activity during the stated shelf life at a storage temperature, for example, at 2-8 ° C. It is preferred that the active agent retains both physical and chemical stability as well as biological activity.
  • the storage period is selected based on the results of stability studies with accelerated and natural storage.
  • the pharmaceutical composition of this invention can be manufactured, packaged or marketed in a single unit dose or a plurality of unit dose units in a finished dosage form.
  • unit dosage means a discrete amount of a pharmaceutical composition containing a predetermined amount of an active ingredient.
  • the amount of active ingredient is usually equal to the dosage of the active ingredient to be administered to the subject, or a convenient portion of such dosage, for example, half or a third of such dosage.
  • the present invention relates to the use of the aforementioned AAV9-based recombinant virus or the aforementioned composition for delivering the SMN 1 gene to target cells.
  • Any method of administering an AAV9-based recombinant virus adopted in the art can be suitably used for the aforementioned AAV9-based recombinant virus of the present invention.
  • the recombinant AAV9 virus is preferably introduced into the cell in a biologically effective amount.
  • a “biologically effective" amount of a recombinant virus is an amount that is sufficient to cause infection (or transduction) and expression of the heterologous nucleic acid sequence in a cell.
  • a "biologically effective" amount of the viral vector is an amount sufficient to induce transduction and expression of the heterologous nucleic acid sequence in the target cell.
  • a cell for administering the aforementioned recombinant AAV9-based virus of the invention can be any type of cell, including, but not limited to, nerve cells (including cells of the peripheral and central nervous system, in particular, brain cells), lung cells, epithelial cells (for example , epithelial cells of the intestine and respiratory tract), muscle cells, pancreatic cells (including islet cells), liver cells, myocardial cells, bone cells (for example, bone marrow stem cells), hematopoietic stem cells, spleen cells, keratinocytes, fibroblasts , endothelial cells, prostate cells, germ cells, and the like.
  • nerve cells including cells of the peripheral and central nervous system, in particular, brain cells
  • lung cells epithelial cells (for example , epithelial cells of the intestine and respiratory tract), muscle cells, pancreatic cells (including islet cells), liver cells, myocardial cells, bone cells (for example, bone marrow stem cells), hematopoietic stem
  • the cell for administering the aforementioned recombinant AAV9 virus can be any progenitor cell.
  • the cells can be stem cells (eg, neural stem cells, liver stem cells).
  • cells can be of any species as indicated above.
  • the above AAV9-based recombinant virus is not used to modify the genetic integrity of human germline cells.
  • the required gene segments were obtained from oligonucleotides created by chemical synthesis. Gene segments from 300 to 1000 bp in length, which are flanked by unique restriction sites, were assembled by renaturation of oligonucleotides on top of each other, followed by PCR amplification from the outermost primers. As a result, a mixture of fragments was obtained, including the desired one. The fragments were cloned at restriction sites in intermediate vectors, after which the DNA sequences of the subcloned fragments were confirmed by DNA sequencing.
  • DNA sequences were determined by Sanger sequencing. DNA and protein sequence analysis and sequence data processing were performed using SnapGene 4.2 and higher software to create, map, analyze, annotate and illustrate sequences. Cultivation of cell cultures
  • the cell lines HEK293 (Human Embryonic Kidney clone 293) and HSMC (Human Skeletal Muscle Cells) were used in the experiments.
  • the cells were cultured under standard conditions at 37 ° C and 5% CO2, in complete DMEM medium supplemented with 10% FBS and an antibiotic.
  • the culture plastic was precoated with collagen (Gibco).
  • Cells were subcultured when 80-90% confluence was reached. Cell viability was assessed using Trypan Blue staining and a Goryaev chamber, or using PI staining and flow cytometry.
  • SMN1 at the mRNA level was checked by quantitative PCR. Briefly, primers and probe specific for wild-type or GeneBeam SMN1 sequence were used. To control the amount of initial RNA, primers and a probe specific to the housekeeping gene GAPDH were used. For each set of primers and probes, calibration curves were constructed using a known copy number of the linearized plasmid DNA containing the amplified sequence of the corresponding gene. Expression analysis was performed by determining the number of copies of SMN1 -GeneBeam, SMN1-WT, and GAPDH in each sample from the calibration curves, after which the number of copies of SMN1 was normalized to 10,000 copies. GAPDH. The obtained values were compared with each other for different samples within the same experiment.
  • SMN1 protein content in cells was performed by intracellular staining, followed by analysis by flow cytometry. Briefly, cells were removed from culture plates with TrypLE, washed in PBS, fixed in 4% paraformaldehyde solution, permeabilized with 0.5% Triton X-100 in PBS, incubated in blocking buffer with 1-5% BSA, and stained in two steps. using primary antibodies to SMN1 and secondary antibodies labeled with Alexa Fluor 488. After staining, cells were washed once in PBS and analyzed on a flow cytometer. The average signal intensity minus the signal stained with secondary antibodies without the addition of primary antibodies was evaluated.
  • Plasmid containing the AAV gene with a transgene expression cassette SNM1 or
  • the titer of viral particles was determined by quantitative PCR with primers and a probe specific to a region of the recombinant viral genome and expressed as the number of copies of viral genomes per ml.
  • the efficiency of transduction was calculated by analyzing the percentage of GFP + cells.
  • the ratio of the number of viral particles to cells is called multiplicity of infection (MOI).
  • MOI of the AAV9-GFP virus varied from 50,000 to 1,000,000.
  • MOI ranges were determined for each line, within which the transduction efficiency varied linearly with the MOI. Further work with the transduction of cell lines was carried out in their linear ranges.
  • Example 1 A method of obtaining a codon -optimized gene SMN1
  • the corresponding amino acid sequence of the SMN_HUMAN protein (SEQ ID NO: 1) was taken as a basis.
  • This amino acid sequence SEQ ID NO: 1 was translated into the nucleotide sequence by sequentially matching each amino acid starting from the N-end of one of the synonymous codons encoding it, taking into account one or a combination of the following features:
  • the target GC-composition was considered 60% based on the article Grzegorz Kudla ET AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, PLoS Biol, June 2006, Volume 4, Issue 6, el 80, doi: 10.1371 / ioumal.pbio.0040180.therefore, the codon was the more preferable, the smaller the difference between the current GC composition and the target was obtained);
  • the construction process also avoided the generation of sense nucleotide sequences, such as restriction sites, internal ribosome entry sites, splicing sites, etc.
  • codon-optimized nucleotide sequences of the SMN1 gene showed an increase in the transcription of the SMN1 gene by 1.5-2 times in further studies, that is, significantly increasing the number of copies of SMNl-opt mRNA compared to SMN1-WT in all used cell lines.
  • SMN1-GB codon-optimized nucleotide sequences of the SMN1 gene unexpectedly showed an increase in transcription of the SMN1 gene by more than 3 times in further studies, that is, an unexpected increase in the number of copies of SMNl-opt mRNA by more than 3 times compared to SMN1-WT in all used cell lines (see Examples 3-4).
  • This final codon-optimized nucleotide sequence of the SMN1 gene received the code name SMN 1 -GeneBeam (or abbreviated as SMN1-GB).
  • the final codon optimized SMN1 sequence (SMN1 -GeneBeam) has the nucleotide sequence shown as SEQ ID NO: 2.
  • This final codon-optimized SMN1 nucleotide sequence (SMN1-GeneBeam) is characterized by an increased codon adaptation index (Paul M. Sharp ET AL., The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications, Nucleic Acids Research, Volume 15, Issue 3, 11 February 1987, Pages 1281-1295, doi: 10.1093 / nar / 15.3.1281 - a standard metric for evaluating the sequence for codon frequencies used) compared to the coding sequence of the wild-type SMN gene (SMN1-WT with SEQ ID NO: 3).
  • the codon adaptation index for the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) is 98%, for the wild-type sequence - 75%.
  • the GC composition of the wild-type sequence is 45%, that is, it differs from the target value by 15%; the GC composition of the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) is 64%, i.e. differs from the target value by 4%.
  • the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) and the nucleotide sequence of the wild-type SMN1 gene (SEQ ID NO: 3) are 71% identical.
  • Example 2 Assembly of genetic constructs carrying the recombinant AAV genome and encoding the SMN1 gene.
  • the wild-type SMN1 gene sequence was obtained by amplification with specific primers from cDNA synthesized from the total RNA of HEK293 cells. During the amplification, the Kozak sequence and the Clal restriction site were added from the 5'-end of the gene, and the Xbal restriction site from the 3'-end. Thereafter, the SMN1 gene sequence was cloned by the restriction enzyme ligase method at the Clal and Xbal sites into the commercial pAAV-GFP Control plasmid (VPK-402) construct from CellBiolab (USA), with the GFP gene replaced with SMN1, resulting in the pAAV-SMNl-WT construct.
  • VPK-402 commercial pAAV-GFP Control plasmid
  • the SMNl-GeneBeam sequence was assembled as described above. Due to the complexity of the sequence, despite its relatively small size, we performed a series of subcloning of gene fragments in intermediate pGEMT vectors with verification of the sequences for each vector. Then, a full-length version of the gene was assembled from several intermediate vectors using PCR and cloned into the intermediate vector pGEMT. The pAAV-SMNl-WT construct was used as the final genetic construct, replacing wild-type SMN1 with SMNl-GeneBeam at the Clal and Xbal sites added to the ends of the SMNl-GeneBeam sequence by PCR.
  • the final vector contains all the necessary elements for gene expression and assembly within the genome of the recombinant AAV:
  • pAAV-GFP pAAV-SMNl-WT
  • pAAV-SMNl-GB were transfected into HEK293 and HSMC cells as described above. Used 5 ⁇ g DNA per well. After 72 hours, cells were harvested and analyzed for SMN1 expression (normalized to GAPDH) as described above.
  • codon-optimization of the SMN1 gene affects the transcription of SMN1, significantly increasing the copy number of SMN1-GB mRNA by several times compared to SMN1-WT in both cell lines used (Fig. 1).
  • the ratio of normalized expression of SMN1-GB to SMN1-WT was 3.9, and for HSMC cells - 12.8.
  • This property of SMN 1 -GeneBeam, as the obtained data show, is not cell-specific, while it provides several times increase in the expression of the target gene in cells, which can be an important advantage in the development of gene therapy drugs. Moreover, this property is not due to any differences in the gene expression cassette and the properties of possible viral capsids carrying the gene from the SMNl-GeneBeam genes, since this analysis was carried out on genetic constructs that differ only in codon optimization of the SMN1 genes, and are otherwise completely identical.
  • HSMC cells were selected to test for SMN1 expression at the protein level by flow cytometry as described above. It was shown that the signal from SMN1-specific antibodies in cells transfected with pAAV-SMNl-GB is 12.2 times higher than in cells transfected with pAAV-SMNl-WT when the amount of DNA used is 5 ⁇ g per 1 well (Fig. 2). This result means that SMN1-GB has no advantages in translation, however, due to increased transcription, the amount of the final protein in cells also increases.
  • the serotype was selected as the serotype
  • AAV9 is wild type or with one or more point mutations.
  • all 3 preparations with the same MOI MOI values varied between experiments from 50 to 200 thousand were used for transduction of permissive cells - primary human myocytes HSMC. Further analysis was performed only if the transduction efficiency was at least 50%.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Neurology (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Neurosurgery (AREA)
  • Epidemiology (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Настоящая заявка относится к области генетики, генной терапии и молекулярной биологии. Более конкретно, настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных (двигательных) нейронов), экспрессионной кассете и вектору на ее основе, а также к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, и их применению.

Description

КОДОН-ОПТИМИЗИРОВАННАЯ НУКЛЕИНОВАЯ КИСЛОТА, КОДИРУЮЩАЯ БЕЛОК SMN1
ОБЛАСТЬ ТЕХНИКИ
Настоящая заявка относится к области генетики, генной терапии и молекулярной биологии. Более конкретно, настоящее изобретение относится к выделенной кодон- оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных (двигательных) нейронов), экспрессионной кассете и вектору на ее основе, а также к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, и их применению.
УРОВЕНЬ ТЕХНИКИ
Спинальная мышечная атрофия (SMA) представляет собой аутосомное рецессивное нервно-мышечное нарушение, вызванное мутациями в гене выживаемости моторных (двигательных) нейронов 1 (SMN1) и утратой кодируемого SMN белка (Lefebvre et al., Cell (1995) 80:155-165). Отсутствие SMN ведет к дегенерации двигательных нейронов в брюшном (переднем) роге спинного мозга, что ведет к слабости проксимальных мышц, отвечающих за ползание, ходьбу, движение шеи и глотание, и непроизвольно сокращающихся мышц, которые управляют дыханием и кашлем (Sumner C.J., NeuroRx (2006) 3:235-245). Таким образом, пациенты с SMA предрасположены к пневмониям и другим пульмональным проблемам, таким как рестриктивное легочное заболевание.
Генная терапия представляет собой перспективный способ лечения спинальной мышечной атрофии (SMA).
Аденоассоциированные вирусные (AAV) векторы считаются эффективными для генной терапии ЦНС, поскольку они обладают подходящим профилем токсичности и иммуногенности, их можно использовать в трансдукции нервных клеток, и они способны опосредовать длительную экспрессию в ЦНС.
Аденоассоциированный вирус (AAV) представляет собой небольшой (20 нм), неспособный к самостоятельной репликации, безоболочечный вирус. У человека и приматов описано множество различных серотипов AAV. Геном аденоассоциированного вируса содержит (+ или -) одноцепочечную ДНК (ssDNA) длиной около 4,7 тысяч нуклеотидов. На концах молекулы геномной ДНК располагаются инвертированные концевые повторы (англ inverted terminal repeats, ITRs). Геном содержит две открытые рамки считывания (англ. ORF): Rep и Сар, содержащие в себе несколько альтернативных рамок считывания, кодирующих различные белковые продукты. Продукты Rep имеют важное значение для репликации AAV, при этом ген Сар, помимо других альтернативных продуктов, кодирует 3 капсидных белка (VP1, VP2 и VP3). Белки VP1, VP2 и VP3 находятся в соотношении 1 :1:10, образуя икосаэдрический капсид (Xie Q. et al. The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy. Proc Natl Acad Sci USA, 2002;
99:10405-10410). При образовании рекомбинантного вектора AAV (rAAV) кассета экспрессии, фланкированная ITR, упаковывается в капсид AAV. Гены, необходимые для репликации AAV, не входят в кассету. Рекомбинантный AAV считается самым безопасным и одним из наиболее широко используемых вирусных векторов для переноса генов in vivo.
Векторы могут инфицировать клетки из тканей множества типов, обеспечивая мощную и устойчивую трансгенную экспрессию. Они также являются непатогенными и имеют низкий профиль иммуногенности (High КА et al., «rAAV human trial experience» Methods Mol Biol.
2011; 807:429-57).
Одной из насущных целей исследований в области разработки эффективной генотерапии является кодон-оптимизация генов интереса в составе векторов для получения максимального уровня экспрессии генов интереса, что, в свою очередь, позволит использовать для достижения значимого эффекта более низкие дозы вектора.
Одним из свойств генетического кода является вырожденное™ - способность разных кодонов (тринуклеотидов) кодировать одну и ту же аминокислоту. Такие кодоны, которые дают одну и ту же аминокислоту в процессе трансляции, называются синонимичными. В природных последовательностях выбор одного из синонимичных кодонов осуществляется случайным образом в процессе эволюции, однако частоты использования синонимичных кодонов отличаются: для каждой аминокислоты есть более и менее предпочтительные. Кодон-оптимизация - это широко используемая в мире техника, направленная на повышение продуктивности наработки белковых молекул, которая заключается в рациональном сопоставлении каждой аминокислоте в белковой последовательности одного из подходящих синонимичных кодонов. Один из распространенных принципов кодон- оптимизации подразумевает использование наиболее частых кодонов, впоследствии были предложены и другие подходы, такие как гармонизация (воспроизведение распределения частот используемых кодонов), но и они не всегда дают увеличение продуктивности. Помимо частот кодонов на эффективность наработки может влиять GC-состав последовательности (отношение количества гуанинов и цитозинов к суммарной длине последовательности), в частности, было показано, что завышенный GC-состав ассоциирован с повышением количества мРНК в клетках млекопитающих Grzegorz Kudla ET AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, Volume 4, Issue 6, el 80, pp. 933-942). Также стоит отметить, что устойчивые элементы вторичной структуры мРНК, т.е. имеющие низкую свободную энергию фолдинга, могут снижать эффективность.
Различные варианты кодон-оптимизации последовательности гена интереса могут приводить к следующему (в сравнение с геном дикого типа): а) уровень экспрессии генов интереса будет незначительно увеличен; б) уровень экспрессии генов интереса будет значительно увеличен; в) уровень экспрессии генов интереса останется приблизительно на том же уровне; г) уровень экспрессии генов интереса будет понижен.
Таким образом, есть потребность в получении кодон-оптимизированной последовательности гена SMN1 для увеличения экспрессии гена SMN1 в целевых клетках.
Было установлено, что кодон-оптимизированная последовательность SMN1 (SMN1- GeneBeam (или сокращенно SMN1-GB)), которая имеет нуклеотидную последовательность SEQ ID NO: 2, неожиданно увеличивает транскрипцию гена SMN1 более чем в 3 раза, то есть неожиданно увеличивает количество копий мРНК SMN 1 -GeneBeam в более чем 3 раза по сравнению с SMN1-WT (дикого типа), что в свою очередь приводит к значительному увеличению экспрессии гена SMN1 и, соответственно SMN белка.
Краткое описание изобретении
В одном из аспектов настоящее изобретение относится к выделенной кодон- оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных нейронов) с SEQ ID NO: 1, и включает последовательность нуклеиновой кислоты SEQ ID NO: 2.
В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к З'-концу: левый (первый) ITR (инвертированные концевые повторы);
CMV (цитомегаловирусный) энхансер;
CMV (цитомегаловирусный) промотер; интрон гена hBGl (ген субъединицы гемоглобина гамма- 1); вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN1; сигнал полиаденилирования hGHl (сигнал полиаденилирования гена гормона роста человека); правый (второй) ITR. В некоторых вариантах экспрессионная кассета включает нуклеиновую кислоту с последовательностью SEQ ID NO: 4.
В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту или вышеуказанную кассету.
В одном из аспектов настоящее изобретение относится к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, который включает капсид и вышеуказанную экспрессионную кассету.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5 '-конца к 3 '-концу:
CMV энхансер;
CMV промотер; интрон гена hBGl; вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN1; сигнал полиаденилирования hGHl ; правый ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ГО NO: 4.
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для доставки гена SMN1 в целевые клетки, которая включает вышеуказанный рекомбинантный вирус на основе AAV9 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.
В одном из аспектов настоящее изобретение относится к применению вышеуказанного рекомбинантного вируса на основе AAV9 или вышеуказанной композиции для доставки гена SMN1 в целевые клетки.
Краткое описание чертежей
Фигура 1. Экспрессия SMN1 на уровне мРНК после трансфекции. Клетки НЕК293 и HSMC были трансфецированы 5 мкг плазмид pAAV-SMNl-WT и pAAV-SMNl-GB (кодирующих ген SMN1 без кодон-оптимизации и с кодон-оптимизацией по алгоритму GeneBeam). Через 72 ч количество копий гена SMN1 в каждом образце было определено с помощью количественной ПЦР (п = 3). Также было определено количество копий гена домашнего хозяйства GAPDH. Все полученные количества для SMN1 были нормализованы на 10000 копий гена GAPDH в каждом образце. Представлены данные по нормализованному среднему количеству копий SMN1-WT, SMN-GB для обеих клеточных линий, с указанием стандартного отклонения. Также представлено соотношение нормализованного количества копий SMN1-GB и SMN1-WT в каждой линии.
Фигура 2. Экспрессия SMN1 на уровне белка после трансфекции. Клетки HSMC были трансфецированы 5 мкг плазмид pAAV-SMNl-WT и pAAV-SMNl-GB (кодирующих ген SMN1 без кодон-оптимизации и с кодон-оптимизацией по алгоритму GeneBeam). Через 72 ч клетки были покрашены первичными антителами к белку SMN1 и вторичными антителами, мечеными Alexa Fluor 488, в каждом образце (п = 3). Представлена средняя интенсивность флюоресцентного сигнала для живых клеток в образцах за вычетом фонового сигнала, полученного на клетках, окрашенных вторичными антителами без первичных антител, с указанием стандартного отклонения.
Фигура 3. Соотношение экспрессии SMN1 на уровне мРНК и белка после трансдукции. Клетки HSMC были трансдуцированы вирусами AAV9-SMN1-WT и AAV9- SMN1-GB в 3 независимых экспериментах, в каждом из которых эффективность трансдукции составила не менее 50% по контрольному GFP-содержащему вирусу. Экспрессия SMN1 была определена на уровне мРНК и белка (см. выше), после чего посчитано соотношение экспрессии SMN1-GB и SMN1-WT. Средние соотношения вместе со стандартными отклонениями представлены в фигуре.
Определения и общие методы Если иное не определено в настоящем документе, научные и технические термины, используемые в связи с настоящим изобретением, будут иметь значения, которые обычно понятны специалистам в данной области.
Кроме того, если по контексту не требуется иное, термины в единственном числе включают в себя термины во множественном числе, и термины во множественном числе включают в себя термины в единственном числе. Как правило, используемая классификация и методы культивирования клеток, молекулярной биологии, иммунологии, микробиологии, генетики, аналитической химии, химии органического синтеза, медицинской и фармацевтической химии, а также гибридизации и химии белка и нуклеиновых кислот, описанные в настоящем документе, хорошо известны специалистам и широко применяются в данной области. Ферментативные реакции и способы очистки осуществляют в соответствии с инструкциями производителя, как это обычно осуществляется в данной области, или как описано в настоящем документе.
«Выделенный» означает измененный или удаленный из природного состояния. Например, нуклеиновая кислота или пептид, в природе присутствующие в животном, не являются «выделенными», но те же нуклеиновая кислота или пептид, частично или полностью отделенные от материалов, сопутствующих им в их природном состоянии, являются «выделенными». Выделенная нуклеиновая кислота или белок могут существовать, по существу, в очищенной форме или могут существовать в неприродном окружении, таком как, например, генетически модифицированной клетке.
Определения «встречающийся в природе», «нативный» или «дикого типа» используют для описания объекта, который можно обнаружить в природе как отличающийся от получаемого искусственно. Например, белок или нуклеотидная последовательность, присутствующие в организме (включая вирус), которые можно изолировать из источника в природе, и которые не модифицированы умышленно специалистом в лаборатории, являются встречающимися в природе.
Термин «геном» относится к полному генетическому материалу организма.
В настоящем описании и в последующей формуле изобретения, если контекстом не предусмотрено иное, слова «включать» и «содержать» или их вариации, такие как «имеющий», «включает», «включающий», «содержит» или «содержащий», следует понимать как включение указанного целого или группы целых, но не исключение любого другого целого или группы целых.
Белок (Пептид) б В настоящем описании, термины «пептид», «полипептид» и «белок» используют взаимозаменяемо, и они относятся к соединению, состоящему из аминокислотных остатков, ковалентно связанных пептидными связями. Белок или пептид должен содержать по меньшей мере две аминокислоты, и не существует ограничений по максимальному количеству аминокислот, которые может содержать последовательность белка или пептида. Полипептиды включают любой пептид или белок, содержащий две или более аминокислот, соединенных друг с другом пептидными связями. Как применяют в настоящем описании, термин относится и к коротким цепям, также общепринято обозначаемым в этой области, например, как пептиды, олигопептиды и олигомеры, и к более длинным цепям, как правило, обозначаемым в этой области как белки, множество типов которых существует. «Полипептиды» включают, помимо прочего, например, биологически активные фрагменты, по существу, гомологичные полипептиды, олигопептиды, гомодимеры, гетеродимеры, варианты полипептидов, модифицированные полипептиды, производные, аналоги, слитные белки. Полипептиды включают природные пептиды, рекомбинантные пептиды, синтетические пептиды или их комбинацию.
Молекулы нуклеиновых кислот
Термины «нуклеиновая кислота», «нуклеиновая последовательность» или «нуклеиновокислотная последовательность», «полинуклеотид», «олигонуклеотид», «полинуклеотидная последовательность» и «нуклеотидная последовательность», которые используются равнозначно в данном описании, обозначают четкую последовательность нуклеотидов, модифицированных или не модифицированных, определяющую фрагмент или участок нуклеиновой кислоты, содержащую или не содержащую неприродные нуклеотиды и являющуюся либо двухцепочечной ДНК или РНК, либо одноцепочечной ДНК или РНК, либо продуктами транскрипции указанных ДНК.
Специалист в этой области имеет общие знания о том, что нуклеиновые кислоты являются полинуклеотидами, которые можно гидролизовать до мономерных «нуклеотидов». Мономерные нуклеотиды можно гидролизовать в нуклеозиды. Как применяют в настоящем описании, полинуклеотиды включают, в качестве неограничивающих примеров, все последовательности нуклеиновой кислоты, получаемые любыми способами, доступными в этой области, включая, в качестве неограничивающих примеров, рекомбинантные способы, т.е. клонирование последовательностей нуклеиновой кислоты из рекомбинантной библиотеки или генома клетки, использование обычной технологии клонирования и ПЦР и т.п., и способами синтеза. Здесь также следует упомянуть, что данное изобретение не относится к нуклеотидным последовательностям в их природной хромосомной среде, т.е. в природном состоянии. Последовательности данного изобретения были выделены и/или очищены, т.е. были взяты прямо или косвенно, например, путем копирования, при этом их среда была по меньшей мере частично модифицирована. Таким образом, также здесь следует подразумевать изолированные нуклеиновые кислоты, полученные путем генетической рекомбинации, например, с помощью принимающих клеток (клеток-хозяев), или полученные путем химического синтеза.
«Выделенная» молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, которая идентифицирована и отделена от по меньшей мере одной молекулы нуклеиновой кислоты-примеси, с которой она обычно связана в естественном источнике нуклеиновой кислоты нуклеазы. Выделенная молекула нуклеиновой кислоты отличается от той формы или набора, в которых она находится в естественных условиях. Таким образом, выделенная молекула нуклеиновой кислоты отличается от молекулы нуклеиновой кислоты, существующей в клетках в естественных условиях. Однако выделенная молекула нуклеиновой кислоты включает молекулу нуклеиновой кислоты, находящуюся в клетках, в которых в норме происходит экспрессия нуклеазы, например, в случае, если молекула нуклеиновой кислоты имеет локализацию в хромосоме, отличную от ее локализации в клетках в естественных условиях.
Термин нуклеотидная последовательность охватывает его комплемент, если не указано иное. Таким образом, нуклеиновую кислоту, имеющую определенную последовательность следует понимать как охватывающие ее комплементарную цепь с ее комплементарной последовательностью.
Термины «трасформация», «трансфекция», «трансдукция» относятся к любому способу или средствам, с помощью которых нуклеиновая кислота вводится в клетку или организм-хозяин, и могут быть использованы взаимозаменяемо для передачи аналогичного значения. Такие способы включают в себя без ограничения трансфекцию, электропорацию, микроинъекции, инфицирование, ПЭГ-сплавление и тому подобное.
Аденоассоциированный вирус (АА V)
Вирусы семейства Parvoviridae представляют собой небольшие ДНК-содержащие вирусы животных. Семейство Parvoviridae может быть разделено на два подсемейства: Parvovirinae, представители которого инфицируют позвоночных животных, и Densovirinae, представители которого инфицируют насекомых. К 2006 году были описаны 11 серотипов аденоассоциированного вируса (Mori, S. ЕТ AL., 2004, «Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein», Virology, T. 330 (2):
375-83). Все известные серотипы могут инфицировать клетки многих видов тканей. Тканевая специфичность определяется серотипом белков капсида, поэтому векторы на основе аденоассоциированого вируса конструируют, задавая необходимый серотип. Дополнительная информация по парвовирусам и другим представителям Parvoviridae описана в литературе (Kenneth I. Berns, «Parvoviridae: The Viruses and Their Replication», Chapter 69 in Fields Virology (3d Ed. 1996)).
Геномная организация всех известных серотипов AAV очень сходна. Геном AAV представляет собой линейную одноцепочечную молекулу ДНК, которая содержит менее чем примерно 5000 нуклеотидов (нт) в длину. Инвертированные концевые повторы (ITR) фланкируют уникальные кодирующие нуклеотидные последовательности репликации неструктурных белков (Rep) и структурных белков (Сар). Ген Сар кодирует белки VP (VP1, VP2 и VP3), которые образуют капсид. Концевые 145 нуклеотидов являются самокомплементарными и организованы таким образом, что может быть сформирован энергетически стабильный внутримолекулярный дуплекс, образующий Т-образную шпилечную структуру. Такие шпилечные структуры функционируют как точки начала репликации ДНК вируса, являясь праймерами для клеточного ДНК-полимеразного комплекса. После инфекции клеток млекопитающих AAV дикого типа (wtAAV) гены Rep (например, Rep78 и Rep52) экспрессируются с помощью Р5 промотора и Р19 промотора, соответственно, и оба белка Rep выполняют определенную функцию в репликации генома вируса. Сплайсинг в открытой рамке считывания Rep (Rep ORF) приводит к экспрессии фактически четырех белков Rep (например, Rep78, Rep68, Rep52 и Rep40). Однако было показано, что несплайсированная мРНК, кодирующая белки Rep78 и Rep52, является достаточной для продукции вектора AAV в клетках млекопитающих.
Вектор
Термин «вектор» при использовании в настоящем документе означает молекулу нуклеиновой кислоты, способную транспортировать другую нуклеиновую кислоту, с которой она соединена.
Термины «инфекционная единица» (ие), «инфекционная частица» или «репликационная единица», как используется в отношении вирусного титра, относятся к числу инфекционных частиц рекомбинантного вектора AAV, которое измеряют посредством анализа инфекционных центров, также известного как анализ репликационных центров, описанный, например, в публикации McFaughlin et ah, J. Virol. (1988) 62:1963-1973. Термин «гетерологичный», когда он относится к последовательностям нуклеиновых кислот, таким как кодирующие последовательности и последовательности регуляции, обозначает последовательности, которые обычно не соединены вместе и/или обычно не связаны с конкретной клеткой. Таким образом, «гетерологичная» область конструкции нуклеиновой кислоты или вектора представляет собой фрагмент нуклеиновой кислоты, расположенный внутри или присоединенный к другой молекуле нуклеиновой кислоты, которая в природе не найдена совместно с другой молекулой. Например, гетерологичная область конструкции нуклеиновой кислоты может содержать кодирующую последовательность, фланкированную последовательностями, которые в природе не найдены совместно с кодирующей последовательностью. Другой пример гетерологичной кодирующей последовательности представляет собой конструкцию, где сама кодирующая последовательность не найдена в природе (например, синтетические последовательности, которые содержат кодоны, отличные от нативного гена).
Как применяют в настоящем описании, термин «экспрессия» определяют как транскрипцию и/или трансляцию конкретной нуклеотидной последовательности, запускаемую ее промотором.
Применение
«Генная терапия» представляет собой вставку генов в клетки и/или тканей субъекта для лечения заболевания, обычно, наследственных заболеваний, при этом дефектный мутантный аллель заменяется или дополняется функциональным аллелем.
«Лечить», «лечение» и «терапия» относятся к методу смягчения или устранения биологического расстройства и/или по меньшей мере одного из сопутствующих ему симптомов. Используемый в данном документе, термин «облегчить» болезнь, заболевание или состояние, означает уменьшение тяжести и/или частоты возникновения симптомов заболевания, расстройства или состояния. Кроме того, содержащиеся в данном документе ссылки на «лечение» включает ссылки на лечебную, паллиативную и профилактическую терапию.
В одном аспекте субъект лечения или пациент является млекопитающим, предпочтительно человеческим субъектом. Вышеупомянутый субъект может быть мужского или женского пола любого возраста.
Термин «нарушение» означает любое состояние, которое можно улучшить в результате лечения по настоящему изобретению. В определение данного термина входят хронические и острые нарушения или заболевания, включающие в себя патологические состояния, которые вызывают предрасположенность млекопитающего к возникновению данного нарушения.
«Заболевание» является состоянием здоровья животного, где животное не может поддерживать гомеостаз, и где, если заболевание не облегчают, то здоровье животного продолжает ухудшаться.
Термин «субъект», «пациент», «индивидуум» и т.п. используют в настоящем описании взаимозаменяемо, и они относятся к любому животному, поддающимуся воздействию способами, представленными в настоящем описании. В конкретных неограничивающих вариантах осуществления субъект, пациент или индивидуум является человеком.
«Терапевтически эффективным количеством» считается количество вводимого в процессе лечения терапевтического агента, которое избавит в определенной степени от одного или нескольких симптомов заболевания, по поводу которого проводится лечение.
Подробное описание изобретения
Кодон-оптимизированная нуклеиновой кислоте
В одном из аспектов настоящее изобретение относится к выделенной кодон- оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных нейронов) с SEQ ID NO: 1, и включает последовательность нуклеиновой кислоты SEQ ID NO: 2.
Для получения кодон-оптимизированного гена SMN1 за основу была взята соответствующая аминокислотная последовательность белка SMN HUMAN: MAMSSGGSGGGVPEQEDSVLFRRGTGQSDDSDIWDDTALIKAYDKAVASFKHALKNG DICETSGKPKTTPKRKPAKKNKSQKKNTAASLQQWKVGDKCSAIWSEDGCIYPATIASI DFKRETCVVVYTGYGNREEQNLSDLLSPICEVANNIEQNAQENENESQVSTDESENSRSP GNKSDNIKPKSAPWNSFLPPPPPMPGPRLGPGKPGLKFNGPPPPPPPPPPHLLSCWLPPFPS GPPIIPPPPPICPDSLDDADALGSMLISWYMSGYHTGYYMGFRQNQKEGRCSHSLN (SEQ ID NO:1)
Данная аминокислотная последовательность SEQ ID NO:1 переводилась в нуклеотидную последовательность путем последовательного сопоставления каждой аминокислоте начиная с N-конца одного из кодирующих её синонимичных кодонов.
Подробно по кодон-оптимизированного гена SMN1 и отбор финальной последовательности описано в примере 1. Финальная кодон-оптимизированная последовательность SMN1 (SMNl-GeneBeam) имеет следующую нуклеотидную последовательность:
ATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGAGCAAGAGGAC AGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGACATCTGGGACGA CACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAAGCACGCCCTGA AGAACGGCGACATCTGCGAGACCAGCGGCAAGCCCAAGACCACCCCCAAGAGAAA GCCCGCCAAGAAGAACAAGAGCCAGAAGAAGAACACCGCCGCCAGCCTGCAGCAG TGGAAGGTGGGCGACAAGTGCAGCGCCATCTGGAGCGAGGACGGCTGCATCTACCC CGCCACCATCGCCAGCATCGACTTCAAGAGAGAGACCTGCGTGGTGGTGTACACCG GCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCCCATCTGCGAG GTGGCCAACAACATCGAGCAGAACGCCCAAGAGAACGAGAACGAGAGCCAAGTGA GCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAAGAGCGACAACATCAA GCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTATGCCCGGCCC TAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCCCCCCTCCTCC TCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAGCGGCCCTCCT ATCATCCCTCCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGCCGACGCCCTG GGCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCTACTACATGGG CTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAACTAG (SEQ ID NO:2).
Данная финальная кодон-оптимизированная нуклеотидная последовательность SMN1 (SMNl-GeneBeam) характеризуется повышенным индексом адаптации кодонов (стандартная метрика для оценки последовательности на предмет частот использованных кодонов) по сравнению с кодирующей последовательностью гена SMN дикого типа (SMN1- WT):
ATGGCGATGAGCAGCGGCGGCAGTGGTGGCGGCGTCCCGGAGCAGGAGGATTCCGT
GCTGTTCCGGCGCGGCACAGGCCAGAGCGATGATTCTGACATTTGGGATGATACAG
CACTGATAAAAGCATATGATAAAGCTGTGGCTTCATTTAAGCATGCTCTAAAGAATG
GTGACATTTGTGAAACTTCGGGTAAACCAAAAACCACACCTAAAAGAAAACCTGCT
AAGAAGAATAAAAGCCAAAAGAAGAATACTGCAGCTTCCTTACAACAGTGGAAAGT
TGGGGACAAATGTTCTGCCATTTGGTCAGAAGACGGTTGCATTTACCCAGCTACCAT
TGCTTCAATTGATTTTAAGAGAGAAACCTGTGTTGTGGTTTACACTGGATATGGAAA
TAGAGAGGAGCAAAATCTGTCCGATCTACTTTCCCCAATCTGTGAAGTAGCTAATAA
Т ATAG ААС A A A AT GCTC AAG AG A ATG АА A AT G A A AGCC A AGTTTC А АС AG AT G А А А
GTGAGAACTCCAGGTCTCCTGGAAATAAATCAGATAACATCAAGCCCAAATCTGCT
CCATGGAACTCTTTTCTCCCTCCACCACCCCCCATGCCAGGGCCAAGACTGGGACCA GGAAAGCCAGGTCTAAAATTCAATGGCCCACCACCGCCACCGCCACCACCACCACC CCACTTACTATCATGCTGGCTGCCTCCATTTCCTTCTGGACCACCAATAATTCCCCCA CCACCTCCCATATGTCCAGATTCTCTTGATGATGCTGATGCTTTGGGAAGTATGTTAA TTTCATGGTACATGAGTGGCTATCATACTGGCTATTATATGGGTTTCAGACAAAATC AA A A AG A AGG A AGGTGCTC AC ATTCCTT A A ATT A A (SEQ ID NOG).
Индекс адаптации кодонов для финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO:2) нашей последовательности равен 98%, для последовательности дикого типа - 75%.
GC-состав последовательности дикого типа равен 45%, то есть отличается от целевого значения на 15%, GC-состав финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO:2) оптимизированной последовательности равен 64%, т.е. отличается от целевого значения на 4%.
Финальная кодон-оптимизированная нуклеотидная последовательность гена SMN1 (SEQ ID NO:2) и нуклеотидная последовательность гена SMN1 дикого типа (SEQ ID NO:3) Последовательности идентичны на 71%.
Экспрессиопная кассета. Экспрессионный вектор.
В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту.
Термин «экспрессионная кассета» при использовании в данном документе, в частности, относится к фрагменту ДНК, который способен в соответствующей обстановке запускать экспрессию полинуклеотида, кодирующего представляющий интерес полипептид, который включен в указанную экспрессионную кассету. При введении в клетку-хозяина экспрессионная кассета помимо прочего способна задействовать клеточные механизмы для транскрипции полинуклеотида, кодирующего представляющий интерес полипептид, в РНК, которая затем обычно дополнительно процессируется и, наконец, транслируется в представляющий интерес полипептид. Экспрессионная кассета может содержаться в экспрессионном векторе.
Экспрессионная кассета по настоящему изобретению содержит в качестве элемента промотор. Термин «промотор», используемый в настоящем документе, в частности, относится к элементу ДНК, который способствует транскрипции полинуклеотида, с которым функционально связан промотор. Промотор может также составлять часть элемента «промотор/энхансер». Хотя физические границы между элементами «промотор» и «энхансер» не всегда ясны, термин «промотор» обычно относится к месту на молекуле нуклеиновой кислоты, с которым связывается РНК-полимераза и/или связанные с ней факторы, и с которого инициируется транскрипция. Энхансеры усиливают активность промотора во времени, а также пространственно. В данной области известно множество промоторов, которые транскрипционно активны в широком диапазоне типов клеток.
Промоторы могут быть разделены на два класса: на тех, которые функционируют конститутивно, и тех, которые регулируются индукцией или снятием репрессии. Для экспрессии белка пригодны оба класса. Промоторы, которые используются для продукции высокого уровня полипептидов в эукариотических клетках и, в частности, в клетках млекопитающих, должны быть сильными и, предпочтительно, должны быть активными в широком диапазоне типов клеток. Сильные конститутивные промоторы, которые способны запускать экспрессию во многих типах клеток, хорошо известны в данной области и, поэтому, нет необходимости в их подробном описании в данном документе. В соответствии с идеей настоящего изобретения · предпочтительно использовать промотор цитомегаловируса (CMV). Промотор или промотор/энхансер, полученные из немедленной ранней (IE) области цитомегаловируса (hCMV) человека, в особенности подходят в качестве промотора в экспрессионной кассете по настоящему изобретению. Немедленная ранняя (IE) область цитомегаловируса (hCMV) человека и полученные из нее функциональные запускающие экспрессию фрагменты и/или функциональные усиливающие экспрессию фрагменты, например, описаны в ЕР0173177 и ЕР0323997, а также хорошо известны в данной области. Таким образом, несколько фрагментов немедленной ранней (IE) области hCMV могут использоваться в качестве промотора и/или промотора/энхансера. Согласно одному варианту осуществления изобретения промотор
CMV человека используется в экспрессионной кассете по настоящему изобретению.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к З'-концу: левый (первый) ITR (инвертированные концевые повторы);
CMV (цитомегаловирусный) энхансер;
CMV (цитомегаловирусный) промотер; интрон гена hBGl (ген субъединицы гемоглобина гамма- 1); вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN1; сигнал полиаденилирования hGHl (сигнал полиаденилирования гена гормона роста человека); правый (второй) ITR.
В некоторых вариантах левый (первый) ITR (инвертированные концевые повторы) имеет следующую последовательность нуклеиновой кислоты: Cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcct (SEQ ID NO: 8).
В некоторых вариантах CMV (цитомегаловирусный) энхансер имеет следующую последовательность нуклеиновой кислоты: cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaac gCcaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtac gccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctac gtattagtcatcgctattaccatg (SEQ ID NO: 9).
В некоторых вариантах CMV (цитомегаловирусный) промотер имеет следующую последовательность нуклеиновой кислоты: gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagt ttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtggga ggtctatataagcagagct (SEQ ID NO: 10).
В некоторых вариантах интрон гена hBGl (ген субъединицы гемоглобина гамма- 1) имеет следующую последовательность нуклеиновой кислоты: cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaa aaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctcttt gcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaa gaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctagg cccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaatt gggat (SEQ ID NO: 11).
В некоторых вариантах сигнал полиаденилирования hGHl (сигнал полиаденилирования гена гормона роста человека) имеет следующую последовательность нуклеиновой кислоты:
Acgggtggcatccctgtgacccctccccagtgcctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaat aaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaag acaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttca agcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggttt caccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccact gctcccttccctgtcctt (SEQ ID NO: 12).
В некоторых вариантах правый (второй) ITR имеет следующую последовательность нуклеиновой кислоты: aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccg ggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 13). В некоторых вариантах экспрессионная кассета имеет следующую последовательность нуклеиновой кислоты: cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtctagttattaatagtaatcaattacggggtcattag ttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtca ataatgacgtatgttcccatagtaacgCcaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtac atcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatggg actttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttg actcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaaca actccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctg gagacgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctccgcggattcgaatcccggccgggaacggtgc attggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatactttt ttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtg ataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagc tacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctc ttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatCGATTGT
AATTCATGAGCCACCATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGA
GCAAGAGGACAGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGAC
ATCTGGGACGACACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAA
GCACGCCCTGAAGAACGGCGACATCTGCGAGACCAGCGGCAAGCCCAAGACCACCC
CCAAGAGAAAGCCCGCCAAGAAGAACAAGAGCCAGAAGAAGAACACCGCCGCCAG
CCTGCAGCAGTGGAAGGTGGGCGACAAGTGCAGCGCCATCTGGAGCGAGGACGGCT
GCATCTACCCCGCCACCATCGCCAGCATCGACTTCAAGAGAGAGACCTGCGTGGTG
GTGTACACCGGCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCC
CATCTGCGAGGTGGCCAACAACATCGAGCAGAACGCCCAAGAGAACGAGAACGAG
AGCCAAGTGAGCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAAGAGCG
ACAACATCAAGCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTA
TGCCCGGCCCTAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCC
CCCCTCCTCCTCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAG
CGGCCCTCCTATCATCCCTCCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGC
CGACGCCCTGGGCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCT
ACTACATGGGCTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAAC
TGATctagagtcgacctgcagaagcttgcctcgagcagcgctgctcgagagatctacgggtggcatccctgtgacccctccccagtgc ctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataa tattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagct ggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattcca ggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggt gatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcg gaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaagg tcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 4).
В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту или вышеуказанную экспрессионную кассету.
В некоторых вариантах осуществления изобретения вектор представляет собой плазмиду, т.е. кольцевую двухцепочечную часть ДНК, в которую могут быть лигированы дополнительные сегменты ДНК.
В некоторых вариантах осуществления изобретения вектор представляет собой вирусный вектор, в котором дополнительные сегменты ДНК могут быть лигированы в вирусный геном.
В некоторых вариантах осуществления изобретения векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальный сайт инициации репликации и эписомные векторы млекопитающих). В других вариантах осуществления изобретения векторы (например, неэписомальные векторы млекопитающих) могут быть интегрированы в геном клетки-хозяина при введении в клетку-хозяина, и таким образом реплицируются вместе с геном хозяина. Более того, некоторые векторы способны направлять экспрессию генов, с которыми они функционально соединены. Такие векторы упоминаются в данном документе как «рекомбинантные экспрессирующие векторы» (или просто «экспрессирующие векторы» («вектор экспрессии» или «экспрессионный вектор»)).
Экспрессионные векторы включают плазмиды, ретровирусы, аденовирусы, аденоассоциированные вирусы (AAV), вирусы растений, такие как вирус мозаики цветной капусты, вирусы табачной мозаики, космиды, YAC, EBV полученные эписомы и тому подобное. Молекулы ДНК могут быть лигированы в вектор таким образом, что последовательности, контролирующие транскрипцию и трансляцию в векторе, выполняют предусмотренную функцию регуляции транскрипции и трансляции ДНК. Экспрессионный вектор и последовательности контроля экспрессии могут быть выбраны таким образом, чтобы быть совместимыми с используемой экспрессирующей клеткой-хозяином. Молекулы ДНК могут быть введены в экспрессионный вектор стандартными способами (например, лигированием комплементарных сайтов рестрикции или лигированием тупых концов, если сайты рестрикции отсутствуют). Рекомбинантный экспрессионный вектор также может кодировать сигнальный пептид, который облегчает выработку белка-интереса клеткой-хозяином. Ген белка- интереса может быть клонирован в вектор таким образом, что сигнальный пептид соединен с рамкой считывания аминоконца белка-интереса. Сигнальным пептидом может быть сигнальный пептид иммуноглобулина или гетерологичный сигнальный пептид (то есть, сигнальный пептид белка не иммуноглобулиновой природы).
Помимо гена SMN1-GB по данному изобретению, рекомбинантная экспрессия векторов по данному изобретению может нести регулирующие последовательности, которые контролируют экспрессию гена SMN 1 -GB в клетке-хозяине. Специалистам в этой области будет понятно, что дизайн экспрессионного вектора, включая выбор регулирующих последовательностей, может зависеть от таких факторов, как селекция клетки-хозяина для трансформации, уровень экспрессии желаемого белка, и т.д. Предпочтительные регулирующие последовательности для экспрессирующей клетки- хозяина млекопитающих включают вирусные элементы обеспечивающие высокий уровень экспрессии белков в клетках млекопитающих, таких как промоторы и/или энхансеры, полученные из ретровирусной LTR, цитомегаловируса (CMV) (например, CMV промотора/энхансера), обезьяньего вируса 40 (SV40) (например, SV40 промотора/энхансера), аденовируса, (например, большого позднего промотора аденовируса (AdMLP)), вирус полиомы, а также сильных промоторов млекопитающих, таких как промотор нативных иммуноглобулинов или промотор актина.
Выражение «контролирующие последовательности» относится к последовательностям ДНК, необходимым для экспрессии функционально связанной кодирующей последовательности в определенном организме-хозяине. Пригодные для прокариот контролирующие последовательности представляют собой, например, промотор, необязательно оператор и сайт связывания рибосомы. Как известно, в эукариотических клетках присутствуют промоторы, сигналы полиаденилирования и энхансеры.
В контексте настоящего описания термин «промотор» или «регуляторная последовательность транскрипции» или «регуляторная последовательность» относится к фрагменту нуклеиновой кислоты, который контролирует транскрипцию одной или нескольких кодирующих последовательностей, и который расположен против направления считывания информации относительно направления транскрипции от сайта инициации транскрипции кодирующей последовательности, а также который структурно идентифицируется по наличию сайта связывания для ДНК-зависимой РНК-полимеразы, сайтов инициации транскрипции и других последовательностей ДНК, включающих, без ограничения, сайты связывания фактора транскрипции, сайты связывания репрессора и активатора белка, а также любые другие последовательности нуклеотидов, известные специалистам в данной области, которые непосредственно или опосредованно регулируют уровень транскрипции с данным промотором. «Конститутивный» промотор представляет собой такой промотор, который активен в большинстве тканей в обычных физиологических условиях и условиях развития. «Индуцибельный» промотор представляет собой промотор, который подвергается физиологической регуляции или регуляции в ходе развития, например, при воздействии химического индуктора. «Тканеспецифичный» промотор активен только в конкретных типах тканей или клеток.
Термины «энхансеры» или «энхансер», используемые в изобретении, могут относиться к последовательности ДНК, которая расположена как смежная с последовательностью ДНК, кодирующей рекомбинантный продукт. Энхансерные элементы обычно расположены в 5'-направлении от промоторного элемента или могут быть расположены ниже или в пределах кодирующей последовательности ДНК (например, последовательности ДНК, транскрибированной или транслированной в рекомбинантный продукт или продукты). Таким образом, энхансерный элемент может быть расположен на расстоянии 100 пар оснований, 200 пар оснований или 300 или больше пар оснований перед последовательностью ДНК, которая кодирует рекомбинантный продукт, или после этой последовательности. Энхансерные элементы могут увеличивать количество экспрессируемого рекомбинантного продукта от последовательности ДНК, превышая экспрессию, обусловленную одиночным промоторным элементом. Специалистам в данной области техники доступно множество энхансерных элементов.
В дополнение к вышеуказанным генам и регулирующим последовательностям, рекомбинантные векторы экспрессии изобретения могут нести дополнительные последовательности, такие как последовательности, которые регулируют репликацию вектора в клетках-хозяевах (например, точки начала репликации) и гены селектируемого маркера. Ген селектируемого маркера облегчает селекцию клеток-хозяев, в которые был введен вектор (см., например, патенты США 4,399,216, 4,634,665 и 5,179,017). Например, обычно ген селектируемого маркера придает устойчивость к лекарственным средствам, таким как G418, гигромицин или метотрексат, клетке-хозяину, в которую вектор введен. Например, гены селектируемого маркера включают ген дигидрофолат редуктазы (DHFR) (для использования в dhfr-клетках-хозяевах при селекции/амплификации метотрексата), ген нео (для селекции G418) и ген синтетазы глутамата.
Термин «последовательность контроля экспрессии», используемый в данном описании, означает полинуклеотидные последовательности, которые необходимы для воздействия на экспрессию и процессинг кодирующих последовательностей, к которым они лигированы. Контролирующие экспрессию последовательности включают соответствующие последовательности инициации транскрипции, терминации, промотора и энхансера; эффективные сигналы процессинга РНК, такие как сплайсинг и сигналы полиаденилирования; последовательности, которые стабилизируют цитоплазматическую мРНК; последовательности, которые повышают эффективность трансляции (т.е. консенсусная последовательность Козака); последовательности, которые повышают стабильность белка; и, при желании, последовательности, которые усиливают секрецию белка. Характер таких контролирующих последовательностей различается в зависимости от организма-хозяина; в прокариотах такие контролирующие последовательности, как правило, включают промотор, сайт связывания рибосомы, а также последовательности терминации транскрипции; в эукариотах, как правило, такие контролирующие последовательности включают промоторы и последовательности терминации транскрипции. Термин «контролирующие последовательности» включает, как минимум, все компоненты, наличие которых имеет важное значение для экспрессии и процессинга, и может также включать дополнительные компоненты, чье присутствие является полезным, например, лидирующие последовательности и последовательности слившихся клеток.
В контексте настоящего описания термин «функционально связанный» относится к связи полинуклеотидных (или полипептидных) элементов в функциональную связь. Нуклеиновая кислота является «функционально связанной», если она находится в условиях функциональной связи с другой последовательностью нуклеиновой кислоты. Например, регуляторная последовательность транскрипции функционально связана с кодирующей последовательностью, если она влияет на транскрипцию указанной кодирующей последовательности. Термин «функционально связанный» означает, что связанные последовательности ДНК являются, как правило, непрерывными, и при необходимости соединения двух участков, кодирующих белок, являются также непрерывными и находятся в рамке считывания.
В одном из вариантов настоящего изобретения «экспрессионный вектор» относится к вектору, содержащему одну или несколько интересующих полинуклеотидных последовательностей, интересующих генов или «трансгенов», которые фланкированы парвовирусными или инвертированными концевыми повторяющимися последовательностями (ITR).
Ни кассета, ни вектор по изобретению не содержит нуклеотидные последовательности генов, кодирующих неструктурные белки (Rep) и структурные белки (Сар) аденоассоциированного вируса. Рекомбинантный вирус на основе АА V9 (аденоассоциированный вирус 9 серотипа)
В одном из аспектов настоящее изобретение относится к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, который включает капсид и вышеуказанную экспрессионную кассету.
Термин «рекомбинантный вирус на основе AAV» (или «вирусоподобная частица на основе AAV», или «рекомбинантный вирусный штамм AAV», или «рекомбинантный вектор AAV», или «вектор rAAV») в контексте настоящего описания относится к вышеуказанной экспрессионной кассете (или вышеуказанному экспрессионному вектору), которая заключена внутри капсида AAV.
Ген Сар, помимо других альтернативных продуктов, кодирует 3 капсидных белка (VP1, VP2 и VP3). Белки VP1, VP2 и VP3 находятся в соотношении 1 :1:10, образуя икосаэдрический капсид (Xie Q. et al. The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy. Proc Natl Acad Sci USA, 2002; 99:10405-10410). Транскрипция этих генов начинается с одного промотора, р40. Молекулярная масса соответствующих белков (VP1, VP2 и VP3) составляет 87, 72 и 62 кДа, соответственно. Все три белка транслируются с одной мРНК. После транскрипции пре-мРНК может подвергаться сплайсингу двумя разными способами, при этом вырезается более длинный или более короткий интрон и образуются мРНК различной нуклеотидной длины.
При образовании рекомбинантного вируса на основе AAV (rAAV) кассета экспрессии, фланкированная ИКП (ITR), упаковывается в капсид AAV. Гены, необходимые для репликации AAV, как было указано выше, не входят в кассету.
ДНК экспрессионной кассеты упакована в вирусный капсид в виде одноцепочечной молекулы ДНК (оцДНК) длиной приблизительно 3000 нуклеотидов. После инфицирования клетки вирусом, одноцепочечную ДНК конвертируют в форму двухцепочечной ДНК (дцДНК). Только дцДНК могут использовать белки клетки, которые транскрибируют содержащийся ген или гены в РНК.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий следующую аминокислотную последовательность
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPG
NGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGG NLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRL
NFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWH
CDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFN
RFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFT
DSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQML
RTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSV
AGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGP
AMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVA
TNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGF
GMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPE
IQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL (SEQ ID NO: 5).
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9, имеющий следующую аминокислотную последовательность:
TAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSG
VGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNN
HLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL
NFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVF
MIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQS
LDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVS
TTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGT
GRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGM
VWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNK
DKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSE
PRPIGTRYLTRNL (SEQ ID NO: 6).
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9. В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9, имеющий следующую аминокислотную последовательность
MASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYN HLYK
QISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKL
FNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQ
YGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRL
MNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVT
QNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDN
VDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQD
RDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNS
FITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGT
RYLTRNL (SEQ ID NO: 7).
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1, VP2 и VP3 AAV9.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями.
Под «несколькими точечными мутациями» подразумеваются две, три, четыре, пять, шесть, семь, восемь, девять или десять точечных замен.
Особенно предпочтительные варианты включают замены (мутации), которые являются консервативными по природе, т.е. те замены, которые имеют место в семействе аминокислот, которые объединены по их боковым цепям. В частности, аминокислоты обычно делят на четыре семейства: (1) кислые - аспартат и глутамат; (2) основные - лизин, аргинин, гистидин; (3) неполярные - аланин, валин, лейцин, изолейцин, пролин, фенилаланин, метионин, триптофан; и (4) незаряженные полярные - глицин, аспарагин, глутамин, цистеин, серин треонин, тирозин. Фенилаланин, триптофан и тирозин иногда классифицируют как ароматические аминокислоты. Например, достаточно обосновано предсказание о том, что выделенная замена лейцина на изолейцин или валин, аспартата на глутамат, треонина на серин или схожая консервативная замена аминокислоты на структурно родственную аминокислоту не окажет важного влияния на биологическую активность. Например, полипептид, представляющий интерес, может включать вплоть до приблизительно 5-10 консервативных или неконсервативных аминокислотных замен, при условии, что желаемая функция молекулы остается незатронутой.
Вариант точечных мутаций в последовательностях белков VP1, VP2 или VP3 AAV9 с помощью аминокислотных замен представляет собой замену, по меньшей мере, одного аминокислотного остатка в белке VP1, VP2 или VP3 AAV9 на другой аминокислотный остаток.
Консервативные замены показаны в таблице А под заголовком «предпочтительные замены».
Figure imgf000025_0001
Figure imgf000026_0001
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к З'-концу:
CMV энхансер;
CMV промотер; интрон гена hBGl; вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN 1 ; сигнал полиаденилирования hGH 1 ; правый ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к З'-концу:
CMV энхансер;
CMV промотер; интрон гена hBGl; вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN1 ; сигнал полиаденилирования hGH 1 ; правый ITR. В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5 '-конца к 3'- концу:
CMV энхансер;
CMV промотер; интрон гена hBGl; вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN1; сигнал полиаденилирования hGHl; правый ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ГО NO: 4.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.
Фармацевтическая композиция
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для доставки гена SMN1 в целевые клетки, которая включает вышеуказанный рекомбинантный вирус на основе AAV9 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.
В конкретных вариантах осуществления настоящее изобретение относится к фармацевтической композиции, содержащей рекомбинантный вирус на основе AAV9 по изобретению в фармацевтически приемлемом носителе или в других фармацевтических агентах, адъювантах, разбавителях и т.д. Носитель для инъекций обычно является жидким. Носитель для других способов введения может быть или твердым, или жидким, таким как стерильная апирогенная вода или стерильный апирогенный фосфатно-солевой буферный раствор. Для введения путем ингаляции носитель является вдыхаемым и предпочтительно находится в твердой или жидкой дисперсной форме. В качестве инъекционной среды предпочтительно использовать воду, содержащую добавки, общепринятые для инъекционных растворов, такие как стабилизирующие агенты, соли или солевые растворы и/или буферы.
«Фармацевтическая композиция» обозначает композицию, включающую в себя вышеуказанный рекомбинантный вирус на основе AAV9 по изобретению и, по крайней мере, один из компонентов, выбранных из группы, состоящей из фармацевтически приемлемых и фармакологически совместимых эксипиентов, таких как наполнители, растворители, разбавители, носители, вспомогательные, распределяющие, средства доставки, консерванты, стабилизаторы, эмульгаторы, суспендирующие агенты, загустители, регуляторы пролонгированной доставки, выбор и соотношение которых зависит от природы и способа назначения и дозировки. Фармацевтические композиции по настоящему изобретению и способы их изготовления будут бесспорно очевидными для специалистов в этой области. Производство фармацевтических композиций предпочтительно должно соответствовать требованиям GMP (надлежащей производственной практики). Композиция может включать буферную композицию, тонические агенты, стабилизаторы и солюбилизаторы.
«Фармацевтически приемлемым» считается материал, который не имеет биологических или других противопоказаний, например, материал можно вводить субъекту без каких-либо нежелательных биологических эффектов. Таким образом, такие фармацевтические композиции можно использовать, например, для трансфекции клетки ех vivo или для введения in vivo рекомбинантного вируса на основе AAV9 по изобретению непосредственно субъекту.
Термин «эксципиент» или «вспомогательное вещество» используется в данном документе для описания любого компонента, отличающегося от ранее описанных по данному изобретению. Это вещества неорганического или органического происхождения, используемые в процессе производства, изготовления лекарственных препаратов для придания им необходимых физико-химических свойств.
Под «стабилизатором» понимается вспомогательное вещество или смесь двух и более вспомогательных веществ, которые обеспечивают физическую и/или химическую стабильность активного агента.
Под термином «буфер», «буферная композиция», «буферный агент» понимается раствор, способный сохранять значение pH, благодаря взаимодействию кислотных и щелочных компонентов, входящих в его состав, который дает возможность препарату вектора на основе rAAV5, проявлять устойчивость к изменениям pH. В общем случае, преимущественными являются значения pH фармацевтической композиции от 4,0 до 8,0. В качестве буферных агентов могут быть использованы, например, ацетатный, фосфатный, нитратный, гистидиновый, сукцинатный и т.п. буферные растворы, но, не ограничиваясь ими.
Фармацевтическая композиция является «стабильной», если активный агент сохраняет свою физическую стабильность и/или химическую стабильность и/или биологическую активность в течение заявленного срока годности при температуре хранения, например, при 2-8 °С. Предпочтительно, чтобы активный агент сохранял и физическую, и химическую стабильность, а также биологическую активность. Период хранения выбирается на основании результатов исследования стабильности при ускоренном и естественном хранении.
Фармацевтическая композиция по данному изобретению может изготавливаться, упаковываться или широко продаваться в виде единичной стандартной дозы или множества единичных стандартных доз в виде готовой лекарственной формы. Используемый в данном документе термин «единичная стандартная доза» означает дискретное количество фармацевтической композиции, содержащей заранее определенное количество активного ингредиента. Количество активного ингредиента обычно равно дозировке активного ингредиента, который будет вводиться субъекту, или удобной части такой дозировки, например, половине или трети такой дозировки.
Применение
В одном из аспектов настоящее изобретение относится к применению вышеуказанного рекомбинантного вируса на основе AAV9 или вышеуказанной композиции для доставки гена SMN 1 в целевые клетки. Любой способ введения рекомбинантного вируса на основе AAV9, принятый в данной области, может соответствующим образом использоваться для вышеуказанного рекомбинантного вируса на основе AAV9 по данному изобретению.
Рекомбинантный вирус на основе AAV9 предпочтительно вводят в клетку в биологически эффективном количестве. «Биологически эффективное» количество рекомбинантного вируса представляет собой количество, которое достаточно, чтобы вызвать инфекцию (или трансдукцию) и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке. Если вирус вводят в клетку in vivo (например, вирус вводят субъекту, как описано ниже), «биологически эффективное» количество вирусного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке-мишени.
Клетка для введения вышеуказанного рекомбинантного вируса на основе AAV9 по изобретению может быть клеткой любого типа, включая в себя без ограничения нервные клетки (включающие в себя клетки периферической и центральной нервной системы, в частности, клетки головного мозга), легочные клетки, эпителиальные клетки (например, эпителиальные клетки кишечника и дыхательных путей), мышечные клетки, клетки поджелудочной железы (в том числе островковые клетки), печеночные клетки, клетки миокарда, костные клетки (например, стволовые клетки костного мозга), гемопоэтические стволовые клетки, клетки селезенки, кератиноциты, фибробласты, эндотелиальные клетки, клетки предстательной железы, половые клетки и тому подобное. Альтернативно, клетка для введения вышеуказанного рекомбинантного вируса на основе AAV9 может быть любой клеткой-предшественником. В качестве дополнительной альтернативы, клетки могут представлять собой стволовые клетки (например, нервные стволовые клетки, стволовые клетки печени). Кроме того, клетки могут происходить от любых видов, как указано выше.
Вышеуказанный рекомбинантный вирус на основе AAV9 не используется для модификации генетической целостности клеток зародышевой линии человека.
Примеры
Для наилучшего понимания изобретения приводятся следующие примеры. Эти примеры приведены только в иллюстративных целях и не должны толковаться как ограничивающие сферу применения изобретения в любой форме.
Все публикации, патенты и патентные заявки, указанные в этой спецификации включены в данный документ путем отсылки. Хотя вышеупомянутое изобретение было довольно подробно описано путем иллюстрации и примера в целях исключения двусмысленного толкования, специалистам в данной области на основе идей, раскрытых в данном изобретении, будет вполне понятно, что могут быть внесены определенные изменения и модификации без отклонения от сущности и объема прилагаемых вариантов осуществления изобретения.
Материалы и общие методы
Методы рекомбинантной ДНК
Для манипуляций с ДНК использовали стандартные методы, описанные у Sambrook J. и др., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Реагенты для молекулярной биологии использовали согласно инструкциям производителей. Вкратце, плазмидную ДНК нарабатывали для дальнейших манипуляций в клетках Е. coli, выращиваемых под селективным давлением с антибиотиками для того, чтобы плазмиды не терялись в клеточной популяции. Плазмидную ДНК выделяли из клеток коммерческими наборами, измеряли концентрацию и использовали для клонирования с помощью обработки эндонуклеазами рестрикции или методами ПЦР-амплификации. Фрагменты ДНК лигировали между собой с помощью лигаз и трансформировали в бактериальные клетки для отбора клонов и дальнейших наработок. Все полученные генетические конструкции подтверждали по паттернам рестрикции и полным секвенированием по Сэнгеру.
Синтез генов
Требуемые сегменты генов получали из олигонуклеотидов, созданных путем химического синтеза. Генные сегменты длиной от 300 до 1000 п. н., которые фланкированы уникальными сайтами рестрикции, собирали путем ренатурации олигонуклеотидов друг на друге с последующей ПЦР-амплификацией с крайних праймеров. В результате получали смесь фрагментов, включая нужный. Фрагменты клонировали по сайтам рестрикции в промежуточные векторы, после чего последовательности ДНК субклонированных фрагментов подтверждали путем секвенирования ДНК.
Определение последовательностей ДНК
Последовательности ДНК определяли путем секвенирования по Сэнгеру. Анализ последовательностей ДНК и белков и обработку данных о последовательностях осуществляли в программе SnapGene 4.2 и выше для создания, картирования, анализа, аннотирования и иллюстрации последовательностей. Культивирование клеточных культур
В экспериментах были использованы клеточные линии НЕК293 (Human Embryonic Kidney clone 293) и HSMC (Human Skeletal Muscle Cells). Клетки культивировались в стандартных условиях при 370С и 5%С02, на полной питательной среде DMEM с добавлением 10% FBS и антибиотика. Для культивирования HSMC культуральный пластик предварительно покрывался коллагеном (Gibco). Пересев клеток осуществлялся при достижении 80-90% конфлюентности. Жизнеспособность клеток оценивалась с помощью окраски Trypan Blue и камеры Горяева либо с помощью окраски PI и проточной цитометрии.
Трансфекция клеток
Клеточные линии засеивали накануне трансфекции в 6-луночные планшеты таким образом, чтобы они достигали 70-80% конфлюентности к моменту трансфекции. Трансфекцию осуществляли с помощью коммерческих наборов для липофекции по протоколу производителя. Через 72 ч клетки обрабатывали растворами трипсина или аналогичными, снимали с подложки, отмывали в фосфатном буфере и собирали для дальнейшего анализа экспрессии целевых генов и белков. При постановке каждой трансфекции использовали контрольную плазмиду, экспрессирующую GFP, для контроля эффективности трансфекции (доля GFP-позитивных клеток в процентах). Дальнейший анализ проводили только в том случае, если эффективность трансфекции составляла не менее 50%.
Все работы проводились в 3 независимых экспериментах.
Анализ генной экспрессии
Экспрессию SMN1 на уровне мРНК проверяли с помощью количественной ПЦР. Вкратце, использовали праймеры и пробу, специфичные к последовательности SMN1 дикого типа или GeneBeam. Для контроля количества исходной РНК использовали праймеры и пробу, специфичные к гену домашнего хозяйства GAPDH. Для каждого набора праймеров и проб строили калибровочные кривые с применением известного количества копий линеаризованной плазмидной ДНК, содержащей амплифицируемую последовательность соответствующего гена. Анализ экспрессии осуществляли, определяя по калибровочным кривым количество копий SMN1 -GeneBeam, SMN1-WT и GAPDH в каждом образце, после чего нормализовали количество копий SMN1 на 10000 копий GAPDH. Полученные значения сравнивали между собой для различных образцов в рамках одного эксперимента.
Определение экспрессии белка SMN1 с помощью проточной цитометрии
Оценку содержания белка SMN1 в клетках проводили посредством внутриклеточного окрашивания, с последующим анализом с помощью проточной цитометрии. Вкратце, клетки снимали с культуральных планшетов с помощью TrypLE, отмывали в PBS, фиксировали в растворе 4% параформальдегида, пермеабилизировали с помощью 0,5% раствора Triton Х-100 в PBS, инкубировали в блокирующем буфере с 1-5% BSA и окрашивали двухэтапно с использованием первичных антител к SMN1 и вторичных антител, меченных Alexa Fluor 488. После окрашивания клетки однократно промывали в PBS и анализировали на проточном цитометре. Оценивали среднюю интенсивность сигнала за вычетом сигнала, окрашенного вторичными антителами без добавления первичных антител.
Сборка и очистка вирусных частиц рекомбинантных векторов AAV
Для сборки вирусных частиц AAV, содержащих ген SMN1 или контрольный ген GFP, использовали упаковочные клетки НЕК293, в которые трансфецировали 3 плазмиды: Плазмида, содержащая геном AAV с кассетой для экспрессии трансгена (SNM1 или
GFP);
Плазмида для экспрессии гена Сар серотипа AAV9 и гена Rep серотипа AAV2. Каждый ген с помощью альтернативных рамок считывания кодирует несколько белковых продуктов;
Плазмида для экспрессии генов аденовируса Ad5, необходимых для сборки и упаковки капсидов AAV.
Через 72 часа клетки лизировали и проводили очистку и концентрирование вирусных частиц с помощью методов фильтрации и хроматографии. Титр вирусных частиц определяли с помощью количественной ПЦР с праймерами и пробой, специфичными к участку рекомбинантного вирусного генома и выражали в виде количества копий вирусных геномов на 1 мл.
Трансдукция клеточных культур Клеточные линии засевали аналогично экспериментам для трансфекции, после чего добавляли препарат с вирусными частицами и через 72 ч клетки анализировали.
Эффективность трансдукции считали, анализируя процент GFP+ клеток.
Для используемых культур предварительно были поставлены эксперименты с проверкой эффективности трансдукции. Кратко, препарат вируса AAV9-GFP трансдуцировали в клеточные линии в различных соотношениях клеток и вирусных частиц.
Отношение количества вирусных частиц и клеток называют multiplicity of infection (MOI).
MOI вируса AAV9-GFP варьировали от 50000 до 1000000. В результате для каждой линии были определены диапазоны MOI, в пределах которых эффективность трансдукции менялась линейно в зависимости от MOI. Дальнейшие работы с трансдукцией клеточных линий проводили в их линейных диапазонах.
После трансдукции анализ экспрессии генов и белков осуществляли как описано выше.
Все работы проводились в 3 независимых экспериментах.
Пример 1. Способ получения кодон -оптимизированного гена SMN1
Для получения кодон-оптимизированного гена SMN1 за основу была взята соответствующая аминокислотная последовательность белка SMN_HUMAN (SEQ ID NO:1).
Данная аминокислотная последовательность SEQ ID NO:1 переводилась в нуклеотидную последовательность путем последовательного сопоставления каждой аминокислоте начиная с N-конца одного из кодирующих её синонимичных кодонов с учетом одного или совокупности следующих признаков:
1) частоты использования данного кодона (Yasukazu Nakamura ЕТ AL., Codon usage tabulated from the international DNA sequence databases; its status 1999, Nucleic Acids Research, 1999, Vol. 27, No. 1, doi: 10.1093/nar/27.1.292k
2) GC-состава концевого участка получаемой нуклеотидной последовательности (целевым значением GC-состава считалось 60% исходя из статьи Grzegorz Kudla ЕТ AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, PLoS Biol, June 2006, Volume 4, Issue 6, el 80, doi: 10.1371/ioumal.pbio.0040180. поэтому кодон был тем предпочтительнее, чем меньше получалась разность текущего GC-состава с целевым);
3) свободной энергии фолдинга концевого участка получаемой нуклеотидной последовательности (вторичные структуры определялись при помощи алгоритма Зукера,
Michael Zuker ЕТ AL., Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information, Nucleic Acids Research, Volume 9, Issue 1, 10 January 1981, Pages 133-148, doi: 10.1093/nar/9.1.133).
В процессе построения также избегалась генерация смысловых нуклеотидных последовательностей, таких как сайты рестрикции, участки внутренней посадки рибосомы, сайты сплайсинга т.д.
В результате перевода аминокислотной последовательности SEQ ID NO:1 в нуклеотидную последовательность был получен ряд кодон-оптимизированных нуклеотидных последовательностей гена SMN 1.
Из вышеуказанного ряда кодон-оптимизированных нуклеотидных последовательностей SMN1 несколько последовательностей не показывали увеличения транскрипции гена SMN1 в дальнейших исследованиях, то есть не было достоверного увеличения количества копий мРНК SMNl-opt по сравнению с SMN1-WT на какой-либо из использованных клеточных линий, или данное увеличение было незначительным.
Большинство кодон-оптимизированных нуклеотидных последовательностей гена SMN1 показал увеличение транскрипции гена SMN1 в 1,5-2 раза в дальнейших исследованиях, то есть достоверно увеличивая количество копий мРНК SMNl-opt по сравнению с SMN1-WT на всех использованных клеточных линиях.
Одна из вышеуказанного ряда кодон-оптимизированных нуклеотидных последовательностей гена SMN1 неожиданно показала увеличение транскрипции гена SMN1 более чем в 3 раза в дальнейших исследованиях, то есть неожиданно увеличивая количество копий мРНК SMNl-opt в более чем 3 раза по сравнению с SMN1-WT на всех использованных клеточных линиях (см. Примеры 3-4). Данная финальная кодон- оптимизированная нуклеотидная последовательность гена SMN1 получила условное название SMN 1 -GeneBeam (или сокращенно SMN1-GB).
Финальная кодон-оптимизированная последовательность SMN1 (SMN1 -GeneBeam) имеет нуклеотидную последовательность представленную SEQ ID NO: 2.
Данная финальная кодон-оптимизированная нуклеотидная последовательность SMN1 (SMN1 -GeneBeam) характеризуется повышенным индексом адаптации кодонов (Paul М. Sharp ЕТ AL., The codon adaptation index-а measure of directional synonymous codon usage bias, and its potential applications, Nucleic Acids Research, Volume 15, Issue 3, 11 February 1987, Pages 1281-1295, doi: 10.1093/nar/15.3.1281 - стандартная метрика для оценки последовательности на предмет частот использованных кодонов) по сравнению с кодирующей последовательностью гена SMN дикого типа (SMN1-WT с SEQ ID NO: 3). Индекс адаптации кодонов для финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO: 2) равен 98%, для последовательности дикого типа - 75%.
GC-состав последовательности дикого типа равен 45%, то есть отличается от целевого значения на 15%, GC-состав финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO: 2) равен 64%, т.е. отличается от целевого значения на 4%.
Финальная кодон-оптимизированная нуклеотидная последовательность гена SMN1 (SEQ ID NO:2) и нуклеотидная последовательность гена SMN1 дикого типа (SEQ ID NO:3) идентичны на 71%.
Пример 2. Сборка генетических конструкций, несущих рекомбинантный геном AAV и кодирующих ген SMN1.
Последовательность гена SMN1 дикого типа была получена путём амплификации со специфическими праймерами с кДНК, синтезированной на основе тотальной РНК клеток НЕК293. В процессе амплификации с 5’ -конца гена была добавлена последовательность Kozak и сайт рестрикции Clal, а с З’-конца - сайт рестрикции Xbal. После этого последовательность гена SMN1 была клонирована рестриктазно-лигазным методом по сайтам Clal и Xbal в коммерческую конструкцию pAAV-GFP Control plasmid (VPK-402) от CellBiolab (США), с заменой гена GFP на SMN1, получив конструкцию pAAV-SMNl-WT.
Последовательность SMNl-GeneBeam была собрана как описано выше. В силу сложности последовательности, несмотря на её относительно небольшой размер, провели серию субклонирований фрагментов гена в промежуточных векторах pGEMT с верификацией сиквенсов для каждого вектора. Далее из нескольких промежуточных векторов с помощью ПЦР собрали полноразмерную версию гена и заклонировали в промежуточный вектор pGEMT. В качестве конечной генетической конструкции использовали конструкцию pAAV-SMNl-WT, заменив SMN1 дикого типа на SMNl- GeneBeam по сайтам Clal и Xbal, добавленным на концы последовательности SMNl- GeneBeam с помощью ПЦР.
Конечный вектор содержит все необходимые элементы для экспрессии гена и сборки в составе генома рекомбинантного AAV:
1) Терминальные повторы ITR на концах последовательности, которая инкапсидируется в вирусный капсид;
2) Элементы для экспрессии целевого гена (промотор, энхансер, интрон, последовательность Kozak, трансген, сайт полиаденилирования); 3) Ориджин бактериальной репликации и ген устойчивости к антибиотику для наработки плазмидной ДНК в бактериальных клетках.
Важно отметить, что генетические конструкции, содержащие гены SMN1-WT и SMNl-GeneBeam, отличаются только последовательностями генов SMN1, а в остальном полностью идентичны.
Пример 3. Проверка экспрессии SMN1 с генетических конструкций.
Генетические конструкции pAAV-GFP, pAAV-SMNl-WT и pAAV-SMNl-GB трансфецировали в клетки НЕК293 и HSMC как описано выше. Использовали 5 мкг ДНК на 1 лунку. Через 72 ч клетки собрали и проанализировали экспрессию SMN1 (с нормализацией на GAPDH) как описано выше.
Было обнаружено, что кодон-оптимизация гена SMN1 влияет на транскрипцию SMN1, достоверно увеличивая количество копий мРНК SMN1-GB в несколько раз по сравнению с SMN1-WT на обеих использованных клеточных линиях (фиг. 1). В частности, для клеток НЕК293 отношение нормализованной экспрессии SMN1-GB к SMN1-WT составило 3,9, а для клеток HSMC - 12,8.
Данное свойство SMN 1 -GeneBeam, как показывают полученные данные, не является клеточно-специфичным, при этом обеспечивает увеличение экспрессии целевого гена в клетках в несколько раз, что может быть важным преимуществом при разработке генотерапевтических препаратов. При этом данное свойство не обусловлено никакими отличиями в кассете генной экспрессии и свойствами возможных вирусных капсидов, несущих геном с генов SMNl-GeneBeam, поскольку данный анализ проводили на генетических конструкциях, которые отличаются только кодон-оптимизацией генов SMN1, а в остальном полностью идентичны.
Клетки HSMC были выбраны для проверки экспрессии SMN1 на уровне белка с помощью проточной цитометрии, как описано выше. Было показано, что сигнал от SMN1- специфичных антител в клетках, трансфецированных pAAV-SMNl-GB, выше, чем в клетках, трансфецированных pAAV-SMNl-WT, в 12,2 раз при использованном количестве ДНК 5 мкг на 1 лунку (фиг. 2). Данный результат означает, что SMN1-GB не имеет преимуществ в трансляции, однако в силу увеличенной транскрипции количество конечного белка в клетках также увеличивается.
Пример 4. Создание вирусных препаратов, экспрессирующих SMN1
Плазмиды pAAV-SMNl-WT и pAAV-SMNl-GB вместе с остальными плазмидами, необходимыми для получения вирусных частиц рекомбинантного AAV (см. выше), были использованы для биопроцесса получения AAV. В качестве серотипа был выбран серотип
AAV9 дикого типа или с одной или несколькими точечными мутациями.
Во всех случаях сравнение свойств SMN1 дикого типа и SMNl-GeneBeam проводили только в случае идентичности используемого серотипа и мутаций капсида, если они присутствовали. Все серотипы на базе AAV9, дикого типа или с мутациями, в дальнейшем обозначаются как AAV9 без указания мутаций.
В результате биопроцесса были получены рекомбинантные вирусные частицы, обозначенные как AAV9-SMN1-WT и AAV9-SMN1-GB, а также контрольные частицы AAV9-GFP. После определения титров вирусных частиц, все 3 препарата с одинаковыми MOI (значения MOI варьировали между экспериментами от 50 до 200 тысяч) были использованы для трансдукции пермиссивных клеток - первичных миоцитов человека HSMC. Дальнейший анализ проводили только в том случае, если эффективность трансдукции составляла не менее 50%.
После успешной трансдукции клетки снимали с подложки, отмывали в фосфатном буфере и анализировали экспрессию SMN1 на уровне мРНК и белка как описано выше. Было показано, что увеличение транскрипционной активности SMNl-GeneBeam сохраняется, таким образом, мРНК SMNl-GeneBeam было детектировано в 7,3 раз больше, чем для SMN1 дикого типа. Аналогичное увеличение наблюдалось и на уровне белка (в 6,8 раз) (фиг. 3), что показывает отсутствие преимуществ SMN1-GB на уровне трансляции, однако детектируемое увеличение эффективности транскрипции позволяет с помощью препарата AAV9-SMN1-GB обеспечивать более высокий уровень экспрессии SMN1 в целевых клетках, что является важным преимуществом при лечении, например, спинальной мышечной атрофии, где уровень экспрессии белка SMN1 определяет тип заболевания от 0 (эмбриональная леталь) до 4 (не требует специального лечения).

Claims

Формула изобретения
1. Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок SMN1 (белок выживаемости моторных нейронов) с SEQ ID NO: 1, включающая последовательность нуклеиновой кислоты SEQ ID NO: 2.
2. Экспрессионная кассета, которая включает кодон-оптимизированную нуклеиновую кислоту по п. 1.
3. Экспрессионная кассета по п.2, включающая следующие элементы в направлении от 5'-конца к З'-концу: левый (первый) ITR (инвертированные концевые повторы);
CMV (цитомегаловирусный) энхансер;
CMV (цитомегаловирусный) промотер; интрон гена hBGl (ген субъединицы гемоглобина гамма- 1); кодон-оптимизированную нуклеиновую кислоту по п. 1 ; сигнал полиаденилирования hGHl (сигнал полиаденилирования гена гормона роста человека); правый (второй) ITR.
4. Экспрессионная кассета по п.З, которая включает нуклеиновую кислоту с SEQ ГО
NO: 4.
5. Экспрессионный вектор, который включает кодон-оптимизированную нуклеиновую кислоту по п. 1 или кассету по пп. 2-4.
6. Рекомбинантный вирус на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, который включает капсид и экспрессионную кассету по любому из пп. 2-4.
7. Рекомбинантный вирус на основе AAV9 по п.6, где капсид включает белок VP1
AAV9.
8. Рекомбинантный вирус на основе AAV9 по п.7, где капсид включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5.
9. Рекомбинантный вирус на основе AAV9 по п.7, где капсид включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями.
10. Рекомбинантный вирус на основе AAV9 по пп.6-9, где капсид включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'- конца к З'-концу:
CMV энхансер;
CMV промотер; интрон гена hBGl; кодон-оптимизированную нуклеиновую кислоту по п. 1; сигнал полиаденилирования hGHl; правый ITR.
11. Рекомбинантный вирус на основе AAV9 по п.6, где капсид включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.
12. Фармацевтическая композиция для доставки гена SMN1 в целевые клетки, включающая рекомбинантный вирус на основе AAV9 по пп. 6-11 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.
13. Применение рекомбинантный вируса на основе AAV9 по пп. 6-11 или композиции по п. 12 для доставки гена SMN1 в целевые клетки.
PCT/RU2021/000238 2020-06-02 2021-06-02 Кодон-оптимизированная нуклеиновая кислота, кодирующая белок smn1 WO2021246909A1 (ru)

Priority Applications (14)

Application Number Priority Date Filing Date Title
IL298772A IL298772A (en) 2020-06-02 2021-06-02 Coding-optimized nucleic acid encoding the SMN1 protein and its use
US18/000,612 US20230212609A1 (en) 2020-06-02 2021-06-02 Codon-optimized nucleic acid encoding smn1 protein
CR20220619A CR20220619A (es) 2020-06-02 2021-06-02 Ácido nucleico codón-optimizado que codifica la proteína smn1 y su uso
JP2022574544A JP2023529855A (ja) 2020-06-02 2021-06-02 Smn1タンパク質をコードするコドン最適化した核酸およびその使用
MA58655A MA58655B1 (fr) 2020-06-02 2021-06-02 Acide nucléique optimisé par codons qui code la protéine smn1
CN202180058177.5A CN116234914A (zh) 2020-06-02 2021-06-02 编码smn1蛋白的密码子优化的核酸
MX2022015231A MX2022015231A (es) 2020-06-02 2021-06-02 Acido nucleico codon-optimizado que codifica la proteina smn1 y su uso.
AU2021282898A AU2021282898A1 (en) 2020-06-02 2021-06-02 Codon-optimized nucleic acid encoding SMN1 protein
EP21817607.1A EP4159863A1 (en) 2020-06-02 2021-06-02 Codon-optimized nucleic acid encoding smn1 protein
CA3181288A CA3181288A1 (en) 2020-06-02 2021-06-02 Codon-optimized nucleic acid encoding smn1 protein
PE2022002846A PE20240079A1 (es) 2020-06-02 2021-06-02 Acido nucleico codon-optimizado que codifica la proteina smn1 y su uso
BR112022024708A BR112022024708A2 (pt) 2020-06-02 2021-06-02 Ácido nucleico otimizado por códon que codifica a proteína smn1, cassete de expressão, vetor de expressão, vírus recombinante baseado em aav9 e seu uso e composição farmacêutica para entregar o gene smn1 a células alvo
KR1020227046340A KR20230019162A (ko) 2020-06-02 2021-06-02 Smn1 단백질을 코딩하는 코돈-최적화된 핵산
CONC2022/0017334A CO2022017334A2 (es) 2020-06-02 2022-12-01 Ácido nucleico codón-optimizado que codifica la proteína smn1 y su uso

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2020118148 2020-06-02
RU2020118148A RU2742837C1 (ru) 2020-06-02 2020-06-02 Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок SMN1, и ее применение

Publications (1)

Publication Number Publication Date
WO2021246909A1 true WO2021246909A1 (ru) 2021-12-09

Family

ID=74665909

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2021/000238 WO2021246909A1 (ru) 2020-06-02 2021-06-02 Кодон-оптимизированная нуклеиновая кислота, кодирующая белок smn1

Country Status (21)

Country Link
US (1) US20230212609A1 (ru)
EP (1) EP4159863A1 (ru)
JP (1) JP2023529855A (ru)
KR (1) KR20230019162A (ru)
CN (1) CN116234914A (ru)
AR (1) AR122500A1 (ru)
AU (1) AU2021282898A1 (ru)
BR (1) BR112022024708A2 (ru)
CA (1) CA3181288A1 (ru)
CL (1) CL2022003428A1 (ru)
CO (1) CO2022017334A2 (ru)
CR (1) CR20220619A (ru)
EC (1) ECSP22092206A (ru)
IL (1) IL298772A (ru)
MA (1) MA58655B1 (ru)
MX (1) MX2022015231A (ru)
PE (1) PE20240079A1 (ru)
RU (1) RU2742837C1 (ru)
TW (1) TW202214862A (ru)
UY (1) UY39245A (ru)
WO (1) WO2021246909A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023246734A1 (en) * 2022-06-21 2023-12-28 Skyline Therapeutics (Shanghai) Co., Ltd. Recombinant aav for the gene therapy of sma disease

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117210457A (zh) * 2022-06-10 2023-12-12 拜奥卡德联合股份公司 具有启动子活性的核酸及其用途

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4399216A (en) 1980-02-25 1983-08-16 The Trustees Of Columbia University Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
EP0173177A1 (de) 1984-08-24 1986-03-05 BEHRINGWERKE Aktiengesellschaft Enhancer für eukaryotische Expressionssysteme
US4634665A (en) 1980-02-25 1987-01-06 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
EP0323997A1 (en) 1987-07-23 1989-07-19 Celltech Limited Recombinant dna expression vectors
US5179017A (en) 1980-02-25 1993-01-12 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
WO2017106354A1 (en) * 2015-12-14 2017-06-22 The Trustees Of The University Of Pennsylvania Adeno-associated viral vectors useful in treatment of spinal muscular atropy

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2312896C2 (ru) * 2001-09-20 2007-12-20 Глаксо Груп Лимитед Последовательность нуклеиновой кислоты, кодирующая белок gag вич-1, способ получения указанной последовательности, вектор, содержащий ее, белок, кодируемый ею, фармацевтическая композиция и их применение для профилактики и/или лечения вич-инфекции и спида

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4399216A (en) 1980-02-25 1983-08-16 The Trustees Of Columbia University Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4634665A (en) 1980-02-25 1987-01-06 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US5179017A (en) 1980-02-25 1993-01-12 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
EP0173177A1 (de) 1984-08-24 1986-03-05 BEHRINGWERKE Aktiengesellschaft Enhancer für eukaryotische Expressionssysteme
EP0323997A1 (en) 1987-07-23 1989-07-19 Celltech Limited Recombinant dna expression vectors
WO2017106354A1 (en) * 2015-12-14 2017-06-22 The Trustees Of The University Of Pennsylvania Adeno-associated viral vectors useful in treatment of spinal muscular atropy

Non-Patent Citations (15)

* Cited by examiner, † Cited by third party
Title
GRZEGORZ KUDLA ET AL.: "High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells", PLOS BIOL, vol. 4, June 2006 (2006-06-01), pages 180, Retrieved from the Internet <URL:doi:10.1371/joumal.pbio.0040180,>
GRZEGORZ KUDLA ET AL.: "High Guanine and Cytosine Content Increases mRNA Levels", MAMMALIAN CELLS, vol. 4, June 2006 (2006-06-01), pages 933 - 942, XP002484439, DOI: 10.1371/journal.pbio.0040180
HIGH KA ET AL.: "rAAV human trial experience", METHODS MOL BIOL, vol. 807, 2011, pages 429 - 57
KENNETH I. BERNS: "Parvoviridae: The Viruses and Their Replication", FIELDS VIROLOGY, 1996
LEFEBVRE ET AL., CELL, vol. 80, 1995, pages 155 - 165
MARCO A. PASSINI ET AL.: "Translational Fidelity of Intrathecal Delivery of Self-Complementary AAV9-Survival Motor Neuron 1 for Spinal Muscular Atrophy", HUMAN GENE THERAPY, vol. 25, 2014, XP009522654, DOI: 10.1089/hum.2014.011 *
MCLAUGHLIN ET AL., J. VIROL, vol. 62, 1988, pages 1963 - 1973
MICHAEL ZUKER ET AL.: "Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information", NUCLEIC ACIDS RESEARCH, vol. 9, 10 January 1981 (1981-01-10), pages 133 - 148, XP003010680, DOI: 10.1093/nar/9.1.133
MORI S. ET AL.: "Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein", VIROLOGY, vol. 330, no. 2, 2004, pages 375 - 83, XP004676906, DOI: 10.1016/j.virol.2004.10.012 *
MORI, S ET AL.: "Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein", VIROLOGY, T, vol. 330, no. 2, 2004, pages 375 - 83, XP004676906, DOI: 10.1016/j.virol.2004.10.012
PAUL M. SHARP ET AL.: "The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications", NUCLEIC ACIDS RESEARCH, vol. 15, 11 February 1987 (1987-02-11), pages 1281 - 1295
SAMBROOK J. ET AL.: "Molecular cloning: A laboratory manual", 1989, COLD SPRING HARBOR LABORATORY PRESS
SUMNER C.J., NEURORX, vol. 3, 2006, pages 235 - 245
XIE Q. ET AL.: "The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy", PROC NATL ACAD SCI USA, vol. 99, 2002, pages 10405 - 10410, XP002255705, DOI: 10.1073/pnas.162250899
YASUKAZU NAKAMURA ET AL.: "Codon usage tabulated from the international DNA sequence databases", NUCLEIC ACIDS RESEARCH, vol. 27, no. 1, 1999, XP002310066, Retrieved from the Internet <URL:doi:10,1093/nar/27,1,292)>

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023246734A1 (en) * 2022-06-21 2023-12-28 Skyline Therapeutics (Shanghai) Co., Ltd. Recombinant aav for the gene therapy of sma disease

Also Published As

Publication number Publication date
CL2022003428A1 (es) 2023-06-09
MA58655A1 (fr) 2023-06-28
MA58655B1 (fr) 2023-12-29
PE20240079A1 (es) 2024-01-16
US20230212609A1 (en) 2023-07-06
MX2022015231A (es) 2023-02-09
CN116234914A (zh) 2023-06-06
CA3181288A1 (en) 2021-12-09
AU2021282898A1 (en) 2023-02-02
AR122500A1 (es) 2022-09-14
CR20220619A (es) 2023-06-14
BR112022024708A2 (pt) 2023-04-11
RU2742837C1 (ru) 2021-02-11
UY39245A (es) 2021-12-31
ECSP22092206A (es) 2023-01-31
TW202214862A (zh) 2022-04-16
JP2023529855A (ja) 2023-07-12
IL298772A (en) 2023-02-01
KR20230019162A (ko) 2023-02-07
CO2022017334A2 (es) 2023-04-17
EP4159863A1 (en) 2023-04-05

Similar Documents

Publication Publication Date Title
US10413598B2 (en) Factor IX gene therapy
US11891616B2 (en) Transgene cassettes designed to express a human MECP2 gene
WO2021246909A1 (ru) Кодон-оптимизированная нуклеиновая кислота, кодирующая белок smn1
RU2751592C2 (ru) Выделенный модифицированный белок VP1 капсида аденоассоциированного вируса 5 серотипа (AAV5), капсид и вектор на его основе
US20240091383A1 (en) Synergistic effect of smn1 and mir-23a in treating spinal muscular atrophy
EA045749B1 (ru) Кодон-оптимизированная нуклеиновая кислота, кодирующая белок smn1, и ее применение
WO2021108468A1 (en) Novel aav3b variants that target human hepatocytes in the liver of humanized mice
OA21075A (en) Codon-optimized nucleic acid that encodes SMN1 protein, and use thereof
WO2023022634A1 (ru) Выделенный модифицированный белок vp1 капсида aav9
WO2023022633A1 (ru) Выделенный модифицированный белок vp1 капсида aav5
EA045824B1 (ru) Выделенный модифицированный белок vp1 капсида aav5
WO2023111106A1 (en) Fukutin related protein gene transfer increase using modified itr sequences
WO2023133593A2 (en) Aav5 capsid variants
WO2024050547A2 (en) Compact bidirectional promoters for gene expression
WO2024015877A2 (en) Novel aav3b capsid variants with enhanced hepatocyte tropism

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21817607

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022574544

Country of ref document: JP

Kind code of ref document: A

Ref document number: 3181288

Country of ref document: CA

ENP Entry into the national phase

Ref document number: 20227046340

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112022024708

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 2021817607

Country of ref document: EP

Effective date: 20230102

ENP Entry into the national phase

Ref document number: 2021282898

Country of ref document: AU

Date of ref document: 20210602

Kind code of ref document: A

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112022024708

Country of ref document: BR

Free format text: APRESENTAR NOVO CONTEUDO ELETRONICO DE LISTAGEM DE SEQUENCIAS BIOLOGICAS, COM A INCLUSAO DOS CAMPOS 140-141, CONFORME PORTARIA INPI 405/2020, ANEXO I, ITEM 5.5.

ENP Entry into the national phase

Ref document number: 112022024708

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20221202

WWE Wipo information: entry into national phase

Ref document number: 522441592

Country of ref document: SA