EA045749B1 - CODON-OPTIMIZED NUCLEIC ACID ENCODING THE SMN1 PROTEIN AND ITS APPLICATION - Google Patents
CODON-OPTIMIZED NUCLEIC ACID ENCODING THE SMN1 PROTEIN AND ITS APPLICATION Download PDFInfo
- Publication number
- EA045749B1 EA045749B1 EA202293188 EA045749B1 EA 045749 B1 EA045749 B1 EA 045749B1 EA 202293188 EA202293188 EA 202293188 EA 045749 B1 EA045749 B1 EA 045749B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- aav9
- smn1
- gene
- nucleic acid
- seq
- Prior art date
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims description 77
- 102000039446 nucleic acids Human genes 0.000 title claims description 59
- 108020004707 nucleic acids Proteins 0.000 title claims description 59
- 102100021947 Survival motor neuron protein Human genes 0.000 title claims description 7
- 101000617738 Homo sapiens Survival motor neuron protein Proteins 0.000 title 1
- 210000004027 cell Anatomy 0.000 claims description 104
- 108090000623 proteins and genes Proteins 0.000 claims description 100
- 230000014509 gene expression Effects 0.000 claims description 93
- 241000700605 Viruses Species 0.000 claims description 63
- 102000004169 proteins and genes Human genes 0.000 claims description 51
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 48
- 101150081851 SMN1 gene Proteins 0.000 claims description 47
- 210000000234 capsid Anatomy 0.000 claims description 42
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 35
- 241000701022 Cytomegalovirus Species 0.000 claims description 32
- 101710132601 Capsid protein Proteins 0.000 claims description 30
- 101710197658 Capsid protein VP1 Proteins 0.000 claims description 30
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 claims description 30
- 101710108545 Viral protein 1 Proteins 0.000 claims description 30
- 230000035772 mutation Effects 0.000 claims description 28
- 239000003623 enhancer Substances 0.000 claims description 19
- 239000000203 mixture Substances 0.000 claims description 19
- 239000013604 expression vector Substances 0.000 claims description 17
- 230000008488 polyadenylation Effects 0.000 claims description 16
- 241000702421 Dependoparvovirus Species 0.000 claims description 14
- 239000008194 pharmaceutical composition Substances 0.000 claims description 13
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 11
- 101000801619 Homo sapiens Long-chain-fatty-acid-CoA ligase ACSBG1 Proteins 0.000 claims description 9
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 9
- 101710195291 Hemoglobin subunit gamma-1 Proteins 0.000 claims description 4
- 108010000521 Human Growth Hormone Proteins 0.000 claims description 4
- 101710171779 Survival motor neuron protein Proteins 0.000 claims description 4
- 235000018102 proteins Nutrition 0.000 description 44
- 239000013598 vector Substances 0.000 description 36
- 108020004414 DNA Proteins 0.000 description 33
- 239000002773 nucleotide Substances 0.000 description 32
- 125000003729 nucleotide group Chemical group 0.000 description 32
- 108020004705 Codon Proteins 0.000 description 30
- 108090000765 processed proteins & peptides Proteins 0.000 description 24
- 230000003612 virological effect Effects 0.000 description 22
- 108020004999 messenger RNA Proteins 0.000 description 20
- 238000000034 method Methods 0.000 description 20
- 238000013518 transcription Methods 0.000 description 19
- 230000035897 transcription Effects 0.000 description 19
- 101000805768 Banna virus (strain Indonesia/JKT-6423/1980) mRNA (guanine-N(7))-methyltransferase Proteins 0.000 description 18
- 101000686790 Chaetoceros protobacilladnavirus 2 Replication-associated protein Proteins 0.000 description 18
- 101000864475 Chlamydia phage 1 Internal scaffolding protein VP3 Proteins 0.000 description 18
- 101000803553 Eumenes pomiformis Venom peptide 3 Proteins 0.000 description 18
- 101000583961 Halorubrum pleomorphic virus 1 Matrix protein Proteins 0.000 description 18
- 101710081079 Minor spike protein H Proteins 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 17
- 102000004196 processed proteins & peptides Human genes 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 16
- 238000010361 transduction Methods 0.000 description 15
- 230000026683 transduction Effects 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 14
- 239000002245 particle Substances 0.000 description 14
- 229940024606 amino acid Drugs 0.000 description 13
- 229920001184 polypeptide Polymers 0.000 description 13
- 230000010076 replication Effects 0.000 description 13
- 238000001890 transfection Methods 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 11
- 238000005457 optimization Methods 0.000 description 10
- 108091033319 polynucleotide Chemical group 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 239000002157 polynucleotide Chemical group 0.000 description 10
- 238000006467 substitution reaction Methods 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 238000001415 gene therapy Methods 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 7
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 7
- 108020004682 Single-Stranded DNA Proteins 0.000 description 7
- 208000015181 infectious disease Diseases 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 208000002320 spinal muscular atrophy Diseases 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 239000013607 AAV vector Substances 0.000 description 5
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 5
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 5
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 5
- 108090000565 Capsid Proteins Proteins 0.000 description 4
- 102100023321 Ceruloplasmin Human genes 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 241000701945 Parvoviridae Species 0.000 description 4
- 108700019146 Transgenes Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000000684 flow cytometry Methods 0.000 description 4
- 230000002458 infectious effect Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000003381 stabilizer Substances 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 3
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 3
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 3
- 108091034117 Oligonucleotide Chemical group 0.000 description 3
- 101710172711 Structural protein Proteins 0.000 description 3
- 239000004480 active ingredient Substances 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 210000003169 central nervous system Anatomy 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010195 expression analysis Methods 0.000 description 3
- 229930195712 glutamate Natural products 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 210000002161 motor neuron Anatomy 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 101150057323 sar gene Proteins 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- -1 without limitation Proteins 0.000 description 3
- 239000012103 Alexa Fluor 488 Substances 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 101150066002 GFP gene Proteins 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- 101150113275 Smn gene Proteins 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 238000011194 good manufacturing practice Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 210000003061 neural cell Anatomy 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 229960004295 valine Drugs 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- YUXKOWPNKJSTPQ-AXWWPMSFSA-N (2s,3r)-2-amino-3-hydroxybutanoic acid;(2s)-2-amino-3-hydroxypropanoic acid Chemical compound OC[C@H](N)C(O)=O.C[C@@H](O)[C@H](N)C(O)=O YUXKOWPNKJSTPQ-AXWWPMSFSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 1
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 1
- MECFLTFREHAZLH-ACZMJKKPSA-N Asn-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N MECFLTFREHAZLH-ACZMJKKPSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 101150074155 DHFR gene Proteins 0.000 description 1
- 102100033697 DNA cross-link repair 1A protein Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241000121256 Densovirinae Species 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101150112014 Gapdh gene Proteins 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000871548 Homo sapiens DNA cross-link repair 1A protein Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 241001045988 Neogene Species 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 241000121250 Parvovirinae Species 0.000 description 1
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000030934 Restrictive pulmonary disease Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- GLNADSQYFUSGOU-GPTZEZBUSA-J Trypan blue Chemical compound [Na+].[Na+].[Na+].[Na+].C1=C(S([O-])(=O)=O)C=C2C=C(S([O-])(=O)=O)C(/N=N/C3=CC=C(C=C3C)C=3C=C(C(=CC=3)\N=N\C=3C(=CC4=CC(=CC(N)=C4C=3O)S([O-])(=O)=O)S([O-])(=O)=O)C)=C(O)C2=C1N GLNADSQYFUSGOU-GPTZEZBUSA-J 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000013377 clone selection method Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000009109 curative therapy Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009025 developmental regulation Effects 0.000 description 1
- GQOKIYDTHHZSCJ-UHFFFAOYSA-M dimethyl-bis(prop-2-enyl)azanium;chloride Chemical compound [Cl-].C=CC[N+](C)(C)CC=C GQOKIYDTHHZSCJ-UHFFFAOYSA-M 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000010212 intracellular staining Methods 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 150000002614 leucines Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 230000032405 negative regulation of neuron apoptotic process Effects 0.000 description 1
- 101150091879 neo gene Proteins 0.000 description 1
- 210000001178 neural stem cell Anatomy 0.000 description 1
- 208000018360 neuromuscular disease Diseases 0.000 description 1
- 244000309711 non-enveloped viruses Species 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000009116 palliative therapy Methods 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 210000001428 peripheral nervous system Anatomy 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000007180 physiological regulation Effects 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 238000009117 preventive therapy Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 210000005267 prostate cell Anatomy 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 239000013608 rAAV vector Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000009747 swallowing Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 230000001256 tonic effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Description
Область техникиField of technology
Настоящее изобретение относится к области генетики, генной терапии и молекулярной биологии. Более конкретно, настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных (двигательных) нейронов), экспрессионной кассете и вектору на ее основе, а также к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках и их применению.The present invention relates to the fields of genetics, gene therapy and molecular biology. More specifically, the present invention relates to an isolated codon-optimized nucleic acid that encodes the SMN1 (motor neuron survival protein) protein, an expression cassette and a vector based thereon, as well as a recombinant virus based on AAV9 (adeno-associated virus serotype 9) to increase the expression of the SMN1 gene in target cells and their application.
Уровень техникиState of the art
Спинальная мышечная атрофия (SMA) представляет собой аутосомное рецессивное нервномышечное нарушение, вызванное мутациями в гене выживаемости моторных (двигательных) нейронов 1 (SMN1) и утратой кодируемого SMN белка (Lefebvre et al., Cell (1995).ю 80:155-165). Отсутствие SMN ведет к дегенерации двигательных нейронов в брюшном (переднем) роге спинного мозга, что ведет к слабости проксимальных мышц, отвечающих за ползание, ходьбу, движение шеи и глотание, и непроизвольно сокращающихся мышц, которые управляют дыханием и кашлем (Sumner C.J., NeuroRx (2006), 3:235-245). Таким образом, пациенты с SMA предрасположены к пневмониям и другим пульмональным проблемам, таким как рестриктивное легочное заболевание.Spinal muscular atrophy (SMA) is an autosomal recessive neuromuscular disorder caused by mutations in the survival motor neuron 1 (SMN1) gene and loss of the SMN-encoded protein (Lefebvre et al., Cell (1995). 80:155-165) . The absence of SMN leads to degeneration of motor neurons in the ventral (anterior) horn of the spinal cord, which leads to weakness of the proximal muscles responsible for crawling, walking, neck movement and swallowing, and the involuntary muscles that control breathing and coughing (Sumner C.J., NeuroRx ( 2006), 3:235-245). Thus, patients with SMA are predisposed to pneumonia and other pulmonary problems such as restrictive pulmonary disease.
Генная терапия представляет собой перспективный способ лечения спинальной мышечной атрофии (SMA).Gene therapy represents a promising treatment option for spinal muscular atrophy (SMA).
Аденоассоциированные вирусные (AAV) векторы считаются эффективными для генной терапии ЦНС, поскольку они обладают подходящим профилем токсичности и иммуногенности, их можно использовать в трансдукции нервных клеток, и они способны опосредовать длительную экспрессию в ЦНС.Adeno-associated viral (AAV) vectors are considered effective for CNS gene therapy because they have a suitable toxicity and immunogenicity profile, can be used in neural cell transduction, and are capable of mediating long-lasting expression in the CNS.
Аденоассоциированный вирус (AAV) представляет собой небольшой (20 нм), неспособный к самостоятельной репликации, безоболочечный вирус. У человека и приматов описано множество различных серотипов AAV. Геном аденоассоциированного вируса содержит (+ или -) одноцепочечную ДНК (ssDNA) длиной около 4,7 тысяч нуклеотидов. На концах молекулы геномной ДНК располагаются инвертированные концевые повторы (англ. inverted terminal repeats, ITRs). Геном содержит две открытые рамки считывания (англ. ORF): Rep и Сар, содержащие в себе несколько альтернативных рамок считывания, кодирующих различные белковые продукты. Продукты Rep имеют важное значение для репликации AAV, при этом ген Сар, помимо других альтернативных продуктов, кодирует 3 капсидных белка (VP1, VP2 и VP3). Белки VP1, VP2 и VP3 находятся в соотношении 1:1:10, образуя икосаэдрический капсид (Xie Q. et al., The atomic structure of adeno-associated vims (AAV-2), a vector for human gene therapy, Proc. Natl. Acad. Sci., USA, 2002, 99:10405-10410). При образовании рекомбинантного вектора AAV (rAAV) кассета экспрессии, фланкированная ITR, упаковывается в капсид AAV. Гены, необходимые для репликации AAV, не входят в кассету. Рекомбинантный AAV считается самым безопасным и одним из наиболее широко используемых вирусных векторов для переноса генов in vivo. Векторы могут инфицировать клетки из тканей множества типов, обеспечивая мощную и устойчивую трансгенную экспрессию. Они также являются непатогенными и имеют низкий профиль иммуногенности (High K.A. et al., rAAV human trial experience, Methods Mol. Biol., 2011, 807:429-57).Adeno-associated virus (AAV) is a small (20 nm), non-replicating, non-enveloped virus. Many different serotypes of AAV have been described in humans and primates. The genome of the adeno-associated virus contains (+ or -) single-stranded DNA (ssDNA) about 4.7 thousand nucleotides in length. At the ends of the genomic DNA molecule there are inverted terminal repeats (ITRs). The genome contains two open reading frames (ORFs): Rep and Car, which contain several alternative reading frames encoding various protein products. Rep products are essential for AAV replication, with the Cap gene encoding 3 capsid proteins (VP1, VP2, and VP3) among other alternative products. Proteins VP1, VP2 and VP3 are in a ratio of 1:1:10, forming an icosahedral capsid (Xie Q. et al., The atomic structure of adeno-associated vims (AAV-2), a vector for human gene therapy, Proc. Natl Acad. Sci., USA, 2002, 99:10405-10410). During the formation of a recombinant AAV vector (rAAV), an ITR-flanked expression cassette is packaged into the AAV capsid. Genes required for AAV replication are not included in the cassette. Recombinant AAV is considered the safest and one of the most widely used viral vectors for in vivo gene transfer. Vectors can infect cells from a variety of tissue types, providing potent and sustained transgene expression. They are also non-pathogenic and have a low immunogenicity profile (High K.A. et al., rAAV human trial experience, Methods Mol. Biol., 2011, 807:429-57).
Одной из насущных целей исследований в области разработки эффективной генотерапии является кодон-оптимизация генов интереса в составе векторов для получения максимального уровня экспрессии генов интереса, что, в свою очередь, позволит использовать для достижения значимого эффекта более низкие дозы вектора.One of the urgent goals of research in the development of effective gene therapy is codon optimization of genes of interest in vectors to obtain the maximum level of expression of genes of interest, which, in turn, will allow the use of lower doses of the vector to achieve a significant effect.
Одним из свойств генетического кода является вырожденность - способность разных кодонов (тринуклеотидов) кодировать одну и ту же аминокислоту. Такие кодоны, которые дают одну и ту же аминокислоту в процессе трансляции, называются синонимичными. В природных последовательностях выбор одного из синонимичных кодонов осуществляется случайным образом в процессе эволюции, однако частоты использования синонимичных кодонов отличаются: для каждой аминокислоты есть более и менее предпочтительные. Кодон-оптимизация - это широко используемая в мире техника, направленная на повышение продуктивности наработки белковых молекул, которая заключается в рациональном сопоставлении каждой аминокислоте в белковой последовательности одного из подходящих синонимичных кодонов. Один из распространенных принципов кодон-оптимизации подразумевает использование наиболее частых кодонов, впоследствии были предложены и другие подходы, такие как гармонизация (воспроизведение распределения частот используемых кодонов), но и они не всегда дают увеличение продуктивности. Помимо частот кодонов на эффективность наработки может влиять GC-состав последовательности (отношение количества гуанинов и цитозинов к суммарной длине последовательности), в частности, было показано, что завышенный GC-состав ассоциирован с повышением количества мРНК в клетках млекопитающих Grzegorz Kudla ET AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, volume 4, issue 6, e180, p. 933-942). Также стоит отметить, что устойчивые элементы вторичной структуры мРНК, т.е. имеющие низкую свободную энергию фолдинга, могут снижать эффективность.One of the properties of the genetic code is degeneracy - the ability of different codons (trinucleotides) to encode the same amino acid. Such codons that give the same amino acid during translation are called synonymous. In natural sequences, the choice of one of the synonymous codons is carried out randomly in the process of evolution, but the frequencies of use of synonymous codons differ: for each amino acid there are more and less preferable ones. Codon optimization is a technique widely used in the world aimed at increasing the productivity of protein molecules, which consists in rationally matching each amino acid in the protein sequence with one of the suitable synonymous codons. One of the common principles of codon optimization involves the use of the most frequent codons; subsequently, other approaches were proposed, such as harmonization (reproducing the distribution of frequencies of used codons), but they do not always increase productivity. In addition to codon frequencies, the production efficiency can be influenced by the GC composition of the sequence (the ratio of the number of guanines and cytosines to the total length of the sequence); in particular, it has been shown that an increased GC composition is associated with an increase in the amount of mRNA in mammalian cells Grzegorz Kudla ET AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, volume 4, issue 6, e180, p. 933-942). It is also worth noting that stable elements of the secondary structure of mRNA, i.e. having low free energy of folding may reduce efficiency.
Различные варианты кодон-оптимизации последовательности гена интереса могут приводить к следующему (в сравнение с геном дикого типа):Various options for codon optimization of the sequence of the gene of interest can lead to the following (compared to the wild type gene):
- 1 045749- 1 045749
а) уровень экспрессии генов интереса будет незначительно увеличен;a) the level of expression of genes of interest will be slightly increased;
б) уровень экспрессии генов интереса будет значительно увеличен;b) the level of expression of genes of interest will be significantly increased;
в) уровень экспрессии генов интереса останется приблизительно на том же уровне;c) the level of expression of genes of interest will remain approximately at the same level;
г) уровень экспрессии генов интереса будет понижен.d) the level of expression of genes of interest will be reduced.
Таким образом, есть потребность в получении кодон-оптимизированной последовательности гена SMN1 для увеличения экспрессии гена SMN1 в целевых клетках.Thus, there is a need to obtain a codon-optimized sequence of the SMN1 gene to increase the expression of the SMN1 gene in target cells.
Было установлено, что кодон-оптимизированная последовательность SMN1 (SMN1-GeneBeam (или сокращенно SMN1-GB)), которая имеет нуклеотидную последовательность SEQ ID NO: 2, неожиданно увеличивает транскрипцию гена SMN1 более чем в 3 раза, т.е. неожиданно увеличивает количество копий мРНК SMN1-GeneBeam в более чем 3 раза по сравнению с SMN1-WT (дикого типа), что в свою очередь приводит к значительному увеличению экспрессии гена SMN1 и, соответственно SMN белка.It was found that the codon-optimized sequence of SMN1 (SMN1-GeneBeam (or SMN1-GB for short)), which has the nucleotide sequence SEQ ID NO: 2, unexpectedly increases the transcription of the SMN1 gene by more than 3-fold, i.e. unexpectedly increases the number of copies of SMN1-GeneBeam mRNA by more than 3 times compared to SMN1-WT (wild type), which in turn leads to a significant increase in the expression of the SMN1 gene and, accordingly, SMN protein.
Краткое описание изобретенияBrief description of the invention
В одном из аспектов настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных нейронов) с SEQ ID NO: 1, и включает последовательность нуклеиновой кислоты SEQ ID NO: 2.In one aspect, the present invention provides an isolated codon-optimized nucleic acid that encodes the SMN1 (survival motor neuron protein) protein of SEQ ID NO: 1, and includes the nucleic acid sequence of SEQ ID NO: 2.
В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту.In one aspect, the present invention provides an expression cassette that includes the above codon-optimized nucleic acid.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the expression cassette includes the following elements in a 5' to 3' direction:
левый (первый) ITR (инвертированные концевые повторы);left (first) ITR (inverted terminal repeats);
CMV (цитомегаловирусный) энхансер;CMV (cytomegalovirus) enhancer;
CMV (цитомегаловирусный) промотер;CMV (cytomegalovirus) promoter;
интрон гена hBG1 (ген субъединицы гемоглобина гамма-1);intron of the hBG1 gene (hemoglobin subunit gamma-1 gene);
вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;
сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека); правый (второй) ITR.hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal); right (second) ITR.
В некоторых вариантах экспрессионная кассета включает нуклеиновую кислоту с последовательностью SEQ ID NO: 4.In some embodiments, the expression cassette includes a nucleic acid having the sequence of SEQ ID NO: 4.
В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту или вышеуказанную кассету.In one aspect, the present invention relates to an expression vector that includes the above codon-optimized nucleic acid or cassette.
В одном из аспектов настоящее изобретение относится к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, который включает капсид и вышеуказанную экспрессионную кассету.In one aspect, the present invention relates to a recombinant virus based on AAV9 (adeno-associated virus serotype 9) for increasing the expression of the SMN1 gene in target cells, which includes a capsid and the above expression cassette.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5.In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the following elements in the direction from 5 '-end to 3'-end:
CMV энхансер;CMV enhancer;
CMV промотер;CMV promoter;
интрон гена hBG1;hBG1 gene intron;
вышеуказанную кодон-оптимизированную нуклеиновую кислоту гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;
сигнал полиаденилирования hGH1;hGH1 polyadenylation signal;
правый ITR.right ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: : 4.
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для доставки гена SMN1 в целевые клетки, которая включает вышеуказанный рекомбинантный вирус на основе AAV9 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.In one aspect, the present invention relates to a pharmaceutical composition for delivering the SMN1 gene to target cells, which includes the above-mentioned AAV9-based recombinant virus in combination with one or more pharmaceutically acceptable excipients.
В одном из аспектов настоящее изобретение относится к применению вышеуказанного рекомбинантного вируса на основе AAV9 или вышеуказанной композиции для доставки гена SMN1 в целевые клетки.In one aspect, the present invention relates to the use of the above recombinant AAV9 virus or the above composition for delivering the SMN1 gene to target cells.
Краткое описание чертежейBrief description of drawings
На фиг. 1 показана экспрессия SMN1 на уровне мРНК после трансфекции. Клетки HEK293 и HSMCIn fig. Figure 1 shows SMN1 expression at the mRNA level after transfection. HEK293 and HSMC cells
- 2 045749 были трансфецированы 5 мкг плазмид pAAV-SMN1-WT и pAAV-SMN1-GB (кодирующих ген SMN1 без кодон-оптимизации и с кодон-оптимизацией по алгоритму GeneBeam). Через 72 ч количество копий гена SMN1 в каждом образце было определено с помощью количественной ПЦР (n=3). Также было определено количество копий гена домашнего хозяйства GAPDH. Все полученные количества для SMN1 были нормализованы на 10000 копий гена GAPDH в каждом образце. Представлены данные по нормализованному среднему количеству копий SMN1-WT, SMN-GB для обеих клеточных линий, с указанием стандартного отклонения. Также представлено соотношение нормализованного количества копий SMN1-GB и SMN1-WT в каждой линии.- 2 045749 were transfected with 5 μg of plasmids pAAV-SMN1-WT and pAAV-SMN1-GB (encoding the SMN1 gene without codon optimization and with codon optimization using the GeneBeam algorithm). After 72 h, the copy number of the SMN1 gene in each sample was determined using quantitative PCR (n=3). The copy number of the housekeeping gene GAPDH was also determined. All obtained quantities for SMN1 were normalized to 10,000 copies of the GAPDH gene in each sample. Data are presented on the normalized mean copy number of SMN1-WT, SMN-GB for both cell lines, with standard deviation indicated. The ratio of normalized copy numbers of SMN1-GB and SMN1-WT in each line is also presented.
На фиг. 2 показана экспрессия SMN1 на уровне белка после трансфекции. Клетки HSMC были трансфецированы 5 мкг плазмид pAAV-SMN1-WT и pAAV-SMN1-GB (кодирующих ген SMN1 без кодон-оптимизации и с кодон-оптимизацией по алгоритму GeneBeam). Через 72 ч клетки были покрашены первичными антителами к белку SMN1 и вторичными антителами, мечеными Alexa Fluor 488, в каждом образце (n=3). Представлена средняя интенсивность флуоресцентного сигнала для живых клеток в образцах за вычетом фонового сигнала, полученного на клетках, окрашенных вторичными антителами без первичных антител, с указанием стандартного отклонения.In fig. Figure 2 shows the expression of SMN1 at the protein level after transfection. HSMC cells were transfected with 5 μg of plasmids pAAV-SMN1-WT and pAAV-SMN1-GB (encoding the SMN1 gene without codon optimization and with codon optimization using the GeneBeam algorithm). After 72 h, cells were stained with primary antibodies to the SMN1 protein and secondary antibodies labeled with Alexa Fluor 488 in each sample (n=3). The average fluorescent signal intensity for live cells in the samples minus the background signal obtained from cells stained with secondary antibodies without primary antibodies is presented, with the standard deviation indicated.
На фиг. 3 показано соотношение экспрессии SMN1 на уровне мРНК и белка после трансдукции. Клетки HSMC были трансдуцированы вирусами AAV9-SMN1-WT и AAV9-SMN1-GB в 3 независимых экспериментах, в каждом из которых эффективность трансдукции составила не менее 50% по контрольному GFP-содержащему вирусу. Экспрессия SMN1 была определена на уровне мРНК и белка (см. выше), после чего посчитано соотношение экспрессии SMN1-GB и SMN1-WT. Средние соотношения вместе со стандартными отклонениями представлены на фигуре.In fig. Figure 3 shows the ratio of SMN1 expression at the mRNA and protein levels after transduction. HSMC cells were transduced with AAV9-SMN1-WT and AAV9-SMN1-GB viruses in 3 independent experiments, in each of which the transduction efficiency was at least 50% of the control GFP-containing virus. SMN1 expression was determined at the mRNA and protein levels (see above), after which the ratio of SMN1-GB and SMN1-WT expression was calculated. The average ratios along with standard deviations are presented in the figure.
Определения и общие методыDefinitions and general methods
Если иное не определено в настоящем изобретении, научные и технические термины, используемые в связи с настоящим изобретением, будут иметь значения, которые обычно понятны специалистам в данной области.Unless otherwise defined in the present invention, scientific and technical terms used in connection with the present invention will have the meanings that are commonly understood by those skilled in the art.
Кроме того, если по контексту не требуется иное, термины в единственном числе включают в себя термины во множественном числе, и термины во множественном числе включают в себя термины в единственном числе. Как правило, используемая классификация и методы культивирования клеток, молекулярной биологии, иммунологии, микробиологии, генетики, аналитической химии, химии органического синтеза, медицинской и фармацевтической химии, а также гибридизации и химии белка и нуклеиновых кислот, описанные в настоящем изобретении, хорошо известны специалистам и широко применяются в данной области. Ферментативные реакции и способы очистки осуществляют в соответствии с инструкциями производителя, как это обычно осуществляется в данной области, или как описано в настоящем изобретении.In addition, unless the context otherwise requires, terms in the singular include plural terms, and plural terms include singular terms. In general, the classification and methods of cell culture, molecular biology, immunology, microbiology, genetics, analytical chemistry, organic synthesis chemistry, medicinal and pharmaceutical chemistry, as well as hybridization and protein and nucleic acid chemistry described in the present invention are well known to those skilled in the art. widely used in this field. Enzymatic reactions and purification methods are carried out in accordance with the manufacturer's instructions, as is usually carried out in the art, or as described in the present invention.
Выделенный означает измененный или удаленный из природного состояния. Например, нуклеиновая кислота или пептид, в природе присутствующие в животном, не являются выделенными, но те же нуклеиновая кислота или пептид, частично или полностью отделенные от материалов, сопутствующих им в их природном состоянии, являются выделенными. Выделенная нуклеиновая кислота или белок могут существовать, по существу, в очищенной форме или могут существовать в неприродном окружении, таком как, например, генетически модифицированной клетке.Separated means altered or removed from the natural state. For example, a nucleic acid or peptide naturally present in an animal is not isolated, but the same nucleic acid or peptide, partially or completely separated from the materials accompanying it in its natural state, is isolated. The isolated nucleic acid or protein may exist in substantially purified form or may exist in a non-natural environment, such as, for example, a genetically modified cell.
Определения встречающийся в природе, нативный или дикого типа используют для описания объекта, который можно обнаружить в природе как отличающийся от получаемого искусственно. Например, белок или нуклеотидная последовательность, присутствующие в организме (включая вирус), которые можно изолировать из источника в природе, и которые не модифицированы умышленно специалистом в лаборатории, являются встречающимися в природе.The terms naturally occurring, native, or wild type are used to describe an entity that can be found in nature to be different from that produced artificially. For example, a protein or nucleotide sequence present in an organism (including a virus) that can be isolated from a source in nature, and that has not been intentionally modified by a person skilled in the laboratory, is naturally occurring.
Термин геном относится к полному генетическому материалу организма.The term genome refers to the complete genetic material of an organism.
В настоящем описании и в последующей формуле изобретения, если контекстом не предусмотрено иное, слова включать и содержать или их вариации, такие как имеющий, включает, включающий, содержит или содержащий, следует понимать как включение указанного целого или группы целых, но не исключение любого другого целого или группы целых.In the present specification and in the following claims, unless the context otherwise requires, the words include and contain, or variations thereof such as having, comprises, including, contains or containing, are to be understood as including the specified whole or group of wholes, but not excluding any other whole or group of wholes.
Белок (пептид).Protein (peptide).
В настоящем описании, термины пептид, полипептид и белок используют взаимозаменяемо, и они относятся к соединению, состоящему из аминокислотных остатков, ковалентно связанных пептидными связями. Белок или пептид должен содержать по меньшей мере две аминокислоты, и не существует ограничений по максимальному количеству аминокислот, которые может содержать последовательность белка или пептида. Полипептиды включают любой пептид или белок, содержащий две или более аминокислот, соединенных друг с другом пептидными связями. Как применяют в настоящем описании, термин относится и к коротким цепям, также общепринято обозначаемым в этой области, например, как пептиды, олигопептиды и олигомеры, и к более длинным цепям, как правило, обозначаемым в этой области как белки, множество типов которых существует. Полипептиды включают, помимо прочего, например, биологически активные фрагменты, по существу, гомологичные полипептиды, олигопептиды, гомодимеры, гетеродимеры, варианты полипептидов, модифицированные полипептиды, производные,As used herein, the terms peptide, polypeptide and protein are used interchangeably and refer to a compound consisting of amino acid residues covalently linked by peptide bonds. A protein or peptide must contain at least two amino acids, and there is no limit to the maximum number of amino acids that a protein or peptide sequence can contain. Polypeptides include any peptide or protein containing two or more amino acids linked together by peptide bonds. As used herein, the term refers to both short chains, also commonly referred to in the art, such as peptides, oligopeptides and oligomers, and longer chains, generally referred to in the art as proteins, of which there are many types. Polypeptides include, but are not limited to, for example, biologically active fragments, substantially homologous polypeptides, oligopeptides, homodimers, heterodimers, polypeptide variants, modified polypeptides, derivatives,
- 3 045749 аналоги, слитные белки. Полипептиды включают природные пептиды, рекомбинантные пептиды, синтетические пептиды или их комбинацию.- 3 045749 analogues, fusion proteins. Polypeptides include natural peptides, recombinant peptides, synthetic peptides, or a combination thereof.
Молекулы нуклеиновых кислот.Nucleic acid molecules.
Термины нуклеиновая кислота, нуклеиновая последовательность или нуклеиновокислотная последовательность, полинуклеотид, олигонуклеотид, полинуклеотидная последовательность и нуклеотидная последовательность, которые используются равнозначно в данном описании, обозначают четкую последовательность нуклеотидов, модифицированных или не модифицированных, определяющую фрагмент или участок нуклеиновой кислоты, содержащую или не содержащую неприродные нуклеотиды и являющуюся либо двухцепочечной ДНК или РНК, либо одноцепочечной ДНК или РНК, либо продуктами транскрипции указанных ДНК.The terms nucleic acid, nucleic sequence or nucleic acid sequence, polynucleotide, oligonucleotide, polynucleotide sequence and nucleotide sequence, as used interchangeably herein, refer to a distinct sequence of nucleotides, modified or unmodified, defining a fragment or region of nucleic acid, whether or not containing unnatural nucleotides. and being either double-stranded DNA or RNA, or single-stranded DNA or RNA, or transcription products of these DNAs.
Специалист в этой области имеет общие знания о том, что нуклеиновые кислоты являются полинуклеотидами, которые можно гидролизовать до мономерных нуклеотидов. Мономерные нуклеотиды можно гидролизовать в нуклеозиды. Как применяют в настоящем описании, полинуклеотиды включают, в качестве неограничивающих примеров, все последовательности нуклеиновой кислоты, получаемые любыми способами, доступными в этой области, включая, в качестве неограничивающих примеров, рекомбинантные способы, т.е. клонирование последовательностей нуклеиновой кислоты из рекомбинантной библиотеки или генома клетки, использование обычной технологии клонирования и ПЦР и т.п., и способами синтеза.One skilled in the art will have general knowledge that nucleic acids are polynucleotides that can be hydrolyzed to monomeric nucleotides. Monomeric nucleotides can be hydrolyzed into nucleosides. As used herein, polynucleotides include, but are not limited to, all nucleic acid sequences produced by any methods available in the art, including, but not limited to, recombinant methods, i.e. cloning nucleic acid sequences from a recombinant library or cell genome, using conventional cloning and PCR technology, etc., and synthesis methods.
Здесь также следует упомянуть, что данное изобретение не относится к нуклеотидным последовательностям в их природной хромосомной среде, т.е. в природном состоянии. Последовательности данного изобретения были выделены и/или очищены, т.е. были взяты прямо или косвенно, например, путем копирования, при этом их среда была по меньшей мере частично модифицирована. Таким образом, также здесь следует подразумевать изолированные нуклеиновые кислоты, полученные путем генетической рекомбинации, например, с помощью принимающих клеток (клеток-хозяев), или полученные путем химического синтеза.It should also be mentioned here that this invention does not relate to nucleotide sequences in their natural chromosomal environment, i.e. in its natural state. The sequences of the present invention have been isolated and/or purified, i.e. were taken directly or indirectly, for example by copying, and their environment was at least partially modified. Thus, it should also be understood here as isolated nucleic acids obtained by genetic recombination, for example by host cells, or obtained by chemical synthesis.
Выделенная молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, которая идентифицирована и отделена от по меньшей мере одной молекулы нуклеиновой кислотыпримеси, с которой она обычно связана в естественном источнике нуклеиновой кислоты нуклеазы. Выделенная молекула нуклеиновой кислоты отличается от той формы или набора, в которых она находится в естественных условиях. Таким образом, выделенная молекула нуклеиновой кислоты отличается от молекулы нуклеиновой кислоты, существующей в клетках в естественных условиях. Однако выделенная молекула нуклеиновой кислоты включает молекулу нуклеиновой кислоты, находящуюся в клетках, в которых в норме происходит экспрессия нуклеазы, например, в случае, если молекула нуклеиновой кислоты имеет локализацию в хромосоме, отличную от ее локализации в клетках в естественных условиях.An isolated nucleic acid molecule is a nucleic acid molecule that has been identified and separated from at least one nucleic acid molecule contaminant with which it is typically associated in a natural nucleic acid source. The isolated nucleic acid molecule differs from the form or set in which it occurs naturally. Thus, the isolated nucleic acid molecule is different from the nucleic acid molecule that naturally exists in cells. However, an isolated nucleic acid molecule includes a nucleic acid molecule found in cells that normally express the nuclease, for example, if the nucleic acid molecule has a chromosomal location that is different from its location in the cells under natural conditions.
Термин нуклеотидная последовательность охватывает его комплемент, если не указано иное. Таким образом, нуклеиновую кислоту, имеющую определенную последовательность следует понимать как охватывающие ее комплементарную цепь с ее комплементарной последовательностью.The term nucleotide sequence covers its complement unless otherwise specified. Thus, a nucleic acid having a specific sequence should be understood as comprising its complementary strand with its complementary sequence.
Термины трасформация, трансфекция, трансдукция относятся к любому способу или средствам, с помощью которых нуклеиновая кислота вводится в клетку или организм-хозяин, и могут быть использованы взаимозаменяемо для передачи аналогичного значения. Такие способы включают в себя без ограничения трансфекцию, электропорацию, микроинъекции, инфицирование, ПЭГ-сплавление и т.п.The terms transformation, transfection, transduction refer to any method or means by which a nucleic acid is introduced into a cell or host organism, and can be used interchangeably to convey a similar meaning. Such methods include, but are not limited to, transfection, electroporation, microinjection, infection, PEG fusion, and the like.
Аденоассоциированный вирус (AAV).Adeno-associated virus (AAV).
Вирусы семейства Parvoviridae представляют собой небольшие ДНК-содержащие вирусы животных. Семейство Parvoviridae может быть разделено на два подсемейства: Parvovirinae, представители которого инфицируют позвоночных животных, и Densovirinae, представители которого инфицируют насекомых. К 2006 г. были описаны 11 серотипов аденоассоциированного вируса (Mori, S. et al., 2004, Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein, Virology, T., 330(2):375-83). Все известные серотипы могут инфицировать клетки многих видов тканей. Тканевая специфичность определяется серотипом белков капсида, поэтому векторы на основе аденоассоциированого вируса конструируют, задавая необходимый серотип. Дополнительная информация по парвовирусам и другим представителям Parvoviridae описана в литературе (Kenneth I. Berns, Parvoviridae: The Viruses and Their Replication, chapter 69 in Fields Virology (3d ed. 1996)).Viruses of the Parvoviridae family are small DNA-containing animal viruses. The family Parvoviridae can be divided into two subfamilies: Parvovirinae, whose members infect vertebrates, and Densovirinae, whose members infect insects. By 2006, 11 serotypes of adeno-associated virus had been described (Mori, S. et al., 2004, Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein, Virology, T., 330(2):375-83 ). All known serotypes can infect cells of many tissue types. Tissue specificity is determined by the serotype of the capsid proteins, so vectors based on adeno-associated virus are constructed by specifying the required serotype. Additional information on parvoviruses and other members of the Parvoviridae is described in the literature (Kenneth I. Berns, Parvoviridae: The Viruses and Their Replication, chapter 69 in Fields Virology (3d ed. 1996)).
Геномная организация всех известных серотипов AAV очень сходна. Геном AAV представляет собой линейную одноцепочечную молекулу ДНК, которая содержит менее чем примерно 5000 нуклеотидов (нт) в длину. Инвертированные концевые повторы (ITR) фланкируют уникальные кодирующие нуклеотидные последовательности репликации неструктурных белков (Rep) и структурных белков (Сар). Ген Сар кодирует белки VP (VP1, VP2 и VP3), которые образуют капсид. Концевые 145 нуклеотидов являются самокомплементарными и организованы таким образом, что может быть сформирован энергетически стабильный внутримолекулярный дуплекс, образующий Т-образную шпилечную структуру. Такие шпилечные структуры функционируют как точки начала репликации ДНК вируса, являясь праймерами для клеточного ДНК-полимеразного комплекса. После инфекции клеток млекопитающих AAV дикого типа (wtAAV) гены Rep (например, Rep78 и Rep52) экспрессируются с помощью Р5 промотора иThe genomic organization of all known AAV serotypes is very similar. The AAV genome is a linear, single-stranded DNA molecule that is less than approximately 5,000 nucleotides (nt) in length. Inverted terminal repeats (ITRs) flank the unique replication nucleotide sequences of nonstructural proteins (Rep) and structural proteins (Sp). The Sar gene encodes the VP proteins (VP1, VP2 and VP3), which form the capsid. The terminal 145 nucleotides are self-complementary and are organized in such a way that an energetically stable intramolecular duplex can be formed, forming a T-shaped hairpin structure. Such hairpin structures function as origins of viral DNA replication, serving as primers for the cellular DNA polymerase complex. Following infection of mammalian cells by wild-type AAV (wtAAV), Rep genes (e.g., Rep78 and Rep52) are expressed through the P5 promoter and
- 4 045749- 4 045749
Р19 промотора, соответственно, и оба белка Rep выполняют определенную функцию в репликации генома вируса. Сплайсинг в открытой рамке считывания Rep (Rep ORF) приводит к экспрессии фактически четырех белков Rep (например, Rep78, Rep68, Rep52 и Rep40). Однако было показано, что несплайсированная мРНК, кодирующая белки Rep78 и Rep52, является достаточной для продукции вектора AAV в клетках млекопитающих.The P19 promoter, respectively, and both Rep proteins perform a specific function in the replication of the viral genome. Splicing in the Rep open reading frame (Rep ORF) results in the expression of essentially four Rep proteins (e.g., Rep78, Rep68, Rep52, and Rep40). However, unspliced mRNA encoding the Rep78 and Rep52 proteins has been shown to be sufficient for AAV vector production in mammalian cells.
Вектор.Vector.
Термин вектор при использовании в настоящем изобретении означает молекулу нуклеиновой кислоты, способную транспортировать другую нуклеиновую кислоту, с которой она соединена.The term vector as used in the present invention means a nucleic acid molecule capable of transporting another nucleic acid to which it is linked.
Термины инфекционная единица (ие), инфекционная частица или репликационная единица, как используется в отношении вирусного титра, относятся к числу инфекционных частиц рекомбинантного вектора AAV, которое измеряют посредством анализа инфекционных центров, также известного как анализ репликационных центров, описанный, например, в публикации McLaughlin et al., J. Virol. (1988), 62:1963-1973.The terms infectious unit(s), infectious particle, or replication unit, as used in relation to viral titer, refer to the number of infectious particles of a recombinant AAV vector, which is measured by an infectious center assay, also known as a replication center assay, as described, for example, in McLaughlin et al., J. Virol. (1988), 62:1963-1973.
Термин гетерологичный, когда он относится к последовательностям нуклеиновых кислот, таким как кодирующие последовательности и последовательности регуляции, обозначает последовательности, которые обычно не соединены вместе и/или обычно не связаны с конкретной клеткой. Таким образом, гетерологичная область конструкции нуклеиновой кислоты или вектора представляет собой фрагмент нуклеиновой кислоты, расположенный внутри или присоединенный к другой молекуле нуклеиновой кислоты, которая в природе не найдена совместно с другой молекулой. Например, гетерологичная область конструкции нуклеиновой кислоты может содержать кодирующую последовательность, фланкированную последовательностями, которые в природе не найдены совместно с кодирующей последовательностью. Другой пример гетерологичной кодирующей последовательности представляет собой конструкцию, где сама кодирующая последовательность не найдена в природе (например, синтетические последовательности, которые содержат кодоны, отличные от нативного гена).The term heterologous, when referring to nucleic acid sequences such as coding sequences and regulatory sequences, refers to sequences that are not typically linked together and/or are not typically associated with a particular cell. Thus, a heterologous region of a nucleic acid or vector construct is a fragment of a nucleic acid located within or attached to another nucleic acid molecule that is not naturally found together with another molecule. For example, a heterologous region of a nucleic acid construct may contain a coding sequence flanked by sequences that are not naturally found in association with the coding sequence. Another example of a heterologous coding sequence is a construct where the coding sequence itself is not found in nature (eg, synthetic sequences that contain codons different from the native gene).
Как применяют в настоящем описании, термин экспрессия определяют как транскрипцию и/или трансляцию конкретной нуклеотидной последовательности, запускаемую ее промотором.As used herein, the term expression is defined as the transcription and/or translation of a particular nucleotide sequence driven by its promoter.
Применение.Application.
Генная терапия представляет собой вставку генов в клетки и/или тканей субъекта для лечения заболевания, обычно, наследственных заболеваний, при этом дефектный мутантный аллель заменяется или дополняется функциональным аллелем.Gene therapy is the insertion of genes into the cells and/or tissues of a subject to treat a disease, usually an inherited disease, whereby a defective mutant allele is replaced or supplemented with a functional allele.
Лечить, лечение и терапия относятся к методу смягчения или устранения биологического расстройства и/или по меньшей мере одного из сопутствующих ему симптомов. Используемый в данном изобретении термин облегчить болезнь, заболевание или состояние, означает уменьшение тяжести и/или частоты возникновения симптомов заболевания, расстройства или состояния. Кроме того, содержащиеся в данном изобретении ссылки на лечение включает ссылки на лечебную, паллиативную и профилактическую терапию.Treat, cure, and therapy refer to a method of alleviating or eliminating a biological disorder and/or at least one of its accompanying symptoms. As used herein, the term ameliorate a disease, disorder, or condition means reducing the severity and/or frequency of symptoms of the disease, disorder, or condition. In addition, references to treatment contained herein include references to curative, palliative and prophylactic therapy.
В одном аспекте субъект лечения или пациент является млекопитающим, предпочтительно человеческим субъектом. Вышеупомянутый субъект может быть мужского или женского пола любого возраста.In one aspect, the subject of treatment or patient is a mammal, preferably a human subject. The above subject may be male or female of any age.
Термин нарушение означает любое состояние, которое можно улучшить в результате лечения по настоящему изобретению. В определение данного термина входят хронические и острые нарушения или заболевания, включающие в себя патологические состояния, которые вызывают предрасположенность млекопитающего к возникновению данного нарушения.The term disorder means any condition that can be improved by treatment according to the present invention. The definition of this term includes chronic and acute disorders or diseases, including pathological conditions that predispose a mammal to the occurrence of a given disorder.
Заболевание является состоянием здоровья животного, где животное не может поддерживать гомеостаз, и где, если заболевание не облегчают, то здоровье животного продолжает ухудшаться.Disease is a state of animal health where the animal is unable to maintain homeostasis, and where, if the disease is not alleviated, the animal's health continues to deteriorate.
Термин субъект, пациент, индивидуум и т.п. используют в настоящем описании взаимозаменяемо, и они относятся к любому животному, поддающимуся воздействию способами, представленными в настоящем описании. В конкретных неограничивающих вариантах осуществления субъект, пациент или индивидуум является человеком.The term subject, patient, individual, etc. are used interchangeably herein and refer to any animal amenable to treatment by the methods presented herein. In specific non-limiting embodiments, the subject, patient, or individual is a human.
Терапевтически эффективным количеством считается количество вводимого в процессе лечения терапевтического агента, которое избавит в определенной степени от одного или нескольких симптомов заболевания, по поводу которого проводится лечение.A therapeutically effective amount is the amount of therapeutic agent administered during treatment that will relieve, to a certain extent, one or more symptoms of the disease being treated.
Подробное описание изобретенияDetailed Description of the Invention
Кодон-оптимизированная нуклеиновой кислоте.Codon-optimized nucleic acid.
В одном из аспектов настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок SMN1 (белок выживаемости моторных нейронов) с SEQ ID NO: 1 и включает последовательность нуклеиновой кислоты SEQ ID NO: 2.In one aspect, the present invention provides an isolated codon-optimized nucleic acid that encodes the SMN1 (survival motor neuron protein) protein of SEQ ID NO: 1 and includes the nucleic acid sequence of SEQ ID NO: 2.
Для получения кодон-оптимизированного гена SMN1 за основу была взята соответствующая аминокислотная последовательность белка SMN_HUMAN:To obtain the codon-optimized SMN1 gene, the corresponding amino acid sequence of the SMN_HUMAN protein was taken as a basis:
- 5 045749- 5 045749
MAMSSGGSGGGVPEQEDSVLFRRGTGQSDDSDIWDDTALIKAYDKAVASFKHALKNG DICETSGKPKTTPKRKPAKKNKSQKKNTAASLQQWKVGDKCSAIWSEDGCIYPATIASI DFKRETCVVVYTGYGNREEQNLSDLLSPICEVANNIEQNAQENENESQVSTDESENSRSP GNKSDNIKPKSAPWNSFLPPPPPMPGPRLGPGKPGLKFNGPPPPPPPPPPHLLSCWLPPFPS GPPIIPPPPPICPDSLDDADALGSMLISWYMSGYHTGYYMGFRQNQKEGRCSHSLN (SEQ IDNO:1)MAMSSGGSGGGVPEQEDSVLFRRGTGQSDDSDIWDDTALIKAYDKAVASFKHALKNG DICETSGKPKTTPKRKPAKKNKSQKKNTAASLQQWKVGDKCSAIWSEDGCIYPATIASI DFKRETCVVVYTGYGNREEQNLSDLLSPICEVANNIEQNAQENENESQVSTDESENSRSP GNKSDNIKPKSAPWNSFLPP PPPMPGPRLGPGKPGLKFNGPPPPPPPPPPHLLSCWLPPFPS GPPIIPPPPPICPDSLDDADALGSMLISWYMSGYHTGYYMGFRQNQKEGRCSHSLN (SEQ IDNO:1)
Данная аминокислотная последовательность SEQ ID NO: 1 переводилась в нуклеотидную последовательность путем последовательного сопоставления каждой аминокислоте начиная с N-конца одного из кодирующих ее синонимичных кодонов.This amino acid sequence SEQ ID NO: 1 was translated into a nucleotide sequence by sequentially assigning each amino acid starting from the N-terminus of one of the synonymous codons encoding it.
Подробно по кодон-оптимизированного гена SMN1 и отбор финальной последовательности описано в примере 1.The details of the codon-optimized SMN1 gene and the selection of the final sequence are described in example 1.
Финальная кодон-оптимизированная последовательность SMN1 (SMN1-GeneBeam) имеет следующую нуклеотидную последовательность: ATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGAGCAAGAGGACThe final codon-optimized sequence of SMN1 (SMN1-GeneBeam) has the following nucleotide sequence: ATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGAGCAAGAGGAC
AGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGACATCTGGGACGA CACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAAGCACGCCCTGA AGAACGGCGACATCTGCGAGACCAGCGGCAAGCCCAAGACCACCCCCAAGAGAAA GCCCGCCAAGAAGAACAAGAGCCAGAAGAAGAACACCGCCGCCAGCCTGCAGCAG TGGAAGGTGGGCGACAAGTGCAGCGCCATCTGGAGCGAGGACGGCTGCATCTACCC CGCCACCATCGCCAGCATCGACTTCAAGAGAGAGACCTGCGTGGTGGTGTACACCG GCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCCCATCTGCGAG GTGGCCAACAACATCGAGCAGAACGCCCAAGAGAACGAGAACGAGAGCCAAGTGA GCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAAGAGCGACAACATCAA GCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTATGCCCGGCCC TAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCCCCCCTCCTCC TCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAGCGGCCCTCCT ATCATCCCTCCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGCCGACGCCCTG GGCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCTACTACATGGG CTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAACTAG (SEQ Ш NO:2).AGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGACATCTGGGACGA CACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAAGCACGCCCTGA AGAACGGCGACATCTGCGAGACCAGCGCAAGCCCAAGACCACCCAAGAGAAA GCCCGCCAAGAAGAACAAGAGCCAGAAGAAGAACACCGCCGCCAGCCTGCAGCAG TGGAAGGTGGGCGACAAG TGCAGCGCCATCTGGAGCGAGGACGGCTGCATCTACCC CGCCACCATCGCCAGCATCGACTTCAAGAGAGACCTGCGTGGTGGTGTACACCG GCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCCCATCTGCGAG GTGGCCAACAACATCGAGCAGAACGCCCAAGAGAACGAGAACGAGAGCCAAGTGA GCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAA GAGCGACAACATCAA GCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTATGCCCGGCCC TAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCCCCCCTCCTCC TCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAGCGGCCCTCCT ATCATCCCTCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGCCGACGCCCTG G GCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCTACTACATGGG CTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAACTAG (SEQ Ш NO:2).
Данная финальная кодон-оптимизированная нуклеотидная последовательность SMN1 (SMN1GeneBeam) характеризуется повышенным индексом адаптации кодонов (стандартная метрика для оценки последовательности на предмет частот использованных кодонов) по сравнению с кодирующей последовательностью гена SMN дикого типа (SMN1-WT):This final codon-optimized nucleotide sequence of SMN1 (SMN1GeneBeam) is characterized by an increased codon adaptation index (a standard metric for evaluating a sequence for the frequencies of codons used) compared to the coding sequence of the wild-type SMN gene (SMN1-WT):
ATGGCGATGAGCAGCGGCGGCAGTGGTGGCGGCGTCCCGGAGCAGGAGGATTCCGT GCTGTTCCGGCGCGGCACAGGCCAGAGCGATGATTCTGACATTTGGGATGATACAG CACTGATAAAAGCATATGATAAAGCTGTGGCTTCATTTAAGCATGCTCTAAAGAATG GTGACATTTGTGAAACTTCGGGTAAACCAAAAACCACACCTAAAAGAAAACCTGCT AAGAAGAATAAAAGCCAAAAGAAGAATACTGCAGCTTCCTTACAACAGTGGAAAGT TGGGGACAAATGTTCTGCCATTTGGTCAGAAGACGGTTGCATTTACCCAGCTACCAT TGCTTCAATTGATTTTAAGAGAGAAACCTGTGTTGTGGTTTACACTGGATATGGAAA TAGAGAGGAGCAAAATCTGTCCGATCTACTTTCCCCAATCTGTGAAGTAGCTAATAA TATAGAACAAAATGCTCAAGAGAATGAAAATGAAAGCCAAGTTTCAACAGATGAAA GTGAGAACTCCAGGTCTCCTGGAAATAAATCAGATAACATCAAGCCCAAATCTGCT CCATGGAACTCTTTTCTCCCTCCACCACCCCCCATGCCAGGGCCAAGACTGGGACCA GGAAAGCCAGGTCTAAAATTCAATGGCCCACCACCGCCACCGCCACCACCACCACC CCACTTACTATCATGCTGGCTGCCTCCATTTCCTTCTGGACCACCAATAATTCCCCCA CCACCTCCCATATGTCCAGATTCTCTTGATGATGCTGATGCTTTGGGAAGTATGTTAA TTTCATGGTACATGAGTGGCTATCATACTGGCTATTATATGGGTTTCAGACAAAATC AAAAAGAAGGAAGGTGCTCACATTCCTTAAATTAA (SEQ ID NO:3).ATGGCGATGAGCAGCGGCGGCAGTGGTGGCGGCGTCCCGGAGCAGGAGGATTCCGT GCTGTTCCGGCGCGGCACAGGCCAGAGCGATGATTCTGACATTTGGGATGATACAG CACTGATAAAAGCATATGATAAAGCTGTGGCTTCATTTAAGCATGCTCTAAAGAATG GTGACATTTGTGAAACTTCGGGTAAACCAAAAACCACACCTAAAAGAAAACCTGCT AAGAAGAATAAAAGCCAAAAGAA GAATACTGCAGCTTCCTTACAACAGTGGAAAGT TGGGGACAAATGTTCTGCCATTTGGTCAGAAGACGGTTGCATTTACCCAGCTACCAT TGCTTCAATTGATTTTAAGAGAGAAACCTGTGTTGTGGTTTACACTGGATATGGAAA TAGAGAGGAGCAAAATCTGTCCGATCTACTTTCCCCAATCTGTGAAGTAGCTAATAA TATAGAACAAAATGCTCAAGAGAATGAAAATGAAAGCCAAGTTTCAA CAGATGAAA GTGAGAACTCCAGGTCTCCTGGAAATAAATCAGATAACATCAAGCCCAAATCTGCT CCATGGAACTCTTTTCTCCCTCCACCACCCCCCATGCCAGGGCCAAGACTGGGACCA GGAAAGCCAGGTCTAAAATTCAATGGCCCACCACCGCCACCGCCACCACCACCACC CCACTTACTATGCTGGCTGCCTCCATTTCCTTCTGGACCACCAATAATTCCCCCA CCACCTCCCATATGTCCAGA TTCTCTTGATGATGCTGATGCTTTGGGAAGTATGTTAA TTTCATGGTACATGAGTGGCTATCATACTGGCTATTATGGGTTTCAGACAAAATC AAAAGAAGGAAGGTGCTCACATTCCTTAAAATTAA (SEQ ID NO:3).
Индекс адаптации кодонов для финальной кодон-оптимизированной нуклеотидной последователь- 6 045749 ности гена SMN1 (SEQ ID NO: 2) нашей последовательности равен 98%, для последовательности дикого типа - 75%.The codon adaptation index for the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) of our sequence is 98%, for the wild-type sequence - 75%.
GC-состав последовательности дикого типа равен 45%, т.е. отличается от целевого значения на 15%, GC-состав финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO: 2) оптимизированной последовательности равен 64%, т.е. отличается от целевого значения на 4%.The GC composition of the wild type sequence is 45%, i.e. differs from the target value by 15%, the GC composition of the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) of the optimized sequence is 64%, i.e. differs from the target value by 4%.
Финальная кодон-оптимизированная нуклеотидная последовательность гена SMN1 (SEQ ID NO: 2) и нуклеотидная последовательность гена SMN1 дикого типа (SEQ ID NO: 3). Последовательности идентичны на 71%.Final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) and nucleotide sequence of the wild-type SMN1 gene (SEQ ID NO: 3). The sequences are 71% identical.
Экспрессионная кассета. Экспрессионный вектор.Expression cassette. Expression vector.
В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту.In one aspect, the present invention provides an expression cassette that includes the above codon-optimized nucleic acid.
Термин экспрессионная кассета при использовании в данном изобретении, в частности, относится к фрагменту ДНК, который способен в соответствующей обстановке запускать экспрессию полинуклеотида, кодирующего представляющий интерес полипептид, который включен в указанную экспрессионную кассету. При введении в клетку-хозяина экспрессионная кассета помимо прочего способна задействовать клеточные механизмы для транскрипции полинуклеотида, кодирующего представляющий интерес полипептид, в РНК, которая затем обычно дополнительно процессируется и, наконец, транслируется в представляющий интерес полипептид. Экспрессионная кассета может содержаться в экспрессионном векторе.The term expression cassette as used herein specifically refers to a fragment of DNA that is capable, under appropriate circumstances, of driving the expression of a polynucleotide encoding a polypeptide of interest that is included in said expression cassette. When introduced into a host cell, the expression cassette is, among other things, capable of engaging cellular machinery to transcribe the polynucleotide encoding the polypeptide of interest into RNA, which is then typically further processed and finally translated into the polypeptide of interest. The expression cassette may be contained in an expression vector.
Экспрессионная кассета по настоящему изобретению содержит в качестве элемента промотор. Термин промотор, используемый в настоящем изобретении, в частности, относится к элементу ДНК, который способствует транскрипции полинуклеотида, с которым функционально связан промотор. Промотор может также составлять часть элемента промотор/энхансер. Хотя физические границы между элементами промотор и энхансер не всегда ясны, термин промотор обычно относится к месту на молекуле нуклеиновой кислоты, с которым связывается РНК-полимераза и/или связанные с ней факторы, и с которого инициируется транскрипция. Энхансеры усиливают активность промотора во времени, а также пространственно. В данной области известно множество промоторов, которые транскрипционно активны в широком диапазоне типов клеток. Промоторы могут быть разделены на два класса: на тех, которые функционируют конститутивно, и тех, которые регулируются индукцией или снятием репрессии. Для экспрессии белка пригодны оба класса. Промоторы, которые используются для продукции высокого уровня полипептидов в эукариотических клетках и, в частности, в клетках млекопитающих, должны быть сильными и, предпочтительно, должны быть активными в широком диапазоне типов клеток. Сильные конститутивные промоторы, которые способны запускать экспрессию во многих типах клеток, хорошо известны в данной области и, поэтому, нет необходимости в их подробном описании в данном изобретении. В соответствии с идеей настоящего изобретения предпочтительно использовать промотор цитомегаловируса (CMV). Промотор или промотор/энхансер, полученные из немедленной ранней (IE) области цитомегаловируса (hCMV) человека, в особенности подходят в качестве промотора в экспрессионной кассете по настоящему изобретению. Немедленная ранняя (IE) область цитомегаловируса (hCMV) человека и полученные из нее функциональные запускающие экспрессию фрагменты и/или функциональные усиливающие экспрессию фрагменты, например, описаны в ЕР 0173177 и ЕР 0323997, а также хорошо известны в данной области. Таким образом, несколько фрагментов немедленной ранней (IE) области hCMV могут использоваться в качестве промотора и/или промотора/энхансера. Согласно одному варианту осуществления изобретения промотор CMV человека используется в экспрессионной кассете по настоящему изобретению.The expression cassette of the present invention contains a promoter element. The term promoter as used in the present invention specifically refers to a DNA element that promotes transcription of the polynucleotide to which the promoter is operably linked. A promoter may also form part of a promoter/enhancer element. Although the physical boundaries between promoter and enhancer elements are not always clear, the term promoter generally refers to the location on a nucleic acid molecule to which RNA polymerase and/or associated factors bind and from which transcription is initiated. Enhancers enhance promoter activity temporally as well as spatially. There are many promoters known in the art that are transcriptionally active in a wide range of cell types. Promoters can be divided into two classes: those that function constitutively and those that are regulated by induction or release of repression. Both classes are suitable for protein expression. Promoters that are used to produce high levels of polypeptides in eukaryotic cells and, in particular, mammalian cells must be strong and preferably must be active in a wide range of cell types. Strong constitutive promoters that are capable of driving expression in many cell types are well known in the art and therefore need not be described in detail herein. In accordance with the idea of the present invention, it is preferable to use a cytomegalovirus (CMV) promoter. A promoter or promoter/enhancer derived from the immediate early (IE) region of human cytomegalovirus (hCMV) is particularly suitable as a promoter in the expression cassette of the present invention. The human cytomegalovirus (hCMV) immediate early (IE) region and functional expression-triggering fragments and/or functional expression-enhancing fragments derived therefrom are, for example, described in EP 0173177 and EP 0323997 and are also well known in the art. Thus, several fragments of the hCMV immediate early (IE) region can be used as a promoter and/or promoter/enhancer. In one embodiment, a human CMV promoter is used in an expression cassette of the present invention.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the expression cassette includes the following elements in a 5' to 3' direction:
левый (первый) ITR (инвертированные концевые повторы);left (first) ITR (inverted terminal repeats);
CMV (цитомегаловирусный) энхансер;CMV (cytomegalovirus) enhancer;
CMV (цитомегаловирусный) промотер;CMV (cytomegalovirus) promoter;
интрон гена hBG1 (ген субъединицы гемоглобина гамма-1);intron of the hBG1 gene (hemoglobin subunit gamma-1 gene);
вышеуказанная кодон-оптимизированная нуклеиновая кислота гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;
сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека); правый (второй) ITR.hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal); right (second) ITR.
В некоторых вариантах левый (первый) ITR (инвертированные концевые повторы) имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the left (first) ITR (inverted terminal repeats) has the following nucleic acid sequence:
Cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcct (SEQ ID NO: 8).(SEQ ID NO: 8).
- 7 045749- 7 045749
В некоторых вариантах CMV (цитомегаловирусный) энхансер имеет следующую последовательность нуклеиновой кислоты: cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaac gCcaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtac gccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctac gtattagtcatcgctattaccatg (SEQ ID NO: 9).In some embodiments, the CMV (cytomegalovirus) enhancer has the following nucleic acid sequence: cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaac gCcaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatca (SEQ ID NO: 9).
В некоторых вариантах CMV (цитомегаловирусный) промотер имеет следующую последовательность нуклеиновой кислоты: gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagt ttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtggga ggtctatataagcagagct (SEQ ID NO: 10).In some embodiments, the CMV (cytomegalovirus) promoter has the following nucleic acid sequence: gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagt ttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacg caaatgggcggtaggcgtgtacggtggga ggtctatataagcagagct (SEQ ID NO: 10).
В некоторых вариантах интрон гена hBG1 (ген субъединицы гемоглобина гамма-1) имеет следующую последовательность нуклеиновой кислоты: cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaa aaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctcttt gcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaa gaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctagg cccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaatt gggat (SEQ ID NO: 11).In some embodiments, the intron of the hBG1 gene (hemoglobin subunit gamma-1 gene) has the following nucleic acid sequence: cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaa aaaatgctttcttcttttaatatactttttttgtttatcttatttctaatactt tccctaatctctttctttcagggcaataatgatacaatgtatcatgcctcttt gcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaa gaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataa ggctggattattctgagtccaagctagg cccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaatt gggat (SEQ ID NO: 11).
В некоторых вариантах сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека) имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal) has the following nucleic acid sequence:
Acgggtggcatccctgtgacccctccccagtgcctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaat aaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaag acaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttca agcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggttt caccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccact gctcccttccctgtcctt (SEQ ID NO: 12).Acgggtggcatccctgtgacccctccccagtgcctctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaat aaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaag acaacctgtagggcctgcggggtctatt gggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttca agcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggttt caccatattggccaggctggtctccaactcctaatctcaggtgatctacccacc ttggcctcccaaattgctgggattacaggcgtgaaccact gctcccttccctgtcctt (SEQ ID NO: 12).
В некоторых вариантах правый (второй) ITR имеет следующую последовательность нуклеиновой кислоты: aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccg ggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 13).In some embodiments, the right (second) ITR has the following nucleic acid sequence: aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccg ggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 1 3).
В некоторых вариантах экспрессионная кассета имеет следующую последовательность нуклеиновой кислоты: cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtctagttattaatagtaatcaattacggggtcattag ttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtca ataatgacgtatgttcccatagtaacgCcaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtac atcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatggg actttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttg actcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaaca actccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctg gagacgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctccgcggattcgaatcccggccgggaacggtgc attggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatactttt ttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtg ataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagc tacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctc ttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatCGATTGTIn some embodiments, the expression cassette has the following nucleic acid sequence: cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgag cgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtctagttatta atcaag tgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatggg actttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttg actcacggggatttccaagtctccaccccattga cgtcaatgggagtttgttttgGcaccaaaatcaacgggactttccaaaatgtcgtaaca actccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctg gagacgccatccacgctgttttgacctccatagaagacaccgggaccga tccagcctccgcggattcgaatcccggccgggaacggtgc attggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatactttt ttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatg cctctttgcaccattctaaagaataacagtg ataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagc tacaatccagctaccattctgcttttattttatggttgggataaggctggattattctctgagtccaagctaggcccttttgctaatcatgtt catacctc ttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatCGATTGT
- 8 045749- 8 045749
AATTCATGAGCCACCATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGA GCAAGAGGACAGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGAC ATCTGGGACGACACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAA GCACGCCCTGAAGAACGGCGACATCTGCGAGACCAGCGGCAAGCCCAAGACCACCC CCAAGAGAAAGCCCGCCAAGAAGAACAAGAGCCAGAAGAAGAACACCGCCGCCAG CCTGCAGCAGTGGAAGGTGGGCGACAAGTGCAGCGCCATCTGGAGCGAGGACGGCT GCATCTACCCCGCCACCATCGCCAGCATCGACTTCAAGAGAGAGACCTGCGTGGTG GTGTACACCGGCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCC CATCTGCGAGGTGGCCAACAACATCGAGCAGAACGCCCAAGAGAACGAGAACGAG AGCCAAGTGAGCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAAGAGCG ACAACATCAAGCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTA TGCCCGGCCCTAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCC CCCCTCCTCCTCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAG CGGCCCTCCTATCATCCCTCCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGC CGACGCCCTGGGCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCT ACTACATGGGCTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAAC TGATctagagtcgacctgcagaagcttgcctcgagcagcgctgctcgagagatctacgggtggcatccctgtgacccctccccagtgc ctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataa tattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagct ggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattcca ggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggt gatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcg gaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaagg tcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 4).AATTCATGAGCCACCATGGCCATGAGCAGCGGCGGCAGCGGCGGCGGCGTGCCTGA GCAAGAGGACAGCGTGCTGTTCAGAAGAGGCACCGGCCAGAGCGACGACAGCGAC ATCTGGGACGACACCGCCCTGATCAAGGCCTACGACAAGGCCGTGGCCAGCTTCAA GCACGCCCTGAAGAACGGCGACATCTGCGAGACCAGCGGCAAGCCCAAGACCACCC CCAAGAGAAAGCCCGCCA AGAAGAAACAAGAGCCAGAAGAAGAACACCGCCGCCAG CCTGCAGCAGTGGAAGGTGGGCGACAAGTGCAGCGCCATCTGGAGCGAGGACGGCT GCATCTACCCCGCCACCATCGCCAGCATCGACTTCAAGAGAGAGACCTGCGTGGTG GTGTACACCGGCTACGGCAACAGAGAGGAGCAGAACCTGAGCGACCTGCTGAGCCC CATCTGCGAGGTGGCCAACAACATCGAGCAGAACGCCCAAGA GAACGAGAACGAG AGCCAAGTGAGCACCGACGAGAGCGAGAACAGCAGAAGCCCCGGCAACAAGAGCG ACAACATCAAGCCCAAGAGCGCCCCCTGGAACAGCTTCCTGCCCCCTCCCCCCCCTA TGCCCGGCCCTAGACTGGGCCCTGGCAAGCCTGGCCTGAAGTTCAACGGCCCCCCCC CCCCTCCTCCTCCTCCTCCTCCTCACCTGCTGAGCTGCTGGCTGCCCCCCTTCCCCAG CGGCCC TCCTATCATCCCTCTCCCCCCCCCATCTGCCCCGACAGCCTGGACGACGC CGACGCCCTGGGCAGCATGCTGATCAGCTGGTACATGAGCGGCTACCACACCGGCT ACTACATGGGCTTCAGACAGAACCAGAAGGAGGGCCGGTGCAGCCACAGCCTGAAC TGATctagagtcgacctgcagaagcttgcctcgagcagctgctgctcgagagatctacgggtggcatccct gtgacccctccccagtgc ctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataa tattatggggtggaggggggtggtatggagcaaggggcaagtttgggaagacaacctgtagggcctgcggggtctattggaaccaagct ggag tgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattcca ggcatgcatgaccaggctcagctaatttttgttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggt gatctacccaccttggcctcccaa attgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcg gaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaagg tcgcccgacgcccgggctttgcccgggcggcctcagtgag cgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 4).
В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает вышеуказанную кодон-оптимизированную нуклеиновую кислоту или вышеуказанную экспрессионную кассету.In one aspect, the present invention relates to an expression vector that includes the above codon-optimized nucleic acid or the above expression cassette.
В некоторых вариантах осуществления изобретения вектор представляет собой плазмиду, т.е. кольцевую двухцепочечную часть ДНК, в которую могут быть лигированы дополнительные сегменты ДНК.In some embodiments, the vector is a plasmid, i.e. a circular, double-stranded portion of DNA into which additional DNA segments can be ligated.
В некоторых вариантах осуществления изобретения вектор представляет собой вирусный вектор, в котором дополнительные сегменты ДНК могут быть лигированы в вирусный геном.In some embodiments, the vector is a viral vector in which additional DNA segments can be ligated into the viral genome.
В некоторых вариантах осуществления изобретения векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальный сайт инициации репликации и эписомные векторы млекопитающих). В других вариантах осуществления изобретения векторы (например, неэписомальные векторы млекопитающих) могут быть интегрированы в геном клетки-хозяина при введении в клетку-хозяина, и таким образом реплицируются вместе с геном хозяина. Более того, некоторые векторы способны направлять экспрессию генов, с которыми они функционально соединены. Такие векторы упоминаются в данном изобретении как рекомбинантные экспрессирующие векторы (или просто экспрессирующие векторы (вектор экспрессии или экспрессионный вектор)).In some embodiments, the vectors are capable of autonomous replication in the host cell into which they are introduced (eg, bacterial vectors having a bacterial origin of replication and mammalian episomal vectors). In other embodiments, vectors (eg, non-episomal mammalian vectors) can be integrated into the host cell genome upon introduction into the host cell, and thus replicate along with the host gene. Moreover, some vectors are capable of directing the expression of genes to which they are operably linked. Such vectors are referred to in this invention as recombinant expression vectors (or simply expression vectors (expression vector or expression vector)).
Экспрессионные векторы включают плазмиды, ретровирусы, аденовирусы, аденоассоциированные вирусы (AAV), вирусы растений, такие как вирус мозаики цветной капусты, вирусы табачной мозаики, космиды, YAC, EBV полученные эписомы и т.п. Молекулы ДНК могут быть лигированы в вектор таким образом, что последовательности, контролирующие транскрипцию и трансляцию в векторе, выполняют предусмотренную функцию регуляции транскрипции и трансляции ДНК. Экспрессионный вектор и последовательности контроля экспрессии могут быть выбраны таким образом, чтобы быть совместимыми с используемой экспрессирующей клеткой-хозяином. Молекулы ДНК могут быть введены в экспрессионный вектор стандартными способами (например, лигированием комплементарных сайтов рестрикции или лигированием тупых концов, если сайты рестрикции отсутствуют).Expression vectors include plasmids, retroviruses, adenoviruses, adeno-associated viruses (AAV), plant viruses such as cauliflower mosaic virus, tobacco mosaic virus, cosmids, YAC, EBV-derived episomes, and the like. DNA molecules can be ligated into a vector such that the transcription and translation control sequences in the vector perform the intended function of regulating DNA transcription and translation. The expression vector and expression control sequences can be selected to be compatible with the expression host cell used. DNA molecules can be introduced into an expression vector by standard methods (eg, ligation of complementary restriction sites or blunt-end ligation if restriction sites are missing).
Рекомбинантный экспрессионный вектор также может кодировать сигнальный пептид, который облегчает выработку белка-интереса клеткой-хозяином. Ген белка-интереса может быть клонирован в вектор таким образом, что сигнальный пептид соединен с рамкой считывания аминоконца белка-интереса. Сигнальным пептидом может быть сигнальный пептид иммуноглобулина или гетерологичный сигнальный пептид (т.е. сигнальный пептид белка не иммуноглобулиновой природы).The recombinant expression vector may also encode a signal peptide that facilitates production of the protein of interest by the host cell. The gene for the protein of interest can be cloned into a vector such that the signal peptide is linked to the amino terminus of the protein of interest. The signal peptide may be an immunoglobulin signal peptide or a heterologous signal peptide (ie, a non-immunoglobulin protein signal peptide).
Помимо гена SMN1-GB по данному изобретению, рекомбинантная экспрессия векторов по данномуIn addition to the SMN1-GB gene according to this invention, recombinant expression of vectors according to this
- 9 045749 изобретению может нести регулирующие последовательности, которые контролируют экспрессию гена SMN1-GB в клетке-хозяине. Специалистам в этой области будет понятно, что дизайн экспрессионного вектора, включая выбор регулирующих последовательностей, может зависеть от таких факторов, как селекция клетки-хозяина для трансформации, уровень экспрессии желаемого белка и т.д. Предпочтительные регулирующие последовательности для экспрессирующей клетки-хозяина млекопитающих включают вирусные элементы обеспечивающие высокий уровень экспрессии белков в клетках млекопитающих, таких как промоторы и/или энхансеры, полученные из ретровирусной LTR, цитомегаловируса (CMV) (например, CMV промотора/энхансера), обезьяньего вируса 40 (SV40) (например, SV40 промотора/энхансера), аденовируса, (например, большого позднего промотора аденовируса (AdMLP)), вирус полиомы, а также сильных промоторов млекопитающих, таких как промотор нативных иммуноглобулинов или промотор актина.- 9045749 of the invention may carry regulatory sequences that control the expression of the SMN1-GB gene in a host cell. Those skilled in the art will appreciate that the design of an expression vector, including the choice of regulatory sequences, may depend on factors such as the selection of the host cell for transformation, the level of expression of the desired protein, etc. Preferred regulatory sequences for a mammalian host expression cell include viral elements that provide high level expression of proteins in mammalian cells, such as promoters and/or enhancers derived from a retroviral LTR, cytomegalovirus (CMV) (eg, CMV promoter/enhancer), simian virus 40 (SV40) (eg, SV40 promoter/enhancer), adenovirus (eg, adenovirus large late promoter (AdMLP)), polyoma virus, as well as strong mammalian promoters such as the native immunoglobulin promoter or the actin promoter.
Выражение контролирующие последовательности относится к последовательностям ДНК, необходимым для экспрессии функционально связанной кодирующей последовательности в определенном организме-хозяине. Пригодные для прокариот контролирующие последовательности представляют собой, например, промотор, необязательно оператор и сайт связывания рибосомы. Как известно, в эукариотических клетках присутствуют промоторы, сигналы полиаденилирования и энхансеры.The expression control sequences refers to DNA sequences necessary for the expression of an operably linked coding sequence in a particular host organism. Suitable control sequences for prokaryotes are, for example, a promoter, optionally an operator and a ribosome binding site. As is known, promoters, polyadenylation signals and enhancers are present in eukaryotic cells.
В контексте настоящего описания термин промотор или регуляторная последовательность транскрипции или регуляторная последовательность относится к фрагменту нуклеиновой кислоты, который контролирует транскрипцию одной или нескольких кодирующих последовательностей, и который расположен против направления считывания информации относительно направления транскрипции от сайта инициации транскрипции кодирующей последовательности, а также который структурно идентифицируется по наличию сайта связывания для ДНК-зависимой РНК-полимеразы, сайтов инициации транскрипции и других последовательностей ДНК, включающих, без ограничения, сайты связывания фактора транскрипции, сайты связывания репрессора и активатора белка, а также любые другие последовательности нуклеотидов, известные специалистам в данной области, которые непосредственно или опосредованно регулируют уровень транскрипции с данным промотором. Конститутивный промотор представляет собой такой промотор, который активен в большинстве тканей в обычных физиологических условиях и условиях развития. Индуцибельный промотор представляет собой промотор, который подвергается физиологической регуляции или регуляции в ходе развития, например, при воздействии химического индуктора. Тканеспецифичный промотор активен только в конкретных типах тканей или клеток.As used herein, the term promoter or transcriptional control sequence or regulatory sequence refers to a nucleic acid fragment that controls the transcription of one or more coding sequences, and that is located upstream of the transcriptional start site of the coding sequence, and that is structurally identifiable by the presence of a binding site for DNA-dependent RNA polymerase, transcription initiation sites and other DNA sequences, including, without limitation, transcription factor binding sites, repressor and protein activator binding sites, as well as any other nucleotide sequences known to those skilled in the art, which directly or indirectly regulate the level of transcription with a given promoter. A constitutive promoter is one that is active in most tissues under normal physiological and developmental conditions. An inducible promoter is a promoter that is subject to physiological or developmental regulation, such as upon exposure to a chemical inducer. A tissue-specific promoter is active only in specific types of tissues or cells.
Термины энхансеры или энхансер, используемые в изобретении, могут относиться к последовательности ДНК, которая расположена как смежная с последовательностью ДНК, кодирующей рекомбинантный продукт. Энхансерные элементы обычно расположены в 5'-направлении от промоторного элемента или могут быть расположены ниже или в пределах кодирующей последовательности ДНК (например, последовательности ДНК, транскрибированной или транслированной в рекомбинантный продукт или продукты). Таким образом, энхансерный элемент может быть расположен на расстоянии 100 пар оснований, 200 пар оснований или 300 или больше пар оснований перед последовательностью ДНК, которая кодирует рекомбинантный продукт, или после этой последовательности. Энхансерные элементы могут увеличивать количество экспрессируемого рекомбинантного продукта от последовательности ДНК, превышая экспрессию, обусловленную одиночным промоторным элементом. Специалистам в данной области техники доступно множество энхансерных элементов.The terms enhancers or enhancer as used in the invention may refer to a DNA sequence that is located adjacent to the DNA sequence encoding the recombinant product. Enhancer elements are typically located 5' of a promoter element or may be located downstream of or within a coding DNA sequence (eg, the DNA sequence transcribed or translated into the recombinant product or products). Thus, the enhancer element may be located 100 base pairs, 200 base pairs, or 300 base pairs or more before or after the DNA sequence that encodes the recombinant product. Enhancer elements can increase the amount of recombinant product expressed from a DNA sequence beyond the expression driven by a single promoter element. A variety of enhancer elements are available to those skilled in the art.
В дополнение к вышеуказанным генам и регулирующим последовательностям, рекомбинантные векторы экспрессии изобретения могут нести дополнительные последовательности, такие как последовательности, которые регулируют репликацию вектора в клетках-хозяевах (например, точки начала репликации) и гены селектируемого маркера. Ген селектируемого маркера облегчает селекцию клеток-хозяев, в которые был введен вектор (см., например, патенты США 4399216, 4634665 и 5179017). Например, обычно ген селектируемого маркера придает устойчивость к лекарственным средствам, таким как G418, гигромицин или метотрексат, клетке-хозяину, в которую вектор введен. Например, гены селектируемого маркера включают ген дигидрофолат редуктазы (DHFR) (для использования в dhfr-клетках-хозяевах при селекции/амплификации метотрексата), ген нео (для селекции G418) и ген синтетазы глутамата.In addition to the above genes and regulatory sequences, the recombinant expression vectors of the invention may carry additional sequences, such as sequences that regulate the replication of the vector in host cells (eg, origins of replication) and selectable marker genes. The selectable marker gene facilitates selection of host cells into which the vector has been introduced (see, for example, US Pat. Nos. 4,399,216, 4,634,665, and 5,179,017). For example, typically a selectable marker gene confers resistance to drugs, such as G418, hygromycin, or methotrexate, to the host cell into which the vector is introduced. For example, selectable marker genes include the dihydrofolate reductase (DHFR) gene (for use in dhfr host cells for methotrexate selection/amplification), the neo gene (for G418 selection) and the glutamate synthetase gene.
Термин последовательность контроля экспрессии, используемый в данном описании, означает полинуклеотидные последовательности, которые необходимы для воздействия на экспрессию и процессинг кодирующих последовательностей, к которым они лигированы. Контролирующие экспрессию последовательности включают соответствующие последовательности инициации транскрипции, терминации, промотора и энхансера; эффективные сигналы процессинга РНК, такие как сплайсинг и сигналы полиаденилирования; последовательности, которые стабилизируют цитоплазматическую мРНК; последовательности, которые повышают эффективность трансляции (т.е. консенсусная последовательность Козака); последовательности, которые повышают стабильность белка; и, при желании, последовательности, которые усиливают секрецию белка. Характер таких контролирующих последовательностей различается в зависимости от организма-хозяина; в прокариотах такие контролирующие последовательности, как правило, включают промотор, сайт связывания рибосомы, а также последовательности терминацииThe term expression control sequence as used herein refers to polynucleotide sequences that are necessary to influence the expression and processing of the coding sequences to which they are ligated. Expression control sequences include the corresponding transcription initiation, termination, promoter and enhancer sequences; efficient RNA processing signals such as splicing and polyadenylation signals; sequences that stabilize cytoplasmic mRNA; sequences that increase translation efficiency (ie, the Kozak consensus sequence); sequences that increase protein stability; and, if desired, sequences that enhance protein secretion. The nature of such control sequences varies depending on the host organism; in prokaryotes, such control sequences typically include a promoter, ribosome binding site, and termination sequences
- 10 045749 транскрипции; в эукариотах, как правило, такие контролирующие последовательности включают промоторы и последовательности терминации транскрипции. Термин контролирующие последовательности включает, как минимум, все компоненты, наличие которых имеет важное значение для экспрессии и процессинга, и может также включать дополнительные компоненты, чье присутствие является полезным, например, лидирующие последовательности и последовательности слившихся клеток.- 10 045749 transcriptions; in eukaryotes, such control sequences typically include promoters and transcription termination sequences. The term control sequences includes, at a minimum, all components whose presence is essential for expression and processing, and may also include additional components whose presence is beneficial, such as leader sequences and fusion sequences.
В контексте настоящего описания термин функционально связанный относится к связи полинуклеотидных (или полипептидных) элементов в функциональную связь. Нуклеиновая кислота является функционально связанной, если она находится в условиях функциональной связи с другой последовательностью нуклеиновой кислоты. Например, регуляторная последовательность транскрипции функционально связана с кодирующей последовательностью, если она влияет на транскрипцию указанной кодирующей последовательности. Термин функционально связанный означает, что связанные последовательности ДНК являются, как правило, непрерывными, и при необходимости соединения двух участков, кодирующих белок, являются также непрерывными и находятся в рамке считывания.As used herein, the term operably linked refers to the linking of polynucleotide (or polypeptide) elements into a functional link. A nucleic acid is operably linked if it is in a functional relationship with another nucleic acid sequence. For example, a transcription control sequence is operably linked to a coding sequence if it affects the transcription of said coding sequence. The term operably linked means that the linked DNA sequences are generally contiguous and, where appropriate, junctions of two protein coding regions are also contiguous and in frame.
В одном из вариантов настоящего изобретения экспрессионный вектор относится к вектору, содержащему одну или несколько интересующих полинуклеотидных последовательностей, интересующих генов или трансгенов, которые фланкированы парвовирусными или инвертированными концевыми повторяющимися последовательностями (ITR).In one embodiment of the present invention, an expression vector refers to a vector containing one or more polynucleotide sequences of interest, genes or transgenes of interest that are flanked by parvovirus or inverted terminal repeat (ITR) sequences.
Ни кассета, ни вектор по изобретению не содержит нуклеотидные последовательности генов, кодирующих неструктурные белки (Rep) и структурные белки (Сар) аденоассоциированного вируса.Neither the cassette nor the vector according to the invention contains nucleotide sequences of genes encoding non-structural proteins (Rep) and structural proteins (Cap) of the adeno-associated virus.
Рекомбинантный вирус на основе AAV9 (аденоассоциированный вирус 9 серотипа).Recombinant virus based on AAV9 (adeno-associated virus serotype 9).
В одном из аспектов настоящее изобретение относится к рекомбинантному вирусу на основе AAV9 (аденоассоциированный вирус 9 серотипа) для увеличения экспрессии гена SMN1 в целевых клетках, который включает капсид и вышеуказанную экспрессионную кассету.In one aspect, the present invention provides a recombinant virus based on AAV9 (adeno-associated virus serotype 9) for increasing the expression of the SMN1 gene in target cells, which includes a capsid and the above expression cassette.
Термин рекомбинантный вирус на основе AAV (или вирусоподобная частица на основе AAV, или рекомбинантный вирусный штамм AAV, или рекомбинантный вектор AAV, или вектор rAAV) в контексте настоящего описания относится к вышеуказанной экспрессионной кассете (или вышеуказанному экспрессионному вектору), которая заключена внутри капсида AAV.The term recombinant AAV virus (or AAV virus-like particle, or recombinant AAV viral strain, or recombinant AAV vector, or rAAV vector) as used herein refers to the above expression cassette (or the above expression vector) that is contained within the AAV capsid .
Ген Сар, помимо других альтернативных продуктов, кодирует 3 капсидных белка (VP1, VP2 и VP3). Белки VP1, VP2 и VP3 находятся в соотношении 1:1:10, образуя икосаэдрический капсид (Xie Q. et al., The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy, Proc. Natl. Acad. Sci., USA, 2002, 99:10405-10410). Транскрипция этих генов начинается с одного промотора, р40. Молекулярная масса соответствующих белков (VP1, VP2 и VP3) составляет 87, 72 и 62 кДа соответственно. Все три белка транслируются с одной мРНК. После транскрипции пре-мРНК может подвергаться сплайсингу двумя разными способами, при этом вырезается более длинный или более короткий интрон и образуются мРНК различной нуклеотидной длины.The Sar gene, in addition to other alternative products, encodes 3 capsid proteins (VP1, VP2 and VP3). Proteins VP1, VP2 and VP3 are in a ratio of 1:1:10, forming an icosahedral capsid (Xie Q. et al., The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy, Proc. Natl Acad. Sci., USA, 2002, 99:10405-10410). Transcription of these genes begins from a single promoter, p40. The molecular weights of the corresponding proteins (VP1, VP2 and VP3) are 87, 72 and 62 kDa, respectively. All three proteins are translated from the same mRNA. After transcription, pre-mRNA can be spliced in two different ways, cutting out a longer or shorter intron and producing mRNAs of different nucleotide lengths.
При образовании рекомбинантного вируса на основе AAV (rAAV) кассета экспрессии, фланкированная ИКП (ITR), упаковывается в капсид AAV. Гены, необходимые для репликации AAV, как было указано выше, не входят в кассету.During the formation of an AAV-derived recombinant virus (rAAV), an ITR-flanked expression cassette is packaged into the AAV capsid. The genes required for AAV replication, as noted above, are not included in the cassette.
ДНК экспрессионной кассеты упакована в вирусный капсид в виде одноцепочечной молекулы ДНК (оцДНК) длиной приблизительно 3000 нуклеотидов. После инфицирования клетки вирусом, одноцепочечную ДНК конвертируют в форму двухцепочечной ДНК (дцДНК). Только дцДНК могут использовать белки клетки, которые транскрибируют содержащийся ген или гены в РНК.The expression cassette DNA is packaged within the viral capsid as a single-stranded DNA (ssDNA) molecule approximately 3000 nucleotides in length. Once a cell is infected with a virus, the single-stranded DNA is converted into double-stranded DNA (dsDNA) form. Only dsDNA can use cell proteins that transcribe the contained gene or genes into RNA.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1 protein.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий следующую аминокислотную последовательность:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP1 protein having the following amino acid sequence:
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPG NGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGG NLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRL NFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWH CDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFN RFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFT DSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQML RTGNNFQF S YEFENVPFHS S YAHSQ SLDRLMNPLIDQYL YYLSKTINGSGQNQQTLKFS V AGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGP AMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVA TNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFMAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPG NGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGG NLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRL NFGQTGDTESVPDPQPI GEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWH CDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFN RFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFT DSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGS QAVGRSSFYCLEYFPSQML RTGNNFQF S YEFENVPFHS S YAHSQ SLDRLMNPLIDQYL YYLSKTINGSGQNQQTLKFS V AGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGP AMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVA TNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGF
- 11 045749- 11 045749
GMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPE
IQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL (SEQ ID NO: 5).IQYTSNYYKSNNNVEFAVNTEGVYSEPRPIGTRYLTRNL (SEQ ID NO: 5).
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP2 protein.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9, имеющий следующую аминокислотную последовательность:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP2 protein having the following amino acid sequence:
TAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSG VGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNN HLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL NFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVF MIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQS LDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVS TTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGT GRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGM VWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNK DKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSE PRPIGTRYLTRNL (SEQ ID NO: 6).TAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSG VGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNN HLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL NFKLFNIQVKEVTDNNGVKTI ANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVF MIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQS LDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVS TTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGED RFFPLSGSLIFGKQGT GRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGM VWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNK DKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEG VYSE PRPIGTRYLTRNL (SEQ ID NO: 6).
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP2 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP2 protein having the amino acid sequence of SEQ ID NO: 6 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP3 protein.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9, имеющий следующую аминокислотную последовательность:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP3 protein having the following amino acid sequence:
MASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYK QISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKL FNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQ YGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRL MNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVT QNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDN VDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQD RDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNS FITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGT RYLTRNL (SEQ ID NO: 7).MASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYK QISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKL FNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQ YGYLTLNDGSQAVGRSSFYCL EYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRL MNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVT QNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDN VDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGW VQNQGILPGMVWQD RDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNS FITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGT RYLTRNL (SEQ ID NO: 7).
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP3 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP3 protein having the amino acid sequence of SEQ ID NO: 7 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1, VP2 и VP3 AAV9.In some embodiments, the AAV9-based recombinant virus has a capsid that includes the AAV9 VP1, VP2, and VP3 proteins.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7.In some embodiments, the AAV9-based recombinant virus has a capsid that includes proteins VP1 having amino acid sequence SEQ ID NO: 5, VP2 having amino acid sequence SEQ ID NO: 6, and VP3 having amino acid sequence SEQ ID NO: 7.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями.In some embodiments, the recombinant AAV9-based virus has a capsid that includes proteins VP1 of amino acid sequence SEQ ID NO: 5 with one or more point mutations, VP2 of amino acid sequence SEQ ID NO: 6 with one or more point mutations, and VP3 of amino acid sequence SEQ ID NO: 7 with one or more point mutations.
Под несколькими точечными мутациями подразумеваются две, три, четыре, пять, шесть, семь, восемь, девять или десять точечных замен.Multiple point mutations are defined as two, three, four, five, six, seven, eight, nine or ten point substitutions.
Особенно предпочтительные варианты включают замены (мутации), которые являются консервативными по природе, т.е. те замены, которые имеют место в семействе аминокислот, которые объединены по их боковым цепям. В частности, аминокислоты обычно делят на четыре семейства: (1) кислые аспартат и глутамат; (2) основные - лизин, аргинин, гистидин; (3) неполярные - аланин, валин, лейцин,Particularly preferred embodiments include substitutions (mutations) that are conservative in nature, i.e. those substitutions that occur in a family of amino acids that are combined along their side chains. Specifically, amino acids are generally divided into four families: (1) acidic aspartate and glutamate; (2) basic - lysine, arginine, histidine; (3) non-polar - alanine, valine, leucine,
- 12 045749 изолейцин, пролин, фенилаланин, метионин, триптофан; и (4) незаряженные полярные - глицин, аспарагин, глутамин, цистеин, серин треонин, тирозин. Фенилаланин, триптофан и тирозин иногда классифицируют как ароматические аминокислоты. Например, достаточно обосновано предсказание о том, что выделенная замена лейцина на изолейцин или валин, аспартата на глутамат, треонина на серин или схожая консервативная замена аминокислоты на структурно родственную аминокислоту не окажет важного влияния на биологическую активность. Например, полипептид, представляющий интерес, может включать вплоть до приблизительно 5-10 консервативных или неконсервативных аминокислотных замен, при условии, что желаемая функция молекулы остается незатронутой.- 12 045749 isoleucine, proline, phenylalanine, methionine, tryptophan; and (4) uncharged polar ones - glycine, asparagine, glutamine, cysteine, serine threonine, tyrosine. Phenylalanine, tryptophan, and tyrosine are sometimes classified as aromatic amino acids. For example, it is reasonably predicted that a selected substitution of leucine for isoleucine or valine, aspartate for glutamate, threonine for serine, or a similar conservative amino acid substitution for a structurally related amino acid will not have an important effect on biological activity. For example, a polypeptide of interest may include up to about 5-10 conservative or non-conservative amino acid substitutions, so long as the desired function of the molecule remains unaffected.
Вариант точечных мутаций в последовательностях белков VP1, VP2 или VP3 AAV9 с помощью аминокислотных замен представляет собой замену, по меньшей мере, одного аминокислотного остатка в белке VP1, VP2 или VP3 AAV9 на другой аминокислотный остаток.A variant of point mutations in the AAV9 VP1, VP2 or VP3 protein sequences using amino acid substitutions is the replacement of at least one amino acid residue in the AAV9 VP1, VP2 or VP3 protein with another amino acid residue.
Консервативные замены показаны в таблице под заголовком предпочтительные замены.Conservative substitutions are shown in the table under the heading Preferred Substitutions.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV9 virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the following elements in the direction from 5 '-end to 3'-end:
CMV энхансер;CMV enhancer;
CMV промотер;CMV promoter;
интрон гена hBG1;hBG1 gene intron;
вышеуказанная кодон-оптимизированная нуклеиновая кислота гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;
сигнал полиаденилирования hGH1;hGH1 polyadenylation signal;
правый ITR.right ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включаетIn some embodiments, the AAV9-based recombinant virus has a capsid that includes
- 13 045749 белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:- 13 045749 proteins VP1 with amino acid sequence SEQ ID NO: 5, VP2 with amino acid sequence SEQ ID NO: 6 and VP3 with amino acid sequence SEQ ID NO: 7, and the expression cassette includes the following elements in the direction from the 5' end to the 3' -end:
CMV энхансер;CMV enhancer;
CMV промотер;CMV promoter;
интрон гена hBG1;hBG1 gene intron;
вышеуказанная кодон-оптимизированная нуклеиновая кислоту гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;
сигнал полиаденилирования hGH1;hGH1 polyadenylation signal;
правый ITR.right ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV9-based virus has a capsid that includes proteins VP1 of amino acid sequence SEQ ID NO: 5 with one or more point mutations, VP2 of amino acid sequence SEQ ID NO: 6 with one or more point mutations, and VP3 of amino acid sequence SEQ ID NO: 7 with one or more point mutations, and the expression cassette includes the following elements in the direction from the 5' end to the 3' end:
CMV энхансер;CMV enhancer;
CMV промотер;CMV promoter;
интрон гена hBG1;hBG1 gene intron;
вышеуказанная кодон-оптимизированная нуклеиновая кислота гена SMN1;the above codon-optimized nucleic acid of the SMN1 gene;
сигнал полиаденилирования hGH1;hGH1 polyadenylation signal;
правый ITR.right ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белок VP1 AAV9, имеющий аминокислотную последовательность SEQ ID NO: 5 или аминокислотную последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.In some embodiments, the AAV9-based recombinant virus has a capsid that includes an AAV9 VP1 protein having the amino acid sequence of SEQ ID NO: 5 or the amino acid sequence of SEQ ID NO: 5 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: : 4.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5, VP2 с аминокислотной последовательность SEQ ID NO: 6 и VP3 с аминокислотной последовательность SEQ ID NO: 7, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.In some embodiments, the AAV9-based recombinant virus has a capsid that includes proteins VP1 having amino acid sequence SEQ ID NO: 5, VP2 having amino acid sequence SEQ ID NO: 6, and VP3 having amino acid sequence SEQ ID NO: 7, and an expression cassette comprising a nucleic acid with SEQ ID NO: 4.
В некоторых вариантах рекомбинантный вирус на основе AAV9 имеет капсид, который включает белки VP1 с аминокислотной последовательность SEQ ID NO: 5 с одной или несколькими точечными мутациями, VP2 с аминокислотной последовательность SEQ ID NO: 6 с одной или несколькими точечными мутациями и VP3 с аминокислотной последовательность SEQ ID NO: 7 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 4.In some embodiments, the recombinant AAV9-based virus has a capsid that includes proteins VP1 of amino acid sequence SEQ ID NO: 5 with one or more point mutations, VP2 of amino acid sequence SEQ ID NO: 6 with one or more point mutations, and VP3 of amino acid sequence SEQ ID NO: 7 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: 4.
Фармацевтическая композиция.Pharmaceutical composition.
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для доставки гена SMN1 в целевые клетки, которая включает вышеуказанный рекомбинантный вирус на основе AAV9 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.In one aspect, the present invention relates to a pharmaceutical composition for delivering the SMN1 gene to target cells, which includes the above-mentioned AAV9-based recombinant virus in combination with one or more pharmaceutically acceptable excipients.
В конкретных вариантах осуществления настоящее изобретение относится к фармацевтической композиции, содержащей рекомбинантный вирус на основе AAV9 по изобретению в фармацевтически приемлемом носителе или в других фармацевтических агентах, адъювантах, разбавителях и т.д. Носитель для инъекций обычно является жидким. Носитель для других способов введения может быть или твердым, или жидким, таким как стерильная апирогенная вода или стерильный апирогенный фосфатносолевой буферный раствор. Для введения путем ингаляции носитель является вдыхаемым и предпочтительно находится в твердой или жидкой дисперсной форме. В качестве инъекционной среды предпочтительно использовать воду, содержащую добавки, общепринятые для инъекционных растворов, такие как стабилизирующие агенты, соли или солевые растворы и/или буферы.In specific embodiments, the present invention provides a pharmaceutical composition comprising a recombinant AAV9 virus of the invention in a pharmaceutically acceptable carrier or other pharmaceutical agents, adjuvants, diluents, etc. The injectable carrier is usually liquid. The carrier for other routes of administration may be either a solid or a liquid, such as sterile pyrogen-free water or sterile pyrogen-free phosphate-buffered saline. For administration by inhalation, the carrier is inhalable and is preferably in solid or liquid dispersed form. As the injection medium, it is preferable to use water containing additives generally accepted for injection solutions, such as stabilizing agents, salts or saline solutions and/or buffers.
Фармацевтическая композиция обозначает композицию, включающую в себя вышеуказанный рекомбинантный вирус на основе AAV9 по изобретению и по крайней мере один из компонентов, выбранных из группы, состоящей из фармацевтически приемлемых и фармакологически совместимых эксипиентов, таких как наполнители, растворители, разбавители, носители, вспомогательные, распределяющие, средства доставки, консерванты, стабилизаторы, эмульгаторы, суспендирующие агенты, загустители, регуляторы пролонгированной доставки, выбор и соотношение которых зависит от природы и способа назначения и дозировки. Фармацевтические композиции по настоящему изобретению и способы их изготовления будут бесспорно очевидными для специалистов в этой области. Производство фармацевтических композиций предпочтительно должно соответствовать требованиям GMP (надлежащей производственной практики). Композиция может включать буферную композицию, тонические агенты, стабилизаторы и солюбилизаторы.Pharmaceutical composition means a composition comprising the above recombinant AAV9 virus of the invention and at least one of the components selected from the group consisting of pharmaceutically acceptable and pharmacologically compatible excipients such as excipients, solvents, diluents, carriers, auxiliaries, dispensers , delivery vehicles, preservatives, stabilizers, emulsifiers, suspending agents, thickeners, prolonged delivery regulators, the choice and ratio of which depends on the nature and method of administration and dosage. The pharmaceutical compositions of the present invention and methods for their manufacture will be readily apparent to those skilled in the art. The production of pharmaceutical compositions should preferably comply with GMP (Good Manufacturing Practices) requirements. The composition may include a buffer composition, tonic agents, stabilizers and solubilizers.
Фармацевтически приемлемым считается материал, который не имеет биологических или других противопоказаний, например, материал можно вводить субъекту без каких-либо нежелательных биологических эффектов. Таким образом, такие фармацевтические композиции можно использовать, например, для трансфекции клетки ех vivo или для введения in vivo рекомбинантного вируса на основе AAV9A pharmaceutically acceptable material is one that has no biological or other contraindications, e.g., the material can be administered to a subject without causing any undesirable biological effects. Thus, such pharmaceutical compositions can be used, for example, for ex vivo transfection of a cell or for in vivo administration of a recombinant AAV9-based virus
- 14 045749 по изобретению непосредственно субъекту.- 14 045749 according to the invention directly to the subject.
Термин эксципиент или вспомогательное вещество используется в данном изобретении для описания любого компонента, отличающегося от ранее описанных по данному изобретению. Это вещества неорганического или органического происхождения, используемые в процессе производства, изготовления лекарственных препаратов для придания им необходимых физико-химических свойств.The term excipient or excipient is used in this invention to describe any component other than those previously described in this invention. These are substances of inorganic or organic origin, used in the production process of medicines to give them the necessary physical and chemical properties.
Под стабилизатором понимается вспомогательное вещество или смесь двух и более вспомогательных веществ, которые обеспечивают физическую и/или химическую стабильность активного агента.By stabilizer is meant an excipient or a mixture of two or more excipients that provide physical and/or chemical stability of the active agent.
Под термином буфер, буферная композиция, буферный агент понимается раствор, способный сохранять значение рН, благодаря взаимодействию кислотных и щелочных компонентов, входящих в его состав, который дает возможность препарату вектора на основе rAAV5, проявлять устойчивость к изменениям рН. В общем случае преимущественными являются значения рН фармацевтической композиции от 4,0 до 8,0. В качестве буферных агентов могут быть использованы, например, ацетатный, фосфатный, цитратный, гистидиновый, сукцинатный и т.п. буферные растворы, но, не ограничиваясь ими.The term buffer, buffer composition, buffer agent refers to a solution capable of maintaining the pH value due to the interaction of the acidic and alkaline components included in its composition, which allows the vector preparation based on rAAV5 to exhibit resistance to changes in pH. In general, pH values of the pharmaceutical composition from 4.0 to 8.0 are preferred. As buffering agents, for example, acetate, phosphate, citrate, histidine, succinate, etc. can be used. buffer solutions, but not limited to them.
Фармацевтическая композиция является стабильной, если активный агент сохраняет свою физическую стабильность и/или химическую стабильность и/или биологическую активность в течение заявленного срока годности при температуре хранения, например при 2-8°C. Предпочтительно, чтобы активный агент сохранял и физическую, и химическую стабильность, а также биологическую активность. Период хранения выбирается на основании результатов исследования стабильности при ускоренном и естественном хранении.A pharmaceutical composition is stable if the active agent maintains its physical stability and/or chemical stability and/or biological activity through its stated shelf life at storage temperature, for example at 2-8°C. It is preferred that the active agent retains both physical and chemical stability as well as biological activity. The storage period is selected based on the results of stability studies during accelerated and natural storage.
Фармацевтическая композиция по данному изобретению может изготавливаться, упаковываться или широко продаваться в виде единичной стандартной дозы или множества единичных стандартных доз в виде готовой лекарственной формы. Используемый в данном изобретении термин единичная стандартная доза означает дискретное количество фармацевтической композиции, содержащей заранее определенное количество активного ингредиента. Количество активного ингредиента обычно равно дозировке активного ингредиента, который будет вводиться субъекту, или удобной части такой дозировки, например, половине или трети такой дозировки.The pharmaceutical composition of this invention may be manufactured, packaged or widely sold as a single unit dose or a plurality of unit dose units in a finished dosage form. As used herein, the term unit dose means a discrete amount of a pharmaceutical composition containing a predetermined amount of the active ingredient. The amount of active ingredient is typically equal to the dosage of the active ingredient to be administered to the subject, or a convenient portion of such dosage, such as one-half or one-third of such dosage.
Применение.Application.
В одном из аспектов настоящее изобретение относится к применению вышеуказанного рекомбинантного вируса на основе AAV9 или вышеуказанной композиции для доставки гена SMN1 в целевые клетки.In one aspect, the present invention relates to the use of the above recombinant AAV9 virus or the above composition for delivering the SMN1 gene to target cells.
Любой способ введения рекомбинантного вируса на основе AAV9, принятый в данной области, может соответствующим образом использоваться для вышеуказанного рекомбинантного вируса на основе AAV9 по данному изобретению.Any method of administering an AAV9-based recombinant virus accepted in the art can be suitably used for the above-mentioned AAV9-based recombinant virus of the present invention.
Рекомбинантный вирус на основе AAV9 предпочтительно вводят в клетку в биологически эффективном количестве. Биологически эффективное количество рекомбинантного вируса представляет собой количество, которое достаточно, чтобы вызвать инфекцию (или трансдукцию) и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке. Если вирус вводят в клетку in vivo (например, вирус вводят субъекту, как описано ниже), биологически эффективное количество вирусного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке-мишени.The AAV9-based recombinant virus is preferably introduced into the cell in a biologically effective amount. A biologically effective amount of a recombinant virus is an amount that is sufficient to cause infection (or transduction) and expression of a heterologous nucleic acid sequence in a cell. If the virus is introduced into a cell in vivo (eg, the virus is administered to a subject as described below), a biologically effective amount of the viral vector is an amount that is sufficient to cause transduction and expression of a heterologous nucleic acid sequence in the target cell.
Клетка для введения вышеуказанного рекомбинантного вируса на основе AAV9 по изобретению может быть клеткой любого типа, включая в себя без ограничения нервные клетки (включающие в себя клетки периферической и центральной нервной системы, в частности, клетки головного мозга), легочные клетки, эпителиальные клетки (например, эпителиальные клетки кишечника и дыхательных путей), мышечные клетки, клетки поджелудочной железы (в том числе островковые клетки), печеночные клетки, клетки миокарда, костные клетки (например, стволовые клетки костного мозга), гемопоэтические стволовые клетки, клетки селезенки, кератиноциты, фибробласты, эндотелиальные клетки, клетки предстательной железы, половые клетки и т.п. Альтернативно клетка для введения вышеуказанного рекомбинантного вируса на основе AAV9 может быть любой клеткой-предшественником. В качестве дополнительной альтернативы, клетки могут представлять собой стволовые клетки (например, нервные стволовые клетки, стволовые клетки печени). Кроме того, клетки могут происходить от любых видов, как указано выше.The cell for introducing the above AAV9-based recombinant virus of the invention may be any type of cell, including but not limited to neural cells (including cells of the peripheral and central nervous system, in particular brain cells), lung cells, epithelial cells (eg , intestinal and respiratory epithelial cells), muscle cells, pancreatic cells (including islet cells), liver cells, myocardial cells, bone cells (eg, bone marrow stem cells), hematopoietic stem cells, spleen cells, keratinocytes, fibroblasts , endothelial cells, prostate cells, germ cells, etc. Alternatively, the cell for introducing the above AAV9-based recombinant virus can be any progenitor cell. As a further alternative, the cells may be stem cells (eg, neural stem cells, liver stem cells). Additionally, the cells can come from any species, as noted above.
Вышеуказанный рекомбинантный вирус на основе AAV9 не используется для модификации генетической целостности клеток зародышевой линии человека.The above AAV9-based recombinant virus is not used to modify the genetic integrity of human germline cells.
ПримерыExamples
Для наилучшего понимания изобретения приводятся следующие примеры. Эти примеры приведены только в иллюстративных целях и не должны толковаться как ограничивающие сферу применения изобретения в любой форме.For a better understanding of the invention, the following examples are provided. These examples are provided for illustrative purposes only and should not be construed as limiting the scope of the invention in any form.
Все публикации, патенты и патентные заявки, указанные в этой спецификации включены в данный документ путем отсылки. Хотя вышеупомянутое изобретение было довольно подробно описано путем иллюстрации и примера в целях исключения двусмысленного толкования, специалистам в данной области на основе идей, раскрытых в данном изобретении, будет вполне понятно, что могут быть внесены оп- 15 045749 ределенные изменения и модификации без отклонения от сущности и объема прилагаемых вариантов осуществления изобретения.All publications, patents and patent applications referenced in this specification are incorporated herein by reference. Although the foregoing invention has been described in some detail by way of illustration and example in order to avoid ambiguity, those skilled in the art will appreciate from the teachings disclosed herein that certain changes and modifications may be made without departing from the spirit. and the scope of the accompanying embodiments of the invention.
Материалы и общие методы.Materials and general methods.
Методы рекомбинантной ДНК.Recombinant DNA methods.
Для манипуляций с ДНК использовали стандартные методы, описанные у Sambrook J. и др., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Реагенты для молекулярной биологии использовали согласно инструкциям производителей. Вкратце плазмидную ДНК нарабатывали для дальнейших манипуляций в клетках Е.coli, выращиваемых под селективным давлением с антибиотиками для того, чтобы плазмиды не терялись в клеточной популяции. Плазмидную ДНК выделяли из клеток коммерческими наборами, измеряли концентрацию и использовали для клонирования с помощью обработки эндонуклеазами рестрикции или методами ПЦРамплификации. Фрагменты ДНК лигировали между собой с помощью лигаз и трансформировали в бактериальные клетки для отбора клонов и дальнейших наработок. Все полученные генетические конструкции подтверждали по паттернам рестрикции и полным секвенированием по Сэнгеру.For DNA manipulation, standard methods were used as described in Sambrook J. et al., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Molecular biology reagents were used according to the manufacturers' instructions. Briefly, plasmid DNA was produced for further manipulation in E. coli cells grown under selective pressure with antibiotics to ensure that plasmids were not lost in the cell population. Plasmid DNA was isolated from cells using commercial kits, the concentration was measured and used for cloning using restriction endonuclease treatment or PCR amplification methods. DNA fragments were ligated with each other using ligases and transformed into bacterial cells for clone selection and further development. All obtained genetic constructs were confirmed by restriction patterns and full Sanger sequencing.
Синтез генов.Gene synthesis.
Требуемые сегменты генов получали из олигонуклеотидов, созданных путем химического синтеза. Генные сегменты длиной от 300 до 1000 п.н., которые фланкированы уникальными сайтами рестрикции, собирали путем ренатурации олигонуклеотидов друг на друге с последующей ПЦР-амплификацией с крайних праймеров. В результате получали смесь фрагментов, включая нужный. Фрагменты клонировали по сайтам рестрикции в промежуточные векторы, после чего последовательности ДНК субклонированных фрагментов подтверждали путем секвенирования ДНК.The required gene segments were obtained from oligonucleotides created by chemical synthesis. Gene segments ranging from 300 to 1000 bp in length, which are flanked by unique restriction sites, were assembled by renaturation of oligonucleotides on each other, followed by PCR amplification from extreme primers. As a result, a mixture of fragments was obtained, including the desired one. The fragments were cloned at restriction sites into intermediate vectors, after which the DNA sequences of the subcloned fragments were confirmed by DNA sequencing.
Определение последовательностей ДНК.Determination of DNA sequences.
Последовательности ДНК определяли путем секвенирования по Сэнгеру. Анализ последовательностей ДНК и белков и обработку данных о последовательностях осуществляли в программе SnapGene 4.2 и выше для создания, картирования, анализа, аннотирования и иллюстрации последовательностей.DNA sequences were determined by Sanger sequencing. DNA and protein sequence analysis and sequence data processing were performed using SnapGene 4.2 and higher to generate, map, analyze, annotate, and illustrate sequences.
Культивирование клеточных культур.Cultivation of cell cultures.
В экспериментах были использованы клеточные линии HEK293 (Human Embryonic Kidney clone 293) и HSMC (Human Skeletal Muscle Cells). Клетки культивировались в стандартных условиях при 370°С и 5% CO2, на полной питательной среде DMEM с добавлением 10% FBS и антибиотика. Для культивирования HSMC культуральный пластик предварительно покрывался коллагеном (Gibco). Пересев клеток осуществлялся при достижении 80-90% конфлюентности. Жизнеспособность клеток оценивалась с помощью окраски Trypan Blue и камеры Горяева либо с помощью окраски PI и проточной цитометрии.Cell lines HEK293 (Human Embryonic Kidney clone 293) and HSMC (Human Skeletal Muscle Cells) were used in the experiments. Cells were cultured under standard conditions at 370°C and 5% CO 2 in complete nutrient medium DMEM supplemented with 10% FBS and antibiotic. To culture HSMC, the culture plastic was precoated with collagen (Gibco). Cell reseeding was carried out when 80-90% confluency was achieved. Cell viability was assessed using Trypan Blue staining and a Goryaev chamber or using PI staining and flow cytometry.
Трансфекция клеток.Cell transfection.
Клеточные линии засеивали накануне трансфекции в 6-луночные планшеты таким образом, чтобы они достигали 70-80% конфлюентности к моменту трансфекции. Трансфекцию осуществляли с помощью коммерческих наборов для липофекции по протоколу производителя. Через 72 ч клетки обрабатывали растворами трипсина или аналогичными, снимали с подложки, отмывали в фосфатном буфере и собирали для дальнейшего анализа экспрессии целевых генов и белков. При постановке каждой трансфекции использовали контрольную плазмиду, экспрессирующую GFP, для контроля эффективности трансфекции (доля GFP-позитивных клеток в процентах). Дальнейший анализ проводили только в том случае, если эффективность трансфекции составляла не менее 50%.Cell lines were seeded on the eve of transfection into 6-well plates so that they reached 70-80% confluency at the time of transfection. Transfection was performed using commercial lipofection kits according to the manufacturer's protocol. After 72 h, the cells were treated with trypsin or similar solutions, removed from the substrate, washed in phosphate buffer, and collected for further analysis of the expression of target genes and proteins. During each transfection, a control plasmid expressing GFP was used to control the transfection efficiency (the percentage of GFP-positive cells). Further analysis was performed only if the transfection efficiency was at least 50%.
Все работы проводились в 3 независимых экспериментах.All work was carried out in 3 independent experiments.
Анализ генной экспрессии.Gene expression analysis.
Экспрессию SMN1 на уровне мРНК проверяли с помощью количественной ПЦР. Вкратце использовали праймеры и пробу, специфичные к последовательности SMN1 дикого типа или GeneBeam. Для контроля количества исходной РНК использовали праймеры и пробу, специфичные к гену домашнего хозяйства GAPDH. Для каждого набора праймеров и проб строили калибровочные кривые с применением известного количества копий линеаризованной плазмидной ДНК, содержащей амплифицируемую последовательность соответствующего гена. Анализ экспрессии осуществляли, определяя по калибровочным кривым количество копий SMN1-GeneBeam, SMN1-WT и GAPDH в каждом образце, после чего нормализовали количество копий SMN1 на 10000 копий GAPDH. Полученные значения сравнивали между собой для различных образцов в рамках одного эксперимента.Expression of SMN1 at the mRNA level was tested using quantitative PCR. Briefly, primers and probe specific to the wild-type or GeneBeam SMN1 sequence were used. To control the amount of initial RNA, primers and a probe specific to the housekeeping gene GAPDH were used. For each set of primers and probes, calibration curves were constructed using a known number of copies of linearized plasmid DNA containing the amplifiable sequence of the corresponding gene. Expression analysis was performed by determining the copy numbers of SMN1-GeneBeam, SMN1-WT, and GAPDH in each sample from calibration curves, and then normalizing the copy number of SMN1 per 10,000 copies of GAPDH. The obtained values were compared with each other for different samples within the same experiment.
Определение экспрессии белка SMN1 с помощью проточной цитометрии.Determination of SMN1 protein expression by flow cytometry.
Оценку содержания белка SMN1 в клетках проводили посредством внутриклеточного окрашивания, с последующим анализом с помощью проточной цитометрии. Вкратце клетки снимали с культуральных планшетов с помощью TrypLE, отмывали в PBS, фиксировали в растворе 4% параформальдегида, пермеабилизировали с помощью 0,5% раствора Triton X-100 в PBS, инкубировали в блокирующем буфере с 1-5% BSA и окрашивали двухэтапно с использованием первичных антител к SMN1 и вторичных антител, меченных Alexa Fluor 488. После окрашивания клетки однократно промывали в PBS и анализировали на проточном цитометре. Оценивали среднюю интенсивность сигнала за вычетом сигнала, окрашенного вторичными антителами без добавления первичных антител.SMN1 protein content in cells was assessed by intracellular staining, followed by flow cytometry analysis. Briefly, cells were removed from culture plates using TrypLE, washed in PBS, fixed in 4% paraformaldehyde, permeabilized with 0.5% Triton X-100 in PBS, incubated in blocking buffer with 1–5% BSA, and stained in two steps with using primary antibodies to SMN1 and secondary antibodies labeled with Alexa Fluor 488. After staining, cells were washed once in PBS and analyzed on a flow cytometer. The average signal intensity was assessed minus the signal stained with secondary antibodies without the addition of primary antibodies.
- 16 045749- 16 045749
Сборка и очистка вирусных частиц рекомбинантных векторов AAV.Assembly and purification of viral particles from recombinant AAV vectors.
Для сборки вирусных частиц AAV, содержащих ген SMN1 или контрольный ген GFP, использовали упаковочные клетки HEK293, в которые трансфецировали 3 следующие плазмиды:To assemble AAV viral particles containing the SMN1 gene or the control GFP gene, HEK293 packaging cells were used, into which the following 3 plasmids were transfected:
плазмида, содержащая геном AAV с кассетой для экспрессии трансгена (SNM1 или GFP);a plasmid containing the AAV genome with a transgene expression cassette (SNM1 or GFP);
плазмида для экспрессии гена Сар серотипа AAV9 и гена Rep серотипа AAV2. Каждый ген с помощью альтернативных рамок считывания кодирует несколько белковых продуктов;plasmid for expression of the Sar gene of serotype AAV9 and the Rep gene of serotype AAV2. Each gene encodes multiple protein products using alternative reading frames;
плазмида для экспрессии генов аденовируса Ad5, необходимых для сборки и упаковки капсидов AAV.plasmid for expression of Ad5 adenovirus genes required for assembly and packaging of AAV capsids.
Через 72 ч клетки лизировали и проводили очистку и концентрирование вирусных частиц с помощью методов фильтрации и хроматографии. Титр вирусных частиц определяли с помощью количественной ПЦР с праймерами и пробой, специфичными к участку рекомбинантного вирусного генома и выражали в виде количества копий вирусных геномов на 1 мл.After 72 h, the cells were lysed and the viral particles were purified and concentrated using filtration and chromatography methods. The titer of viral particles was determined using quantitative PCR with primers and a probe specific to a region of the recombinant viral genome and expressed as the number of copies of viral genomes per 1 ml.
Трансдукция клеточных культур.Transduction of cell cultures.
Клеточные линии засевали аналогично экспериментам для трансфекции, после чего добавляли препарат с вирусными частицами и через 72 ч клетки анализировали. Эффективность трансдукции считали, анализируя процент GFP+ клеток.Cell lines were seeded similarly to the transfection experiments, after which the drug with viral particles was added, and after 72 hours the cells were analyzed. Transduction efficiency was calculated by analyzing the percentage of GFP+ cells.
Для используемых культур предварительно были поставлены эксперименты с проверкой эффективности трансдукции. Кратко, препарат вируса AAV9-GFP трансдуцировали в клеточные линии в различных соотношениях клеток и вирусных частиц. Отношение количества вирусных частиц и клеток называют multiplicity of infection (MOI). MOI вируса AAV9-GFP варьировали от 50000 до 1000000. В результате для каждой линии были определены диапазоны MOI, в пределах которых эффективность трансдукции менялась линейно в зависимости от MOI. Дальнейшие работы с трансдукцией клеточных линий проводили в их линейных диапазонах.For the cultures used, experiments were previously carried out to test the efficiency of transduction. Briefly, the AAV9-GFP virus preparation was transduced into cell lines at various ratios of cells and viral particles. The ratio of the number of viral particles and cells is called multiplicity of infection (MOI). The MOI of the AAV9-GFP virus varied from 50,000 to 1,000,000. As a result, MOI ranges were determined for each line, within which the transduction efficiency varied linearly depending on the MOI. Further work with transduction of cell lines was carried out in their linear ranges.
После трансдукции анализ экспрессии генов и белков осуществляли как описано выше.After transduction, gene and protein expression analysis was performed as described above.
Все работы проводились в 3 независимых экспериментах.All work was carried out in 3 independent experiments.
Пример 1. Способ получения кодон-оптимизированного гена SMN1.Example 1. Method for obtaining a codon-optimized SMN1 gene.
Для получения кодон-оптимизированного гена SMN1 за основу была взята соответствующая аминокислотная последовательность белка SMN_HUMAN (SEQ ID NO: 1).To obtain the codon-optimized SMN1 gene, the corresponding amino acid sequence of the SMN_HUMAN protein (SEQ ID NO: 1) was taken as a basis.
Данная аминокислотная последовательность SEQ ID NO: 1 переводилась в нуклеотидную последовательность путем последовательного сопоставления каждой аминокислоте начиная с N-конца одного из кодирующих ее синонимичных кодонов с учетом одного или совокупности следующих признаков:This amino acid sequence SEQ ID NO: 1 was translated into a nucleotide sequence by sequentially matching each amino acid, starting from the N-terminus, with one of the synonymous codons encoding it, taking into account one or a combination of the following features:
1) частоты использования данного кодона (Yasukazu Nakamura et al., Codon usage tabulated from the international DNA sequence databases; its status 1999, Nucleic Acids Research, 1999, vol. 27, № 1, DOI: 10.1093/nar/27.1.292);1) frequency of use of a given codon (Yasukazu Nakamura et al., Codon usage tabulated from the international DNA sequence databases; its status 1999, Nucleic Acids Research, 1999, vol. 27, No. 1, DOI: 10.1093/nar/27.1.292) ;
2) GC-состава концевого участка получаемой нуклеотидной последовательности (целевым значением GC-состава считалось 60% исходя из статьи Grzegorz Kudla et al., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, PLoS Biol, June 2006, volume 4, issue 6, e180, DOI: 10.1371/joumal.pbio.0040180, поэтому кодон был тем предпочтительнее, чем меньше получалась разность текущего GC-состава с целевым);2) GC composition of the terminal region of the resulting nucleotide sequence (the target value of GC composition was considered to be 60% based on the article by Grzegorz Kudla et al., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, PLoS Biol, June 2006, volume 4, issue 6, e180, DOI: 10.1371/joumal.pbio.0040180, therefore the codon was more preferable, the smaller the difference between the current GC composition and the target one);
3) свободной энергии фолдинга концевого участка получаемой нуклеотидной последовательности (вторичные структуры определялись при помощи алгоритма Зукера, Michael Zuker et al., Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information, Nucleic Acids Research, volume 9, issue 1, 10 January 1981, pages 133-148, DOI: 10.1093/nar/9.1.133).3) free energy of folding of the terminal region of the resulting nucleotide sequence (secondary structures were determined using the Zuker algorithm, Michael Zuker et al., Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information, Nucleic Acids Research, volume 9, issue 1, 10 January 1981, pages 133-148, DOI: 10.1093/nar/9.1.133).
В процессе построения также избегалась генерация смысловых нуклеотидных последовательностей, таких как сайты рестрикции, участки внутренней посадки рибосомы, сайты сплайсинга т.д.During the construction process, the generation of sense nucleotide sequences, such as restriction sites, internal ribosome entry sites, splicing sites, etc., was also avoided.
В результате перевода аминокислотной последовательности SEQ ID NO: 1 в нуклеотидную последовательность был получен ряд кодон-оптимизированных нуклеотидных последовательностей гена SMN1.As a result of translating the amino acid sequence of SEQ ID NO: 1 into a nucleotide sequence, a number of codon-optimized nucleotide sequences of the SMN1 gene were obtained.
Из вышеуказанного ряда кодон-оптимизированных нуклеотидных последовательностей SMN1 несколько последовательностей не показывали увеличения транскрипции гена SMN1 в дальнейших исследованиях, т.е. не было достоверного увеличения количества копий мРНК SMN1-opt по сравнению с SMN1-WT на какой-либо из использованных клеточных линий, или данное увеличение было незначительным.Of the above series of codon-optimized SMN1 nucleotide sequences, several sequences did not show an increase in SMN1 gene transcription in further studies, i.e. there was no significant increase in SMN1-opt mRNA copy number compared to SMN1-WT in any of the cell lines used, or the increase was negligible.
Большинство кодон-оптимизированных нуклеотидных последовательностей гена SMN1 показал увеличение транскрипции гена SMN1 в 1,5-2 раза в дальнейших исследованиях, т.е. достоверно увеличивая количество копий мРНК SMN1-opt по сравнению с SMN1-WT на всех использованных клеточных линиях.Most codon-optimized nucleotide sequences of the SMN1 gene showed an increase in SMN1 gene transcription by 1.5-2 times in further studies, i.e. significantly increasing the number of SMN1-opt mRNA copies compared to SMN1-WT in all cell lines used.
Одна из вышеуказанного ряда кодон-оптимизированных нуклеотидных последовательностей гена SMN1 неожиданно показала увеличение транскрипции гена SMN1 более чем в 3 раза в дальнейших исследованиях, т.е. неожиданно увеличивая количество копий мРНК SMN1-opt в более чем 3 раза по сравнению с SMN1-WT на всех использованных клеточных линиях (см. примеры 3-4). Данная финальная кодон-оптимизированная нуклеотидная последовательность гена SMN1 получила условное названиеOne of the above series of codon-optimized nucleotide sequences of the SMN1 gene unexpectedly showed an increase in SMN1 gene transcription by more than 3 times in further studies, i.e. unexpectedly increasing the copy number of SMN1-opt mRNA by more than 3-fold compared to SMN1-WT in all cell lines used (see examples 3-4). This final codon-optimized nucleotide sequence of the SMN1 gene received the code name
- 17 045749- 17 045749
SMN1-GeneBeam (или сокращенно SMN1-GB).SMN1-GeneBeam (or SMN1-GB for short).
Финальная кодон-оптимизированная последовательность SMN1 (SMNl-GeneBeam) имеет нуклеотидную последовательность представленную SEQ ID NO: 2.The final codon-optimized sequence of SMN1 (SMNl-GeneBeam) has the nucleotide sequence shown by SEQ ID NO: 2.
Данная финальная кодон-оптимизированная нуклеотидная последовательность SMN1 (SMN1GeneBeam) характеризуется повышенным индексом адаптации кодонов (Paul М. Sharp et al., The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications, Nucleic Acids Research, volume 15, issue 3,11 February 1987, pages 1281-1295, DOI: 10.1093/nar/15.3.1281 - стандартная метрика для оценки последовательности на предмет частот использованных кодонов) по сравнению с кодирующей последовательностью гена SMN дикого типа (SMN1-WT с SEQ ID NO: 3).This final codon-optimized nucleotide sequence of SMN1 (SMN1GeneBeam) is characterized by an increased codon adaptation index (Paul M. Sharp et al., The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications, Nucleic Acids Research, volume 15 , issue 3,11 February 1987, pages 1281-1295, DOI: 10.1093/nar/15.3.1281 - a standard metric for evaluating a sequence for the frequencies of codons used) compared to the coding sequence of the wild type SMN gene (SMN1-WT with SEQ ID NO: 3).
Индекс адаптации кодонов для финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO: 2) равен 98%, для последовательности дикого типа - 75%.The codon adaptation index for the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) is 98%, for the wild type sequence - 75%.
GC-состав последовательности дикого типа равен 45%, т.е. отличается от целевого значения на 15%, GC-состав финальной кодон-оптимизированной нуклеотидной последовательности гена SMN1 (SEQ ID NO: 2) равен 64%, т.е. отличается от целевого значения на 4%.The GC composition of the wild type sequence is 45%, i.e. differs from the target value by 15%, the GC composition of the final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) is 64%, i.e. differs from the target value by 4%.
Финальная кодон-оптимизированная нуклеотидная последовательность гена SMN1 (SEQ ID NO: 2) и нуклеотидная последовательность гена SMN1 дикого типа (SEQ ID NO: 3) идентичны на 71%.The final codon-optimized nucleotide sequence of the SMN1 gene (SEQ ID NO: 2) and the nucleotide sequence of the wild-type SMN1 gene (SEQ ID NO: 3) are 71% identical.
Пример 2. Сборка генетических конструкций, несущих рекомбинантный геном AAV и кодирующих ген SMN1.Example 2. Assembly of genetic constructs carrying the recombinant AAV genome and encoding the SMN1 gene.
Последовательность гена SMN1 дикого типа была получена путем амплификации со специфическими праймерами с кДНК, синтезированной на основе тотальной РНК клеток HEK293. В процессе амплификации с 5'-конца гена была добавлена последовательность Kozak и сайт рестрикции ClaI, а с 3'-конца - сайт рестрикции XbaI. После этого последовательность гена SMN1 была клонирована рестриктазно-лигазным методом по сайтам ClaI и XbaI в коммерческую конструкцию pAAV-GFP Control plasmid (VPK-402) от CellBiolab (США), с заменой гена GFP на SMN1, получив конструкцию pAAV-SMN1-WT.The wild-type SMN1 gene sequence was obtained by amplification with specific primers from cDNA synthesized from total RNA of HEK293 cells. During the amplification process, a Kozak sequence and a ClaI restriction site were added to the 5' end of the gene, and an XbaI restriction site to the 3' end. After this, the SMN1 gene sequence was cloned using the restriction enzyme ligase method at the ClaI and XbaI sites into the commercial construct pAAV-GFP Control plasmid (VPK-402) from CellBiolab (USA), with the GFP gene replaced by SMN1, obtaining the pAAV-SMN1-WT construct.
Последовательность SMN1-GeneBeam была собрана как описано выше. В силу сложности последовательности, несмотря на ее относительно небольшой размер, провели серию субклонирований фрагментов гена в промежуточных векторах pGEMT с верификацией сиквенсов для каждого вектора. Далее из нескольких промежуточных векторов с помощью ПЦР собрали полноразмерную версию гена и заклонировали в промежуточный вектор pGEMT. В качестве конечной генетической конструкции использовали конструкцию pAAV-SMN1-WT, заменив SMN1 дикого типа на SMN1-GeneBeam по сайтам ClaI и XbaI, добавленным на концы последовательности SMN1-GeneBeam с помощью ПЦР.The SMN1-GeneBeam sequence was assembled as described above. Due to the complexity of the sequence, despite its relatively small size, a series of subcloning of gene fragments was carried out in intermediate pGEMT vectors with sequence verification for each vector. Next, the full-length version of the gene was assembled from several intermediate vectors using PCR and cloned into the intermediate vector pGEMT. The pAAV-SMN1-WT construct was used as the final genetic construct, replacing wild-type SMN1 with SMN1-GeneBeam at the ClaI and XbaI sites added to the ends of the SMN1-GeneBeam sequence using PCR.
Конечный вектор содержит все необходимые элементы для экспрессии гена и сборки в составе генома рекомбинантного AAV:The final vector contains all the necessary elements for gene expression and assembly into the recombinant AAV genome:
1) терминальные повторы ITR на концах последовательности, которая инкапсидируется в вирусный капсид;1) terminal ITR repeats at the ends of the sequence that is encapsidated into the viral capsid;
2) элементы для экспрессии целевого гена (промотор, энхансер, интрон, последовательность Kozak, трансген, сайт полиаденилирования);2) elements for expression of the target gene (promoter, enhancer, intron, Kozak sequence, transgene, polyadenylation site);
3) ориджин бактериальной репликации и ген устойчивости к антибиотику для наработки плазмидной ДНК в бактериальных клетках.3) the origin of bacterial replication and the antibiotic resistance gene for the production of plasmid DNA in bacterial cells.
Важно отметить, что генетические конструкции, содержащие гены SMN1-WT и SMNl-GeneBeam, отличаются только последовательностями генов SMN1, а в остальном полностью идентичны.It is important to note that the genetic constructs containing the SMN1-WT and SMNl-GeneBeam genes differ only in the sequences of the SMN1 genes, and are otherwise completely identical.
Пример 3. Проверка экспрессии SMN1 с генетических конструкций.Example 3. Testing SMN1 expression from genetic constructs.
Генетические конструкции pAAV-GFP, pAAV-SMN1-WT и pAAV-SMN1-GB трансфецировали в клетки HEK293 и HSMC как описано выше. Использовали 5 мкг ДНК на 1 лунку. Через 72 ч клетки собрали и проанализировали экспрессию SMN1 (с нормализацией на GAPDH) как описано выше.Gene constructs pAAV-GFP, pAAV-SMN1-WT, and pAAV-SMN1-GB were transfected into HEK293 and HSMC cells as described above. 5 μg of DNA per well was used. After 72 h, cells were harvested and SMN1 expression was analyzed (normalized to GAPDH) as described above.
Было обнаружено, что кодон-оптимизация гена SMN1 влияет на транскрипцию SMN1, достоверно увеличивая количество копий мРНК SMN1-GB в несколько раз по сравнению с SMN1-WT на обеих использованных клеточных линиях (фиг. 1). В частности, для клеток HEK293 отношение нормализованной экспрессии SMN1-GB к SMN1-WT составило 3,9, а для клеток HSMC - 12,8.Codon optimization of the SMN1 gene was found to affect SMN1 transcription, significantly increasing the copy number of SMN1-GB mRNA severalfold compared to SMN1-WT in both cell lines used (Fig. 1). Specifically, for HEK293 cells the ratio of normalized expression of SMN1-GB to SMN1-WT was 3.9, and for HSMC cells it was 12.8.
Данное свойство SMN1-GeneBeam, как показывают полученные данные, не является клеточноспецифичным, при этом обеспечивает увеличение экспрессии целевого гена в клетках в несколько раз, что может быть важным преимуществом при разработке генотерапевтических препаратов. При этом данное свойство не обусловлено никакими отличиями в кассете генной экспрессии и свойствами возможных вирусных капсидов, несущих геном с генов SMN1-GeneBeam, поскольку данный анализ проводили на генетических конструкциях, которые отличаются только кодон-оптимизацией генов SMN1, а в остальном полностью идентичны.This property of SMN1-GeneBeam, as the data obtained shows, is not cell-specific, but provides a several-fold increase in the expression of the target gene in cells, which can be an important advantage in the development of gene therapy drugs. Moreover, this property is not due to any differences in the gene expression cassette and the properties of possible viral capsids carrying the genome from the SMN1-GeneBeam genes, since this analysis was carried out on genetic constructs that differ only in the codon optimization of the SMN1 genes, and are otherwise completely identical.
Клетки HSMC были выбраны для проверки экспрессии SMN1 на уровне белка с помощью проточной цитометрии, как описано выше. Было показано, что сигнал от SMN1-специфичных антител в клетках, трансфецированных pAAV-SMN1-GB, выше, чем в клетках, трансфецированных pAAV-SMN1-WT, в 12,2 раз при использованном количестве ДНК 5 мкг на 1 лунку (фиг. 2). Данный результат означает, что SMN1-GB не имеет преимуществ в трансляции, однако в силу увеличенной транскрипции количество конечного белка в клетках также увеличивается.HSMC cells were selected to examine SMN1 expression at the protein level using flow cytometry as described above. It was shown that the signal from SMN1-specific antibodies in cells transfected with pAAV-SMN1-GB was higher than in cells transfected with pAAV-SMN1-WT by 12.2 times when the amount of DNA used was 5 μg per well (Fig. 2). This result means that SMN1-GB does not have a translational advantage, but due to increased transcription, the amount of the final protein in cells also increases.
- 18 045749- 18 045749
Пример 4. Создание вирусных препаратов, экспрессирующих SMN1.Example 4. Creation of viral preparations expressing SMN1.
Плазмиды pAAV-SMN1-WT и pAAV-SMN1-GB вместе с остальными плазмидами, необходимыми для получения вирусных частиц рекомбинантного AAV (см. выше), были использованы для биопроцесса получения AAV. В качестве серотипа был выбран серотип AAV9 дикого типа или с одной или несколькими точечными мутациями.Plasmids pAAV-SMN1-WT and pAAV-SMN1-GB, along with the remaining plasmids necessary for the production of recombinant AAV viral particles (see above), were used for the bioprocess of producing AAV. The serotype chosen was AAV9 serotype wild type or with one or more point mutations.
Во всех случаях сравнение свойств SMN1 дикого типа и SMN1-GeneBeam проводили только в случае идентичности используемого серотипа и мутаций капсида, если они присутствовали. Все серотипы на базе AAV9, дикого типа или с мутациями, в дальнейшем обозначаются как AAV9 без указания мутаций.In all cases, comparisons between the properties of wild-type SMN1 and SMN1-GeneBeam were made only in the case of identity of the serotype used and capsid mutations, if present. All AAV9-based serotypes, wild type or with mutations, are hereafter referred to as AAV9 without specifying mutations.
В результате биопроцесса были получены рекомбинантные вирусные частицы, обозначенные как AAV9-SMN1-WT и AAV9-SMN1-GB, а также контрольные частицы AAV9-GFP. После определения титров вирусных частиц, все 3 препарата с одинаковыми MOI (значения MOI варьировали между экспериментами от 50 до 200 тысяч) были использованы для трансдукции пермиссивных клеток - первичных миоцитов человека HSMC. Дальнейший анализ проводили только в том случае, если эффективность трансдукции составляла не менее 50%.The bioprocess resulted in recombinant viral particles designated AAV9-SMN1-WT and AAV9-SMN1-GB, as well as control AAV9-GFP particles. After determining the titers of viral particles, all 3 drugs with the same MOI (MOI values varied between experiments from 50 to 200 thousand) were used for transduction of permissive cells - primary human myocytes HSMC. Further analysis was performed only if the transduction efficiency was at least 50%.
После успешной трансдукции клетки снимали с подложки, отмывали в фосфатном буфере и анализировали экспрессию SMN1 на уровне мРНК и белка как описано выше. Было показано, что увеличение транскрипционной активности SMN1-GeneBeam сохраняется, таким образом, мРНК SMN1-GeneBeam было детектировано в 7,3 раз больше, чем для SMN1 дикого типа. Аналогичное увеличение наблюдалось и на уровне белка (в 6,8 раз) (фиг. 3), что показывает отсутствие преимуществ SMN1-GB на уровне трансляции, однако детектируемое увеличение эффективности транскрипции позволяет с помощью препарата AAV9-SMN1-GB обеспечивать более высокий уровень экспрессии SMN1 в целевых клетках, что является важным преимуществом при лечении, например, спинальной мышечной атрофии, где уровень экспрессии белка SMN1 определяет тип заболевания от 0 (эмбриональная леталь) до 4 (не требует специального лечения).After successful transduction, cells were removed from the support, washed in phosphate buffer, and SMN1 expression was analyzed at the mRNA and protein levels as described above. The increase in SMN1-GeneBeam transcriptional activity was shown to be maintained, such that 7.3-fold more SMN1-GeneBeam mRNA was detected than for wild-type SMN1. A similar increase was observed at the protein level (6.8-fold) (Fig. 3), which shows that SMN1-GB does not benefit at the translation level, however, the detectable increase in transcription efficiency allows AAV9-SMN1-GB to provide a higher level of expression SMN1 in target cells, which is an important advantage in the treatment of, for example, spinal muscular atrophy, where the level of SMN1 protein expression determines the type of disease from 0 (fetal lethal) to 4 (does not require special treatment).
Claims (13)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2020118148 | 2020-06-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
EA045749B1 true EA045749B1 (en) | 2023-12-22 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4159863A1 (en) | Codon-optimized nucleic acid encoding smn1 protein | |
US20210403947A1 (en) | Miniaturized dystrophins and uses thereof | |
AU2003272672B2 (en) | High titer recombinant AAV production | |
US20220306696A1 (en) | Isolated modified vp1 capsid protein of aav5 | |
US20240091383A1 (en) | Synergistic effect of smn1 and mir-23a in treating spinal muscular atrophy | |
EA045749B1 (en) | CODON-OPTIMIZED NUCLEIC ACID ENCODING THE SMN1 PROTEIN AND ITS APPLICATION | |
JP2023540085A (en) | AAV5-based vaccine against SARS-CoV-2 | |
OA21075A (en) | Codon-optimized nucleic acid that encodes SMN1 protein, and use thereof | |
WO2020187268A1 (en) | Fusion protein for enhancing gene editing and use thereof | |
CN117836312A (en) | Isolated modified AAV9 capsid protein VP1 | |
EA045824B1 (en) | ISOLATED MODIFIED PROTEIN VP1 OF AAV5 CAPSIDS | |
WO2023022633A1 (en) | Isolated modified aav5 capsid protein vp1 | |
JP2024509224A (en) | Codon-optimized nucleic acid encoding FIX protein | |
WO2023111106A1 (en) | Fukutin related protein gene transfer increase using modified itr sequences | |
EA046419B1 (en) | MINIATURIZED DYSTROPHINS AND THEIR APPLICATIONS |