CN115605266A - Dysferlin双载体的基因疗法 - Google Patents
Dysferlin双载体的基因疗法 Download PDFInfo
- Publication number
- CN115605266A CN115605266A CN202180033036.8A CN202180033036A CN115605266A CN 115605266 A CN115605266 A CN 115605266A CN 202180033036 A CN202180033036 A CN 202180033036A CN 115605266 A CN115605266 A CN 115605266A
- Authority
- CN
- China
- Prior art keywords
- aav
- seq
- polynucleotide
- nucleotide sequence
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000620 Dysferlin Proteins 0.000 title claims abstract description 138
- 102000004168 Dysferlin Human genes 0.000 title claims abstract 14
- 238000001415 gene therapy Methods 0.000 title description 7
- 239000002157 polynucleotide Substances 0.000 claims abstract description 705
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 705
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 705
- 101001016184 Homo sapiens Dysferlin Proteins 0.000 claims abstract description 397
- 102000056610 human DYSF Human genes 0.000 claims abstract description 385
- 239000012634 fragment Substances 0.000 claims abstract description 166
- 239000013612 plasmid Substances 0.000 claims abstract description 144
- 239000013598 vector Substances 0.000 claims abstract description 132
- 239000000203 mixture Substances 0.000 claims abstract description 111
- 208000021642 Muscular disease Diseases 0.000 claims abstract description 79
- 201000009623 Myopathy Diseases 0.000 claims abstract description 77
- 230000009977 dual effect Effects 0.000 claims abstract description 47
- 239000002773 nucleotide Substances 0.000 claims description 520
- 125000003729 nucleotide group Chemical group 0.000 claims description 520
- 239000013607 AAV vector Substances 0.000 claims description 262
- 108090000623 proteins and genes Proteins 0.000 claims description 172
- 210000004027 cell Anatomy 0.000 claims description 163
- 238000000034 method Methods 0.000 claims description 127
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 98
- 102000004169 proteins and genes Human genes 0.000 claims description 94
- 241000702421 Dependoparvovirus Species 0.000 claims description 71
- 238000004806 packaging method and process Methods 0.000 claims description 55
- 210000003205 muscle Anatomy 0.000 claims description 50
- 230000003612 virological effect Effects 0.000 claims description 42
- 238000004519 manufacturing process Methods 0.000 claims description 33
- 239000003550 marker Substances 0.000 claims description 33
- 241000701161 unidentified adenovirus Species 0.000 claims description 33
- 230000010076 replication Effects 0.000 claims description 30
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 26
- 208000037150 Dysferlin-related limb-girdle muscular dystrophy R2 Diseases 0.000 claims description 24
- 201000009563 autosomal recessive limb-girdle muscular dystrophy type 2B Diseases 0.000 claims description 24
- 230000003115 biocidal effect Effects 0.000 claims description 23
- 201000009342 Limb-girdle muscular dystrophy Diseases 0.000 claims description 21
- 229940027941 immunoglobulin g Drugs 0.000 claims description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 16
- 239000003814 drug Substances 0.000 claims description 16
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 15
- 108010059343 MM Form Creatine Kinase Proteins 0.000 claims description 15
- 108091023045 Untranslated Region Proteins 0.000 claims description 14
- 230000008488 polyadenylation Effects 0.000 claims description 14
- 108020005067 RNA Splice Sites Proteins 0.000 claims description 13
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 13
- 102000005604 Myosin Heavy Chains Human genes 0.000 claims description 12
- 108010084498 Myosin Heavy Chains Proteins 0.000 claims description 12
- 229930027917 kanamycin Natural products 0.000 claims description 11
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 claims description 11
- 229960000318 kanamycin Drugs 0.000 claims description 11
- 229930182823 kanamycin A Natural products 0.000 claims description 11
- 239000013608 rAAV vector Substances 0.000 claims description 11
- 108090000204 Dipeptidase 1 Proteins 0.000 claims description 10
- 239000003242 anti bacterial agent Substances 0.000 claims description 10
- 101150066583 rep gene Proteins 0.000 claims description 10
- 108010085238 Actins Proteins 0.000 claims description 9
- 239000003623 enhancer Substances 0.000 claims description 9
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 8
- 230000000747 cardiac effect Effects 0.000 claims description 8
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 7
- 241000124008 Mammalia Species 0.000 claims description 7
- 101150044789 Cap gene Proteins 0.000 claims description 6
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 claims description 6
- 108090000362 Lymphotoxin-beta Proteins 0.000 claims description 6
- 108010065729 Troponin I Proteins 0.000 claims description 6
- 210000000663 muscle cell Anatomy 0.000 claims description 6
- 102000004420 Creatine Kinase Human genes 0.000 claims description 5
- 108010042126 Creatine kinase Proteins 0.000 claims description 5
- 238000011002 quantification Methods 0.000 claims description 5
- 230000002463 transducing effect Effects 0.000 claims description 5
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 201000006938 muscular dystrophy Diseases 0.000 claims description 4
- 102000007469 Actins Human genes 0.000 claims description 3
- 101001044938 Dictyostelium discoideum Diacylglycerol kinase A Proteins 0.000 claims description 3
- 241000283073 Equus caballus Species 0.000 claims description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 3
- 206010021143 Hypoxia Diseases 0.000 claims description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 claims description 3
- 102000013394 Troponin I Human genes 0.000 claims description 3
- 210000002064 heart cell Anatomy 0.000 claims description 3
- 210000005229 liver cell Anatomy 0.000 claims description 3
- 210000001057 smooth muscle myoblast Anatomy 0.000 claims description 3
- 210000000130 stem cell Anatomy 0.000 claims description 3
- 241001494479 Pecora Species 0.000 claims description 2
- 230000002107 myocardial effect Effects 0.000 claims description 2
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 claims 31
- HWHLPVGTWGOCJO-UHFFFAOYSA-N Trihexyphenidyl Chemical group C1CCCCC1C(C=1C=CC=CC=1)(O)CCN1CCCCC1 HWHLPVGTWGOCJO-UHFFFAOYSA-N 0.000 claims 1
- 229960001032 trihexyphenidyl Drugs 0.000 claims 1
- 239000013603 viral vector Substances 0.000 abstract description 44
- 102100032248 Dysferlin Human genes 0.000 description 121
- 230000014509 gene expression Effects 0.000 description 111
- 108090000765 processed proteins & peptides Proteins 0.000 description 66
- 102000004196 processed proteins & peptides Human genes 0.000 description 57
- 229920001184 polypeptide Polymers 0.000 description 54
- 108020004414 DNA Proteins 0.000 description 49
- 210000004899 c-terminal region Anatomy 0.000 description 41
- 210000001519 tissue Anatomy 0.000 description 28
- 150000001413 amino acids Chemical class 0.000 description 24
- 239000000523 sample Substances 0.000 description 23
- 239000012528 membrane Substances 0.000 description 20
- 239000002245 particle Substances 0.000 description 19
- 238000002347 injection Methods 0.000 description 18
- 239000007924 injection Substances 0.000 description 18
- 238000000746 purification Methods 0.000 description 18
- 108020004635 Complementary DNA Proteins 0.000 description 17
- 238000010804 cDNA synthesis Methods 0.000 description 17
- 239000002299 complementary DNA Substances 0.000 description 17
- 238000012384 transportation and delivery Methods 0.000 description 17
- 201000010099 disease Diseases 0.000 description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 16
- 108090000565 Capsid Proteins Proteins 0.000 description 15
- 102100023321 Ceruloplasmin Human genes 0.000 description 15
- 230000000694 effects Effects 0.000 description 15
- 241000700605 Viruses Species 0.000 description 14
- 241001465754 Metazoa Species 0.000 description 13
- 210000000234 capsid Anatomy 0.000 description 13
- 230000008439 repair process Effects 0.000 description 13
- 238000011282 treatment Methods 0.000 description 13
- 125000000539 amino acid group Chemical group 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 210000004900 c-terminal fragment Anatomy 0.000 description 10
- 239000000499 gel Substances 0.000 description 10
- 238000001802 infusion Methods 0.000 description 10
- 238000007918 intramuscular administration Methods 0.000 description 10
- 238000001990 intravenous administration Methods 0.000 description 10
- 150000007523 nucleic acids Chemical class 0.000 description 10
- 241000699670 Mus sp. Species 0.000 description 9
- 239000000443 aerosol Substances 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 239000006071 cream Substances 0.000 description 9
- 239000003937 drug carrier Substances 0.000 description 9
- 239000007943 implant Substances 0.000 description 9
- 238000007912 intraperitoneal administration Methods 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 239000002674 ointment Substances 0.000 description 9
- 239000007921 spray Substances 0.000 description 9
- 238000010254 subcutaneous injection Methods 0.000 description 9
- 239000007929 subcutaneous injection Substances 0.000 description 9
- 239000006217 urethral suppository Substances 0.000 description 9
- -1 cells Substances 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 108020001507 fusion proteins Proteins 0.000 description 8
- 102000037865 fusion proteins Human genes 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- 210000001087 myotubule Anatomy 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 8
- 108020004707 nucleic acids Proteins 0.000 description 8
- 238000001262 western blot Methods 0.000 description 8
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 7
- 239000013592 cell lysate Substances 0.000 description 7
- 239000012530 fluid Substances 0.000 description 7
- 238000001476 gene delivery Methods 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 210000002027 skeletal muscle Anatomy 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- 239000002671 adjuvant Substances 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 239000003085 diluting agent Substances 0.000 description 6
- 239000004615 ingredient Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 210000004940 nucleus Anatomy 0.000 description 6
- 239000000546 pharmaceutical excipient Substances 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000011200 topical administration Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 229940096973 urethral suppository Drugs 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 238000011529 RT qPCR Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 230000007812 deficiency Effects 0.000 description 5
- 238000012744 immunostaining Methods 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 238000010255 intramuscular injection Methods 0.000 description 5
- 239000007927 intramuscular injection Substances 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 239000002105 nanoparticle Substances 0.000 description 5
- 230000002018 overexpression Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 210000001236 prokaryotic cell Anatomy 0.000 description 5
- 238000012385 systemic delivery Methods 0.000 description 5
- 238000002560 therapeutic procedure Methods 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 210000002845 virion Anatomy 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 206010016654 Fibrosis Diseases 0.000 description 4
- 206010061218 Inflammation Diseases 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 238000011887 Necropsy Methods 0.000 description 4
- 241000125945 Protoparvovirus Species 0.000 description 4
- 241000700159 Rattus Species 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 4
- 231100000673 dose–response relationship Toxicity 0.000 description 4
- 230000004761 fibrosis Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 210000002216 heart Anatomy 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 230000004054 inflammatory process Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 210000001179 synovial fluid Anatomy 0.000 description 4
- 230000028973 vesicle-mediated transport Effects 0.000 description 4
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 230000004543 DNA replication Effects 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 3
- 102000005720 Glutathione transferase Human genes 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 230000005867 T cell response Effects 0.000 description 3
- 102100036407 Thioredoxin Human genes 0.000 description 3
- HXNVJPQADLRHGR-JBACZVJFSA-N Trp-Glu-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXNVJPQADLRHGR-JBACZVJFSA-N 0.000 description 3
- 108020005202 Viral DNA Proteins 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 239000012620 biological material Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 230000012202 endocytosis Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 238000010166 immunofluorescence Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000002458 infectious effect Effects 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000002934 lysing effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 210000004898 n-terminal fragment Anatomy 0.000 description 3
- 230000017074 necrotic cell death Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 239000003755 preservative agent Substances 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 239000011347 resin Substances 0.000 description 3
- 229920005989 resin Polymers 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 108060008226 thioredoxin Proteins 0.000 description 3
- 230000000699 topical effect Effects 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 2
- 102000000412 Annexin Human genes 0.000 description 2
- 108050008874 Annexin Proteins 0.000 description 2
- 206010003445 Ascites Diseases 0.000 description 2
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 2
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 2
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 102000003904 Caveolin 3 Human genes 0.000 description 2
- 108090000268 Caveolin 3 Proteins 0.000 description 2
- 108010035532 Collagen Proteins 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102100037241 Endoglin Human genes 0.000 description 2
- 108010036395 Endoglin Proteins 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 2
- 101000775053 Homo sapiens Neuroblast differentiation-associated protein AHNAK Proteins 0.000 description 2
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 2
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 2
- QRTVJGKXFSYJGW-KBIXCLLPSA-N Ile-Glu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QRTVJGKXFSYJGW-KBIXCLLPSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- 102100039564 Leukosialin Human genes 0.000 description 2
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 2
- WLCYCADOWRMSAJ-CIUDSAMLSA-N Lys-Asn-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O WLCYCADOWRMSAJ-CIUDSAMLSA-N 0.000 description 2
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 2
- BPDXWKVZNCKUGG-BZSNNMDCSA-N Lys-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N BPDXWKVZNCKUGG-BZSNNMDCSA-N 0.000 description 2
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 2
- 208000010428 Muscle Weakness Diseases 0.000 description 2
- 206010028372 Muscular weakness Diseases 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- 102000003505 Myosin Human genes 0.000 description 2
- 108060008487 Myosin Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 102100031837 Neuroblast differentiation-associated protein AHNAK Human genes 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 2
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 2
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 2
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 2
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- PALLCTDPFINNMM-JQHSSLGASA-N Trp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N PALLCTDPFINNMM-JQHSSLGASA-N 0.000 description 2
- 102000004243 Tubulin Human genes 0.000 description 2
- 108090000704 Tubulin Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 208000025341 autosomal recessive disease Diseases 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 229920001436 collagen Polymers 0.000 description 2
- 238000002648 combination therapy Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 210000002808 connective tissue Anatomy 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 229960003624 creatine Drugs 0.000 description 2
- 239000006046 creatine Substances 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 239000002612 dispersion medium Substances 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 210000000981 epithelium Anatomy 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 230000005714 functional activity Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 238000002789 length control Methods 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000013411 master cell bank Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000004897 n-terminal region Anatomy 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 235000019198 oils Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000000816 peptidomimetic Substances 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 229920001983 poloxamer Polymers 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 210000004909 pre-ejaculatory fluid Anatomy 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 102220030037 rs398123767 Human genes 0.000 description 2
- 102220002559 rs727503909 Human genes 0.000 description 2
- 102220002552 rs786205081 Human genes 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 238000007910 systemic administration Methods 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- 125000001917 2,4-dinitrophenyl group Chemical group [H]C1=C([H])C(=C([H])C(=C1*)[N+]([O-])=O)[N+]([O-])=O 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- KQPKMEYBZUPZGK-UHFFFAOYSA-N 4-[(4-azido-2-nitroanilino)methyl]-5-(hydroxymethyl)-2-methylpyridin-3-ol Chemical compound CC1=NC=C(CO)C(CNC=2C(=CC(=CC=2)N=[N+]=[N-])[N+]([O-])=O)=C1O KQPKMEYBZUPZGK-UHFFFAOYSA-N 0.000 description 1
- 101150096316 5 gene Proteins 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- CVHJIWVKTFNGHT-ACZMJKKPSA-N Ala-Gln-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N CVHJIWVKTFNGHT-ACZMJKKPSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 206010002556 Ankylosing Spondylitis Diseases 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 241000180579 Arca Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 1
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- MHBUWPFQNPJTAS-QAETUUGQSA-N Asn-Leu-Phe-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 MHBUWPFQNPJTAS-QAETUUGQSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 1
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 1
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- DKQCWCQRAMAFLN-UBHSHLNASA-N Asp-Trp-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O DKQCWCQRAMAFLN-UBHSHLNASA-N 0.000 description 1
- CXEFNHOVIIDHFU-IHPCNDPISA-N Asp-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)O)N CXEFNHOVIIDHFU-IHPCNDPISA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- NTTIDCCSYIDANP-UHFFFAOYSA-N BCCP Chemical compound BCCP NTTIDCCSYIDANP-UHFFFAOYSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 101000580791 Beet necrotic yellow vein virus (isolate Japan/S) Replicase Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 1
- 101710180532 Biotin carboxyl carrier protein of acetyl-CoA carboxylase Proteins 0.000 description 1
- 101100381481 Caenorhabditis elegans baz-2 gene Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102100035371 Chymotrypsin-like elastase family member 1 Human genes 0.000 description 1
- 101710138848 Chymotrypsin-like elastase family member 1 Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102100031673 Corneodesmosin Human genes 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 101150083642 DYSF gene Proteins 0.000 description 1
- 101000872083 Danio rerio Delta-like protein C Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102100036912 Desmin Human genes 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 108010069091 Dystrophin Proteins 0.000 description 1
- 102000001039 Dystrophin Human genes 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101710099240 Elastase-1 Proteins 0.000 description 1
- 238000011510 Elispot assay Methods 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 101150066516 GST gene Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- NXPXQIZKDOXIHH-JSGCOSHPSA-N Gln-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N NXPXQIZKDOXIHH-JSGCOSHPSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 1
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- DXMOIVCNJIJQSC-QEJZJMRPSA-N Glu-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DXMOIVCNJIJQSC-QEJZJMRPSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- 108010018962 Glucosephosphate Dehydrogenase Proteins 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- JPWIMMUNWUKOAD-STQMWFEESA-N Gly-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN JPWIMMUNWUKOAD-STQMWFEESA-N 0.000 description 1
- YYQGVXNKAXUTJU-YUMQZZPRSA-N Gly-Cys-His Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O YYQGVXNKAXUTJU-YUMQZZPRSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- LJXWZPHEMJSNRC-KBPBESRZSA-N Gly-Gln-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LJXWZPHEMJSNRC-KBPBESRZSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- PCPOYRCAHPJXII-UWVGGRQHSA-N Gly-Lys-Met Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PCPOYRCAHPJXII-UWVGGRQHSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- ZNPRMNDAFQKATM-LKTVYLICSA-N His-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZNPRMNDAFQKATM-LKTVYLICSA-N 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 1
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 1
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101001111984 Homo sapiens N-acylneuraminate-9-phosphatase Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- HODVZHLJUUWPKY-STECZYCISA-N Ile-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=C(O)C=C1 HODVZHLJUUWPKY-STECZYCISA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 102100037872 Intercellular adhesion molecule 2 Human genes 0.000 description 1
- 101710148794 Intercellular adhesion molecule 2 Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- JLYUZRKPDKHUTC-WDSOQIARSA-N Leu-Pro-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JLYUZRKPDKHUTC-WDSOQIARSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- URBJRJKWSUFCKS-AVGNSLFASA-N Lys-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N URBJRJKWSUFCKS-AVGNSLFASA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 102100025136 Macrosialin Human genes 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- CNUPMMXDISGXMU-CIUDSAMLSA-N Met-Cys-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O CNUPMMXDISGXMU-CIUDSAMLSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- GHQFLTYXGUETFD-UFYCRDLUSA-N Met-Tyr-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N GHQFLTYXGUETFD-UFYCRDLUSA-N 0.000 description 1
- 201000001087 Miyoshi muscular dystrophy Diseases 0.000 description 1
- 208000009376 Miyoshi myopathy Diseases 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 102100023906 N-acylneuraminate-9-phosphatase Human genes 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241001045988 Neogene Species 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 241001195348 Nusa Species 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 208000005228 Pericardial Effusion Diseases 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 1
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 1
- MRNRMSDVVSKPGM-AVGNSLFASA-N Phe-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRNRMSDVVSKPGM-AVGNSLFASA-N 0.000 description 1
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 229940096437 Protein S Drugs 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 208000022583 Qualitative or quantitative defects of dysferlin Diseases 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 101100372762 Rattus norvegicus Flt1 gene Proteins 0.000 description 1
- 101100409194 Rattus norvegicus Ppargc1b gene Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 241000220221 Rosales Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- BIWBTRRBHIEVAH-IHPCNDPISA-N Ser-Tyr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BIWBTRRBHIEVAH-IHPCNDPISA-N 0.000 description 1
- 102100021905 Synapsin-1 Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 1
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- GYDJEQRTZSCIOI-UHFFFAOYSA-N Tranexamic acid Chemical compound NCC1CCC(C(O)=O)CC1 GYDJEQRTZSCIOI-UHFFFAOYSA-N 0.000 description 1
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 1
- NAQBQJOGGYGCOT-QEJZJMRPSA-N Trp-Asn-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NAQBQJOGGYGCOT-QEJZJMRPSA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- LFGHEUIUSIRJAE-TUSQITKMSA-N Trp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N LFGHEUIUSIRJAE-TUSQITKMSA-N 0.000 description 1
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 1
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 1
- FQNUWOHNGJWNLM-QWRGUYRKSA-N Tyr-Cys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FQNUWOHNGJWNLM-QWRGUYRKSA-N 0.000 description 1
- ZAGPDPNPWYPEIR-SRVKXCTJSA-N Tyr-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ZAGPDPNPWYPEIR-SRVKXCTJSA-N 0.000 description 1
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 1
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 1
- XOVDRAVPGHTYLP-JYJNAYRXSA-N Tyr-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O XOVDRAVPGHTYLP-JYJNAYRXSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 1
- 108091034131 VA RNA Proteins 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- DLYOEFGPYTZVSP-AEJSXWLSSA-N Val-Cys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N DLYOEFGPYTZVSP-AEJSXWLSSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 1
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- LNWSJGJCLFUNTN-ZOBUZTSGSA-N Val-Trp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LNWSJGJCLFUNTN-ZOBUZTSGSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108010031318 Vitronectin Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 238000004082 amperometric method Methods 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 210000001742 aqueous humor Anatomy 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 238000000594 atomic force spectroscopy Methods 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 108010002833 beta-lactamase TEM-1 Proteins 0.000 description 1
- 210000000941 bile Anatomy 0.000 description 1
- 229920000249 biocompatible polymer Polymers 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 101150037655 blaA gene Proteins 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 101150064899 capa gene Proteins 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 210000002939 cerumen Anatomy 0.000 description 1
- 210000003756 cervix mucus Anatomy 0.000 description 1
- 102000021178 chitin binding proteins Human genes 0.000 description 1
- 108091011157 chitin binding proteins Proteins 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 210000004913 chyme Anatomy 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000003920 cognitive function Effects 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 239000003246 corticosteroid Substances 0.000 description 1
- 229960001334 corticosteroids Drugs 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 210000002726 cyst fluid Anatomy 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000005045 desmin Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 210000000188 diaphragm Anatomy 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- UGMCXQCYOVCMTB-UHFFFAOYSA-K dihydroxy(stearato)aluminium Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[Al](O)O UGMCXQCYOVCMTB-UHFFFAOYSA-K 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004980 dosimetry Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 150000002222 fluorine compounds Chemical class 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 238000002599 functional magnetic resonance imaging Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 230000002710 gonadal effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 108010043612 kentsin Proteins 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 208000027905 limb weakness Diseases 0.000 description 1
- 231100000861 limb weakness Toxicity 0.000 description 1
- 229920006008 lipopolysaccharide Polymers 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 210000005060 membrane bound organelle Anatomy 0.000 description 1
- 210000004914 menses Anatomy 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 239000002923 metal particle Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 230000020763 muscle atrophy Effects 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 201000000585 muscular atrophy Diseases 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 229920005615 natural polymer Polymers 0.000 description 1
- 101150091879 neo gene Proteins 0.000 description 1
- 231100000956 nontoxicity Toxicity 0.000 description 1
- 101150073438 nusA gene Proteins 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000001819 pancreatic juice Anatomy 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 210000004912 pericardial fluid Anatomy 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 208000026526 progressive weakness Diseases 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 210000004908 prostatic fluid Anatomy 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 210000002097 psoas muscle Anatomy 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 210000004915 pus Anatomy 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 102220030096 rs398123799 Human genes 0.000 description 1
- 102200072717 rs61742872 Human genes 0.000 description 1
- 102220084268 rs766341386 Human genes 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 210000002374 sebum Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 238000011287 therapeutic dose Methods 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 229940033663 thimerosal Drugs 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 230000005641 tunneling Effects 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 238000001291 vacuum drying Methods 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000007332 vesicle formation Effects 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000010464 virion assembly Effects 0.000 description 1
- 238000004832 voltammetry Methods 0.000 description 1
- 210000004916 vomit Anatomy 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4707—Muscular dystrophy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0075—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0019—Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
- C12N2750/14152—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/40—Systems of functionally co-operating vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Neurology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Physical Education & Sports Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Dermatology (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
Abstract
本文描述了编码人dysferlin蛋白的片段的重组多核苷酸。此外,还进一步描述了包含此类重组多核苷酸的质粒、病毒载体、双载体系统、细胞和组合物。此类重组多核苷酸、质粒、病毒载体、双载体系统、细胞和组合物可以被用于治疗dysferlin肌病。
Description
相关申请的交叉引用
本申请根据35 U.S.C. § 119(e)要求2020年5月13日提交的美国临时申请63/024,338号的优先权,其内容通过引用并入本申请中。
以电子方式提交的材料通过引用并入
本申请含有作为本公开的单独部分的计算机可读形式的序列表,其内容通过引用整体并入本文中并且标识如下:文件名:106887_8070_SL.txt;大小:129,123字节,创建于;2021年5月11日。
技术领域
本发明提供了包含人类dysferlin基因片段的多核苷酸和包含所述多核苷酸的质粒、病毒载体、细胞和组合物,以及使用所述多核苷酸、质粒、病毒载体和组合物治疗患有dysferlin缺陷(例如肢带型肌营养不良症2B型(limb girdle muscular dystrophy type2B)、三好氏肌肉病变(Miyoshi Myopathy)和远端前群肌病(distal anteriorcompartment myopathy)的对象的方法。
背景技术
Dysferlin肌病(Dysferlinopathy)是常染色体隐性疾病,包括肢带型肌营养不良症2B型(LGMD2B)、三好氏肌肉病变和远端前群肌病,统称为dysferlin肌病。肢带型肌营养不良症2B型(LGMD2B)是美国最常见的LGMD之一,全球报告的发病率为1/100,000-1/200,000。三好氏肌肉病变是dysferlin肌病的更受限的下肢远端形式。事实上,在考虑疾病谱时,LGMD2B往往从远端腓肠肌萎缩开始,然后随着时间的推移扩散而影响近端肌肉。dysferlin的缺失导致进行式的营养不良,伴随慢性肌纤维损失、炎症、脂肪替代和纤维化,它们都会导致肌肉无力恶化。
dysferlin基因很大,到目前为止已经确定了55个外显子,跨越至少150 kb的基因组DNA。这些外显子预测大约6.5 kb的cDNA和2,088个氨基酸的蛋白质。Dysferlin是237kDa的蛋白质,其由C端疏水跨膜结构域和带有多个C2结构域的较长的细胞质方向的亲水区域组成。越来越多的研究表明dysferlin的缺失损害了骨骼肌中Ca2+依赖性的膜修复(Songet al., Proc. Natl. Acad. Sci USA 98: 4084-4088, 2001; Schnepp et al., J.Virol. 77:3495-3504, 2003)。此外,已经证明了dysferlin与其他参与膜修复的蛋白质(包括膜联蛋白A1和A2、AHNAK和小窝蛋白-3)相互作用。当考虑到骨骼肌是机械性活动的且容易受伤时,就强调了这个系统的重要性;因此,必须有强大的膜重封机制。缺失或突变的dysferlin导致膜修复受损和一连串事件,首先是肌肉纤维坏死,导致肌肉纤维损失和进行性肢体无力。肌肉纤维再生能力的损失被认为是dysferlin缺陷的促进性后果。Dysferlin还与囊泡运输和内吞作用、T型小管的形成等有关。
Dysferlin基因的突变导致等位的常染色体隐性疾病,包括肢带型肌营养不良症2B型(LGMD2B)、三好氏肌肉病变和远端前群肌病,统称为dysferlin肌病(参见,例如Groseet al., PloS one 7:e39233,2012;Bansal et al., Nature 423, 168-172,2003;Moore,S.A., et al., J. Neuropathol. Exp. Neurol 65: 995-1003, 2006;Rosales et al.,Muscle Nerv 42:14-21, 2010;Sondergaard et al., Anns of Clin. Trans. Neurol.2:256-270, 2015;Evesson et al., J. Biol. Chem. 285: 28529-28539, 2010和Klingeet al., Soc. Exp. Biol. 21: 1768-1776, 2007,其中的每篇文献都通过引用整体并入本文)。不太常见的dysferlin缺陷的表型表现为脊柱强直综合征(rigid spine syndrome)(Klinge et al., Muscle Nerve 41: 166-173, 2010,该文献通过引用整体并入本文)。一般来说,患者在20岁早期时出现缓慢进行性的无力和高血清肌酸激酶(CK)。约三分之一的患者在发病后15年内成为依赖轮椅的人。临床上,心脏是不受影响的且认知功能不受影响。肌无力的分布相对受限的表型变异为潜在的区域基因置换治疗奠定了基础,可能极大地影响该疾病的生活质量(Grose et al., PLoS One 7:e39233, 2012,Barton et al.,Muscle Nerve 42: 22-29, 2010)。单核苷酸变化是典型的DYSF基因突变,这也有利于基因转移的成功,以保护转基因产物免受免疫排斥(Rodine-Klapac et al., Mol. Ther. 18:109-117, 2010;Mendell et al., N. Eng. J. Med. 363: 1429-1437, 2010;Mendell etal., Ann. Neurol. 66:290-297, 2009;其中每篇文献都通过引用整体并入本文)。
目前还没有治愈或治疗dysferlin肌病的方法。总体而言,评估基因置换或替代基因置换的临床前研究表明多种策略在恢复膜修复方面表现出一定的功效。dysferlin基因包括55个外显子,含有150 kb的基因组DNA及其6.5 kb的相关cDNA。然而,对于基因置换,AAV的包装极限是4.7 kb,其小于为6.5 kb的dysferlin的cDNA序列。因此,需要对LGMD2B进行处理就需要能够将功能性全长的dysferlin蛋白递送给有需要的对象的新机制。
发明内容
本文公开了一种编码人dysferlin(hDYSF)蛋白的片段的重组多核苷酸,其中所述重组多核苷酸包含第一核苷酸序列,其中所述第一核苷酸序列由以下序列组成:(a)SEQ IDNO: 1、6或18的核苷酸序列;(b)与SEQ ID NO: 1、SEQ ID NO: 6或SEQ ID NO: 18的核苷酸序列在SEQ ID NO: 1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(c)SEQ ID NO: 13或15的核苷酸序列;(d)与SEQ ID NO: 13或15的核苷酸序列在SEQ ID NO: 13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(e)编码hDYSF蛋白的片段的核苷酸序列,其中所述片段由SEQ ID NO: 9的氨基酸序列组成;或者(f)与(e)的核苷酸序列在(e)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含一个或多个选自末端反向重复序列(ITR)、启动子、内含子、选择标志物或复制原点(ORI)的另外的核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含包括ITR的另外的核苷酸序列。在一些实施方案中,ITR是AAV ITR。在一些实施方案中,AAV ITR是AAV2 ITR或AAV3 ITR。在一些实施方案中,重组多核苷酸包含两个ITR。在一些实施方案中,ITR包含SEQ ID NO: 3或SEQID NO: 17的核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含包括启动子的另外的核苷酸序列。在一些实施方案中,启动子是肌肉特异性启动子。在一些实施方案中,肌肉特异性启动子选自人骨骼肌动蛋白基因元件、心脏肌动蛋白基因元件、肌间线蛋白(desmin)启动子、骨骼α-肌动蛋白(ASKA)启动子、肌钙蛋白I(TNNI2)启动子、心肌特异性增强子结合因子mef结合元件、肌肉肌酸激酶(MCK)启动子、截短的MCK(tMCK)启动子、肌球蛋白重链(MHC)启动子、混合肌球蛋白重链增强子/MCK增强子-启动子(MHCK7)启动子、C5-12启动子、小鼠肌酸激酶增强子元件、骨骼快收缩肌钙蛋白c基因元件、慢收缩心肌肌钙蛋白c基因元件、慢收缩肌钙蛋白i基因元件、低氧诱导性核因子。在一些实施方案中,肌肉特异性启动子是MHCK7启动子。在一些实施方案中,启动子是重组启动子。在一些实施方案中,重组启动子是重组肌肉特异性启动子。在一些实施方案中,重组肌肉特异性启动子是重组肌球蛋白重链-肌酸激酶肌肉特异性启动子。在一些实施方案中,启动子包含SEQ ID NO: 4的核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含包括内含子的另外的核苷酸序列。在一些实施方案中,内含子包括5'供体位点、分支点和/或3'剪接位点。在一些实施方案中,内含子是嵌合内含子。在一些实施方案中,内含子包含来自人类β-球蛋白基因的5'供体位点。在一些实施方案中,内含子包含来自免疫球蛋白G(IgG)重链的分支点。在一些实施方案中,内含子包含来自免疫球蛋白G(IgG)重链的3′剪接受体位点。在一些实施方案中,内含子包含SEQ ID NO: 5的核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含包括选择标志物的另外的核苷酸序列。在一些实施方案中,选择标志物是抗生素抗性基因。在一些实施方案中,抗生素抗性基因是β-内酰胺酶基因或卡那霉素(kanamycin)抗性基因。在一些实施方案中,重组多核苷酸包含SEQ ID NO: 6或SEQ ID NO: 18的核苷酸序列。在一些实施方案中,重组核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,重组核苷酸不包含除一个或多个ITR以外的AAV序列。
在一些实施方案中,重组核苷酸不包含除一个或多个ITR以外的病毒序列。
本文公开了编码人dysferlin蛋白的片段的重组多核苷酸序列,其中所述重组多核苷酸包含第二核苷酸序列,其中所述第二核苷酸序列由以下序列组成:(a)SEQ ID NO:2、8或19的核苷酸序列;(b)与SEQ ID NO: 2、8或19的核苷酸序列在SEQ ID NO: 2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(c)SEQ ID NO: 14或16的核苷酸序列;(d)与SEQ ID NO: 14或16的核苷酸序列在SEQ IDNO: 14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(e)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ IDNO: 10的氨基酸序列组成;或者(f)与(e)的多核苷酸序列在(d)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含一个或多个包含末端反向重复序列(ITR)、选择标志物、复制原点(ORI)、非翻译区(UTR)或多腺苷酸化(polyA)信号的另外的核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含包括ITR的另外的核苷酸序列。在一些实施方案中,ITR是AAV ITR。在一些实施方案中,AAV ITR是AAV2 ITR或AAV3 ITR。在一些实施方案中,重组核苷酸包含两个ITR。在一些实施方案中,ITR包含SEQ ID NO: 3或17的核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含包括polyA信号的核苷酸序列。在一些实施方案中,polyA信号是人工polyA信号。在一些实施方案中,polyA信号包含SEQ IDNO: 7的核苷酸序列。
在一些实施方案中,重组多核苷酸进一步包含包括选择标志物的另外的核苷酸序列。在一些实施方案中,选择标志物是抗生素抗性基因。在一些实施方案中,抗生素抗性基因是β-内酰胺酶基因或卡那霉素抗性基因。在一些实施方案中,重组多核苷酸包含SEQ IDNO: 8或SEQ ID NO: 19的核苷酸序列。
在一些实施方案中,重组核苷酸进一步不包含编码hDYSF蛋白的第一片段的第一多核苷酸序列。
在一些实施方案中,重组核苷酸不包含除一个或多个ITR以外的AAV序列。
在一些实施方案中,重组核苷酸不包含除一个或多个ITR以外的病毒序列。
本文进一步公开了一种双腺相关病毒(AAV)载体系统,其包含:(a)第一AAV载体,其中所述第一AAV载体包含编码人dysferlin(hDYSF)蛋白的N端片段的第一重组多核苷酸,其中所述第一重组多核苷酸包含第一核苷酸序列,其中所述第一核苷酸序列由以下序列组成:(i)SEQ ID NO: 1、6或18的核苷酸序列;(ii)与SEQ ID NO:1、SEQ ID NO: 6或SEQ IDNO: 18的核苷酸序列在SEQ ID NO: 1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO: 13或15的核苷酸序列;(iv)与SEQ ID NO: 13或15的核苷酸序列在SEQ ID NO: 13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中所述片段由SEQ ID NO: 9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)第二AAV载体,其中所述第二AAV载体包含编码人dysferlin蛋白的C端片段的第二重组多核苷酸,其中所述第二重组多核苷酸包含第二核苷酸序列,其中所述第二核苷酸序列由以下序列组成:(i)SEQ ID NO: 2、8或19的核苷酸序列;(ii)与SEQID NO: 2、8或19的核苷酸序列在SEQ ID NO: 2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO: 14或16的核苷酸序列;(iv)与SEQ ID NO: 14或16的核苷酸序列在SEQ ID NO: 14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO: 10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
本文进一步公开了包含任何本文公开的重组多核苷酸的腺相关病毒(AAV)载体。在一些实施方案中,重组多核苷酸编码人dysferlin蛋白的N端片段。在一些实施方案中,重组多核苷酸编码人dysferlin蛋白的C端片段。在一些实施方案中,AAV载体是AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13、AAVrh.10、AAVrh.20或AAVrh.74。在一些实施方案中,AAV载体是AAVrh.74。
本文进一步公开了包含任何本文所公开的AAV载体的组合物。
本文进一步公开了包含以下的组合物:(a)第一重组腺相关病毒(rAAV)载体,其中第一rAAV载体包含编码人dysferlin(hDYSF)蛋白的N端片段的第一重组多核苷酸,其中所述第一重组多核苷酸包含第一核苷酸序列,其中所述第一核苷酸序列由以下序列组成:(i)SEQ ID NO:1、6或18的核苷酸序列;(ii)与SEQ ID NO:1、SEQ ID NO:6或SEQ ID NO:18的核苷酸序列在SEQ ID NO:1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15各自的全长上具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中所述片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)第二rAAV载体,其中所述第二rAAV载体包含编码人dysferlin蛋白的C端片段的第二重组多核苷酸,其中所述第二重组多核苷酸包含第二核苷酸序列,其中所述第二核苷酸序列由以下序列组成:(i)SEQ ID NO:2、8或19的核苷酸序列;(ii)与SEQ ID NO:2、8或19的核苷酸序列在SEQ ID NO:2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ IDNO:14或16的核苷酸序列在SEQ ID NO:14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中所述hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
在一些实施方案中,第一和第二rAAV载体的摩尔比值在约100:1-1:100、约10:1-1:10、约2:1-1:2或约1:1之间。
本文进一步公开了一种腺相关病毒(AAV)载体,其包含:(a)第一末端反向重复序列(ITR);(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ ID NO:1或6的核苷酸序列;(ii)与SEQ ID NO:1或6的核苷酸序列在SEQID NO:1或6的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中所述片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(c)第二ITR,其中所述多核苷酸的侧翼是第一和第二ITR。
在一些实施方案中,ITR是AAV ITR。在一些实施方案中,AAV ITR是AAV2 ITR或AAV3 ITR。在一些实施方案中,第一和/或第二ITR包含SEQ ID NO: 3或17的核苷酸序列。
在一些实施方案中,AAV载体进一步包含一个或多个包含启动子、内含子、选择标志物或复制原点(ORI)的另外的多核苷酸序列。
在一些实施方案中,AAV载体进一步包含包括启动子的另外的多核苷酸序列。在一些实施方案中,启动子是肌肉特异性启动子。在一些实施方案中,肌肉特异性启动子是肌球蛋白重链复合物-E盒(box)肌肉肌酸激酶融合增强子/启动子。在一些实施方案中,启动子是重组启动子。在一些实施方案中,重组启动子是重组肌肉特异性启动子。在一些实施方案中,重组肌肉特异性启动子是MHCK7启动子。在一些实施方案中,启动子包含SEQ ID NO: 4的核苷酸序列。
在一些实施方案中,AAV载体进一步包含包括内含子的另外的多核苷酸序列。在一些实施方案中,内含子包含5'供体位点、分支点和/或3'剪接位点。在一些实施方案中,内含子是嵌合内含子。在一些实施方案中,内含子包含来自人类β-球蛋白基因的5′供体位点。在一些实施方案中,内含子包含来自免疫球蛋白G(IgG)重链的分支点。在一些实施方案中,内含子包含来自免疫球蛋白G(IgG)重链的3'剪接受体位点。在一些实施方案中,内含子包含SEQ ID NO: 5的核苷酸序列。
在一些实施方案中,AAV载体进一步包含包括选择标志物的另外的多核苷酸序列。在一些实施方案中,选择标志物是抗生素抗性基因。在一些实施方案中,抗生素抗性基因是β-内酰胺酶基因或卡那霉素抗性基因。在一些实施方案中,AAV载体包含SEQ ID NO: 6或SEQ ID NO: 15的核苷酸序列。
在一些实施方案中,AAV载体进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,AAV载体不包含除一个或多个ITR以外的AAV序列。
在一些实施方案中,AAV载体不包含除一个或多个ITR以外的病毒序列。
本文进一步公开了一种腺相关病毒(AAV)载体,其包含:(a)第一末端反向重复序列(ITR);(b)编码人dysferlin蛋白的片段的多核苷酸,其中所述多核苷酸序列由以下序列组成:(i)SEQ ID NO:2或8的核苷酸序列;(ii)与SEQ ID NO:2或8的核苷酸序列在SEQ IDNO:2或8的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQID NO:14或16的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列;以及(c)第二ITR,其中多核苷酸的侧翼是第一和第二ITR。
在一些实施方案中,AAV载体进一步包含一个或多个包括选择标志物、复制原点(ORI)、非翻译区(UTR)或多腺苷酸化(polyA)信号的多核苷酸序列。
在一些实施方案中,ITR是AAV ITR。在一些实施方案中,AAV ITR是AAV2 ITR或AAV3 ITR。在一些实施方案中,ITR包含SEQ ID NO: 3或17的核苷酸序列。
在一些实施方案中,AAV载体进一步包含包括polyA信号的另外的多核苷酸序列。在一些实施方案中,polyA信号是人工polyA信号。在一些实施方案中,polyA信号包含SEQID NO: 7的核苷酸序列。
在一些实施方案中,AAV载体进一步包含包括选择标志物的另外的多核苷酸序列。在一些实施方案中,选择标志物是抗生素抗性基因。在一些实施方案中,抗生素抗性基因是β-内酰胺酶基因或卡那霉素抗性基因。
在一些实施方案中,AAV载体包含SEQ ID NO: 8或SEQ ID NO: 16的核苷酸序列。
在一些实施方案中,AAV载体进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,AAV载体不包含除一个或多个ITR以外的AAV序列。
在一些实施方案中,AAV载体不包含除一个或多个ITR以外的病毒序列。
本文公开了一种双腺相关病毒(AAV)载体系统,其包含:(I)第一AAV载体,其中所述第一AAV载体包含:(a)第一末端反向重复序列(ITR);(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ ID NO:1或6的核苷酸序列;(ii)与SEQ ID NO:1或6的核苷酸序列在SEQ ID NO:1或6的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(c)第二ITR,其中所述多核苷酸的侧翼是第一和第二ITR;以及(II)第二AAV载体,其中所述第二AAV载体包含(a)第三末端反向重复序列(ITR);(b)编码人dysferlin蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ IDNO:2或8的核苷酸序列;(ii)与SEQ ID NO:2或8的核苷酸序列在SEQ ID NO:2或8的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ IDNO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列;以及(c)第四ITR,其中多核苷酸的两侧是第三和第四ITR。
本文进一步公开了一种腺相关病毒(AAV)包装系统,其包含:(a)包含本文公开的重组多核苷酸的质粒、(b)腺病毒辅助质粒、以及(c)rep-cap质粒。在一些情况下,腺病毒辅助质粒包含pHELP质粒。
本文进一步公开了一种腺相关病毒包装系统,其包含:(a)包含本文公开的重组多核苷酸的质粒和(b)腺病毒辅助质粒。在一些情况下,腺病毒辅助质粒包含pHELP质粒。
本文进一步公开了一种产生腺相关病毒(AAV)载体的方法,其包含使细胞与AAV包装系统接触,其中所述AAV包装系统包含:(a)包含本文公开的重组多核苷酸的质粒、(b)腺病毒辅助质粒和(c)rep-cap质粒。在一些情况下,细胞是宿主细胞,任选地哺乳动物宿主细胞,进一步任选地HEK293。
本文进一步公开了一种产生腺相关病毒(AAV)载体的方法,其包含用AAV包装系统转导包装细胞系,其中所述AAV包装系统包含:(a)包括包含任何本文公开的重组多核苷酸的AAV表达盒(expression cassette)的质粒和(b)腺病毒辅助质粒,其中所述包装细胞系表达腺相关病毒的rep和cap基因。在一些情况下,AAV的rep基因是Rep78。在一些情况下,AAV cap基因是Rh74 cap基因。
本文进一步公开了包含任何本文公开中的重组多核苷酸的细胞。
本文进一步公开了包含AAV表达盒的细胞,其中AAV表达盒包含任何本文公开的重组多核苷酸。在一些情况下,所述质粒包含与SEQ ID NO:18或19有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸。在一些情况下,质粒包含SEQ ID NO:18或19的多核苷酸。
本文进一步公开了一种治疗dysferlin肌病的方法,其包含向有此需要的对象施用:(a)有效量的第一重组多核苷酸,其包含编码人dysferlin(hDYSF)蛋白的N端的第一多核苷酸序列,其中所述第一多核苷酸序列由以下序列组成:(i)SEQ ID NO:1、6或18的核苷酸序列;(ii)与SEQ ID NO:1、SEQ ID NO:6或SEQ ID NO:18的核苷酸序列在SEQ ID NO:1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)有效量的第二重组多核苷酸,其包含编码人dysferlin蛋白的C端片段的第二多核苷酸序列,其中所述第二多核苷酸序列由以下序列组成:(i)SEQ ID NO:2、8或19的核苷酸序列;(ii)与SEQID NO:2、8或19的核苷酸序列在SEQ ID NO:2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
在一些实施方案中,第一多核苷酸被肌肉内地或静脉内地施用。在一些实施方案中,第二多核苷酸被肌肉内地或静脉内地施用。
在一些实施方案中,第一和第二多核苷酸被同时地或按顺序地施用。
在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
本文进一步公开了一种治疗dysferlin肌病的方法,其包含向有此需要的对象施用:(a)有效量的第一腺相关病毒(AAV)载体,其中所述第一AAV载体包含编码人dysferlin(hDYSF)蛋白的N端的第一多核苷酸,其中所述第一多核苷酸由以下序列组成:(i)SEQ IDNO:1或6的核苷酸序列;(ii)与SEQ ID NO:1或6的核苷酸序列在SEQ ID NO:1、或6的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ IDNO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)有效量的第二AAV载体,其中所述第二AAV载体包含编码人dysferlin蛋白的C端片段的第二多核苷酸,其中所述第二多核苷酸由以下序列组成:(i)SEQ ID NO:2或8的核苷酸序列;(ii)与SEQ ID NO:2或8的核苷酸序列在SEQ ID NO:2或8的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
在一些实施方案中,第一AAV载体被肌肉内地或静脉内地施用。在一些实施方案中,第二AAV载体被肌肉内地或静脉内地施用。在一些实施方案中,第一和第二AAV载体被同时地施用。
在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
在一些实施方案中,治疗dysferlin肌病的方法包含向有此需要的对象施用有效量的任何本文公开的AAV双载体系统。
在一些实施方案中,AAV双载体系统被肌肉内地或静脉内地施用。
在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
在一些实施方案中,治疗dysferlin肌病的方法包含向有此需要的对象施用有效量的任何本文公开的组合物。
在一些实施方案中,组合物被肌肉内地或静脉内地施用。
在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
本文进一步公开了组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用,其中所述组合物包含:(a)第一重组多核苷酸,其包含编码人dysferlin(hDYSF)蛋白的N端的第一多核苷酸序列,其中所述第一多核苷酸序列由以下序列组成:(i)SEQ ID NO:1、6或18的核苷酸序列;(ii)与SEQ ID NO:1、SEQ ID NO:6或SEQ ID NO:18的核苷酸序列在SEQ ID NO:1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)第二重组多核苷酸,其包含编码人dysferlin蛋白的C端片段的第二多核苷酸序列,其中所述第二多核苷酸序列由以下序列组成:(i)SEQ ID NO:2、8或19的核苷酸序列;(ii)与SEQ ID NO:2、8或19的核苷酸序列在SEQ ID NO:2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
在一些实施方案中,第一多核苷酸被肌肉内地或静脉内地施用。在一些实施方案中,第二多核苷酸被肌肉内地或静脉内地施用。在一些实施方案中,第一和第二多核苷酸被同时地施用。
在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
本发明公开了组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用,其中所述组合物包含:(a)有效量的第一腺相关病毒(AAV)载体,其中所述第一AAV载体包含编码人dysferlin(hDYSF)蛋白的N端的第一多核苷酸序列,其中所述第一多核苷酸由以下序列组成:(i)SEQ ID NO:1或6的核苷酸序列;(ii)与SEQ ID NO:1或6的核苷酸序列在SEQ ID NO:1、或6的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)有效量的第二腺相关病毒(AAV)载体,其中所述第二AAV载体包含编码人dysferlin蛋白的C端片段的第二多核苷酸,其中所述第二多核苷酸由以下序列组成:(i)SEQ ID NO:2或8的核苷酸序列;(ii)与SEQ ID NO:2或8的核苷酸序列在SEQ ID NO:2或8的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
在一些实施方案中,第一AAV载体被肌肉内地或静脉内地施用。在一些实施方案中,第二AAV载体被肌肉内地或静脉内地施用。在一些实施方案中,第一和第二AAV载体被同时地施用。
在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
本文公开了组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用,其中所述组合物包含任何本文公开的AAV双载体系统。
在一些实施方案中,组合物被肌肉内地或静脉内地施用。
在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
本文公开了任何所公开的组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用。
在一些实施方案中,组合物被肌肉内地或静脉内地施用。
在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
在一些实施方案中,基于超螺旋DNA或质粒作为定量标准品,第一AAV载体的有效量在约1x106-1x1016 vg/kg、约1x108-1x1015 vg/kg或约1x1010-1x1014 vg/kg之间。
在一些实施方案中,基于超螺旋DNA或质粒作为定量标准品,第二AAV载体的有效量在约1x106-1x1016 vg/kg、约1x108-1x1015 vg/kg或约1x1010-1x1014 vg/kg之间。
在一些实施方案中,第一AAV载体被施用至少1、2、3、4或5次。
在一些实施方案中,第二AAV载体被施用至少1、2、3、4或5次。
在一些实施方案中,AAV双载体系统的有效量在约1x1010-1x1013载体基因组(vg)、约1x1011-1x1013 vg、1x1012-1x1013 vg之间。
在一些实施方案中,AAV双载体系统被施用至少1、2、3、4或5次。
在一些实施方案中,组合物的有效量在约1x1010-1x1013载体基因组(vg)、约1x1011-1x1013 vg、1x1012-1x1013 vg之间。
在一些实施方案中,组合物被施用至少1、2、3、4或5次。
本文公开了一种编码人dysferlin(hDYSF)蛋白的重组多核苷酸,其中重组多核苷酸序列包含SEQ ID NO:20的核苷酸序列或与SEQ ID NO:20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。在一些实施方案中,重组多核苷酸序列包含SEQ ID NO: 20的核苷酸序列。
本文公开了一种制备编码人dysferlin(hDYSF)蛋白的重组多核苷酸的方法,其中重组多核苷酸序列包含SEQ ID NO:20的核苷酸序列或与SEQ ID NO.20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,其中所述方法包含使细胞与含有编码人dysferlin(hDYSF)蛋白的N端的第一多核苷酸序列的重组多核苷酸接触,其中所述第一多核苷酸序列由以下序列组成:(i)SEQ ID NO:1、6或18的核苷酸序列;(ii)与SEQ ID NO:1、SEQ ID NO:6或SEQ ID NO:18的核苷酸序列在SEQ ID NO:1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ IDNO:13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)包含编码人dysferlin(hDYSF)蛋白的C端片段的第二多核苷酸序列的第二重组多核苷酸,其中所述第二多核苷酸序列由以下序列组成:(i)SEQ ID NO:2、8或19的核苷酸序列;(ii)与SEQ IDNO:2、8或19的核苷酸序列在SEQ ID NO:2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的多核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
本文公开了一种制备编码人dysferlin(hDYSF)蛋白的重组多核苷酸的方法,其中所述重组多核苷酸包含SEQ ID NO:20的核苷酸序列或与SEQ ID NO:20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,其中所述方法包含使细胞与双AAV载体系统接触,所述系统包含:(I)第一AAV载体,其中所述第一AAV载体包含(a)第一末端反向重复序列(ITR);(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ ID NO:1或6的核苷酸序列;(ii)与SEQ ID NO:1或6的核苷酸序列在SEQ ID NO:1或6的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(c)第二ITR,其中多核苷酸的侧翼是第一和第二ITR;以及(II)第二AAV载体,其中所述第二AAV载体包含(a)第三末端反向重复序列(ITR);(b)编码人dysferlin蛋白的片段的多核苷酸,其中所述多核苷酸序列由以下序列组成:(i)SEQ ID NO:2或8的核苷酸序列;(ii)与SEQ ID NO:2或8的核苷酸序列在SEQ ID NO:2或8的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列;以及(c)第四ITR,其中多核苷酸的侧翼是第三和第四ITR。
在一些实施方案中,细胞是真核细胞。在一些实施方案中,细胞是肌肉细胞、心脏细胞、干细胞、卫星细胞和/或肝脏细胞。
本文公开了一种制备编码人dysferlin(hDYSF)蛋白的重组多核苷酸的方法,其中重组多核苷酸序列包含SEQ ID NO:20的核苷酸序列或与SEQ ID NO:20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,其中所述方法包含向对象施用包含编码人dysferlin(hDYSF)蛋白的N端的第一多核苷酸序列的重组多核苷酸,其中所述第一多核苷酸序列由以下序列组成:(i)SEQ ID NO:1、6或18的核苷酸序列;(ii)与SEQ ID NO:1、SEQ ID NO:6或SEQ ID NO:18的核苷酸序列在SEQ ID NO:1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ IDNO:13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)包含编码人dysferlin(hDYSF)蛋白的C端片段的第二多核苷酸序列的第二重组多核苷酸,其中所述第二多核苷酸序列由以下序列组成:(i)SEQ ID NO:2、8或19的核苷酸序列;(ii)与SEQ IDNO:2、8或19的核苷酸序列在SEQ ID NO:2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
本文公开了一种制备编码人dysferlin(hDYSF)蛋白的重组多核苷酸的方法,其中所述重组多核苷酸包含SEQ ID NO:20的核苷酸序列或与SEQ ID NO:20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,其中所述方法包含向对象施用双AAV载体系统,所述系统包含:(I)第一AAV载体,其中所述第一AAV载体包含(a)第一末端反向重复序列(ITR);(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ ID NO:1或6的核苷酸序列;(ii)与SEQ ID NO:1或6的核苷酸序列在SEQ ID NO:1或6的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(c)第二ITR,其中多核苷酸的侧翼是第一和第二ITR;以及(II)第二AAV载体,其中所述第二AAV载体包含(a)第三末端反向重复序列(ITR);(b)编码人dysferlin蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ ID NO:2或8的核苷酸序列;(ii)与SEQ ID NO:2或8的核苷酸序列在SEQ ID NO:2或8的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列;以及(c)第四ITR,其中多核苷酸的侧翼是第三和第四ITR。
本文公开了一种治疗对象的肌营养不良症的方法,其包含在对象中表达编码人dysferlin(hDYSF)蛋白的重组多核苷酸,其中所述重组多核苷酸序列包含SEQ ID NO:20的核苷酸序列或与SEQ ID NO: 20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。
在一些实施方案中,所述方法包含向对象施用包含编码人dysferlin(hDYSF)蛋白的N端的第一多核苷酸序列的重组多核苷酸,其中所述第一多核苷酸序列由以下序列组成:(i)SEQ ID NO:1、6或18的核苷酸序列;(ii)与SEQ ID NO:1、SEQ ID NO:6或SEQ ID NO:18的核苷酸序列在SEQ ID NO:1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ IDNO:13或15的核苷酸序列在SEQ ID NO:13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(b)包含编码人dysferlin(hDYSF)蛋白的C端片段的第二多核苷酸序列的第二重组多核苷酸,其中所述第二多核苷酸序列由以下序列组成:(i)SEQ ID NO:2、8或19的核苷酸序列;(ii)与SEQ ID NO:2、8或19的核苷酸序列在SEQ ID NO:2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸序列。
在一些实施方案中,所述方法包含向对象施用双AAV载体系统,所述系统包含:(I)第一AAV载体,其中所述第一AAV载体包含(a)第一末端反向重复序列(ITR);(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ IDNO:1或6的核苷酸序列;(ii)与SEQ ID NO:1或6的核苷酸序列在SEQ ID NO:1或6的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ IDNO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(c)第二ITR,其中多核苷酸的侧翼是第一和第二ITR;以及(II)第二AAV载体,其中所述第二AAV载体包含(a)第三末端反向重复序列(ITR);(b)编码人dysferlin蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ ID NO:2或8的核苷酸序列;(ii)与SEQ ID NO:2或8的核苷酸序列在SEQ IDNO:2或8的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQID NO:14或16的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(v)编码hDYSF蛋白的片段的多核苷酸序列,其中hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;以及(c)第四ITR,其中多核苷酸的侧翼是第三和第四ITR。
在一些实施方案中,对象是哺乳动物,选自人类、非人类灵长类动物、犬、羊、马、猪、鼠、大鼠、兔、牛或猫。
在一些实施方案中,对象患有dysferlin肌病。在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
附图说明
图1提供了用于治疗dysferlin肌病的双AAV载体系统的示意图。5’载体(例如5’hDYSF AAV载体),pAAV.MHCK7.DYSF5'.PTG(PTG=启动子/转基因)含有肌肉特异性MHCK7启动子、嵌合内含子、共有Kozak序列和对应于SEQ ID NO: 12的氨基酸1-1113的DYSF cDNA的5'部分。3’载体(例如3’hDYSF AAV载体),pAAV.DYSF3'.POLYA,含有对应于SEQ ID NO: 12的氨基酸794-2080的DYSF cDNA的3'部分和含有多腺苷酸化信号的DYSF 3'UTR。
图2提供了pAAV.MHCK7.DYSF5'.PTG DNA载体质粒图谱。
图3提供了pAAV.DYSF3'.POLYA载体DNA质粒图谱。
图4A-4D示出了双载体系统递送后dysferlin的表达。通过免疫染色(图4A)和蛋白质印迹可以看到两种载体的递送后完整(robust)全长dysferlin表达(图4C)。单独的任何一个载体的递送都没有异常的dysferlin表达(图4B:免疫染色,图4D:蛋白质印迹)。3222是全长对照。
图5A-5C示出了rAAVrh74.MHCK7.DYSF.DV递送后dysferlin表达的时间过程的结果。图5A展示了双载体递送至左胫骨前肌(LTA)后通过dysferrin免疫标记(上图部分)观察到的全长dysferrlin表达。治疗后1个月、3个月和6个月,Dysferlin的表达一直持续,病理上没有异常反应(H&E,下图部分)。比例尺,100 μm。每个时间点N=4。图5B示出了1、3、6个月样品的蛋白质印迹,显示了在注射的LTA(每组2个)中全长的dysferlin的表达。γ-微管蛋白作为加样对照。图5C示出了不同组织在注射后3个月和6个月,每ug基因组DNA的载体基因组的生物分布图。注:LTA是经处理的;对数轴。
图6示出了通过肌肉内注射rAAVrh.74.MHCK7.DYSF.DV治疗的4只动物在3个月或12个月的终点时的目标肌肉(LTA)和非目标组织的蛋白质印迹分析。
图7A-7C示出了AAVrh.74.MHCK7.DYSF.DV的全身性递送后dysferlin的表达。图7A示出了在全身性递送6 x 1012 vg(2.4e13 vg/kg,基于超螺旋DNA或质粒作为定量标准品)AAVrh.74.MHCK7.DYSF.DV后组织的dysferlin免疫标记(每个剂量n=6)。所示肌肉为心脏、腓肠肌、横膈膜和四头肌用于Dysf-/-、经处理(AAV.DV)和野生型(WT)组织。图7B示出了胫骨前肌(LTA)、腓肠肌(RGAS)、四头肌(LQD)、三头肌(RTri)和横膈膜中中心化核的量化情况。*p<0.05样品与野生型之间显著差异,#样品与野生型之间无显著差异。图7C示出了组织裂解物(H:心脏,G:腓肠肌,Q:四头肌,D:横膈膜)的蛋白质印迹,展示了在237 kD的全长dysferlin条带,γ-微管蛋白作为加样对照。
图8示出了AAVrh.74.DYSF.DV递送后剂量依赖性的膜再密封活性。
图9示出了AAVrh.74.MHCK7.DYSF.DV全身性递送后纤维化和炎症的逆转。基于超螺旋的DNA或质粒作为定量标准品,用6 x 1012 vg(2.4e13 vg/kg)处理BlaJ小鼠。AAVrh.74.MHCK7.DYSF.DV(n=6)。取出腰肌,并分析纤维化(中间一栏)和CD8单核细胞的存在。基因递送后,这两个参数都显著减少。
图10A-10B展示了rAAVrh.74.MHCK7.DYSF.DV的全身性递送恢复Dysf-/-小鼠的功能性缺陷。图10A:收获横膈膜肌肉条,并根据实验方案来评估具体的力量。经处理的横膈膜显示出力量的显著改善(**P>0.01,ANOVA),这与两种剂量[2e12 vg总AAV.DYSF DV(8e13vg/kg,基于超螺旋DNA或质粒作为定量标准品),或6e12 vg总AAV.DYSF.DV(2.4e13 vg/kg,基于超螺旋DNA或质粒作为定量标准品)]下的野生型的力量没有区别。图10B示出了在膜再密封方面存在着剂量依赖性反应。低剂量时没有显著改善。
图11A-11D示出了来自监测AAV 衣壳和dysferlin的T细胞反应的结果。外周血单核细胞被分离并暴露于包含AAV5和AAVrh.74衣壳(蓝色条状)的肽以及人dysferlin(绿色)。在3个月(图11A)和6个月(图11B)时监测AAV5衣壳和dysferlin的T细胞反应。在3个月(图11C)和6个月(图11D)时监测AAVrh.74 衣壳和dysferlin的T细胞反应。
图12A-12C示出了在非人类灵长类动物中的dysferlin表达。图12A示出了注射AAV5.DYSF或AAVrh.74.DYSF.DV后3和6个月的NHP组织的组织学(H&E)和dysferlin免疫荧光(IF)图像。H&E染色的切片显示缺乏免疫浸润和纤维的坏死。IF切片显示,与原始的(假手术(sham))相比,经注射的组织中dysferlin过度表达。图12B示出了AAV5.DYSF和AAVrh.74.DYSF.DV注射后3和6个月的组织的蛋白质印迹图像。重要的是,与假手术对照相比,经注射的组织显示了dysferlin的过度表达。阳性(+)对照是野生型小鼠组织,以及阴性(-)对照是129-Dysf-/-未经注射的组织。图12C示出了用AAVrh.74.DYSF.DV IM注射到左TA后载体基因的生物分布,注意是对数比例。
图13展示了使用抗FLAG来确认载体衍生的dysferlin表达。N端FLAG标签被用来区分内源性的和AAV衍生的dysferlin。
具体实施方式
定义
除非另有定义,否则本文使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员通常理解的相同含义。将进一步理解,例如在常用词典中定义的术语,应当被解释为具有与其在本申请和相关技术的上下文中的含义一致的含义,并且除非在此明确定义,否则不应当以理想化或过于正式的意义来解释。虽然下文未明确定义,但此类术语应根据其共同含义进行解释。
本文描述中使用的术语仅用于描述特定的实施方案的目的,而不旨在限制本发明。本文提到的所有出版物、专利申请、专利和其他参考文献全部通过引用整体并入本文。
除非另有说明,否则本技术的实践将采用组织培养、免疫学、分子生物学、微生物学、细胞生物学和重组DNA的常规技术,这些技术属于本领域技术。
除非上下文中另有说明,否则本文描述的本发明的各种特征可用于任何组合。此外,本发明还设想在一些实施方案中,可以排除或省略本文所述的任何特征或特征的组合。为了说明,如果说明书中规定复合物包含组分A、B和C,则具体意图是A、B或C中的任何一个或其组合可以单独地或在任何组合中被省略和放弃。
除非明确地指出,否则所有指定的实施方案、特征和术语旨在包括所述的实施方案、特征或术语及其生物等效物。
所有数字名称,例如pH值、温度、时间、浓度和分子量,包括范围,都是近似值,其变化(+)或(-)的增量为1.0或0.1,视情况而定,或者变化+/-15%,或者变化10%,或者变化5%,或者变化2%且这样的范围也包括在本文内。应该理解的是,尽管并非总是明确说明,但所有数字名称之前都有术语“约“。还应理解的是,尽管并非总是明确说明,但本文描述的试剂仅是示例性的,且本领域已知此类试剂的等效物。
除非另有说明,否则本技术的实施将采用在本领域技术范围内的有机化学、药理学、免疫学、分子生物学、微生物学、细胞生物学和重组DNA的常规技术。例如,参见Sambrook, Fritsch and Maniatis, Molecular Cloning:A Laboratory Manual, 2ndedition (1989);Current Protocols In Molecular Biology (F. M. Ausubel, et al.eds., (1987));the series Methods in Enzymology (Academic Press, Inc):PCR 2:APractical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)),Harlow and Lane, eds. (1988) Antibodies, a Laboratory Manual, and Animal CellCulture (R.I. Freshney, ed. (1987))。
如本文所使用的,术语“增加”、“减少”、“高”、“低”或其任何语法上的变化是指参考组合物、多肽、蛋白质等的大约90%、80%、50%、20%、10%、5%、1%、0.5%或甚至0.1%的变化。
当用于描述本文所公开的任何成分、范围、剂型等的选择时,术语或“可接受的”、“有效的”或“充分的”意指所述成分、范围、剂型等适用于所公开的目的。
也如本文所使用的,“和/或”是指并涵盖一个或多个相关列出项目的任何和所有可能组合,以及在备选方案(“或”)中解释时缺少组合。
可以推断出,没有明确的叙述,除非另有说明,否则当本公开内容涉及多肽、蛋白质、多核苷酸或抗体时,其等效物或生物等效物应在本公开内容的范围内。如本文所使用的,术语“其生物等效物”在指代参考蛋白质、抗体、多肽或核酸时旨在与“其等效物”同义,意指具有最小序列同一性而仍保持所需结构或功能的那些。除非本文具体叙述,否则预期本文提到的任何多核苷酸、多肽或蛋白质也包括其等效物。例如,等效物意指在参考序列的全长上至少约70%的同源性或同一性、或至少80%的同源性或同一性、或至少约85%、或至少约90%、或至少约95%、或至少98%的同源性或同一性,并表现出与参考蛋白、多肽或核酸基本等效的生物学活性。另外,当提到多核苷酸时,在一方面,其等效物是在严格条件下与参考多核苷酸或其互补序列杂交的多核苷酸,在另一方面,其具有与参考多核苷酸或其互补序列相同或相似的活性或功能。
蛋白质或多肽(在本文中称为参考物)的等效物与参考物有至少50%(或至少60%、或至少70%、或至少80%或至少90%)的同一性并保留了参考物的功能和可制造性。
如本文中所使用的,术语“功能”、“活性”和“酶活性”可互换地使用。dysferlin的缺失已被证明损害了骨骼肌中Ca2+依赖性的膜修复(Song et al., Proc. Natl. Acad. Sci. USA 98:4084-4088, 2001 and Schnepp et al., J. Virol. 77:3495-3504,2003)。此外,dysferlin已被证明与其他参与膜修复的蛋白质相互作用,包括膜联蛋白A1和A2、AHNAK和小窝蛋白-3(Schnepp et al., J. Virol. 77:3495-3504, 2003, Duan et al., J. Virol. 72:8568-8577, 1998, Donsante et al., Gene Ther. 8:1343-1346,2001,和Monahan et al., Expert Opin. Drug. Saf. 1:79-91, 2002)。肌肉纤维再生能力的损失被认为是dysferlin缺陷的促成性后果(Song et al., Gene Ther. 8:1299-1306, 2001)。Dysferlin也与囊泡运输和内吞作用以及T管形成有关(Eveson et al., The Journal of Biological Chemistry 285:28529-28539, 2010,Klinge et al., FASEB Journal: Official Publication of the Federation of American Societies for Experimental Biology 21:1768-1776, 2007,以及Klinge et al., Muscle & Nerve 41:166-173, 2010)。因此,dysferlin的活性的示例包括但不限于骨骼肌中的膜修复(例如膜再密封)、防止或恢复肌肉纤维再生能力、囊泡运输、内吞作用和横向(T-)管的形成。膜修复试验、囊泡运输试验和管形成试验是本领域已知的且被可用于体外测量dysferlin活性。例如,参见Carmeille et al., Methods Mol. Biol. 1668:195-207, 2017, Vassilievaand Nusrat, Methods Mol. Biol. 440:3-14, 2008, Demonbreun et al., Am. J.Pathol. 184(1):248-59, 2014,其中每一项都通过引用整体并入本文中。测量dysferlin活性的其他方法可在例如Grose et al., PLoS One 7:e39233, 2012和Sondergaard et al., Anns of Clin. Trans. Neurol. 2:256-270, 2015中找到。
多核苷酸(在本文中称为参考物)的等效物与参考物有至少50%(或至少60%、或至少70%、或至少80%或至少90%)的同一性,并且编码与参考物编码的相同多肽,或者编码由参考物编码的多肽的等效物。
为了得出与参考序列的氨基酸/核苷酸残基或连续片段等效的(或对应的)测试序列的位置或连续片段,在测试序列和参考序列之间进行序列比对。相互对齐的位置或片段被确定为等效物。
术语“亲和标签”是指可被包含在融合蛋白中的多肽,以便使用能够结合至(即,有亲和力)亲和标签的配体检测融合蛋白和/或从细胞环境中纯化融合蛋白。配体可以是,但不限于抗体、树脂或互补多肽。亲和标签可以包含小的肽(通常是长度约为4至16个氨基酸的肽),或者它可以包含较大的多肽。常用的亲和标签包括聚精氨酸、FLAG、V5、聚组氨酸、c-Myc、Strep II、麦芽糖结合蛋白(MBP)、N-利用物质蛋白A(NusA)、硫氧还蛋白(Trx)和谷胱甘肽S-转移酶(GST)等等(例如,参见GST基因融合系统手册-Sigma-Aldrich)。在实施方案中,亲和标签是多组氨酸标签(例如His6标签(SEQ ID NO: 21))。在融合蛋白中加入亲和标签可以通过亲和纯化使用能够紧密和特异性结合亲和标签的亲和介质将融合蛋白从细胞环境中纯化出来。亲和介质可以包括,例如,与固定相(基质)(例如琼脂糖或金属珠)共价连接的金属带电树脂或配体。例如,多组氨酸标记的融合蛋白(也称为His标记的融合蛋白)可以通过使用Ni2+或Co2+负载树脂的固定化金属离子色谱法回收,抗FLAG亲和凝胶可以被用于捕获FLAG标记的融合蛋白,而谷胱甘肽交联到固体支持物(例如琼脂糖)可以被用于捕获GST标记的融合蛋白。在一个方面,亲和标签是纯化标签或标志物。
如本文所使用的,术语“纯化”、“净化”或“分离”是指从复杂的混合物(例如细胞裂解液或多肽混合物)中分离出一种或多种生物材料(例如多核苷酸、多肽或病毒载体)的过程。纯化、分离或隔离不需要是完全的,即在纯化过程后,复杂混合物的一些成分可能与一种或多种生物材料(例如多核苷酸、多肽或病毒载体)一起保留。然而,相对于纯化前的复合混合物,纯化的产物应该富含一种或多种生物材料(例如多核苷酸、多肽或病毒载体),而最初存在于复杂混合物中的其他成分的很大一部分应该通过纯化过程被去除。
如本文所使用的,术语“细胞”可指原核细胞或真核细胞,任选地是从对象或市售来源获得。在某些情况下,细胞是宿主细胞,例如哺乳动物细胞或哺乳动物宿主细胞。在某些情况下,宿主细胞在本文中被称为生产细胞或包装细胞。在某些情况下,细胞系是包装细胞系。
“真核细胞”包含除无核界以外的所有生命界。它们可以通过膜结合的细胞核很容易区分。动物、植物、真菌和原生生物是真核生物或有机体,它们的细胞通过内膜和细胞骨架组织成复杂的结构。最典型的膜结合结构是细胞核。除非特别说明,术语“宿主”包括真核宿主,例如包括酵母、高等植物、昆虫和哺乳动物细胞。真核细胞或宿主的非限制性示例包括猿猴、牛、猪、鼠、大鼠、禽、爬行动物和人,例如,HEK293细胞、中国仓鼠卵巢(CHO)细胞、CHO-S细胞、CHO-K1细胞、293T细胞、HeLa细胞、小仓鼠肾脏(BHK)细胞、Sf9细胞、干细胞、卫星细胞和肌肉细胞。肌肉细胞的示例包括但不限于,骨骼肌细胞、心肌细胞和平滑肌细胞。
“原核细胞”通常缺乏细胞核或任何其他膜结合的细胞器,分为两个域,细菌和古细菌。除了染色体DNA外,这些细胞还可以在一个称为附加体的环中包含遗传信息。细菌细胞非常小,大致相当于动物线粒体的大小(直径约1-2 μm,长10 μm)。原核细胞有三种主要形状:杆状、球形和螺旋状。细菌细胞不像真核生物那样经历复杂的复制过程,而是通过二元分裂进行分裂。示例包括但不限于芽孢杆菌、大肠杆菌和沙门氏菌。
应用于核酸序列的术语“编码”是指被叙述来“编码”多肽的多核苷酸,在其天然状态下或通过本领域技术人员熟知的方法操作时,可被转录和/或翻译以产生多肽和/或其片段的mRNA。反义链是这种核酸的互补序列,编码序列可以从中推导出来。
术语“等效物”或“生物等效物”在提及特定的分子、生物或细胞材料时可互换使用,并意指在保持所需结构或功能的同时具有最小同源性的材料(例如,具有类似的功能或活性)。应该理解,在没有明确说明的情况下,当提到与参考多肽、蛋白质或多核苷酸的等效物或生物等效物时,等效物或生物等效物与参考多肽、蛋白质或多核苷酸具有所描述的结构关系和等效或基本等效的生物活性。例如,等效多肽、蛋白质或多核苷酸的非限制性示例包括对其或对于在参考多肽、多核苷酸或蛋白质全长上的多肽、蛋白质或多核苷酸具有至少60%、或者至少65%、或者至少70%、或者至少75%、或者至少80%、或者至少85%、或者至少90%、或者至少95%同一性的多肽、蛋白质或多核苷酸。另外,等效物多肽是由在高度严格的条件下与编码这种参考多肽序列的多核苷酸杂交,并且具有实质上等效或等效的生物活性的多核苷酸或其补体编码的多肽。本文描述了高度严格的条件,并通过引用将其并入本文。或者,其等效物是由多核苷酸或其互补序列(其与参考多核苷酸(例如野生型多核苷酸)在参考多核苷酸的长度上具有至少70%、或者至少75%、或者至少80%、或者至少85%、或者至少90%、或者至少95%、或者至少97%同一性)编码的多肽。这种等效多肽具有与参考多核苷酸编码的多肽相同的生物活性。
等效多核苷酸的非限制性示例包括与参考多核苷酸具有至少60%、或者至少65%、或者至少70%、或者至少75%、或者至少80%、或者至少85%、或者至少90%、或者至少95%、或者至少97%的同一性的多核苷酸。等效物还包括在高度严格的条件下与参考多核苷酸杂交的多核苷酸或其互补序列。这种等效多核苷酸具有与参考多核苷酸相同的生物活性。
多核苷酸或多核苷酸区域(或多肽或多肽区域)与另一个序列具有一定百分比(例如80%、85%、90%或95%)的“序列同一性”意味着,当对齐时,该百分比的碱基(或氨基酸)在参考多核苷酸长度上比较两个序列时是相同的。可以使用本领域已知的软件程序,例如Current Protocols in Molecular Biology(Ausubel et al., eds. 1987)Supplement30,section 7.7.18, Table 7.7.1中描述的软件,确定比对和同源性百分比或序列同一性。在某些实施方案中,默认参数被用于对齐。使用默认参数,可以使用BLAST执行非限制性示例性对齐程序。具体而言,示例性程序包括使用以下默认参数的BLASTN和BLASTP:遗传代码=标准;过滤器=无;链=双链;截止值=60;期望值=10;矩阵=BLOSUM62;描述=50个序列;排序方式=高分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS translations +SwissProtein+SPupdate+PIR。有关这些程序的详细信息,请访问以下互联网地址:ncbi.nlm.nih.gov/cgi-bin/BLAST。序列同一性和同一性百分比可以通过将它们并入clustalW(可在网址:genome.jp/tools/clustalw/上获得,最后一次访问日期为2017年1月13日)或Clustal Omega(可在ebi.ac.uk/Tools/msa/clustalo/上获得)中来确定。
“同源性”或“同一性”或“相似性”是指两个肽之间或两个核酸分子之间的序列相似性。同源性可以通过比较每个序列中的一个位置来确定,该位置可能是为了比较而对齐的。当比较序列中的一个位置被相同的碱基或氨基酸占据时,则分子在该位置是同源的。序列之间的同源度是序列共享的匹配或同源位置数量的函数。“不相关”或“非同源”序列是与本公开的其中一个序列具有小于40%的同一性,或者小于25%的同一性。
如本文所使用的,术语“至少90%同一性”是指两个比较的序列(多核苷酸或多肽)的同一性为约90%至约100%。它还包括至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、约91%至约100%、约92%至约100%、约93%至约100%、约94%至约100%、约95%至约100%、约96%至约100%、约97%至约100%、约98%至约100%、或约99%至约100%的同一性。
如本文所使用的,术语“保留”“类似”和“相同”在描述多核苷酸、蛋白和/或多肽的功能、活性或功能活性时可互换地使用,其指的是参考蛋白、多核苷酸和/或肽的活性为至少约20%(包括但不限于:至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约97%、或约100%)的功能活性。
“杂交”是指一个或多个多核苷酸反应形成复合物的反应,该复合物通过核苷酸残基碱基之间的氢键来稳定。氢键可以通过Watson-Crick碱基配对、Hoogstein结合或任何其他序列特异性方式发生。该复合物可以包含形成双链结构的两条链、形成多链复合物的三条或更多条链、单个自杂交链或这些的任何组合。杂交反应可以构成更广泛过程中的一个步骤,例如PCR反应的启动,或者核酶对多核苷酸的酶切。
严格杂交条件的示例包括:培养温度为约25℃至约37℃;杂交缓冲液浓度为约6×SSC至约10×SSC;甲酰胺浓度为约0%至约25%;以及洗涤液为约4×SSC至约8×SSC。中等杂交条件的示例包括:培养温度为约40℃至约50℃;缓冲液浓度为约为9×SSC至约2×SSC;甲酰胺浓度为约30%至约50%;以及洗涤液为约5×SSC至约2×SSC。高严格条件的示例包括:培养温度为约55℃至约68℃;缓冲液浓度为约1×SSC至约0.1×SSC;甲酰胺浓度为约55%至约75%;以及洗涤液为约1×SSC至0.1×SSC或去离子水。通常,杂交培养时间为5分钟至24小时,具有1、2或更多洗涤步骤,以及洗涤培养时间约为1、2或15分钟。SSC为0.15 M NaCl和15mM柠檬酸盐缓冲液。可以理解的是,可以采用使用其他缓冲系统的SSC等效物。在一个方面,等效物多核苷酸是指在严格的条件下与参考多核苷酸或其互补序列杂交的多核苷酸。在另一个方面,等效多肽是指由多核苷酸编码的多肽,该多核苷酸是在严格条件下与参考多核苷酸或其互补序列杂交的多核苷酸。
如本文所使用的,“表达”是指多核苷酸转录成mRNA的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。如果多核苷酸源于基因组DNA,则表达可以包括真核细胞中mRNA的剪接。
如本文所使用的,术语“功能性”可用于修改任何分子、生物或细胞材料,以使其实现特定的指定作用。
如本文所使用的,术语“核酸序列”和“多核苷酸”被可互换地使用来指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。因此,该术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、互补DNA(cDNA)、DNA-RNA杂交体,或包含嘌呤和嘧啶碱基或其他天然的、化学的或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。在某些实施方案中,多核苷酸包含和/或编码信使RNA(mRNA)、短发夹RNA和/或小发夹RNA。在一个实施方案中,多核苷酸是mRNA或编码mRNA。在某些实施方案中,多核苷酸是双链(ds)DNA,例如工程化的ds DNA或由单链RNA合成的ds cDNA。
术语“蛋白质”、“肽”和“多肽”被可互换地使用,并且在其最广泛的意义上是指两个或更多个氨基酸、氨基酸类似物或肽模拟物子单元的化合物。所述子单位可以通过肽键而被连接。在另一个方面,所述子单位可以通过其他键(例如酯键、醚键等)被连接。蛋白质或多肽必须含有至少两个氨基酸,而且对于可以组成蛋白质或肽的序列的氨基酸的最大数目没有限制。如本文所使用的,术语“氨基酸”是指天然的和/或非天然的或合成的氨基酸,包括甘氨酸以及D和L光学异构体、氨基酸类似物和肽模拟物。
如本文所使用的,连续的氨基酸序列指具有至少两个氨基酸的序列。然而,需要注意的是,第一部分和第二部分的连续氨基酸序列不限制该氨基酸序列使第一部分直接地结合至第二部分。也可以是第一部分通过第三部分(例如连接)与第二部分相连从而形成一个连续的氨基酸序列。
如本文所使用的,术语“结合”、“共轭”、“偶联”和“缀合”是指分子之间,特别是两个氨基酸序列和/或两个多肽之间键的形成。结合可以是直接的(即键)或间接的(即通过其他分子)。结合可以是共价的或非共价的。
如本文所使用的,连续的氨基酸序列可以包含彼此直接地或间接地(例如通过连接子)连接的两个或更多个的多肽。
如本文所使用的,术语“重组表达系统”是指用于通过重组形成的某些遗传物质的表达的一种或多种遗传构建体。
“基因递送载体”被定义为能够将插入的多核苷酸携带到宿主细胞中的任何分子。基因递送载体的实施例是脂质体、胶束生物相容的聚合物(包括天然聚合物和合成聚合物);脂蛋白;脂质纳米颗粒;多肽;多糖;脂多糖;人工病毒包膜;金属颗粒;以及细菌、或者病毒(例如狂犬病毒、黄病毒、慢病毒、杆状病毒、腺病毒和逆转录病毒)、噬菌体、粘粒、质粒、真菌载体和已经被描述用于在多种真核和原核宿主中表达的本领域通常使用的并且可以用于基因治疗以及简单的蛋白质表达的其他重组载体。
可以使用基因递送载体将本文公开的多核苷酸递送至细胞或组织。如本文所使用的“基因递送”、“基因转移”、“基于mRNA的递送”、“转导”等是指将外源多核苷酸(有时称为“转基因”)引入宿主细胞的术语,而不论采用哪种方法引入。这样的方法包括多种众所周知的技术,例如载体介导的基因转移(通过,例如病毒感染/转染,或各种其他基于蛋白质或基于脂质的基因递送复合物(包括例如原胺复合物、脂质纳米颗粒、聚合物纳米颗粒、脂质-聚合物混合纳米颗粒和无机纳米颗粒,或其组合))以及促进“裸”多核苷酸递送的技术(例如电穿孔、“基因枪(gene gun)”递送和用于引入多核苷酸的各种其他技术)。引入的多核苷酸可以是未经修饰的,或者可以包括一种或多种修饰;例如,经修饰的mRNA可以包含ARCAcapping;酶促多腺苷酸化添加100-250个腺苷残基的尾巴(SEQ ID NO: 22);以及用5-甲基胞苷替换胞苷和/或用伪尿苷替换尿苷中的一种或两种。引入的多核苷酸可以在宿主细胞中稳定地或瞬时地维持。稳定的维持通常需要所引入的多核苷酸含有与宿主细胞相容的复制原点或整合到宿主细胞的复制子中,例如染色体外复制子(例如质粒)或核或线粒体染色体。如本领域已知和本文所述的,已知有许多载体能够介导基因向哺乳动物细胞的转移。
“质粒”是与染色体DNA分离的染色体外DNA分子,其能够独立于染色体DNA而进行复制。在许多情况下,它是环状的和双链的。质粒提供了在微生物群体内水平基因转移的机制,并且通常在给定的环境状态下提供选择优势。质粒可以携带在竞争性环境中对天然存在的抗生素具有抗性的基因,或者替代地产生的蛋白质可以在类似情况下充当毒素。
基因工程中使用的“质粒”被称为“质粒载体”。许多从商业上获得的质粒可用于此类用途。待复制的基因被插入含有使细胞对特定抗生素具有抗性的基因和多个克隆位点(MCS,或多连接子)的质粒的拷贝中,所述克隆位点是含有几个常用的限制性酶切位点的段区域,其允许在该位置轻松插入DNA片段。质粒的另一个主要用途是制备大量的蛋白质。在这种情况下,研究人员使含有带有目的基因的质粒的细菌生长。正如细菌产生蛋白质以赋予其抗生素抗性一样,其也可以被诱导以从插入的基因产生大量蛋白质。
“酵母人工染色体“或“YAC”是指用于克隆大DNA片段(大于100 kb,最大可达3000kb)的载体。它是人工构建的染色体,并且包含在酵母细胞中复制和保存所需的端粒、着丝粒和复制起始序列。构建使用最初的环状质粒,使用限制酶将环状质粒线性化,然后DNA连接酶可以通过使用粘性末端在线性分子内添加感兴趣的序列或基因。酵母表达载体(例如YAC、YIp(酵母整合质粒)和YEp(酵母游离质粒))非常有用,因为酵母本身就是真核细胞,因次可以得到具有翻译后修饰的真核蛋白质产物,但是已发现YAC比BAC更加不稳定,产生嵌合效应。
如本文所使用的,术语“病毒衣壳”或“衣壳”是指病毒颗粒的蛋白质壳或外壳。衣壳的功能是衣壳化(encapsidate)、保护、运输病毒基因组并将其释放到宿主细胞中。衣壳通常由蛋白质(“衣壳蛋白”)的寡聚结构亚基组成。如本文所使用的,术语“衣壳化”是指封闭在病毒衣壳内。
如本文所使用的,关于病毒或质粒的术语“辅助(子)”是指用于提供复制和包装病毒颗粒或重组病毒颗粒(例如本文公开的经修饰的AAV)所必需的另外的组分的病毒或质粒。辅助病毒编码的组分可以包括病毒粒子组装、衣壳化、基因组复制和/或包装所需的任何基因。例如,辅助病毒可以编码用于病毒基因组的复制的必需的酶。辅助病毒和适用于AAV构建体的质粒的非限制性示例包括pHELP(质粒)、腺病毒(病毒)或疱疹病毒(病毒)。
如本文所用,可以从对象、细胞系或培养的细胞或组织获得生物样品或样品。示例性样品包括但不限于细胞样品、组织样品、液体样品,例如血液和其他生物来源的液体样品(包括但不限于眼液(房水和玻璃体液)、外周血、血清、血浆、腹水、尿液、脑脊液(CSF)、痰、唾液、骨髓、滑液(synovial fluid)、房水、羊水、耵聍、母乳、支气管肺灌洗液(broncheoalveolar lavage fluid)、精液、前列腺液、考珀氏液或射精前液体、女性射精、汗液、眼泪、囊液、胸膜和腹膜液、心包液、腹水、淋巴液、食糜、胆汁、间质液、月经、脓液、皮脂、呕吐物、阴道分泌物/冲洗物、滑液、黏膜分泌物、粪便水、胰液、来自窦腔的灌洗液、支气管肺吸液、胚泡腔液或脐带血。
如本文所使用的,术语“可检测标志物”是指至少一种能够直接地或间接地产生可检测信号的标志物。这种标志物的非详尽清单包括产生可检测信号的酶,例如通过比色法、荧光法、发光法(例如辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶、葡萄糖-6磷酸脱氢酶,发色团(chromophore)(例如荧光、发光染料))、通过电子显微镜检测电子密度或通过其电特性(例如电导率、安培法、伏安法)检测的基团、可检测的基团(例如其分子大小足以引起其物理和/或化学性质的可检测的变化,这种检测可通过光学方法(例如衍射、表面等离子体共振、表面变化、接触角变化)或物理方法(例如原子力光谱、隧道效应或放射性分子(例如32P、35S、89Zr或125I))完成)。
如本文所使用的,术语“纯化标志物”是指至少一种对纯化或鉴定有用的标志物。这种标志物的非详尽清单包括His、lacZ、GST、麦芽糖结合蛋白、NusA、BCCP、c-myc、CaM、FLAG、GFP、YFP、cherry、硫氧还蛋白、poly(NANP)、V5、Snap、HA、几丁质结合蛋白、Softag 1、Softag 3、Strep或S-蛋白。合适的直接或间接荧光标志物包括FLAG、GFP、YFP、RFP、dTomato、cherry、Cy3、Cy5、Cy5.5、Cy7、DNP、AMCA、Biotin、Digoxigenin、Tamra、Texas Red、Rhodamine、Alexa fluors、FITC、TRITC或任何其他荧光染料或半抗原。
如本文所使用的,表位标签是生物结构或序列(例如蛋白质或碳水化合物),其作为抗原被抗体识别。在某些实施方案中,表位标签与纯化标志物和/或亲和标签可互换地使用。
“组合物”意指两种或更多种化合物(例如,活性多肽、多核苷酸、病毒载体或抗体的组合)与另一种惰性(例如,可检测的标签)或活性(例如,基因传递载体)化合物或组合物的组合。
“药物组合物”旨在包括活性多肽、多核苷酸或抗体与惰性或活性载体(例如固体支持物)的组合,从而使该组合物适合于体外、体内或离体的诊断或治疗用途。
如本文所使用的,术语“药学上可接受的载体”涵盖任何标准药物载体,例如磷酸盐缓冲盐水溶液、水和乳液(例如油/水或水/油乳液)以及各种类型的润湿剂。该组合物还可以包括稳定剂和防腐剂。载体、稳定剂和佐剂的示例参见Martin (1975) Remington’sPharm. Sci., 15th Ed. (Mack Publ. Co., Easton)。
“对象/受试者”、“个体”或“患者”在本文中可互换地使用,并且指脊椎动物,优选地哺乳动物,更优选地人类。哺乳动物包括但不限于非人类灵长类动物、鼠、大鼠、兔、猿猴、牛、羊、猪、犬、猫、农场动物、运动动物、宠物、马和灵长类动物,特别是人类。除了对人的治疗有用外,本发明还对伴侣哺乳动物、外来动物和驯养动物,包括哺乳动物、啮齿动物等的兽医治疗有用。在一个实施方案中,哺乳动物包括马、狗和猫。在本发明的另一个实施方案中,人是十八岁以下的青少年或婴儿。
疾病的“治疗”或“疗法”包括:(1)预防疾病,即,使易患该疾病但尚未出现或显示疾病症状的患者不出现疾病的临床症状;(2)抑制疾病,即,阻止或减少疾病或其临床症状的发展;或者(3)缓解疾病,即,导致疾病或其临床症状的消退。在一个方面,术语“治疗”不包括防止或预防。
与术语“治疗”有关的术语“患有”指患者或个人被诊断出患有疾病或易患疾病。
“有效量”是指足以产生有益或预期效果的量。有效量可以通过一次或多次施用、应用或剂量施用。这种递送取决于许多变量,包括单个剂量单位使用的时间段、治疗剂的生物利用率、施用途径等。然而,可以理解的是,本发明的治疗剂用于任何特定对象的具体剂量水平取决于多种因素,包括所采用的特定化合物的活性;对象的年龄、体重、一般健康状况、性别和饮食;施用时间;排泄率;药物组合;以及所治疗的特定疾病的严重程度和施用形式。治疗剂量通常可以进行滴定以优化安全性和疗效。在一个方面,有效量是治疗上的有效量。通常情况下,体外和/或体内试验的剂量-效果关系最初可以为患者施用的适当剂量提供有用的指导。一般来说,人们希望施用一定量的化合物以达到与在体外发现的有效浓度相称的血清水平。这些参数的确定完全属于本领域的技术范畴。这些考虑因素以及有效的配方和施用程序在本领域是众所周知的并被描述于标准教科书中。与此定义一致,如本文所使用的,术语“治疗有效量”是指足以抑制离体、体外或体内RNA病毒复制的量。
术语施用应包括但不限于通过口服、肠胃外(例如肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如尿道栓剂)或外用施用途径(例如凝胶、软膏、乳膏、气雾剂等)施用,并且可以单独或一起被配制成合适的剂量单位制剂,其含有适合每种施用途径的常规无毒的药学上可接受的载体、佐剂、赋形剂和载体。本发明不受施用途径、试剂或施用时间的限制。
如本文所使用的,术语“AAV”是腺相关病毒的标准缩写。腺相关病毒是一种单链DNA细小病毒,仅在通过共感染辅助病毒提供某些功能的细胞中生长。目前有十三种血清型的AAV已被表征。AAV的一般信息和评论可以在例如Carter, Handbook of Parvoviruses1:169-228, 1989, and Berns, Virology 1743-1764, 1999中找到。然而,完全可以预期,这些相同原理将适用于其他AAV血清型,因为众所周知,各种血清型在结构上和功能上、甚至在遗传水平上都有十分紧密相关。(例如,参见Blacklowe, Parvoviruses and HumanDisease 165-174, 1988, J. R. Pattison, ed.;以及Rose, Comprehensive Virology3:1-61, 1974)。例如,所有AAV血清型显然都表现出由同源rep基因介导的非常相似的复制特性;并且都携带有三种相关的衣壳蛋白,例如在AAV2中表达的那些。异源双链分析进一步表明了相关程度,该分析揭示了沿基因组长度的血清型之间广泛的交叉杂交;以及在末端与“末端反向重复序列”(ITR)相对应的类似自退火片段的存在。类似的传染性模式也表明,每种血清型中的复制功能都处于类似的调节控制之下。
如本文所使用的,“AAV表达盒”是指包含侧接于AAV末端重复序列(ITR)的一个或多个感兴趣的多核苷酸(或转基因)的核苷酸序列。当存在于已被编码和表达rep和cap基因产物的载体转染的宿主细胞中时,这种AAV表达盒可以被复制并包装成感染性病毒颗粒(例如AAV载体)。
“AAV病毒粒子”或“AAV载体”或“AAV病毒颗粒”或“AAV载体颗粒”是指由至少一种AAV衣壳蛋白和衣壳化的多核苷酸AAV表达盒组成的病毒颗粒。如果颗粒包含异源多核苷酸(即,野生型AAV基因组以外的多核苷酸,例如待递送给哺乳动物细胞的转基因),则通常被称为“AAV载体颗粒”或简称为“AAV载体”。因此,AAV载体颗粒的产生必然包括AAV表达盒的产生,因为这样的质粒被包含在AAV载体颗粒中。
腺相关病毒(AAV)是一种复制缺陷型细小病毒,其单链DNA基因组的长度约为4.7kb,包括两个145个核苷酸的末端反向重复序列(ITR)。AAV有多种血清型。AAV血清型的基因组的核苷酸序列是已知的。例如,AAV血清型2(AAV2)基因组的核苷酸序列在Srivastava etal., J Virol, 45: 555-564 (1983)中提出,并由Ruffing et al., J Gen Virol, 75:3385-3392 (1994)进行修正。作为其他实施例,GenBank登录号NC_002077中提供了AAV-1的完整基因组; GenBank登录号NC_1829中提供了AAV-3的完整基因组;GenBank登录号NC_001829中提供了AAV-4的完整基因组;GenBank登录号AF085716中提供了AAV-5的基因组;GenBank登录号NC_00 1862中提供了AAV-6的完整基因组;GenBank登录号 AX753246和AX753249中分别提供了AAV-7和AAV-8基因组的至少一部分(也参见与AAV-8有关的美国专利第7,282,199和7,790,449号); Gao et al,J. Virol., 78: 6381-6388 (2004)中提供了AAV-9基因组; Mol.Ther., 13(1):67-76 (2006)中提供了AAV-10基因组;以及Virology, 330(2):375-383 (2004)中提供了AAV-11基因组。Rodino-Klapac., et al. Journal of translational medicine 5, 45 (2007)中描述了AAVrh.74血清型的克隆。指导病毒DNA复制(rep)、衣壳化/包装和宿主细胞染色体整合的顺式作用序列被包含在ITR中。三个AAV启动子(因其相对图谱位置而命名为p5、p19和p40)驱动编码rep和cap基因的两个AAV内部开放阅读框的表达。两个rep启动子(p5和p19),加上单个AAV内含子的差异剪接(例如在AAV2核苷酸2107和2227处),导致从rep基因产生四个rep蛋白(rep 78、rep 68、rep52和rep 40)。Rep蛋白具有最终负责复制病毒基因组的多种酶学性质。cap基因是从p40启动子表达的,并且它编码三种衣壳蛋白VP1、VP2和VP3。替代的剪接和非共有的翻译起始位点负责三种相关的衣壳蛋白的产生。单个共有多腺苷酸化位点位于AAV基因组的图谱位置95。Muzyczka, Current Topics in Microbiology and Immunology, 158:97-129 (1992)中综述了AAV的生命周期和遗传学。
本公开的重组AAV基因组包含本发明的核酸分子和在该核酸分子侧翼的一个或多个AAV ITR。rAAV基因组中的AAV DNA可以来自用于可以衍生包括但不限于以下AAV血清型的重组病毒的任何AAV血清型:AAVrh.74、AAVrh.10、AAVrh.20、AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12和AAV-13。假型rAAV的产生公开于例如WO 01/83692。也可以预期其他类型的rAAV变体,例如具有衣壳突变的rAAV。参见,例如,Marsic et al., Molecular Therapy, 22(11): 1900-1909 (2014)。如上述背景技术部分所提及的,各种AAV血清型的基因组的核苷酸序列是本领域已知的。在一些实施方案中,使用AAV1、AAV6、AAV8或AAVrh.74以促进骨骼肌特异性表达。
如说明书和权利要求书中所使用的,单数形式“一”、“一个或一种”和“该或所述”包括复数引用,除非上下文另外明确指出。例如,术语“一个细胞”包括多个细胞,包括其混合物。
如本文所使用的,术语“包含”或“包括”旨在表示包括所列举的要素但不排除其他元素的组合物和方法。当用于定义组合物和方法时,“基本上由……组成”应表示排除对于所述目的而言对组合具有任何实质意义的其他元素。因此,基本上由本文所定义的元素组成的组合物将不会从分离和纯化方法以及药学上可接受的载体(例如磷酸盐缓冲盐水、防腐剂等)中排除痕量污染物。“由……组成”是指排除其他成分和用于施用本发明的组合物的实质性方法步骤的或用于生产组合物或实现预期结果的工艺步骤的痕量元素。由这些过渡术语中的每一个限定的实施方案在本发明的范围内。
如本文关于核酸(例如DNA或RNA)所用,术语“分离的”是指分别与存在于大分子天然来源中的其他DNA或RNA分离的分子。术语“分离的核酸”是指包括非天然存在为片段的核酸片段。术语“分离的”在本文中也用于指从其他细胞蛋白分离的多肽、蛋白和/或宿主细胞,并且意在涵盖纯化的和重组的多肽。在其他实施方案中,术语“分离的”是指与成分、细胞和其他分离,其中细胞、组织、多核苷酸、肽、多肽、蛋白质、抗体或其片段通常在自然界中是相关联的。例如,分离的细胞是与具有不同表型或基因型的组织或细胞分离的细胞。对本领域技术人员显而易见的是,非天然存在的多核苷酸、肽、多肽、蛋白质、抗体或其片段不需要“分离”即可将其与天然存在的对应物区分开。
本文中关于多肽或多核苷酸(例如DNA或RNA)的术语“重组”是指通过实验室的重组方法(例如分子克隆)形成的分子。分子克隆技术是本领域已知的,可以包括但不限于多核苷酸的PCR扩增、多核苷酸的酶解、多核苷酸与表达盒(例如哺乳动物表达盒)的连接(ligation)、用多核苷酸转化、转染或转导细胞,以及多核苷酸的表达来产生多肽。参见,例如 Green and Sambrook, Molecular Cloning:A Laboratory Manual, 2012。术语“重组多核苷酸”是指包括编码蛋白质的多核苷酸的片段。例如,重组多核苷酸可以包括编码人dysferlin蛋白的多核苷酸的片段。重组多核苷酸可以通过编码蛋白质的多核苷酸的片段的PCR扩增产生。重组多肽可以通过一个或多个重组多核苷酸的表达产生。
本文公开了编码人dysferlin(hDSYSF)蛋白的片段的多核苷酸。本文进一步公开了包含编码人dysferlin(hDSYSF)蛋白的片段的多核苷酸的质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物。本文还公开了制备和使用这种多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物的方法。
本文公开了一种编码人dysferlin(hDYSF)蛋白的片段的重组多核苷酸,其中所述重组多核苷酸包含第一核苷酸序列,其中所述第一核苷酸序列由以下序列组成:(a)SEQ IDNO:1、6或18的核苷酸序列;(b)与SEQ ID NO:1、SEQ ID NO:6或SEQ ID NO:18的核苷酸序列在SEQ ID NO:1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(c)SEQ ID NO:13或15的核苷酸序列;(d)与SEQ ID NO:13或15的核苷酸序列在SEQ ID NO:13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(e)编码hDYSF蛋白的核苷酸序列,其中hDYSF蛋白由SEQ IDNO:9的氨基酸序列组成;或者(f)与(e)的核苷酸序列在(e)的核苷酸序列全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
本文进一步公开了编码人dysferlin蛋白的片段的重组多核苷酸序列,其中所述重组多核苷酸包含第一核苷酸序列,其中所述第一核苷酸序列由以下序列组成:(a)SEQ IDNO:2、8或19的核苷酸序列;(b)与SEQ ID NO:2、8或19的核苷酸序列在SEQ ID NO:2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(c)SEQ ID NO:14或16的核苷酸序列;(d)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列;(e)编码hDYSF蛋白的多核苷酸序列,其中hDYSF蛋白由SEQ ID NO:10的氨基酸序列组成;或者(f)与(e)的多核苷酸序列在(e)的核苷酸序列全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
本文进一步公开了腺相关病毒(AAV)载体。在一些实施方案中,腺相关病毒(AAV)载体包含:(a)第一末端反向重复序列(ITR);(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸,其中该多核苷酸由以下序列组成:(i)SEQ ID NO:1或6的核苷酸序列;(ii)与SEQID NO:1或6的核苷酸序列在SEQ ID NO:1或6的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;(iii)SEQ ID NO:13或15的核苷酸序列;(iv)与SEQ ID NO:13或15的核苷酸序列在SEQID NO:13或15全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;(v)编码hDYSF蛋白的核苷酸序列,其中hDYSF蛋白由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;以及(c)第二ITR,其中多核苷酸的侧翼是第一和第二ITR。
在一些实施方案中,腺相关病毒(AAV)载体包含:(a)第一末端反向重复序列(ITR);(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸,其中所述多核苷酸由以下序列组成:(i)SEQ ID NO:2或8的核苷酸序列;(ii)与SEQ ID NO:2或8的核苷酸序列在SEQ IDNO:2或8的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;(iii)SEQ ID NO:14或16的核苷酸序列;(iv)与SEQ ID NO:14或16的核苷酸序列在SEQ ID NO:14或16的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;(v)编码hDYSF蛋白的核苷酸序列,其中hDYSF蛋白由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;以及(c)第二ITR,其中多核苷酸的侧翼是第一和第二ITR。
本文进一步公开了腺相关病毒(AAV)表达盒。在一些实施方案中,AAV表达盒包含(a)第一末端反向重复序列(ITR),其中第一ITR包含任何本文公开的ITR;(b)任何本文公开的5'hDYSF多核苷酸;以及(c)第二ITR,其中所述第二ITR包含任何本文公开的ITR,其中(b)的5'hYDSYF多核苷酸的侧翼是(a)和(c)的第一和第二ITR。
在一些实施方案中,AAV表达盒包含:(a)第一末端反向重复序列(ITR),其中第一ITR包含任何本文公开的ITR;(b)任何本文公开的3'hDYSF多核苷酸;以及(c)第二ITR,其中所述第二ITR包含任何本文公开的ITR,其中(b)的3'hYDSYF多核苷酸的侧翼是(a)和(c)的第一和第二ITR。
本文进一步公开了腺相关病毒(AAV)载体。在一些实施方案中,AAV载体包含:(a)第一末端反向重复序列(ITR),其中第一ITR包含任何本文公开的ITR;(b)任何本文公开的5'hDYSF多核苷酸;以及(c)第二ITR,其中第二ITR包含任何本文公开的ITR,其中(b)的5'hYDSYF多核苷酸的侧翼为(a)和(c)的第一和第二ITR。
在一些实施方案中,AAV载体包含:(a)第一末端反向重复序列(ITR),其中第一ITR包含任何本文公开的ITR;(b)任何本文公开的3'hDYSF多核苷酸;以及(c)第二ITR,其中第二ITR包含任何本文公开的ITR,其中(b)的3'hYDSYF多核苷酸的侧翼为(a)和(c)的第一和第二ITR。
本文进一步公开了双腺相关病毒(AAV)载体系统。在一些实施方案中,双AAV载体系统包含:(a)第一AAV载体,其中所述第一AAV载体包含任何本文公开的5'hDYSF多核苷酸;以及(b)第二AAV载体,其中所述第二AAV载体包含任何本文公开的3' hDYSF多核苷酸。
本文进一步公开了双腺相关病毒(AAV)载体系统。在一些实施方案中,所述双AAV载体系统包含以下组分,由以下组分组成或基本上由以下组分组成:(a)第一AAV载体,其中所述第一AAV载体包含任何本文公开的5'hDYSF AAV载体,由其组成或基本上由其组成;以及(b)第二AAV载体,其中所述第二AAV载体包含任何本文公开的3'hDYSF AAV载体,由其组成或基本上由其组成。
本文进一步公开了腺相关病毒(AAV)载体。在一些实施方案中,AAV载体包含任何本文公开的5'hDYSF多核苷酸。
在一些实施方案中,AAV载体包含任何本文公开的3'hDYSF多核苷酸。
在一些实施方案中,多核苷酸、质粒、病毒载体(例如病毒或病毒颗粒)、载体系统、病毒包装系统、细胞和组合物进一步包含一个或多个核苷酸序列,该序列包含末端反向重复序列(ITR)、启动子、内含子、选择标志物或复制原点(ORI),由其组成或基本上由其组成。
在一些实施方案中,多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物进一步包含一个或多个另外的核苷酸序列,该序列包含末端反向重复序列(ITR)、选择标志物、复制原点(ORI)、非翻译区(UTR)或多腺苷酸化(PolyA)信号。
本文进一步公开了治疗dysferlin肌病的方法。在一些实施方案中,治疗dysferlin肌病的方法包含向有此需要的对象施用本文公开的任何多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物。
本文进一步公开了任何本文所公开的多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物在制备用于治疗dysferlin肌病的药物中的用途。
同源的重组和hDYSF片段
AAV介导的基因疗法为多种疾病提供了理想的治疗策略;然而,其受到AAV病毒粒子4.7kb包装限制的阻碍。特别值得关注的是目前没有治愈或有效疗法的疾病(例如dysferlin肌病)。本文公开了一种通过两部分的基因组的同源重组制备或产生全长的dysferlin基因的方法。在一个实施例中,两个部分包装的基因组如图1所示,为pAAV.MHCK7.DYSF5'.PTG和pAAV.DYSF3'.POLYA。无论是通过被包装成AAV载体的病毒递送还是非病毒方法(例如LNP),一旦这两个基因组被递送到细胞(例如肌细胞),它们就会产生包含全长dysferlin编码区的转录本,导致功能性dysferlin蛋白的表达。两个多核苷酸之间的重叠区域促进了同源重组,导致含有全长dysferlin基因的转录本。通过将全长的dysferlin基因分离成两个部分包装的基因组,该方法成功地绕过了AAV包装的限制并且产生了功能性的全长dysferlin基因。在一个实施方案中,转录本是包含与SEQ ID NO:20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列的表达盒。在一个实施方案中,转录本是包含SEQ ID NO:20的序列的表达盒。
在一些实施方案中,本文公开了一种编码人dysferlin(hDYSF)蛋白的重组多核苷酸,其中所述重组多核苷酸序列包含SEQ ID NO:20的核苷酸序列或与SEQ ID NO:20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。在某些情况下,重组多核苷酸包含SEQ ID NO: 20的核苷酸序列。在某些情况下,本文公开了一种制备重组多肽的方法。在一些情况下,所述方法包含使细胞与编码hDYSF蛋白的5'片段的重组多核苷酸和编码hDYSF蛋白的3'片段的第二重组多核苷酸接触。在某些情况下,所述方法包含使细胞与本文所述的双AAV载体系统接触。在一些情况下,所述细胞是真核细胞,任选地肌肉细胞、心脏细胞和/或肝脏细胞。在一些情况下,所述方法包含向对象施用编码hDYSF蛋白的5'片段的重组多核苷酸和编码hDYSF蛋白的3'片段的第二重组多核苷酸。在某些情况下,所述方法包含向对象施用本文所述的双AAV载体系统。在一些情况下,所述方法包含通过表达包含SEQ ID NO: 20或与SEQ ID NO: 20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列的重组多核苷酸来治疗对象的肌营养不良症。在一些情况下,对象患有dysferlin肌病,任选地选自LGMD2B或三好氏肌肉病变。
本文还公开了两种重组多核苷酸,每一种都编码人dysferlin(hDYSF)蛋白的片段,其能够通过上述同源重组导致全长dysferlin基因的产生。在一些实施方案中,重组的多核苷酸编码hDYSF蛋白的5'片段。在一些实施方案中,编码hDYSF蛋白的5'片段的重组多核苷酸被称为5'hDYSF多核苷酸。在一些实施方案中,重组多核苷酸编码hDYSF蛋白的3'片段。在一些实施方案中,编码hDYSF蛋白的3'片段的重组多核苷酸被称为3'hDSYF多核苷酸。
5'hDYSF多核苷酸
在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的3330-3365、3330-3360、3330-3355、3335-3365、3335-3350、3340-3365、3340-3360或3340-3355个之间的连续的核苷酸,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的3360、3359、3358、3357、3356、3355、3354、3353、3352、3351、3350、3349、3348、3347、3346、3345、3344、3343、3342、3341、或3340个或更少的连续的核苷酸,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的3330-3365、3330-3360、3330-3355、3335-3365、3335-3350、3340-3365、3340-3360或3340-3355个之间的连续的核苷酸,由其组成或基本由其组成,其中5'hDYSF多核苷酸在SEQ ID NO: 11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的全长上是SEQ IDNO:11的核苷酸序列的至少80%、82%、85%、87%、88%、90%、92%、95%、96%、97%、98%、99%或100%。在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的3360、3359、3358、3357、3356、3355、3354、3353、3352、3351、3350、3349、3348、3347、3346、3345、3344、3343、3342、3341或3340个或更少的连续的核苷酸,由其组成或基本由其组成,其中5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的全长上是SEQ ID NO:11的核苷酸序列的至少80%、82%、85%、87%、88%、90%、92%、95%、96%、97%、98%、99%或100%。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO: 11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的全长上是SEQ IDNO:11的核苷酸序列的至少85%。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO: 11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的全长上是SEQ ID NO:11的核苷酸序列的至少90%。在一些实施方案中,5'hDYSF多核苷酸在SEQID NO: 11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750、或377-3716之间区域的全长上是SEQ ID NO:11的核苷酸序列的至少95%。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的3330-3365、3330-3360、3330-3355、3335-3365、3335-3350、3340-3365、3340-3360或3340-3355个之间的连续的核苷酸,由其组成或基本上由其组成,其中5'hDYSF多核苷酸在SEQ ID NO: 11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域中包含30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1个或更少的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域的3360、3359、3358、3357、3356、3355、3354、3353、3352、3351、3350、3349、3348、3347、3346、3345、3344、3343、3342、3341或3340个或更少的连续的核苷酸,由其组成或基本上由其组成,其中5'hDYSF多核苷酸在SEQ ID NO: 11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域中包含30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1个或更少的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域中包含15个或更少的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、 350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域中包含10个或更少的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域中包含5个或更少的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域中包含1个核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸100-4000、100-3900、100-3800、100-3750、100-3716、150-4000、150-3900、150-3800、150-3750、150-3716、200-4000、200-3900、200-3800、200-3750、200-3716、250-4000、250-3900、250-3800、250-3750、250-3716、300-4000、300-3900、300-3800、300-3750、300-3716、350-4000、350-3900、350-3800、350-3750、350-3716、370-4000、370-3900、370-3800、370-3750、370-3716、377-4000、377-3900、377-3800、377-3750或377-3716之间区域中包含至少1个核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸377-3716之间区域中包含至少1个的核苷酸错配。在一些实施方案中,该5'hDYSF多核苷酸不进一步包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的3330-3365、3330-3360、3330-3355、3335-3365、3335-3350、3340-3365、3340-3360或3340-3355连续核苷酸,由其组成或基本上由其组成,其中5'hDSYF多核苷酸包含包括SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域。在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的3360、3359、3358、3357、3356、3355、3354、3353、3352、3351、3350、3349、3348、3347、3346、3345、3344、3343、3342、3341或3340个或更少的连续的核苷酸,由其组成或基本上由其组成,其中5'hDSYF多核苷酸包含包括SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域。在一些实施方案中,5'hDYSF多核苷酸包含与含有SEQ IDNO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的核苷酸序列有至少85%、87%、88%、90%、92%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与含有SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的核苷酸序列在该区域的全长上有至少90%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与含有SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的核苷酸序列在该区域的全长上有至少95%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与含有SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的核苷酸序列在该区域的全长上有至少99%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸进一步不包括编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含10、9、8、7、6、5、4、3、2、1个或更少的与包含SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的核苷酸序列的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸包含5个或更少的与包含SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的核苷酸序列的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸包含2个或更少的与包含SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的核苷酸序列的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸包含1个或更少的与包含SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的核苷酸序列的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的3360、3359、3358、3357、3356、3355、3354、3353、3352、3351、3350、3349、3348、3347、3346、3345、3344、3343、3342、3341或3340个或更少的连续的核苷酸,由其组成或基本上由其组成,其中该5'hDSYF多核苷酸包含包括SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域,其中5'hDYSF多核苷酸在包含SEQ ID NO:11的核苷酸位置3400-3716、3400-3700、3400-3650、3400-3600、3400-3550、3400-3500、3390-3716、3390-3700、3390-3650、3390-3600、3390-3550、3390-3500、3380-3716、3380-3700、3380-3650、3380-3500、3371-3716、3371-3700、3371-3650、3371-3600、3371-3550或3371-3500的区域的全长上是SEQ ID NO:11的核苷酸序列的至少90%、92%、95%、96%、97%、98%、99%或100%。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含SEQ ID NO:11的3330-3365、3330-3360、3330-3355、3335-3365、3335-3350、3340-3365、3340-3360或3340-3355个之间连续的核苷酸,由其组成或基本上由其组成,其中5'hDSYF多核苷酸不包含由SEQ ID NO: 11的核苷酸位置1-100、1-200、1-300、1-350、1-375、1-376、100-200、100-300、100-350、100-375、100-376、200-300、200-350、200-375或200-376组成的区域。在一些实施方案中,5'hDSYF多核苷酸不包含由SEQ ID NO:11的核苷酸位置1-376组成的区域。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含:SEQ ID NO:11的3360、3359、3358、3357、3356、3355、3354、3353、3352、3351、3350、3349、3348、3347、3346、3345、3344、3343、3342、3341或3340个或更少的连续的核苷酸,由其组成或基本上由其组成,其中5'hDSYF多核苷酸不包含由SEQ ID NO: 11的核苷酸位置1-100、1-200、1-300、1-350、1-375、100-200、100-300、100-350、100-375、200-300、200-350、200-375组成的区域。在一些实施方案中,5'hDSYF多核苷酸不包含由SEQ ID NO:11的核苷酸位置1-376组成的区域。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含SEQ ID NO: 1的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:与SEQ ID NO: 1的核苷酸序列在SEQ ID NO: 1的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:与SEQ ID NO: 1的核苷酸序列在SEQ ID NO: 1的全长上有至少90%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:与SEQ ID NO: 1的核苷酸序列在SEQ ID NO: 1的全长上有至少92%同一性的核苷酸序列,或由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:与SEQ IDNO: 1的核苷酸序列在SEQ ID NO: 1的全长上有至少95%同一性的核苷酸序列,或由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含SEQ ID NO: 13的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:与SEQ ID NO: 13的核苷酸序列在SEQ ID NO: 13的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:与SEQ ID NO: 13的核苷酸序列在SEQ ID NO: 13的全长上有至少90%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:与SEQ ID NO: 13的核苷酸序列在SEQ ID NO: 13的全长上有至少92%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含:与SEQ ID NO: 13的核苷酸序列在SEQ ID NO: 13的全长上有至少95%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含编码包含野生型hDSYF蛋白的N端区域的hDYSF蛋白的片段的核苷酸序列,或由其组成或基本上由其组成。在一些实施方案中,包含野生型hDSYF蛋白的N端区域的hDYSF蛋白的片段被称为N端hDYSF蛋白。在一些实施方案中,5'hDYSF多核苷酸包含编码N端hDYSF蛋白的核苷酸序列,由其组成或基本上由其组成,其中N端hDYSF蛋白包含:包括SEQ ID NO:12的氨基酸残基1-1113、200-1113、400-1113、500-1113、600-1113、650-113、650-1100、700-1100、700-1113、700-1050、700-1000、800-1113、800-1100、800-1050、900-1113、900-1100、1000-1113或1000-1100、由其组成或基本上由其组成的区域。在一些实施方案中,5'hDYSF多核苷酸包含:与编码N端hDYSF蛋白质的核苷酸序列在编码N端hDYSF蛋白的核苷酸序列的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成,其中N端hDYSF蛋白包含:包括SEQ ID NO:12的氨基酸残基1-1113、200-1113、400-1113、500-1113、600-1113、650-113、650-1100、700-1100、700-1113、700-1050、700-1000、800-1113、800-1100、800-1050、900-1113、900-1100、1000-1113、或1000-1100、由其组成或基本上由其组成的区域。在一些实施方案中,N端hDYSF蛋白包含:包括氨基酸残基999-1113、999-1100、1000-1113或1000-1100、由其组成或基本上由其组成的区域。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含编码N端hDYSF蛋白的核苷酸序列、由其组成或基本上由其组成,其中N端hDYSF蛋白的长度为至少1000个氨基酸,并且其中N端hDYSF蛋白包含包括SEQ ID NO: 12的氨基酸残基999-1113、999-1100、1000-1113或1000-1100的区域,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含与编码N端hDYSF蛋白的核苷酸序列在编码N端hDYSF蛋白的核苷酸序列的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成,其中N端hDYSF蛋白的长度为至少1000个氨基酸,并且其中N端hDYSF蛋白包含包括SEQ ID NO:12的氨基酸残基999-1113、999-1100、1000-1113或1000-1100的区域。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含编码N端hDYSF蛋白的核苷酸序列,由其组成或基本上由其组成,其中N端hDYSF蛋白包含SEQ ID NO: 9的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含与编码N端hDYSF蛋白的核苷酸序列在编码N端hDYSF蛋白的核苷酸序列的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成,其中该N端hDYSF蛋白包含SEQ ID NO:9的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含与编码N端hDYSF蛋白的核苷酸序列在编码N端hDYSF蛋白的核苷酸序列的全长上有至少90%同一性的核苷酸序列,由其组成或基本上由其组成,其中N端hDYSF蛋白包含SEQ ID NO:9的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含与编码N端hDYSF蛋白的核苷酸序列在编码N端hDYSF蛋白的核苷酸序列的全长上有至少92%同一性的核苷酸序列,由其组成或基本上由其组成,其中N端hDYSF蛋白包含SEQ ID NO:9的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含与编码N端hDYSF蛋白的核苷酸序列在编码N端hDYSF蛋白的核苷酸序列的全长上有至少95%同一性的核苷酸序列,由其组成或基本上由其组成,其中N端hDYSF蛋白包含SEQ ID NO:9的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,5'hDYSF多核苷酸包含与编码N端hDYSF蛋白的核苷酸序列在编码N端hDYSF蛋白的核苷酸序列的全长上有至少97%同一性的核苷酸序列,由其组成或基本上由其组成,其中N端hDYSF蛋白包含SEQ ID NO:9的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,N端hDYSF蛋白包含与SEQ ID NO:9的氨基酸序列在SEQ ID NO:9的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,N端hDYSF蛋白包含与SEQ ID NO:9的氨基酸序列在SEQ ID NO:9的全长上有至少90%同一性的氨基酸序列。在一些实施方案中,N端hDYSF蛋白包含与SEQ ID NO:9的氨基酸序列在SEQ ID NO:9的全长上有至少92%同一性的氨基酸序列。在一些实施方案中,N端hDYSF蛋白包含与SEQ ID NO:9的氨基酸序列在SEQ ID NO:9的全长上有至少95%同一性的氨基酸序列。在一些实施方案中,N端hDYSF蛋白包含与SEQ ID NO:9的氨基酸序列在SEQID NO:9的全长上有至少97%同一性的氨基酸序列。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含SEQ ID NO: 6的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与SEQ ID NO: 6的核苷酸序列在SEQ ID NO: 6的全长上有至少80%、81%、82%、83%、84%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与SEQ IDNO: 6的核苷酸序列在SEQ ID NO: 6的全长上有至少85%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与SEQ ID NO: 6的核苷酸序列在SEQ ID NO: 6的全长上有至少90%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDYSF多核苷酸包含SEQ ID NO: 15的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与SEQ ID NO:6的核苷酸序列在SEQ ID NO:15的全长上有至少80%、81%、82%、83%、84%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与SEQ IDNO:15的核苷酸序列在SEQ ID NO:15的全长上有至少85%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸包含与SEQ ID NO:15的核苷酸序列在SEQ ID NO:15的全长上有至少90%同一性的核苷酸序列。在一些实施方案中,5'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
3'hDYSF多核苷酸
在一些实施方案中,3'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的3500-4100、3500-4000、3500-3900、3500-3880、3500-3870、3600-4100、3600-4000、3600-3900、3600-3880、3600-3870、3700-4100、3700-4000、3700-3900、3700-3880、3700-3870、3800-4100、3800-4000或3800-3900个之间的连续的核苷酸,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的4100、4000、3900、3880或3870个或更少的连续的核苷酸,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的3500-4100、3500-4000、3500-3900、3500-3880、3500-3870、3600-4100、3600-4000、3600-3900、3600-3880、3600-3870、3700-4100、3700-4000、3700-3900、3700-3880、3700-3870、3800-4100、3800-4000或3800-3900个之间的连续的核苷酸,由其组成或基本由其组成,其中3'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的全长上是SEQ ID NO:11的核苷酸序列的至少80%、82%、85%、87%、88%、90%、92%、95%、96%、97%、98%、99%或100%。在一些实施方案中,3'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的4100、4000、3900、3880或3870个或更少的连续的核苷酸,由其组成或基本由其组成,其中3'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的全长上是SEQ ID NO:11的核苷酸序列的至少80%、82%、85%、87%、88%、90%、92%、95%、96%、97%、98%、99%或100%。在一些实施方案中,3'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的全长上是SEQ ID NO:11的核苷酸序列的至少85%。在一些实施方案中,3'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的全长上是SEQ ID NO:11的核苷酸序列的至少90%。在一些实施方案中,3'hDYSF多核苷酸在SEQID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的全长上是SEQ ID NO:11的核苷酸序列的至少95%。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的3500-4100、3500-4000、3500-3900、3500-3880、3500-3870、3600-4100、3600-4000、3600-3900、3600-3880、3600-3870、3700-4100、3700-4000、3700-3900、3700-3880、3700-3870、3800-4100、3800-4000或3800-3900个之间的连续的核苷酸,由其组成或基本上由其组成,其中3'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域中包含30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1个或更少的核苷酸错配。在一些实施方案中,3'hDYSF多核苷酸包含:SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域的4100、4000、3900、3880、或3870个或更少的连续的核苷酸,由其组成或基本上由其组成,其中3'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域中包含30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1个或更少的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域中包含15个或更少的核苷酸错配。在一些实施方案中,3'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620、或2754-6619之间的区域包含10个或更少的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域中包含5个或更少的核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域中包含1个核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ IDNO:11的核苷酸2600-6850、2600-6800、2600-6780、2600-6750、2600-6725、2600-6700、2700-6850、2700-6800、2700-6780、2700-6750、2700-6725、2700-6700、2700-6680、2700-6650、2700-6625、2700-6620、2700-6619、2750-6850、2750-6800、2750-6780、2750-6750、2750-6725、2750-6700、2750-6680、2750-6650、2750-6625、2750-6620、2750-6619、2754-6850、2754-6800、2754-6780、2754-6750、2754-6725、2754-6700、2754-6680、2754-6650、2754-6625、2754-6620或2754-6619之间区域中包含至少1个核苷酸错配。在一些实施方案中,5'hDYSF多核苷酸在SEQ ID NO:11的核苷酸2754-6619之间区域中包含至少1个核苷酸错配。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含:SEQ ID NO:11的3500-4100、3500-4000、3500-3900、3500-3880、3500-3870、3600-4100、3600-4000、3600-3900、3600-3880、3600-3870、3700-4100、3700-4000、3700-3900、3700-3880、3700-3870、3800-4100、3800-4000、or 3800-3900之间连续的核苷酸,由其组成或基本上由其组成,其中5'hDSYF多核苷酸不包含由SEQ ID NO:11的核苷酸位置6620-6914、6620-6900、6620-6800、6620-6700、6700-6914、6700-6800、6800-6914或6800-6900组成的区域。在一些实施方案中,3'hDSYF多核苷酸不包含由SEQ ID NO:11的核苷酸位置6620-6914组成的区域。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含:SEQ ID NO:11的4100、4000、3900、3880或3870个或更少的连续的核苷酸,由其组成或基本上由其组成其中3'hDSYF多核苷酸不包含由SEQ ID NO: 11的核苷酸位置6620-6914、6620-6900、6620-6800、6620-6700、6700-6914、6700-6800、6800-6914、或6800-6900组成的区域。在一些实施方案中,3'hDSYF多核苷酸不包含由SEQ ID NO:11的核苷酸位置6620-6914组成的区域。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含SEQ ID NO: 2的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与SEQ ID NO: 2的核苷酸序列在SEQ ID NO: 2的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与SEQ ID NO: 2的核苷酸序列在SEQ ID NO: 2的全长上有至少90%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与SEQ ID NO: 2的核苷酸序列在SEQ ID NO: 2的全长上有至少92%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与SEQ IDNO: 2的核苷酸序列在SEQ ID NO: 2的全长上有至少95%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含SEQ ID NO: 14的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与SEQ ID NO: 14的核苷酸序列在SEQ ID NO: 14的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与SEQ ID NO: 14的核苷酸序列在SEQ ID NO: 14的全长上有至少90%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与SEQ ID NO: 14的核苷酸序列在SEQ ID NO: 14的全长上有至少92%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与SEQ ID NO: 14的核苷酸序列在SEQ ID NO: 14的全长上有至少95%同一性的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含编码包括野生型hDSYF蛋白的C端区域的hDYSF蛋白的片段的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,包含野生型hDSYF蛋白的C端区域的hDYSF蛋白的片段被称为C端hDYSF蛋白。在一些实施方案中,3'hDYSF多核苷酸包含编码C端hDYSF蛋白的核苷酸序列,由其组成或基本上由其组成,其中C端hDYSF蛋白包含:包括SEQ ID NO:12的氨基酸残基750-2080、750-2000、750-1900、775-2080、775-2000、775-1900、794-2080、794-2000或794-1900、由其组成或基本上由其组成的区域。在一些实施方案中,3'hDYSF多核苷酸包含:与编码C端hDYSF蛋白的核苷酸序列在编码C端hDYSF蛋白的核苷酸序列的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成,其中C端hDYSF蛋白包含:包括SEQ ID NO:12的氨基酸残基750-2080、750-2000、750-1900、775-2080、775-2000、775-1900、794-2080、794-2000或794-1900、由其组成或基本上由其组成的区域。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含编码C端hDYSF蛋白的核苷酸序列,由其组成或基本上由其组成,其中C端hDYSF蛋白包含长度为1400、1350、1325、1300、1290或1287个或更少的氨基酸,并且其中C端hDYSF蛋白包含包括SEQ ID NO:12的氨基酸残基750-2080、750-2000、750-1900、775-2080、775-2000、775-1900、794-2080、794-2000或794-1900的区域。在一些实施方案中,3'hDYSF多核苷酸包含:与编码C端hDYSF蛋白的核苷酸序列在编码C端hDYSF蛋白的核苷酸序列的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成,其中C端hDYSF蛋白的长度为1400、1350、1325、1300、1290或1287个或更少的氨基酸,并且其中C端hDYSF蛋白包含包括SEQ ID NO:12的氨基酸残基750-2080、750-2000、750-1900、775-2080、775-2000、775-1900、794-2080、794-2000或794-1900的区域。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含编码C端hDYSF蛋白的核苷酸序列,由其组成或基本上由其组成,其中C端hDYSF蛋白包含:长度为1400、1350、1325、1300、1290或1287或更少的氨基酸,由其组成或基本上由其组成,其中C端hDYSF蛋白不包含:包括SEQ IDNO:12的氨基酸残基678-793、678-750、678-725或678-700的区域。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含编码C端hDYSF蛋白的核苷酸序列,由其组成或基本上由其组成,其中该C端hDYSF蛋白包含SEQ ID NO: 10的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含:与编码C端hDYSF蛋白的核苷酸序列在编码C端hDYSF蛋白的核苷酸序列的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列,由其组成或基本上由其组成,其中该C端hDYSF蛋白包含SEQ ID NO: 10的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与编码C端hDYSF蛋白的核苷酸序列在编码C端hDYSF蛋白的核苷酸序列的全长上有至少90%同一性的核苷酸序列,由其组成或基本上由其组成,其中该C端hDYSF蛋白包含SEQ ID NO: 10的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与编码C端hDYSF蛋白的核苷酸序列在编码C端hDYSF蛋白的核苷酸序列的全长上有至少92%同一性的核苷酸序列,由其组成或基本上由其组成,其中C端hDYSF蛋白包含SEQ ID NO: 10的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与编码C端hDYSF蛋白的核苷酸序列在编码C端hDYSF蛋白的核苷酸序列的全长上有至少95%同一性的核苷酸序列,由其组成或基本上由其组成,其中C端hDYSF蛋白包含SEQ ID NO: 10的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,3'hDYSF多核苷酸包含:与编码C端hDYSF蛋白的核苷酸序列在编码C端hDYSF蛋白的核苷酸序列的全长上有至少97%同一性的核苷酸序列,由其组成或基本上由其组成,其中C端hDYSF蛋白包含SEQ ID NO: 10的氨基酸序列,由其组成或基本上由其组成。在一些实施方案中,C端hDYSF蛋白包含与SEQ ID NO:10的氨基酸序列在SEQ ID NO:10的全长上有至少80%、82%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,C端hDYSF蛋白包含与SEQ ID NO:10的氨基酸序列在SEQ ID NO:10的全长上有至少90%同一性的氨基酸序列。在一些实施方案中,C端hDYSF蛋白包含与SEQ IDNO:10的氨基酸序列在SEQ ID NO:10的全长上有至少92%同一性的氨基酸序列。在一些实施方案中,C端hDYSF蛋白包含与SEQ ID NO:10的氨基酸序列在SEQ ID NO:10的全长上有至少95%同一性的氨基酸序列。在一些实施方案中,C端hDYSF蛋白包含与SEQ ID NO:10的氨基酸序列在SEQ ID NO:10的全长上有至少97%同一性的氨基酸序列。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含SEQ ID NO: 8的核苷酸序列。在一些实施方案中,3'hDYSF多核苷酸包含与SEQ ID NO: 8的核苷酸序列在SEQ ID NO: 8的全长上有至少80%、81%、82%、83%、84%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,3'hDYSF多核苷酸包含与SEQ IDNO: 8的核苷酸序列在SEQ ID NO: 8的全长上有至少85%的同一性的核苷酸序列。在一些实施方案中,3'hDYSF多核苷酸包含与SEQ ID NO: 8的核苷酸序列在SEQ ID NO: 8的全长上有至少90%同一性的核苷酸序列。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,3'hDYSF多核苷酸包含SEQ ID NO: 16的核苷酸序列。在一些实施方案中,3'hDYSF多核苷酸包含与SEQ ID NO: 16的核苷酸序列在SEQ ID NO: 16的全长上有至少80%、81%、82%、83%、84%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,3'hDYSF多核苷酸包含与SEQID NO: 16的核苷酸序列在SEQ ID NO: 16的全长上有至少85%的同一性的核苷酸序列。在一些实施方案中,3'hDYSF多核苷酸包含与SEQ ID NO: 16的核苷酸序列在SEQ ID NO: 16的全长上有至少90%同一性的核苷酸序列。在一些实施方案中,3'hDYSF多核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
在一些实施方案中,5'hDSYF多核苷酸和3'hDYSF多核苷酸的序列包含至少500、600、700、800、900、950、960或963个核苷酸的重叠。在一些实施方案中,N端hDSYF蛋白和C端hDSYF蛋白的序列包含至少50、100、150、200、250、300或320个氨基酸的重叠。
末端反向重复序列
在一些实施方案中,多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物进一步包含:包括一个或多个末端反向重复序列(ITR)、由其组成或基本上由其组成的核苷酸序列。在一些实施方案中,多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物进一步包含两个、三个、四个、五个或六个或更多个包含两个、三个、四个、五个或六个或更多个ITR的核苷酸序列,由其组成或基本上由其组成。在一些实施方案中,两个或更多个ITR是相同的。在一些实施方案中,两个或更多个ITR是不同的。
在一些实施方案中,重组多核苷酸的侧翼是两个或更多个ITR。在一些实施方案中,5'hDYSF多核苷酸的侧翼是第一对ITR。在一些实施方案中,3'hDYSF多核苷酸的侧翼是第二对ITR。在一些实施方案中,第一对ITR中的ITR是相同的。在一些实施方案中,第一对ITR中的ITR是不同的。在一些实施方案中,第二对ITR中的ITR是相同的。在一些实施方案中,第二对ITR中的ITR是不同的。在一些实施方案中,第一对ITR中的ITR与第二对ITR中的ITR相同。在一些实施方案中,第一对ITR中的至少一个ITR与第二对ITR中的至少一个ITR相同。在一些实施方案中,第一对ITR中的ITR与第二对ITR中的ITR不同。在一些实施方案中,第一对ITR中的至少一个ITR与第二对ITR中的至少一个ITR不同。
在一些实施方案中,ITR是病毒性ITR。在一些实施方案中,ITR是AAV ITR。在一些实施方案中,AAV ITR选自AAV血清型AAVrh.20、AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAVrh.74、AAV-8、AAV-9、AAV-10、AAVrh.10、AAV-11、AAV-12和AAV-13中的至少一种的ITR。在一些实施方案中,AAV ITR是AAV2 ITR。在一些实施方案中,AAV ITR是AAV5 ITR。AAV1-6的ITR序列可以在例如Grimm et al., J. Virol.80(1):426-39, 2006中找到,其通过引用整体并入本文。
在一些实施方案中,重组多核苷酸不包含除末端反向重复序列(ITR)以外的AAV序列。
在一些实施方案中,重组多核苷酸不包含除末端反向重复序列(ITR)以外的病毒序列。
在一些实施方案中,ITR包含SEQ ID NO: 3的核苷酸序列。在一些实施方案中,ITR包含与SEQ ID NO: 3的核苷酸序列在SEQ ID NO: 3的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。在一些实施方案中,ITR包含SEQ ID NO: 3的核苷酸序列。在一些实施方案中,ITR包含与SEQ ID NO: 3的核苷酸序列在SEQ ID NO: 3的全长上有至少90%同一性的核苷酸序列。在一些实施方案中,ITR包含与SEQ ID NO: 3的核苷酸序列在SEQ ID NO: 3的全长上有至少95%同一性的核苷酸序列。在一些实施方案中,ITR包含包括与SEQ ID NO: 3的核苷酸序列有10、9、8、7、6、5、4、3、2或1个或更少的核苷酸错配的核苷酸序列。在一些实施方案中,ITR包含包括与SEQ ID NO: 3的核苷酸序列有5个或更少的核苷酸错配的核苷酸序列。
启动子
在一些实施方案中,多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物进一步包含核苷酸序列,所述核苷酸序列包括一个或多个启动子,由其组成或基本上由其组成。在一些实施方案中,启动子是真核生物启动子。真核生物启动子的示例包括但不限于巨细胞病毒(CMV)启动子、延伸因子1α(EF1a)启动子、CAG启动子、磷酸甘油酸激酶基因(PGK)启动子、四环素反应元件(TRE)启动子、人U6核(U6)启动子和UAS启动子。在一些实施方案中,启动子是哺乳动物的启动子。在一些实施方案中,启动子是组成型启动子。在一些实施方案中,启动子是可诱导的启动子。
在一些实施方案中,启动子是组织特异性启动子。组织的示例包括但不限于肌肉组织、上皮组织、结缔组织和神经组织。组织特异性启动子的示例包括但不限于:B29启动子、CD14启动子、CD43启动子、CD45启动子、CD68启动子、肌间线蛋白启动子、弹性蛋白酶-1启动子、内皮糖蛋白(Endoglin)启动子、纤连蛋白启动子、Flt-1启动子、GFAP启动子、ICAM-2启动子、INF-β启动子、Mb启动子、NphsI启动子、OG-2启动子、SP-B启动子、SYN1启动子、WASP启动子、SV40/bAlb启动子、SV40/hAlb启动子、SV40/CD43启动子、SV40/CD45启动子和NSE/RU5' 启动子。
在一些实施方案中,启动子是肌肉特异性启动子。在一些实施方案中,肌肉特异性启动子是肌球蛋白重链复合物-E盒肌肉肌酸激酶融合增强子/启动子。
在一些实施方案中,启动子是重组启动子。在一些实施方案中,重组启动子是重组肌肉特异性启动子。在一些实施方案中,重组肌肉特异性启动子是重组肌球蛋白重链-肌酸激酶肌肉特异性启动子。在另一个实施方案中,肌肉特异性启动子包含人骨骼肌动蛋白基因元件、心脏肌动蛋白基因元件、肌间线蛋白启动子、骨骼α-肌动蛋白(ASKA)启动子、肌钙蛋白I(TNNI2)启动子、心肌特异性增强子结合因子mef结合元件、肌肉肌酸激酶(MCK)启动子、截短的MCK(tMCK)启动子、肌球蛋白重链(MHC)启动子、混合肌球蛋白重链增强子/MCK增强子-启动子(MHCK7)启动子、C5-12启动子、小鼠肌酸激酶增强子元件、骨骼快收缩肌钙蛋白c基因元件、慢收缩心肌肌钙蛋白c基因元件、慢收缩肌钙蛋白i基因元件、低氧诱导性核因子。
在一些实施方案中,启动子包含SEQ ID NO: 4的核苷酸序列。在一些实施方案中,启动子包含与SEQ ID NO: 4的核苷酸序列在SEQ ID NO: 4的全长上有至少80%、82%、85%、87%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
内含子
在一些实施方案中,多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物进一步包含核苷酸序列,所述核苷酸序列包括含一个或多个内含子,由其组成或基本上由其组成。在一些实施方案中,内含子是真核生物内含子。在一些实施方案中,内含子是哺乳动物的内含子。在一些实施方案中,内含子是合成的内含子。在一些实施方案中,内含子是嵌合的内含子。在一些实施方案中,内含子来自非编码外显子。在一些实施方案中,内含子在5'或至5'hDYSF多核苷酸的上游。
在一些实施方案中,内含子包含5'供体位点、分支点或3'剪接位点中的至少一个。在一些实施方案中,内含子包含两个或更多个5'供体位点、分支点或3'剪接位点。在一些实施方案中,内含子包含5'供体位点、分支点和3'剪接位点。
在一些实施方案中,内含子包含来自人类β-球蛋白基因的5'供体位点。
在一些实施方案中,内含子包含来自免疫球蛋白G(IgG)重链的分支点。
在一些实施方案下,内含子包含来自免疫球蛋白G(IgG)重链的3'剪接受体位点。
在一些实施方案中,内含子包含SEQ ID NO: 5的核苷酸序列。在一些实施方案中,内含子包含与SEQ ID NO: 5的核苷酸序列在SEQ ID NO: 5的全长上有至少80%、82%、85%、87%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
选择标志物
在一些实施方案中,多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物进一步包含核苷酸序列,所述核苷酸序列包含一个或多个选择标志物,由其组成或基本上由其组成。在一些实施方案中,选择标志物是细菌可选择标志物。在一些实施方案中,选择标志物是抗生素抗性基因。抗生素抗性基因的示例包括但不限于β-内酰胺酶、卡那霉素抗性基因、来自Tn5的neo基因、来自大肠杆菌基因组的突变体FabI基因和URA3(来自酵母的乳清酸核苷-5'磷酸脱羧酶)。在一些实施方案中,抗生素抗性基因是β-内酰胺酶基因。在一些实施方案中,抗生素抗性基因是卡那霉素抗性基因。
多腺苷酸化信号
在一些实施方案中,多核苷酸、质粒、病毒载体、载体系统、病毒包装系统、细胞和组合物进一步包含核苷酸序列,所述核苷酸序列包含一个或多个多腺苷酸化(polyA)信号,由其组成或基本上由其组成。在一些实施方案中,polyA信号是人工polyA信号。
在一些实施方案中,polyA信号包含SEQ ID NO: 7的核苷酸序列。在一些实施方案中,polyA信号包含与SEQ ID NO: 7的核苷酸序列在SEQ ID NO: 7的全长上有至少80%、82%、85%、87%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
表达盒和包装系统
本文进一步公开了腺相关病毒(AAV)表达盒。在一些实施方案中,AAV表达盒包含:(a)第一末端反向重复序列(ITR),其中第一ITR包含任何本文公开的ITR;(b)任何本文公开的5'hDYSF多核苷酸;以及(c)第二ITR,其中第二ITR包含任何本文公开的ITR,其中(b)的5'hYDSYF多核苷酸的侧翼为(a)和(c)的第一和第二ITR。在一些实施方案中,包含任何本文公开的5'hDYSF多核苷酸的AAV表达盒被称为5'hDYSF AAV表达盒。
本文进一步公开了腺相关病毒(AAV)质粒。在一些实施方案中,AAV表达盒包含(a)第一末端反向重复序列(ITR),其中第一ITR包含任何本文公开的ITR;(b)任何本文公开的3'hDYSF多核苷酸;以及(c)第二ITR,其中第二ITR包含任何本文公开的ITR,其中(b)的3'hYDSYF多核苷酸的侧翼为(a)和(c)的第一和第二ITR。在一些实施方案中,包含任何本文公开的3'hDYSF多核苷酸的AAV表达盒被称为3'hDYSF AAV表达盒。
在一些实施方案中,腺相关病毒(AAV)表达盒包含:(a)第一末端反向重复序列(ITR);(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸序列,其中所述多核苷酸序列由以下序列组成:(i)SEQ ID NO: 1的核苷酸序列;(ii)与SEQ ID NO: 1的核苷酸序列在SEQ ID NO:1的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;(iii)SEQ ID NO: 13的核苷酸序列;(iv)与SEQ ID NO: 13的核苷酸序列在SEQ ID NO: 13的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;(v)编码hDYSF蛋白的核苷酸序列,其中hDYSF蛋白由SEQ ID NO:9的氨基酸序列组成;或者(vi)与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;以及(c)第二ITR,其中多核苷酸序列的侧翼为第一和第二ITR。在一些实施方案中,任何本文公开的AAV表达盒进一步包含一个或多个另外的多核苷酸序列,所述多核苷酸序列包含启动子、内含子、选择标志物或复制原点(ORI)。在一些实施方案中,AAV表达盒包含SEQ ID NO:6的核苷酸序列。在一些实施方案中,AAV表达盒包含与SEQID NO: 6的核苷酸序列在SEQ ID NO: 6的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,AAV表达盒包含SEQ ID NO: 15的核苷酸序列。在一些实施方案中,AAV表达盒包含与SEQ ID NO: 15的核苷酸序列在SEQ ID NO: 15的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,AAV表达盒进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。在一些实施方案中,AAV表达盒不包含除末端反向重复序列(ITR)以外的AAV序列。在一些实施方案中,AAV表达盒不包含除末端反向重复序列(ITR)以外的病毒序列。
在一些实施方案中,腺相关病毒(AAV)表达盒包括:(a)第一末端反向重复序列(ITR);(b)编码人dysferlin蛋白的片段的多核苷酸序列,其中所述多核苷酸序列由以下序列组成:(i)SEQ ID NO: 2的核苷酸序列;(ii)与SEQ ID NO: 2的核苷酸序列在SEQ ID NO:2的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;(iii)SEQ ID NO: 14的核苷酸序列;(ii)与SEQ ID NO: 14的核苷酸序列在SEQ ID NO: 14的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列;(v)编码hDYSF蛋白的多核苷酸序列,其中hDYSF蛋白由SEQ ID NO:10的氨基酸序列组成;或者(vi)与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多核苷酸序列;以及(c)第二ITR,其中多核苷酸序列的侧翼是第一和第二ITR。在一些实施方案中,AAV表达盒包含SEQ ID NO:8的核苷酸序列。在一些实施方案中,AAV表达盒包含与SEQ ID NO: 8的核苷酸序列在SEQ ID NO: 8的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,AAV表达盒包含SEQ ID NO: 16的核苷酸序列。在一些实施方案中,AAV表达盒包含与SEQ ID NO: 16的核苷酸序列在SEQ ID NO: 16的全长上有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,AAV表达盒进一步包含一个或多个多核苷酸序列,所述多核苷酸序列包含选择标志物、复制原点(ORI)、非翻译区(UTR)或多腺苷酸化(polyA)信号。
本文进一步公开了腺相关病毒(AAV)包装系统。在一些实施方案中,AAV包装系统包含:(a)任何本文公开的5'hDYSF AAV表达盒;(b)腺病毒辅助质粒;以及(c)rep-cap质粒。在一些实施方案中,腺病毒辅助质粒包含来自腺病毒的一个或多个基因。在一些实施方案中,来自腺病毒的一个或多个基因介导AAV的复制。在一些实施方案中,来自腺病毒的一个或多个基因选自E4、E2a和VA。在一些实施方案中,rep-cap质粒包含一个或多个编码腺相关病毒rep和cap基因的多核苷酸。在一些实施方案中,rep基因编码选自Rep78、Rep68、Rep62和Rep40的生命周期蛋白的一种或多种。在一些实施方案中,cap基因编码选自VP1、VP2和VP3的衣壳蛋白的一种或多种。在一些实施方案中,5'hDYSF AAV表达盒包含一个或多个ITR。在一些实施方案中,ITR是AAV ITR。在一些实施方案中,AAV ITR的血清型与AAV衣壳蛋白的血清型相同。在一些实施方案中,AAV ITR的血清型与AAV衣壳蛋白的血清型不同。在一些实施方案中,AAV rep基因的血清型与AAV衣壳蛋白的血清型相同。在一些实施方案中,AAV rep基因的血清型与AAV衣壳蛋白的血清型不同。在一些实施方案中,包含任何本文公开的5'hDYSF AAV表达盒的AAV包装系统被称为5'hDYSF AAV包装系统。
在一些实施方案中,AAV包装系统包含:(a)任何本文公开的3'hDYSF AAV表达盒;(b)腺病毒辅助质粒;以及(c)rep-cap质粒。在一些实施方案中,腺病毒辅助质粒包括来自腺病毒的一个或多个基因。在一些实施方案中,来自腺病毒的一个或多个基因介导AAV的复制。在一些实施方案中,来自腺病毒的一个或多个基因选自E4、E2a和VA。在一些实施方案中,rep-cap质粒包含一个或多个编码腺相关病毒rep和cap基因的多核苷酸。在一些实施方案中,rep基因编码选自Rep78、Rep68、Rep62和Rep40的生命周期蛋白的一种或多种。在一些实施方案中,cap基因编码选自VP1、VP2和VP3的衣壳蛋白的一种或多种。在一些实施方案中,3'hDYSF AAV表达盒包含一个或多个ITR。在一些实施方案中,ITR是AAV ITR。在一些实施方案中,AAV ITR的血清型与AAV衣壳蛋白的血清型相同。在一些实施方案中,AAV ITR的血清型与AAV衣壳蛋白的血清型不同。在一些实施方案中,AAV rep基因的血清型与AAV衣壳蛋白的血清型相同。在一些实施方案中,AAV rep基因的血清型与AAV衣壳蛋白的血清型不同。在一些实施方案中,包含任何本文公开的3'hDYSF AAV表达盒的AAV包装系统被称为3'hDYSF AAV包装系统。
在一些实施方案中,腺相关病毒包装系统包含:(a)任何本文公开的5'hDYSF AAV表达盒;以及(b)腺病毒辅助质粒。在一些实施方案中,腺病毒辅助质粒包含来自腺病毒的一个或多个基因。在一些实施方案中,来自腺病毒的一个或多个基因介导AAV的复制。在一些实施方案中,来自腺病毒的一个或多个基因选自E4、E2a和VA。
在一些实施方案中,腺相关病毒包装系统包括:(a)任何本文公开的3'hDYSF AAV表达盒;以及(b)腺病毒辅助质粒。在一些实施方案中,腺病毒辅助质粒包含来自腺病毒的一个或多个基因。在一些实施方案中,来自腺病毒的一个或多个基因介导AAV的复制。在一些实施方案中,来自腺病毒的一个或多个基因选自E4、E2a和VA。
病毒载体
本文进一步公开了腺相关病毒(AAV)载体(例如AAV病毒或AAV颗粒)。在一些实施方案中,AAV载体包括任何本文公开的5'hDYSF多核苷酸,由其组成或基本上由其组成。在一些实施方案中,包含任何本文公开的5'hDYSF多核苷酸的AAV载体被称为5'hDYSF AAV载体。
在一些实施方案中,5'hDYSF AAV载体包含本文公开的任何5'hDYSF AAV表达盒。
在一些实施方案中,AAV载体包含任何本文公开的3' hDYSF多核苷酸,由其组成或基本上由其组成。在一些实施方案中,包含任何本文公开的3'hDYSF多核苷酸的AAV载体被称为3'hDYSF AAV载体。
在一些实施方案中,3'hDYSF AAV载体包含任何本文公开的3'hDYSF AAV表达盒。
在一些实施方案中,AAV载体是血清型1、2、3、4、5、6、7、8、9、10、11、12、13、rh.10、rh.20或rh.74的AAV。在一些实施方案中,AAV载体是血清型rh.74的AAV。在一些实施方案中,AAV载体不是血清型5的AAV。
本文进一步公开了双腺相关病毒(AAV)载体系统,其包含两个或更多个本文公开的AAV载体。在一些实施方案中,双AAV载体系统包含:(a)第一AAV载体,其中第一AAV载体包含任何本文公开的5'hDYSF多核苷酸;以及(b)第二AAV载体,其中第二AAV载体包含任何本文公开的3'hDYSF多核苷酸。
在一些实施方案中,双AAV载体系统包含:(a)第一AAV载体,其中第一AAV载体包含任何本文公开的5'hDYSF AAV载体,由其组成或基本上由其组成;以及(b)第二AAV载体,其中第二AAV载体包含任何本文公开的3'hDYSF AAV载体,由其组成或基本上由其组成;由其组成或基本上由其组成。
组合物
本文进一步公开了包含任何本文公开的5'hDYSF多核苷酸、由其组成或基本上由其组成的组合物。本文进一步公开了包含任何本文公开的3'hDYSF多核苷酸、由其组成或基本上由其组成的组合物。本文进一步公开了包含任何本文公开的5'hDYSF质粒、由其组成或基本上由其组成的组合物。本文进一步公开了包含任何本文公开的3'hDYSF质粒、由其组成或基本上由其组成的组合物。本文进一步公开了包含任何本文公开的双AAV载体系统、由其组成或基本上由其组成的组合物。本文进一步公开了包含任何本文公开的AAV载体、由其组成或基本上由其组成的组合物。
本文进一步公开了包含以下的组合物:(a)重组腺相关病毒(rAAV)载体,其中rAAV载体包含任何本文公开的5' hDYSF多核苷酸,由其组成或基本上由其组成;以及(b)药学上可接受的载体、稀释剂、赋形剂或佐剂;由其组成或基本上由其组成。
本文进一步公开了包含以下的组合物:(a)重组腺相关病毒(rAAV)载体,其中rAAV包含任何本文公开的3' hDYSF多核苷酸,由其组成或基本上由其组成;以及(b)药学上可接受的载体、稀释剂、赋形剂或佐剂;由其组成或基本上由其组成。
本文进一步公开了包含以下的组合物:(a)第一重组腺相关病毒(rAAV),其中第一rAAV包含任何本文公开的5' hDYSF多核苷酸,由其组成或基本上由其组成;以及(b)第二重组腺相关病毒(rAAV),其中第二rAAV包含任何本文公开的3' hDYSF多核苷酸,由其组成或基本上由其组成;由其组成或基本上由其组成。
本文进一步公开了包含以下组合物:(a)第一腺相关病毒(AAV)颗粒,其中第一AAV颗粒包括任何本文公开的5'hDYSF AAV载体,由其组成或基本上由其组成;以及(b)第二腺相关病毒(AAV)颗粒,其中第二AAV颗粒包含任何本文公开的3'hDYSF AAV载体,由其组成或基本上由其组成;由其组成或基本上由其组成。
在一些实施方案中,任何本文公开的组合物进一步包含至少一种药学上可接受的载体、稀释剂、赋形剂或佐剂。可接受的载体、稀释剂和佐剂对接受者无毒且优选地在所使用的剂量和浓度下是惰性的,并包括缓冲剂和表面活性剂(例如普兰尼克(pluronic))。可接受的载体的示例包括但不限于磷酸盐缓冲盐水、防腐剂等。
药学上可接受的载体、稀释剂或赋形剂适合注射使用。适合注射使用的药学上可接受的载体、稀释剂或赋形剂的示例包括无菌水溶液或分散体以及用于临时制备无菌注射溶液或分散体的无菌粉末。在所有情况下的制剂必须是无菌的,而且必须是流动的以便易于注射的程度。它在制造和储存条件下必须是稳定的,并且必须防止微生物(例如细菌和真菌)的污染作用。载体可以是溶剂或分散介质,含有例如水、乙醇、多元醇(例如甘油、丙二醇、液体聚乙二醇等)、其适当的混合物和植物油。例如,可以通过使用涂层(例如卵磷脂)在分散体的情况下通过保持所需的颗粒大小以及使用表面活性剂来保持适当的流动性。防止微生物的作用可以通过各种抗菌剂和抗真菌剂(例如,对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞等)来实现。在许多情况下,其优选地包括等渗剂,例如,糖或氯化钠。通过使用延迟吸收剂(例如单硬脂酸铝和明胶)可以延长可注射的组合物的吸收时间。
无菌注射液通过将本文公开的多核苷酸、质粒、病毒载体或双载体系统按所需要的量加入适当的溶剂中,并按需要加入上述各种其他成分,然后进行过滤消毒来制备。一般来说,分散体通过将灭菌的活性成分加入无菌载体中来制备,该载体含有基本的分散介质和上面列举的所需的其他成分。在制备无菌注射液的无菌粉末的情况下,优选的制备方法是真空干燥和冷冻干燥技术,其从先前无菌过滤的溶液中产生活性成分的粉末和任何另外的所需成分。
产生AAV载体的方法
本文公开了产生腺相关病毒(AAV)载体(例如,病毒或病毒颗粒)的方法。产生AAV载体的方法在本领域是已知的。例如,这种方法在例如WO 01/83692中被公开,其内容并通过引用整体并入本文中。AAV产生的一般原则在例如Carter, Current Opinions in Biotechnology 1533-1539, 1992;和Muzyczka, Curr. Topics in Microbial. and Immunol. 158:97-129, 1992中总结,其中每篇文章都通过引用整体并入本文。产生AAV的各种方法描述于Ratschin et al., Mol. Cell. Biol. 4:2072, 1984;Hermonat et al., Proc. Natl. Acad. Sci. USA, 81:6466, 1984;Tratschin et al., Mo1. Cell. Biol.5:3251, 1985; McLaughlin et al., J. Virol., 62:1963, 1988;以及Lebkowski et al., Mol. Cell. Biol., 7:349, 1988;Samulski et al., J. Virol., 63:3822-3828,1989;美国专利申请第 5,173,414号;WO 95/13365以及对应的美国专利申请第5,658.776号;WO 95/13392;WO 96/17947;PCT/US98/18600;WO 97/09441 (PCT/US96/14423);WO 97/08298 (PCT/US96/13872);WO 97/21825 (PCT/US96/20777);WO 97/06243 (PCT/FR96/01064);WO 99/11764;Perrin et al., Vaccine 13:1244-1250, 1995;Paul et al., Human Gene Therapy 4:609-615, 1993;Clark et al., Gene Therapy 3:1124-1132,1996;美国专利申请第 5,786,211号;美国专利申请第 5,871,982号;以及美国专利申请第6,258,595号,其中每一项通过引用整体并入本文。
在一些实施方案中,产生腺相关病毒(AAV)载体的方法包含用任何本文公开的AAV包装系统转导细胞。在一些实施方案中,细胞是真核细胞。在一些实施方案中,细胞是哺乳动物细胞。在一些实施方案中,细胞是稳定地表达腺相关病毒rep和cap基因的重组细胞。在一些实施方案中,方法进一步包含培养该细胞以产生转导的细胞的群体。在一些实施方案中,方法进一步包含收集来自转导的细胞的群体的上清液。在一些实施方案中,方法进一步包含将上清液进行一个或多个纯化步骤以产生纯化的AAV载体样品,其中AAV载体样品基本上不含细胞碎片和蛋白质。替代地或另外地,方法进一步包含裂解转导的细胞的群体以产生细胞裂解液。在一些实施方案中,方法进一步包含将细胞裂解液进行一个或多个纯化步骤以产生纯化的AAV载体样品,其中AAV载体样品基本上不含细胞碎片和蛋白质。在一些实施方案中,纯化的AAV载体样品的纯度为至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%纯。
在一些实施方案中,生产腺相关病毒(AAV)载体的方法包含用任何本文公开的5'hDYSF AAV包装系统转导细胞。在一些实施方案中,细胞是真核细胞。在一些实施方案中,细胞是哺乳动物细胞。在一些实施方案中,细胞是稳定地表达腺相关病毒rep和cap基因的重组细胞。在一些实施方案中,方法进一步包含培养细胞以产生转导的细胞的群体。在一些实施方案中,方法进一步包含收集来自转导的细胞的群体的上清液。在一些实施方案中,方法进一步包括将上清液进行一个或多个纯化步骤以产生纯化的AAV载体样品,其中AAV载体样品基本上不含细胞碎片和蛋白质。替代地或另外地,方法进一步包含裂解转导的细胞的群体以产生细胞裂解液。在一些实施方案中,方法进一步包含将细胞裂解液进行一个或多个纯化步骤以产生纯化的AAV载体样品,其中AAV载体样品基本上不含细胞碎片和蛋白质。在一些实施方案中,纯化的AAV载体样品的纯度为至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%纯。
在一些实施方案中,产生腺相关病毒(AAV)载体的方法包括用任何本文公开的3'hDYSF AAV包装系统转导细胞。在一些实施方案中,细胞是真核细胞。在一些实施方案中,细胞是哺乳动物细胞。在一些实施方案中,细胞是稳定地表达腺相关病毒rep和cap基因的重组细胞。在一些实施方案中,方法进一步包含培养细胞以产生转导的细胞的群体。在一些实施方案中,方法进一步包含收集来自转导的细胞的群体的上清液。在一些实施方案中,方法进一步包含将上清液进行一个或多个纯化步骤以产生纯化的AAV载体样品,其中AAV载体样品基本上不含细胞碎片和蛋白质。替代地或另外地,方法进一步包括裂解转导的细胞的群体以产生细胞裂解液。在一些实施方案中,方法进一步包括将细胞裂解液进行一个或多个纯化步骤以产生纯化的AAV载体样品,其中AAV载体样品基本上不含细胞碎片和蛋白质。在一些实施方案中,纯化的AAV载体样品的纯度为至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%纯。
细胞
本文进一步公开了包含任何本文公开的5'hDYSF多核苷酸的细胞。细胞可以是原核细胞或真核细胞。真核细胞的非限制性示例包括哺乳动物,例如仓鼠、小鼠、大鼠、犬、卵巢或人类细胞。在一些实施方案中,用包含任何本文公开的5'hDYSF多核苷酸的质粒转染细胞。在一些实施方案中,用任何本文公开的5'hDYSF AAV表达盒转导细胞。在一些实施方案中,用任何本文公开的5' hDYSF AAV载体感染细胞。
本文进一步公开了包含任何本文公开的3'hDYSF多核苷酸的细胞。在一些实施方案中,用包含任何本文公开的3' hDYSF多核苷酸的质粒转染细胞。在一些实施方案中,用任何本文公开的3' hDYSF AAV表达盒转导细胞。在一些实施方案中,用任何本文公开的3'hDYSF AAV载体感染细胞。
本文公开的任何细胞可以是产生传染性rAAV的包装细胞。在一些实施方案中,包装细胞是稳定转化的癌细胞,例如HeLa细胞、293细胞和PerC.6细胞(同源的293系)。在另一个实施方案中,包装细胞是未转化的癌细胞的细胞,例如低传代293细胞(用腺病毒E1转化的人类胎儿肾细胞)、MRC-5细胞(人类胎儿成纤维细胞)、WI-38细胞(人类胎儿成纤维细胞)、Vero细胞(猴肾细胞)和FRhL-2细胞(恒河猴肺部细胞)。原核细胞的非限制性示例包括细菌细胞(例如,大肠杆菌)和古细菌细胞。本公开的细胞可以被用于产生细胞库,例如,用于非GMP目的登记细胞库(Accession Cell Banks,ACB)或GMP主细胞库(GMP Master CellBank,MCB)。在一个实施方案中,在生物反应器中培养用于生产之前,等份(aliquote)细胞从原始接种物扩增到更大体积。
治疗的方法
本文进一步公开了治疗dysferlin肌病的方法。在一些实施方案中,治疗dysferlin肌病的方法包含:向有此需要的对象施用(a)有效量的第一多核苷酸,其中所述第一多核苷酸包含任何本文公开的5'hDYSF多核苷酸,以及(b)有效量的第二多核苷酸,其中所述第二多核苷酸包含任何本文公开的3'hDYSF多核苷酸,由其组成或基本上由其组成。在一些实施方案中,第一多核苷酸通过口服、肠胃外(例如,肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如,尿道栓剂)或外用施用途径(例如凝胶、软膏、乳膏、气雾剂等)施用。在一些实施方案中,第一多核苷酸通过肌肉内或静脉内施用。在一些实施方案中,第二多核苷酸通过口服、肠胃外(例如,肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如,尿道栓剂)或外用施用途径(例如凝胶、软膏、乳膏、气雾剂等)施用。在一些实施方案中,第二多核苷酸通过肌肉内或静脉内施用。在一些实施方案中,第一和第二多核苷酸同时施用。在一些实施方案中,第一和第二多核苷酸按顺序施用。在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
在一些实施方案中,治疗dysferlin肌病的方法包含:向有此需要的对象施用(a)有效量的第一腺相关病毒(AAV)载体,其中第一AAV载体包含任何本文公开的5'hDYSF AAV载体,以及(b)有效量的第二腺相关病毒(AAV)载体,其中第二AAV载体包含任何本文公开的3' hDYSF AAV载体,由其组成或基本上由其组成。在一些实施方案中,第一AAV载体通过口服、肠胃外(例如,肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如,尿道栓剂)或外用施用途径(例如凝胶、软膏、乳膏、气雾剂等)施用。在一些实施方案中,第一AAV载体通过肌肉内或静脉内施用。在一些实施方案中,第二AAV载体通过口服、肠胃外(例如,肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如,尿道栓剂)或外用施用途径(例如凝胶、软膏、乳膏、气雾剂等)施用。在一些实施方案中,第二AAV载体通过肌肉内或静脉内施用。在一些实施方案中,第一和第二AAV载体同时施用。在一些实施方案中,第一和第二AAV载体按顺序施用。在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
在一些实施方案中,治疗dysferlin肌病的方法包含:向有此需要的对象施用(a)有效量的第一AAV表达盒,其中第一AAV表达盒包含任何本文公开的5' hDYSF AAV表达盒;以及(b)有效量的第二AAV表达盒,其中第二AAV表达盒包含任何本文公开的3' hDSYF AAV表达盒,由其组成或基本上由其组成。在一些实施方案中,第一AAV表达盒通过口服、肠胃外(例如,肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如,尿道栓剂)或外用施用途径(例如凝胶、软膏、乳膏、气雾剂等)施用。在一些实施方案中,第一AAV表达盒通过肌肉内或静脉内施用。在一些实施方案中,第二AAV表达盒通过口服、肠胃外(例如,肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如,尿道栓剂)或外用施用途径(例如凝胶、软膏、乳膏、气雾剂等)施用。在一些实施方案中,第二AAV表达盒通过肌肉内或静脉内施用。在一些实施方案中,第一和第二AAV表达盒同时施用。在一些实施方案中,第一和第二AAV表达盒按顺序施用。在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
在一些实施方案中,治疗dysferlin肌病的方法包含向有此需要的对象施用有效量的组合物,由其组成或基本上由其组成,所述组合物包含:(a)任何本文公开的5' hDYSF多核苷酸和任何本文公开的3' hDYSF多核苷酸;(b)任何本文公开的5' hDYSF AAV载体和任何本文公开的3' hDYSF AAV载体;(c)任何本文公开的5' hDYSF AAV表达盒和任何本文公开的3' hDYSF AAV表达盒;以及(d)任何本文公开的双AAV载体系统。在一些实施方案中,组合物通过口服、肠胃外(例如,肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如,尿道栓剂)或外用施用途径(例如,凝胶、软膏、乳膏、气雾剂等)施用。在一些实施方案中,组合物通过肌肉内或静脉内施用。在一些实施方案中,dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
本文进一步公开了任何重组多核苷酸、质粒、病毒载体、载体系统和组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用。本文公开了包含:(a)任何本文公开的5'hDYSF多核苷酸和任何本文公开的3'hDYSF多核苷酸;(b)任何本文公开的5'hDYSF AAV载体和任何本文公开的3' hDYSF AAV载体;(c)任何本文公开的5'hDYSF AAV表达盒和任何本文公开的3'hDYSF AAV表达盒;以及(d)(e)任何本文公开的双AAV载体系统的组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用。在一些实施方案中,组合物通过口服、肠胃外(例如肌肉内、腹膜内、静脉内、ICV、脑内注射或输液、皮下注射或植入)、经鼻的吸入喷雾、阴道、直肠、舌下、尿道(例如,尿道栓剂)或外用施用途径(例如凝胶、软膏、乳膏、气雾剂等)施用。在一些实施方案中,组合物通过肌肉内或静脉内施用。在一些实施方案中,dysferlin肌病是指肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
在本发明的方法中施用的AAV载体的滴度将取决于例如,特定的AAV、施用方式、治疗目标、个体和被靶向的细胞类型而不同并可以通过本领域的标准方法来确定。AAV的滴度范围从至少约1x106、约1x107、约1x108、约1x109、约1x1010、约1x1011、约1x1012、约1x1013至约1x1014或更多DNase抗性颗粒(DRP)每毫升(DRP/ml)。剂量也可以用病毒基因组的单位(vg)表示。例如,AAV的剂量可以从至少约1x106、约1x107、约1x108、约1x109、约1x1010、约1x1011、约1x1012、约2x1012、约3x1012、约4x1012、约5x1012、约6x1012、约7x1012、约8x1012、约9x1012、约1x1013至约1x1014病毒基因组。
AAV剂量可以通过多种方法确定,其中包括但不限于ELISA、评估逆转录酶的活性、FACS、northern印迹转导检测(例如半定量northern)、点印迹分析或PCR(例如qPCR)。众所周知,AAV剂量可以通过定量实时PCR(qPCR)测量AAV载体基因组来确定。这种qPCR方法克服了传统转导检测的不一致性或任意性结果。在PCR剂量测定的一个实施方案中,质粒DNA被用来作为校准标准品。质粒的形式会影响qPCR方法的剂量结果。在一个实施方案中,环形或超螺旋的DNA或质粒被用作定量标准品。
在一些实施方案中,剂量可以以vg/kg为单位表示,基于超螺旋DNA或质粒作为定量标准品。例如,AAV的剂量为约1x106-1x1016 vg/kg、约1x108-1x1015 vg/kg或约1x1010-1x1014 vg/kg,基于超螺旋DNA或质粒作为定量标准品。在另一个实施方案中,剂量为至少约1x106、约1x107、约1x108、约1x109、约1x1010、约1x1011、约1x1012、约2x1012、约4x1012、约6x1012、约8x1012、约1x1013、约2x1013、约2.4x1013、约3x1013、约4x1013、约5x1013、约6x1013、约7x1013、约8x1013、约9x1013、约1x1014、约1x1015或至少约1x1016 vg/kg。在一个实施方案中,剂量为至少2x1012、4x1012、6x1012、8x1012、1x1013、2x1013、2.4x1013、3x1013、4x1013、5x1013、6x1013、7x1013或8x1013 vg/kg,基于超螺旋DNA或质粒作为定量标准品。
在一些实施方案中,本文公开的方法包含每次注射施用1.5毫升的总体积中至少约1x106、约1x107、约1x108、约1x109、约1x1010、约1x1011、约1x1012、约2x1012、约3x1012、约4x1012、约5x1012、约6x1012、约7x1012、约8x1012、约9x1012、约1x1013 vg。在一些实施方案中,本文公开的方法包含施用至少约1x106、约1x107、约1x108、约1x109、约1x1010、约1x1011、约1x1012、约2x1012、约3x1012、约4x1012、约5x1012、约6x1012、约7x1012、约8x1012、约9x1012、约1x1013、约2x1013、约5x1013、约7x1013、约1x1014 vg的总每日剂量。确定包膜载体基因组滴度的一个示例性方法是使用定量PCR,例如描述于Pozsgai et al., Mol. Ther. 25(4):855-869, 2017中的方法,其内容通过引用整体并入本文。
在一些实施方案中,一天向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物至少1、2、3、4、5、6、7、8、9、或10次。在一些实施方案中,一周向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次。在一些实施方案中,一个月向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31次。在一些实施方案中,至少每1、2、3、4、5、6、7、8、9或10天向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物。在一些实施方案中,至少每1、2、3、4、5、6、7、8、9、10、11、12、13或14周向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物。在一些实施方案中,向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物至少1、2、3、4、5、6、7、8、9或10天的时间。在一些实施方案中,向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20周的时间。在一些实施方案中,向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物至少1、2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19或20个月的时间。
在一些实施方案中,本文公开的方法包括全身性地施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物。例如,全身性地施用是进入循环系统使得整个身体受到影响的施用。全身性施用包括肠道施用(例如通过胃肠道吸收),以及通过注射、输液或植入的肠胃外施用。
在一些实施方案中,本文公开的方法包含局部施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物。在一些实施方案中,本文公开的方法包含将任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物施用于一个或多个组织。在一些实施方案中,组织选自肌肉、上皮组织、结缔组织和神经组织。在一些实施方案中,该组织是肌肉组织。
在一些实施方案中,本文公开的方法包含将任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物施用于对象的脚。在一些实施方案中,本文公开的方法包含将任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物施用于对象的趾短伸肌(EDB)肌肉。
联合疗法也在本发明的考虑范围内。本文所用的联合疗法包括同时治疗和按顺序治疗。特别地考虑本发明的方法与标准医学治疗(例如皮质类固醇)的组合,以及与新型疗法的组合。
在一些实施方案中,本文公开的方法进一步包含在向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物之前或之后,检测对象中dysferlin基因的突变的是否存在。在一些实施方案中,检测dysferlin基因的突变的存在时,将任何本文所公开的多核苷酸、质粒、病毒载体、双载体系统或组合物施用于对象。示例性的dysferlin突变包括但不限于c.1392dupA、c.3035G>A (p.W1012X)、c.2858dupT、c.2779del G、c.5594delG、c.4201dupA、c.1795_1799dupTACT、c.3832C>T (p.Q1278X)、c.757C>T(p.R253W)、c.855+1delG、c.3126G>A (p.W1042X)、c.1663C>T (p.R555W)、c.610C>T(p.R204X)、c.3112C>T (p.R1038X)、c.1368C>G (p.C456W)、c.5713C>T (p.R1905X)、c.3826C>G (p.I1276V)、c.3843 +1G>A、c.4167+1G>C、c.2643+1G>A、c.797T>C (p.I266P)、c4876delG、c.3477C>A (p.Y1159X)、c.3137G>A (p.R1046H)、c.509C>A (p.A170E)、c.3967C>T (p.Q1323X)、3191_3196dupGAGGCG、c.3992G>T (p.R1331L)、c.3516_3517delTT、c.247delG、c.1180+11C>T、c896G>A (p.G299E)、c.5078G>A (p.R1693Q)、c.5979dupA、c.3348+1_3348+4delGTAT、c.5314_5318delAGCCC、以及c565C>G (p.L189V)。在某些情况下,dysferlin基因包含一个或多个突变,包括但不限于c.1392dupA、c.3035G>A(p.W1012X)、c.2858dupT、c.2779del G、c.5594delG、c.4201dupA、c.1795_1799dupTACT、c.3832C>T (p.Q1278X)、c.757C>T (p.R253W)、c.855+1delG、c.3126G>A (p.W1042X)、c.1663C>T (p.R555W)、c.610C>T (p.R204X)、c.3112C>T (p.R1038X)、c.1368C>G(p.C456W)、c.5713C>T (p.R1905X)、c.3826C>G (p.I1276V)、c.3843 +1G>A、c.4167+1G>C、c.2643+1G>A、c.797T>C (p.I266P)、c4876delG、c.3477C>A (p.Y1159X)、c.3137G>A(p.R1046H)、c.509C>A (p.A170E)、c.3967C>T (p.Q1323X)、3191_3196dupGAGGCG、c.3992G>T (p.R1331L), c.3516_3517delTT, c.247delG、c.1180+11C>T、c896G>A (p.G299E)、c.5078G>A (p.R1693Q)、c.5979dupA、c.3348+1_3348+4delGTAT、c.5314_5318delAGCCC、以及c565C>G (p.L189V)。
在一些实施方案中,本文公开的方法进一步包含在向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物之前或之后,检测对象中dysferlin蛋白的水平。在一些实施方案中,本文公开的方法进一步包含在向对象施用任何本文公开的多核苷酸、质粒、病毒载体、双载体系统或组合物后,检测对象中dysferlin蛋白的水平。在一些实施方案中,检测dysferlin的水平包括检测dysferlin基因的表达。检测dysferlin基因的表达可以包含定量dysferlin DNA或RNA水平。替代地或另外地,检测dysferlin蛋白的水平包含定量检测dysferlin蛋白的水平。在一些实施方案中,在对象的样品中检测dysferlin蛋白的水平。在一些实施方案中,样品是体液样品。体液样品的示例包括但不限于血液、尿液、汗液、唾液、粪便和滑液。在一些实施方案中,血液样品是血浆或血清样品。在某些情况下,方法进一步包含dysferlin DNA测序测试,例如来自Athena Diagnostics(CPT:81408(1))。
在一些实施方案中,本文公开的方法进一步包含修改施用于对象的任何多核苷酸、质粒、病毒载体、双载体系统或组合物的剂量或给药频率。在一些实施方案中,修改剂量或给药频率是基于dysferlin蛋白水平的检测。在一些实施方案中,当对象中的dysferlin蛋白水平与来自较早时间点(例如,在施用多核苷酸、质粒、病毒载体、双载体系统或组合物之前,或者在施用多核苷酸、质粒、病毒载体、双载体系统或组合物的初始剂量后但在施用多核苷酸、质粒、病毒载体、双载体系统或组合物的后续剂量之前)的对象中的dysferlin蛋白水平相比增加时,减少剂量或给药频率。
试剂盒
在又一个方面,提供了一种试剂盒,其包含:多核苷酸、多肽、载体、细胞和系统或组合物中的任何一种或多种以及使用说明,或基本上由其组成或进一步由其组成。在一个方面,多核苷酸、多肽、载体、细胞和系统或组合物中的任何一种或多种是可检测标记的标志物,或者进一步包含纯化的或可检测的标志物。在某些情况下,试剂盒包含a)第一多核苷酸,其中所述第一多核苷酸是本文所述的重组多核苷酸,以及第二多核苷酸,其中所述第二多核苷酸是本文所述的重组多核苷酸;或者b)第一腺相关病毒(AAV)载体,其中所述第一AAV载体是本文所述的AAV载体,以及第二腺相关病毒(AAV)载体,其中所述第二AAV载体是本文所述的AAV载体;或者c)本文所述的AAV双载体系统;或者d)本文所述的组合物;或者e)本文所述的细胞(例如,宿主细胞,任选地哺乳动物细胞);以及任选地使用说明。
实施例
实施例1:双AAV载体系统的产生
本实施例提供了产生本文公开的双AAV载体系统的示例性方法。在本实施例中,产生了双AAV载体,rAAVrh.74.MHCK7.DYSF.DV。rAAVrh.74.MHCK7.DYSF.DV是非复制的重组AAV,血清型rh74(AAVrh74)在肌肉特异性MHCK7启动子的控制下从双载体(DV)表达人dysferlin。双载体含有dysferlin cDNA序列的5'部分或3'部分,这些部分重叠了约1 kb以促进重组来产生全长的人dysferlin基因。含有人dysferlin cDNA的一部分的表达盒的侧翼是AAV2末端反向重复序列(ITR)(图1)。
为了构建rAAVrh.74.MHCK7.DYSF.DV,人dysferlin cDNA被分割成两个连接AAV的包装容量(<4.7kb)的构建体。5'载体(例如5'hDYSF AAV载体),pAAV.MHCK7.DYSF5'.PTG(PTG=启动子/转基因)含有肌肉特异性MHCK7启动子、嵌合内含子、共有Kozak序列和对应于Dysferlin氨基酸序列的氨基酸1-1113的DYSF cDNA的5'部分。3'载体(例如3'hDYSF AAV载体),pAAV.DYSF3'.POLYA,含有对应于Dysferlin氨基酸序列的氨基酸794-2080的DYSFcDNA的3'部分和携带多腺苷酸化信号的DYSF 3'UTR。5'hDYSF AAV载体和3'hDYSF AAV载体的表达盒的序列分别公开为SEQ ID NO: 6和8。
先前的研究已经验证了使用MHCK7启动子的心脏表达(Salva et al. Mol Ther 15, 320-329 (2007),其通过引用整体并入本文)和实现了骨骼肌、横膈肌和心肌的表达的AAVrh74(Sondergaard et al. Annals of clinical and Transl Neurology 2,256-270(2015),其通过引用整体并入本文)。5'hDYSF AAV载体和3'hDSYF AAV载体被衣壳化为单独的AAVrh.74病毒。AAVrh.74血清型的分子克隆来自恒河猴的淋巴结并已在Rodino-Klapacet al. Journal of Translational medicine 5, 45 (2007)中讨论,其通过引用整体并入本文。
5' hDYSF AAV载体(AAV载体质粒pAAV.MHCK7.DYSF5'.PTG)
使用AAV载体DNA质粒pAAV.MHCK7.DYSF5'.PTG产生第一重组单链AAV载体。通过将驱动人dysferlin部分cDNA序列(人cDNA,Genbank登录号 # NM_003494.3)的5'部分的MHCK7表达盒插入到载体骨架pAAV-CMV(Clontech)中构建质粒(质粒图见图2,具体序列信息见表1)。存在嵌合内含子且由人β-球蛋白基因的第一内含子的5'供体位点和内含子的分支点和3'剪接受体位点组成,该内含子位于免疫球蛋白基因重链可变区的前导区(leader)和主体之间。该载体中包括的唯一病毒序列是AAV2的末端反向重复序列,其是病毒DNA复制和包装rAAV载体基因组所需要的。两个ITR之间的序列是被衣壳化进AAVrh74病毒粒子中的DNA部分。
3'hDYSF AAV载体(AAV载体质粒pAAV.DYSF3'.POLY)
使用AAV载体DNA质粒pAAV.DYSF3'.POLYA产生第二重组单链AAV载体。通过将人dysferlin部分cDNA序列(人cDNA,Genbank 登录号# NM_003494.3)插入到载体骨架pAAV-CMV(Clontech)中构建质粒(质粒图见图3,具体序列信息见表2)。内源性的dysferlin 3'非翻译区和polyA信号序列被用于有效的转录终止。该载体中包括的唯一病毒序列是AAV2的末端反向重复序列,其是病毒DNA复制和包装rAAV载体基因组所需要的。两个ITR之间的序列被衣壳化进AAVrh74病毒粒子中的DNA部分。
AAV辅助质粒(pNLRep2-Caprh74)
由p5E18和pCLR3K构建亲本质粒pNLrep。(参见Bansal, D., et al. Defectivemembrane repair in dysferlin-deficient muscular dystrophy. Nature 423, 168-172 (2003),其通过引用整体并入本文)。p5E18基于pAAV/Ad。其含有AAV2 rep和cap基因,p5启动子从rep的5'端去除并放置在cap的3'端,导致p5和rep之间存在3 kb的间隔序列(具体序列信息见表3)。为了产生pCLR3K,人类胶原蛋白内含子通过PCR扩增,然后在1,052位克隆进pAd/AV。为了构建pNLrep,p5E18的BamHI/XbaI片段被替换为含有pCLR3k的3 kb胶原蛋白内含子的BamHI/XbaI片段。PCR扩增rh74 cap基因,并使用Swa I/Not I限制性位点将其克隆进pNLrep中AAV2 cap基因的位置而得到pNLRep2-Caprh74。AAV rh74衣壳基因的鉴定通过DNA质粒测序确定。
腺病毒辅助质粒(pHELP)
从Applied Viromics(Fremont, CA 94538)获得质粒pHELP,其大小为11,635 bp(具体序列信息见表4)。质粒含有对AAV复制很重要的腺病毒基因组的区域,即E2A、E4和VARNA(腺病毒E1功能由293细胞提供)。质粒基于pBluescript骨架并且还含有编码赋予对氨苄西林(10182-11042 bp)、细菌ColE1复制原点(9315-10167 bp)和f1单链DNA复制原点(11172-11627 bp)抗性的TEM-1ß-内酰胺酶基因的bla基因。质粒中的腺病毒序列仅占腺病毒基因组的~28%(9,280/35,938),且不含有对复制重要的顺式元件,例如末端反向重复序列。通过进行DNA质粒测序确认这3个腺病毒基因的鉴定。DNA分析显示与3个5型腺病毒基因区(GenBank登录号AF369965,其通过引用整体并入本文)有100%的同源性。
实施例2:使用双AAV载体系统制备病毒产品
使用优化的磷酸钙共沉淀方法用3种生产质粒((i)AAV载体质粒,例如5'hDYSFAAV载体或3'hDYSF AAV载体;(ii)腺病毒(Ad)辅助质粒;以及(iii)AAV辅助质粒)转染HEK293细胞。转染细胞包含制备含有AAV载体质粒、Ad辅助质粒、AAV辅助质粒和CaCl2的DNA/钙溶液,并与等体积的2X HEPES缓冲盐水混合以获得最佳沉淀物。然后将沉淀物加入到HEK293细胞中并进行孵育。孵育后在加入核酸酶的时候交换培养基。
实施例3:rAAVrh.74.MHCK7.DYSF.DV肌肉内递送的功效的确定
产生两个AAV表达盒,其包含MHCK7.DYSF盒的5'和3'部分,重叠序列~1 kb(参见图1)。质粒被包装进AAVrh.74载体。4周大的Dysf-/-小鼠用每种载体1x1011 vg处理,通过肌肉内注射入胫骨前肌,并在1个月时进行尸检。通过免疫染色(图4A)和蛋白质印迹(图4C)可以看到两种载体的递送后完整全长dysferlin表达。单独的任何一个载体的递送都没有异常的dysferlin表达(图4B,免疫染色,图4D,蛋白质印迹)。3222是全长对照。对表达dysferlin的肌肉纤维的数量进行定量,如表5所示。
开始评估胫骨前肌肌肉内注射后安全性的时间过程研究(表6)。也评估了蛋白质表达和载体生物分布。在1、3、6、9和12个月的终点,对动物进行了全面的尸检,并评估了dysferlin表达(图5A-5C(示出了1、3和6个月)、载体生物分布(表7)和肌肉和非目标器官的组织病理学。胫骨肌肉(TA)被注射。对每个动物用于病理学分析的组织包括:性腺、肝脏、心脏、肺、脾脏、肾脏、横膈肌、左(经处理的)和右胫骨前肌肉。没有发现任何问题。
肌肉内注射后,在注射的胫骨前肌中发现dysferlin的表达(图6)。静脉内递送后,骨骼肌和心肌中发现dysferlin的表达(图7A)。
对另外几组小鼠进行处理以确定膜修复的最小有效剂量。在8周大的129Dysf-/-小鼠的FDB中注射三种剂量的AAV载体(每组6只)。对照Dysf-/-组接受生理盐水,一组129WT小鼠作为品系特定的正常对照。如图8所示,AAVrh.74.DYSF.DV处理显示了剂量依赖性的膜再密封。平行表达研究表明,高剂量的结果是表达>50%的纤维转导。当对肌肉重量进行标准化处理时,该剂量相当于给胫骨前肌进行表达和安全研究的剂量(图4A-5C)。
rAAVrh.74.MHCK7.DYSF.DV的全身性递送
进行了一项剂量研究以测试双载体递送的全身性递送的可行性/有效性。基于该品系已确定的功能性MRI/MRS结果,BlaJ小鼠(AJ dysferlin缺陷小鼠与BL6小鼠回交)被用于研究。3组小鼠(n=每组6只)在6周龄时通过尾静脉注射生理盐水、2e12 vg总AAV.DYSF DV(8e13 vg/kg,基于超螺旋DNA或质粒为定量标准品)或6e12 vg总AAV.DYSF.DV(2.4e13 vg/kg,基于超螺旋DNA或质粒为定量标准品)进行处理。在3个月时进行终点分析,包括横膈肌生理学、FDB中的膜修复测定,以及全面的尸检以量化dysferlin表达和评估组织病理学4。
在4个月的研究终点进行了全面的尸检。对横膈肌进行力量测量,对FDB肌肉进行膜修复的恢复测试,并收获肌肉和器官用于表达、载体生物分布和组织病理学。在高剂量下,dysferlin在所有肌肉中广泛表达(图7A和7B),而低剂量有低水平的可变的表达。在20周时,BlaJ在组织学上有非常轻微的表型。与对照组相比,作为再生标志物的中心核有显著增加。在高剂量时经处理的小鼠显示出中心核的显著减少(图7B)。受影响最严重的肌肉,腰肌在高剂量(6e12 vg)处理后表现出纤维化和炎症的减少(图9)。横膈肌的力量缺陷在高和低剂量下都得到了恢复(图10A),并且在FDB肌肉的膜修复中存在剂量依赖性反应(图10B)。
实施例4:通过NHP中AAV5和Aavrh.74.Mhck7.Dysf.Dv递送全长Dysferlin表达的安全性和功效
方法:我们用AAV.MHCK7.DYSF.FLAG通过肌肉内注射处理4个NHP。2个NHP用AAV5.MHCK7.DYSF处理,2个用AAVrh.74.mhck7.dysf.flag处理。与我们的临床试验设计相呼应,一只动物在3个月时被分析,两只在6个月时被分析。动物接受了基线化学和免疫学研究,包括ELISpot分析,以测量针对AAV5和rh.74 衣壳和dysferlin(图11A-11D)和抗AAV Ab滴度(表9)的T细胞。
用于刺激PBMC的肽池(pool)被设计成15个氨基酸长,重叠10个氨基酸以捕获所有可能的抗原表位。与肽发生反应的细胞释放干扰素-γ,通过ELISpot检测定量为斑点。以50个斑点/1x106个细胞为阳性反应阈值计算每百万个细胞中的斑点。没有观察到持续的免疫反应。所有动物在研究终点都有表达(图16A)。在整个研究过程中,每两周重复这些研究。在研究终点时对动物进行了全面的尸检,除了基因表达研究外,还包括重要器官组织的组织病理学和生物分布研究。
结果:没有发现可观察到的毒性。申请人使用不区分恒河猴和人类dysferlin的抗dysferlin抗体来证明dysferlin的过表达(图12A-12C)。还做了抗FLAG免疫染色以确认载体衍生的dysferlin表达(图13)。与未注射的对照相比,对于AAV5.DYSF注射的TA,肌肉显示了dysferlin的104.9%(3个月)和122.6%(6个月)过表达,而AAVrh.74.DYSF.DV注射的TA有122.0%(3个月)和115.2%(6个月)过表达。在NHP的组织水平上没有观察到毒性,缺乏炎症或肌肉纤维坏死。通过ELISpot免疫学检测没有显示出对衣壳或转基因的任何异常反应(图11A-11D)。此外,任何猕猴的全血计数和化学检测均未显示异常值。正如预期的那样,基因转移后抗AAV抗体滴度升高。终点抗AAVrh.74的滴度比抗AAV5的滴度低。
等效物
除非另有定义,否则本文使用的所有技术和科学术语都具有如本发明的所属领域中的普通技术人员中的一个通常所理解的相同的含义。
可以在缺少在本文没有具体公开的任何元素或限制的情况下,适当地实施本文说明性地描述的本技术。因此,例如,术语“包含”、“包括”、“含有”等应该被广泛且没有限制地理解。此外,本文采用的术语和表达已经被用作描述而非限制,在这些术语和表达的使用中,没有意图排除所示和描述的特征或其部分的任何等效物,但应该认识到,在本发明技术所要求保护的范围内各种变化都是可能的。
因此,应该理解的是,本文中提供的材料、方法和实施例是优选的方面的代表,其是示例性的,而且不旨在作为对本技术的范围的限制。
本文广泛地和一般地描述了本技术。落入一般性描述之内的较窄的种类和亚属分组中的每一个也都形成本技术的一部分。这包括了具有从该属中移除任何主题的附带条件或负面限制的本技术的一般性描述,无论被删除的材料是否在本文中被具体描述。
此外,在以马库什组描述本技术的特征或方面的情况中,本领域技术人员将认识到,还借此以该马库什组中的任何单独成员或成员的亚组描述了本技术。
在本文中提到的所有出版物、专利申请、专利和其他参考文献,其整体都以引用的方式明确地合并入本文中,至如同每个都单独地以引用的方式合并的相同程度。如有冲突,以本说明书(包括定义)为准。
在以下权利要求中阐述其其他。
序列表
<110> 国家儿童医院研究所
<120> DYSFERLIN双载体的基因疗法
<130> 195000-22F-CNP
<140>
<141>
<150> 63/024,338
<151> 2020-05-13
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 3340
<212> DNA
<213> 智人
<220>
<223> 5' hDYSF DNA片段v1
<400> 1
atgctgaggg tcttcatcct ctatgccgag aacgtccaca cacccgacac cgacatcagc 60
gatgcctact gctccgcggt gtttgcaggg gtgaagaaga gaaccaaagt catcaagaac 120
agcgtgaacc ctgtatggaa tgagggattt gaatgggacc tcaagggcat ccccctggac 180
cagggctctg agcttcatgt ggtggtcaaa gaccatgaga cgatggggag gaacaggttc 240
ctgggggaag ccaaggtccc actccgagag gtcctcgcca cccctagtct gtccgccagc 300
ttcaatgccc ccctgctgga caccaagaag cagcccacag gggcctcgct ggtcctgcag 360
gtgtcctaca caccgctgcc tggagctgtg cccctgttcc cgccccctac tcctctggag 420
ccctccccga ctctgcctga cctggatgta gtggcagaca caggaggaga ggaagacaca 480
gaggaccagg gactcactgg agatgaggcg gagccattcc tggatcaaag cggaggcccg 540
ggggctccca ccaccccaag gaaactacct tcacgtcctc cgccccacta ccccgggatc 600
aaaagaaagc gaagtgcgcc tacatctaga aagctgctgt cagacaaacc gcaggatttc 660
cagatcaggg tccaggtgat cgaggggcgc cagctgccgg gggtgaacat caagcctgtg 720
gtcaaggtta ccgctgcagg gcagaccaag cggacgcgga tccacaaggg aaacagccca 780
ctcttcaatg agactctttt cttcaacttg tttgactctc ctggggagct gtttgatgag 840
cccatcttta tcacggtggt agactctcgt tctctcagga cagatgctct cctcggggag 900
ttccggatgg acgtgggcac catttacaga gagccccggc acgcctatct caggaagtgg 960
ctgctgctct cagaccctga tgacttctct gctggggcca gaggctacct gaaaacaagc 1020
ctttgtgtgc tggggcctgg ggacgaagcg cctctggaga gaaaagaccc ctctgaagac 1080
aaggaggaca ttgaaagcaa cctgctccgg cccacaggcg tagccctgcg aggagcccac 1140
ttctgcctga aggtcttccg ggccgaggac ttgccgcaga tggacgatgc cgtgatggac 1200
aacgtgaaac agatctttgg cttcgagagt aacaagaaga acttggtgga cccctttgtg 1260
gaggtcagct ttgcggggaa aatgctgtgc agcaagatct tggagaagac ggccaaccct 1320
cagtggaacc agaacatcac actgcctgcc atgtttccct ccatgtgcga aaaaatgagg 1380
attcgtatca tagactggga ccgcctgact cacaatgaca tcgtggctac cacctacctg 1440
agtatgtcga aaatctctgc ccctggagga gaaatagaag aggagcctgc aggtgctgtc 1500
aagccttcga aagcctcaga cttggatgac tacctgggct tcctccccac ttttgggccc 1560
tgctacatca acctctatgg cagtcccaga gagttcacag gcttcccaga cccctacaca 1620
gagctcaaca caggcaaggg ggaaggtgtg gcttatcgtg gccggcttct gctctccctg 1680
gagaccaagc tggtggagca cagtgaacag aaggtggagg accttcctgc ggatgacatc 1740
ctccgggtgg agaagtacct taggaggcgc aagtactccc tgtttgcggc cttctactca 1800
gccaccatgc tgcaggatgt ggatgatgcc atccagtttg aggtcagcat cgggaactac 1860
gggaacaagt tcgacatgac ctgcctgccg ctggcctcca ccactcagta cagccgtgca 1920
gtctttgacg ggtgccacta ctactaccta ccctggggta acgtgaaacc tgtggtggtg 1980
ctgtcatcct actgggagga catcagccat agaatcgaga ctcagaacca gctgcttggg 2040
attgctgacc ggctggaagc tggcctggag caggtccacc tggccctgaa ggcgcagtgc 2100
tccacggagg acgtggactc gctggtggct cagctgacgg atgagctcat cgcaggctgc 2160
agccagcctc tgggtgacat ccatgagaca ccctctgcca cccacctgga ccagtacctg 2220
taccagctgc gcacccatca cctgagccaa atcactgagg ctgccctggc cctgaagctc 2280
ggccacagtg agctccctgc agctctggag caggcggagg actggctcct gcgtctgcgt 2340
gccctggcag aggagcccca gaacagcctg ccggacatcg tcatctggat gctgcaggga 2400
gacaagcgtg tggcatacca gcgggtgccc gcccaccaag tcctcttctc ccggcggggt 2460
gccaactact gtggcaagaa ttgtgggaag ctacagacaa tctttctgaa atatccgatg 2520
gagaaggtgc ctggcgcccg gatgccagtg cagatacggg tcaagctgtg gtttgggctc 2580
tctgtggatg agaaggagtt caaccagttt gctgagggga agctgtctgt ctttgctgaa 2640
acctatgaga acgagactaa gttggccctt gttgggaact ggggcacaac gggcctcacc 2700
taccccaagt tttctgacgt cacgggcaag atcaagctac ccaaggacag cttccgcccc 2760
tcggccggct ggacctgggc tggagattgg ttcgtgtgtc cggagaagac tctgctccat 2820
gacatggacg ccggtcacct gagcttcgtg gaagaggtgt ttgagaacca gacccggctt 2880
cccggaggcc agtggatcta catgagtgac aactacaccg atgtgaacgg ggagaaggtg 2940
cttcccaagg atgacattga gtgcccactg ggctggaagt gggaagatga ggaatggtcc 3000
acagacctca accgggctgt cgatgagcaa ggctgggagt atagcatcac catccccccg 3060
gagcggaagc cgaagcactg ggtccctgct gagaagatgt actacacaca ccgacggcgg 3120
cgctgggtgc gcctgcgcag gagggatctc agccaaatgg aagcactgaa aaggcacagg 3180
caggcggagg cggagggcga gggctgggag tacgcctctc tttttggctg gaagttccac 3240
ctcgagtacc gcaagacaga tgccttccgc cgccgccgct ggcgccgtcg catggagcca 3300
ctggagaaga cggggcctgc agctgtgttt gcccttgagg 3340
<210> 2
<211> 3866
<212> DNA
<213> 智人
<220>
<223> 3' hDYSF DNA片段v1
<400> 2
tcgtcatctg gatgctgcag ggagacaagc gtgtggcata ccagcgggtg cccgcccacc 60
aagtcctctt ctcccggcgg ggtgccaact actgtggcaa gaattgtggg aagctacaga 120
caatctttct gaaatatccg atggagaagg tgcctggcgc ccggatgcca gtgcagatac 180
gggtcaagct gtggtttggg ctctctgtgg atgagaagga gttcaaccag tttgctgagg 240
ggaagctgtc tgtctttgct gaaacctatg agaacgagac taagttggcc cttgttggga 300
actggggcac aacgggcctc acctacccca agttttctga cgtcacgggc aagatcaagc 360
tacccaagga cagcttccgc ccctcggccg gctggacctg ggctggagat tggttcgtgt 420
gtccggagaa gactctgctc catgacatgg acgccggtca cctgagcttc gtggaagagg 480
tgtttgagaa ccagacccgg cttcccggag gccagtggat ctacatgagt gacaactaca 540
ccgatgtgaa cggggagaag gtgcttccca aggatgacat tgagtgccca ctgggctgga 600
agtgggaaga tgaggaatgg tccacagacc tcaaccgggc tgtcgatgag caaggctggg 660
agtatagcat caccatcccc ccggagcgga agccgaagca ctgggtccct gctgagaaga 720
tgtactacac acaccgacgg cggcgctggg tgcgcctgcg caggagggat ctcagccaaa 780
tggaagcact gaaaaggcac aggcaggcgg aggcggaggg cgagggctgg gagtacgcct 840
ctctttttgg ctggaagttc cacctcgagt accgcaagac agatgccttc cgccgccgcc 900
gctggcgccg tcgcatggag ccactggaga agacggggcc tgcagctgtg tttgcccttg 960
agggggccct gggcggcgtg atggatgaca agagtgaaga ttccatgtcc gtctccacct 1020
tgagcttcgg tgtgaacaga cccacgattt cctgcatatt cgactatggg aaccgctacc 1080
atctacgctg ctacatgtac caggcccggg acctggctgc gatggacaag gactcttttt 1140
ctgatcccta tgccatcgtc tccttcctgc accagagcca gaagacggtg gtggtgaaga 1200
acacccttaa ccccacctgg gaccagacgc tcatcttcta cgagatcgag atctttggcg 1260
agccggccac agttgctgag caaccgccca gcattgtggt ggagctgtac gaccatgaca 1320
cttatggtgc agacgagttt atgggtcgct gcatctgtca accgagtctg gaacggatgc 1380
cacggctggc ctggttccca ctgacgaggg gcagccagcc gtcgggggag ctgctggcct 1440
cttttgagct catccagaga gagaagccgg ccatccacca tattcctggt tttgaggtgc 1500
aggagacatc aaggatcctg gatgagtctg aggacacaga cctgccctac ccaccacccc 1560
agagggaggc caacatctac atggttcctc agaacatcaa gccagcgctc cagcgtaccg 1620
ccatcgagat cctggcatgg ggcctgcgga acatgaagag ttaccagctg gccaacatct 1680
cctcccccag cctcgtggta gagtgtgggg gccagacggt gcagtcctgt gtcatcagga 1740
acctccggaa gaaccccaac tttgacatct gcaccctctt catggaagtg atgctgccca 1800
gggaggagct ctactgcccc cccatcaccg tcaaggtcat cgataaccgc cagtttggcc 1860
gccggcctgt ggtgggccag tgtaccatcc gctccctgga gagcttcctg tgtgacccct 1920
actcggcgga gagtccatcc ccacagggtg gcccagacga tgtgagccta ctcagtcctg 1980
gggaagacgt gctcatcgac attgatgaca aggagcccct catccccatc caggaggaag 2040
agttcatcga ttggtggagc aaattctttg cctccatagg ggagagggaa aagtgcggct 2100
cctacctgga gaaggatttt gacaccctga aggtctatga cacacagctg gagaatgtgg 2160
aggcctttga gggcctgtct gacttttgta acaccttcaa gctgtaccgg ggcaagacgc 2220
aggaggagac agaagatcca tctgtgattg gtgaatttaa gggcctcttc aaaatttatc 2280
ccctcccaga agacccagcc atccccatgc ccccaagaca gttccaccag ctggccgccc 2340
agggacccca ggagtgcttg gtccgtatct acattgtccg agcatttggc ctgcagccca 2400
aggaccccaa tggaaagtgt gatccttaca tcaagatctc catagggaag aaatcagtga 2460
gtgaccagga taactacatc ccctgcacgc tggagcccgt atttggaaag atgttcgagc 2520
tgacctgcac tctgcctctg gagaaggacc taaagatcac tctctatgac tatgacctcc 2580
tctccaagga cgaaaagatc ggtgagacgg tcgtcgacct ggagaacagg ctgctgtcca 2640
agtttggggc tcgctgtgga ctcccacaga cctactgtgt ctctggaccg aaccagtggc 2700
gggaccagct ccgcccctcc cagctcctcc acctcttctg ccagcagcat agagtcaagg 2760
cacctgtgta ccggacagac cgtgtaatgt ttcaggataa agaatattcc attgaagaga 2820
tagaggctgg caggatccca aacccacacc tgggcccagt ggaggagcgt ctggctctgc 2880
atgtgcttca gcagcagggc ctggtcccgg agcacgtgga gtcacggccc ctctacagcc 2940
ccctgcagcc agacatcgag caggggaagc tgcagatgtg ggtcgaccta tttccgaagg 3000
ccctggggcg gcctggacct cccttcaaca tcaccccacg gagagccaga aggtttttcc 3060
tgcgttgtat tatctggaat accagagatg tgatcctgga tgacctgagc ctcacggggg 3120
agaagatgag cgacatttat gtgaaaggtt ggatgattgg ctttgaagaa cacaagcaaa 3180
agacagacgt gcattatcgt tccctgggag gtgaaggcaa cttcaactgg aggttcattt 3240
tccccttcga ctacctgcca gctgagcaag tctgtaccat tgccaagaag gatgccttct 3300
ggaggctgga caagactgag agcaaaatcc cagcacgagt ggtgttccag atctgggaca 3360
atgacaagtt ctcctttgat gattttctgg gctccctgca gctcgatctc aaccgcatgc 3420
ccaagccagc caagacagcc aagaagtgct ccttggacca gctggatgat gctttccacc 3480
cagaatggtt tgtgtccctt tttgagcaga aaacagtgaa gggctggtgg ccctgtgtag 3540
cagaagaggg tgagaagaaa atactggcgg gcaagctgga aatgaccttg gagattgtag 3600
cagagagtga gcatgaggag cggcctgctg gccagggccg ggatgagccc aacatgaacc 3660
ctaagcttga ggacccaagg cgccccgaca cctccttcct gtggtttacc tccccataca 3720
agaccatgaa gttcatcctg tggcggcgtt tccggtgggc catcatcctc ttcatcatcc 3780
tcttcatcct gctgctgttc ctggccatct tcatctacgc cttcccgaac tatgctgcca 3840
tgaagctggt gaagcccttc agctga 3866
<210> 3
<211> 128
<212> DNA
<213> 腺相关病毒2
<220>
<223> ITR
<400> 3
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120
gggttcct 128
<210> 4
<211> 792
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> 启动子
<400> 4
aagcttgcat gtctaagcta gacccttcag attaaaaata actgaggtaa gggcctgggt 60
aggggaggtg gtgtgagacg ctcctgtctc tcctctatct gcccatcggc cctttgggga 120
ggaggaatgt gcccaaggac taaaaaaagg ccatggagcc agaggggcga gggcaacaga 180
cctttcatgg gcaaaccttg gggccctgct gtctagcatg ccccactacg ggtctaggct 240
gcccatgtaa ggaggcaagg cctggggaca cccgagatgc ctggttataa ttaacccaga 300
catgtggctg cccccccccc cccaacacct gctgcctcta aaaataaccc tgtccctggt 360
ggatcccctg catgcgaaga tcttcgaaca aggctgtggg ggactgaggg caggctgtaa 420
caggcttggg ggccagggct tatacgtgcc tgggactccc aaagtattac tgttccatgt 480
tcccggcgaa gggccagctg tcccccgcca gctagactca gcacttagtt taggaaccag 540
tgagcaagtc agcccttggg gcagcccata caaggccatg gggctgggca agctgcacgc 600
ctgggtccgg ggtgggcacg gtgcccgggc aacgagctga aagctcatct gctctcaggg 660
gcccctccct ggggacagcc cctcctggct agtcacaccc tgtaggctcc tctatataac 720
ccaggggcac aggggctgcc ctcattctac caccacctcc acagcacaga cagacactca 780
ggagcagcca gc 792
<210> 5
<211> 148
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> 内含子
<400> 5
aggtaagttt agtctttttg tcttttattt caggtcccgg atccggtggt ggtgcaaatc 60
aaagaactgc tcctcagtgg atgttgcctt tacttctagg cctgtacgga agtgttactt 120
ctgctctaaa agctgcggaa ttgtaccc 148
<210> 6
<211> 4689
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> DYSF F5'表达盒v1
<400> 6
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120
gggttccttg tagttaatga ttaacccgcc atgctctaga gtttaagctt gcatgtctaa 180
gctagaccct tcagattaaa aataactgag gtaagggcct gggtagggga ggtggtgtga 240
gacgctcctg tctctcctct atctgcccat cggccctttg gggaggagga atgtgcccaa 300
ggactaaaaa aaggccatgg agccagaggg gcgagggcaa cagacctttc atgggcaaac 360
cttggggccc tgctgtctag catgccccac tacgggtcta ggctgcccat gtaaggaggc 420
aaggcctggg gacacccgag atgcctggtt ataattaacc cagacatgtg gctgcccccc 480
cccccccaac acctgctgcc tctaaaaata accctgtccc tggtggatcc cctgcatgcg 540
aagatcttcg aacaaggctg tgggggactg agggcaggct gtaacaggct tgggggccag 600
ggcttatacg tgcctgggac tcccaaagta ttactgttcc atgttcccgg cgaagggcca 660
gctgtccccc gccagctaga ctcagcactt agtttaggaa ccagtgagca agtcagccct 720
tggggcagcc catacaaggc catggggctg ggcaagctgc acgcctgggt ccggggtggg 780
cacggtgccc gggcaacgag ctgaaagctc atctgctctc aggggcccct ccctggggac 840
agcccctcct ggctagtcac accctgtagg ctcctctata taacccaggg gcacaggggc 900
tgccctcatt ctaccaccac ctccacagca cagacagaca ctcaggagca gccagcggcg 960
cgcccaggta agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc 1020
aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt 1080
tacttctgct ctaaaagctg cggaattgta cccgcggccg cggctagcca ccatgctgag 1140
ggtcttcatc ctctatgccg agaacgtcca cacacccgac accgacatca gcgatgccta 1200
ctgctccgcg gtgtttgcag gggtgaagaa gagaaccaaa gtcatcaaga acagcgtgaa 1260
ccctgtatgg aatgagggat ttgaatggga cctcaagggc atccccctgg accagggctc 1320
tgagcttcat gtggtggtca aagaccatga gacgatgggg aggaacaggt tcctggggga 1380
agccaaggtc ccactccgag aggtcctcgc cacccctagt ctgtccgcca gcttcaatgc 1440
ccccctgctg gacaccaaga agcagcccac aggggcctcg ctggtcctgc aggtgtccta 1500
cacaccgctg cctggagctg tgcccctgtt cccgccccct actcctctgg agccctcccc 1560
gactctgcct gacctggatg tagtggcaga cacaggagga gaggaagaca cagaggacca 1620
gggactcact ggagatgagg cggagccatt cctggatcaa agcggaggcc cgggggctcc 1680
caccacccca aggaaactac cttcacgtcc tccgccccac taccccggga tcaaaagaaa 1740
gcgaagtgcg cctacatcta gaaagctgct gtcagacaaa ccgcaggatt tccagatcag 1800
ggtccaggtg atcgaggggc gccagctgcc gggggtgaac atcaagcctg tggtcaaggt 1860
taccgctgca gggcagacca agcggacgcg gatccacaag ggaaacagcc cactcttcaa 1920
tgagactctt ttcttcaact tgtttgactc tcctggggag ctgtttgatg agcccatctt 1980
tatcacggtg gtagactctc gttctctcag gacagatgct ctcctcgggg agttccggat 2040
ggacgtgggc accatttaca gagagccccg gcacgcctat ctcaggaagt ggctgctgct 2100
ctcagaccct gatgacttct ctgctggggc cagaggctac ctgaaaacaa gcctttgtgt 2160
gctggggcct ggggacgaag cgcctctgga gagaaaagac ccctctgaag acaaggagga 2220
cattgaaagc aacctgctcc ggcccacagg cgtagccctg cgaggagccc acttctgcct 2280
gaaggtcttc cgggccgagg acttgccgca gatggacgat gccgtgatgg acaacgtgaa 2340
acagatcttt ggcttcgaga gtaacaagaa gaacttggtg gacccctttg tggaggtcag 2400
ctttgcgggg aaaatgctgt gcagcaagat cttggagaag acggccaacc ctcagtggaa 2460
ccagaacatc acactgcctg ccatgtttcc ctccatgtgc gaaaaaatga ggattcgtat 2520
catagactgg gaccgcctga ctcacaatga catcgtggct accacctacc tgagtatgtc 2580
gaaaatctct gcccctggag gagaaataga agaggagcct gcaggtgctg tcaagccttc 2640
gaaagcctca gacttggatg actacctggg cttcctcccc acttttgggc cctgctacat 2700
caacctctat ggcagtccca gagagttcac aggcttccca gacccctaca cagagctcaa 2760
cacaggcaag ggggaaggtg tggcttatcg tggccggctt ctgctctccc tggagaccaa 2820
gctggtggag cacagtgaac agaaggtgga ggaccttcct gcggatgaca tcctccgggt 2880
ggagaagtac cttaggaggc gcaagtactc cctgtttgcg gccttctact cagccaccat 2940
gctgcaggat gtggatgatg ccatccagtt tgaggtcagc atcgggaact acgggaacaa 3000
gttcgacatg acctgcctgc cgctggcctc caccactcag tacagccgtg cagtctttga 3060
cgggtgccac tactactacc taccctgggg taacgtgaaa cctgtggtgg tgctgtcatc 3120
ctactgggag gacatcagcc atagaatcga gactcagaac cagctgcttg ggattgctga 3180
ccggctggaa gctggcctgg agcaggtcca cctggccctg aaggcgcagt gctccacgga 3240
ggacgtggac tcgctggtgg ctcagctgac ggatgagctc atcgcaggct gcagccagcc 3300
tctgggtgac atccatgaga caccctctgc cacccacctg gaccagtacc tgtaccagct 3360
gcgcacccat cacctgagcc aaatcactga ggctgccctg gccctgaagc tcggccacag 3420
tgagctccct gcagctctgg agcaggcgga ggactggctc ctgcgtctgc gtgccctggc 3480
agaggagccc cagaacagcc tgccggacat cgtcatctgg atgctgcagg gagacaagcg 3540
tgtggcatac cagcgggtgc ccgcccacca agtcctcttc tcccggcggg gtgccaacta 3600
ctgtggcaag aattgtggga agctacagac aatctttctg aaatatccga tggagaaggt 3660
gcctggcgcc cggatgccag tgcagatacg ggtcaagctg tggtttgggc tctctgtgga 3720
tgagaaggag ttcaaccagt ttgctgaggg gaagctgtct gtctttgctg aaacctatga 3780
gaacgagact aagttggccc ttgttgggaa ctggggcaca acgggcctca cctaccccaa 3840
gttttctgac gtcacgggca agatcaagct acccaaggac agcttccgcc cctcggccgg 3900
ctggacctgg gctggagatt ggttcgtgtg tccggagaag actctgctcc atgacatgga 3960
cgccggtcac ctgagcttcg tggaagaggt gtttgagaac cagacccggc ttcccggagg 4020
ccagtggatc tacatgagtg acaactacac cgatgtgaac ggggagaagg tgcttcccaa 4080
ggatgacatt gagtgcccac tgggctggaa gtgggaagat gaggaatggt ccacagacct 4140
caaccgggct gtcgatgagc aaggctggga gtatagcatc accatccccc cggagcggaa 4200
gccgaagcac tgggtccctg ctgagaagat gtactacaca caccgacggc ggcgctgggt 4260
gcgcctgcgc aggagggatc tcagccaaat ggaagcactg aaaaggcaca ggcaggcgga 4320
ggcggagggc gagggctggg agtacgcctc tctttttggc tggaagttcc acctcgagta 4380
ccgcaagaca gatgccttcc gccgccgccg ctggcgccgt cgcatggagc cactggagaa 4440
gacggggcct gcagctgtgt ttgcccttga gggcggccgc aataaaagat ctttattttc 4500
attagatctg tgtgttggtt ttttgtgtgt ctagagcatg gcgggttaat cattaactac 4560
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4620
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4680
cgagcgcgc 4689
<210> 7
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<223> PolyA信号
<400> 7
aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtg 49
<210> 8
<211> 4592
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> DYSF F3'表达盒v1
<400> 8
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120
gggttccttg tagttaatga ttaacccgcc atgctactta tctacgtagc catgctctgg 180
tcgactctag agttttcgtc atctggatgc tgcagggaga caagcgtgtg gcataccagc 240
gggtgcccgc ccaccaagtc ctcttctccc ggcggggtgc caactactgt ggcaagaatt 300
gtgggaagct acagacaatc tttctgaaat atccgatgga gaaggtgcct ggcgcccgga 360
tgccagtgca gatacgggtc aagctgtggt ttgggctctc tgtggatgag aaggagttca 420
accagtttgc tgaggggaag ctgtctgtct ttgctgaaac ctatgagaac gagactaagt 480
tggcccttgt tgggaactgg ggcacaacgg gcctcaccta ccccaagttt tctgacgtca 540
cgggcaagat caagctaccc aaggacagct tccgcccctc ggccggctgg acctgggctg 600
gagattggtt cgtgtgtccg gagaagactc tgctccatga catggacgcc ggtcacctga 660
gcttcgtgga agaggtgttt gagaaccaga cccggcttcc cggaggccag tggatctaca 720
tgagtgacaa ctacaccgat gtgaacgggg agaaggtgct tcccaaggat gacattgagt 780
gcccactggg ctggaagtgg gaagatgagg aatggtccac agacctcaac cgggctgtcg 840
atgagcaagg ctgggagtat agcatcacca tccccccgga gcggaagccg aagcactggg 900
tccctgctga gaagatgtac tacacacacc gacggcggcg ctgggtgcgc ctgcgcagga 960
gggatctcag ccaaatggaa gcactgaaaa ggcacaggca ggcggaggcg gagggcgagg 1020
gctgggagta cgcctctctt tttggctgga agttccacct cgagtaccgc aagacagatg 1080
ccttccgccg ccgccgctgg cgccgtcgca tggagccact ggagaagacg gggcctgcag 1140
ctgtgtttgc ccttgagggg gccctgggcg gcgtgatgga tgacaagagt gaagattcca 1200
tgtccgtctc caccttgagc ttcggtgtga acagacccac gatttcctgc atattcgact 1260
atgggaaccg ctaccatcta cgctgctaca tgtaccaggc ccgggacctg gctgcgatgg 1320
acaaggactc tttttctgat ccctatgcca tcgtctcctt cctgcaccag agccagaaga 1380
cggtggtggt gaagaacacc cttaacccca cctgggacca gacgctcatc ttctacgaga 1440
tcgagatctt tggcgagccg gccacagttg ctgagcaacc gcccagcatt gtggtggagc 1500
tgtacgacca tgacacttat ggtgcagacg agtttatggg tcgctgcatc tgtcaaccga 1560
gtctggaacg gatgccacgg ctggcctggt tcccactgac gaggggcagc cagccgtcgg 1620
gggagctgct ggcctctttt gagctcatcc agagagagaa gccggccatc caccatattc 1680
ctggttttga ggtgcaggag acatcaagga tcctggatga gtctgaggac acagacctgc 1740
cctacccacc accccagagg gaggccaaca tctacatggt tcctcagaac atcaagccag 1800
cgctccagcg taccgccatc gagatcctgg catggggcct gcggaacatg aagagttacc 1860
agctggccaa catctcctcc cccagcctcg tggtagagtg tgggggccag acggtgcagt 1920
cctgtgtcat caggaacctc cggaagaacc ccaactttga catctgcacc ctcttcatgg 1980
aagtgatgct gcccagggag gagctctact gcccccccat caccgtcaag gtcatcgata 2040
accgccagtt tggccgccgg cctgtggtgg gccagtgtac catccgctcc ctggagagct 2100
tcctgtgtga cccctactcg gcggagagtc catccccaca gggtggccca gacgatgtga 2160
gcctactcag tcctggggaa gacgtgctca tcgacattga tgacaaggag cccctcatcc 2220
ccatccagga ggaagagttc atcgattggt ggagcaaatt ctttgcctcc ataggggaga 2280
gggaaaagtg cggctcctac ctggagaagg attttgacac cctgaaggtc tatgacacac 2340
agctggagaa tgtggaggcc tttgagggcc tgtctgactt ttgtaacacc ttcaagctgt 2400
accggggcaa gacgcaggag gagacagaag atccatctgt gattggtgaa tttaagggcc 2460
tcttcaaaat ttatcccctc ccagaagacc cagccatccc catgccccca agacagttcc 2520
accagctggc cgcccaggga ccccaggagt gcttggtccg tatctacatt gtccgagcat 2580
ttggcctgca gcccaaggac cccaatggaa agtgtgatcc ttacatcaag atctccatag 2640
ggaagaaatc agtgagtgac caggataact acatcccctg cacgctggag cccgtatttg 2700
gaaagatgtt cgagctgacc tgcactctgc ctctggagaa ggacctaaag atcactctct 2760
atgactatga cctcctctcc aaggacgaaa agatcggtga gacggtcgtc gacctggaga 2820
acaggctgct gtccaagttt ggggctcgct gtggactccc acagacctac tgtgtctctg 2880
gaccgaacca gtggcgggac cagctccgcc cctcccagct cctccacctc ttctgccagc 2940
agcatagagt caaggcacct gtgtaccgga cagaccgtgt aatgtttcag gataaagaat 3000
attccattga agagatagag gctggcagga tcccaaaccc acacctgggc ccagtggagg 3060
agcgtctggc tctgcatgtg cttcagcagc agggcctggt cccggagcac gtggagtcac 3120
ggcccctcta cagccccctg cagccagaca tcgagcaggg gaagctgcag atgtgggtcg 3180
acctatttcc gaaggccctg gggcggcctg gacctccctt caacatcacc ccacggagag 3240
ccagaaggtt tttcctgcgt tgtattatct ggaataccag agatgtgatc ctggatgacc 3300
tgagcctcac gggggagaag atgagcgaca tttatgtgaa aggttggatg attggctttg 3360
aagaacacaa gcaaaagaca gacgtgcatt atcgttccct gggaggtgaa ggcaacttca 3420
actggaggtt cattttcccc ttcgactacc tgccagctga gcaagtctgt accattgcca 3480
agaaggatgc cttctggagg ctggacaaga ctgagagcaa aatcccagca cgagtggtgt 3540
tccagatctg ggacaatgac aagttctcct ttgatgattt tctgggctcc ctgcagctcg 3600
atctcaaccg catgcccaag ccagccaaga cagccaagaa gtgctccttg gaccagctgg 3660
atgatgcttt ccacccagaa tggtttgtgt ccctttttga gcagaaaaca gtgaagggct 3720
ggtggccctg tgtagcagaa gagggtgaga agaaaatact ggcgggcaag ctggaaatga 3780
ccttggagat tgtagcagag agtgagcatg aggagcggcc tgctggccag ggccgggatg 3840
agcccaacat gaaccctaag cttgaggacc caaggcgccc cgacacctcc ttcctgtggt 3900
ttacctcccc atacaagacc atgaagttca tcctgtggcg gcgtttccgg tgggccatca 3960
tcctcttcat catcctcttc atcctgctgc tgttcctggc catcttcatc tacgccttcc 4020
cgaactatgc tgccatgaag ctggtgaagc ccttcagctg aggactctcc tgccctgtag 4080
aaggggccgt ggggtcccct ccagcatggg actggcctgc ctcctccgcc cagctcggcg 4140
agctcctcca gacctcctag gcctgattgt cctgccaggg tgggcagaca gacagatgga 4200
ccggcccaca ctcccagagt tgctaacatg gagctctgag atcaccccac ttccatcatt 4260
tccttctccc ccaacccaac gcttttttgg atcagctcag acatatttca gtataaaaca 4320
gttggaacca caaaaaaaaa aaaaaaaagt cgacgcggcc gcaataaaag atctttattt 4380
tcattagatc tgtgtgttgg ttttttgtgt gtctagagca tggctacgta gataagtagc 4440
atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc 4500
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 4560
cccgggcggc ctcagtgagc gagcgagcgc gc 4592
<210> 9
<211> 1113
<212> PRT
<213> 智人
<220>
<223> 5' hDYSF 蛋白片段
<400> 9
Met Leu Arg Val Phe Ile Leu Tyr Ala Glu Asn Val His Thr Pro Asp
1 5 10 15
Thr Asp Ile Ser Asp Ala Tyr Cys Ser Ala Val Phe Ala Gly Val Lys
20 25 30
Lys Arg Thr Lys Val Ile Lys Asn Ser Val Asn Pro Val Trp Asn Glu
35 40 45
Gly Phe Glu Trp Asp Leu Lys Gly Ile Pro Leu Asp Gln Gly Ser Glu
50 55 60
Leu His Val Val Val Lys Asp His Glu Thr Met Gly Arg Asn Arg Phe
65 70 75 80
Leu Gly Glu Ala Lys Val Pro Leu Arg Glu Val Leu Ala Thr Pro Ser
85 90 95
Leu Ser Ala Ser Phe Asn Ala Pro Leu Leu Asp Thr Lys Lys Gln Pro
100 105 110
Thr Gly Ala Ser Leu Val Leu Gln Val Ser Tyr Thr Pro Leu Pro Gly
115 120 125
Ala Val Pro Leu Phe Pro Pro Pro Thr Pro Leu Glu Pro Ser Pro Thr
130 135 140
Leu Pro Asp Leu Asp Val Val Ala Asp Thr Gly Gly Glu Glu Asp Thr
145 150 155 160
Glu Asp Gln Gly Leu Thr Gly Asp Glu Ala Glu Pro Phe Leu Asp Gln
165 170 175
Ser Gly Gly Pro Gly Ala Pro Thr Thr Pro Arg Lys Leu Pro Ser Arg
180 185 190
Pro Pro Pro His Tyr Pro Gly Ile Lys Arg Lys Arg Ser Ala Pro Thr
195 200 205
Ser Arg Lys Leu Leu Ser Asp Lys Pro Gln Asp Phe Gln Ile Arg Val
210 215 220
Gln Val Ile Glu Gly Arg Gln Leu Pro Gly Val Asn Ile Lys Pro Val
225 230 235 240
Val Lys Val Thr Ala Ala Gly Gln Thr Lys Arg Thr Arg Ile His Lys
245 250 255
Gly Asn Ser Pro Leu Phe Asn Glu Thr Leu Phe Phe Asn Leu Phe Asp
260 265 270
Ser Pro Gly Glu Leu Phe Asp Glu Pro Ile Phe Ile Thr Val Val Asp
275 280 285
Ser Arg Ser Leu Arg Thr Asp Ala Leu Leu Gly Glu Phe Arg Met Asp
290 295 300
Val Gly Thr Ile Tyr Arg Glu Pro Arg His Ala Tyr Leu Arg Lys Trp
305 310 315 320
Leu Leu Leu Ser Asp Pro Asp Asp Phe Ser Ala Gly Ala Arg Gly Tyr
325 330 335
Leu Lys Thr Ser Leu Cys Val Leu Gly Pro Gly Asp Glu Ala Pro Leu
340 345 350
Glu Arg Lys Asp Pro Ser Glu Asp Lys Glu Asp Ile Glu Ser Asn Leu
355 360 365
Leu Arg Pro Thr Gly Val Ala Leu Arg Gly Ala His Phe Cys Leu Lys
370 375 380
Val Phe Arg Ala Glu Asp Leu Pro Gln Met Asp Asp Ala Val Met Asp
385 390 395 400
Asn Val Lys Gln Ile Phe Gly Phe Glu Ser Asn Lys Lys Asn Leu Val
405 410 415
Asp Pro Phe Val Glu Val Ser Phe Ala Gly Lys Met Leu Cys Ser Lys
420 425 430
Ile Leu Glu Lys Thr Ala Asn Pro Gln Trp Asn Gln Asn Ile Thr Leu
435 440 445
Pro Ala Met Phe Pro Ser Met Cys Glu Lys Met Arg Ile Arg Ile Ile
450 455 460
Asp Trp Asp Arg Leu Thr His Asn Asp Ile Val Ala Thr Thr Tyr Leu
465 470 475 480
Ser Met Ser Lys Ile Ser Ala Pro Gly Gly Glu Ile Glu Glu Glu Pro
485 490 495
Ala Gly Ala Val Lys Pro Ser Lys Ala Ser Asp Leu Asp Asp Tyr Leu
500 505 510
Gly Phe Leu Pro Thr Phe Gly Pro Cys Tyr Ile Asn Leu Tyr Gly Ser
515 520 525
Pro Arg Glu Phe Thr Gly Phe Pro Asp Pro Tyr Thr Glu Leu Asn Thr
530 535 540
Gly Lys Gly Glu Gly Val Ala Tyr Arg Gly Arg Leu Leu Leu Ser Leu
545 550 555 560
Glu Thr Lys Leu Val Glu His Ser Glu Gln Lys Val Glu Asp Leu Pro
565 570 575
Ala Asp Asp Ile Leu Arg Val Glu Lys Tyr Leu Arg Arg Arg Lys Tyr
580 585 590
Ser Leu Phe Ala Ala Phe Tyr Ser Ala Thr Met Leu Gln Asp Val Asp
595 600 605
Asp Ala Ile Gln Phe Glu Val Ser Ile Gly Asn Tyr Gly Asn Lys Phe
610 615 620
Asp Met Thr Cys Leu Pro Leu Ala Ser Thr Thr Gln Tyr Ser Arg Ala
625 630 635 640
Val Phe Asp Gly Cys His Tyr Tyr Tyr Leu Pro Trp Gly Asn Val Lys
645 650 655
Pro Val Val Val Leu Ser Ser Tyr Trp Glu Asp Ile Ser His Arg Ile
660 665 670
Glu Thr Gln Asn Gln Leu Leu Gly Ile Ala Asp Arg Leu Glu Ala Gly
675 680 685
Leu Glu Gln Val His Leu Ala Leu Lys Ala Gln Cys Ser Thr Glu Asp
690 695 700
Val Asp Ser Leu Val Ala Gln Leu Thr Asp Glu Leu Ile Ala Gly Cys
705 710 715 720
Ser Gln Pro Leu Gly Asp Ile His Glu Thr Pro Ser Ala Thr His Leu
725 730 735
Asp Gln Tyr Leu Tyr Gln Leu Arg Thr His His Leu Ser Gln Ile Thr
740 745 750
Glu Ala Ala Leu Ala Leu Lys Leu Gly His Ser Glu Leu Pro Ala Ala
755 760 765
Leu Glu Gln Ala Glu Asp Trp Leu Leu Arg Leu Arg Ala Leu Ala Glu
770 775 780
Glu Pro Gln Asn Ser Leu Pro Asp Ile Val Ile Trp Met Leu Gln Gly
785 790 795 800
Asp Lys Arg Val Ala Tyr Gln Arg Val Pro Ala His Gln Val Leu Phe
805 810 815
Ser Arg Arg Gly Ala Asn Tyr Cys Gly Lys Asn Cys Gly Lys Leu Gln
820 825 830
Thr Ile Phe Leu Lys Tyr Pro Met Glu Lys Val Pro Gly Ala Arg Met
835 840 845
Pro Val Gln Ile Arg Val Lys Leu Trp Phe Gly Leu Ser Val Asp Glu
850 855 860
Lys Glu Phe Asn Gln Phe Ala Glu Gly Lys Leu Ser Val Phe Ala Glu
865 870 875 880
Thr Tyr Glu Asn Glu Thr Lys Leu Ala Leu Val Gly Asn Trp Gly Thr
885 890 895
Thr Gly Leu Thr Tyr Pro Lys Phe Ser Asp Val Thr Gly Lys Ile Lys
900 905 910
Leu Pro Lys Asp Ser Phe Arg Pro Ser Ala Gly Trp Thr Trp Ala Gly
915 920 925
Asp Trp Phe Val Cys Pro Glu Lys Thr Leu Leu His Asp Met Asp Ala
930 935 940
Gly His Leu Ser Phe Val Glu Glu Val Phe Glu Asn Gln Thr Arg Leu
945 950 955 960
Pro Gly Gly Gln Trp Ile Tyr Met Ser Asp Asn Tyr Thr Asp Val Asn
965 970 975
Gly Glu Lys Val Leu Pro Lys Asp Asp Ile Glu Cys Pro Leu Gly Trp
980 985 990
Lys Trp Glu Asp Glu Glu Trp Ser Thr Asp Leu Asn Arg Ala Val Asp
995 1000 1005
Glu Gln Gly Trp Glu Tyr Ser Ile Thr Ile Pro Pro Glu Arg Lys
1010 1015 1020
Pro Lys His Trp Val Pro Ala Glu Lys Met Tyr Tyr Thr His Arg
1025 1030 1035
Arg Arg Arg Trp Val Arg Leu Arg Arg Arg Asp Leu Ser Gln Met
1040 1045 1050
Glu Ala Leu Lys Arg His Arg Gln Ala Glu Ala Glu Gly Glu Gly
1055 1060 1065
Trp Glu Tyr Ala Ser Leu Phe Gly Trp Lys Phe His Leu Glu Tyr
1070 1075 1080
Arg Lys Thr Asp Ala Phe Arg Arg Arg Arg Trp Arg Arg Arg Met
1085 1090 1095
Glu Pro Leu Glu Lys Thr Gly Pro Ala Ala Val Phe Ala Leu Glu
1100 1105 1110
<210> 10
<211> 1287
<212> PRT
<213> 智人
<220>
<223> 3' hDYSF蛋白片段
<400> 10
Val Ile Trp Met Leu Gln Gly Asp Lys Arg Val Ala Tyr Gln Arg Val
1 5 10 15
Pro Ala His Gln Val Leu Phe Ser Arg Arg Gly Ala Asn Tyr Cys Gly
20 25 30
Lys Asn Cys Gly Lys Leu Gln Thr Ile Phe Leu Lys Tyr Pro Met Glu
35 40 45
Lys Val Pro Gly Ala Arg Met Pro Val Gln Ile Arg Val Lys Leu Trp
50 55 60
Phe Gly Leu Ser Val Asp Glu Lys Glu Phe Asn Gln Phe Ala Glu Gly
65 70 75 80
Lys Leu Ser Val Phe Ala Glu Thr Tyr Glu Asn Glu Thr Lys Leu Ala
85 90 95
Leu Val Gly Asn Trp Gly Thr Thr Gly Leu Thr Tyr Pro Lys Phe Ser
100 105 110
Asp Val Thr Gly Lys Ile Lys Leu Pro Lys Asp Ser Phe Arg Pro Ser
115 120 125
Ala Gly Trp Thr Trp Ala Gly Asp Trp Phe Val Cys Pro Glu Lys Thr
130 135 140
Leu Leu His Asp Met Asp Ala Gly His Leu Ser Phe Val Glu Glu Val
145 150 155 160
Phe Glu Asn Gln Thr Arg Leu Pro Gly Gly Gln Trp Ile Tyr Met Ser
165 170 175
Asp Asn Tyr Thr Asp Val Asn Gly Glu Lys Val Leu Pro Lys Asp Asp
180 185 190
Ile Glu Cys Pro Leu Gly Trp Lys Trp Glu Asp Glu Glu Trp Ser Thr
195 200 205
Asp Leu Asn Arg Ala Val Asp Glu Gln Gly Trp Glu Tyr Ser Ile Thr
210 215 220
Ile Pro Pro Glu Arg Lys Pro Lys His Trp Val Pro Ala Glu Lys Met
225 230 235 240
Tyr Tyr Thr His Arg Arg Arg Arg Trp Val Arg Leu Arg Arg Arg Asp
245 250 255
Leu Ser Gln Met Glu Ala Leu Lys Arg His Arg Gln Ala Glu Ala Glu
260 265 270
Gly Glu Gly Trp Glu Tyr Ala Ser Leu Phe Gly Trp Lys Phe His Leu
275 280 285
Glu Tyr Arg Lys Thr Asp Ala Phe Arg Arg Arg Arg Trp Arg Arg Arg
290 295 300
Met Glu Pro Leu Glu Lys Thr Gly Pro Ala Ala Val Phe Ala Leu Glu
305 310 315 320
Gly Ala Leu Gly Gly Val Met Asp Asp Lys Ser Glu Asp Ser Met Ser
325 330 335
Val Ser Thr Leu Ser Phe Gly Val Asn Arg Pro Thr Ile Ser Cys Ile
340 345 350
Phe Asp Tyr Gly Asn Arg Tyr His Leu Arg Cys Tyr Met Tyr Gln Ala
355 360 365
Arg Asp Leu Ala Ala Met Asp Lys Asp Ser Phe Ser Asp Pro Tyr Ala
370 375 380
Ile Val Ser Phe Leu His Gln Ser Gln Lys Thr Val Val Val Lys Asn
385 390 395 400
Thr Leu Asn Pro Thr Trp Asp Gln Thr Leu Ile Phe Tyr Glu Ile Glu
405 410 415
Ile Phe Gly Glu Pro Ala Thr Val Ala Glu Gln Pro Pro Ser Ile Val
420 425 430
Val Glu Leu Tyr Asp His Asp Thr Tyr Gly Ala Asp Glu Phe Met Gly
435 440 445
Arg Cys Ile Cys Gln Pro Ser Leu Glu Arg Met Pro Arg Leu Ala Trp
450 455 460
Phe Pro Leu Thr Arg Gly Ser Gln Pro Ser Gly Glu Leu Leu Ala Ser
465 470 475 480
Phe Glu Leu Ile Gln Arg Glu Lys Pro Ala Ile His His Ile Pro Gly
485 490 495
Phe Glu Val Gln Glu Thr Ser Arg Ile Leu Asp Glu Ser Glu Asp Thr
500 505 510
Asp Leu Pro Tyr Pro Pro Pro Gln Arg Glu Ala Asn Ile Tyr Met Val
515 520 525
Pro Gln Asn Ile Lys Pro Ala Leu Gln Arg Thr Ala Ile Glu Ile Leu
530 535 540
Ala Trp Gly Leu Arg Asn Met Lys Ser Tyr Gln Leu Ala Asn Ile Ser
545 550 555 560
Ser Pro Ser Leu Val Val Glu Cys Gly Gly Gln Thr Val Gln Ser Cys
565 570 575
Val Ile Arg Asn Leu Arg Lys Asn Pro Asn Phe Asp Ile Cys Thr Leu
580 585 590
Phe Met Glu Val Met Leu Pro Arg Glu Glu Leu Tyr Cys Pro Pro Ile
595 600 605
Thr Val Lys Val Ile Asp Asn Arg Gln Phe Gly Arg Arg Pro Val Val
610 615 620
Gly Gln Cys Thr Ile Arg Ser Leu Glu Ser Phe Leu Cys Asp Pro Tyr
625 630 635 640
Ser Ala Glu Ser Pro Ser Pro Gln Gly Gly Pro Asp Asp Val Ser Leu
645 650 655
Leu Ser Pro Gly Glu Asp Val Leu Ile Asp Ile Asp Asp Lys Glu Pro
660 665 670
Leu Ile Pro Ile Gln Glu Glu Glu Phe Ile Asp Trp Trp Ser Lys Phe
675 680 685
Phe Ala Ser Ile Gly Glu Arg Glu Lys Cys Gly Ser Tyr Leu Glu Lys
690 695 700
Asp Phe Asp Thr Leu Lys Val Tyr Asp Thr Gln Leu Glu Asn Val Glu
705 710 715 720
Ala Phe Glu Gly Leu Ser Asp Phe Cys Asn Thr Phe Lys Leu Tyr Arg
725 730 735
Gly Lys Thr Gln Glu Glu Thr Glu Asp Pro Ser Val Ile Gly Glu Phe
740 745 750
Lys Gly Leu Phe Lys Ile Tyr Pro Leu Pro Glu Asp Pro Ala Ile Pro
755 760 765
Met Pro Pro Arg Gln Phe His Gln Leu Ala Ala Gln Gly Pro Gln Glu
770 775 780
Cys Leu Val Arg Ile Tyr Ile Val Arg Ala Phe Gly Leu Gln Pro Lys
785 790 795 800
Asp Pro Asn Gly Lys Cys Asp Pro Tyr Ile Lys Ile Ser Ile Gly Lys
805 810 815
Lys Ser Val Ser Asp Gln Asp Asn Tyr Ile Pro Cys Thr Leu Glu Pro
820 825 830
Val Phe Gly Lys Met Phe Glu Leu Thr Cys Thr Leu Pro Leu Glu Lys
835 840 845
Asp Leu Lys Ile Thr Leu Tyr Asp Tyr Asp Leu Leu Ser Lys Asp Glu
850 855 860
Lys Ile Gly Glu Thr Val Val Asp Leu Glu Asn Arg Leu Leu Ser Lys
865 870 875 880
Phe Gly Ala Arg Cys Gly Leu Pro Gln Thr Tyr Cys Val Ser Gly Pro
885 890 895
Asn Gln Trp Arg Asp Gln Leu Arg Pro Ser Gln Leu Leu His Leu Phe
900 905 910
Cys Gln Gln His Arg Val Lys Ala Pro Val Tyr Arg Thr Asp Arg Val
915 920 925
Met Phe Gln Asp Lys Glu Tyr Ser Ile Glu Glu Ile Glu Ala Gly Arg
930 935 940
Ile Pro Asn Pro His Leu Gly Pro Val Glu Glu Arg Leu Ala Leu His
945 950 955 960
Val Leu Gln Gln Gln Gly Leu Val Pro Glu His Val Glu Ser Arg Pro
965 970 975
Leu Tyr Ser Pro Leu Gln Pro Asp Ile Glu Gln Gly Lys Leu Gln Met
980 985 990
Trp Val Asp Leu Phe Pro Lys Ala Leu Gly Arg Pro Gly Pro Pro Phe
995 1000 1005
Asn Ile Thr Pro Arg Arg Ala Arg Arg Phe Phe Leu Arg Cys Ile
1010 1015 1020
Ile Trp Asn Thr Arg Asp Val Ile Leu Asp Asp Leu Ser Leu Thr
1025 1030 1035
Gly Glu Lys Met Ser Asp Ile Tyr Val Lys Gly Trp Met Ile Gly
1040 1045 1050
Phe Glu Glu His Lys Gln Lys Thr Asp Val His Tyr Arg Ser Leu
1055 1060 1065
Gly Gly Glu Gly Asn Phe Asn Trp Arg Phe Ile Phe Pro Phe Asp
1070 1075 1080
Tyr Leu Pro Ala Glu Gln Val Cys Thr Ile Ala Lys Lys Asp Ala
1085 1090 1095
Phe Trp Arg Leu Asp Lys Thr Glu Ser Lys Ile Pro Ala Arg Val
1100 1105 1110
Val Phe Gln Ile Trp Asp Asn Asp Lys Phe Ser Phe Asp Asp Phe
1115 1120 1125
Leu Gly Ser Leu Gln Leu Asp Leu Asn Arg Met Pro Lys Pro Ala
1130 1135 1140
Lys Thr Ala Lys Lys Cys Ser Leu Asp Gln Leu Asp Asp Ala Phe
1145 1150 1155
His Pro Glu Trp Phe Val Ser Leu Phe Glu Gln Lys Thr Val Lys
1160 1165 1170
Gly Trp Trp Pro Cys Val Ala Glu Glu Gly Glu Lys Lys Ile Leu
1175 1180 1185
Ala Gly Lys Leu Glu Met Thr Leu Glu Ile Val Ala Glu Ser Glu
1190 1195 1200
His Glu Glu Arg Pro Ala Gly Gln Gly Arg Asp Glu Pro Asn Met
1205 1210 1215
Asn Pro Lys Leu Glu Asp Pro Arg Arg Pro Asp Thr Ser Phe Leu
1220 1225 1230
Trp Phe Thr Ser Pro Tyr Lys Thr Met Lys Phe Ile Leu Trp Arg
1235 1240 1245
Arg Phe Arg Trp Ala Ile Ile Leu Phe Ile Ile Leu Phe Ile Leu
1250 1255 1260
Leu Leu Phe Leu Ala Ile Phe Ile Tyr Ala Phe Pro Asn Tyr Ala
1265 1270 1275
Ala Met Lys Leu Val Lys Pro Phe Ser
1280 1285
<210> 11
<211> 6914
<212> DNA
<213> 智人
<220>
<223> hDYSF DNA全长
<400> 11
gcggccgccg cccagccagg tgcaaaatgc cgtgtcattg ggagactccg cagccggagc 60
attagattac agctcgacgg agctcgggaa gggcggcggg ggtggaagat gagcagaagc 120
ccctgttctc ggaacgccgg ctgacaagcg gggtgagcgc agccggggcg gggacccagc 180
ctagcccact ggagcagccg ggggtggccc gttccccttt aagagcaact gctctaagcc 240
aggagccaga gattcgagcc ggcctcgccc agccagccct ctccagcgag gggacccaca 300
agcggcgcct cggccctccc gacctttccg agccctcttt gcgccctggg cgcacggggc 360
cctacacgcg ccaagcatgc tgagggtctt catcctctat gccgagaacg tccacacacc 420
cgacaccgac atcagcgatg cctactgctc cgcggtgttt gcaggggtga agaagagaac 480
caaagtcatc aagaacagcg tgaaccctgt atggaatgag ggatttgaat gggacctcaa 540
gggcatcccc ctggaccagg gctctgagct tcatgtggtg gtcaaagacc atgagacgat 600
ggggaggaac aggttcctgg gggaagccaa ggtcccactc cgagaggtcc tcgccacccc 660
tagtctgtcc gccagcttca atgcccccct gctggacacc aagaagcagc ccacaggggc 720
ctcgctggtc ctgcaggtgt cctacacacc gctgcctgga gctgtgcccc tgttcccgcc 780
ccctactcct ctggagccct ccccgactct gcctgacctg gatgtagtgg cagacacagg 840
aggagaggaa gacacagagg accagggact cactggagat gaggcggagc cattcctgga 900
tcaaagcgga ggcccggggg ctcccaccac cccaaggaaa ctaccttcac gtcctccgcc 960
ccactacccc gggatcaaaa gaaagcgaag tgcgcctaca tctagaaagc tgctgtcaga 1020
caaaccgcag gatttccaga tcagggtcca ggtgatcgag gggcgccagc tgccgggggt 1080
gaacatcaag cctgtggtca aggttaccgc tgcagggcag accaagcgga cgcggatcca 1140
caagggaaac agcccactct tcaatgagac tcttttcttc aacttgtttg actctcctgg 1200
ggagctgttt gatgagccca tctttatcac ggtggtagac tctcgttctc tcaggacaga 1260
tgctctcctc ggggagttcc ggatggacgt gggcaccatt tacagagagc cccggcacgc 1320
ctatctcagg aagtggctgc tgctctcaga ccctgatgac ttctctgctg gggccagagg 1380
ctacctgaaa acaagccttt gtgtgctggg gcctggggac gaagcgcctc tggagagaaa 1440
agacccctct gaagacaagg aggacattga aagcaacctg ctccggccca caggcgtagc 1500
cctgcgagga gcccacttct gcctgaaggt cttccgggcc gaggacttgc cgcagatgga 1560
cgatgccgtg atggacaacg tgaaacagat ctttggcttc gagagtaaca agaagaactt 1620
ggtggacccc tttgtggagg tcagctttgc ggggaaaatg ctgtgcagca agatcttgga 1680
gaagacggcc aaccctcagt ggaaccagaa catcacactg cctgccatgt ttccctccat 1740
gtgcgaaaaa atgaggattc gtatcataga ctgggaccgc ctgactcaca atgacatcgt 1800
ggctaccacc tacctgagta tgtcgaaaat ctctgcccct ggaggagaaa tagaagagga 1860
gcctgcaggt gctgtcaagc cttcgaaagc ctcagacttg gatgactacc tgggcttcct 1920
ccccactttt gggccctgct acatcaacct ctatggcagt cccagagagt tcacaggctt 1980
cccagacccc tacacagagc tcaacacagg caagggggaa ggtgtggctt atcgtggccg 2040
gcttctgctc tccctggaga ccaagctggt ggagcacagt gaacagaagg tggaggacct 2100
tcctgcggat gacatcctcc gggtggagaa gtaccttagg aggcgcaagt actccctgtt 2160
tgcggccttc tactcagcca ccatgctgca ggatgtggat gatgccatcc agtttgaggt 2220
cagcatcggg aactacggga acaagttcga catgacctgc ctgccgctgg cctccaccac 2280
tcagtacagc cgtgcagtct ttgacgggtg ccactactac tacctaccct ggggtaacgt 2340
gaaacctgtg gtggtgctgt catcctactg ggaggacatc agccatagaa tcgagactca 2400
gaaccagctg cttgggattg ctgaccggct ggaagctggc ctggagcagg tccacctggc 2460
cctgaaggcg cagtgctcca cggaggacgt ggactcgctg gtggctcagc tgacggatga 2520
gctcatcgca ggctgcagcc agcctctggg tgacatccat gagacaccct ctgccaccca 2580
cctggaccag tacctgtacc agctgcgcac ccatcacctg agccaaatca ctgaggctgc 2640
cctggccctg aagctcggcc acagtgagct ccctgcagct ctggagcagg cggaggactg 2700
gctcctgcgt ctgcgtgccc tggcagagga gccccagaac agcctgccgg acatcgtcat 2760
ctggatgctg cagggagaca agcgtgtggc ataccagcgg gtgcccgccc accaagtcct 2820
cttctcccgg cggggtgcca actactgtgg caagaattgt gggaagctac agacaatctt 2880
tctgaaatat ccgatggaga aggtgcctgg cgcccggatg ccagtgcaga tacgggtcaa 2940
gctgtggttt gggctctcag tggatgagaa ggagttcaac cagtttgctg aggggaagct 3000
gtctgtcttt gctgaaacct atgagaacga gactaagttg gcccttgttg ggaactgggg 3060
cacaacgggc ctcacctacc ccaagttttc tgacgtcacg ggcaagatca agctacccaa 3120
ggacagcttc cgcccctcgg ccggctggac ctgggctgga gattggttcg tgtgtccgga 3180
gaagactctg ctccatgaca tggacgccgg tcacctgagc ttcgtggaag aggtgtttga 3240
gaaccagacc cggcttcccg gaggccagtg gatctacatg agtgacaact acaccgatgt 3300
gaacggggag aaggtgcttc ccaaggatga cattgagtgc ccactgggct ggaagtggga 3360
agatgaggaa tggtccacag acctcaaccg ggctgtcgat gagcaaggct gggagtatag 3420
catcaccatc cccccggagc ggaagccgaa gcactgggtc cctgctgaga agatgtacta 3480
cacacaccga cggcggcgct gggtgcgcct gcgcaggagg gatctcagcc aaatggaagc 3540
actgaaaagg cacaggcagg cggaggcgga gggcgagggc tgggagtacg cctctctttt 3600
tggctggaag ttccacctcg agtaccgcaa gacagatgcc ttccgccgcc gccgctggcg 3660
ccgtcgcatg gagccactgg agaagacggg gcctgcagct gtgtttgccc ttgagggggc 3720
cctgggcggc gtgatggatg acaagagtga agattccatg tccgtctcca ccttgagctt 3780
cggtgtgaac agacccacga tttcctgcat attcgactat gggaaccgct accatctacg 3840
ctgctacatg taccaggccc gggacctggc tgcgatggac aaggactctt tttctgatcc 3900
ctatgccatc gtctccttcc tgcaccagag ccagaagacg gtggtggtga agaacaccct 3960
taaccccacc tgggaccaga cgctcatctt ctacgagatc gagatctttg gcgagccggc 4020
cacagttgct gagcaaccgc ccagcattgt ggtggagctg tacgaccatg acacttatgg 4080
tgcagacgag tttatgggtc gctgcatctg tcaaccgagt ctggaacgga tgccacggct 4140
ggcctggttc ccactgacga ggggcagcca gccgtcgggg gagctgctgg cctcttttga 4200
gctcatccag agagagaagc cggccatcca ccatattcct ggttttgagg tgcaggagac 4260
atcaaggatc ctggatgagt ctgaggacac agacctgccc tacccaccac cccagaggga 4320
ggccaacatc tacatggttc ctcagaacat caagccagcg ctccagcgta ccgccatcga 4380
gatcctggca tggggcctgc ggaacatgaa gagttaccag ctggccaaca tctcctcccc 4440
cagcctcgtg gtagagtgtg ggggccagac ggtgcagtcc tgtgtcatca ggaacctccg 4500
gaagaacccc aactttgaca tctgcaccct cttcatggaa gtgatgctgc ccagggagga 4560
gctctactgc ccccccatca ccgtcaaggt catcgataac cgccagtttg gccgccggcc 4620
tgtggtgggc cagtgtacca tccgctccct ggagagcttc ctgtgtgacc cctactcggc 4680
ggagagtcca tccccacagg gtggcccaga cgatgtgagc ctactcagtc ctggggaaga 4740
cgtgctcatc gacattgatg acaaggagcc cctcatcccc atccaggagg aagagttcat 4800
cgattggtgg agcaaattct ttgcctccat aggggagagg gaaaagtgcg gctcctacct 4860
ggagaaggat tttgacaccc tgaaggtcta tgacacacag ctggagaatg tggaggcctt 4920
tgagggcctg tctgactttt gtaacacctt caagctgtac cggggcaaga cgcaggagga 4980
gacagaagat ccatctgtga ttggtgaatt taagggcctc ttcaaaattt atcccctccc 5040
agaagaccca gccatcccca tgcccccaag acagttccac cagctggccg cccagggacc 5100
ccaggagtgc ttggtccgta tctacattgt ccgagcattt ggcctgcagc ccaaggaccc 5160
caatggaaag tgtgatcctt acatcaagat ctccataggg aagaaatcag tgagtgacca 5220
ggataactac atcccctgca cgctggagcc cgtatttgga aagatgttcg agctgacctg 5280
cactctgcct ctggagaagg acctaaagat cactctctat gactatgacc tcctctccaa 5340
ggacgaaaag atcggtgaga cggtcgtcga cctggagaac aggctgctgt ccaagtttgg 5400
ggctcgctgt ggactcccac agacctactg tgtctctgga ccgaaccagt ggcgggacca 5460
gctccgcccc tcccagctcc tccacctctt ctgccagcag catagagtca aggcacctgt 5520
gtaccggaca gaccgtgtaa tgtttcagga taaagaatat tccattgaag agatagaggc 5580
tggcaggatc ccaaacccac acctgggccc agtggaggag cgtctggctc tgcatgtgct 5640
tcagcagcag ggcctggtcc cggagcacgt ggagtcacgg cccctctaca gccccctgca 5700
gccagacatc gagcagggga agctgcagat gtgggtcgac ctatttccga aggccctggg 5760
gcggcctgga cctcccttca acatcacccc acggagagcc agaaggtttt tcctgcgttg 5820
tattatctgg aataccagag atgtgatcct ggatgacctg agcctcacgg gggagaagat 5880
gagcgacatt tatgtgaaag gttggatgat tggctttgaa gaacacaagc aaaagacaga 5940
cgtgcattat cgttccctgg gaggtgaagg caacttcaac tggaggttca ttttcccctt 6000
cgactacctg ccagctgagc aagtctgtac cattgccaag aaggatgcct tctggaggct 6060
ggacaagact gagagcaaaa tcccagcacg agtggtgttc cagatctggg acaatgacaa 6120
gttctccttt gatgattttc tgggctccct gcagctcgat ctcaaccgca tgcccaagcc 6180
agccaagaca gccaagaagt gctccttgga ccagctggat gatgctttcc acccagaatg 6240
gtttgtgtcc ctttttgagc agaaaacagt gaagggctgg tggccctgtg tagcagaaga 6300
gggtgagaag aaaatactgg cgggcaagct ggaaatgacc ttggagattg tagcagagag 6360
tgagcatgag gagcggcctg ctggccaggg ccgggatgag cccaacatga accctaagct 6420
tgaggaccca aggcgccccg acacctcctt cctgtggttt acctccccat acaagaccat 6480
gaagttcatc ctgtggcggc gtttccggtg ggccatcatc ctcttcatca tcctcttcat 6540
cctgctgctg ttcctggcca tcttcatcta cgccttcccg aactatgctg ccatgaagct 6600
ggtgaagccc ttcagctgag gactctcctg ccctgtagaa ggggccgtgg ggtcccctcc 6660
agcatgggac tggcctgcct cctccgccca gctcggcgag ctcctccaga cctcctaggc 6720
ctgattgtcc tgccagggtg ggcagacaga cagatggacc ggcccacact cccagagttg 6780
ctaacatgga gctctgagat caccccactt ccatcatttc cttctccccc aacccaacgc 6840
ttttttggat cagctcagac atatttcagt ataaaacagt tggaaccaca aaaaaaaaaa 6900
aaaaaaaaaa aaaa 6914
<210> 12
<211> 2080
<212> PRT
<213> 智人
<220>
<223> hDYSF蛋白全长
<400> 12
Met Leu Arg Val Phe Ile Leu Tyr Ala Glu Asn Val His Thr Pro Asp
1 5 10 15
Thr Asp Ile Ser Asp Ala Tyr Cys Ser Ala Val Phe Ala Gly Val Lys
20 25 30
Lys Arg Thr Lys Val Ile Lys Asn Ser Val Asn Pro Val Trp Asn Glu
35 40 45
Gly Phe Glu Trp Asp Leu Lys Gly Ile Pro Leu Asp Gln Gly Ser Glu
50 55 60
Leu His Val Val Val Lys Asp His Glu Thr Met Gly Arg Asn Arg Phe
65 70 75 80
Leu Gly Glu Ala Lys Val Pro Leu Arg Glu Val Leu Ala Thr Pro Ser
85 90 95
Leu Ser Ala Ser Phe Asn Ala Pro Leu Leu Asp Thr Lys Lys Gln Pro
100 105 110
Thr Gly Ala Ser Leu Val Leu Gln Val Ser Tyr Thr Pro Leu Pro Gly
115 120 125
Ala Val Pro Leu Phe Pro Pro Pro Thr Pro Leu Glu Pro Ser Pro Thr
130 135 140
Leu Pro Asp Leu Asp Val Val Ala Asp Thr Gly Gly Glu Glu Asp Thr
145 150 155 160
Glu Asp Gln Gly Leu Thr Gly Asp Glu Ala Glu Pro Phe Leu Asp Gln
165 170 175
Ser Gly Gly Pro Gly Ala Pro Thr Thr Pro Arg Lys Leu Pro Ser Arg
180 185 190
Pro Pro Pro His Tyr Pro Gly Ile Lys Arg Lys Arg Ser Ala Pro Thr
195 200 205
Ser Arg Lys Leu Leu Ser Asp Lys Pro Gln Asp Phe Gln Ile Arg Val
210 215 220
Gln Val Ile Glu Gly Arg Gln Leu Pro Gly Val Asn Ile Lys Pro Val
225 230 235 240
Val Lys Val Thr Ala Ala Gly Gln Thr Lys Arg Thr Arg Ile His Lys
245 250 255
Gly Asn Ser Pro Leu Phe Asn Glu Thr Leu Phe Phe Asn Leu Phe Asp
260 265 270
Ser Pro Gly Glu Leu Phe Asp Glu Pro Ile Phe Ile Thr Val Val Asp
275 280 285
Ser Arg Ser Leu Arg Thr Asp Ala Leu Leu Gly Glu Phe Arg Met Asp
290 295 300
Val Gly Thr Ile Tyr Arg Glu Pro Arg His Ala Tyr Leu Arg Lys Trp
305 310 315 320
Leu Leu Leu Ser Asp Pro Asp Asp Phe Ser Ala Gly Ala Arg Gly Tyr
325 330 335
Leu Lys Thr Ser Leu Cys Val Leu Gly Pro Gly Asp Glu Ala Pro Leu
340 345 350
Glu Arg Lys Asp Pro Ser Glu Asp Lys Glu Asp Ile Glu Ser Asn Leu
355 360 365
Leu Arg Pro Thr Gly Val Ala Leu Arg Gly Ala His Phe Cys Leu Lys
370 375 380
Val Phe Arg Ala Glu Asp Leu Pro Gln Met Asp Asp Ala Val Met Asp
385 390 395 400
Asn Val Lys Gln Ile Phe Gly Phe Glu Ser Asn Lys Lys Asn Leu Val
405 410 415
Asp Pro Phe Val Glu Val Ser Phe Ala Gly Lys Met Leu Cys Ser Lys
420 425 430
Ile Leu Glu Lys Thr Ala Asn Pro Gln Trp Asn Gln Asn Ile Thr Leu
435 440 445
Pro Ala Met Phe Pro Ser Met Cys Glu Lys Met Arg Ile Arg Ile Ile
450 455 460
Asp Trp Asp Arg Leu Thr His Asn Asp Ile Val Ala Thr Thr Tyr Leu
465 470 475 480
Ser Met Ser Lys Ile Ser Ala Pro Gly Gly Glu Ile Glu Glu Glu Pro
485 490 495
Ala Gly Ala Val Lys Pro Ser Lys Ala Ser Asp Leu Asp Asp Tyr Leu
500 505 510
Gly Phe Leu Pro Thr Phe Gly Pro Cys Tyr Ile Asn Leu Tyr Gly Ser
515 520 525
Pro Arg Glu Phe Thr Gly Phe Pro Asp Pro Tyr Thr Glu Leu Asn Thr
530 535 540
Gly Lys Gly Glu Gly Val Ala Tyr Arg Gly Arg Leu Leu Leu Ser Leu
545 550 555 560
Glu Thr Lys Leu Val Glu His Ser Glu Gln Lys Val Glu Asp Leu Pro
565 570 575
Ala Asp Asp Ile Leu Arg Val Glu Lys Tyr Leu Arg Arg Arg Lys Tyr
580 585 590
Ser Leu Phe Ala Ala Phe Tyr Ser Ala Thr Met Leu Gln Asp Val Asp
595 600 605
Asp Ala Ile Gln Phe Glu Val Ser Ile Gly Asn Tyr Gly Asn Lys Phe
610 615 620
Asp Met Thr Cys Leu Pro Leu Ala Ser Thr Thr Gln Tyr Ser Arg Ala
625 630 635 640
Val Phe Asp Gly Cys His Tyr Tyr Tyr Leu Pro Trp Gly Asn Val Lys
645 650 655
Pro Val Val Val Leu Ser Ser Tyr Trp Glu Asp Ile Ser His Arg Ile
660 665 670
Glu Thr Gln Asn Gln Leu Leu Gly Ile Ala Asp Arg Leu Glu Ala Gly
675 680 685
Leu Glu Gln Val His Leu Ala Leu Lys Ala Gln Cys Ser Thr Glu Asp
690 695 700
Val Asp Ser Leu Val Ala Gln Leu Thr Asp Glu Leu Ile Ala Gly Cys
705 710 715 720
Ser Gln Pro Leu Gly Asp Ile His Glu Thr Pro Ser Ala Thr His Leu
725 730 735
Asp Gln Tyr Leu Tyr Gln Leu Arg Thr His His Leu Ser Gln Ile Thr
740 745 750
Glu Ala Ala Leu Ala Leu Lys Leu Gly His Ser Glu Leu Pro Ala Ala
755 760 765
Leu Glu Gln Ala Glu Asp Trp Leu Leu Arg Leu Arg Ala Leu Ala Glu
770 775 780
Glu Pro Gln Asn Ser Leu Pro Asp Ile Val Ile Trp Met Leu Gln Gly
785 790 795 800
Asp Lys Arg Val Ala Tyr Gln Arg Val Pro Ala His Gln Val Leu Phe
805 810 815
Ser Arg Arg Gly Ala Asn Tyr Cys Gly Lys Asn Cys Gly Lys Leu Gln
820 825 830
Thr Ile Phe Leu Lys Tyr Pro Met Glu Lys Val Pro Gly Ala Arg Met
835 840 845
Pro Val Gln Ile Arg Val Lys Leu Trp Phe Gly Leu Ser Val Asp Glu
850 855 860
Lys Glu Phe Asn Gln Phe Ala Glu Gly Lys Leu Ser Val Phe Ala Glu
865 870 875 880
Thr Tyr Glu Asn Glu Thr Lys Leu Ala Leu Val Gly Asn Trp Gly Thr
885 890 895
Thr Gly Leu Thr Tyr Pro Lys Phe Ser Asp Val Thr Gly Lys Ile Lys
900 905 910
Leu Pro Lys Asp Ser Phe Arg Pro Ser Ala Gly Trp Thr Trp Ala Gly
915 920 925
Asp Trp Phe Val Cys Pro Glu Lys Thr Leu Leu His Asp Met Asp Ala
930 935 940
Gly His Leu Ser Phe Val Glu Glu Val Phe Glu Asn Gln Thr Arg Leu
945 950 955 960
Pro Gly Gly Gln Trp Ile Tyr Met Ser Asp Asn Tyr Thr Asp Val Asn
965 970 975
Gly Glu Lys Val Leu Pro Lys Asp Asp Ile Glu Cys Pro Leu Gly Trp
980 985 990
Lys Trp Glu Asp Glu Glu Trp Ser Thr Asp Leu Asn Arg Ala Val Asp
995 1000 1005
Glu Gln Gly Trp Glu Tyr Ser Ile Thr Ile Pro Pro Glu Arg Lys
1010 1015 1020
Pro Lys His Trp Val Pro Ala Glu Lys Met Tyr Tyr Thr His Arg
1025 1030 1035
Arg Arg Arg Trp Val Arg Leu Arg Arg Arg Asp Leu Ser Gln Met
1040 1045 1050
Glu Ala Leu Lys Arg His Arg Gln Ala Glu Ala Glu Gly Glu Gly
1055 1060 1065
Trp Glu Tyr Ala Ser Leu Phe Gly Trp Lys Phe His Leu Glu Tyr
1070 1075 1080
Arg Lys Thr Asp Ala Phe Arg Arg Arg Arg Trp Arg Arg Arg Met
1085 1090 1095
Glu Pro Leu Glu Lys Thr Gly Pro Ala Ala Val Phe Ala Leu Glu
1100 1105 1110
Gly Ala Leu Gly Gly Val Met Asp Asp Lys Ser Glu Asp Ser Met
1115 1120 1125
Ser Val Ser Thr Leu Ser Phe Gly Val Asn Arg Pro Thr Ile Ser
1130 1135 1140
Cys Ile Phe Asp Tyr Gly Asn Arg Tyr His Leu Arg Cys Tyr Met
1145 1150 1155
Tyr Gln Ala Arg Asp Leu Ala Ala Met Asp Lys Asp Ser Phe Ser
1160 1165 1170
Asp Pro Tyr Ala Ile Val Ser Phe Leu His Gln Ser Gln Lys Thr
1175 1180 1185
Val Val Val Lys Asn Thr Leu Asn Pro Thr Trp Asp Gln Thr Leu
1190 1195 1200
Ile Phe Tyr Glu Ile Glu Ile Phe Gly Glu Pro Ala Thr Val Ala
1205 1210 1215
Glu Gln Pro Pro Ser Ile Val Val Glu Leu Tyr Asp His Asp Thr
1220 1225 1230
Tyr Gly Ala Asp Glu Phe Met Gly Arg Cys Ile Cys Gln Pro Ser
1235 1240 1245
Leu Glu Arg Met Pro Arg Leu Ala Trp Phe Pro Leu Thr Arg Gly
1250 1255 1260
Ser Gln Pro Ser Gly Glu Leu Leu Ala Ser Phe Glu Leu Ile Gln
1265 1270 1275
Arg Glu Lys Pro Ala Ile His His Ile Pro Gly Phe Glu Val Gln
1280 1285 1290
Glu Thr Ser Arg Ile Leu Asp Glu Ser Glu Asp Thr Asp Leu Pro
1295 1300 1305
Tyr Pro Pro Pro Gln Arg Glu Ala Asn Ile Tyr Met Val Pro Gln
1310 1315 1320
Asn Ile Lys Pro Ala Leu Gln Arg Thr Ala Ile Glu Ile Leu Ala
1325 1330 1335
Trp Gly Leu Arg Asn Met Lys Ser Tyr Gln Leu Ala Asn Ile Ser
1340 1345 1350
Ser Pro Ser Leu Val Val Glu Cys Gly Gly Gln Thr Val Gln Ser
1355 1360 1365
Cys Val Ile Arg Asn Leu Arg Lys Asn Pro Asn Phe Asp Ile Cys
1370 1375 1380
Thr Leu Phe Met Glu Val Met Leu Pro Arg Glu Glu Leu Tyr Cys
1385 1390 1395
Pro Pro Ile Thr Val Lys Val Ile Asp Asn Arg Gln Phe Gly Arg
1400 1405 1410
Arg Pro Val Val Gly Gln Cys Thr Ile Arg Ser Leu Glu Ser Phe
1415 1420 1425
Leu Cys Asp Pro Tyr Ser Ala Glu Ser Pro Ser Pro Gln Gly Gly
1430 1435 1440
Pro Asp Asp Val Ser Leu Leu Ser Pro Gly Glu Asp Val Leu Ile
1445 1450 1455
Asp Ile Asp Asp Lys Glu Pro Leu Ile Pro Ile Gln Glu Glu Glu
1460 1465 1470
Phe Ile Asp Trp Trp Ser Lys Phe Phe Ala Ser Ile Gly Glu Arg
1475 1480 1485
Glu Lys Cys Gly Ser Tyr Leu Glu Lys Asp Phe Asp Thr Leu Lys
1490 1495 1500
Val Tyr Asp Thr Gln Leu Glu Asn Val Glu Ala Phe Glu Gly Leu
1505 1510 1515
Ser Asp Phe Cys Asn Thr Phe Lys Leu Tyr Arg Gly Lys Thr Gln
1520 1525 1530
Glu Glu Thr Glu Asp Pro Ser Val Ile Gly Glu Phe Lys Gly Leu
1535 1540 1545
Phe Lys Ile Tyr Pro Leu Pro Glu Asp Pro Ala Ile Pro Met Pro
1550 1555 1560
Pro Arg Gln Phe His Gln Leu Ala Ala Gln Gly Pro Gln Glu Cys
1565 1570 1575
Leu Val Arg Ile Tyr Ile Val Arg Ala Phe Gly Leu Gln Pro Lys
1580 1585 1590
Asp Pro Asn Gly Lys Cys Asp Pro Tyr Ile Lys Ile Ser Ile Gly
1595 1600 1605
Lys Lys Ser Val Ser Asp Gln Asp Asn Tyr Ile Pro Cys Thr Leu
1610 1615 1620
Glu Pro Val Phe Gly Lys Met Phe Glu Leu Thr Cys Thr Leu Pro
1625 1630 1635
Leu Glu Lys Asp Leu Lys Ile Thr Leu Tyr Asp Tyr Asp Leu Leu
1640 1645 1650
Ser Lys Asp Glu Lys Ile Gly Glu Thr Val Val Asp Leu Glu Asn
1655 1660 1665
Arg Leu Leu Ser Lys Phe Gly Ala Arg Cys Gly Leu Pro Gln Thr
1670 1675 1680
Tyr Cys Val Ser Gly Pro Asn Gln Trp Arg Asp Gln Leu Arg Pro
1685 1690 1695
Ser Gln Leu Leu His Leu Phe Cys Gln Gln His Arg Val Lys Ala
1700 1705 1710
Pro Val Tyr Arg Thr Asp Arg Val Met Phe Gln Asp Lys Glu Tyr
1715 1720 1725
Ser Ile Glu Glu Ile Glu Ala Gly Arg Ile Pro Asn Pro His Leu
1730 1735 1740
Gly Pro Val Glu Glu Arg Leu Ala Leu His Val Leu Gln Gln Gln
1745 1750 1755
Gly Leu Val Pro Glu His Val Glu Ser Arg Pro Leu Tyr Ser Pro
1760 1765 1770
Leu Gln Pro Asp Ile Glu Gln Gly Lys Leu Gln Met Trp Val Asp
1775 1780 1785
Leu Phe Pro Lys Ala Leu Gly Arg Pro Gly Pro Pro Phe Asn Ile
1790 1795 1800
Thr Pro Arg Arg Ala Arg Arg Phe Phe Leu Arg Cys Ile Ile Trp
1805 1810 1815
Asn Thr Arg Asp Val Ile Leu Asp Asp Leu Ser Leu Thr Gly Glu
1820 1825 1830
Lys Met Ser Asp Ile Tyr Val Lys Gly Trp Met Ile Gly Phe Glu
1835 1840 1845
Glu His Lys Gln Lys Thr Asp Val His Tyr Arg Ser Leu Gly Gly
1850 1855 1860
Glu Gly Asn Phe Asn Trp Arg Phe Ile Phe Pro Phe Asp Tyr Leu
1865 1870 1875
Pro Ala Glu Gln Val Cys Thr Ile Ala Lys Lys Asp Ala Phe Trp
1880 1885 1890
Arg Leu Asp Lys Thr Glu Ser Lys Ile Pro Ala Arg Val Val Phe
1895 1900 1905
Gln Ile Trp Asp Asn Asp Lys Phe Ser Phe Asp Asp Phe Leu Gly
1910 1915 1920
Ser Leu Gln Leu Asp Leu Asn Arg Met Pro Lys Pro Ala Lys Thr
1925 1930 1935
Ala Lys Lys Cys Ser Leu Asp Gln Leu Asp Asp Ala Phe His Pro
1940 1945 1950
Glu Trp Phe Val Ser Leu Phe Glu Gln Lys Thr Val Lys Gly Trp
1955 1960 1965
Trp Pro Cys Val Ala Glu Glu Gly Glu Lys Lys Ile Leu Ala Gly
1970 1975 1980
Lys Leu Glu Met Thr Leu Glu Ile Val Ala Glu Ser Glu His Glu
1985 1990 1995
Glu Arg Pro Ala Gly Gln Gly Arg Asp Glu Pro Asn Met Asn Pro
2000 2005 2010
Lys Leu Glu Asp Pro Arg Arg Pro Asp Thr Ser Phe Leu Trp Phe
2015 2020 2025
Thr Ser Pro Tyr Lys Thr Met Lys Phe Ile Leu Trp Arg Arg Phe
2030 2035 2040
Arg Trp Ala Ile Ile Leu Phe Ile Ile Leu Phe Ile Leu Leu Leu
2045 2050 2055
Phe Leu Ala Ile Phe Ile Tyr Ala Phe Pro Asn Tyr Ala Ala Met
2060 2065 2070
Lys Leu Val Lys Pro Phe Ser
2075 2080
<210> 13
<211> 3340
<212> DNA
<213> 智人
<220>
<223> 5' hDYSF DNA片段v2
<400> 13
atgctgaggg tcttcatcct ctatgccgag aacgtccaca cacccgacac cgacatcagc 60
gatgcctact gctccgcggt gtttgcaggg gtgaagaaga gaaccaaagt catcaagaac 120
agcgtgaacc ctgtatggaa tgagggattt gaatgggacc tcaagggcat ccccctggac 180
cagggctctg agcttcatgt ggtggtcaaa gaccatgaga cgatggggag gaacaggttc 240
ctgggggaag ccaaggtccc actccgagag gtcctcgcca cccctagtct gtccgccagc 300
ttcaatgccc ccctgctgga caccaagaag cagcccacag gggcctcgct ggtcctgcag 360
gtgtcctaca caccgctgcc tggagctgtg cccctgttcc cgccccctac tcctctggag 420
ccctccccga ctctgcctga cctggatgta gtggcagaca caggaggaga ggaagacaca 480
gaggaccagg gactcactgg agatgaggcg gagccattcc tggatcaaag cggaggcccg 540
ggggctccca ccaccccaag gaaactacct tcacgtcctc cgccccacta ccccgggatc 600
aaaagaaagc gaagtgcgcc tacatctaga aagctgctgt cagacaaacc gcaggatttc 660
cagatcaggg tccaggtgat cgaggggcgc cagctgccgg gggtgaacat caagcctgtg 720
gtcaaggtta ccgctgcagg gcagaccaag cggacgcgga tccacaaggg aaacagccca 780
ctcttcaatg agactctttt cttcaacttg tttgactctc ctggggagct gtttgatgag 840
cccatcttta tcacggtggt agactctcgt tctctcagga cagatgctct cctcggggag 900
ttccggatgg acgtgggcac catttacaga gagccccggc acgcctatct caggaagtgg 960
ctgctgctct cagaccctga tgacttctct gctggggcca gaggctacct gaaaacaagc 1020
ctttgtgtgc tggggcctgg ggacgaagcg cctctggaga gaaaagaccc ctctgaagac 1080
aaggaggaca ttgaaagcaa cctgctccgg cccacaggcg tagccctgcg aggagcccac 1140
ttctgcctga aggtcttccg ggccgaggac ttgccgcaga tggacgatgc cgtgatggac 1200
aacgtgaaac agatctttgg cttcgagagt aacaagaaga acttggtgga cccctttgtg 1260
gaggtcagct ttgcggggaa aatgctgtgc agcaagatct tggagaagac ggccaaccct 1320
cagtggaacc agaacatcac actgcctgcc atgtttccct ccatgtgcga aaaaatgagg 1380
attcgtatca tagactggga ccgcctgact cacaatgaca tcgtggctac cacctacctg 1440
agtatgtcga aaatctctgc ccctggagga gaaatagaag aggagcctgc aggtgctgtc 1500
aagccttcga aagcctcaga cttggatgac tacctgggct tcctccccac ttttgggccc 1560
tgctacatca acctctatgg cagtcccaga gagttcacag gcttcccaga cccctacaca 1620
gagctcaaca caggcaaggg ggaaggtgtg gcttatcgtg gccggcttct gctctccctg 1680
gagaccaagc tggtggagca cagtgaacag aaggtggagg accttcctgc ggatgacatc 1740
ctccgggtgg agaagtacct taggaggcgc aagtactccc tgtttgcggc cttctactca 1800
gccaccatgc tgcaggatgt ggatgatgcc atccagtttg aggtcagcat cgggaactac 1860
gggaacaagt tcgacatgac ctgcctgccg ctggcctcca ccactcagta cagccgtgca 1920
gtctttgacg ggtgccacta ctactaccta ccctggggta acgtgaaacc tgtggtggtg 1980
ctgtcatcct actgggagga catcagccat agaatcgaga ctcagaacca gctgcttggg 2040
attgctgacc ggctggaagc tggcctggag caggtccacc tggccctgaa ggcgcagtgc 2100
tccacggagg acgtggactc gctggtggct cagctgacgg atgagctcat cgcaggctgc 2160
agccagcctc tgggtgacat ccatgagaca ccctctgcca cccacctgga ccagtacctg 2220
taccagctgc gcacccatca cctgagccaa atcactgagg ctgccctggc cctgaagctc 2280
ggccacagtg agctccctgc agctctggag caggcggagg actggctcct gcgtctgcgt 2340
gccctggcag aggagcccca gaacagcctg ccggacatcg tcatctggat gctgcaggga 2400
gacaagcgtg tggcatacca gcgggtgccc gcccaccaag tcctcttctc ccggcggggt 2460
gccaactact gtggcaagaa ttgtgggaag ctacagacaa tctttctgaa atatccgatg 2520
gagaaggtgc ctggcgcccg gatgccagtg cagatacggg tcaagctgtg gtttgggctc 2580
tcagtggatg agaaggagtt caaccagttt gctgagggga agctgtctgt ctttgctgaa 2640
acctatgaga acgagactaa gttggccctt gttgggaact ggggcacaac gggcctcacc 2700
taccccaagt tttctgacgt cacgggcaag atcaagctac ccaaggacag cttccgcccc 2760
tcggccggct ggacctgggc tggagattgg ttcgtgtgtc cggagaagac tctgctccat 2820
gacatggacg ccggtcacct gagcttcgtg gaagaggtgt ttgagaacca gacccggctt 2880
cccggaggcc agtggatcta catgagtgac aactacaccg atgtgaacgg ggagaaggtg 2940
cttcccaagg atgacattga gtgcccactg ggctggaagt gggaagatga ggaatggtcc 3000
acagacctca accgggctgt cgatgagcaa ggctgggagt atagcatcac catccccccg 3060
gagcggaagc cgaagcactg ggtccctgct gagaagatgt actacacaca ccgacggcgg 3120
cgctgggtgc gcctgcgcag gagggatctc agccaaatgg aagcactgaa aaggcacagg 3180
caggcggagg cggagggcga gggctgggag tacgcctctc tttttggctg gaagttccac 3240
ctcgagtacc gcaagacaga tgccttccgc cgccgccgct ggcgccgtcg catggagcca 3300
ctggagaaga cggggcctgc agctgtgttt gcccttgagg 3340
<210> 14
<211> 3866
<212> DNA
<213> 智人
<220>
<223> 3' hDYSF DNA片段v2
<400> 14
tcgtcatctg gatgctgcag ggagacaagc gtgtggcata ccagcgggtg cccgcccacc 60
aagtcctctt ctcccggcgg ggtgccaact actgtggcaa gaattgtggg aagctacaga 120
caatctttct gaaatatccg atggagaagg tgcctggcgc ccggatgcca gtgcagatac 180
gggtcaagct gtggtttggg ctctcagtgg atgagaagga gttcaaccag tttgctgagg 240
ggaagctgtc tgtctttgct gaaacctatg agaacgagac taagttggcc cttgttggga 300
actggggcac aacgggcctc acctacccca agttttctga cgtcacgggc aagatcaagc 360
tacccaagga cagcttccgc ccctcggccg gctggacctg ggctggagat tggttcgtgt 420
gtccggagaa gactctgctc catgacatgg acgccggtca cctgagcttc gtggaagagg 480
tgtttgagaa ccagacccgg cttcccggag gccagtggat ctacatgagt gacaactaca 540
ccgatgtgaa cggggagaag gtgcttccca aggatgacat tgagtgccca ctgggctgga 600
agtgggaaga tgaggaatgg tccacagacc tcaaccgggc tgtcgatgag caaggctggg 660
agtatagcat caccatcccc ccggagcgga agccgaagca ctgggtccct gctgagaaga 720
tgtactacac acaccgacgg cggcgctggg tgcgcctgcg caggagggat ctcagccaaa 780
tggaagcact gaaaaggcac aggcaggcgg aggcggaggg cgagggctgg gagtacgcct 840
ctctttttgg ctggaagttc cacctcgagt accgcaagac agatgccttc cgccgccgcc 900
gctggcgccg tcgcatggag ccactggaga agacggggcc tgcagctgtg tttgcccttg 960
agggggccct gggcggcgtg atggatgaca agagtgaaga ttccatgtcc gtctccacct 1020
tgagcttcgg tgtgaacaga cccacgattt cctgcatatt cgactatggg aaccgctacc 1080
atctacgctg ctacatgtac caggcccggg acctggctgc gatggacaag gactcttttt 1140
ctgatcccta tgccatcgtc tccttcctgc accagagcca gaagacggtg gtggtgaaga 1200
acacccttaa ccccacctgg gaccagacgc tcatcttcta cgagatcgag atctttggcg 1260
agccggccac agttgctgag caaccgccca gcattgtggt ggagctgtac gaccatgaca 1320
cttatggtgc agacgagttt atgggtcgct gcatctgtca accgagtctg gaacggatgc 1380
cacggctggc ctggttccca ctgacgaggg gcagccagcc gtcgggggag ctgctggcct 1440
cttttgagct catccagaga gagaagccgg ccatccacca tattcctggt tttgaggtgc 1500
aggagacatc aaggatcctg gatgagtctg aggacacaga cctgccctac ccaccacccc 1560
agagggaggc caacatctac atggttcctc agaacatcaa gccagcgctc cagcgtaccg 1620
ccatcgagat cctggcatgg ggcctgcgga acatgaagag ttaccagctg gccaacatct 1680
cctcccccag cctcgtggta gagtgtgggg gccagacggt gcagtcctgt gtcatcagga 1740
acctccggaa gaaccccaac tttgacatct gcaccctctt catggaagtg atgctgccca 1800
gggaggagct ctactgcccc cccatcaccg tcaaggtcat cgataaccgc cagtttggcc 1860
gccggcctgt ggtgggccag tgtaccatcc gctccctgga gagcttcctg tgtgacccct 1920
actcggcgga gagtccatcc ccacagggtg gcccagacga tgtgagccta ctcagtcctg 1980
gggaagacgt gctcatcgac attgatgaca aggagcccct catccccatc caggaggaag 2040
agttcatcga ttggtggagc aaattctttg cctccatagg ggagagggaa aagtgcggct 2100
cctacctgga gaaggatttt gacaccctga aggtctatga cacacagctg gagaatgtgg 2160
aggcctttga gggcctgtct gacttttgta acaccttcaa gctgtaccgg ggcaagacgc 2220
aggaggagac agaagatcca tctgtgattg gtgaatttaa gggcctcttc aaaatttatc 2280
ccctcccaga agacccagcc atccccatgc ccccaagaca gttccaccag ctggccgccc 2340
agggacccca ggagtgcttg gtccgtatct acattgtccg agcatttggc ctgcagccca 2400
aggaccccaa tggaaagtgt gatccttaca tcaagatctc catagggaag aaatcagtga 2460
gtgaccagga taactacatc ccctgcacgc tggagcccgt atttggaaag atgttcgagc 2520
tgacctgcac tctgcctctg gagaaggacc taaagatcac tctctatgac tatgacctcc 2580
tctccaagga cgaaaagatc ggtgagacgg tcgtcgacct ggagaacagg ctgctgtcca 2640
agtttggggc tcgctgtgga ctcccacaga cctactgtgt ctctggaccg aaccagtggc 2700
gggaccagct ccgcccctcc cagctcctcc acctcttctg ccagcagcat agagtcaagg 2760
cacctgtgta ccggacagac cgtgtaatgt ttcaggataa agaatattcc attgaagaga 2820
tagaggctgg caggatccca aacccacacc tgggcccagt ggaggagcgt ctggctctgc 2880
atgtgcttca gcagcagggc ctggtcccgg agcacgtgga gtcacggccc ctctacagcc 2940
ccctgcagcc agacatcgag caggggaagc tgcagatgtg ggtcgaccta tttccgaagg 3000
ccctggggcg gcctggacct cccttcaaca tcaccccacg gagagccaga aggtttttcc 3060
tgcgttgtat tatctggaat accagagatg tgatcctgga tgacctgagc ctcacggggg 3120
agaagatgag cgacatttat gtgaaaggtt ggatgattgg ctttgaagaa cacaagcaaa 3180
agacagacgt gcattatcgt tccctgggag gtgaaggcaa cttcaactgg aggttcattt 3240
tccccttcga ctacctgcca gctgagcaag tctgtaccat tgccaagaag gatgccttct 3300
ggaggctgga caagactgag agcaaaatcc cagcacgagt ggtgttccag atctgggaca 3360
atgacaagtt ctcctttgat gattttctgg gctccctgca gctcgatctc aaccgcatgc 3420
ccaagccagc caagacagcc aagaagtgct ccttggacca gctggatgat gctttccacc 3480
cagaatggtt tgtgtccctt tttgagcaga aaacagtgaa gggctggtgg ccctgtgtag 3540
cagaagaggg tgagaagaaa atactggcgg gcaagctgga aatgaccttg gagattgtag 3600
cagagagtga gcatgaggag cggcctgctg gccagggccg ggatgagccc aacatgaacc 3660
ctaagcttga ggacccaagg cgccccgaca cctccttcct gtggtttacc tccccataca 3720
agaccatgaa gttcatcctg tggcggcgtt tccggtgggc catcatcctc ttcatcatcc 3780
tcttcatcct gctgctgttc ctggccatct tcatctacgc cttcccgaac tatgctgcca 3840
tgaagctggt gaagcccttc agctga 3866
<210> 15
<211> 4689
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> DYSF F5' 表达盒v2
<400> 15
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120
gggttccttg tagttaatga ttaacccgcc atgctctaga gtttaagctt gcatgtctaa 180
gctagaccct tcagattaaa aataactgag gtaagggcct gggtagggga ggtggtgtga 240
gacgctcctg tctctcctct atctgcccat cggccctttg gggaggagga atgtgcccaa 300
ggactaaaaa aaggccatgg agccagaggg gcgagggcaa cagacctttc atgggcaaac 360
cttggggccc tgctgtctag catgccccac tacgggtcta ggctgcccat gtaaggaggc 420
aaggcctggg gacacccgag atgcctggtt ataattaacc cagacatgtg gctgcccccc 480
cccccccaac acctgctgcc tctaaaaata accctgtccc tggtggatcc cctgcatgcg 540
aagatcttcg aacaaggctg tgggggactg agggcaggct gtaacaggct tgggggccag 600
ggcttatacg tgcctgggac tcccaaagta ttactgttcc atgttcccgg cgaagggcca 660
gctgtccccc gccagctaga ctcagcactt agtttaggaa ccagtgagca agtcagccct 720
tggggcagcc catacaaggc catggggctg ggcaagctgc acgcctgggt ccggggtggg 780
cacggtgccc gggcaacgag ctgaaagctc atctgctctc aggggcccct ccctggggac 840
agcccctcct ggctagtcac accctgtagg ctcctctata taacccaggg gcacaggggc 900
tgccctcatt ctaccaccac ctccacagca cagacagaca ctcaggagca gccagcggcg 960
cgcccaggta agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc 1020
aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt 1080
tacttctgct ctaaaagctg cggaattgta cccgcggccg cggctagcca ccatgctgag 1140
ggtcttcatc ctctatgccg agaacgtcca cacacccgac accgacatca gcgatgccta 1200
ctgctccgcg gtgtttgcag gggtgaagaa gagaaccaaa gtcatcaaga acagcgtgaa 1260
ccctgtatgg aatgagggat ttgaatggga cctcaagggc atccccctgg accagggctc 1320
tgagcttcat gtggtggtca aagaccatga gacgatgggg aggaacaggt tcctggggga 1380
agccaaggtc ccactccgag aggtcctcgc cacccctagt ctgtccgcca gcttcaatgc 1440
ccccctgctg gacaccaaga agcagcccac aggggcctcg ctggtcctgc aggtgtccta 1500
cacaccgctg cctggagctg tgcccctgtt cccgccccct actcctctgg agccctcccc 1560
gactctgcct gacctggatg tagtggcaga cacaggagga gaggaagaca cagaggacca 1620
gggactcact ggagatgagg cggagccatt cctggatcaa agcggaggcc cgggggctcc 1680
caccacccca aggaaactac cttcacgtcc tccgccccac taccccggga tcaaaagaaa 1740
gcgaagtgcg cctacatcta gaaagctgct gtcagacaaa ccgcaggatt tccagatcag 1800
ggtccaggtg atcgaggggc gccagctgcc gggggtgaac atcaagcctg tggtcaaggt 1860
taccgctgca gggcagacca agcggacgcg gatccacaag ggaaacagcc cactcttcaa 1920
tgagactctt ttcttcaact tgtttgactc tcctggggag ctgtttgatg agcccatctt 1980
tatcacggtg gtagactctc gttctctcag gacagatgct ctcctcgggg agttccggat 2040
ggacgtgggc accatttaca gagagccccg gcacgcctat ctcaggaagt ggctgctgct 2100
ctcagaccct gatgacttct ctgctggggc cagaggctac ctgaaaacaa gcctttgtgt 2160
gctggggcct ggggacgaag cgcctctgga gagaaaagac ccctctgaag acaaggagga 2220
cattgaaagc aacctgctcc ggcccacagg cgtagccctg cgaggagccc acttctgcct 2280
gaaggtcttc cgggccgagg acttgccgca gatggacgat gccgtgatgg acaacgtgaa 2340
acagatcttt ggcttcgaga gtaacaagaa gaacttggtg gacccctttg tggaggtcag 2400
ctttgcgggg aaaatgctgt gcagcaagat cttggagaag acggccaacc ctcagtggaa 2460
ccagaacatc acactgcctg ccatgtttcc ctccatgtgc gaaaaaatga ggattcgtat 2520
catagactgg gaccgcctga ctcacaatga catcgtggct accacctacc tgagtatgtc 2580
gaaaatctct gcccctggag gagaaataga agaggagcct gcaggtgctg tcaagccttc 2640
gaaagcctca gacttggatg actacctggg cttcctcccc acttttgggc cctgctacat 2700
caacctctat ggcagtccca gagagttcac aggcttccca gacccctaca cagagctcaa 2760
cacaggcaag ggggaaggtg tggcttatcg tggccggctt ctgctctccc tggagaccaa 2820
gctggtggag cacagtgaac agaaggtgga ggaccttcct gcggatgaca tcctccgggt 2880
ggagaagtac cttaggaggc gcaagtactc cctgtttgcg gccttctact cagccaccat 2940
gctgcaggat gtggatgatg ccatccagtt tgaggtcagc atcgggaact acgggaacaa 3000
gttcgacatg acctgcctgc cgctggcctc caccactcag tacagccgtg cagtctttga 3060
cgggtgccac tactactacc taccctgggg taacgtgaaa cctgtggtgg tgctgtcatc 3120
ctactgggag gacatcagcc atagaatcga gactcagaac cagctgcttg ggattgctga 3180
ccggctggaa gctggcctgg agcaggtcca cctggccctg aaggcgcagt gctccacgga 3240
ggacgtggac tcgctggtgg ctcagctgac ggatgagctc atcgcaggct gcagccagcc 3300
tctgggtgac atccatgaga caccctctgc cacccacctg gaccagtacc tgtaccagct 3360
gcgcacccat cacctgagcc aaatcactga ggctgccctg gccctgaagc tcggccacag 3420
tgagctccct gcagctctgg agcaggcgga ggactggctc ctgcgtctgc gtgccctggc 3480
agaggagccc cagaacagcc tgccggacat cgtcatctgg atgctgcagg gagacaagcg 3540
tgtggcatac cagcgggtgc ccgcccacca agtcctcttc tcccggcggg gtgccaacta 3600
ctgtggcaag aattgtggga agctacagac aatctttctg aaatatccga tggagaaggt 3660
gcctggcgcc cggatgccag tgcagatacg ggtcaagctg tggtttgggc tctcagtgga 3720
tgagaaggag ttcaaccagt ttgctgaggg gaagctgtct gtctttgctg aaacctatga 3780
gaacgagact aagttggccc ttgttgggaa ctggggcaca acgggcctca cctaccccaa 3840
gttttctgac gtcacgggca agatcaagct acccaaggac agcttccgcc cctcggccgg 3900
ctggacctgg gctggagatt ggttcgtgtg tccggagaag actctgctcc atgacatgga 3960
cgccggtcac ctgagcttcg tggaagaggt gtttgagaac cagacccggc ttcccggagg 4020
ccagtggatc tacatgagtg acaactacac cgatgtgaac ggggagaagg tgcttcccaa 4080
ggatgacatt gagtgcccac tgggctggaa gtgggaagat gaggaatggt ccacagacct 4140
caaccgggct gtcgatgagc aaggctggga gtatagcatc accatccccc cggagcggaa 4200
gccgaagcac tgggtccctg ctgagaagat gtactacaca caccgacggc ggcgctgggt 4260
gcgcctgcgc aggagggatc tcagccaaat ggaagcactg aaaaggcaca ggcaggcgga 4320
ggcggagggc gagggctggg agtacgcctc tctttttggc tggaagttcc acctcgagta 4380
ccgcaagaca gatgccttcc gccgccgccg ctggcgccgt cgcatggagc cactggagaa 4440
gacggggcct gcagctgtgt ttgcccttga gggcggccgc aataaaagat ctttattttc 4500
attagatctg tgtgttggtt ttttgtgtgt ctagagcatg gcgggttaat cattaactac 4560
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4620
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4680
cgagcgcgc 4689
<210> 16
<211> 4592
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> DYSF F3' 表达盒v2
<400> 16
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120
gggttccttg tagttaatga ttaacccgcc atgctactta tctacgtagc catgctctgg 180
tcgactctag agttttcgtc atctggatgc tgcagggaga caagcgtgtg gcataccagc 240
gggtgcccgc ccaccaagtc ctcttctccc ggcggggtgc caactactgt ggcaagaatt 300
gtgggaagct acagacaatc tttctgaaat atccgatgga gaaggtgcct ggcgcccgga 360
tgccagtgca gatacgggtc aagctgtggt ttgggctctc agtggatgag aaggagttca 420
accagtttgc tgaggggaag ctgtctgtct ttgctgaaac ctatgagaac gagactaagt 480
tggcccttgt tgggaactgg ggcacaacgg gcctcaccta ccccaagttt tctgacgtca 540
cgggcaagat caagctaccc aaggacagct tccgcccctc ggccggctgg acctgggctg 600
gagattggtt cgtgtgtccg gagaagactc tgctccatga catggacgcc ggtcacctga 660
gcttcgtgga agaggtgttt gagaaccaga cccggcttcc cggaggccag tggatctaca 720
tgagtgacaa ctacaccgat gtgaacgggg agaaggtgct tcccaaggat gacattgagt 780
gcccactggg ctggaagtgg gaagatgagg aatggtccac agacctcaac cgggctgtcg 840
atgagcaagg ctgggagtat agcatcacca tccccccgga gcggaagccg aagcactggg 900
tccctgctga gaagatgtac tacacacacc gacggcggcg ctgggtgcgc ctgcgcagga 960
gggatctcag ccaaatggaa gcactgaaaa ggcacaggca ggcggaggcg gagggcgagg 1020
gctgggagta cgcctctctt tttggctgga agttccacct cgagtaccgc aagacagatg 1080
ccttccgccg ccgccgctgg cgccgtcgca tggagccact ggagaagacg gggcctgcag 1140
ctgtgtttgc ccttgagggg gccctgggcg gcgtgatgga tgacaagagt gaagattcca 1200
tgtccgtctc caccttgagc ttcggtgtga acagacccac gatttcctgc atattcgact 1260
atgggaaccg ctaccatcta cgctgctaca tgtaccaggc ccgggacctg gctgcgatgg 1320
acaaggactc tttttctgat ccctatgcca tcgtctcctt cctgcaccag agccagaaga 1380
cggtggtggt gaagaacacc cttaacccca cctgggacca gacgctcatc ttctacgaga 1440
tcgagatctt tggcgagccg gccacagttg ctgagcaacc gcccagcatt gtggtggagc 1500
tgtacgacca tgacacttat ggtgcagacg agtttatggg tcgctgcatc tgtcaaccga 1560
gtctggaacg gatgccacgg ctggcctggt tcccactgac gaggggcagc cagccgtcgg 1620
gggagctgct ggcctctttt gagctcatcc agagagagaa gccggccatc caccatattc 1680
ctggttttga ggtgcaggag acatcaagga tcctggatga gtctgaggac acagacctgc 1740
cctacccacc accccagagg gaggccaaca tctacatggt tcctcagaac atcaagccag 1800
cgctccagcg taccgccatc gagatcctgg catggggcct gcggaacatg aagagttacc 1860
agctggccaa catctcctcc cccagcctcg tggtagagtg tgggggccag acggtgcagt 1920
cctgtgtcat caggaacctc cggaagaacc ccaactttga catctgcacc ctcttcatgg 1980
aagtgatgct gcccagggag gagctctact gcccccccat caccgtcaag gtcatcgata 2040
accgccagtt tggccgccgg cctgtggtgg gccagtgtac catccgctcc ctggagagct 2100
tcctgtgtga cccctactcg gcggagagtc catccccaca gggtggccca gacgatgtga 2160
gcctactcag tcctggggaa gacgtgctca tcgacattga tgacaaggag cccctcatcc 2220
ccatccagga ggaagagttc atcgattggt ggagcaaatt ctttgcctcc ataggggaga 2280
gggaaaagtg cggctcctac ctggagaagg attttgacac cctgaaggtc tatgacacac 2340
agctggagaa tgtggaggcc tttgagggcc tgtctgactt ttgtaacacc ttcaagctgt 2400
accggggcaa gacgcaggag gagacagaag atccatctgt gattggtgaa tttaagggcc 2460
tcttcaaaat ttatcccctc ccagaagacc cagccatccc catgccccca agacagttcc 2520
accagctggc cgcccaggga ccccaggagt gcttggtccg tatctacatt gtccgagcat 2580
ttggcctgca gcccaaggac cccaatggaa agtgtgatcc ttacatcaag atctccatag 2640
ggaagaaatc agtgagtgac caggataact acatcccctg cacgctggag cccgtatttg 2700
gaaagatgtt cgagctgacc tgcactctgc ctctggagaa ggacctaaag atcactctct 2760
atgactatga cctcctctcc aaggacgaaa agatcggtga gacggtcgtc gacctggaga 2820
acaggctgct gtccaagttt ggggctcgct gtggactccc acagacctac tgtgtctctg 2880
gaccgaacca gtggcgggac cagctccgcc cctcccagct cctccacctc ttctgccagc 2940
agcatagagt caaggcacct gtgtaccgga cagaccgtgt aatgtttcag gataaagaat 3000
attccattga agagatagag gctggcagga tcccaaaccc acacctgggc ccagtggagg 3060
agcgtctggc tctgcatgtg cttcagcagc agggcctggt cccggagcac gtggagtcac 3120
ggcccctcta cagccccctg cagccagaca tcgagcaggg gaagctgcag atgtgggtcg 3180
acctatttcc gaaggccctg gggcggcctg gacctccctt caacatcacc ccacggagag 3240
ccagaaggtt tttcctgcgt tgtattatct ggaataccag agatgtgatc ctggatgacc 3300
tgagcctcac gggggagaag atgagcgaca tttatgtgaa aggttggatg attggctttg 3360
aagaacacaa gcaaaagaca gacgtgcatt atcgttccct gggaggtgaa ggcaacttca 3420
actggaggtt cattttcccc ttcgactacc tgccagctga gcaagtctgt accattgcca 3480
agaaggatgc cttctggagg ctggacaaga ctgagagcaa aatcccagca cgagtggtgt 3540
tccagatctg ggacaatgac aagttctcct ttgatgattt tctgggctcc ctgcagctcg 3600
atctcaaccg catgcccaag ccagccaaga cagccaagaa gtgctccttg gaccagctgg 3660
atgatgcttt ccacccagaa tggtttgtgt ccctttttga gcagaaaaca gtgaagggct 3720
ggtggccctg tgtagcagaa gagggtgaga agaaaatact ggcgggcaag ctggaaatga 3780
ccttggagat tgtagcagag agtgagcatg aggagcggcc tgctggccag ggccgggatg 3840
agcccaacat gaaccctaag cttgaggacc caaggcgccc cgacacctcc ttcctgtggt 3900
ttacctcccc atacaagacc atgaagttca tcctgtggcg gcgtttccgg tgggccatca 3960
tcctcttcat catcctcttc atcctgctgc tgttcctggc catcttcatc tacgccttcc 4020
cgaactatgc tgccatgaag ctggtgaagc ccttcagctg aggactctcc tgccctgtag 4080
aaggggccgt ggggtcccct ccagcatggg actggcctgc ctcctccgcc cagctcggcg 4140
agctcctcca gacctcctag gcctgattgt cctgccaggg tgggcagaca gacagatgga 4200
ccggcccaca ctcccagagt tgctaacatg gagctctgag atcaccccac ttccatcatt 4260
tccttctccc ccaacccaac gcttttttgg atcagctcag acatatttca gtataaaaca 4320
gttggaacca caaaaaaaaa aaaaaaaagt cgacgcggcc gcaataaaag atctttattt 4380
tcattagatc tgtgtgttgg ttttttgtgt gtctagagca tggctacgta gataagtagc 4440
atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc 4500
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 4560
cccgggcggc ctcagtgagc gagcgagcgc gc 4592
<210> 17
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> 3' ITR
<400> 17
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgc 128
<210> 18
<211> 8341
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> 用于DYS F5表达盒的质粒序列
<400> 18
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120
gggttccttg tagttaatga ttaacccgcc atgctctaga gtttaagctt gcatgtctaa 180
gctagaccct tcagattaaa aataactgag gtaagggcct gggtagggga ggtggtgtga 240
gacgctcctg tctctcctct atctgcccat cggccctttg gggaggagga atgtgcccaa 300
ggactaaaaa aaggccatgg agccagaggg gcgagggcaa cagacctttc atgggcaaac 360
cttggggccc tgctgtctag catgccccac tacgggtcta ggctgcccat gtaaggaggc 420
aaggcctggg gacacccgag atgcctggtt ataattaacc cagacatgtg gctgcccccc 480
cccccccaac acctgctgcc tctaaaaata accctgtccc tggtggatcc cctgcatgcg 540
aagatcttcg aacaaggctg tgggggactg agggcaggct gtaacaggct tgggggccag 600
ggcttatacg tgcctgggac tcccaaagta ttactgttcc atgttcccgg cgaagggcca 660
gctgtccccc gccagctaga ctcagcactt agtttaggaa ccagtgagca agtcagccct 720
tggggcagcc catacaaggc catggggctg ggcaagctgc acgcctgggt ccggggtggg 780
cacggtgccc gggcaacgag ctgaaagctc atctgctctc aggggcccct ccctggggac 840
agcccctcct ggctagtcac accctgtagg ctcctctata taacccaggg gcacaggggc 900
tgccctcatt ctaccaccac ctccacagca cagacagaca ctcaggagca gccagcggcg 960
cgcccaggta agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc 1020
aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt 1080
tacttctgct ctaaaagctg cggaattgta cccgcggccg cggctagcca ccatgctgag 1140
ggtcttcatc ctctatgccg agaacgtcca cacacccgac accgacatca gcgatgccta 1200
ctgctccgcg gtgtttgcag gggtgaagaa gagaaccaaa gtcatcaaga acagcgtgaa 1260
ccctgtatgg aatgagggat ttgaatggga cctcaagggc atccccctgg accagggctc 1320
tgagcttcat gtggtggtca aagaccatga gacgatgggg aggaacaggt tcctggggga 1380
agccaaggtc ccactccgag aggtcctcgc cacccctagt ctgtccgcca gcttcaatgc 1440
ccccctgctg gacaccaaga agcagcccac aggggcctcg ctggtcctgc aggtgtccta 1500
cacaccgctg cctggagctg tgcccctgtt cccgccccct actcctctgg agccctcccc 1560
gactctgcct gacctggatg tagtggcaga cacaggagga gaggaagaca cagaggacca 1620
gggactcact ggagatgagg cggagccatt cctggatcaa agcggaggcc cgggggctcc 1680
caccacccca aggaaactac cttcacgtcc tccgccccac taccccggga tcaaaagaaa 1740
gcgaagtgcg cctacatcta gaaagctgct gtcagacaaa ccgcaggatt tccagatcag 1800
ggtccaggtg atcgaggggc gccagctgcc gggggtgaac atcaagcctg tggtcaaggt 1860
taccgctgca gggcagacca agcggacgcg gatccacaag ggaaacagcc cactcttcaa 1920
tgagactctt ttcttcaact tgtttgactc tcctggggag ctgtttgatg agcccatctt 1980
tatcacggtg gtagactctc gttctctcag gacagatgct ctcctcgggg agttccggat 2040
ggacgtgggc accatttaca gagagccccg gcacgcctat ctcaggaagt ggctgctgct 2100
ctcagaccct gatgacttct ctgctggggc cagaggctac ctgaaaacaa gcctttgtgt 2160
gctggggcct ggggacgaag cgcctctgga gagaaaagac ccctctgaag acaaggagga 2220
cattgaaagc aacctgctcc ggcccacagg cgtagccctg cgaggagccc acttctgcct 2280
gaaggtcttc cgggccgagg acttgccgca gatggacgat gccgtgatgg acaacgtgaa 2340
acagatcttt ggcttcgaga gtaacaagaa gaacttggtg gacccctttg tggaggtcag 2400
ctttgcgggg aaaatgctgt gcagcaagat cttggagaag acggccaacc ctcagtggaa 2460
ccagaacatc acactgcctg ccatgtttcc ctccatgtgc gaaaaaatga ggattcgtat 2520
catagactgg gaccgcctga ctcacaatga catcgtggct accacctacc tgagtatgtc 2580
gaaaatctct gcccctggag gagaaataga agaggagcct gcaggtgctg tcaagccttc 2640
gaaagcctca gacttggatg actacctggg cttcctcccc acttttgggc cctgctacat 2700
caacctctat ggcagtccca gagagttcac aggcttccca gacccctaca cagagctcaa 2760
cacaggcaag ggggaaggtg tggcttatcg tggccggctt ctgctctccc tggagaccaa 2820
gctggtggag cacagtgaac agaaggtgga ggaccttcct gcggatgaca tcctccgggt 2880
ggagaagtac cttaggaggc gcaagtactc cctgtttgcg gccttctact cagccaccat 2940
gctgcaggat gtggatgatg ccatccagtt tgaggtcagc atcgggaact acgggaacaa 3000
gttcgacatg acctgcctgc cgctggcctc caccactcag tacagccgtg cagtctttga 3060
cgggtgccac tactactacc taccctgggg taacgtgaaa cctgtggtgg tgctgtcatc 3120
ctactgggag gacatcagcc atagaatcga gactcagaac cagctgcttg ggattgctga 3180
ccggctggaa gctggcctgg agcaggtcca cctggccctg aaggcgcagt gctccacgga 3240
ggacgtggac tcgctggtgg ctcagctgac ggatgagctc atcgcaggct gcagccagcc 3300
tctgggtgac atccatgaga caccctctgc cacccacctg gaccagtacc tgtaccagct 3360
gcgcacccat cacctgagcc aaatcactga ggctgccctg gccctgaagc tcggccacag 3420
tgagctccct gcagctctgg agcaggcgga ggactggctc ctgcgtctgc gtgccctggc 3480
agaggagccc cagaacagcc tgccggacat cgtcatctgg atgctgcagg gagacaagcg 3540
tgtggcatac cagcgggtgc ccgcccacca agtcctcttc tcccggcggg gtgccaacta 3600
ctgtggcaag aattgtggga agctacagac aatctttctg aaatatccga tggagaaggt 3660
gcctggcgcc cggatgccag tgcagatacg ggtcaagctg tggtttgggc tctctgtgga 3720
tgagaaggag ttcaaccagt ttgctgaggg gaagctgtct gtctttgctg aaacctatga 3780
gaacgagact aagttggccc ttgttgggaa ctggggcaca acgggcctca cctaccccaa 3840
gttttctgac gtcacgggca agatcaagct acccaaggac agcttccgcc cctcggccgg 3900
ctggacctgg gctggagatt ggttcgtgtg tccggagaag actctgctcc atgacatgga 3960
cgccggtcac ctgagcttcg tggaagaggt gtttgagaac cagacccggc ttcccggagg 4020
ccagtggatc tacatgagtg acaactacac cgatgtgaac ggggagaagg tgcttcccaa 4080
ggatgacatt gagtgcccac tgggctggaa gtgggaagat gaggaatggt ccacagacct 4140
caaccgggct gtcgatgagc aaggctggga gtatagcatc accatccccc cggagcggaa 4200
gccgaagcac tgggtccctg ctgagaagat gtactacaca caccgacggc ggcgctgggt 4260
gcgcctgcgc aggagggatc tcagccaaat ggaagcactg aaaaggcaca ggcaggcgga 4320
ggcggagggc gagggctggg agtacgcctc tctttttggc tggaagttcc acctcgagta 4380
ccgcaagaca gatgccttcc gccgccgccg ctggcgccgt cgcatggagc cactggagaa 4440
gacggggcct gcagctgtgt ttgcccttga gggcggccgc aataaaagat ctttattttc 4500
attagatctg tgtgttggtt ttttgtgtgt ctagagcatg gcgggttaat cattaactac 4560
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4620
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4680
cgagcgcgca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 4740
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 4800
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 4860
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 4920
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 4980
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 5040
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 5100
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 5160
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 5220
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 5280
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 5340
ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc 5400
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 5460
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 5520
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 5580
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 5640
gttttaaatc aatctaaagt atatatgagt aaaaatattc cggaattgcc agctggggcg 5700
ccctctggta aggttgggaa gccctgcaaa gtaaactgga tggctttctt gccgccaagg 5760
atctgatggc gcaggggatc aagatctgat caagagacag gatgaggatc gtttcgcatg 5820
attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag gctattcggc 5880
tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg 5940
caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag 6000
gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc agctgtgctc 6060
gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc ggggcaggat 6120
ctcctgtcat cccaccttgc tcctgccgag aaagtatcca tcatggctga tgcaatgcgg 6180
cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa acatcgcatc 6240
gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct ggacgaagag 6300
catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat gcccgacggc 6360
gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt ggaaaatggc 6420
cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata 6480
gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga ccgcttcctc 6540
gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg ccttcttgac 6600
gagttcttct gaaccggtaa tattattgaa gcatttatca gggttattgt ctcatgagcg 6660
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 6720
gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata 6780
ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa aacctctgac 6840
acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag 6900
cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac tatgcggcat 6960
cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac agatgcgtaa 7020
ggagaaaata ccgcatcagg cgattccaac atccaataaa tcatacaggc aaggcaaaga 7080
attagcaaaa ttaagcaata aagcctcaga gcataaagct aaatcggttg taccaaaaac 7140
attatgaccc tgtaatactt ttgcgggaga agcctttatt tcaacgcaag gataaaaatt 7200
tttagaaccc tcatatattt taaatgcaat gcctgagtaa tgtgtaggta aagattcaaa 7260
cgggtgagaa aggccggaga cagtcaaatc accatcaata tgatattcaa ccgttctagc 7320
tgataaattc atgccggaga gggtagctat ttttgagagg tctctacaaa ggctatcagg 7380
tcattgcctg agagtctgga gcaaacaaga gaatcgatga acggtaatcg taaaactagc 7440
atgtcaatca tatgtacccc ggttgataat cagaaaagcc ccaaaaacag gaagattgta 7500
taagcaaata tttaaattgt aagcgttaat attttgttaa aattcgcgtt aaatttttgt 7560
taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa 7620
gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag 7680
aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt 7740
gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac 7800
cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag 7860
gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg 7920
cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgta ctatggttgc 7980
tttgacgagc acgtataacg tgctttcctc gttagaatca gagcgggagc taaacaggag 8040
gccgattaaa gggattttag acaggaacgg tacgccagaa tcctgagaag tgtttttata 8100
atcagtgagg ccaccgagta aaagagtctg tccatcacgc aaattaaccg ttgtcgcaat 8160
acttctttga ttagtaataa catcacttgc ctgagtagaa gaactcaaac tatcggcctt 8220
gctggtaata tccagaacaa tattaccgcc agccattgca acggaatcgc cattcgccat 8280
tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 8340
t 8341
<210> 19
<211> 8244
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> 用于DYS F3表达盒的质粒序列
<400> 19
gtagccatgc tctggtcgac tctagagttt tcgtcatctg gatgctgcag ggagacaagc 60
gtgtggcata ccagcgggtg cccgcccacc aagtcctctt ctcccggcgg ggtgccaact 120
actgtggcaa gaattgtggg aagctacaga caatctttct gaaatatccg atggagaagg 180
tgcctggcgc ccggatgcca gtgcagatac gggtcaagct gtggtttggg ctctctgtgg 240
atgagaagga gttcaaccag tttgctgagg ggaagctgtc tgtctttgct gaaacctatg 300
agaacgagac taagttggcc cttgttggga actggggcac aacgggcctc acctacccca 360
agttttctga cgtcacgggc aagatcaagc tacccaagga cagcttccgc ccctcggccg 420
gctggacctg ggctggagat tggttcgtgt gtccggagaa gactctgctc catgacatgg 480
acgccggtca cctgagcttc gtggaagagg tgtttgagaa ccagacccgg cttcccggag 540
gccagtggat ctacatgagt gacaactaca ccgatgtgaa cggggagaag gtgcttccca 600
aggatgacat tgagtgccca ctgggctgga agtgggaaga tgaggaatgg tccacagacc 660
tcaaccgggc tgtcgatgag caaggctggg agtatagcat caccatcccc ccggagcgga 720
agccgaagca ctgggtccct gctgagaaga tgtactacac acaccgacgg cggcgctggg 780
tgcgcctgcg caggagggat ctcagccaaa tggaagcact gaaaaggcac aggcaggcgg 840
aggcggaggg cgagggctgg gagtacgcct ctctttttgg ctggaagttc cacctcgagt 900
accgcaagac agatgccttc cgccgccgcc gctggcgccg tcgcatggag ccactggaga 960
agacggggcc tgcagctgtg tttgcccttg agggggccct gggcggcgtg atggatgaca 1020
agagtgaaga ttccatgtcc gtctccacct tgagcttcgg tgtgaacaga cccacgattt 1080
cctgcatatt cgactatggg aaccgctacc atctacgctg ctacatgtac caggcccggg 1140
acctggctgc gatggacaag gactcttttt ctgatcccta tgccatcgtc tccttcctgc 1200
accagagcca gaagacggtg gtggtgaaga acacccttaa ccccacctgg gaccagacgc 1260
tcatcttcta cgagatcgag atctttggcg agccggccac agttgctgag caaccgccca 1320
gcattgtggt ggagctgtac gaccatgaca cttatggtgc agacgagttt atgggtcgct 1380
gcatctgtca accgagtctg gaacggatgc cacggctggc ctggttccca ctgacgaggg 1440
gcagccagcc gtcgggggag ctgctggcct cttttgagct catccagaga gagaagccgg 1500
ccatccacca tattcctggt tttgaggtgc aggagacatc aaggatcctg gatgagtctg 1560
aggacacaga cctgccctac ccaccacccc agagggaggc caacatctac atggttcctc 1620
agaacatcaa gccagcgctc cagcgtaccg ccatcgagat cctggcatgg ggcctgcgga 1680
acatgaagag ttaccagctg gccaacatct cctcccccag cctcgtggta gagtgtgggg 1740
gccagacggt gcagtcctgt gtcatcagga acctccggaa gaaccccaac tttgacatct 1800
gcaccctctt catggaagtg atgctgccca gggaggagct ctactgcccc cccatcaccg 1860
tcaaggtcat cgataaccgc cagtttggcc gccggcctgt ggtgggccag tgtaccatcc 1920
gctccctgga gagcttcctg tgtgacccct actcggcgga gagtccatcc ccacagggtg 1980
gcccagacga tgtgagccta ctcagtcctg gggaagacgt gctcatcgac attgatgaca 2040
aggagcccct catccccatc caggaggaag agttcatcga ttggtggagc aaattctttg 2100
cctccatagg ggagagggaa aagtgcggct cctacctgga gaaggatttt gacaccctga 2160
aggtctatga cacacagctg gagaatgtgg aggcctttga gggcctgtct gacttttgta 2220
acaccttcaa gctgtaccgg ggcaagacgc aggaggagac agaagatcca tctgtgattg 2280
gtgaatttaa gggcctcttc aaaatttatc ccctcccaga agacccagcc atccccatgc 2340
ccccaagaca gttccaccag ctggccgccc agggacccca ggagtgcttg gtccgtatct 2400
acattgtccg agcatttggc ctgcagccca aggaccccaa tggaaagtgt gatccttaca 2460
tcaagatctc catagggaag aaatcagtga gtgaccagga taactacatc ccctgcacgc 2520
tggagcccgt atttggaaag atgttcgagc tgacctgcac tctgcctctg gagaaggacc 2580
taaagatcac tctctatgac tatgacctcc tctccaagga cgaaaagatc ggtgagacgg 2640
tcgtcgacct ggagaacagg ctgctgtcca agtttggggc tcgctgtgga ctcccacaga 2700
cctactgtgt ctctggaccg aaccagtggc gggaccagct ccgcccctcc cagctcctcc 2760
acctcttctg ccagcagcat agagtcaagg cacctgtgta ccggacagac cgtgtaatgt 2820
ttcaggataa agaatattcc attgaagaga tagaggctgg caggatccca aacccacacc 2880
tgggcccagt ggaggagcgt ctggctctgc atgtgcttca gcagcagggc ctggtcccgg 2940
agcacgtgga gtcacggccc ctctacagcc ccctgcagcc agacatcgag caggggaagc 3000
tgcagatgtg ggtcgaccta tttccgaagg ccctggggcg gcctggacct cccttcaaca 3060
tcaccccacg gagagccaga aggtttttcc tgcgttgtat tatctggaat accagagatg 3120
tgatcctgga tgacctgagc ctcacggggg agaagatgag cgacatttat gtgaaaggtt 3180
ggatgattgg ctttgaagaa cacaagcaaa agacagacgt gcattatcgt tccctgggag 3240
gtgaaggcaa cttcaactgg aggttcattt tccccttcga ctacctgcca gctgagcaag 3300
tctgtaccat tgccaagaag gatgccttct ggaggctgga caagactgag agcaaaatcc 3360
cagcacgagt ggtgttccag atctgggaca atgacaagtt ctcctttgat gattttctgg 3420
gctccctgca gctcgatctc aaccgcatgc ccaagccagc caagacagcc aagaagtgct 3480
ccttggacca gctggatgat gctttccacc cagaatggtt tgtgtccctt tttgagcaga 3540
aaacagtgaa gggctggtgg ccctgtgtag cagaagaggg tgagaagaaa atactggcgg 3600
gcaagctgga aatgaccttg gagattgtag cagagagtga gcatgaggag cggcctgctg 3660
gccagggccg ggatgagccc aacatgaacc ctaagcttga ggacccaagg cgccccgaca 3720
cctccttcct gtggtttacc tccccataca agaccatgaa gttcatcctg tggcggcgtt 3780
tccggtgggc catcatcctc ttcatcatcc tcttcatcct gctgctgttc ctggccatct 3840
tcatctacgc cttcccgaac tatgctgcca tgaagctggt gaagcccttc agctgaggac 3900
tctcctgccc tgtagaaggg gccgtggggt cccctccagc atgggactgg cctgcctcct 3960
ccgcccagct cggcgagctc ctccagacct cctaggcctg attgtcctgc cagggtgggc 4020
agacagacag atggaccggc ccacactccc agagttgcta acatggagct ctgagatcac 4080
cccacttcca tcatttcctt ctcccccaac ccaacgcttt tttggatcag ctcagacata 4140
tttcagtata aaacagttgg aaccacaaaa aaaaaaaaaa aaagtcgacg cggccgcaat 4200
aaaagatctt tattttcatt agatctgtgt gttggttttt tgtgtgtcta gagcatggct 4260
acgtagataa gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt 4320
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 4380
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcattaatg 4440
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 4500
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 4560
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 4620
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 4680
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4740
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4800
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4860
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4920
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4980
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 5040
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 5100
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 5160
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 5220
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 5280
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 5340
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 5400
atatgagtaa aaatattccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc 5460
cctgcaaagt aaactggatg gctttcttgc cgccaaggat ctgatggcgc aggggatcaa 5520
gatctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg 5580
caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa 5640
tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg 5700
tcaagaccga cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt 5760
ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa 5820
gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatcc caccttgctc 5880
ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg 5940
ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg 6000
aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg 6060
aactgttcgc caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg 6120
gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact 6180
gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg 6240
ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc 6300
ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga accggtaata 6360
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 6420
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 6480
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 6540
tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt 6600
cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg 6660
tgttggcggg tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt 6720
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 6780
attccaacat ccaataaatc atacaggcaa ggcaaagaat tagcaaaatt aagcaataaa 6840
gcctcagagc ataaagctaa atcggttgta ccaaaaacat tatgaccctg taatactttt 6900
gcgggagaag cctttatttc aacgcaagga taaaaatttt tagaaccctc atatatttta 6960
aatgcaatgc ctgagtaatg tgtaggtaaa gattcaaacg ggtgagaaag gccggagaca 7020
gtcaaatcac catcaatatg atattcaacc gttctagctg ataaattcat gccggagagg 7080
gtagctattt ttgagaggtc tctacaaagg ctatcaggtc attgcctgag agtctggagc 7140
aaacaagaga atcgatgaac ggtaatcgta aaactagcat gtcaatcata tgtaccccgg 7200
ttgataatca gaaaagcccc aaaaacagga agattgtata agcaaatatt taaattgtaa 7260
gcgttaatat tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc 7320
aataggccga aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga 7380
gtgttgttcc agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag 7440
ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt 7500
ttttggggtc gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta 7560
gagcttgacg gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag 7620
cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg 7680
cgcttaatgc gccgctacag ggcgcgtact atggttgctt tgacgagcac gtataacgtg 7740
ctttcctcgt tagaatcaga gcgggagcta aacaggaggc cgattaaagg gattttagac 7800
aggaacggta cgccagaatc ctgagaagtg tttttataat cagtgaggcc accgagtaaa 7860
agagtctgtc catcacgcaa attaaccgtt gtcgcaatac ttctttgatt agtaataaca 7920
tcacttgcct gagtagaaga actcaaacta tcggccttgc tggtaatatc cagaacaata 7980
ttaccgccag ccattgcaac ggaatcgcca ttcgccattc aggctgcgca actgttggga 8040
agggcgatcg gtgcgggcct cttcgctatt acgccagctg cgcgctcgct cgctcactga 8100
ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct cagtgagcga 8160
gcgagcgcgc agagagggag tggccaactc catcactagg ggttccttgt agttaatgat 8220
taacccgcca tgctacttat ctac 8244
<210> 20
<211> 7906
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> 完整的DYF表达盒
<400> 20
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120
gggttccttg tagttaatga ttaacccgcc atgctctaga gtttaagctt gcatgtctaa 180
gctagaccct tcagattaaa aataactgag gtaagggcct gggtagggga ggtggtgtga 240
gacgctcctg tctctcctct atctgcccat cggccctttg gggaggagga atgtgcccaa 300
ggactaaaaa aaggccatgg agccagaggg gcgagggcaa cagacctttc atgggcaaac 360
cttggggccc tgctgtctag catgccccac tacgggtcta ggctgcccat gtaaggaggc 420
aaggcctggg gacacccgag atgcctggtt ataattaacc cagacatgtg gctgcccccc 480
cccccccaac acctgctgcc tctaaaaata accctgtccc tggtggatcc cctgcatgcg 540
aagatcttcg aacaaggctg tgggggactg agggcaggct gtaacaggct tgggggccag 600
ggcttatacg tgcctgggac tcccaaagta ttactgttcc atgttcccgg cgaagggcca 660
gctgtccccc gccagctaga ctcagcactt agtttaggaa ccagtgagca agtcagccct 720
tggggcagcc catacaaggc catggggctg ggcaagctgc acgcctgggt ccggggtggg 780
cacggtgccc gggcaacgag ctgaaagctc atctgctctc aggggcccct ccctggggac 840
agcccctcct ggctagtcac accctgtagg ctcctctata taacccaggg gcacaggggc 900
tgccctcatt ctaccaccac ctccacagca cagacagaca ctcaggagca gccagcggcg 960
cgcccaggta agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc 1020
aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt 1080
tacttctgct ctaaaagctg cggaattgta cccgcggccg cggctagcca ccatgctgag 1140
ggtcttcatc ctctatgccg agaacgtcca cacacccgac accgacatca gcgatgccta 1200
ctgctccgcg gtgtttgcag gggtgaagaa gagaaccaaa gtcatcaaga acagcgtgaa 1260
ccctgtatgg aatgagggat ttgaatggga cctcaagggc atccccctgg accagggctc 1320
tgagcttcat gtggtggtca aagaccatga gacgatgggg aggaacaggt tcctggggga 1380
agccaaggtc ccactccgag aggtcctcgc cacccctagt ctgtccgcca gcttcaatgc 1440
ccccctgctg gacaccaaga agcagcccac aggggcctcg ctggtcctgc aggtgtccta 1500
cacaccgctg cctggagctg tgcccctgtt cccgccccct actcctctgg agccctcccc 1560
gactctgcct gacctggatg tagtggcaga cacaggagga gaggaagaca cagaggacca 1620
gggactcact ggagatgagg cggagccatt cctggatcaa agcggaggcc cgggggctcc 1680
caccacccca aggaaactac cttcacgtcc tccgccccac taccccggga tcaaaagaaa 1740
gcgaagtgcg cctacatcta gaaagctgct gtcagacaaa ccgcaggatt tccagatcag 1800
ggtccaggtg atcgaggggc gccagctgcc gggggtgaac atcaagcctg tggtcaaggt 1860
taccgctgca gggcagacca agcggacgcg gatccacaag ggaaacagcc cactcttcaa 1920
tgagactctt ttcttcaact tgtttgactc tcctggggag ctgtttgatg agcccatctt 1980
tatcacggtg gtagactctc gttctctcag gacagatgct ctcctcgggg agttccggat 2040
ggacgtgggc accatttaca gagagccccg gcacgcctat ctcaggaagt ggctgctgct 2100
ctcagaccct gatgacttct ctgctggggc cagaggctac ctgaaaacaa gcctttgtgt 2160
gctggggcct ggggacgaag cgcctctgga gagaaaagac ccctctgaag acaaggagga 2220
cattgaaagc aacctgctcc ggcccacagg cgtagccctg cgaggagccc acttctgcct 2280
gaaggtcttc cgggccgagg acttgccgca gatggacgat gccgtgatgg acaacgtgaa 2340
acagatcttt ggcttcgaga gtaacaagaa gaacttggtg gacccctttg tggaggtcag 2400
ctttgcgggg aaaatgctgt gcagcaagat cttggagaag acggccaacc ctcagtggaa 2460
ccagaacatc acactgcctg ccatgtttcc ctccatgtgc gaaaaaatga ggattcgtat 2520
catagactgg gaccgcctga ctcacaatga catcgtggct accacctacc tgagtatgtc 2580
gaaaatctct gcccctggag gagaaataga agaggagcct gcaggtgctg tcaagccttc 2640
gaaagcctca gacttggatg actacctggg cttcctcccc acttttgggc cctgctacat 2700
caacctctat ggcagtccca gagagttcac aggcttccca gacccctaca cagagctcaa 2760
cacaggcaag ggggaaggtg tggcttatcg tggccggctt ctgctctccc tggagaccaa 2820
gctggtggag cacagtgaac agaaggtgga ggaccttcct gcggatgaca tcctccgggt 2880
ggagaagtac cttaggaggc gcaagtactc cctgtttgcg gccttctact cagccaccat 2940
gctgcaggat gtggatgatg ccatccagtt tgaggtcagc atcgggaact acgggaacaa 3000
gttcgacatg acctgcctgc cgctggcctc caccactcag tacagccgtg cagtctttga 3060
cgggtgccac tactactacc taccctgggg taacgtgaaa cctgtggtgg tgctgtcatc 3120
ctactgggag gacatcagcc atagaatcga gactcagaac cagctgcttg ggattgctga 3180
ccggctggaa gctggcctgg agcaggtcca cctggccctg aaggcgcagt gctccacgga 3240
ggacgtggac tcgctggtgg ctcagctgac ggatgagctc atcgcaggct gcagccagcc 3300
tctgggtgac atccatgaga caccctctgc cacccacctg gaccagtacc tgtaccagct 3360
gcgcacccat cacctgagcc aaatcactga ggctgccctg gccctgaagc tcggccacag 3420
tgagctccct gcagctctgg agcaggcgga ggactggctc ctgcgtctgc gtgccctggc 3480
agaggagccc cagaacagcc tgccggacat cgtcatctgg atgctgcagg gagacaagcg 3540
tgtggcatac cagcgggtgc ccgcccacca agtcctcttc tcccggcggg gtgccaacta 3600
ctgtggcaag aattgtggga agctacagac aatctttctg aaatatccga tggagaaggt 3660
gcctggcgcc cggatgccag tgcagatacg ggtcaagctg tggtttgggc tctctgtgga 3720
tgagaaggag ttcaaccagt ttgctgaggg gaagctgtct gtctttgctg aaacctatga 3780
gaacgagact aagttggccc ttgttgggaa ctggggcaca acgggcctca cctaccccaa 3840
gttttctgac gtcacgggca agatcaagct acccaaggac agcttccgcc cctcggccgg 3900
ctggacctgg gctggagatt ggttcgtgtg tccggagaag actctgctcc atgacatgga 3960
cgccggtcac ctgagcttcg tggaagaggt gtttgagaac cagacccggc ttcccggagg 4020
ccagtggatc tacatgagtg acaactacac cgatgtgaac ggggagaagg tgcttcccaa 4080
ggatgacatt gagtgcccac tgggctggaa gtgggaagat gaggaatggt ccacagacct 4140
caaccgggct gtcgatgagc aaggctggga gtatagcatc accatccccc cggagcggaa 4200
gccgaagcac tgggtccctg ctgagaagat gtactacaca caccgacggc ggcgctgggt 4260
gcgcctgcgc aggagggatc tcagccaaat ggaagcactg aaaaggcaca ggcaggcgga 4320
ggcggagggc gagggctggg agtacgcctc tctttttggc tggaagttcc acctcgagta 4380
ccgcaagaca gatgccttcc gccgccgccg ctggcgccgt cgcatggagc cactggagaa 4440
gacggggcct gcagctgtgt ttgcccttga gggggccctg ggcggcgtga tggatgacaa 4500
gagtgaagat tccatgtccg tctccacctt gagcttcggt gtgaacagac ccacgatttc 4560
ctgcatattc gactatggga accgctacca tctacgctgc tacatgtacc aggcccggga 4620
cctggctgcg atggacaagg actctttttc tgatccctat gccatcgtct ccttcctgca 4680
ccagagccag aagacggtgg tggtgaagaa cacccttaac cccacctggg accagacgct 4740
catcttctac gagatcgaga tctttggcga gccggccaca gttgctgagc aaccgcccag 4800
cattgtggtg gagctgtacg accatgacac ttatggtgca gacgagttta tgggtcgctg 4860
catctgtcaa ccgagtctgg aacggatgcc acggctggcc tggttcccac tgacgagggg 4920
cagccagccg tcgggggagc tgctggcctc ttttgagctc atccagagag agaagccggc 4980
catccaccat attcctggtt ttgaggtgca ggagacatca aggatcctgg atgagtctga 5040
ggacacagac ctgccctacc caccacccca gagggaggcc aacatctaca tggttcctca 5100
gaacatcaag ccagcgctcc agcgtaccgc catcgagatc ctggcatggg gcctgcggaa 5160
catgaagagt taccagctgg ccaacatctc ctcccccagc ctcgtggtag agtgtggggg 5220
ccagacggtg cagtcctgtg tcatcaggaa cctccggaag aaccccaact ttgacatctg 5280
caccctcttc atggaagtga tgctgcccag ggaggagctc tactgccccc ccatcaccgt 5340
caaggtcatc gataaccgcc agtttggccg ccggcctgtg gtgggccagt gtaccatccg 5400
ctccctggag agcttcctgt gtgaccccta ctcggcggag agtccatccc cacagggtgg 5460
cccagacgat gtgagcctac tcagtcctgg ggaagacgtg ctcatcgaca ttgatgacaa 5520
ggagcccctc atccccatcc aggaggaaga gttcatcgat tggtggagca aattctttgc 5580
ctccataggg gagagggaaa agtgcggctc ctacctggag aaggattttg acaccctgaa 5640
ggtctatgac acacagctgg agaatgtgga ggcctttgag ggcctgtctg acttttgtaa 5700
caccttcaag ctgtaccggg gcaagacgca ggaggagaca gaagatccat ctgtgattgg 5760
tgaatttaag ggcctcttca aaatttatcc cctcccagaa gacccagcca tccccatgcc 5820
cccaagacag ttccaccagc tggccgccca gggaccccag gagtgcttgg tccgtatcta 5880
cattgtccga gcatttggcc tgcagcccaa ggaccccaat ggaaagtgtg atccttacat 5940
caagatctcc atagggaaga aatcagtgag tgaccaggat aactacatcc cctgcacgct 6000
ggagcccgta tttggaaaga tgttcgagct gacctgcact ctgcctctgg agaaggacct 6060
aaagatcact ctctatgact atgacctcct ctccaaggac gaaaagatcg gtgagacggt 6120
cgtcgacctg gagaacaggc tgctgtccaa gtttggggct cgctgtggac tcccacagac 6180
ctactgtgtc tctggaccga accagtggcg ggaccagctc cgcccctccc agctcctcca 6240
cctcttctgc cagcagcata gagtcaaggc acctgtgtac cggacagacc gtgtaatgtt 6300
tcaggataaa gaatattcca ttgaagagat agaggctggc aggatcccaa acccacacct 6360
gggcccagtg gaggagcgtc tggctctgca tgtgcttcag cagcagggcc tggtcccgga 6420
gcacgtggag tcacggcccc tctacagccc cctgcagcca gacatcgagc aggggaagct 6480
gcagatgtgg gtcgacctat ttccgaaggc cctggggcgg cctggacctc ccttcaacat 6540
caccccacgg agagccagaa ggtttttcct gcgttgtatt atctggaata ccagagatgt 6600
gatcctggat gacctgagcc tcacggggga gaagatgagc gacatttatg tgaaaggttg 6660
gatgattggc tttgaagaac acaagcaaaa gacagacgtg cattatcgtt ccctgggagg 6720
tgaaggcaac ttcaactgga ggttcatttt ccccttcgac tacctgccag ctgagcaagt 6780
ctgtaccatt gccaagaagg atgccttctg gaggctggac aagactgaga gcaaaatccc 6840
agcacgagtg gtgttccaga tctgggacaa tgacaagttc tcctttgatg attttctggg 6900
ctccctgcag ctcgatctca accgcatgcc caagccagcc aagacagcca agaagtgctc 6960
cttggaccag ctggatgatg ctttccaccc agaatggttt gtgtcccttt ttgagcagaa 7020
aacagtgaag ggctggtggc cctgtgtagc agaagagggt gagaagaaaa tactggcggg 7080
caagctggaa atgaccttgg agattgtagc agagagtgag catgaggagc ggcctgctgg 7140
ccagggccgg gatgagccca acatgaaccc taagcttgag gacccaaggc gccccgacac 7200
ctccttcctg tggtttacct ccccatacaa gaccatgaag ttcatcctgt ggcggcgttt 7260
ccggtgggcc atcatcctct tcatcatcct cttcatcctg ctgctgttcc tggccatctt 7320
catctacgcc ttcccgaact atgctgccat gaagctggtg aagcccttca gctgaggact 7380
ctcctgccct gtagaagggg ccgtggggtc ccctccagca tgggactggc ctgcctcctc 7440
cgcccagctc ggcgagctcc tccagacctc ctaggcctga ttgtcctgcc agggtgggca 7500
gacagacaga tggaccggcc cacactccca gagttgctaa catggagctc tgagatcacc 7560
ccacttccat catttccttc tcccccaacc caacgctttt ttggatcagc tcagacatat 7620
ttcagtataa aacagttgga accacaaaaa aaaaaaaaaa aagtcgacgc ggccgcaata 7680
aaagatcttt attttcatta gatctgtgtg ttggtttttt gtgtgtctag agcatggcta 7740
cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 7800
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 7860
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgc 7906
<210> 21
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的6xHis 标签
<400> 21
His His His His His His
1 5
<210> 22
<211> 250
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<221> misc_feature
<222> (1)..(250)
<223> 此序列可以涵盖100-250个核苷酸
<400> 22
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240
aaaaaaaaaa 250
Claims (135)
1.一种编码人dysferlin(hDYSF)蛋白的片段的重组多核苷酸,其中所述重组多核苷酸包含第一核苷酸序列,其中所述第一核苷酸序列由以下组成:
(a)SEQ ID NO: 1、6、或18的核苷酸序列;
(b)核苷酸序列,其与SEQ ID NO: 1、SEQ ID NO: 6或SEQ ID NO: 18的核苷酸序列在SEQ ID NO: 1、6或18各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;
(c)SEQ ID NO: 13或15的核苷酸序列;
(d)核苷酸序列,其与SEQ ID NO: 13或15的核苷酸序列在SEQ ID NO: 13或15各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;
(e)编码hDYSF蛋白的片段的核苷酸序列,其中所述片段由SEQ ID NO: 9的氨基酸序列组成;或者
(f)核苷酸序列,其与(e)的核苷酸序列在(e)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性。
2.根据权利要求1所述的重组多核苷酸,其进一步包含一个或多个选自末端反向重复序列(ITR)、启动子、内含子、选择标志物或复制原点(ORI)的另外的核苷酸序列。
3.根据权利要求2所述的重组多核苷酸,其中所述ITR是AAV ITR。
4.根据权利要求3所述的重组多核苷酸,其中所述AAV ITR是AAV2 ITR或AAV3 ITR。
5.根据权利要求2至4中任一项所述的重组多核苷酸,其中所述重组多核苷酸包含两个ITR。
6.根据权利要求2至5中任一项所述的重组多核苷酸,其中所述ITR包含SEQ ID NO: 3或SEQ ID NO: 17的核苷酸序列。
7.根据权利要求2至6所述的重组多核苷酸,其中所述启动子包含肌肉特异性启动子。
8.根据权利要求7所述的重组多核苷酸,其中所述肌肉特异性启动子选自人骨骼肌动蛋白基因元件、心脏肌动蛋白基因元件、肌间线蛋白启动子、骨骼α-肌动蛋白(ASKA)启动子、肌钙蛋白I(TNNI2)启动子、心肌特异性增强子结合因子mef结合元件、肌肉肌酸激酶(MCK)启动子、截短的MCK(tMCK)启动子、肌球蛋白重链(MHC)启动子、混合肌球蛋白重链增强子/MCK增强子-启动子(MHCK7)启动子、C5-12启动子、小鼠肌酸激酶增强子元件、骨骼快收缩肌钙蛋白c基因元件、慢收缩心肌肌钙蛋白c基因元件、慢收缩肌钙蛋白i基因元件、低氧诱导性核因子。
9.根据权利要求7所述的重组多核苷酸,其中所述肌肉特异性启动子包含MHCK7启动子。
10.根据权利要求2至6中任一项所述的重组多核苷酸,其中所述启动子包含重组启动子。
11.根据权利要求10所述的重组多核苷酸,其中所述重组启动子包含重组肌肉特异性启动子。
12.根据权利要求2至11中任一项所述的重组多核苷酸,其中所述启动子包含SEQ IDNO: 4的核苷酸序列。
13.根据权利要求2至12中任一项所述的重组多核苷酸,其中所述内含子包含5'供体位点、分支点和/或3'剪接位点。
14.根据权利要求2至13中任一项所述的重组多核苷酸,其中所述内含子包含嵌合内含子。
15.根据权利要求2至14中任一项所述的重组多核苷酸,其中所述内含子包含来自人类β-球蛋白基因的5'供体位点。
16.根据权利要求2至15中任一项所述的重组多核苷酸,其中所述内含子包含来自免疫球蛋白G(IgG)重链的分支点。
17.根据权利要求2至16中任一项所述的重组多核苷酸,其中所述内含子包含来自免疫球蛋白G(IgG)重链的3′剪接受体位点。
18.根据权利要求2至17中任一项所述的重组多核苷酸,其中所述内含子包含SEQ IDNO:5的核苷酸序列。
19.根据权利要求2至18中任一项所述的重组多核苷酸,其中所述选择标志物是抗生素抗性基因。
20.根据权利要求19所述的重组多核苷酸,其中所述抗生素抗性基因是β-内酰胺酶基因或卡那霉素抗性基因。
21.根据权利要求1所述的重组多核苷酸,其中所述重组多核苷酸包含SEQ ID NO: 6或SEQ ID NO: 18的核苷酸序列。
22.根据权利要求1至21中任一项所述的重组多核苷酸,其中所述重组核苷酸进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
23.根据权利要求1至22中任一项所述的重组多核苷酸,其中所述重组核苷酸不包含除一个或多个ITR以外的AAV序列。
24.根据权利要求1至22中任一项所述的重组多核苷酸,其中所述重组核苷酸不包含除一个或多个ITR以外的病毒序列。
25.一种编码人dysferlin蛋白的片段的重组多核苷酸序列,其中所述重组多核苷酸包含第二核苷酸序列,其中所述第二核苷酸序列由以下组成:
(a)SEQ ID NO:2、8或19的核苷酸序列;
(b)核苷酸序列,其与SEQ ID NO:2、8或19的核苷酸序列在SEQ ID NO:2、8或19各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;
(c)SEQ ID NO: 14或16的核苷酸序列;
(d)核苷酸序列,其与SEQ ID NO: 14或16的核苷酸序列在SEQ ID NO: 14或16各自的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;
(e)编码hDYSF蛋白的片段的多核苷酸序列,其中所述hDYSF蛋白的片段由SEQ ID NO:10的氨基酸序列组成;或者
(f)多核苷酸序列,其与(e)的多核苷酸序列在(d)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性。
26.根据权利要求25所述的重组多核苷酸,其进一步包含一个或多个包含末端反向重复序列(ITR)、选择标志物、复制原点(ORI)、非翻译区(UTR)或多腺苷酸化(polyA)信号的另外的核苷酸。
27.根据权利要求26所述的重组多核苷酸,其中所述ITR是AAV ITR。
28.根据权利要求27所述的重组多核苷酸,其中所述AAV ITR是AAV2 ITR或AAV3 ITR。
29.根据权利要求25、27或28中任一项所述的重组核苷酸,其中所述重组核苷酸进一步包含两个ITR。
30.根据权利要求26至29中任一项所述的重组多核苷酸,其中所述ITR包含SEQ ID NO:3或17的核苷酸序列。
31.根据权利要求26至30中任一项所述的重组多核苷酸,其中所述polyA信号是人工polyA信号。
32.根据权利要求26至31中任一项所述的重组多核苷酸,其中所述polyA信号包含SEQID NO: 7的核苷酸序列。
33.根据权利要求26至32中任一项所述的重组多核苷酸,其中所述选择标志物包含抗生素抗性基因。
34.根据权利要求33所述的重组多核苷酸,其中所述抗生素抗性基因包含β-内酰胺酶基因或卡那霉素抗性基因。
35.根据权利要求25所述的重组多核苷酸,其中所述重组多核苷酸包含SEQ ID NO: 8或SEQ ID NO: 19的核苷酸序列。
36.根据权利要求25至35中任一项所述的重组多核苷酸,其中所述重组核苷酸进一步不包含编码hDYSF蛋白的第一片段的第一多核苷酸序列。
37.根据权利要求25至36中任一项所述的重组多核苷酸,其中所述重组核苷酸不包含除一个或多个ITR以外的AAV序列。
38.根据权利要求25至36中任一项所述的重组多核苷酸,其中所述重组核苷酸不包含除一个或多个ITR以外的病毒序列。
39.一种双腺相关病毒(AAV)载体系统,其包含:
(a)第一AAV载体,其中所述第一AAV载体包含权利要求1至24中任一项所述的重组多核苷酸;和
(b)第二AAV载体,其中所述第二AAV载体包含权利要求25至38中任一项所述的重组多核苷酸。
40.一种包含权利要求1至24中任一项所述的重组多核苷酸的腺相关病毒(AAV)载体。
41.根据权利要求40所述的AAV载体,其中所述AAV载体是AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13、AAVrh.10、AAVrh.20或AAVrh.74。
42.根据权利要求40所述的AAV载体,其中所述AAV载体是AAVrh.74。
43.一种包含权利要求25至38中任一项所述的重组多核苷酸的腺相关病毒(AAV)载体。
44.根据权利要求43所述的AAV载体,其中所述AAV载体是AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13、AAVrh.10、AAVrh.20或AAVrh.74。
45.根据权利要求43所述的AAV载体,其中所述AAV载体是AAVrh.74。
46.一种包含权利要求1-38中任一项所述的重组多核苷酸或权利要求40至45中任一项所述的AAV载体的组合物。
47.一种组合物,其包含:
(a)第一重组腺相关病毒(rAAV)载体,其中所述第一rAAV载体包含根据权利要求40至42中任一项所述的AAV载体;以及
(b)第二rAAV载体,其中所述第二rAAV载体包含根据权利要求43至45中任一项所述的AAV载体。
48.根据权利要求47所述的组合物,其中第一和第二rAAV载体的摩尔比值在约100:1-1:100、约10:1-1:10、约2:1-1:2或约1:1之间。
49.一种腺相关病毒(AAV)载体,其包含:
(a)第一末端反向重复序列(ITR);
(b)编码人dysferlin(hDYSF)蛋白的片段的多核苷酸,其中所述多核苷酸由以下组成;
i. SEQ ID NO: 1或6的核苷酸序列;
ii. 核苷酸序列,其与SEQ ID NO: 1或6的核苷酸序列在SEQ ID NO: 1或6的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;
iii. SEQ ID NO: 13或15的核苷酸序列;
iv. 核苷酸序列,其与SEQ ID NO: 13或15的核苷酸序列在SEQ ID NO: 13或15的全长有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;
v. 编码hDYSF蛋白的片段的核苷酸序列,其中所述hDYSF蛋白的片段由SEQ ID NO: 9的氨基酸序列组成;或者
vi. 核苷酸序列,其与(v)的核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;以及
(c)第二ITR,
其中,多核苷酸的侧翼为第一和第二ITR。
50.根据权利要求49所述的AAV载体,其进一步包含一个或多个选自启动子、内含子、选择标志物或复制原点(ORI)的另外的多核苷酸。
51.根据权利要求49或50所述的AAV载体,其中所述ITR是AAV ITR。
52.根据权利要求51所述的AAV载体,其中所述AAV ITR是AAV2 ITR或AAV3 ITR。
53.根据权利要求49至52中任一项所述的AAV载体,其中第一和/或第二ITR包含SEQ IDNO:3或17的核苷酸序列。
54.根据权利要求50至53中任一项所述的AAV载体,其中所述启动子是肌肉特异性启动子。
55.根据权利要求54所述的AAV载体,其中所述肌肉特异性启动子是肌球蛋白重链复合物-E盒肌肉肌酸激酶融合增强子/启动子。
56.根据权利要求50至53中任一项所述的AAV载体,其中所述启动子是重组启动子。
57.根据权利要求56所述的AAV载体,其中所述重组启动子是重组肌肉特异性启动子。
58.根据权利要求57所述的AAV载体,其中所述重组肌肉特异性启动子是MHCK7启动子。
59.根据权利要求50至58中任一项所述的AAV载体,其中所述启动子包含SEQ ID NO: 4的核苷酸序列。
60.根据权利要求50至59中任一项所述的AAV载体,其中所述内含子包含5'供体位点、分支点和/或3'剪接位点。
61.根据权利要求50至60中任一项所述的AAV载体,其中所述内含子是嵌合内含子。
62.根据权利要求50至61中任一项所述的AAV载体,其中所述内含子包含来自人β-球蛋白基因的5′供体位点。
63.根据权利要求50至62中任一项所述的AAV载体,其中所述内含子包含来自免疫球蛋白G(IgG)重链的分支点。
64.根据权利要求50至63中任一项所述的AAV载体,其中所述内含子包含来自免疫球蛋白G(IgG)重链的3'剪接受体位点。
65.根据权利要求50至64中任一项所述的AAV载体,其中所述内含子包含SEQ ID NO: 5的核苷酸序列。
66.根据权利要求50至65中任一项所述的AAV载体,其中所述选择标志物是抗生素抗性基因。
67.根据权利要求66所述的AAV载体,其中所述抗生素抗性基因是β-内酰胺酶基因或卡那霉素抗性基因。
68.根据权利要求49至67中任一项所述的AAV载体,其中所述AAV载体包含SEQ ID NO:6或SEQ ID NO: 15的核苷酸序列。
69.根据权利要求49至68中任一项所述的AAV载体,其中所述AAV载体进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
70.根据权利要求49至69中任一项所述的AAV载体,其中所述AAV载体不包含除一个或多个ITR以外的AAV序列。
71.根据权利要求49至69中任一项所述的AAV载体,其中所述AAV载体不包含除一个或多个ITR以外的病毒序列。
72.一种腺相关病毒(AAV)载体,其包含:
(a)第一末端反向重复序列(ITR);
(b)编码人dysferlin蛋白的片段的多核苷酸,其中所述多核苷酸由以下组成:
i. SEQ ID NO: 2或8的核苷酸序列;
ii. 核苷酸序列,其与SEQ ID NO: 2或8的核苷酸序列在SEQ ID NO: 2或8的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;
iii. SEQ ID NO: 14或16的核苷酸序列;
iv. 核苷酸序列,其与SEQ ID NO: 14或16的核苷酸序列在SEQ ID NO: 14或16的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;
v. 编码hDYSF蛋白的片段的多核苷酸,其中所述hDYSF蛋白的片段由SEQ ID NO: 10的氨基酸序列组成;或者
vi. 多核苷酸,其与(v)的多核苷酸序列在(v)的核苷酸序列的全长上有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;以及
(c)第二ITR,
其中,多核苷酸的侧翼为第一和第二ITR。
73.根据权利要求72所述的AAV载体,其进一步包含选自选择标志物、复制原点(ORI)、非翻译区(UTR)或多腺苷酸化(polyA)信号的一个或多个多核苷酸。
74.根据权利要求72或73所述的AAV载体,其中所述ITR是AAV ITR。
75.根据权利要求74所述的AAV载体,其中所述AAV ITR是AAV2 ITR或AAV3 ITR。
76.根据权利要求72至75中任一项所述的AAV载体,其中所述ITR包含SEQ ID NO:3或17的核苷酸序列。
77.根据权利要求73至76中任一项所述的AAV载体,其中所述polyA信号是人工polyA信号。
78.根据权利要求73至77中任一项所述的AAV载体,其中所述polyA信号包含SEQ IDNO: 7的核苷酸序列。
79.根据权利要求73至78中任一项所述的AAV载体,其中所述选择标志物是抗生素抗性基因。
80.根据权利要求79所述的AAV载体,其中所述抗生素抗性基因是β-内酰胺酶基因或卡那霉素抗性基因。
81.根据权利要求72至80中任一项所述的AAV载体,其中所述AAV载体包含SEQ ID NO:8或SEQ ID NO: 16的核苷酸序列。
82.根据权利要求72至81中任一项所述的AAV载体,其中所述AAV载体进一步不包含编码hDYSF蛋白的第二片段的第二多核苷酸序列。
83.根据权利要求72至82中任一项所述的AAV载体,其中所述AAV载体不包含除一个或多个ITR以外的AAV序列。
84.根据权利要求72至82中任一项所述的AAV载体,其中所述AAV载体不包含除一个或多个ITR以外的病毒序列。
85.一种双腺相关病毒(AAV)载体系统,其包含
(a)第一AAV载体,其中所述第一AAV载体包含根据权利要求40至42和49至71中任一项所述的AAV载体;和
(b)第二AAV载体,其中所述第二AAV载体包含根据权利要求43至45和72至84中任一项所述的AAV载体。
86.根据权利要求85所述的双腺相关病毒(AAV)载体系统,其中所述AAV载体是AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13、AAVrh.10、AAVrh.20或AAVrh.74。
87.根据权利要求85所述的双腺相关病毒(AAV)载体系统,所述AAV载体为AAVrh.74。
88.一种腺相关病毒(AAV)包装系统,其包含:
(a)质粒,其包含权利要求1至38中任一项所述的重组多核苷酸;
(b)腺病毒辅助质粒;以及
(c)rep-cap质粒。
89.一种腺相关病毒包装系统,其包含:
(a)质粒,其包含权利要求1至38中任一项所述的重组多核苷酸;以及
(b)腺病毒辅助质粒。
90.根据权利要求88或89所述的腺相关病毒包装系统,其中所述腺病毒辅助质粒包含pHELP质粒。
91.一种产生腺相关病毒(AAV)载体的方法,其包含使细胞与包含权利要求1至38中任一项所述的重组多核苷酸的质粒或权利要求88所述的AAV包装系统接触。
92.根据权利要求91所述的方法,其中所述细胞是宿主细胞,任选地哺乳动物宿主细胞,进一步任选地HEK293。
93.一种产生腺相关病毒(AAV)载体的方法,其包含用包括权利要求1至38中任一项所述的重组多核苷酸的质粒转导包装细胞系,其中所述包装细胞系表达腺相关病毒rep和cap基因。
94.根据权利要求93所述的方法,其中所述AAV rep基因是Rep78。
95.根据权利要求93所述的方法,其中所述AAV cap基因是Rh74 cap基因。
96.一种包含权利要求1至38中任一项所述的重组多核苷酸的细胞。
97.一种包含质粒的细胞,所述质粒包含权利要求1至38中任一项所述的重组多核苷酸。
98.根据权利要求88至90中任一项所述的AAV包装系统、权利要求91至95中任一项所述的方法、或者权利要求96或97所述的细胞,其中所述质粒包含与SEQ ID NO:18或19有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸。
99.根据权利要求88至90中任一项所述的AAV包装系统、权利要求91至95中任一项所述的方法、或者权利要求96或97所述的细胞,其中所述质粒包含SEQ ID NO:18或19的多核苷酸。
100.一种治疗dysferlin肌病的方法,其包含向有此需要的对象施用:
(a)有效量的第一多核苷酸,其中所述第一多核苷酸是权利要求1至24中任一项所述的重组多核苷酸;以及
(b)有效量的第二多核苷酸,其中所述第二多核苷酸是权利要求25至38中任何一项所述的重组多核苷酸。
101.根据权利要求100所述的方法,其中第一多核苷酸和/或第二多核苷酸通过肌肉内或静脉内施用。
102.根据权利要求100或101所述的方法,其中第一和第二多核苷酸同时或按顺序施用。
103.一种治疗dysferlin肌病的方法,其包含向有此需要的对象施用:
(a)有效量的第一腺相关病毒(AAV)载体,其中第一AAV载体是权利要求40至42和49至71中任一项所述的AAV载体;以及
(b)有效量的第二AAV载体,其中所述第二AAV载体是权利要求43至45和72至84中任一项所述的AAV载体。
104.根据权利要求103所述的方法,其中所述第一AAV载体和/或第二AAV载体通过肌肉内或静脉内施用。
105.根据103或104所述的方法,其中所述第一和第二AAV载体同时或按顺序施用。
106.一种治疗dysferlin肌病的方法,其包含向有此需要的对象施用有效量的权利要求39或85至87中任一项所述的AAV双载体系统。
107.根据权利要求106所述的方法,其中所述AAV双载体系统通过肌肉内或静脉内施用。
108.一种治疗dysferlin肌病的方法,其包含向有此需要的对象施用有效量的权利要求46至48中任一项所述的组合物。
109.根据权利要求108所述的方法,其中所述组合物通过肌肉内或静脉内施用。
110.根据权利要求100至109中任一项所述的方法,其中所述的dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
111.组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用,其中所述组合物包含:
(a)第一多核苷酸,其中所述第一多核苷酸是权利要求1至24中任一项所述的重组多核苷酸;以及
(b)第二多核苷酸,其中所述第二多核苷酸是权利要求25至38中任一项所述的重组多核苷酸。
112.组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用,其中所述组合物包含:
(a)有效量的第一腺相关病毒(AAV)载体,其中第一AAV载体是权利要求40至42和49至71中任一项所述的AAV载体;以及
(b)有效量的第二腺相关病毒(AAV)载体,其中第二AAV载体是权利要求43至45和72至84中任一项所述的AAV载体。
113.组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用,其中所述组合物包含权利要求39或85至87中任一项所述的AAV双载体系统。
114.根据权利要求46至48中任一项所述的组合物在制备用于治疗有此需要的对象中的dysferlin肌病的药物中的应用。
115.根据权利要求111至114中任一项所述的应用,其中所述组合物通过肌肉内或静脉内施用。
116.根据权利要求111至114中任一项所述的应用,其中所述dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
117.根据权利要求100至110中任一项所述的方法,其中所述第一AAV载体的有效量在约1x106-1x1016 vg/kg、约1x108-1x1015 vg/kg或约1x1010-1x1014 vg/kg之间,其中剂量通过超螺旋PCR定量标准测量。
118.根据权利要求117所述的方法,其中所述第一AAV载体的有效量为1.2e13 vg/kg,其中所述剂量通过超螺旋PCR定量标准测量。
119.根据权利要求100至110和117中任一项所述的方法,其中所述第二AAV载体的有效量在约1x106-1x1016 vg/kg、约1x108-1x1015 vg/kg或约1x1010-1x1014 vg/kg之间,其中剂量通过超螺旋PCR标准测量。
120.根据权利要求119所述的方法,其中所述第二AAV载体的有效量为1.2e13 vg/kg,其中所述剂量通过超螺旋PCR定量标准测量。
121.根据权利要求117至120中任一项所述的方法,其中总AAV载体剂量为2.4e13 vg/kg,其中剂量通过超螺旋PCR标准测量。
122.一种编码人dysferlin(hDYSF)蛋白的重组多核苷酸,其中重组多核苷酸序列包含SEQ ID NO: 20的核苷酸序列或与SEQ ID NO: 20的核苷酸序列有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。
123.根据权利要求122所述的重组多核苷酸,其中所述重组多核苷酸序列包含SEQ IDNO: 20的核苷酸序列。
124.一种制备权利要求122所述的重组多核苷酸的方法,其包含使细胞与权利要求1至24中任一项所述的重组多核苷酸和权利要求25至38中任一项所述的重组多核苷酸接触或使其在细胞中表达。
125.一种制备权利要求122所述的重组多核苷酸的方法,其包含使细胞与权利要求39和85至87中任一项所述的双AAV载体系统接触。
126.一种制备权利要求124或125所述的重组多核苷酸的方法,其中所述细胞是真核细胞。
127.一种制备权利要求124或125所述的重组多核苷酸的方法,其中所述细胞是肌肉细胞、心脏细胞、干细胞、卫星细胞和/或肝脏细胞。
128.一种制备权利要求122所述的重组多核苷酸的方法,其包含向对象施用权利要求1至24中任一项所述的重组多核苷酸和权利要求25至38中任一项所述的重组多核苷酸。
129.一种制备权利要求122所述的重组多核苷酸的方法,其包含向对象施用权利要求39和85至87中任一项所述的双AAV载体系统或权利要求47或48所述的组合物。
130.一种治疗对象中的肌营养不良症的方法,其包含在对象中表达权利要求122所述的重组多核苷酸。
131.根据权利要求130所述的方法,其包含向对象施用权利要求1至24中任一项所述的重组多核苷酸和权利要求25至38中任一项所述的重组多核苷酸或权利要求47或48所述的组合物。
132.根据权利要求130所述的方法,其包含向对象施用权利要求39和85至87中任一项所述的双AAV载体系统。
133.根据权利要求128至132中任一项所述的方法,其中所述对象是选自人类、非人类灵长类、犬、羊、马、猪、鼠、大鼠、兔、牛或猫的哺乳动物。
134.根据权利要求128至133中任一项所述的方法,其中所述对象患有dysferlin肌病。
135.根据权利要求134所述的方法,其中所述dysferlin肌病是肢带型肌营养不良症2B型(LGMD2B)或三好氏肌肉病变。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063024338P | 2020-05-13 | 2020-05-13 | |
US63/024,338 | 2020-05-13 | ||
PCT/US2021/031998 WO2021231577A1 (en) | 2020-05-13 | 2021-05-12 | Gene therapy with dysferlin dual vectors |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115605266A true CN115605266A (zh) | 2023-01-13 |
Family
ID=78524926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180033036.8A Pending CN115605266A (zh) | 2020-05-13 | 2021-05-12 | Dysferlin双载体的基因疗法 |
Country Status (16)
Country | Link |
---|---|
US (1) | US20230279065A1 (zh) |
EP (1) | EP4138999A4 (zh) |
JP (2) | JP2023519762A (zh) |
KR (2) | KR20240074881A (zh) |
CN (1) | CN115605266A (zh) |
AR (1) | AR123826A1 (zh) |
AU (2) | AU2021270526B2 (zh) |
BR (1) | BR112022020387A2 (zh) |
CA (1) | CA3172664A1 (zh) |
CL (1) | CL2022003099A1 (zh) |
CO (1) | CO2022016968A2 (zh) |
IL (1) | IL297656A (zh) |
MX (1) | MX2022014066A (zh) |
NZ (1) | NZ793468A (zh) |
TW (1) | TW202208407A (zh) |
WO (1) | WO2021231577A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024020574A2 (en) * | 2022-07-21 | 2024-01-25 | New York University | Auf1 gene therapy for limb girdle muscular dystrophy |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000011157A1 (en) * | 1998-08-25 | 2000-03-02 | The General Hospital Corporation | Dysferlin, a gene mutated in distal myopathy and limb girdle muscular dystrophy |
US20030110526A1 (en) * | 1998-08-25 | 2003-06-12 | Robert H. Brown | Dysferlin mutations |
JP7202895B2 (ja) * | 2016-06-17 | 2023-01-12 | ザ ユニバーシティ オブ ノース カロライナ アット チャペル ヒル | ジスフェリン異常症の治療のためのトランケートされたジスフェリン |
AU2019319547A1 (en) * | 2018-08-10 | 2021-03-18 | Kirsten DIMMLER | Methods of detecting inherited myopathies in horses |
-
2021
- 2021-05-12 NZ NZ793468A patent/NZ793468A/en unknown
- 2021-05-12 JP JP2022567513A patent/JP2023519762A/ja active Pending
- 2021-05-12 AU AU2021270526A patent/AU2021270526B2/en active Active
- 2021-05-12 BR BR112022020387A patent/BR112022020387A2/pt unknown
- 2021-05-12 KR KR1020247015675A patent/KR20240074881A/ko active Search and Examination
- 2021-05-12 CN CN202180033036.8A patent/CN115605266A/zh active Pending
- 2021-05-12 CA CA3172664A patent/CA3172664A1/en active Pending
- 2021-05-12 KR KR1020227042999A patent/KR20230009444A/ko not_active IP Right Cessation
- 2021-05-12 WO PCT/US2021/031998 patent/WO2021231577A1/en active Application Filing
- 2021-05-12 MX MX2022014066A patent/MX2022014066A/es unknown
- 2021-05-12 EP EP21803851.1A patent/EP4138999A4/en active Pending
- 2021-05-12 US US17/924,820 patent/US20230279065A1/en active Pending
- 2021-05-12 IL IL297656A patent/IL297656A/en unknown
- 2021-05-12 AR ARP210101301A patent/AR123826A1/es unknown
- 2021-05-12 TW TW110117182A patent/TW202208407A/zh unknown
-
2022
- 2022-11-08 CL CL2022003099A patent/CL2022003099A1/es unknown
- 2022-11-26 CO CONC2022/0016968A patent/CO2022016968A2/es unknown
-
2023
- 2023-07-18 AU AU2023206111A patent/AU2023206111A1/en active Pending
-
2024
- 2024-02-02 JP JP2024014797A patent/JP2024032967A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021231577A1 (en) | 2021-11-18 |
BR112022020387A2 (pt) | 2022-11-29 |
NZ793468A (en) | 2023-07-28 |
AU2021270526B2 (en) | 2023-04-20 |
IL297656A (en) | 2022-12-01 |
MX2022014066A (es) | 2022-12-07 |
EP4138999A1 (en) | 2023-03-01 |
TW202208407A (zh) | 2022-03-01 |
AR123826A1 (es) | 2023-01-18 |
JP2023519762A (ja) | 2023-05-12 |
CA3172664A1 (en) | 2021-11-18 |
KR20240074881A (ko) | 2024-05-28 |
KR20230009444A (ko) | 2023-01-17 |
US20230279065A1 (en) | 2023-09-07 |
CO2022016968A2 (es) | 2022-12-09 |
AU2021270526A1 (en) | 2022-11-24 |
AU2023206111A1 (en) | 2023-08-10 |
EP4138999A4 (en) | 2024-01-10 |
CL2022003099A1 (es) | 2023-10-13 |
JP2024032967A (ja) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020205228B2 (en) | Gene therapies for lysosomal disorders | |
AU2022204199A1 (en) | Gene editing of deep intronic mutations | |
US20230144834A1 (en) | Adeno-associated virus vectors encoding modified g6pc and uses thereof | |
CN113005123A (zh) | 用于神经变性疾病的基因疗法 | |
AU2017268469A1 (en) | Gene therapy methods for age-related diseases and conditions | |
KR20180012772A (ko) | 파브리 병 유전자 치료 | |
WO2003093436A2 (en) | Treatment for phenylketonuria | |
KR20220006527A (ko) | 리소좀 장애에 대한 유전자 요법 | |
US20240197917A1 (en) | Gene therapy | |
EP4069263A1 (en) | Transgene cassettes designed to express a human mecp2 gene | |
AU2023206111A1 (en) | Gene therapy with dysferlin dual vectors | |
CN114502575A (zh) | 用于arsa基因转移的腺相关病毒组合物和其使用方法 | |
CN114402075A (zh) | 乌谢尔综合征(ush2a)的基因疗法 | |
WO2016037931A1 (en) | Nucleic acid constructs and expression vectors for gene therapy of acute porphyrias and other diseases | |
CA3098592A1 (en) | Gene therapy for treating peroxisomal disorders | |
WO2018213618A1 (en) | Gene therapy for tuberous sclerosis | |
WO2024125494A1 (zh) | 一种基因调节的方法及其应用 | |
CA3223506A1 (en) | Methods and compositions for tau reduction gene therapy | |
WO2024110770A1 (en) | A new promoter for retinal pigment epithelium (rpe) targeted gene therapy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |