CN117343943A - 腺相关病毒的衣壳蛋白编码基因改造方法 - Google Patents
腺相关病毒的衣壳蛋白编码基因改造方法 Download PDFInfo
- Publication number
- CN117343943A CN117343943A CN202311325464.5A CN202311325464A CN117343943A CN 117343943 A CN117343943 A CN 117343943A CN 202311325464 A CN202311325464 A CN 202311325464A CN 117343943 A CN117343943 A CN 117343943A
- Authority
- CN
- China
- Prior art keywords
- codon
- mutating
- codons
- segment
- coding sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000565 Capsid Proteins Proteins 0.000 title claims abstract description 116
- 102100023321 Ceruloplasmin Human genes 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 77
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 57
- 241000702421 Dependoparvovirus Species 0.000 title claims abstract description 12
- 230000014509 gene expression Effects 0.000 claims abstract description 29
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 20
- 108020004705 Codon Proteins 0.000 claims description 646
- 108091026890 Coding region Proteins 0.000 claims description 212
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 136
- 238000005457 optimization Methods 0.000 claims description 79
- 108091081024 Start codon Proteins 0.000 claims description 76
- 101710132601 Capsid protein Proteins 0.000 claims description 75
- 101710197658 Capsid protein VP1 Proteins 0.000 claims description 75
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 claims description 75
- 101710108545 Viral protein 1 Proteins 0.000 claims description 75
- 101150044789 Cap gene Proteins 0.000 claims description 74
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 68
- 239000013598 vector Substances 0.000 claims description 63
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 62
- 239000002773 nucleotide Substances 0.000 claims description 50
- 125000003729 nucleotide group Chemical group 0.000 claims description 50
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 42
- 241000701447 unidentified baculovirus Species 0.000 claims description 36
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 31
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 31
- 239000004473 Threonine Substances 0.000 claims description 31
- 239000004474 valine Substances 0.000 claims description 31
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 29
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 26
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 26
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 25
- 108020005350 Initiator Codon Proteins 0.000 claims description 23
- 235000003704 aspartic acid Nutrition 0.000 claims description 21
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 21
- 241000238631 Hexapoda Species 0.000 claims description 20
- 235000018102 proteins Nutrition 0.000 claims description 17
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 13
- 235000013922 glutamic acid Nutrition 0.000 claims description 13
- 239000004220 glutamic acid Substances 0.000 claims description 13
- 229960000310 isoleucine Drugs 0.000 claims description 13
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 13
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 12
- 101150066583 rep gene Proteins 0.000 claims description 12
- 229940024606 amino acid Drugs 0.000 claims description 9
- 235000001014 amino acid Nutrition 0.000 claims description 9
- 150000001413 amino acids Chemical class 0.000 claims description 9
- 239000012228 culture supernatant Substances 0.000 claims description 9
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 8
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 8
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 8
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 8
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 230000035772 mutation Effects 0.000 claims description 7
- 239000013604 expression vector Substances 0.000 claims description 6
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 239000013603 viral vector Substances 0.000 claims description 4
- 101710088839 Replication initiation protein Proteins 0.000 claims description 3
- 101710203837 Replication-associated protein Proteins 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 description 65
- 210000005266 circulating tumour cell Anatomy 0.000 description 51
- 210000000234 capsid Anatomy 0.000 description 27
- 230000003612 virological effect Effects 0.000 description 26
- 239000002245 particle Substances 0.000 description 18
- 241000700605 Viruses Species 0.000 description 16
- 208000015181 infectious disease Diseases 0.000 description 14
- 108091033319 polynucleotide Proteins 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 239000013605 shuttle vector Substances 0.000 description 9
- 238000001962 electrophoresis Methods 0.000 description 8
- 229920001184 polypeptide Polymers 0.000 description 8
- 102000004196 processed proteins & peptides Human genes 0.000 description 8
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 241000288906 Primates Species 0.000 description 7
- 108700019146 Transgenes Proteins 0.000 description 7
- 238000004113 cell culture Methods 0.000 description 6
- 230000002458 infectious effect Effects 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 210000004962 mammalian cell Anatomy 0.000 description 5
- 238000004806 packaging method and process Methods 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000011529 RT qPCR Methods 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 230000001464 adherent effect Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 239000013607 AAV vector Substances 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 241000125945 Protoparvovirus Species 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 150000007523 nucleic acids Chemical group 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 2
- 108010000487 High-Molecular-Weight Kininogen Proteins 0.000 description 2
- 102100035792 Kininogen-1 Human genes 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 241000701945 Parvoviridae Species 0.000 description 2
- 241000256251 Spodoptera frugiperda Species 0.000 description 2
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 2
- 238000004043 dyeing Methods 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- -1 p6.9 Proteins 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000012474 protein marker Substances 0.000 description 2
- 239000012521 purified sample Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 108010047303 von Willebrand Factor Proteins 0.000 description 2
- 102100036537 von Willebrand factor Human genes 0.000 description 2
- 229960001134 von willebrand factor Drugs 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- VOUAQYXWVJDEQY-QENPJCQMSA-N 33017-11-7 Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)NCC(=O)NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)CCC1 VOUAQYXWVJDEQY-QENPJCQMSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108090000935 Antithrombin III Proteins 0.000 description 1
- 102000004411 Antithrombin III Human genes 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108010075254 C-Peptide Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010014172 Factor V Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010074864 Factor XI Proteins 0.000 description 1
- 108010080865 Factor XII Proteins 0.000 description 1
- 102000000429 Factor XII Human genes 0.000 description 1
- 108010071289 Factor XIII Proteins 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 108090000481 Heparin Cofactor II Proteins 0.000 description 1
- 102100030500 Heparin cofactor 2 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 1
- 102100022119 Lipoprotein lipase Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 101710141347 Major envelope glycoprotein Proteins 0.000 description 1
- 241000713821 Mason-Pfizer monkey virus Species 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000010977 Phospholipase A2 domains Human genes 0.000 description 1
- 108050001165 Phospholipase A2 domains Proteins 0.000 description 1
- 108090000113 Plasma Kallikrein Proteins 0.000 description 1
- 102000013566 Plasminogen Human genes 0.000 description 1
- 108010051456 Plasminogen Proteins 0.000 description 1
- 108010022233 Plasminogen Activator Inhibitor 1 Proteins 0.000 description 1
- 102000004179 Plasminogen Activator Inhibitor 2 Human genes 0.000 description 1
- 108090000614 Plasminogen Activator Inhibitor 2 Proteins 0.000 description 1
- 102100039418 Plasminogen activator inhibitor 1 Human genes 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 229940096437 Protein S Drugs 0.000 description 1
- 108010066124 Protein S Proteins 0.000 description 1
- 102000029301 Protein S Human genes 0.000 description 1
- 108010094028 Prothrombin Proteins 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 101150024766 VP1 gene Proteins 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004115 adherent culture Methods 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 102000003801 alpha-2-Antiplasmin Human genes 0.000 description 1
- 108090000183 alpha-2-Antiplasmin Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 229960005348 antithrombin iii Drugs 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 229960003638 dopamine Drugs 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 229940012444 factor xiii Drugs 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010025221 plasma protein Z Proteins 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 210000004777 protein coat Anatomy 0.000 description 1
- 229940039716 prothrombin Drugs 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- 231100000033 toxigenic Toxicity 0.000 description 1
- 230000001551 toxigenic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0601—Invertebrate cells or tissues, e.g. insect cells; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14041—Use of virus, viral particle or viral elements as a vector
- C12N2710/14043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14121—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Virology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本公开提供了对腺相关病毒(AAV)的cap基因的衣壳蛋白编码序列进行改造的方法,以及通过该方法获得的AAV衣壳蛋白编码序列。本公开还提供了经改造的AAV衣壳蛋白编码序列用于表达重组AAV和感兴趣的蛋白质的用途。
Description
本申请要求申请日为2022年10月13日、申请号为202211254858.1的中国在先申请的优先权,其全部内容通过引用并入本文。
技术领域
本公开涉及重组载体领域,具体涉及对腺相关病毒(AAV)的衣壳蛋白编码基因(cap基因)进行改造的方法。
背景技术
腺相关病毒(Adeno-associated virus,AAV)属于细小病毒科,其病毒颗粒较小,无包膜,衣壳具有二十面体结构。AAV被认为是目前最有前景的基因治疗候选载体之一,主要因为它对人类的非致病性,能够提供长期的基因表达,而不会诱导显著的免疫反应。
包裹基因组的AAV衣壳总共由60个亚基组成,包括三种不同的病毒衣壳蛋白VP1、VP2和VP3,它们的基因序列只在N端不同。VP3序列在所有三个剪接变体之间都很常见,VP2和VP1具有相对更长的N端序列,其中VP1的独特区域包含磷脂酶A2结构域,对病毒的感染性起到重要作用。虽然这三种VP蛋白在细胞转导中都发挥着关键和特定的作用,但对它们的精确化学计量仍然比较困难。在野生型衣壳中,VP1、VP2和VP3的比例约为1:1:10。由于三种衣壳蛋白的组装是随机的,因此重组AAV衣壳中VP1/VP2/VP3的比例主要取决于它们的相对表达水平。
用于生产重组AAV的经典方式是使用质粒瞬转哺乳动物细胞例如293细胞或者Hela细胞,随后可以包装出衣壳结构类似于野生型的重组AAV。但是由于哺乳动物细胞的培养特性,例如贴壁培养或者需要血清添加,对规模放大造成了很大的困难。因此,目前越来越多的研究者开始使用昆虫杆状病毒系统进行AAV包装。然而,通过重组杆状病毒感染昆虫细胞生产重组AAV的机制与质粒瞬转哺乳动物细胞的方式有很大区别,野生型AAV的天然宿主主要为包含灵长类在内的哺乳动物细胞,其衣壳蛋白编码序列中的一些启动子序列在昆虫细胞中的效率非常低。因此在昆虫细胞中,通常难以通过一条基因序列达到对三种衣壳蛋白的高效且比例适当的表达。
具有能降低达到相同治疗效果下的注射剂量,从而保证更好的安全性,并且降低了重组病毒载体的生产成本和高滴度的生产压力。因此,对VP1蛋白在细胞中的表达量优化成为了重点。
发明概述
在第一方面,本公开提供了一种对腺相关病毒(AAV)的衣壳蛋白编码基因(cap基因)的衣壳蛋白编码序列进行改造的方法,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,所述方法包括:
(1)对VP1和VP2的编码序列使用弱起始密码子并且对VP3的编码序列使用强起始密码子;和
(2)对VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子进行密码子优化,从而降低所述密码子的起始翻译强度。
Cap基因编码序列中的VP1特有区段是本领域技术人员熟知的并可以通过常规方法确定。例如,在具有SEQ ID NO:2所示的AAV6血清型cap基因的衣壳蛋白编码序列中,VP1编码序列是指第1-411位核苷酸;在具有SEQ ID NO:4所示的AAV8血清型cap基因的衣壳蛋白编码序列中,VP1特有区段是指第1-411位核苷酸。
在一些实施方案中,对VP1的编码序列使用起始密码子ACG。
在一些实施方案中,对VP2的编码序列使用起始密码子ACG。
在一些实施方案中,对VP3的编码序列使用起始密码子ATG。
在一些实施方案中,除VP1特有区段以外,还对所述衣壳蛋白编码序列中另外的编码序列区段中的一个或多个密码子进行密码子优化,从而降低所述密码子的起始翻译强度,所述另外的编码序列区段选自:
(1)VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段;
(2)VP3的编码序列的起始密码子下游的编码序列区段;和
(3)(1)和(2)的组合。
Cap基因编码序列中的VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段是本领域技术人员熟知的并可以通过常规方法确定。例如,在具有SEQ ID NO:2所示的AAV6血清型cap基因的衣壳蛋白编码序列中,VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段是指第412-609位核苷酸;在具有SEQ ID NO:4所示的AAV8血清型cap基因的衣壳蛋白编码序列中,VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段是指第412-606位核苷酸。
Cap基因编码序列中的VP3的编码序列的起始密码子下游的编码序列区段是本领域技术人员熟知的并可以通过常规方法确定。例如,在具有SEQ ID NO:2所示的AAV6血清型cap基因的衣壳蛋白编码序列中,VP3的编码序列的起始密码子下游的编码序列区段是指第610-2214位核苷酸;在具有SEQ ID NO:4所示的AAV8血清型cap基因的衣壳蛋白编码序列中,VP3的编码序列的起始密码子下游的编码序列区段是指第607-2208位核苷酸。
在一些实施方案中,对cap基因编码序列中的所有区段进行密码子优化,从而降低所述区段中密码子的起始翻译强度。
在上述方法的一些实施方案中,所述密码子优化包括选自以下的一项或多项:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为GAC,优选将所述区段中的所有密码子GAT突变为GAC;
(2)将编码亮氨酸(Leu)的密码子CTT突变为CTA,优选将所述区段中的所有密码子CTT突变为CTA;
(3)将编码亮氨酸(Leu)的密码子TTG突变为CTC,优选将所述区段中的所有密码子TTG突变为CTC;
(4)将编码异亮氨酸(Ile)的密码子ATT突变为ATC,优选将所述区段中的所有密码子ATT突变为ATC;
(5)将编码脯氨酸(Pro)的密码子CCA突变为CCC,优选将所述区段中的所有密码子CCA突变为CCC;
(6)将编码亮氨酸(Leu)的密码子CTG突变为CTC,优选将所述区段中的所有密码子CTG突变为CTC;
(7)将编码缬氨酸(Val)的密码子GTG突变为GTC,优选将所述区段中的所有密码子GTG突变为GTC;
(8)将编码谷氨酸(Glu)的密码子GAA突变为GAG,优选将所述区段中的所有密码子GAA突变为GAG;和
(9)将编码苏氨酸(Thr)的密码子ACG突变为ACC,优选将所述区段中的所有密码子ACG突变为ACC。
在一些实施方案中,所述密码子优化包括(1)至(9)项中的至少2项、至少3项、至少4项、至少5项、至少6项、至少7项、全部8项或全部9项。
在一些实施方案中,所述密码子优化包括:
(1)将编码亮氨酸(Leu)的密码子TTG突变为CTC,优选将所述区段中的所有密码子TTG突变为CTC;
(2)将编码亮氨酸(Leu)的密码子CTG突变为CTC,优选将所述区段中的所有密码子CTG突变为CTC;
(3)将编码缬氨酸(Val)的密码子GTG突变为GTC,优选将所述区段中的所有密码子GTG突变为GTC;和
(4)将编码苏氨酸(Thr)的密码子ACG突变为ACC,优选将所述区段中的所有密码子ACG突变为ACC。
在一些实施方案中,所述AAV为选自下组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和AAV9。在一些优选的实施方案中,所述AAV为AAV6或AAV8。
各种AAV血清型的野生型cap基因编码序列是本领域技术人员可以常规获得的。例如AAV1血清型的野生型cap基因可以具有如SEQ ID NO:13所示的核苷酸序列;AAV2血清型的野生型cap基因可以具有如SEQ ID NO:14所示的核苷酸序列;AAV3血清型的野生型cap基因可以具有如SEQ ID NO:15所示的核苷酸序列;AAV4血清型的野生型cap基因可以具有如SEQ ID NO:16所示的核苷酸序列;AAV5血清型的野生型cap基因可以具有如SEQ ID NO:17所示的核苷酸序列;AAV6血清型的野生型cap基因可以具有如SEQ ID NO:18所示的核苷酸序列;AAV7血清型的野生型cap基因可以具有如SEQ ID NO:19所示的核苷酸序列;AAV8血清型的野生型cap基因可以具有如SEQ ID NO:20所示的核苷酸序列;AAV9血清型的野生型cap基因可以具有如SEQ ID NO:21所示的核苷酸序列。
在一些实施方案中,所述AAV为AAV6血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为GAC,优选将所述区段中的所有密码子GAT突变为GAC;
(2)将编码异亮氨酸(Ile)的密码子ATT突变为ATC,优选将所述区段中的所有密码子ATT突变为ATC;
(3)将编码亮氨酸(Leu)的密码子TTG突变为CTC,优选将所述区段中的所有密码子TTG突变为CTC;
(4)将编码亮氨酸(Leu)的密码子CTG突变为CTC,优选将所述区段中的所有密码子CTG突变为CTC;
(5)将编码缬氨酸(Val)的密码子GTG突变为GTC,优选将所述区段中的所有密码子GTG突变为GTC;
(6)将编码苏氨酸(Thr)的密码子ACG突变为ACC,优选将所述区段中的所有密码子ACG突变为ACC。
在一些实施方案中,所述AAV为AAV8血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为GAC,优选将所述区段中的所有密码子GAT突变为GAC;
(2)将编码亮氨酸(Leu)的密码子CTT突变为CTA,优选将所述区段中的所有密码子CTT突变为CTA;
(3)将编码脯氨酸(Pro)的密码子CCA突变为CCC,优选将所述区段中的所有密码子CCA突变为CCC;
(4)将编码亮氨酸(Leu)的密码子CTG突变为CTC,优选将所述区段中的所有密码子CTG突变为CTC;
(5)将编码缬氨酸(Val)的密码子GTG突变为GTC,优选将所述区段中的所有密码子GTG突变为GTC;
(6)将编码谷氨酸(Glu)的密码子GAA突变为GAG,优选将所述区段中的所有密码子GAA突变为GAG;
(7)将编码苏氨酸(Thr)的密码子ACG突变为ACC,优选将所述区段中的所有密码子ACG突变为ACC。
在第二方面,本公开涉及通过本公开的第一方面的方法获得的AAV的cap基因的衣壳蛋白编码序列。
在第三方面,本公开涉及一种重组AAV的cap基因的衣壳蛋白编码序列,其具有如SEQ ID NO:3或SEQ ID NO:5所示的核苷酸序列,或与SEQ ID NO:3或SEQ ID NO:5所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
在第四方面,本公开涉及一种重组AAV的cap基因的衣壳蛋白编码序列,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,其中:
(1)VP1和VP2的编码序列具有弱起始密码子并且VP3的编码序列具有强起始密码子;
(2)VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子经密码子优化使得所述密码子的起始翻译强度降低。
在一些实施方案中,VP1的编码序列具有起始密码子ACG。
在一些实施方案中,VP2的编码序列具有起始密码子ACG。
在一些实施方案中,VP3的编码序列具有起始密码子ATG。
在一些实施方案中,VP1和VP2的编码序列具有起始密码子ACG,且VP3的编码序列具有起始密码子ATG。
在一些实施方案中,除VP1特有区段以外,所述衣壳蛋白编码序列中另外的编码序列区段中的一个或多个密码子还经密码子优化使得所述密码子的起始翻译强度降低,所述另外的编码序列区段选自:
(1)VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段;
(2)VP3的编码序列的起始密码子下游的编码序列区段;和
(3)(1)和(2)的组合。
在上述重组AAV的cap基因的衣壳蛋白编码序列的一些实施方案中,所述密码子优化包括选自以下的一项或多项:
(1)编码天冬氨酸(Asp)的密码子GAT突变为GAC,优选所述区段中的所有密码子GAT突变为GAC;
(2)编码亮氨酸(Leu)的密码子CTT突变为CTA,优选所述区段中的所有密码子CTT突变为CTA;
(3)编码亮氨酸(Leu)的密码子TTG突变为CTC,优选所述区段中的所有密码子TTG突变为CTC;
(4)编码异亮氨酸(Ile)的密码子ATT突变为ATC,优选所述区段中的所有密码子ATT突变为ATC;
(5)编码脯氨酸(Pro)的密码子CCA突变为CCC,优选所述区段中的所有密码子CCA突变为CCC;
(6)编码亮氨酸(Leu)的密码子CTG突变为CTC,优选所述区段中的所有密码子CTG突变为CTC;
(7)编码缬氨酸(Val)的密码子GTG突变为GTC,优选所述区段中的所有密码子GTG突变为GTC;
(8)编码谷氨酸(Glu)的密码子GAA突变为GAG,优选所述区段中的所有密码子GAA突变为GAG;和
(9)编码苏氨酸(Thr)的密码子ACG突变为ACC,优选所述区段中的所有密码子ACG突变为ACC。
在一些实施方案中,所述密码子优化包括(1)至(9)项中的至少2项、至少3项、至少4项、至少5项、至少6项、至少7项、全部8项或全部9项。
在一些实施方案中,所述密码子优化包括:
(1)编码亮氨酸(Leu)的密码子TTG突变为CTC,优选所述区段中的所有密码子TTG突变为CTC;
(2)编码亮氨酸(Leu)的密码子CTG突变为CTC,优选所述区段中的所有密码子CTG突变为CTC;
(3)编码缬氨酸(Val)的密码子GTG突变为GTC,优选所述区段中的所有密码子GTG突变为GTC;和
(4)编码苏氨酸(Thr)的密码子ACG突变为ACC,优选所述区段中的所有密码子ACG突变为ACC。
在一些实施方案中,所述AAV为选自下组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和AAV9,优选所述AAV为AAV6或AAV8血清型。
在一些实施方案中,所述AAV为AAV6血清型,且所述密码子优化包括VP1特有区段中的密码子进行了以下密码子优化:
(1)编码天冬氨酸(Asp)的密码子GAT突变为GAC,优选所述区段中的所有密码子GAT突变为GAC;
(2)编码异亮氨酸(Ile)的密码子ATT突变为ATC,优选所述区段中的所有密码子ATT突变为ATC;
(3)编码亮氨酸(Leu)的密码子TTG突变为CTC,优选所述区段中的所有密码子TTG突变为CTC;
(4)编码亮氨酸(Leu)的密码子CTG突变为CTC,优选所述区段中的所有密码子CTG突变为CTC;
(5)编码缬氨酸(Val)的密码子GTG突变为GTC,优选所述区段中的所有密码子GTG突变为GTC;
(6)编码苏氨酸(Thr)的密码子ACG突变为ACC,优选所述区段中的所有密码子ACG突变为ACC。
在一些实施方案中,所述AAV为AAV8血清型,且所述密码子优化包括VP1特有区段中的密码子进行了以下密码子优化:
(1)编码天冬氨酸(Asp)的密码子GAT突变为GAC,优选所述区段中的所有密码子GAT突变为GAC;
(2)编码亮氨酸(Leu)的密码子CTT突变为CTA,优选所述区段中的所有密码子CTT突变为CTA;
(3)编码脯氨酸(Pro)的密码子CCA突变为CCC,优选所述区段中的所有密码子CCA突变为CCC;
(4)编码亮氨酸(Leu)的密码子CTG突变为CTC,优选所述区段中的所有密码子CTG突变为CTC;
(5)编码缬氨酸(Val)的密码子GTG突变为GTC,优选所述区段中的所有密码子GTG突变为GTC;
(6)编码谷氨酸(Glu)的密码子GAA突变为GAG,优选所述区段中的所有密码子GAA突变为GAG;
(7)编码苏氨酸(Thr)的密码子ACG突变为ACC,优选所述区段中的所有密码子ACG突变为ACC。
在一些实施方案中,所述重组AAV的cap基因的衣壳蛋白编码序列具有如SEQ IDNO:3或SEQ ID NO:5所示的核苷酸序列,或与SEQ ID NO:3或SEQ ID NO:5所示的序列具有至少80%序列一致性、至少85%序列一致性、至少90%序列一致性、至少95%序列一致性、至少98%序列一致性,或至少99%序列一致性的变体核苷酸序列。
在第五方面,本公开涉及一种载体,所述载体包含根据本发明的第四方面的重组AAV的cap基因的衣壳蛋白编码序列。
在一些实施方案中,所述载体是表达载体。
在一些实施方案中,所述载体是病毒载体,优选昆虫杆状病毒载体。
在一些实施方案中,所述载体来源于选自以下的载体系统:Bac-to-Bac系统、flashBac/BacMagic系统、BaculoDirect系统和BacPAK6/Bacologold系统。
在一些实施方案中,所述载体来源于Bac-to-Bac系统。Bac-to-Bac系统载体包含pFastBacdual、pFastBac1、pFastBacHTA、pFastBacHTB或pFastBacHTC等载体骨架,在一些优选的实施例中,所述载体来源于pFastBacdual载体骨架。
在一些实施方案中,所述载体还包含AAV的复制相关蛋白基因(rep基因)。在一些实施方案中,所述rep基因为选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和AAV9的rep基因。在优选的实施方案中,所述rep基因来源于AAV2血清型。
在一些实施方案中,所述载体包含与所述重组AAV的cap基因的衣壳蛋白编码序列和/或rep基因可操作地连接的表达调控序列。在一些实施方案中,所述表达调控序列包含一个或多个启动子和/或一个或多个增强子。
在一些实施方案中,所述启动子选自pH、Gp64、p6.9和p10启动子中的一种或多种。在一些优选的实施方案中,所述启动子包括hr1和p6.9、p10启动子组合(hr1p6.9p10)、pH和Acie01启动子组合(pH-Acie01),或单独的pH启动子。
在一些实施方案中,所述增强子选自hr1、hr2、hr3、hr4和hr5增强子中的一种或多种。
在一些实施方案中,所述载体还包含编码感兴趣的蛋白质的序列。在一些实施方案中,所述感兴趣的蛋白质选自凝血因子例如FIX、FVIII,抗体或其片段例如scFv片段,和多巴胺合成蛋白等。
在第六方面,本公开涉及一种细胞,所述细胞包含本公开的第五方面的载体。在一些实施方案中,所述细胞是昆虫细胞。
在第七方面,本公开涉及一种制备重组AAV的方法,所述方法包括:
(1)培养根据本公开的第六方面的细胞;和
(2)从所述细胞和/或培养上清液分离所述重组AAV。
在一些实施方案中,当在所述细胞中表达时,所述VP1、VP2和VP3的表达量的比例为约1:1:10。
在第八方面,本公开提供了一种组合物,所述组合物包含根据本公开的第二方面或第三方面的重组AAV的衣壳蛋白编码基因、根据本公开的第四方面的载体或根据本公开的第五方面的细胞。在一些实施方案中,所述载体还包含药学上可接受的载体和/或赋形剂。
本发明还涉及以下实施方式:
实施方式1.一种对腺相关病毒(AAV)的衣壳蛋白编码基因(cap基因)的衣壳蛋白编码序列进行改造的方法,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,所述方法包括:
(1)对VP1的编码序列使用弱起始密码子;和
(2)对VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子进行密码子优化,从而降低所述密码子的起始翻译强度。
实施方式2.根据实施方式1的方法,其中:
(1)对VP1的编码序列使用起始密码子ACG;和/或
(2)对VP1特有区段中的密码子优化包括:将VP1特有区段中具有较强的起始功能的密码子全部或部分突变为非上述密码子的同义密码子。
实施方式3.一种对腺相关病毒(AAV)的衣壳蛋白编码基因(cap基因)的衣壳蛋白编码序列进行改造的方法,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,所述方法包括:
(1)对VP1和VP2的编码序列使用弱起始密码子并且对VP3的编码序列使用强起始密码子;和
(2)对VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子进行密码子优化,从而降低所述密码子的起始翻译强度。
实施方式4.根据实施方式3的方法,其中对VP1和VP2的编码序列使用起始密码子ACG,并且对VP3的编码序列使用起始密码子ATG。
实施方式5.根据实施方式1-4中任一项的方法,其中除VP1特有区段以外,还对所述衣壳蛋白编码序列中另外的编码序列区段中的一个或多个密码子进行密码子优化,从而降低所述密码子的起始翻译强度,所述另外的编码序列区段选自:
(1)VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段;
(2)VP3的编码序列的起始密码子下游的编码序列区段;和
(3)(1)和(2)的组合。
实施方式6.根据实施方式1-5中任一项的方法,其中所述密码子优化包括选自以下的一项或多项:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码亮氨酸(Leu)的密码子CTT突变为非CTT的同义密码子,优选突变为CTA,优选对所述区段中的所有密码子CTT进行突变;
(3)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(4)将编码异亮氨酸(Ile)的密码子ATT突变为非ATT的同义密码子,优选突变为ATC,优选对所述区段中的所有密码子ATT进行突变;
(5)将编码脯氨酸(Pro)的密码子CCA突变为非CCA的同义密码子,优选突变为CCC,优选对所述区段中的所有密码子CCA进行突变;
(6)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(7)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(8)将编码谷氨酸(Glu)的密码子GAA突变为非GAA的同义密码子,优选突变为GAG,优选对所述区段中的所有密码子GAA进行突变;和
(9)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式7.根据实施方式6的方法,其中所述密码子优化包括(1)至(9)项中的至少2项、至少3项、至少4项、至少5项、至少6项、至少7项、全部8项或全部9项。
实施方式8.根据实施方式6或7的方法,其中所述密码子优化包括选自以下的一项或多项:
(1)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(2)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(3)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;和
(4)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式9.根据实施方式8的方法,其中所述密码子优化包括(1)至(4)项中的至少2项、至少3项或全部4项。
实施方式10.根据实施方式1-9中任一项的方法,其中所述方法还包括:
在所述密码子优化后,对所述衣壳蛋白编码序列中存在于相邻两个密码子中的三核苷酸ATG进行优化,在不改变所述相邻两个密码子编码的氨基酸的情况下,将三核苷酸ATG突变为非ATG的序列。
实施方式11.根据实施方式1-10中任一项的方法,其中所述AAV为选自下组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和AAV9,优选所述AAV为AAV6、AAV8或AAV9血清型。
实施方式12.实施方式11的方法,其中所述AAV为AAV6血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码异亮氨酸(Ile)的密码子ATT突变为非ATT的同义密码子,优选突变为ATC,优选对所述区段中的所有密码子ATT进行突变;
(3)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(4)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(5)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(6)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式13.实施方式11的方法,其中所述AAV为AAV8血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码亮氨酸(Leu)的密码子CTT突变为非CTT的同义密码子,优选突变为CTA,优选对所述区段中的所有密码子CTT进行突变;
(3)将编码脯氨酸(Pro)的密码子CCA突变为非CCA的同义密码子,优选突变为CCC,优选对所述区段中的所有密码子CCA进行突变;
(4)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(5)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(6)将编码谷氨酸(Glu)的密码子GAA突变为非GAA的同义密码子,优选突变为GAG,优选对所述区段中的所有密码子GAA进行突变;
(7)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式14.实施方式11的方法,其中所述AAV为AAV9血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为TTA、CTA、CTC或CTT,优选对所述区段中的所有密码子TTG进行突变;
(2)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(3)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(4)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式15.实施方式14的方法,其中所述方法还包括:
在所述密码子优化后,对所述衣壳蛋白编码序列中存在于相邻两个密码子中的三核苷酸ATG进行优化,在不改变所述相邻两个密码子编码的氨基酸的情况下,将三核苷酸ATG突变为非ATG的序列。
实施方式16.通过实施方式1-15中任一项的方法获得的AAV的cap基因的衣壳蛋白编码序列。
实施方式17.一种重组AAV的cap基因的衣壳蛋白编码序列,其具有如SEQ ID NO:3或SEQ ID NO:5所示的核苷酸序列,或与SEQ ID NO:3或SEQ ID NO:5所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
实施方式18.一种重组AAV的cap基因的衣壳蛋白编码序列,所述编码序列中的VP1启动子及VP1特有区段具有如SEQ ID NO:23-26中任一项所示的核苷酸序列,或与SEQ IDNO:23-26中任一项所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
实施方式19.一种重组AAV的cap基因的衣壳蛋白编码序列,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,其中:
(1)VP1的编码序列具有弱起始密码子;
(2)VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子经密码子优化使得所述密码子的起始翻译强度降低。
实施方式20.根据实施方式19的衣壳蛋白编码序列,其中:
(1)VP1的编码序列具有起始密码子ACG;和/或
(2)VP1特有区段中的密码子优化包括:所述VP1特有区段中具有较强的起始功能的密码子全部或部分突变为非上述密码子的同义密码子。
实施方式21.一种重组AAV的cap基因的衣壳蛋白编码序列,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,其中:
(1)VP1和VP2的编码序列具有弱起始密码子并且VP3的编码序列具有强起始密码子;
(2)VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子经密码子优化使得所述密码子的起始翻译强度降低。
实施方式22.根据实施方式21的重组AAV的cap基因的衣壳蛋白编码序列,其中VP1和VP2的编码序列具有起始密码子ACG,且VP3的编码序列具有起始密码子ATG。
实施方式23.根据实施方式19-22中任一项的重组AAV的cap基因的衣壳蛋白编码序列,其中除VP1特有区段以外,所述衣壳蛋白编码序列中另外的编码序列区段中的一个或多个密码子还经密码子优化使得所述密码子的起始翻译强度降低,所述另外的编码序列区段选自:
(1)VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段;
(2)VP3的编码序列的起始密码子下游的编码序列区段;和
(3)(1)和(2)的组合。
实施方式24.根据实施方式19-23中任一项的重组AAV的cap基因的衣壳蛋白编码序列,其中所述密码子优化包括选自以下的一项或多项:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码亮氨酸(Leu)的密码子CTT突变为非CTT的同义密码子,优选突变为CTA,优选对所述区段中的所有密码子CTT进行突变;
(3)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(4)将编码异亮氨酸(Ile)的密码子ATT突变为非ATT的同义密码子,优选突变为ATC,优选对所述区段中的所有密码子ATT进行突变;
(5)将编码脯氨酸(Pro)的密码子CCA突变为非CCA的同义密码子,优选突变为CCC,优选对所述区段中的所有密码子CCA进行突变;
(6)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(7)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(8)将编码谷氨酸(Glu)的密码子GAA突变为非GAA的同义密码子,优选突变为GAG,优选对所述区段中的所有密码子GAA进行突变;和
(9)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式25.根据实施方式24的重组AAV的cap基因的衣壳蛋白编码序列,其中所述密码子优化包括(1)至(9)项中的至少2项、至少3项、至少4项、至少5项、至少6项、至少7项、全部8项或全部9项。
实施方式26.根据实施方式24或25的重组AAV的cap基因的衣壳蛋白编码序列,其中所述密码子优化包括选自以下的一项或多项:
(1)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(2)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(3)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;和
(4)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式27.根据实施方式26的衣壳蛋白编码序列,其中所述密码子优化包括(1)至(4)项中的至少2项、至少3项或全部4项。
实施方式28.根据实施方式19-27中任一项的衣壳蛋白编码序列,其中所述衣壳蛋白编码序列中存在于相邻两个密码子中的三核苷酸ATG进行了优化,在不改变所述相邻两个密码子编码的氨基酸的情况下,三核苷酸ATG突变为非ATG的序列。
实施方式29.根据实施方式19-28中任一项的重组AAV的cap基因的衣壳蛋白编码序列,其中所述AAV为选自下组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和AAV9,优选所述AAV为AAV6、AAV8或AAV9血清型。
实施方式30.根据实施方式29的衣壳蛋白编码序列,其中所述AAV为AAV6血清型,且所述密码子优化包括VP1特有区段中的密码子进行了以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码异亮氨酸(Ile)的密码子ATT突变为非ATT的同义密码子,优选突变为ATC,优选对所述区段中的所有密码子ATT进行突变;
(3)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(4)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(5)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(6)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式31.根据实施方式29的衣壳蛋白编码序列,其中所述AAV为AAV8血清型,且所述密码子优化包括VP1特有区段中的密码子进行了以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码亮氨酸(Leu)的密码子CTT突变为非CTT的同义密码子,优选突变为CTA,优选对所述区段中的所有密码子CTT进行突变;
(3)将编码脯氨酸(Pro)的密码子CCA突变为非CCA的同义密码子,优选突变为CCC,优选对所述区段中的所有密码子CCA进行突变;
(4)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(5)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(6)将编码谷氨酸(Glu)的密码子GAA突变为非GAA的同义密码子,优选突变为GAG,优选对所述区段中的所有密码子GAA进行突变;
(7)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式32.实施方式29的衣壳蛋白编码序列,其中所述AAV为AAV9血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为TTA、CTA、CTC或CTT,优选对所述区段中的所有密码子TTG进行突变;
(2)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(3)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(4)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
实施方式33.根据实施方式32的衣壳蛋白编码序列,其中所述衣壳蛋白编码序列中存在于相邻两个密码子中的三核苷酸ATG进行了优化,在不改变所述相邻两个密码子编码的氨基酸的情况下,三核苷酸ATG突变为非ATG的序列。
实施方式34.根据实施方式19所述的重组AAV的cap基因的衣壳蛋白编码序列,其具有如SEQ ID NO:3或SEQ ID NO:5所示的核苷酸序列,或与SEQ ID NO:3或SEQ ID NO:5所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
实施方式35.根据实施方式19所述的重组AAV的cap基因的衣壳蛋白编码序列,所述编码序列中的VP1启动子及VP1特有区段具有如SEQ ID NO:23-26中任一项所示的核苷酸序列,或与SEQ ID NO:23-26中任一项所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
实施方式36.一种载体,所述载体包含根据实施方式19-35中任一项所述的重组AAV的cap基因的衣壳蛋白编码序列,优选所述载体是表达载体。
实施方式37.根据实施方式36的载体,其中所述载体是病毒载体,优选昆虫杆状病毒载体。
实施方式38.根据实施方式37的载体,其中所述载体来源于选自以下的载体系统:Bac-to-Bac载体系统、flashBac/BacMagic载体系统、BaculoDirect载体系统或BacPAK6/Bacologold载体系统。
实施方式39.根据实施方式36-38中任一项所述的载体,其中所述载体还包含AAV的复制相关蛋白基因(rep基因),优选所述rep基因来源于AAV2血清型。
实施方式40.根据实施方式36-39中任一项所述的载体,其中所述载体还包含编码感兴趣的蛋白质的核苷酸序列。
实施方式41.细胞,所述细胞包含实施方式36-40中任一项所述的载体,优选所述细胞是昆虫细胞。
实施方式42.一种制备重组AAV的方法,所述方法包括:
(1)培养根据实施方式41所述的细胞;和
(2)从所述细胞和/或培养上清液分离所述重组AAV。
实施方式43.根据实施方式42的方法,其中当在所述细胞中表达时,所述VP1、VP2和VP3的表达量的比例为约1:1:10。
附图说明
图1显示了对AAV的衣壳蛋白编码基因中的VP1、VP2和VP3编码序列使用不同强度的起始密码子的策略。
图2显示了在AAV的衣壳蛋白编码基因中添加含有昆虫细胞启动子的内含子序列的先前的优化策略。
图3显示了对AAV的衣壳蛋白编码基因进行密码子优化的策略。
图4显示了包含ITR-CMV-EGFP的重组序列。
图5显示了重组杆状病毒穿梭载体pFBd-ITR-EGFP的图谱。
图6显示了包含经优化的Cap基因和其它元件的重组序列。
图7显示了重组杆状病毒穿梭载体pFBd-IE-hr1Cap-Rep的图谱。
图8显示了使用凝胶电泳和考马斯亮蓝染色检测的优化前后的三种衣壳蛋白的表达比例的结果。
图9显示了使用凝胶电泳和考马斯亮蓝染色检测的优化前后的五种AAV9血清型衣壳蛋白的表达比例的结果。
具体实施方式
除非另有定义,否则本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员的通常理解相同的含义。
为了更容易理解本公开,下面首先定义某些术语。在整个说明书中阐述了以下术语和其他术语的附加定义。
如本说明书和所附权利要求书中所使用的,单数形式“一个”、“一种”和“该”包括复数指代物,除非上下文另有明确规定。
在本文中,术语“包含”、“具有”、“包括”和“含有”应被解释为开放式术语(即意味着“包括但不限于”)。
本文提及的所有公开和其他参考文献以全文引用的方式并入本文中。尽管本文引用许多文献,但该引用不构成承认这些文献中的任一者形成本领域中普通常识的一部分。
术语“AAV”或“腺相关病毒”是指病毒的细小病毒属(Parvoviridae)的依赖细小病毒(Dependoparvovirus)。AAV可为衍生自天然存在的“野生型”病毒的AAV、衍生自被包装到衍生自由天然存在的cap基因编码的衣壳蛋白的衣壳中的rAAV基因组和/或被包装到衍生自由非天然衣壳cap基因编码的衣壳蛋白的衣壳中的rAAV基因组的AAV。出于本文中的本发明的目的,术语“AAV”为腺相关病毒的缩写,包括但不限于该病毒自身及其衍生物。除非另有指示,否则该术语是指所有亚型或血清型,以及能够复制型及重组形式两者。
术语“AAV”包括但不限于AAV1型、AAV2型、AAV 3A型、AAV 3B型、AAV 4型、AAV 5型、AAV 6型、AAV 7型、AAV 8型以及AAV 9型。术语“AAV”还包括不同来源的AAV,例如禽类AAV、牛类AAV、犬类AAV、山羊类AAV、马类AAV、灵长类AAV、非灵长类AAV及绵羊类AAV。其中,“灵长类AAV”是指感染灵长类动物的AAV,“非灵长类AAV”是指感染非灵长类哺乳动物的AAV等。
各种血清型的AAV的基因组序列,以及天然末端重复序列(ITR)、Rep蛋白及衣壳亚基的序列是本领域中已知的。此类序列可发现于文献中或诸如GenBank的公共数据库中。
术语“rAAV”是指“重组AAV”。在一些实施方案中,重组AAV具有其中部分或所有rep及cap基因已经被异源序列取代的AAV基因组。若AAV病毒颗粒包含异源多核苷酸(亦即,除野生型AAV基因组以外的多核苷酸),则通常将其称为“重组AAV(rAAV)病毒颗粒”或“rAAV病毒颗粒”。一般而言,异源多核苷酸侧接有至少一个、通常是两个AAV反向末端重复序列(ITR)。
术语“cap基因”或“衣壳基因”是指编码形成或促进形成病毒的衣壳或蛋白质外壳的衣壳蛋白的核酸序列。在AAV的情况下,衣壳蛋白可为VP1、VP2或VP3。
术语“rep基因”是指编码病毒复制及生产所需的非结构蛋白(rep78、rep68、rep52及rep40等)的核酸序列。
如本文所用,术语“变体”是指具有与参考多核苷酸或多肽基本上类似的序列的多核苷酸或多肽。在多核苷酸的情况下,与参考多核苷酸相比,变体可在5'端、3'端和/或一或多个内部位点处具有一或多个核苷酸的缺失、取代、添加。变体与参考多核苷酸之间的序列类似性和/或差异可使用本领域中已知的常规技术(例如聚合酶链反应(PCR)及杂交技术)检测。
变体多核苷酸也包括合成衍生的多核苷酸,诸如例如通过使用定点诱变产生的多核苷酸。一般而言,如通过本领域熟练技术人员已知的序列比对程序所测定的,多核苷酸(包括但不限于DNA或RNA)的变体可与参考多核苷酸具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
对于多肽或蛋白质序列,与参考多肽或蛋白质序列相比,变体可具有一或多个氨基酸的缺失、取代、添加。变体与参考多肽之间的序列相似性和/或差异可使用本领域熟练技术人员已知的常规技术(例如蛋白质印迹)检测。一般而言,如通过本领域的熟练技术人员已知的序列比对程序所测定的,多肽的变体与参考多肽可以具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些情况下,术语“变体”可用于描述包含变体衣壳序列的AAV。
术语“可操作地连接”针对两种或更多种组分(诸如序列元件),其中所述组分被排列成所述两种组分均正常起作用,且使得组分中的至少一个可介导施加于其他组分中的至少一个的功能成为可能。举例来说,若转录调节序列诸如启动子响应于一或多种转录调节因子的存在或不存在而控制编码序列的转录水平,则所述转录调节序列以可操作方式连接于编码序列。转录调节序列一般以顺式与编码序列可操作地连接,但不必与其直接相邻。举例而言,增强子是一种以可操作方式连接编码序列的转录调节序列,尽管它们并不毗邻。
多核苷酸“载体”或“构建体”能够将基因序列转移至靶细胞。通常,“载体构建体”、“表达载体”、“表达构建体”、“表达盒”及“基因转移载体”意谓能够导引所关注基因的表达且可将基因序列转移至靶细胞的任何核酸构建体。因此,该术语包括克隆和表达载体以及整合载体。
术语“感染性”病毒或病毒颗粒为包含能够组装的病毒衣壳且能够将多核苷酸组分递送至病毒物种对其具向性的细胞中的病毒或病毒颗粒。该术语未必暗示病毒的任何复制能力。用于计数感染性病毒颗粒的分析描述于在本发明中的其他地方及本领域中。病毒感染性可表示为感染性病毒颗粒与总病毒颗粒的比。确定感染性病毒颗粒与总病毒颗粒的比的方法为本领域中已知的。参见例如Grainger等人(2005)Mol.Ther.11:S337(描述TCID50感染滴度分析);及Zolotukhin等人(1999)Gene Ther.6:973。
本公开的生产方法中的昆虫细胞包含杆状病毒辅助构建体,其具有编码本文描述的经修饰的cap基因的表达盒。昆虫细胞可为(但不限于)经培养的细胞系,如衍生自粉斑夜蛾(Trichoplusia ni)的BTI-TN-5B1-4(High FiveTM,ThermoFisher Scientific,Carlsbad,CA)、Sf9细胞或Sf21细胞(其两者均衍生自草地贪夜蛾(Spodopterafrugiperda))、具有哺乳动物型聚糖概况的Sf9或TN368细胞(GlycoBac),或Sf-RVN细胞(MilliporeSigma)。
昆虫细胞可以另外包含(在相同辅助构建体上或在另外的辅助构建体上)包含AAVrep基因的表达盒。昆虫细胞中的辅助构建体包含转录调节元件,其指导和调节Rep蛋白和衣壳蛋白的表达。这些元件包括但不限于:在昆虫细胞中具有活性的组成型或诱导型启动子(例如,p5启动子、p10启动子、p19启动子、p40启动子、polh启动子、E1启动子和ΔE1启动子);Kozak序列;转录起始和终止位点(经修饰或未经修饰);mRNA剪接位点(经修饰或未经修饰,在多肽编码序列内或与多肽编码序列相邻;和病毒、真核或原核RNA元件,其控制mRNA的剪接、核输出、定位、稳定或翻译(例如,土拨鼠肝炎病毒转录后调节元件(WPRE)(Zufferey等人,J Virol.73(4):2886-92(1999))、MMLV/MPMV、真核组成型运输元件(CTE)(Li等人,Nature443(7108):234-7(2006))、RNA邮编(RNA zipcode)(Jambhekar和DeRisi,RNA 13(5):625-42(2007)),和增加翻译效率的omega或其他5’-UTR RNA元件)。
rAAV在其衣壳内可包含含有感兴趣的转基因的AAV载体。转基因可编码报告物蛋白用于使用生化(萤光素酶,SEAP)或成像(GFP,Venus,dTomato)技术进行检测。转基因可编码治疗蛋白,其包括但不限于嵌合抗原受体(CAR)、C-肽或胰岛素、胶原VII、IGF-I、脂蛋白脂肪酶、纤维蛋白原、凝血酶原、因子V、因子VIII、因子IX、因子XI、因子XII、因子XIII、血管性血友病因子(von Willebrand factor)、前激肽释放酶、高分子量激肽原(菲茨杰拉德因子(Fitzgerald factor))、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白C、蛋白S、蛋白Z、蛋白Z相关蛋白酶抑制剂、纤溶酶原、alpha 2-抗纤溶酶、组织纤溶酶原活化物、尿激酶、纤溶酶原活化物抑制剂-1和纤溶酶原活化物抑制剂-2。转基因可编码序列特异性核酸酶(ZFN、TALEN或Cas9)或序列特异性结合蛋白(ZFP、TALE或dCas9)。转基因可编码用于疫苗接种的免疫原性蛋白(例如,肿瘤抗原)。
AAV载体可包含转录调节元件(例如,启动子和强化子),其可指导和调节转基因在人类细胞中的表达。AAV载体还可在转基因表达盒的一端或两端包含AAV完全或部分反向末端重复(ITR)。需要ITR以用于包装和病毒整合至宿主(人类)基因组内。
目前已知在哺乳动物细胞中,野生型AAV的衣壳蛋白表达的优化比例为约VP1:VP2:VP3=1:1:10。以此比例表达的AAV衣壳蛋白能够高效的组装为结构完整的AAV颗粒。为此,在昆虫细胞中对衣壳蛋白编码序列优化主要策略为两种,一种为对VP1使用弱化的起始密码子(图1),另一种为在VP1特有序列中添加含有昆虫细胞启动子的内含子序列(图2)。
采用弱化VP1起始密码子的方式可以通过一条基因序列对AAV的3种VP蛋白进行同时表达。然而,由于起始密码子被弱化,翻译表达框中的其他具有较强起始翻译功能的密码子将会同时起始翻译,因此这种竞争作用将会降低完整VP1的表达量,而增加一些不完整的(缺失了部分N端序列)VP1表达。这些不完整的VP1蛋白参与AAV的组装,最终将会造成包装后的重组AAV衣壳中完整VP1蛋白的比例降低,进而影响感染性。
而如图2所示的第二种方式虽减弱了这种影响,但是也难以达到野生型的VP1比例水平,并且由于添加了额外的启动子,会对后续重组载体元件的组合优化造成限制。
本公开参考昆虫细胞中启动子及弱启动子密码子的使用频率,对昆虫细胞中AAV衣壳基因VP1中初试启动子序列下游的弱启动子密码子进行了同义突变,以降低这些原始密码子的起始翻译强度,从而降低了潜在的不完整VP1的表达,显著的改善了VP1蛋白在AAV衣壳蛋白中的比例。
下面结合附图和实施例对本公开作进一步详细的说明。以下实施例仅用于说明本公开而不用于限制本公开的范围。实施例中未注明具体条件的实验方法,系按照本领域已知的常规条件,或按照制造厂商所建议的条件进行操作。
实施例
实施例1.AAV8和AAV6.2FF的相关重组杆状病毒穿梭载体的构建及重组杆状病毒的获得
在本实施例中,通过如下步骤获得了AAV8和AAV6.2FF的相关重组杆状病毒穿梭载体和重组杆状病毒。
确定相关基因:Rep蛋白的基因来源于AAV2基因组(GenBank:AF043303.1),根据核糖体泄露扫描机制,参考文献(Smith R H,Levy J R,Kotin R M.A simplifiedbaculovirus-AAV expression vector system coupled with one-step affinitypurification yields high-titer rAAV stocks frominsect cells[J].MolecularTherapy,2009,17(11):1888-1896.)对其中碱基进行点突变。
Cap蛋白的基因来源于AAV8(NC_006261.1)和AAV6.2FF基因组(van Lieshout LP,Domm J M,Rindler T N,et al.A novel triple-mutant AAV6 capsid induces rapidand potent transgene expression in the muscle and respiratory tract of mice[J].Molecular Therapy-Methods&Clinical Development,2018,9:323-329.)。优化策略如图3所示。其中,Acie01的序列参见GenBank:NC_001623.1,杆状病毒同源区hr1的序列参见GenBank:M14313.1。
委托金斯瑞及通用生物系统(安徽)有限公司分别合成相应序列:Rep基因序列(核苷酸序列如SEQ ID NO:1所示),AAV8 Cap原始基因序列(核苷酸序列如SEQ ID NO:2所示),AAV8 Cap VP1优化后基因序列(核苷酸序列如SEQ ID NO:3所示),AAV6.2FF Cap原始基因序列(核苷酸序列如SEQ ID NO:4所示),AAV6.2FF Cap VP1优化后基因序列(核苷酸序列如SEQ ID NO:5所示),hr1和p6.9、p10启动子组合(hr1p6.9p10,核苷酸序列如SEQ ID NO:6所示),pH启动子和Acie01组合(pH-Acie01,核苷酸序列如SEQ ID NO:7所示)。
其中,相对于SEQ ID NO:2所示的AAV8 Cap原始基因序列,SEQ ID NO:3中对VP1特有区域中的密码子进行了以下密码子优化:将编码天冬氨酸(Asp)的密码子GAT突变为GAC;将编码亮氨酸(Leu)的密码子CTT突变为CTA;将编码脯氨酸(Pro)的密码子CCA突变为CCC;将编码亮氨酸(Leu)的密码子CTG突变为CTC;将编码缬氨酸(Val)的密码子GTG突变为GTC;将编码谷氨酸(Glu)的密码子GAA突变为GAG;和将编码苏氨酸(Thr)的密码子ACG突变为ACC。
相对于SEQ ID NO:4所示的AAV6 Cap原始基因序列,SEQ ID NO:5中对VP1特有区域中的密码子进行了以下密码子优化:将编码天冬氨酸(Asp)的密码子GAT突变为GAC;将编码异亮氨酸(Ile)的密码子ATT突变为ATC;将编码亮氨酸(Leu)的密码子TTG突变为CTC;将编码亮氨酸(Leu)的密码子CTG突变为CTC;将编码缬氨酸(Val)的密码子GTG突变为GTC;和将编码苏氨酸(Thr)的密码子ACG突变为ACC。
使用本领域熟知的同源重组方法将pAAV-EGFP载体(该载体包含pUC57骨架、上下游ITR及中间的启动子CMV、目的基因EGFP以及SV40 polyA)中的ITR-CMV-EGFP序列克隆至pFastBacdual载体(Invitrogen)上,测序鉴定后得到重组杆状病毒穿梭载体pFBd-ITR-EGFP(如图4和图5所示)。pFBd-ITR-EGFP载体的核苷酸序列如SEQ ID NO:8所示。随后,将四种Cap序列分别克隆至pFastBacdual上,测序鉴定后得到重组杆状病毒穿梭载体pFBd-IE-hr1Cap8-Rep(核苷酸序列如SEQ ID NO:9所示)、pFBd-IE-hr1Cap8VP1Opti-Rep(核苷酸序列如SEQ ID NO:10所示)、pFBd-IE-hr1Cap6.2FF-Rep(核苷酸序列如SEQ ID NO:11所示)和pFBd-IE-hr1Cap6.2FFVP1Opti-Rep(核苷酸序列如SEQ ID NO:12所示)四个重组杆状病毒穿梭载体。重组序列和重组杆状病毒穿梭载体pFBd-IE-hr1Cap-Rep分别如图6和图7中所示。
将重组载体pFBd-ITR-EGFP、pFBd-IE-hr1Cap8-Rep、pFBd-IE-hr1Cap8VP1Opti-Rep、pFBd-IE-hr1Cap6.2FF-Rep和pFBd-IE-hr1Cap6.2FFVP1Opti-Rep分别转化至DH10Bac感受态细胞(Invitrogen),进行蓝白斑筛选,挑取白色阳性克隆培养。使用PureLinkTMHiPure Plasmid DNA Purification Kits(Invitrogen)分别提取杆状病毒质粒(Bacmid)。将5种Bacmid分别转染至贴壁Sf9细胞(Gbico)。4天后,收获初代重组杆状病毒,并进行扩增至P2代。得到P2代重组杆状病毒分别命名为BV-ITR-EGFP、BV-IE-hr1Cap8-Rep、BV-IE-hr1Cap8VP1Opti-Rep、BV-IE-hr1Cap6.2FF-Rep和BV-IE-hr1Cap6.2FFVP1Opti-Rep。
使用空斑法分别测定病毒滴度。此部分内容具体参照Bac to Bac ExpressionSystem操作手册(Invitrogen)。
实施例2.AAV相关重组杆状病毒的制备
AAV的包装和获取方法如下:将P2代重组杆状病毒分别以MOI=5共感染25mL悬浮Sf9细胞(密度5.0E+06细胞/mL)。感染4天后收获细胞,4200rpm离心10分钟分离细胞和培养上清。将培养上清于4℃保存,细胞使用25mL TNT裂解液(20mM Tris–HCl(pH 7.5),150mMNaCl,1% Triton X-100,10mmol/l MgCl2)室温孵育1小时裂解,并以100U/mL终浓度加入核酸酶,于4℃消化过夜,次日10000rpm离心。最终将离心后的裂解上清液与细胞培养上清液混合,得到初步的AAV病毒原液。
具体来说,AAV8-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap8-Rep如上述方法共感染Sf9细胞;AAV8VP1Opti-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap8VP1Opti-Rep如上述方法共感染Sf9细胞;AAV6.2FF-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap6.2FF-Rep如上述方法共感染Sf9细胞;AAV6.2FFVP1Opti-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap6.2FF-Rep如上述方法共感染Sf9细胞。
实施例3.AAV相关重组杆状病毒的滴度和感染性比较
使用本领域熟知的qPCR方法对实施例2中获得的AAV8-EGFP、AAV8VP1Opti-EGFP、AAV6.2FF-EGFP和AAV6.2FFVP1Opti-EGFP病毒原液进行物理滴度测定,并换算成每毫升细胞培养体积下的产毒滴度。最终得出AAV8-EGFP的原液滴度为2.54×1012VG/mL,AAV8VP1Opti-EGFP的原液滴度为8.53×1011VG/mL,AAV6.2FF-EGFP的原液滴度为1.30×1012VG/mL,AAV6.2FFVP1Opti-EGFP的原液滴度为7.26×1011VG/mL。
对四种病毒原液使用POROSTMCaptureSelectTM亲和层析填料(Thermo)进行纯化,纯化后样品使用相同qPCR方法测定物理滴度。将纯化后样品梯度稀释,以不同MOI感染贴壁培养的293T细胞(获自ATCC,48孔板,5.0E+04细胞/孔)。感染2天后,用流式细胞仪检测EGFP的表达效率。
实验结果表明,衣壳优化后制备出的AAV8VP1Opti-EGFP和AAV6.2FFVP1Opti-EGFP相比于原始衣壳的AAV8-EGFP和AAV6.2FF-EGFP虽然物理滴度分别下降了3倍和2倍左右,但是生物感染性能分别提高3.5倍和5.3倍(表1)。因此,使用此方法进行衣壳优化后,单位细胞培养体积条件下的感染性AAV病毒颗粒的产量达到显著提升。
表1.AAV重组病毒颗粒的感染性
实施例4.优化前后AAV相关重组杆状病毒的衣壳蛋白比例
使用0-20%的预制胶(南京金斯瑞生物科技有限公司)将等量(约2×1011VG)的四种AAVAAV8-EGFP、AAV8VP1Opti-EGFP、AAV6.2FF-EGFP和AAV6.2FFVP1Opti-EGFP进行SDS-PAGE。具体步骤如下:用PBS稀释AAV样品,达到40μL体积中含有约2×1011VG的AAV颗粒,向其中加入10μL 5×浓度上样loading buffer,混匀之后放置于100℃金属浴中加热10min。组装好SDS-PAGE仪器进行上样,每个预制胶孔上样40μL加热后的样品,蛋白Marker(Thermofisher,26616)上样量为8μL。加样完毕,盖好上盖,连接电泳仪,电压设定为150V,当溴酚蓝指示剂迁移到距前沿1-2cm处即停止电泳,电泳时间大约70min。
电泳结束后,取出胶板,放入容器中使用0.25%的考马斯亮蓝染液进行染色过夜。次日弃去染色液,用蒸馏水把胶面漂洗几次,然后加入脱色液,进行扩散脱色。每30min换一次脱色液,直至蛋白质带清晰为止,分析衣壳比例。
如图8所示,结果表明,衣壳优化后的病毒中VP1的比例相比于原始衣壳的病毒得到显著提高。
实施例5.AAV9的相关重组杆状病毒穿梭载体的构建及重组杆状病毒的获得和制备
Cap蛋白的基因来源于野生型AAV9 VP1基因(GenBank:AY530579),委托金斯瑞及通用生物系统(安徽)有限公司合成将起始密码子改为ACG的AAV9 cap VP1基因序列(SEQID NO:22所示),以及对VP1特有区域Cap9VP1opti-1优化后的序列(SEQ ID NO:23所示)。
其中,相对于SEQ ID NO:22所示的未对AAV9 Cap VP1特有区域进行优化的序列,SEQ ID NO:23所示的VP1opti-1序列中对VP1特有区域中的密码子进行了以下优化:将编码天冬氨酸(Asp)的密码子GAT突变为GAC(该突变是为了突变掉起始密码子后的一个非正常顺序编码的ATG);将编码亮氨酸(Leu)的密码子TTG突变为TTA;将编码缬氨酸(Val)的密码子GTG突变为GTC;将编码苏氨酸(Thr)的密码子ACG突变为ACC;将编码亮氨酸(Leu)的密码子CTG突变为CTC。
使用本领域熟知的同源重组方法将AAV9 Cap VP1(SEQ ID NO:22所示)置换到pFBd-IE-hr1Cap8-Rep上,测序鉴定后得到重组杆状病毒供体质粒载体pFBd-IE-hr1Cap9-Rep。通过同源重组方法将优化后VP1特有区域Cap9VP1opti-1(SEQ ID NO:23所示)置换到pFBd-IE-hr1Cap9-Rep上,测序鉴定后得到重组杆状病毒供体质粒载体pFBd-IE-hr1Cap9VP1Opti-1-Rep。
使用本领域熟知的定点突变及同源重组方法对pFBd-IE-hr1Cap9VP1Opti-1-Rep的VP1特有区域Cap9 VP1opti-1第25个氨基酸亮氨酸密码子分别突变为弱的同义密码子CTA、CTC、CTT,突变后分别命名为VP1opti-2(SEQ ID NO:24所示)、VP1opti-3(SEQ ID NO:25所示)、VP1opti-4(SEQ ID NO:26所示),测序鉴定后得到重组杆状病毒供体质粒载体pFBd-IE-hr1Cap9VP1Opti-2-Rep、pFBd-IE-hr1Cap9VP1Opti-3-Rep、pFBd-IE-hr1Cap9VP1Opti-4-Rep。
各个载体中的优化策略如下表所示。
表2.不同载体中的优化策略
将重组载体pFBd-ITR-EGFP、pFBd-IE-hr1Cap9-Rep、pF pFBd-IE-hr1Cap9VP1Opti-1-Rep、pFBd-IE-hr1Cap9VP1Opti-2-Rep、pFBd-IE-hr1Cap9VP1Opti-3-Rep和pFBd-IE-hr1Cap9VP1Opti-4-Rep分别转化至DH10Bac感受态细胞(Invitrogen),进行蓝白斑筛选,挑取白色阳性克隆培养。使用PureLinkTMHiPure Plasmid DNA PurificationKits(Invitrogen)分别提取杆状病毒质粒(Bacmid)。将5种Bacmid分别转染至贴壁Sf9细胞(Gbico)。4天后,收获初代重组杆状病毒,并进行扩增至P2代。得到P2代重组杆状病毒分别命名为BV-ITR-EGFP、BV-IE-hr1Cap9-Rep、BV-IE-hr1Cap9VP1Opti-1-Rep、BV-IE-hr1Cap9VP1Opti-2-Rep、BV-IE-hr1Cap9VP1Opti-3-Rep和BV-IE-hr1Cap9VP1Opti-4-Rep。
使用空斑法分别测定病毒滴度。此部分内容具体参照Bac to Bac ExpressionSystem操作手册(Invitrogen)。
实施例6:AAV相关重组杆状病毒的制备
AAV的包装和获取方法如下:将P2代重组杆状病毒分别以MOI=0.5共感染25mL悬浮Sf9细胞(密度5.0E+06细胞/mL)。感染4天后收获细胞,4200rpm离心10分钟分离细胞和培养上清。将培养上清于4℃保存。细胞使用25mL TNT裂解液(20mM Tris–HCl(pH 7.5),150mMNaCl,1% Triton X-100,10mmol/l MgCl2)室温孵育1小时裂解,并以100U/mL终浓度加入核酸酶,10000rpm离心。最终将离心后的裂解上清液与细胞培养上清液混合,得到初步的AAV病毒原液。
具体来说,AAV9-WT-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap9-Rep如上述方法共感染Sf9细胞;AAV9VP1Opti-1-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap9VP1Opti-1-Rep如上述方法共感染Sf9细胞;AAV9VP1Opti-2-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap9VP1Opti-2-Rep如上述方法共感染Sf9细胞;AAV9VP1Opti-3-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap9VP1Opti-3-Rep如上述方法共感染Sf9细胞;AAV9VP1Opti-4-EGFP的获得方式为使用BV-ITR-EGFP和BV-IE-hr1Cap9VP1Opti-4-Rep如上述方法共感染Sf9细胞。
实施例7:AAV相关重组杆状病毒的滴度和感染性比较
使用本领域熟知的qPCR方法对实施例6中获得的AAV9-WT-EGFP、AAV9VP1Opti-1-EGFP、AAV9VP1Opti-2-EGFP、AAV9VP1Opti-3-EGFP和AAV9VP1Opti-4-EGFP病毒原液进行物理滴度测定,并换算成每毫升细胞培养体积下的产毒滴度,如下表3所示。
表3.AAV重组病毒包装产量测定
样本名称 | 小量包装产量VG/mL |
AAV9-WT-EGFP | 1.08×1012 |
AAV9VP1Opti-1-EGFP | 1.05×1012 |
AAV9VP1Opti-2-EGFP | 1.17×1012 |
AAV9VP1Opti-3-EGFP | 1.08×1012 |
AAV9VP1Opti-4-EGFP | 1.11×1012 |
对五种病毒原液使用POROSTMCaptureSelectTM亲和层析填料(Thermo)进行纯化,纯化后样品使用相同qPCR方法测定物理滴度。将纯化后样品梯度稀释,以不同MOI感染贴壁培养的293T细胞(获自ATCC,48孔板,5.0E+04细胞/孔)。感染2天后,用流式细胞仪检测EGFP的表达效率。
表4.AAV重组病毒颗粒的感染性
实验结果表明,衣壳优化后制备出的AAV9VP1Opti-1-EGFP、AAV9VP1Opti-2-EGFP、AAV9VP1Opti-3-EGFP和AAV9VP1Opti-4-EGFP病毒相比于原始衣壳的AAV9-EGFP在物理滴度上无显著性差异,但是生物感染性能提高5倍以上(表4)。因此,使用此方法进行衣壳优化后,单位细胞培养体积条件下的感染性AAV病毒颗粒的产量达到显著提升。
实施例8:优化前后AAV相关重组杆状病毒的衣壳蛋白比例
使用0-20%的预制胶(南京金斯瑞生物科技有限公司)将等量(约2×1011VG)的AAV9-WT-EGFP、AAV9VP1Opti-1-EGFP、AAV9VP1Opti-2-EGFP、AAV9VP1Opti-3-EGFP和AAV9VP1Opti-4-EGFP进行SDS-PAGE。具体步骤如下:用PBS稀释AAV样品,达到40μL体积中含有约2×1011VG的AAV颗粒,向其中加入10μL 5×浓度上样loading buffer,混匀之后放置于100℃金属浴中加热10min。组装好SDS-PAGE仪器进行上样,每个预制胶孔上样40μL加热后的样品,蛋白Marker(Thermofisher,26616)上样量为8μL。加样完毕,盖好上盖,连接电泳仪,电压设定为150V,当溴酚蓝指示剂迁移到距前沿1-2cm处即停止电泳,电泳时间大约70min。
电泳结束后,取出胶板,放入容器中使用0.25%的考马斯亮蓝染液进行染色过夜。次日弃去染色液,用蒸馏水把胶面漂洗几次,然后加入脱色液,进行扩散脱色。每30min换一次脱色液,直至蛋白质带清晰为止,分析衣壳比例。
如图9所示,结果表明,衣壳优化后的病毒中VP1的比例相比于原始衣壳的病毒得到显著提高。
Claims (43)
1.一种对腺相关病毒(AAV)的衣壳蛋白编码基因(cap基因)的衣壳蛋白编码序列进行改造的方法,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,所述方法包括:
(1)对VP1的编码序列使用弱起始密码子;和
(2)对VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子进行密码子优化,从而降低所述密码子的起始翻译强度。
2.根据权利要求1的方法,其中:
(1)对VP1的编码序列使用起始密码子ACG;和/或
(2)对VP1特有区段中的密码子优化包括:将VP1特有区段中具有较强的起始功能的密码子全部或部分突变为非上述密码子的同义密码子。
3.一种对腺相关病毒(AAV)的衣壳蛋白编码基因(cap基因)的衣壳蛋白编码序列进行改造的方法,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,所述方法包括:
(1)对VP1和VP2的编码序列使用弱起始密码子并且对VP3的编码序列使用强起始密码子;和
(2)对VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子进行密码子优化,从而降低所述密码子的起始翻译强度。
4.根据权利要求3的方法,其中对VP1和VP2的编码序列使用起始密码子ACG,并且对VP3的编码序列使用起始密码子ATG。
5.根据权利要求1-4中任一项的方法,其中除VP1特有区段以外,还对所述衣壳蛋白编码序列中另外的编码序列区段中的一个或多个密码子进行密码子优化,从而降低所述密码子的起始翻译强度,所述另外的编码序列区段选自:
(1)VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段;
(2)VP3的编码序列的起始密码子下游的编码序列区段;和
(3)(1)和(2)的组合。
6.根据权利要求1-5中任一项的方法,其中所述密码子优化包括选自以下的一项或多项:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码亮氨酸(Leu)的密码子CTT突变为非CTT的同义密码子,优选突变为CTA,优选对所述区段中的所有密码子CTT进行突变;
(3)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(4)将编码异亮氨酸(Ile)的密码子ATT突变为非ATT的同义密码子,优选突变为ATC,优选对所述区段中的所有密码子ATT进行突变;
(5)将编码脯氨酸(Pro)的密码子CCA突变为非CCA的同义密码子,优选突变为CCC,优选对所述区段中的所有密码子CCA进行突变;
(6)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(7)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(8)将编码谷氨酸(Glu)的密码子GAA突变为非GAA的同义密码子,优选突变为GAG,优选对所述区段中的所有密码子GAA进行突变;和
(9)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
7.根据权利要求6的方法,其中所述密码子优化包括(1)至(9)项中的至少2项、至少3项、至少4项、至少5项、至少6项、至少7项、全部8项或全部9项。
8.根据权利要求6或7的方法,其中所述密码子优化包括选自以下的一项或多项:
(1)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(2)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(3)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;和
(4)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
9.根据权利要求8的方法,其中所述密码子优化包括(1)至(4)项中的至少2项、至少3项或全部4项。
10.根据权利要求1-9中任一项的方法,其中所述方法还包括:
在所述密码子优化后,对所述衣壳蛋白编码序列中存在于相邻两个密码子中的三核苷酸ATG进行优化,在不改变所述相邻两个密码子编码的氨基酸的情况下,将三核苷酸ATG突变为非ATG的序列。
11.根据权利要求1-10中任一项的方法,其中所述AAV为选自下组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和AAV9,优选所述AAV为AAV6、AAV8或AAV9血清型。
12.权利要求11的方法,其中所述AAV为AAV6血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码异亮氨酸(Ile)的密码子ATT突变为非ATT的同义密码子,优选突变为ATC,优选对所述区段中的所有密码子ATT进行突变;
(3)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(4)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(5)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(6)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
13.权利要求11的方法,其中所述AAV为AAV8血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码亮氨酸(Leu)的密码子CTT突变为非CTT的同义密码子,优选突变为CTA,优选对所述区段中的所有密码子CTT进行突变;
(3)将编码脯氨酸(Pro)的密码子CCA突变为非CCA的同义密码子,优选突变为CCC,优选对所述区段中的所有密码子CCA进行突变;
(4)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(5)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(6)将编码谷氨酸(Glu)的密码子GAA突变为非GAA的同义密码子,优选突变为GAG,优选对所述区段中的所有密码子GAA进行突变;
(7)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
14.权利要求11的方法,其中所述AAV为AAV9血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为TTA、CTA、CTC或CTT,优选对所述区段中的所有密码子TTG进行突变;
(2)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(3)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(4)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
15.权利要求14的方法,其中所述方法还包括:
在所述密码子优化后,对所述衣壳蛋白编码序列中存在于相邻两个密码子中的三核苷酸ATG进行优化,在不改变所述相邻两个密码子编码的氨基酸的情况下,将三核苷酸ATG突变为非ATG的序列。
16.通过权利要求1-15中任一项的方法获得的AAV的cap基因的衣壳蛋白编码序列。
17.一种重组AAV的cap基因的衣壳蛋白编码序列,其具有如SEQ ID NO:3或SEQ ID NO:5所示的核苷酸序列,或与SEQ ID NO:3或SEQ ID NO:5所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
18.一种重组AAV的cap基因的衣壳蛋白编码序列,所述编码序列中的VP1启动子及VP1特有区段具有如SEQ ID NO:23-26中任一项所示的核苷酸序列,或与SEQ ID NO:23-26中任一项所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
19.一种重组AAV的cap基因的衣壳蛋白编码序列,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,其中:
(1)VP1的编码序列具有弱起始密码子;
(2)VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子经密码子优化使得所述密码子的起始翻译强度降低。
20.根据权利要求19的衣壳蛋白编码序列,其中:
(1)VP1的编码序列具有起始密码子ACG;和/或
(2)VP1特有区段中的密码子优化包括:所述VP1特有区段中具有较强的起始功能的密码子全部或部分突变为非上述密码子的同义密码子。
21.一种重组AAV的cap基因的衣壳蛋白编码序列,其中所述cap基因通过一条编码序列以不同的起始密码子编码衣壳蛋白VP1、VP2和VP3,其中:
(1)VP1和VP2的编码序列具有弱起始密码子并且VP3的编码序列具有强起始密码子;
(2)VP1的编码序列的起始密码子和VP2的编码序列的起始密码子之间的编码序列区段(VP1特有区段)中的一个或多个密码子经密码子优化使得所述密码子的起始翻译强度降低。
22.根据权利要求21的重组AAV的cap基因的衣壳蛋白编码序列,其中VP1和VP2的编码序列具有起始密码子ACG,且VP3的编码序列具有起始密码子ATG。
23.根据权利要求19-22中任一项的重组AAV的cap基因的衣壳蛋白编码序列,其中除VP1特有区段以外,所述衣壳蛋白编码序列中另外的编码序列区段中的一个或多个密码子还经密码子优化使得所述密码子的起始翻译强度降低,所述另外的编码序列区段选自:
(1)VP2的编码序列的起始密码子和VP3的编码序列的起始密码子之间的编码序列区段;
(2)VP3的编码序列的起始密码子下游的编码序列区段;和
(3)(1)和(2)的组合。
24.根据权利要求19-23中任一项的重组AAV的cap基因的衣壳蛋白编码序列,其中所述密码子优化包括选自以下的一项或多项:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码亮氨酸(Leu)的密码子CTT突变为非CTT的同义密码子,优选突变为CTA,优选对所述区段中的所有密码子CTT进行突变;
(3)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(4)将编码异亮氨酸(Ile)的密码子ATT突变为非ATT的同义密码子,优选突变为ATC,优选对所述区段中的所有密码子ATT进行突变;
(5)将编码脯氨酸(Pro)的密码子CCA突变为非CCA的同义密码子,优选突变为CCC,优选对所述区段中的所有密码子CCA进行突变;
(6)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(7)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(8)将编码谷氨酸(Glu)的密码子GAA突变为非GAA的同义密码子,优选突变为GAG,优选对所述区段中的所有密码子GAA进行突变;和
(9)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
25.根据权利要求24的重组AAV的cap基因的衣壳蛋白编码序列,其中所述密码子优化包括(1)至(9)项中的至少2项、至少3项、至少4项、至少5项、至少6项、至少7项、全部8项或全部9项。
26.根据权利要求24或25的重组AAV的cap基因的衣壳蛋白编码序列,其中所述密码子优化包括选自以下的一项或多项:
(1)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(2)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(3)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;和
(4)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
27.根据权利要求26的衣壳蛋白编码序列,其中所述密码子优化包括(1)至(4)项中的至少2项、至少3项或全部4项。
28.根据权利要求19-27中任一项的衣壳蛋白编码序列,其中所述衣壳蛋白编码序列中存在于相邻两个密码子中的三核苷酸ATG进行了优化,在不改变所述相邻两个密码子编码的氨基酸的情况下,三核苷酸ATG突变为非ATG的序列。
29.根据权利要求19-28中任一项的重组AAV的cap基因的衣壳蛋白编码序列,其中所述AAV为选自下组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和AAV9,优选所述AAV为AAV6、AAV8或AAV9血清型。
30.根据权利要求29的衣壳蛋白编码序列,其中所述AAV为AAV6血清型,且所述密码子优化包括VP1特有区段中的密码子进行了以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码异亮氨酸(Ile)的密码子ATT突变为非ATT的同义密码子,优选突变为ATC,优选对所述区段中的所有密码子ATT进行突变;
(3)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子TTG进行突变;
(4)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(5)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(6)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
31.根据权利要求29的衣壳蛋白编码序列,其中所述AAV为AAV8血清型,且所述密码子优化包括VP1特有区段中的密码子进行了以下密码子优化:
(1)将编码天冬氨酸(Asp)的密码子GAT突变为非GAT的同义密码子,优选突变为GAC,优选对所述区段中的所有密码子GAT进行突变;
(2)将编码亮氨酸(Leu)的密码子CTT突变为非CTT的同义密码子,优选突变为CTA,优选对所述区段中的所有密码子CTT进行突变;
(3)将编码脯氨酸(Pro)的密码子CCA突变为非CCA的同义密码子,优选突变为CCC,优选对所述区段中的所有密码子CCA进行突变;
(4)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(5)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(6)将编码谷氨酸(Glu)的密码子GAA突变为非GAA的同义密码子,优选突变为GAG,优选对所述区段中的所有密码子GAA进行突变;
(7)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
32.权利要求29的衣壳蛋白编码序列,其中所述AAV为AAV9血清型,且所述密码子优化包括对VP1特有区段中的密码子进行以下密码子优化:
(1)将编码亮氨酸(Leu)的密码子TTG突变为非TTG的同义密码子,优选突变为TTA、CTA、CTC或CTT,优选对所述区段中的所有密码子TTG进行突变;
(2)将编码亮氨酸(Leu)的密码子CTG突变为非CTG的同义密码子,优选突变为CTC,优选对所述区段中的所有密码子CTG进行突变;
(3)将编码缬氨酸(Val)的密码子GTG突变为非GTG的同义密码子,优选突变为GTC,优选对所述区段中的所有密码子GTG进行突变;
(4)将编码苏氨酸(Thr)的密码子ACG突变为非ACG的同义密码子,优选突变为ACC,优选对所述区段中的所有密码子ACG进行突变。
33.根据权利要求32的衣壳蛋白编码序列,其中所述衣壳蛋白编码序列中存在于相邻两个密码子中的三核苷酸ATG进行了优化,在不改变所述相邻两个密码子编码的氨基酸的情况下,三核苷酸ATG突变为非ATG的序列。
34.根据权利要求19所述的重组AAV的cap基因的衣壳蛋白编码序列,其具有如SEQ IDNO:3或SEQ ID NO:5所示的核苷酸序列,或与SEQ ID NO:3或SEQ ID NO:5所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
35.根据权利要求19所述的重组AAV的cap基因的衣壳蛋白编码序列,所述编码序列中的VP1启动子及VP1特有区段具有如SEQ ID NO:23-26中任一项所示的核苷酸序列,或与SEQID NO:23-26中任一项所示的序列具有至少80%、至少85%、至少90%、至少95%、至少98%,或至少99%序列一致性的变体核苷酸序列。
36.一种载体,所述载体包含根据权利要求19-35中任一项所述的重组AAV的cap基因的衣壳蛋白编码序列,优选所述载体是表达载体。
37.根据权利要求36的载体,其中所述载体是病毒载体,优选昆虫杆状病毒载体。
38.根据权利要求37的载体,其中所述载体来源于选自以下的载体系统:Bac-to-Bac载体系统、flashBac/BacMagic载体系统、BaculoDirect载体系统或BacPAK6/Bacologold载体系统。
39.根据权利要求36-38中任一项所述的载体,其中所述载体还包含AAV的复制相关蛋白基因(rep基因),优选所述rep基因来源于AAV2血清型。
40.根据权利要求36-39中任一项所述的载体,其中所述载体还包含编码感兴趣的蛋白质的核苷酸序列。
41.细胞,所述细胞包含权利要求36-40中任一项所述的载体,优选所述细胞是昆虫细胞。
42.一种制备重组AAV的方法,所述方法包括:
(1)培养根据权利要求41所述的细胞;和
(2)从所述细胞和/或培养上清液分离所述重组AAV。
43.根据权利要求42的方法,其中当在所述细胞中表达时,所述VP1、VP2和VP3的表达量的比例为约1:1:10。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211254858 | 2022-10-13 | ||
CN2022112548581 | 2022-10-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117343943A true CN117343943A (zh) | 2024-01-05 |
Family
ID=89370612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311325464.5A Pending CN117343943A (zh) | 2022-10-13 | 2023-10-12 | 腺相关病毒的衣壳蛋白编码基因改造方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117343943A (zh) |
WO (1) | WO2024078584A1 (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6489141B1 (en) * | 1997-07-09 | 2002-12-03 | The University Of Queensland | Nucleic acid sequence and methods for selectively expressing a protein in a target cell or tissue |
AU2006304997B2 (en) * | 2005-10-20 | 2012-03-01 | Uniqure Ip B.V. | Improved AAV vectors produced in insect cells |
MX345729B (es) * | 2009-03-04 | 2017-02-14 | Deutsches Krebsforsch | Proteina activadora del ensamblaje (aap) y su uso para la fabricacion de particulas de parvovirus que consisten esencialmente de vp3. |
IL247729B2 (en) * | 2014-03-10 | 2023-09-01 | Uniqure Ip Bv | Improved aav vectors produced in insect cells |
CN115867647A (zh) * | 2020-04-02 | 2023-03-28 | 优尼科生物制药有限公司 | 新型细胞系 |
CA3169087A1 (en) * | 2020-04-02 | 2021-10-07 | David Johannes Francois DU PLESSIS | Dual bifunctional vectors for aav production |
EP4301768A2 (en) * | 2021-03-03 | 2024-01-10 | Voyager Therapeutics, Inc. | Controlled expression of viral proteins |
-
2023
- 2023-10-12 WO PCT/CN2023/124269 patent/WO2024078584A1/zh unknown
- 2023-10-12 CN CN202311325464.5A patent/CN117343943A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2024078584A1 (zh) | 2024-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11613765B2 (en) | Vectors with modified initiation codon for the translation of AAV-Rep78 useful for production of AAV | |
US8163543B2 (en) | AAV vectors produced in insect cells | |
US20240167002A1 (en) | Compositions and Methods for Producing Recombinant AAV | |
WO2021113767A1 (en) | Novel compositions and methods for producing recombinant aav | |
WO2024078584A1 (zh) | 腺相关病毒的衣壳蛋白编码基因改造方法 | |
AU2016202153B2 (en) | Vectors with modified initiation codon for the translation of AAV-Rep78 useful for production of AAV in insect cells | |
DK2035564T3 (en) | VECTORS WITH MODIFIED initiation codon TO THE TRANSLATION OF AAV rep 78 FOR PRODUCTION OF AAV IN INSECT CELLS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40096825 Country of ref document: HK |