ES2734355T3 - Vectores de baculovirus que comprenden secuencias de codificación repetidas con sesgos de codones diferenciales - Google Patents
Vectores de baculovirus que comprenden secuencias de codificación repetidas con sesgos de codones diferenciales Download PDFInfo
- Publication number
- ES2734355T3 ES2734355T3 ES16176100T ES16176100T ES2734355T3 ES 2734355 T3 ES2734355 T3 ES 2734355T3 ES 16176100 T ES16176100 T ES 16176100T ES 16176100 T ES16176100 T ES 16176100T ES 2734355 T3 ES2734355 T3 ES 2734355T3
- Authority
- ES
- Spain
- Prior art keywords
- amino acid
- nucleotide sequence
- sequence
- sequences
- parvovirus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108020004705 Codon Proteins 0.000 title claims abstract description 80
- 239000013598 vector Substances 0.000 title claims description 91
- 241000701447 unidentified baculovirus Species 0.000 title claims description 75
- 239000002773 nucleotide Substances 0.000 claims abstract description 188
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 188
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 181
- 210000004027 cell Anatomy 0.000 claims abstract description 174
- 241000238631 Hexapoda Species 0.000 claims abstract description 144
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 125
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 113
- 241000125945 Protoparvovirus Species 0.000 claims abstract description 111
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 claims abstract description 81
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 claims abstract description 69
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 58
- 150000001413 amino acids Chemical class 0.000 claims abstract description 20
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims abstract description 6
- 238000004519 manufacturing process Methods 0.000 claims description 60
- 150000007523 nucleic acids Chemical class 0.000 claims description 51
- 108020004707 nucleic acids Proteins 0.000 claims description 44
- 102000039446 nucleic acids Human genes 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 28
- 210000002845 virion Anatomy 0.000 claims description 25
- 108090000565 Capsid Proteins Proteins 0.000 claims description 16
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 16
- 108700010070 Codon Usage Proteins 0.000 claims description 11
- 241000702421 Dependoparvovirus Species 0.000 claims description 11
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 11
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 11
- 230000002068 genetic effect Effects 0.000 claims description 10
- 229920001184 polypeptide Polymers 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 6
- 230000006978 adaptation Effects 0.000 claims description 5
- 238000001261 affinity purification Methods 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims description 3
- 235000018102 proteins Nutrition 0.000 description 113
- 108091026890 Coding region Proteins 0.000 description 28
- 238000010276 construction Methods 0.000 description 20
- 238000013518 transcription Methods 0.000 description 19
- 230000035897 transcription Effects 0.000 description 19
- 210000004962 mammalian cell Anatomy 0.000 description 18
- 235000001014 amino acid Nutrition 0.000 description 14
- 101710197658 Capsid protein VP1 Proteins 0.000 description 13
- 108091081024 Start codon Proteins 0.000 description 13
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 description 12
- 210000000234 capsid Anatomy 0.000 description 12
- 208000015181 infectious disease Diseases 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 10
- 239000000243 solution Substances 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000014621 translational initiation Effects 0.000 description 7
- 241001203868 Autographa californica Species 0.000 description 6
- 108020005350 Initiator Codon Proteins 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- 108020004459 Small interfering RNA Proteins 0.000 description 5
- 241000256251 Spodoptera frugiperda Species 0.000 description 5
- 239000004055 small Interfering RNA Substances 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 241000701366 unidentified nuclear polyhedrosis viruses Species 0.000 description 5
- 241000701945 Parvoviridae Species 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 238000001415 gene therapy Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000002458 infectious effect Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 101150066583 rep gene Proteins 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 241000282412 Homo Species 0.000 description 3
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 3
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 3
- 102100022119 Lipoprotein lipase Human genes 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 238000001190 Q-PCR Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 2
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 2
- 102100022641 Coagulation factor IX Human genes 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 108010056651 Hydroxymethylbilane synthase Proteins 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 101100218334 Mus musculus Aurkc gene Proteins 0.000 description 2
- 241000121250 Parvovirinae Species 0.000 description 2
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 101710093543 Probable non-specific lipid-transfer protein Proteins 0.000 description 2
- 101710150114 Protein rep Proteins 0.000 description 2
- 101710152114 Replication protein Proteins 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- 238000002679 ablation Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000256173 Aedes albopictus Species 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 102000005666 Apolipoprotein A-I Human genes 0.000 description 1
- 108010059886 Apolipoprotein A-I Proteins 0.000 description 1
- 102100029470 Apolipoprotein E Human genes 0.000 description 1
- 101710095339 Apolipoprotein E Proteins 0.000 description 1
- 101000756436 Autographa californica nuclear polyhedrosis virus Uncharacterized 23.6 kDa protein in LEF2-PH intergenic region Proteins 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000121256 Densovirinae Species 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 102000013446 GTP Phosphohydrolases Human genes 0.000 description 1
- 108091006109 GTPases Proteins 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 102000016354 Glucuronosyltransferase Human genes 0.000 description 1
- 108010092364 Glucuronosyltransferase Proteins 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 1
- 241000484121 Human parvovirus Species 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 208000001021 Hyperlipoproteinemia Type I Diseases 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101000930477 Mus musculus Albumin Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- WDVSHHCDHLJJJR-UHFFFAOYSA-N Proflavine Chemical compound C1=CC(N)=CC2=NC3=CC(N)=CC=C3C=C21 WDVSHHCDHLJJJR-UHFFFAOYSA-N 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 101150100379 Rep52 gene Proteins 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 108010048889 Thyroxine-Binding Proteins Proteins 0.000 description 1
- 102000009488 Thyroxine-Binding Proteins Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 206010060749 Type I hyperlipidaemia Diseases 0.000 description 1
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 108091006088 activator proteins Proteins 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- IRSCQMHQWWYFCW-UHFFFAOYSA-N ganciclovir Chemical compound O=C1NC(N)=NC2=C1N=CN2COC(CO)CO IRSCQMHQWWYFCW-UHFFFAOYSA-N 0.000 description 1
- 229960002963 ganciclovir Drugs 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 108010011677 glyoxylate aminotransferase Proteins 0.000 description 1
- 208000009429 hemophilia B Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 229940002612 prodrug Drugs 0.000 description 1
- 239000000651 prodrug Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
Landscapes
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
Una célula de insecto que comprende una primera secuencia de nucleótidos que codifica una primera secuencia de aminoácidos y una segunda secuencia de nucleótidos que codifica una segunda secuencia de aminoácidos, en la que: (a) la primera y la segunda secuencias de nucleótidos están cada una unida operativamente a secuencias de control de la expresión para la expresión en una célula de insecto; (b) la primera y la segunda secuencias de aminoácidos comprenden una secuencia de aminoácidos común de la cual al menos 100 aminoácidos tienen una identidad de aminoácidos de al menos un 90 % entre la primera y la segunda secuencias de aminoácidos; (c) las secuencias de nucleótidos que codifican la secuencia de aminoácidos común en la primera y la segunda secuencias de aminoácidos son menos del 95% idénticas; (d) el uso de codones de la primera o segunda secuencias de nucleótidos que codifica la secuencia de aminoácidos común está adaptado al uso de codones de la célula huésped de insecto; (e) la primera secuencia de nucleótidos codifica la secuencia de aminoácidos de una proteína Rep52 o 40 de parvovirus y la segunda secuencia de nucleótidos codifica la secuencia de aminoácidos de una proteína Rep78 o 68 de parvovirus; y (f) las secuencias de aminoácidos comunes comprenden las secuencias de aminoácidos del segundo aminoácido más C-terminal de la proteína Rep52 o 40 de parvovirus.
Description
DESCRIPCIÓN
Vectores de baculovirus que comprenden secuencias de codificación repetidas con sesgos de codones diferenciales
Campo de la invención
La presente invención se refiere a los campos de la medicina, la biología molecular y la terapia génica. La invención se refiere a la producción de proteínas en células de insectos mediante la cual se utilizan secuencias de codificación repetidas en vectores de baculovirus. En particular, la invención se refiere a la producción de vectores parvovíricos que pueden utilizarse en la terapia génica y a mejoras en la expresión de las proteínas rep virales que incrementen la productividad de los vectores parvovíricos.
Antecedentes de la invención
El sistema de expresión de baculovirus es bien conocido por su uso como vector de clonación y expresión eucariótico (King, L. A., y R. D. Possee, 1992, "The baculovirus expression system", Chapman y Hall, United Kingdom; O'Reilly, D. R., y col., 1992. Baculovirus Expression Vectors: A Laboratory Manual. New York: W. H. Freeman.). Entre otras ventajas del sistema de expresión de baculovirus se encuentran que las proteínas expresadas son casi siempre solubles, están correctamente plegadas y son biológicamente activas. Otras ventajas incluyen el conocimiento de las preferencias de codones de las células de insectos (véase, por ejemplo, el documento US2003/0228696), los altos niveles de expresión de proteínas, una producción más rápida, la idoneidad para la expresión de proteínas de gran tamaño y la idoneidad para la producción a gran escala. Sin embargo, en la producción a gran escala o continua de proteínas heterólogas utilizando el sistema de expresión de baculovirus en biorreactores de células de insectos, la inestabilidad de los niveles de producción, también conocido como el efecto de paso, es un obstáculo importante. Este efecto se debe, al menos en parte, a la recombinación entre secuencias homólogas repetidas en el ADN de baculovirus.
El sistema de expresión den baculovirus se ha usado con éxito también para la producción de vectores de virus adenoasociados (VAA) recombinantes (Urabe y col., 2002, Hum. Gene Ther. 13: 1935-1943; documento US 6.723.551 y documento US 20040197895). Los VAA pueden considerarse no de los vectores virales más prometedores para la terapia génica humana. Los VAA tienen la capacidad de infectar eficazmente dividiendo así como no dividiendo las células humanas, el genoma del virus VAA se integra en un único sitio cromosómico en el genoma de la célula huésped, y lo más importante, aunque el VAA está presente en muchos seres humanos, nunca se ha asociado con ninguna enfermedad. En vista de estas ventajas, se está evaluando el virus adenoasociado recombinante (VAAr) en ensayos clínicos de terapia génica para la hemofilia B, el melanoma maligno, la fibrosis quística, la hiperlipoproteinemia de tipo I y otras enfermedades.
Para superar los problemas con los sistemas de producción de mamífero para VAA Urabe y col., (2002, mencionado anteriormente) desarrollaron un sistema de producción de VAA en células de insecto. Para la producción de VAA en células de insecto fue necesario realizar algunas modificaciones con el fin de lograr la estequiometría correcta de las tres proteínas de la cápside de VAA (VP1, VP2 y VP3), que se basa en una combinación del uso alterno de dos sitios aceptores de corte y empalme y la utilización subóptima de un codón de iniciación ACG para VP2 que no se reproduce con precisión por células de insectos. Para imitar la estequiometría correcta de las proteínas de la cápside en células de insectos, Urabe y col., ((2002, citado anteriormente) utilizan una construcción que se transcribe en un único mensajero policistrónico que es capaz de expresar las tres proteínas VP sin necesidad de corte y empalme y en el que el codón iniciador en dirección 5' se sustituye por el codón iniciador subóptimo ACG. El documento WO2007/046703 da a conocer una mejora adicional de la infectividad de los vectores VAAr producidos en baculovirus basados en la producción mediante optimización de la estequiometría de las proteínas de la cápside de VAA tal como se producen en células de insectos. El documento WO2007/084773 da a conocer la suplementación de VP1 en relación con VP2 y VP3 y un vector de VP1 que comprende secuencias de nucleótidos que expresan VP1.
Para la expresión de las proteínas Rep de VAA en el sistema de expresión de células de insecto de VAA como han desarrollado inicialmente Urabe y col., (2002, citado anteriormente), se usa una construcción de baculovirus recombinante que alberga dos unidades independientes de expresión de Rep (una para Rep78 y una para Rep52), cada una bajo el control de un promotor de células de insecto distinto, los promotores AIE1 y PolH, respectivamente.
No obstante, Kohlbrenner y col., (2005, Mol. Ther. 12: 1217-25; documento WO 2005/072364) notificaron que la construcción de baculovirus para la expresión de las dos proteínas Rep, tal como utilizan Urabe y col., sufre de una inestabilidad inherente. Al dividir la orientación palindrómica de los dos genes de Rep en el vector original de Urabe y diseñando dos vectores de baculovirus independientes para expresar Rep52 y Rep78, Kohlbrenner y col., (2005, citado anteriormente) se aumentó la estabilidad al pase del vector. Sin embargo, a pesar de la expresión coherente de Rep78 y Rep52 a partir de las dos construcciones independientes de Rep en baculovirus en células de insecto en al menos 5 pases, el rendimiento del vector VAAr es de 5 a 10 veces menor en comparación con la construcción de baculovirus-Rep original diseñado por Urabe y col., (2002, mencionado anteriormente).
En el documento WO2007/148971, los presentes inventores han mejorado significativamente la estabilidad de la producción del vector de VAAr en células de insecto mediante el uso de una sola secuencia de codificación para las proteínas Rep78 y Rep52 en el que se utiliza un codón iniciador subóptimo para la proteína Rep78 que está
parcialmente omitido por los ribosomas de exploración para permitir la iniciación de la traducción también en dirección 3' en el codón de iniciación de la proteína Rep52.
Sin embargo, existe todavía la necesidad de mejoras adicionales en la producción a gran escala (comercial) de proteínas heterólogas, incluyendo los vectores de VAAr, en células de insecto. Por lo tanto es un objeto de la presente invención proporcionar medios y procedimientos que permitan un rendimiento estable y alto (a gran escala) de la producción de proteínas heterólogas y vectores parvovíricos.
Descripción de la invención
Definiciones
Tal como se utiliza en el presente documento, la expresión "unido operativamente" se refiere a un enlace de elementos de polinucleótido (o polipéptido) en una relación funcional. Un ácido nucleico está “unido operativamente” cuando se coloca en una relación funcional con otra secuencia de ácido nucleico. Por ejemplo, una secuencia reguladora de la transcripción está operativamente unida a una secuencia de codificación si afecta a la transcripción de la secuencia de codificación. Unido operativamente significa que las secuencias de ADN que están unidas son típicamente contiguas y, cuando es necesario, la unión de dos regiones de codificación de proteínas, contiguas y en el marco de lectura.
“Secuencia de control de la expresión" se refiere a una secuencia de ácido nucleico que regula la expresión de una secuencia de nucleótidos a la que está unida operativamente. Una secuencia de control de la expresión está "unido operativamente" a una secuencia de nucleótidos cuando la secuencia de control de la expresión controla y regula la transcripción y/o la traducción de la secuencia de nucleótidos. Por lo tanto, una secuencia de control de la expresión puede incluir promotores, potenciadores, sitios de entrada al ribosoma interno (IRES), terminadores de la transcripción, un codón de iniciación en el frente de un gen que codifica la proteína, señal de corte y empalme para intrones, y codones de terminación. La expresión "secuencia de control de la expresión" se pretende que incluya, como mínimo, una secuencia cuya presencia está diseñada para influir sobre la expresión, y también puede incluir componentes ventajosos adicionales. Por ejemplo, secuencias líder y secuencias de pareja de fusión son secuencias de control de la expresión. La expresión también puede incluir el diseño de la secuencia de ácido nucleico de tal manera que se eliminan de la secuencia posibles codones de iniciación dentro y fuera del marco. También puede incluir el diseño de la secuencia de ácido nucleico de tal manera que se eliminan los sitios de corte y empalme potenciales no deseados. Incluye secuencias o secuencias de poliadenilación (pA) que dirigen la adición de una cola de poliA, es decir, una cadena de residuos de adenina en el extremo 3' de un ARNm, secuencias denominadas secuencias poliA. También pueden diseñarse para mejorar la estabilidad del ARNm. Las secuencias de control de la expresión que afectan a la estabilidad de la transcripción y traducción de estabilidad, por ejemplo, promotores, así como las secuencias que efectúan la traducción, por ejemplo, secuencias de Kozak, se conocen en células de insecto. Las secuencias de control de la expresión pueden ser de tal naturaleza que modulan la secuencia de nucleótidos a la que están unidas operativamente de tal manera que se consiguen niveles de expresión más bajos o niveles de expresión más altos.
Tal como se utiliza en el presente documento, el término "promotor" o "secuencia reguladora de la transcripción" se refiere a un fragmento de ácido nucleico que funciona controlando la transcripción de una o más secuencias de codificación, y está situado en dirección 5' con respecto a la dirección de la transcripción del sitio de iniciación de la transcripción de la secuencia de codificación y está estructuralmente identificado por la presencia de un sitio de unión para la ARN polimerasa dependiente de ADN, sitios de iniciación de la transcripción y cualquier otra secuencia de ADN, incluyendo, pero sin limitaciones, los sitios de unión para el factor de transcripción, sitios de unión para la proteína represora y activadora, y cualquier otra secuencia de nucleótidos conocida para un experto en la técnica para actuar directa o indirectamente para regular la cantidad de transcripción a partir del promotor. Un promotor "constitutivo" es un promotor que es activo en la mayoría de los tejidos en las condiciones ambientales y fisiológicas del desarrollo. Un promotor "inducible" es un promotor que está regulado fisiológicamente en el desarrollo, por ejemplo, por la aplicación de un inductor químico. Un promotor “específico de tejido" es activo únicamente en tipos específicos de células o tejidos.
Las expresiones "sustancialmente idéntico/a", "identidad sustancial" o "esencialmente similar/es" o "similitud esencial" significa que dos péptidos o dos secuencias de nucleótidos, cuando están alineadas óptimamente, tales como mediante los programas GAP o BESTFIT usando parámetros por defecto, comparten al menos un cierto porcentaje de identidad de secuencia como se define en otro lugar del presente documento. GAP usa el algoritmo de alineación global de Needleman y Wunsch para alinear dos secuencias sobre la totalidad de su longitud, de modo que se maximiza el número de coincidencias y minimiza el número de huecos. Generalmente se usan los parámetros por defecto de GAP con una penalización por creación de hueco= 50 (nucleótidos)/8 (proteínas) y penalización por extensión de hueco= 3 (nucleótidos)/2 (proteínas). Para los nucleótidos, la matriz de puntuación por defecto usada es nwsgapdna y para las proteínas, la matriz de puntuación por defecto es Blosum62 (Henikoff y Henikoff, 1992, PNAS 89, 915-919). Está claro que cuando se dice que las secuencias de ARN son esencialmente similares o tienen un cierto grado de identidad de secuencia con secuencias de ADN, la timina (T) en la secuencia de ADN se considera igual a uracilo (U) en la secuencia de ARN. Las alineaciones y puntuaciones de las secuencias para el porcentaje de la identidad de secuencia se puede determinar, por ejemplo, usando programas de ordenador, tal como el paquete GCG Wisconsin Versión 10.3, disponible en Accelrys Inc., 9685 Scranton Road, San Diego, CA 92121-3752 UsA o el
software de fuente abierta EMBOSS para Windows (versión actual 2.7, 1-07). Como alternativa se puede determinar el porcentaje de similitud o identidad mediante la búsqueda en bases de datos tales como FASTA, BLAST, etc.
Las secuencias de nucleótidos que codifican proteínas Rep de parvovirus de la invención también pueden definirse por su capacidad para hibridarse con las secuencias de nucleótidos de SEQ ID NO. de 1 - 4, respectivamente, en condiciones de hibridación moderadas o, preferentemente, rigurosas. Las condiciones de hibridación rigurosas se definen en el presente documento como condiciones que permiten que una secuencia de ácido nucleico de al menos aproximadamente 25, preferentemente aproximadamente 50 nucleótidos, 75 o 100 y, lo más preferentemente, de aproximadamente 200 o más nucleótidos, hibride a una temperatura de aproximadamente 65 °C en una solución que comprende aproximadamente 1 M de sal, preferentemente 6 x SSC o cualquier otra solución con una fuerza iónica comparable, y lavado a 65 °C en una solución que comprende aproximadamente 0,1 M de sal, o menos, preferentemente 0,2 x SSC o cualquier otra solución con una comparable fuerza iónica. Preferentemente, la hibridación se realiza durante la noche, es decir al menos durante 10 horas y, preferentemente, el lavado se lleva a cabo durante al menos una hora con al menos dos cambios de la solución de lavado. Estas condiciones generalmente permitirán la hibridación específica de secuencias que tienen aproximadamente 90 % o más de identidad de secuencia.
Las condiciones moderadas se definen en el presente documento como condiciones que permiten que secuencias de ácido nucleico de al menos 50 nucleótidos, preferentemente aproximadamente 200 o más nucleótidos, hibriden a una temperatura de aproximadamente 45 °C en una solución que comprende aproximadamente 1 M de sal, preferentemente 6 x SSC o cualquier otra solución con una fuerza iónica comparable, y lavado a temperatura ambiente en una solución que comprende aproximadamente 1 M de sal, preferentemente 6 x SSC o cualquier otra solución con una fuerza iónica comparable. Preferentemente, la hibridación se realiza durante la noche, es decir al menos durante 10 horas y, preferentemente, el lavado se lleva a cabo durante al menos una hora con al menos dos cambios de la solución de lavado. Estas condiciones generalmente permitirán la hibridación específica de secuencias que tienen hasta un 50 % de identidad de secuencia. El experto en la técnica será capaz de modificar estas condiciones de hibridación con el fin de identificar específicamente las secuencias con una identidad variable entre 50 % y 90 %.
Descripción detallada de la invención
En algunos aspectos, la presente divulgación se refiere a la utilización de parvovirus animales, en particular dependovirus, tales como VAA infecciosos de simio o humanos, y los componentes de los mismos (por ejemplo, un genoma de parvovirus de animal) para su uso como vectores para la introducción y/o expresión de ácidos nucleicos en células de mamífero. En particular, la invención se refiere a mejoras en la productividad de tales vectores de parvovirus cuando se producen en células de insecto.
Los virus de la familia Parvoviridae son pequeños virus animales de ADN. La familia Parvoviridae puede dividirse en dos subfamilias: la Parvovirinae, que infectan a los vertebrados, y la Densovirinae, que infecta a insectos. Los miembros de la subfamilia Parvovirinae se denominan en el presente documento los parvovirus e incluyen el género Dependovirus. Como se deduce a partir del nombre de su género, los miembros de Dependovirus son únicos en cuanto a que, por lo general, requieren coinfección con un virus auxiliar, tal como adenovirus o virus herpes, para la infección productiva en cultivo celular. El género Dependovirus incluye VAA, que normalmente infecta a seres humanos (por ejemplo, los serotipos 1, 2, 3A, 3B, 4, 5, y 6) o primates (por ejemplo, los serotipos 1 y 4), y virus relacionados que infectan a otros animales de sangre caliente (por ejemplo, virus adenoasociados bovinos, caninos, equinos y ovinos). Información adicional sobre los parvovirus y otros miembros de la familia Parvoviridae se describe en Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication," Capítulo 69 en Fields Virology (3a Ed. 1996). Por conveniencia, la presente invención se ilustra adicionalmente con ejemplos y se describe en el presente documento por referencia a VAA. Sin embargo, se entiende que la invención no se limita a VAA sino que puede aplicarse igualmente a otros parvovirus.
La organización genómica de todos los serotipos de VAA conocidos es muy similar. El genoma de los VAA es una molécula de ADN monocatenario lineal que tiene menos de aproximadamente 5.000 nucleótidos (nt) de longitud. Repeticiones terminales invertidas (ITR) flanquean las secuencias de nucleótidos de codificación únicas para las proteínas de replicación no estructurales (Rep) y las proteínas estructurales (VP). Las proteínas VP (VP1, -2 y -3) forman la cápside. Los 145 nt terminales son autocomplementarios y están organizados de manera que se puede formar un dúplex intramolecular energéticamente estable formando una horquilla en forma de T. Estas estructuras de horquilla funcionan como un origen para la replicación del ADN viral, sirviendo como cebadores para el complejo de la ADN polimerasa celular. Después de la infección de del VAA silvestre en células de mamífero, los genes de Rep (es decir, Rep78 y Rep52) se expresan a partir del promotor P5 y el promotor P19, respectivamente, y ambas proteínas Rep tienen una función en la replicación del genoma viral. Un acontecimiento de corte y empalme en el ORF de Rep da lugar a la expresión de, en realidad, cuatro proteínas Rep (es decir, Rep78, Rep68, Rep52 y Rep40). Sin embargo, se ha demostrado que el ARNm sin cortar, que codifica las proteínas Rep78 y Rep52, en células de mamífero, son suficientes para la producción del vector VAA. También en las células de insecto, las proteínas Rep78 y Rep52 son suficientes para la producción del vector VAA.
Un "vector VAA o de parvovirus recombinante" (o "vector de VAAr") en el presente documento se refiere a un vector que comprende una o más secuencias de polinucleótidos de interés, genes de interés o "transgenes" que están flanqueados por secuencias de repetición de repetición terminales invertidas (ITR) de parvovirus o de VAA. Tales
vectores de VAAr pueden replicarse y empaquetarse en partículas víricas infecciosas cuando están presentes en una célula huésped de insecto que se expresan productos génicos rep y cap de VAA (es decir, proteínas Rep y Cap de VAA). Cuando un vector de VAAr se incorpora en una construcción de ácido nucleico más grande (por ejemplo, en un cromosoma o en otro vector tal como un plásmido o baculovirus utilizado para la clonación o transfección), el vector de VAAr se denomina típicamente "provector" que puede "rescatarse" mediante replicación y encapsidación en presencia de funciones de empaquetamiento de VAA y funciones auxiliares necesarias.
En un primer aspecto, la invención se refiere a una célula de insecto que comprende una primera secuencia de nucleótidos que codifica una primera secuencia de aminoácidos y una segunda secuencia de nucleótidos que codifica una segunda secuencia de aminoácidos, en las que: (a) la primera y la segunda secuencia de nucleótidos están cada una unida de manera operativa a secuencias de control de la expresión para la expresión en una célula de insecto; (b) la primera y la segunda secuencias de aminoácidos comprenden una secuencia de aminoácidos común de la cual por lo menos 100 aminoácidos tienen una identidad de aminoácidos de al menos 90 % entre las secuencias primera y segunda de aminoácidos; (c) las secuencias de nucleótidos que codifican la secuencia de aminoácidos común en las primera y segunda secuencias de aminoácidos tienen menos del 95 % de identidades; (d) el uso de codones de la primera o segunda secuencia de nucleótidos que codifica la secuencia de aminoácidos común está adaptado para el uso de codones de la célula huésped de insectos; (e) la primera secuencia de nucleótidos codifica la secuencia de aminoácidos de una proteína Rep52 o 40 de parvovirus y la segunda secuencia de nucleótidos codifica la secuencia de aminoácidos de una proteína Rep78 o 68 de parvovirus; y (f) las secuencias de aminoácidos comunes comprenden las secuencias de aminoácidos del segundo aminoácido al aminoácido más C-terminal de la proteína Rep52 o 40 de parvovirus. La célula de insecto comprende al menos una primera secuencia de nucleótidos que codifica una primera secuencia de aminoácidos y una segunda secuencia de nucleótidos que codifica una segunda secuencia de aminoácidos. Preferentemente, las primera y segunda secuencias de aminoácidos comprenden cada una secuencia de aminoácidos común de la cual al menos 100, 200, 300, 350 o 398 aminoácidos tienen al menos 90, 95, 98, 99 o 100 % de identidad de aminoácidos entre la primera y la segunda secuencias de aminoácidos. Por el contrario, las secuencias de nucleótidos que codifican las secuencias de aminoácidos comunes en las primera y segunda secuencias de aminoácidos (como está presente en las primera y segunda secuencias de nucleótidos, respectivamente) tienen menos de 95, 90, 89, 88,4, 85, 80, 75, 70, 65, 60, o 55 % de identidad.
Por lo general, las primera y segunda secuencias de aminoácidos serán heterólogas para la célula de insecto. Preferentemente, al menos una de las secuencias de aminoácidos comunes en las primera y segunda secuencias de aminoácidos es una secuencia de aminoácidos de origen natural. Más preferentemente, al menos una de las primera y segunda secuencias de aminoácidos son secuencias de aminoácidos de origen natura. Lo más preferentemente, las primera y segunda secuencias de aminoácidos son secuencias de aminoácidos de origen natura.
En una realización preferida, la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la primera secuencia de nucleótidos tiene un sesgo de uso de codones mejorado para la célula de insecto, en comparación con la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la segunda secuencia de nucleótidos, en la que la diferencia en el índice de adaptación de codones entre la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en el primero y segundo nucleótido es de al menos 0,2. Se entiende en el presente documento que cada vez que se haga referencia al sesgo del uso de codones para una célula de insecto, esto incluye el sesgo del uso de codones para una célula de insecto infectada con baculovirus, incluyendo, en particular, el sesgo de uso de codones para una célula infectada con el virus de la polihedrosis nuclear múltiple Autographa californica (AcMNPV). El uso de codones de la primera secuencia de nucleótidos que codifica la secuencia de aminoácidos común preferentemente está adaptado u optimizado al uso de los codones de la célula huésped de insecto. La capacidad de adaptación de una secuencia de nucleótidos que codifica la secuencia de aminoácidos común al uso de los codones de la célula huésped puede expresarse como el índice de adaptación de codones (IAC). Preferentemente, el uso de codones está adaptado a la célula de insecto en la que la primera y segunda secuencia de nucleótidos están presentes. Por lo general, esta será una célula del género Spodoptera, Más preferentemente una célula de Spodoptera frugiperda. Por tanto, el uso de codones está, preferentemente, adaptado para Spodoptera frugiperda o para una célula infectada por el virus de la polihedrosis nuclear múltiple Autographa californica (AcMNPV). En el presente documento, un índice de adaptación de codones se define como una medida de la capacidad de adaptación relativa del uso de codones de un gen hacia el uso de codones de genes altamente expresados. La capacidad de adaptación relativa (w) de cada codón es la relación entre el uso de cada codón con el del codón más abundante para el mismo aminoácido. El índice de IAC se define como la media geométrica de estos valores de capacidad de adaptación relativa. Se excluyen los codones no sinónimos y los codones de terminación (en función del código genético). Los valores de IAC varían de 0 a 1, indicando los valores más altos una mayor proporción de los codones más abundantes (véase Sharp y Li, 1987, Nucleic Acids Research 15: 1281-1295; véase también: Kim y col., Gene. 1997, 199:293-301; zur Megede y col., Journal of Virology, 2000, 74: 2628-2635). En una célula de insecto preferente, la diferencia en el IAC entre la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la primera y segunda secuencias de nucleótidos es de al menos 0,3, 0,4, 0,5, 0,6, 0,7, 0,8. Preferentemente, además del IAC de la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la primera secuencia de nucleótidos es al menos 0,5, 0,6, 0,7, 0,8, 0,9 o 1,0.
Una secuencia de nucleótidos preferida que codifica la secuencia de aminoácidos común en la primera secuencia de nucleótidos es una secuencia de codificación en la que al menos 50, 75, 90, 95, 98 o 99 %, y preferentemente todos los codones no comunes o codones menos comunes están sustituidos por un codón común que codifica el mismo
aminoácido como se indica en la Tabla 1 o en la Tabla 2. En el presente documento se tiende que un codón común es el codón más frecuentemente utilizado que codifica cada residuo de aminoácido particular en genes de Spodoptera frugiperda altamente expresados, como se muestra en la Tabla 1 o en células infectadas por MNPV con genes de Autographa californica altamente expresados, como se muestra en la Tabla 2. Todos los codones distintos de los codones comunes y de los codones menos comunes son "codones no comunes". Los codones no comunes incluyen los "segundos codones más frecuentes", entendidos como codones que tienen la frecuencia más alta en la Tabla 1 o la Tabla 2. Preferentemente, la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la primera secuencia de nucleótidos tiene un tramo continuo de al menos 25, 50, 100, 200 o 300 codones, todos los cuales son codones comunes. La secuencia de codificación puede adaptarse además para mejorar la expresión en la célula huésped de insecto por procedimientos descritos en el documento WO 2004/059556 y mediante la modificación del contenido de CpG de la secuencia de codificación como se describe en el documento WO 2006/015789. Se entiende que tales adaptaciones adicionales pueden hacer que no todos los codones en la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la primera secuencia de nucleótidos son codones comunes.
En una realización preferida de la célula de insecto, todos los codones en la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la primera secuencia de nucleótidos son codones comunes de conformidad con (una de ellas) las Tablas 1 o 2. Más preferentemente, en una célula de insecto de este tipo, todos los codones de la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la segunda secuencia de nucleótidos son segundos codones más frecuentes de conformidad con (cualquiera de ellas) las Tablas 1 o 2, de modo que se entiende que si en la primera secuencia de nucleótidos, los codones comunes están de acuerdo con la Tabla 1, los segundos codones más frecuentes en la segunda secuencia de nucleótidos también están de acuerdo con la Tabla 1, o que si en la primera secuencia de nucleótidos, los codones comunes están de acuerdo con la Tabla 2, los segundos codones más frecuentes en la segunda secuencia de nucleótidos también están de acuerdo con la Tabla 2.
La optimización de codones puede realizarse sobre la base del uso de codones del organismo Spodoptera frugiperda como se puede encontrar en una base de datos de uso de codones (véase, por ejemplo, http://www.kazusa.or.jp/codon/). Los programas de ordenador adecuados para la optimización de codones están disponibles para el experto en la materia (véase, por ejemplo Jayaraj y col., 2005, Nucl. Acids Res. 33(9):3011-3016; y en internet). Como alternativa, las optimizaciones se pueden hacer a mano, usando la misma base de datos de uso de codones.
En una realización de la célula de insecto de la invención, al menos 50, 60, 80, 90 o 100 % de los codones en la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la segunda secuencia de nucleótidos están alterados en comparación con el codón correspondiente de la primera secuencia de nucleótidos para maximizar el contenido de AT o GC de la segunda secuencia de nucleótidos.
Por lo tanto, en una realización preferida de la invención, la diferencia en la secuencia de nucleótidos entre la primera y segunda secuencia de nucleótidos que codifica las secuencias de aminoácidos comunes se maximiza (es decir, la identidad de nucleótidos se reduce al mínimo) mediante uno o más de: a) cambiar el sesgo de codones de la primera secuencia de nucleótidos que codifica la secuencia de aminoácidos común; b) cambiar el sesgo de codones de la segunda secuencia de nucleótidos que codifica la secuencia de aminoácidos común; c) cambiar el contenido de GC de la primera secuencia de nucleótidos que codifica la secuencia de aminoácidos común; y d) cambiar el contenido de GC de la segunda secuencia de nucleótidos que codifica la secuencia de aminoácidos común.
Una realización preferida de la invención de la célula de insecto se refiere a la producción de proteínas de parvovirus en las células de insecto de la invención. En particular, las proteínas de parvovirus se producen en las células de insecto en el contexto de la preparación de vectores de parvovirus recombinantes, más preferentemente vectores de parvovirus de animales recombinantes y, lo más preferentemente, vectores VAA recombinantes. Por lo tanto, en esta realización preferida de las células de insecto de la invención, la primera secuencia de nucleótidos codifica una secuencia de aminoácidos de una proteína Rep52 o 40 de parvovirus y la segunda secuencia de nucleótidos codifica una secuencia de aminoácidos de una proteína Rep78 o 68 de parvovirus. Se entiende, sin embargo, que las realizaciones en las que la primera secuencia de nucleótidos codifica una secuencia de aminoácidos de una proteína Rep78 o 68 de parvovirus y la segunda secuencia de nucleótidos codifica una secuencia de aminoácidos de una proteína Rep52 o proteína 40 de parvovirus están incluidas expresamente en la invención. Por conveniencia en las realizaciones se utilizará la secuencia de nucleótidos que codifica una proteína Rep52 o 40 de parvovirus como primera secuencia de nucleótidos y la secuencia de nucleótidos que codifica una proteína Rep78 o 68 de parvovirus como segunda secuencia de nucleótidos, pero la inversa de estas realizaciones se incluye expresamente en la invención. La secuencia de aminoácidos común codificada por la primera y segunda secuencias de nucleótidos comprenden o consisten en las secuencias de aminoácidos de al menos el segundo aminoácido al aminoácido más C-terminal de una proteína Rep52 o 40 de parvovirus. Preferentemente, las secuencias de aminoácidos comunes comprenden o consisten en el primer aminoácido al aminoácido más C-terminal de la proteína Rep52 o 40 de parvovirus. Las identidades de aminoácidos entre las secuencias de aminoácidos comunes de parvovirus son como se han definido anteriormente para las secuencias de aminoácidos comunes. Preferentemente, en la célula de insecto, las proteínas Rep de parvovirus son proteínas Rep de virus adenoasociados (VAA). Más preferentemente, las proteínas Rep de parvovirus codificadas en la primera y segunda secuencias de nucleótidos son del mismo serotipo.
Una secuencia de nucleótidos que codifica proteínas Rep de parvovirus, se entiende, en el presente documento, como
una secuencia de nucleótidos que codifica las proteínas Rep no estructurales que son necesarias y suficientes para la producción de vectores de parvovirus en las células de insectos, tales como las proteínas Rep78 o Rep68, y Rep52 0 Rep40. La secuencia de nucleótidos de parvovirus animales es, preferentemente, de un dependovirus, más preferentemente de virus adenoasociado (VAA) de ser humano o de simio y, lo más preferentemente, de un VAA que normalmente infecta a los seres humanos (por ejemplo, los serotipos 1, 2, 3A, 3B, 4, 5 y 6) o primates (por ejemplo, los serotipos 1 y 4). Un ejemplo de una secuencia de nucleótidos que codifica las proteínas Rep de parvovirus animales se da en la SEQ ID No.7, que representa una parte del genoma de la secuencia de serotipo 2 de VAA que codifica las proteínas Rep. La secuencia de codificación de Rep78 comprende los nucleótidos 11 a 1876 y la secuencia de codificación de Rep52 comprende los nucleótidos 683 - 1876, también representados por separado en la SEQ ID No.
1 y 5. Se entiende que los pesos moleculares exactos de las proteínas Rep78 y Rep52, así como las posiciones exactas de los codones de iniciación de la traducción pueden diferir entre diferentes parvovirus. Sin embargo, el experto sabrá cómo identificar la posición correspondiente en la secuencia de nucleótidos de otros parvovirus distintos de VAA-2.
Una (primera) secuencia de nucleótidos que codifica una proteína Rep52 de parvovirus puede, por tanto, definirse como una secuencia de nucleótidos:
a) que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 50, 60, 70, 80, 88, 89, 90, 95, 97, 98, o 99 % de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO. 6; b) que tiene al menos 50, 60, 70, 80, 81, 82, 85, 90, 95, 97, 98, o 99 % de identidad de secuencia con la secuencia de nucleótidos de una cualquiera de las SEQ ID NO de 1 -. 5 y 10;
c) la cadena complementaria de la que se hibrida a una secuencia de molécula de ácido nucleico de (a) o (b); d) secuencias de nucleótidos cuya secuencia difiere de la secuencia de una molécula de ácido nucleico de (c) debido a la degeneración del código genético.
Una (segunda) secuencia de nucleótidos que codifica una proteína Rep78 de parvovirus puede, por tanto, definirse como una secuencia de nucleótidos:
a) que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 50, 60, 70, 80, 88, 89, 90, 95, 97, 98, o 99 % de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO. 8; b) que tiene al menos 50, 60, 70, 80, 81, 82, 85, 90, 95, 97, 98, o 99 % de identidad de secuencia con la secuencia de nucleótidos de las posiciones 11-1876 de la SEQ ID NO de 7;
c) la cadena complementaria de la que se hibrida a una secuencia de molécula de ácido nucleico de (a) o (b); d) secuencias de nucleótidos cuya secuencia difiere de la secuencia de una molécula de ácido nucleico de (c) debido a la degeneración del código genético.
Preferentemente, la secuencia de nucleótidos codifica las proteínas Rep de parvovirus humanos que son necesarias y suficientes para la producción de vectores de parvovirus en células de insecto.
Las diversas modificaciones de la primera y segunda secuencia de nucleótidos de codificación como se ha definido anteriormente, incluyendo, por ejemplo, las secuencias de parvovirus de tipo silvestre, para la expresión apropiada en células de insectos se consigue mediante la aplicación de técnicas de ingeniería genética bien conocidas, tales como se describe en, por ejemplo, Sambrook y Russell (2001) "Molecular Cloning: A Laboratory Manual, (3a edición), Cold Spring Harbor Laboratory Press, Cold Spring Harbor Laboratory Press, New York. El experto en la técnica conoce varias modificaciones adicionales de las regiones de codificación que podrían aumentar el rendimiento de las proteínas que codifican. Estás modificaciones están dentro del ámbito de la presente invención.
En las células de insecto de la invención. La primera y segunda secuencias de nucleótidos son, preferentemente, parte de una construcción de ácido nucleico. La célula de insecto puede comprender dos construcciones de ácido nucleico distintas, una para cada una de las primera y segunda secuencias de nucleótidos, o de la célula de insecto puede comprender un solo tipo de construcción de ácido nucleico que comprende tanto la primera como la segunda secuencias de nucleótidos.
En un aspecto adicional, la invención se refiere a una construcción de ácido nucleico que comprende una primera y/o una segunda secuencia de nucleótidos que codifica para una primera y una segunda secuencia de aminoácidos, respectivamente, que comprenden una secuencia de aminoácidos común como se ha definido anteriormente. Preferentemente, las primera y/o segunda secuencias de nucleótidos en la construcción codifican proteínas Rep de parvovirus como se han definido anteriormente. Preferentemente, en la construcción, la secuencia de nucleótidos que codifica la primera y la segunda secuencias de aminoácidos están unidas operativamente a secuencias de control de la expresión para la expresión en una célula de insecto. Estas secuencias de control de la expresión incluirán, como mínimo, un promotor que es activo en las células de insecto. Las técnicas conocidas para un experto en la materia para expresar genes extraños en células huésped de insecto se pueden utilizar para practicar la invención. La metodología para la ingeniería molecular y la expresión de polipéptidos en células de insecto se describe, por ejemplo, en Summers y Smith 1986. A Manual of Methods for Baculovirus Vectors and Insect Culture Procedures, Texas Agricultural Experimental Station Bull. No. 7555, College Station, Tex.; Luckow. 1991. En Prokop y col., Cloning and Expression of Heterologous Genes in Insect Cells with Baculovirus Vectors' Recombinant DNA Technology and Applications, 97-152; King, L. A. y R. D. Possee, 1992, The baculovirus expression system, Chapman and Hall, Reino
Unido; O'Reilly, D. R., L. K. Miller, V. A. Luckow, 1992, Baculovirus Expression Vectors: A Laboratory Manual, New York; W. H. Freeman y Richardson, C. D., 1995, Baculovirus Expression Protocols, Methods in Molecular Biology, volumen 39; documento US 4,745,051; documento US2003148506; y documento WO 03/074714. Los promotores adecuados para la transcripción de la primera y la segunda secuencias de nucleótidos de la invención incluyen, por ejemplo, los promotores de poliedro (pool), p10, p35, IE-1 o AIE-1 y otros promotores descritos en las referencias anteriores. Puesto que se sabe que en células de mamífero una expresión menos abundante de Rep78 en comparación con Rep52 favorece altos rendimientos de vectores (Li y col., 1997, J Virol. 71: 5236-43; Grimm y col., 1998, Hum Gene Ther. 9, 2745-2760), preferentemente se usa un promotor más débil para dirigir la expresión de la proteína Rep78 o 68 que el promotor utilizado para la expresión de la proteína Rep52 o 40. Por ejemplo, se puede usar el promotor de poliedro más fuerte para la expresión de la proteína Rep52 o 40, el promotor AIE1, un promotor mucho más débil que el promotor Polh, puede elegirse para dirigir la expresión de la proteína Rep78 o 68. Preferentemente, la elección de promotores para la proteína Rep52 o 40 y la proteína Rep78 o 68, respectivamente, es tal que en una célula de insecto con el fin de producir en la célula de insecto una relación molar de Rep78/68 a Rep52/40 en el intervalo de 1:10 a 10:1, 1:5 k.o. 5:1, o 1:3 a 3:1, preferentemente a aproximadamente 20 - 40 horas después de la infección, más preferentemente a aproximadamente 30 - 40 horas después de la infección, utilizando una expresión en baculovirus. La relación molar de Rep78 y Rep52 se puede determinar por medio de transferencia de tipo Western, utilizando preferentemente un anticuerpo monoclonal que reconoce un epítopo común tanto de Rep78/68 como de Rep52/40, o el uso de, por ejemplo, un anticuerpo anti-Rep de ratón (303,9, Progen, Alemania; dilución 1:50).
Preferentemente, la construcción de ácido nucleico para la expresión de la primera y la segunda secuencias de nucleótidos de la invención en células de insecto es un vector compatible con células de insectos. Un "vector compatible con células de insecto" o "vector" se entiende que es una molécula de ácido nucleico capaz de transformación o transfección productiva de un insecto o célula de insecto. Los vectores biológicos de ejemplo incluyen plásmidos, moléculas de ácido nucleico lineales y virus recombinantes. Se puede usar cualquier vector siempre que sea compatible con las células de insecto. El vector puede integrarse en el genoma de las células de insecto, pero el vector también puede ser episomal. La presencia del vector en la célula de insecto no tiene que permanente y también se incluyen vectores episomales transitorios. Los vectores pueden introducirse por cualquier medio conocido, por ejemplo mediante tratamiento químico de las células, electroporación, o infección. En una realización preferida, el vector es un baculovirus, un vector viral, o un plásmido. En una realización más preferida, el vector es un baculovirus, es decir, la construcción es un vector de baculovirus. Los vectores de baculovirus y los procedimientos para su uso se describen en las referencias citadas anteriormente en la ingeniería molecular de células de insecto.
Las construcciones de ácido nucleico de la invención pueden comprender además una secuencia de control de la expresión que comprende una secuencia de nueve nucleótidos de la SEQ. ID NO: 9 o una secuencia de nucleótidos sustancialmente homóloga a la SEQ. ID NO: 9, en dirección 5' de los codones de iniciación de la secuencia de nucleótidos que codifica la primera y/o la segunda secuencias de aminoácidos. Una secuencia con una identidad sustancial con la secuencia de nucleótidos de SEQ. ID NO: 9 y que ayudará a aumentar la expresión de la primera y/o las secuencias de aminoácidos es, por ejemplo, una secuencia que tiene al menos 60 %, 70 %, 80 % o 90 % de identidad con la secuencia de nueve nucleótidos de SEQ ID NO: 9.
La célula de insecto puede ser cualquier célula que sea adecuada para la producción de proteínas heterólogas. Preferentemente, la célula de insecto permite la replicación de los vectores de baculovirus y se puede mantener en cultivo. Más preferentemente, la célula de insecto también permite la replicación de los vectores de parvovirus recombinantes, incluyendo los vectores de VAAr. Por ejemplo, la línea celular utilizada puede ser las líneas celulares de Spodoptera frugiperda, Drosophila o las líneas celulares de mosquitos, por ejemplo, las líneas celulares de Aedes albopictus. Las células de insecto o líneas de células preferentes son células de la especie de insecto que son susceptibles a la infección por baculovirus, incluyendo, por ejemplo, Se301, SeIZD2109, SeUCR1, Sf9, Sf900+, Sf21, BTI-TN-5B1-4, MG-1, Tn368, HzAm1 Ha2302, Hz2E5, High Five (Invitrogen, CA, USA) y expresSF+®' (documento US 6.103.526; Protein Sciences Corp., CT, Estados Unidos).
Una célula de insecto preferida de acuerdo con la invención es una célula de insecto para la producción de vectores de parvovirus recombinantes. Esta célula de insecto comprende adicionalmente, además de la "primera" y la "segunda" secuencias de nucleótidos o la primera y la segunda secuencias de nucleótidos de las construcciones de ácido nucleico:
a) una tercera secuencia de nucleótidos que comprende al menos una secuencia de nucleótidos de repetición terminal invertida (secuencia ITR) de parvovirus; y
b) una cuarta secuencia de nucleótidos que comprende las secuencias de codificación de la proteína Cap de parvovirus unida operativamente a secuencias de control de la expresión para la expresión en una célula de insecto.
En el contexto de la invención se entiende que "al menos una secuencia de nucleótidos ITR de parvovirus" significa una secuencia palindrómica, que comprende secuencias principalmente complementarias y dispuestas simétricamente, también denominada regiones "A", "B" y "C". La ITR funciona como un origen de replicación, un sitio que tiene un papel "cis" en la replicación, es decir, es un sitio de reconocimiento para proteínas de replicación que actúan en trans, tales como, por ejemplo, Rep 78 (o Rep68) que reconocen el palíndromo y secuencias específicas
internas del palíndromo. Una excepción a la simetría de la secuencia ITR es la región "D" de la ITR. Es única (no tiene una complementaria dentro de una ITR). La realización de muescas en el ADN monocatenario se produce en la unión entre las regiones A y D. Es la región en la que se inicia una nueva síntesis de ADN. La región D normalmente se encuentra a un lado del palíndromo y proporciona direccionalidad de la etapa de replicación del ácido nucleico. Un parvovirus que se replica en una célula de mamífero tiene típicamente dos secuencias ITR. Sin embargo, es posible diseñar una ITR de modo que los sitios de unión estén en ambas hebras de las regiones A y las regiones D están situadas simétricamente, una a cada lado del palíndromo. En un molde de ADN circular de doble cadena (por ejemplo, un plásmido), la replicación de ácidos nucleicos asistida por Rep78 o Rep68 procede en ambas direcciones y una sola ITR es suficiente para la replicación del parvovirus de un vector circular. Por lo tanto, una secuencia de nucleótidos ITR se puede utilizar en el contexto de la presente invención. Preferentemente, sin embargo, se utilizan dos u otro número par de ITR regulares. Lo más preferentemente, se utilizan dos secuencias ITR. Una ITR de parvovirus preferente es una ITR de VAA. Por razones de seguridad, puede ser deseable construir un vector de parvovirus recombinante (VAAr) que no es capaz de propagarse adicionalmente después de la introducción inicial en una célula en presencia de un segundo VAA. Tal mecanismo de seguridad para limitar la propagación de vectores indeseable en un receptor puede proporcionarse mediante el uso de VAAr con una ITR quimérica como se describe en el documento US2003148506.
El número de construcciones de ácido nucleico empleadas en la célula de insecto para la producción del vector de parvovirus recombinante (VAAr) no es limitante en la invención. Por ejemplo, uno, dos, tres, cuatro, cinco, o más construcciones distintas se pueden emplear para producir VAAr en células de insecto de acuerdo con los procedimientos de la presente invención. Si se emplean cinco construcciones, una construcción codifica VP 1 de VAA, otra construcción codifica VP2 de VAA, otra construcción más codifica VP3 de VAA, todavía otra construcción más codifica la proteína Rep como se ha definido anteriormente y una construcción final comprende al menos una ITR de VAA. Si se utilizan menos de cinco construcciones, las construcciones pueden comprender varias combinaciones de la al menos una ITR de VAA y las secuencias de codificación de VP1, VP2, VP3, y la proteína Rep.
Preferentemente, se utilizan dos, tres o cuatro construcciones. Si se utilizan dos construcciones, preferentemente la célula de insecto comprende: (A) una primera construcción de ácido nucleico para la expresión de las proteínas Rep como se ha definido anteriormente, construcción que comprende además la cuarta secuencia de nucleótidos como se define en (b) anteriormente (que comprende las secuencias de codificación de la proteína Cap de parvovirus unidas operativamente a al menos una secuencia de control de la expresión para la expresión en una célula de insecto; véase también más adelante); y (B) una tercera construcción de ácido nucleico que comprende la tercera secuencia de nucleótidos como se ha definido en (a) anterior (que comprende al menos una secuencia de nucleótidos de ITR de parvovirus/VAA). Si se utilizan tres construcciones, se usa, preferentemente, la misma configuración que se usa para dos construcciones, excepto porque se usan construcciones separadas para la expresión de las proteínas de la cápside y para la expresión de las proteínas Rep. Si se utilizan cuatro construcciones, se usa, preferentemente, la misma configuración que se usa para tres construcciones, excepto porque se usan construcciones separadas para la expresión de las proteínas Rep78/68 y para la expresión de las proteínas Rep 52/40. Las secuencias de cada construcción pueden estar en cualquier orden una respecto a la otra. Por ejemplo, si una construcción comprende ITR y un ORF que comprende secuencias de nucleótidos que codifican proteínas de la cápside VP, el ORF de VP puede estar ubicado en la construcción de manera que, tras la replicación del ADN entre las secuencias ITR, el ORF de VP está replicado o no replicado. Para otro ejemplo, las secuencias de codificación y/o el ORF de Rep que comprenden las secuencias de nucleótidos que codifican proteínas de la cápside VP pueden estar en cualquier orden en una construcción. Se entiende que también las construcciones de ácido nucleico tercera, cuarta y más son, preferentemente, vectores compatibles con una célula de insecto, preferentemente vectores de baculovirus como se ha descrito anteriormente. Como alternativa, en la célula de insecto de la invención, una o más de la primera secuencia de nucleótidos, la tercera secuencia de nucleótido, la cuarta secuencia de nucleótidos, y la quinta secuencia de nucleótidos y otras secuencias de nucleótidos opcionales pueden estar integradas de forma estable en el genoma de la célula de insecto. Un experto en la técnica sabe cómo introducir de manera estable una secuencia de nucleótidos en el genoma de insecto y cómo identificar una célula que tiene dicha secuencia de nucleótidos en el genoma. La incorporación en el genoma puede añadirse mediante, por ejemplo, el uso de un vector que comprende las secuencias de nucleótidos altamente homólogas a regiones del genoma de insecto. El uso de secuencias específicas, tales como transposones, es otra manera de introducir una secuencia de nucleótidos en un genoma.
En la invención, en el presente documento se entiende la cuarta secuencia de nucleótidos que comprende las secuencias de codificación de la proteína de la cápside (Cap) de parvovirus comprende secuencias que codifican cada una de las tres proteínas de la cápside de parvovirus, VP1, -2 y -3. La cuarta secuencia de nucleótidos que comprende las secuencias de codificación de la proteína de la cápside puede estar presente en diversas formas. Por ejemplo, se pueden usar secuencias de codificación distintas para cada una de las proteínas de la cápside VP1, -2 y -3, de modo que cada secuencia de codificación está unida operativamente a las secuencias de control de la expresión para la expresión en una célula de insecto. Más preferentemente, sin embargo, la cuarta secuencia de nucleótidos comprende un único marco de lectura abierto que codifica las tres proteínas de la cápside de parvovirus animal (VAA) VP1, VP2 y VP3, en la que el codón de iniciación para la traducción de la proteína de la cápside VP1 es un codón de iniciación subóptimo que no es ATG como se describe, por ejemplo, en Urabe y col., (2002, mencionado anteriormente) y en el documento WO2007/046703. El codón de iniciación subóptimo para la proteína de la cápside VP1 se puede seleccionar de ACG, TTG, CTG y GTG, de los cuales son los más preferidos CTG y GTG. La cuarta secuencia de
nucleótidos para la expresión de las proteínas de la cápside puede comprende además una o más modificaciones como se describe en el documento WO2007/046703.
El experto en la materia conoce varias modificaciones adicionales de las regiones de codificación de VP, que podrían aumentar el rendimiento de VP y el virión o tener otros efectos deseados, tales como tropismo alterado o reducir la antigenicidad del virión. Estás modificaciones están dentro del ámbito de la presente invención. Preferentemente, la secuencia de nucleótidos de la invención que codifica las proteínas de la cápside de parvovirus está unida operativamente a secuencias de control de la expresión para la expresión en una célula de insecto, que, como mínimo, incluirá un promotor que es activo en las células de insecto. Tales secuencias de control y otras técnicas y materiales (por ejemplo, vectores) para la expresión de proteínas de la cápside de parvovirus en las células huésped de insectos ya se han descrito anteriormente para las proteínas Rep.
En una realización preferida de la invención, la tercera secuencia de nucleótidos presente en las células de insecto de la invención, es decir, la secuencia que comprende al menos una ITR de parvovirus (VAA), comprende además al menos una secuencia de nucleótidos que codifica un producto génico de interés, de modo que, preferentemente, la al menos una secuencia de nucleótidos que codifica un producto génico de interés se incorpora en el genoma de un vector de parvovirus recombinante (VAAr) producido en la célula de insecto. Preferentemente, al menos una secuencia de nucleótidos que codifica un producto génico de interés es una secuencia para la expresión en una célula de mamífero. Preferentemente, la tercera secuencia de nucleótidos comprende dos secuencias de nucleótidos ITR de parvovirus (VAA) y en la que la al menos una secuencia de nucleótidos que codifica un producto génico de interés se encuentra entre las dos secuencias de nucleótidos ITR de parvovirus (VAA). Preferentemente, la secuencia de nucleótidos que codifica un producto génico de interés (para la expresión en la célula de mamífero) se incorporará en el vector de parvovirus recombinante (VAAr) producido en la célula de insecto si se encuentra entre dos ITR regulares o se encuentra en cualquiera de los lados de una ITR diseñada con dos regiones D.
La tercera secuencia de nucleótidos definida anteriormente en el presente documento puede, por lo tanto, comprender una secuencia nucleotídica que codifica al menos un "producto génico de interés" para la expresión en una célula de mamífero, que se encuentra de tal manera que se incorporará en un vector de parvovirus recombinante (VAAr) replicado en la célula de insecto. Cualquier secuencia de nucleótidos se puede incorporar para su expresión posterior en una célula de mamífero transfectada con el vector de parvovirus recombinante (VAAr) producido de acuerdo con la presente invención. La secuencia de nucleótidos puede, por ejemplo, codificar una proteína que puede expresar un agente de ARNi, es decir, una molécula de ARN que es capaz de ARN de interferencia, tal como, por ejemplo, un ARNch (ARN corto en horquilla) o un ARNic (ARN corto de interferencia). "ARNpi" significa un ARN pequeño de interferencia que es un ARN bicatenario de longitud corta que no son tóxicos en las células de mamífero (Elbashir y col., 2001, Nature 411: 494-98; Caplen y col., 2001, Proc. Natl. Acad. Sci. USA 98: 9742-47). En una realización preferida, la tercera secuencia de nucleótidos puede comprender dos secuencias de nucleótidos y cada una codifica un producto génico de interés para la expresión en una célula de mamífero. Cada una de las dos secuencias de nucleótidos que codifican un producto de interés se encuentra localizada de tal manera que se incorporará en un vector de parvovirus recombinante (VAAr) replicado en la célula de insecto.
El producto de interés para la expresión en una célula de mamífero puede ser un producto génico terapéutico. Un producto génico terapéutico puede ser un polipéptido, o una molécula de ARN (ARNpi), u otro producto génico que, cuando se expresa en una célula diana, proporciona un efecto terapéutico deseado, tal como, por ejemplo, ablación de una actividad no deseada, por ejemplo, la ablación de una célula infectada, o la complementación de un defecto genético, por ejemplo, provocando una deficiencia en una actividad enzimática. Ejemplos de productos génicos de polipéptidos terapéuticos incluyen CFTR, factor IX, lipoproteína lipasa (LPL, preferentemente LPL S447X; véase el documento WO 01/00220), apolipoproteína A1, uridina difosfato glucuronosiltransferasa (UGT), proteína de interacción reguladora de la GTPasa en la retinitis pigmentosa (RP-GRIP) y citocinas o interleucinas, como por ejemplo, IL-10, porfobilinógeno desaminasa (PBGD) y alanina: glioxilato aminotransferasa.
Como alternativa, o además, como tercer producto génico, la tercera secuencia de nucleótidos definida anteriormente en el presente documento puede comprender una secuencia de nucleótidos que codifica un polipéptido que sirve como proteínas marcadoras para evaluar la transformación y la expresión celular. Las proteínas marcadoras adecuadas para este fin son, por ejemplo, la proteína GFP fluorescente y los genes marcadores seleccionables HSV timidina cinasa (para la selección en medio HAT), higromicina B fosfotransferasa bacteriana (para la selección en higromicina B), Tn5 aminoglucósido fosfotransferasa (para la selección en G418) y la dihidrofolato reductasa (DHFR) (para la selección en metotrexato), CD20, el gen del factor de crecimiento nervioso de baja afinidad. Las fuentes para la obtención de estos genes marcadores y procedimientos para su uso se proporcionan en Sambrook y Russel (2001) "Molecular Cloning: A Laboratory Manual, (3a edición), Cold Spring Harbor Laboratory Press, Cold Spring Harbor Laboratory Press, New York. Además, la tercera secuencia de nucleótidos definida anteriormente en el presente documento puede comprender una secuencia de nucleótidos que codifica un polipéptido que puede servir como un mecanismo de seguridad que permite curar a un sujeto de las células transducidas con el vector de parvovirus recombinante (VAAr) de la invención, si se considera necesario. Tal secuencia de nucleótidos, a menudo referido como un gen suicida, codifica una proteína que es capaz de convertir un profármaco en una sustancia tóxica que es capaz de matar las células transgénicas en las que se expresa la proteína. Los ejemplos adecuados de tales genes suicidas incluyen, por ejemplo el gen de la citosina desaminasa de E. coli o uno de los genes de la timidina cinasa del virus del herpes simple, citomegalovirus y el virus de varicela zoster, en cuyo caso se puede usar ganciclovir como
profárma
En otra realización, uno de los productos génicos de interés puede ser una proteína de VAA. En particular, una proteína Rep, tal como Rep78 o Rep68, o un fragmento funcional de la misma. Una secuencia de nucleótidos que codifica una Rep78 y/o Rep68, si está presente en el genoma de un vector de parvovirus recombinante (VAAr) de la invención y se expresa en una célula de mamífero transducida con el vector, permite la integración del vector de parvovirus recombinante (VAAr) en el genoma de la célula de mamífero transducida. La expresión de Rep78 y/o Rep68 en una célula de mamífero transducida o infectada con VAAr puede proporcionar una ventaja para ciertos usos del vector de parvovirus recombinante (VAAr), permitiendo la expresión a largo plazo o permanente de cualquier otro producto génico de interés introducido en la célula por el vector.
En los vectores de parvovirus recombinante (VAAr) de la invención, la al menos una o más secuencia de nucleótidos que codifica un producto génico de interés para la expresión en una célula de mamífero, preferentemente está/están unido operativamente a al menos una secuencia de control de la expresión compatibles con células de mamífero, por ejemplo un promotor. Muchos de estos promotores son conocidos en la técnica (véase, Sambrook y Russel, 2001, citado anteriormente). Pueden usarse los promotores constitutivos que se expresan ampliamente en muchos tipos de células, tales como el promotor de CMV. Sin embargo, son más preferentes los promotores que son inducibles, específicos de tejido, específicos de tipo de célula o específicos del ciclo celular. Por ejemplo, para la expresión específica en el hígado, se puede seleccionar un promotor a partir de un promotor de a1-antitripsina (AAT), un promotor de globulina de unión a hormonas tiroideas, un promotor de albúmina, un promotor de LPS (globina de unión a la tiroxina), un promotor híbrido de HCR- promotor ApoCII, un promotor híbrido HCR-hAAT, un promotor de AAT en combinación con el elemento potenciador del gen de ka albúmina de ratón (Ealb) y un promotor de la apolipoproteína E. Otros ejemplos incluyen el promotor E2F Lara la expresión selectiva de tumor, y, en particular, expresión selectiva de células tumorales neurológicas (Parr y col., 1997, Nat. Medicina. 3: 1145-9) o el promotor de IL-2 para su uso en células sanguíneas mononucleares (Hagenbaugh y col., 1997, J Exp Med.; 185: 2101-10).
El VAA es capaz de infectar una serie de células de mamífero. Véase, por ejemplo, Tratschin y col., (1985, Mol. Cell Biol. 5:3251-3260) y Grimm y col., (1999, Hum. Gene Ther. 10:2445-2450). Sin embargo, la transducción de VAA de fibroblastos sinoviales humanos es significativamente más eficiente que en las células murinas similares, Jennings y col., Arthritis Res., 3: 1 (2001), y la tropicidad celular del VAA se diferencia entre los serotipos. Véase, por ejemplo, Davidson y col., (2000, Proc. Natl. Acad. Sci. USA, 97:3428-3432), que analizan las diferencias entre v Aa 2, Va A4 y VAA5 con respecto al tropismo celular del SNC de mamífero y la eficiencia de la transducción.
Las secuencias de VAA que se pueden utilizar en la presente invención para la producción de vectores VAA recombinantes en células de insectos se pueden derivar del genoma de cualquier serotipo de VAA. En general, los serotipos de VAA tienen secuencias genómicas de homología significativa a nivel de aminoácidos y de ácido nucleico proporcionan un conjunto idéntico de funciones genéticas, producen viriones que son esencialmente físicamente y funcionalmente equivalentes y se replican y ensamblan mediante mecanismos prácticamente idénticos. Para la secuencia genómica de los diversos serotipos de VAA y una visión general de las similitudes genómicas véase, por ejemplo número de acceso en GenBank U89790; número de acceso en GenBank J01901; número de acceso en GenBank AF043303; número de acceso en GenBank AF085716; Chlorini y col., (1997, J. Vir. 71: 6823-33); Srivastava y col., (1983, J. Vir. 45:555-64); Chlorini y col., (1999, J. Vir. 73:1309-1319); Rutledge y col., (1998, J. Vir. 72:309-319); y Wu y col., (2000, J. Vir. 74: 8635-47). Los serotipos 1, 2, 3, 4 y 5 de VVA son una fuente preferente de secuencias de nucleótidos de VAA para su uso en el contexto de la presente invención. Preferentemente, las secuencias ITR de VAA para su uso en el contexto de la presente invención derivan de VAA1, VAA2, y/o VAA4. Del mismo modo, las secuencias de codificación de Rep (Rep78/68 y Rep52/40) derivan, preferentemente, de VAA1, VAA2, y/o VAA4. Las secuencias de codificación de las proteínas de la cápside VP1, VP2, y VP3 para su uso en el contexto de la presente invención pueden, no obstante, tomarse de cualquiera de los 42 serotipos conocidos, más preferentemente de VAA1, VAA2, v Aa 3, VAA4, VAA5, VAA6, VAA7, VAa 8 o VAA9 o partículas de tipo VAA recién desarrolladas obtenidas mediante, por ejemplo, técnicas de barajado de la cápside y bibliotecas de la cápside de VAA.
Las secuencias de ITR y Rep de VAA y están particularmente conservadas entre la mayoría de los serotipos. Las proteínas Rep78 de diversos serotipos de VAA son, por ejemplo, más del 89 % idéntica y la secuencia de nucleótidos total a nivel del genoma entre VAA2, VAA3A, VAA3B, y VAa 6 es de aproximadamente el 82 % (Bantel-Schaal y col., 1999, J. Virol., 73(2):939-947). Por otra parte, se sabe que las secuencias de Rep e ITR de muchos serotipos de VAA se complementan de forma cruzada con eficiencia (es decir, sustituyen funcionalmente sustituto) las secuencias correspondientes de otros serotipos en la producción de partículas de VAA en las células de mamífero. El documento US2003148506 notifica que las secuencias de Rep e ITR del VAA también complementan de forma cruzada con eficiencia otras secuencias de VAA de Rep e ITR en células de insecto.
Se sabe que las proteínas VP de VAA determinan la tropicidad celular del virión del VAA. Las secuencias que codifican las proteínas VP están significativamente menos conservadas que las proteínas y los genes Rep entre diferentes serotipos de VAA. La capacidad de las secuencias Rep e ITR complementan de forma cruzada a las correspondientes secuencias de otros serotipos permite la producción de partículas de VAAr seudotipadas que comprenden las proteínas de la cápside de un serotipo (por ejemplo, VAA3) y las secuencias de Rep y/o ITR de otro serotipo de VAA (por ejemplo, VAA2). Tales partículas de VAAr seudotipadas son una parte de la presente invención.
Las secuencias de "VAA" modificadas también se pueden utilizar en el contexto de la presente invención, por ejemplo, para la producción de vectores de VAAr en células de insecto. Tales secuencias modificadas incluyen, por ejemplo, secuencias que tienen al menos aproximadamente 70 %, al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, o más de identidad de secuencia de aminoácidos de y/o nucleótidos (por ejemplo, una secuencia que tiene de aproximadamente 75 a 99 % de identidad de la secuencia de nucleótidos) con una VP, Rep o ITR de VAA1, VAA2, v Aa 3, VAA4, VAA5, VAA6, VAA7, VAA8 o VAA9 se pueden utilizar en lugar de secuencias salvajes de VP, Rep o ITR del VAA.
Aunque es similar a otros serotipos de VAA en muchos aspectos, el VAA5 difiere de otros serotipos de VAA humanos y de simio más de otros serotipos conocidos humanos y de simio. En vista de ello, la producción de VAA5 puede diferir de la producción de otros serotipos en células de insecto. Cuando se emplean procedimientos de la invención para producir VAA5, se prefiere que una o más construcciones que comprende, de manera colectiva en el caso de más de una construcción, una secuencia de nucleótidos que comprende una ITR de VAA5, una secuencia de nucleótidos comprende una secuencia de codificación de Rep de VAA5 (es decir, una secuencia de nucleótidos comprende una Rep78 de VAA5). Tales secuencias de ITR y Rep pueden modificarse como se desee para obtener una producción eficiente de VAA5r o vectores de VAA5r seudotipados en células de insecto. Por ejemplo, el codón de iniciación de las secuencias de Rep puede modificarse, los sitios de corte y empalme de VP pueden modificarse o eliminarse y/o el codón de iniciación de VP1 y los nucleótidos cercanos pueden modificarse para mejorar la producción de vectores VAA5r en la célula de insecto.
En otro aspecto, la invención se refiere a un procedimiento para producir un virión de parvovirus recombinante (VAAr) (que comprende un vector de parvovirus recombinante (VAAr) como se ha definido anteriormente) en una célula de insecto, comprendiendo el procedimiento las etapas de: a) cultivar una célula de insecto como se ha definido en el presente documento anteriormente en condiciones tales que se produce el vector de parvovirus recombinante (VAAr); y (b) recuperación del vector de parvovirus recombinante (VAAr). En el presente documento se entiende que el vector de parvovirus recombinante (VAAr) producido en el procedimiento es, preferentemente, un virión infeccioso de VAA o de parvovirus que comprende los ácidos nucleicos del vector de parvovirus recombinante (VAAr). Las condiciones de crecimiento para células de insecto en cultivo y producción de productos heterólogos en células de insecto en cultivo son bien conocidas en la técnica y se describen, por ejemplo, en las referencias citadas anteriormente sobre la ingeniería molecular de las células de insecto (véase también el documento WO2007/046703).
Preferentemente, el procedimiento comprende además la etapa de purificación por afinidad del vector de parvovirus recombinante (VAAr) (los viriones que lo comprenden) utilizando un anticuerpo anti-VAA, preferentemente un anticuerpo inmovilizado. El anticuerpo anti-VAA es, preferentemente, un anticuerpo monoclonal. Un anticuerpo particularmente adecuado es un anticuerpo de camélido monocatenario o un fragmento del mismo como, por ejemplo, se puede obtener a partir de camellos o llamas (véase, por ejemplo Muyldermans, 2001, Biotechnol. 74: 277-302). El anticuerpo para la purificación por afinidad del VAAr es, preferentemente, un anticuerpo que se une específicamente a un epítopo en una proteína de la cápside de VAA, de modo que, preferentemente, el epítopo es un epítopo que está presente en la proteína de la cápside de más de un serotipo de VAA. Por ejemplo, el anticuerpo puede producirse o seleccionarse sobre la base de la unión específica a la cápside de VAA2, pero, al mismo tiempo, también puede unirse específicamente a las cápsides de VAA1, VAA3 y VAA5.
En aún otro aspecto la invención se refiere a una construcción de ácido nucleico que comprende una primera y una segunda secuencias de nucleótidos en la que: (a) la primera y la segunda secuencia de nucleótidos están cada una unidas de manera operativa a secuencias de control de la expresión para la expresión en una célula de insecto; (b) la primera y la segunda secuencias de aminoácidos comprenden una secuencia de aminoácidos común de la cual por lo menos 100 aminoácidos tienen una identidad de aminoácidos de al menos 90 % entre las secuencias primera y segunda de aminoácidos; (c) las secuencias de nucleótidos que codifican la secuencia de aminoácidos común en las primera y segunda secuencias de aminoácidos tienen menos del 95 % de identidades; (d) el uso de codones de la primera o segunda secuencia de nucleótidos que codifica la secuencia de aminoácidos común está adaptado para el uso de codones de la célula huésped de insectos; (e) la primera secuencia de nucleótidos codifica la secuencia de aminoácidos de una proteína Rep52 o 40 de parvovirus y la segunda secuencia de nucleótidos codifica la secuencia de aminoácidos de una proteína Rep78 o 68 de parvovirus; y (f) las secuencias de aminoácidos comunes comprenden las secuencias de aminoácidos del segundo aminoácido al aminoácido más C-terminal de la proteína Rep52 o 40 de parvovirus.
En un aspecto diferente la invención se refiere a un procedimiento para la producción de un virión de parvovirus recombinante (VAAr) (que comprende un vector de parvovirus recombinante (VAAr) como se ha definido anteriormente) en una célula de insecto. Preferentemente, el procedimiento comprende las etapas de: (a) cultivar una célula de insecto tal como se ha definido en el presente documento anteriormente en condiciones tales que se produce el vector de parvovirus recombinante (VAAr), en el que la célula de insecto comprende al menos una construcción de ácido nucleico para la expresión de las proteínas Rep78/68 y Rep52/40 de parvovirus (tales como, por ejemplo, una construcción de ácido nucleico que comprende la primera y la segunda secuencias de nucleótidos como se ha definido en el presente documento anteriormente) y comprende además una tercera y cuarta secuencias de nucleótidos como se ha definido en el presente documento anteriormente, y en el que la construcción o construcciones de ácido nucleico para la expresión de las proteínas Rep78/68 and Rep52/40 de parvovirus produce un nivel de expresión de Rep52/40
en la célula de insecto que es más alto que el nivel de expresión de Rep78/68 en una base molar; y, (b) recuperación del vector de parvovirus recombinante (VAAr). Preferentemente, en el procedimiento, la relación molar entre las proteínas Rep52/40 y Rep78/68 en la célula de insecto es mayor que 10:1, preferentemente al menos 11:1, 15:1,20:1, 30:1, 40:1, 50:1 o 60:1. Una relación molar de las proteínas Rep52/40 y Rep78/68 en la célula de insecto mayor que 10:1 da como resultado ventajosamente una mejor relación entre viriones completos (es decir, que comprenden un genoma de VAAr) y viriones vacíos (véase, por ejemplo, la Figura 8). Sin embargo, una relación molar entre las proteínas Rep52/40 y Rep78/68 demasiado alta puede dar lugar a un título más bajo del VAAr producido tal como se determina por el número de copias de genes. En una realización, por tanto, la relación molar entre las proteínas Rep52/40 y Rep78/68 es menor que 100:1, 80:1, 70:1, 60:1, 50:1, 40:1, 30:1, o 20:1. La relación molar entre las proteínas Rep78/68 y Rep52/40 se puede determinar por medio de transferencia Western como se describe en el documento WO2007/148971, preferentemente usando un anticuerpo monoclonal que reconoce un epítopo común tanto de Rep78/68 como de Rep52/40, o utilizando el anticuerpo descrito en el documento WO2007/148971. Preferentemente, la relación molar mínima entre las proteínas Rep52/40 y Rep78/68, como se ha indicado anteriormente se consigue aproximadamente a las 20 - 40 horas después de la infección, más preferentemente aproximadamente 30 - 40 horas después de la infección, utilizando un baculovirus o un sistema de expresión similar.
Existen varios medios para aumentar el nivel de expresión relativa de las proteínas Rep52/40 en comparación con el de la proteína Rep78/68. En caso de que se use una unidad de transcripción única para la expresión de las proteínas Rep78/68 y Rep52/40, la secuencia de codificación de las proteínas Rep78/68 y Rep52/40 puede adaptarse del siguiente modo para obtener una relación molar de las proteínas Rep52/40 y Rep78/68 n la célula de insecto mayor que 10:1:
a) el codón de iniciación de la traducción de la proteína Rep78/68 se puede cambiar a un codón de iniciación subóptimo y/o contexto subóptima del mismo como se describe en el documento WO2007/148971;
b) eliminación de uno o más o todas (9) las secuencias ATG que se producen entre los inicios de la traducción de los genes de Rep78/68 y Rep 52/40, respectivamente, preferentemente mediante cambios en la isocodificación en la secuencia de nucleótidos. Este se consigue, por ejemplo, en la secuencia de codificación pVD189 Rep descrita en el Ejemplo 3 y en la SEQ ID NO: 11;
c) optimización del contexto del codón de iniciación de la traducción de la proteína Rep52/40 de acuerdo con el contexto iniciador óptimo de 5'-N N N N N N A U G A a/c/g N-3' para la iniciación eficiente de la traducción en células de lepidópteros (como se describe en Chang y col., 1999, Virology 259: 369-383);
d) mediante la incorporación de una secuencia de control de la expresión que comprende una secuencia de nueve nucleótidos de la SEQ. ID NO: 9 o una secuencia de nucleótidos sustancialmente homóloga a la SEQ. ID NO: 9, en dirección 5' de los codones de iniciación de la proteína Rep52/40;
e) mejorar el sesgo del uso de codones de la parte de la secuencia de codificación que codifica la proteína Rep52/40 para la expresión en células de insecto (como se ha descrito anteriormente); y,
f) cambiar el uso de codones de la parte de la secuencia de codificación entre los inicios de la traducción de las proteínas Rep78/68 y Rep 52/40 de modo que esté menos adaptado a la expresión en células de insecto (como se ha descrito anteriormente). La combinación de a) a f) se incluye en la invención y en un una a) preferida se combina con al menos uno de b) a f).
Como alternativa, y/o además de, se puede usar una segunda unidad de transcripción genética para la expresión de la proteína Rep52/40. La expresión de la proteína Rep52/40 de esta segunda unidad de transcripción genética puede incrementarse por una o más de
a) usar un promotor más fuerte para la unidad de transcripción de Rep52/40 en comparación con el promotor de la unidad de Rep78/68 (véase más adelante);
b) aumentar el número de copias de la unidad de transcripción Rep52/40 en comparación con la de la unidad Rep78/68;
c) mejorar el sesgo del uso de codones de la secuencia de codificación que codifica la proteína Rep52/40 para la expresión en células de insecto (como se ha descrito anteriormente, por ejemplo las SEQ ID NO: 2 o 10); d) optimización del contexto del codón de iniciación de la traducción de la proteína Rep52/40 de acuerdo con el contexto iniciador óptimo de 5'-N N N N N N A U G A a/c/g N-3' para la iniciación eficiente de la traducción en células de lepidópteros (como se describe en Chang y col., citado anteriormente); y
e) mediante la incorporación de una secuencia de control de la expresión que comprende una secuencia de nueve nucleótidos de la SEQ. ID NO: 9 o una secuencia de nucleótidos sustancialmente homóloga a la SEQ. ID NO: 9, en dirección 5' de los codones de iniciación de la proteína Rep52/40.
Un ejemplo de una construcción en la que dos unidades de transcripción separadas se utilizan para la expresión de las proteínas Rep78/68 y Rep 52/40 es la construcción pVD183 como se ha descrito en los Ejemplos 2 y 3 en el presente documento. Las construcciones de ácido nucleico para su uso en el procedimiento para producir un virión de parvovirus recombinante (y que producen un nivel de expresión de Rep52/40 en la célula de insecto que es más alto que el nivel de expresión de Rep78/68 sobre una base molar) son un aspecto adicional de la presente invención.
En el presente documento se entiende que el vector de parvovirus recombinante (VAAr) producido en el procedimiento es, preferentemente, un virión infeccioso de VAA o de parvovirus que comprende los ácidos nucleicos del vector de parvovirus recombinante (VAAr). Las condiciones de crecimiento para células de insecto en cultivo y producción de
productos heterólogos en células de insecto en cultivo son bien conocidas en la técnica y se describen, por ejemplo, en las referencias citadas anteriormente sobre la ingeniería molecular de las células de insecto (véase también el documento WO2007/046703). Preferentemente, el procedimiento comprende además la etapa de purificación por afinidad del vector de parvovirus recombinante (VAAr) (los viriones que lo comprenden) utilizando un anticuerpo anti-VAA como se ha descrito anteriormente.
Un primer promotor igualmente fuerte o más fuerte que un segundo promotor para uso en la invención puede definirse del siguiente modo. La fuerza del promotor se puede determinar mediante la expresión que se obtiene en las condiciones que se utilizan en el procedimiento de la invención. En una realización preferida, el primer promotor o el segundo promotor se seleccionan del grupo que consiste en un promotor Polh, el promotor p10, el promotor de la proteína básica, un promotor inducible o un promotor deltaE1 o un promotor E1, o cualquier otro promotor génico de baculovirus tardío o muy tardío. Más preferentemente, el primer promotor se selecciona del grupo que consiste en un promotor Polh, el promotor p10 o el promotor de la proteína básica y en el que el segundo promotor es un promotor deltaE1 o un promotor E1, o cualquier otro promotor génico de baculovirus temprano o tardío. Preferentemente, el primer promotor en la construcción de ácido nucleico de la invención es un promotor p10 y el segundo promotor es un promotor Polh o un promotor Hsp70 mínimo 4xHsp27 EcRE . En otra realización, la primera promotor en la construcción de ácido nucleico de la invención es un promotor 4xHsp27 EcRE+mínimo Hsp70 y el segundo promotor es un promotor Polh. En aún otra realización, el primer promotor en la construcción de ácido nucleico de la invención es un promotor Polh y el segundo promotor es un promotor p10, deltaE1 o E1. e) mediante la incorporación de una secuencia de control de la expresión que comprende una secuencia de nueve nucleótidos de la SEQ. En otra realización más, el primer promotor en la construcción de ácido nucleico de la invención es un promotor p10 y el segundo promotor es un promotor deltaE1 o E1. En otra realización más, el primer promotor en la construcción de ácido nucleico de la invención es un promotor PolH y el segundo promotor es un promotor PolH. Lo más preferentemente, el primer promotor en la construcción de ácido nucleico de la invención es un promotor PolH y el segundo promotor es un promotor deltaE1.
Se entiende que un "elemento potenciador" o "potenciador" define una secuencia que potencia la actividad de un promotor (es decir, aumenta la tasa de transcripción de una secuencia en dirección 3' del promotor), que, a diferencia de un promotor, no posee actividad promotora y que, por lo general, puede funcionar independientemente de su ubicación con respecto al promotor (es decir, en dirección 5' o 3' del promotor). Los elementos potenciadores son bien conocidos en la técnica. Ejemplos no limitantes de elementos potenciadores (o partes de los mismos) que podrían utilizarse en la presente invención incluyen potenciadores de baculovirus y elementos potenciadores que se encuentran en células de insecto. Se prefiere que el elemento potenciador aumente en una célula la expresión de ARNm de un gen, al que el promotor que está unido operativamente, en al menos un 25 %, más preferentemente al menos un 50 %, incluso más preferentemente al menos un 100 %, y, lo más preferentemente, al menos un 200 % en comparación con la expresión de ARNm del gen en ausencia del elemento potenciador. La expresión del ARNm se puede determinar, por ejemplo, mediante RT-PCR cuantitativa.
En el presente documento se prefiere el uso de un elemento potenciador para aumentar la expresión de la proteína Rep de parvovirus. Por lo tanto, en una realización preferida adicional, el primer casete de expresión comprende al menos un elemento potenciador de baculovirus y/o al menos un elemento de respuesta a ecdisona. Preferentemente, el elemento potenciador se selecciona del grupo que consiste en hr1, hr2, hr3, hr4 y hr5.
En el presente documento y sus reivindicaciones, el verbo “comprender” y sus conjugaciones se usan en su sentido no limitante para indicar que los artículos que siguen a la palabra están incluidos pero que los artículos no mencionados específicamente no están excluidos. Además, la referencia a un elemento con un articulo indefinido “un" o "uno/una" no excluye la posibilidad de que haya presente más de uno de los elementos, a menos que el contexto requiera claramente que haya uno y solo uno de los elementos. El artículo indefinido “un” o “uno/una” normalmente significa “al menos uno/una”.
Los ejemplos siguientes se ofrecen únicamente con fines ilustrativos y no están destinados a limitar el ámbito de la presente invención de ningún modo.
Descripción de las figuras
Figura 1 Mapa físico de pVD183
Figura 2 Relación de las copias genómicas del gen ORF 1629 y el gen Rep en las muestras de baculovirus tomadas en diferentes pases de la construcción de baculovirus Bac.FBDSLR (Urabe y col., 2002, Hum Gene Ther.
13(16):1935-43). Las copias genómicas se midieron por QPCR.
Figura 3 Relación de las copias genómicas del gen ORF 1629 y el gen Rep en las muestras de baculovirus tomadas en diferentes pases de la construcción de baculovirus pVD183 de la invención. Las copias genómicas se midieron por QPCR.
Figura 4. Producción de VAAr con BacVD183. La caída de la producción se debe a una reducción en la cantidad de baculovirus presentes.
Figura 5 ORF Qp CR en los pases de Bac.VD183.
Figura 6. Transferencia de tipo Western para la expresión de varios pases de Bac.VD183. "88" indica la construcción Bac.VD88, que se denomina REP-ACG/PSC en el documento WO2007/148971, que se utiliza en el
presente documento como control. La cantidad de expresión de Rep se relaciona con la concentración de Bac.VD183.
Figura 7. Q-PCR sobre volumen celular bruto (CLB) de producciones de VAArl utilizando tres construcciones diferentes para las proteínas Rep: VD88, VD183 y VD189. 5: 1: 1 se refiere a la relación de los diferentes baculovirus utilizados en la producción, 5 se refiere a Bac.VD88, Bac.VD183, o Bac.VD189, el primer 1 se refiere a Bac.VD84 (que contiene el gen de la cápside de VAA1) y el segundo 1 se refiere al baculovirus que contiene la construcción de ITR, Bac.VD43.
Figura 8. Los CLB de la producción de tres VAAr1 diferentes se purificaron en una columna de Llama específica para la cápside de VAA y en los lotes purificados se midieron las copias genómicas y las partículas de VAAr totales. La división de las partículas de VAAr totales por el número de Q-PCR da lugar a la relación total mencionada anteriormente. 5:1:1 se refiere a la relación de los diferentes baculovirus utilizados en la producción, 5 se refiere a Bac.VD88, Bac.VD183, o Bac.VD189, el primer 1 se refiere a Bac.VD84 (que contiene el gen de la cápside de VAA1) y el segundo 1 se refiere al baculovirus que contiene la construcción de ITR, Bac.VD43.
Figura 9. Transferencia de tipo Western de Rep. Se tomaron muestras a varios pases del baculovirus Bac.VD88 o Bac.VD189 y se realizó una transferencia de tipo Western. La cantidad de Rep52 respecto a la cantidad de Rep78 es consistentemente superior para Bac.VD189.
Figura 10. Transferencia de tipo Western de Rep. Se tomaron muestras a varios pases del baculovirus Bac.VD183 y se realizó amplificación y transferencia de tipo Western de Rep. La cantidad de Rep52 con respecto a la cantidad de Rep78 es mucho más alta para Bac.VD183 que para Bac.VD189 y Bac.VD88.
Ejemplos
1. Ejemplo 1
1.1. Materiales y procedimientos
1.1.1 Construcción del plásmido de baculovirus
pFBDSLR (Urabe y col., 2002, mencionado anteriormente) es un vector de expresión pFastBacDual (Invitrogen) que comprende 2 casetes de expresión separados para las proteínas Rep78 y Rep52 de VAA2, de modo que la expresión de las proteínas Rep52 está dirigida por el promotor Polh y la expresión de la proteína Rep78 a partir del promotor AIE. Esta construcción se ha subclonado en pPSC10, un plásmido que es compatible con el GenExpress BaculoKIT (Protein Sciences Corporation).
La secuencia de codificación de Rep52 de tipo salvaje en el casete de expresión de Rep 52 se reemplaza con el la secuencia de codificación de Rep52 optimizada por codones de la SEQ ID NO. 2 para producir pPSC10Rep-52CD.
La secuencia de codificación de Rep52 de tipo salvaje en el casete de expresión de Rep 78 de pPSC10Rep-52CD se reemplaza con la secuencia de codificación de Rep52 optimizada por AT de la SEQ ID NO. 3 para producir pPSC10Rep-52CD/78AT.
La secuencia de codificación de Rep52 de tipo salvaje en el casete de expresión de Rep 78 de pPSC10Rep-52CD se reemplaza con la secuencia de codificación de Rep52 optimizada por GC de la SEQ ID NO. 4 para producir pPSC10Rep-52CD/78GC.
1.1.2 Producción de baculovirus recombinante
Los baculovirus recombinantes derivados del virus de de la polihedrosis nuclear múltiple de Autographa californica (AcMNPV) se producen utilizando el GenExpress BaculoKIT (Protein Sciences Corporation). La transfección se lleva a cabo de la siguiente manera: En un tubo de 14 ml de fondo redondo se mezclan 200 |jl de medio GRACE con 6 |jl de cellfectine (Invitrogen) y en un tubo eppendorf, 200 j l de medio GRACE se mezclan con 50 j l de ADN viral (Protein Sciences) y 2 jg del plásmido de transferencia (REP). El contenido del tubo de eppendorf se añade al tubo y se mezcla cuidadosamente. Después de un período de incubación de 30 minutos a temperatura ambiente se añaden 1.300 j l de GRACE a la mezcla de transfección. Las células de insecto en un matraz T25 se lavan con medio GRACE y se añade la mezcla de transfección gota a gota a la capa de células. Después de una incubación de 6 horas a 28 °C se añade suero SF900II suplementado con 10 % de SFB cuidadosamente y el matraz T25 se introdujo en una estufa de 28 °C durante 5 días, después de lo cual se cosecha el baculovirus recombinante.
1.2 Resultados
El rendimiento de pPSC10Rep-52CD, pPSC10Rep-52CD/78AT and pPSC10Rep-52CD/78GC pPSC10Rep recién diseñados se compara con las construcciones pFBDSLR de Rep originales de de Urabe y col., (2002, mencionado anteriormente). Las cuatro construcciones se pasan en serie hasta el paso 5. Se realizan experimentos de producción de VAA1 recombinante usando las construcciones de Rep de los pases 2, 3, 4 y 5 en combinación con un baculovirus que contiene un casete de expresión de mamífero de un gen indicador entre de las ITR de VAA (VAA-LPL) y un baculovirus que contiene un casete de expresión de células de insecto para el VAA1-Cap (VAA-cap) de los pases respectivos 2, 3, 4 y 5. Los baculovirus recombinantes de VAA-LPL y VAA-Cap, tal como se utilizan en el presente documento, se describen en el documento WO2007/046703. Se determinan los rendimientos de producción de VAA1LPL mediante QPCR. El baculovirus original diseñado por Urabe y col., 2002 (REP/Bac-to-Bac original) se traduce en una disminución rápida de la producción de VAA en 5 pases. Sin embargo, el baculovirus con las unidades de expresión de REP de pPSC10Rep-52CD, pPSC10Rep-52CD/78AT y pPSC10Rep-52CD/s 78GC da lugar a la producción de VAA estable durante al menos 5 pases. Por lo tanto, los rendimientos de producción reproducibles de VAA-LPL en varios pases (por ejemplo, de 2 a 5), solo se obtienen usando baculovirus que contienen las construcciones pPSC10Rep-52CD, pPSC10Rep-52CD/78AT y pPSC10Rep-52CD/78GC.
2. Ejemplo 2
Previamente se ha descrito que los vectores de expresión de baculovirus que contiene de 2 casetes de expresión separados para las proteínas Rep78 and Rep52 de VAA son genéticamente inestables en los baculovirus (véase, por ejemplo, el documento WO2007/148971 y Kohlbrenner y col., 2005, Mol Ther- 12(6):1217-25). Ahora, los inventores han establecido la aplicación de la optimización del uso de codones (con respecto al uso de codones del virus de la polihedrosis nuclear múltiple por Autographa californica (AcMNPV) de solo la secuencia de codificación de Rep52 y no la secuencia de codificación de Rep78 a fin de introducir cambios suficiente entre las partes anteriormente idénticas de las secuencias de codificación de Rep52 y Rep78 para reducir los acontecimientos de recombinación. A continuación, demostraron que realmente este era el caso.
2.1 Clonación
Un plásmido que contiene los casetes de expresión doble de Rep originales en el plásmido pPSC10, pVD42 de Protein Sciences Corporation se modificó. pVD42 contiene el gen de rep78 dirigido por el promotor deltaE1 y el gen de rep52 dirigido por el promotor PolH, como en la construcción pFBDSLR original (Urabe y col., 2002, Hum Gene Ther.
13(16):1935-43). La secuencia de codificación de rep52 en pVD42 se sustituyó por una secuencia de codificación de rep52 sintética cuyo uso de codones se adaptó al uso de codones del virus de la polihedrosis nuclear múltiple de Autographa californica (AcMNPV) (véase la Tabla 2; y http://www.kazusa.or.jp/codon/cgibin/showcodon.cgi?species=46015). Esta secuencia de codificación de rep52 de VAA2 optimizada por codones se representa en la SEQ ID NO: 10. En la figura 1 se muestra un mapa físico del plásmido pVD183 resultante, que comprende el la secuencia de codificación de rep52 de VAA2 optimizada por codones dirigida desde el promotor Polh y la secuencia de codificación de rep78 del VAA2 dirigida desde el promotor deltaE1.
2.2 Resultados
Los inventores han realizado un clon de baculovirus recombinante del plásmido pVD183 y se pasó el baculovirus 10 veces para analizar su estabilidad genética. Los inventores analizaron la estabilidad genética de la construcción mediante QPCR en el genoma del baculovirus y el gen de Rep52 mediante transferencia de tipo Western y mediante la eficiencia de producción del VAAr del baculovirus. Al mismo tiempo, el baculovirus Bac.VD42 original se hizo pasar al pase 7 para la comparación. Los datos anteriores sobre la estabilidad del Bac.VD42(o Bac.FBDSLR) también se mencionan en el documento WO2007/148971 (denominado REP/Bac-to-Bac original).
2.2.1 QPCR
Estabilidad medida mediante QPCR en los genomas de baculovirus. El número de copias de un gen que es esencial para la replicación de baculovirus y que se utiliza para la producción de BacVD183 a partir de pVD183 mediante recombinación en ORF1629 y ORF603 entre el pVD183 y el esqueleto del baculovirus de Protein Sciences. El ORF 1629 (ORF) se ha medido mediante QPCR y el número de copias de los genes Rep también se ha medido mediante QPCR. La relación entre estos 2 genes debe permanecer igual durante los pases posteriores del baculovirus. La figura 2 muestra para la comparación que Bac.FBDSLR es más bien inestable. Figura 3 muestra que Bac.VD183 es significativamente más estable. Los inventores observaron que la eficiencia de los 2 conjuntos de cebadores utilizados en la QPCR no es necesariamente igual, por lo tanto, se puede obtener una relación diferente de 1. Sin embargo, un indicador más importante de la estabilidad es que la relación debe permanecer relativamente constante durante múltiples pases. El pase 3 del Bac.FBDSLR ya es subóptimo, dado que la relación es de aproximadamente 0,25 y solo empeora. Bac.VD183 también comienza alrededor de 0,3 pero fluctúa alrededor de esa relación, lo que indica que hay una situación estable. Las deleciones en el genoma de baculovirus da lugar a un baculovirus que crece más rápido que los baculovirus que tiene un genoma de longitud completa, por lo tanto, cuando se produce una deleción, esos clones crecerán más que los demás. Las variaciones en el procedimiento de QPCR pueden dar lugar a las fluctuaciones observadas en la Figura 3.
2.2.2 Producción de VAAr
La Figura 4 muestra la producción de VAAr con la construcción Bac.VD183 estable. La caída en la producción en los pases más altos se debe a una reducción en la cantidad de baculovirus utilizados en la producción de VAAr (véase la Figura 5). La figura 5 muestra la QPCR en el ORF de Bac.VD183, que está directamente relacionado con la cantidad de baculovirus presentes en la muestra. La cantidad de baculovirus utilizados en la producción de VAAr se correlaciona con la cantidad de VAAr producido.
2.2.3 Transferencia de tipo Western de Rep
La Figura 6 muestra la expresión de la proteína Rep durante los pases de Bac.VD183 analizada mediante transferencia de tipo Western.
3. Ejemplo 3
El efecto del nivel de expresión de Rep52 se determinó en dos parámetros de producción de VAAr. En particular, el efecto del nivel de expresión relativo de Rep52 en comparación con el nivel de expresión de Rep78 en 1) el nivel de producción de VAAr como se expresa en las copias del genoma por ml de volumen celular bruto (g/m de CLB); y 2) la relación entre los viriones de VAAr totales y los viriones de VAAr completos (los viriones de VAAr completos son viriones que comprenden una copia del genoma de VAAr). Estos parámetros se compararon para tres diferentes construcciones de Rep de VAAr diferentes que dan lugar cada una a diferentes niveles de expresión de Rep52 y en proporción diferente entre los niveles de Rep52 y Rep78. Las tres construcciones fueron pVD88 (denominados REP-ACG/PSC en el documento WO2007/148971), pVD183 (descrito en el Ejemplo 2 en el presente documento anteriormente) y pVD189 (véase más adelante).
3.1 Construcción de pVD189
La construcción pVD88 se volvió a diseñar mediante la eliminación de 9 secuencias de ATG entre el inicio de la traducción de los genes de Rep78 y Rep 52 y cambiando el codón de iniciación de la traducción ACG de Rep78 a CTG. Véase la secuencia siguiente. Baseclear (Leiden, Países Bajos) sintetizó el nuevo gen y lo clonó en pVD88 reemplazando el gen Rep existente para obtener pVD189. La secuencia de nucleótidos de la secuencia de codificación de Rep en pVD189 se representa en la SEQ ID NO: 11.
3.2 Producción de VAAr
Los baculovirus se realizaron con las construcciones de VD88, VD183, y VD189 y estos se utilizaron para la producción de VAAr1. La comparación de las construcciones VD88, VD183 y VD189 en la producción de VAAr dio lugar a una producción de VAAr (copias del genoma) mejor, medida mediante Q-PCR en el volumen celular bruto (CLB). La Figura 7 muestra que la construcción de Rep estándar VD88, que da como resultado una cantidad menor de Rep52 (Figura 9) da como resultado aproximadamente 4 x 1010 de GC/ml medidos en el CLB. VD189 que conduce a una cantidad de Rep52 ligeramente mayor (Figura 9) dio como resultado una producción de VAAr medida en el CLB de aproximadamente 6 x 1010 de GC/ml. VD183 que conduce a una cantidad de Rep52 claramente mayor (Figura 10) dio como resultado una producción de VAAr medida en el CLB de aproximadamente 6 x 1010 de GC/ml.
Un parámetro de calidad muy importante es la relación total: completos del lote de VAAr. La Figura 8 muestra que la mejor relación de totales (viriones): completos (viriones) se obtiene con la construcción VD183 que muestra la cantidad de Rep52 más alta respecto a la cantidad de Rep78 en comparación con las construcciones Bac.VD189 y Bac.VD88 en la Figura 9.
3.2 Construcciones adicionales
Se construyen y se analizan siguientes construcciones, y parte de la invención:
Construcciones Promotor(es) Codones de iniciación y secuencias de codificación
1) VD88 PolH ACG-78--------------- ATG-52------------*
2) VD189 PolH CTG-78-atg ATG-52 eliminado------------*
3) VD183 delta E1 PolH ATG-78-----------------------------------* ATG--52—SEQ ID NO: 10----------4) VD196 PolH CTG-78--------------- ATG-52------------*
5) VD197 PolH ACG -78-atg ATG-52 eliminado------------ *
6) VD197/52 P10 PolH ACG -78-atg ATG-52 eliminado------------ *+ ATG--52---SEQ ID NO: 10- * 7) VD189/52 P10 PolH CTG-78-atg ATG-52 eliminado------------*+ ATG--52---SEQ ID NO: 10- * 8) VD183/10 P10 PolH ATG--78----------------------------------* ATG--52—SEQ ID NO: 10----------9) VD197/52cd PolH ACG -78-atg ATG-52 eliminado-SEQ ID NO: 10*
1,2, 4, 5, 8 y 9 tienen 1 unidad de transcripción para la expresión de las proteínas Rep 78 y 52. 3, 6 y 7 tienen 2 unidades de transcripción para la expresión las proteínas Rep 78 y 52.
Una estimación aproximada de las cantidades y las relaciones de las proteínas rep 78 y rep 52 para las diferentes construcciones durante la producción de VAAr (rep78:rep52):
78 52
1) 1 :1
2) 1,5 :2
3) 1 : 20
Claims (15)
1. Una célula de insecto que comprende una primera secuencia de nucleótidos que codifica una primera secuencia de aminoácidos y una segunda secuencia de nucleótidos que codifica una segunda secuencia de aminoácidos, en la que:
(a) la primera y la segunda secuencias de nucleótidos están cada una unida operativamente a secuencias de control de la expresión para la expresión en una célula de insecto;
(b) la primera y la segunda secuencias de aminoácidos comprenden una secuencia de aminoácidos común de la cual al menos 100 aminoácidos tienen una identidad de aminoácidos de al menos un 90 % entre la primera y la segunda secuencias de aminoácidos;
(c) las secuencias de nucleótidos que codifican la secuencia de aminoácidos común en la primera y la segunda secuencias de aminoácidos son menos del 95% idénticas;
(d) el uso de codones de la primera o segunda secuencias de nucleótidos que codifica la secuencia de aminoácidos común está adaptado al uso de codones de la célula huésped de insecto;
(e) la primera secuencia de nucleótidos codifica la secuencia de aminoácidos de una proteína Rep52 o 40 de parvovirus y la segunda secuencia de nucleótidos codifica la secuencia de aminoácidos de una proteína Rep78 o 68 de parvovirus; y
(f) las secuencias de aminoácidos comunes comprenden las secuencias de aminoácidos del segundo aminoácido más C-terminal de la proteína Rep52 o 40 de parvovirus.
2. Una célula de insecto de acuerdo con la reivindicación 1, en la que las secuencias de nucleótidos que codifican la secuencia de aminoácidos común en la primera y la segunda secuencias de aminoácidos son menos del 80 % idénticas.
3. Una célula de insecto de acuerdo con la reivindicación 1 o la reivindicación 2, en la que las secuencias de aminoácidos comunes en la primera y la segunda secuencias de aminoácidos comparten una identidad de aminoácidos de al menos un 99 %, preferentemente una identidad de aminoácidos del 100 %.
4. Una célula de insecto de acuerdo con una cualquiera de las reivindicaciones anteriores, en la que la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la primera secuencia de nucleótidos tiene un sesgo de uso de codones mejorado para la célula de insecto, en comparación con la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la segunda secuencia de nucleótidos, en la que la diferencia en el índice de adaptación de codones entre la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la primera y la segunda secuencias de nucleótidos es al menos 0,2.
5. Una célula de insecto de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la secuencia de nucleótidos con el sesgo de uso de codones mejorado comprende un tramo continuo de al menos 25 codones todos los cuales son codones comunes de conformidad con la Tabla 1 o la Tabla 2, en el que, preferentemente, todos los codones en la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la secuencia de nucleótidos con el sesgo de uso mejorado son codones comunes de acuerdo con la Tabla 1 o la Tabla 2, y en la que, más preferentemente, todos los codones en la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la otra secuencia de nucleótidos son segundos codones más frecuentes de acuerdo con la Tabla 1 o la Tabla 2.
6. Una célula de insecto de acuerdo con una cualquiera de las reivindicaciones anteriores, en la que al menos el 50 % de los codones en la secuencia de nucleótidos que codifica la secuencia de aminoácidos común en la segunda secuencia de nucleótidos está alterada en comparación con el codón correspondiente en la primera secuencia de nucleótidos para maximizar el contenido de AT o GC de la segunda secuencia de nucleótidos.
7. Una célula de insecto de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que la primera y la segunda secuencias de nucleótidos son parte de una única construcción de ácido nucleico.
8. Una célula de insecto de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que las proteínas Rep de parvovirus son proteínas Rep del virus adenoasociado (VAA), en la que, preferentemente, las proteínas Rep de parvovirus codificadas en la primera y la segunda secuencias de nucleótidos son del mismo serotipo.
9. Una célula de insecto de acuerdo con una cualquiera de las reivindicaciones anteriores, en la que la primera secuencia de nucleótidos codifica una proteína Rep52 de parvovirus y se selecciona del grupo que consiste en:
a) una secuencia de nucleótidos que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de secuencia de al menos un 70 % con la secuencia de aminoácidos de la SEQ ID NO. 6; b) una secuencia de nucleótidos que tiene al menos un 70 % de identidad de secuencia con la secuencia de nucleótidos de una cualquiera de las SEQ ID NO de 1 - 5 y 10;
c) una secuencia de nucleótidos cuya cadena complementaria hibrida a una secuencia de molécula de ácido nucleico de (a) o (b); y
d) una secuencia de nucleótidos cuya secuencia difiere de la secuencia de una molécula de ácido nucleico de (c) debido a la degeneración del código genético,
y en la que la segunda secuencia de nucleótidos codifica una proteína Rep78 de parvovirus y se selecciona del grupo que consiste en:
a) una secuencia de nucleótidos que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de secuencia de al menos un 70 % con la secuencia de aminoácidos de la SEQ ID NO. 8; b) una secuencia de nucleótidos que tiene al menos un 70 % de identidad de secuencia con la secuencia de nucleótidos de las posiciones 11-1.876 de la SEQ ID NO. 7;
c) una secuencia de nucleótidos cuya cadena complementaria hibrida a una secuencia de molécula de ácido nucleico de (a) o (b);
d) una secuencia de nucleótidos cuya secuencia difiere de la secuencia de una molécula de ácido nucleico de (c) debido a la degeneración del código genético.
10. Una célula de insecto de acuerdo con una cualquiera de las reivindicaciones anteriores, en la que la célula de insecto comprende además:
a) una tercera secuencia de nucleótidos que comprende al menos una secuencia de nucleótidos de repetición terminal invertida (ITR) de parvovirus; y
b) una cuarta secuencia de nucleótidos que comprende las secuencias de codificación de la proteína de la cápside de parvovirus unida operativamente a secuencias de control de la expresión para la expresión en una célula de insecto,
en la que, preferentemente, una o más de la primera, segunda, tercera y cuarta secuencias de nucleótidos son parte de una construcción de ácido nucleico que es un vector compatible con células de insectos, preferentemente un vector de baculovirus.
11. Una célula de insecto de acuerdo con la reivindicación 10, en la que la tercera secuencia de nucleótidos comprende además al menos una secuencia de nucleótidos que codifica un producto génico de interés y en el que la al menos una secuencia de nucleótidos que codifica un producto génico de interés se incorpora en el genoma de un vector de parvovirus producido en la célula de insecto, en la que, preferentemente, la tercera secuencia de nucleótidos comprende dos secuencias de nucleótidos ITR de parvovirus y en la que la al menos una secuencia de nucleótidos que codifica un producto génico de interés se localiza entre las dos secuencias de ITR de nucleótidos de parvovirus.
12. Una célula de insecto de acuerdo con la reivindicación 10 o la reivindicación 11, en la que al menos una de la primera, segunda secuencia, tercera y cuarta secuencias de nucleótidos se integran de forma estable en el genoma de la célula de insecto.
13. Una célula de insecto de acuerdo con una cualquiera de las reivindicaciones 10-12, en la que el parvovirus es VAA.
14. Un procedimiento para producir un virión de parvovirus recombinante en una célula de insecto que comprende las etapas de:
a) cultivar una célula de insecto como se define en una cualquiera de las reivindicaciones 10-13 en condiciones tales que se produce el virión de parvovirus recombinante; y
b) la recuperación del virión de parvovirus recombinante,
comprendiendo, preferentemente, el procedimiento además la etapa de purificación por afinidad del virión utilizando un anticuerpo anti-parvovirus inmovilizado, más preferentemente un anticuerpo de camélido monocatenario o un fragmento del mismo y en el que, preferentemente, el virión de parvovirus recombinante es un virión de VAA recombinante.
15. Una construcción de ácido nucleico que comprende una primera y una segunda secuencia de nucleótidos como se define en una cualquiera de las reivindicaciones 1-9.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US95208107P | 2007-07-26 | 2007-07-26 | |
| EP07113257 | 2007-07-26 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2734355T3 true ES2734355T3 (es) | 2019-12-05 |
Family
ID=67928509
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES16176100T Active ES2734355T3 (es) | 2007-07-26 | 2008-07-25 | Vectores de baculovirus que comprenden secuencias de codificación repetidas con sesgos de codones diferenciales |
Country Status (4)
| Country | Link |
|---|---|
| ES (1) | ES2734355T3 (es) |
| HU (1) | HUE043953T2 (es) |
| PT (1) | PT3093345T (es) |
| TR (1) | TR201910872T4 (es) |
-
2008
- 2008-07-25 ES ES16176100T patent/ES2734355T3/es active Active
- 2008-07-25 PT PT16176100T patent/PT3093345T/pt unknown
- 2008-07-25 TR TR2019/10872T patent/TR201910872T4/tr unknown
- 2008-07-25 HU HUE16176100A patent/HUE043953T2/hu unknown
Also Published As
| Publication number | Publication date |
|---|---|
| TR201910872T4 (tr) | 2019-08-21 |
| PT3093345T (pt) | 2019-07-19 |
| HUE043953T2 (hu) | 2019-09-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12486496B2 (en) | AAV vectors produced by insect cells comprising Rep52 and Rep78 coding sequences with differential codon biases | |
| US8163543B2 (en) | AAV vectors produced in insect cells | |
| ES2929031T3 (es) | Optimización de la expresión de las proteínas rep y cap parvovirales en células de insecto | |
| ES2785223T3 (es) | Células de insecto para la producción de vectores de AAV | |
| ES2734355T3 (es) | Vectores de baculovirus que comprenden secuencias de codificación repetidas con sesgos de codones diferenciales | |
| AU2014201171B9 (en) | Baculoviral vectors comprising repeated coding sequences with differential codon biases | |
| ES2575990T3 (es) | Vectores con codón de iniciación modificado para la traducción de aav-rep78 para la producción de aav en las células de insectos | |
| HK40014371A (en) | Baculoviral vectors comprising repeated coding sequences with differential codon biases | |
| HK1249136B (en) | Improved aav vectors produced in insect cells | |
| HK1231125B (en) | Baculoviral vectors comprising repeated coding sequences with differential codon biases | |
| HK1231125A1 (en) | Baculoviral vectors comprising repeated coding sequences with differential codon biases | |
| HK1143185B (en) | Baculoviral vectors comprising repeated coding sequences with differential codon biases | |
| HK1115413B (en) | Improved aav vectors produced in insect cells |