ES2864081T3 - Elementos potenciadores de CPMV - Google Patents
Elementos potenciadores de CPMV Download PDFInfo
- Publication number
- ES2864081T3 ES2864081T3 ES15735364T ES15735364T ES2864081T3 ES 2864081 T3 ES2864081 T3 ES 2864081T3 ES 15735364 T ES15735364 T ES 15735364T ES 15735364 T ES15735364 T ES 15735364T ES 2864081 T3 ES2864081 T3 ES 2864081T3
- Authority
- ES
- Spain
- Prior art keywords
- sequence
- plant
- seq
- construct
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241000723655 Cowpea mosaic virus Species 0.000 title claims abstract description 124
- 239000003623 enhancer Substances 0.000 title claims abstract description 108
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 261
- 239000002773 nucleotide Substances 0.000 claims abstract description 260
- 230000014509 gene expression Effects 0.000 claims abstract description 228
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims abstract description 98
- 108020003589 5' Untranslated Regions Proteins 0.000 claims abstract description 19
- 108090000623 proteins and genes Proteins 0.000 claims description 129
- 102000004169 proteins and genes Human genes 0.000 claims description 102
- 238000010367 cloning Methods 0.000 claims description 66
- 230000001105 regulatory effect Effects 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 57
- 150000007523 nucleic acids Chemical class 0.000 claims description 50
- 108020004707 nucleic acids Proteins 0.000 claims description 42
- 102000039446 nucleic acids Human genes 0.000 claims description 42
- 241000700605 Viruses Species 0.000 claims description 27
- 108091036066 Three prime untranslated region Proteins 0.000 claims description 20
- 206010022000 influenza Diseases 0.000 claims description 17
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 101710154606 Hemagglutinin Proteins 0.000 claims description 15
- 101710093908 Outer capsid protein VP4 Proteins 0.000 claims description 15
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 claims description 15
- 101710176177 Protein A56 Proteins 0.000 claims description 15
- 239000000185 hemagglutinin Substances 0.000 claims description 15
- 108010067390 Viral Proteins Proteins 0.000 claims description 5
- 230000006798 recombination Effects 0.000 claims description 3
- 238000005215 recombination Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 241000196324 Embryophyta Species 0.000 description 320
- 229960004641 rituximab Drugs 0.000 description 80
- 108010076504 Protein Sorting Signals Proteins 0.000 description 69
- 239000000945 filler Substances 0.000 description 52
- 101710085938 Matrix protein Proteins 0.000 description 50
- 101710127721 Membrane protein Proteins 0.000 description 50
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 description 47
- 239000012634 fragment Substances 0.000 description 47
- 108020003519 protein disulfide isomerase Proteins 0.000 description 47
- 125000003275 alpha amino acid group Chemical group 0.000 description 41
- 101150033195 Victoria gene Proteins 0.000 description 38
- 230000002797 proteolythic effect Effects 0.000 description 38
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 32
- 210000004027 cell Anatomy 0.000 description 32
- 239000013612 plasmid Substances 0.000 description 31
- 108091081024 Start codon Proteins 0.000 description 29
- 108091026890 Coding region Proteins 0.000 description 27
- 230000000977 initiatory effect Effects 0.000 description 24
- 208000037797 influenza A Diseases 0.000 description 20
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- 108010058731 nopaline synthase Proteins 0.000 description 18
- 210000005220 cytoplasmic tail Anatomy 0.000 description 17
- 241000219823 Medicago Species 0.000 description 16
- 210000001519 tissue Anatomy 0.000 description 15
- 238000011144 upstream manufacturing Methods 0.000 description 14
- 108090000051 Plastocyanin Proteins 0.000 description 13
- 230000014616 translation Effects 0.000 description 13
- 239000013598 vector Substances 0.000 description 13
- 108020005345 3' Untranslated Regions Proteins 0.000 description 11
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 241000589158 Agrobacterium Species 0.000 description 10
- 108700026244 Open Reading Frames Proteins 0.000 description 10
- 230000030279 gene silencing Effects 0.000 description 10
- 230000001939 inductive effect Effects 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 10
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 241000723607 Comovirus Species 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 101150084101 RNA2 gene Proteins 0.000 description 7
- 101100353432 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP2 gene Proteins 0.000 description 7
- 230000008595 infiltration Effects 0.000 description 7
- 238000001764 infiltration Methods 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 239000002028 Biomass Substances 0.000 description 6
- 108091035707 Consensus sequence Proteins 0.000 description 6
- 108010076039 Polyproteins Proteins 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 239000000411 inducer Substances 0.000 description 6
- 208000037798 influenza B Diseases 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000009261 transgenic effect Effects 0.000 description 6
- 230000010474 transient expression Effects 0.000 description 6
- 241000272525 Anas platyrhynchos Species 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- -1 antibodies Substances 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 4
- 241000208125 Nicotiana Species 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000004186 co-expression Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000035931 haemagglutination Effects 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 241000219194 Arabidopsis Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 3
- 241000283073 Equus caballus Species 0.000 description 3
- 241000207746 Nicotiana benthamiana Species 0.000 description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 240000006394 Sorghum bicolor Species 0.000 description 3
- 101900024951 Tomato bushy stunt virus RNA silencing suppressor p19 Proteins 0.000 description 3
- 150000001413 amino acids Chemical group 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 241001493065 dsRNA viruses Species 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 239000003630 growth substance Substances 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000037039 plant physiology Effects 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 241000712461 unidentified influenza virus Species 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 235000006576 Althaea officinalis Nutrition 0.000 description 2
- 101710132601 Capsid protein Proteins 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 235000019750 Crude protein Nutrition 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 241001057636 Dracaena deremensis Species 0.000 description 2
- 241001529459 Enterovirus A71 Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 108090000394 Erythropoietin Proteins 0.000 description 2
- 102000003951 Erythropoietin Human genes 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 241000905450 Grapevine leafroll-associated virus 2 Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 241000701806 Human papillomavirus Species 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 101710091688 Patatin Proteins 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 240000004713 Pisum sativum Species 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 108700001094 Plant Genes Proteins 0.000 description 2
- 241000725643 Respiratory syncytial virus Species 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 241000710145 Tomato bushy stunt virus Species 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 2
- 229960003669 carbenicillin Drugs 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 229940105423 erythropoietin Drugs 0.000 description 2
- 241001233957 eudicotyledons Species 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 238000000265 homogenisation Methods 0.000 description 2
- 238000003119 immunoblot Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000003262 industrial enzyme Substances 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000002054 inoculum Substances 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- QAPSNMNOIOSXSQ-YNEHKIRRSA-N 1-[(2r,4s,5r)-4-[tert-butyl(dimethyl)silyl]oxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O[Si](C)(C)C(C)(C)C)C1 QAPSNMNOIOSXSQ-YNEHKIRRSA-N 0.000 description 1
- 101150073246 AGL1 gene Proteins 0.000 description 1
- 108090000104 Actin-related protein 3 Proteins 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 241001293113 Anas clypeata Species 0.000 description 1
- 101100274514 Arabidopsis thaliana CKL11 gene Proteins 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 101710151325 B2 protein Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101150064755 CKI1 gene Proteins 0.000 description 1
- 101100290380 Caenorhabditis elegans cel-1 gene Proteins 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 241001515826 Cassava vein mosaic virus Species 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 241001168968 Chroicocephalus ridibundus Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 241000724252 Cucumber mosaic virus Species 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- YAHZABJORDUQGO-NQXXGFSBSA-N D-ribulose 1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 1
- 101100001914 Danio rerio apmap gene Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 101800003838 Epidermal growth factor Proteins 0.000 description 1
- 102400001368 Epidermal growth factor Human genes 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 1
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 1
- 241000950314 Figura Species 0.000 description 1
- KRHYYFGTRYWZRS-UHFFFAOYSA-M Fluoride anion Chemical compound [F-] KRHYYFGTRYWZRS-UHFFFAOYSA-M 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 101800000653 Helper component proteinase Proteins 0.000 description 1
- 241000125184 Heracleum Species 0.000 description 1
- 101000853000 Homo sapiens Interleukin-26 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 102000005755 Intercellular Signaling Peptides and Proteins Human genes 0.000 description 1
- 108010070716 Intercellular Signaling Peptides and Proteins Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 102100036679 Interleukin-26 Human genes 0.000 description 1
- 108010066979 Interleukin-27 Proteins 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 235000021506 Ipomoea Nutrition 0.000 description 1
- 241000207783 Ipomoea Species 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 241000272168 Laridae Species 0.000 description 1
- 241001494920 Larus argentatus Species 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102100031789 Myeloid-derived growth factor Human genes 0.000 description 1
- 101150005851 NOS gene Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 1
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000004371 Panax ginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241000287882 Pavo Species 0.000 description 1
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 1
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 241000710181 Potato virus M Species 0.000 description 1
- 241000710179 Potato virus S Species 0.000 description 1
- 241000709992 Potato virus X Species 0.000 description 1
- 241000723762 Potato virus Y Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101800001092 Protein 3B Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 101100397775 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YCK2 gene Proteins 0.000 description 1
- 101710147732 Small envelope protein Proteins 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical class O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000009618 Transforming Growth Factors Human genes 0.000 description 1
- 108010009583 Transforming Growth Factors Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 1
- 101710194411 Triosephosphate isomerase 1 Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 101800003106 VPg Proteins 0.000 description 1
- 240000000851 Vaccinium corymbosum Species 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 244000042314 Vigna unguiculata Species 0.000 description 1
- 101800001476 Viral genome-linked protein Proteins 0.000 description 1
- 101800001133 Viral protein genome-linked Proteins 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- VJYIFXVZLXQVHO-UHFFFAOYSA-N chlorsulfuron Chemical compound COC1=NC(C)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)Cl)=N1 VJYIFXVZLXQVHO-UHFFFAOYSA-N 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229940116977 epidermal growth factor Drugs 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 244000052637 human pathogen Species 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 229960001388 interferon-beta Drugs 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 102000003898 interleukin-24 Human genes 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 210000000299 nuclear matrix Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 239000003415 peat Substances 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000009894 physiological stress Effects 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 235000005974 protein supplement Nutrition 0.000 description 1
- 229940116540 protein supplement Drugs 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000000018 receptor agonist Substances 0.000 description 1
- 229940044601 receptor agonist Drugs 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000012882 rooting medium Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000701 toxic element Toxicity 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 239000003656 tris buffered saline Substances 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/16—Antivirals for RNA viruses for influenza or rhinoviruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8251—Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
- C12N7/04—Inactivation or attenuation; Producing viral sub-units
- C12N7/045—Pseudoviral particles; Non infectious pseudovirions, e.g. genetically engineered
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Virology (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Veterinary Medicine (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Nutrition Science (AREA)
- Botany (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Physiology (AREA)
- Pulmonology (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
Un potenciador de la expresión que comprende una secuencia de nucleótidos de UTR 5' del CPMV derivada del ARN-2 del CPMV, la secuencia de nucleótidos de la UTR 5' del CPMV consiste en los nucleótidos 1-160 de la SEQ ID NO: 1 o consiste en los nucleótidos 1-160 de la SEQ ID NO: 69.
Description
DESCRIPCIÓN
Elementos potenciadores de CPMV
Campo de la invención
La presente invención se refiere a la expresión de proteínas de interés en plantas. La presente invención también proporciona métodos y composiciones para la producción de proteínas de interés en plantas.
Antecedentes de la invención
Las plantas ofrecen un gran potencial como sistemas de producción de proteínas recombinantes. Un enfoque para producir proteínas extrañas en plantas es generar líneas de plantas transgénicas estables. Sin embargo, este es un proceso que requiere mucho tiempo y trabajo. Una alternativa a las plantas transgénicas es el uso de vectores de expresión basados en virus vegetales. Los vectores basados en virus vegetales permiten la expresión rápida, de alto nivel y transitoria de proteínas en las plantas.
Un método para lograr la expresión transitoria de alto nivel de proteínas extrañas en plantas implica el uso de vectores basados en virus vegetales de ARN, lo que incluye los comovirus, tales como el virus del mosaico del caupí (CPMV; ver, por ejemplo, los documentos WO2007/135480; WO2009/087391; US 2010/0287670, Sainsbury F. y otros, 2008, Plant Physiology; 148: 121-1218; Sainsbury F. y otros, 2008, Plant Biotechnology Journal; 6: 82-92; Sainsbury F. y otros, 2009, Plant Biotechnology Journal; 7: 682-693; Sainsbury F. y otros, 2009, Methods in Molecular Biology, Recombinant Proteins From Plants, vol. 483: 25-39).
Los comovirus son virus de ARN con un genoma bipartito. Los segmentos del genoma del ARN comoviral se denominan como ARN-1 y ARN-2. El ARN-1 codifica las proteínas VPg, replicasa y proteasa. El virus requiere la replicasa para la replicación del genoma viral. El ARN-2 del comovirus virus del mosaico del caupí (CPMV) produce una poliproteína de 105 kDa o 95 kDa procesada en 4 péptidos funcionales.
La región 5' del ARN-2 del CPMV comprende codones de inicio (AUG) en las posiciones 115, 161, 512 y 524. Los codones de inicio en las posiciones 161 y 512 están en el mismo marco de lectura de triplete. La iniciación en el codón de inicio en la posición 161 da como resultado la síntesis de la poliproteína de 105 K mientras que la iniciación en el codón de inicio en la posición 512 dirige la síntesis de la poliproteína de 95 K. La iniciación de la traducción en el codón de inicio en la posición 512 en el CPMV es más eficiente que el inicio en la posición 161, lo que da como resultado la producción de más poliproteína de 95 K que poliproteína de 105 K. El codón de inicio en la posición 115 no es esencial para la replicación del virus (Wellink y otros, 1993 Biochimie. 75(8): 741-7).
Se requiere el mantenimiento del marco entre los sitios de iniciación en las posiciones 161 y 512 en el ARN-2 del CPMV para la replicación eficiente del ARN-2 por la replicasa codificada por el ARN-1 (Holness y otros, 1989; Virology 172, 311-320; van Bokhoven y otros, 1993, Virology 195, 377-386; Rohll y otros, 1993 Virology 193, 672-679; Wellink y otros, 1993, Biochimie. 75(8):741-7). Este requisito afecta la longitud de las secuencias que pueden insertarse aguas arriba del codón de inicio 512 en formas replicativas de vectores de expresión del ARN-2 del CPMV. Además, el uso de polienlazadores debe usarse con precaución ya que pueden desplazar el marco de lectura de codones (ORF) entre estos sitios de iniciación.
El CPMV ha servido como base para el desarrollo de sistemas de vectores adecuados para la producción de polipéptidos heterólogos en plantas (Liu y otros, 2005 Vaccine 23, 1788-1792; Sainsbury y otros, 2007 Virus Expression Vectors (ed. Hefferon, K.), págs. 339-555). Estos sistemas se basan en la modificación del ARN-2, pero difieren en si se usan versiones de longitud completa o con eliminaciones. La replicación del ARN-2 modificado se logra mediante la inoculación conjunta con ARN-1. Las proteínas extrañas están fusionadas al extremo C-terminal de las poliproteínas derivadas del ARN-2. La liberación del polipéptido N-terminal está mediada por la acción de la secuencia del péptido catalítico 2A del virus de la fiebre aftosa (Gopinath y otros, 2000, Virology 267: 159-173). Las moléculas de ARN-2 resultantes son capaces de propagarse tanto dentro como entre plantas. Esta estrategia se ha usado para expresar una serie de proteínas recombinantes, tales como el antígeno central de la hepatitis B (HBcAg) y las proteínas inmunitarias pequeñas (SIP), en plantas de caupí (Mechtcheriakova y otros, J. Virol. Methods 131, 10-15; 2006; Monger y otros, 2006, Plant Biotechnol. J. 4, 623-631; Alamillo y otros, 2006, Biotechnol. J. 1, 1103-1111). Aunque tiene éxito, el uso de un vector viral de longitud completa limita el tamaño de las secuencias insertadas, y el movimiento entre plantas genera preocupaciones sobre la biocontención del virus.
Para abordar el problema de la biocontención y el tamaño del inserto, Canizares y otros (2006 Plant Biotechnol, J 4: 183-193) reemplazaron la mayor parte de la región codificante del ARN-2 con una secuencia de interés para producir una versión inhabilitada del ARN-2 del CPMV (deIARN-2). La secuencia a expresar se fusionó al AUG en la posición 512 del ARN-2, inmediatamente aguas arriba de la región no traducida (UTR) 3' para crear una molécula que imita al ARN-2. Tales constructos fueron capaces de replicarse cuando se introdujeron en plantas en presencia del ARN-1 y un supresor del silenciamiento, y dirigieron la síntesis de niveles sustanciales de proteínas heterólogas (Sainsbury y otros, 2008 Plant Biotechnol J 6: 82-92).
La mutación del codón de inicio en la posición 161 en un vector de ARN-2 del CPMV (U162C; HT) aumenta los niveles de expresión de una proteína codificada por una secuencia insertada después del codón de inicio en la posición 512. Esto permite la producción de altos niveles de proteínas extrañas sin la necesidad de replicación viral y se denominó el sistema CPMV-HT (documento WO2009/087391; Sainsbury y Lomonossoff, 2008, Plant Physiol. 148, 1212-1218). En los plásmidos de expresión pEAQ (Sainsbury y otros, 2009, Plant Biotechnology Journal, 7, págs. 682-693; documento US 2010/0287670), la secuencia a expresar se coloca entre la UTR 5' y la UTR 3'. La UTR 5' en la serie pEAQ porta la mutación U162C (HT).
Resumen de la invención
La presente invención se refiere a la expresión de proteínas de interés en plantas. La presente invención también proporciona métodos y composiciones para la producción de proteínas de interés en plantas. La presente invención proporciona un potenciador de la expresión que comprende una secuencia de nucleótidos de la UTR 5' del CPMV derivada del ARN-2 del CPMV, donde la secuencia de nucleótidos de la UTR 5' del CPMV consiste en los nucleótidos 1-160 de la SEQ ID NO: 1 o consiste en los nucleótidos 1-160 de la SEQ ID NO: 69. La presente invención también proporciona un ácido nucleico que comprende el potenciador de la expresión y una secuencia de nucleótidos de interés, donde la secuencia de nucleótidos de interés está unida operativamente al extremo 3' del potenciador de la expresión, y la secuencia de nucleótidos de interés codifica una proteína de interés. La presente invención también proporciona un sistema de expresión en plantas que comprende el potenciador de la expresión, en donde el potenciador de la expresión está unido operativamente a una región reguladora en el extremo 5' del potenciador de la expresión. La presente invención también proporciona un método para producir una proteína de interés en una planta o una porción de una planta que comprende, introducir en la planta o la porción de la planta el sistema de expresión en plantas e incubar la planta o la porción de la planta en condiciones que permitan la expresión de la secuencia de nucleótidos que codifica la proteína de interés. La presente invención también proporciona una planta o porción de una planta infectada transitoriamente o transformada de manera estable con el sistema de expresión en plantas.
Como se describe en la presente descripción, se proporciona un potenciador de la expresión que comprende una secuencia de nucleótidos de la UTR 5' del CPMV que consiste en X nucleótidos (CMPVX), donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, o que consiste en una secuencia de nucleótidos que comprende de aproximadamente 80 % a 100 % de similitud de secuencia con CMPVX, donde X=160, 155, 150 o 114 de la SEQ ID n O: 1. El potenciador de la expresión puede comprender una secuencia de nucleótidos seleccionada del grupo de la SEQ ID NO: 24, 27, 68, 69, 70 y 71.
La presente descripción también proporciona el potenciador de la expresión como se definió anteriormente, donde el potenciador de la expresión comprende además una secuencia de relleno (CPMVX+, donde X=160, 155, 150, 114 de la SEQ ID NO: 1). La secuencia de relleno puede comprender una longitud de 0 a aproximadamente 100 nucleótidos, o cualquier longitud entre ellos, una o más secuencias kozak de plantas, un sitio de clonación múltiple, una o más secuencias enlazadoras, uno o más sitios de recombinación o una combinación de los mismos. La presente descripción también proporciona el potenciador de la expresión como se definió anteriormente, donde la secuencia kozak se selecciona del grupo de secuencias como las que se muestra en las SEQ ID NO: 5-17. El potenciador de la expresión como se acaba de definir (CPMVX+, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1) puede comprender una secuencia de nucleótidos seleccionada del grupo de la SEQ ID NO: 2, 72, 73, 74, 75, 76 y 77.
También se proporciona un sistema de expresión en plantas que comprende una secuencia de ácido nucleico que comprende una región reguladora, unida operativamente con el potenciador de la expresión CPMVX, CPMVX+, como se definió anteriormente, donde el potenciador de la expresión está unido operativamente a una secuencia de nucleótidos de interés. El sistema de expresión en plantas puede comprender además una UTR 3' de comovirus. El sistema de expresión en plantas puede comprender además una segunda secuencia de ácido nucleico que codifica un supresor del silenciamiento, por ejemplo, HcPro o p19.
La secuencia de nucleótidos de interés del sistema de expresión en plantas como se definió anteriormente puede codificar una proteína viral o un anticuerpo. Por ejemplo, la proteína viral puede ser una hemaglutinina de influenza y puede seleccionarse del grupo de H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 y una hemaglutinina de influenza tipo B. La secuencia de nucleótidos que codifica la proteína viral o el anticuerpo puede comprender una secuencia de péptido señal nativo, o un péptido señal no nativo, por ejemplo, el péptido señal no nativo puede obtenerse a partir de la proteína disulfuro isomerasa (PDI).
Como se describe en la presente descripción, se proporciona un método para producir una proteína de interés en una planta o en una porción de una planta que comprende, introducir en la planta o en la porción de una planta el sistema de expresión en plantas que comprende CPMVx o CPMVX+, como se definió anteriormente, e incubar la planta o la porción de una planta en condiciones que permitan la expresión de la secuencia de nucleótidos que codifica la proteína de interés.
La presente descripción también proporciona una planta o porción de una planta transfectada transitoriamente o transformada de manera estable con el sistema de expresión en plantas como se describió anteriormente.
Los sistemas de expresión basados en plantas como se describen en la presente descripción dan como resultado el aumento o potenciación de la expresión de una secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo que está unido operativamente al potenciador de la expresión, ya sea CPMVX o CPMVX+ como se define en la presente descripción. El aumento en la expresión puede determinarse al comparar el nivel de expresión obtenido mediante el uso de los potenciadores de la expresión basados en CPMVX o basados en CPMVX+ con el nivel de expresión de la misma secuencia de nucleótidos que codifica el marco abierto de lectura heterólogo unido operativamente a la secuencia potenciadora de la técnica anterior (CPMV HT) que comprende una proteína M incompleta (como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218). En la SEQ ID NO: 4 se proporciona un ejemplo de una secuencia CPMV HT de la técnica anterior.
Los sistemas de expresión basados en plantas como se describen en la presente descripción también pueden tener una serie de propiedades tales como, por ejemplo, que contienen sitios de clonación convenientes para genes o secuencias de nucleótidos de interés, pueden infectar plantas fácilmente de una manera rentable, pueden provocar una infección local o sistémica eficiente de las plantas inoculadas. Además, la infección debería proporcionar un buen rendimiento de material proteico útil.
Este resumen de la invención no describe necesariamente todas las características de la invención.
Breve descripción de los dibujos
Estas y otras características de la invención serán más evidentes a partir de la siguiente descripción en la que se hace referencia a los dibujos adjuntos en donde:
La FIGURA 1A muestra un esquema general de un ejemplo de varias secuencias potenciadoras, CPMVX y CPMVX+ (que comprende CPMVX y un fragmento de relleno, que en este ejemplo no limitante, comprende un sitio de clonación múltiple y una secuencia kozak de plantas), como se describe en la presente descripción. CPMCX y CPMVX+ se muestran cada uno unidos operativamente a la región reguladora de plantas en sus extremos 5', y en sus extremos 3', en serie, una secuencia de nucleótidos de interés (que incluye un sitio de iniciación ATG y un sitio de parada), una UTR 3' y una secuencia terminadora. Un ejemplo de constructo CPMVX como se describe en la presente descripción, es CPMV160. Un ejemplo de constructo CPMVX+ como se describe en la presente descripción, es CPMV160+. La FIGURA 1B muestra ejemplos de varias variantes de constructos que comprenden secuencias potenciadoras, como se describe en la presente descripción (CPMV160, secuencia completa proporcionada como SEQ ID NO: 1; CPMV155, secuencia completa proporcionada como SEQ ID NO: 24; CPMV150, secuencia completa proporcionada como SEQ ID NO: 27; y CPMV114, secuencia completa proporcionada como SEQ ID NO: 68), unidas operativamente a la región reguladora (en estos ejemplos no limitantes 2X35S) en sus extremos 5', y en sus extremos 3', una secuencia de nucleótidos de interés, o "GOI", que incluye una secuencia kozak de plantas adyacente al sitio de iniciación ATG (los elementos mostrados entre corchetes se incluyen para el contexto y no son parte de las secuencias potenciadoras de CPMVX o CPMVX+). La FIGURA 1C muestra ejemplos de varias variantes de constructos que comprenden secuencias potenciadoras, como se describe en la presente descripción (CPMV 160+, secuencia completa proporcionada como SEQ ID NO: 2; CPMV155+, secuencia completa proporcionada como SEQ ID NO: 72; CPMV150+, secuencia completa proporcionada como SEQ ID NO: 73; y CPMV114+, secuencia completa proporcionada como SEQ ID NO: 74), unidas operativamente a la región reguladora de plantas (en estos ejemplos no limitantes 2X35S) en sus extremos 5', y en sus extremos 3', un fragmento de relleno (en estos ejemplos no limitantes, que comprende un sitio de clonación múltiple y una secuencia kozak de plantas), una secuencia de nucleótidos de interés, "GOI", que comprende un sitio de iniciación ATG (los elementos que se muestran entre corchetes se incluyen para el contexto, y no son parte de las secuencias potenciadoras CPMVX o CPMVX+).
La FIGURA 2 muestra el título relativo de hemaglutinación (HMG) en extractos proteicos crudos de proteínas producidas en plantas que comprenden constructos de expresión de CPMV-HT (técnica anterior), y constructos de expresión basados en CPMV160+, unidos operativamente con una secuencia de nucleótidos de interés. Se muestran datos para la expresión de HA a partir de H1 A/California/07/2009 con un péptido señal PDI (PDI-H1 Cal; número de constructo 484 UTR 5': CPMV HT; y número de constructo 1897, UTR 5': CPMV160+; ver el Ejemplo 5), H3 A/Victoria/361/2011 con un péptido señal de PDI (PDI-H3 Vic; número de constructo 1391, UTR 5': c Pm V Ht ; y número de constructo 1800, u Tr 5': CMPV160+; ver los Ejemplos 1 y 2, respectivamente), H5 a partir de Influenza A/Indonesia/5/2005 con un péptido señal nativo (WtSp-H5 Indo; número de constructo 489, UTR 5': CMPV HT; y número de constructo 1880, Ut R 5': CMPV160+; ver el Ejemplo 6), y B/Wisconsin/1/2010 con bucle proteolítico eliminado y con un péptido señal nativo (WtSp-B Wis-PrL; número de constructo 1445, UTR 5': CMPV HT; y número de constructo 1975, UTR 5': CMPV160+, ver el Ejemplo 13). PDI: péptido señal de proteína disulfuro isomerasa; PrL-: bucle proteolítico eliminado.
La FIGURA 3 muestra los títulos relativos de hemaglutinación (HMG) en extractos proteicos crudos de proteínas producidas en plantas que comprenden constructos de expresión de CPMV-HT (técnica anterior) y constructos de expresión basados en CPMV160+. Se muestran datos para la expresión de HA a partir de H1 A/California/07/2009 con un péptido señal PDI (número de constructo 484, UTR 5': CMPV HT; y número de constructo 1897 UTR 5': CMPV160+, ver el Ejemplo 5), H3 A/Victoria/361/2011 con un péptido señal Pd I (número de constructo 1391, UTR 5': CMPV HT; y número de constructo 1800 UTR 5': CMPV160+, ver los Ejemplos 1 y 2, respectivamente), B
Brisbane/60/08 con bucle proteolítico eliminado y con un péptido señal PDI (número de constructo 1039, UTR 5': CMPV HT; y número de constructo 1937, UTR 5': CMPV160+; ver el Ejemplo 9), B Brisbane/60/08+H1Tm, con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009, y con un péptido señal PDI (número de constructo 1067, UTR 5': CMPV Ht ; y número de constructo 1977, Ut R 5': CMPV160+; ver el Ejemplo 10), B Massachusetts/2/2012 2012 con bucle proteolítico eliminado y con un péptido señal PDI (número de constructo 2072, UTR 5': CMPV HT; y número de constructo 2050, UTR 5': CMPV 160+; ver el Ejemplo 11), B Massachusetts/2/2012+H1Tm con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009 y con un péptido señal PDI (número de constructo 2074, UTR 5': CMPV HT; y número de constructo 2060, UTR 5': CMPV160+; ver el Ejemplo 12), B Wisconsin/1/2010 con bucle proteolítico eliminado y con el péptido señal nativo (número de constructo 1445, UTR 5': CMPV HT; y número de constructo 1975, UTR 5': CMPV160+; ver el Ejemplo 13), y B Wisconsin/1/2010+H1Tm con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009 y con el péptido señal nativo (número de constructo 1454, UTR 5': CMPV h T; y número de constructo 1893, UTR 5': CMPV160+; ver el Ejemplo 14).
La FIGURA 4A muestra ejemplos de variantes de secuencias kozak de plantas ensayadas. Los constructos muestran una secuencia parcial de CPMVX+, una región reguladora de plantas, un fragmento de relleno y una secuencia de nucleótidos de interés (GOI). En este ejemplo no limitante, el constructo comprende una región reguladora 2X35S, CPMV 160+, un fragmento de relleno que comprende un sitio de clonación múltiple y una secuencia kozak de plantas (también se indica el extremo 5' de una secuencia de nucleótidos de interés: "ATG...GOI": donde la GOI es H3 A/Victoria/361). Las variantes de las secuencias kozak de plantas también se muestran debajo de la secuencia (ver también la Figura 9). Cada variante de secuencia kozak de plantas se fusionó al extremo 3' del fragmento de relleno y al sitio 5'-ATG de la secuencia de nucleótidos de interés (en estos ejemplos no limitantes, H3 A/Victoria/361). Los otros elementos de los constructos permanecieron iguales). La FIGURA 4B muestra los títulos de HA de una secuencia de nucleótidos de interés producida en plantas que comprende el constructo de expresión de CMPV160+ y una variante de secuencias kozak de plantas como se indica.
La FIGURA 5 muestra la expresión del anticuerpo rituximab (Rituxan) bajo el control de CPMV-HT (números de constructo 5001 y 5002, ver los ejemplos 15 y 16) o CPMV160 (números de constructo 2100 y 2109, ver el Ejemplo 15 y 16) y con ya sea su péptido señal nativo o el péptido señal nativo reemplazado con el péptido señal de proteína disulfuro isomerasa (PDl).
La FIGURA 6 muestra los componentes de secuencia usados para preparar el número de constructo 1391(A-2X35S CPMV-HT PDISP H3Victoria NOS; ver el Ejemplo 1). El número de constructo 1391 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H3 Victoria)). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 6A muestra la secuencia del cebador IF-PDI.S1=3c (SEQ ID NO: 67). La FIGURA 6B muestra la secuencia del cebador IF-H3V36111.s1-4r (SEQ ID NO: 17). La FIGURA 6C muestra la secuencia de PDISP/H3 Victoria (SEQ ID NO: 18). La FIGURA 6D muestra una representación esquemática del constructo 1191. La FIGURA 6E muestra el constructo 1191; de bordes de ADN-t izquierdo a derecho (subrayados), 2X35S CPMV-HT NOS, con casete de expresión del inhibidor de silenciamiento de plastocianina-P19-plastocianina; SEQ ID NO: 19). La FIGURA 6F muestra el casete de expresión número 1391 desde el promotor 2X35S hasta el terminador NOS. La secuencia de nucleótidos de PDISP/H3 Victoria está subrayada; la UTR 5' del CPMV en negrita; la proteína M incompleta en cursiva (SEQ ID NO: 20). La FIGURA 6G muestra la secuencia de aminoácidos de PDISP/H3 Victoria (SEQ ID NO: 21). La FIGURA 6h muestra una representación esquemática del número de constructo 1391 (un constructo de referencia).
La FIGURA 7 muestra los componentes de secuencia usados para preparar el número de constructo 1800 (A-2X35S CPMV160+ PDISP H3Victoria NOS; ver el ejemplo 2). El número de constructo 1800 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 7A muestra la secuencia del cebador IF**(SacII)-PDI.s1+4c (SEQ ID NO: 22). La FIGURA 7B muestra la secuencia del cebador IF-H3V3611 1.s1-4r (SEQ ID NO: 23). La secuencia de PDISP/H3 Victoria se muestra en la Figura 6C (SEQ ID NO: 18). La FIGURA 7C muestra una representación esquemática del constructo 2171 (se indican los sitios de enzimas de restricción SacII y StuI usados para la linealización del plásmido). La FIGURA 7D muestra el constructo 2171 de bordes de ADN-t izquierdo a derecho (subrayados), 2X35S/CPMV160+/NOS con casete de expresión del inhibidor de silenciamiento de plastocianina-P19-plastocianina, una cola citoplasmática transmembrana de H1 California y la UTR 3' del CPMV (SEQ ID NO: 25). La FIGURA 7E muestra el casete de expresión número 1800 desde el promotor 2X35S hasta el terminador NOS. La secuencia de nucleótidos de PDISP/H3 Victoria está subrayada; la UTR 5' se muestra en negrita; la secuencia kozak de plantas está subrayada doble; un fragmento de relleno (sitio de clonación múltiple) de 16 pares de bases está ubicado entre la UTR 5' y la secuencia kozak de plantas (SEQ ID NO: 26). La secuencia de aminoácidos de PDISP/H3 Victoria se muestra en la Figura 6G (SEQ ID NO: 27). La FIGURA 7F muestra una representación esquemática del número de constructo 1800 (un constructo basado en CPMVX+, donde X=160).
La FIGURA 8 muestra los componentes de secuencia usados para preparar el número de constructo 1935 (2X35S/CPMV160/PDISP/H3 Victoria/NOS; ver el ejemplo 3). El número de constructo 1935 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, y no incluye un fragmento de relleno (sitio de clonación múltiple) o una secuencia kozak de plantas (este constructo tampoco comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160 (CPMVX, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 8A muestra la secuencia del cebador IF-CPMV(fl5'UTR)_SpPDI.c (SEQ ID NO: 28). La FIGURA 8B muestra una representación esquemática del constructo 1190. La FIGURA 8C muestra la secuencia de ácido nucleico del constructo 1190 de bordes de ADN-t izquierdo a derecho (subrayados), 2X35S/CPMV160/NOS con casete de expresión del inhibidor de silenciamiento de plastocianina-P19-plastocianina y una UTR 3' del CPMV (SEQ ID NO: 29). La FIGURA 8D muestra el casete de expresión número 1935 desde el promotor 2X35S hasta el terminador NOS. La secuencia de nucleótidos de PDISP/H3 Victoria está subrayada, la UTR 5' se muestra en negrita (SEQ ID NO: 30). Este casete no incluye una secuencia kozak de plantas o un fragmento de relleno (sitio de clonación múltiple). La FIGURA 8E muestra una representación esquemática del número de constructo 1935 (un constructo basado en CPMVX, donde X=160).
La FIGURA 9 muestra secuencias que comprenden variaciones en una secuencia kozak de plantas usada para preparar una selección de constructos basados en "CPMV160+" (números de constructos 1992 a 1999). Se muestra la variación de secuencia entre el sitio de restricción SacII y ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV160+/NOS, que comprende variaciones en una secuencia kozak de plantas (las secuencias se muestran como variaciones de la secuencia correspondiente a partir del constructo 1800; ver el Ejemplo 4). La variante de secuencia kozak de plantas está subrayada. PDISP: péptido señal de proteína disulfuro isomerasa. La FIGURA 9A muestra la secuencia de nucleótidos de IF-HT1*(-Mprot)-PDI.c (SEQ ID NO: 31; usada para preparar el número de constructo 1992). La FIGURA 9B muestra la secuencia de nucleótidos de IF-HT2*(-Mprot)-PDI.c (SEQ ID NO: 32; usada para preparar el número de constructo 1993). La FIGURA 9C muestra la secuencia de nucleótidos de IF-HT3*(-Mprot)-PDI.c (SEQ ID NO: 33; usada para preparar el número de constructo 1994). La FIGURA 9D muestra la secuencia de nucleótidos de IF-HT4*(-Mprot)-PDI.c (SEQ ID NO: 34; usada para preparar el número de constructo 1995). La FIGURA 9E muestra la secuencia de nucleótidos de IF-HT5*(-Mprot)-PDI.c (SEQ ID NO: 35; usada para preparar el número de constructo 1996). La FIGURA 9F muestra la secuencia de nucleótidos de IF-HT6*(-Mprot)-PDI.c (SEQ ID NO: 36 usada para preparar el número de constructo 1997). La FIGURA 9G muestra la secuencia de nucleótidos de IF-HT7*(-Mprot)-PDI.c (SEQ ID NO: 37; usada para preparar el número de constructo 1998). La FIGURA 9H muestra la secuencia de nucleótidos de IF-HT8*(-Mprot)-PDI.c (SEQ ID NO: 38; usada para preparar el número de constructo 1999). La FIGURA 9I muestra una representación esquemática del número de constructo 1992 que comprende una secuencia kozak de plantas (Kozak1) mediante el uso de la SEQ ID NO: 31 (FIGURA 9A). Los constructos 1993-1999 comprenden las mismas características que el constructo 1992, excepto que cada constructo (1993-1999) comprende una secuencia kozak de plantas modificada (Kozak1) como se muestra en las Figuras 9B a 9H (SEQ ID NO: 32 a 38), respectivamente.
La FIGURA 10 muestra los componentes de secuencia usados para preparar los números de constructo 484 y 1897 (2X35S/CPMV HT PDISP/H1 California NOS y 2X35S/CPMV160+ PDISP/H1 California NOS, respectivamente; ver el Ejemplo 5). El número de constructo 484 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H1 California). El número de constructo 1897 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 10A muestra la secuencia de nucleótidos de PDISP/H1 California (SEQ ID NO: 39). La FiGu RA 10B muestra la secuencia de aminoácidos de PDISP/H1 California (SEQ ID NO: 40). La FIGURA 10C muestra una representación esquemática del número de constructo 484 (2X35S/CPMV HT; constructo de referencia). La FIGURA 10D muestra una representación esquemática del número de constructo 1897 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 11 muestra los componentes de secuencia usados para preparar los números de constructo 489, 1880 y 1885 (2X35S/CPMV HT H5 Indonesia NOS; CPMV160+ H5 Indonesia NOS y CPMV160 H5 Indonesia NOS, respectivamente; ver el Ejemplo 6). El número de constructo 489 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H1 California). El número de constructo 1880 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). El número de constructo 1885 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, y no incluye un fragmento de relleno (sitio de clonación múltiple) o una secuencia kozak de plantas (este constructo tampoco comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160 (CPMVX, donde X=160). NOS: terminador de nopalina sintasa. La Fig UrA 11A muestra la secuencia de nucleótidos de H5 Indonesia nativa (SEQ ID NO: 41). La FIGURA 11B muestra la secuencia de aminoácidos de H5 Indonesia nativa (SEQ ID NO: 42). La FIGURA 11C muestra una representación esquemática
del número de constructo 489 (2X35S/CPMV HT; constructo de referencia). La FIGURA 11D muestra una representación esquemática del número de constructo 1880 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160). La FIGURA 11E muestra una representación esquemática del número de constructo 1885 (2X35S/CPMV160; un constructo basado en CPMVX, donde X=160).
La FIGURA 12 muestra los componentes de secuencia usados para preparar los números de constructo 1240 y 2168 (2X35S/CPMV HT PDISP/H7 Hangzhou NOS y 2X35S/CPMV160+ PDISP/H7 Hangzhou NOS, respectivamente; ver el Ejemplo 7). El número de constructo 1240 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H7 Hangzhou). El número de constructo 1897 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 12A muestra la secuencia de nucleótidos de PDISP/H7 Hangzhou (SEQ ID NO: 43). La FlGuRA 12B muestra la secuencia de aminoácidos de PDISP/H7 Hangzhou (SEQ ID NO: 44). La FIGURA 12C muestra una representación esquemática del número de constructo 2140 (2X35S/CPMV HT; constructo de referencia). La FIGURA 12D muestra una representación esquemática del número de constructo 2168 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 13 muestra los componentes de secuencia usados para preparar los números de constructo 2130 y 2188 (2X35S/CPMV HT PDISP/H7 Hangzhou+H5 Indonesia TMCT NOS y 2X35S/CPMV160+ PDISP/H7 Hangzhou+H5 Indonesia TMCT NOS, respectivamente; ver el Ejemplo 8). El número de constructo 2130 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H7 Hangzhou+H5 Indonesia TMCT). El número de constructo 1897 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; TMCT: cola citoplasmática del dominio transmembrana. La FIGURA 13A muestra la secuencia de nucleótidos de PDISP/H7 Hangzhou+H5 Indonesia TMCT (SEQ ID NO: 45). La FIGURA 13B muestra la secuencia de aminoácidos de PDISP/H7 Hangzhou+H5 Indonesia TMCT (SEQ ID NO: 46). La FIGURA 13C muestra una representación esquemática del número de constructo 2130 (2X35S/CPMV HT; constructo de referencia). La FIGURA 13D muestra una representación esquemática del número de constructo 2188 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 14 muestra los componentes de secuencia usados para preparar los números de constructo 1039 y 1937 (2X35S/CPMV HT PDISP/HA B Brisbane (PrL-) NOS y 2X35S/CPMV160+ PDISP/HA B Brisbane (PrL-) NOS, respectivamente; ver el Ejemplo 9). El número de constructo 1039 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HA B Brisbane (PrL-)). El número de constructo 1937 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado. La FIGURA 14A muestra la secuencia de nucleótidos de PDISP/HA B Brisbane (PrL-) (SEQ ID NO: 47). La FIGURA 14B muestra la secuencia de aminoácidos de PDISP/HA B Brisbane (PrL-) (Se Q ID NO: 48). La FIGURA 14C muestra una representación esquemática del número de constructo 1039 (2X35S/CPMV h T; constructo de referencia). La FIGURA 14D muestra una representación esquemática del número de constructo 1937 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X = 160).
La FIGURA 15 muestra los componentes de secuencia usados para preparar los números de constructo 1067 y 1977 (2X35S/CPMV HT PDISP/HA B Brisbane (Prl-)+H1 California TMCT NOS y 2X35S/CPMV160+ PDISP/HA B Brisbane (PrL-)+H1 California TMCT NOS, respectivamente; ver el Ejemplo 10). El número de constructo 1067 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HA B Brisbane (PrL-)+H1 California TMCT). El número de constructo 1977 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La FIGURA 15A muestra la secuencia de nucleótidos de PDISP/HA B Brisbane (PrL-)+H1 California TMCT (SEQ ID NO: 49). La FIGURA 15B muestra la secuencia de aminoácidos de PDISP/HA B Brisbane (PrL-)+H1 California TMCT (s Eq ID NO: 50). La FIGURA 15C muestra una representación esquemática del número de constructo 1067 (2X35S/CPMV HT; constructo de referencia). La FIGURA
15D muestra una representación esquemática del número de constructo 1977 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 16 muestra los componentes de secuencia usados para preparar los números de constructo 2072 y 2050 (2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-) NOS y 2X35S/CPMV160+ PDISP/HA B Massachusetts (PrL-) NOS, respectivamente; ver el Ejemplo 11). El número de constructo 2072 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HA B Massachusetts (PrL-)). El número de constructo 2050 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia Kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado. La FIGURA 16A muestra la secuencia de nucleótidos de PDISP/Ha B Massachusetts (PrL-) (SEQ ID NO: 51). La FIGURA 16B muestra la secuencia de aminoácidos de PDISP/HA B Massachusetts (PrL-) (SEQ ID NO: 52). La FIGURA 16C muestra una representación esquemática del número de constructo 2072 (2X35S/CPMV HT; constructo de referencia). La FIGURA 16D muestra una representación esquemática del número de constructo 2050 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 17 muestra los componentes de secuencia usados para preparar los números de constructo 2074 y 2060 (2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS y 2X35S/CPMV160+ PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS, respectivamente; ver el Ejemplo 12). El número de constructo 2074 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT). El número de constructo 2060 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La FIGURA 17A muestra la secuencia de nucleótidos de PDISP/HA B Massachusetts (PrL-)+H1 California TMCT (SEQ ID NO: 53). La FIGURA 17B muestra la secuencia de aminoácidos de PDISP/HA B Massachusetts (PrL-)+H1 California TMCT (SeQ ID NO: 54). La FIGURA 17C muestra una representación esquemática del número de constructo 2074 (2X35S/CPMV HT; constructo de referencia). La FIGURA 17D muestra una representación esquemática del número de constructo 2060 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 18 muestra los componentes de secuencia usados para preparar los números de constructo 1445, 1820 y 1975 (2X35S/CPMV HT HA B Wisconsin (PrL-) NOS, 2X35S/CPMV160+ HA B Wisconsin (PrL-) NOS y 2X35S/CPMV160 HA B Wisconsin (PrL-) NOS, respectivamente; ver el Ejemplo 13). El número de constructo 1445 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (HA B Wisconsin (PrL-)). El número de constructo 1820 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). El número de constructo 1975 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, y no incluye un fragmento de relleno (sitio de clonación múltiple) o una secuencia kozak de plantas (este constructo tampoco comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en "CPMV160" (CPMVX). PrL-: bucle proteolítico eliminado; NOS: terminador de nopalina sintasa. La FIGURA 18A muestra la secuencia de nucleótidos de HA B Wisconsin (PrL-) (SEQ ID NO: 55). La FIGURA 18B muestra la secuencia de aminoácidos de HA B Wisconsin (PrL-) (SEQ ID NO: 56). La FIGURA 18C muestra una representación esquemática del número de constructo 1445 (2X35S/CPMV HT; constructo de referencia). La FIGURA 18D muestra una representación esquemática del número de constructo 1820 (2X35S/CPMV160+; un constructo basado en CPMVX+). La FIGURA 18E muestra una representación esquemática del número de constructo 1975 (2X35S/CPMV160; un constructo basado en CPMVX, donde X=160).
La FIGURA 19 muestra los componentes de secuencia usados para preparar los números de constructo 1454 y 1893 (2X35S/CPMV HT HA B Wisconsin (PrL-)+H1 California TMCT NOS y 2X35S/CPMV160+ HA B Wisconsin (PrL-)+H1 California TMCT NOS, respectivamente; ver el Ejemplo 14). El número de constructo 1454 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (HA B Wisconsin (PrL-)+H1 California TMCT). El número de constructo 1893 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La
FIGURA 19A muestra la secuencia de nucleótidos de HA B Wisconsin (PrL-)+H1 California TMCT (SEQ ID NO: 57). La FIGURA 19B muestra la secuencia de aminoácidos de PDISP/HA B Wisconsin (PrL-)+H1 California TMCT (Se Q ID NO: 58). La FIGURA 19C muestra una representación esquemática del número de constructo 1454 (2X35S/CPMV HT; constructo de referencia). La FIGURA 19D muestra una representación esquemática del número de constructo 1893 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 20 muestra los componentes de secuencia usados para preparar los números de constructo 5001 y 2100 (2X35S/CPMV HT HC rituximab (Rituxan) NOS y 2X35S/CPMV160+ h C rituximab (Rituxan) NOS, respectivamente; ver el Ejemplo 15). El número de constructo 5001 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (HC rituximab (Rituxan)). El número de constructo 2100 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). HC: cadena pesada; NOS: terminador de nopalina sintasa. La FIGURA 20A muestra la secuencia de nucleótidos de HC rituximab (Rituxan; SEQ ID NO: 59). La FIGURA 20B muestra la secuencia de aminoácidos de HC rituximab (Rituxan; SEQ ID NO: 60). La FIGURA 20C muestra una representación esquemática del número de constructo 5001 (2X35S/CPMV HT; constructo de referencia). La FIGURA 20D muestra una representación esquemática del número de constructo 2100 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 21 muestra los componentes de secuencia usados para preparar los números de constructo 5002 y 2109 (2X35S/CPMV HT PDISP/HC rituximab (Rituxan) NOS y 2X35S/CPMV160+ PDISP/HC rituximab (Rituxan) NOS, respectivamente; ver el Ejemplo 16). El número de constructo 5001 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HC Rituzan). El número de constructo 2100 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; HC: cadena pesada; NOS: terminador de nopalina sintasa. La FIGURA 2 lA muestra la secuencia de nucleótidos de PDISP/HC rituximab (Rituxan; SEQ ID NO: 61). La FIGURA 21B muestra la secuencia de aminoácidos de PDISP/HC rituximab (Rituxan; SEQ ID NO: 62). La FIGURA 21C muestra una representación esquemática del número de constructo 5002 (2X35S/CPMV HT; constructo de referencia). La FIGURA 21D muestra una representación esquemática del número de constructo 2109 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 22 muestra los componentes de secuencia usados para preparar los números de constructo 5021 y 2120 (2X35S/CPMV HT LC rituximab (Rituxan) NOS y 2X35S/CPMV160+ lC rituximab (Rituxan) NOS, respectivamente; ver el Ejemplo 17). El número de constructo 5021 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (LC rituximab (Rituxan)). El número de constructo 2120 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). LC: cadena ligera; NOS: terminador de nopalina sintasa. La FIGURA 22A muestra la secuencia de nucleótidos de LC rituximab (Rituxan; SEQ ID NO: 63). La FIGURA 22B muestra la secuencia de aminoácidos de LC rituximab (Rituxan; SEQ ID NO: 64). La FIGURA 22C muestra una representación esquemática del número de constructo 5021 (2X35S/CPMV HT; constructo de referencia). La FIGURA 22D muestra una representación esquemática del número de constructo 2120 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
La FIGURA 23 muestra los componentes de secuencia usados para preparar los números de constructo 5022 y 2129 (2X35S/CPMV HT PDISP/LC rituximab (Rituxan) NOS y 2X35S/CPMV160+ PDISP/LC rituximab (Rituxan) NOS, respectivamente; ver el Ejemplo 18). El número de constructo 5001 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/LC rituximab (Rituxan)). El número de constructo 2100 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; HC: cadena pesada; NOS: terminador de nopalina sintasa. La FIGURA 23A muestra la secuencia de nucleótidos de PDISP/LC rituximab (Rituxan; SEQ ID NO: 65). La FIGURA 23B muestra la secuencia de aminoácidos de PDISP/LC rituximab (Rituxan; SEQ ID NO: 66). La FIGURA 23C muestra una representación esquemática del número de constructo 5022 (2X35S/CPMV HT; constructo de referencia). La FIGURA 23D muestra una representación esquemática del número de constructo 2129 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).
Descripción detallada
La presente invención se refiere a la expresión de proteínas de interés en plantas. La presente invención también proporciona métodos y composiciones para la producción de proteínas de interés en plantas.
En la descripción que sigue, se usan ampliamente varios términos, se proporcionan las siguientes definiciones para facilitar la comprensión de diversos aspectos de la invención. El uso de ejemplos en la memoria descriptiva, que incluye ejemplos de términos, tiene únicamente propósitos ilustrativos y no pretende limitar el alcance y el significado de las modalidades de la presente invención.
Como se usa en la presente descripción, el uso de la palabra "un" o "una" cuando se usa en la presente descripción junto con el término "que comprende" puede significar "uno", pero también es coherente con el significado de "uno o más", "al menos uno" y "uno o más de uno". El término "aproximadamente" se refiere a una variación de aproximadamente /-10 % de un valor dado. El término "pluralidad" significa más de uno, por ejemplo, dos o más, tres o más, cuatro o más, y similares.
La presente descripción proporciona un potenciador de la expresión que comprende una región no traducida 5' (UTR) del CPMV, "CPMVX", que comprende X nucleótidos de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, o una secuencia que comprende entre 80 % a 100 % de similitud de secuencia con CPMVX, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1. Este potenciador de la expresión se denomina generalmente como CPMVX (ver la Figura 1A).
La secuencia potenciadora CPMVX puede fusionarse adicionalmente a una secuencia de relleno, en donde CMPVX comprende X nucleótidos de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, o una secuencia que comprende entre 80 a 100 % de similitud de secuencia con CPMVX, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, y la secuencia de relleno comprende de 1-100 nucleótidos fusionados al extremo 3' de la secuencia CMPVX. Por ejemplo, la secuencia de relleno puede comprender aproximadamente 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 nucleótidos, o cualquier número de nucleótidos entre ellos.
Si la secuencia CMPVX comprende un fragmento de relleno, entonces este potenciador de la expresión puede denominarse como CPMVX+ (ver la Figura 1A), donde X=160, 155, 150, 114 de la SEQ ID NO: 1, también puede denominarse como CMPVX que comprende una secuencia de relleno, o puede denominarse CPMV160+; CPMV155+; CPMV150+; CPMV114+, cuando X=160, 155, 150 o 114, respectivamente. Los constructos que comprenden CPMVX que no comprenden una secuencia de relleno pueden denominarse CPMVX+, donde X=160, 155, 150, 114 de la SEQ ID NO: 1, y donde la secuencia de relleno tiene 0 nucleótidos de longitud.
La secuencia de relleno puede modificarse por truncamiento, deleción o reemplazo de la secuencia nativa de UTR 5' del CMPV que está ubicada en dirección 3' con respecto al nucleótido 160. La secuencia de relleno modificada puede eliminarse, reemplazarse, truncarse o acortarse en comparación con la secuencia de relleno inicial o no modificada (es decir, nativa) asociada con la UTR 5' (como se describe en Sainsbury F., y Lomonossoff G.P., 2008, Plant Physiol.
148: págs. 1212-1218). La secuencia de relleno puede comprender uno o más sitios de restricción (polienlazador, sitio de clonación múltiple, uno o más sitios de clonación), una o más secuencias kozak de plantas, una o más secuencias enlazadoras, uno o más sitios de recombinación, o una combinación los mismos. Por ejemplo, que no debe considerarse limitante, una secuencia de relleno puede comprender en serie, un sitio de clonación múltiple de una longitud deseada, fusionado a una secuencia kozak de planta. La secuencia de relleno no comprende una secuencia de nucleótidos de la secuencia UTR 5' nativa que está ubicada en dirección 3' con respecto al nucleótido 160 de la UTR 5' nativa del CPMV, por ejemplo los nucleótidos 161 al 512 como se muestra en la Figura 1 de Sainsbury F. y Lomonossoff G.P. (2008, Plant Physiol. 148: págs. 1212-1218), o los nucleótidos 161-509 de la SEQ ID NO: 4. Es decir, la proteína M incompleta presente en la secuencia de CPMV HT de la técnica anterior (Figura 1; de Sainsbury F. y Lomonossoff G.P., 2008) se elimina de la UTR 5' en la presente invención.
El potenciador de la expresión CPMVX, o CPMVX+, puede unirse operativamente en el extremo 5' de la secuencia potenciadora con una región reguladora que está activa en una planta, y unirse operativamente a una secuencia de nucleótidos de interés en el extremo 3' del potenciador de la expresión (Figura 1A), para conducir la expresión de la secuencia de nucleótidos de interés dentro de una planta huésped.
También se proporcionan sistemas de expresión para producir una o más proteínas de interés en una planta mediante el uso de CMPVX o CPMVX+. Los sistemas de expresión descritos en la presente descripción comprenden un casete de expresión que comprende CPMVX, o una secuencia que comprende un 80 % de similitud de secuencia con CPMVX y, opcionalmente, una secuencia de relleno fusionada a CMPVX (CPMVX+). El casete de expresión que comprende CMPVX o CMPVX+, puede comprender además una región reguladora que está activa en una planta que está unida operativamente al extremo 5' del potenciador de la expresión. Una secuencia de nucleótidos de interés puede unirse operativamente al extremo 3' del casete de expresión de modo que cuando se introduce dentro de una planta, se logra la expresión de la secuencia de nucleótidos de interés dentro de una planta huésped.
También se proporcionan células vegetales, tejidos vegetales, plantas enteras, inóculos, ácidos nucleicos, constructos que comprenden secuencias de nucleótidos de interés que codifican proteínas de interés, casetes de expresión o sistemas de expresión que comprenden CPMVX o CPMVX+ como se describe en la presente descripción, y métodos para expresar una proteína de interés en plantas.
Con referencia a las Figuras 1A, 1B y 1C, se proporcionan ejemplos no limitantes de un potenciador de la expresión que comprende una secuencia UTR 5' del CPMV (CPMVX) que comprende nucleótidos de X de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1. El potenciador de la expresión CMPVX también puede denominarse como CPMV160; CPMV155; CPMV150; CPMV114, cuando X=160, 155, 150 o 114, respectivamente.
La secuencia de nucleótidos de interés puede fusionarse (unirse operativamente) a la secuencia potenciadora que comprende una región reguladora de plantas, mediante el uso de una diversidad de enfoques. Por ejemplo, que no deben considerarse limitantes:
1) Una secuencia de nucleótidos de interés que codifica una proteína de interés puede fusionarse al extremo 3' del potenciador de la expresión inmediatamente después de la secuencia UTR 5', por ejemplo CPMVX, donde X=160, 155, 150, 114 nucleótidos de la SEQ ID NO: 1. En este ejemplo, la secuencia de nucleótidos de interés está fusionada a la UTR 5' sin un sitio de clonación múltiple, y la secuencia de nucleótidos de interés puede incluir en su extremo 5' una secuencia kozak de plantas inmediatamente aguas arriba de un sitio de iniciación ATG de la secuencia de nucleótidos de interés (ver la Figura 1B). Si X=160 (es decir, CPMV160), entonces una secuencia de nucleótidos de interés que está unida operativamente a CPMV160 puede no requerir una secuencia kozak de plantas fusionada a su extremo 5', ya que los nucleótidos 150-160, o 155-160, de la SEQ ID NO: 1 comprenden una secuencia de tipo kozak. Sin embargo, puede incluirse una secuencia kozak de plantas en constructos que comprenden CPMV160 si se desea (ver la Figura 1B: "+/kozak de plantas"). Si es X=155, 150 o 114, se recomienda incluir una secuencia kozak de plantas que está fusionada al extremo 5' de la secuencia de nucleótidos de interés en los constructos que comprenden CPMV155, CPMV150 o CPMV114 para una expresión óptima de la secuencia de nucleótidos de interés.
2) La secuencia de nucleótidos de interés puede fusionarse a un potenciador de la expresión CMPVX+ (donde X=160, 155, 150, 114 de la SEQ ID NO: 1) que comprende una secuencia kozak de plantas en el extremo 3' del potenciador de la expresión, de modo que la secuencia de nucleótidos de interés está ubicada inmediatamente después de la secuencia kozak de plantas. En este ejemplo, la secuencia de nucleótidos de interés que está fusionada a CPMVX+ no incluiría un sitio de clonación múltiple o una secuencia kozak de plantas (el constructo resultante sería análogo a los que se presentan en la Figura 1B).
3) La secuencia de nucleótidos de interés puede fusionarse a un potenciador de la expresión CPMVX+ (donde X=160, 155, 150, 114 de la SEQ ID NO: 1), que comprende un sitio de clonación múltiple (MCS) en el extremo 3' del potenciador de la expresión, mediante el uso del sitio de clonación múltiple. En este ejemplo, la secuencia de nucleótidos de interés puede incluir en su extremo 5' una secuencia correspondiente para permitir la fusión con el sitio de clonación múltiple del potenciador de la expresión, y una secuencia kozak de plantas inmediatamente aguas arriba del sitio de iniciación ATG de la secuencia de nucleótidos de interés (ver la Figura 1C).
El resultado general mediante el uso de cualquiera de los métodos anteriores, es un constructo (o casete de expresión) que comprende una región reguladora de plantas en asociación operativa (unida operativamente) con una secuencia Ut R 5' del CPMV que comprende X nucleótidos, donde X=160, 155, 150, 114 de la SEQ ID NO: 1 (o una secuencia potenciadora que comprende un 80 % de similitud de secuencia con la secuencia UTR 5' de CPMV), el extremo 3' de la secuencia de UTR 5' del CPMV está fusionado al extremo 3' de una secuencia kozak de plantas, el extremo 3' de la secuencia kozak de plantas fusionado y adyacente al extremo 5' de la secuencia de nucleótidos de interés comprende una secuencia de iniciación ATG. El constructo puede comprender, o no, un sitio de clonación múltiple ubicado entre la UTR 5' y la secuencia kozak de plantas. El constructo puede comprender además una secuencia de la región no traducida 3' (UTR), por ejemplo, una UTR 3' de comovirus, o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo, un terminador NOS, unido operativamente al extremo 3' de la secuencia de nucleótidos de interés (ver la Figura 1A).
Se proporciona, además, un sistema de expresión en plantas que comprende un ácido nucleico que comprende una región reguladora, unida operativamente a uno o más de un potenciador de la expresión como se describe en la presente descripción (por ejemplo, CPMVX), y una secuencia de nucleótidos de interés. Además, se describe un ácido nucleico que comprende una secuencia promotora (región reguladora), unida operativamente a un potenciador de la expresión que comprende una UTR 5' del CPMV y una secuencia de relleno modificada o eliminada (por ejemplo, CPMVX+) y una secuencia de nucleótidos de interés. El ácido nucleico puede comprender además una secuencia que codifica una UTR 3', por ejemplo, una UTR 3' de comovirus, o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo, un terminador NOS, de modo que la secuencia de nucleótidos de interés está insertada aguas arriba a partir de la UTR 3'.
Por "unida operativamente" se entiende que las secuencias particulares interactúan ya sea directa o indirectamente para llevar a cabo una función prevista, tal como la mediación o la modulación de la expresión de una secuencia de
ácido nucleico. La interacción de secuencias unidas operativamente puede, por ejemplo, estar mediada por proteínas que interactúan con las secuencias unidas operativamente.
"Potenciador(es) de la expresión", "secuencia(s) potenciadora(s)" o "elemento(s) potenciador(es)", como se hace referencia en la presente descripción, incluyen secuencias derivadas de, o que comparten similitud de secuencia con, porciones de la UTR 5' del CPMv a partir del segmento del genoma de a RN-2. Una secuencia potenciadora puede potenciar la expresión de un marco abierto de lectura (ORF) heterólogo aguas abajo al que están unidos.
El término "UTR 5'" o "región no traducida 5'" o "secuencia líder 5'" se refiere a regiones de un ARNm que no están traducidas. La UTR 5' comienza típicamente en el sitio de inicio de la transcripción y termina justo antes del sitio de iniciación de la traducción o codón de inicio (generalmente AUG en un ARNm, ATG en una secuencia de ADN) de la región codificante. La longitud de la UTR 5' puede modificarse mediante mutación, por ejemplo, sustitución, deleción o inserción de la UTR 5'. La UTR 5' puede modificarse adicionalmente mediante la mutación de un codón de inicio natural o un sitio de iniciación de la traducción de modo que el codón ya no funcione como codón de inicio y la traducción pueda iniciarse en un sitio de inicio alternativo.
La UTR 5' de los nucleótidos 1-160 de la secuencia del ARN-2 del CPMV (SEQ ID NO: 1), comienza en el sitio de inicio de la transcripción hasta el primer codón de iniciación en marco (en la posición 161), que sirve como el sitio de iniciación para la producción de la más larga de dos proteínas carboxi coterminales codificadas por un segmento de genoma de comovirus de tipo silvestre. Además, un “tercer” sitio de iniciación en (o correspondiente a) la posición 115 en la secuencia genómica de ARN-2 del CPMV también puede estar mutado, eliminado o alterado de cualquier otra manera. Se ha demostrado que la eliminación de AUG 115 además de la eliminación de AUG 161 mejora la expresión cuando se combina con una proteína M incompleta (Sainsbury y Lomonossoff, 2008, Plant Physiology; 148: 1212-1218; documento WO 2009/087391).
El potenciador de la expresión puede comprender una región no traducida (UTR) 5' del CPMV que comprende nucleótidos de X de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1 (CPMVX), o una secuencia que comprende 80 % de similitud de secuencia con CPMVX (donde X=160, 155, 150 o 114 de la SEQ ID NO: 1; ver las Figuras 1A y 1B) y exhibe la propiedad de mejorar la expresión de una secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo que está unido operativamente al potenciador de la expresión, en comparación con la expresión de la misma secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo unido operativamente a la secuencia potenciadora de CPMV HT de la técnica anterior que comprende una proteína M incompleta (como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218).
La secuencia potenciadora CPMVX también puede fusionarse a una secuencia de relleno, por ejemplo, un sitio de clonación múltiple (MCS), o un MCS unido a una secuencia kozak de plantas, en donde el CMPVx comprende nucleótidos de X de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, o una secuencia que comprende un 80 % de similitud de secuencia con CPMVX (donde X=160, 155, 150 o 114 de la SEQ ID NO: 1), y exhibe la propiedad de mejorar la expresión de la secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo unido operativamente al potenciador de la expresión, en comparación con la expresión de la misma secuencia que codifica un marco abierto de lectura heterólogo unido operativamente a la secuencia potenciadora CPMV HT de la técnica anterior que comprende una proteína M incompleta (como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218). La secuencia de relleno comprende de 0-500 nucleótidos fusionados al extremo 3' de la secuencia CMPVX. Preferentemente, la secuencia de relleno comprende un sitio de clonación múltiple (MCS), o un MCS unido a una secuencia kozak de plantas, y no incluye una proteína M. Si la secuencia CMPVX comprende un fragmento de relleno (sin una proteína M), entonces este potenciador de la expresión puede denominarse como "CPMVX+" (ver las Figuras 1A y 1C), como "CMPVX que comprende una secuencia de relleno y una secuencia kozak de plantas", o como "CMPVX que comprende un MCS junto con una secuencia kozak de plantas".
El potenciador de la expresión CPMVX, donde X=160, consiste en los nucleótidos 1-160 de la SEQ ID NO: 1:
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgcgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca (SSQ ID NO:l)
Si el potenciador de la expresión consiste en el nucleótido 1-160 de la SEQ ID NO: 1 (CPMV160), entonces una secuencia de nucleótidos de interés con o sin una secuencia kozak de plantas 5' ubicada en el extremo 5' adyacente a una secuencia de iniciación (ATG), puede fusionarse al extremo 3' de la UTR 5' (después del nucleótido 160 de la SEQ ID NO: 1), de modo que el constructo general se asemeja al que se muestra en la Figura 1B (CPMV160). El constructo que comprende CPMV160 puede comprender además una región reguladora unida operativamente al extremo 5' del potenciador de la expresión y una secuencia que codifica una UTR 3', por ejemplo una región no traducida (UTR) 3' de comovirus o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo un terminador NOS, fusionada al
extremo 3' de la secuencia de nucleótidos de interés. Sin desear limitarse por la teoría, CPMV160 puede no requerir la adición de una secuencia kozak de plantas al extremo 5' de la secuencia de nucleótidos de interés, ya que la secuencia en las posiciones 150-155, 155-160 o 150-160 de la SEQ ID NO: 1 puede funcionar como una secuencia kozak activa (nativa) en una planta. El número de constructo 1935 (ver el Ejemplo 3) y el número de constructo 1885 (ver el Ejemplo 6) son ejemplos de constructos basados en CPMV160 (Cp Mv X, donde X=160).
El potenciador de la expresión puede comprender CPMVX+, donde X=160. Un ejemplo no limitante de tal potenciador es CPMV160+ (ver la Figura 1C) que comprende la secuencia de SEQ ID NO: 2 (Ut R 5': nucleótido 1-160; sitio de clonación múltiple en cursiva nucleótidos 161-176; secuencia kozak de plantas en mayúsculas y negrita, nucleótidos 177-181):
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca gggcccaata ccgcggAGAA
181 A (SEQ ID NO:2)
Los ejemplos de constructos mediante el uso de la SEQ ID NO: 2 como un potenciador de la expresión incluyen los constructos 1800, 1897, 1880, 2168, 2188, 1937, 1977, 2050, 2060, 1975, 1893, 2100, 2109, 2120, 2129 (ver los Ejemplos 3 y 5-18, respectivamente).
Como sería evidente para un experto en la técnica, puede usarse cualquier sitio de clonación múltiple (MCS) o un MCS de diferente longitud (ya sea más corto o más largo) en lugar de la secuencia en los nucleótidos 161-176 de la SEQ ID NO: 2. Además, la secuencia kozak de plantas de SEQ ID NO: 2 (mostrada en los nucleótidos 177-181) puede ser cualquier secuencia kozak de plantas, que incluye, pero no se limita a, una de las secuencias seleccionadas de las SEQ ID NO: 5-17 (ver también la Figura 4A; el constructo de la Figura 4 incluye la SEQ ID NO: 2, con variaciones de la secuencia kozak de plantas como se indica, y comprende una región reguladora de plantas unida al extremo 5' de la UTR 5', y el sitio de iniciación de la transcripción, ATG, de una secuencia de nucleótidos de interés, ubicada en dirección 3' con respecto a la secuencia kozak de plantas).
El potenciador de la expresión CPMVX, puede incluir una "A" en la posición 115 (115A), de modo que CMPVX, 115A, donde X=160, 155 o 150, comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (ver el documento WO 2009/087391, para la secuencia completa del segmento del genoma del ARN2 del CPMV de tipo silvestre). Un ejemplo de un potenciador de la expresión CPMVX, 115A es "CPMV 160, 115A", como se define en la SEQ ID n O: 69 (la "A" se muestra en negrita y subrayada):
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca (SEQ ID NO:69)
El potenciador de la expresión CPMVX+, también puede incluir una "A" en la posición 115 (115A), de modo que CMPVX+, 115A, donde X=160, 155 o 150, comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (documento WO 2009/087391). Un ejemplo no limitante de un potenciador de la expresión CPMVX+, 115A es "CPMV 160+, 115A", como se define en la SEQ ID NO: 75 (la "A" se muestra en negrita y subrayado):
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca gggcccaata ccgcggAGAA
181 A (SEQ ID NO:75)
Como se indicó anteriormente para la SEQ ID NO: 2, puede usarse cualquier MCS, o un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 75, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.
Si el potenciador de la expresión consiste en los nucleótidos 1-155 de la SEQ ID NO: 1 (CPMV155):
g IiaiIIiaaaSIIC ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttgtcagat cgtgcttcgg cacea (SEQ ID NO:24),
entonces una secuencia de nucleótidos de interés con una secuencia kozak de plantas ubicada en el extremo 5', adyacente a una secuencia de iniciación (ATG), puede fusionarse al extremo 3' de la UTR 5' (después del nucleótido 155 de la SEQ ID NO: 1), de modo que el constructo general se asemeja al que se muestra en la Figura 1B (CPMV155). El constructo que comprende CPMV155 puede comprender además una región reguladora unida operativamente al extremo 5' del potenciador de la expresión y una secuencia que codifica una UTR 3', por ejemplo una región no traducida 3' (UTR) de comovirus o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo un terminador NOS, fusionada al extremo 3' de la secuencia de nucleótidos de interés. En este ejemplo, la secuencia de nucleótidos de interés comprende una secuencia kozak de plantas en su extremo 5', ya que está eliminada la secuencia kozak nativa o una porción de esta secuencia (nucleótidos 155-160 de la SEQ ID NO: 1).
El potenciador de la expresión puede comprender CPMV155+, que comprende la secuencia de SEQ ID NO: 72 (UTR 5': nucleótido 1-155; sitio de clonación múltiple en cursiva nucleótidos 156-171; secuencia kozak de plantas en mayúsculas y negrita, nucleótidos 172-176):
1 tattaaaatc TI.TIaataggCC TltgaTiaaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caceagggcc caataccgcg ctAGAAA
(SEQ ID NO:72)
Como se indicó anteriormente para CPMV160+ (SEQ ID NO: 2), puede usarse cualquier MCS, que incluye un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 72, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.
El potenciador de la expresión CPMV155, puede incluir una "A" en la posición 115 (115A), de modo que "CMPV155, 115a " comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (ver el documento WO 2009/087391), como se define por la SEQ ID NO: 70 ("A" está en negrita y subrayada):
J- 17 cL t 17aaaa 1-C 1717a a 1.a g gi71 t x g a t a a a a g Cg a a c g t g g g g a a a C C C gaa CCclclclCC11.C
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc
121 gatcttcaac gttgtcagat cgtgcttcgg cacea (SEQ ID NO:70)
El potenciador de la expresión CPMV155+, también puede incluir una "A" en la posición 115 (115A), de modo que "CMPV155+, 115a" comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (documento Wo 2009/087391), como se define por la SEQ ID NO: 76 (la "A" se muestra en negrita y subrayada):
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caceagggcc caataccgcg gAGAA
181 A (SEQ ID NO:76)
Como se indicó anteriormente para SEQ ID NO: 2, puede usarse cualquier MCS, o un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 76, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.
Si el potenciador de la expresión consiste en los nucleótidos 1-150 de la SEQ ID NO: 1 (CPMV150):
1 Cel1.tcLcL3.3tC ttaataggtt ttgSXciclclclCJ cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttgtcagat cgtgcttcgg (SEQ ID NO:;27),
entonces una secuencia de nucleótidos de interés con una secuencia kozak de plantas ubicada en el extremo 5', adyacente a una secuencia de iniciación (ATG), puede fusionarse al extremo 3' de la UTR 5' (después del nucleótido 150 de la SEQ ID NO: 1), de modo que el constructo general se asemeja al que se muestra en la Figura 1B (CPMV150). El constructo que comprende CPMV150 puede comprender además una región reguladora unida operativamente al extremo 5' del potenciador de la expresión y una secuencia que codifica una UTR 3', por ejemplo una región no traducida (UTR) 3' de comovirus o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo, un terminador NOS, fusionada al extremo 3' de la secuencia de nucleótidos de interés. En este ejemplo, la secuencia de nucleótidos de interés comprende una secuencia kozak de plantas en su extremo 5', ya que está eliminada la secuencia kozak nativa en la posición 150-160 de la SEQ ID NO: 1.
El potenciador de la expresión puede comprender CPMV150+, que comprende la secuencia de SEQ ID NO: 73 (UTR 5': nucleótido 1-150; sitio de clonación múltiple en cursiva, nucleótidos 156-166; secuencia kozak de plantas en mayúsculas y negrita, nucleótidos 167-171):
1 t a11 aa aat c 11 aa t ag g11 t a.gat a aa ag cg aa cg t ggg g aa acc cg aa ccaaa c ca t a
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttgtcagat cgtgcttcgg gggcccaata ccgcggAGAA A
(SEQ ID N O ;73)
Como se indicó anteriormente para CPMV160+ (SEQ ID NO: 2), puede usarse cualquier MCS, lo que incluye un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 73, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.
El potenciador de la expresión CPMV150, puede incluir una "A" en la posición 115 (115A), de modo que "CMPV150, 115A" comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (ver documento w O 2009/087391) como se define por la SEQ ID NO: 71 (la "A" se muestra en negrita y subrayada):
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc
121 gatcttcaac gttgtcagat cgtgcttcgg (SEQ ID NO:71)
El potenciador de la expresión CPMV150+, también puede incluir una "A" en la posición 115 (115A), de modo que "CMPV150+, 115A" comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (documento Wo 2009/087391), como se define por la SEQ ID NO: 77 (la "A" se muestra en negrita y subrayada):
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc
121 gatcttcaac gttgtcagat cgtgcttcgg gggcccaata ccgcggRGAA
181 A (SEQ ID NO:77)
Como se indicó anteriormente para la SEQ ID NO: 2, puede usarse cualquier MCS, o un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 77, y la secuencia Kozak de plantas puede ser cualquier secuencia kozak de plantas.
Si el potenciador de la expresión consiste en los nucleótidos 1-114 de la SEQ ID NO: 1:
entonces una secuencia de nucleótidos de interés con una secuencia kozak de plantas ubicada en el extremo 5', adyacente a una secuencia de iniciación (ATG), puede fusionarse al extremo 3' de la UTR 5' (después del nucleótido 114 de la SEQ ID NO: 1), de modo que el constructo general se asemeja al que se muestra en la Figura 1B (CPMV114). El constructo que comprende CPMV1114 puede comprender además una región reguladora unida operativamente al extremo 5' del potenciador de la expresión y una secuencia que codifica una UTR 3', por ejemplo una región no traducida (UTR) 3' de comovirus o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo un terminador NOS, fusionada al extremo 3' de la secuencia de nucleótidos de interés. En este ejemplo, la secuencia de nucleótidos de interés comprende una secuencia kozak de plantas en su extremo 5', ya que existe una secuencia de tipo kozak en dirección 5' con respecto al nucleótido 114 de la SEQ ID NO: 1.
El potenciador de la expresión puede comprender CPMV114+, que comprende la secuencia de SEQ ID NO: 74 (UTR 5': nucleótido 1-114; sitio de clonación múltiple en cursiva, nucleótidos 115-130; secuencia kozak de plantas en mayúsculas y negrita, nucleótidos 131-135):
1 2 a a t ac c gc gg AGAAA
(SEQ ID NO:74)
Como se indicó anteriormente para CPMV160+ (SEQ ID NO: 2), puede usarse cualquier MCS, lo que incluye un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 73, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.
El potenciador de la expresión también puede comprender los nucleótidos 1-160 de la SEQ ID NO: 1, fusionado con una secuencia kozak de plantas ubicada aguas abajo a partir de la posición 160 de la SEQ ID NO: 1. La secuencia kozak de plantas puede ubicarse inmediatamente adyacente al nucleótido 160 de la SEQ ID NO: 1, o el potenciador de la expresión puede comprender un fragmento de relleno de aproximadamente 0 a aproximadamente 500 nucleótidos, o cualquier cantidad entre ellos, ubicado inmediatamente adyacente al nucleótido 160 de la SEQ ID NO: 1 (CPMVX+) y la secuencia kozak de plantas unida al extremo 3' del fragmento de relleno. El fragmento de relleno puede comprender un sitio de clonación múltiple (MCS) de aproximadamente 4 a 100 nucleótidos o cualquier cantidad entre ellos, y una secuencia de nucleótidos de interés que comprende una secuencia kozak de plantas y un sitio de clonación correspondiente en su extremo 5' puede unirse operativamente al potenciador de la expresión de CMPVX mediante el uso de MCS, o el fragmento de relleno puede comprender un sitio de clonación múltiple de aproximadamente 4 a 100 nucleótidos fusionados a una secuencia kozak de plantas, y una secuencia de nucleótidos de interés puede fusionarse al potenciador de la expresión inmediatamente aguas abajo de la secuencia kozak de plantas. Preferentemente, el fragmento de relleno no comprende una secuencia que codifica una proteína M.
Un ejemplo, que no debe considerarse limitante, de un constructo, que comprende en serie, una región reguladora de plantas fusionada a una UTR 5' de CPMV que consiste en los nucleótidos 1-160 de la SEQ ID NO: 1, que está fusionada a un fragmento de relleno es CPMV160+ como se muestra en la Figura 1C (en la Figura 1C, el sitio de inicio ATG de la secuencia de nucleótidos de interés "GOI", también se muestra para mayor claridad). En este ejemplo, el fragmento de relleno está fusionado al extremo 3' de la secuencia CPMV 1-160 y comprende, en serie, un sitio de clonación múltiple fusionado a una secuencia kozak de plantas (en este ejemplo, que no debe considerarse limitante, la secuencia kozak de plantas es: AGAAA). El fragmento de relleno no comprende ninguna secuencia que codifica una proteína M. Si el constructo CPMV 160+ está fusionado a una secuencia de nucleótidos de interés (como se muestra en la Figura 1C), entonces la secuencia kozak de plantas está ubicada en dirección 5' con respecto a la secuencia de nucleótidos de interés, y adyacente al sitio de iniciación ATG de la secuencia de nucleótidos de interés. Como apreciará un experto en la técnica, el sitio de clonación múltiple puede comprender uno o más de un sitio de restricción adecuado, y la secuencia del sitio de clonación múltiple no está limitada al ejemplo mostrado en la Figura 1C. Además, la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas y no se limita a la secuencia mostrada en la Figura 1C. Los números de constructo 1800, 1897, 1880, 2168, 2188, 1937, 1977, 2050, 2060, 1975, 1893, 2100, 2109, 2120, 2129 (ver los Ejemplos 3 y 5-18, respectivamente) son ejemplos de constructos basados en CPMV160+ (CPMVX+, donde X=160).
También se muestran en la Figura 1C ejemplos de potenciadores de la expresión CPMV155+, CPMV150+ y CPMV114+, cada uno de los cuales comprende los nucleótidos 1-155, 1-150 o 1-114 de la SEQ ID NO: 1, respectivamente, fusionados a un fragmento de relleno de manera similar al descrito para CPMV160+, arriba. En la Figura 1C, el sitio de inicio ATG de la secuencia de nucleótidos de interés (GOI) también se muestra para cada CPMV155+, CPMV150+ y CPMV 114+. En estos ejemplos, el fragmento de relleno está fusionado al extremo 3' de la secuencia potenciadora de CPMV que comprende, en serie, un sitio de clonación múltiple fusionado a una secuencia kozak de plantas. El fragmento de relleno no comprende ninguna secuencia que codifica una proteína M. Como apreciará un experto en la técnica, el sitio de clonación múltiple puede comprender uno o más de un sitio de restricción adecuado, y la secuencia del sitio de clonación múltiple no está limitada a los ejemplos mostrados en la Figura 1C. Además, la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas y no está limitada a la secuencia mostrada en la Figura 1C (AGAAA).
El potenciador de la expresión también puede comprender el potenciador de la expresión CPMVX, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, en combinación con un sitio de clonación múltiple (polienlazador, sitio de restricción; sitio de clonación) fusionado al extremo 3' de la secuencia UTR 5', y que carece de una secuencia kozak de plantas (es decir, CPMVX+, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1). En estos casos, la secuencia de ácido nucleico que codifica una proteína de interés (secuencia de nucleótidos de interés) que se unirá al potenciador, comprenderá, en serie desde el extremo 5' al extremo 3' de la secuencia de nucleótidos de interés, un sitio de clonación múltiple (complementario con el fragmento de relleno; el fragmento de relleno no comprende ninguna secuencia que codifica una proteína M) fusionado a una secuencia kozak de plantas ubicada aguas arriba y adyacente a un sitio de iniciación ATG (sitio de inicio de la transcripción) de la secuencia de nucleótidos de interés.
El potenciador de la expresión puede comprender además una o más "secuencia consenso kozak" o "secuencia kozak". Las secuencias kozak juegan un papel importante en la iniciación de la traducción. La tasa de traducción puede optimizarse al asegurar que cualquier secuencia de inestabilidad de ARNm se elimine del constructo transgénico y que el sitio de inicio de la traducción o el sitio de iniciación coincida con el consenso Kozak para plantas (Gutierrrez, R.A. y otros, 1999, Trends Plant Sci. 4, 429-438; Kawaguchi, R. y Bailey-Serres, J., 2002, Curr. Opin. Plant Biol. 5, 460-465). La posición más altamente conservada en este motivo es la purina (que es más a menudo una A) tres nucleótidos aguas arriba del codón ATG, lo que indica el inicio de la traducción (Kozak, M., 1987, J. Mol. Biol. 20: 947-950). Las secuencias consenso Kozak en plantas se conocen en la técnica (ver, por ejemplo, Rangan y otros, Mol. Biotechnol., 2008, julio 39(3), págs. 207-213). Tanto las secuencias Kozak sintéticas como las naturales pueden usarse en el potenciador de la expresión o pueden fusionarse a la secuencia de nucleótidos de interés como se describe en la presente descripción.
La secuencia kozak de plantas puede ser cualquier secuencia kozak conocida de plantas (ver, por ejemplo, L. Rangan y otros, Mol. Biotechnol., 2008, julio 39(3), pp. 207-213), que incluye, pero no se limita a, las siguientes secuencias consenso de plantas:
caA(A/C)a (SEQ ID NO: 5; reino vegetal)
aaA(A/C)a (SEQ ID NO: 6; dicotiledóneas)
aa(A/G)(A/C)a (SEQ ID NO: 7; arabidopsis)
La secuencia kozak de plantas también puede seleccionarse del grupo de (ver la Figura 4):
AGAAA (SEQ ID NO: 8)
AGACA (SEQ ID NO: 9)
AGGAA (SEQ ID NO: 10)
AAAAA (SEQ ID NO: 11)
AAACA (SEQ ID NO: 12)
AAGCA (SEQ ID NO: 13)
AAGAA (SEQ ID NO: 14)
AAAGAA (SEQ ID NO: 15)
AAAGAA (SEQ ID NO: 16)
(A/-)A(A/G)(A/G)(A/C)A. (SEQ ID NO: 3; Secuencia consenso)
El potenciador de la expresión puede comprender además uno o más "sitio(s) de restricción" o "sitio(s) de reconocimiento de restricción", "sitio(s) de clonación múltiple", "MCS", "sitio(s) de clonación" "secuencia polienlazadora" o "polienlazador" para facilitar la inserción del nucleótido de interés en el sistema de expresión en plantas. Los sitios de restricción son motivos de secuencia específicos que son reconocidos por enzimas de restricción como se conoce bien en la técnica. El potenciador de la expresión puede comprender uno o más sitios de restricción o sitios de clonación que se ubican aguas abajo (3') de la UTR 5'. El uno o más sitios de restricción o sitios de clonación pueden ubicarse además aguas arriba (5') de una o más secuencias kozak, y ubicarse entre una UTR 5' y una secuencia kozak. La secuencia polienlazadora (sitio de clonación múltiple) puede comprender cualquier secuencia de
ácidos nucleicos que sea útil para añadir y eliminar secuencias de ácidos nucleicos, lo que incluye una secuencia de nucleótidos que codifica una proteína de interés, en el extremo 3' de la UTR 5'. Una secuencia polienlazadora puede comprender de 4 a aproximadamente 100 ácidos nucleicos, o cualquier cantidad entre ellos.
El potenciador de la expresión también puede comprender la secuencia de SEQ ID NO: 1 en asociación operativa con una región reguladora de plantas y un sitio de inicio de la transcripción (ATG) fusionado a una secuencia de nucleótidos de interés (GOI), como se muestra en la Figura 1B (CPMVX; donde X=160, 155, 150 o 114). CPMVX también puede comprender cualquier secuencia kozak de plantas que incluye, pero no se limita a, una de las secuencias de las s Eq ID NO: 5-17.
La UTR 5' para su uso en el potenciador de la expresión descrito en la presente descripción (CPMVX o CPMVX+, donde X=160, 155, 150 o 144), puede derivarse a partir de un virus de a Rn bipartito, por ejemplo, del segmento del genoma de ARN-2 de un virus de ARN bipartito, tal como un comovirus, siempre que muestre 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1 y 2. Por ejemplo, la secuencia potenciadora puede tener de aproximadamente 80 % a aproximadamente 100 % de identidad con la secuencia de las SEQ ID NO: 1 y 2, o cualquier cantidad intermedia, de aproximadamente 90 % a aproximadamente 100 % de identidad con la secuencia de las SEQ ID NO: 1 y 2, o cualquier cantidad intermedia, aproximadamente 95 % a aproximadamente 100 %, de identidad con la secuencia de SEQ ID NO: 1 y 2, o cualquier cantidad intermedia, o aproximadamente 98 % a aproximadamente 100 %, de identidad con la secuencia de SEQ ID NO: 1 y 2, o cualquier cantidad intermedia, en donde el potenciador de la expresión, cuando está unido operativamente a una región reguladora de plantas y una secuencia kozak de plantas como se describe en la presente descripción, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que está unida operativamente al potenciador de la expresión cuando se compara con el nivel de expresión de la secuencia de nucleótidos de interés fusionada al CMPV HT (SEQ ID NO: 4; secuencia potenciadora de la técnica anterior que comprende una proteína M incompleta como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218) mediante el uso de la misma región reguladora de plantas.
La SEQ ID NO: 4 comprende un potenciador de la expresión CPMV HT como se conoce en la técnica anterior (por ejemplo, la Figura 1 de Sainsbury y Lomonossoff 2008, Plant Physiol. 148: págs. 1212-1218). El "CPMV HT" incluye la secuencia UTR 5' de los nucleótidos 1-160 de la SEQ ID NO: 4 con nucleótidos modificados en las posiciones 115 (cgt) y 162 (acg), y una proteína M incompleta, y carece de una secuencia kozak de plantas (UTR 5': nucleótidos 1-160; proteína M incompleta subrayada, nucleótidos 161-509). La SEQ ID NO: 4 incluye, además, un sitio de clonación múltiple (cursiva, nucleótidos 510-528) que no está presente en la secuencia de CPMV HT de la técnica anterior:
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttqtcaqat cqtqcttcqq caccagtaca acqrttttctt tcactqaaqc
181 gaaatcaaag atctctttqt qqacacqtaq tqcqqcqcca l.1.aaa "caacq tqtacttqtc
241 ctattcttgt cqqtqtqqtc ttqqqaaaaq aaaqcttqct qqaqqctqct qttcaqcccc
301 atacattact tqttacqatt ctqctqactt tcqqcqqqtq caatatctct acttctqctt
361 qacqaqqtat tqttqcctqt acttctttct tcttcttctt qctqattqqt t e Laraaqaa
421 atctagtatt ttctttqaaa cagaqttttc ccqtqqtttt cgaacttqqa qaaaqattqt
481 taagcttctg tatattctqc ccaaatttgt cgqgccc SEQ ID NO: 4
Los constructos que comprenden CPMV HT se usan en la presente descripción como constructos de referencia, de modo que pueden compararse los niveles de expresión de una secuencia de nucleótidos de interés, o un producto codificado por la secuencia de nucleótidos de interés producida mediante el uso de un constructo que comprende CPMVX o CPMVX+. Los constructos 1391, 484, 489, 2140, 2130, 1039, 1067, 2072, 2074, 1445, 1454, 5001, 5002, 5021 y 5022 (ver los Ejemplos 1 y 5-18, respectivamente) comprenden el constructo de referencia CPMV HT.
Como se muestra en las Figuras 2-5, el uso de los potenciadores de la expresión como se describe en la presente descripción da como resultado un aumento de la expresión de la secuencia de nucleótidos de interés, cuando se compara con la expresión de la misma secuencia de nucleótidos de interés mediante el uso del mismo promotor y las secuencias de UTR 3' y terminadoras. Por ejemplo, con referencia a las Figuras 2, 3 y 5, se muestra una comparación
de la expresión de las proteínas producidas en plantas que comprenden constructos de expresión de CPMV-HT (técnica anterior) y constructos de expresión basados en CPMV160+, unidos operativamente con:
H1 A/California/07/2009 ("PDI-H1 Cal", o "H1 A/California/07/2009"): número de constructo 1897 basado en CPMV160+, número de constructo 484 basado en CPMV HT número (ver el Ejemplo 5);
H3 A/Victoria/361/2011 ("PDI-H3 Vic" o "H3 A/Victoria/361/2011"): número de constructo 1800 basado en CPMV160+; número de constructo 1391 basado en CPMV HT (ver los Ejemplos 1 y 2, respectivamente); H5 de Influenza A/Indonesia/5/2005 con un péptido señal nativo (WtSp-H5 Indo): número de constructo 1880 basado en CPMV160+; número de constructo 489 basado en CPMV HT (ver el Ejemplo 6);
B/Wisconsin/1/2010 con bucle proteolítico eliminado y con un péptido señal nativo ("WtSp-B Wis-PrL", o "B/Wisconsin/1/2010"): número de constructo 1975 basado en CPMV160+; número de constructo 1445 basado en CPMV HT (ver el Ejemplo 13);
B Brisbane/60/08 con bucle proteolítico eliminado y con un péptido señal PDI ("B Brisbane/60/08"): número de constructo 1937 basado en CPMV160+; número de constructo 1039 basado en CMPV HT (ver el Ejemplo 9); B Brisbane/60/08+H1Tm, con bucle proteolítico eliminado fusionado al dominio transmembrana y la cola citoplasmática y con un péptido señal PDI ("B Brisbane/60/08+H1Tm"): número de constructo 1977 basado en Cp Mv 160+; constructo 1067 basado en CMPV HT (ver el Ejemplo 10),
B Massachusetts/2/2012 2012 con bucle proteolítico eliminado y con un péptido señal PDI ("B Massachusetts/2/2012 2012"): número de constructo 2050 basado en CPMV160+; número de constructo 2072 basado en CPMV HT (ver el Ejemplo 11),
B Massachusetts/2/2012+H1Tm con bucle proteolítico eliminado fusionado al dominio transmembrana y la cola citoplasmática y con un péptido señal PDI ("B Massachusetts/2/2012+H1Tm"): número de constructo 2060 basado en CPMV160+; número de constructo 2074 basado en CPMV HT (ver el Ejemplo 12),
B Wisconsin/1/2010+H1Tm con bucle proteolítico eliminado fusionado al dominio transmembrana y la cola citoplasmática y con el péptido señal nativo ("B Wisconsin/1/2010+H1Tm"): número de constructo 1893 basado en CPMV160+; constructo 1454 basado en CPMV HT (ver el Ejemplo 14);
Rituximab (Rituxan) bajo el control de CPMV-HT con un péptido señal nativo o PDI ("CPMV-HT/SP tipo silvestre" y "CPMV-HT/PDISP"; números de constructo 5001 y 5002, respectivamente, ver los ejemplos 15 y 16) o CPMV160+ ("CPMV 160+/SP tipo silvestre" y "CPMV 160+/PDISP"; números de constructo 2100 y 2109, respectivamente, ver los ejemplos 15 y 16).
En cada caso, la expresión (determinada como actividad de hemoaglutinación o expresión de rituximab (Rituxan) según sea el caso) aumenta en el constructo basado en CMPV160+ en comparación con la del constructo basado en CPMV de la técnica anterior. Además, varias de las secuencias de nucleótidos de interés codificaron proteínas quiméricas o modificadas, por ejemplo, que comprenden péptidos señal heterólogos (por ejemplo, PDI), secuencias de la cola citoplasmática del dominio transmembrana heterólogo (TDCT) y/o secuencias modificadas que incluyen un bucle proteolítico eliminado (PrL-).
El aumento de la expresión observado mediante el uso de constructos basados en CPMV160+ también se observa si la secuencia kozak de plantas usada en los constructos basados en CPMV160+ anteriores se reemplaza con otras secuencias kozak de plantas, por ejemplo, una de esas secuencias kozak de plantas definidas en las SEQ ID NO: 8-16. Por ejemplo, con referencia a la Figura 4, se muestra una comparación de la expresión de las proteínas producidas en plantas que comprenden constructos de expresión basados en CPMV160+, unidos operativamente con una secuencia de nucleótidos de interés (H3 A/Victoria/361) cada una fusionada a diversas secuencias kozak de plantas. En cada caso, la expresión (determinada como título de hemoaglutinación) del constructo basado en CMPV160+ demuestra niveles de expresión significativos y mayores que el constructo basado en CMPV HT de la técnica anterior.
Los términos "por ciento de similitud" o "por ciento de identidad" cuando se refieren a una secuencia particular se usan, por ejemplo, como se expone en el programa de software GCG de la Universidad de Wisconsin, o mediante alineamiento manual e inspección visual (ver, por ejemplo, Current Protocols in Molecular Biology, Ausubel y otros, Eds. Suplemento de 1995). Los métodos de alineamiento de secuencias para la comparación se conocen bien en la técnica. Puede realizarse un alineamiento óptimo de secuencias para la comparación, mediante el uso de, por ejemplo, el algoritmo de Smith y Waterman, (1981, Adv. Appl. Math. 2:482), mediante el algoritmo de alineamiento de Needleman y Wunsch, (1970, J. Mol. Biol. 48: 443), mediante el método de búsqueda de similitud de Pearson y Lipman, (1988, Proc. Nat'l. Acad. Sci. USA 85: 2444), mediante implementaciones computarizadas de estos
algoritmos (por ejemplo: GAP, BESTFIT, FASTA y TFASTA en el paquete de software de Wisconsin Genetics, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis.).
Un ejemplo de un algoritmo adecuado para determinar el por ciento de identidad de secuencia y similitud de secuencia son los algoritmos BLAST y BLAST 2.0, que se describen en Altschul y otros, (1977, Nuc. Acids Res. 25: 3389-3402) y Altschul y otros, (1990, J. Mol. Biol. 215: 403-410), respectivamente. Se usan BLAST y BLAST 2.0, con los parámetros descritos en la presente descripción, para determinar el por ciento de identidad de secuencia para los ácidos nucleicos y las proteínas. Por ejemplo, el programa BLASTN (para secuencias de nucleótidos) puede usar como valores predeterminados una longitud de palabra (W) de 11, una expectativa (E) de 10, M=5, N=-4 y una comparación de ambas cadenas. Para las secuencias de aminoácidos, el programa BLASTP puede usar como valores predeterminados una longitud de palabra de 3 y una expectativa (E) de 10, y la matriz de puntuación BLOSUM62 (ver Henikoff y Henikoff, 1989, Proc. Natl. Acad. Sci. USA 89: 10915) alineamientos (B) de 50, expectativa (E) de 10, M=5, N=-4, y una comparación de ambas cadenas. El software para realizar el análisis BLAST está disponible públicamente a través del National Center for Biotechnology Information (ver la URL: ncbi.nlm.nih.gov/).
Una secuencia de nucleótidos de interés que codifica una proteína requiere la presencia de un "sitio de iniciación de la traducción" o "sitio de iniciación" o "sitio de inicio de la traducción" o "sitio de inicio" o "codón de inicio" ubicado aguas arriba del gen que va a expresarse. Dichos sitios de iniciación pueden proporcionarse ya sea como parte de una secuencia potenciadora o como parte de una secuencia de nucleótidos que codifica la proteína de interés.
"Casete de expresión" se refiere a una secuencia de nucleótidos que comprende un ácido nucleico de interés bajo el control de, y unido operablemente (u operativamente) a, un promotor apropiado u otros elementos reguladores para la transcripción del ácido nucleico de interés en una célula huésped.
Por "bucle proteolítico" o "sitio de escisión" se entiende la secuencia consenso del sitio proteolítico que está implicada en la escisión del precursor HA0. "Consenso" o "secuencia consenso", como se usa en la presente descripción, significa una secuencia (secuencia de aminoácidos o de nucleótidos) que comprende la variabilidad de secuencia de las secuencias relacionadas basado en el análisis de alineamiento de secuencias múltiples, por ejemplo, subtipos de una secuencia particular de HA0 de la influenza. La secuencia consenso del sitio de escisión de HA0 de la influenza puede incluir secuencias de aminoácidos de hemaglutinina consenso de influenza A, que incluyen, por ejemplo, secuencias de aminoácidos de hemaglutinina consenso de H1, consenso de H3, consenso de H5 o consenso de influenza B, por ejemplo, pero no se limitan a, B Florida, B Malaysia, B Wisconsin y B Massachusetts. Los ejemplos no limitantes de secuencias de la región del bucle proteolítico se muestran en las Figuras 15 y 18B de la solicitud provisional de los EE. UU. núm. 61/806,227 (presentada el 28 de marzo de 2013; ver también Bianchi y otros, 2005, Journal of Virology, 79: 7380-7388).
Los residuos en el bucle proteolítico o en el sitio de escisión pueden estar mutados, por ejemplo, pero no limitado a, mutación puntual, sustitución, inserción o eliminación. El término "mutación de aminoácidos" o "modificación de aminoácidos" como se usa en la presente descripción pretende abarcar sustituciones, deleciones, inserciones y modificaciones de aminoácidos. Puede realizarse cualquier combinación de sustitución, deleción, inserción y modificación como se describe en la solicitud provisional de los EE. UU. núm. 61/806,227 (presentada el 28 de marzo de 2013) para llegar al constructo final, siempre y cuando el constructo final posea las características deseadas, por ejemplo, escisión reducida o abolida del bucle proteolítico o sitio de escisión por una proteasa.
Como se describe en la presente descripción, se proporciona un constructo de ácido nucleico (sistema de expresión) que comprende una secuencia potenciadora de la expresión unida operativamente a una secuencia de nucleótidos de interés que codifica una proteína de interés. También se proporcionan sistemas de expresión en plantas que comprenden una secuencia potenciadora como se describe en la presente descripción. También se proporciona un sistema de expresión en plantas que comprende una región reguladora de plantas, en asociación operativa con una secuencia potenciadora que está unida operativamente a una secuencia de nucleótidos de interés, donde la secuencia de nucleótidos de interés codifica una proteína de interés. La secuencia potenciadora puede seleccionarse de cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77, o una secuencia de nucleótidos que exhibe 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77, en donde el potenciador de la expresión, cuando se une operativamente a una región reguladora de plantas y una secuencia kozak de plantas como se describe en la presente descripción, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que está unida operativamente al potenciador de la expresión en comparación con el nivel de expresión de la secuencia de nucleótidos de interés fusionada al CMPV HT (SEQ ID NO: 4; secuencia potenciadora de la técnica anterior que comprende una proteína M incompleta como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218) mediante el uso de la misma región reguladora de plantas.
La secuencia potenciadora de la presente descripción puede usarse para expresar una proteína de interés en un organismo huésped, por ejemplo, una planta. En este caso, la proteína de interés también puede ser heteróloga para el organismo huésped en cuestión e introducirse en las células vegetales mediante el uso de técnicas de transformación conocidas en la técnica. Un gen heterólogo en un organismo puede reemplazar un gen endógeno
equivalente, es decir, uno que normalmente realiza la misma función o una función similar, o la secuencia insertada puede ser adicional al gen endógeno u otra secuencia.
La secuencia potenciadora unida operativamente a una secuencia de nucleótidos de interés también puede estar unida operativamente al promotor, o región reguladora de plantas, y una UTR 3' y secuencias terminadoras. La secuencia potenciadora puede definirse mediante, por ejemplo, cualquiera de las SEQ ID NO: 1, 2, 24, 27, 68, 69 y 70-77, o una secuencia de nucleótidos que exhibe 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77. Por lo tanto, la secuencia de nucleótidos de interés está ubicada entre la secuencia potenciadora y la secuencia de terminación (ver la Figura 1A). El potenciador de la expresión o la secuencia de nucleótidos de interés pueden comprender una secuencia kozak de plantas.
La descripción proporciona además un casete de expresión que comprende en serie, un promotor o una región reguladora de plantas, unida operativamente a una secuencia potenciadora de la expresión como se describe en la presente descripción que está fusionada con una secuencia de nucleótidos de interés, una secuencia UTR 3' y una secuencia terminadora. La secuencia potenciadora puede definirse mediante, por ejemplo, cualquiera de las s Eq ID NO: 1,2, 24, 27, 68, 69 y 70-77, o una secuencia de nucleótidos que exhibe 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se establece en cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77. El potenciador de la expresión o la secuencia de nucleótidos de interés pueden comprender una secuencia kozak de plantas.
Como apreciaría un experto en la técnica, la secuencia de terminación (terminadora) puede ser cualquier secuencia que está activa en la planta huésped, por ejemplo, la secuencia de terminación puede derivarse del segmento del genoma del ARN-2 de un virus de ARN bipartito, por ejemplo, un comovirus, o la secuencia de terminación puede ser un terminador NOS.
Los constructos de la presente descripción pueden comprender además una región no traducida (UTR) 3'. Una región no traducida 3' contiene una señal de poliadenilación y cualquier otra señal reguladora capaz de efectuar el procesamiento del ARNm o la expresión génica. La señal de poliadenilación se caracteriza generalmente por efectuar la adición de pistas de ácido poliadenílico al extremo 3' del precursor de ARNm. Las señales de poliadenilación se reconocen comúnmente por la presencia de homología con la forma canónica 5' AATAAA-3', aunque las variaciones no son infrecuentes. Ejemplos no limitantes de regiones 3' adecuadas son las regiones no traducidas transcritas en 3' que contienen una señal de poliadenilación de genes del plásmido inductor de tumores (Ti) de Agrobacterium, tal como la nopalina sintasa (gen Nos) y genes vegetales tales como los genes de la proteína de almacenamiento de la soja, la subunidad pequeña del gen de la ribulosa-1,5-bisfosfato carboxilasa (ssRUBISCO; documento US 4,962,028), el promotor usado para regular la expresión de plastocianina (Pwee y Gray 1993). La secuencia de terminación (terminadora) puede obtenerse de la UTR 3' del gen de la plastocianina de alfalfa.
Por "secuencia de nucleótidos (o ácido nucleico) de interés", o "región codificante de interés", se entiende cualquier secuencia de nucleótidos, o región codificante (estos términos pueden usarse indistintamente) que se expresará dentro de un organismo huésped, por ejemplo, una planta, para producir una proteína de interés. Dicha secuencia de nucleótidos de interés puede codificar, pero no se limita a, proteínas nativas o modificadas, una enzima industrial o una enzima industrial modificada, una proteína agrícola o una proteína agrícola modificada, una proteína auxiliar, un suplemento proteico, una proteína farmacéuticamente activa, un nutracéutico, un producto de valor agregado o un fragmento del mismo para piensos, alimentos o tanto para piensos como para uso alimentario.
La proteína de interés puede comprender un péptido señal nativo o no nativo; el péptido señal no nativo puede ser de origen vegetal. Por ejemplo, el péptido señal puede ser un péptido señal de proteína disulfuro isomerasa (PDI). El péptido señal nativo puede corresponder al de la proteína de interés que se expresa.
La secuencia de nucleótidos de interés, o la región codificante de interés también puede incluir una secuencia de nucleótidos que codifica una proteína farmacéuticamente activa, por ejemplo factores de crecimiento, reguladores del crecimiento, anticuerpos, antígenos y fragmentos de los mismos, o sus derivados útiles para la inmunización o vacunación y similares. Tales proteínas incluyen, pero no se limitan a, una proteína que es un patógeno humano, una proteína viral, por ejemplo, pero no limitado a, antígenos que forman VLP, una o más proteínas del virus sincitial respiratorio (RSV), rotavirus, virus de la influenza, virus de la inmunodeficiencia humana (VIH), virus de la rabia, virus del papiloma humano (HPV), enterovirus 71 (EV71) o interleucinas, por ejemplo, una o más de una de IL-1 a IL-24, IL-26 e IL-27, citocinas, eritropoyetina (EPO), insulina, G-CSF, GM-Cs F, hPG-CSF, M-CSF o combinaciones de los mismos, interferones, por ejemplo, interferón alfa, interferón beta, interferón gamma, factores de coagulación de la sangre, por ejemplo, Factor VIII, Factor IX o tPA hGH, receptores, agonistas de receptores, anticuerpos, por ejemplo, pero no limitado a, rituximab (Rituxan), neuropolipéptidos, insulina, vacunas, factores de crecimiento, por ejemplo, pero no limitado a, factor de crecimiento epidérmico, factor de crecimiento de queratinocitos, factor de crecimiento de transformación, reguladores del crecimiento, antígenos, autoantígenos, fragmentos de los mismos o combinaciones de los mismos.
La proteína de interés también puede incluir una hemaglutinina de influenza (HA; ver el documento WO 2009/009876). La HA es una glicoproteína de membrana de tipo I homotrimérica, que generalmente comprende un péptido señal, un dominio HA1 y un dominio HA2 que comprende un sitio de anclaje que abarca la membrana en el extremo C-terminal y una cola citoplasmática pequeña. Las secuencias de nucleótidos que codifican HA se conocen bien y están disponibles (ver, por ejemplo, la Base de Datos BioDefense and Public Health (Influenza Research Database; Squires y otros, 2008 Nucleic Acids Research 36:D497-D503) en URL:
biohealth-base.org/GSearch/home.do?decorator=Influenza; o las bases de datos mantenidas por el National Center for Biotechnology Information (ver URL: ncbi.nlm.nih.gov).
Una proteína HA puede ser de una influenza tipo A, una influenza tipo B o es un subtipo de HA de influenza tipo A seleccionada del grupo de H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 y H16. La HA puede ser de una influenza tipo A, seleccionada del grupo H1, H2, H3, H5, H6, H7 y H9. Los fragmentos de las HA enumeradas anteriormente también pueden considerarse una proteína de interés. Además, los dominios de un tipo o subtipo de las HA enumeradas anteriormente pueden combinarse para producir HA quiméricas (ver, por ejemplo, el documento WO2009/076778).
Los ejemplos de subtipos que comprenden proteínas HA incluyen A/Nueva Caledonia/20/99 (H1N1), A/Indonesia/5/2006 (H5N1), A/pollo/Nueva York/1995, A/gaviota argéntea/DE/677/88 (H2N8), A/Texas/32/2003, A/ánade/MN/33/00, A/pato/Shanghai/1/2000, A/ánade rabudo/TX/828189/02, A/Pavo/Ontario/6118/68 (H8N4), A/pato cuchareta/Irán/G54/03, A/pollo/Alemania/N/1949 (H10N7), A/pato/Inglaterra/56 (H11N6), A/pato/Alberta/60/76 (H12N5), A/Gaviota/Maryland/704/77 (H13N6), A/Ánade/Gurjev/263/82, A/pato/Australia/341/83 (H15N8), A/gaviota de cabeza negra/Suecia/5/99 (H16N3), B/Lee/40, C/Johannesburgo/66, A/Puerto Rico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Islas Salomón 3/2006 (H1N1), A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), B/Malasia/2506/2004, B/Florida/4/2006, A/Singapur/1/57 (H2N2), A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1), A/Cerceta/Hong-Kong/W312/97 (H6N1), A/Equino/Praga/56 (H7N7), A/Hong Kong/1073/99 (H9N2)).
La proteína HA puede ser un subtipo H1, H2, H3, H5, H6, H7 o H9. Por ejemplo, la proteína H1 puede ser de la cepa A/Nueva Caledonia/20/99 (H1N1), A/Puerto Rico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Islas Salomón 3/Cepa 2006 (H1N1), A/California/04/2009 (H1N1) o A/California/07/2009 (H1N1). La proteína H3 también puede ser de la cepa A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), A/Victoria/361/2011 (H3N2), A/Texas/50/2012 (H3N2), A/Hawaii/22/2012 (H3N2), A/Nueva York/39/2012 (H3N2) o A/Perth/16/2009 (H3N2). La proteína H2 puede ser de la cepa A/Singapur/1/57 (H2N2). La proteína H5 puede ser de la cepa A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1) o A/Indonesia/5/2005. La proteína H6 puede ser de la cepa A/Cerceta/Hong Kong/W312/97 (H6N1). La proteína H7 puede ser de la cepa A/Equino/Praga/56 (H7N7), o H7 A/Hangzhou/1/2013, A/Anhui/1/2013 (H7N9) o A/Shanghai/2/2013 (H7N9). La proteína H9 es de la cepa A/HongKong/1073/99 (H9N2). La proteína HA puede provenir de un virus de la influenza que puede ser un virus tipo B, que incluye virus similar a B/Malasia/2506/2004, B/Florida/4/2006, B/Brisbane/60/08, B/Massachusetts/2/2012 (linaje de Yamagata) o B/Wisconsin/1/2010 (linaje de Yamagata). Los ejemplos no limitantes de secuencias de aminoácidos de las proteínas HA de los subtipos H1, H2, H3, H5, H6, H7, h 9 o B incluyen secuencias como se describe en los documentos WO 2009/009876, Wo 2009/076778, WO 2010/003225. La proteína HA del virus de la influenza puede ser H5 Indonesia.
La HA también puede ser una HA quimérica, en donde un dominio transmembrana nativo de HA se reemplaza por un dominio transmembrana heterólogo. El dominio transmembrana de las proteínas HA está muy conservado (ver, por ejemplo, la Figura 1C del documento WO 2010/148511). El dominio transmembrana heterólogo puede obtenerse de cualquier dominio transmembrana de HA, por ejemplo, pero no limitado a, el dominio transmembrana de H1 California, B/Florida/4/2006 (Número de acceso de GenBank ACA334 93.1), B/Malasia/2506/2004 (Número de acceso de GenBank ABU99194.1), H1/Bri (Número de acceso de GenBank ADE28750.1), H1 A/Islas Salomón/3/2006 (Número de acceso de GenBank ABU99109.1), H1/NC (Número de acceso de GenBank AAP34 324.1), H2 A/Singapur/1/1957 (Número de acceso de GenBank AAA64366.1), H3 A/Brisbane/10/2007 (Número de acceso de GenBank ACI26318.1), H3 A/Wisconsin/67/2005 (Número de acceso de GenBank ABO37599.1), H5 A/Anhui/1/2005 (Número de acceso de GenBank ABD28180.1), H5 A/Vietnam/1194/2004 (Número de acceso de GenBank ACR48874.1), H5-Indo (Número de acceso de GenBank ABW06108.1). El dominio transmembrana también puede definirse por la siguiente secuencia de aminoácidos consenso:
iLXiYystvAiSslXlXXmlagXsXwmcs (SEQ ID NO: 78)
La HA puede comprender un péptido señal nativo o no nativo; el péptido señal no nativo puede ser de origen vegetal. El péptido señal nativo puede corresponder al de la hemaglutinina que se expresa o puede corresponder a una segunda hemaglutinina. Adicionalmente, el péptido señal puede ser de una proteína estructural o hemaglutinina de un virus distinto de la influenza. Ejemplos no limitantes de un péptido señal que puede usarse es el de la proteína disulfuro isomerasa de alfalfa (SP de PDI; nucleótidos 32-103 del número de acceso Z11499) o el péptido señal de patatina (SP de PatA; ubicado en los nucleótidos 1738 - 1806 de núm. de acceso de GenBank A08215). La secuencia de nucleótidos de SP de PatA para este número de acceso es:
ATGGCAACTACTAAAACTTTTTTAATTTTATTTTTTATGATATTAGCAACTACTAGTTCAACATGTGCT (SEQ ID NO: 79)
la secuencia de aminoácidos del péptido señal de patatina A es:
MATTKTFLILFFMILATTSSTCA (SEQ ID NO: 80)
La presente descripción también proporciona moléculas de ácido nucleico que comprenden secuencias que codifican una proteína HA. Las moléculas de ácido nucleico pueden comprender además una o más regiones reguladoras unidas operativamente a la secuencia que codifica una proteína HA. Las moléculas de ácido nucleico pueden comprender una secuencia que codifica una H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 o hA de influenza tipo B. Por ejemplo, la proteína HA codificada por la molécula de ácido nucleico puede ser un subtipo H1, H2, H3, H5, H6, H7, H9, una HA de tipo B. La proteína H1 codificada por el ácido nucleico puede ser de la cepa A/Nueva Caledonia/20/99 (H1N1), A/Puerto Rico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Islas Salomón 3/2006 (H1N1), A/California/04/2009 (H1N1) o A/California/07/2009 (H1N1). La proteína H3 codificada por la molécula de ácido nucleico puede ser de la cepa A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), A/Victoria/361/2011 (H3N2), A/Texas/50/2012 (H3N2), A/Hawaii/22/2012 (H3N2), A/Nueva York/39/2012 (H3N2) o A/Perth/16/2009 (H3N2). La proteína H2 codificada por la molécula de ácido nucleico puede ser de la cepa A/Singapur/1/57 (H2N2). La proteína H5 codificada por la molécula de ácido nucleico puede ser la cepa A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1) o A/Indonesia/5/2005. La proteína H6 codificada por la molécula de ácido nucleico puede ser de la cepa A/Cerceta/Hong-Kong/W312/97 (H6N1). La proteína H7 codificada por la molécula de ácido nucleico puede ser de la cepa A/Equino/Praga/56 (H7N7) o H7 A/Hangzhou/1/2013, A/Anhui/1/2013 (H7N9) o A/Shanghai/2/2013 (H7N9). Adicionalmente, la proteína H9 codificada por la molécula de ácido nucleico puede ser de la cepa A/Hong Kong/1073/99 (H9N2). La proteína HA codificada por la molécula de ácido nucleico puede ser de un virus de la influenza tipo B, que incluye virus similar a B/Malasia/2506/2004, B/Florida/4/2006, B/Brisbane/60/08, B/Massachusetts/2/2012 (linaje Yamagata) o B/Wisconsin/1/2010 (linaje Yamagata). Los ejemplos no limitantes de secuencias de aminoácidos de las proteínas HA de los subtipos H1, H2, H3, H5, H6, H7, H9 o B incluyen secuencias como se describe en los documentos WO 2009/009876, WO 2009/076778, WO 2010/003225. La proteína HA del virus de la influenza puede ser H5 Indonesia.
Tabla 1: EiemDlos de constructos aue se han DreDarado como se describe en la Dresente descriDción:
Si la secuencia de ácido nucleico de interés codifica un producto que es directa o indirectamente tóxico para la planta, entonces dicha toxicidad puede reducirse al expresar selectivamente la secuencia de nucleótidos de interés dentro de un tejido deseado o en una etapa deseada del desarrollo de la planta.
La región codificante de interés o la secuencia de nucleótidos de interés puede expresarse en cualquier planta huésped adecuada que esté transformada o comprenda las secuencias de nucleótidos, o moléculas de ácido nucleico, o constructos genéticos o vectores de la presente descripción. Los ejemplos de huéspedes adecuados incluyen, pero no se limitan a, Arabidopsis, cultivos agrícolas que incluyen, por ejemplo, canola, Brassica spp., planta de maíz, Nicotiana spp., (tabaco), por ejemplo, Nicotiana benthamiana, alfalfa, patata, batata (Ipomoea batatus), ginseng, guisante, avena, arroz, soja, trigo, cebada, girasol, algodón, maíz, centeno (Secale cereale), sorgo (Sorghum bicolor, Sorghum vulgare), cártamo (Carthamus tinctorius).
Los términos "biomasa" y "materia vegetal" como se usan en la presente descripción, se refieren a cualquier material derivado de una planta. La biomasa o materia vegetal puede comprender una planta completa, o parte de la planta, incluida la hoja, raíz, tallo, flor, semilla, también puede incluir cualquier tejido de la planta, cualquier célula de la planta o cualquier fracción de la planta, parte o la planta, tejido o célula. Además, la biomasa o materia vegetal puede comprender componentes vegetales intracelulares, componentes vegetales extracelulares, extractos líquidos o
sólidos de plantas, o una combinación de los mismos. Además, la biomasa o materia vegetal puede comprender plantas, células vegetales, tejidos, un extracto líquido, o una combinación de los mismos, de hojas, tallos, frutos, raíces de las plantas o una combinación de los mismos. Una parte de una planta puede comprender materia vegetal o biomasa.
Por "región reguladora", "elemento regulador" o "promotor" se entiende una parte de ácido nucleico típicamente, pero no siempre, aguas arriba de la región codificante de proteínas de un gen, que puede estar compuesto por ADN o ARN, o tanto ADN como ARN. Cuando una región reguladora está activa, y en asociación operativa, o unida operativamente, con un gen de interés, esta puede dar como resultado la expresión del gen de interés. Un elemento regulador puede ser capaz de mediar la especificidad en un órgano o controlar la activación de genes por el desarrollo o temporal. Una "región reguladora" incluye elementos promotores, elementos promotores mínimos que exhiben una actividad promotora basal, elementos que son inducibles en respuesta a un estímulo externo, elementos que median la actividad promotora tales como elementos reguladores negativos o potenciadores de la transcripción. "Región reguladora", como se usa en la presente descripción, también incluye elementos que son activos después de la transcripción, por ejemplo, elementos reguladores que modulan la expresión génica tales como potenciadores de la transcripción y la traducción, represores de la transcripción y la traducción, secuencias activadoras aguas arriba y determinantes de inestabilidad del ARNm. Varios de estos últimos elementos pueden ubicarse próximos a la región codificante.
En el contexto de esta descripción, el término "elemento regulador" o "región reguladora" se refiere típicamente a una secuencia de ADN, generalmente, pero no siempre, aguas arriba (5') a la secuencia codificante de un gen estructural, que controla la expresión de la región codificante al proporcionar el reconocimiento para la ARN polimerasa y/u otros factores necesarios para que la transcripción comience en un sitio particular. Sin embargo, debe entenderse que otras secuencias de nucleótidos, ubicadas dentro de los intrones, o en dirección 3' de la secuencia también pueden contribuir a la regulación de la expresión de una región codificante de interés. Un ejemplo de un elemento regulador que proporciona el reconocimiento de la ARN polimerasa u otros factores de transcripción para garantizar el inicio en un sitio particular es un elemento promotor. La mayoría, pero no todos, los elementos promotores eucariotas contienen una caja TATA, una secuencia de ácidos nucleicos conservada compuesta por pares de bases de nucleótidos de adenosina y timidina, generalmente situados aproximadamente a 25 pares de bases aguas arriba de un sitio de inicio de la transcripción. Un elemento promotor comprende un elemento promotor basal, responsable del inicio de la transcripción, así como también otros elementos reguladores (como se enumeró anteriormente) que modifican la expresión génica.
Hay varios tipos de regiones reguladoras, incluidas aquellas que son reguladas por el desarrollo, inducibles o constitutivas. Una región reguladora que es regulada por el desarrollo, o controla la expresión diferencial de un gen bajo su control, se activa dentro de ciertos órganos o tejidos de un órgano en momentos específicos durante el desarrollo de ese órgano o tejido. Sin embargo, algunas regiones reguladoras que son reguladas por el desarrollo pueden estar activas preferentemente dentro de ciertos órganos o tejidos en etapas específicas del desarrollo, también pueden ser activas de una manera regulada por el desarrollo, o también a un nivel basal en otros órganos o tejidos dentro de la planta. Los ejemplos de regiones reguladoras específicas de tejido, por ejemplo, una región reguladora específica, incluyen el promotor de napina y el promotor de cruciferina (Rask y otros, 1998, J. Plant Physiol.
152: 595-599; Bilodeau y otros, 1994, Plant Cell 14: 125-130). Un ejemplo de un promotor específico de la hoja incluye el promotor de plastocianina (ver el documento US 7,125,978).
Una región reguladora inducible es una que es capaz de activar directamente o indirectamente la transcripción de una o más secuencias de ADN o genes en respuesta a un inductor. En ausencia de un inductor, las secuencias de ADN o los genes no se transcribirán. Típicamente, el factor proteico que se une específicamente a una región reguladora inducible para activar la transcripción puede estar presente en una forma inactiva, que después se convierte directamente o indirectamente en la forma activa por el inductor. Sin embargo, el factor proteico también puede estar ausente. El inductor puede ser un agente químico tal como una proteína, metabolito, regulador del crecimiento, herbicida o compuesto fenólico o un estrés fisiológico impuesto directamente por calor, frío, sal o elementos tóxicos o indirectamente a través de la acción de un patógeno o agente patógeno tal como un virus. Una célula que contiene una región reguladora inducible puede exponerse a un inductor al aplicar externamente el inductor a la célula o planta tal como por pulverización, riego, calentamiento o métodos similares. Los elementos reguladores inducibles pueden derivarse de genes ya sea vegetales o no vegetales (por ejemplo, Gatz, C. y Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358). Los ejemplos de promotores inducibles potenciales incluyen, pero no se limitan a, promotor inducible por tetraciclina (Gatz, C., 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108), promotor inducible por esteroides (Aoyama, T. y Chua, N.H., 1997, Plant J. 2, 397-404) y promotor inducible por etanol (Salter, M.G., y otros, 1998, Plant Journal 16, 127-132; Caddick, M.X., y otros, 1998, Nature Biotech. 16, 177-180) genes IB6 y CKI1 inducibles por citoquinina (Brandstatter, I. y Kieber, J.J., 1998, Plant Cell 10, 1009-1019; Kakimoto, T., 1996, Science 274, 982-985) y el elemento inducible por auxina, DR5 (Ulmasov, T., y otros, 1997, Plant Cell 9, 1963-1971).
Una región reguladora constitutiva dirige la expresión de un gen a través de las diversas partes de una planta y de manera continua a lo largo del desarrollo de la planta. Los ejemplos de elementos reguladores constitutivos conocidos incluyen promotores asociados con el transcrito 35S de CaMV. (p35S; Odell y otros, 1985, Nature, 313: 810-812), los genes de actina de arroz 1 (Zhang y otros, 1991, Plant Cell, 3: 1155-1165), actina 2 (An y otros, 1996, Plant J., 10:
107-121), o tms 2 (documento U.S. 5,428,147) y triosafosfato isomerasa 1 (Xu y otros, 1994, Plant Physiol. 106: 459-467), el gen de ubiquitina 1 de la planta de maíz (Cornejo y otros, 1993, Plant Mol. Biol. 29: 637-646), los genes de ubiquitina 1 y 6 de Arabidopsis (Holtorf y otros, 1995, Plant Mol. Biol. 29: 637-646), y el gen del factor de inicio de la traducción 4A del tabaco (Mandel y otros, 1995 Plant Mol. Biol. 29: 995-1004), el promotor del virus del mosaico de la vena de la yuca, pCAS, (Verdaguer y otros, 1996); el promotor de la subunidad pequeña de la ribulosa bifosfato carboxilasa, pRbcS: (Outchkourov y otros, 2003), el pUbi (para monocotiledóneas y dicotiledóneas).
Como se describe en la presente descripción, se ha encontrado que las regiones reguladoras que comprenden secuencias potenciadoras con eficacia demostrada en la expresión foliar son eficaces en la expresión transitoria. Sin desear limitarse por la teoría, la unión de elementos reguladores aguas arriba de un gen fotosintético por unión a la matriz nuclear puede mediar una expresión fuerte. Por ejemplo, puede usarse hasta -784 desde el sitio de inicio de la traducción de la plastocianina de guisante (documento US 7,125,978) para mediar en la expresión fuerte del gen indicador.
El término "constitutivo", como se usa en la presente descripción, no indica necesariamente que una secuencia de nucleótidos bajo el control de la región reguladora constitutiva se expresa al mismo nivel en todos los tipos de células, sino que la secuencia se expresa en una amplia variedad de tipos de células aun cuando a menudo se observa variación en la abundancia.
Los constructos de expresión descritos anteriormente pueden estar presentes en un vector. El vector puede comprender secuencias borde que permiten la transferencia e integración del casete de expresión en el genoma del organismo o huésped. El constructo puede ser un vector binario de plantas, por ejemplo, un vector de transformación binario basado en pPZP (Hajdukiewicz, y otros, 1994). Otros constructos de ejemplo incluyen pBin19 (ver Frisch, D.A., L.W. Harris-Haller, y otros, 1995, Plant Molecular Biology 27: 405-409).
Si se desea, los constructos de esta descripción pueden manipularse adicionalmente para incluir marcadores seleccionables. Sin embargo, es posible que esto no sea necesario. Los marcadores seleccionables útiles incluyen enzimas que proporcionan resistencia a productos químicos tales como antibióticos, por ejemplo, gentamicina, higromicina, kanamicina, o herbicidas tales como fosfinotricina, glifosato, clorosulfuron y similares. De manera similar, pueden usarse enzimas que proporcionan la producción de un compuesto identificable por cambio de color, tal como GUS (beta-glucuronidasa), o luminiscencia, tal como luciferasa o g Fp .
Un vector también puede incluir un potenciador de la expresión como se describe en la presente descripción. El potenciador de la expresión puede ubicarse en un ADN-T que también contiene un supresor del silenciamiento génico y NPTII. El polienlazador también puede codificar uno o dos conjuntos de residuos de histidina 6 x para permitir la inclusión de etiquetas His N- o C-terminales en la proteína de interés para facilitar la purificación de la proteína.
El silenciamiento génico postranscripcional (PTGS) puede estar implicado en la limitación de la expresión de transgenes en plantas, y la coexpresión de un supresor del silenciamiento del virus Y de la patata (HcPro) puede usarse para contrarrestar la degradación específica de los ARNm transgénicos (Brigneti y otros, 1998, EMBO J. 17, 6739-6746). Los supresores de silenciamiento alternativos se conocen bien en la técnica y pueden usarse como se describe en la presente descripción (Chiba y otros, 2006, Virology 346: 7-14), por ejemplo, pero no limitado a, TEV-p1/HC-Pro (virus del grabado del tabaco-pl/HCPro), BYV -p21, p19 del virus del enanismo ramificado del tomate (TBSV p19; el constructo de p19 descrito en el documento w O 2010/0003225), proteína de la cápside del virus del arrugamiento del tomate (TCV -CP), 2b del virus del mosaico del pepino; CMV-2b), p25 del virus X de la patata (PVX-p25), p11 del virus M de la patata (PVM-p11), p11 del virus S de la patata (PVS-p11), p16 del virus de la quemazón del arándano (BScV -p16), p23 del virus de la tristeza de los cítricos (CTV-p23), p24 del virus-2 asociado al enrollamiento de la hoja de vid, (GLRaV-2 p24), p10 del virus de la vid A, (GVA-p10), p14 del virus de la vid B (GVB-p14), p10 del virus latente de Heracleum (HLV-p10) o p16 del virus latente común del ajo (GCLV-p16).
Por lo tanto, uno o más supresores de silenciamiento, por ejemplo, pero no limitado a, HcPro, TEV-p1/HC-Pro, BYV-p21, TBSV p19, TCV-CP, CMV-2b, PVX-p25, rgscam, proteína B2 de FHV, la proteína de envoltura pequeña de CPMV y la proteína de la envoltura de TCV, PVM-p11, PVS-p11, BScV-p16, CTV-p23, GLRaV-2 p24, GBV-p14, HLV-p10, GCLV-p16 o GVA-p10 pueden coexpresarse junto con el casete de expresión basado en comovirus, el elemento de amplificación derivado de geminivirus y la secuencia de ácido nucleico que codifica la proteína de interés para garantizar aún más altos niveles de producción de proteínas dentro de una planta.
Los constructos descritos en la presente descripción pueden introducirse en células vegetales mediante el uso de plásmidos Ti, plásmidos Ri, vectores de virus de plantas, transformación directa de ADN, microinyección, electroporación, etcétera. Para reseñas de tales técnicas ver, por ejemplo, Weissbach y Weissbach, Methods for Plant Molecular Biology, Academy Press, Nueva York VIII, págs. 421-463 (1988); Geierson y Corey, Plant Molecular Biology, 2da Ed. (1988); y Miki e Iyer, Fundamentals of Gene Transfer in Plants. En Plant Metabolism, 2da Ed. DT. Dennis, DH Turpin, DD Lefebrve, DB Layzell (eds), Addison Wesly, Langmans Ltd. Londres, págs. 561-579 (1997). Otros métodos incluyen la captación directa de ADN, el uso de liposomas, la electroporación, por ejemplo con el uso de protoplastos, microinyección, microproyectiles o fibras e infiltración al vacío. Ver, por ejemplo, Bilang, y otros (1991, Gene 100: 247-250), Scheid y otros (1991, Mol. Gen. Genet. 228: 104-112), Guerche y otros (1987, Plant Science 52: 111-116),
Neuhause y otros (1987, Theor. Appl Genet. 75: 30-36), Klein y otros, (2987, Nature 327: 70-73); Freeman y otros (1984, Plant Cell Physiol. 29: 1353), Howell y otros (1980, Science 208: 1265), Horsch y otros (1985, Science 227: 1229-1231), DeBlock y otros, (1989, Plant Physiology 91: 694-701), Methods for Plant Molecular Biology (Weissbach y Weissbach, eds., Academic Press Inc., 1988), Methods in Plant Molecular Biology (Schuler y Zielinski, eds., Academic Press Inc., 1989), documentos WO 92/09696, WO 94/00583, EP 331083, EP 175966, Liu y Lomonossoff (2002, J Virol Meth, 105:343-348), documentos EP 290395; WO 8706614; patentes de EE. UU. núms. 4,945,050; 5,036,006; y 5,100,792, solicitudes de patente de EE. UU. núms. de serie 08/438,666, presentada el 10 de mayo de 1995 y 07/951,715, presentada el 25 de septiembre de 1992.
Los métodos de expresión transitoria pueden usarse para expresar los constructos de la presente descripción (ver D'Aoust y otros, 2009, Methods in molecular biology, Vol 483, páginas 41-50; Liu y Lomonossoff, 2002, Journal of Virological Methods, 105: 343-348). Alternativamente, puede usarse un método de expresión transitoria basado en vacío, como se describe en Kapila y otros, (1997, Plant Sci. 122, 101-108) o los documentos WO 00/063400, WO 00/037663. Estos métodos pueden incluir, por ejemplo, pero no se limitan a, un método de agroinoculación o agroinfiltración, infiltración con jeringa, sin embargo, también pueden usarse otros métodos transitorios como se indicó anteriormente. Con agroinoculación, agroinfiltración o infiltración con jeringa, una mezcla de agrobacterias que comprende el ácido nucleico deseado se introduce en los espacios intercelulares de un tejido, por ejemplo, las hojas, la porción aérea de la planta (que incluye el tallo, las hojas y la flor), otra porción de la planta (tallo, raíz, flor) o la planta completa. Después de cruzar la epidermis, las agrobacterias infectan y transfieren
ADN-t se transcribe de manera episomal y el ARNm se traduce, lo que conduce a la producción de la proteína de interés en las células infectadas, sin embargo, el paso del ADN-t dentro del núcleo es transitorio.
También se consideran parte de esta descripción plantas, células vegetales o semillas transgénicas que contienen el constructo génico de la presente descripción que pueden usarse como una plataforma de planta adecuada para la expresión transitoria de proteínas descrita en la presente descripción. Los métodos para regenerar plantas completas a partir de células vegetales también se conocen en la técnica (por ejemplo, ver Guerineau y Mullineaux (1993, Plant transformation and expression vectors. En: Plant Molecular Biology Labfax (Croy RRD ed.) Oxford, BIOS Scientific Publishers, págs. 121-148). En general, las células vegetales transformadas se cultivan en un medio apropiado, que puede contener agentes de selección tales como antibióticos, donde se usan marcadores de selección para facilitar la identificación de las células vegetales transformadas. Una vez que se forma el callo, se puede fomentar la formación de brotes con el empleo de las hormonas vegetales apropiadas de acuerdo con métodos conocidos y los brotes se transfieren a un medio de enraizamiento para la regeneración de las plantas. Las plantas pueden usarse después para establecer generaciones repetitivas, ya sea a partir de semillas o mediante el uso de técnicas de propagación vegetativa. Las plantas transgénicas también pueden generarse sin usar cultivo de tejidos. Los métodos para la transformación estable y la regeneración de estos organismos están establecidos en la técnica y son conocidos para un experto en la técnica. Las técnicas disponibles se reseñan en Vasil y otros, (Cell Culture and Somatic Cell Genetics of Plants, Vol. I, II y III, Laboratory Procedures and Their Applications, Academic Press, 1984), y Weissbach y Weissbach (Methods for Plant Molecular Biology, Academic Press, 1989). El método para obtener plantas transformadas y regeneradas no es crucial para la presente invención.
Si las plantas, la parte de la planta o la célula vegetal van a transformarse o cotransformarse con dos o más constructos de ácido nucleico, el constructo de ácido nucleico puede introducirse en las Agrobacterium en un solo evento de transfección, los ácidos nucleicos se combinan y las células bacterianas se transfectan como se describió. Alternativamente, los constructos pueden introducirse en serie. En este caso, se introduce un primer constructo en las Agrobacterium como se describió, las células se cultivan en condiciones de selección (por ejemplo, en presencia de un antibiótico) donde solo pueden crecer las bacterias transformadas individualmente. Después de esta primera etapa de selección, se introduce un segundo constructo de ácido nucleico en las Agrobacterium como se describió, y las células se cultivan en condiciones de doble selección, donde solo pueden crecer las bacterias doblemente transformadas. Las bacterias doblemente transformadas pueden usarse después para transformar una planta, parte de la planta o célula vegetal como se describe en la presente descripción, o pueden someterse a una etapa de transformación adicional para acomodar un tercer constructo de ácido nucleico.
Alternativamente, si las plantas, una parte de la planta o una célula vegetal van a transformarse o cotransformarse con dos o más constructos de ácido nucleico, el constructo de ácido nucleico puede introducirse en la planta mediante la coinfiltración de una mezcla de células de Agrobacterium con la planta, parte de la planta o célula vegetal, cada célula de Agrobacterium puede comprender uno o más constructos a introducir dentro de la planta. Para variar los niveles de expresión relativa dentro de la planta, parte de la planta o célula vegetal, de una secuencia de nucleótidos de interés dentro de un constructo, durante la etapa de infiltración, puede variarse la concentración de las diversas poblaciones de agrobacterias que comprenden los constructos deseados.
La presente descripción proporciona además una planta transgénica que comprende el sistema de expresión como se define en la presente descripción, en donde el ácido nucleico heterólogo de interés en el casete se expresa a un nivel potenciado en comparación con otros sistemas de expresión análogos que carecen de uno o más componentes del sistema de expresión como se describe en la presente descripción, por ejemplo CMPV HT (SEQ ID NO: 4).
La presente descripción comprende además un método para generar una proteína de interés, que comprende las etapas de proporcionar una planta, o parte de la planta, que exprese el sistema de expresión como se describe en la presente descripción, recolectar, al menos, un tejido en donde la proteína de interés se ha expresado y, opcionalmente, aislar la proteína de interés a partir del tejido.
Por lo tanto, en diversos aspectos, y sin limitación, la descripción proporciona:
- un potenciador de la expresión, que comprende una UTR 5' de comovirus seleccionada de cualquiera de las SEQ ID NO: 1, 2, 24, 27, 68, 69 y 70-77, o una secuencia de nucleótidos que presenta 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77, en donde el potenciador de la expresión, cuando se une operativamente a una región reguladora de plantas y una secuencia kozak de plantas como se describe en la presente descripción, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que está unida operativamente al potenciador de la expresión en comparación con el nivel de expresión de la secuencia de nucleótidos de interés fusionada al CMPV HT (SEQ ID NO: 4; secuencia potenciadora de la técnica anterior que comprende una proteína M incompleta como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218) mediante el uso de la misma región reguladora de plantas.
- uno o más sistemas de expresión que comprenden un potenciador de la expresión o casete de expresión basado en comovirus como se definió anteriormente, un promotor (región reguladora), opcionalmente un polienlazador, una secuencia kozak, un ácido nucleico que codifica una proteína de interés y un terminador.
- métodos para expresar una proteína de interés, en un organismo huésped, tal como una planta, mediante el uso de uno o más sistemas de expresión o vectores como se describe en la presente descripción.
- células huésped y organismos que expresan proteínas de interés a partir de uno o más sistemas de expresión o vectores de la descripción y métodos para la producción de los huéspedes y organismos.
Tabla 2: lista de secuencias
continuación
Ejemplo de referencia 1 - 2X35S/CPMV-HT/PDISP/H3 Victoria/ NOS (número de constructo 1391)
Una secuencia que codifica H3 de la influenza A/Victoria/361/2011 en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H3 Victoria) se clonó en el sistema de expresión 2X35S-CPMV-HT-NOS (CMPV-HT original) mediante el uso del siguiente método basado en PCR. Un fragmento que contenía la secuencia codificante de PDISP/H3 Victoria se amplificó mediante el uso de los cebadores IF-PDI.S1+3c (Figura 6A, SEQ ID NO: 67) e IF-H3V36111.s1-4r (Figura 6B, SEQ ID NO: 17), mediante el uso de la secuencia de PDISP/H3 Victoria (Figura 6C, SEQ ID NO: 18) como molde. El producto de PCR se clonó en el sistema de expresión 2X35S/CPMV-HT/NOS mediante el uso del sistema de clonación In-Fusion (Clontech, Mountain View, CA). El número de constructo 1191 (Figura 6D) se digirió con las enzimas de restricción SacII y StuI y el plásmido linealizado se usó para la reacción de ensamblaje In-Fusion. El número de constructo 1191 es un plásmido aceptor destinado para la clonación "In Fusion" de genes de interés en un casete de expresión basado en CPMV-HT. También incorpora un constructo génico para la coexpresión del supresor de silenciamiento de TBSV P19 bajo el promotor y terminador del gen de Plastocianina de la alfalfa. La cadena principal es un plásmido binario pCAMBIA y la secuencia del borde izquierdo al derecho del ADN-t se presenta en la Figura 6E (SEQ ID NO: 19). El constructo resultante recibió el número 1391 (Figura 6F, SEQ ID NO: 20). La secuencia de aminoácidos de la H3 madura de la influenza A/Victoria/361/2011 fusionada con PDISP se presenta en la Figura 6G (SEQ ID NO: 21). Una representación del plásmido 1391 se presenta en la Figura 6H.
Ejemplo 2 - 2X35S/CPMV160+/PDISP/H3 Victoria/NOS (número de constructo 1800)
Una secuencia que codifica H3 de la influenza A/Victoria/361/2011 en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H3 Victoria) se clonó en el sistema de expresión 2X35S/CPMV160+/NOS (CPMV160+) mediante el uso del siguiente método basado en PCR. Un fragmento que contenía la secuencia codificante de PDISP/H3 Victoria se amplificó mediante el uso de los cebadores IF**(SacII)-PDI.s1+4c (Figura 7A, SEQ ID NO: 22) e IF-H3V36111.s1-4r (Figura 7B, SEQ ID NO: 23), mediante el uso de la secuencia de PDISP/H3 Victoria (Figura 7C, SEQ ID NO: 24) como molde. El producto de p Cr se clonó en el sistema de expresión 2X35S/CPMV160+/NOS mediante el uso del sistema de clonación In-Fusion (Clontech, Mountain View, CA). El número de constructo 2171 (Figura 7D) se digirió con las enzimas de restricción SacII y StuI y el plásmido linealizado se usó para la reacción de ensamblaje In-Fusion. El número de constructo 2171 es un plásmido aceptor destinado a la clonación "In Fusion" de genes de interés en un casete de expresión basado en CPMV160+. También incorpora un constructo génico para la coexpresión del supresor de silenciamiento de TBSV P19 bajo el promotor y terminador del gen de Plastocianina de la alfalfa. La cadena principal es un plásmido binario pCAMBIA y la secuencia desde el borde izquierdo al derecho del ADN-t se presenta en la Figura 7E (SEQ ID NO: 25). El constructo
resultante recibió el número 1800 (Figura 7F, SEQ ID NO: 26). La secuencia de aminoácidos de la H3 madura de la influenza A/Victoria/361/2011 fusionada con PDISP se presenta en la Figura 7G (SEQ ID NO: 27). Una representación del plásmido 1800 se presenta en la Figura 7H.
Ejemplo 3 - 2X35S/CPMV160/PDISP/H3 Victoria/ NOS (número de constructo 1935)
Una secuencia que codifica H3 de la influenza A/Victoria/361/2011 en la que el péptido señal nativo se ha reemplazado con el de la proteína disulfuro isomerasa de la alfalfa (PDISP/H3 Victoria) se clonó en el casete de expresión 2X35S-CPMV160-NOS mediante el uso del siguiente método basado en PCR. Un fragmento que contenía la secuencia codificante de PDISP/H3 Victoria se amplificó mediante el uso de los cebadores IF-CPMV(fl5'UTR)_SpPDI.c (Figura 8A, SEQ ID NO: 28) e IF-H3V36111.s1-4r (Figura 7B, SEQ ID NO: 23), mediante el uso de la secuencia de PDISP/H3 Victoria (Figura 7C, SEQ ID NO: 24) como molde. El producto de PCR se clonó en el sistema de expresión 2X35S/CPMV160/NOS mediante el uso del sistema de clonación In-Fusion (Clontech, Mountain View, c A). El número de constructo 1190 (Figura 8B) se digirió con las enzimas de restricción SacII y StuI y el plásmido linealizado se usó para la reacción de ensamblaje In-Fusion. El número de constructo 1190 es un plásmido aceptor destinado para la clonación "In Fusion" de genes de interés en un casete de expresión basado en CPMV160. También incorpora un constructo génico para la coexpresión del supresor de silenciamiento de TBSV P19 bajo el promotor y terminador del gen de Plastocianina de la alfalfa. La cadena principal es un plásmido binario pCAMBIA y la secuencia desde el borde izquierdo al derecho del ADN-t se presenta en la Figura 8C (SEQ ID NO: 29). El constructo resultante recibió el número 1935 (Figura 8D, SEQ ID NO: 30). La secuencia de aminoácidos de la H3 madura de la influenza A/Victoria/361/2011 fusionada con PDISP se presenta en la Figura 7G (SEQ ID NO: 27). Una representación del plásmido 1935 se presenta en la Figura 8E.
Ejemplo 4 - Variación de secuencia entre el sitio de restricción SacII y ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV160+/NOS (Número de constructos 1992 a 1999)
Se crearon ocho constructos que comprenden variaciones de secuencia entre el sitio de restricción SacII y el ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV160+/NOS mediante el uso del mismo método basado en PCR que para el número de constructo 1800 (ver el Ejemplo 2) mediante el uso de un cebador directo modificado y la conservación de todos los demás componentes iguales. Las variantes HT1* a HT8* se amplificaron mediante el uso de los cebadores enumerados en las Figuras 9A - 9H, cebadores:
IF-HT1*(-Mprot)-PDI.c (Figura 9A, SEQ ID NO: 31),
IF-HT2*(-Mprot)-PDI.c (Figura 9B, SEQ ID NO: 32),
IF-HT3*(-Mprot)-PDI.c (Figura 9C, SEQ ID NO: 33)
IF-HT4*(-Mprot)-PDI.c (Figura 9D, SEQ ID NO: 34)
IF-HT5*(-Mprot)-PDI.c (Figura 9E, SEQ ID NO: 35)
IF-HT6*(-Mprot)-PDI.c (Figura 9F, SEQ ID NO: 36)
IF-HT7*(-Mprot)-PDI.c (Figura 9G, SEQ ID NO: 37) y
IF-HT8*(-Mprot)-PDI.c (Figura 9H, SEQ ID NO: 38),
para crear el número de constructo 1992 a 1999, respectivamente. Representación del plásmido 1992 se presenta en la Figura 9I. Se usaron características análogas para preparar los constructos 1993-1999.
Ejemplo 5 - 2X35S/CPMV HT (número de constructo 484) y 2X35S/CPMV160+ (número de constructo 1897) para PDISP/H1 California
Una secuencia de codificación correspondiente a H1 de Influenza A/California/7/2009 en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H1 California) (Figura 10A, SEQ ID NO: 39) se clonó en CPMV-HT original y CPMV160 mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H1 California. La secuencia de aminoácidos de la H1 madura de la Influenza A/California/7/2009 fusionada con PDISP se presenta en la Figura 10B (SEQ ID NO: 40). Representaciones de los plásmidos 484 y 1897 se presentan en las Figuras 10C y 10D.
Ejemplo 6 - 2X35S/CPMV HT (número de constructo 489), 2X35S/CPMV160+ (número de constructo 1880) y 2X35S/CPMV160 (número de constructo 1885) para H5 Indonesia
Una secuencia codificante correspondiente a H5 nativa de la influenza A/Indonesia/5/2005 (Figura 11A, SEQ ID NO: 41) se clonó en CPMV-HT original, CPMV160+ y CPMV160 mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1), 1800 (ver el Ejemplo 2) y 1935 (ver el Ejemplo 3) respectivamente, pero con cebadores de PCR modificados diseñados específicamente para H5 Indonesia. La secuencia de aminoácidos de H5 nativa de la influenza A/Indonesia/5/2005 se presenta en la Figura 11B (SEQ ID NO: 42). Representaciones de los plásmidos 489, 1880 y 1885 se presentan en la Figura 11C a la Figura 11E.
Ejemplo 7 - 2X35S/CPMV HT (número de constructo 2140) y 2X35S/CPMV160+ (número de constructo 2168) para PDISP-H7 Hangzhou
Una secuencia codificante correspondiente a H7 de la influenza A/Hangzhou/1/2013 en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H7 Hangzhou) (Figura 12A, SEQ ID NO: 43) se clonó en CPMv HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H7 Hangzhou. La secuencia de aminoácidos de la H7 madura de la influenza A/Hangzhou/1/2013 fusionada con PDISP se presenta en la Figura 12B (SEQ ID NO: 44). Representaciones de los plásmidos 2140 y 2168 se presentan en las Figuras 12C y 12D.
Ejemplo 8 - 2X35S/CPMV HT (número de constructo 2130) y 2X35S/CPMV160+ (número de constructo 2188) para PDISP/H7 Hangzhou+H5 Indonesia TMCT
Una secuencia codificante quimérica de hemaglutinina correspondiente al ectodominio de H7 de Influenza A/Hangzhou/1/2013 fusionada al dominio transmembrana y cola citoplasmática (TMCT) de H5 de influenza A/Indonesia/5/2005 y con el péptido señal de la proteína disulfuro isomerasa de alfalfa (PDISP/H7 Hangzhou+H5 Indonesia TMCT) (Figura 13A, SEQ ID NO: 45) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H7 Hangzhou+H5 Indonesia TMCT. La secuencia de aminoácidos de HA madura de H7 Hangzhou+H5 Indonesia TMCT fusionada con PDISP se presenta en la Figura 13B (SEQ ID NO: 46). Representaciones de los plásmidos 2130 y 2188 se presentan en las Figuras 13C y 13D.
Ejemplo 9 - 2X35S/CPMV HT (número de constructo 1039) y 2X35S/CPMV160+ (número de constructo 1937) para PDISP/HA B Brisbane (PrL-)
Una secuencia codificante correspondiente a HA de la influenza B/Brisbane/60/2008 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas del bucle proteolítico en secuencias de HA) en las que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B Brisbane (PrL-)) (Figura 14A, SEQ ID NO: 47) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Brisbane (PrL-). La secuencia de aminoácidos de HA B Brisbane (PrL-) madura fusionada con PDISP se presenta en la Figura 14B (SEQ ID NO: 48). Representaciones de los plásmidos 1039 y 1937 se presentan en la Figura 14C y la Figura 14D.
Ejemplo 10 - 2X35S/CPMV HT (número de constructo 1067) y 2X35S/CPMV160+ (número de constructo 1977) para PDISP/HA B Brisbane (PrL-)+H1 California TMCT
Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de HA de la influenza B/Brisbane/60/08 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013, para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de la influenza A/California/7/2009 y con el péptido señal de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B Brisbane (PrL-)+H1 California TMCT) (Figura 15A, SEQ ID NO: 49) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Brisbane (PrL-)+H1 California TMCT. La secuencia de aminoácidos de HA madura de B Brisbane (PrL-)+H1 California TMCT fusionada con PDISP se presenta en la Figura 15B (SEQ ID NO: 50). Representaciones de los plásmidos 1067 y 1977 se presentan en la Figura 15C y la Figura 15D.
Ejemplo 11 - 2X35S/CPMV HT (número de constructo 2072) y 2X35S/CPMV160+ (número de constructo 2050) para PDISP/HA B Massachussetts (PrL-)
Una secuencia codificante correspondiente a HA de la influenza B/Massachussetts/2/2012 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B
Massachussetts (PrL-)) (Figura 16A, SEQ ID NO: 51) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Massachussetts (PrL-). La secuencia de aminoácidos de HA madura de B Massachussetts (PrL-) fusionada con PDISP se presenta en la Figura 16B (SEQ ID NO: 52). Representaciones de los plásmidos 2072 y 2050 se presentan en la Figura 16C y la Figura 16D.
Ejemplo 12 - 2X35S/CPMV HT (número de constructo 2074) y 2X35S/CPMV160+ (número de constructo 2060) para PDISP/HA B Massachussetts (PrL-)+H1 California TMCT
Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de HA de la influenza B/Massachussetts/2/2012 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm.
61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de la influenza A/California/7/2009 y con el péptido señal de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B Massachussetts (PrL-)+H1 California TMCT) (Figura 17A, Se Q ID NO: 53) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Massachussetts (PrL-)+H1 California TMCT. La secuencia de aminoácidos de la HA madura de B Massachussetts (PrL-)+H1 California Tm Ct fusionada con PDISP se presenta en la Figura 17B (SEQ ID NO: 54). Representaciones de los plásmidos 2074 y 2060 se presentan en las Figuras 17C y 17D.
Ejemplo 13 - 2X35S/CPMV HT (número de constructo 1445), 2X35S/CPMV160+ (número de constructo 1820) y CPMV160 (número de constructo 1975) para HA B Wisconsin (PrL-)
Una secuencia codificante correspondiente a HA de la influenza B/Wisconsin/1/2010 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) con su péptido señal nativo (HA B Wisconsin (PrL-)) (Figura 18A, SEQ ID NO: 55) se clonó en CPMV-HT original, CPMV160+ y CPMV160 mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1), 1800 (ver el Ejemplo 2) y 1935 (ver el Ejemplo 3), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para HA B Wisconsin (PrL-). La secuencia de aminoácidos de HA B Wisconsin (PrL-) con su péptido señal nativo se presenta en la Figura 18B (SEQ ID NO: 56). Representaciones de los plásmidos 1445, 1820 y 1975 se presentan en las Figuras 18C, 18D y 18E, respectivamente.
Ejemplo 14 - 2X35S/CPMV HT (número de constructo 1454) y 2X35S/CPMV160+ (número de constructo 1893) para HA B Wisconsin (PrL-)+H1 California TMCT
Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de HA de la Influenza B/ Wisconsin /2/2012 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de la influenza A/California/7/2009 con el péptido señal nativo de HA B Wisconsin (HA B Wisconsin (PrL-)+H1 California TMCT) (Figura 19A, SEQ ID NO: 57) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para HA B Wisconsin (PrL-)+H1 California TMCT. La secuencia de aminoácidos de HA B Wisconsin (PrL-)+H1 California TMCT se presenta en la Figura 19B (SEQ ID NO: 58). Representaciones de los plásmidos 1454 y 1893 se presentan en las Figuras 19C y 19D.
Ejemplo 15 - 2X35S/CPMV HT (número de constructo 5001) y 2X35S/CPMV160+ (número de constructo 2100) para HC rituximab (Rituxan)
Una secuencia codificante correspondiente a la cadena pesada del anticuerpo IgG1 monoclonal Rituximab (HC rituximab (Rituxan); Figura 20A, SEQ ID NO: 59) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para HC rituximab (Rituxan). La secuencia de aminoácidos de HC rituximab (Rituxan) se presenta en la Figura 20B (SEQ ID NO: 60). Representaciones de los plásmidos 5001 y 2100 se presentan en la Figura 20C y la Figura 20D.
Ejemplo 16 - 2X35S/CPMV HT (número de constructo 5002) y 2X35S/CPMV160+ (número de constructo 2109) para PDISP/HC rituximab (Rituxan)
Una secuencia codificante correspondiente a la cadena pesada del anticuerpo monoclonal IgG1 Rituximab en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/HC rituximab (Rituxan); Figura 21A, SEQ ID NO: 61) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 y 1800, respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HC rituximab (Rituxan). La secuencia de aminoácidos de HA madura de B
Massachussetts (PrL-) fusionada con PDISP se presenta en la Figura 21B (SEQ ID NO: 62). Representaciones de los plásmidos 5002 y 2109 se presentan en la Figura 21C y la Figura 21D.
Ejemplo 17 - 2X35S/CPMV-HT (número de constructo 5021) y 2X35S/CPMV160+ (número de constructo 2120) para LC rituximab (Rituxan)
Una secuencia codificante correspondiente a la cadena ligera del anticuerpo monoclonal IgG1 Rituximab (LC rituximab (Rituxan; Figura 22A, SEQ ID NO: 63) se clonó en CPMV-HT original y c Pm V160+ mediante el uso del mismo método basado en PCR que los constructos 1391 y 1800 respectivamente, pero con cebadores de PCR modificados diseñados específicamente para LC rituximab (Rituxan). La secuencia de aminoácidos de LC rituximab (Rituxan) se presenta en la Figura 22B (SEQ ID NO: 64). Representaciones de los plásmidos 5021 y 2120 se presentan en la Figura 22C y la Figura 22D.
Ejemplo 18 - 2X35S/CPMV-HT (número de constructo 5022) y 2X35S/CPMV160+ (número de constructo 2129) para PDISP/LC rituximab (Rituxan)
Una secuencia codificante correspondiente a la cadena ligera del anticuerpo monoclonal IgG1 Rituximab en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/LC rituximab (Rituxan; Figura 23A, SEQ ID NO: 65) se clonó en CPm V-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 y 1800, respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/LC rituximab (Rituxan). La secuencia de aminoácidos de HA madura de LC rituximab (Rituxan) fusionada con PDISP se presenta en la Figura 23B (SEQ ID NO: 66). Representaciones de los plásmidos 5022 y 2129 se presentan en la Figura 23C y la Figura 23D.
Ejemplo 19: Transfección en Agrobacterium
La cepa de Agrobacterium AGL1 se transfectó por electroporación con los constructos de ADN mediante el uso de los métodos descritos por D'Aoust y otros 2008 (Plant Biotechnology Journal 6: 930-940). Las Agrobacterium transfectadas se cultivaron en medio YEB suplementado con ácido 2-(N-morfolino)etanosulfónico (MES) 10 mM, acetosiringona 20 j M, kanamicina 50 jg/m l y carbenicilina 25 jg/m l pH 5,6 a una DO600 entre 0,6 y 1,6. Las suspensiones de Agrobacterium se centrifugaron antes de su uso y se resuspendieron en medio de infiltración (MgCh 10 mM y MES 10 mM pH 5,6).
Preparación de biomasa vegetal, inóculo y agroinfiltración
Las plantas de Nicotiana benthamiana se cultivaron a partir de semillas en bandejas llenas con un sustrato de turba comercial. Se permitió que las plantas crecieran en el invernadero con un fotoperiodo de 16/8 y un régimen de temperaturas de 25 °C de día/20 °C de noche. Tres semanas después de la siembra, se escogieron plántulas individuales, se trasplantaron en macetas y se dejaron crecer en el invernadero durante tres semanas adicionales en las mismas condiciones ambientales.
Las agrobacterias transfectadas con cada constructo se cultivaron en un medio YEB suplementado con ácido 2-(N-morfolino)etanosulfónico (MES) 10 mM, acetosiringona 20 j M, kanamicina 50 jg/m l y carbenicilina 25 jg/ml, pH 5,6 hasta que alcanzaron una DO600 entre 0,6 y 1,6. Las suspensiones de Agrobacterium se centrifugaron antes de su uso y se resuspendieron en medio de infiltración (MgCh 10 mM y MES 10 mM, pH 5,6) y se almacenaron durante la noche a 4 °C. El día de la infiltración, los lotes de cultivo se diluyeron en 2,5 volúmenes de cultivo y se permitió que se calentaran antes de su uso. Las plantas completas de N. benthamiana se colocaron al revés en la suspensión bacteriana en un tanque de acero inoxidable hermético a vacío de 20-40 Torr durante 2 min. Las plantas se devolvieron al invernadero durante un período de incubación de 2-6 días hasta la cosecha.
Cosecha de hojas y extracción de proteínas totales
Después de la incubación, la parte aérea de las plantas se cosechó, se congeló a -80 °C y se trituró en pedazos. Las proteínas solubles totales se extrajeron mediante homogeneización (Polytron) de cada muestra de material vegetal congelado triturado en 3 volúmenes de Tris 50 mM frío pH 8,0, NaCl 0,15 M, Triton X-100 al 0,1 % y fluoruro de fenilmetanosulfonilo 1 mM. Después de la homogeneización, las suspensiones se centrifugaron a 10000 g durante 10 minutos a 4 °C y estos extractos crudos clarificados (sobrenadante) se guardaron para su análisis.
Ejemplo 20 - Análisis de proteínas e inmunotransferencia
El contenido de proteína total de los extractos crudos clarificados se determinó mediante el ensayo de Bradford (Bio-Rad, Hercules, CA) mediante el uso de albúmina de suero bovino como patrón de referencia. Las proteínas se separaron por SDS-PAGE y se transfirieron por electrotransferencia a membranas de difluoruro de polivinileno (PVDF) (Roche Diagnostics Corporation, Indianápolis, IN) para la inmunodetección. Antes de la inmunotransferencia, las membranas se bloquearon con leche descremada al 5 % y Tween-20 al 0,1 % en solución salina tamponada con Tris (TBS-T) durante 16-18 h a 4 °C.
Claims (15)
1. Un potenciador de la expresión que comprende una secuencia de nucleótidos de UTR 5' del CPMV derivada del ARN-2 del CPMV, la secuencia de nucleótidos de la UTR 5' del CPMV consiste en los nucleótidos 1-160 de la SEQ ID NO: 1 o consiste en los nucleótidos 1-160 de la SEQ ID NO: 69.
2. El potenciador de la expresión de la reivindicación 1, que comprende además una segunda secuencia de aproximadamente 1 a 100 nucleótidos de longitud, fusionada al extremo 3' de la secuencia de nucleótidos de UTR 5' del CPMV.
3. El potenciador de la expresión de la reivindicación 2, en donde la segunda secuencia comprende una secuencia kozak de plantas, un sitio de clonación múltiple, un enlazador, un polienlazador, un sitio de recombinación o una combinación de los mismos.
4. El potenciador de la expresión de la reivindicación 3, en donde la segunda secuencia comprende una secuencia kozak de plantas seleccionada de las SEQ ID NO: 5 -17.
5. El potenciador de la expresión de la reivindicación 2, que comprende una secuencia de nucleótidos de SEQ ID NO: 2.
6. El potenciador de la expresión de la reivindicación 2, que comprende una secuencia de nucleótidos de SEQ ID NO: 75.
7. Un ácido nucleico que comprende el potenciador de la expresión de cualquiera de las reivindicaciones 1 a 6 y una secuencia de nucleótidos de interés, la secuencia de nucleótidos de interés está unida operativamente al extremo 3' del potenciador de la expresión, la secuencia de nucleótidos de interés codifica una proteína de interés.
8. El ácido nucleico de la reivindicación 7, la secuencia de nucleótidos de interés comprende un ATG en el extremo 5', la secuencia de nucleótidos de interés está fusionada al extremo 3' de la secuencia de nucleótidos de la UTR 5' del CPMV del potenciador de la expresión.
9. Un sistema de expresión en plantas que comprende el potenciador de la expresión de cualquiera de las reivindicaciones 1 a 6, en donde el potenciador de la expresión está unido operativamente a una región reguladora en el extremo 5' del potenciador de la expresión.
10. El sistema de expresión en plantas de la reivindicación 9, en donde el potenciador de la expresión está unido operativamente a una secuencia de nucleótidos de interés en el extremo 3' del potenciador de la expresión, la secuencia de nucleótidos de interés codifica una proteína de interés.
11. El sistema de expresión en plantas de la reivindicación 10, en donde el potenciador de la expresión comprende además una UTR 3' de comovirus fusionada al extremo 3' de la secuencia de nucleótidos de interés.
12. El ácido nucleico de la reivindicación 7 o el sistema de expresión en plantas de la reivindicación 10, en donde la secuencia de nucleótidos de interés comprende una secuencia de nucleótidos que codifica una proteína viral o un anticuerpo.
13. El ácido nucleico de la reivindicación 7 o el sistema de expresión en plantas de la reivindicación 10, en donde la secuencia de nucleótidos de interés es una hemaglutinina (HA) de la influenza, seleccionada de B HA, H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 y H16.
14. Un método para producir una proteína de interés en una planta o en una porción de una planta que comprende, introducir por transformación en la planta o en la porción de la planta el sistema de expresión en plantas de la reivindicación 10, e incubar la planta o la porción de la planta en condiciones que permitan la expresión de la secuencia de nucleótidos que codifica la proteína de interés.
15. Una planta o porción de una planta transfectada transitoriamente o transformada de manera estable con el sistema de expresión en plantas de la reivindicación 10.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461925852P | 2014-01-10 | 2014-01-10 | |
PCT/CA2014/050326 WO2014153674A1 (en) | 2013-03-28 | 2014-03-28 | Influenza virus-like particle production in plants |
PCT/CA2015/050009 WO2015103704A1 (en) | 2014-01-10 | 2015-01-08 | Cpmv enhancer elements |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2864081T3 true ES2864081T3 (es) | 2021-10-13 |
Family
ID=53523412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15735364T Active ES2864081T3 (es) | 2014-01-10 | 2015-01-08 | Elementos potenciadores de CPMV |
Country Status (12)
Country | Link |
---|---|
US (2) | US11441150B2 (es) |
EP (1) | EP3092309B1 (es) |
JP (1) | JP6518257B2 (es) |
CN (1) | CN105980561B (es) |
AU (1) | AU2015205805B2 (es) |
BR (1) | BR112016015875A2 (es) |
CA (1) | CA2936350C (es) |
DK (1) | DK3092309T3 (es) |
ES (1) | ES2864081T3 (es) |
RU (1) | RU2699982C2 (es) |
TW (1) | TWI714522B (es) |
WO (1) | WO2015103704A1 (es) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0800272D0 (en) | 2008-01-08 | 2008-02-13 | Plant Bioscience Ltd | Protein expression systems |
BR112016015875A2 (pt) * | 2014-01-10 | 2017-09-19 | Medicago Inc | Elementos intensificadores de cpmv |
RU2020132255A (ru) * | 2018-03-14 | 2022-04-15 | Медикаго Инк. | Энхансер экспрессии в растениях |
BR112021017899A2 (pt) * | 2019-03-14 | 2021-12-21 | Medicago Inc | Intensificador de expressão vegetal endógeno |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9414118D0 (en) | 1994-07-13 | 1994-08-31 | Axis Genetics Ltd | Modified plant viruses as vectors of heterologous peptides |
US6042832A (en) | 1996-08-28 | 2000-03-28 | Thomas Jefferson University | Polypeptides fused with alfalfa mosaic virus or ilarvirus capsid proteins |
US20010006950A1 (en) | 1998-02-11 | 2001-07-05 | Juha Punnonen | Genetic vaccine vector engineering |
US6489537B1 (en) | 1998-08-07 | 2002-12-03 | The Trustees Of The University Of Pennsylvania | Phytochelatin synthases and uses therefor |
US6287570B1 (en) | 1998-11-23 | 2001-09-11 | Patricia L. Foley | Vaccine against swine influenza virus |
US7125978B1 (en) | 1999-10-04 | 2006-10-24 | Medicago Inc. | Promoter for regulating expression of foreign genes |
DK1247095T3 (da) | 1999-12-06 | 2008-12-08 | Univ Illinois | TCR-proteiner med höj affinitet samt fremgangsmåder |
DE10109354A1 (de) | 2001-02-27 | 2002-09-05 | Icon Genetics Ag | Rekombinante virale Schaltersysteme |
AU2003291914A1 (en) * | 2002-12-27 | 2004-07-22 | Centro De Ingenieria Genetica Y Biotecnologia | Artificial promoter for the expression of dna sequences in vegetal cells |
AU2004235800B2 (en) | 2003-05-05 | 2010-02-18 | Dow Agrosciences Llc | Stable immunoprophylactic and therapeutic compositions derived from transgenic plant cells and methods for production |
ZA200508930B (en) | 2003-05-05 | 2007-03-28 | Thompson Boyce Inst Plant Research | Vectors and cells for preparing immunoprotective compositions derived from transgenic plants |
WO2005018539A2 (en) | 2003-06-16 | 2005-03-03 | Medimmune Vaccines, Inc. | Influenza hemagglutinin and neuraminidase variants |
US8080255B2 (en) | 2003-07-11 | 2011-12-20 | Novavax Inc. | Functional influenza virus like particles (VLPs) |
US8592197B2 (en) | 2003-07-11 | 2013-11-26 | Novavax, Inc. | Functional influenza virus-like particles (VLPs) |
ES2662118T3 (es) | 2005-04-29 | 2018-04-05 | University Of Cape Town | Expresión de proteínas virales en las plantas |
CA2615658A1 (en) | 2005-07-19 | 2007-01-25 | Dow Global Technolgies Inc. | Recombinant flu vaccines |
SI1937301T1 (sl) | 2005-10-18 | 2015-08-31 | Novavax, Inc. | Funkcionalni influenčnemu virusu podobni delci (VLP) |
AU2007215080A1 (en) | 2006-02-13 | 2007-08-23 | Fraunhofer Usa, Inc. | Influenza antigens, vaccine compositions, and related methods |
EP2476432B1 (en) | 2006-03-07 | 2015-08-19 | Vaxinnate Corporation | Compositions that include hemagglutinin, methods of making and methods of use thereof |
US7618815B2 (en) | 2006-03-08 | 2009-11-17 | University Of Kentucky Research Foundation | Viral vectors useful in soybean and methods of use |
EP2029755A1 (en) * | 2006-05-22 | 2009-03-04 | Plant Bioscience Limited | Bipartite system, method and composition for the constitutive and inducible expression of high levels of foreign proteins in plants |
WO2008148104A1 (en) | 2007-05-25 | 2008-12-04 | Novavax, Inc. | Novel vlps derived from cells that do not express a viral matrix or core protein |
CN103122354B (zh) | 2007-11-27 | 2018-03-23 | 麦迪卡格公司 | 表达血凝素之转基因植物中生产的重组流感病毒样颗粒(vlp) |
GB0724752D0 (en) * | 2007-12-19 | 2008-01-30 | Bari Mazhar A | Method for producing a thermoelectric material |
GB0800272D0 (en) * | 2008-01-08 | 2008-02-13 | Plant Bioscience Ltd | Protein expression systems |
KR101956910B1 (ko) | 2008-01-21 | 2019-03-12 | 메디카고 인코포레이티드 | 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs) |
EP2413962A1 (en) | 2009-03-30 | 2012-02-08 | Mount Sinai School of Medicine | Influenza virus vaccines and uses thereof |
NZ597401A (en) * | 2009-06-24 | 2013-09-27 | Medicago Inc | Chimeric influenza virus-like particles comprising hemagglutinin |
US20120185969A1 (en) | 2009-09-04 | 2012-07-19 | Syngenta Participations Ag | Stacking of translational enhancer elements to increase polypeptide expression in plants |
KR20180026562A (ko) | 2009-09-22 | 2018-03-12 | 메디카고 인코포레이티드 | 식물-유래 단백질의 제조방법 |
US10226527B2 (en) | 2010-10-04 | 2019-03-12 | Massachusetts Institute Of Technology | Hemagglutinin polypeptides, and reagents and methods relating thereto |
AU2011325827B2 (en) | 2010-11-04 | 2016-08-04 | Medicago Inc. | Plant expression system |
TWI526539B (zh) | 2010-12-22 | 2016-03-21 | 苜蓿股份有限公司 | 植物中生產類病毒顆粒(vlp)的方法及以該方法生產之vlp |
TWI620816B (zh) | 2011-03-23 | 2018-04-11 | 苜蓿股份有限公司 | 植物衍生蛋白回收方法 |
EP2718428B1 (en) | 2011-06-13 | 2018-03-07 | Medicago Inc. | Rabies virus like particle production in plants |
PL220281B1 (pl) | 2011-09-23 | 2015-09-30 | Inst Biochemii I Biofizyki Polskiej Akademii Nauk | Szczepionka DNA, sposób indukowania odpowiedzi immunologicznej, przeciwciała specyficznie rozpoznające białko hemaglutyniny H5 wirusa grypy i zastosowanie szczepionki DNA |
US11155581B2 (en) | 2011-09-30 | 2021-10-26 | Medicago Inc. | Increasing virus-like particle yield in plants |
WO2013068593A1 (en) | 2011-11-11 | 2013-05-16 | Philip Morris Products S.A. | Influenza virus -like particles (vlps) comprising hemagglutinin produced nicotiana tabacum |
EP2876161B1 (en) | 2012-07-23 | 2018-12-05 | The Institute of Biological Resources | Vaccine |
CN105247059B (zh) * | 2013-03-28 | 2021-07-06 | 莫迪卡戈公司 | 植物中流感样病毒颗粒的产生 |
BR112016015875A2 (pt) * | 2014-01-10 | 2017-09-19 | Medicago Inc | Elementos intensificadores de cpmv |
ES2912291T3 (es) * | 2014-03-27 | 2022-05-25 | Medicago Inc | Elementos potenciadores de CPMV modificados |
-
2015
- 2015-01-08 BR BR112016015875A patent/BR112016015875A2/pt not_active Application Discontinuation
- 2015-01-08 CA CA2936350A patent/CA2936350C/en active Active
- 2015-01-08 ES ES15735364T patent/ES2864081T3/es active Active
- 2015-01-08 AU AU2015205805A patent/AU2015205805B2/en active Active
- 2015-01-08 RU RU2016132865A patent/RU2699982C2/ru active
- 2015-01-08 TW TW104100482A patent/TWI714522B/zh active
- 2015-01-08 EP EP15735364.0A patent/EP3092309B1/en active Active
- 2015-01-08 JP JP2016545837A patent/JP6518257B2/ja active Active
- 2015-01-08 US US15/110,696 patent/US11441150B2/en active Active
- 2015-01-08 CN CN201580007060.9A patent/CN105980561B/zh active Active
- 2015-01-08 WO PCT/CA2015/050009 patent/WO2015103704A1/en active Application Filing
- 2015-01-08 DK DK15735364.0T patent/DK3092309T3/da active
-
2020
- 2020-05-21 US US16/880,583 patent/US11884929B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20170029832A1 (en) | 2017-02-02 |
US11884929B2 (en) | 2024-01-30 |
RU2699982C2 (ru) | 2019-09-11 |
CN105980561B (zh) | 2020-06-02 |
RU2016132865A3 (es) | 2018-08-28 |
EP3092309B1 (en) | 2021-02-24 |
AU2015205805B2 (en) | 2020-11-12 |
CA2936350C (en) | 2023-01-31 |
DK3092309T3 (da) | 2021-04-12 |
EP3092309A4 (en) | 2017-06-28 |
US20200283784A1 (en) | 2020-09-10 |
JP6518257B2 (ja) | 2019-05-22 |
US11441150B2 (en) | 2022-09-13 |
BR112016015875A2 (pt) | 2017-09-19 |
JP2017501738A (ja) | 2017-01-19 |
WO2015103704A1 (en) | 2015-07-16 |
EP3092309A1 (en) | 2016-11-16 |
CA2936350A1 (en) | 2015-07-16 |
AU2015205805A1 (en) | 2016-08-04 |
TW201610154A (zh) | 2016-03-16 |
RU2016132865A (ru) | 2018-02-14 |
TWI714522B (zh) | 2021-01-01 |
CN105980561A (zh) | 2016-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6025214B2 (ja) | 植物発現系 | |
ES2912291T3 (es) | Elementos potenciadores de CPMV modificados | |
US11884929B2 (en) | CPMV enhancer elements | |
ES2826402T3 (es) | Producción de partículas similares a rotavirus en plantas | |
AU2015286165B2 (en) | Modifying protein production in plants | |
JP2022534464A (ja) | 内因性植物発現エンハンサー |