WO2009121994A1 - Proteínas de fusión con un dominio lectina de tipo beta-trébol, procedimiento de obtención y sus aplicaciones - Google Patents
Proteínas de fusión con un dominio lectina de tipo beta-trébol, procedimiento de obtención y sus aplicaciones Download PDFInfo
- Publication number
- WO2009121994A1 WO2009121994A1 PCT/ES2009/070079 ES2009070079W WO2009121994A1 WO 2009121994 A1 WO2009121994 A1 WO 2009121994A1 ES 2009070079 W ES2009070079 W ES 2009070079W WO 2009121994 A1 WO2009121994 A1 WO 2009121994A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- peptide
- sequence
- protein
- fusion protein
- seq
- Prior art date
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 52
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims description 37
- 108090001090 Lectins Proteins 0.000 title abstract description 10
- 102000004856 Lectins Human genes 0.000 title abstract description 10
- 239000002523 lectin Substances 0.000 title abstract description 10
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 61
- 230000014509 gene expression Effects 0.000 claims abstract description 37
- 238000000746 purification Methods 0.000 claims abstract description 34
- 235000000346 sugar Nutrition 0.000 claims abstract description 7
- 229920000936 Agarose Polymers 0.000 claims abstract description 6
- 150000008163 sugars Chemical class 0.000 claims abstract description 5
- 108090000623 proteins and genes Proteins 0.000 claims description 123
- 102000004169 proteins and genes Human genes 0.000 claims description 94
- 210000004027 cell Anatomy 0.000 claims description 67
- 239000013612 plasmid Substances 0.000 claims description 33
- 238000010276 construction Methods 0.000 claims description 32
- 239000013604 expression vector Substances 0.000 claims description 28
- 230000002068 genetic effect Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 25
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 22
- 241000588724 Escherichia coli Species 0.000 claims description 19
- 238000005406 washing Methods 0.000 claims description 17
- 239000002773 nucleotide Substances 0.000 claims description 15
- 125000003729 nucleotide group Chemical group 0.000 claims description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 13
- 239000012504 chromatography matrix Substances 0.000 claims description 10
- 240000005995 Laetiporus sulphureus Species 0.000 claims description 9
- 238000004587 chromatography analysis Methods 0.000 claims description 9
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 8
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 7
- 238000002955 isolation Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000028327 secretion Effects 0.000 claims description 7
- 239000000287 crude extract Substances 0.000 claims description 6
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 239000013603 viral vector Substances 0.000 claims description 5
- 238000010494 dissociation reaction Methods 0.000 claims description 4
- 230000005593 dissociations Effects 0.000 claims description 4
- 230000002797 proteolythic effect Effects 0.000 claims description 4
- 241000672609 Escherichia coli BL21 Species 0.000 claims description 3
- 241000233866 Fungi Species 0.000 claims description 3
- 235000007714 Laetiporus sulphureus Nutrition 0.000 claims description 3
- 101710135898 Myc proto-oncogene protein Proteins 0.000 claims description 3
- 102100038895 Myc proto-oncogene protein Human genes 0.000 claims description 3
- 101710150448 Transcriptional regulator Myc Proteins 0.000 claims description 3
- 229920002704 polyhistidine Polymers 0.000 claims description 3
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 abstract description 8
- 239000008101 lactose Substances 0.000 abstract description 8
- 239000003480 eluent Substances 0.000 abstract description 3
- 229930182830 galactose Natural products 0.000 abstract description 3
- 238000001042 affinity chromatography Methods 0.000 abstract 1
- 238000007429 general method Methods 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 91
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 34
- 108010076818 TEV protease Proteins 0.000 description 23
- 239000000872 buffer Substances 0.000 description 20
- 108091008146 restriction endonucleases Proteins 0.000 description 18
- 238000003752 polymerase chain reaction Methods 0.000 description 16
- 239000012505 Superdex™ Substances 0.000 description 15
- 229920002684 Sepharose Polymers 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 12
- 238000005119 centrifugation Methods 0.000 description 12
- 239000013049 sediment Substances 0.000 description 12
- 239000007983 Tris buffer Substances 0.000 description 11
- 238000010367 cloning Methods 0.000 description 11
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 239000013600 plasmid vector Substances 0.000 description 10
- 241000894006 Bacteria Species 0.000 description 9
- 238000002523 gelfiltration Methods 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 102000003960 Ligases Human genes 0.000 description 8
- 108090000364 Ligases Proteins 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000010828 elution Methods 0.000 description 7
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 7
- 229930027917 kanamycin Natural products 0.000 description 7
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 7
- 229960000318 kanamycin Drugs 0.000 description 7
- 229930182823 kanamycin A Natural products 0.000 description 7
- 229960001375 lactose Drugs 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 101710118538 Protease Proteins 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 101710137373 Dermonecrotic toxin LspiSicTox-betaIII1 Proteins 0.000 description 5
- 101710180073 Dermonecrotic toxin SdSicTox-betaIIB1ai Proteins 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 244000005700 microbiome Species 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 238000000108 ultra-filtration Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 108010064785 Phospholipases Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 3
- 241001135700 Arcanobacterium haemolyticum Species 0.000 description 3
- 241001195348 Nusa Species 0.000 description 3
- 102000015439 Phospholipases Human genes 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- 101100182770 Streptococcus phage Cp-7 CPL7 gene Proteins 0.000 description 3
- 102100036407 Thioredoxin Human genes 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 238000002050 diffraction method Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 235000014304 histidine Nutrition 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 108060008226 thioredoxin Proteins 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 229920000856 Amylose Polymers 0.000 description 2
- GUBGYTABKSRVRQ-DCSYEGIMSA-N Beta-Lactose Chemical compound OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-DCSYEGIMSA-N 0.000 description 2
- 108010041952 Calmodulin Proteins 0.000 description 2
- 102000000584 Calmodulin Human genes 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 2
- 108010020195 FLAG peptide Proteins 0.000 description 2
- 108060003393 Granulin Proteins 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 108010058683 Immobilized Proteins Proteins 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 239000007801 affinity label Substances 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 150000002411 histidines Chemical class 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108091008023 transcriptional regulators Proteins 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- 241000242764 Aequorea victoria Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 101150033322 CPL7 gene Proteins 0.000 description 1
- 101710168661 Calmodulin-7 Proteins 0.000 description 1
- 241000186225 Corynebacterium pseudotuberculosis Species 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 101710102075 Glutathione S-transferase 1 Proteins 0.000 description 1
- 101000777488 Heteractis magnifica DELTA-stichotoxin-Hmg2b Proteins 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000702051 Streptococcus phage CP-7 Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 208000025087 Yersinia pseudotuberculosis infectious disease Diseases 0.000 description 1
- CTPQAXVNYGZUAJ-LXOASSSBSA-N [(1s,2s,4r,5s)-3-hydroxy-2,4,5,6-tetraphosphonooxycyclohexyl] dihydrogen phosphate Chemical compound OC1[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)C(OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O CTPQAXVNYGZUAJ-LXOASSSBSA-N 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- CTPQAXVNYGZUAJ-WPRNADSXSA-N inositol-(1,3,4,5,6)-pentakisphosphate Chemical compound O[C@H]1[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O CTPQAXVNYGZUAJ-WPRNADSXSA-N 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 244000000010 microbial pathogen Species 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 101150066372 pld gene Proteins 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 230000003381 solubilizing effect Effects 0.000 description 1
- 108010018381 streptavidin-binding peptide Proteins 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
- C07K14/42—Lectins, e.g. concanavalin, phytohaemagglutinin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
Definitions
- the invention can be framed in a generic way in the biotechnology sector, with obvious applications in the pharmaceutical field and, currently, in the development of high performance structural genomics projects. More specifically, the invention would be framed in the processes of production and purification of fusion proteins.
- Some systems considered are based on mammalian, yeast or insect eukaryotic cells (Greene, JJ. (2004). Methods Mol. Biol. 267, 3-14; DaIy, R. & Hearn, MT. (2005). J. Mol. Recognit. 18, 119-138; Kost, TA, Condreay, JP. & Jarvis, DL (2005). Nat. Biotechnol. 23, 567-575) or cell-free systems (Murthy, TV, Wu, W ., Qiu, QQ, Shi, Z. Labaer, J. & Brizuela, L. (2004). Prot. Expr. Purif. 36, 217-225).
- affinity tag because they allow to develop generic purification protocols based on affinity chromatographs, while in Ia
- Trx Trx
- MBP has become one of the affinity labels on which most interest one of the most widely studied (Dyson, MR, Shadbolt, SP, Vincent, KJ, Perera, RL & McCafferty, J. (2004). BMC Biotechnol.
- An aspect of the invention constitutes a recombinant fusion protein, hereinafter fusion protein of the invention, comprising at least one sequence of the following group: a) the amino acid sequence of the LSLi 50 peptide of the Laetiporus sulphureus (SEQ) fungus ID NO2), and b) a sequence analogous to SEQ ID NO2 of a).
- analogous is intended to include any amino acid sequence that can be isolated or constructed based on the amino acid sequence shown in the SEQ. ID NO2, for example, by the introduction of conservative or non-conservative amino acid substitutions, including the insertion of one or more amino acids, the addition of one or more amino acids at any of the ends of the molecule or the deletion of one or more amino acids at any end or inside the sequence.
- an analogous amino acid sequence is substantially homologous to the amino acid sequence identified as SEQ ID NO2.
- Ia "substantially homologous" expression means that the amino acid sequences in question have a degree of identity, at the amino acid level, of at least 60%, preferably of at least 85%, or more preferably of at least 95%
- Another aspect of the invention constitutes the method of obtaining the fusion protein, hereinafter the method of the invention, which comprises the following steps:
- the gene construction or expression vector of i) under the control of suitable promoters allows the expression of the fusion protein or peptide of interest, and purification of the crude extract of the cells, iii) Immobilization of the protein or peptide of fusion in matrices derived from agarose by passing crude extract of ii) through the matrix, iv) Dissociation of the fusion protein or peptide from the chromatographic matrix by washing the matrix with a medium containing one or more competing sugars , and, optionally v) Separation of the SEQ ID NO2 peptide from the fusion protein by suitable proteolytic treatment.
- step i) of the process of the invention it is necessary to develop a genetic construction comprising the DNA sequence encoding the peptide SEQ ID NO2, the protein or peptide of interest and optionally, an endoprotease recognition sequence, for example , TEV (tobaceous etch virus endoprotease) in order to separate the affinity tag from the protein of interest.
- an endoprotease recognition sequence for example , TEV (tobaceous etch virus endoprotease)
- Another aspect of the invention constitutes a genetic construction coding for the DNA sequence coding for the fusion protein of the invention, hereinafter genetic construction of the invention, which comprises, at least, a sequence of the following group: a) Ia DNA sequence SEQ ID NO1, and b) a sequence homologous to SEQ ID NO1.
- the genetic construction of the invention allows the expression of a protein of interest linked to the peptide of SEQ ID NO2.
- This genetic construction of the invention may also comprise, if necessary and to allow a better isolation, detection or secretion outside the cell of the expressed peptide of interest, a nucleotide sequence encoding a peptide capable of being used for purposes. for isolation, detection or secretion of said peptide.
- a particular object of the present invention constitutes a genetic construction of the invention comprising any other nucleotide sequence encoding a peptide or peptide sequence that allows the isolation, detection or secretion outside the cell of the expressed peptide , for example, by way of illustration and without limiting the scope of the invention, a polyhistidine sequence (6xHis), a peptide sequence recognizable by a monoclonal antibody (for example, for identification, or any other that serves to purify the protein of fusion resulting by immunoaffinity chromatography: tag peptides such as c-myc, HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David La ⁇ e (1999). CoId Spring Harbor Laboratory Press. New York.
- another aspect of the present invention constitutes an expression vector, hereinafter the expression vector of the invention, comprising a genetic construction of the invention and allowing the expression of a protein or peptide. Examples of a particular embodiment can be found in the examples of the present invention.
- an expression vector comprises, in addition to the genetic construction described in the invention, a promoter that directs its transcription (for example, pT7, plac, ptrc, ptac, pBAD, ret, etc.), to which it is operatively linked , and other necessary or appropriate sequences that control and regulate said transcription and, where appropriate, the translation of the product of interest, for example, transcription initiation and termination signals (tlt2, etc.), polyadenylation signal, origin of replication , ribosome binding sequences (RBS), coding sequences of transcriptional regulators, (enhancers), transcriptional silencers (silencers), repressors, etc.
- a promoter that directs its transcription for example, pT7, plac, ptrc, ptac, pBAD, ret, etc.
- other necessary or appropriate sequences that control and regulate said transcription and, where appropriate, the translation of the product of interest, for example, transcription initiation and termination signals (t
- expression vectors can be selected according to the conditions and needs of each specific case among expression plasmids, viral vectors (DNA or RNA), cosmids, artificial chromosomes, etc. which may also contain markers that can be used to select cells transfected or transformed with the gene or genes of interest.
- the choice of the vector will depend on the host cell and the type of use to be performed. Therefore, according to one embodiment Particular of the present invention said vector is a plasmid or a viral vector.
- the obtaining of said vector can be carried out by conventional methods known to those skilled in the art, as well as for the transformation of microorganisms and eukaryotic cells different widely known methods can be used - chemical transformation, electroporation, microinjection, etc.
- Another aspect of the present invention constitutes a host cell, hereinafter cell of the invention, which comprises the genetic construction or the expression vector of the invention, preferably a prokaryotic cell.
- a particular embodiment of the invention constitutes a host cell of the invention constituted by an E. coli cell, preferably E. coli BL21 DE3 cells.
- the present invention relates to a new general or universal method of expression and purification of fusion proteins containing a ⁇ -clover lectin domain as an affinity tag.
- the present invention is based on the fact that the inventors have observed that the lectin module of the hemolytic protein of the fungus Laetiporus sulphureus (the first 150 amino acids: LSL150) (SEQ ID NO2) is functional as a constituent part of numerous recombinant fusion proteins designed ad hoc. That is, on the one hand, Ia
- SEQ ID NO2 is versatile from a protein folding perspective because it folds properly being accompanied by different proteins at its C-terminal end and, on the other, retains its sugar binding capacity.
- the recombinant proteins of interest fused to the C-terminal end of SEQ ID NO2 also fold properly, as deduced from the results of activity carried out with the pure proteins.
- these proteins of interest maintain their native state even once separated from SEQ ID NO2 by proteolytic treatment (TEV protease; see below). All this has allowed to purify various fusion proteins containing the SEQ ID NO2 at its N-terminal end using a single purification protocol.
- SEQ ID NO2 (of eukaryotic origin) is produced in E. coli (prokaryotic) with a high yield (approx. 80 mg per liter of culture), folding properly.
- E. coli prokaryotic
- Figure 3 the three-dimensional structure of SEQ ID NO2 produced in E. coli that they have determined is essentially equal to that of the corresponding LSL lectin module isolated directly from the L. sulphureus fungus ( Figure 3). This structure guarantees the proper folding of SEQ ID NO2 expressed heterologously in a prokaryotic organism, which is not always obvious.
- the yield with which the constructed fusion proteins are obtained is such that it allows to tackle projects of crystallization of the pure proteins, once separated from SEQ ID NO2, with a low cost.
- the A. haemolyticum PLD protein see example 3
- its expression with a histidine tag (His6 tag) under the same conditions as LSL 150 -PLD did not allow obtaining the soluble fusion protein. That is, the sequence SEQ ID NO2 has affinity and solubility label properties.
- SEQ ID NO2 allows to produce different fusion proteins with high yields and to establish a purification protocol for them of a general, efficient, simple and low cost nature. These characteristics are due to factors of different nature. In the first place, it is because the method of purification of the fusion protein implies a single chromatographic affinity stage. Secondly, the cost of the main components used in this protocol, that is, chromatographic matrices derived from agarose (Sepharose TM 4B, 6B, CL-4B, CL-6B) and eluents (D (+) - lactose ), is surprisingly low.
- the chromatographic matrices used do not require any additional chemical treatment to act as affinity matrices against the sequence SEQ ID NO2 and, on the other, being essentially inert to the homogenized cell and not requiring regenerations beyond buffer washing, can be reused essentially continuously.
- one aspect of the invention constitutes a recombinant fusion protein, hereinafter fusion protein of the invention, comprising at least one sequence of the following group: c) the amino acid sequence of the fungus LSL150 peptide
- Laetiporus sulphureus (SEQ ID NO2), and d) a sequence analogous to SEQ ID NO2 of a).
- analogous is intended to include any amino acid sequence that can be isolated or constructed based on the amino acid sequence shown in the SEQ. ID NO2, for example, by the introduction of conservative or non-conservative amino acid substitutions, including the insertion of one or more amino acids, the addition of one or more amino acids at any of the ends of the molecule or the deletion of one or more amino acids at any end or within the sequence.
- an analogous amino acid sequence is substantially homologous to the amino acid sequence identified as SEQ ID N02.
- the expression “substantially homologous” means that the amino acid sequences in question have a degree of identity, at the level of amino acids, of at least 60%, preferably of at least 85% , or more preferably of at least 95%.
- Another aspect of the invention constitutes the method of obtaining the fusion protein, hereinafter the method of the invention, which comprises the following steps: v) Obtaining a gene construction comprising the nucleotide sequence of LSL 150 (SEQ ID NO1 ) and the sequence coding for the protein or peptide of interest, and of the expression vector that it comprises, vi) Transformation of a host cell, preferably prokaryotic, more preferably Escher ⁇ chia coli, in which the gene construct or the vector of expression of i) under control of suitable promoters, allows the expression of the fusion protein or peptide of interest, and purification of the crude extract from the cells, vii) Immobilization of the fusion protein or peptide in matrices derived from agarose by means of the passage of crude extract of ii) through the matrix, viii) Dissociation of the fusion protein or peptide from the chromatographic matrix ica by washing the matrix with a medium containing one or several competing sugars, and, optionally v) Separat
- step i) of the process of the invention it is necessary to develop a genetic construction comprising the DNA sequence encoding the peptide SEQ ID NO2, the protein or peptide of interest and optionally, an endoprotease recognition sequence, for example , TEV (tobaceous etch virus endoprotease) in order to separate the affinity tag from the protein of interest.
- an endoprotease recognition sequence for example , TEV (tobaceous etch virus endoprotease)
- Another aspect of the invention constitutes a genetic construction coding for the DNA sequence coding for the fusion protein of the invention, hereinafter genetic construction of the invention, which comprises, at least, a sequence of the following group: c) Ia DNA sequence SEQ ID NO1, and d) a sequence homologous to SEQ ID NO1.
- the genetic construction of the invention allows the expression of a protein of interest linked to the peptide of SEQ ID NO2.
- This genetic construction of the invention may also comprise, if necessary and to allow a better isolation, detection or secretion outside the cell of the expressed peptide of interest, a nucleotide sequence encoding a peptide capable of being used for purposes. for isolation, detection or secretion of said peptide.
- a particular object of the present invention constitutes a genetic construction of the invention comprising any other nucleotide sequence encoding a peptide or peptide sequence that allows the isolation, detection or secretion outside the cell of the expressed peptide , for example, by way of illustration and without limiting the scope of the invention, a polyhistidine sequence (6xHis), a peptide sequence recognizable by a monoclonal antibody (for example, for identification, or any other that serves to purify the resulting fusion protein by immunoaffinity chromatography: label peptides such as c-myc , HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David La ⁇ e (1999). CoId Spring Harbor Laboratory Press. New York. Chapter: Tagging proteins. Pp. 347-377).
- Said nucleotide sequences can be integrated into a gene expression vector that allows the regulation of the expression thereof under suitable conditions inside the cells.
- another aspect of the present invention constitutes an expression vector, hereinafter the expression vector of the invention, comprising a genetic construction of the invention and allowing the expression of a protein or peptide. Examples of a particular embodiment can be found in the examples of the present invention.
- an expression vector comprises, in addition to the genetic construction described in the invention, a promoter that directs its transcription (for example, pT7, plac, ptrc, ptac, pBAD, ret, etc.), to which it is operatively linked , and other necessary or appropriate sequences that control and regulate said transcription and, where appropriate, the translation of the product of interest, for example, transcription initiation and termination signals (tlt2, etc.), polyadenylation signal, origin of replication , ribosome binding sequences (RBS), sequences encoders of transcriptional regulators, (enhancers), transcriptional silencers (silencers), repressors, etc.
- a promoter that directs its transcription for example, pT7, plac, ptrc, ptac, pBAD, ret, etc.
- other necessary or appropriate sequences that control and regulate said transcription and, where appropriate, the translation of the product of interest, for example, transcription initiation and termination signals (
- expression vectors can be selected according to the conditions and needs of each specific case among expression plasmids, viral vectors (DNA or RNA), cosmids, artificial chromosomes, etc. which may also contain markers that can be used to select cells transfected or transformed with the gene or genes of interest.
- the choice of the vector will depend on the host cell and the type of use to be performed. Therefore, according to a particular embodiment of the present invention said vector is a plasmid or a viral vector.
- the obtaining of said vector can be carried out by conventional methods known to those skilled in the art, as well as for the transformation of microorganisms and eukaryotic cells different widely known methods can be used - chemical transformation, electroporation, microinjection, etc.
- Another aspect of the present invention constitutes a host cell, hereinafter cell of the invention, which comprises the genetic construction or the expression vector of the invention, preferably a prokaryotic cell.
- a particular embodiment of the invention constitutes a host cell of the invention constituted by an E. coli cell, preferably E. coli BL21 DE3 cells.
- FIG. 1 Plasmid pKLSL150 and sequence of the LSL 150 protein.
- Left part scheme of the expression vector pKLSL150 containing Ia 450 nt sequence coding for the LSL 150 protein under the control of the T7 promoter and an IPTG inducible regulator. This plasmid contains the Kanamycin resistance gene (Kan), the lacl repressor gene, and a multiple cloning site (Ncol / Xhol).
- Right part nucleotide and amino acid sequence of the LSL 150 protein flanked by the Ncol and EcoRI restriction sites used in the cloning.
- Figure 2. Analysis by SDS-PAGE of the purification of the LSL 150 fusion protein.
- samples of different fractions of the elution profile of LSL 150 appear when washing the column with buffer containing 0.2 M lactose.
- molecular mass patterns with their corresponding masses in kDa are shown.
- Figure 3 Three-dimensional structure of the LSLi 50 protein.
- Left part representation of the LSL 150 peptide skeleton (black: ⁇ strands; gray: loops).
- Right part peptide skeleton of the lectin module of the complete protein isolated directly from the fungus Laetiporus sulphureus
- FIG. 4 Plasmid pKLSLt and recognition sequence of the TEV protease.
- Upper part pKLSLt expression vector scheme derived from pKLSL150 ( Figure 1). In it, the sequences encoding the linker and the recognition site for the TEV protease have been inserted at the 3 ' end of the sequence that codes for the LSL 150 protein. The situation of a multiple cloning site (EcoRI / Xhol) is also indicated.
- Bottom nucleotide and amino acid sequence of C-terminal end of LSL 150, as well as the linker, of the TEV cutting sequence and of the restriction sites.
- Figure 5. Plasmid pKLSLt-EGFP.
- Upper part scheme of the pKLSLt -EGFP expression vector derived from pKLSLt ( Figure 4) in which the sequence coding for the Enhancer Green has been inserted
- EGFP Fluorescence Protein
- Figure 6. Analysis by SDS-PAGE of the expression and purification of the LSL 150 -EGFP fusion protein and its treatment with the TEV protease. Streets: 1. molecular mass markers (kDa); 2. soluble fraction of the cell homogenate; 3. LSL150-EGFP protein after Sepharose TM 4B; 4. treatment of LSL150-EGFP with TEV protease; 5. EGFP after gel filtration with Superdex 75; 6. LSL 150 after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
- Figure 7. Plasmid pKLSLt-PLD.
- Upper part scheme of the pKLSLt -PLD expression vector derived from pKLSLt ( Figure 4) in which the sequence coding for the PLD protein (sphingomyelin-dependent phospholipase of the microorganism Arcanobacterium haemolyticum) of 846 bp between the restriction sites has been inserted EcoRI and Hind III.
- Lower part nucleotide and amino acid sequence of the TEV cutting site and part of the cloned protein.
- Ia LSL 150 -PLD fusion protein and its treatment with TEV protease Streets: 1. molecular mass markers (kDa); 2. soluble fraction of the cell homogenate; 3. LSL 150 -PLD protein after Sepharose TM 4B; 4. treatment of LSL 150 -PLD with TEV protease; 5. PLD after gel filtration with Superdex 75; 6. LSLi 50 after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
- Figure 9. Plasmid pKLSLt-SMD.
- Upper part pKLSLt -SMD expression vector scheme derived from pKLSLt ( Figure 4) in which the sequence coding for the SMD protein (sphingomyelin dependent phospholipase of the microorganism Corynebacterium pseudotuberculosis) of 802 bp between the restriction sites has been inserted EcoRI and Hind ///.
- Lower part nucleotide and amino acid sequence of the TEV cutting site and part of the cloned protein.
- Figure 10 Analysis by SDS-PAGE of the expression and purification of the LSLi 50 -SMD fusion protein and its treatment with the TEV protease. Streets: 1. molecular mass markers (kDa); 2. soluble fraction of the cell homogenate; 3. LSLi 50- SMD protein after Sepharose TM 4B; 4. treatment of LSLi 50 -SMD with TEV protease; 5. SMD after gel filtration with Superdex 75; 6. LSLi 50 after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
- FIG. 11 Plasmid pKLSLt-CPL7.
- Upper part pKLSLt -CPL7 expression vector scheme derived from pKLSLt ( Figure 4) in which the sequence coding for the CPL7 protein (phage Murein hydrolase Cp-7 of the Streptoccocus pneumoniae microorganism) of 1003 bp has been inserted between EcoRI and Hind III restriction sites.
- Lower part nucleotide and amino acid sequence of the TEV cutting site and part of the cloned protein.
- FIG. 12 Analysis by SDS-PAGE of the expression and purification of the LSLi 50 -CPL7 fusion protein and its treatment with the TEV protease. Streets: 1. molecular mass markers (kDa); 2. fraction soluble cell homogenate; 3. LSI_i 5 o-CPL7 protein after Sepharose TM 4B; 4. treatment of LSLi 50 -CPL7 with TEV protease; 5. CPL7 after gel filtration with Superdex 75; 6. LSLi 50 after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
- FIG. 13 Plasmid pKLSI_t-IP5_2K.
- Upper part scheme of the expression vector pKLSLt -IP5_2K derived from pKLSLt ( Figure 4) in which the sequence coding for the protein IP5_2K (Inositol (1, 3,4,5,6) -pentakisphosphate kinase from Arabidopsis has been inserted thaliana) of 1353 bp between the EcoRI and Hind III restriction sites.
- Lower part nucleotide and amino acid sequence of the TEV cutting site and part of the cloned protein.
- FIG. 14 Analysis by SDS-PAGE of the expression and purification of the LSLiso-IP5_2K fusion protein and its treatment with the TEV protease. Streets: 1. soluble fraction of the cell homogenate; 2 molecular mass markers (kDa) .; 3. LSLiso-IP5_2K protein after Sepharose TM 4B; 4. treatment of LSLiso-IP5_2K with TEV protease; 5. IP5_2K after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
- Example 1 Development of the vector with the lectin domain ⁇ -clover of the fungus Laetiporus sulphureus
- the gene coding for this peptide LSL150 was expressed heterologously in E. coli.
- the LSL 150 peptide of the invention (SEQ ID NO2) is the lectin module of the LSL modular protein (Mr 35 kDa) produced by the fungus Laetiporus sulphureus (Tateno, H. & Goldstein, IJ. (2003). J. Biol. Chem. 278, 40455-40463).
- LSL150 is constituted by the first 150 amino acids of LSL (17 kDa), which they adopt a structure called ⁇ -clover (Manche ⁇ o. JM, Tateno, H., Goldstein, IJ., Mart ⁇ nez-Ripoll, M. & Hermoso, JA (2005). J. Biol. Chem. 280, 17251-17259).
- This can be described as a small ⁇ barrel formed by 6 ⁇ strands, at one of whose ends is the so-called loop triplet.
- the structure as a whole results from the triplication of a basic structural unit of about 50 wastes, each of which would have the ability to bind sugars derived from galactose.
- LSL 150 has three potential sugar binding sites, two of which are competent to bind disaccharides containing galactose as demonstrated (Manche ⁇ o. JM, Tateno, H., Goldstein, IJ., Mart ⁇ nez-Ripoll, M. & Hermoso, JA (2005) J. Biol. Chem. 280, 17251-17259).
- plasmid vector pKLSL150 ( Figure 1) was constructed by inserting the open reading phase of the first 450 nt of the LSL protein gene (LSL 450 ) into vector pET28a + (Novagen). The insert was obtained by means of a polymerase chain reaction (PCR) using pET43-LSLa as a template (Tateno, H. & Goldstein, IJ. (2003).
- PCR polymerase chain reaction
- E. coli bacteria (BL21 DE3) were transformed with the expression vector pKLSL150, where the expression of the gene that codes for it is under the transcriptional control of the T7 promoter.
- E. coli cells were grown in 1 L of Luria Bertani LB medium containing kanamycin (50 ⁇ g / mL) for 3-4 hours at 37 0 C, until an OD 6 oonm of 0.6 was reached, at which point the expression is induced of the protein by adding 0.3 mM IPTG and subsequent incubation at 16 0 C for 20 hours. Cell cultures were separated from the culture medium by centrifugation at 4000 xg for 15 min.
- the sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
- the resuspended sediment was passed through a French press.
- the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes. This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
- LSLi 50 The three-dimensional structure of recombinant LSLi 50 has been determined by protein crystallography, finding that it is perfectly superimposable ( rmsd 1.1 A for 148 carbons) to the lectin domain of LSL isolated directly from the fungus Laetiporus sulphureus ( Figure 3), which It guarantees the proper folding of this heterologously expressed protein.
- Figure 3 The extraordinary performance of the production of LSLi 50 , which points to very efficient stages of transcription and translation, as well as the efficiency, simplicity and perfectly acceptable costs of the purification protocol led to the approach of the working hypothesis that LSL150 could act as affinity and solubility label in the production of fusion proteins.
- this molecule has very attractive characteristics as a fusion label: first, it is extraordinarily soluble (solutions of up to 60-80 mg / ml have been prepared). Although this characteristic is not a sufficient requirement to be considered a solubilizing agent, it is a necessary requirement to be; secondly, it is monomeric, so it will not contribute to the establishment of intermolecular interactions between the fusion proteins of which it is part, and thirdly, it lacks cysteine residues, which implies the absence of oxidation problems .
- the plasmid vector pKLSLt was constructed by inserting in the vector pET28a + (Novagen) the open reading phase of the first 450 nt of the LSL protein gene (LSL450) followed by the nucleotide sequences encoding a binding linker and the TEV protease recognition site [LTEV). Said insert was obtained by means of a polymerase chain reaction (PCR) using pET43-LSLa (Tateno, H. & Goldstein, IJ.
- PCR polymerase chain reaction
- the plasmid vector pKLSLt was constructed by inserting in the vector pET28a + (Novagen) the open reading phase of the first 450 nt of the LSL protein gene (LSL 450 ) followed by the nucleotide sequences encoding a binding linker and the TEV protease recognition site (LTEV).
- Said insert was obtained by means of a polymerase chain reaction (PCR) using as template the pET43-LSLa (Tateno & Goldstein, 2003) and oligonucleotides that hybridize in the initial and final region of the LSL450 gene and have at their ends the target sequences of the restriction enzymes Ncol and the sequence (LTEV) followed by the target sequence for the restriction enzyme EcoRI, respectively ( Figure 4).
- PCR polymerase chain reaction
- the fragment obtained and the vector pET28a + were digested with the corresponding restriction enzymes, purified and ligated in the presence of the enzyme T4 ligase (Roche).
- competent bacteria were transformed with the ligation product and selected the recombinant plasmid pKLSLt following standard cloning procedures (Sambrook and Russell; 2001).
- the plasmid vector pKLSLt-EGFP ( Figure 5) was constructed by inserting an open reading phase of 720 nt of the gene of the EGFP protein (Enhancer Green Fluorescence Protein) in the vector pKLSLt ( Figure 4 ). The insert was obtained by means of a polymerase chain reaction (PCR) using as a template the plasmid pCMV-EGFP (Clontech), as well as specific oligonucleotides that hybridize in the initial and final region of the EGFP gene and present at their ends the target sequences of the restriction enzymes EcoRI and Notl, respectively.
- PCR polymerase chain reaction
- the fragment obtained and the pKLSLt vector were digested with the corresponding restriction enzymes, purified and ligated in the presence of the enzyme T4 ligase (Roche). Subsequently, competent bacteria were transformed with the ligation product and the recombinant plasmid pKLSLt-EGFP was selected following standard cloning procedures (Sambrook and Russell; 2001).
- E. coli cells (BL21 DE3) containing plasmid pKLSLt-EGFP ( Figure 5) were incubated for 3-4 hours at 37 0 C in 1 L of LB medium containing kanamycin (50 ug / mL), to achieved one of OD ⁇ oonm 0.6. Then the expression of the protein is induced LSL150-EGFP by the addition of 0.3 mM IPTG, after which purpose the culture is maintained at 16 0 C for 20 hours. After centrifugation at 4000 xg for 15 min, the cells were separated from the culture medium. The sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
- the resuspended sediment was passed through a French press.
- the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes.
- This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
- the elution of LSL150-EGFP is carried out by washing the chromatographic matrix with the same previous buffer containing 0.2 M lactose ( Figure 6).
- the plasmid vector pKLSLt-PLD ( Figure 7) was constructed by inserting the open reading phase of the first 846nt of the sphingomyelin-dependent phospholipase (PLD) gene of the pathogenic bacterium Arcanobacterium haemolyticum into the vector pKLSLt ( Figure 4).
- the insert was obtained by means of a polymerase chain reaction (PCR) using the plasmid pJB31 (provided by Dr.
- E. coli cells (BL21 DE3) were incubated containing plasmid pKLSLt-PLD ( Figure 7) for 3-4 hours at 37 0 C in 1 L of LB medium containing kanamycin (50 ug / mL) until reached an OD 6 0.6 oonm. Then the expression of the protein is induced -PLD LSLI 50 by the addition of 0.3 mM IPTG, after which purpose the culture is maintained at 16 0 C for 20 hours. After centrifugation at 4000 xg for 15min, the cells were separated from the culture medium.
- the sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
- the resuspended sediment was passed through a French press.
- the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes. This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
- the plasmid vector pKLSLt-SMD ( Figure 9) was constructed by inserting the open reading phase of 802nt of the sphingomyelin-dependent phospholipase gene of the pathogenic microorganism Corynebacter ⁇ um pseudotuberculosis (SMD) into the vector pKLSLt ( Figure 4).
- the insert was obtained by means of a polymerase chain reaction (PCR) using as a template the plasmid pJG90 (Tambourgi et al., 2002), as well as specific oligonucleotides that hybridize in the initial and final region of the EGFP gene and present at their ends target sequences of restriction enzymes EcoRI and Hindlll respectively.
- the fragment obtained and the pKLSLt vector were digested with the corresponding restriction enzymes, purified and ligated in the presence of the enzyme T4 ligase (Roche). Subsequently, competent bacteria were transformed with the ligation product and the recombinant plasmid pKLSLt-SMD was selected following standard cloning procedures (Sambrook and Russell; 2001).
- E. coli cells (BL21 DE3) were incubated containing plasmid pKLSLt-SMD ( Figure 9) for 3-4 hours at 37 0 C in 1 L of LB medium containing kanamycin (50 ug / mL) until reached an OD 6 0.6 oonm.
- Example 5 Expression of the LSLi 50 -CPL7 fusion protein
- the plasmid vector pKLSLt-CPL7 ( Figure 11) was constructed by inserting the open reading phase of the first 1003nt of the murein hydrolase CPL7 protein gene of the bacteriophage Cp-7 of Streptococcus pneumoniae into the vector pKLSLt ( Figure 4).
- the insert was obtained by means of a polymerase chain reaction (PCR) using plasmid pCP700 as a template (Garc ⁇ a, P., Garc ⁇ a, JL., Garc ⁇ a, E., Sánchez-Puelles, JM, López, R.
- the sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
- the resuspended sediment was passed through a French press.
- the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes. This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
- the plasmid vector pKLSLt-IP5_2K ( Figure 13) was constructed by inserting the open reading phase of the first 1353nt of the Inositol protein (1, 3,4,5,6) -pentakisphosphate kinase gene from Arabidopsis thaliana into the pKLSLt vector ( Figure 4). The insert was obtained by polymerase chain reaction (PCR) using as a template the plasmid pET28c containing the cDNA of IP5_2K (provided by Dr. Beatriz González, Group of Crystallography, Insto.
- PCR polymerase chain reaction
- Rocasolano, CSIC as well as specific oligonucleotides that they hybridize in the initial and final region of the IP5_2K gene and present at their ends the target sequences of the Sacl and Xhol restriction enzymes respectively.
- the fragment obtained and the pKLSLt vector were digested with the corresponding restriction enzymes, purified and ligated in the presence of the enzyme T4 ligase (Roche).
- T4 ligase (Roche).
- competent bacteria were transformed with the ligation product, the recombinant plasmid pKLSLt-IP5_2K being selected following standard cloning procedures (Sambrook and Russell; 2001).
- E. coli cells (BL21 DE3) were incubated pKLSLt-containing plasmid IP5_2K (Figure 13) for 3-4 hours at 37 0 C in 1 L of LB medium containing kanamycin (50 ug / mL) until reached an OD 6 oonm of 1.
- the expression of the LSL 150 -IP5_2K protein is induced by the addition of 0.3 mM IPTG, after which the culture is maintained at 16 0 C for 16 hours. After centrifugation at 4000 xg for 15min, the cells were separated from the culture medium.
- the sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
- the resuspended sediment was passed through a French press.
- the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes. This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
- IP5_2K has been produced as a fusion protein with GST (GST-IP5_2K) and purified following standard protocols for this affinity / solubility label (results not shown).
- GST-I P5_2K was treated with TEV protease, and subsequently IP5_2K purified by penetrability chromatography on Superdex 75.
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
La presente invención describe un nuevo método general de expresión y purificación de proteínas de fusión conteniendo un dominio peptídico lectina β-trébol como etiqueta de afinidad y solubilidad. Esta etiqueta permite producir diferentes proteínas de fusión solubles con elevados rendimientos y purificarlas mediante un protocolo de purificación eficaz, sencillo y de bajo coste. Dicho protocolo está basado en Ia capacidad del péptido para unir azúcares derivados de galactosa y consta de una sola etapa de cromatografía de afinidad que emplea matrices derivadas de agarosa y lactosa como eluyente.
Description
PROTEÍNAS DE FUSIÓN CON UN DOMINIO LECTINA DE TIPO BETA- TRÉBOL, PROCEDIMIENTO DE OBTENCIÓN Y SUS APLICACIONES
SECTOR DE LA TÉCNICA La invención se puede encuadrar de un modo genérico en el sector de Ia biotecnología, con evidentes aplicaciones en el campo farmacéutico y, actualmente, en el desarrollo de proyectos de genómica estructural de alto rendimiento. De un modo más concreto, Ia invención se encuadraría en los procesos de producción y purificación de proteínas de fusión.
ESTADO DE LA TÉCNICA
El exitoso desarrollo de proyectos de genómica ocurrido en los últimos años ha permitido obtener una vasta cantidad de información genética, especialmente de organismos procariotas, en donde el número de genomas secuenciados se contará por miles en pocos años (Abby, S. & Daubin, V. (2007). Trends Microbiol. 15, 135-141 ). Un factor decisivo de este éxito ha sido, sin duda alguna, Ia homogeneidad química y estructural de los ácidos nucleicos, Io cual ha permitido desarrollar protocolos de secuenciación de alto rendimiento ("high throughput") de carácter universal. Actualmente, en Ia era post-genómica, el interés se dirige principalmente al análisis funcional y estructural de las proteínas codificadas por dichos genomas. En este sentido, y a diferencia de los ácidos nucleicos, las proteínas son química y estructuralmente mucho más heterogéneas, Io cual supone de fado Ia imposibilidad de desarrollar protocolos de alto rendimiento universales para Ia purificación y caracterización estructural de estas moléculas (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-320). Otros problemas relevantes asociados al diseño de este tipo de procesos de alto rendimiento es el bajo rendimiento en Ia producción y Ia escasa solubilidad de muchas de las proteínas sobre- expresadas (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353-358). Esto último ha conducido a Ia búsqueda de sistemas de
sobre-expresión de proteínas recombinantes alternativos al que puede considerarse el sistema de expresión por excelencia: Ia bacteria Escheríchia coli. Algunos sistemas considerados están basados en células eucariotas de mamífero, levaduras o de insectos (Greene, JJ. (2004). Methods Mol. Biol. 267, 3-14; DaIy, R. & Hearn, MT. (2005). J. Mol. Recognit. 18, 119-138; Kost, T.A., Condreay, JP. & Jarvis, D. L. (2005). Nat. Biotechnol. 23, 567-575) o bien sistemas libres de células (Murthy, T.V., Wu, W., Qiu, Q.Q., Shi, Z. Labaer, J. & Brizuela, L. (2004). Prot. Expr. Purif. 36, 217-225). No obstante, el bajo coste, Ia facilidad de manejo y de escalado de cultivos siguen haciendo de E. coli el sistema de sobre- expresión prácticamente universal (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353-358).
Una aproximación empleada actualmente en el desarrollo de protocolos de alto rendimiento universales de producción/purificación de proteínas en E. coli es el uso de etiquetas de afinidad ("affinity tag") (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320; Arnau, J., Lauritzen, C, Petersen, G. E. & Petersen, J. (2006). Prot. Express. Purif. 48, 1-13). Estas etiquetas son proteínas o péptidos que, fusionados a Ia proteína recombinante de interés, idealmente permitirían aumentar el rendimiento de su expresión, incrementar su solubilidad y desarrollar un protocolo simple y eficaz de purificación. Se puede afirmar que actualmente no existe una etiqueta de afinidad que reúna estas características de un modo general o universal; de hecho, se considera que el uso combinado de varias etiquetas podría ser una posible solución al diseño de estrategias generales (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320). Obviamente, el empleo sistemático de esta aproximación combinatorial requiere de un conocimiento preciso de las ventajas e inconvenientes de las correspondientes etiquetas individuales.
En Ia Tabla I se muestran las principales etiquetas de afinidad
("affinity tag") pues permiten desarrollar protocolos de purificación genéricos basados en cromatografías de afinidad, mientras que en Ia
Tabla II, aparecen etiquetas que en algunos casos se ha comprobado actúan como "agentes solubilizantes" ("solubility enhancers").
Tabla I. Principales etiquetas de afinidad
Etiqueta Proteína Matriz Referencia
His6 Etiqueta de seis Metales inmovilizados 1 histidinas
GST Glutathion-S-transferase Glutation 2
MBP Maltose-binding protein Amilosa 3
FLAG Péptido FLAG Anticuerpo anti-FLAG 4
BAP Péptido aceptor de Avidita 5 biotina
Strep Il Péptido de unión a Streptavidina 6 streptavidina
CBP Péptido de unión a Calmodulina 7 calmodulina
1. Gaberc-Porekar, V. & Menart, V. (2001 ). J. Biochem. Biophys.
Methods 49, 335-360. 2. Smith, D. B. & Johnson, K.S. (1988). Gene 67, 31-40.
3. di Guan, C, Li, P., Riggs, P. D. & Inoue, H. (1998). Gene 67, 21- 30.
4. Einhauer, A. & Jungbauer, A. (2001 ). J. Biochem. Biophys. Methods 49, 455-465. 5. Schatz, PJ. (1993). Biotechnology (NY) 11 , 1138-1143.
6. Voss, S. & Skerra, A. (1997). Protein Eng. 10, 975-982.
7. Vaillancourt, P., Zheng, C. F., Hoang, D.Q. & Breister, L. (2000) Methods Enzymol. 326, 340-362.
Tabla I. Principales etiquetas solubilizantes
Etiqueta Proteína Origen Referencia
MBP Maltose-binding Escheríchia coli 8 protein
GST Glutathione-S- Schischosoma 9 transferase japonicum
Trx Thioredoxin Escherichia coli 10
NusA N-Utilization Escheríchia coli 11 substance
SUMO Small Ubiquitin- Homo sapiens 12 modifier
SET Solubility-enhancing Sintético 13 tag
8. Nallamsetty, S. & Waugh, D.S. (2006). Prot. Expr. Puríf. 45, 175- 182.
9. Nygren, P.A., Stahl, S. & Uhlen, M. (1993). Trends Biotechnol. 12, 184-188.
10. LaVaINe, E. R., DiBlasio, E.A., Kovacic, S., Grant, K.L., Schendel,
P.F. & McCoy, J. M. (1993). Biotechnology (NY). 11 , 187-193. H . Davis, G. D., Elisee, C, Newham, D. M. & Harrison, R.G. (1999).
Biotechnol. Bioeng. 65, 382-388. 12. Marblestone, J. G., Edavettal., S.C., Lim, Y., Lim, P., Zuo, X. &
Butt, T.R. (2006). Prot. Sci. 15, 182-189. 13.Zhang, Y.B., Howitt, J., McCorkle, S., Lawrence, P., Springer, K.
& Freimuth, P. (2004). Prot. Expr. Puríf. 36, 207-216.
Hoy día el interés se centra principalmente en MBP, GST, NusA y
Trx. No obstante y teniendo en cuenta, por un lado, que estudios recientes demuestran una baja eficacia de GST (Dyson, M. R., Shadbolt, S. P., Vincent, KJ. , Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32)
y Trx (Marblestone, J.G., Edavettal., S.C., Lim, Y., Lim, P., Zuo, X. & Butt, T. R. (2006). Prot. Sci. 15, 182-189) como agentes solubilizantes en E. coli y, por otro, que NusA, aun con una eficacia similar a MBP como agente solubilizante, no permite desarrollar un protocolo de purificación inmediato (Davis, G. D., Elisee, C, Newham, D. M. & Harrison, R.G. (1999). Biotechnol. Bioeng. 65, 382-388; Dummler, A., Lawrence, A. M. & de Marco, A. (2005). Microb. CeII Fact. 4, 34), MBP ha devenido una de las etiquetas de afinidad sobre Ia que más interés se tiene y una de las más ampliamente estudiadas (Dyson, M. R., Shadbolt, S. P., Vincent, K. J., Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32; Braud, S., Moutiez, M., BeNn, P., Abello, N., Drevet, P., Zinn-Justin, S., Courcon, M., Masson, C, Dassa, J. & Charbonnier, J. B. (2005). J. Proteome Res. 4, 2137-2147). Asimismo, puede afirmarse que Ia eficacia de estas etiquetas es función de Ia proteína "acompañante" (Dyson, M. R., Shadbolt, S. P., Vincent, KJ. , Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32), Io cual no es sino reflejo de Ia diversidad química y estructural de las proteínas. Indudablemente, una validación cualitativa de las etiquetas de afinidad requerirá de una aproximación a gran escala o "proteómica" (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353- 358).
Tabla II. Principales etiquetas de afinidad
Etiqueta Proteína Matriz Referencia
His6 Etiqueta de seis Metales inmovilizados 7 histidinas
GST Glutathion-S-transferase Glutation 8
MBP Maltose-binding protein Amilosa 9
FLAG Péptido FLAG Anticuerpo anti-FLAG 10
BAP Péptido aceptor de Avidina 11 biotina
Strep Il Péptido de unión a Streptavidina 12
streptavidina
CBP Péptido de unión a Calmodulina 13 calmodulina
H. Gaberc-Porekar, V. & Menart, V. (2001 ). J. Biochem. Biophys.
Methods 49, 335-360.
15.Smith, D. B. & Johnson, K.S. (1988). Gene 67, 31-40. 16. di Guan, C, Li, P., Riggs, P. D. & Inoue, H. (1998). Gene 67, 21-
30. 17. Einhauer, A. & Jungbauer, A. (2001 ). J. Biochem. Biophys.
Methods 49, 455-465.
18.Schatz, PJ. (1993). Biotechnology (NY) 11 , 1138-1143. 19.Voss, S. & Skerra, A. (1997). Protein Eng. 10, 975-982.
20.Vaillancourt, P., Zheng, C. F., Hoang, D.Q. & Breister, L. (2000)
Methods Enzymol. 326, 340-362.
Una etiqueta de afinidad ideal aumenta el rendimiento en Ia producción de proteínas (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-
320). Este efecto está asociado normalmente con etiquetas proteicas (no péptidos pequeños) situadas en el extremo N-terminal de Ia fusión, en donde Ia etiqueta proporcionaría un entorno eficaz para iniciar el proceso de traducción, evitando que el ARNm adoptara estructuras secundarias que pudiesen interferir en Ia unión a los ribosomas (Hartz, D., McPheeters,
D.S., Green, L. & GoId, L. (1991 ). J. Mol. Biol. 218, 99-105). Por otro lado, también deben permitir desarrollar un protocolo de purificación eficaz, potencialmente escalable a procesos de alto rendimiento con costes mínimos (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320). En este sentido, Ia matriz cromatográfica de afinidad cobra especial relevancia (ver
Tabla II), distinguiéndose dos grandes grupos: matrices con proteínas inmovilizadas, que suelen ser caras, con baja capacidad de unión y vidas medias cortas (FLAG, BAP, Strepll, CBP), y matrices con ligandos de
pequeño tamaño (MBP, GST), más baratas y estables. Por otro lado, Ia disociación de Ia proteína inmovilizada en Ia matriz debe producirse en condiciones no "agresivas" para el estado nativo de Ia proteína.
Claramente, cualquier estrategia basada en el uso de etiquetas de afinidad debería proporcionar Ia posibilidad de eliminarla de un modo eficaz (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320), aspecto éste especialmente relevante cuando se trata de proteínas con potenciales aplicaciones en terapia humana (Arnau, J., Lauritzen, C, Petersen, G. E. & Petersen, J. (2006). Prot. Express. Purif. 48, 1-13). La disponibilidad de endoproteasas con una especificidad exquisita como AcTEV® (tobáceo etch virus; Invitrogen) o PreScission® (Amersham Biotech) han mitigado notablemente este problema. Puesto que los determinantes de Ia especificidad de estas endoproteasas se localizan en el lado C-terminal del enlace peptídico diana (TEV: ENLYFQ/G; PreScission: LEVLFQ/GP), tras Ia hidrólisis, estos permanecerán en las etiquetas si están situadas en el extremo N-terminal de Ia proteína de fusión.
Finalmente, de acuerdo a las expectativas de aumento de inversiones en el mercado farmacéutico en fármacos de naturaleza proteica para el periodo 2004-2010 (de 34000 a 52000 millones de dólares; Pavlou, A.K. & Reichert, J. M. (2004). Nat. Biotechnol. 22, 1513-
1519), se espera Ia aparición de nuevas proteínas de interés terapéutico, de ahí que Ia búsqueda de nuevas etiquetas de afinidad sea actualmente un campo de intensa investigación (Arnau, J., Lauritzen, C, Petersen, G. E.
& Petersen, J. (2006). Prot. Express. Purif. 48, 1-13).
En resumen, Ia puesta a punto de un procedimiento de alto rendimiento de carácter general de producción y/o purificación de proteínas se enfrenta al problema de Ia heterogeneidad química y estructural de estas moléculas. Concretamente, los tres principales
desafíos a los que se intenta aportar soluciones mediante el uso de las etiquetas de afinidad y solubilidad son:
• Aumento del rendimiento de Ia producción de las proteínas heterólogas, • Aumento de Ia solubilidad de Ia proteína de interés, y
• Aportar un protocolo de purificación eficaz y fácilmente escalable a procesos de alto rendimiento
DESCRIPCIÓN DE LA INVENCIÓN
Breve Descripción
Un aspecto de Ia invención Io constituye una proteína de fusión recombinante, en adelante proteína de fusión de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de aminoácidos del péptido LSLi50 del hongo Laetiporus sulphureus (SEQ ID NO2), y b) una secuencia análoga a Ia SEQ ID NO2 de a).
En el sentido utilizado en esta descripción, el término "análoga" pretende incluir a cualquier secuencia de aminoácidos que pueda ser aislada o construida en base a Ia secuencia de aminoácidos mostrada en Ia SEQ. ID NO2, por ejemplo, mediante Ia introducción de sustituciones de aminoácidos conservativas o no conservativas, incluyendo Ia inserción de uno o más aminoácidos, Ia adición de uno o más aminoácidos en cualquiera de los extremos de Ia molécula o Ia deleción de uno o más aminoácidos en cualquier extremo o en el interior de Ia secuencia.
En general, una secuencia de aminoácidos análoga es sustancialmente homologa a Ia secuencia de aminoácidos identificada como Ia SEQ ID NO2. En el sentido utilizado en esta descripción, Ia
expresión "sustancialmente homologa" significa que las secuencias de aminoácidos en cuestión tienen un grado de identidad, a nivel de aminoácidos, de, al menos, un 60%, preferentemente de, al menos un 85%, o más preferentemente de, al menos, un 95%.
Otro aspecto de Ia invención Io constituye el procedimiento de obtención de Ia proteína de fusión, en adelante procedimiento de Ia invención, que comprende las siguientes etapas:
i) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSLi50 (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, ii) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escherichia coli, en
Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, iii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, iv) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado.
Para llevar a cabo el paso i) del procedimiento de Ia invención es necesario elaborar una construcción genética que comprenda Ia secuencia de ADN codificante del peptido SEQ ID NO2, Ia proteína o péptido de interés y opcionalmente, una secuencia de reconocimiento de endoproteasas, por ejemplo, TEV (tobáceo etch virus endoprotease) con objeto de separar Ia etiqueta de afinidad de Ia proteína de interés.
Así, otro aspecto de Ia invención Io constituye una construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión de Ia invención, en adelante construcción genética de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de ADN SEQ ID NO1 , y b) una secuencia homologa a Ia SEQ ID NO1.
La construcción genética de Ia invención permite Ia expresión de una proteína de interés unida al péptido de SEQ ID NO2. Esta construcción genética de Ia invención, también puede comprender, en caso necesario y para permitir un mejor aislamiento, detección o secreción al exterior de Ia célula del péptido de interés expresado, una secuencia de nucleótidos que codifica para un péptido susceptible de ser utilizado con fines de aislamiento, detección o secreción de dicho péptido. Por tanto, un objeto particular de Ia presente invención Io constituye una construcción genética de Ia invención que comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David Lañe (1999). CoId Spring Harbor Laboratory Press. New York. Capítulo: Tagging proteins. Pp. 347-377).
La construcción genética de Ia invención descrita previamente puede aislarse y obtenerse por un experto mediante el empleo de técnicas ampliamente conocidas en el estado de Ia técnica (Sambrook et al. "Molecular cloning, a Laboratory Manual 2nd ed., CoId Sping Harbor Laboratory Press, N.Y., 1989 vol 1-3). Dichas secuencias de nucleótidos pueden estar integradas en un vector de expresión génica que permite Ia regulación de Ia expresión de Ia misma en condiciones adecuadas en el interior de las células.
Por tanto, otro aspecto de Ia presente invención Io constituye un vector de expresión, en adelante vector de expresión de Ia invención, que comprende una construcción genética de Ia invención y que permite Ia expresión de una proteína o péptido. Ejemplos de una realización particular se pueden encontrar en los ejemplos de Ia presente invención. En general, un vector de expresión comprende, además de Ia construcción genética descrita en Ia invención, un promotor que dirige su transcripción (por ejemplo, pT7, plac, ptrc, ptac, pBAD, ret, etc.), al que está operativamente enlazado, y otras secuencias necesarias o apropiadas que controlan y regulan dicha transcripción y, en su caso, Ia traducción del producto de interés, por ejemplo, señales de inicio y terminación de transcripción (tlt2, etc.), señal de poliadenilación, origen de replicación, secuencias de unión a ribosomas (RBS), secuencias codificantes de reguladores transcripcionales, (enhancers), silenciadores transcripcionales (silencers), represores, etc. Ejemplos de vectores de expresión apropiados pueden seleccionarse de acuerdo con las condiciones y necesidades de cada caso concreto entre plásmidos de expresión, vectores virales (DNA o RNA), cósmidos, cromosomas artificiales, etc. que pueden contener, además, marcadores utilizables para seleccionar las células transfectadas o transformadas con el gen o genes de interés. La elección del vector dependerá de Ia célula huésped y del tipo de uso que se quiera realizar. Por tanto, según un modo de realización
particular de Ia presente invención dicho vector es un plásmido o un vector viral. La obtención de dicho vector puede realizarse por métodos convencionales conocidos por los técnicos en Ia materia al igual que para Ia transformación de microorganismos y células eucariotas se pueden utilizar diferentes métodos ampliamente conocidas - transformación química, electroporación, microinyección, etc. - descritos en diversos manuales [Sambrook, J., Fritsch, E. F., and Maniatis, T. (1989). Molecular cloning: a laboratory manual, 2nd ed. CoId Spring Harbor Laboratory, CoId Spring Harbor, N.Y.].
Otro aspecto de Ia presente invención Io constituye una célula huésped, en adelante célula de Ia invención, que comprende Ia construcción genética o el vector de expresión de Ia invención, preferentemente una célula procariota. Una realización particular de Ia invención Io constituye una célula huésped de Ia invención constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.
Descripción detallada La presente invención se refiere a un nuevo método general o universal de expresión y purificación de proteínas de fusión conteniendo un dominio lectina β-trébol como etiqueta de afinidad.
La presente invención se basa en que los inventores han observado que el módulo lectina de Ia proteína hemolítica del hongo Laetiporus sulphureus (los primeros 150 aminoácidos: LSL150) (SEQ ID NO2) es funcional en tanto que parte constituyente de numerosas proteínas recombinantes de fusión diseñadas ad hoc. Es decir, que por un lado, Ia
SEQ ID NO2 es versátil desde una perspectiva de plegamiento de proteínas pues se pliega adecuadamente estando acompañada de diferentes proteínas en su extremo C-terminal y, por otro, conserva su
capacidad de unión de azúcares. Sorprendentemente, las proteínas recombinantes de interés fusionadas al extremo C-terminal de SEQ ID NO2 también se pliegan adecuadamente, según se deduce de los resultados de actividad llevados a cabo con las proteínas puras. Además, estas proteínas de interés mantienen su estado nativo incluso una vez separadas de SEQ ID NO2 mediante tratamiento proteolítico (TEV proteasa; ver más abajo). Todo ello ha permitido purificar diversas proteínas de fusión conteniendo Ia SEQ ID NO2 en su extremo N-terminal empleando un único protocolo de purificación.
En este sentido, los inventores han observado que Ia SEQ ID NO2 (de origen eucariota) se produce en E. coli (procariota) con un elevado rendimiento (aprox. 80 mg por litro de cultivo), plegándose adecuadamente. De hecho, Ia estructura tridimensional de SEQ ID NO2 producida en E. coli que han determinado es esencialmente igual a Ia del correspondiente módulo lectina de LSL aislada directamente del hongo L. sulphureus (Figura 3). Esta estructura es garantía del plegamiento adecuado de SEQ ID NO2 expresada heterólogamente en un organismo procariota, Io cual no es siempre obvio. Sorprendentemente, en todos los ejemplos indicados más abajo, el rendimiento con el que se obtienen las proteínas de fusión construidas (ver ejemplos más abajo) es tal que permite afrontar proyectos de cristalización de las proteínas puras, una vez separadas de SEQ ID NO2, con un coste bajo. En el caso concreto de Ia proteína PLD de A. haemolyticum (ver ejemplo 3), su expresión con una etiqueta de histidinas (His6 tag) en las mismas condiciones que LSL150- PLD, no permitía obtener Ia proteína de fusión soluble. Es decir, Ia secuencia SEQ ID NO2 reúne propiedades de etiqueta de afinidad y de solubilidad. En este sentido, es de destacar que actualmente se desconocen las bases moleculares por las cuales una proteína actúa como etiqueta de solubilidad y que, por ello, no disponemos de criterios objetivos con los cuales realizar una búsqueda sistemática de proteínas que
pudiesen actuar como tales. En nuestro caso particular, podemos afirmar que del análisis estructural y biofísico de Ia secuencia SEQ ID N02 no se pueden deducir sus propiedades como etiqueta de solubilidad. La idea inicial de que cualquier proteína muy soluble puede actuar como tal se ha comprobado incorrecta (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-320). Aunque Ia solubilidad es una propiedad necesaria para una potencial etiqueta de solubilidad, es obvio que no es un requisito suficiente.
En tanto que etiqueta de afinidad y de solubilidad, Ia SEQ ID NO2 permite producir diferentes proteínas de fusión con elevados rendimientos y establecer un protocolo de purificación de las mismas de carácter general, eficaz, sencillo y de bajo coste. Estas características se deben a factores de distinta naturaleza. En primer lugar, se debe a que el método de purificación de Ia proteína de fusión implica una única etapa cromatográfica de afinidad. En segundo lugar, a que el costo de los principales componentes empleados en dicho protocolo, esto es, las matrices cromatográficas derivadas de agarosa (Sepharose™ 4B, 6B, CL- 4B, CL-6B) y eluyentes (D(+)-lactosa), es sorprendentemente bajo. Así, y a modo de comparación, mientras que el precio medio de estas resinas está en torno a unos 420-580€/litro (en el caso de Sepharose™ 6B se emplea una columna con unos 25 mi de resina) y el de D(+)-lactosa como eluyente unos 28€/kilo, el precio de los componentes empleados en el sistema descrito en (Tielker, D., Rosenau, F., Bartels, K. M., Rosenbaum, T. & Jaeger, K.E. (2006). Bio-Techniques 41 , 327-332), esto es, manosa- agarosa es de 33120 €/litro y el de D-manosa de unos 900 €/kilo. Y, finalmente, en tercer lugar, las matrices cromatográficas empleadas, por una parte, no requieren de ningún tratamiento químico adicional para actuar como matrices de afinidad frente a Ia secuencia SEQ ID NO2 y, por otra, al ser esencialmente inertes a los homogeneizados celulares y no
requerir regeneraciones más allá de su lavado con buffer, pueden reutilizarse de un modo esencialmente continuo.
Una vez comprobada Ia capacidad de Ia secuencia SEQ ID N02 para actuar como etiqueta de afinidad y solubilidad, se puede afirmar a posteriorí que ésta reúne características ventajosas adicionales para ser empleada biotecnológicamente en procesos de producción y purificación de proteínas. En primer lugar, al ser un dominio monomérico no impone restricciones estéricas sobre Ia proteína C-terminal "acompañante"; en segundo lugar, al carecer de residuos de cisteína Ia secuencia SEQ ID NO2 no demanda el uso de agentes moduladores del estado redox del medio y, finalmente, en tercer lugar, esta secuencia es LSLi50 es desde una perspectiva evolutiva un módulo proteico, por Io que está adaptada estructural y funcionalmente a ser parte constituyente de proteínas modulares, como son de facto las proteínas recombinantes de fusión. En este sentido es destacable el hecho de que ninguna de las etiquetas de afinidad (proteínas) actualmente relevantes, como MBP, GST o Trx, proceden de proteínas modulares.
Por tanto, un aspecto de Ia invención Io constituye una proteína de fusión recombinante, en adelante proteína de fusión de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: c) Ia secuencia de aminoácidos del péptido LSL150 del hongo
Laetiporus sulphureus (SEQ ID NO2), y d) una secuencia análoga a Ia SEQ ID NO2 de a).
En el sentido utilizado en esta descripción, el término "análoga" pretende incluir a cualquier secuencia de aminoácidos que pueda ser aislada o construida en base a Ia secuencia de aminoácidos mostrada en Ia SEQ. ID NO2, por ejemplo, mediante Ia introducción de sustituciones de aminoácidos conservativas o no conservativas, incluyendo Ia inserción de
uno o más aminoácidos, Ia adición de uno o más aminoácidos en cualquiera de los extremos de Ia molécula o Ia deleción de uno o más aminoácidos en cualquier extremo o en el interior de Ia secuencia.
En general, una secuencia de aminoácidos análoga es sustancialmente homologa a Ia secuencia de aminoácidos identificada como Ia SEQ ID N02. En el sentido utilizado en esta descripción, Ia expresión "sustancialmente homologa" significa que las secuencias de aminoácidos en cuestión tienen un grado de identidad, a nivel de aminoácidos, de, al menos, un 60%, preferentemente de, al menos un 85%, o más preferentemente de, al menos, un 95%.
Otro aspecto de Ia invención Io constituye el procedimiento de obtención de Ia proteína de fusión, en adelante procedimiento de Ia invención, que comprende las siguientes etapas: v) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSL150 (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, vi) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escheríchia coli, en Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, vii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, viii) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con
un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado.
Para llevar a cabo el paso i) del procedimiento de Ia invención es necesario elaborar una construcción genética que comprenda Ia secuencia de ADN codificante del peptido SEQ ID NO2, Ia proteína o péptido de interés y opcionalmente, una secuencia de reconocimiento de endoproteasas, por ejemplo, TEV (tobáceo etch virus endoprotease) con objeto de separar Ia etiqueta de afinidad de Ia proteína de interés.
Así, otro aspecto de Ia invención Io constituye una construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión de Ia invención, en adelante construcción genética de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: c) Ia secuencia de ADN SEQ ID NO1 , y d) una secuencia homologa a Ia SEQ ID NO1.
La construcción genética de Ia invención permite Ia expresión de una proteína de interés unida al péptido de SEQ ID NO2. Esta construcción genética de Ia invención, también puede comprender, en caso necesario y para permitir un mejor aislamiento, detección o secreción al exterior de Ia célula del péptido de interés expresado, una secuencia de nucleótidos que codifica para un péptido susceptible de ser utilizado con fines de aislamiento, detección o secreción de dicho péptido. Por tanto, un objeto particular de Ia presente invención Io constituye una construcción genética de Ia invención que comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia
invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David Lañe (1999). CoId Spring Harbor Laboratory Press. New York. Capítulo: Tagging proteins. Pp. 347-377).
La construcción genética de Ia invención descrita previamente puede aislarse y obtenerse por un experto mediante el empleo de técnicas ampliamente conocidas en el estado de Ia técnica (Sambrook et al.
"Molecular cloning, a Laboratory Manual 2nd ed., CoId Sping Harbor
Laboratory Press, N.Y., 1989 vol 1-3). Dichas secuencias de nucleótidos pueden estar integradas en un vector de expresión génica que permite Ia regulación de Ia expresión de Ia misma en condiciones adecuadas en el interior de las células.
Por tanto, otro aspecto de Ia presente invención Io constituye un vector de expresión, en adelante vector de expresión de Ia invención, que comprende una construcción genética de Ia invención y que permite Ia expresión de una proteína o péptido. Ejemplos de una realización particular se pueden encontrar en los ejemplos de Ia presente invención.
En general, un vector de expresión comprende, además de Ia construcción genética descrita en Ia invención, un promotor que dirige su transcripción (por ejemplo, pT7, plac, ptrc, ptac, pBAD, ret, etc.), al que está operativamente enlazado, y otras secuencias necesarias o apropiadas que controlan y regulan dicha transcripción y, en su caso, Ia traducción del producto de interés, por ejemplo, señales de inicio y terminación de transcripción (tlt2, etc.), señal de poliadenilación, origen de replicación, secuencias de unión a ribosomas (RBS), secuencias
codificantes de reguladores transcripcionales, (enhancers), silenciadores transcripcionales (silencers), represores, etc. Ejemplos de vectores de expresión apropiados pueden seleccionarse de acuerdo con las condiciones y necesidades de cada caso concreto entre plásmidos de expresión, vectores virales (DNA o RNA), cósmidos, cromosomas artificiales, etc. que pueden contener, además, marcadores utilizables para seleccionar las células transfectadas o transformadas con el gen o genes de interés. La elección del vector dependerá de Ia célula huésped y del tipo de uso que se quiera realizar. Por tanto, según un modo de realización particular de Ia presente invención dicho vector es un plásmido o un vector viral. La obtención de dicho vector puede realizarse por métodos convencionales conocidos por los técnicos en Ia materia al igual que para Ia transformación de microorganismos y células eucariotas se pueden utilizar diferentes métodos ampliamente conocidas - transformación química, electroporación, microinyección, etc. - descritos en diversos manuales [Sambrook, J., Fritsch, E. F., and Maniatis, T. (1989). Molecular cloning: a laboratory manual, 2nd ed. CoId Spring Harbor Laboratory, CoId Spring Harbor, N.Y.].
Otro aspecto de Ia presente invención Io constituye una célula huésped, en adelante célula de Ia invención, que comprende Ia construcción genética o el vector de expresión de Ia invención, preferentemente una célula procariota.
Una realización particular de Ia invención Io constituye una célula huésped de Ia invención constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.
DESCRIPCIÓN DE LAS FIGURAS
Figura 1.- Plásmido pKLSL150 y secuencia de Ia proteína LSL150. Parte izquierda: esquema del vector de expresión pKLSL150 que contiene Ia
secuencia de 450 nt que codifica para Ia proteína LSL150 bajo el control del promotor de T7 y un regulador inducible por IPTG. Este plásmido contiene el gen de resistencia a Ia Kanamicina (Kan), el gen del represor lacl, y un sitio múltiple de clonaje (Ncol/Xhol). Parte derecha: secuencia de nucleótidos y aminoácidos de Ia proteína LSL150 flanqueada por los sitios de restricción Ncol y EcoRI utilizados en el clonaje.
Figura 2.- Análisis mediante SDS-PAGE de Ia purificación de Ia proteína de fusión LSL150. En el gel aparecen muestras de diferentes fracciones del perfil de elución de LSL150 al lavar Ia columna con buffer conteniendo 0.2 M lactosa. A Ia izquierda se muestran patrones de masa molecular con sus correspondientes masas en kDa.
Figura 3.- Estructura tridimensional de Ia proteína LSLi50. Parte izquierda: representación del esqueleto peptídico de LSL150 (negro: hebras β; gris: bucles). Parte derecha: esqueleto peptídico del módulo lectina de Ia proteína completa aislada directamente del hongo Laetiporus sulphureus
(negro: hebras β; gris: bucles). N: extremo amino terminal; C: extremo carboxilo terminal. La estructura de ambas proteínas se ha determinado mediante cristalografía de proteínas. La superposición revela una rmsd para 148 carbonos α de 1.1 A, esto es, son casi perfectamente superponibles.
Figura 4.- Plásmido pKLSLt y secuencia de reconocimiento de Ia TEV proteasa. Parte superior: esquema del vector de expresión pKLSLt derivado del pKLSL150 (Figura 1 ). En él se han insertado, en el extremo 3' de Ia secuencia que codifica para Ia proteína LSL150, las secuencias que codifican para el linker y para el sitio de reconocimiento por Ia TEV proteasa. Se indica asimismo, Ia situación de un sitio múltiple de clonaje (EcoRI/Xhol). Parte inferior: secuencia de nucleótidos y aminoácidos del
extremo C-terminal de LSL150, así como del linker, de Ia secuencia de corte TEV y de los sitios de restricción.
Figura 5.- Plásmido pKLSLt-EGFP. Parte superior: esquema del vector de expresión pKLSLt -EGFP derivado del pKLSLt (Figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia Enhancer Green
Fluorescence Protein (EGFP) de Aequorea victoria (Clontech) de 720 pb entre los sitios de restricción EcoRI y Not I. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 6.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSL150-EGFP y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSL150-EGFP tras Sepharose™ 4B; 4. tratamiento de LSL150-EGFP con TEV proteasa; 5. EGFP tras filtración en gel con Superdex 75; 6. LSL150 tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
Figura 7.- Plásmido pKLSLt-PLD. Parte superior: esquema del vector de expresión pKLSLt -PLD derivado del pKLSLt (Figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína PLD (fosfolipasa dependiente de esfingomielina del microorganismo Arcanobacterium haemolyticum) de 846 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 8.- Análisis mediante SDS-PAGE de Ia expresión y purificación de
Ia proteína de fusión LSL150-PLD y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSL150-PLD tras
Sepharose™ 4B; 4. tratamiento de LSL150-PLD con TEV proteasa; 5. PLD tras filtración en gel con Superdex 75; 6. LSLi50 tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
Figura 9.- Plásmido pKLSLt-SMD. Parte superior: esquema del vector de expresión pKLSLt -SMD derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína SMD (fosfolipasa dependiente de esfingomielina del microorganismo Corynebacteríum pseudotuberculosis) de 802 pb entre los sitios de restricción EcoRI y Hind ///. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 10.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLi50-SMD y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSLi50-SMD tras Sepharose™ 4B; 4. tratamiento de LSLi50-SMD con TEV proteasa; 5. SMD tras filtración en gel con Superdex 75; 6. LSLi50 tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
Figura 11.- Plásmido pKLSLt-CPL7. Parte superior: esquema del vector de expresión pKLSLt -CPL7 derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína CPL7 (mureín hidrolasa del fago Cp-7 del microorganismo Streptoccocus pneumoniae) de 1003 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 12.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLi50-CPL7 y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción
soluble del homogeneizado celular; 3. proteína LSI_i5o-CPL7 tras Sepharose™ 4B; 4. tratamiento de LSLi50-CPL7 con TEV proteasa; 5. CPL7 tras filtración en gel con Superdex 75; 6. LSLi50 tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
Figura 13.- Plásmido pKLSI_t-IP5_2K. Parte superior: esquema del vector de expresión pKLSLt -IP5_2K derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína IP5_2K (Inositol (1 ,3,4,5,6)-pentakisfosfato quinasa de Arabidopsis thaliana) de 1353 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 14.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLiso-IP5_2K y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. fracción soluble del homogeneizado celular; 2 marcadores de masa molecular (kDa).; 3. proteína LSLiso-IP5_2K tras Sepharose™ 4B; 4. tratamiento de LSLiso-IP5_2K con TEV proteasa; 5. IP5_2K tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
EJEMPLOS DE LA INVENCIÓN
Ejemplo 1.- Desarrollo del vector con el dominio lectina β-trébol del hongo Laetiporus sulphureus Con objeto de caracterizar estructuralmente el dominio lectina β-trébol base de Ia invención, el gen que codifica para este péptido LSL150 fue expresado heterólogamente en E. coli. Concretamente, el péptido LSL150 de Ia invención (SEQ ID NO2) es el módulo lectina de Ia proteína modular LSL (Mr 35 kDa) producida por el hongo Laetiporus sulphureus (Tateno, H. & Goldstein, IJ. (2003). J. Biol. Chem. 278, 40455-40463). LSL150 está constituido por los 150 primeros aminoácidos de LSL (17 kDa), que
adoptan una estructura denominada de β-trébol (Mancheño. J. M., Tateno, H., Goldstein, IJ. , Martínez-Ripoll, M. & Hermoso, J.A. (2005). J. Biol. Chem. 280, 17251-17259). Este se puede describir como un pequeño barril β formado por 6 hebras β, en uno de cuyos extremos se encuentra el denominado triplete de bucles. La estructura en su conjunto resulta de Ia triplicación de una unidad estructural básica de unos 50 residuos, cada una de las cuales poseería capacidad de unión de azúcares derivados de galactosa. Por ello, LSL150 tiene tres potenciales sitios de unión de azúcares, dos de los cuales son competentes para unir disacáridos conteniendo galactosa según se ha demostrado (Mancheño. J. M., Tateno, H., Goldstein, IJ. , Martínez-Ripoll, M. & Hermoso, J.A. (2005). J. Biol. Chem. 280, 17251-17259).
Previamente, el vector plasmídico pKLSL150 (Figura 1 ) fue construido insertando Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL450) en el vector pET28a+ (Novagen). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno, H. & Goldstein, IJ. (2003).
J. Biol. Chem. 278, 40455-40463), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen LSL45O y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y EcoRI respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSL150 siguiendo procedimientos estándares de clonaje (Sambrook, J.
& Russell, D.W. (2001 ). CoId Spring Harbour Lab. Press. 3rd Ed).
Para Ia producción de Ia proteína LSLi50 recombinante, se transformaron bacterias E. coli (BL21 DE3) con el vector de expresión
pKLSL150, en donde Ia expresión del gen que codifica para ella se encuentra bajo el control transcripcional del promotor de T7. Las células de E. coli fueron crecidas en 1 L de medio Luria Bertani LB conteniendo kanamicina (50 μg/mL) durante 3-4 horas a 370C, hasta alcanzarse una OD6oonm de 0.6, momento en donde se induce Ia expresión de Ia proteína mediante Ia adición de 0.3 mM IPTG y posterior incubación a 160C durante 20 horas. Los cultivos celulares se separaron del medio de cultivo mediante centrifugación a 4000 x g durante 15 min. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de Ia proteína LSLi50 mediante lavado con el mismo buffer anterior conteniendo lactosa 0.2 M. La columna puede ser empleada de nuevo sin necesidad de etapas de regeneración adicionales, simplemente tras equilibrarla de nuevo en el buffer de lavado sin azúcar. Debido a que Ia matriz cromatográfica resulta ser inerte a los homogeneizados celulares su uso continuado está garantizado. La proteína así purificada se ha conseguido con un rendimiento de aproximadamente 50 mg/litro de cultivo. El protocolo de purificación proporciona proteína LSLi50 electroforéticamente pura (Figura 2).Todas las etapas del proceso de purificación se realizan a 40C. Se ha determinado Ia estructura tridimensional de LSLi50 recombinante mediante cristalografía de proteínas, encontrándose que es perfectamente superponible (rmsd 1.1 A para 148 carbonos) al dominio lectina de LSL aislada directamente del hongo Laetiporus sulphureus (Figura 3), Io cual
es garantía del plegamiento adecuado de esta proteína expresada heterólogamente. El extraordinario rendimiento de Ia producción de LSLi50, que apunta a unas muy eficaces etapas de transcripción y traducción, así como Ia eficacia, sencillez y costes perfectamente asumibles del protocolo de purificación condujeron al planteamiento de Ia hipótesis de trabajo de que LSL150 pudiese actuar como etiqueta de afinidad y de solubilidad en Ia producción de proteínas de fusión. Además, esta molécula posee características muy atractivas como etiqueta de fusión: en primer lugar, es extraordinariamente soluble (se han preparado soluciones de hasta 60-80 mg/ml). Aunque esta característica no es un requisito suficiente para considerarse un agente solubilizante, sí que es un requisito necesario para serlo; en segundo lugar, es monomérica, por Io que no va a contribuir al establecimiento de interacciones intermoleculares entre las proteínas de fusión de las que forme parte, y en tercer lugar, carece de residuos de cisteína, Io que implica Ia ausencia de problemas de oxidaciones.
Con objeto de validar esta hipótesis se han construido una serie de fusiones génicas entre Ia secuencia que codifica para LSLi50 y las secuencias que codifican para distintas proteínas, entre las cuales se ha incorporado Ia secuencia de reconocimiento de Ia proteasa TEV. Para ello se construyó el vector plasmídico pKLSLt insertando en el vector pET28a+ (Novagen) Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL450) seguida de Ia secuencias de nucleótidos que codifican para un linker de unión y el sitio de reconocimiento de Ia TEV proteasa [LTEV). Dicho inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno, H. & Goldstein, IJ. (2003). J. Biol. Chem. 278, 40455-40463) y oligonucleótidos que hibridan en Ia región inicial y final del gen LSL450 y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y Ia secuencia (LTEV) seguida de Ia secuencia diana para Ia enzima de restricción EcoRI, respectivamente (Figura 4). Tras Ia reacción, el
fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt siguiendo procedimientos estándares de clonaje (Sambrook, J. & Russell, D. W. (2001 ). CoId Spring Harbour Lab. Press. 3rd Ed).
Ejemplo 2.- Expresión de Ia proteína de fusión LSLI50-EGFP
2.1.- Construcción del vector plasmídico pKLSLt
Con objeto de validar las aplicaciones del dominio SEQ ID NO2 se han construido una serie de fusiones génicas entre Ia secuencia de ADN que codifica para el dominio LSL150 (SEQ ID NO1 ) y las secuencias que codifican para distintas proteínas, entre las cuales se ha incorporado Ia secuencia de reconocimiento de Ia proteasa TEV. Para ello se construyó el vector plasmídico pKLSLt insertando en el vector pET28a+ (Novagen) Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL450) seguida de Ia secuencias de nucleótidos que codifican para un linker de unión y el sitio de reconocimiento de Ia TEV proteasa (LTEV). Dicho inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno & Goldstein, 2003) y oligonucleótidos que hibridan en Ia región inicial y final del gen LSL450 y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y Ia secuencia (LTEV) seguida de Ia secuencia diana para Ia enzima de restricción EcoRI, respectivamente (Figura 4). Tras Ia reacción, el fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se
seleccionó el plásmido recombinante pKLSLt siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
2.2.- Construcción del vector plasmídico pKLSLt-EGFP El vector plasmídico pKLSLt-EGFP (Figura 5) fue construido insertando una fase de lectura abierta de 720 nt del gen de Ia proteína EGFP (Enhancer Green Fluorescence Protein) en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pCMV-EGFP (Clontech), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen EGFP y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Notl, respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-EGFP siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
2.3.- Producción y purificación de Ia proteína de fusión LSL150-EGFP
Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-EGFP (Figura 5) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una ODβoonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSL150-EGFP mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 160C durante 20 horas. Tras centrifugación a 4000 x g durante 15 min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene
mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL150-EGFP mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 6). Las fracciones conteniendo LSL150-EGFP se juntaron (Figura 6, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas Centriprep YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde EGFP y LSL150 (Figura 6, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 6, calles 5 y 6, respectivamente).
Ejemplo 3.- Expresión de Ia proteína de fusión LSLi50-PLD
3.1.- Construcción de los plásmidos bacterianos El vector plasmídico pKLSLt-PLD (Figura 7) fue construido insertando Ia fase de lectura abierta de los primeros 846nt del gen de Ia fosfolipasa dependiente de esfingomielina (PLD) de Ia bacteria patógena Arcanobacterium haemolyticum en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pJB31 (proporcionado por el Dr. Stephen Billington del Department of Veterinary Science and Microbiology, University of Arizona), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen PLD y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción,
purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-PLD siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
3.2.- Producción y purificación de Ia proteína de fusión LSLi50-PLD
Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-PLD (Figura 7) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD6oonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSLi50-PLD mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 160C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL150-PLD mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 8). Las fracciones conteniendo LSLi50-PLD se juntaron (Figura 8, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde PLD y LSLi50 (Figura 8, calle
4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 8, calles 5 y 6, respectivamente).
Ejemplo 4.- Expresión de Ia proteína de fusión LSL150-SMD
4.1. - Construcción de los plásmidos bacterianos
El vector plasmídico pKLSLt-SMD (Figura 9) fue construido insertando Ia fase de lectura abierta de 802nt del gen de Ia fosfolipasa dependiente de esfingomielina del microorganismo patógeno Corynebacteríum pseudotuberculosis (SMD) en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pJG90 (Tambourgi et al., 2002), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen EGFP y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-SMD siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
4.2.- Purificación de Ia proteína de fusión LSLi50-SMD
Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-SMD (Figura 9) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD6oonm de 0.6.
En ese momento se induce Ia expresión de Ia proteína LSL150-SMD mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a
160C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI
y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL150-SMD mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 10). Las fracciones conteniendo LSL150-SMD se juntaron (Figura 10, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde SMD y LSL150 (Figura 10, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 10, calles 5 y 6, respectivamente).
Ejemplo 5.- Expresión de Ia proteína de fusión LSLi50-CPL7
5.1.- Construcción de los plásmidos bacterianos
El vector plasmídico pKLSLt-CPL7 (Figura 11 ) fue construido insertando Ia fase de lectura abierta de los primeros 1003nt del gen de Ia proteína mureín hidrolasa CPL7 del bacteriófago Cp-7 de Streptococcus pneumoniae en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pCP700 (García, P., García, JL., García, E., Sánchez-Puelles, J. M., López, R. (1990) Gene 86, 81-88), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen CPL7 y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento
obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionándose el plásmido recombinante pKLSI_t-CPL7 siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
5.2.- Purificación de Ia proteína de fusión LSLi50-CPL7 Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-CPL7 (Figura 11 ) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD6oonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSL150-CPI-J mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 160C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSLi50-CPL7 mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 12). Las fracciones conteniendo LSLi50-CPL7 se juntaron (Figura 12, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM
NaCI, 0.04% azida sódica (80:1 ; w/w), rinde CPL7 y LSL150 (Figura 12, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 12, calles 5 y 6, respectivamente).
Ejemplo 6.- Expresión de Ia proteína de fusión LSLi50-IP5_2K
5.1.- Construcción de los plásmidos bacterianos
El vector plasmídico pKLSLt-IP5_2K (Figura 13) fue construido insertando Ia fase de lectura abierta de los primeros 1353nt del gen de Ia proteína Inositol (1 ,3,4,5,6)-pentakisfosfato quinasa de Arabidopsis thaliana en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pET28c conteniendo el cDNA de IP5_2K (proporcionado por Ia Dr. Beatriz González, Grupo de Cristalografía, Insto. Rocasolano, CSIC), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen IP5_2K y presentan en sus extremos las secuencias diana de las enzimas de restricción Sacl y Xhol respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación, seleccionándose el plásmido recombinante pKLSLt-IP5_2K siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
5.2.- Purificación de Ia proteína de fusión LSLi50-IP5_2K
Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-IP5_2K (Figura 13) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD6oonm de 1. En ese momento se induce Ia expresión de Ia proteína LSL150-IP5_2K mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a
160C durante 16 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpm en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSLi50-IP5_2K mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 14). Las fracciones conteniendo LSL150- IP5_2K se juntaron (Figura 14, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde IP5_2K y LSL150 (Figura 14, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 14, calles 5).
A modo de comparación, IP5_2K se ha producido como proteína de fusión con GST (GST-IP5_2K) y purificado siguiendo protocolos estándar para esta etiqueta afinidad/solubilidad (resultados no mostrados). Al igual que LSL-I P5_2K, GST-I P5_2K fue tratada con TEV proteasa, y posteriormente IP5_2K purificada mediante cromatografía de penetrabilidad en Superdex 75. Los rendimientos finales de ambas purificaciones llevadas a cabo en paralelo, en condiciones experimentales esencialmente idénticas, fueron: 23 mg de IP5 2K partiendo de 4 litros de cultivo con el sistema basado en LSL y de 3.2 mg con el basado en GST.
Claims
1.- Proteína de fusión recombinante caracterizada porque comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de aminoácidos del péptido LSL150 del hongo
Laetiporus sulphureus (SEQ ID NO2), y b) una secuencia análoga a Ia SEQ ID NO2 de a).
2.- Procedimiento de obtención de Ia proteína de fusión según reivindicación 1 caracterizado porque comprende las siguientes etapas: i) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSLi50 (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, ii) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escherichia coli, en Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, iii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, iv) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado.
3.- Construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión según reivindicación 1 caracterizada porque comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de ADN SEQ ID NO1 , y b) una secuencia homologa a Ia SEQ ID NO1.
A - Construcción genética según reivindicación 3 caracterizada porque comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag).
5.- Vector de expresión caracterizado porque comprende una construcción genética según reivindicaciones 3 y 4 que permite Ia expresión de una proteína o péptido.
6.- Vector de expresión según reivindicación 5 caracterizado porque el vector es un plásmido o un vector viral.
7.- Célula huésped caracterizada porque comprende Ia construcción genética según reivindicaciones 3 y 4 o el vector de expresión según reivindicaciones 5 y 6, preferentemente una célula procariota.
8.- Célula huésped según reivindicación 7 caracterizada porque está constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ESP200800909 | 2008-04-02 | ||
ES200800909A ES2327309B1 (es) | 2008-04-02 | 2008-04-02 | Proteinas de fusion con un dominio lectina de tipo beta-trebol, procedimiento de obtencion y sus aplicaciones. |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2009121994A1 true WO2009121994A1 (es) | 2009-10-08 |
Family
ID=41134867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/ES2009/070079 WO2009121994A1 (es) | 2008-04-02 | 2009-03-30 | Proteínas de fusión con un dominio lectina de tipo beta-trébol, procedimiento de obtención y sus aplicaciones |
Country Status (2)
Country | Link |
---|---|
ES (1) | ES2327309B1 (es) |
WO (1) | WO2009121994A1 (es) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999066053A1 (en) * | 1998-06-16 | 1999-12-23 | Rmf Dictagene S.A. | Expression vector for use in a one-step purification protocol |
-
2008
- 2008-04-02 ES ES200800909A patent/ES2327309B1/es not_active Expired - Fee Related
-
2009
- 2009-03-30 WO PCT/ES2009/070079 patent/WO2009121994A1/es active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999066053A1 (en) * | 1998-06-16 | 1999-12-23 | Rmf Dictagene S.A. | Expression vector for use in a one-step purification protocol |
Non-Patent Citations (4)
Title |
---|
MANCHEÑO, J.M. ET AL.: "Structural Analysis of the Laetiporus sulphureus Hemolytic Pore-forming lectin in Complex with Sugars.", J. BIOLOGICAL CHEMISTRY, vol. 280, no. 17, April 2005 (2005-04-01), pages 17251 - 17259 * |
TATENO, H. ET AL.: "Molecular Cloning, Expression, and Characterization of Novthe Hemolytic Lectins from the Mushroom Laetiporus sulphureus, Which Show Homology to Bacterial Toxins.", J. BIOLOGICAL CHEMISTRY, vol. 278, no. 42, October 2003 (2003-10-01), pages 40455 - 40463 * |
TAYLOR, M.E. ET AL.: "Carbohydrate- recognition domains as tools for rapid purification of recombinant eukaryotic proteins.", BIOCHEM. J., vol. 274, March 1991 (1991-03-01), pages 575 - 580 * |
TIELKER, D. ET AL.: "Lectin-based affinity tag for one-step protein purification.", BIO-TECHNIQUES., vol. 41, no. 3, September 2006 (2006-09-01), pages 327 - 332 * |
Also Published As
Publication number | Publication date |
---|---|
ES2327309A1 (es) | 2009-10-27 |
ES2327309B1 (es) | 2010-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guerrero et al. | Tandem SUMO fusion vectors for improving soluble protein expression and purification | |
US7271256B2 (en) | Method for producing circular or multimeric protein species in vivo or in vitro and related methods | |
Garinot-Schneider et al. | Identification of putative active-site residues in the DNase domain of colicin E9 by random mutagenesis | |
Lin et al. | Aggregating tags for column‐free protein purification | |
ES2321058T7 (es) | Purificación de proteínas recombinantes fusionadas con epítopos múltiples | |
Olson et al. | Design, expression, and stability of a diverse protein library based on the human fibronectin type III domain | |
US8357511B2 (en) | Protein purification tags and uses thereof | |
US10358461B2 (en) | Precipitable peptides | |
CN110511950B (zh) | Pab蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用 | |
Loughran et al. | Modified His-tag fusion vector for enhanced protein purification by immobilized metal affinity chromatography | |
ES2327309B1 (es) | Proteinas de fusion con un dominio lectina de tipo beta-trebol, procedimiento de obtencion y sus aplicaciones. | |
US20160319287A1 (en) | Atypical inteins | |
EP1981978B1 (en) | Affinity polypeptide for purification of recombinant proteins | |
Mochnáčová et al. | Simple and rapid pipeline for the production of cyclic and linear small-sized peptides in E. coli | |
US20220042063A1 (en) | Novel peptide for enhancing expression efficiency of target protein, and fusion protein comprising same | |
KR20090018315A (ko) | 대장균 유래 ptsL 프로모터를 함유하는 재조합벡터 및이를 이용한 외래 단백질의 제조방법 | |
Clifford et al. | Production of native recombinant proteins using a novel split intein affinity technology | |
CN114921449B (zh) | 一种组织蛋白酶k的制备方法 | |
WO2023108026A2 (en) | Biological production of histidine-rich peptides | |
US11214791B2 (en) | Engineered FHA domains | |
WO2023177526A2 (en) | Compositions and methods for detecting an endotoxin | |
WO2024119434A1 (zh) | 一种提高重组蛋白表达效率的酸性表面助溶短肽标签 | |
US20200291080A1 (en) | Recombinase Purification | |
JP2018000174A (ja) | ヒトFcRnをコードするポリヌクレオチドおよび当該ポリヌクレオチドを利用したヒトFcRnの製造方法 | |
US20110136169A1 (en) | Expression system compositions and methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 09728641 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 09728641 Country of ref document: EP Kind code of ref document: A1 |