BR112018017088B1 - Sistema de expressão para organismos eucarióticos - Google Patents
Sistema de expressão para organismos eucarióticos Download PDFInfo
- Publication number
- BR112018017088B1 BR112018017088B1 BR112018017088-7A BR112018017088A BR112018017088B1 BR 112018017088 B1 BR112018017088 B1 BR 112018017088B1 BR 112018017088 A BR112018017088 A BR 112018017088A BR 112018017088 B1 BR112018017088 B1 BR 112018017088B1
- Authority
- BR
- Brazil
- Prior art keywords
- expression
- stf
- promoter
- core promoter
- dna
- Prior art date
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 332
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 166
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 54
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 54
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 48
- 230000009870 specific binding Effects 0.000 claims abstract description 33
- 108091023040 Transcription factor Proteins 0.000 claims abstract description 30
- 102000040945 Transcription factor Human genes 0.000 claims abstract description 30
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 56
- 241000894007 species Species 0.000 claims description 28
- 108091081024 Start codon Proteins 0.000 claims description 25
- 230000004913 activation Effects 0.000 claims description 25
- 238000004519 manufacturing process Methods 0.000 claims description 24
- 238000013518 transcription Methods 0.000 claims description 20
- 230000035897 transcription Effects 0.000 claims description 20
- 230000001276 controlling effect Effects 0.000 claims description 14
- 241000233866 Fungi Species 0.000 claims description 12
- 230000002538 fungal effect Effects 0.000 claims description 9
- 241000196324 Embryophyta Species 0.000 claims description 8
- 241000282414 Homo sapiens Species 0.000 claims description 7
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 6
- 241000195628 Chlorophyta Species 0.000 claims description 5
- 241000218922 Magnoliophyta Species 0.000 claims description 5
- 241001465754 Metazoa Species 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 5
- 230000001105 regulatory effect Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 abstract description 19
- 108020004414 DNA Proteins 0.000 description 71
- 108091026890 Coding region Proteins 0.000 description 58
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 52
- 241000499912 Trichoderma reesei Species 0.000 description 51
- 230000027455 binding Effects 0.000 description 48
- 239000013612 plasmid Substances 0.000 description 36
- 238000004458 analytical method Methods 0.000 description 34
- 101150052795 cbh-1 gene Proteins 0.000 description 34
- 230000009466 transformation Effects 0.000 description 31
- 241000228245 Aspergillus niger Species 0.000 description 30
- 244000005700 microbiome Species 0.000 description 27
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 26
- 108700008625 Reporter Genes Proteins 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 25
- 241000235645 Pichia kudriavzevii Species 0.000 description 23
- 230000010354 integration Effects 0.000 description 23
- 101710096438 DNA-binding protein Proteins 0.000 description 22
- 108700026244 Open Reading Frames Proteins 0.000 description 22
- 239000003550 marker Substances 0.000 description 22
- 239000000047 product Substances 0.000 description 22
- 239000002609 medium Substances 0.000 description 21
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 20
- 102100029820 Mitochondrial brown fat uncoupling protein 1 Human genes 0.000 description 20
- 229920001817 Agar Polymers 0.000 description 19
- 102000053602 DNA Human genes 0.000 description 19
- 101000939438 Homo sapiens Mitochondrial brown fat uncoupling protein 1 Proteins 0.000 description 19
- 241000235058 Komagataella pastoris Species 0.000 description 19
- 239000008272 agar Substances 0.000 description 19
- 239000013256 coordination polymer Substances 0.000 description 19
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 16
- 244000206911 Candida holmii Species 0.000 description 16
- 239000000499 gel Substances 0.000 description 16
- 230000006801 homologous recombination Effects 0.000 description 16
- 238000002744 homologous recombination Methods 0.000 description 16
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- 241000699666 Mus <mouse, genus> Species 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 235000002965 Candida holmii Nutrition 0.000 description 14
- 238000003753 real-time PCR Methods 0.000 description 14
- 238000000844 transformation Methods 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- 108700010070 Codon Usage Proteins 0.000 description 12
- 210000001938 protoplast Anatomy 0.000 description 12
- 108091033409 CRISPR Proteins 0.000 description 11
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 11
- 230000001419 dependent effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 239000008103 glucose Substances 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 10
- 241000545067 Venus Species 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- 230000012010 growth Effects 0.000 description 10
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 9
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 9
- 229940041514 candida albicans extract Drugs 0.000 description 9
- 239000012228 culture supernatant Substances 0.000 description 9
- 229960002920 sorbitol Drugs 0.000 description 9
- 230000002103 transcriptional effect Effects 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 239000012138 yeast extract Substances 0.000 description 9
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 8
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 8
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 8
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 8
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 8
- 241001138401 Kluyveromyces lactis Species 0.000 description 8
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 8
- 241000207746 Nicotiana benthamiana Species 0.000 description 8
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 8
- 101150001810 TEAD1 gene Proteins 0.000 description 8
- 101150074253 TEF1 gene Proteins 0.000 description 8
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 8
- 239000001110 calcium chloride Substances 0.000 description 8
- 235000011148 calcium chloride Nutrition 0.000 description 8
- 229910001628 calcium chloride Inorganic materials 0.000 description 8
- 238000000684 flow cytometry Methods 0.000 description 8
- 239000013642 negative control Substances 0.000 description 8
- 229910052757 nitrogen Inorganic materials 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 241000351920 Aspergillus nidulans Species 0.000 description 7
- 241000699802 Cricetulus griseus Species 0.000 description 7
- 241000124008 Mammalia Species 0.000 description 7
- 241000235015 Yarrowia lipolytica Species 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 7
- 239000008101 lactose Substances 0.000 description 7
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 7
- 230000037353 metabolic pathway Effects 0.000 description 7
- 239000001965 potato dextrose agar Substances 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 238000012800 visualization Methods 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 6
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 6
- 241000219195 Arabidopsis thaliana Species 0.000 description 6
- 101100351264 Candida albicans (strain SC5314 / ATCC MYA-2876) PDC11 gene Proteins 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 6
- 241000699660 Mus musculus Species 0.000 description 6
- 239000000020 Nitrocellulose Substances 0.000 description 6
- 101150050255 PDC1 gene Proteins 0.000 description 6
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 6
- 229940097277 hygromycin b Drugs 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 229920001220 nitrocellulos Polymers 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 239000004458 spent grain Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 108010023063 Bacto-peptone Proteins 0.000 description 5
- 235000017399 Caesalpinia tinctoria Nutrition 0.000 description 5
- 108010059892 Cellulase Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 5
- 101000713234 Homo sapiens TRIO and F-actin-binding protein Proteins 0.000 description 5
- 239000007836 KH2PO4 Substances 0.000 description 5
- 102000004389 Ribonucleoproteins Human genes 0.000 description 5
- 108010081734 Ribonucleoproteins Proteins 0.000 description 5
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 5
- 102100036855 TRIO and F-actin-binding protein Human genes 0.000 description 5
- 241000388430 Tara Species 0.000 description 5
- 239000006285 cell suspension Substances 0.000 description 5
- 229940106157 cellulase Drugs 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 5
- 235000019796 monopotassium phosphate Nutrition 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 108010054624 red fluorescent protein Proteins 0.000 description 5
- 239000000600 sorbitol Substances 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 102100036826 Aldehyde oxidase Human genes 0.000 description 4
- 238000010354 CRISPR gene editing Methods 0.000 description 4
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 4
- 241001326555 Eurotiomycetes Species 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 4
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 4
- 241000908234 Mucor indicus Species 0.000 description 4
- 241000235388 Mucorales Species 0.000 description 4
- 241000226677 Myceliophthora Species 0.000 description 4
- 125000002288 PGK1 group Chemical group 0.000 description 4
- 241000228150 Penicillium chrysogenum Species 0.000 description 4
- 241000235343 Saccharomycetales Species 0.000 description 4
- 241001326539 Schizosaccharomycetes Species 0.000 description 4
- 241001326533 Sordariomycetes Species 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 239000012160 loading buffer Substances 0.000 description 4
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 4
- 235000019341 magnesium sulphate Nutrition 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000010473 stable expression Effects 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 235000013619 trace mineral Nutrition 0.000 description 4
- 239000011573 trace mineral Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- 241000123640 Arecales Species 0.000 description 3
- 244000075850 Avena orientalis Species 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 241000218980 Brassicales Species 0.000 description 3
- 235000002566 Capsicum Nutrition 0.000 description 3
- 240000008574 Capsicum frutescens Species 0.000 description 3
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 3
- 244000045195 Cicer arietinum Species 0.000 description 3
- 235000010523 Cicer arietinum Nutrition 0.000 description 3
- 244000060011 Cocos nucifera Species 0.000 description 3
- 235000013162 Cocos nucifera Nutrition 0.000 description 3
- 241000699800 Cricetinae Species 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 241000255601 Drosophila melanogaster Species 0.000 description 3
- 240000003133 Elaeis guineensis Species 0.000 description 3
- 241001465328 Eremothecium gossypii Species 0.000 description 3
- 241001247262 Fabales Species 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- 240000005979 Hordeum vulgare Species 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 240000004322 Lens culinaris Species 0.000 description 3
- 235000010666 Lens esculenta Nutrition 0.000 description 3
- 241000219171 Malpighiales Species 0.000 description 3
- 241000555303 Mamestra brassicae Species 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 241000219833 Phaseolus Species 0.000 description 3
- 241000218633 Pinidae Species 0.000 description 3
- 240000004713 Pisum sativum Species 0.000 description 3
- 235000010582 Pisum sativum Nutrition 0.000 description 3
- 241001536628 Poales Species 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 240000000111 Saccharum officinarum Species 0.000 description 3
- 235000007201 Saccharum officinarum Nutrition 0.000 description 3
- 235000007238 Secale cereale Nutrition 0.000 description 3
- 244000082988 Secale cereale Species 0.000 description 3
- 241000208255 Solanales Species 0.000 description 3
- 240000003768 Solanum lycopersicum Species 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 240000006394 Sorghum bicolor Species 0.000 description 3
- 235000007230 Sorghum bicolor Nutrition 0.000 description 3
- 241000256251 Spodoptera frugiperda Species 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- 241000255993 Trichoplusia ni Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- 241000209140 Triticum Species 0.000 description 3
- 241000219977 Vigna Species 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000007244 Zea mays Nutrition 0.000 description 3
- 108010084455 Zeocin Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000001390 capsicum minimum Substances 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005558 fluorometry Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 3
- 239000008223 sterile water Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108020005065 3' Flanking Region Proteins 0.000 description 2
- 101150055704 ALG9 gene Proteins 0.000 description 2
- 101100343194 Aspergillus niger gaaC gene Proteins 0.000 description 2
- 235000007319 Avena orientalis Nutrition 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 241000195585 Chlamydomonas Species 0.000 description 2
- 241000196319 Chlorophyceae Species 0.000 description 2
- 229910021580 Cobalt(II) chloride Inorganic materials 0.000 description 2
- 235000001950 Elaeis guineensis Nutrition 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 101001076604 Homo sapiens Inhibin alpha chain Proteins 0.000 description 2
- 101001115218 Homo sapiens Ubiquitin-40S ribosomal protein S27a Proteins 0.000 description 2
- 101001046426 Homo sapiens cGMP-dependent protein kinase 1 Proteins 0.000 description 2
- 102100025885 Inhibin alpha chain Human genes 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 239000008118 PEG 6000 Substances 0.000 description 2
- 235000012570 Pinus sp Nutrition 0.000 description 2
- 229920002584 Polyethylene Glycol 6000 Polymers 0.000 description 2
- 241000218979 Populus sp. Species 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 241001293481 Trebouxiophyceae Species 0.000 description 2
- 102100023341 Ubiquitin-40S ribosomal protein S27a Human genes 0.000 description 2
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 239000002518 antifoaming agent Substances 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 102100022422 cGMP-dependent protein kinase 1 Human genes 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- -1 crRNA Proteins 0.000 description 2
- 230000001461 cytolytic effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 101150073906 gpdA gene Proteins 0.000 description 2
- 101150095733 gpsA gene Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 101150085005 ku70 gene Proteins 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 108010038196 saccharide-binding proteins Proteins 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000028070 sporulation Effects 0.000 description 2
- 239000012192 staining solution Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 239000007221 ypg medium Substances 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- MRXDGVXSWIXTQL-HYHFHBMOSA-N (2s)-2-[[(1s)-1-(2-amino-1,4,5,6-tetrahydropyrimidin-6-yl)-2-[[(2s)-4-methyl-1-oxo-1-[[(2s)-1-oxo-3-phenylpropan-2-yl]amino]pentan-2-yl]amino]-2-oxoethyl]carbamoylamino]-3-phenylpropanoic acid Chemical compound C([C@H](NC(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C=O)C1NC(N)=NCC1)C(O)=O)C1=CC=CC=C1 MRXDGVXSWIXTQL-HYHFHBMOSA-N 0.000 description 1
- VLEIUWBSEKKKFX-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O VLEIUWBSEKKKFX-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 102100032533 ADP/ATP translocase 1 Human genes 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- OLVPQBGMUGIKIW-UHFFFAOYSA-N Chymostatin Natural products C=1C=CC=CC=1CC(C=O)NC(=O)C(C(C)CC)NC(=O)C(C1NC(N)=NCC1)NC(=O)NC(C(O)=O)CC1=CC=CC=C1 OLVPQBGMUGIKIW-UHFFFAOYSA-N 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 101000768061 Escherichia phage P1 Antirepressor protein 1 Proteins 0.000 description 1
- 102100020760 Ferritin heavy chain Human genes 0.000 description 1
- 101100264215 Gallus gallus XRCC6 gene Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 101000796932 Homo sapiens ADP/ATP translocase 1 Proteins 0.000 description 1
- 101001002987 Homo sapiens Ferritin heavy chain Proteins 0.000 description 1
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 1
- 241000500891 Insecta Species 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 108010054278 Lac Repressors Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 108010050258 Mitochondrial Uncoupling Proteins Proteins 0.000 description 1
- 239000007832 Na2SO4 Substances 0.000 description 1
- 101100342585 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) mus-51 gene Proteins 0.000 description 1
- 101100494726 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pep-4 gene Proteins 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- 241000467496 Pseudomonas protegens Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 101150111829 RBCS2 gene Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 101150014136 SUC2 gene Proteins 0.000 description 1
- 101100342589 Schizosaccharomyces pombe (strain 972 / ATCC 24843) pku70 gene Proteins 0.000 description 1
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 1
- UIIMBOGNXHQVGW-DEQYMQKBSA-M Sodium bicarbonate-14C Chemical compound [Na+].O[14C]([O-])=O UIIMBOGNXHQVGW-DEQYMQKBSA-M 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 101100245640 Solanum lycopersicum PSBP gene Proteins 0.000 description 1
- 241000946897 Streptomyces lavenduligriseus Species 0.000 description 1
- 102100036976 X-ray repair cross-complementing protein 6 Human genes 0.000 description 1
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 1
- 101150023727 ald2 gene Proteins 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 229940019748 antifibrinolytic proteinase inhibitors Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 229940091771 aspergillus fumigatus Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 108010086192 chymostatin Proteins 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000011544 gradient gel Substances 0.000 description 1
- 101150051897 his5 gene Proteins 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- SURQXAFEQWPFPV-UHFFFAOYSA-L iron(2+) sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Fe+2].[O-]S([O-])(=O)=O SURQXAFEQWPFPV-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 229910000357 manganese(II) sulfate Inorganic materials 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 229950000964 pepstatin Drugs 0.000 description 1
- 108010091212 pepstatin Proteins 0.000 description 1
- FAXGPCHRFPCXOO-LXTPJMTPSA-N pepstatin A Chemical compound OC(=O)C[C@H](O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)C[C@H](O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)CC(C)C FAXGPCHRFPCXOO-LXTPJMTPSA-N 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 1
- 229960001225 rifampicin Drugs 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 229910052938 sodium sulfate Inorganic materials 0.000 description 1
- 235000011152 sodium sulphate Nutrition 0.000 description 1
- 101150028191 stf gene Proteins 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 1
- 229910000368 zinc sulfate Inorganic materials 0.000 description 1
- RZLVQBNCHSJZPX-UHFFFAOYSA-L zinc sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Zn+2].[O-]S([O-])(=O)=O RZLVQBNCHSJZPX-UHFFFAOYSA-L 0.000 description 1
- 239000011686 zinc sulphate Substances 0.000 description 1
- 235000009529 zinc sulphate Nutrition 0.000 description 1
Abstract
A presente invenção proporciona um sistema de expressão para um hospedeiro eucariótico, que compreende 1) um cassete de expressão compreendendo um promotor de núcleo, o referido promotor de núcleo controlando a expressão de uma sequência de DNA que codifica um fator de transcrição sintético (sTF) e 2) um ou mais cassetes de expressão compreendendo, cada um, uma sequência de DNA que codifica um produto desejado operavelmente ligado a um promotor sintético, o referido promotor sintético compreendendo um promotor de núcleo, e sítios de ligação específicos para o sTF a montante do promotor de núcleo. A presente invenção também proporciona um método para identificar promotores de núcleo universais para hospedeiros eucarióticos, sistemas de expressão utilizando promotores de núcleo universais, hospedeiros compreendendo os referidos sistemas, e métodos para produzir produtos proteicos em hospedeiros eucarióticos.
Description
[0001] A presente invenção refere-se a um sistema de expressão para um hospedeiro eucariótico (tal como um hospedeiro de micro-organismo), um hospedeiro compreendendo o referido sistema de expressão, e um método para a produção de um produto proteico desejado usando o referido hospedeiro. Além disso, a presente invenção refere-se a um método para identificar um promotor de núcleo universal, um promotor de núcleo universal obtenível pelo referido método e um sistema de expressão, um hospedeiro de organismo eucariótico (tal como um hospedeiro de micro-organismo) e um método para produzir um produto proteico utilizando um promotor de núcleo universal.
[0002] A expressão gênica controlada e previsível é muito difícil de conseguir, mesmo em hospedeiros bem estabelecidos, especialmente em termos de expressão estável em condições de cultivo ou estágios de crescimento diversos. Além disso, para muitos hospedeiros industriais potencialmente interessantes, existe um espectro muito limitado (ou mesmo ausente) de ferramentas e/ou métodos para realizar a expressão de genes heterólogos. Em muitos casos, isso impede o uso desses (hospedeiros frequentemente muito promissores) em aplicações industriais. Em alguns hospedeiros, condições indutoras específicas precisam estar funcionando para alcançar a expressão desejável dos genes-alvo. Isso resulta em exigências específicas para os meios de cultura ou o processamento a jusante que, no final, aumentam os custos de produção. Outro problema em hospedeiros industriais é o estabelecimento de programas de expressão complexos nos quais se deseja ter simultaneamente níveis de expressão específicos de múltiplos genes. Isto é importante, por exemplo, para a engenharia da via metabólica, onde os genes individuais que codificam as enzimas nas vias de produção precisam ser expressos (e as enzimas correspondentes produzidas) em uma razão equilibrada, para garantir o fluxo metabólico ideal para os produtos desejados.
[0003] Para atingir padrões de expressão previsíveis e/ou estáveis dos genes-alvo em um organismo hospedeiro (em condições variáveis) é importante que a expressão destes genes seja minimamente afetada pelos mecanismos reguladores intrínsecos do hospedeiro. Isto pode ser realizado através da utilização de componentes não nativos (heterólogos) (promotores, fatores de transcrição e agentes indutores) nos sistemas de expressão de genes-alvo engenheirados. Estes sistemas de expressão são chamados ortogonais, se não forem influenciados pelo hospedeiro e senão estiverem influenciando o hospedeiro de outras maneiras que não as pretendidas. Os sistemas de expressão ortogonaisainda dependem, no entanto, das funções celulares endógenas do hospedeiro, tais como a transcrição e a tradução, de modo que eles têm que satisfazer certos critérios que permitam a sua funcionalidade no hospedeiro. Estes critérios são, até certo ponto, específicos para a espécie (hospedeiro), o que torna difícil projetar um sistema ortogonal funcional através de uma ampla variedade de espécies muito diferentes.
[0004] Tipicamente, as estratégias atuais para a expressão de genes heterólogos empregam o uso de promotores endógenos (específicos do hospedeiro) em hospedeiros específicos (Hubmann et al. 2014 e Blumhoff et al. 2012). Estes promotores podem ser induzíveis, ou os assim chamados constitutivos, porém, em nenhum caso, são ortogonais, porque a sua função é dependente de fatores específicos existentes no organismo hospedeiro. Também, o uso de promotores específicos do hospedeiro impede a transferência interespécies desses sistemas de expressão, o que resulta na necessidade de desenvolver sistemas de expressão customizados para cada hospedeiro. Os exemplos existentes de sistemas de expressão transferíveis interespécies, baseados nos promotores do hospedeiro nativo, estão limitados a um espectro estreito de organismos intimamente relacionados, nos quais os promotores funcionam. Estes incluem alguns promotores de levedura, tais como os promotores de Kluyveromyces lactis URA3 e LEU2 ou Schizosaccharomyces pombe HIS5 funcionais em Saccharomyces cerevisiae. Em fungos filamentosos, por exemplo, o promotor gpdA de Aspergillus nidulans tem sido utilizado com sucesso em Aspergillus niger, Aspergillus fumigatus e Trichoderma reesei. Estes promotores são, no entanto, principalmente utilizados para a expressão de genes marcadores de seleção nestes organismos. Eles não são adequados para a expressão do gene-alvo (codificando uma proteína desejada) e especialmente para a expressão simultânea de múltiplos genes (codificando uma via metabólica), porque a sua atividade é fortemente influenciada pelas condições de crescimento ou eles conferem um espectro insuficiente de atividades transcricionais.
[0005] Vários estudos têm relatado acaracterização e a engenharia de sistemas de expressão gênica que empregam fatores de transcrição sintéticos (ortogonais) (sTFs) e promotores dependentes de sTF engenheirados para controlar a expressão de genes-alvo. Os promotores dependentes de sTF são compostos de um número variável de sítios de ligação ao sTF ligados a um promotorde núcleo. O número de sítios de ligação em combinação comum promotor de núcleo específico define o nível de expressão do gene-alvo e representa uma melhora significativa no controle do nível de expressão em comparação com os sistemas que utilizam promotores específicos do hospedeiro para a expressão do gene-alvo. Os sTFs utilizados nestes sistemas de expressão são, no entanto, expressos a partir de promotores nativos (específicos do hospedeiro) ou promotores nativosmodificados, o que torna estes sistemas apenas parcialmente ortogonais e o que impede a sua utilização em diversas espécies. Os exemplos dos sistemas de expressão parcialmente ortogonais incluem:1) O sistema de expressão desenvolvido para S. cerevisiae, onde o sTF é expresso a partir do promotor TDH3 de S. cerevisiae ou a partir do promotor que combina a UAS deTDH3 e o promotor de núcleo CYC1 de S. cerevisiae, e osgenes-alvo são expressos a partir de promotores sintéticos contendo um número diverso de sítios de ligação ao sTF e promotores de núcleo TDH3 ou CYC1 (Ito et al., 2015).2) O sistema de expressão desenvolvido para A. nidulans e A. niger, onde o sTF é expresso a partir do promotor gpdA de A. nidulans, e o gene-alvo é expresso a partir de um promotor sintético contendo três sítios de ligação para o sTF, do promotor de núcleo URA3 de S. cerevisiae e de uma sequência aleatória de 94 pb derivada de E. coli (Pachlinger et al., 2005).3) O sistema de expressão desenvolvido para Arabidopsis thaliana, onde o sTF é expresso a partir do promotor 35S de A. thaliana, ou outro promotor de A. thaliana, ou a partir de um promotor sintético contendo quatro sítios de ligação para o sTF e um promotor mínimo 35S de A. thaliana. O promotor mínimo refere-seprovavelmente a um promotor de núcleo na referida publicação. O gene-alvo é expresso a partir do promotor sintético contendo quatro sítios de ligação para o sTF e do promotor mínimo 35S de A. thaliana (US2002081667).
[0006] Embora vários sistemas de expressão gênica tenham sido divulgados na técnica anterior, ainda há uma necessidade de sistemas de expressão gênica para hospedeiros de organismos eucarióticos (e.g., hospedeiros de micro-organismos eucarióticos) que possam proporcionar uma expressão forte e estável, um amplo espectro de níveis de expressão e possam ser usados em diversas espécies e gêneros de organismos eucarióticos diferentes, tal como em diversas espécies e gêneros diferentes de micro-organismos eucarióticos. Isso possibilitaria, e.g., a transferência eficiente para, e o teste de vias metabólicas engenheiradas simultaneamente em, vários hospedeiros de produção potenciais para avaliação da funcionalidade. Além disso, um verdadeiro sistema de expressão ortogonal proporcionaria benefícios à comunidade científica que estuda organismos eucarióticos.
[0007] Um objetivo da presente invenção é proporcionar sistemas de expressão ortogonais que sejam funcionais (transferíveis) em um grande espectro de organismos eucarióticos, tais como micro-organismos eucarióticos. Tais sistemas de expressão superariam a necessidade de utilizar sequências de DNA nativas do hospedeiro na construção dos sistemas de expressão e, portanto, o estabelecimento de sistemas de expressão não dependentes da regulação transcricional intrínseca do hospedeiro de expressão.
[0008] Um objetivo adicional da invenção é proporcionar sistemas de expressão, os quais permitam níveis de expressão fortes, estáveis e previsíveis de genes-alvo, e os quais não sejam influenciados pelas condições de cultivo ou pelos estágios de desenvolvimento ou crescimento do organismo hospedeiro.
[0009] A motivação para a presente invenção baseia-se na constatação que 1) a utilização dos promotores específicos do hospedeiro, ou das suas partes, para expressar os sTFs, e 2) a utilização de promotores de núcleo específicos da espécie nos promotores dependentes de sTF que controlam a expressão dos genes-alvo são as principais razões pelas quais os sistemas de expressão atuais baseados em sTFs não podem ser transferidos entre as diversas espécies sem perda de sua função.
[0010] A presente invenção mostra que é vantajoso utilizar um promotor de núcleo sozinho para a expressão de um sTF. Isto permite uma expressão constitutiva baixa do sTF no hospedeiro (e.g., hospedeiro de micro-organismo).
[0011] Além disso, a presente invenção mostra que é possível desenvolver um método para identificar promotores de núcleo que são funcionais em espécies distantes.
[0012] Além disso, a presente invenção mostra que é possível construir sistemas de expressão baseados nestes promotores de núcleo funcionais em diversas espécies, que permitem níveis ajustáveis de expressão de genes-alvo através de um grande espectro de organismos eucarióticos (e.g., micro-organismos eucarióticos).
[0013] Assim, a presente invenção proporciona um sistema de expressão para um hospedeiro eucariótico (e.g., hospedeiro de micro-organismo), que compreende:(a) um cassete de expressão compreendendo um promotor de núcleo,o referido promotor de núcleo sendo o único "promotor" que controla a expressão de uma sequência de DNA que codifica o fator de transcrição sintético (sTF) e(b) um ou mais cassetes de expressão compreendendo, cada um, uma sequência de DNA que codifica um produto proteico desejado operavelmente ligado a um promotor sintético, o referido promotor sintético compreendendo um promotor denúcleo idêntico a (a) ou outro promotor de núcleo, e sítios de ligação específicos para o sTF a montante do promotor denúcleo.
[0014] A presente invenção proporciona também um hospedeiro eucariótico, tal como um hospedeiro de micro-organismo eucariótico, compreendendo o sistema de expressão.
[0015] Além disso, a presente invençãoproporciona um método para produzir um produto proteico desejado (ou múltiplos produtos proteicos desejados simultaneamente) em um hospedeiro eucariótico,compreendendo cultivar o hospedeiro eucariótico sob condições de cultivo adequadas.
[0016] Além disso, a presente invençãoproporciona um método para produzir um produto proteico desejado (ou múltiplos produtos proteicos desejados simultaneamente) em um hospedeiro de micro-organismo eucariótico, compreendendo cultivar o hospedeiro de microorganismo eucariótico sob condições de cultivo adequadas.
[0017] A presente invenção também proporciona um método para identificar promotores de núcleo universais para hospedeiros eucarióticos.
[0018] O método de identificação compreende as seguintes etapas:- expressar constitutivamente um fator de transcrição sintético, sTF, em Saccharomyces cerevisiae,- no mesmo hospedeiro, coexpressar um gene relator operavelmente ligado a um promotor de teste dependente de sTF, o referido promotor de teste dependente de sTF compreendendo um promotor de núcleo a ser testado, e sítiosde ligação ao sTF a montante desse,- permitir que o referido gene relator seja expresso sob o promotor de teste na presença de ativação pelo sTF,- avaliar o nível de expressão do gene relator, e- selecionar, a partir dos promotores de núcleo testados, os promotores de núcleo que mostrem uma expressão do gene relator pelo menos 40% tão alta quanto a obtida com o promotor de núcleo PGK1 de S. cerevisiae testado no mesmo sistema de relator;- em casos específicos, também selecionar os promotores de núcleo que mostrem menos do que 40% de expressão do gene relator em comparação com a expressão do gene relator obtida com o promotor de núcleo PGK1 de S. cerevisiae testado no mesmo sistema de relator.
[0019] Além disso, a presente invençãoproporciona um promotor de núcleo universal (UCP). O promotor de núcleo universal é obtenível pelo método de identificação divulgado.
[0020] Um promotor de núcleo universal (UCP) compreende tipicamente uma sequência de DNA contendo a região 5’ a montante de um gene eucariótico, começando 10 -50 pb a montante de uma sequência TATA e terminando 9 pb amontante do códon de iniciação ATG. A distância entre a sequência TATA e o códon de iniciação é de preferência nãomaior do que 180 pb e não menor do que 80 pb. O UCP compreende tipicamente também uma sequência de DNA compreendendo 1-20 pb aleatórios na sua extremidade 3’. Em uma modalidade, um UCP compreende tipicamente uma sequência de DNA tendo pelo menos 90% de identidade de sequência com a referida região 5’ a montante de um gene eucariótico, e uma sequência de DNA compreendendo 1-20 pb aleatórios na sua extremidade 3'.
[0021] Além disso, a presente invençãoproporciona um sistema de expressão para um hospedeiro eucariótico, que compreende(a) um cassete de expressão que compreende um UCP, o referido UCP controlando a expressão de uma sequência de DNA que codifica o fator de transcrição sintético (sTF), e(b) um ou mais cassetes de expressão, cada um compreendendo uma sequência de DNA que codifica um produto proteico desejado operavelmente ligado a um promotor sintético, o referido promotor sintético compreendendo um UCP idêntico a (a) ou outro UCP, e sítios de ligação específicos para o sTF a montante do UCP.
[0022] Além disso, a presente invençãoproporciona um hospedeiro eucariótico (e.g., um hospedeiro de micro-organismo eucariótico) que compreende um sistema de expressão utilizando promotores de núcleo essenciais.
[0023] A presente invenção também proporciona um método para produzir um produto proteico desejado (ou múltiplos produtos proteicos desejados simultaneamente) em um hospedeiro eucariótico (e.g., um hospedeiro de microorganismo eucariótico) usando um sistema de expressão com promotores de núcleo universais.
[0024] A presente invenção proporciona assim um sistema de expressão ortogonal que é funcional (transferível) em um grande espectro de organismos eucarióticos ou micro-organismos eucarióticos, que permite níveis de expressão fortes, estáveis e previsíveis de genes-alvo, e não é influenciado por condições de cultivo ou estágios de desenvolvimento ou crescimento do organismo hospedeiro.
[0025] O sistema de expressão proporcionado pela presente invenção simplifica e concentra as ferramentas genéticas necessárias para construir novos hospedeiros de expressão. Atualmente, existe um amplo conjunto de sistemas de expressão que são altamente específicos para os organismos e as espécies. Com a presente invenção, a indústria e a comunidade científica mais ampla, que trabalham em organismos eucarióticos, podem adotar um conjunto menor e comum de ferramentas de expressão ortogonais. Isso beneficiaria a comunidade e levaria a novas inovações no campo.Breve descrição das Figuras
[0026] A Figura 1 representa um esquema de um sistema de expressão para a expressão de um único gene em um organismo eucariótico (e.g., um micro-organismo eucariótico).
[0027] As Figuras 2A, 2B e 2C representam um esquema do método de exame para selecionar UCPs a partir dos promotores de núcleo candidatos.
[0028] A Figura 3 representa um esquema de um sistema de expressão utilizando os UCPs para regular simultaneamente a expressão de múltiplos genes em um organismo eucariótico, tal como um micro-organismo eucariótico.
[0029] A Figura 4 representa exemplos dos sistemas de expressão funcionais/transferíveis em diversos organismos ou micro-organismos.
[0030] As Figuras 5A e 5B representam o teste de diferentes versões dos sTFs e a avaliação da modulação do desempenho do sistema de expressão em Saccharomyces cerevisiae por fluorometria.
[0031] As Figuras 6A e 6B representam a análise dos sistemas de expressão em diversos hospedeiros fúngicos. Análise quantitativa da expressão do gene relator determinada por citometria de fluxo da fluorescência (6A) e por fluorometria (6B).
[0032] As Figuras 7A, 7B, 7C e 7D representam a análise dos níveis de expressão ajustáveis em diferentes hospedeiros (Pichia kudriavzevii, Aspergillus niger e Trichoderma reesei) por citometria de fluxo da fluorescência e western blotting.
[0033] As Figuras 8A e 8B representam o esquema do sistema de expressão (8A) e a análise da expressão de um gene relator em Kazachstania exigua (8B) por PCR quantitativa em tempo real (qPCR).
[0034] As Figuras 9A, 9B, 9C e 9D representam a análise da produção de proteínas em diversos hospedeiros de expressão (Trichoderma reesei e Pichia pastoris) contendo o sistema de expressão.Descrição detalhadaDefinições
[0035] A menos que definido de outro modo, todos os termos técnicos e científicos utilizados neste documento têm o mesmo significado que o normalmente entendido por alguém de habilidade na técnica à qual pertence esta invenção.
[0036] O DNA refere-se ao ácido desoxirribonucleico.
[0037] O códon é uma unidade de três nucleotídeos que está codificando para um único aminoácido nos genes que codificam para proteínas. Os códons que codificam um aminoácido podem diferir em quaisquer dos seus três nucleotídeos. Diferentes organismos têm diferentes frequências dos códons em seus genomas, o que tem implicações para a eficiência da tradução de mRNA e produção de proteínas.
[0038] A sequência de codificação refere-se a uma sequência de DNA que codifica um RNA ou polipeptídeo específico (i.e., uma sequência de amino ácidos específica). A sequência de codificação pode, em alguns casos, conter íntrons (i.e., sequências adicionais que interrompem o quadro de leitura, que são removidas durante a maturação da molécula de RNA em um processo denominado remoção de RNA). Se a sequência de codificação codificar um polipeptídeo, esta sequência contém um quadro de leitura.
[0039] O quadro de leitura é definido por um códon de iniciação (AUG no RNA; correspondendo a ATG na sequência de DNA) e é uma sequência de códons consecutivos codificando um polipeptídeo (proteína). O quadro de leitura está terminando por um códon de interrupção (um dos três: UAG, UGA e UAA no RNA; correspondendo a TAG, TGA e TAA na sequência de DNA). Uma pessoa versada na técnica pode predizer a localização dos quadros de leitura abertos utilizando programas de computador e banco de dados em geral disponíveis.
[0040] O Promotor eucariótico é uma região de DNA necessária para a iniciação da transcrição de um gene. Ele está a montante de uma sequência de DNA que codifica um RNA ou polipeptídeo específico (sequência de codificação). Ele contém uma sequência de ativação a montante (UAS) e um promotor de núcleo. Uma pessoa versada na técnica pode predizer a localização de um promotor utilizando programas de computador e banco de dados em geral disponíveis.
[0041] O promotor de núcleo (CP) é uma parte de um promotor eucariótico e é uma região de DNA imediatamente a montante (região 5’ a montante) de uma sequência de codificação que codifica um polipeptídeo, como definido pelo códon de iniciação. O promotor de núcleo compreende todos os motivos reguladores da transcrição gerais, necessários para a iniciação da transcrição, tais como uma sequência TATA, porém não compreende quaisquer motivos reguladores específicos, tais como as sequências UAS (sítios de ligação para ativadores e repressores nativos).
[0042] O promotor de núcleo é definido para o propósito da presente invenção como uma sequência de DNA contendo: 1) uma região 5’ a montante de um gene altamenteexpresso começando 10-50 pb a montante da sequência TATA e terminando 9 pb a montante do códon de iniciação, onde a distância entre a sequência TATA e o códon de iniciação não é maior do que 180 pb e não é menor do que 80 pb, 2) 1-20pb aleatórios, tipicamente 5 a 15 ou 6 a 10, que estão localizados no lugar dos 9 pb da região de DNA (1) imediatamente a montante do códon de iniciação; ou como uma sequência de DNA contendo: 1) uma sequência de DNA tendo pelo menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou99% de identidade de sequência com a referida região 5’ a montante e 2) 1-20 pb aleatórios, tipicamente 5 a 15 ou 6 a10, que estão localizados no lugar dos 9 pb da região de DNA (1) imediatamente a montante do códon de iniciação.
[0043] Um gene altamente expresso em um organismo, no contexto desta invenção, é um gene que tenha sido mostrado nesse organismo ser expresso entre os top 3% ou 5% de todos os genes em qualquer condição estudada, como determinado através de análise por transcriptômica, ou um gene, em um organismo onde a análise por transcriptômica não tenha sido realizada, que é o homólogo de sequência mais próximo ao gene altamente expresso.
[0044] A sequência TATA é definida para o propósito da presente invenção como uma sequência de DNA (TATA) a montante do códon de iniciação, onde a distância da sequência TATA e o códon de iniciação não é maior do que 180 pb e não é menor do que 80 pb. No caso de múltiplas sequências que satisfaçam a descrição, a sequência TATA é definida como a sequência TATA com menor distância do códon de iniciação.
[0045] O fator de transcrição refere-se a uma proteína que se liga a sequências de DNA específicas presentes na UAS, controlando com isso a taxa de transcrição, que é realizada pela RNA II polimerase. Os fatores de transcrição executam essa função sozinhos ou com outras proteínas em um complexo, promovendo (como um ativador) ou bloqueando (como um repressor) o recrutamento da RNA polimerase para os promotores de núcleo dos genes.
[0046] O fator de transcrição sintético (sTF) refere-se a uma proteína que funciona como um fator de transcrição, porém não é uma proteína nativa de um organismo hospedeiro. No contexto desta invenção, o sTF é uma proteína artificial que compreende tipicamente uma proteína de ligação ao DNA de origem procariótica, um sinal de localização nuclear e um domínio de ativação da transcrição de origem viral.
[0047] O promotor sintético refere-se a uma região de DNA que funciona como um promotor eucariótico, porém não é um promotor de ocorrência natural de um organismo hospedeiro. Ele contém uma sequência de ativação a montante (UAS) e um promotor de núcleo, em que a UAS, ou o promotor de núcleo, ou ambos os elementos, não são nativos no organismo hospedeiro. No contexto desta invenção, o promotor sintético compreende (normalmente 110, tipicamente 1, 2, 4 ou 8) sítios de ligação específicospara o sTF (UAS sintética - sUAS) ligados a um promotor de núcleo.
[0048] O domínio de ligação ao DNA ou DBD refere-se à região de uma proteína, tipicamente um domínio de proteína específico, que é responsável pela interação (ligação) da proteína com uma sequência de DNA específica.
[0049] O promotor de núcleo universal (UCP) é um promotor de núcleo que confere nível de expressão ou atividade de relator suficiente (normalmente, porém não necessariamente, pelo menos 40%), tal como nível de fluorescência, obtido com o promotor de núcleo PKG1 de Saccharomyces cerevisiae testado em um sistema de exame de CP como divulgado na presente invenção. Um promotor de núcleo selecionado utilizando este sistema proporciona tipicamente expressão suficiente de um fator de transcrição em várias espécies e gêneros de organismos eucarióticos.
[0050] Um sistema de expressão ortogonal significa aqui um sistema de expressão consistindo em promotores de núcleo heterólogos (não nativos), fator(es) de transcrição e sítios de ligação específicos para o fator de transcrição. Tipicamente, o sistema de expressão ortogonal é funcional (transferível) em diversos organismos eucarióticos, tais como os micro-organismos eucarióticos.
[0051] O sistema de exame de CP é construído em Saccharomyces cerevisiae e compreende uma cepa de Saccharomyces cerevisiae que expressa constitutivamente um sTF e de preferência um plasmídio relator do tipo centromérico construído com o promotor de núcleo a ser testado. O plasmídio relator tipicamente contém sítios de ligação específicos para o sTF, um gene relator, tal como o gene mCherry, e um terminador, tal como o terminador ADH1 para o gene mCherry. O promotor de núcleo testado é inserido entre os sítios de ligação ao sTF e o gene relator. O promotor de núcleo testado compreende tipicamente na sua extremidade 3’ uma sequência compreendendo 1-20 nucleotídeos aleatórios, tal como a sequência TTAATTAAA, e tipicamente incluindo sítios de restrição. A função do promotor de núcleo é avaliada por uma medição do relator, tal como a medição de fluorescência da cepa resultante e comparada com uma cepa de controle onde o promotor de núcleo é o promotor de núcleo PKG1 de Saccharomyces cerevisiae.
[0052] Um plasmídio centromérico refere-se aqui a um plasmídio de número de cópias único ou baixo usado em S. cerevisiae. Este plasmídio contém regiões de DNA funcionais como um centrômero (sequência CEN) e como uma sequência que se replica autonomamente (ARS) em S. cerevisiae. A sequência ARS proporciona uma origem de replicação e a sequência CEN regula a replicação e a distribuição dos plasmídios durante a divisão celular, o que torna o plasmídio centromérico análogo a um cromossoma.
[0053] A expressão suficiente de um fator de transcrição é definida como um nível de expressão de um fator de transcrição que leva à ativação da transcrição de um gene ou genes que estão sob o controle do(s) promotor(es) dependente(s) do fator de transcrição.
[0054] O organismo eucariótico é definido no contexto desta invenção como um organismo pertencente ao: 1) Reino fúngico, incluindo a levedura, tal como as classes Saccharomycetales, incluindo, porém não se limitando às, espécies Saccharomyces cerevisiae, Kluyveromyces lactis, Candida krusei (Pichia kudriavzevii), Pichia pastoris (Komagataella pastoris), Eremothecium gossypii,Kazachstania exigua, Yarrowia lipolytica e outras; ou Schizosaccharomycetes, tais como Schizosaccharomyces pombe; fungos filamentosos, tais como as classes Eurotiomycetes, incluindo, porém não se limitando às, espécies Aspergillus niger, Aspergillus nidulans, Penicillium chrysogenum, e outras; Sordariomycetes, incluindo, porém não se limitando às, espécies Trichoderma reesei, Myceliophthora thermophile e outras; ou Mucorales, tais como Mucor indicus e outros. 2) Reino vegetal, incluindo as angiospermas, tais como as ordens Solanales, incluindo, porém não se limitando ao, gênero Nicotiana (N. benthamiana), Solanum (S. tuberosum), Lycopersicon (L. esculentum), Capsicum (C. anuum) e outros; Brassicales, incluindo, porém não se limitando ao, gênero Arabidopsis (A. thaliana), Brassica (B. napus) e outros; Poales, incluindo, porém não se limitando às, espécies Avena sativa, Secale cereale, Zea mays, Triticum spp., Oryza sativa, Hordeum vulgare, Sorghum bicolor, Saccharum officinarum e outras; Fabales, incluindo, porém não se limitando às, espécies Phaseolus spp., Vigna spp., Glycine max, Pisum sativum, Lens culinaris, Cicer arietinum e outras; Malpighiales, incluindo, porém não se limitando ao, gênero Populus e outros; Pinales, incluindo, porém não se limitando ao, gênero Pinus, e outros; ou Arecales, incluindo, porém não se limitando às, espécies Elaeis guineensis, Cocos nucifera, e outras; e algas verdes, tais como as classes Chlorophyceae, incluindo, porém não se limitando ao, gênero Chlamydomonas (C. reinhardtii); ou Trebouxiophyceae, incluindo, porém não se limitando às, espécies Chlorella spp., e outras. 3) Reino animal, incluindo os mamíferos (Mammalia), incluindo, porém não se limitando às, espécies Mus musculus (camundongo), Cricetulus griseus (hamster), Homo sapiens (ser humano) e outros; insetos, incluindo, porém não se limitando às, espécies Mamestra brassicae, Spodoptera Frugiperda, Trichoplusia ni, Drosophila melanogaster e outras.
[0055] O micro-organismo eucariótico é definido no contexto da invenção como um micro-organismo incluindo a levedura, tal como as classes Saccharomycetales, incluindo, porém não se limitando às, espécies Saccharomyces cerevisiae, Kluyveromyces lactis, Candida krusei (Pichia kudriavzevii), Pichia pastoris (Komagataella pastoris), Eremotecium gossypii, Kazachstania exigua, Yarrowia lipolytica e outras; Schizosaccharomycetes, tais como Schizosaccharomyces pombe; e fungos filamentosos, tais como as classes Eurotiomycetes, incluindo, porém não se limitando às, espécies Aspergillus niger, Aspergillus nidulans, Penicillium chrysogenum, e outras; Sordariomycetes, incluindo, porém não se limitando às, espécies Trichoderma reesei, Myceliophthora thermophile e outras; Mucorales, tais como Mucor indicus e outras.
[0056] A presente invenção proporciona um sistema de expressão para um hospedeiro eucariótico, que compreende(a) um cassete de expressão compreendendo um promotor de núcleo;o promotor de núcleo sendo o único promotor para controlar a expressão de uma sequência de DNA que codifica o fator de transcrição sintético (sTF), e(b) um ou mais cassetes de expressão compreendendo, cada um, uma sequência de DNA que codifica um produto proteico desejado operavelmente ligado a um promotor sintético;o promotor sintético compreende um promotor de núcleo, que é idêntico ao promotor de núcleo em (a) ou outro promotor de núcleo, e um ou mais sítios de ligação específicos para o sTF a montante do promotor de núcleo.
[0057] O promotor de núcleo compreendetipicamente uma sequência de DNA contendo a região 5’ a montante de um gene eucariótico, começando 10 - 50 pb amontante de uma sequência TATA e terminando 9 pb a montante do códon de iniciação ATG. A distância entre a sequência TATA e o códon de iniciação não é maior do que 180 pb e não é menor do que 80 pb. O promotor de núcleo compreende tipicamente também uma sequência de DNA compreendendo 1-20 pb aleatórios em sua extremidade 3’. Em uma modalidade, o promotor de núcleo compreende tipicamente uma sequência de DNA tendo pelo menos 90% de identidade de sequência com areferida região 5’ a montante de um gene eucariótico, e umasequência de DNA compreendendo 1-20 pb aleatórios em sua extremidade 3'.
[0058] A sequência de DNA que codifica o fator de transcrição sintético (sTF) compreende tipicamente um regulador de transcrição procariótico, um sinal de localização nuclear e um domínio de ativação da transcrição.
[0059] Os CPs usados no sistema de expressão podem ser diferentes, ou o primeiro, CP1, pode ser idêntico ao segundo, CP2 (ou ao terceiro, CP3, ou ao quarto, CP4). Isto é ilustrado nas Figuras 1 e 3.
[0060] Os dois cassetes de expressão ((a) e (b)) podem ser introduzidos em um hospedeiro eucariótico (tipicamente integrados em um genoma) como duas moléculas de DNA individuais, ou como uma molécula de DNA na qual os dois (ou mais) cassetes de expressão estão ligados (fundidos) para formar um único DNA.
[0061] Em aplicações específicas, onde o gene- alvo for um gene nativo (homólogo) de um organismo hospedeiro, o promotor sintético também pode ser inserido imediatamente a montante da região de codificação do gene- alvo no genoma do organismo hospedeiro, possivelmente substituindo o promotor original (nativo) do gene-alvo.
[0062] Mais especificamente, o sistema de expressão compreende, assim, duas partes de DNA, que são construídas no sistema de expressão compreendendo pelo menos dois cassetes de expressão individuais:(a) um cassete para sTF - fator de transcrição sintético, o qual compreende um CP que controla a expressão de um gene que codifica uma proteína de fusão (sTF), o próprio sTF e um terminador. O sTF compreende uma proteína de ligação ao DNA derivada de origem procariótica, tipicamentereguladores da transcrição bacterianos, tais como da família TetR; um sinal de localização nuclear, tal como o NLS de SV40; e um domínio de ativação da transcrição, tal como o domínio de ativação VP16 ou VP64; e (b) um cassete de expressão para gene-alvo, o qual compreende um promotor sintético, que compreende um número variável de sítios de ligação ao sTF, normalmente 1 a 10, tipicamente 1, 2, 4 ou 8, separados por 0-20, tipicamente 5-15 nucleotídeos aleatórios, um CP, um gene-alvo e um terminador.
[0063] A composição do sistema de expressão de exemplo é ilustrada na Figura 1.
[0064] A presente invenção baseia-se na ideia de utilizar um promotor de núcleo (CP), em vez de um promotor completo, para a expressão de um fator de transcrição sintético (sTF). Alguns CPs podem suportar um baixo nível de transcrição quando colocados na frente de um gene. Devido à ausência de sequências reguladoras específicas, necessárias para o controle da transcrição condicional, que estão presentes em promotores completos (tipicamente na sequência de ativação a montante - UAS), esta transcrição é constitutiva - ou seja, constante em todas as condições de crescimento ou metabólicas. Porque o mecanismo geral de transcrição é evolutivamente conservado, alguns dos CPs podem funcionar em espécies muito diversas. Estas características são utilizadas na invenção para a construção de sistemas de expressão transferíveis entre espécies.
[0065] A baixa expressão constitutiva do gene de sTF facilitada por um CP proporciona uma quantidade suficiente de um fator de transcrição sintético, que se liga aos seus sítios de ligação específicos sobre o promotor sintético do gene-alvo e ativa a sua expressão. O número de sítios de ligação é proporcional ao nível de expressão do(s) gene(s)-alvo, onde mais sítios de ligação resultam em maior expressão. O promotor sintético compreende, além dos sítios de ligação ao sTF, também um CP. A escolha do CP no promotor sintético que controla a expressão do(s) gene(s)-alvo é também importante para o nível de expressão do(s) gene(s)-alvo. A combinação dos sítios de ligação ao sTF e o CP pode resultar em uma gama de níveis de expressão que podem ser modulados desde muito baixos até muito altos. Na extremidade superior, a expressão atingida por este sistema excede os níveis de expressão dos genes nativos mais altamente expressos em um organismo hospedeiro.
[0066] A Figura 1 ilustra um exemplo de um esquema de um sistema de expressão para a expressão de um único gene em um organismo ou micro-organismo eucariótico. O cassete de expressão para fator de transcrição sintético (sTF) contém um CP (CP1), uma sequência de codificação de sTF e um terminador. O CP1 proporciona uma baixa expressão constitutiva do sTF. Portanto, o sTF está presente em uma célula hospedeira em um nível constante o tempo todo, em todas as condições de crescimento e em todos os estágios de desenvolvimento e crescimento. O cassete de expressão para gene-alvo contém um promotor sintético, uma sequência de codificação de um gene-alvo e um terminador. O promotor sintético compreende múltiplos sítios de ligação específicos para o sTF (normalmente 1-10, tipicamente 1, 2,4 ou 8; formando uma sequência de ativação a montante sintética - sUAS) e um CP (CP2). O gene-alvo codifica um produto proteico de interesse.
[0067] A atividade de transcrição do CP1, o “sinal”, é “amplificada” pelo sTF ligado à sUAS. Isto resulta na ativação da transcrição sobre o CP2, resultando na expressão do gene-alvo. Como discutido acima, os dois cassetes de expressão podem ser introduzidos em um hospedeiro eucariótico (tipicamente integrados em um genoma) como duas moléculas de DNA individuais, ou como uma molécula de DNA na qual os dois cassetes estão ligados (fundidos) em um único DNA. Em aplicações específicas, onde o gene-alvo for um gene nativo (homólogo) de um organismo hospedeiro, o promotor sintético também pode ser inserido imediatamente a montante da região de codificação do gene- alvo no genoma do organismo hospedeiro. Os CPs usados no sistema de expressão podem ser diferentes, ou o CP1 pode ser idêntico ao CP2.
[0068] A presente invenção também proporciona um hospedeiro eucariótico (e.g., um hospedeiro de micro-organismo eucariótico) que compreende o sistema de expressão como divulgado neste documento.
[0069] Um organismo eucariótico refere-se aqui, em particular, às 1) espécies fúngicas, incluindo a levedura, tais como as espécies das classesSaccharomycetales, incluindo, porém não se limitando à, Saccharomyces cerevisiae, Kluyveromyces lactis, Candida krusei (Pichia kudriavzevii), Pichia pastoris (Komagataella pastoris), Eremothecium gossypii, Kazachstania exigua, Yarrowia lipolytica, e outras; Schizosaccharomycetes, tais como Schizosaccharomyces pombe; e espécies de fungos filamentosos, tais como as das classes Eurotiomycetes, incluindo, porém não se limitando a, Aspergillus niger, Aspergillus nidulans, Penicillium chrysogenum, e outras; Sordariomycetes, incluindo, porém não se limitando a, Trichoderma reesei, Myceliophthora thermophile e outras; Mucorales, tais como Mucor indicus e outras; 2) espécies de plantas, incluindo as angiospermas, tais como as espécies das ordens Solanales, incluindo, porém não se limitando a, Nicotiana benthamiana, Solanum tuberosum, Lycopersicon esculentum, Capsicum anuum e outras; Brassicales,incluindo, porém não se limitando a, Arabidopsis thaliana, Brassica napus e outras; Poales, incluindo, porém não se limitando a, Avena sativa, Secale cereale, Zea mays, Triticum spp. Oryza sativa, Hordeum vulgare, Sorghum bicolor, Saccharum officinarum e outras; Fabales, incluindo, porém não se limitando a, Phaseolus spp., Vigna spp., Glycine max, Pisum sativum, Lens culinaris, Cicer arietinum e outras; Malpighiales, incluindo, porém não se limitando a, Populus sp., e outras; Pinales, incluindo, porém não se limitando a, Pinus sp., e outras; ou Arecales incluindo, porém não se limitando a, Elaeis guineensis, Cocos nucifera, e outras; e as espécies de algas verdes, incluindo, porém não se limitando a, Chlamydomonas reinhardtii, Chlorella spp. e outras; 3) Espécies de animais, incluindo, porém não se limitando aos, mamíferos (Mammalia), incluindo, porém não se limitando às, espécies Mus musculus (camundongo), Cricetulus griseus (hamster), Homo sapiens (ser humano), e outras; espécies de insetos, incluindo, porém não se limitando às, espécies Mamestra brassicae, Spodoptera frugiperda, Trichoplusia ni, Drosophila melanogaster e outras.
[0070] A presente invenção também proporciona um método para produzir um produto proteico desejado em um hospedeiro eucariótico (e.g., hospedeiro de micro-organismo,) compreendendo cultivar o hospedeiro sob condições de cultivo adequadas.
[0071] Por condições de cultivo adequadas entende-se quaisquer condições que permitam a sobrevivência ou o crescimento do organismo hospedeiro e/ou a produção do produto desejado no organismo hospedeiro. O produto desejado pode ser um produto do gene ou genes-alvo (proteína ou proteínas), ou um composto produzido por uma proteína (enzima) ou por uma via metabólica. No presente contexto, o produto desejado é tipicamente um produto proteico (enzima).
[0072] A presente invenção também proporciona um sistema de expressão gênica que é funcional em várias espécies e gêneros eucarióticos diferentes. O elemento- chave no sistema é um promotor de núcleo que facilita a expressão em várias espécies. Tal promotor de núcleo é aqui denominado promotor de núcleo universal - UCP.
[0073] Esta propriedade, assim chamada atividade de transcrição basal, baseia-se no recrutamento eficiente do complexo de RNA polimerase II para o promotor de núcleo; e resulta em nível de expressão baixo, porém estável, em todas as condições de cultivo e crescimento (desenvolvimento). Este sinal constitutivo baixo é amplificado por um fator de transcrição sintético (sTF), cuja expressão é controlada pelo UCP, para um nível de expressão ajustável dos genes-alvo (nativos ouheterólogos). Cada gene-alvo está sob o controle de um promotor engenheirado e compreende um número selecionado de sítios de ligação específicos para o sTF e um UCP. A combinação dos sítios de ligação específicos para o sTF e o UCP define o nível de expressão do gene-alvo.
[0074] Isso proporciona meios para controlar a expressão em diversos hospedeiros, incluindo aqueles com tecnologia não desenvolvida. As aplicações do uso dos UCPs são a produção de proteínas, a engenharia metabólica e as redes reguladoras genéticas artificiais.
[0075] Além disso, o sistema pode ser usado como uma plataforma para identificar novos UCPs com novas propriedades.
[0076] A presente invenção proporciona um método para identificar um promotor de núcleo universal para hospedeiros eucarióticos. O método compreende- expressar constitutivamente um fator de transcrição sintético, sTF, em Saccharomyces cerevisiae,- coexpressar no mesmo hospedeiro um gene relator operavelmente ligado a um promotor de teste dependente de sTF, o referido promotor de teste dependente de sTF compreendendo um promotor de núcleo a ser testado, e sítios de ligação ao sTF a montante desse,- permitir que o referido gene relator seja expresso sob o promotor de teste na presença de ativação pelo sTF,- avaliar o nível de expressão do gene relator, e- selecionar, a partir dos promotores de núcleo testados, os promotores de núcleo que mostrem uma expressão do gene relator pelo menos 40% tão alta quanto a obtida com o promotor de núcleo PGK1 de S. cerevisiae testado no mesmo sistema de relator;- em casos específicos, também selecionar os promotores de núcleo que mostrem um nível de expressão do relator menor do que 40%.
[0077] Mais especificamente, o método compreende otimamente o uso de um plasmídio centromérico circular compreendendo sítios de ligação específicos para o sTF operavelmente ligados ao promotor de núcleo testado, e um gene relator.
[0078] A sequência de DNA que codifica o fator de transcrição sintético (sTF) compreende tipicamente uma sequência de DNA que codifica uma proteína de ligação ao DNA de origem procariótica, um sinal de localização nuclear e um domínio de ativação da transcrição. O sTF compreende uma proteína de ligação ao DNA derivada de origem procariótica, tipicamente bacteriana, reguladores da transcrição, tais como uma proteína da família TetR; um sinal de localização nuclear, tal como o NLS de SV40; e um domínio de ativação da transcrição, tal como o domínio de ativação VP16 ou VP64.
[0079] O promotor a ser testado é selecionado a partir dos promotores de genes eucarióticos expressos ao nível dos mais elevados 3% ou 5% de todos os genes em qualquer condição no organismo eucariótico dado.
[0080] A presente invenção proporciona um promotor de núcleo universal (UCP), em que o promotor de núcleo é obtenível pelo método de identificação como divulgado neste documento.
[0081] Tipicamente, um promotor de núcleo universal compreende uma sequência de DNA contendo 1) a região 5’ a montante de um gene eucariótico, começando 10 - 50 pb a montante de uma sequência TATA e terminando 9 pb a montante do códon de iniciação ATG; e 2) uma sequência de DNA aleatória de 1-20 pb que está localizada no lugar dos 9 pb da região de DNA (1) imediatamente a montante do códon de iniciação. A distância entre a sequência TATA e o códon de iniciação do gene eucariótico original não é maior do que 180 pb e não é menor do que 80 pb. Em uma modalidade, o promotor de núcleo compreende uma sequência de DNA tendo pelo menos 90% de identidade de sequências com a referida região 5’ a montante e uma sequência de DNA aleatória de 120 pb que está localizada no lugar dos 9 pb da região de DNA (1) imediatamente a montante do códon de iniciação.
[0082] A seleção dos CPs funcionais em organismos distantes é realizada em Saccharomyces cerevisiae, e as fontes dos CPs candidatos são preferivelmente (mas não necessariamente) organismos industrialmente relevantes, preferivelmente (mas não necessariamente) distantes em termos de divergência evolutiva ou em outras características, tais como a arquitetura do genoma ou o teor de GC.
[0083] A seleção dos CPs candidatos é baseada no nível de expressão dos genes nos organismos-fonte selecionados, contendo o CP candidato em seus promotores. Outro critério de seleção é a presença de uma sequência TATA no CP candidato (Figura 2A).
[0084] Em uma modalidade, o exame quanto aos CPs funcionais é vantajosamente realizado por construção in vivo do CP candidato com o cassete de relator dependente de sTF expresso em uma cepa de S. cerevisiae que expressa constitutivamente o sTF (Figura 2B). As cepas resultantes são testadas quanto a um nível de um relator, preferivelmente a fluorescência, e estes níveis são comparados com uma cepa de controle, onde o promotor de núcleo PGK1 de S. cerevisiae é utilizado na construção do relator. Os CPs candidatos, que facilitam os níveis suficientes de relator, preferivelmente de fluorescência (normalmente, porém não necessariamente, maiores do que 40%), da cepa de controle (Figura 2C), e, portanto, satisfazem os critérios do exame, são chamados promotores de núcleo universais, UCPs. Os CPs e os UCPs selecionados são usados para a construção de sistemas de expressão.
[0085] Os sistemas de expressão resultantes são funcionais em hospedeiros eucarióticos. Estes hospedeiros incluem todos os organismos eucarióticos, em particular: 1) Micro-organismos fúngicos, incluindo os fungos filamentosos e as leveduras, em particular os organismos das seguintes taxionomias: A) Saccharomycetales, incluindo, porém não se limitando à, Saccharomyces cerevisiae, Kluyveromyces lactis, Candida krusei (Pichia kudriavzevii), Pichia pastoris (Komagataella pastoris), Eremothecium gossypii, Kazachstania exigua, Yarrowia lipolytica, e outras; Schizosaccharomycetes, tal como Schizosaccharomyces pombe; B) Eurotiomycetes, incluindo, porém não se limitando às, espécies Aspergillus niger, Aspergillus nidulans, Penicillium chrysogenum e outras; C) Sordariomycetes, incluindo, porém não se limitando às, espécie Trichoderma reesei, Myceliophthora thermophile e outras; D) Mucorales, tais como Mucor indicus e outras. 2) Organismos de plantas,incluindo as angiospermas e as algas verdes, em particular,os organismos a partir das seguintes taxionomias: E)Solanales, incluindo, porém não se limitando às, espécies Nicotiana benthamiana, Solanum tuberosum, Lycopersicon esculentum, Capsicum anuum, e outras; F) Brassicales, incluindo, porém não se limitando às, espécies Arabidopsis thaliana, Brassica napus e outras; G) Poales, incluindo, porém não se limitando às, espécies Avena sativa, Secale cereale, Zea mays, Triticum spp., Oryza sativa, Hordeum vulgare, Sorghum bicolor, Saccharum officinarum e outras; H) Fabales incluindo, porém não se limitando às, espécies Phaseolus spp., Vigna spp., Glycine max, Pisum sativum, Lens culinaris, Cicer arietinum e outras; I) Malpighiales, incluindo, porém não se limitando às, espécies Populus sp., e outras; J) Pinales, incluindo, porém não se limitando às,espécies Pinus sp., e outras; K) Arecales, incluindo, porémnão se limitando às, espécies Elaeis guineensis, Cocos nucifera, e outras; L) Chlorophyceae, incluindo, porém não se limitando às, espécies Chlamydomonas reinhardtii e outras; M) Trebouxiophyceae, incluindo, porém não se limitando às, espécies Chlorella spp., e outras. 3) Organismos de animais, em particular organismos das seguintes taxionomias: N) mamíferos (Mammalia), incluindo, porém não se limitando às, espécies Mus musculus (camundongo), Cricetulus griseus (hamster), Homo sapiens (ser humano) e outras; O) insetos (Insecta), incluindo, porém não se limitando às, espécies Mamestra brassicae, Spodoptera frugiperda, Trichoplusia ni, Drosophilamelanogaster e outras.
[0086] As Figuras 2A, B e C ilustram um exemplo de um esquema do método de exame utilizado para a seleção de UCPs a partir dos promotores de núcleo candidatos.
[0087] A Figura 2A ilustra um esquema de seleção de um promotor de núcleo candidato em um organismo eucariótico. A região de DNA imediatamente a montante de um gene de qualquer organismo eucariótico, que pertence a um grupo dos top 3% ou 5% dos genes mais altamente expressos em qualquer condição, é analisada quanto à presença da sequência TATA (sequência TATA) dentro de -180 pb e -80 pb a montante de um códon de iniciação (ATG). Se mais do que uma sequência TATA aparecer nessa região, então a mais próxima ao ATG (códon de iniciação) é escolhida como uma sequência TATA. A sequência que começa 10-50 pb a montante da sequência TATA e termina 9 pb a montante do ATG (códon de iniciação) é selecionada para o exame do promotor de núcleo.
[0088] A Figura 2B ilustra uma cepa de Saccharomyces cerevisiae que expressa constitutivamente um sTF. Ela é cotransformada tipicamente com um plasmídio centromérico linearizado (número de cópias único ou baixo) e uma biblioteca, ou versões individuais, dos promotores de núcleo a serem testados. O plasmídio centromérico contém tipicamente, por exemplo, 4 sítios de ligação ao sTF, o gene relator, tal como o gene mCherry, e é linearizado entre essas duas características, como mostrado na figura. Cada fragmento de DNA do promotor de núcleo compreende a sequência de DNA selecionada (Figura 2A), seguida por uma sequência compreendendo nucleotídeos aleatórios, tipicamente contendo sítios de restrição, aqui uma sequência útil é, por exemplo, TTAATTAAA, e flanqueada por sequências de DNA com 20-50 pb de comprimento sobre cada extremidade. Estas sequências de flanco são homólogas à cada extremidade do plasmídio linearizado, a sequência de flanco a 5’ é homóloga a uma região que cobre parcialmente os sítios de ligação ao sTF no plasmídio linearizado, e a sequência de flanco a 3' é homóloga à extremidade 5’ do quadro de leitura aberto do gene relator, tal como o gene mCherry. Após a transformação, o plasmídio é construído in vivo por um mecanismo de recombinação homólogo intrínseco da levedura Saccharomyces cerevisiae, resultando no plasmídio centromérico circular compreendendo os sítios de ligação ao sTF, seguidos por um promotor de núcleo incluindo uma sequência, tal como TTAATTAAA, e o gene relator, tal como o gene mCherry. As cepas resultantes são analisadas quanto ao relator, tal como uma fluorescência vermelha causada pela proteína mCherry produzida. O nível de intensidade do relator, tal como a fluorescência, corresponde ao nível de expressão do gene relator, tal como o gene mCherry, que corresponde à função do promotor de núcleo testado.
[0089] Figura 2C) As cepas transformadas, que conferem um nível suficiente de relator, tal como a fluorescência, que é tipicamente 40% ou maior do que o relator, tal como a fluorescência da cepa contendo o promotor de núcleo PGK1 construído no mesmo plasmídio centromérico (destacado pela seta na figura), são selecionadas. Os plasmídios centroméricos são isolados das cepas selecionadas, o DNA de plasmídio é purificado e sequenciado e os promotores de núcleo selecionados são utilizados para construções subsequentes de cassetes de expressão para o teste em outros organismos eucarióticos. Em casos específicos, também os promotores de núcleo que não conferem um nível de 40% ou maior de expressão do relator são usados para construções de cassetes de expressão para organismos eucarióticos. Se o promotor de núcleo for funcional no hospedeiro doador de promotor de núcleo e também em pelo menos um outro hospedeiro que seja uma espécie diferente do hospedeiro doador de promotor de núcleo, então o promotor de núcleo é designado como promotor de núcleo universal, UCP.
[0090] A presente invenção proporciona um promotor de núcleo universal (UCP), que é obtenível pelo método divulgado. Tipicamente, o UCP compreende uma sequência de DNA contendo: 1) a região 5’ a montante de um gene eucariótico, começando 10 - 50 pb a montante de uma sequência TATA e terminando 9 pb a montante do códon de iniciação ATG, e em que a distância entre a sequência TATA e o códon de iniciação não é maior do que 180 pb e não é menor do que 80 pb, 2) e uma sequência de DNA compreendendo 1-20 pb aleatórios que está localizada na extremidade 3’ da sequência de DNA (1). Em uma modalidade, o promotor de núcleo universal compreende 1) uma sequência de DNA tendo pelo menos 90% de identidade de sequência com a referida região 5’ a montante e 2) uma sequência de DNA compreendendo 1-20 pb aleatórios que está localizada na extremidade 3' da sequência de DNA.
[0091] A presente invenção também proporciona um sistema de expressão para um hospedeiro eucariótico, que compreende (a) um cassete de expressão compreendendo um UCP,o referido UCP controlando a expressão de uma sequência de DNA que codifica o fator de transcrição sintético (sTF), e(b) um ou mais cassetes de expressão compreendendo, cada um, uma sequência de DNA que codifica um produto proteico desejado operavelmente ligado a um promotor sintético,o referido promotor sintético compreendendo o UCP de (a) ououtro UCP, e sítios de ligação específicos para o sTF a montante do UCP.
[0092] É possível construir múltiplos promotores sintéticos com diferentes números de sítios de ligação (normalmente 1-10, tipicamente 1, 2, 4 ou 8, separados por0-20, tipicamente 5 -15 nucleotídeos aleatórios)controlando diferentes genes-alvo simultaneamente por um sTF. Isto resultaria, por exemplo, em um conjunto de genes expressos diferentemente, formando uma via metabólica.
[0093] A Figura 3 ilustra um exemplo de um esquema de um sistema de expressão utilizando os UCPs para uma regulação simultânea da expressão de múltiplos genes em um organismo eucariótico (e.g., micro-organismo). O esquema representa uma via metabólica hipotética, porém a abordagem também poderia ser usada para outros sistemas de expressão de múltiplos genes (vias de sinalização, transporte ou glicosilação, produção simultânea de proteínas, etc.) ou suas combinações.
[0094] O cassete de expressão para fator de transcrição sintético (sTF) (A) na Figura 3 é análogo ao mostrado na Figura 1, satisfazendo o mesmo propósito. Os cassetes de expressão de genes-alvo podem estar presentesem um número variável, variando de 1 a 20. Cada cassete de expressão para gene-alvo contém um promotor sintético, que pode ter uma arquitetura clássica (monodirecional) (B) ou um desenho bidirecional (C). O promotor sintético (mono- ou bidirecional) consiste em múltiplos sítios de ligação específicos para o sTF (normalmente 1-10, tipicamente 1, 2, 4 ou 8), e um UCP. Os genes-alvo (Genes A, B, C, D) codificam as proteínas de interesse que podem formar uma via metabólica ou sua parte, ou codificam qualquer combinação de proteínas, dependendo da aplicação.
[0095] A função do sistema de expressão ilustrado na Figura 3 é análoga à apresentada na Figura 1, a atividade de transcrição do UCP1 é “modulada” pelo sTF ligado às sUASs dos genes-alvo. A ocupação de cada sUAS em combinação com os UCPs leva a níveis de expressão específicos de cada gene individual, resultando em níveis específicos das proteínas-alvo. Os cassetes de expressão podem ser introduzidos em um hospedeiro eucariótico (tipicamente integrados em um genoma) como moléculas de DNA individuais ou como moléculas de DNA maiores onde os cassetes de expressão individuais são fundidos em conjunto. Em aplicações específicas, onde os genes-alvo forem genes nativos (homólogos) de um organismo hospedeiro - os promotores sintéticos também podem ser inseridos imediatamente a montante de cada região de codificação do gene-alvo no genoma do organismo hospedeiro. Os UCPs usados no sistema de expressão podem ser diferentes, ou alguns ou todos os UCPs também podem ser idênticos.
[0096] A presente invenção proporciona um hospedeiro eucariótico compreendendo o sistema de expressão divulgado. Estes hospedeiros incluem todos os organismos eucarióticos, em particular os micro-organismos fúngicos, incluindo os fungos filamentosos e as leveduras, os hospedeiros de plantas, incluindo as angiospermas e as algas, e hospedeiros animais, incluindo os mamíferos e os insetos.
[0097] A presente invenção proporciona também um método para produzir um produto proteico desejado em um hospedeiro eucariótico (e.g., hospedeiro de micro-organismo), compreendendo cultivar o hospedeiro sob condições de cultivo adequadas.
[0098] O ajuste do sistema de expressão para diferentes níveis de expressão pode ser realizado em S. cerevisiae, onde múltiplas opções, incluindo escolhas de UCPs, sTFs, diferentes números de BSs e genes-alvo, podem ser testadas rapidamente. O conjunto ideal estabelecido de genes diferentemente expressos pode ser transferido diretamente para o hospedeiro de destino, onde ele conserva a sua função. O alto nível de expressão atingido por este sistema também pode ser utilizado nos hospedeiros de produção de proteína (enzima). A vantagem de utilizar S. cerevisiae é a disponibilidade de métodos bem estabelecidos e rápidos para modificações genéticas, transformação de DNA, exame, análises, cultivos e modelagem in silico. Isso acelerará o processo de desenvolvimento de hospedeiro industrial e possibilitará o uso de novos hospedeiros que tenham alto potencial para propósitos específicos, porém um espectro muito limitado de ferramentas para a engenharia genética.
[0099] A Figura 4 ilustra exemplos dos sistemas de expressão funcionais/transferíveis em diversos organismos eucarióticos. Os sistemas de expressão construídos em uma única molécula de DNA compreendem doiscassetes de expressão: 1) cassete de expressão para sTF, que compreende diferentes UCPs, exemplificadas aqui com o533cp ou 008cp (ver as Tabelas 1 e 2), a versão de sTF coma proteína de ligação ao DNA, exemplificada aqui por BM3R1, e um terminador, exemplificado aqui pelo terminador TEF1 de Trichoderma reesei. E 2) o cassete de expressão para gene- alvo compreende diversos sítios de ligação específicos parao sTF, exemplificados aqui por oito sítios de ligação específicos para BM3R1, diferentes UCPs, exemplificados aqui por 114cp ou 201cp (ver as Tabelas 1 e 2), a região decodificação do gene relator, exemplificada aqui pela regiãode codificação de mCherry (proteína fluorescente vermelha,)e um terminador, exemplificado aqui pelo terminador ADH1 deS. cerevisiae. A região de codificação da proteína de ligação ao DNA, aqui BM3R1, foi optimizada nos códons para se adequar ao uso de códons de Aspergillus niger. No Exemplo 3, a versão do sistema de expressão contendo 201cp e 008cp é referida como “versão A”, e a versão do sistema de expressão contendo 114cp e 533cp é referida como “versão B”.
[0100] As Figuras 5A e 5B ilustram um exemplo de um teste de diferentes versões dos sTFs e a avaliação da modulação do desempenho dos sistemas de expressão em Saccharomyces cerevisiae.
[0101] Figura 5A) Os sistemas de expressão análogos ao apresentado na Figura 4 foram construídos com as seguintes modificações no sistema acima descrito: 1)diferentes proteínas de ligação ao DNA foram utilizadas como partes dos sTFs (LexA, SrpR, PhlF, TetR, BM3R1, e TarA, ver o Exemplo 1); 2) diferentes números dos sítios de ligação específicos para o sTF foram utilizados nos promotores sintéticos dos cassetes de expressão para genesalvo (a versão com 8 sítios de ligação mostrados na figura); 3) os cassetes individuais (o cassete de expressão para sTF e o cassete para relator) foram integrados, cada um em uma única cópia, no genoma de Saccharomyces cerevisiae em dois loci genômicos separados (exemplificados aqui por URA3 e LEU2); 4) os sTFs foram expressos a partir do promotor de núcleo de S. cerevisiae, aqui exemplificado pelo promotor de núcleo TDH3; 5) o promotor de núcleo utilizado no cassete de expressão do relator foi aqui exemplificado por ENO1cp de S. cerevisiae.
[0102] Figura 5B) As cepas com ambos os cassetes de expressão integrados foram testadas quanto ao nível de fluorescência. Foram testados sistemas de expressão de controle que possuem oito sítios de ligação específicos para o sTF e que não possuem os cassetes de expressão para sTF (mostrados como "wo sTF" na figura). As proteínas de ligação ao DNA, SrpR, PhlF, TetR, BM3R1 e TarA, foram optimizadas nos códons para a utilização de códon de Saccharomyces cerevisiae. Na maioria dos casos, é demonstrada uma clara modulação do nível de expressão do gene-alvo, que reflete o número de sítios de ligação específicos para o sTF (0-8, conforme especificado na figura) nos promotores sintéticos dos cassetes de expressão para gene-alvo.
[0103] As Figuras 6A e 6B representam exemplos da análise dos sistemas de expressão em diversos hospedeiros fúngicos. Análise quantitativa da expressão do gene relator detectada por citometria de fluxo da fluorescência (6A) e por fluorometria (6B). Os sistemas de expressão construídos (Tabela 2) foram integrados em uma única cópia nos genomas de: Saccharomyces cerevisiae, Aspergillus niger, Trichoderma reesei, Yarrowia lipolytica, Candida krusei (Pichia kudriavzevii), e Pichia pastoris (Komagataella pastoris). A funcionalidade do sistema em todos estes organismos foi confirmada por análise fluorescente das cepas transformadas. Os sistemas de expressão usados para cada organismo são idênticos aos apresentados na Figura 4. Os identificadores das cepas nas figuras (6A e 6B) significam o que segue: “WT” representa uma cepa de base de cada hospedeiro de expressão no qual os sistemas de expressão não foram transformados; “A” representa cepas com uma versão do sistema de expressão (integrado no genoma em cópia única) mostrado na Figura 4 contendo 201cp e 008cp; “A*” representa as cepas com a versão do sistema de expressão A, onde a parte de ligação ao DNA do sTF foi otimizada no códon para combinar com os códons frequentes em Saccharomyces cerevisiae; “B” representa cepas com uma versão do sistema de expressão (integrado no genoma em cópia única) mostrado na Figura 4 contendo 114cp e 533cp; “B*” representa as cepas com a versão do sistema de expressão B, onde a parte de ligação ao DNA do sTF foi otimizada no códon para combinar com os códons frequentes em Saccharomyces cerevisiae; “A_NC” e “B_NC” representam cepas com as versões de controle negativo dos sistemas de expressão (A ou B) (integrados no genoma em cópia única), onde o cassete de expressão para sTF estava ausente (removido), deixando apenas o cassete de expressão para gene-alvo (exemplificado aqui com 8 BS + 201/114cp + mCherry + terminador Sc-ADH1).
[0104] A Figura 6A representa a análise por citometria de fluxo (instrumento DB FACSAria III) da expressão de mCherry nos hospedeiros. Ela foi realizada sobre as células (para os fungos unicelulares - Saccharomyces cerevisiae, Yarrowia lipolytica, Pichia kudriavzevii, Pichia pastoris) ou os esporos (para os fungos filamentosos - Aspergillus niger, Trichoderma reesei). Os gráficos mostram a intensidade da fluorescência (mCherry) normalizada pelo tamanho da partícula (célula/esporo) (FSC - dispersão direta) para 10000 células/esporos de cada cepa. A linha horizontal (dentro da caixa cinza) representa o valor mediano, a caixa cinza representa o intervalo interquartil (intervalo IQ), a parte inferior da caixa cinza representa o valor do percentil de 25%, a parte superior da caixa cinza representa o valor do percentil de 75% e os bigodes no gráficos de caixas representam valores que se estendem a partir dos valores dos percentis de 25%/75% até os valores mais altos e mais baixos que não são maiores do que 1,5 vez o intervalo IQ, que, juntamente com o intervalo IQ, representam cerca de 99% de todos os casos medidos (células/esporos) nesses experimentos.
[0105] A Figura 6B representa um exemplo da análise da expressão de mCherry nos hospedeiros. Ela foi realizada por medição da fluorometria utilizando o instrumento Varioskan (Thermo Electron Corporation), sobre suspensões de células/micélios após crescimento 18 horas em meio SCD. Os gráficos mostram a intensidade da fluorescência (mCherry) normalizada pela densidade óptica das suspensões de células/micélios usadas para a análise fluorimétrica. As colunas representam os valores médios e as barras de erro os desvios-padrão a partir de pelo menos 3 réplicas experimentais.
[0106] As Figuras 7A, 7B, 7C e 7D representamexemplos da análise dos níveis de expressão ajustáveis em diferentes hospedeiros (Pichia kudriavzevii, Aspergillus niger e Trichoderma reesei).
[0107] A Figura 7A representa um exemplo (mostrado como um esquema) do sistema de expressão com um número variável de sítios de ligação ao sTF utilizados para a modulação da expressão do gene relator em Pichia kudriavzevii e Aspergillus niger. O sistema de expressão construído em uma única molécula de DNA compreende dois cassetes de expressão (análogos àqueles na Figura 4): 1)cassete de expressão para sTF, que compreende um UCP, exemplificado aqui com o 008cp (ver a Tabela 1), a versão de sTF com a proteína de ligação ao DNA, exemplificada aqui por BM3R1, e o domínio de ativação, exemplificado aqui por VP16, e um terminador, exemplificado aqui por terminador TEF1 de Trichoderma reesei. E 2) os cassetes de expressão para genes-alvo, que compreendem diferentes números de sítios de ligação específicos para o sTF, exemplificados aqui por 0, 1, 2, 4 e 8 sítios de ligação específicos paraBM3R1, diferentes UCPs, exemplificados aqui por 201cp (ver a Tabela 1), a região de codificação do gene relator, exemplificada aqui pela região de codificação de mCherry (proteína fluorescente vermelha), e um terminador, exemplificado aqui pelo terminador ADH1 de S. cerevisiae. A região de codificação da proteína de ligação ao DNA, aqui BM3R1, foi optimizada nos códons para se adequar ao uso de códons de Aspergillus niger.
[0108] A Figura 7B representa a análise por citometria de fluxo (instrumento DB FACSAria III) da expressão de mCherry em Pichia kudriavzevii e Aspergillus niger contendo os sistemas de expressão com número variável de sítios de ligação ao sTF (0, 1, 2, 4 e 8). Ela foi realizada sobre células obtidas a partir de 18 horas de cultivo em meio SCD (para Pichia kudriavzevii), ou sobre esporos obtidos após 4 dias de cultivo em placas de ágar PDA (Aspergillus niger). Os gráficos mostram a intensidade da fluorescência (mCherry) normalizada pelo tamanho da partícula (célula/esporo) (FSC - dispersão direta) para 10000 células de cada cepa. A linha horizontal (dentro da caixa cinza) representa o valor mediano, a caixa cinza representa o intervalo interquartil (intervalo IQ), a parte inferior da caixa cinza representa o valor do percentil de 25%, a parte superior da caixa cinza representa o valor do percentil de 75% e os bigodes no gráfico de caixas representam valores que se estendem a partir dos valores dos percentis de 25%/75% até os valores mais altos e mais baixos que não são maiores do que 1,5 vez o intervalo IQ, que, juntamente com o intervalo IQ, representam cerca de 99% de todos os casos medidos (células/esporos) nesses experimentos.
[0109] A Figura 7C representa um exemplo (mostrado como um esquema) do sistema de expressão com um número variável de sítios de ligação ao sTF utilizados para a modulação da produção de proteína CBH1 em Trichoderma reesei. O sistema de expressão construído em uma única molécula de DNA compreende dois cassetes de expressão (análogos àqueles nas Figuras 4 e 7A): 1) cassete deexpressão para sTF, que compreende um UCP, exemplificado aqui com o 533cp (ver a Tabela 1), a versão de sTF com a proteína de ligação ao DNA, exemplificada aqui por BM3R1, e o domínio de ativação, exemplificado aqui por VP16, e um terminador, exemplificado aqui pelo terminador TEF1 de Trichoderma reesei. E 2) os cassetes de expressão para genes-alvo, que compreendem diferentes números de sítios de ligação específicos para o sTF, exemplificados aqui por 0, 1, 2, 4 e 8 sítios de ligação específicos para BM3R1,diferentes UCPs, exemplificados aqui por 201cp (ver a Tabela 1), a região de codificação do gene-alvo, exemplificada aqui pela região de codificação de CBH1 de Trichoderma reesei (incluindo os íntrons que ocorrem no gene CBH1 de Trichoderma reesei nativo), e um terminador, exemplificado aqui pelo terminador ADH1 de S. cerevisiae. A região de codificação da proteína de ligação ao DNA, aquiBM3R1, foi optimizada nos códons para se adequar ao uso decódons de Aspergillus niger.
[0110] A Figura 7D representa as análises por western blot da proteína CBH1 produzida por Trichoderma reesei para diferentes níveis com a utilização dos sistemas de expressão com um número variável de sítios de ligação ao sTF (0, 1, 2, 4 e 8). Duas condições diferentes de culturaforam usadas, 1) um meio com extrato de grão consumido e lactose (“SGE-lactose” na Figura), o que resulta na forte suprarregulação da expressão do gene CBH1 nativo (na cepa de base - WT), e 2) SCD (“SCD” na figura), que tem um forteefeito inibitório sobre a expressão do gene CBH1 nativo (nacepa de base - WT). O equivalente de 15 μl do sobrenadante da cultura de 3 dias de cada cultura foi carregado sobre umgel (gradiente de 4-20%). O gel foi transferido para uma membrana de nitrocelulose e a proteína CBH1 foi detectada com o anticorpo primário anti-CBH1 específico (camundongo) (e o anticorpo secundário conjugado ao anti-IR680 de camundongo), e a visualização do sinal foi realizada no instrumento Odyssey CLx Imaging System (LI-CORBiosciences).
[0111] As Figuras 8A e 8B representam o esquema do sistema de expressão (8A) e a análise da expressão de um gene relator em Kazachstania exigua (8B).
[0112] A Figura 8A representa um exemplo (mostrado como um esquema) do sistema de expressão usado para Kazachstania exigua. O sistema de expressão construído em uma única molécula de DNA compreende dois cassetes de expressão (Tabela 3): 1) cassete de expressão para sTF, quecompreende um UCP, exemplificado aqui com o Sc-TDH3cp (ver a Tabela 1), a versão de sTF com a proteína de ligação ao DNA, exemplificada aqui por TetR, e o domínio de ativação, exemplificado aqui por VP16, e um terminador, exemplificado aqui pelo terminador g706 de Kazachstania exigua. E 2) o cassete de expressão para gene-alvo compreende diferentes sítios de ligação específicos para o sTF, exemplificados aqui por oito sítios de ligação específicos para TetR, diferentes UCPs, exemplificados aqui por Sc-ENO1cp (ver a Tabela 1), a região de codificação do gene relator, exemplificada aqui pela região de codificação de Venus (proteína fluorescente amarela), e um terminador, exemplificado aqui pelo terminador PDC1 de S. cerevisiae. A região de codificação da proteína de ligação ao DNA, aqui TetR, e a região de codificação do gene-alvo, aqui relator Venus, foram optimizadas nos códons para se adequarem ao uso de códons de Saccharomyces cerevisiae.
[0113] A Figura 8B representa um exemplo de uma análise da expressão de Venus em Kazachstania exigua contendo o sistema de expressão (descrito na Figura 8A, Tabela 3). O cassete de expressão foi integrado no genoma da cepa de base de Kazachstania exigua (“WT” na Figura), substituindo a região de codificação nativa de g706, para obter a cepa testada (“SES” na Figura). As duas cepas (WT e SES) foram cultivadas no meio SCD por 10 horas, e a cepa SES por 22 para atingir a fase estacionária (“SES_stat” na Figura). A transcrição de Venus e os genes ADH1 foram analisados por qPCR, com o gene ALG9 sendo o controle de normalização para a quantificação da expressão. As colunas apresentam os valores médios e as barras de erros os desvios-padrão de 3 réplicas experimentais.
[0114] As Figuras 9A, 9B, 9C e 9D representam a análise da produção de proteína em diversos hospedeiros de expressão (Trichoderma reesei e Pichia pastoris) contendo o sistema de expressão.
[0115] A Figura 9A representa um exemplo (mostrado como um esquema) do sistema de expressão para a produção de proteína CBH1 em Trichoderma reesei. O sistema de expressão construído em uma única molécula de DNA compreende dois cassetes de expressão (análogos àqueles nas Figuras 4 e 7C): 1) cassete de expressão para sTF, que compreende um UCP, exemplificado aqui com o 533cp (ver a Tabela 1), a versão de sTF com a proteína de ligação ao DNA, exemplificada aqui por BM3R1, e o domínio de ativação, exemplificado aqui por VP16, e um terminador, exemplificado aqui pelo terminador TEF1 de Trichoderma reesei. E 2) os cassetes de expressão para genes-alvo, que compreendem diversos sítios de ligação específicos para o sTF, exemplificados aqui por oito sítios de ligação específicos para BM3R1, diferentes UCPs, exemplificados aqui por 114cp (ver a Tabela 1), a região de codificação do gene-alvo, exemplificada aqui pela região de codificação de CBH1 de Trichoderma reesei (incluindo os íntrons que ocorrem na região de codificação de CBH1 de Trichoderma reesei nativa), e um terminador, exemplificado aqui pelo terminador PDC1 de Trichoderma reesei. A região de codificação da proteína de ligação ao DNA, aqui BM3R1, foi optimizada nos códons para se adequar ao uso de códons de Aspergillus niger.
[0116] A Figura 9B representa um exemplo de uma análise da produção de CBH1 em Trichoderma reesei contendo o sistema de expressão (descrito na Figura 9A). A cepa de base de Trichoderma reesei ("WT" na Figura) era uma cepa mutante abrigando múltiplas remoções dos genes que codificam 8 proteases diversas. O cassete de expressão foi integrado no genoma da cepa de base para obter a cepa testada (“SES” na Figura). As duas cepas (WT e SES) foram cultivadas no biorreactor (fermentador) em duas condições diferentes: 1) em um meio contendo grão consumido, extrato de grão consumido e lactose (“SGM” na Figura), o que resulta em uma forte suprarregulação da expressão do gene CBH1 nativo (na cepa de base - WT) e da expressão de outros genes celulolíticos (em ambas as cepas), e 2) em um meio contendo extrato de levedura e glicose (“glicose” na Figura) que tem um forte efeito inibitório sobre a expressão do gene CBH1 nativo (na cepa de base - WT) e a expressão de outros genes celulolíticos (em ambas as cepas). Os sobrenadantes destas culturas foram analisados através de análise por SDS-PAGE (SDS-eletroforese em gel de poliacrilamida) quanto ao teor de proteína total (Coomassie) e quanto ao teor de CBH1 específico ("western blot"). Para a análise do teor de proteína total, o equivalente de 1,5 μl de sobrenadantes da cultura em pontos de tempo diferentes, e a faixa de proteína CBH1 purificada (controle de carga), foram carregados sobre um gel (4-20% de gradiente), e o gel foi colorido com coomassie coloidal (PageBlue Protein Staining Solution; Thermo Fisher Scientific). Para a análise de CBH1 específico, o equivalente de 0,075 μl de sobrenadantes da cultura de diferentes pontos de tempo, e a faixa de proteína CBH1 purificada (controle de carga), foram carregados sobre um gel (gradiente de4-20%) e a proteína CBH1 (após transferência para uma membrana de nitrocelulose) foi detectada com o anticorpo primário anti-CBH1 específico (camundongo) (e o anticorpo secundário conjugado ao anti- IR680 de camundongo). Para ambas as análises, a visualização do sinal foi realizada no instrumento Odyssey CLx Imaging System (LI-COR Biosciences). A concentração de proteína (nos sobrenadantes da cultura) foi estimada a partir da faixa de CBH1 purificada carregada sobre cada gel, e os valores são mostrados na Figura.
[0117] A Figura 9C representa um exemplo (mostrado como um esquema) do sistema de expressão utilizado para Pichia pastoris para a produção de um produto proteico. O sistema de expressão construído em uma única molécula de DNA compreende dois cassetes de expressão (análogos àqueles na Figura 4): 1) cassete de expressão para sTF, que compreende um UCP, exemplificado aqui com o 008cp (ver a Tabela 1), a versão de sTF com a proteína de ligação ao DNA, exemplificada aqui por BM3R1, e o domínio de ativação, exemplificado aqui por VP16, e um terminador, exemplificado aqui pelo terminador TEF1 de Trichoderma reesei. E 2) o cassete de expressão para gene-alvo compreende diversos sítios de ligação específicos para o sTF, exemplificados aqui por oito sítios de ligação específicos para BM3R1, diferentes UCPs, exemplificados aqui por 201cp (ver a Tabela 1), a região de codificação do gene-alvo, exemplificada aqui pela região de codificação da proteína de fusão compreendendo o sinal de secreção de S. cerevisiae (fator α), o sítio de clivagem de protease KEX/spe13, o módulo de ligação ao carboidrato (CBM), a proteína elastina-like (ELP5), e outro CBM, e um terminador exemplificada aqui pelo terminador ADH1 de S. cerevisiae. A região de codificação da proteína de ligação ao DNA, aqui BM3R1, foi optimizada nos códons para se adequar ao uso de códons de Saccharomyces cerevisiae.
[0118] A Figura 9D representa uma análise da produção de CBM-ELP5-CBM em Pichia pastoris contendo o sistema de expressão (descrito na Figura 9C). A cepa foi cultivada em diversas condições, e os sobrenadantes dessas culturas foram analisados pelo western blot. O equivalente a 22,5 μl dos sobrenadantes da cultura foram carregadassobre um gel (gradiente de 4-20%), e a proteína CBM-ELP5- CBM (após transferência para uma membrana de nitrocelulose) foi detectada com o anticorpo primário anti-CBM específico (camundongo) (e o anticorpo secundário conjugado ao anti- IR680 de camundongo). A visualização do sinal foi realizada no instrumento Odyssey CLx Imaging System (LI-COR Biosciences).Tabela 1:Seleção dos promotores de núcleo testados em Saccharomyces cerevisiae e outros organismos. As sequências sombreadas são as regiões de flanco a 3’ adicionadas às sequências promotoras do núcleo para propósitos de exame ou clonagem. O ATG (códon de iniciação) está sublinhado. Sc - origem de Saccharomyces cerevisiae; An - origem de Aspergillus niger; Tr - origem de Trichoderma reesei; At - origem de Arabidopsis thaliana; Cr - origem de Chlamydomonas reinhardtii; Mm - origem de Mus musculus
Tabela 2:Sequências de DNA de alguns dos sistemas de expressãotransferíveis interespécies. As partes de DNA funcionaissão indicadas: 8 × sítio de ligação ao BM3R1 (texto branco,destaque preto); promotores de núcleo (sublinhados); regiãode codificação de mCherry (texto branco, destaque cinza);terminadores (itálico, destaque cinza); BM3R1-sTF (destaquecinza).
Tabela 3:Sequência de DNA do sistema de expressão testado emKazachstania exígua e Saccharomyces cerevisiae. As partesde DNA funcionais são indicadas: 8 × sítio de ligação aoTetR (texto branco, destaque preto); promotores de núcleo(sublinhados); região de codificação de Venus (textobranco, destaque cinza); terminadores (itálico, destaquecinza); TetR-sTF (destaque cinza).
Tabela 4:Sequências de DNA dos sistemas de expressão testados emNicotiana benthamiana. As partes de DNA funcionais sãoindicadas: 8 × sítio de ligação ao sTF (texto branco,destaque preto); promotores de núcleo (sublinhados); regiãode codificação de mCherry (texto branco, destaque cinza);terminadores (itálico, destaque cinza); sTFs (destaquecinza).
Tabela 5:Sequências de DNA dos sistemas de expressão testados emChlamydomonas reinhardtii. As partes de DNA funcionais sãoindicadas: 8 × sítio de ligação ao sTF (texto branco,destaque preto); promotores de núcleo (sublinhados); regiãode codificação de mCherry (texto branco, destaque cinza);terminadores (itálico, destaque cinza); sTFs (destaquecinza).
Tabela 6:Sequência de DNA dos sistemas de expressão testados nascélulas de ovário de hamster chinês (células CHO -Cricetulus griseus). As partes de DNA funcionais sãoindicadas: 8 × sítio de ligação ao sTF (texto branco,destaque preto); promotores de núcleo (sublinhados); regiãode codificação de mCherry (texto branco, destaque cinza);terminadores (itálico, destaque cinza); sTF (destaquecinza).
ExemplosExemplo 1As proteínas de ligação ao DNA bacterianas e os seus sítiosde ligação utilizados nos sistemas de expressão:- LexA (repressor de transcrição de Escherichia coli;GenBank: EDV67321.1)Sítios de ligação ao LexA (independentemente dafita de DNA):CTGTATATAAACACAG (SEQ ID NO: 76);CTGTATATATACCCAG (SEQ ID NO: 77);CTGTATATAAAACCAG (SEQ ID NO: 78);GTGGTTATATATACAG (SEQ ID NO: 79)- SrpR (regulador transcricional de Pseudomonasputida; Sequência de Referência NCBI: WP_019437727.1)Sítios de ligação ao SrpR (independentemente dafita de DNA):ATATACATACATGCTTGTTTGTTTGTAAAC (SEQ ID NO: 80);ATTTACATACATTCTTGTTTGTTTGTAAAC (SEQ ID NO: 81)- PhlF (regulador transcricional de Pseudomonasprotegens; GenBank: AAF20928.1)Sítios de ligação ao PhlF (independentemente dafita de DNA):ATGATACGAAACGTACCGTATCGTTAAGGT (SEQ ID NO: 82);ATGATACGGAACGTTACGTATCGTTAAGCT (SEQ ID NO: 83);ATGATACGGAAGCTACCGTATCGTAAAGGT (SEQ ID NO: 84);ATGATACGTAACGTACCGTATCGTAAAGGT (SEQ ID NO: 85)- TetR (regulador transcricional de Escherichia coli,GenBank: EFK45326.1)Sítio de ligação ao TetR (independentemente dafita de DNA):ACTCCCTATCAGTGATAGAGA (SEQ ID NO: 86)- BM3R1 (regulador transcricional de Bacillusmegaterium; Sequência de Referência NCBI: WP_013083972.1)Sítios de ligação ao BM3R1 (independentemente dafita de DNA):CGGAATGAAGGTTCATTCCG (SEQ ID NO: 87);CGGAATGAACTTTCATTCCG (SEQ ID NO: 88);CGGAATGAACATTCATTCCG (SEQ ID NO: 89);CGGAATGAACGTTCATTCCG (SEQ ID NO: 90)- TarA (regulador transcricional de Streptomyceslavenduligriseus; Sequência de Referência NCBI:WP_030788560.1)Sítios de ligação ao TarA (independentemente dafita de DNA):AACATACCGTGTGGTATGTT (SEQ ID NO: 91);AACATACCGAGTGGTATGTT (SEQ ID NO: 92);AACATACCGTGAGGTATGTT (SEQ ID NO: 93);AAACATACCGTGTGGTATGTTC (SEQ ID NO: 94)- LacI (repressor de lac de Escherichia coli;Sequência de Referência NCBI: WP_048339836.1)Sítio de ligação ao LacI (independentemente dafita de DNA):AATTGTGAGCGGCTCACAATT (SEQ ID NO: 95)Exemplo 2Teste de diferentes versões dos sTFs e avaliação damodulação do desempenho do sistema de expressão emSaccharomyces cerevisiae. (Figura 5)
[0119] Os sistemas de expressão (cassetes deexpressão individuais para os sTFs e para os relatores) foram construídos como duas moléculas de DNA separadas (plasmídios) (Figura 5A). Os plasmídios com os cassetes de expressão para cada sTF continham: 1) a região decodificação optimizada nos códons de Saccharomyces cerevisiae da proteína de ligação ao DNA (LexA, PhlF, SrpR, TetR, BM3R1 e TarA; Exemplo 1) em cada região de codificação de sTF, 2) NLS e o domínio de ativação VP16 em cada região de codificação de sTF, 3) o Sc-TDH3cp (Tabela 1) controlando a expressão de cada sTF, 4) o gene marcador de seleção URA3 (de origem de Kluyveromyces lactis), 5) osflancos para integração no genoma por recombinação homóloga no lócus ura3-52 (para substituir a região de codificação mutada do lócus), 6) regiões necessárias para a propagaçãodo plasmídio em E. coli. Os plasmídios com os cassetes para o relator continham 1) a região de codificação optimizada nos códons de Saccharomyces cerevisiae da proteína Venus (fluorescente amarela), 2) o Sc-ENO1cp (Tabela 1) que controla a expressão de Venus em conjunto com 3) sítios de ligação específicos para sTF posicionados a montante (0, 1, 2, 4 ou 8) (Exemplo 1), 4) o gene marcador de seleçãoLEU2 (de origem de Kluyveromyces lactis), 5) os flancospara integração no genoma por recombinação homóloga no lócus leu2-3_112 (substituindo a região de codificação mutada do lócus) e 6) regiões necessárias para a propagação do plasmídio em E. coli.
[0120] O Saccharomyces cerevisiae CEN.PK (MATα, ura3-52 leu2-3_112 his3Δ 1 MAL2-8C SUC2) foi usada como acepa parental. Os cassetes de expressão (Figura 5A) foram introduzidos nas células através da transformação dos plasmídios integrativos linearizados, o sTF e os cassetes de expressão para relator correspondentes foramtransformados em uma única cepa. Cada cassete de integração foi librado pela endonuclease de restrição NotI do plasmídio antes da transformação. As transformações foram realizadas usando o protocolo padrão de acetato de lítio.As integrações de cópia única foram confirmadas por qPCR,onde o sinal da qPCR do gene Venus foi comparado a um sinal da qPCR de uma sequência nativa única em cada cepa.
[0121] Para todos os cultivos, 6,7 g/L de base de nitrogênio de levedura (YNB, Becton, Dickinson and Company), mistura sintética de aminoácidos completa sem uracil e leucina suplementada com 20 g/L de D-glicose (SCD- LU) foram utilizados. No caso de cultivos em placa de ágar,20 g/L de ágar foram utilizados além dos componentes acimamencionados.
[0122] As pré-culturas das cepas testadas foram desenvolvidas durante 24-48 horas sobre as placas de ágar com SCD-LU antes da inoculação de 4 ml de SCD-LU em placasde cultivo de 24 poços até DO600 = 0,2. As culturas foramdesenvolvidas durante 18 horas a 800 rpm (Infors HT Microtron) e 28°C em triplicata, centrifugadas, lavadas e ressuspensas em 0,2 ml de água estéril. Duzentos μl da suspensão celular foram analisados em 96 poços pretos (Black Cliniplate; Thermo Scientific) utilizando o fluorímetro Varioskan (Thermo Electron Corporation). As configurações para Venus foram 510 nm (excitação) e 530 nm (emissão), respectivamente. Para a normalização dos resultados de fluorescência, as suspensões celulares analisadas foram diluídas 100x e a DO600 foi medida em placas de microtítulo de 96 poços transparentes (NUNC) usando Varioskan (Thermo Electron Corporation).
[0123] Os resultados da análise fluorescente são mostrados na Figura 5B.Exemplo 3Análise quantitativa do desempenho do sistema de expressão em diversos hospedeiros fúngicos (Figura 6)
[0124] Os sistemas de expressão (Tabela 2, Figura 4) e as suas versões de controle negativo (os sistemas de expressão com regiões removidas abrangendo o promotor de núcleo controlando o sTF e o próprio sTF) foramclonados em plasmídios introduzindo marcadores de seleção eflancos para integração no genoma para 6 espécies diferentes. 1) A cepa CEN.PK de Saccharomyces cerevisiae foi utilizada como a cepa parental. Os sistemas de expressão (incluindo as versões com a região de codificação optimizada nos códons de Saccharomyces cerevisiae da proteína de ligação ao DNA, BM3R1), incluindo o gene marcador de seleção LEU2 (de origem de Kluyveromyces lactis), foram integrados no lócus leu2-3_112 (substituindo a região de codificação mutada do lócus) usando as regiões de flanco correspondentes para recombinação homóloga. As transformações foram feitas pelo protocolo padrão de acetato de lítio. 2) A cepa ATCC1015 de Aspergillus niger foi utilizada como a cepa parental. Os sistemas de expressão, incluindo um gene marcador de seleção de resistência à higromicina com um promotor e terminador adequados, foram integrados no lócus gaaC (substituindo a região de codificação nativa) utilizando as regiões de flanco correspondentes para recombinação homóloga. As transformações foram realizadas usando o protocolo de transformação CRISPR (ver abaixo), incluindo: protoplastos da cepa de A. niger, DNA doador linear (cassete de expressão com o marcador de seleção e os flancos para integração), proteína Cas9 (IDT) e mistura de crRNA sintético e tracrRNA (IDT). A Cas9, o crRNA e o tracrRNA formam um complexo de ribonucleoproteína (RNP) que gera uma quebra da fita dupla no lócus genômico alvo que é então reparado com o DNA doador linear por recombinação homóloga. 3) A cepa M124 de Trichoderma reesei (coleta de cultura VTT) foi usada como a cepa parental. Os sistemas de expressão, incluindo um gene marcador de seleção de resistência à higromicina com um promotor e terminador adequados, foram integrados no lócus pep4 (substituindo a região de codificação nativa) usando as regiões de flanco correspondentes para recombinação homóloga. As transformações foram feitas usando o protocolo de transformação CRISPR (ver abaixo), incluindo: protoplastos da cepa de T. reesei, DNA doador linear (cassete de expressão com o marcador de seleção e regiões de flanco) e complexo de RNP que gera uma quebra da fita dupla no lócus genômico alvo que é então reparado com o DNA doador linear. 4) A cepa ATCC 32196 de Pichia kudriavzevii foi utilizada como a cepa parental. Os sistemas de expressão, incluindo um gene marcador de seleção de resistência à higromicina com um promotor e terminador adequados, foram integrados no lócus PDC1 (substituindo a região de codificação nativa) usando regiões de flanco correspondentes para recombinação homóloga. As transformações foram feitas usando o protocolo padrão de acetato de lítio. 5) A cepa X-33 de Pichia pastoris (Invitrogen) foi usada como a cepa parental. Os sistemas de expressão (com a região de codificação da proteína de ligação ao DNA, BM3R1, que foi optimizada no códon para se adequar ao uso do códon de Saccharomyces cerevisiae), incluindo um gene marcador de seleção de resistênciaà zeocina com promotor e terminador adequados, foram integrados no lócus AOX1 (integração na região promotora AOX1) utilizando as regiões de flanco correspondentes para recombinação homóloga. As transformações foram feitas usando o protocolo padrão de acetato de lítio. 6) A Yarrowia lipolytica C-00365 (coleta de cultura VTT) foi usada como a cepa parental. Os sistemas de expressão, incluindo um gene marcador de seleção de resistência a nourseotricina com um promotor e terminador adequados, foram integrados no lócus ANT1 (substituindo a região de codificação nativa) utilizando as regiões de flanco correspondentes para recombinação homóloga. Astransformações foram feitas usando o protocolo padrão de acetato de lítio.
[0125] O protocolo de transformação CRISPR: Os protoplastos isolados foram suspensos em 200 μl de solução STC (1,33 M de sorbitol, 10 mM de Tris-HCl, 50 mM de CaCl2, pH 8,0). Cem μl de suspensão de protoplastos foram misturados com 3,5 μg de DNA doador e 20 μl de solução de RNP (1 μM de proteína Cas9 (IDT), 1 μM de crRNA sintético(IDT), e 1 μM de tracrRNA (IDT)) e 100 μl da solução detransformação (25% de PEG 6000, 50 mM de CaCl2, 10 mM deTris-HCl, pH 7,5). A mistura foi incubada em gelo durante 20 min. Dois ml de solução de transformação foram adicionados e a mistura foi incubada 5 min na temperaturaambiente. Quatro ml de STC foram adicionados, seguidos pela adição de 7 ml do ágar de superfície fundido (50°C) (200g/L de D-sorbitol, 6,7 g/L de base de nitrogênio de levedura (YNB, Becton, Dickinson and Company), aminoácido sintético completo, 20 g/l de D-glicose, 400 mg/L (para A. niger) ou 100 mg/L (para T. reesei) de higromicina B e 20 g/L de ágar). A mistura foi vertida em uma placa de seleção de higromicina (200 g/L de D-sorbitol, 6,7 g/L de base de nitrogênio de levedura (YNB, Becton, Dickinson and Company), aminoácido sintético completo, 20 g/L de D- glicose, 400 mg/L (para A. niger) ou 100 mg/L (para T. reesei) de higromicina B, 20 g/L de ágar). O cultivo foi realizado a +28 °C durante cinco ou sete dias, as colônias foram colhidas e cultivadas novamente sobre as placas YPD contendo 400 mg/L (para A. niger) ou 100 mg/L (para T. reesei) de higromicina B.
[0126] As integrações corretas foram confirmadas por PCR do DNA genômico de cada cepa transformada, onde o amplicon (região amplificada de DNA) estendeu a construção integrada e o DNA genômico para fora dos flancos para integração. As integrações de cópia única foram confirmadas por qPCR, onde o sinal de qPCR do gene mCherry foi comparado a um sinal de qPCR de uma sequência nativa única em cada hospedeiro.
[0127] Para os cultivos líquidos, foram usados 6,7 g/L de base de nitrogênio de levedura (YNB, Becton, Dickinson and Company), aminoácido completo sintético suplementado com 20 g/L de D-glicose (SCD). No caso de cultivos em placa de ágar, meio solidificado contendo 20 g/L de ágar, 20 g/L de bacto peptona (Becton Dickinson), 10 g/L de extrato de levedura e 20 g/L de D-glicose (placas YPD). Para obter os esporos dos fungos filamentosos, foram utilizadas placas de ágar PDA para a esporulação (39 g/L de Batata dextrose ágar da BD-Difco).
[0128] Para a análise por citometria de fluxo da produção de mCherry nas cepas testadas (Figura 6A), as pré- culturas das cepas de leveduras testadas foram desenvolvidas por 24-48 horas em placas de ágar YPD e os fungos filamentosos (cepas de A. niger e T. reesei) foram esporulados em placas PDA (7 dias), os esporos coletados e diluídos em 1x PBS antes da análise. No caso das cepas de leveduras, 4 ml de meio SCD em placas de cultivo de 24 poços foram inoculados a partir de pré-culturas para DO600 = 0,2 por cada cepa de levedura testada. As culturas foram desenvolvidas durante 18 horas a 800 rpm (Infors HT Microtron) e 28°C. Cem μL da cultura foram combinados com 1,5 mL de 1x PBS antes da análise. As medições foram feitas com o FACSAria III (BD), onde 10000 eventos foram registrados e os resultados foram normalizados dividindo-se os valores de fluorescência de mCherry pelo tamanho da célula (dispersão direta, FSC-A). Os resultados da análise fluorescente por citometria de fluxo são mostrados na Figura 6A.
[0129] Para a análise da fluorometria quantitativa (Figura 6B), as pré-culturas das cepas de leveduras testadas foram desenvolvidas por 24-48 horas em placas de ágar YPD e as pré-culturas (inoculadas por esporos) das cepas de Trichoderma reesei foram desenvolvidas por 24 horas em meio YPG (20 g/L de bacto peptona, 10 g/L de extrato de levedura e 30 g/L de gelatina). Quatro ml do meio SCD em placas de cultivo de 24 poços foram inoculados a DO600 = 0,2 por cada cepa delevedura testada (DO600 = 0,5 no caso de T. reesei). Asculturas foram desenvolvidas durante 18 horas a 800 rpm (Infors HT Microtron) e 28°C em triplicata, centrifugadas, lavadas e ressuspensas em 0,2 ml de água estéril. Duzentos μl de cada suspensão celular foram analisados em placas de 96 poços pretas (Black Cliniplate; Thermo Scientific) usando o fluorímetro Varioskan (Thermo ElectronCorporation). As configurações para mCherry foram 587 nm (excitação) e 610 nm (emissão), respectivamente. Para a normalização dos resultados de fluorescência, as suspensões celulares analisadas foram diluídas 100x e a DO600 foi medida em placas de microtítulo de 96 poços transparentes(NUNC) utilizando o Varioskan (Thermo ElectronCorporation). Os resultados da análise são mostrados na Figura 6B.Exemplo 4Análise dos níveis de expressão ajustáveis em diferentes hospedeiros (Pichia kudriavzevii, Aspergillus niger e Trichoderma reesei) (Figura 7)
[0130] Os sistemas de expressão para Pichia kudriavzevii e Aspergillus niger com diversos números dos sítios de ligação específicos para o sTF (0, 1, 2, 4 ou 8)(Figura 7A) foram construídos de forma análoga ao Exemplo 3 (a versão do sistema de expressão A - mostrada na Figura 4 - foi usada). No caso de Pichia kudriavzevii, a cepa ATCC 32196 foi usada como a cepa parental. Os sistemas de expressão, incluindo o gene marcador de seleção de resistência à higromicina com um promotor e terminador adequados, foram integrados no lócus PDC1 (substituindo a região de codificação nativa) utilizando as regiões de flanco correspondentes para recombinação homóloga. As transformações foram feitas usando o protocolo padrão de acetato de lítio. No caso de Aspergillus niger, a cepa ATCC1015 foi usada como a cepa parental. Os sistemas de expressão, incluindo um gene marcador de seleção de resistência à higromicina com um promotor e terminador adequados, foram integrados no lócus gaaC (substituindo a região de codificação nativa) utilizando as regiões de flanco correspondentes para recombinação homóloga. As transformações foram feitas utilizando o protocolo de transformação CRISPR, incluindo: protoplastos da cepa de A. niger, DNA doador linear (cassete de expressão com o marcador de seleção e os flancos para integração) e complexo de RNP que gera uma quebra da fita dupla no lócus genômico alvo que é então reparado com o DNA doador linear.
[0131] A molécula de DNA, contendo os sistemas de expressão para Trichoderma reesei para a expressão ajustável do gene CBH1 (Figura 7C), continha o 201cp (Tabela 1), juntamente com os sítios de ligação específicospara BM3R1 posicionados a montante (0, 1, 2, 4, ou 8)controlando a expressão da região de codificação de CBH1, oterminador PDC1 de T. reesei, 533cp (Tabela 1) controlandoa expressão da região de codificação de sTF, a região de codificação de sTF, o terminador TEF1 de Trichoderma reesei, o gene marcador de seleção de resistência à higromicina com promotor e terminador adequados, e os flancos para integração no genoma por recombinação homóloga no lócus CBH1 (substituindo a região de codificação nativa). A cepa M124 de T. reesei (coleta de cultura VTT) foi usada como a cepa parental. As transformações foram feitas pelo protocolo de transformação de protoplastos (ver abaixo), incluindo: protoplastos da cepa de T. reesei e DNA doador linear (cassete de expressão com o marcador de seleção e os flancos para integração).
[0132] O protocolo de transformação deprotoplastos: Os protoplastos isolados foram suspensos em200 μl de solução STC (1,33 M de sorbitol, 10 mM de Tris- HCl, 50 mM de CaCl2, pH 8,0). Cem μl de suspensão de protoplastos foram misturados com 10 μg do DNA doador e 100μl da solução de transformação (25% de PEG 6000, 50 mM deCaCl2, 10 mM de Tris-HCl, pH 7,5)). A mistura foi incubadaem gelo durante 20 min. Dois ml de solução de transformação foram adicionados e a mistura foi incubada 5 min na temperatura ambiente. Quatro ml de STC foram adicionados,seguidos pela adição de 7 ml do ágar de superfície fundido(200 g/L de D-sorbitol, 6,7 g/L de base de nitrogênio de levedura (YNB, Becton, Dickinson and Company), aminoácido sintético completo, 20 g/l de D-glicose, 100 mg/L de higromicina B, 20 g/L de ágar). A mistura foi vertida em uma placa de seleção (200 g/L de D-sorbitol, 6,7 g/L de base de nitrogênio de levedura (YNB, Becton, Dickinson and Company), aminoácido sintético completo, 20 g/L de D- glicose, 100 mg/L de higromicina B, e 20 g/L de ágar). O cultivo foi realizado a +28 °C durante cinco dia; as colônias foram colhidas e cultivadas novamente sobre as placas YPD contendo 100 mg/L de higromicina B.
[0133] As integrações corretas foram confirmadas por PCR do DNA genômico de cada cepa transformada, onde o amplicon (região amplificada de DNA) estendeu a construção integrada e o DNA genômico para fora dos flancos para integração. As integrações de cópia única foram confirmadas por qPCR, onde o sinal de qPCR do gene mCherry (para as cepas de Pichia kudriavzevii e Aspergillus niger) ou a região de codificação de BM3R1 (para as cepas de Trichoderma reesei) foi comparado a um sinal de qPCR de uma sequência nativa única em cada hospedeiro.
[0134] Para os cultivos líquidos, foram usados 6,7 g/L de base de nitrogênio de levedura (YNB, Becton, Dickinson and Company), aminoácido completo sintético suplementado com 20 g/L de D-glicose (SCD). No caso de cultivos em placa de ágar, foi usado meio solidificado contendo 20 g/L de ágar, 20 g/L de bacto peptona (Becton Dickinson), 10 g/L de extrato de levedura e 20 g/L de D- glicose (placas YPD). Para obter os esporos dos fungos filamentosos, foram utilizadas placas de ágar PDA para a esporulação (39 g/L de Batata dextrose ágar da BD-Difco).
[0135] Para a análise por citometria de fluxo da produção de mCherry nas cepas testadas (Figura 7B), as pré-culturas das cepas de Pichia kudriavzevii foram desenvolvidas por 24-48 horas em placas de ágar YPD e as cepas de Aspergillus niger foram esporuladas em placas PDA (por 7 dias), os esporos coletados e diluídos em 1x PBS antes da análise. No caso das cepas de Pichia kudriavzevii, 4 ml de meio SCD em placas de cultivo de 24 poços foram inoculados a partir da pré-cultura para DO600 = 0,2. As culturas foram desenvolvidas durante 18 horas a 800 rpm (Infors HT Microtron) e 28°C. Cem μL da cultura foram combinados com 1,5 mL de 1x PBS antes da análise. As medições foram feitas com o FACSAria III (BD), onde 10000 eventos foram registrados e os resultados foram normalizados dividindo-se os valores de fluorescência de mCherry pelo tamanho da célula (dispersão direta, FSC-A). Os resultados da análise fluorescente por
[0136] Para a análise por western blot da produção de CBH1 nas cepas de Trichoderma reesei, as pré- culturas (inoculadas por esporos) foram desenvolvidas por 24 horas em meio YPG (20 g/L de bacto peptona, 10 g/L de extrato de levedura e 30 g/L L gelatina). Quatro ml de SGE- lactose (15 g/L de KH2PO4, 5,4 g/L de Na2SO4, 1 mL/L deelementos residuais (3,7 mg/L de CoCl2, 5 mg/L deFeSO4.7H2O, 1,4 mg/L de ZnSO4.7H2O, 1,6 mg/L de MnSO4.7H2O),40 g/L de lactose, 333,25 g/L de extrato de grão consumido, 8,6 g/L de (NH4)2-citrato, 100 mM de Pipps, 2,4 mM de MgSO4, e 4,1 mM de CaCl2, pH ajustado para 4,8 com KOH) ou o meio SCD em placas de cultivo de 24 poços foi inoculado para DO600 = 0,5 para cada cepa testada. As culturas foramdesenvolvidas durante 3 dias a 800 rpm (Infors HT Microtron) e 28°C, centrifugadas e o sobrenadante transferido para um tubo limpo. Quinze μL de cadasobrenadante foram misturados com 4 μL de 4x tampão decarga de SDS (400 ml/L de glicerol, 100 mL/L de β-mercaptoetanol, 2 g/L de corante OrangeG (Sigma), 40 g/L de SDS, e 125 mM de Tris-HCl, pH 6,8), fervidos e carregados em gel de gradiente de 4-20% de SDS-PAGE. O gel foi transferido para uma membrana de nitrocelulose e a proteína CBH1 foi detectada com o anticorpo primário anti-CBH1 específico (camundongo) (e o anticorpo secundário conjugado ao anti-IR680 de camundongo) e a visualização do sinal foi realizada no instrumento Odyssey CLx Imaging System (LI-COR Biosciences). Os resultados da análise são mostrados na Figura 7D.Exemplo 5Teste do sistema de expressão em Kazachstania exigua (Figura 8)
[0137] O sistema de expressão usado para Kazachstania exigua (Tabela 3, Figura 8A) foi clonado em um plasmídio contendo regiões de flanco para o gene g706 de K. exigua que codifica um homólogo de ALD2 de S. cerevisiae. Na construção resultante, a região de flanco 3'-UTR para g706 de K. exigua formou uma sequência terminadora para o sTF no sistema de expressão. O sistema de expressão, incluindo as regiões de flanco para recombinação homóloga, foi integrado no lócus g706 (substituindo a região de codificação nativa).
[0138] A cepa C-02458 de Kazachstania exigua (coleta de cultura VTT) foi modificada pela substituição de ambos os locos KU70 pelo cassete de expressão de Cas9 (contendo promotor e terminador adequados). A cepa resultante (MAT a/α ura3Δ/ura3Δ ku70Δ::Cas9/ku70::Cas9) foi usada como a cepa parental (WT na Figura 8B). A transformação do sistema de expressão (DNA doador) na cepa de base foi realizada em conjunto com um plasmídio centromérico contendo o marcador de seleção URA3 e um cassete de expressão para um sgRNA que alveja Cas9 no lócus g706 (o sgRNA foi expresso sob o controle do promotor de RNA polimerase III de S. cerevisiae SNR52 e do terminador SUP4). A cepa resultante é mostrada como “SES” na Figura 8B.
[0139] A transformação foi feita pelo protocolo de eletroporação: As células foram inoculadas em meio YPD e cultivadas durante a noite a 250 rpm e 30 °C. A culturanoturna foi diluída para uma DO600 = 0,2 e desenvolvida até uma DO600 = 1,3. As células coletadas e lavadas foramressuspensas em 10 mL de Tris-EDTA (pH 7,5) contendo 10 mM de ditiotreitol e incubadas a 30 °C durante 30 minutos. Quarenta mL de água gelada foram adicionados às células, seguidos por centrifugação. Esta foi seguida com duas etapas de lavagem, primeiro com 50 mL de água estéril gelada, depois com 10 mL de sorbitol a 1 M gelado. Finalmente, as células foram ressuspensas em 125 μL de sorbitol a 1 M gelado. Cinquenta μL de suspensão celular foram combinados com 15 μL de uma mistura de DNA (contendo 5 μg do DNA doador e 5 μg do plasmídio de gRNA). A eletroporação foi realizada em cubetas de 2 mm a 1,25 kV, 200 Q e 25 μF. Novecentos e cinquenta μL de solução de recuperação (10 g/L de extrato de levedura, 10 g/L de Bacto peptona, 20 g/L de glicose, 1 M de sorbitol) foram adicionados imediatamente após a eletroporação. As células foram recuperadas durante 30 minutos a 250 rpm e 30 °C antes da preparação em meio SCD sem uracil.
[0140] Para a análise da expressão, as duas cepas (WT e SES) foram cultivadas em triplicatas em meio SCD por 10 horas, e a cepa SES também por 22 horas para atingir a fase estacionária, quando toda a glicose foi consumida (“SES_stat” na Figura 8B). O RNA total foi isolado das cepas (Kit RNeasy - QIAGEN), o cDNA foi produzido (Kit Transcriptor First Strand cDNA Synthesis - Roche) e a transcrição dos genes Venus e ADH1 (um gene glicolítico altamente expresso na fase exponencial de crescimento e infrarregulado na ausência de glicose) foi analisada por qPCR com primers específicos para cada gene. O gene ALG9 foi usado como o controle de normalização para a quantificação da expressão. Os resultados da análise são mostrados na Figura 8B.Exemplo 6O sistema de expressão utilizado para a produção de uma proteína secretada em fungos (Trichoderma reesei e Pichia pastoris) (Figura 9)
[0141] A molécula de DNA, contendo o sistema de expressão para Trichoderma reesei (Figura 9A), continha 114cp (Tabela 1) juntamente com oito sítios de ligação específicos para BM3R1 posicionados a montante controlando a expressão da região de codificação de CBH1, a região de codificação para o gene CBH1, o terminador PDC1 de Trichoderma reesei, 533cp (Tabela 1) controlando a expressão da região de codificação de sTF, a região de codificação de sTF, o terminador TEF1 de Trichoderma reesei, o gene marcador de seleção de resistência à higromicina com um promotor e terminador adequados e regiões de flanco para a integração genômica no lócus CBH1 (substituindo a região de codificação nativa) por recombinação homóloga. A cepa M1763 de T. reesei (coleta de cultura VTT) foi usada como a cepa parental (“WT” na Figura 9B). As transformações foram feitas pelo protocolo de transformação de protoplastos (Exemplo 4), usandoprotoplastos da cepa de T. reesei e DNA doador linear (cassete de expressão com o marcador de seleção e flancos para integração).
[0142] As integrações corretas foram confirmadas usando PCR a partir do DNA genômico, onde o amplicon (amplificada região de DNA) estendeu a construção integrada e o DNA genômico para fora dos flancos para integração. A integração de cópia única foi testada usando qPCR, onde o sinal de qPCR da região de codificação de BM3R1 foi comparado com o sinal de uma sequência nativa única no hospedeiro. A cepa contendo o cassete de expressão (“SES” na Figura 9B) foi analisada quanto à produção de CBH1 e comparada com a cepa de base nas condições de indução e repressão de celulase.
[0143] A produção de CBH1 nas cepas deTrichoderma reesei foi realizada em biorreatores de 1 L. As pré-culturas (inoculadas com esporos) para os cultivos nas condições de indução de celulase foram desenvolvidas durante 24 horas em meio SGE-lactose (Exemplo 4) para produzir uma quantidade suficiente de micélio para as inoculações no biorreator. As pré-culturas (inoculadas com esporos) para os cultivos nas condições de repressão de celulase foram desenvolvidas durante 24 horas em um meio YE-glicose-A (20 g/L de glicose, 10 g/L de extrato de levedura, 15 g/L de KH2PO4, 5 g/L de (NH4)2SO4, 1 mL/L deelementos residuais (3,7 mg/L de CoCl2, 5 mg/L deFeSO4.7H2O, 1,4 mg/L de ZnSO4.7H2O, 1,6 mg/L de MnSO4.7H2O), 2,4 mM de MgSO4, e 4,1 mM de CaCl2, pH ajustado para 4,8). Os cultivos dos biorreatores de indução de celulase foram inoculados em meio SGM (“SGM” na Figura 9B) (20 g/L deextrato de grão consumido, 20 g/L de grão consumido vendido, 60 g/L de lactose, 5 g/L de KH2PO4, 5 g/l deNH4SO4, 1 mL/L de elementos residuais, 2,4 mM de MgSO4, e4,1 mM de CaCl2, 1 mL/L de Antiespuma J647, pH 4,8), fluxode ar a 0,5 slpm (0,4-0,6 vvm) e agitação a 600 rpm. Os cultivos dos biorreatores de repressão de celulase foram inoculados no meio de YE-glicose-B (“glicose” na Figura 9B) (10 g/L de glicose, 20 g/L de extrato de levedura, 5 g/l KH2PO4, 5 g/L de NH4SO4, 1 mL/L de elementos residuais, 2,4mM de MgSO4, e 4,1 mM de CaCl2, 1 mL/L de Antiespuma J647,pH 4,8), e estas culturas foram continuamente alimentadas com glicose (300 g/L de glicose com vazão a 4,4 g/h), fluxode ar a 0,5 slpm (0,4-0,6 vvm) e agitação a 900 rpm. O cultivo foi realizado por 150 horas, amostras obtidas em vários momentos, subconjunto mostrado na Figura 9B.
[0144] Para a análise por corante coomassie (Figura 9B - painel superior esquerdo), 1,5 μL de cadasobrenadante da cultura (ponto no tempo) foi misturado com 15 μL de 1x tampão de carga de SDS (100 ml/L de glicerol, 25 ml/L de β-mercaptoetanol, 0,5 g/L de corante OrangeG (Sigma), 10 g/L de SDS e 31,2 mM de Tris-HCl, pH 6,8), fervido e carregado em gel de gradiente de SDS-PAGE de 4-20% em conjunto com diluições de proteína CBH1 purificadacomo um padrão. O gel foi colorido com corante coomassie coloidal (PageBlue Protein Staining Solution; Thermo Fisher Scientific) de acordo com o protocolo do fabricante. A visualização do gel colorido foi realizada no instrumento Odyssey CLx Imaging System (LI-COR Biosciences). A concentração de proteína no sobrenadante da cultura foi estimada a partir do padrão de CBH1 no mesmo gel (Figura 9B - tabela superior à direita). Para a análise por western (Figura 9B - painel inferior esquerdo), 0,075 μL de cadasobrenadante de cultura (ponto no tempo) foi misturado com 15 μL de 1x tampão de carga de SDS, fervido e carregado nogel de gradiente de SDS-PAGE de 4-20% em conjunto com diluições de proteína CBH1 purificada. O gel foi transferido para uma membrana de nitrocelulose, e a proteína CBH1 foi detectada com o anticorpo primário anti- CBH1 específico (camundongo) (e o anticorpo secundário conjugado ao anti-IR680 de camundongo) e a visualização do sinal foi realizada no instrumento Odyssey CLx Imaging System (LI-COR Biosciences). A concentração de CBH1 no sobrenadante da cultura foi estimada (Figura 9B - tabela inferior à direita).
[0145] A molécula de DNA, contendo o sistema de expressão para Pichia pastoris (Figura 9C), consistiu no 201cp (Tabela 1) juntamente com oito sítios de ligação específicos para BM3R1 posicionados a montante controlando a expressão da região de codificação da proteína de fusão, na região de codificação para a proteína de fusão (consistindo no sinal de secreção N terminal de Saccharomyces cerevisiae (fator α), sítio de clivagem de protease KEX/spe13, módulo de ligação ao carboidrato (CBM), proteína elastina-like (ELP5) e outro CBM), seguida pelo terminador ADH1 de S. cerevisiae, 008cp (Tabela 1)controlando a expressão da região de codificação de sTF, a região de codificação de sTF (a região de codificação da proteína de ligação ao DNA, BM3R1, do sTF foi optimizada no códon para se adequar ao uso de códons de Saccharomyces cerevisiae), o terminador TEF1 de Trichoderma reesei, o gene marcador de seleção de resistência à zeocina com promotor e terminador adequados e os flancos para integração no genoma por recombinação homóloga no lócus de AOX1 (integração na região do promotor AOX1). As transformações foram feitas usando o protocolo padrão de acetato de lítio. A cepa contendo uma cópia única docassete de expressão foi testada quanto à produção da proteína em diversas condições (Figura 9D).
[0146] A produção de CBM-ELP5-CBM em Pichia pastoris foi realizada em frascos Erlenmeyer. A pré-cultura foi realizada por 24 horas no meio YPP (10 g/L de extrato de levedura, 20 g/L de peptona, 13,4 g/L de base de nitrogênio de levedura, 0,4 mg/L de biotina, 20 g/L de glicerol, 13,2 mM de K2HPO4, e 86,8 mM de KH2PO4, pH = 6,0)com 20 g/L de glicerol (YPP-Gly). Para testar o efeito de diferentes fontes de carbono, o glicerol foi substituído por 20 g/L de glicose (“YPP-Glc” na Figura 9D) ou por 20 g/L de etanol (“YPP-EtOH” na Figura 9D). As células da pré- cultura foram inoculadas (para DO600 = 1,0) em YPP-Gly,YPP-Glc, ou YPP-EtOH e cultivadas durante 2 dias, também foi testada a adição de inibidores de proteinase (quimostatina e pepstatina). A pré-cultura também foi cultivada por dois dias adicionais (três dias no total).
[0147] Para a análise por western (Figura 9D), 22,5 μL de cada sobrenadante da cultura foram misturados com 7,5 μL de 4x tampão de carga de SDS, fervidos ecarregados no gel de gradiente de SDS-PAGE de 4-20%. O gel foi transferido para uma membrana de nitrocelulose e a proteína CBM-ELP5-CBM foi detectada com o anticorpo primário anti-CBM específico (camundongo) (e o anticorpo secundário conjugado ao anti-IR680 de camundongo) e a visualização do sinal foi realizada no instrumento Odyssey CLx Imaging System (LI-COR Biosciences) (Figura 9D).Exemplo 7Teste do desempenho do sistema de expressão em organismo de planta (Nicotiana benthamiana)
[0148] Dois sistemas de expressão são testadosem Nicotiana benthamiana (Tabela 4): Os sistemas deexpressão construídos em moléculas de DNA individuais compreendem dois cassetes de expressão: 1) cassete deexpressão para sTF, que compreende um promotor de núcleo utilizado para o controle da expressão de sTF, exemplificado aqui com o At-RPL41D_cp (Tabela 1); a versão de sTF com a proteína de ligação ao DNA, exemplificada aqui por BM3R1 ou TetR, e com o domínio de ativação, exemplificado aqui por VP16AD ou VP64AD; e um terminador, exemplificado aqui pelo terminador MT3 de Arabidopsis thaliana. E 2) o cassete de expressão para gene-alvo, que compreende diversos sítios de ligação específicos para o sTF, exemplificados aqui por oito sítios de ligação específicos para BM3R1 ou por oito sítios de ligação específicos para TetR; outro promotor de núcleo, exemplificado aqui por At-ATTI7_cp (ver Tabela 1), a região de codificação do gene-alvo, exemplificada aqui pela região de codificação de mCherry (relator de proteína fluorescente vermelha); e um terminador, exemplificado aqui pelo terminador PSBX de Arabidopsis thaliana. As regiões de codificação dos sTFs e do mCherry são otimizadas nos códons para adequarem-se ao uso de códons de Nicotiana benthamiana. Também, as versões de controle negativo (os sistemas de expressão com regiões removidas abrangendo o At-RPL41D_cp, o sTF e o terminador MT3) são construídas.
[0149] Os sistemas de expressão (e as versões de controle negativo) são clonados em um plasmídio contendo a região de codificação do marcador selecionável de planta (NptII) com promotor e terminador adequados, e as sequências para propagação em Agrobacterium tumefaciens, incluindo o marcador de seleção de canamicina. Os plasmídios são transformados em Agrobacterium tumefaciens (cepa EHA105) por eletroporação (cubetas de 2 mm; com configurações: 1,25 kV, 200 Q e 25 μF), e os transformantes são desenvolvidos na presença de canamicina e rifampicina antes da infecção das folhas de Nicotiana benthamiana. As folhas de plantas com 6 semanas de idade são infiltradas com a mistura 1:1 das culturas de Agrobacterium tumefaciens, uma com a cepa carregando o sistema de expressão e outra com uma cepa carregando um vetor de expressão para o inibidor de silenciamento de gene pós- transcricional p19 (Silhavy et al., 2002) (ambas as culturas diluídas para DO600 = 0,7 com 10 mM de MgCl2 + 10mM de MES - pH = 5,8). Os discos foliares infiltrados(correspondendo à área infiltrada) são coletados após 6 dias de incubação em uma estufa, triturados em 1xPBS, e os extratos brutos são analisados quanto à fluorescência de mCherry usando o instrumento Varioskan (Thermo Electron Corporation).Exemplo 8Teste do desempenho do sistema de expressão em algas verdes (Chlamydomonas reinhardtii)
[0150] Dois sistemas de expressão são testados em Chlamydomonas reinhardtii (Tabela 5): Os sistemas de expressão construídos em moléculas de DNA individuais compreendem dois cassetes de expressão: 1) cassete de expressão para sTF, que compreende um promotor de núcleo utilizado para o controle da expressão de sTF, exemplificado aqui com o Cr-eIF-5A_cp (Tabela 1); a versão de sTF com a proteína de ligação ao DNA, exemplificada aqui por BM3R1 ou TetR, e com o domínio de ativação, exemplificado aqui por VP16AD ou VP64AD; e um terminador, exemplificado aqui pelo terminador RPS27A de Chlamydomonas reinhardtii. E 2) o cassete de expressão para o gene-alvo, que compreende diversos sítios de ligação específicos para o sTF, exemplificados aqui por oito sítios de ligação específicos para BM3R1 ou por oito sítios de ligação específicos para TetR; outro promotor de núcleo, exemplificado aqui por Cr-RPS3A_cp (Tabela 1), a região de codificação do gene-alvo, exemplificada aqui pela região de codificação de mCherry (relator de proteína fluorescente vermelha); e um terminador, exemplificado aqui pelo terminador RBCS2 de Chlamydomonas reinhardtii. As regiões de codificação dos sTFs e do mCherry são otimizadas nos códons para se adequarem ao uso de códons de Chlamydomonas reinhardtii. Também, as versões de controle negativo (os sistemas de expressão com regiões removidas abrangendo o Cr-eIF-5A_cp, o sTF e o terminador RPS27A) são construídas.
[0151] Os sistemas de expressão (e as versões de controle negativo) são clonados no sítio Ncol do plasmídio pChlamy_4 (Invitrogen). Os plasmídios resultantes (incluindo o plasmídio pChlamy_4 não modificado), após a linearização, são transformados em Chlamydomonasreinhardtii (cepa 137c; Invitrogen). As transformações são realizadas de acordo com o protocolo no manual do Kit GeneArt Chlamydomonas Protein Expression (Invitrogen). Os transformantes são desenvolvidos no meio Gibco Tap Growth, na presença de Zeocina, e analisados quanto à fluorescência de mCherry usando o instrumento Varioskan (Thermo Electron Corporation).Exemplo 9Teste do desempenho do sistema de expressão em células CHO (Cricetulus griseus)
[0152] O sistema de expressão para Cricetulus griseus (Tabela 6) construídos em moléculas de DNA individuais compreende dois cassetes de expressão: 1)cassete de expressão para sTF, que compreende um promotor de núcleo utilizado para o controle da expressão de sTF, exemplificado aqui com o Mm-Atp5b_cp (Tabela 1); a versão de sTF com a proteína de ligação ao DNA, exemplificada aqui por BM3R1, e com o domínio de ativação, exemplificado aqui por VP64AD; e um terminador, exemplificado aqui pelo terminador INHA de Mus musculus. E 2) o cassete de expressão para o gene-alvo, que compreende diversos sítios de ligação específicos para o sTF, exemplificados aqui por oito sítios de ligação específicos para BM3R1; outro promotor de núcleo, exemplificado aqui por Mm-Eef2_cp (Tabela 1), a região de codificação do gene-alvo, exemplificada aqui pela região de codificação de mCherry (relator de proteína fluorescente vermelha); e um terminador, exemplificado aqui pelo terminador FTH1 de Mus musculus. As regiões de codificação de sTF e mCherry são otimizadas nos códons para se adequarem ao uso de códons de Cricetulus griseus. Também, as versões de controle negativo (os sistemas de expressão com regiões removidas abrangendo o Mm-Atp5b_cp, o sTF e o terminador INHA) são construídas.
[0153] O sistema de expressão (e a versão de controle negativo) é clonado entre os sítios MluI e XbaI do plasmídio pcDNA3.1 (Invitrogen). Os plasmídios resultantes são transfectados nas células de ovário de hamster chinês (CHO-K1; American Type Culture Collection (Rockville, MD)).Antes da transformação, as células CHO-K1 são cultivadas em Meio de Ham F-12K (de Kaighn) (Gibco) contendo 2 mM de L- glutamina e 1500 mg/L de bicarbonato de sódio, suplementado com 10% de soro bovino fetal (FBS), 100 U/ml de penicilina e 100 mg/ml de estreptomicina. As células são mantidas em uma atmosfera de 5% de CO2 e 90% de umidade relativa a 37 °C. Em um frasco, as células são cultivadas, divididas e 3x105 células são semeadas em placas de cultura de 6 poços e desenvolvidas em 2 ml de meio até 70% de confluência. A transfecção é feita com FuGene 6 (Roche) de acordo com as instruções do fabricante, com aproximadamente 1 μg de DNA de plasmídio adicionado por poço. As células transfectadas são deixadas continuarem a crescer por até 5 dias. A expressão de mCherry é monitorizada diariamente após a transfecção por microscopia de fluorescência.Referências da literatura:1. Hubmann G, Thevelein J, Nevoigt E (2014) Natural and Modified Promoters for Tailored Metabolic Engineering of the Yeast Saccharomyces cerevisiae. Em: Mapelli V, editor. Yeast Metabolic Engineering: Springer New York. pp. 17-42.2. Blumhoff M, Steiger MG, Marx H, Mattanovich D, Sauer M (2013) Six novel constitutive promoters for metabolic engineering of Aspergillus niger. Appl Microbiol Biotechnol 97(1):259-67.3. Ito Y, Yamanishi M, Ikeuchi A, Matsuyama T (2015) A highly tunable system for the simultaneous expression of multiple enzymes in Saccharomyces cerevisiae. ACS Synth Biol 4: 12-16.4. Pachlinger R, Mitterbauer R, Adam G, Strauss J (2005) Metabolically independent and accurately adjustable Aspergillus sp. expression system. Appl Environ Microbiol 71: 672-678.5. Silhavy D, Molnar A, Lucioli A, Szittya G, Hornyik C, Tavazza M, Burgyan J. (2002) A viral protein suppresses RNA silencing and binds silencing-generated, 21- to 25-nucleotide double-stranded RNAs. EMBO J. 21(12):3070-80. Referências de patentesUS2002081667
Claims (6)
1. Sistema de expressão para um hospedeiro eucariótico caracterizado por compreender(a) um cassete de expressão compreendendoum promotor de núcleo, o referido promotor de núcleo sendo a única sequência reguladora para controlar a expressão de uma sequência de DNA que codifica o fator de transcrição sintético (sTF), euma sequência de DNA que codifica o fator de transcrição sintético (sTF), e(b) um ou mais cassetes de expressão compreendendo, cada um, uma sequência de DNA que codifica um produto desejado operacionalmente ligado a um promotor sintético,o referido promotor sintético compreendendo um promotor de núcleo idêntico ao promotor de núcleo de (a) ou outro promotor de núcleo, e sítios de ligação específicos para o sTF a montante do promotor de núcleo.
2. Sistema de expressão, de acordo com a reivindicação 1, caracterizado pelo fato de que o promotor de núcleo compreende uma sequência de DNA contendo a região 5’ a montante de um gene eucariótico, iniciando 10 - 50 pb a montante de uma sequência TATA e terminando 9 pb a montante do códon de iniciação ATG, e em que a distância entre a sequência TATA e o códon de iniciação não é maior do que 180 pb e não é menor do que 80 pb, e uma sequência de DNA na sua extremidade 3’ compreendendo 1-20 pb aleatórios.
3. Sistema de expressão, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o promotor de núcleo é um promotor de núcleo universal (UCP) funcional em diversos organismos eucarióticos.
4. Sistema de expressão, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o referido fator de transcrição sintético (sTF) compreende um regulador de transcrição procariótico, um sinal de localização nuclear, e um domínio de ativação da transcrição.
5. Sistema de expressão, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que o hospedeiro eucariótico é selecionado a partir do grupo que consiste em espécies fúngicas, incluindo levedura e fungos filamentosos, espécies de plantas, incluindo angiospermas e espécies de algas verdes, e espécies animais.
6. Método para produzir um produto proteico desejado em um hospedeiro eucariótico caracterizado por compreender cultivar um hospedeiro eucariótico não-humano compreendendo o sistema de expressão, conforme definido na reivindicação 1 a 5, sob condições de cultivo adequadas.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20165137A FI127283B (en) | 2016-02-22 | 2016-02-22 | Expression system for eukaryotic microorganisms |
FI20165137 | 2016-02-22 | ||
PCT/FI2017/050114 WO2017144777A1 (en) | 2016-02-22 | 2017-02-21 | Expression system for eukaryotic organisms |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112018017088A2 BR112018017088A2 (pt) | 2019-01-02 |
BR112018017088B1 true BR112018017088B1 (pt) | 2024-10-08 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11332750B2 (en) | Expression system for eukaryotic organisms | |
Maekawa et al. | Polyubiquitin promoter-based binary vectors for overexpression and gene silencing in Lotus japonicus | |
US8236528B2 (en) | Method for methanol independent induction from methanol inducible promoters in Pichia | |
CN105695485A (zh) | 一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用 | |
KR20210153106A (ko) | 단백질 생산을 위한 물질 및 방법 | |
KR20140033048A (ko) | 변경된 점성 표현형을 갖는 사상균 | |
Wu et al. | Cloning and identification of promoter Prd29A and its application in sugarcane drought resistance | |
CA2809828C (en) | Regulatory element for heterologous protein production in the fruiting body of filamentous fungi | |
BR112018017088B1 (pt) | Sistema de expressão para organismos eucarióticos | |
EP1114867A1 (en) | Transcription regulatory sequences derived from Chlamydomonas reinhardtii | |
Xiao-Yi et al. | Production of marker-free transgenic tobacco plants by Flp/frt recombination system | |
CN106636174A (zh) | 表达外源蛋白的毕赤酵母、其构建方法及其诱导表达方法 | |
WO2018236294A1 (en) | GENE EXPRESSION PRODUCT FOR PRODUCING TARGET BIOLOGICAL PROTEINS OR PRODUCTS FROM THERMOTOLERANT YEAST BY INDUCTION AND NON-INDUCTION OF METHANOL, COMPRISING ITS PRODUCT USAGE PROCESS | |
US9145561B2 (en) | Regulatory element for heterologous protein production in the fruiting body of filamentous fungi | |
CN116769781B (zh) | 一种来源于粗壮脉纹孢菌的启动子及其应用 | |
US10131916B2 (en) | Regulatory element for heterologous protein production in the fruiting body of filamentous fungi | |
CN116515889A (zh) | 一种植物叶组织特异性表达dna调控元件及其应用 | |
CN114106123A (zh) | 转录激活结构域TaL及其应用 | |
US20040237132A1 (en) | Plant promoters | |
JP2006075123A (ja) | キャンディダ・ユティリス由来のプロモーターdna | |
CN101087519A (zh) | 表达Na+泵ATP酶的维管植物 |