CN117716039A - 用于增强真菌细胞中的蛋白质产生的组合物和方法 - Google Patents
用于增强真菌细胞中的蛋白质产生的组合物和方法 Download PDFInfo
- Publication number
- CN117716039A CN117716039A CN202280050548.XA CN202280050548A CN117716039A CN 117716039 A CN117716039 A CN 117716039A CN 202280050548 A CN202280050548 A CN 202280050548A CN 117716039 A CN117716039 A CN 117716039A
- Authority
- CN
- China
- Prior art keywords
- protein
- seq
- recombinant
- proteins
- poi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002538 fungal effect Effects 0.000 title claims abstract description 165
- 238000000034 method Methods 0.000 title claims description 81
- 230000002708 enhancing effect Effects 0.000 title claims description 6
- 230000014616 translation Effects 0.000 title description 34
- 239000000203 mixture Substances 0.000 title description 20
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 412
- 108091006104 gene-regulatory proteins Proteins 0.000 claims abstract description 314
- 102000034356 gene-regulatory proteins Human genes 0.000 claims abstract description 312
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 267
- 238000004519 manufacturing process Methods 0.000 claims abstract description 37
- 235000018102 proteins Nutrition 0.000 claims description 259
- 150000007523 nucleic acids Chemical group 0.000 claims description 172
- 241000499912 Trichoderma reesei Species 0.000 claims description 135
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 100
- 230000014509 gene expression Effects 0.000 claims description 60
- 108091033319 polynucleotide Proteins 0.000 claims description 59
- 102000040430 polynucleotide Human genes 0.000 claims description 59
- 239000002157 polynucleotide Substances 0.000 claims description 58
- -1 antibodies Proteins 0.000 claims description 57
- 102000004190 Enzymes Human genes 0.000 claims description 48
- 108090000790 Enzymes Proteins 0.000 claims description 48
- 229940088598 enzyme Drugs 0.000 claims description 48
- 108090000637 alpha-Amylases Proteins 0.000 claims description 35
- 102000013142 Amylases Human genes 0.000 claims description 27
- 108010065511 Amylases Proteins 0.000 claims description 27
- 102000004139 alpha-Amylases Human genes 0.000 claims description 27
- 235000019418 amylase Nutrition 0.000 claims description 27
- 238000011144 upstream manufacturing Methods 0.000 claims description 27
- 229940024171 alpha-amylase Drugs 0.000 claims description 26
- 108010011619 6-Phytase Proteins 0.000 claims description 23
- 102000015439 Phospholipases Human genes 0.000 claims description 23
- 108010064785 Phospholipases Proteins 0.000 claims description 23
- 102000004316 Oxidoreductases Human genes 0.000 claims description 18
- 108090000854 Oxidoreductases Proteins 0.000 claims description 18
- 230000028070 sporulation Effects 0.000 claims description 17
- 229940025131 amylases Drugs 0.000 claims description 16
- 102100022624 Glucoamylase Human genes 0.000 claims description 15
- 239000004365 Protease Substances 0.000 claims description 14
- 108010084185 Cellulases Proteins 0.000 claims description 13
- 102000005575 Cellulases Human genes 0.000 claims description 13
- 229920001503 Glucan Polymers 0.000 claims description 13
- 102000035195 Peptidases Human genes 0.000 claims description 13
- 108091005804 Peptidases Proteins 0.000 claims description 13
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 claims description 12
- 108700007698 Genetic Terminator Regions Proteins 0.000 claims description 12
- 102000004317 Lyases Human genes 0.000 claims description 12
- 108090000856 Lyases Proteins 0.000 claims description 12
- 108010093305 exopolygalacturonase Proteins 0.000 claims description 12
- 239000004382 Amylase Substances 0.000 claims description 11
- 108010013043 Acetylesterase Proteins 0.000 claims description 10
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 claims description 10
- 108010059820 Polygalacturonase Proteins 0.000 claims description 10
- 108010002430 hemicellulase Proteins 0.000 claims description 10
- 102100032487 Beta-mannosidase Human genes 0.000 claims description 9
- 108090000371 Esterases Proteins 0.000 claims description 9
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 claims description 9
- 108010015776 Glucose oxidase Proteins 0.000 claims description 9
- 108010060309 Glucuronidase Proteins 0.000 claims description 9
- 102000053187 Glucuronidase Human genes 0.000 claims description 9
- 102000004195 Isomerases Human genes 0.000 claims description 9
- 108090000769 Isomerases Proteins 0.000 claims description 9
- 108010029541 Laccase Proteins 0.000 claims description 9
- 108090001060 Lipase Proteins 0.000 claims description 9
- 108060008724 Tyrosinase Proteins 0.000 claims description 9
- 102000003425 Tyrosinase Human genes 0.000 claims description 9
- 108010055059 beta-Mannosidase Proteins 0.000 claims description 9
- 235000019420 glucose oxidase Nutrition 0.000 claims description 9
- 235000011073 invertase Nutrition 0.000 claims description 9
- 108010062085 ligninase Proteins 0.000 claims description 9
- 108010038851 tannase Proteins 0.000 claims description 9
- 108090000915 Aminopeptidases Proteins 0.000 claims description 8
- 102000004400 Aminopeptidases Human genes 0.000 claims description 8
- 239000004366 Glucose oxidase Substances 0.000 claims description 8
- 239000004367 Lipase Substances 0.000 claims description 8
- 102000004882 Lipase Human genes 0.000 claims description 8
- 241001465754 Metazoa Species 0.000 claims description 8
- 101710163270 Nuclease Proteins 0.000 claims description 8
- 102000003992 Peroxidases Human genes 0.000 claims description 8
- 108010051210 beta-Fructofuranosidase Proteins 0.000 claims description 8
- 102000005936 beta-Galactosidase Human genes 0.000 claims description 8
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 8
- 108010005400 cutinase Proteins 0.000 claims description 8
- 229940116332 glucose oxidase Drugs 0.000 claims description 8
- 235000019421 lipase Nutrition 0.000 claims description 8
- 108700038091 Beta-glucanases Proteins 0.000 claims description 7
- 108010006303 Carboxypeptidases Proteins 0.000 claims description 7
- 102000005367 Carboxypeptidases Human genes 0.000 claims description 7
- 108010053835 Catalase Proteins 0.000 claims description 7
- 102000016938 Catalase Human genes 0.000 claims description 7
- 108010023736 Chondroitinases and Chondroitin Lyases Proteins 0.000 claims description 7
- 102000011413 Chondroitinases and Chondroitin Lyases Human genes 0.000 claims description 7
- 108010053770 Deoxyribonucleases Proteins 0.000 claims description 7
- 102000016911 Deoxyribonucleases Human genes 0.000 claims description 7
- 108050008938 Glucoamylases Proteins 0.000 claims description 7
- 108050009363 Hyaluronidases Proteins 0.000 claims description 7
- 102000001974 Hyaluronidases Human genes 0.000 claims description 7
- 108090000128 Lipoxygenases Proteins 0.000 claims description 7
- 102000003820 Lipoxygenases Human genes 0.000 claims description 7
- 108700020962 Peroxidase Proteins 0.000 claims description 7
- 108091007187 Reductases Proteins 0.000 claims description 7
- 108010030291 alpha-Galactosidase Proteins 0.000 claims description 7
- 102000005840 alpha-Galactosidase Human genes 0.000 claims description 7
- 108010019077 beta-Amylase Proteins 0.000 claims description 7
- 229940119679 deoxyribonucleases Drugs 0.000 claims description 7
- 230000001939 inductive effect Effects 0.000 claims description 7
- 108010059345 keratinase Proteins 0.000 claims description 7
- 101710117655 Maltogenic alpha-amylase Proteins 0.000 claims description 6
- 108090001066 Racemases and epimerases Proteins 0.000 claims description 6
- 102000004879 Racemases and epimerases Human genes 0.000 claims description 6
- 108010083644 Ribonucleases Proteins 0.000 claims description 6
- 102000006382 Ribonucleases Human genes 0.000 claims description 6
- 108010028144 alpha-Glucosidases Proteins 0.000 claims description 6
- 235000021245 dietary protein Nutrition 0.000 claims description 6
- 108020003175 receptors Proteins 0.000 claims description 6
- 102000005962 receptors Human genes 0.000 claims description 6
- 230000004568 DNA-binding Effects 0.000 claims description 5
- 102100024295 Maltase-glucoamylase Human genes 0.000 claims 2
- 108090000765 processed proteins & peptides Proteins 0.000 abstract description 23
- 102000004196 processed proteins & peptides Human genes 0.000 abstract description 21
- 229920001184 polypeptide Polymers 0.000 abstract description 20
- 210000004027 cell Anatomy 0.000 description 217
- 150000001413 amino acids Chemical group 0.000 description 118
- 238000000855 fermentation Methods 0.000 description 73
- 230000004151 fermentation Effects 0.000 description 72
- 102000039446 nucleic acids Human genes 0.000 description 63
- 108020004707 nucleic acids Proteins 0.000 description 63
- 230000002018 overexpression Effects 0.000 description 35
- 108700005075 Regulator Genes Proteins 0.000 description 31
- 230000000694 effects Effects 0.000 description 28
- 239000000758 substrate Substances 0.000 description 25
- 241000233866 Fungi Species 0.000 description 24
- 108010059892 Cellulase Proteins 0.000 description 23
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 20
- 239000008101 lactose Substances 0.000 description 20
- 239000000047 product Substances 0.000 description 19
- 239000002609 medium Substances 0.000 description 17
- 230000001105 regulatory effect Effects 0.000 description 17
- 239000013598 vector Substances 0.000 description 17
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 16
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 16
- 108700026244 Open Reading Frames Proteins 0.000 description 16
- 229910052799 carbon Inorganic materials 0.000 description 16
- 229940085127 phytase Drugs 0.000 description 16
- 229940106157 cellulase Drugs 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 108091026890 Coding region Proteins 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- 241000223259 Trichoderma Species 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 230000006698 induction Effects 0.000 description 12
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 11
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 11
- 239000008103 glucose Substances 0.000 description 11
- 230000010354 integration Effects 0.000 description 11
- 229910052760 oxygen Inorganic materials 0.000 description 11
- 239000001301 oxygen Substances 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- HIWPGCMGAMJNRG-ACCAVRKYSA-N Sophorose Natural products O([C@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O)[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HIWPGCMGAMJNRG-ACCAVRKYSA-N 0.000 description 10
- 229940024606 amino acid Drugs 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 10
- HIWPGCMGAMJNRG-UHFFFAOYSA-N beta-sophorose Natural products OC1C(O)C(CO)OC(O)C1OC1C(O)C(O)C(O)C(CO)O1 HIWPGCMGAMJNRG-UHFFFAOYSA-N 0.000 description 10
- 230000012010 growth Effects 0.000 description 10
- 239000003550 marker Substances 0.000 description 10
- 244000005700 microbiome Species 0.000 description 10
- PZDOWFGHCNHPQD-VNNZMYODSA-N sophorose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](C=O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O PZDOWFGHCNHPQD-VNNZMYODSA-N 0.000 description 10
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 9
- 241000228245 Aspergillus niger Species 0.000 description 9
- 108091033409 CRISPR Proteins 0.000 description 9
- 101100032157 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pyr2 gene Proteins 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 241000351920 Aspergillus nidulans Species 0.000 description 8
- 102000004157 Hydrolases Human genes 0.000 description 8
- 108090000604 Hydrolases Proteins 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000002103 transcriptional effect Effects 0.000 description 8
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 230000003248 secreting effect Effects 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 241000228212 Aspergillus Species 0.000 description 6
- 240000006439 Aspergillus oryzae Species 0.000 description 6
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- 108020005004 Guide RNA Proteins 0.000 description 6
- 108010047754 beta-Glucosidase Proteins 0.000 description 6
- 230000033228 biological regulation Effects 0.000 description 6
- 101150052795 cbh-1 gene Proteins 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 238000007824 enzymatic assay Methods 0.000 description 6
- 238000001952 enzyme assay Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 238000012239 gene modification Methods 0.000 description 6
- 230000005017 genetic modification Effects 0.000 description 6
- 235000013617 genetically modified food Nutrition 0.000 description 6
- 101150073906 gpdA gene Proteins 0.000 description 6
- 101150095733 gpsA gene Proteins 0.000 description 6
- 239000000411 inducer Substances 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 235000015097 nutrients Nutrition 0.000 description 6
- 210000001938 protoplast Anatomy 0.000 description 6
- 241001465318 Aspergillus terreus Species 0.000 description 5
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 5
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 5
- 239000004793 Polystyrene Substances 0.000 description 5
- 108091023040 Transcription factor Proteins 0.000 description 5
- 102000040945 Transcription factor Human genes 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 229910021529 ammonia Inorganic materials 0.000 description 5
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 5
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 5
- 102000006995 beta-Glucosidase Human genes 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 235000019419 proteases Nutrition 0.000 description 5
- 230000002797 proteolythic effect Effects 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 229920001817 Agar Polymers 0.000 description 4
- 241000235349 Ascomycota Species 0.000 description 4
- 241001513093 Aspergillus awamori Species 0.000 description 4
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 4
- 102100036269 Hexosaminidase D Human genes 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- 108010084650 alpha-N-arabinofuranosidase Proteins 0.000 description 4
- 239000001913 cellulose Substances 0.000 description 4
- 229920002678 cellulose Polymers 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- 229910001882 dioxygen Inorganic materials 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 229920002223 polystyrene Polymers 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 239000013587 production medium Substances 0.000 description 4
- 230000028327 secretion Effects 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 101150016309 trpC gene Proteins 0.000 description 4
- 102100025573 1-alkyl-2-acetylglycerophosphocholine esterase Human genes 0.000 description 3
- 108010024976 Asparaginase Proteins 0.000 description 3
- 241000250967 Branchia Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 3
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108010090665 Mannosyl-Glycoprotein Endo-beta-N-Acetylglucosaminidase Proteins 0.000 description 3
- 241000226677 Myceliophthora Species 0.000 description 3
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- 108090000284 Pepsin A Proteins 0.000 description 3
- 102000057297 Pepsin A Human genes 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 241001313536 Thermothelomyces thermophila Species 0.000 description 3
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 3
- 238000001816 cooling Methods 0.000 description 3
- 239000000706 filtrate Substances 0.000 description 3
- 238000012224 gene deletion Methods 0.000 description 3
- 239000002054 inoculum Substances 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 239000007003 mineral medium Substances 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000004952 protein activity Effects 0.000 description 3
- 230000017854 proteolysis Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 239000011573 trace mineral Substances 0.000 description 3
- 235000013619 trace mineral Nutrition 0.000 description 3
- 108700026220 vif Genes Proteins 0.000 description 3
- 229920001221 xylan Polymers 0.000 description 3
- 150000004823 xylans Chemical class 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- XZKIHKMTEMTJQX-UHFFFAOYSA-N 4-Nitrophenyl Phosphate Chemical compound OP(O)(=O)OC1=CC=C([N+]([O-])=O)C=C1 XZKIHKMTEMTJQX-UHFFFAOYSA-N 0.000 description 2
- 108010043797 4-alpha-glucanotransferase Proteins 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 2
- 102000006267 AMP Deaminase Human genes 0.000 description 2
- 108700016228 AMP deaminases Proteins 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 108010025188 Alcohol oxidase Proteins 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- 108090000531 Amidohydrolases Proteins 0.000 description 2
- 102000004092 Amidohydrolases Human genes 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 102100040894 Amylo-alpha-1,6-glucosidase Human genes 0.000 description 2
- 241000228215 Aspergillus aculeatus Species 0.000 description 2
- 241000228193 Aspergillus clavatus Species 0.000 description 2
- 241000228197 Aspergillus flavus Species 0.000 description 2
- 241000892910 Aspergillus foetidus Species 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 102100024423 Carbonic anhydrase 9 Human genes 0.000 description 2
- 108010035722 Chloride peroxidase Proteins 0.000 description 2
- 108090001069 Chymopapain Proteins 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 102100035149 Cytosolic endo-beta-N-acetylglucosaminidase Human genes 0.000 description 2
- 108030002106 D-psicose 3-epimerases Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 239000004375 Dextrin Substances 0.000 description 2
- 229920001353 Dextrin Polymers 0.000 description 2
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 108090000270 Ficain Proteins 0.000 description 2
- 241000223218 Fusarium Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 108010022769 Glucan 1,3-beta-Glucosidase Proteins 0.000 description 2
- 108010050375 Glucose 1-Dehydrogenase Proteins 0.000 description 2
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 108010028688 Isoamylase Proteins 0.000 description 2
- 108010010525 Isomaltulose synthase Proteins 0.000 description 2
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 2
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 102100033468 Lysozyme C Human genes 0.000 description 2
- 241000235395 Mucor Species 0.000 description 2
- 102000048245 N-acetylneuraminate lyases Human genes 0.000 description 2
- 108700023220 N-acetylneuraminate lyases Proteins 0.000 description 2
- 108060004757 N-acyl-D-amino-acid deacylase Proteins 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 108010033272 Nitrilase Proteins 0.000 description 2
- AYRXSINWFIIFAE-UHFFFAOYSA-N O6-alpha-D-Galactopyranosyl-D-galactose Natural products OCC1OC(OCC(O)C(O)C(O)C(O)C=O)C(O)C(O)C1O AYRXSINWFIIFAE-UHFFFAOYSA-N 0.000 description 2
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 108090000526 Papain Proteins 0.000 description 2
- 108010073038 Penicillin Amidase Proteins 0.000 description 2
- 108090000313 Pepsin B Proteins 0.000 description 2
- 102100026918 Phospholipase A2 Human genes 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 102000056251 Prolyl Oligopeptidases Human genes 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 108090000919 Pyroglutamyl-Peptidase I Proteins 0.000 description 2
- 102100031108 Pyroglutamyl-peptidase 1 Human genes 0.000 description 2
- 108030006203 Rhamnogalacturonan endolyases Proteins 0.000 description 2
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 241001494489 Thielavia Species 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- 241001149964 Tolypocladium Species 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 241000223260 Trichoderma harzianum Species 0.000 description 2
- 241000378866 Trichoderma koningii Species 0.000 description 2
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 108010046334 Urease Proteins 0.000 description 2
- 102100039662 Xaa-Pro dipeptidase Human genes 0.000 description 2
- 241000235015 Yarrowia lipolytica Species 0.000 description 2
- 239000008351 acetate buffer Substances 0.000 description 2
- 108010093941 acetylxylan esterase Proteins 0.000 description 2
- 108090000350 actinidain Proteins 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 2
- 108010044879 alpha-L-rhamnosidase Proteins 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- 229960003272 asparaginase Drugs 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 108010085377 beta-N-Acetylhexosaminidases Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000002551 biofuel Substances 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 239000005018 casein Substances 0.000 description 2
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 2
- 235000021240 caseins Nutrition 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 108010048610 cellobiose phosphorylase Proteins 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 108010042194 dextransucrase Proteins 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 238000003028 enzyme activity measurement method Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 108090000285 fruit bromelain Proteins 0.000 description 2
- 230000004077 genetic alteration Effects 0.000 description 2
- 231100000118 genetic alteration Toxicity 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- DLRVVLDZNNYCBX-CQUJWQHSSA-N gentiobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)C(O)O1 DLRVVLDZNNYCBX-CQUJWQHSSA-N 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000013028 medium composition Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 229940111202 pepsin Drugs 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000004853 protein function Effects 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 101150095482 pyr2 gene Proteins 0.000 description 2
- 108010001816 pyranose oxidase Proteins 0.000 description 2
- 102000037983 regulatory factors Human genes 0.000 description 2
- 108091008025 regulatory factors Proteins 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000013605 shuttle vector Substances 0.000 description 2
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 108090000346 stem bromelain Proteins 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000004753 textile Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- NGGMYCMLYOUNGM-UHFFFAOYSA-N (-)-fumagillin Natural products O1C(CC=C(C)C)C1(C)C1C(OC)C(OC(=O)C=CC=CC=CC=CC(O)=O)CCC21CO2 NGGMYCMLYOUNGM-UHFFFAOYSA-N 0.000 description 1
- 108090000344 1,4-alpha-Glucan Branching Enzyme Proteins 0.000 description 1
- 102000003925 1,4-alpha-Glucan Branching Enzyme Human genes 0.000 description 1
- CHUGKEQJSLOLHL-UHFFFAOYSA-N 2,2-Bis(bromomethyl)propane-1,3-diol Chemical compound OCC(CO)(CBr)CBr CHUGKEQJSLOLHL-UHFFFAOYSA-N 0.000 description 1
- PDLPTSJWDUCMKS-UHFFFAOYSA-N 3-[4-(3-sulfopropyl)piperazin-1-yl]propane-1-sulfonic acid Chemical compound OS(=O)(=O)CCCN1CCN(CCCS(O)(=O)=O)CC1 PDLPTSJWDUCMKS-UHFFFAOYSA-N 0.000 description 1
- SATHPVQTSSUFFW-UHFFFAOYSA-N 4-[6-[(3,5-dihydroxy-4-methoxyoxan-2-yl)oxymethyl]-3,5-dihydroxy-4-methoxyoxan-2-yl]oxy-2-(hydroxymethyl)-6-methyloxane-3,5-diol Chemical compound OC1C(OC)C(O)COC1OCC1C(O)C(OC)C(O)C(OC2C(C(CO)OC(C)C2O)O)O1 SATHPVQTSSUFFW-UHFFFAOYSA-N 0.000 description 1
- XZKIHKMTEMTJQX-UHFFFAOYSA-L 4-nitrophenyl phosphate(2-) Chemical compound [O-][N+](=O)C1=CC=C(OP([O-])([O-])=O)C=C1 XZKIHKMTEMTJQX-UHFFFAOYSA-L 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- 101150111329 ACE-1 gene Proteins 0.000 description 1
- ZHQQRIUYLMXDPP-SSDOTTSWSA-N Actinidine Natural products C1=NC=C(C)C2=C1[C@H](C)CC2 ZHQQRIUYLMXDPP-SSDOTTSWSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 101710199313 Alpha-L-arabinofuranosidase Proteins 0.000 description 1
- 102100025981 Aminoacylase-1 Human genes 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 108010033764 Amylosucrase Proteins 0.000 description 1
- 102100030988 Angiotensin-converting enzyme Human genes 0.000 description 1
- 102100035765 Angiotensin-converting enzyme 2 Human genes 0.000 description 1
- 108090000975 Angiotensin-converting enzyme 2 Proteins 0.000 description 1
- 229920000189 Arabinogalactan Polymers 0.000 description 1
- 239000001904 Arabinogalactan Substances 0.000 description 1
- 101710152845 Arabinogalactan endo-beta-1,4-galactanase Proteins 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- 102100023943 Arylsulfatase L Human genes 0.000 description 1
- 102000009133 Arylsulfatases Human genes 0.000 description 1
- 108010024957 Ascorbate Oxidase Proteins 0.000 description 1
- 101000709143 Aspergillus aculeatus Rhamnogalacturonate lyase A Proteins 0.000 description 1
- 101100382641 Aspergillus aculeatus cbhB gene Proteins 0.000 description 1
- 101001065065 Aspergillus awamori Feruloyl esterase A Proteins 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 1
- 108700020228 Aspergillus oryzae THIA Proteins 0.000 description 1
- 101710204694 Beta-xylosidase Proteins 0.000 description 1
- 102100035687 Bile salt-activated lipase Human genes 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 101150111062 C gene Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000196881 Castanopsis Species 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108090000746 Chymosin Proteins 0.000 description 1
- 102100039501 Chymotrypsinogen B Human genes 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 102100029057 Coagulation factor XIII A chain Human genes 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 108090000395 Cysteine Endopeptidases Proteins 0.000 description 1
- 102000003950 Cysteine Endopeptidases Human genes 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-YMDCURPLSA-N D-galactopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-YMDCURPLSA-N 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 108030001574 Deuterolysin Proteins 0.000 description 1
- 108010001682 Dextranase Proteins 0.000 description 1
- 108010012023 Dextrin dextranase Proteins 0.000 description 1
- 101001096557 Dickeya dadantii (strain 3937) Rhamnogalacturonate lyase Proteins 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010067722 Dipeptidyl Peptidase 4 Proteins 0.000 description 1
- 108700036010 EC 3.4.21.65 Proteins 0.000 description 1
- 108700033915 EC 3.4.23.22 Proteins 0.000 description 1
- 108700033917 EC 3.4.23.23 Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101150015836 ENO1 gene Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000228138 Emericella Species 0.000 description 1
- 101710147028 Endo-beta-1,4-galactanase Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000427940 Fusarium solani Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- 102000055441 Gastricsin Human genes 0.000 description 1
- 108090001072 Gastricsin Proteins 0.000 description 1
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 description 1
- 108010073324 Glutaminase Proteins 0.000 description 1
- 102000009127 Glutaminase Human genes 0.000 description 1
- 108030002455 Glutathione amide-dependent peroxidases Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101001095266 Homo sapiens Prolyl endopeptidase Proteins 0.000 description 1
- 101100398376 Hypocrea jecorina pki1 gene Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 1
- 102400000471 Isomaltase Human genes 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- 108010043135 L-methionine gamma-lyase Proteins 0.000 description 1
- 108010004098 Leucyl aminopeptidase Proteins 0.000 description 1
- 102100028524 Lysosomal protective protein Human genes 0.000 description 1
- 101100485303 Magnaporthe oryzae (strain 70-15 / ATCC MYA-4617 / FGSC 8958) XYR1 gene Proteins 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 108090000131 Metalloendopeptidases Proteins 0.000 description 1
- 102000003843 Metalloendopeptidases Human genes 0.000 description 1
- 102100023174 Methionine aminopeptidase 2 Human genes 0.000 description 1
- 108090000192 Methionyl aminopeptidases Proteins 0.000 description 1
- 102100032519 Mitochondrial ribonuclease P catalytic subunit Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- 108020002334 Monoacylglycerol lipase Proteins 0.000 description 1
- 101710203791 Mucorpepsin Proteins 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101100453819 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) kgd gene Proteins 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 101710126437 N-acetylmuramyl-L-alanine amidase Proteins 0.000 description 1
- 108030006755 N-acyl-aliphatic-L-amino acid amidohydrolases Proteins 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 101000728666 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) Putative rhamnogalacturonase Proteins 0.000 description 1
- 101100028920 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cfp gene Proteins 0.000 description 1
- 101100329389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cre-1 gene Proteins 0.000 description 1
- 108010026867 Oligo-1,6-Glucosidase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000736199 Paeonia Species 0.000 description 1
- 102100026367 Pancreatic alpha-amylase Human genes 0.000 description 1
- 102100033357 Pancreatic lipase-related protein 2 Human genes 0.000 description 1
- 108010029182 Pectin lyase Proteins 0.000 description 1
- 241000228129 Penicillium janthinellum Species 0.000 description 1
- 101000606732 Penicillium janthinellum Penicillopepsin-2 Proteins 0.000 description 1
- 102100038551 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidase Human genes 0.000 description 1
- 108030006253 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidases Proteins 0.000 description 1
- 108090000882 Peptidyl-Dipeptidase A Proteins 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 102100035200 Phospholipase A and acyltransferase 4 Human genes 0.000 description 1
- 108090000553 Phospholipase D Proteins 0.000 description 1
- 102000011420 Phospholipase D Human genes 0.000 description 1
- 108010058864 Phospholipases A2 Proteins 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 108700015930 Prolyl Oligopeptidases Proteins 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- 108030006244 Protein-glutamine glutaminases Proteins 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 101710148480 Putative beta-xylosidase Proteins 0.000 description 1
- 102100021702 Putative cytochrome P450 2D7 Human genes 0.000 description 1
- 101710126089 Putative inactive carbonic anhydrase 5B-like protein Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 101100172356 Schizosaccharomyces pombe (strain 972 / ATCC 24843) eno101 gene Proteins 0.000 description 1
- 101100172357 Schizosaccharomyces pombe (strain 972 / ATCC 24843) eno102 gene Proteins 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102000003667 Serine Endopeptidases Human genes 0.000 description 1
- 108090000083 Serine Endopeptidases Proteins 0.000 description 1
- 108090000899 Serralysin Proteins 0.000 description 1
- 101000706987 Serratia marcescens (strain ATCC 21074 / E-15) Serralysin Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 208000021386 Sjogren Syndrome Diseases 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- OUUQCZGPVNCOIJ-UHFFFAOYSA-M Superoxide Chemical compound [O-][O] OUUQCZGPVNCOIJ-UHFFFAOYSA-M 0.000 description 1
- 241001442052 Symphytum Species 0.000 description 1
- 101150074253 TEF1 gene Proteins 0.000 description 1
- 241001238980 Thermothelomyces Species 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- ISWQCIVKKSOKNN-UHFFFAOYSA-L Tiron Chemical compound [Na+].[Na+].OC1=CC(S([O-])(=O)=O)=CC(S([O-])(=O)=O)=C1O ISWQCIVKKSOKNN-UHFFFAOYSA-L 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- 241000024277 Trichoderma reesei QM6a Species 0.000 description 1
- 101710158370 Xylan 1,4-beta-xylosidase Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- ZNOZWUKQPJXOIG-XSBHQQIPSA-L [(2r,3s,4r,5r,6s)-6-[[(1r,3s,4r,5r,8s)-3,4-dihydroxy-2,6-dioxabicyclo[3.2.1]octan-8-yl]oxy]-4-[[(1r,3r,4r,5r,8s)-8-[(2s,3r,4r,5r,6r)-3,4-dihydroxy-6-(hydroxymethyl)-5-sulfonatooxyoxan-2-yl]oxy-4-hydroxy-2,6-dioxabicyclo[3.2.1]octan-3-yl]oxy]-5-hydroxy-2-( Chemical compound O[C@@H]1[C@@H](O)[C@@H](OS([O-])(=O)=O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H]2OC[C@H]1O[C@H](O[C@H]1[C@H]([C@@H](CO)O[C@@H](O[C@@H]3[C@@H]4OC[C@H]3O[C@H](O)[C@@H]4O)[C@@H]1O)OS([O-])(=O)=O)[C@@H]2O ZNOZWUKQPJXOIG-XSBHQQIPSA-L 0.000 description 1
- UGXQOOQUZRUVSS-ZZXKWVIFSA-N [5-[3,5-dihydroxy-2-(1,3,4-trihydroxy-5-oxopentan-2-yl)oxyoxan-4-yl]oxy-3,4-dihydroxyoxolan-2-yl]methyl (e)-3-(4-hydroxyphenyl)prop-2-enoate Chemical compound OC1C(OC(CO)C(O)C(O)C=O)OCC(O)C1OC1C(O)C(O)C(COC(=O)\C=C\C=2C=CC(O)=CC=2)O1 UGXQOOQUZRUVSS-ZZXKWVIFSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 101150054399 ace2 gene Proteins 0.000 description 1
- 108010048241 acetamidase Proteins 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 238000010564 aerobic fermentation Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 150000001323 aldoses Chemical class 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 108010012864 alpha-Mannosidase Proteins 0.000 description 1
- 102000019199 alpha-Mannosidase Human genes 0.000 description 1
- 108010061261 alpha-glucuronidase Proteins 0.000 description 1
- ULSIYEODSMZIPX-UHFFFAOYSA-N alpha-hydroxyphenethylamine Natural products NCC(O)C1=CC=CC=C1 ULSIYEODSMZIPX-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 108010048202 alternansucrase Proteins 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000019312 arabinogalactan Nutrition 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- 229920000617 arabinoxylan Polymers 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- FIVPIPIDMRVLAY-UHFFFAOYSA-N aspergillin Natural products C1C2=CC=CC(O)C2N2C1(SS1)C(=O)N(C)C1(CO)C2=O FIVPIPIDMRVLAY-UHFFFAOYSA-N 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 108010083912 bleomycin N-acetyltransferase Proteins 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 230000005587 bubbling Effects 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 230000035425 carbon utilization Effects 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000006727 cell loss Effects 0.000 description 1
- 230000008618 cell wall macromolecule catabolic process Effects 0.000 description 1
- 230000010001 cellular homeostasis Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000035605 chemotaxis Effects 0.000 description 1
- 108010089807 chitosanase Proteins 0.000 description 1
- 108010025790 chlorophyllase Proteins 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 229960002976 chymopapain Drugs 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009990 desizing Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- MUCZHBLJLSDCSD-UHFFFAOYSA-N diisopropyl fluorophosphate Chemical compound CC(C)OP(F)(=O)OC(C)C MUCZHBLJLSDCSD-UHFFFAOYSA-N 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 229960001760 dimethyl sulfoxide Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 108010091371 endoglucanase 1 Proteins 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092450 endoglucanase Z Proteins 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 108010038658 exo-1,4-beta-D-xylosidase Proteins 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 235000019836 ficin Nutrition 0.000 description 1
- POTUGHMKJGOKRI-UHFFFAOYSA-N ficin Chemical compound FI=CI=N POTUGHMKJGOKRI-UHFFFAOYSA-N 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 229960005051 fluostigmine Drugs 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- NGGMYCMLYOUNGM-CSDLUJIJSA-N fumagillin Chemical compound C([C@H]([C@H]([C@@H]1[C@]2(C)[C@H](O2)CC=C(C)C)OC)OC(=O)\C=C\C=C\C=C\C=C\C(O)=O)C[C@@]21CO2 NGGMYCMLYOUNGM-CSDLUJIJSA-N 0.000 description 1
- 229960000936 fumagillin Drugs 0.000 description 1
- 210000000167 fungal chromosome Anatomy 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- FIVPIPIDMRVLAY-RBJBARPLSA-N gliotoxin Chemical compound C1C2=CC=C[C@H](O)[C@H]2N2[C@]1(SS1)C(=O)N(C)[C@@]1(CO)C2=O FIVPIPIDMRVLAY-RBJBARPLSA-N 0.000 description 1
- 229930182480 glucuronide Natural products 0.000 description 1
- 150000008134 glucuronides Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229940059442 hemicellulase Drugs 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 235000012907 honey Nutrition 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 229940066716 pepsin a Drugs 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 229950006768 phenylethanolamine Drugs 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 235000002949 phytic acid Nutrition 0.000 description 1
- 239000000467 phytic acid Substances 0.000 description 1
- 229940068041 phytic acid Drugs 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 229960002816 potassium chloride Drugs 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010066823 proline dipeptidase Proteins 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000000011 protein activity measurement Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- 101150089778 pyr-4 gene Proteins 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000011218 seed culture Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 102000023888 sequence-specific DNA binding proteins Human genes 0.000 description 1
- 108091008420 sequence-specific DNA binding proteins Proteins 0.000 description 1
- 108010059841 serine carboxypeptidase Proteins 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 230000004991 spatiotemporal regulation Effects 0.000 description 1
- 229940063673 spermidine Drugs 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 108090000135 streptogrisin A Proteins 0.000 description 1
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 101150111745 sucA gene Proteins 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 108060007951 sulfatase Proteins 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- VKFFEYLSKIYTSJ-UHFFFAOYSA-N tetraazanium;phosphonato phosphate Chemical compound [NH4+].[NH4+].[NH4+].[NH4+].[O-]P([O-])(=O)OP([O-])([O-])=O VKFFEYLSKIYTSJ-UHFFFAOYSA-N 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- NGSWKAQJJWESNS-ZZXKWVIFSA-N trans-4-coumaric acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000013060 ultrafiltration and diafiltration Methods 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 238000003828 vacuum filtration Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N3/00—Spore forming or isolating processes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/885—Trichoderma
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本公开总体上涉及用于商业规模生产目的蛋白(多肽)的重组真菌细胞(菌株)。因此,某些实施例涉及重组真菌细胞(菌株),这些重组真菌细胞(菌株)产生目的蛋白并且过表达编码本公开的调节蛋白的一种或多种基因。
Description
技术领域
本公开总体上涉及分子生物学、生物化学、调节蛋白、工业发酵、蛋白质产生、丝状真菌等领域。本公开的某些实施例涉及经修饰的(突变型)丝状真菌细胞以及其用于增强目的蛋白产生的方法。
相关申请的交叉引用
本申请要求于2021年7月19日提交的美国临时专利申请号63/223,277的权益,将其通过引用以其全文并入本文。
序列表的引用
与本文一起提交的序列表文本文件含有于2022年6月27日创建的文件“NB41848-WO-PCT_SequenceListing.txt”,该文件的大小为404千字节(KB)。本序列表符合37C.F.R.§1.52(e),并通过引用以其全文并入本文。
背景技术
许多生物聚合物降解水解酶(例如纤维素酶、半纤维素酶、木质酶、果胶酶等)因其在食品、饲料、纺织、纸浆和纸张工业等中的潜在应用而受到关注。例如,工业丝状真菌生产菌株,特别地曲霉属(Aspergillus)和木霉属(Trichoderma)菌株,可以产生大量的这些胞外酶。同样,高分泌菌株和强启动子(例如纤维素酶(基因)启动子)的存在使得丝状真菌细胞特别适合于异源蛋白产生。
因此,丝状真菌能够表达高水平的天然和异源蛋白,从而使其非常适用于大规模生产用于工业、制药、动物健康以及食品和饮料应用等的酶和其他蛋白质。尽管本领域目前有与丝状真菌菌株相关的知识,但本领域对于用于生产目的蛋白的改善的菌株存在持续不断的需求。如下文所述,本公开的重组丝状真菌细胞(菌株)非常适合用于工业规模发酵工艺,以增强内源和/或异源目的蛋白的表达/产生。
发明内容
如本文总体上阐述,本公开的某些实施例涉及能够产生增加量的目的蛋白的重组真菌细胞。更特别地,如下文描述和示例说明的,申请人设计/构建了过表达本公开的一种或多种调节蛋白的示例性里氏木霉(T.reesei)报告菌株及其经修饰的(重组)菌株。在本实例中,构建报告菌株以表达/产生两(2)种目的蛋白(即,报告蛋白;例如,植酸酶和淀粉酶)。
因此,本公开的某些实施例尤其提供重组真菌细胞,其过表达与表1中所示的里氏木霉(Trichoderma reesei)蛋白质包含至少80%同一性的一种或多种蛋白质,和/或过表达与表6中所示的蛋白质直系同源物包含至少80%同一性的一种或多种蛋白质。因此,在某些实施例中,本公开的重组真菌细胞过表达至少两种蛋白质、至少三种蛋白质等的组合,这些蛋白质与表1中所示的里氏木霉基因序列包含至少80%同一性、和/或与表6中所示的直系同源基因序列包含至少80%同一性。
本公开的某些其他方面涉及编码这样的调节蛋白的重组多核苷酸,而其他方面涉及编码目的蛋白的重组多核苷酸。在其他相关的实施例中,本公开提供重组真菌细胞,其包含编码一种或多种调节蛋白和/或一种或多种目的蛋白的引入的多核苷酸。例如,在某些实施例中,本公开的重组真菌细胞产生目的蛋白,例如酶、抗体、受体蛋白、动物饲料蛋白、人类食品蛋白等。
在某些其他实施例中,申请人描述了用于在本公开的一种或多种重组细胞中产生增加量的目的蛋白的方法。例如,某些方面涉及用于构建表达/产生一种或多种目的蛋白的重组真菌细胞的方法。在这些方法的某些实施例中,表达/产生目的蛋白(POI)的重组真菌细胞包含编码本公开的一种或多种调节蛋白的一种或多种引入的多核苷酸(例如,表达盒)。
附图说明
图1示出了pBKT030的载体图。
图2示出了在过表达单一调节蛋白(图2;SEQ ID NO:30、65、68或101)的经修饰的菌株的小规模(2L)发酵过程中产生的淀粉酶报告蛋白的量。更特别地,将亲本菌株(图2;对照)在整个发酵过程中产生的报告蛋白的量设定为1,并绘制每个菌株在每个时间点产生的蛋白质的相对量。
图3示出了过表达两种调节因子的经修饰的菌株在小规模(2L)发酵过程中产生的报告蛋白的量。更特别地,将亲本菌株(图3;对照)在整个发酵过程中产生的蛋白质的量设定为1,并绘制每个菌株在每个时间点产生的蛋白质的相对量。
图4示出了过表达调节蛋白SEQ ID NO:68的经修饰的菌株(底部板)和不过表达任何调节蛋白的对照菌株(顶部板)的孢子形成水平。
生物序列说明
SEQ ID NO:1是编码SEQ ID NO:2的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:2是由SEQ ID NO:1编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:3是SEQ ID NO:2的调节蛋白中存在的DNA结合结构域(DBD)的预测的氨基酸序列。
SEQ ID NO:4是编码SEQ ID NO:5的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:5是由SEQ ID NO:4编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:6是SEQ ID NO:5的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:7是编码SEQ ID NO:8的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:8是由SEQ ID NO:7编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:9是SEQ ID NO:8的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:10是编码SEQ ID NO:11的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:11是由SEQ ID NO:10编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:12是编码SEQ ID NO:13的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:13是由SEQ ID NO:12编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:14是SEQ ID NO:13的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:15是编码SEQ ID NO:16的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:16是由SEQ ID NO:15编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:17是SEQ ID NO:16的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:18是编码SEQ ID NO:19的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:19是由SEQ ID NO:18编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:20是SEQ ID NO:19的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:21是编码SEQ ID NO:22的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:22是由SEQ ID NO:21编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:23是编码SEQ ID NO:24的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:24是由SEQ ID NO:23编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:25是编码SEQ ID NO:26的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:26是由SEQ ID NO:25编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:27是SEQ ID NO:26的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:28是编码SEQ ID NO:29的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:29是由SEQ ID NO:28编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:30是编码SEQ ID NO:31的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:31是由SEQ ID NO:30编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:32是SEQ ID NO:31的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:33是编码SEQ ID NO:34的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:34是由SEQ ID NO:33编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:35是SEQ ID NO:34的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:36是编码SEQ ID NO:37的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:37是由SEQ ID NO:36编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:38是SEQ ID NO:37的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:39是编码SEQ ID NO:40的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:40是由SEQ ID NO:39编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:41是SEQ ID NO:40的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:42是编码SEQ ID NO:43的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:43是由SEQ ID NO:42编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:44是SEQ ID NO:43的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:45是编码SEQ ID NO:46的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:46是由SEQ ID NO:45编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:47是SEQ ID NO:46的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:48是编码SEQ ID NO:49的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:49是由SEQ ID NO:48编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:50是SEQ ID NO:49的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:51是编码SEQ ID NO:52的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:52是由SEQ ID NO:51编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:53是SEQ ID NO:52的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:54是编码SEQ ID NO:55的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:55是由SEQ ID NO:54编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:56是编码SEQ ID NO:57的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:57是由SEQ ID NO:56编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:58是SEQ ID NO:57的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:59是编码SEQ ID NO:60的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:60是由SEQ ID NO:59编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:61是SEQ ID NO:60的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:62是编码SEQ ID NO:63的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:63是由SEQ ID NO:62编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:64是SEQ ID NO:63的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:65是编码SEQ ID NO:66的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:66是由SEQ ID NO:65编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:67是SEQ ID NO:66的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:68是编码SEQ ID NO:69的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:69是由SEQ ID NO:68编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:70是SEQ ID NO:69的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:71是编码SEQ ID NO:72的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:72是由SEQ ID NO:71编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:73是SEQ ID NO:72的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:74是编码SEQ ID NO:75的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:75是由SEQ ID NO:74编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:76是SEQ ID NO:75的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:77是编码SEQ ID NO:78的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:78是由SEQ ID NO:79编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:79是编码SEQ ID NO:80的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:80是由SEQ ID NO:79编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:81是SEQ ID NO:80的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:82是编码SEQ ID NO:83的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:83是由SEQ ID NO:82编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:84是编码SEQ ID NO:85的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:85是由SEQ ID NO:84编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:86是SEQ ID NO:85的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:87是编码SEQ ID NO:88的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:88是由SEQ ID NO:87编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:89是SEQ ID NO:88的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:90是编码SEQ ID NO:91的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:91是由SEQ ID NO:90编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:92是SEQ ID NO:91的调节蛋白中存在的第一DBD的预测的氨基酸序列。
SEQ ID NO:93是SEQ ID NO:91的调节蛋白中存在的第二DBD的预测的氨基酸序列。
SEQ ID NO:94是编码SEQ ID NO:95的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:95是由SEQ ID NO:94编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:96是SEQ ID NO:95的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:97是编码SEQ ID NO:98的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:98是由SEQ ID NO:97编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:99是编码SEQ ID NO:100的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:100是由SEQ ID NO:99编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:101是编码SEQ ID NO:102的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:102是由SEQ ID NO:101编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:103是SEQ ID NO:102的调节蛋白中存在的第一DBD的预测的氨基酸序列。
SEQ ID NO:104是SEQ ID NO:102的调节蛋白中存在的第二DBD的预测的氨基酸序列。
SEQ ID NO:105是编码SEQ ID NO:106的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:106是由SEQ ID NO:105编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:107是SEQ ID NO:106的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:108是编码SEQ ID NO:109的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:109是由SEQ ID NO:108编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:110是编码SEQ ID NO:111的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:111是由SEQ ID NO:110编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:112是SEQ ID NO:101的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:113是编码SEQ ID NO:114的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:114是由SEQ ID NO:113编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:115是SEQ ID NO:114的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:116是编码SEQ ID NO:117的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:117是由SEQ ID NO:116编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:118是SEQ ID NO:117的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:119是编码SEQ ID NO:120的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:120是由SEQ ID NO:119编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:121是SEQ ID NO:120的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:122是编码SEQ ID NO:123的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:123是由SEQ ID NO:122编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:124是SEQ ID NO:123的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:125是编码SEQ ID NO:126的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:126是由SEQ ID NO:125编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:127是SEQ ID NO:126的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:128是编码SEQ ID NO:129的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:129是由SEQ ID NO:128编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:130是SEQ ID NO:129的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:131是编码SEQ ID NO:132的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:132是由SEQ ID NO:131编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:133是SEQ ID NO:132的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:134是编码SEQ ID NO:135的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:135是由SEQ ID NO:134编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:136是SEQ ID NO:135的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:137是编码SEQ ID NO:138的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:138是由SEQ ID NO:137编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:139是SEQ ID NO:138的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:140是编码SEQ ID NO:141的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:141是由SEQ ID NO:140编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:142是SEQ ID NO:141的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:143是SEQ ID NO:141的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:144是编码SEQ ID NO:145的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:145是由SEQ ID NO:144编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:146是SEQ ID NO:145的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:147是编码SEQ ID NO:148的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:148是由SEQ ID NO:147编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:149是编码SEQ ID NO:150的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:150是由SEQ ID NO:149编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:151是SEQ ID NO:150的调节蛋白中存在的DBD的预测的氨基酸序列。
SEQ ID NO:152是编码SEQ ID NO:153的调节蛋白的里氏木霉DNA序列。
SEQ ID NO:153是由SEQ ID NO:152编码的调节蛋白的预测的氨基酸序列。
SEQ ID NO:154是SEQ ID NO:153的调节蛋白中存在的DBD的预测的氨基酸序列。
具体实施方式
I.概述
如本文所述,某些实施例涉及用于商业规模生产蛋白质(多肽)的重组(经遗传修饰的)丝状真菌细胞(菌株)。例如,某些实施例涉及重组丝状真菌细胞,其过表达与SEQ IDNO:1、4、7、10、12、15、18、21、23、25、28、30、33、36、39、42、45、48、51、54、56、59、62、65、68、71、74、77、79、82、84、87、90、94、97、99、101、105、108、110、113、116、119、122、125、128、131、134、137、140、144、147、149和/或152的里氏木霉基因包含至少80%同一性的调节基因,或过表达与表6中所示的直系同源基因序列包含至少80%同一性的调节基因。
某些其他实施例涉及重组丝状真菌细胞,其过表达与表4和/或表5中所示的里氏木霉调节基因序列组合包含至少80%同一性的至少两种调节基因的组合。因此,某些其他实施例涉及重组丝状真菌细胞,其产生目的蛋白并且过表达与SEQ ID NO:1、4、7、10、12、15、18、21、23、25、28、30、33、36、39、42、45、48、51、54、56、59、62、65、68、71、74、77、79、82、84、87、90、94、97、99、101、105、108、110、113、116、119、122、125、128、131、134、137、140、144、147、149和/或152的里氏木霉调节基因包含至少80%同一性的调节基因,或过表达与表6中所示的直系同源基因序列包含至少80%同一性的调节基因。某些其他方面涉及多核苷酸(例如,表达盒),其包含与编码本公开的调节蛋白的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列。
在相关的实施例中,本公开的重组丝状真菌细胞包含编码一种或多种目的蛋白的一种或多种表达盒。例如,某些方面涉及编码目的蛋白的表达盒,其中该盒包含与编码目的蛋白的下游(3′)核酸序列可操作地连接的上游(5′)启动子。因此,某些其他实施例涉及用于在丝状真菌宿主细胞中产生增加量的异源目的蛋白(POI)的方法。
II.定义
在进一步详细地描述本发明的菌株、组合物和方法之前,定义了以下术语和短语。未定义的术语应当符合本领域技术人员已知和使用的常规含义。
在本说明书中引用的所有出版物以及专利都通过引用并入本文。
在提供了一系列值的情况下,应理解每个中间值为到下限的十分之一单位(除非上下文清晰地另外指示),该范围的上限与下限之间以及在该陈述范围内的任何其他陈述的或中间值均被涵盖在本发明的组合物和方法之内。这些较小范围的上限和下限可以被独立地包括在较小的范围内,并且也被涵盖在本发明的组合物和方法之内,服从所陈述范围中任何特别排除的限值。在所陈述的范围包括一个或者全部两个限值的情况下,排除那些包括的限值的任一个或者全部两个的范围也包括在本发明的组合物和方法中。
本文提供了某些范围,其中数值前面是术语“约”。术语“约”在本文中用于为其后面的确切数字以及与该术语后面的数字接近或近似的数字提供文字支持。在确定数字是否接近或近似于特别叙述的数字时,接近或近似的未列举的数字可以是在呈现其的上下文中提供特别叙述的数字的实质性等值的数字。例如,关于数值,术语“约”是指数值的-10%至+10%的范围,除非术语在上下文中另有特别定义。在另一个实例中,短语“约6的pH值”是指pH值为从5.4至6.6,除非pH值另有特别定义。
本文提供的标题并非对本发明的组合物和方法的各个方面或实施例进行限制,这些方面或实施例可通过将说明书作为一个整体来参考而得到。因此,把本说明书作为一个整体参考时,以下即将定义的术语得以更全面地定义。
根据此具体实施方式,以下缩写和定义适用。应当注意单数形式“一个/一种(a/an)”和“该/所述(the)”包括复数个指示物,除非上下文中另有清楚地指示。因此,例如,提及“酶”包括多种这样的酶,并且提及“剂量”包括提及本领域技术人员已知的一次或多次剂量及其等效物等。
应进一步注意,可以撰写权利要求书以排除任何任选的要素。因此,此陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“排除”、“不包括”等或使用“否定型”限定或“条件”的前提基础。例如,在某些实施例中,条件“其中培养基不包含诱导底物”可用于排除诱导底物,例如纤维素、乳糖、龙胆二糖、槐糖等。
应进一步注意,如本文所用,术语“包含”意指“包括但不限于”在术语“包含”之后的一种或多种组分。在术语“包含”之后的组分是必需的或强制性的,但是包含一种或多种组分的组合物还可以包括其他非强制性或任选的一种或多种组分。
还要注意的是,如本文所用,术语“由……组成”意指包括且限于术语“由……组成”之后的一种或多种组分。因此,术语“由……组成”之后的一种或多种组分是必需的或强制性的,且组合物中不存在一种或多种其他组分。
在阅读本公开后,如将对于本领域技术人员显而易见的,本文描述和说明的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与其他几个实施例中的任一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可能的任何其他顺序来进行任何叙述的方法。
如本文所用,术语“子囊菌(Ascomycete)真菌细胞”是指真菌界中的子囊菌门(Ascomycota)中的任何生物。子囊菌真菌细胞的实例包括但不限于盘菌亚门(Pezizomycotina)的丝状真菌,诸如木霉属物种、曲霉属物种、毁丝霉属(Myceliophthora)物种、青霉属(Penicillium)物种等。
如本文所用,术语“丝状真菌”是指真菌亚门和卵菌亚门的所有丝状形式。例如,丝状真菌包括但不限于枝顶孢属(Acremonium)、曲霉属、翘孢霉属(Emericella)、镰刀菌属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属、脉孢菌属(Neurospora)、青霉属、柱霉属(Scytalidium)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)和木霉属物种。
在某些实施例中,丝状真菌是木霉属物种细胞(菌株),其包括但不限于哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉和绿色木霉(Trichoderma viride)。如本领域技术人员已知的,里氏木霉先前被分类为“红褐肉座菌(Hypocrea jecorina)”。
在其他实施例中,丝状真菌是曲霉属物种细胞(菌株),例如棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、棒曲霉(Aspergillusclavatus)、黄曲霉(Aspergillus flavus)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)和土曲霉(Aspergillus terreus)。
如本文所用,术语“野生型”和“天然的”可以互换使用,并是指天然发现的基因、蛋白质、真菌细胞或菌株。
如本文所用,术语“重组”或“非天然”是指具有至少一个工程化遗传改变或已通过引入异源核酸分子而修饰的生物、微生物、细胞、核酸分子或载体,或者是指已经被改变使得可以控制异源或内源核酸分子或基因的表达的细胞(例如,微生物细胞)。重组还指衍生自非天然细胞的细胞,或者是具有一个或多个这样的修饰的非天然细胞的后代。遗传改变包括例如引入编码蛋白质的可表达核酸分子的修饰,或细胞遗传物质的其他核酸分子添加、缺失、取代或其他功能性改变。例如,重组细胞可以表达未在天然(野生型)细胞内发现的相同或同源形式的基因或其他核酸分子,或者可以提供改变的内源基因表达模式,如过表达、低表达、最低表达或根本不表达。
“重组(recombination、recombining)”或产生“重组的(recombined)”核酸通常是两个或更多个核酸片段的组装,其中该组装产生嵌合基因。
如本文所用,术语“基因”与术语“等位基因”同义,是指编码和指导蛋白质或RNA表达的核酸。丝状真菌的营养体形式通常是单倍体,因此指定基因的单拷贝(即单个等位基因)足以赋予指定表型。
如本文所用,术语“基因”意指涉及产生多肽(蛋白质)链的DNA的区段,该区段可以包括或可以不包括编码区之前和之后的区域(例如,5′非翻译区(5′UTR)或“前导”序列、3'UTR或“尾部”序列、启动子序列、终止子序列等),以及个体编码区段(外显子)之间的插入序列(内含子)。例如,目的基因(DNA)序列(GOI)可以编码调节蛋白、结构蛋白、商业上重要的工业蛋白或肽(例如酶(例如,蛋白酶、甘露聚糖酶、木聚糖酶、淀粉酶、葡糖淀粉酶、纤维素酶、氧化酶、植酸酶、脂肪酶))等。目的基因可以是天然存在的基因、突变(经修饰的)基因或合成基因。
如本文所用,术语“启动子”是指用于引导下游基因或其可读框(ORF)转录的核酸序列。通常启动子将适合于正在表达靶基因的宿主细胞(例如,丝状真菌细胞)。启动子与其他转录和翻译调节核酸序列(也称为“控制序列”)一起是表达给定的基因所必须的。一般而言,转录和翻译调节序列包括但不限于启动子和终止子序列,包括核心启动子和增强子或激活子或抑制子序列、转录和翻译起始和终止序列。在某些实施例中,启动子是诱导型启动子或组成型启动子。在某些实施例中,诱导型启动子是诱导型纤维素酶基因启动子。
如本文所用,术语“启动子活性”是核酸在宿主细胞中指导下游(3′)多核苷酸转录的能力。为了测试启动子活性,(启动子)核酸可以可操作地连接到下游多核苷酸以产生重组核酸。可以将重组核酸引入细胞中,并且可以评估多核苷酸的转录。在某些情况下,多核苷酸可以编码蛋白质,并且可以通过评估细胞中蛋白质的产生来评估多核苷酸的转录。
如本文所用,术语“可操作地连接”是指两个或更多个核酸序列之间的功能性连接。因此,当核酸序列置于与另一个核酸序列的功能关系时,该核酸序列与另一个核酸序列“可操作地连接”。例如,如果启动子序列或终止子序列影响编码序列的转录,则该启动子序列或终止子序列可操作地连接到编码序列;如果核糖体结合位点被定位以促进翻译,则该核糖体结合位点可操作地连接到编码序列;如果编码分泌性前导序列(即,信号肽)的核酸序列表达为参与多肽分泌的前蛋白,则该编码分泌性前导序列(即,信号肽)的核酸序列可操作地连接到编码多肽的核酸序列(例如,ORF)。通常,“可操作地连接”意指被连接的DNA(核酸)序列是连续的,并且在分泌性前导序列的情况下,是连续的并且处于阅读相中。然而,增强子不必是连续的。连接两个或更多个核酸序列(即,可操作地连接)是使用本领域技术人员的任何方法来完成的。
如本文所用,示例性亲本里氏木霉菌株包括但不限于里氏木霉菌株QM6a(13631)、里氏木霉菌株RL-P37(NRRL保藏号15709)和里氏木霉菌株RUT-C30(56765);示例性亲本黑曲霉菌株包括但不限于黑曲霉菌株1015;示例性亲本米曲霉菌株包括但不限于米曲霉菌株RIB40(42149);并且示例性亲本嗜热毁丝霉菌(Myceliophthora thermophila)菌株包括但不限于嗜热毁丝霉菌菌株42464。
例如,木霉属菌株Rut-C30和RL-P37是木霉菌天然分离物QM6a的诱变衍生物(LeCrom等人,2009;Sheir-Neiss和Montenecourt,1984),其中菌株NG14是最后的共同母菌株。在本公开的某些方面,示例性丝状真菌菌株衍生自/获得自里氏木霉菌株RL-P37并且包含里氏木霉pyr2基因(下文简称为“Δpyr2”)的缺失,如Sheir-Neiss和Montenecourt(1984)以及PCT公开号WO 2011/153449通常描述的。
如本文所用,短语“木质纤维素降解酶”、“纤维素酶(cellulase enzyme)”、和“纤维素酶(cellulase)”可互换使用,并且包括糖苷水解酶(GH),例如纤维二糖水解酶、木聚糖酶、内切葡聚糖酶、和β-葡糖苷酶,这些酶水解纤维素(半纤维素)的糖苷键以产生糖(例如,葡萄糖、木糖、阿拉伯糖等)。
如本文所用,“内切葡聚糖酶”蛋白可以缩写为“EG”,“纤维二糖水解酶”蛋白可以缩写为“CBH”,“β-葡糖苷酶”蛋白可以缩写为“BG”,并且“木聚糖酶”蛋白可以缩写为“XYL”。因此,如本文所用,编码EG蛋白的基因(或ORF)可以缩写为“eg”,编码CBH蛋白的基因(或ORF)可以缩写为“cbh”,编码BG蛋白的基因(或ORF)可以缩写为“bg”,并且编码XYL蛋白的基因(或ORF)可以缩写为“xyl”。在某些实施例中,纤维二糖水解酶包括归类于酶委员会编号(EC 3.2.1.91)的酶,内切葡聚糖酶包括归类于EC 3.2.1.4的酶,内切-β-1,4-木聚糖酶包括归类于EC 3.2.1.8的酶、β-木糖苷酶包括归类于EC 3.2.1.37的酶,并且β-葡糖苷酶包括归类于EC 3.2.1.21的酶。
如本文所用,“纤维素酶基因启动子”包括但不限于纤维二糖水解酶(cbh)基因启动子序列、内切葡聚糖酶(eg)基因启动子序列、β-葡糖苷酶(bg)基因启动子序列、木聚糖酶(xyl)基因启动子序列等。
如本文所用,术语“修饰”和“遗传修饰”可以互换使用,并且包括:(a)引入、取代或去除基因中的一个或多个核苷酸,或者引入、取代或去除基因的转录或翻译所需的调节元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调和/或上调,(f)本文公开的任何一个或多个基因/DNA序列的特异性诱变和/或(g)随机诱变。
如本文所用,短语“一种或多种经修饰的丝状真菌细胞”、“一种或多种突变型丝状真菌细胞”、“一种或多种重组真菌细胞”、“一种或多种经修饰的丝状真菌菌株”等可互换使用并且是指衍生自(即,获得自)属于盘菌亚门的亲本丝状真菌细胞的丝状真菌细胞。例如,“经修饰的”丝状真菌细胞可以衍生自(获得自)亲本丝状真菌细胞,其中该经修饰的细胞包含在亲本细胞中未发现的至少一个遗传修饰。
如本文所用,示例性植酸酶(报告子)蛋白是描述于PCT公开号WO 2008097619A2(通过引用以其全文并入本文)的工程化布丘氏菌属(Buttiauxella)物种植酸酶蛋白,并且示例性淀粉酶(报告子)蛋白是来自土曲霉(NCBI登录号XP_001209405)的α-淀粉酶蛋白。
如本文所用,术语“淀粉酶”是指尤其能够催化淀粉的降解的糖苷水解酶(酶)。这样的淀粉酶包括但不限于内切作用的α-淀粉酶(EC 3.2.1.1;α-D-(l→4)-葡聚糖葡聚糖水解酶)、外切作用的β-淀粉酶(EC 3.2.1.2;α-D-(l→4)-葡聚糖麦芽糖水解酶)和产物特异性淀粉酶,如生麦芽糖α-淀粉酶(EC 3.2.1.133)、α-葡糖苷酶(EC 3.2.1.20;α-D-葡萄糖苷葡糖水解酶)、葡糖淀粉酶(EC 3.2.1.3;α-D-(l→4)-葡聚糖葡糖水解酶)、麦芽四糖苷酶(EC 3.2.1.60)、麦芽六糖苷酶(EC 3.2.1.98)等。
如本领域技术人员通常理解的,这样的淀粉酶特别适合用于淀粉液化和糖化、清洁淀粉污渍、纺织品退浆、烘焙、酿造等。
如本文所用,术语“植酸酶”是指尤其能够催化植酸水解并释放无机磷的酶。如本领域技术人员通常理解的,植酸酶特别适合用于动物饲料等。
如本文所用,“功能性基因”是能够被细胞组分用于产生活性基因产物(典型地蛋白质)的基因。相比之下,“非功能性基因”不能被细胞组分用于产生活性基因产物(即功能性蛋白),或者具有降低的被细胞组分用于产生活性基因产物(即功能性蛋白)的能力。
如本文所用,“功能性蛋白”是具有功能或活性(例如酶功能/活性、结合功能/活性(例如,DNA结合)、表面活性特性等)的蛋白质,并且其未被诱变、截短或以其他方式修饰以消除或降低该功能/活性。
如本文所用,“调节基因”是其功能对真菌宿主产生蛋白质有影响的基因。在本公开的某些方面,调节基因(编码调节蛋白)的过表达对丝状真菌(宿主)细胞的蛋白质产生有影响。“调节基因”编码“调节蛋白”。
如本文所用,“调节蛋白”包括但不限于转录因子蛋白、蛋白激酶、参与组蛋白修饰或染色质重塑的蛋白质、以及其他“基因转录调节蛋白”。
更特别地,如本文所用,术语“一种或多种调节基因”“一种或多种调节蛋白”和/或其他“基因转录调节蛋白”并不旨在是限制性的,而是在本文中用于帮助分类、表征和/或鉴定本公开的示例性基因和/或蛋白质。因此,如下文第III节、随后的实例(以及其中的表1-表6)中进一步所指定,DNA序列(例如,表1)和/或蛋白质序列在本文中被特别称为调节基因和/或蛋白质,而不考虑整体蛋白质功能。例如,表1-表6中所阐述的调节蛋白可以包括参与一种或多种代谢途径活动(例如,如以缓解途径瓶颈)等的蛋白质(例如,酶)等,其中这样的蛋白质(酶)在本文中可被称为调节蛋白,而不考虑整体蛋白质功能。
如下文进一步详述和描述的,本公开的某些方面涉及编码调节蛋白的某些调节基因的过表达。如本文所用,编码调节蛋白的基因的“过表达”(缩写为“OE”)可以例如通过以下来进行:将编码调节蛋白(例如,参见实例1;表1)的特定基因的另外的拷贝(或多个拷贝)引入真菌宿主;或者通过在异源启动子的控制下表达编码调节蛋白的基因,从而导致基因表达增加;或者以其他方式对真菌宿主进行遗传修饰,使得基因大量表达或基因产物的活性增加。编码调节蛋白的基因的过表达影响可以通过在适合于蛋白质产生的条件下培养经修饰的宿主来研究。对内源蛋白或异源蛋白的产生的影响可以通过以下来研究:确定例如酶比活性、确定总蛋白的量或确定所产生的特定内源或异源蛋白的量。
如本文所用,“基因的破坏”、“基因破坏”、“基因的灭活”和“基因灭活”可互换使用,并且广泛地是指基本上防止宿主细胞产生功能性基因产物(例如,功能性蛋白)的任何遗传修饰。基因破坏的示例性方法包括基因的任何部分的完全或部分(包括多肽编码序列、启动子、增强子或另外的调节元件)缺失、或其诱变,其中诱变涵盖取代、插入、缺失、倒位、及其任何组合和变化,该诱变破坏/灭活一个或多个靶基因并基本上减少或阻止功能性基因产物(即功能性蛋白)的、产生。
如本文所用,“基因缺失”是指该基因从宿主细胞的基因组中去除。当基因包括与基因编码序列不紧邻的控制元件(例如,增强子元件)时,基因缺失是指编码序列、以及任选地相邻增强子元件(例如,包括但不限于启动子和/或终止子序列)的缺失。
如本文所用,“异源基因”是指具有以下序列的至少一部分的多核苷酸(DNA)序列,该序列对于其被引入和/或表达的细胞不是天然的或以天然形式存在的。
如本文所用,“异源核酸构建体”或“异源DNA序列”具有以下序列的一部分,该序列对于其表达的细胞不是天然的或以天然形式存在的。
如本文所用,“异源蛋白”由异源基因、异源核酸(多核苷酸)序列、异源DNA序列等编码。
因此,在某些实施例中,将编码目的蛋白(POI)的异源基因、异源核酸构建体、异源DNA序列等引入(例如,转化)丝状真菌细胞(菌株)中。例如,在进行本文所述的其他遗传修饰之前、期间或之后,可以将编码POI的异源基因构建体引入丝状真菌细胞(菌株)中。
关于控制序列,异源是指在自然界中不起调节与其目前正在调节的基因的表达相同的基因的功能的控制序列(例如,启动子、增强子、终止子)。通常,异源的核酸序列对于它们存在的细胞或部分基因组不是内源的,并且已经通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源”核酸构建体可以含有与天然细胞中发现的控制序列/DNA编码序列组合相同或不同的控制序列/DNA编码序列组合。
如本文所用,术语“编码序列”是指直接指定其(所编码的)蛋白质产物的氨基酸序列的多核苷酸序列。编码序列的边界一般由通常以起始密码子(ATG)开始的可读框(ORF)确定。编码序列典型地包括DNA、cDNA和重组核苷酸序列。例如,ORF通常是指包含不间断阅读框的多核苷酸序列(无论是天然存在的、非天然存在的、或合成的),该不间断阅读框由以下组成:(i)起始密码子,(ii)表示已编码的蛋白质产物的氨基酸的一系列密码子,和(iii)终止密码子,该ORF以5′至3′方向阅读(或翻译)。
如本文所用,术语“DNA构建体”或“表达构建体”是指核酸序列,其包含至少两种DNA多核苷酸片段。DNA或表达构建体可以用于将核酸序列引入真菌宿主细胞中。可以体外(例如,通过PCR)或通过任何其他合适的技术产生DNA。在一些优选的实施例中,DNA构建体包含目的序列(例如,编码目的蛋白)。在某些实施例中,将目的多核苷酸序列可操作地连接到启动子和/或终止子。在一些实施例中,DNA构建体进一步包含至少一种选择性标记。在另外的实施例中,DNA构建体包含与宿主细胞染色体同源的序列。在其他实施例中,DNA构建体包含与宿主细胞染色体非同源的序列。
如本文所用,“侧翼序列”是指正在讨论的序列的上游或下游的任何序列(例如,对于基因A-B-C,基因B以A和C基因序列为侧翼)。在某些实施例中,输入序列在每侧的侧翼为同源盒。在另一个实施例中,输入序列和同源盒包含在每侧的侧翼为填充序列的单元。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),但是在优选的实施例中,它在被侧翼的序列的每侧。每个同源盒的序列与丝状真菌染色体中的序列同源。这些序列指导在丝状真菌染色体中新构建体的整合位置以及染色体的哪部分将被输入序列替代。
如本文所用,术语基因表达的“下调”包括导致功能性基因产物(即功能性蛋白)表达降低(下调)的任何方法。
术语“载体”在本文中定义为被设计用于携带待引入一种或多种细胞类型中的核酸序列的多核苷酸。载体包括克隆载体、表达载体、穿梭载体、质粒、噬菌体或病毒颗粒、DNA构建体、盒等。表达载体可包括调节序列,诸如启动子、信号序列、编码序列和转录终止子。
如本文所用,“表达载体”意指包含编码序列的DNA构建体,该编码序列与能够在合适的宿主中实现蛋白表达的合适的控制序列可操作地连接。这样的控制序列可包括实现转录的启动子、控制转录的任选操纵子序列、编码mRNA上合适的核糖体结合位点的序列、增强子以及控制转录和翻译终止的序列。
如本文所用,术语“分泌信号序列”表示编码多肽(即,“分泌肽”)的DNA序列,该多肽作为较大多肽的组分引导较大的多肽通过其中该较大多肽被合成的细胞的分泌路径。较大的多肽在通过分泌路径转运期间通常被切割以去除分泌肽。
如本文所用,术语“分离的”或“纯化的”是指从天然相关的至少一种组分中去除的丝状真菌细胞、核酸或多肽。
如本文所用,术语“目的蛋白”或“POI”是指希望在丝状真菌细胞中表达的多肽。这样的蛋白可以是酶、底物结合蛋白、表面活性蛋白、结构蛋白等,可以以高水平表达,并且可以用于商业化的目的。例如,如下文总体上阐述,目的蛋白(POI)包括但不限于纤维素酶、半纤维素酶、木聚糖酶、过氧化物酶、蛋白酶、脂肪酶、磷脂酶、酯酶、角质酶、聚酯酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂加氧酶、木质酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、α-葡聚糖酶、β-葡聚糖酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、乙酰酯酶、氨肽酶、阿拉伯聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、核酸酶、脱氧核糖核酸酶、核糖核酸酶、差向异构酶、α-半乳糖苷酶、β-半乳糖苷酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡萄糖氧化酶、葡糖醛酸糖苷酶、转化酶、异构酶等。
目的蛋白(POI)可以由“内源”基因编码。例如,在某些实施例中,目的蛋白(POI)由对于丝状真菌细胞(菌株)而言内源的基因(例如前述编码天然纤维素酶组(例如,纤维二糖水解酶、木聚糖酶、内切葡聚糖酶和β-葡糖苷酶)的野生型基因)编码。
如本文所用,术语“增加的生产力”及其变体意指当在与不过表达调节蛋白的亲本(对照)丝状真菌细胞相同的培养基组成、温度、pH、细胞密度、溶解氧和时间条件下培养时,过表达编码本公开的调节蛋白的调节基因的经修饰的(突变型)丝状真菌细胞产生的目的蛋白增加至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少11%、至少12%、至少13%、至少14%、至少15%、至少16%、至少17%、至少18%、至少19%、或至少20%(例如,大于20%)。
如本文所用,术语“增加的量”(当在短语如重组细胞“产生‘增加的量’的目的蛋白”中使用时)、及其变体意指当在与不过表达调节蛋白的亲本(对照)丝状真菌细胞相同的培养基组成、温度、pH、细胞密度、溶解氧和时间条件下培养时,过表达编码本公开的调节蛋白的调节基因的经修饰的(突变型)丝状真菌细胞产生的目的蛋白的量增加至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少11%、至少12%、至少13%、至少14%、至少15%、至少16%、至少17%、至少18%、至少19%、或至少20%(例如,大于20%)。
如本文所用,术语“多肽”和“蛋白质”(和/或其各自的复数形式)可互换地用来指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文中使用用于氨基酸残基的常规一字母或三字母代码。聚合物可以是线性的或支化的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。该术语还涵盖天然修饰的或通过干预(例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化、或任何其他操作或修饰,诸如与标记组分缀合)修饰的氨基酸聚合物。该定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
如本文所用,功能上和/或结构上相似的蛋白质被认为是“相关的蛋白质”。这样的蛋白质可衍生自不同属和/或物种的生物、或甚至不同纲的生物(例如,细菌和真菌)。相关的蛋白质还涵盖通过一级序列分析确定的、通过二级或三级结构分析确定的、或者通过免疫交叉反应性确定的同源物。
如本文所用,短语“基本上无活性”或相似短语意指指定活性在混合物中不可检测或以不会干扰混合物的预期目的的量存在。
如本文所用,术语“衍生多肽”是指通过以下衍生的或可衍生的蛋白质:在一个或多个N末端和C末端中的一个或两个添加一个或多个氨基酸、在氨基酸序列中一个或多个不同位点取代一个或多个氨基酸、在蛋白质的一端或两端或者在氨基酸序列的一个或多个位点缺失一个或多个氨基酸、和/或在氨基酸序列中一个或多个位点插入一个或多个氨基酸。蛋白衍生物的制备可以通过修饰编码天然蛋白的DNA序列、将该DNA序列转化到合适的宿主中、以及表达修饰的DNA序列以形成衍生蛋白来实现。
相关的(和衍生)蛋白包括“变体蛋白”。变体蛋白通过在少量氨基酸残基处的取代、缺失和/或插入而不同于参考/亲本蛋白(例如,野生型蛋白)。变体与亲本蛋白之间的不同氨基酸残基的数量可以是一个或多个,例如,1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、或更多个氨基酸残基。变体蛋白与参考蛋白可以共有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或甚至至少约99%、或更多氨基酸序列同一性。变体蛋白也可以与参考蛋白在选择的基序、结构域、表位、保守区域等方面不同。
如本文所用,术语“同源”蛋白是指与参考蛋白具有相似活性、功能和/或结构的蛋白质。这并不旨在表示同源物必定是进化上相关的。因此,其旨在表示该术语涵盖从不同生物获得的相同、类似或相应(即,在结构和功能方面)的一种或多种蛋白质。在一些实施例中,希望鉴定与参考蛋白具有相似的四级、三级和/或一级结构的同源物。例如,来自黑曲霉、米曲霉和/或喜热梭孢壳(Thermothelomyces thermophilus)的调节蛋白同源物(即,包含与本公开的全长里氏木霉调节蛋白基本相同的氨基酸序列)描述于实例10(参见,表6)中。
序列之间的同源性程度可以使用本领域已知的任何合适的方法确定(参见,例如,Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;威斯康星遗传学软件包(Wisconsin Genetics Software Package)(威斯康星州麦迪逊市的遗传学电脑集团(Genetics Computer Group,Madison,WI))中的程序,诸如GAP、BESTFIT、FASTA和TFASTA;和Devereux等人,1984)。出于本发明的目的,使用如在EMBOSS包(Rice等人,2000)(优选3.0.0版本或更新版本)的尼德尔程序所实施的尼德尔曼-翁施算法(Needleman和Wunsch,1970)来确定两个氨基酸序列之间的同一性程度。所使用的任选参数是空位开放罚分10、空位延伸罚分0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的尼德尔的输出(使用非简化选项获得)用作同一性百分比并且计算如下:
(相同的残基×100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS包(Rice等人,2000,同上)(优选3.0.0版本或更新版本)的尼德尔程序所实施的尼德尔曼-翁施算法(Needleman和Wunsch,1970,同上)来确定两个脱氧核糖核苷酸序列之间的同一性程度。所使用的任选参数是空位开放罚分10、空位延伸罚分0.5、以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。将标记为“最长同一性”的尼德尔的输出(使用非简化选项获得)用作同一性百分比并且计算如下:
(相同的脱氧核糖核苷酸×100)/(比对长度-比对中的空位总数)
如本文所用,在至少两个核酸或多肽的情况下,短语“基本上类似”和“基本上相同”典型地意指多核苷酸或多肽包含与参考(即,野生型)序列相比具有至少约40%同一性、至少约50%同一性、至少约60%同一性、至少约70%同一性、至少约75%同一性、至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约91%同一性、至少约92%同一性、至少约93%同一性、至少约94%同一性、至少约95%同一性、至少约96%同一性、至少约97%同一性、至少约98%同一性、或甚至至少约99%同一性、或更高同一性的序列。可以使用已知的程序(诸如BLAST、ALIGN和CLUSTAL)使用标准参数确定序列同一性。
如本文所用,术语“诱导物(inducer、inducers)”、或“诱导底物”可互换使用,是指引起丝状真菌细胞产生“增加的量”的总蛋白的任何化合物。诱导底物的实例包括但不限于槐糖、乳糖、龙胆二糖和纤维素。
如本文所用,术语“诱导”是指响应于“诱导物”(即,诱导底物)的存在基因的转录增加,这导致以显著增加的速率在丝状真菌细胞中合成目的蛋白(POI)。
为了测量编码目的蛋白(POI)的目的基因(GOI)的“诱导”,用候选诱导底物(诱导物)处理经修饰的丝状真菌细胞并与未用诱导底物(诱导物)处理的亲本丝状真菌(对照)细胞进行比较。因此,未处理的亲本(对照)细胞被赋予为100%的相对蛋白活性值,其中当活性值(即,相对于对照细胞)大于100%、大于105%、大于110%、大于150%,大于200%-500%(即,相对于对照)、或更高时,实现在经修饰的宿主细胞中编码POI的GOI的诱导。
如本文所用,“需氧发酵”是指在氧存在下生长。
如本文所用,术语“细胞肉汤”统称为液体/深层培养中的培养基和细胞。
如本文所用,术语“细胞团”是指存在于液体/深层培养中的细胞组分(包括完整和裂解的细胞)。细胞团可以干重或湿重表示。
如本文所用,短语“升高的发酵(培养)温度”是大于实例中描述的标准发酵条件的发酵温度。
如本文所用,术语“孢子形成”当在短语如“改善的孢子形成”、“增强的孢子形成”、“增加的孢子形成”、“改善的孢子形成表型”等中使用时意指与参考菌株相比,在适当的营养培养基上(在琼脂板上或在液体培养物中)生长的真菌菌株形成更大量的孢子。例如,在某些实施例中,相对于不过表达任何调节蛋白的对照菌株,过表达与SEQ ID NO:68包含至少80%同一性的调节蛋白的重组真菌菌株表现出改善的孢子形成表型。
应当理解,本公开的方法不限于获得经修饰的(突变型)丝状真菌细胞(菌株)的特定顺序。可以在构建菌株的任何步骤将基因的修饰引入亲本菌株中,以产生内源目的蛋白(POI)和/或产生异源POI。
III.调节蛋白
如本领域技术人员通常理解的,调节蛋白在不同水平上参与细胞稳态的调节,包括但不限于将DNA转录成RNA的过程。例如,许多称为转录因子的调节蛋白典型地是序列特异性DNA结合蛋白,它们通过与(调节)基因的启动子区域中的特定(靶)位点结合来控制、调节、介导等基因转录的速率(Latchman,1993)。更特别地,转录因子的一个显著特征是它们具有DNA结合结构域(DBD),这使它们能够具有与称为增强子或启动子序列的特定DNA序列结合的能力。因此,一些调节蛋白与转录起始位点附近的DNA启动子序列结合,并有助于形成转录起始复合物。其他调节蛋白结合调节序列,例如增强子序列,并且可以刺激或抑制相关基因的转录,其中这些调节序列可以是被转录基因的上游(5′)或下游(3′)的数千个碱基对(bp)。
蛋白激酶是可以通过向其他蛋白质(共价)添加磷酸盐(即磷酸化)来选择性地修饰其他蛋白质的调节蛋白。组蛋白乙酰化酶/脱乙酰酶是可以分别经由共价添加/去除乙酰基基团(COCH3)来修饰组蛋白蛋白质的调节蛋白。例如,转录调节是最常见的基因控制形式,其中调节蛋白的作用允许对基因表达模式进行独特的时空调节。
丝状真菌中纤维素酶、半纤维素酶、木质酶、果胶酶等的产生被认为主要在转录水平上受到调节(Aro等人,2005)。例如,Stricker等人(2008)描述了黑曲霉和里氏木霉中纤维素酶和半纤维素酶表达的转录调节(包括XlnR和Xyr1的作用)的相似性和差异。如Kubicek等人(2009)所述,在里氏木霉中,一些调节组分在纤维素酶调节中发挥积极作用(Xyr1、Ace2、Hap2/3/5),而另一些则发挥消极作用(Ace1、Cre1)。尽管已经描述了一些调节基因对蛋白质产生的作用,但仍然需要能够增强内源和异源目的蛋白的产生的改善的丝状真菌菌株。
如本领域通常已知的,丝状真菌菌株典型地作为菌丝体深层培养物在生物反应器中生长,这些生物反应器经调节以将氧和营养素引入并分配到培养基(即,发酵肉汤)中并维持最佳pH和温度等。特别地,发酵肉汤的混合、通气、冷却等所需的功率会显著增加生产成本,并且在发动机、电源、冷却设备等方面产生更高的资本支出。例如,发酵工艺过程中热量的释放与碳和能源的利用密切相关(Wang等人,1979)。如Wang等人(1979)通常描述的,热量的量与生长和产物形成的化学计量有关,而热量释放的速率与工艺的动力学成正比,其中对热量释放的兴趣源于在发酵工艺过程中去除热量的需要(例如,维持最佳的产物形成)。因此,在较高温度下运行该工艺可以是有益的,因为它可以减少发酵时间并释放发酵能力。
一般而言,大多数丝状真菌只有在约20℃-40℃的温度范围内才会生长并高效生产。例如,发酵温度可以稍微变化,但对于丝状真菌诸如里氏木霉,温度通常将会在约20℃至40℃的范围内,通常优选在约25℃至34℃的范围内。因此,在升高的温度下发酵丝状真菌菌株用于产生蛋白质的能力在降低蛋白质生产成本方面是特别有意义的。如下文所述,本公开的重组丝状真菌细胞(菌株)非常适合用于工业规模发酵工艺,以增强目的蛋白的产生。
更特别地,如本文所述和下文实例部分所阐述,申请人已对超过七百五十(750)种调节蛋白进行鉴定和筛选,用于这些调节蛋白在丝状真菌(宿主)细胞中增强蛋白质产生的能力。更特别地,如实例中所述,申请人已经设计/构建了过表达调节蛋白(例如,参见表1,实例1)或其两种调节蛋白的组合(表4和表5)的示例性里氏木霉报告菌株及其经修饰的(重组)菌株。例如,构建实例1C中描述的里氏木霉报告菌株以表达两种示例性报告蛋白(即,布丘氏菌属物种植酸酶和土曲霉α-淀粉酶);其中表达两种报告蛋白的里氏木霉报告菌株被进一步修饰以过表达单一调节蛋白(实例1D)或两种调节蛋白的组合(实例1E)。
如实例4中所阐述,对六百九十一(691)个单一调节蛋白的过表达进行筛选,以在各种条件下改善蛋白质产生,其中表2中所阐述的调节蛋白的过表达导致在标准条件下在乳糖释放板中孵育一百二十(120)个小时后发酵时一种或两种报告蛋白的产生增加。另外,如实例5中所阐述,表3中所阐述的调节蛋白的过表达导致在高温下在乳糖释放板中孵育一百二十(120)个小时后发酵时一种或两种报告蛋白的产生增加。
如实例6中进一步描述的,对一百三十四(134)个重组菌株进行筛选,每个重组菌株过表达两种不同的调节蛋白,或两种相同的调节蛋白,以在各种条件下改善蛋白质产生。例如,如表4中所阐述,同时过表达两个里氏木霉调节基因(DNA)序列组合的突变型(重组)细胞在乳糖释放条件下发酵时表现出增强的蛋白质生产力表型(即,相对于亲本/对照细胞)。
另外,如表5中所阐述,同时过表达两个里氏木霉调节基因(DNA)序列组合的重组细胞在用2%(w/w)葡萄糖/槐糖作为碳源发酵时表现出增强的蛋白质生产力表型(即,相对于亲本/对照细胞)。
同样,如实例7-9中总体上描述的,在使用槐糖作为诱导底物(以恒定补料速率)的两(2)L生物反应器中(在补料分批发酵中)评估过表达单一调节蛋白(实例8)或两种调节蛋白(实例9)的里氏木霉菌株的子集。更特别地,如实例8中所述,相对于对照菌株,所有过表达SEQ ID NO:31、SEQ ID NO:66、SEQ ID NO:69或SEQ ID NO:102(参见,图2)的调节蛋白的里氏木霉突变型菌株均展现出改善的蛋白质产生。另外,如实例9中所述,所有过表达SEQID NO:66和69、SEQ ID NO:31和66、SEQ ID NO:31和69、SEQ ID NO:100和69、或SEQ ID NO:100和66(参见,图3)的调节蛋白组合的里氏木霉突变型(重组)菌株在整个发酵过程中均展现出比对照菌株更高的蛋白质生产力。
如实例10中所述,编码与里氏木霉调节蛋白同源的调节蛋白的丝状真菌调节基因在表6中示出。因此,在某些方面,本公开涉及重组丝状真菌细胞,其过表达与SEQ ID NO:1、4、7、10、12、15、18、21、23、25、28、30、33、36、39、42、45、48、51、54、56、59、62、65、68、71、74、77、79、82、84、87、90、94、97、99、101、105、108、110、113、116、119、122、125、128或131、134、137、140、144、147、149、152的里氏木霉基因包含至少80%同一性的调节基因,和/或重组丝状真菌细胞,其过表达与来自表6中所示的丝状真菌细胞的直系同源基因序列包含至少80%同一性的调节基因。因此,某些其他实施例涉及重组丝状真菌细胞,其过表达与SEQ IDNO:2、5、8、11、13、16、19、22、24、26、29、31、34、37、40、43、46、49、52、55、57、60、63、66、69、72、75、78、80、83、85、88、91、95、98、100、102、106、109、111、114、117、120、123、126、129或132、135、138、141、145、148、150、153的调节蛋白包含至少80%同一性的调节蛋白,和/或过表达与来自表6中所示的丝状真菌细胞的调节蛋白直系同源物包含至少80%同一性的调节蛋白。某些其他实施例提供了重组丝状真菌细胞,其过表达与表4和/或表5中所阐述的组合的基因序列包含至少80%同一性的至少两种调节基因的组合。某些其他实施例提供了重组丝状真菌细胞,其过表达与表4和/或表5中所阐述的调节蛋白组合包含至少80%同一性的至少两种调节蛋白的组合。
如下文进一步描述的,某些实施例涉及编码本公开的调节蛋白(参见,实例1;表1)的多核苷酸构建体(例如,表达盒)。在某些实施例中,多核苷酸构建体包含与编码调节蛋白的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,该调节蛋白与SEQ ID NO:2、5、8、11、13、16、19、22、24、26、29、31、34、37、40、43、46、49、52、55、57、60、63、66、69、72、75、78、80、83、85、88、91、95、98、100、102、106、109、111、114、117、120、123、126、129、132、135、138、141、145、148、150或153的调节蛋白包含至少80%序列同一性。因此,某些其他实施例涉及重组丝状真菌细胞,其包含编码这样的调节蛋白的表达盒。某些其他实施例涉及用于在丝状真菌细胞中产生增加量的目的蛋白的方法。
IV.重组核酸和分子生物学
因此,如上文总体上阐述和下文进一步示例说明的,本公开的某些实施例涉及经遗传修饰的丝状真菌细胞/菌株,其过表达编码本公开的调节蛋白(例如,参见实例1;表1)的一种或多种(调节)基因。因此,在某些方面,丝状真菌细胞包含一种或多种(多种)引入的多核苷酸。在某些实施例中,引入的多核苷酸是表达盒,该表达盒在5′至3′方向上包含与编码目的蛋白(POI)的下游(3′)基因(或可读框;ORF)序列可操作地连接的上游(5′)启动子序列。在相关的实施例中,盒可以进一步包含与编码POI的基因或ORF可操作地连接的下游(3′)终止子序列。
在某些其他实施例中,引入的多核苷酸是表达盒,该表达盒在5′至3′方向上包含与下游调节基因序列(即,编码调节蛋白)可操作地连接的上游启动子序列。在相关的实施例中,盒可以进一步包含与编码调节蛋白的调节基因可操作地连接的下游(3′)终止子序列。
例如,包含与调节基因(编码调节蛋白)可操作地连接的上游启动子的调节基因表达盒示意性在下文(方案A)示出,其中该启动子[pro]和调节基因[reg_gene]序列在5′至3′方向上以有效的“-“组合显示:
方案A:5′-[pro]-[reg_gene]-3′
同样,包含与调节基因(编码调节蛋白)(与下游终止子序列可操作地连接)可操作地连接的上游启动子的调节基因表达盒示意性在下文方案B中示出,其中该启动子[pro]、调节基因[reg_gene]和终止子[term]序列在5′至3′方向上以有效的“-“组合显示。
方案B:5′-[pro]-[reg_gene]-[term]-3′
如方案A或方案B所示,启动子和/或终止子序列并不旨在是限制性的,而是经过选择以便在希望的真菌细胞/菌株中起作用。例如,启动子序列可以是在丝状真菌细胞中显示转录活性的任何核苷酸序列,包括突变型/变体启动子、截短的启动子、串联启动子、杂合启动子、合成启动子、诱导型启动子、调谐启动子(tuned promoter)、条件表达系统及其组合。通常,合适的启动子可以从编码胞外或胞内多肽的基因中获得,这些多肽对于丝状真菌细胞是天然的或异源的(外源的)。适合于驱动本公开的一种或多种调节基因的表达的启动子的实例包括但不限于里氏木霉cDNA1启动子、eno1启动子、pdc1启动子、pki1启动子、tef1启动子、rp2启动子、和描述于Fitz等人2018(通过引用以其全文并入本文)的其他里氏木霉启动子,米曲霉thiA启动子,构巢曲霉gpdA启动子等。
因此,可以将包含编码调节蛋白(或目的蛋白)的多核苷酸的核酸构建体可操作地连接到一个或多个控制序列(例如,启动子序列、终止子序列),这些控制序列能够指导编码序列在本公开的丝状真菌细胞中的表达(例如在与这些控制序列相容的条件下)。
如下文实例中所阐述,可以使用本领域熟知的常规方法构建本公开的重组丝状真菌细胞(例如,Ausubel等人,2003)。
在某些实施例中,可以经由CRISPR-Cas9编辑构建经修饰的(突变型)丝状真菌细胞。例如,可以借助核酸指导的内切核酸酶修饰、破坏、缺失或下调目的基因,这些核酸指导的内切核酸酶通过结合指导RNA(例如,Cas9和Cpf1)或指导DNA(例如,NgAgo)发现其靶DNA,这将内切核酸酶募集到DNA上的靶序列上,其中内切核酸酶可以在DNA中产生单链或双链断裂。此靶向DNA断裂成为DNA修复的底物,并且可以与所提供的编辑模板重组以使基因破坏或缺失或修饰。例如,编码核酸指导的内切核酸酶(出于此目的,来自酿脓链球菌(S.pyogenes)的Cas9)的基因或编码Cas9核酸酶的密码子优化的基因可操作地连接到在真菌细胞中有活性的启动子和在真菌细胞中有活性的终止子,从而产生真菌Cas9表达盒。同样,本领域技术人员容易地鉴定目的基因特有的一个或多个靶位点。例如,为了构造编码gRNA的DNA构建体-指向目的基因内的靶位点,可变的靶向结构域(VT)将包含靶位点的核苷酸,这些核苷酸为(PAM)前间区序列邻近基序(NGG)的5',这些核苷酸与编码酿脓链球菌Cas9的Cas9内切核酸酶识别结构域(CER)的DNA融合。将编码VT结构域的DNA和编码CER结构域的DNA组合,从而产生编码gRNA的DNA。因此,通过将编码gRNA的DNA可操作地连接到真菌细胞中的活性启动子和真菌细胞中的活性终止子来产生gRNA的真菌细胞表达盒。
在某些实施例中,将由内切核酸酶诱导的DNA断裂用输入序列修复/替代。例如,为了精确修复由上述Cas9表达盒和gRNA表达盒产生的DNA断裂,提供了核苷酸编辑模板,使得细胞的DNA修复机构可以利用该编辑模板。例如,靶向基因的约500bp 5′可以与靶向基因的约500bp 3′融合以产生编辑模板,该模板由真菌宿主的机构用于修复由RNA引导的内切核酸酶(RGEN)产生的DNA断裂。可以使用双链或单链DNA形式的更短的核苷酸段作为编辑模板。
可以使用许多不同的方法(例如,原生质体融合、电穿孔、自然感受态或诱导感受态)将Cas9表达盒、gRNA表达盒、和编辑模板共同递送至丝状真菌细胞。通过用正向和反向引物扩增靶基因,通过PCR来筛选转化的细胞。这些引物可以扩增野生型基因座或已由RGEN编辑的经修饰的基因座。
使用转化丝状真菌和培养真菌的标准技术(这些标准技术是本领域技术人员所熟知的)来转化本公开的真菌宿主细胞。因此,将DNA构建体或载体引入真菌宿主细胞中包括如下技术如:转化、电穿孔、核显微注射、转导、转染(例如脂质介导的转染和DEAE-糊精介导的转染)、用磷酸钙DNA沉淀孵育、用DNA包被的微粒高速轰击、基因枪或生物射弹转化、原生质体融合等。一般的转化技术是本领域已知的(参见,例如,Ausubel等人,1987,Sambrook等人,2001和2012,以及Campbell等人,1989)。异源蛋白在木霉属中的表达描述于例如美国专利号6,022,725;6,268,328;Harkki等人,1991以及Harkki等人,1989中。对于曲霉属菌株的转化,还参考了Cao等人(2000)。
在某些其他实施例中,重组核酸(或其多核苷酸表达盒或其表达载体)进一步包含一种或多种选择性标记。用于丝状真菌中的选择性标记包括但不限于alsl、amdS、hygR、pyr2、pyr4、pyrG、sucA trpC、argB、博来霉素抗性标记、杀稻瘟菌素抗性标记、吡啶硫胺抗性标记、新霉素抗性标记、腺嘌呤途径基因、胸苷激酶标记等。在特别的实施例中,选择性标记是pyr2,其组合物和使用方法总体上阐述于PCT公开号WO 2011/153449中。
通常,使用已经进行了渗透性处理的原生质体或细胞转化木霉属物种细胞,典型地以105至107/mL、特别是2×106/mL的密度进行。将100μL体积的在适当的溶液(例如1.2M山梨糖醇和50mM CaCl2)中的这些原生质体或细胞与所希望的DNA混合。通常,向摄取溶液中添加高浓度的聚乙二醇(PEG)。也可以将添加剂诸如二甲亚砜、肝素、亚精胺、氯化钾等添加到摄取溶液中以促进转化。类似的程序可用于其他真菌宿主细胞。参见,例如美国专利号6,022,725和6,268,328,其两者都通过引用并入本文。
在某些实施例中,本公开涉及一种或多种目的蛋白的表达/产生,该一种或多种目的蛋白对于丝状真菌宿主细胞是内源的。在其他实施例中,本公开涉及一种或多种目的蛋白的表达/产生,该一种或多种目的蛋白对于丝状真菌宿主细胞是异源的。
在特别的实施例中,将编码蛋白质(例如,调节蛋白、目的蛋白)的异源基因(或ORF)引入丝状真菌(宿主)细胞中。在某些实施例中,将异源基因克隆到中间载体中,然后转化到丝状真菌(宿主)细胞中用于表达。这些中间载体可以是原核载体,诸如像质粒或穿梭载体。表达载体/构建体典型地含有转录单元或表达盒,该转录单元或表达盒含有表达异源序列所需的所有附加元件。例如,典型的表达盒含有与编码POI的异源核酸序列可操作地连接的5′启动子,并且可以进一步包含转录物的有效聚腺苷酸化、核糖体结合位点和翻译终止所需的序列信号。该盒的附加元件可以包括增强子,并且如果使用基因组DNA作为结构基因,可以包括具有功能性剪接供体和受体位点的内含子。
除了启动子序列之外,表达盒还可以含有结构基因的转录终止区下游以提供有效的终止。终止区可以从与启动子序列相同的基因获得或者可以从不同基因获得。尽管任何真菌终止子在本发明中可能是有功能的,但优选的终止子包括:来自木霉属cbhI基因的终止子,来自构巢曲霉trpC基因(Yelton等人,1984;Mullaney等人,1985)、泡盛曲霉或黑曲霉葡糖淀粉酶基因(Nunberg等人,1984;Boel等人,1984)、和/或米黑毛霉(Mucor miehei)羧基蛋白酶基因(EPO公开号0215594)的终止子。
用于将遗传信息运送到细胞中的特定表达载体并不特别关键。可以使用用于在真核细胞或原核细胞中表达的常规载体中的任一种。标准的细菌表达载体包括噬菌体λ和M13,以及质粒如基于pBR322的质粒、pSKF、pET23D,和融合表达系统如MBP、GST和LacZ,以及酵母2μ质粒和酵母着丝粒质粒。也可以将表位标签例如c-myc添加到重组蛋白中以提供便利的分离方法。
可以包括在表达载体中的元件还可以是复制子,编码允许选择携带重组质粒的细菌的抗生素抗性的基因,或在质粒的非必需区中的允许插入异源序列的独特限制性位点。所选择的特定抗生素抗性基因也不是决定性的,因为本领域已知的许多抗性基因中的任一种都可以是合适的。优选地选择原核序列,使得它们不干扰DNA在真菌宿主中的复制或整合。
本公开的转化的方法可以导致转化载体的全部或一部分稳定整合到丝状真菌的基因组中。然而,还考虑了导致维持自主复制的染色体外转化载体的转化。可以使用用于将外源(异源)核苷酸序列引入宿主细胞的任何已知程序。这些包括使用磷酸钙转染、聚凝胺、原生质体融合、电穿孔、基因枪法、脂质体、显微注射,以及用于将克隆的基因组DNA、cDNA、合成DNA、或其他外源遗传材料引入宿主细胞的任何其他已知方法(参见,例如,Sambrook等人,同上)。还使用农杆菌(Agrobacterium)介导的转染方法,诸如美国专利号6,255,115中所述的转染方法。
将一种或多种表达载体引入细胞后,在有利于在纤维素酶基因启动子序列控制下的基因表达的条件下培养转染的细胞。大批转化细胞可以如本文所述进行培养。最后,使用标准技术从培养物回收产物。
V.目的蛋白
如上所述,本公开的某些实施例涉及经遗传修饰的(重组)真菌细胞,其包含表达或过表达编码目的蛋白(POI)的基因(或ORF)的遗传修饰。更特别地,某些实施例涉及用于在本公开的经修饰的(突变型)真菌细胞中表达/产生这样的目的蛋白的组合物和方法。因此,在某些实施例中,本公开的重组真菌细胞产生增加量的目的蛋白,包括但不限于酶、抗体、受体蛋白、动物饲料蛋白和/或人类食品蛋白。
在某些方面,本公开的重组细胞产生增加量的选自由以下组成的组的酶:淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、过氧化物酶、蛋白酶、脂肪酶、磷脂酶、酯酶、角质酶、聚酯酶、植酸酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂加氧酶、木质酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、α-葡聚糖酶、β-葡聚糖酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、乙酰酯酶、氨肽酶、阿拉伯聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、核酸酶、脱氧核糖核酸酶、核糖核酸酶、差向异构酶、α-半乳糖苷酶、β-半乳糖苷酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡萄糖氧化酶、葡糖醛酸糖苷酶、转化酶和异构酶。
在其他实施例中,本公开的重组细胞产生增加量的选自由以下组成的组的淀粉酶:α-淀粉酶、β-淀粉酶、生麦芽糖α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、麦芽四糖苷酶和麦芽六糖苷酶。
如本文所述,目的蛋白(POI)可以是内源POI或异源POI。在某些实施例中,POI包括但不限于半纤维素酶、过氧化物酶、蛋白酶、纤维素酶、木聚糖酶、脂肪酶、磷脂酶、酯酶、角质酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂加氧酶、木质酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、β-葡聚糖酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、脱氧核糖核酸酶、差向异构酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡萄糖氧化酶、葡糖醛酸糖苷酶、转化酶、异构酶等。在某些实施例中,POI选自酶学委员会(EC)编号,该酶学委员会(EC)编号选自由以下组成的组:EC 1、EC2、EC 3、EC 4、EC 5或EC 6。
例如,在某些实施例中,POI是包括但不限于选自以下的EC1(氧化还原酶)酶的氧化还原酶:EC 1.10.3.2(例如,漆酶)、EC 1.10.3.3(例如,L-抗坏血酸氧化酶)、EC 1.1.1.1(例如,醇脱氢酶)、EC 1.11.1.10(例如,氯化物过氧化物酶)、EC 1.11.1.17(例如,过氧化物酶)、EC 1.1.1.27(例如,L-乳酸脱氢酶)、EC 1.1.1.47(例如,葡萄糖1-脱氢酶)、EC1.1.3.X(例如,葡萄糖氧化酶)、EC 1.1.3.10(例如,吡喃糖氧化酶)、EC 1.13.11.X(例如,双加氧酶)、EC 1.13.11.12(例如,亚油酸l3S-脂氧合酶(lineolate l3S-lipozygenase))、EC 1.1.3.13(例如,醇氧化酶)、EC 1.14.14.1(例如,单加氧酶)、EC 1.14.18.1(例如,单酚单加氧酶(monophenol monooxigenase))、EC 1.15.1.1(例如,超氧化物歧化酶)、EC1.1.5.9(先前为EC 1.1.99.10,例如,葡萄糖脱氢酶)、EC 1.1.99.18(例如,纤维二糖脱氢酶)、EC 1.1.99.29(例如,吡喃糖脱氢酶)、EC1.2.l.X(例如,脂肪酸还原酶)、EC 1.2.1.10(例如,乙醛脱氢酶)、EC 1.5.3.X(例如,果糖基胺还原酶)、EC 1.8.l.X(例如,二硫化物还原酶)和EC 1.8.3.2(例如,硫醇氧化酶)。
在某些实施例中,POI是包括但不限于EC 2(转移酶)酶的转移酶,该EC 2(转移酶)酶选自EC 2.3.2.13(例如,转谷氨酰胺酶)、EC 2.4.l.X(例如,己糖基转移酶)、EC2.4.1.40(例如,交替蔗糖酶(alternasucrase))、EC 2.4.1.18(例如,1,4α-葡聚糖分支酶)、EC 2.4.1.19(例如,环麦芽糖糊精葡聚糖转移酶)、EC 2.4.1.2(例如,糊精葡聚糖酶)、EC 2.4.1.20(例如,纤维二糖磷酸化酶)、EC 2.4.1.25(例如,4-α-葡聚糖转移酶)、EC2.4.1.333(例如,l,2-β-低聚葡糖磷酸转移酶)、EC 2.4.1.4(例如,淀粉蔗糖酶)、EC2.4.1.5(例如,葡聚糖蔗糖酶)、EC 2.4.1.69(例如,半乳糖苷2-α-L-岩藻糖基转移酶)、EC2.4.1.9(例如,菊粉蔗糖酶(inulosucrase))、EC 2.7.1.17(例如,木酮糖激酶)、EC2.7.7.89(原名EC 3.1.4.15,例如,[谷氨酰氨合成酶]-腺苷-L-酪氨酸磷酸化酶)、EC2.7.9.4(例如,α葡聚糖激酶)和EC 2.7.9.5(例如,磷酸葡聚糖激酶)。
在其他实施例中,POI是包括但不限于EC 3(水解酶)酶的水解酶,该EC 3(水解酶)酶选自EC 3.1.X.X(例如,酯酶)、EC 3.1.1.1(例如,果胶酶)、EC 3.1.1.14(例如,叶绿素酶)、EC 3.1.1.20(例如,鞣酸酶)、EC 3.1.1.23(例如,甘油酯酰基水解酶)、EC 3.1.1.26(例如,半乳糖脂酶)、EC 3.1.1.32(例如,磷脂酶Al)、EC 3.1.1.4(例如,磷脂酶A2)、EC3.1.1.6(例如,乙酰酯酶)、EC 3.1.1.72(例如,乙酰木聚糖酯酶)、EC 3.1.1.73(例如,阿魏酸酯酶)、EC 3.1.1.74(例如,角质酶)、EC 3.1.1.86(例如,鼠李糖半乳糖醛酸乙酰酯酶)、EC 3.1.1.87(例如,伏马菌素Bl酯酶)、EC 3.1.26.5(例如,核糖核酸酶P)、EC 3.1.3.X(例如,磷酸单酯水解酶)、EC 3.1.30.1(例如,曲霉属核酸酶Sl)、EC 3.1.30.2(例如,粘质沙雷氏菌(Serratia marcescens)核酸酶)、EC 3.1.3.1(例如,碱性磷酸酶)、EC 3.1.3.2(例如,酸性磷酸酶)、EC 3.1.3.8(例如,3-植酸酶)、EC 3.1.4.1(例如,磷酸二酯酶I)、EC3.1.4.11(例如,磷酸肌醇磷脂酶C)、EC 3.1.4.3(例如,磷脂酶C)、EC 3.1.4.4(例如,磷脂酶D)、EC 3.1.6.1(例如,芳基硫酸酯酶)、EC 3.1.8.2(例如,二异丙基-氟磷酸酶)、EC3.2.1.10(例如,寡-l,6-葡糖苷酶)、EC 3.2.1.101(例如,甘露聚糖内切-l,6-α-甘露糖苷酶)、EC 3.2.1.11(例如,α-l,6-葡聚糖-6-葡聚糖水解酶)、EC 3.2.1.131(例如,木聚糖α-l,2-葡萄糖醛酸苷酶)、EC 3.2.1.132(例如,壳聚糖N-乙酰葡糖氨基水解酶)、EC3.2.1.139(例如,α-葡糖醛酸糖苷酶)、EC 3.2.1.14(例如,几丁质酶)、EC 3.2.1.151(例如,木葡聚糖特异性内切-β-l,4-葡聚糖酶)、EC 3.2.1.155(例如,木葡聚糖特异性外切-β-l,4-葡聚糖酶)、EC 3.2.1.164(例如,半乳聚糖内切-l,6-β-半乳糖苷酶)、EC 3.2.1.17(例如,溶菌酶)、EC 3.2.1.171(例如,鼠李半乳糖醛酸聚糖水解酶)、EC 3.2.1.174(例如,鼠李半乳糖醛酸聚糖鼠李糖水解酶)、EC 3.2.1.2(例如,β-淀粉酶)、EC 3.2.1.20(例如,α-葡糖苷酶)、EC 3.2.1.22(例如,α-半乳糖苷酶)、EC 3.2.1.25(例如,β-甘露糖苷酶)、EC3.2.1.26(例如,β-果糖呋喃糖苷酶)、EC 3.2.1.37(例如,木聚糖1,4-β-木糖苷酶)、EC3.2.1.39(例如,葡聚糖内切-l,3-β-D-葡糖苷酶)、EC 3.2.1.40(例如,α-L-鼠李糖苷酶)、EC 3.2.1.51(例如,α-L-岩藻糖苷酶)、EC 3.2.1.52(例如,β-N-乙酰己糖胺酶)、EC3.2.1.55(例如,α-N-阿拉伯呋喃糖苷酶)、EC 3.2.1.58(例如,葡聚糖l,3-β-葡糖苷酶)、EC3.2.1.59(例如,葡聚糖内切-l,3-α-葡糖苷酶)、EC 3.2.1.67(例如,半乳糖醛酸1,4-α-半乳糖醛酸酶)、EC 3.2.1.68(例如,异淀粉酶)、EC 3.2.1.7(例如,l-β-D-果聚糖果糖水解酶)、EC 3.2.1.74(例如,葡聚糖l,4--葡糖苷酶)、EC 3.2.1.75(例如,葡聚糖内切-l,6-β-葡糖苷酶)、EC 3.2.1.77(例如,甘露聚糖l,2-(l,3)-α-甘露糖苷酶)、EC 3.2.1.80(例如,果聚糖β-果糖苷酶)、EC 3.2.1.82(例如,外切-聚-α-半乳糖醛酸苷酶)、EC 3.2.1.83(例如,κ-角叉菜胶酶)、EC 3.2.1.89(例如,阿拉伯半乳聚糖内切-l,4-β-半乳糖苷酶)、EC3.2.1.91(例如,纤维素l,4-β-纤维二糖苷酶)、EC 3.2.1.96(例如,甘露糖基-糖蛋白内切-β-N-乙酰葡糖胺糖苷酶)、EC 3.2.1.99(例如,阿拉伯聚糖内切-l,5-α-L-阿拉伯糖苷酶)、EC 3.4.X.X(例如,肽酶)、EC 3.4.1l.X(例如,氨肽酶)、EC 3.4.11.1(例如,亮氨酰氨肽酶)、EC 3.4.11.18(例如,甲硫氨酰氨肽酶)、EC 3.4.13.9(例如,Xaa-Pro二肽酶)、EC3.4.14.5(例如,二肽基-肽酶IV)、EC 3.4.16.X(例如,丝氨酸型羧肽酶)、EC 3.4.16.5(例如,羧肽酶C)、EC 3.4.19.3(例如,焦谷氨酰肽酶I)、EC 3.4.21.X(例如,丝氨酸内肽酶)、EC3.4.21.1(例如,胰凝乳蛋白酶)、EC 3.4.21.19(例如,谷氨酰内肽酶)、EC 3.4.21.26(例如,脯氨酰寡肽酶)、EC 3.4.21.4(例如,胰蛋白酶)、EC 3.4.21.5(例如,凝血酶)、EC3.4.21.63(例如,蜂蜜曲霉蛋白酶)、EC 3.4.21.65(例如,热霉菌素)、EC 3.4.21.80(例如,链霉菌素A)、EC 3.4.22.X(例如,半胱氨酸内肽酶)、EC 3.4.22.14(例如,猕猴桃蛋白酶(actinidain))、EC 3.4.22.2(例如,木瓜蛋白酶)、EC 3.4.22.3(例如,无花果蛋白酶)、EC3.4.22.32(例如,茎菠萝蛋白酶)、EC 3.4.22.33(例如,水果菠萝蛋白酶)、EC 3.4.22.6(例如,木瓜凝乳蛋白酶)、EC 3.4.23.1(例如,胃蛋白酶A)、EC 3.4.23.2(例如,胃蛋白酶B)、EC3.4.23.22(例如,栗疫霉胃蛋白酶)、EC 3.4.23.23(例如,毛霉胃蛋白酶)、EC 3.4.23.3(例如,胃亚蛋白酶)、EC 3.4.24.X(例如,金属内肽酶)、EC 3.4.24.39(例如,氘代溶素(deuterolysin))、EC 3.4.24.40(例如,舍雷肽酶)、EC 3.5.1.1(例如,天冬酰胺酶)、EC3.5.1.11(例如,青霉素酰胺酶)、EC 3.5.1.14(例如,N-酰基-脂族-L-氨基酸酰胺水解酶)、EC 3.5.1.2(例如,L-谷氨酰胺酰胺水解酶)、EC 3.5.1.28(例如,N-乙酰胞壁酰-L-丙氨酸酰胺酶)、EC 3.5.1.4(例如,酰胺酶)、EC 3.5.1.44(例如,蛋白-L-谷氨酰胺酰胺水解酶)、EC 3.5.1.5(例如,脲酶)、EC 3.5.1.52(例如,肽-N(4)-(N-乙酰基-β-葡糖胺基)天冬酰胺酰胺酶)、EC 3.5.1.81(例如,N-酰基-D-氨基酸脱酰基酶)、EC 3.5.4.6(例如,AMP脱氨酶)和EC 3.5.5.1(例如,腈水解酶)。
在其他实施例中,POI是包括但不限于选自以下的EC 4(裂解酶)酶的裂解酶:EC4.1.2.10(例如,苯乙醇腈裂解酶)、EC 4.1.3.3(例如,N-乙酰神经氨酸裂解酶)、EC4.2.1.1(例如,碳酸脱水酶)、EC 4.2.2.-(例如,鼠李半乳糖醛酸聚糖裂解酶)、EC4.2.2.10(例如,果裂解酶)、EC 4.2.2.22(例如,果胶三糖-裂解酶)、EC 4.2.2.23(例如,鼠李半乳糖醛酸聚糖内切裂解酶)和EC 4.2.2.3(例如,甘露糖醛特异性海藻酸裂解酶)。
在某些其他实施例中,POI是包括但不限于选自以下的EC 5(异构酶)酶的异构酶:EC 5.1.3.3(例如,醛糖l-差向异构酶)、EC 5.1.3.30(例如,D-阿洛酮糖3-差向异构酶)、EC5.4.99.11(例如,异麦芽酮糖合酶)和EC 5.4.99.15(例如,(l 4)-a-D-葡聚糖l-a-D-葡糖基变位酶)。
在又其他实施例中,POI是包括但不限于选自以下的EC 6(连接酶)酶的连接酶:EC6.2.1.12(例如,4-香豆酸:辅酶A连接酶)和EC 6.3.2.28(例如,L-氨基酸α-连接酶)。
用于产生蛋白质的最佳条件将随宿主细胞的选择以及待表达的一种或多种蛋白质的选择而变化。本领域技术人员通过常规实验和/或优化可以容易地确定这样的条件。
目的蛋白可以在表达后被纯化或分离。目的蛋白能以本领域技术人员已知的各种方式被分离或纯化,这取决于样品中存在的其他组分。标准纯化方法包括但不限于电泳、分子、免疫和色谱技术,包括离子交换、疏水、亲和以及反相HPLC色谱和色谱聚焦。例如,目的蛋白可以使用标准抗目的蛋白抗体柱进行纯化。超滤和渗滤技术联合蛋白浓缩也是有用的。所需的纯化程度将取决于目的蛋白的预期用途而变化。在某些情况下,不需要纯化蛋白。
在某些其他实施例中,为了证实本公开的经遗传修饰的真菌细胞产生增加水平的目的蛋白,可以进行各种筛选方法。表达载体可以编码用作可检测标签的与靶蛋白的多肽融合物,或者靶蛋白本身可以用作可选择或可筛选的标记。可以经由蛋白质印迹、斑点印迹(可获自冷泉港试验方案网站(Cold Spring Harbor Protocols website)的方法)、ELISA、或者(如果标记为GFP)全细胞荧光和/或FACS来检测经标记的蛋白质。例如,将包含6-组氨酸标签作为与靶蛋白的融合物,并且该标签将通过蛋白质印迹检测。如果靶蛋白以足够高的水平表达,可以进行与考马斯(Coomassie)/银染色组合的SDS-PAGE以检测与亲本(对照)细胞相比变体宿主细胞表达的增加,在这种情况下不需要标记。此外,可以使用其他方法来证实目的蛋白的改善的水平,诸如,检测蛋白活性或每个细胞中的量、蛋白活性或每毫升培养基中的量的增加,从而允许培养或发酵有效地继续更长时间,或通过这些方法的组合。
比生产力的检测是评估蛋白质产生的另一种方法。比生产力(Qp)可以通过以下公式确定:
Qp=gP/gDCW·hr
其中“gP”是在罐中产生的蛋白质的克数,“gDCW”是在罐中的干细胞重量(DCW)的克数,“hr”是从接种时间开始的几小时内的发酵时间,其包括产生时间以及生长时间。
VI.发酵
某些实施例涉及用于产生目的蛋白的组合物和方法,这些方法包括生长、培养或发酵本公开的经修饰的(突变型)丝状真菌细胞。一般而言,使用本领域熟知的发酵方法发酵真菌细胞。在一些实施例中,真菌细胞在分批、补料分批或连续发酵条件下生长。经典的分批发酵是封闭的系统,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,将培养基用一种或多种希望的生物接种。在该方法中,无需向系统中添加任何组分即可进行发酵。典型地,分批发酵符合关于添加营养素的“分批”的资格,同时控制pH和氧气浓度等因素。分批系统的肉汤和培养物组成不断变化直到发酵停止的时间。在分批培养中,细胞通过静态停滞期进展到高生长对数期,最后进入生长速率减少或停止的稳定期。如果不处理,细胞就会凋亡并最终死亡。一般而言,在分批阶段,大部分产物的产生发生在对数期期间。
标准分批系统的合适的变体是“补料分批发酵”系统。在典型分批系统的该变体中,随着发酵的进展,在对数期完成后,以增量添加底物。补料分批系统通常用于避免分解代谢物抑制。连续补料底物使该工艺能够将其浓度保持在临界水平以下,这可能会导致细胞代谢和蛋白质产生受到抑制。分批和补料分批发酵是常用的并且在本领域中是熟知的。
连续发酵是将限定的发酵培养基连续添加到生物反应器中,并同时去除等量的条件培养基以用于加工的系统。连续发酵通常将培养物维持在恒定的(高)密度,其中细胞主要保持在对数期生长。在其他系统中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续系统努力维持稳态生长条件。因此,由于抽出培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵工艺的营养物质和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域中熟知的。
本公开的某些实施例涉及用于培养真菌的发酵程序。用于产生纤维素酶的发酵程序是本领域已知的。例如,纤维素酶可以通过固体培养或深层培养(包括分批、补料分批和连续流程)来产生。培养通常在生长培养基中完成,该生长培养基包含含水矿物盐培养基、有机生长因子、碳源和能源材料、分子氧以及当然还有待使用的丝状真菌宿主的起始接种物。
除了碳源和能源、氧、可同化氮和微生物的接种物外,还有必要以恰当比例供给合适量的矿质营养素来确保适当的微生物生长,使微生物转化工艺中细胞对碳源和能源的同化最大化,并且在发酵培养基中获得最大细胞产量和最大细胞密度。
含水矿质培养基的组成可在宽泛的范围内变化,这部分取决于所使用的微生物和底物,正如本领域所已知的。除了氮以外,矿质培养基还应该包括处于合适的可溶性可同化离子形式和化合形式的合适量的磷、镁、钙、钾、硫和钠,并且还优选应存在也处于适合的可溶性可同化形式的某些微量元素诸如铜、锰、钼、锌、铁、硼和碘以及其他,这些全部如本领域所已知的。
发酵工艺可以是需氧工艺,其中所需的分子氧通过含分子氧气体诸如空气、富氧空气或甚至基本上纯的分子氧供给,只要维持发酵器皿的内容物具有可有效用于帮助微生物物种以旺盛方式生长的合适的氧分压。
发酵温度可以稍微变化,但对于丝状真菌诸如里氏木霉,温度通常将会在约20℃至40℃的范围内,通常优选在约25℃至34℃的范围内。
微生物还需要可同化氮源。可同化氮源可以是任何含氮化合物或能够释放适于微生物进行代谢利用的形式的氮。虽然可采用多种有机氮源化合物如蛋白水解产物,但通常可以利用廉价的含氮化合物,诸如氨、氢氧化铵、尿素和多种铵盐(诸如磷酸铵、硫酸铵、焦磷酸铵、氯化铵或多种其他氨化合物)。氨气本身便于大规模操作,并且能以合适的量通过鼓泡穿过含水发酵物(发酵培养基)而使用。同时,还可采用这样的氨来帮助进行pH控制。
含水微生物发酵物中的pH范围应该是在约2.0至10.0的示例性范围内。在丝状真菌的情况下,pH通常在约2.5至8.0的范围内;在里氏木霉的情况下,pH通常在约3.0至7.0的范围内。微生物pH范围的偏好在一定程度上取决于所采用的培养基以及特定的微生物,并因此可以进行一定程度的调整,如本领域技术人员可以容易地确定的。
优选地,发酵以使得含碳底物可被控制为限制性因素的方式进行,从而提供了含碳底物到产物的良好转化并避免细胞被基本量的未转化底物污染。后一种情况对水溶性底物而言不是问题,因为任何剩余的痕量物质均可容易地洗掉。然而,在非水溶性底物的情况下这可能是个问题,并且需要增加的产物处理步骤诸如合适的洗涤步骤。
如上所述,达到该水平的时间不是关键的,并且可随特定的微生物和所进行的发酵工艺而变化。然而,本领域熟知如何确定发酵培养基中的碳源浓度以及希望的碳源水平是否已经达到。
发酵可以分批或连续操作进行,为了易于控制、产生均一量的产物以及最经济地使用所有设备,分批补料操作是更为优选的。
如果需要,在将含水矿质培养基补料至发酵罐之前,可以将碳源和能源材料的部分或全部和/或可同化氮源(诸如氨)的部分添加至该含水矿质培养基。
优选以预定的速率,或者响应可通过监测诸如碳和能量底物的浓度、pH、溶解氧、来自发酵罐的废气中的氧或二氧化碳、通过干细胞重量可测量的细胞密度、光透射比等而确定的需求来控制引入反应器的每一种料流。各种材料的补料速率可以变化,以获得最大生产率和/或最大产率。
在分批操作或优选的补料分批操作中,一开始对所有的设备、反应器或发酵装置、器皿或容器、管道、附带的循环或冷却设备等进行灭菌,通常通过采用蒸汽诸如在约121℃持续至少约15分钟。然后在存在所有所需的营养素,包括氧和含碳底物的情况下,用所选微生物的培养物接种灭菌过的反应器。所用发酵罐类型并不重要。
从发酵肉汤收集和纯化(例如,纤维素酶)酶还可以通过本领域技术人员已知的程序进行。发酵肉汤将通常含有细胞碎片,包括细胞、多种悬浮固体和其他生物质污染物(优选将它们通过本领域已知的手段从发酵肉汤去除)以及希望的纤维素酶产物。
适用于这种去除的工艺包括常规的固体-液体分离技术,诸如像离心、过滤、透析、微量过滤、旋转真空过滤或其他已知的工艺,以产生无细胞滤液。可以优选地使用技术诸如超滤、蒸发或沉淀在结晶之前进一步浓缩发酵肉汤或无细胞滤液。
沉淀上清液或滤液的蛋白组分可以借助于盐(例如硫酸铵)来完成,然后通过各种色谱程序(例如离子交换色谱、亲和色谱或类似的本领域公认的程序)进行纯化。
VII.示例性实施例
本文公开的组合物和方法的非限制性实施例如下:
1.一种重组真菌细胞,其过表达与SEQ ID NO:1、4、7、10、12、15、18、21、23、25、28、30、33、36、39、42、45、48、51、54、56、59、62、65、68、71、74、77、79、82、84、87、90、94、97、99、101、105、108、110、113、116、119、122、125、128、131、134、137、140、144、147、149或152的里氏木霉基因包含至少80%同一性的基因。
2.一种重组真菌细胞,其过表达与表6中所示的基因序列包含至少80%同一性的基因。
3.一种重组真菌细胞,其过表达与SEQ ID NO:2、5、8、11、13、16、19、22、24、26、29、31、34、37、40、43、46、49、52、55、57、60、63、66、69、72、75、78、80、83、85、88、91、95、98、100、102、106、109、111、114、117、120、123、126、129、132、135、138、141、145、148、150或153的里氏木霉蛋白质包含至少80%同一性的蛋白质。
4.一种重组真菌细胞,其过表达与表6中所示的蛋白质包含至少80%同一性的蛋白质。
5.一种重组真菌细胞,其过表达与表4或表5中所示的里氏木霉基因序列组合包含至少80%同一性的至少两种基因的组合。
6.一种重组真菌细胞,其过表达与表4或表5中所示的里氏木霉蛋白质组合包含至少80%同一性的至少两种蛋白质的组合。
7.一种多核苷酸(例如,表达盒),其包含与编码蛋白质的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,所述蛋白质与SEQ ID NO:2、5、8、11、13、16、19、22、24、26、29、31、34、37、40、43、46、49、52、55、57、60、63、66、69、72、75、78、80、83、85、88、91、95、98、100、102、106、109、111、114、117、120、123、126、129、132、135、138、141、145、148、150或153的蛋白质包含至少80%序列同一性。
8.一种多核苷酸,其包含与编码蛋白质的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,所述蛋白质与表6中所示的蛋白质直系同源物包含至少80%序列同一性。
9.如实施例7或8所述的多核苷酸,其中所述上游启动子是组成型启动子或诱导型启动子。
10.如实施例7或8所述的多核苷酸,其进一步包含在编码蛋白质的核酸序列下游(3′)并且可操作地连接到编码蛋白质的核酸序列的终止子序列。
11.一种重组真菌细胞,其包含如实施例7或8所述的多核苷酸。
12.一种重组真菌细胞,其包含(a)如实施例7或8所述的多核苷酸,以及(b)编码目的蛋白(POI)的多核苷酸。
13.如实施例12所述的重组细胞,其中编码所述POI的所述多核苷酸包含与编码所述POI的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列。
14.一种重组真菌细胞,其产生目的蛋白(POI)并且过表达与SEQ ID NO:2、5、8、11、13、16、19、22、24、26、29、31、34、37、40、43、46、49、52、55、57、60、63、66、69、72、75、78、80、83、85、88、91、95、98、100、102、106、109、111、114、117、120、123、126、129、132、135、138、141、145、148、150或153的蛋白质包含至少80%同一性的蛋白质。
15.一种重组真菌细胞,其产生目的蛋白(POI)并且过表达由基因编码的蛋白质,该基因与表6中所示的基因序列包含至少80%同一性。
16.一种重组真菌细胞,其产生目的蛋白(POI)并且过表达与表4或表5中所示的里氏木霉基因序列的组合包含至少80%同一性的至少两种基因的组合。
17.一种重组真菌细胞,其产生目的蛋白(POI)并且过表达与表4或表5中所示的里氏木霉蛋白质的组合包含至少80%同一性的至少两种蛋白质的组合。
18.如实施例11-17中任一项所述的重组细胞,其中所述目的蛋白(POI)选自由以下组成的组:酶、抗体、受体蛋白、动物饲料蛋白和人类食品蛋白。
19.如实施例18所述的重组细胞,其中所述酶选自由以下组成的组:淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、过氧化物酶、蛋白酶、脂肪酶、磷脂酶、酯酶、角质酶、聚酯酶、植酸酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂加氧酶、木质酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、α-葡聚糖酶、β-葡聚糖酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、乙酰酯酶、氨肽酶、阿拉伯聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、核酸酶、脱氧核糖核酸酶、核糖核酸酶、差向异构酶、α-半乳糖苷酶、β-半乳糖苷酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡萄糖氧化酶、葡糖醛酸糖苷酶、转化酶和异构酶。
20.如实施例18所述的重组细胞,其中所述酶是选自由以下组成的组的淀粉酶:α-淀粉酶、β-淀粉酶、生麦芽糖α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、麦芽四糖苷酶和麦芽六糖苷酶。
21.一种重组真菌细胞,其过表达与SEQ ID NO:68包含至少80%同一性的蛋白质,其中相对于不过表达任何调节蛋白的对照真菌细胞,所述重组细胞包含改善的孢子形成表型。
22.一种用于在真菌细胞中产生增加量的异源目的蛋白(POI)的方法,所述方法包括:(a)构建(或获得)重组真菌细胞,所述重组真菌细胞包含编码目的蛋白(POI)的多核苷酸,其中所述多核苷酸包含与编码所述POI的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,(b)将多核苷酸引入所述细胞中,所述多核苷酸包含与编码蛋白质的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,所述蛋白质与SEQ ID NO:2、5、13、16、19、24、26、31、34、40、49、55、57、60、63、66、69、75、85、88、95、98、100、102、106、111、114、117、123、129,132、135、138、141、145、148、150或153的蛋白质包含至少80%序列同一性,或者所述蛋白质与表6中所示的蛋白质直系同源物包含至少80%同一性,以及(c)发酵所述重组细胞,其中当在用于产生所述POI的相同条件下发酵所述细胞时,相对于步骤(a)的重组细胞,步骤(b)的重组细胞产生增加量的所述POI。
23.一种用于在真菌细胞中产生增加量的异源目的蛋白(POI)的方法,所述方法包括:(a)构建(或获得)重组真菌细胞,所述重组真菌细胞包含编码POI的多核苷酸,其中所述多核苷酸包含与编码所述POI的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,(b)将多核苷酸引入所述细胞中,所述多核苷酸包含与编码蛋白质的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,所述蛋白质与SEQ ID NO:SEQ ID NO:5、8、11、16、19、22、24、29、31、37、43、46、52、55、57、66、69、72、75、78、80、83、85、91、95、100、102、106、109、114、117、120、123、126或129的蛋白质包含至少80%序列同一性,或者所述蛋白质与表6中所示的蛋白质直系同源物包含至少80%同一性,以及(c)在升高的发酵温度下发酵所述重组细胞,其中当在用于产生所述POI的相同条件下发酵所述细胞时,相对于步骤(a)的重组细胞,步骤(b)的重组细胞产生增加量的所述POI。
24.一种用于在真菌细胞中产生增加量的异源目的蛋白(POI)的方法,所述方法包括:(a)构建(或获得)重组真菌细胞,所述重组真菌细胞过表达与表4或表5中所示的蛋白质序列组合包含至少80%同一性的至少两种蛋白质的组合,(b)将编码POI的多核苷酸引入所述细胞中,其中所述多核苷酸包含与编码所述POI的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,以及(c)发酵所述细胞,其中当在用于产生所述POI的相同条件下发酵时,相对于对照细胞,所述重组细胞产生增加量的所述POI,其中对照细胞包含编码所述POI的表达盒,但不过表达至少两种基因的组合。
25.如实施例22-24中任一项所述的方法,其中将编码所述POI的所述多核苷酸整合到所述真菌细胞的基因组中,并且/或者将编码所述调节蛋白的所述多核苷酸整合到所述真菌细胞的基因组中。
26.如实施例22-24中任一项所述的方法,其中所述目的蛋白(POI)选自由以下组成的组:酶、抗体、受体蛋白、动物饲料蛋白和人类食品蛋白。
27.如实施例26所述的方法,其中所述酶选自由以下组成的组:淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、过氧化物酶、蛋白酶、脂肪酶、磷脂酶、酯酶、角质酶、聚酯酶、植酸酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂加氧酶、木质酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、α-葡聚糖酶、β-葡聚糖酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、乙酰酯酶、氨肽酶、阿拉伯聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、核酸酶、脱氧核糖核酸酶、核糖核酸酶、差向异构酶、α-半乳糖苷酶、β-半乳糖苷酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡萄糖氧化酶、葡糖醛酸糖苷酶、转化酶和异构酶。
28.如实施例26所述的方法,其中所述酶是选自由以下组成的组的淀粉酶:α-淀粉酶、β-淀粉酶、生麦芽糖α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、麦芽四糖苷酶和麦芽六糖苷酶。
29.一种用于增强真菌细胞的孢子形成的方法,所述方法包括(a)构建或获得重组真菌细胞,所述重组真菌细胞过表达与SEQ ID NO:68包含至少80%同一性的蛋白质,以及(b)使菌株在适当的孢子形成条件(包括但不限于营养培养基、温度和光照等条件)下生长,其中与不过表达所述蛋白质的对照真菌细胞相比,所述重组细胞包含增强的孢子形成表型,所述蛋白质与SEQ ID NO:68包含至少80%同一性。
实例
应理解,尽管以下实例说明了本公开的实施例,但仅是通过说明的方式给出的。从上述讨论和这些实例,本领域技术人员可以对本公开进行各种改变和修改以使其适应各种用途和条件。这样的修改也旨在落入请求保护的发明的范围内。本文使用的标准重组DNA和分子克隆技术是本领域熟知的(Ausubel等人,1987;Sambrook等人,1989)。
实例1
丝状真菌细胞中调节蛋白过表达文库的构建
A.概述
如上文具体实施方式中总体上阐述,调节蛋白是特定细胞功能(例如信号传导、趋化性、运输、代谢调节、基因表达、蛋白质降解)的关键调节因子。许多调节蛋白典型地通过与(调节的)基因的启动子区域中的特定(靶)位点结合来调节基因表达。本实例总体上描述了示例性里氏木霉报告菌株及其过表达调节蛋白(表1)或其两种调节蛋白的组合的经修饰的(重组)菌株的设计和构建。
B.里氏木霉报告菌株
以下实例中所阐述和描述的里氏木霉宿主细胞衍生自里氏木霉菌株RL-P37(NRRL保藏号15709),其中已缺失里氏木霉pyr2基因(Δpyr2),如Sheir-Neiss和Montenecourt(1984)通常描述的。
在里氏木霉cbh1调节序列的控制下,将里氏木霉宿主细胞进一步修饰以过表达两(2)种报告蛋白,(i)来自布丘氏菌属物种的工程化植酸酶以及(ii)来自土曲霉的α-淀粉酶。例如,将携带编码上述报告蛋白的合成基因的DNA构建体与可操作地连接到构建体之一的来自构巢曲霉的选择性标记amdS一起共转化。通过PCR扩增验证了正确的克隆,这证实了基因组中存在两种基因(即合成DNA构建体)。通过发酵肉汤的酶活性测量来证实异源报告蛋白的产生和功能性。
C.调节蛋白表达载体的构建
在本实例中,申请人鉴定了超过750种调节蛋白,这些调节蛋白是使用生物信息学工具从里氏木霉QM6a菌株的JGI数据库中选择的。对于一些基因,确定了可替代的起始密码子和/或终止密码子。在这样的情况下,选择基因的不同推定变体用于过表达。根据制造商的方案,从野生型QM6a菌株(ATCC13631)的基因组DNA中对所选基因进行PCR扩增,并且使用无缝克隆和组装试剂盒(英杰公司(Invitrogen))将其克隆到在来自构巢曲霉的gpdA启动子的控制下的pBKT030(图1)载体中。载体进一步包含来自里氏木霉的cbh1终止子、用于选择里氏木霉转化体的pyr2标记与其天然启动子和终止子、以及上游和下游同源重组区,以使得过表达盒能够在里氏木霉报告宿主中的所选基因座处进行靶向整合。
D.用单一调节蛋白过表达盒对里氏木霉的转化
线性盒包含编码调节蛋白的基因、gpdA启动子、cbh1终止子、pyr2标记与其天然启动子和终止子、以及大约一(1)kb长的上游和下游同源重组侧翼,从基于pBKT030的质粒组中对该线性盒进行PCR扩增并将其转化至报告菌株中。如PCT公开号WO 2013/102674(通过引用以其全文并入本文)中所述进行原生质体的制备和转化。
使用Crispr-Cas9技术介导将表达盒整合到报告菌株的基因组中,以在刺激DNA修复的特定基因组位置处产生双链断裂(DSB)。在真菌细胞中,DSB是经由体外组装的RNP复合物产生的,这些复合物可以在限定的基因座中特异性切割里氏木霉基因组。将调节蛋白过表达盒整合到基因座中,包括用于选择转化体的pyr2标记。根据供应商(Synthego公司,美国)的建议,Cas9核酸酶EnGenSpy Cas9 NLS(新英格兰生物实验室公司(New EnglandBioLabs,Inc))和用tracrRNA退火的合成crRNA之间以1:1摩尔比形成RNP复合物。为了进行转化,将四(4)μl的RNP复合物与从适当质粒扩增的1-3μg过表达盒混合,该过表达盒与侧翼一起靶向整合到3号染色体中。
将两(2)个独立的转化体划线到选择性培养基板上。通过PCR筛选生长克隆是否正确整合。总共获得了691个过表达调节蛋白的菌株,并针对改善的特征进行筛选。
如下表1中所示,里氏木霉基因序列(DNA SEQ)在编码的调节蛋白序列(蛋白质SEQ)之前,例如,SEQ ID NO:1的DNA序列编码SEQ ID NO:2的调节蛋白,SEQ ID NO:4的DNA序列编码SEQ ID NO:5的调节蛋白,SEQ ID NO:7的DNA序列编码SEQ ID NO:8的调节蛋白等。如表1中所示,如果调节蛋白中存在DNA结合结构域序列(DBD SEQ),则DBD序列呈现在调节蛋白序列(蛋白质SEQ)的右侧,例如,SEQ ID NO:2的调节蛋白包含SEQ ID NO:3的DBD,SEQ ID NO:91的调节蛋白包含SEQ ID NO:92的DBD和SEQ ID NO:93的DBD。
表1编码调节蛋白的里氏木霉基因(DNA)序列
E.双调节蛋白过表达盒的构建和转化
应用分裂的pyr2标记方法以同时过表达两(2)种调节蛋白。双过表达盒的第一部分获得自先前构建的载体(实例1C),其中pyr2标记位于编码调节蛋白的基因的下游。将调节蛋白的编码序列与gpdA启动子和cbh1终止子、与整合基因座的上游侧翼同源的区域、以及pyr2标记的5′部分及其天然启动子一起进行PCR扩增。
将先前构建的基于pBKT030的表达质粒组(实例1C)用作模板来PCR扩增调节蛋白基因以及gpdA启动子和cbh1终止子,随后将其克隆到pI载体(描述于PCT公开号WO 2021/102238)中,位于pyr2标记的下游。根据制造商的方案,使用无缝克隆和组装试剂盒(英杰公司)进行克隆。
双过表达盒的第二部分获得自包含编码调节蛋白的基因的pI衍生载体组。将调节蛋白的编码序列与gpdA启动子和cbh1终止子,以及与整合基因座的下游侧翼同源的区域、和pyr2标记的3'部分及其天然终止子一起扩增。
将双过表达盒的两(2)个分开的部分(每个部分包含编码单一调节蛋白的一个基因)以不同的组合转化至报告菌株中,如实例1D中所述。将每个组合的两(2)个转化体划线到选择性培养基板上。通过PCR分析生长克隆是否正确整合。总共获得了134株过表达两种相同或两种不同调节蛋白的菌株,并针对改善的特征进行筛选,如下文实例中所述。
实例2
接种物的制备、蛋白质产生和样品的制备
将十(10)μL孢子悬浮液接种到二十四(24)孔聚苯乙烯板( CLS3527)中,该板具有1mL生产培养基(7g/L(NH4)2SO4、4.7g/L KH2PO4、1g/L MgSO4·7H2O、0.6g/L CaCl2·2H2O、33g/L PIPPS缓冲液(pH 5.5)、0.25%里氏木霉微量元素;175g/LC6H8O7、200g/L FeSO4·7H2O、16g/L ZnSO4·7H2O、3.2g/L CuSO4·5H2O、1.4g/L MnSO4·H2O和0.8g/L H3BO3)以及作为碳源的1.6%(w/w)葡萄糖。将板在28℃、200rpm(50mm幅度)、80%湿度下孵育二十四(24)小时。将一百(100)μL的培养液用于生产板的接种。
将里氏木霉生产培养物在二十四(24)孔聚苯乙烯板( CLS3527)中生长或者配置为例如从固体、多孔基质释放乳糖的板中生长。每孔含有1.2mL的生产培养基。在聚苯乙烯板的情况下,将最终浓度为2%(w/w)的葡萄糖/槐糖混合物用作碳源。在乳糖释放板的情况下,将1.6%(w/w)葡萄糖添加到生产培养基中。将板在28℃或34℃、200rpm(50mm幅度)、80%湿度下孵育。
孵育120小时后进行取样。收集八百(800)μL的培养物并用0.45μM PALL AcroPrep96孔过滤板过滤。将获得的上清液用于总蛋白和酶活性测量。
实例3
酶活性测量
使用牛血清白蛋白(BSA)作为标准,通过伯乐公司(BioRad)Bradford测定确定培养物上清液中的总蛋白浓度。
根据制造商的方案,使用α-淀粉酶测定试剂盒(Ceralpha方法,麦格酶公司(Megazyme))测量培养物上清液中的α-淀粉酶活性。
使用赛默飞世尔科技公司(ThermoFisher Scientific)的对硝基苯磷酸盐(PNPP)作为底物来确定植酸酶活性。在含有0.025%(w/v)Tween-20和0.0075g/L CaCl2的100mM乙酸盐缓冲液(pH 5.5)中制备十(10)mM PNPP溶液。通过将在100mM乙酸盐缓冲液(pH 5.5)中制备的四(4)μL的适当上清液稀释液添加到九十六(96)孔微量滴定板(Costar平底PS3641)中的四十六(46)μL的PNPP底物溶液中来测量植酸酶活性。将微量滴定板密封并在37℃以900rpm连续振荡孵育十(10)分钟。通过添加四十五(45)μL的淬灭缓冲液(2N NaOH)来终止酶促反应。在分光光度计中在405nm处测量板的吸光度(终点)。
为了计算性能指数(PI),将过表达调节蛋白的菌株测量的(平均)酶活性除以不过表达任何调节蛋白的报告菌株测量的(平均)酶活性。
实例4
在28℃改善的蛋白质产生
对上述所有六百九十一(691)个调节蛋白过表达突变体(实例1D)进行筛选,以在各种条件下改善蛋白质产生。通过酶活性测定(例如,参见实例3)来测量蛋白质生产力。
更特别地,下表2阐述了调节蛋白的过表达导致在乳糖释放板中在28℃在孵育一百二十(120)小时后一种或两种报告蛋白(即,α-淀粉酶和/或植酸酶报告子)的酶活性增加,其中数值代表相对于不过表达任何调节蛋白的对照报告菌株针对α-淀粉酶酶促测定(α-淀粉酶)和植酸酶酶促测定(植酸酶)计算的性能指数(PI)。
表2
导致在乳糖释放板中在28℃蛋白质产生增加的调节蛋白过表达
NS;与参考值无统计学显著差异
例如,如表2中所示,当在乳糖释放条件下在28℃发酵时,过表达包含SEQ ID NO:1、4、12、15、18、23、25、30、33、39、48、54、56、59、62、65、68、74、84、87、94、97、99、101、105、110、113、116、122、128或131的里氏木霉基因(DNA)序列(即,编码分别包含SEQ ID NO:2、5、13、16、19、24、26、31、34、40、49、55、57、60、63、66、69、75、85、88、95、98、100、102、106、111、114、117、123、129或132的调节蛋白)的突变型(重组)细胞表现出增强的蛋白质生产力表型(即,相对于亲本/对照细胞)。更特别地,在这样的乳糖释放条件下,过表达前述调节蛋白(表1)的这样的重组细胞产生增加量的α-淀粉酶和/或植酸酶报告蛋白(相对于对照细胞)。
实例5
在34℃改善的蛋白质产生
在本实例中,申请人对六百九十一(691)个调节蛋白过表达突变体的子集进行筛选,以确定任何过表达的调节蛋白是否进一步导致在34℃的较高培养温度下改善蛋白质产生。通过酶活性测定(例如,参见实例3)来测量蛋白质生产力。
例如,表3中阐述了调节蛋白的过表达导致在乳糖释放板中在34℃下在孵育一百二十(120)小时后α-淀粉酶和/或植酸酶报告蛋白的酶活性增加,其中数值代表相对于不过表达任何调节蛋白的对照报告菌株针对α-淀粉酶酶促测定(α-淀粉酶)和植酸酶酶促测定(植酸酶)计算的性能指数(PI)。
表3
在乳糖释放板中在34℃导致蛋白质产生增加的调节蛋白过表达
NS;与参考值无统计学显著差异。
例如,如表3中所示,当在乳糖释放条件下在34℃发酵时,过表达包含SEQ ID NO:4、7、10、15、18、21、23、28、30、36、42、45、51、54、56、65、68、71、74、77、79、82、84、90、94、99、101、105、108、113、116、119、122、125或128的里氏木霉基因(DNA)序列(即,编码分别包含SEQ ID NO:SEQ ID NO:5、8、11、16、19、22、24、29、31、37、43、46、52、55、57、66、69、72、75、78、80、83、85、91、95、100、102、106、109、114、117、120、123、126或129的调节蛋白)的突变型(重组)细胞表现出增强的蛋白质生产力表型(即,相对于亲本/对照细胞)。更特别地,在这样的乳糖释放条件下,过表达前述调节蛋白(表3)的这样的重组细胞产生增加量的α-淀粉酶和/或植酸酶报告蛋白(相对于对照细胞)。
实例6
导致在28℃蛋白质产生改善的两种调节蛋白的同时过表达
在本实例中,对一百三十四(134)个重组菌株进行筛选,每个重组菌株过表达两种不同的调节蛋白,或两种相同的调节蛋白(实例1E),以在各种条件下改善蛋白质产生。通过酶活性测定(例如,参见实例3)来测量蛋白质生产力。
更特别地,下表4中阐述了两种调节蛋白的组合的过表达导致在乳糖释放板中在28℃在孵育一百二十(120)小时后α-淀粉酶报告蛋白的酶活性增加,其中数值代表相对于不过表达任何调节蛋白的对照报告菌株针对α-淀粉酶酶促测定(α-淀粉酶)计算的性能指数(PI)。
表4
导致在乳糖释放板中在28℃蛋白质产生增加的两种调节蛋白的同时过表达
表4(续)
导致在乳糖释放板中在28℃蛋白质产生增加的两种调节蛋白的同时过表达
如表4中所示,当在乳糖释放条件下在28℃发酵时,同时过表达SEQ ID NO:4和30、SEQ ID NO:4和94、SEQ ID NO:4和97、SEQ ID NO:4和99、SEQ ID NO:12和12、SEQ ID NO:12和30、SEQ ID NO:12和68、SEQ ID NO:23和101、SEQ ID NO:23和113、SEQ ID NO:23和12、SEQ ID NO:23和4、SEQ ID NO:23和94、SEQ ID NO:23和97、SEQ ID NO:23和99、SEQ ID NO:25和101、SEQ ID NO:25和12、SEQ ID NO:25和30、SEQ ID NO:25和65、SEQ ID NO:25和68、SEQ ID NO:25和94、SEQ ID NO:30和12、SEQ ID NO:30和23、SEQ ID NO:30和30、SEQ IDNO:30和65、SEQ ID NO:30和68、SEQ ID NO:30和94、SEQ ID NO:30和97、SEQ ID NO:30和99、SEQ ID NO:65和12、SEQ ID NO:65和30、SEQ ID NO:65和4、SEQ ID NO:65和65、SEQ IDNO:65和68、SEQ ID NO:65和94、SEQ ID NO:65和97、SEQ ID NO:65和99、SEQ ID NO:87和30、SEQ ID NO:94和30、SEQ ID NO:94和68、SEQ ID NO:94和94、SEQ ID NO:97和12、SEQ IDNO:97和23、SEQ ID NO:97和30、SEQ ID NO:97和4、SEQ ID NO:97和68、SEQ ID NO:97和94、SEQ ID NO:97和97、SEQ ID NO:97和99、SEQ ID NO:99和30、SEQ ID NO:99和65、SEQ IDNO:99和68、SEQ ID NO:99和97、SEQ ID NO:110和30、SEQ ID NO:110和65、SEQ ID NO:110和68、SEQ ID NO:128和101、SEQ ID NO:128和12、SEQ ID NO:128和94、或SEQ ID NO:128和97的里氏木霉基因(DNA)序列组合的突变型(重组)细胞表现出增强的蛋白质生产力表型(即,相对于亲本/对照细胞)。更特别地,在这样的乳糖释放条件下,过表达前述两种调节蛋白的组合(表4)的这样的重组细胞产生增加量的α-淀粉酶报告子(相对于对照细胞)。
同样,下表5中阐述了两种调节蛋白的组合的过表达导致在具有2%(w/w)葡萄糖/槐糖作为碳源的聚苯乙烯板中在28℃在孵育一百二十(120)小时后α-淀粉酶报告蛋白的产生增加,其中数值代表相对于不过表达任何调节蛋白的对照报告菌株针对α-淀粉酶酶促测定(α-淀粉酶)计算的性能指数(PI)。
表5
导致在28℃、使用2%(w/w)葡萄糖/槐糖作为碳源情况下蛋白质产生增加的两种调节蛋白的同时过表达
因此,如上文表5所示,当在28℃用2%(w/w)葡萄糖/槐糖作为碳源发酵时,同时过表达SEQ ID NO:12和101、SEQ ID NO:12和128、SEQ ID NO:12和23、SEQ ID NO:12和65、SEQID NO:12和99、SEQ ID NO:25和101、SEQ ID NO:30和101、SEQ ID NO:30和12、SEQ ID NO:30和23、SEQ ID NO:30和65、SEQ ID NO:30和94、SEQ ID NO:30和97、SEQ ID NO:87和113、SEQ ID NO:87和99、SEQ ID NO:94和101、SEQ ID NO:94和12、SEQ ID NO:94和23、SEQ IDNO:94和30、SEQ ID NO:94和4、SEQ ID NO:94和68、SEQ ID NO:94和94、SEQ ID NO:94和99、SEQ ID NO:97和101、SEQ ID NO:97和113、SEQ ID NO:97和30、SEQ ID NO:97和99、SEQ IDNO:99和101、SEQ ID NO:99和12、SEQ ID NO:99和23、SEQ ID NO:99和30、SEQ ID NO:99和65、SEQ ID NO:99和68、SEQ ID NO:99和94、SEQ ID NO:99和97、SEQ ID NO:99和99、或SEQID NO:110和101的里氏木霉基因(DNA)序列组合的突变型(重组)细胞表现出增强的蛋白质生产力表型(即,相对于亲本/对照细胞)。例如,在这样的葡萄糖/槐糖条件下,过表达前述两种调节蛋白的组合(表5)的重组细胞产生增加量的α-淀粉酶报告子(相对于亲本细胞)。
实例7
小规模补料分批发酵中的蛋白质产生
在使用槐糖作为诱导底物(以恒定补料速率)的两(2)L生物反应器中(在补料分批发酵中)评估过表达单一调节蛋白(实例4和实例5)或两种调节蛋白(实例6)的里氏木霉菌株的子集。更特别地,如美国专利号7,713,725(通过引用以其全文并入本文)中通常描述的使用种子培养物在柠檬酸盐基本培养基中进行里氏木霉发酵。在发酵过程中,在不同时间点收获所有培养物的上清液并通过酶活性测定进行分析,如上文实例3中所述。
实例8
通过调节蛋白的过表达改善发酵中的蛋白质产生
在小规模补料分批发酵中进一步评估过表达SEQ ID NO:31、SEQ ID NO:66、SEQID NO:69、或SEQ ID NO:102的调节蛋白的里氏木霉突变型(重组)菌株,如实例4中所述。例如,图2表示在整个发酵过程中重组菌株相对于对照报告菌株(不过表达任何调节蛋白)的酶产生,其中如上文实例3中所述通过酶活性测定测量蛋白质生产力。更特别地,如图2中所示,所有评估的突变型菌株均展现出改善的蛋白质产生。
实例9
通过两种调节蛋白的同时过表达改善发酵中的蛋白质产生
在小规模补料分批发酵中评估过表达SEQ ID NO:66和SEQ ID NO:69、SEQ ID NO:31和SEQ ID NO:66、SEQ ID NO:31和SEQ ID NO:69、SEQ ID NO:100和SEQ ID NO:69、或SEQID NO:100和SEQ ID NO:66的调节蛋白组合的里氏木霉突变型(重组)菌株,如实例7中所述。更特别地,图3表示与不过表达任何调节蛋白的对照报告菌株相比,基于酶活性测定(例如,参见实例3)的突变型菌株的酶产生。如图3中所示,五种评估的突变型(重组)菌株在整个发酵过程中展现出比对照菌株更高的蛋白质生产力。
实例10
真菌调节蛋白直系同源物
在本实例中,申请人已经对针对真菌物种里氏木霉(GCF_000167675.1)、喜热梭孢壳(GCF_000226095.1)、米曲霉(GCF_000184455.2)、解脂耶氏酵母(Yarrowia lipolytica)(GCF_000002525.2)、巴斯德驹田氏酵母(Komagataella pastoris)(GCA_001708105.1)、酿酒酵母(Saccharomyces cerevisiae)(GCF_000146045.2)、粟酒裂殖酵母(Schizosaccharomyces pombe)(GCF_000002945.1)、和黑曲霉(GCF_000002855.3)的SEQID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:16、SEQ IDNO:19、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:34、SEQ ID NO:37、SEQ ID NO:40、SEQ ID NO:43、SEQ ID NO:46、SEQ ID NO:49、SEQ IDNO:52、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:60、SEQ ID NO:63、SEQ ID NO:66、SEQ IDNO:69、SEQ ID NO:72、SEQ ID NO:75、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:83、SEQ IDNO:85、SEQ ID NO:88、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:98、SEQ ID NO:100、SEQID NO:102、SEQ ID NO:106、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:114、SEQ ID NO:117、SEQ ID NO:120、SEQ ID NO:123、SEQ ID NO:126、SEQ ID NO:129和SEQ ID NO:132进行基于同源性的检索。如下所示,表6列出了针对这些所选的真菌物种组鉴定的直系同源物。
表6调节蛋白直系同源物
表6调节蛋白直系同源物(续)
表6调节蛋白直系同源物(续)
表6调节蛋白直系同源物(续)
表6调节蛋白直系同源物(续)
表6调节蛋白直系同源物(续)
表6调节蛋白直系同源物(续)
表6调节蛋白直系同源物(续)
实例11
通过过表达调节蛋白对孢子形成的改善
在本实例中,将过表达调节蛋白SEQ ID NO:68的重组菌株和对照菌株(即,不过表达任何调节蛋白)在琼脂板基本培养基(20g/L琼脂、7g/L(NH4)2SO4、4.7g/L KH2PO4、1g/LMgSO4·7H2O、0.6g/L CaCl2·2H2O(pH 5.5)、0.25%里氏木霉微量元素;175g/L C6H8O7、200g/L FeSO4·7H2O、16g/L ZnSO4·7H2O、3.2g/L CuSO4·5H2O、1.4g/L MnSO4·H2O和0.8g/L H3BO3)(含有2.0%(w/w)葡萄糖作为碳源)上进行铺板。将板在光照培养箱(12h/12h光照周期)中在28℃孵育72小时。例如,如图4中所示,过表达SEQ ID NO:68的调节蛋白的重组菌株显示出比对照菌株更高的孢子形成水平。
实例12
通过过表达调节蛋白对背景蛋白酶活性的提高
在本实例中,监测上述所有六百九十一(691)种调节蛋白过表达突变体(实例4)的内源蛋白水解活性的增加。更特别地,将在28℃从含有乳糖的生产培养基产生的发酵样品点样到含有1%酪蛋白的指示剂琼脂板上。根据供应商的建议,使用Pierce蛋白酶测定试剂盒23263(赛默科技公司(Thermo Scientific))定量测量因降解酪蛋白沉淀而形成视觉晕圈的样品的蛋白水解活性。在两(2)种不同pH测量蛋白水解活性,并参考对照菌株的蛋白水解活性。
如下表7中所示,过表达调节蛋白SEQ ID NO:4、SEQ ID NO:99、SEQ ID NO:134、SEQ ID NO:137、SEQ ID NO:140、SEQ ID NO:144、SEQ ID NO:147、SEQ ID NO:149和SEQ IDNO:152的重组菌株显示出增加的背景蛋白水解活性,表明上述调节因子参与蛋白酶基因表达的调节。申请人在本文中考虑表7中所阐述的一种或多种调节基因的遗传修饰(例如,缺失、破坏等)可用于减少/减轻特别易受蛋白水解降解影响的目的蛋白的蛋白水解。
表7
过表达由SEQ识别号表示的调节蛋白的菌株发酵培养物中的相对蛋白酶活性
参考文献
EPO Publication No.0215594
PCT Publication No.WO 2021/102238
PCT Publication No.WO 2008/097619
PCT Publication No.WO 2005/056772
PCT Publication No.WO 2008/080017
PCT Publication No.WO 2011/151512
PCT Publication No.WO 2011/151513
PCT Publication No.WO 2011/151515
PCT Publication No.WO 2011/153449
PCT Publication No.WO 2013/102674
PCT Publication No.WO 2014/093275
PCT Publication No.WO 2016/100272
U.S.Patent No.6,022,725
U.S.Patent No.6,255,115
U.S.Patent No.6,268,328
Aro et al.,“Transcriptional regulation of plant cell wall degradationby filamentous fungi”FEMS Microbiology Reviews 29:719-739.2005.
Ausubel et al.,“Current Protocols in Molecular Biology,published byGreene Publishing Assoc.and Wiley-Interscience(1987,1989and 2003).
Boel et al.,“Two different types of intervening sequences in theglucoamylase gene from Aspergillus niger”,EMBO J.3:1581-1585,1984.
Campbell et al.,Curr.Genet.,16:53-56,1989.
Cao et al.,“Penicillopepsin-JT2,a recombinant enzyme from Penicilliumjanthinellum and the contribution of a hydrogen bond in subsite S3 to kcat”,Protein Science(9):991-1001,2000.
Devereux et al.,Nucleic Acids Res.12:387-395,1984.
Druzhinina and Kubicek,“Genetic engineering of T.reesei cellulasesand their production”,Microb.Biotechnol.10,1485–1499,2017.
Fitz et al.“The Promoter Toolbox for Recombinant Gene Expression inTrichoderma reesei”,Frontiers in Bioengineering and Biotechnology,Volume 6,Article 135,2018.
Harkki et al.,“A Novel Fungal Expression System:Secretion of ActiveCalf Chymosin from the Filamentous Fungus Trichoderma reesei”,BioTechnol.,7:596-603,1989.
Harkki et al.,“Genetic engineering of Trichoderma to produce strainswith novel cellulase profiles”,Enzyme Microb.Technol.,13:227-233,1991.
Ilmen et al.,“Regulation of cellulase gene expression in thefilamentous fungus Trichoderma reesei”,Applied and EnvironmentalMicrobiology,63(4)-1298-1306,1997.
Kriegler,Gene Transfer and Expression:A Laboratory Manual,1990.
Kubicek et al.,“Metabolic engineering strategies for the improvementof cellulase production by Hypocrea jecorina”,Biotechnol.Biofuels 2:19,2009.
Latchman,“Transcription factors:an overview”,Int.J.Exp.Path.,74,417-422,1993.
Lever,“A new reaction for colorimetric determination ofcarbohydrates”,Anal.Biochem.,47:273-279,1972.
Li,Wan-Chen et al.“Trichoderma reesei complete genome sequence,repeat-induced point mutation,and partitioning of CAZyme gene clusters.”Biotechnology for biofuels Vol.10(170),2017.
Mullaney et al.,“Primary structure of the trpC gene from Aspergillusnidulans”,Molecular and General Genetics 199:37-45,1985.
Needleman and Wunsch,“A general method applicable to the search forsimilarities in the amino acid sequence of two proteins”,J.Mol.Biol.48:443-453,1970.
Nordberg et al.,“The genome portal of the Department of Energy JointGenome Institute:2014 updates”,Nucleic Acids Res.,42(1):D26-31,2014.
Nunberg et al.,“Molecular cloning and characterization of theglucoamylase gene of Aspergillus awamori”,Mol.Cell Biol.4:2306,1984.
Pearson and Lipman,Proc.Natl.Acad.Sci.USA 85:2444,1988.
Portnoy et al.,“Differential Regulation of the CellulaseTranscription Factors XYR1,ACE2,and ACE1 in Trichoderma reesei StrainsProducing High and Low Levels of Cellulase”,Eukaryotic Cell,10(2):262-271,2011.
Rice et al.,“EMBOSS:The European Molecular Biology Open SoftwareSuite”,Trends in Genetics 16:276-277,2000.
Sambrook et al.,Molecular Cloning,A Laboratory Manual,2nd Edition,ColdSpring Harbor Laboratory Press,Cold Spring,New York,1989.
Sambrook et al.,Molecular Cloning,A Laboratory Manual,4th Edition,ColdSpring Harbor Laboratory Press,Cold Spring,New York,2012.
Sheir-Neiss and Montenecourt,"Characterization of the secretedcellulases of Trichoderma reesei wild type and mutants during controlledfermentations",Applied Microbiology and Biotechnology,20(1):46-53,1984.
Smith and Waterman,Adv.Appl.Math.2:482,1981.
Stricker et al.,“Regulation of transcription of cellulases-andhemicellulases-encoding genes in Aspergillus niger and Hypocrea jecorina(Trichoderma reesei),Appl.Microbiol.Biotechnol.(Review),78(2):211-220,2008.
Wang et al.,“Fermentation&Enzyme Technology”,John Wiley&Sons,1979.
Wood,“The cellulase of Fusarium solani.Purification and specificityof theβ-(1→4)-glucanase and theβ-d-glucosidase components”,Biochem.J.,121:353-362,1971.
Wu et al.,“The regulatory and transcriptional landscape associatedwith carbon utilization in a filamentous fungus”,PNAS,117(11):6003-6013,2020.
Yelton et al.,“Transformation of Aspergillus nidulans by using a trpCplasmid”,PNAS USA 81:1470-1474,1984.
Claims (32)
1.一种重组真菌细胞,其过表达与表1中所示的里氏木霉(Trichoderma reesei)基因包含至少80%同一性的基因。
2.一种重组真菌细胞,其过表达与表6中所示的直系同源基因包含至少80%同一性的基因。
3.一种重组真菌细胞,其过表达与表1中所示的里氏木霉蛋白质包含至少80%同一性的蛋白质。
4.一种重组真菌细胞,其过表达与表6中所示的蛋白质直系同源物包含至少80%同一性的蛋白质。
5.一种重组真菌细胞,其过表达与表1中所示的里氏木霉基因包含至少80%同一性的至少两种基因的组合。
6.一种重组真菌细胞,其过表达与表6中所示的直系同源基因包含至少80%同一性的至少两种基因的组合。
7.一种重组真菌细胞,其过表达与表1中所示的里氏木霉蛋白质包含至少80%同一性的至少两种蛋白质的组合。
8.一种重组真菌细胞,其过表达与表6中所示的蛋白质直系同源物包含至少80%同一性的至少两种蛋白质的组合。
9.一种重组真菌细胞,其过表达与表1中所示的DNA结合结构域(DBD)包含至少80%同一性的一种或多种蛋白质。
10.一种重组真菌细胞,其过表达与SEQ ID NO:68包含至少80%同一性的蛋白质,其中所述重组细胞包含增强的孢子形成表型。
11.一种多核苷酸,其包含与编码调节蛋白的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,所述调节蛋白与表1中所示的蛋白质包含至少80%序列同一性。
12.一种多核苷酸,其包含与编码蛋白质的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列,所述蛋白质与表6中所示的蛋白质直系同源物包含至少80%序列同一性。
13.如权利要求11或12所述的多核苷酸,其中所述上游启动子是组成型启动子或诱导型启动子。
14.如权利要求11或12所述的多核苷酸,其进一步包括在编码所述调节蛋白的核酸序列下游(3′)并且可操作地连接到编码所述调节蛋白的核酸序列的终止子序列。
15.一种重组真菌细胞,其包含如权利要求11或12所述的多核苷酸。
16.一种重组真菌细胞,其包含如权利要求11或12所述的多核苷酸,并且包含编码目的蛋白(POI)的多核苷酸。
17.如权利要求16所述的重组细胞,其中编码所述POI的所述多核苷酸包含与编码所述POI的下游(3′)核酸序列可操作地连接的上游(5′)启动子序列。
18.一种重组真菌细胞,其产生目的蛋白(POI)并且过表达与表1中所示的蛋白质包含至少80%同一性的一种或多种蛋白质。
19.一种重组真菌细胞,其产生目的蛋白(POI)并且过表达与表6中所示的蛋白质包含至少80%同一性的一种或多种蛋白质。
20.一种重组真菌细胞,其产生目的蛋白(POI)并且过表达与表4或表5中所示的里氏木霉蛋白质序列组合包含至少80%同一性的至少两种蛋白质的组合。
21.如权利要求16-20中任一项所述的重组真菌细胞,其中所述目的蛋白(POI)选自由以下组成的组:酶、抗体、受体蛋白、动物饲料蛋白和人类食品蛋白。
22.如权利要求21所述的重组真菌细胞,其中所述酶选自由以下组成的组:淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、过氧化物酶、蛋白酶、脂肪酶、磷脂酶、酯酶、角质酶、聚酯酶、植酸酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂加氧酶、木质酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、α-葡聚糖酶、β-葡聚糖酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、乙酰酯酶、氨肽酶、阿拉伯聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、核酸酶、脱氧核糖核酸酶、核糖核酸酶、差向异构酶、α-半乳糖苷酶、β-半乳糖苷酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡萄糖氧化酶、葡糖醛酸糖苷酶、转化酶和异构酶。
23.如权利要求20所述的重组真菌细胞,其中所述POI是选自由以下组成的组的淀粉酶:α-淀粉酶、β-淀粉酶、生麦芽糖α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、麦芽四糖苷酶和麦芽六糖苷酶。
24.一种用于在真菌细胞中产生增加量的异源目的蛋白(POI)的方法,所述方法包括:
(a)构建或获得重组真菌细胞,所述重组真菌细胞包含编码目的蛋白(POI)的多核苷酸,
(b)将包含与编码蛋白质的下游(3′)核酸序列可操作地连接的上游(5′)启动子的多核苷酸引入所述细胞中,所述蛋白质与表1中所示的蛋白质包含至少80%序列同一性,以及
(c)发酵所述重组细胞,
其中当在用于产生所述POI的相同条件下发酵所述细胞时,相对于步骤(a)的重组细胞,步骤(b)的重组细胞产生增加量的所述POI。
25.一种用于在真菌细胞中产生增加量的异源目的蛋白(POI)的方法,所述方法包括:
(a)构建或获得重组真菌细胞,所述重组真菌细胞包含编码目的蛋白(POI)的多核苷酸,
(b)将包含与编码蛋白质的下游(3′)核酸序列可操作地连接的上游(5′)启动子的多核苷酸引入所述细胞中,所述蛋白质与表6中所示的蛋白质包含至少80%序列同一性,以及
(c)发酵所述重组细胞,
其中当在用于产生所述POI的相同条件下发酵所述细胞时,相对于步骤(a)的重组细胞,步骤(b)的重组细胞产生增加量的所述POI。
26.一种用于在真菌细胞中产生增加量的异源目的蛋白(POI)的方法,所述方法包括:
(a)构建或获得重组真菌细胞,所述重组真菌细胞过表达与表1中所示的蛋白质包含至少80%同一性的至少两种蛋白质的组合,
(b)将编码POI的多核苷酸引入所述细胞中,以及
(c)发酵所述重组细胞,
其中当在用于产生所述POI的相同条件下发酵时,相对于对照细胞,所述重组细胞产生增加量的所述POI,其中对照细胞包含编码所述POI的表达盒,但不过表达至少两种蛋白质的组合。
27.一种用于在真菌细胞中产生增加量的异源目的蛋白(POI)的方法,所述方法包括:
(a)构建或获得重组真菌细胞,所述重组真菌细胞过表达与表6中所示的蛋白质包含至少80%同一性的至少两种蛋白质的组合,
(b)将编码POI的多核苷酸引入所述细胞中,以及
(c)发酵所述重组细胞,
其中当在用于产生所述POI的相同条件下发酵时,相对于对照细胞,所述重组细胞产生增加量的所述POI,其中对照细胞包含编码所述POI的表达盒,但不过表达至少两种蛋白质的组合。
28.如权利要求24-27中任一项所述的方法,其中将编码所述POI的所述多核苷酸整合到所述真菌细胞的基因组中,并且/或者将编码所述调节蛋白的所述多核苷酸整合到所述真菌细胞的基因组中。
29.如权利要求24-27中任一项所述的方法,其中所述目的蛋白(POI)选自由以下组成的组:酶、抗体、受体蛋白、动物饲料蛋白和人类食品蛋白。
30.如权利要求24-27中任一项所述的方法,其中所述目的蛋白(POI)选自由以下组成的组:淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、过氧化物酶、蛋白酶、脂肪酶、磷脂酶、酯酶、角质酶、聚酯酶、植酸酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂加氧酶、木质酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、α-葡聚糖酶、β-葡聚糖酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、乙酰酯酶、氨肽酶、阿拉伯聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、核酸酶、脱氧核糖核酸酶、核糖核酸酶、差向异构酶、α-半乳糖苷酶、β-半乳糖苷酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡萄糖氧化酶、葡糖醛酸糖苷酶、转化酶和异构酶。
31.如权利要求30所述的方法,其中所述POI是选自由以下组成的组的淀粉酶:α-淀粉酶、β-淀粉酶、生麦芽糖α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、麦芽四糖苷酶和麦芽六糖苷酶。
32.一种用于增强真菌细胞的孢子形成的方法,所述方法包括:
(a)构建或获得重组真菌细胞,所述重组真菌细胞过表达与SEQ ID NO:68包含至少80%同一性的蛋白质,以及
(b)使菌株在适当的孢子形成条件下生长,
其中与不过表达所述蛋白质的对照真菌细胞相比,所述重组细胞包含增强的孢子形成表型,所述蛋白质与SEQ ID NO:68包含至少80%同一性。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163223277P | 2021-07-19 | 2021-07-19 | |
US63/223,277 | 2021-07-19 | ||
PCT/US2022/035655 WO2023003683A2 (en) | 2021-07-19 | 2022-06-30 | Compositions and methods for enhanced protein production in fungal cells |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117716039A true CN117716039A (zh) | 2024-03-15 |
Family
ID=82742748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280050548.XA Pending CN117716039A (zh) | 2021-07-19 | 2022-06-30 | 用于增强真菌细胞中的蛋白质产生的组合物和方法 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4373943A2 (zh) |
CN (1) | CN117716039A (zh) |
WO (1) | WO2023003683A2 (zh) |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU607398B2 (en) | 1985-08-29 | 1991-03-07 | Genencor Inc. | Heterologous polypeptides expressed in filamentous fungi, processes for making same, and vectors for making same |
EP0562003B2 (en) | 1990-12-10 | 2015-04-01 | Danisco US Inc. | Improved saccharification of cellulose by cloning and amplification of the beta-glucosidase gene of trichoderma reesei |
DE69822142T2 (de) | 1997-04-07 | 2005-03-03 | Unilever N.V. | Transformation von schimmeln durch agrobacterium, insbesondere von der gattung aspergillus |
US6268328B1 (en) | 1998-12-18 | 2001-07-31 | Genencor International, Inc. | Variant EGIII-like cellulase compositions |
DK1545217T3 (da) | 2002-09-10 | 2013-06-03 | Genencor Int | Induktion af genekspression ved anvendelse af en højkoncentrationssukkerblanding |
EP2097525B1 (en) | 2006-12-21 | 2013-06-19 | Novozymes Inc. | Methods of reducing or eliminating expression of genes in filamentous fungal strains by transitive rna interference |
ES2513217T3 (es) | 2007-02-07 | 2014-10-24 | Danisco Us, Inc., Genencor Division | Fitasas de Buttiauxella sp. variantes que tienen propiedades alteradas |
US8323931B2 (en) * | 2008-11-03 | 2012-12-04 | Iogen Energy Corporation | Hosts and fermentation processes for cellulase production |
WO2011153449A1 (en) | 2010-06-03 | 2011-12-08 | Danisco Us Inc. | Filamentous fungal host strains and dna constructs, and methods of use thereof |
FI20105632A0 (fi) | 2010-06-04 | 2010-06-04 | Valtion Teknillinen | Menetelmä proteiinien tuottamiseksi rihmamaisilla sienillä |
FI20105633A0 (fi) | 2010-06-04 | 2010-06-04 | Valtion Teknillinen | Parannettu menetelmä proteiinien tuottamiseksi |
FI20105634A0 (fi) | 2010-06-04 | 2010-06-04 | Valtion Teknillinen | Proteiinien parannettu tuotto rihmamaisilla sienillä |
US9567596B2 (en) | 2012-01-05 | 2017-02-14 | Glykos Finland Oy | Protease deficient filamentous fungal cells and methods of use thereof |
CA2892786A1 (en) | 2012-12-12 | 2014-06-19 | Danisco Us Inc. | Variants of cellobiohydrolases |
AU2015362784B2 (en) | 2014-12-16 | 2021-05-13 | Danisco Us Inc | Fungal genome modification systems and methods of use |
WO2017177289A1 (en) * | 2016-04-15 | 2017-10-19 | Vtt International Oy | Process for conversion of biomass into fermentable sugars with integrated enzyme |
US20220064228A1 (en) * | 2018-12-12 | 2022-03-03 | Novozymes A/S | Methods For Increasing The Productivity Of A Filamentous Fungal Cell In The Production Of A Polypeptide |
US20230009832A1 (en) | 2019-11-20 | 2023-01-12 | Dupont Nutrition Biosciences Aps | Thermostable phytase variants |
-
2022
- 2022-06-30 WO PCT/US2022/035655 patent/WO2023003683A2/en active Application Filing
- 2022-06-30 CN CN202280050548.XA patent/CN117716039A/zh active Pending
- 2022-06-30 EP EP22748143.9A patent/EP4373943A2/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4373943A2 (en) | 2024-05-29 |
WO2023003683A2 (en) | 2023-01-26 |
WO2023003683A3 (en) | 2023-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109790510B (zh) | 在不存在诱导底物下丝状真菌细胞中的蛋白产生 | |
JP2021040649A (ja) | 真菌株および使用方法 | |
EP3384002A1 (en) | Method of producing proteins in filamentous fungi with decreased clr2 activity | |
EP4055177B1 (en) | Fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
CN112074530A (zh) | 包含粘度降低表型的丝状真菌菌株 | |
US20230174998A1 (en) | Compositions and methods for enhanced protein production in filamentous fungal cells | |
US10597429B2 (en) | Method of producing proteins in filamentous fungi with decreased CLR1 activity | |
EP3227430B1 (en) | Fungal host strains, dna constructs, and methods of use | |
CN117716039A (zh) | 用于增强真菌细胞中的蛋白质产生的组合物和方法 | |
CN118574921A (zh) | 用于增强真菌细胞中的蛋白质产生的组合物和方法 | |
CN112654704A (zh) | 包含蛋白质生产率提高表型的突变和遗传修饰的丝状真菌菌株及其方法 | |
WO2024102556A1 (en) | Filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
US20240352499A1 (en) | Polynucleotides encoding novel nucleases, compositions thereof and methods thereof for eliminating dna from protein preparations | |
WO2024137350A2 (en) | Recombinant fungal strains and methods thereof for producing consistent proteins | |
CN117881772A (zh) | 编码新型核酸酶的多核苷酸、其组合物及其从蛋白质制剂中消除dna的方法 | |
Shaik | Inflammatory thermophilic fungi are used in biotechnology applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |