CN117693587A - 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞 - Google Patents
具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞 Download PDFInfo
- Publication number
- CN117693587A CN117693587A CN202280051979.8A CN202280051979A CN117693587A CN 117693587 A CN117693587 A CN 117693587A CN 202280051979 A CN202280051979 A CN 202280051979A CN 117693587 A CN117693587 A CN 117693587A
- Authority
- CN
- China
- Prior art keywords
- bacillus
- amino acid
- protein
- seq
- rema
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000193830 Bacillus <bacterium> Species 0.000 title claims abstract description 228
- 241000022563 Rema Species 0.000 title claims abstract description 205
- 108090000623 proteins and genes Proteins 0.000 title claims description 480
- 102000004169 proteins and genes Human genes 0.000 title claims description 341
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 70
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 67
- 229920001184 polypeptide Polymers 0.000 claims abstract description 66
- 150000001875 compounds Chemical class 0.000 claims abstract description 58
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000004519 manufacturing process Methods 0.000 claims abstract description 37
- 230000001965 increasing effect Effects 0.000 claims abstract description 17
- 238000012258 culturing Methods 0.000 claims abstract description 14
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 217
- 150000001413 amino acids Chemical class 0.000 claims description 117
- 241000194108 Bacillus licheniformis Species 0.000 claims description 84
- 230000035772 mutation Effects 0.000 claims description 82
- 238000006467 substitution reaction Methods 0.000 claims description 70
- 230000014509 gene expression Effects 0.000 claims description 58
- 108091005804 Peptidases Proteins 0.000 claims description 44
- 102000004190 Enzymes Human genes 0.000 claims description 42
- 108090000790 Enzymes Proteins 0.000 claims description 42
- 229940088598 enzyme Drugs 0.000 claims description 42
- 239000004365 Protease Substances 0.000 claims description 41
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 34
- 244000063299 Bacillus subtilis Species 0.000 claims description 33
- 230000002779 inactivation Effects 0.000 claims description 30
- 241000193744 Bacillus amyloliquefaciens Species 0.000 claims description 26
- 235000019419 proteases Nutrition 0.000 claims description 26
- 241000194103 Bacillus pumilus Species 0.000 claims description 24
- 241000193385 Geobacillus stearothermophilus Species 0.000 claims description 20
- 241000193422 Bacillus lentus Species 0.000 claims description 15
- 102000013142 Amylases Human genes 0.000 claims description 12
- 108010065511 Amylases Proteins 0.000 claims description 12
- 235000019418 amylase Nutrition 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 10
- 241001328122 Bacillus clausii Species 0.000 claims description 9
- 241000194107 Bacillus megaterium Species 0.000 claims description 9
- 241001249117 Bacillus mojavensis Species 0.000 claims description 9
- 239000004382 Amylase Substances 0.000 claims description 8
- 241000193388 Bacillus thuringiensis Species 0.000 claims description 8
- 229940097012 bacillus thuringiensis Drugs 0.000 claims description 8
- 239000001963 growth medium Substances 0.000 claims description 8
- 102100032487 Beta-mannosidase Human genes 0.000 claims description 7
- 108090001060 Lipase Proteins 0.000 claims description 7
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 7
- 108010055059 beta-Mannosidase Proteins 0.000 claims description 7
- 241000193755 Bacillus cereus Species 0.000 claims description 6
- 241000193752 Bacillus circulans Species 0.000 claims description 6
- 241000193749 Bacillus coagulans Species 0.000 claims description 6
- 241000193747 Bacillus firmus Species 0.000 claims description 6
- 241001322378 Bacillus paralicheniformis Species 0.000 claims description 6
- 241000563903 Bacillus velezensis Species 0.000 claims description 6
- 102100026189 Beta-galactosidase Human genes 0.000 claims description 6
- 241000193764 Brevibacillus brevis Species 0.000 claims description 6
- 108010059892 Cellulase Proteins 0.000 claims description 6
- 102000004882 Lipase Human genes 0.000 claims description 6
- 239000004367 Lipase Substances 0.000 claims description 6
- 241000194109 Paenibacillus lautus Species 0.000 claims description 6
- 229940054340 bacillus coagulans Drugs 0.000 claims description 6
- 229940005348 bacillus firmus Drugs 0.000 claims description 6
- 235000019421 lipase Nutrition 0.000 claims description 6
- 108010011619 6-Phytase Proteins 0.000 claims description 5
- 241000006382 Bacillus halodurans Species 0.000 claims description 5
- 108010059881 Lactase Proteins 0.000 claims description 5
- 101710163270 Nuclease Proteins 0.000 claims description 5
- 229940116108 lactase Drugs 0.000 claims description 5
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 claims description 4
- 108010093031 Galactosidases Proteins 0.000 claims description 4
- 102000002464 Galactosidases Human genes 0.000 claims description 4
- 102100022624 Glucoamylase Human genes 0.000 claims description 4
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 claims description 4
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 claims description 4
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 claims description 3
- 241000193375 Bacillus alcalophilus Species 0.000 claims description 3
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 claims description 3
- 241000193386 Lysinibacillus sphaericus Species 0.000 claims description 3
- 108010064785 Phospholipases Proteins 0.000 claims description 3
- 102000015439 Phospholipases Human genes 0.000 claims description 3
- 229940106157 cellulase Drugs 0.000 claims description 3
- 229940085127 phytase Drugs 0.000 claims description 3
- 241000193398 Bacillus methanolicus Species 0.000 claims description 2
- 230000015784 hyperosmotic salinity response Effects 0.000 claims description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 1
- 101100412422 Bacillus subtilis (strain 168) remA gene Proteins 0.000 abstract description 26
- 230000001580 bacterial effect Effects 0.000 abstract description 26
- 101100412423 Bacillus subtilis (strain 168) remB gene Proteins 0.000 abstract description 18
- 238000012239 gene modification Methods 0.000 abstract description 3
- 230000005017 genetic modification Effects 0.000 abstract description 3
- 235000013617 genetically modified food Nutrition 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 311
- 210000004027 cell Anatomy 0.000 description 305
- 235000001014 amino acid Nutrition 0.000 description 275
- 239000013612 plasmid Substances 0.000 description 72
- 108020004414 DNA Proteins 0.000 description 56
- 102000035195 Peptidases Human genes 0.000 description 43
- 238000012217 deletion Methods 0.000 description 41
- 230000037430 deletion Effects 0.000 description 41
- 101150009206 aprE gene Proteins 0.000 description 35
- 108091033319 polynucleotide Proteins 0.000 description 31
- 102000040430 polynucleotide Human genes 0.000 description 31
- 239000002157 polynucleotide Substances 0.000 description 31
- 230000006870 function Effects 0.000 description 26
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 24
- 150000007523 nucleic acids Chemical class 0.000 description 24
- 102000039446 nucleic acids Human genes 0.000 description 23
- 108020004707 nucleic acids Proteins 0.000 description 23
- 108091034117 Oligonucleotide Proteins 0.000 description 21
- 238000012224 gene deletion Methods 0.000 description 21
- 239000000411 inducer Substances 0.000 description 20
- 108020004999 messenger RNA Proteins 0.000 description 19
- 239000002773 nucleotide Substances 0.000 description 19
- 125000003729 nucleotide group Chemical group 0.000 description 19
- 230000000087 stabilizing effect Effects 0.000 description 19
- 230000000415 inactivating effect Effects 0.000 description 17
- 230000002829 reductive effect Effects 0.000 description 17
- 230000004151 fermentation Effects 0.000 description 16
- 238000002744 homologous recombination Methods 0.000 description 16
- 230000006801 homologous recombination Effects 0.000 description 16
- 229910052721 tungsten Inorganic materials 0.000 description 16
- 229910052727 yttrium Inorganic materials 0.000 description 16
- 241000588724 Escherichia coli Species 0.000 description 15
- 239000006142 Luria-Bertani Agar Substances 0.000 description 15
- 238000000855 fermentation Methods 0.000 description 15
- 238000012408 PCR amplification Methods 0.000 description 14
- 229910052799 carbon Inorganic materials 0.000 description 14
- 210000000349 chromosome Anatomy 0.000 description 14
- 239000012634 fragment Substances 0.000 description 14
- 229910052700 potassium Inorganic materials 0.000 description 14
- 101150067544 sigF gene Proteins 0.000 description 14
- 101150009288 amyB gene Proteins 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 13
- 239000003550 marker Substances 0.000 description 13
- 230000010076 replication Effects 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 229960003276 erythromycin Drugs 0.000 description 12
- 230000010354 integration Effects 0.000 description 12
- 229910052698 phosphorus Inorganic materials 0.000 description 12
- 230000035897 transcription Effects 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 229910052720 vanadium Inorganic materials 0.000 description 11
- 230000004075 alteration Effects 0.000 description 10
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 9
- 230000001419 dependent effect Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 229910052757 nitrogen Inorganic materials 0.000 description 9
- 101150066365 remA gene Proteins 0.000 description 9
- 101100059000 Bacillus subtilis (strain 168) capA gene Proteins 0.000 description 8
- 101100219452 Bacillus subtilis (strain 168) capC gene Proteins 0.000 description 8
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 8
- 229910052739 hydrogen Inorganic materials 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- -1 /or Species 0.000 description 7
- 101100059011 Bacillus subtilis (strain 168) capB gene Proteins 0.000 description 7
- 108091033409 CRISPR Proteins 0.000 description 7
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 7
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 7
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 7
- 229960000723 ampicillin Drugs 0.000 description 7
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 7
- 229910052731 fluorine Inorganic materials 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 101150002181 remB gene Proteins 0.000 description 7
- 102200108029 rs199473044 Human genes 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 6
- 108091035707 Consensus sequence Proteins 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000010362 genome editing Methods 0.000 description 6
- 238000002887 multiple sequence alignment Methods 0.000 description 6
- 102200034317 rs28938169 Human genes 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 5
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 5
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 5
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 5
- 101100277447 Bacillus subtilis (strain 168) degQ gene Proteins 0.000 description 5
- 101100126141 Escherichia coli (strain K12) insF6 gene Proteins 0.000 description 5
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 5
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 5
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 5
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 5
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 5
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 5
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 5
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 5
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 5
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 5
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 5
- RVYDCISQIGHAFC-ZPFDUUQYSA-N Met-Ile-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O RVYDCISQIGHAFC-ZPFDUUQYSA-N 0.000 description 5
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 5
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 5
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 5
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 5
- 108090000787 Subtilisin Proteins 0.000 description 5
- 108010056079 Subtilisins Proteins 0.000 description 5
- 102000005158 Subtilisins Human genes 0.000 description 5
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 5
- 108700009124 Transcription Initiation Site Proteins 0.000 description 5
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 5
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000012527 feed solution Substances 0.000 description 5
- 239000004220 glutamic acid Substances 0.000 description 5
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 108010070643 prolylglutamic acid Proteins 0.000 description 5
- 230000002797 proteolythic effect Effects 0.000 description 5
- 230000005026 transcription initiation Effects 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- DVGKRPYUFRZAQW-UHFFFAOYSA-N 3 prime Natural products CC(=O)NC1OC(CC(O)C1C(O)C(O)CO)(OC2C(O)C(CO)OC(OC3C(O)C(O)C(O)OC3CO)C2O)C(=O)O DVGKRPYUFRZAQW-UHFFFAOYSA-N 0.000 description 4
- 108020005065 3' Flanking Region Proteins 0.000 description 4
- 108020005029 5' Flanking Region Proteins 0.000 description 4
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 4
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 4
- 101100214214 Bacillus subtilis (strain 168) ywtC gene Proteins 0.000 description 4
- 108091005658 Basic proteases Proteins 0.000 description 4
- 238000010354 CRISPR gene editing Methods 0.000 description 4
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 4
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 4
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 4
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 4
- 101100083407 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) pgsA1 gene Proteins 0.000 description 4
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 4
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 4
- 108091023045 Untranslated Region Proteins 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 229940025131 amylases Drugs 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 101150076330 pgsA gene Proteins 0.000 description 4
- 108010084572 phenylalanyl-valine Proteins 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 229960002477 riboflavin Drugs 0.000 description 4
- 235000019192 riboflavin Nutrition 0.000 description 4
- 239000002151 riboflavin Substances 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 3
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 3
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- DBNLXHGDGBUCDV-KKUMJFAQSA-N Gln-Phe-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DBNLXHGDGBUCDV-KKUMJFAQSA-N 0.000 description 3
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 3
- 108020004485 Nonsense Codon Proteins 0.000 description 3
- 108010067372 Pancreatic elastase Proteins 0.000 description 3
- 102000016387 Pancreatic elastase Human genes 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- 102000012479 Serine Proteases Human genes 0.000 description 3
- 108010022999 Serine Proteases Proteins 0.000 description 3
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 3
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 3
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 3
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 3
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 3
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 229960005091 chloramphenicol Drugs 0.000 description 3
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 101150053330 grpE gene Proteins 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 101150103033 lpxB gene Proteins 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000037434 nonsense mutation Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 235000019833 protease Nutrition 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000028070 sporulation Effects 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- LKDMKWNDBAVNQZ-WJNSRDFLSA-N 4-[[(2s)-1-[[(2s)-1-[(2s)-2-[[(2s)-1-(4-nitroanilino)-1-oxo-3-phenylpropan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-4-oxobutanoic acid Chemical compound OC(=O)CCC(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)NC=1C=CC(=CC=1)[N+]([O-])=O)CC1=CC=CC=C1 LKDMKWNDBAVNQZ-WJNSRDFLSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- 108010041525 Alanine racemase Proteins 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 101100275394 Bacillus subtilis (strain 168) cotG gene Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 101100129336 Dictyostelium discoideum malA gene Proteins 0.000 description 2
- 108090000194 Dipeptidyl-peptidases and tripeptidyl-peptidases Proteins 0.000 description 2
- 102000003779 Dipeptidyl-peptidases and tripeptidyl-peptidases Human genes 0.000 description 2
- 102100023164 Epididymis-specific alpha-mannosidase Human genes 0.000 description 2
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 2
- 102000004157 Hydrolases Human genes 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 2
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- UEXCHCYDPAIVDE-SRVKXCTJSA-N Phe-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 2
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 2
- 108010020346 Polyglutamic Acid Proteins 0.000 description 2
- 101710198277 RNA polymerase sigma factor sigA Proteins 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 101100190460 Shigella flexneri pic gene Proteins 0.000 description 2
- 241001591005 Siga Species 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- 108091036408 Toxin-antitoxin system Proteins 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 2
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 108010019077 beta-Amylase Proteins 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000012876 carrier material Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000001627 detrimental effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 229940066758 endopeptidases Drugs 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 231100000221 frame shift mutation induction Toxicity 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 108091008053 gene clusters Proteins 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 101150086151 hrdB gene Proteins 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 229920002643 polyglutamic acid Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000004147 pyrimidine metabolism Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 101150102864 rpoD gene Proteins 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 101150117326 sigA gene Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 108010080981 3-phytase Proteins 0.000 description 1
- ZUQOBHTUMCEQBG-UHFFFAOYSA-N 4-amino-5-hydroxynaphthalene-1,7-disulfonic acid Chemical compound OS(=O)(=O)C1=CC(O)=C2C(N)=CC=C(S(O)(=O)=O)C2=C1 ZUQOBHTUMCEQBG-UHFFFAOYSA-N 0.000 description 1
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- 108010088237 ATCGAT-specific type II deoxyribonucleases Proteins 0.000 description 1
- 108010031025 Alanine Dehydrogenase Proteins 0.000 description 1
- 241000588986 Alcaligenes Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 1
- 108030004804 Aspartic endopeptidases Proteins 0.000 description 1
- 102000009422 Aspartic endopeptidases Human genes 0.000 description 1
- 241000997155 Bacillus amyloliquefaciens XH7 Species 0.000 description 1
- 101100361767 Bacillus subtilis (strain 168) sigK gene Proteins 0.000 description 1
- 101100257702 Bacillus subtilis (strain 168) srfAA gene Proteins 0.000 description 1
- 101100321034 Bacillus subtilis (strain 168) yqfD gene Proteins 0.000 description 1
- 241000702194 Bacillus virus SPO1 Species 0.000 description 1
- 102100026657 Cathepsin Z Human genes 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 description 1
- 102100023335 Chymotrypsin-like elastase family member 2A Human genes 0.000 description 1
- 102100039501 Chymotrypsinogen B Human genes 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 102100038445 Claudin-2 Human genes 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- 102000003950 Cysteine Endopeptidases Human genes 0.000 description 1
- 108090000395 Cysteine Endopeptidases Proteins 0.000 description 1
- 108030001451 Cysteine-type carboxypeptidases Proteins 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 108010044289 DNA Restriction-Modification Enzymes Proteins 0.000 description 1
- 102000006465 DNA Restriction-Modification Enzymes Human genes 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101100257706 Dictyostelium discoideum srfA gene Proteins 0.000 description 1
- 101100366599 Dictyostelium discoideum srfB gene Proteins 0.000 description 1
- 101100366601 Dictyostelium discoideum srfD gene Proteins 0.000 description 1
- 108090001081 Dipeptidases Proteins 0.000 description 1
- 102000004860 Dipeptidases Human genes 0.000 description 1
- 108010083608 Durazym Proteins 0.000 description 1
- 108700035154 EC 3.4.15.- Proteins 0.000 description 1
- 102000051496 EC 3.4.15.- Human genes 0.000 description 1
- 108700033355 EC 3.4.19.- Proteins 0.000 description 1
- 102000057898 EC 3.4.19.- Human genes 0.000 description 1
- 108700034212 EC 3.4.21.118 Proteins 0.000 description 1
- 108700034182 EC 3.4.21.119 Proteins 0.000 description 1
- 108700036029 EC 3.4.21.35 Proteins 0.000 description 1
- 108700036045 EC 3.4.21.78 Proteins 0.000 description 1
- 108700036044 EC 3.4.21.79 Proteins 0.000 description 1
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 101100267109 Escherichia coli (strain K12) ygfF gene Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 1
- 101710089384 Extracellular protease Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- 108050008938 Glucoamylases Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 102000001398 Granzyme Human genes 0.000 description 1
- 108060005986 Granzyme Proteins 0.000 description 1
- 102100030386 Granzyme A Human genes 0.000 description 1
- 102100030385 Granzyme B Human genes 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000882901 Homo sapiens Claudin-2 Proteins 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 102000001399 Kallikrein Human genes 0.000 description 1
- 108060005987 Kallikrein Proteins 0.000 description 1
- 102100038297 Kallikrein-1 Human genes 0.000 description 1
- 102100034870 Kallikrein-8 Human genes 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- 108010036940 Levansucrase Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- URBJRJKWSUFCKS-AVGNSLFASA-N Lys-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N URBJRJKWSUFCKS-AVGNSLFASA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- UXJHNUBJSQQIOC-SZMVWBNQSA-N Met-Trp-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O UXJHNUBJSQQIOC-SZMVWBNQSA-N 0.000 description 1
- 108030000089 Metallocarboxypeptidases Proteins 0.000 description 1
- 102000006166 Metallocarboxypeptidases Human genes 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 1
- 102100033174 Neutrophil elastase Human genes 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 102100026367 Pancreatic alpha-amylase Human genes 0.000 description 1
- 102100033359 Pancreatic triacylglycerol lipase Human genes 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- 102100040402 Phlorizin hydrolase Human genes 0.000 description 1
- 102000003827 Plasma Kallikrein Human genes 0.000 description 1
- 108090000113 Plasma Kallikrein Proteins 0.000 description 1
- 102100038124 Plasminogen Human genes 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 241000866625 Polymorphus Species 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 108020004422 Riboswitch Proteins 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- 102000003667 Serine Endopeptidases Human genes 0.000 description 1
- 108090000083 Serine Endopeptidases Proteins 0.000 description 1
- 108030000574 Serine-type carboxypeptidases Proteins 0.000 description 1
- 102000034328 Serine-type carboxypeptidases Human genes 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- 108030005531 Threonine endopeptidases Proteins 0.000 description 1
- 102000007983 Threonine endopeptidases Human genes 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 229930003571 Vitamin B5 Natural products 0.000 description 1
- 108010045422 Xylan Endo-1,3-beta-Xylosidase Proteins 0.000 description 1
- 102000004139 alpha-Amylases Human genes 0.000 description 1
- 229940024171 alpha-amylase Drugs 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 101150105363 amyE gene Proteins 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000003578 bacterial chromosome Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- FAPWYRCQGJNNSJ-UBKPKTQASA-L calcium D-pantothenic acid Chemical compound [Ca+2].OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O.OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O FAPWYRCQGJNNSJ-UBKPKTQASA-L 0.000 description 1
- 229960002079 calcium pantothenate Drugs 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000001516 effect on protein Effects 0.000 description 1
- YERABYSOHUZTPQ-UHFFFAOYSA-P endo-1,4-beta-Xylanase Chemical compound C=1C=CC=CC=1C[N+](CC)(CC)CCCNC(C(C=1)=O)=CC(=O)C=1NCCC[N+](CC)(CC)CC1=CC=CC=C1 YERABYSOHUZTPQ-UHFFFAOYSA-P 0.000 description 1
- 108010091371 endoglucanase 1 Proteins 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092450 endoglucanase Z Proteins 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- XRECTZIEBJDKEO-UHFFFAOYSA-N flucytosine Chemical group NC1=NC(=O)NC=C1F XRECTZIEBJDKEO-UHFFFAOYSA-N 0.000 description 1
- 229960004413 flucytosine Drugs 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000030414 genetic transfer Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 101150107068 gsiB gene Proteins 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 108090000155 pancreatic elastase II Proteins 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 230000027086 plasmid maintenance Effects 0.000 description 1
- 229940012957 plasmin Drugs 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 101150116440 pyrF gene Proteins 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 101150015060 sigG gene Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 101150105742 spoIIE gene Proteins 0.000 description 1
- 101150060157 spoIIGA gene Proteins 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 108010082371 succinyl-alanyl-alanyl-prolyl-phenylalanine-4-nitroanilide Proteins 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000005029 transcription elongation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000009492 vitamin B5 Nutrition 0.000 description 1
- 239000011675 vitamin B5 Substances 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明涉及一种用于提高生物化合物的生产的芽孢杆菌宿主细胞。具体地,本发明涉及一种在remA和/或remB基因中具有遗传修饰的芽孢杆菌宿主。本发明还涉及一种基于培养本发明的细菌宿主细胞来增加至少一种感兴趣的多肽的生产的方法。
Description
技术领域
本发明涉及一种用于提高生物化合物的生产的芽孢杆菌(Bacillus)宿主细胞。具体地,本发明涉及一种在remA和/或remB基因中具有遗传修饰的芽孢杆菌宿主。本发明还涉及一种基于培养本发明的细菌宿主细胞来增加至少一种感兴趣的化合物的生产的方法。
背景技术
芽孢杆菌属的微生物被广泛用作工业劳动力,用于生产有价值的化合物,如化学品、聚合物和蛋白,特别是蛋白,如洗涤和/或清洁活性酶或者用于饲料和食品应用的酶。这些有用物质的生物技术生产是通过这种芽孢杆菌的发酵和随后的产物纯化来进行的。芽孢杆菌能够将大量蛋白分泌至发酵液中。与细胞内生产相比,这允许简单的产品纯化过程,并且解释了芽孢杆菌在工业应用中的成功。
通过优化基因表达盒,已经实现了用芽孢杆菌生产生物化合物。已经开发了启动子如aprE基因启动子(EP1244794),PcryIIIA、PamyL和PamyQ启动子的组合(WO994379,US5955310,WO2005098016),或者驱动高水平表达的噬菌体启动子PSPO1(WO2015118126)。
同样,通过在转录物稳定元件的5’UTR内引入cryIIIA稳定元件(WO9943835),aprE基因的稳定元件(WO2016134213)以及cotG、SP82、gsiB、grpE和rib基因的稳定元件(WO2008140615),优化了所得转录物的mRNA稳定性以增加半衰期。
此外,已经实现了增加编码感兴趣的生物化合物的表达盒的拷贝数以增加产物产量。US20100248306公开了一种稳定质粒维持的方法,WO15055558稳定并增加细胞内的质粒拷贝数。已经成功应用了稳定细胞染色体内多个多核苷酸拷贝的整合的各种方法(US2003032186,US2008085535)。
对细菌生产宿主进行了遗传修饰,以去除不需要的宿主细胞蛋白,提高产品纯度(WO2003093453)并增强感兴趣的蛋白的表达(WO2003083125)。
用于生产生物化合物的芽孢杆菌宿主细胞的优化具有高度相关性,其中即使化合物产量的微小改进在大规模工业量中也是显著的。因此,本发明涉及具有增加的生物化合物生产能力的芽孢杆菌宿主细胞。
发明内容
在本发明的基础研究中发现,在remA和/或remB基因中具有遗传修饰的芽孢杆菌宿主细胞允许在所述宿主细胞中提高感兴趣的化合物的产量,特别所感兴趣的多肽,例如胞外酶。因此,本发明涉及一种修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌(Bacillus subtilis)细胞。
在另一优选的实施方案中,本发明的芽孢杆菌宿主细胞包含表达盒,用于生产感兴趣的化合物,优选感兴趣的多肽。因此,在另一实施方案中,本发明涉及一种生产感兴趣的化合物,优选感兴趣的多肽的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离感兴趣的化合物。
此外,本发明涉及一种改变的RemA或RemB蛋白,其用于产生改良的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白包含在SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的一个或多个非保守氨基酸取代(如本文所定义),IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ ID NO:21的氨基酸位置R18和/或P29,并且其中所述改变的RemB蛋白包含在SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的一个或多个非保守氨基酸取代(如本文所定义),IC值等于或大于3.0,优选地等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选SEQ ID NO:23的氨基酸位置G6、I19、S62、T67、L68和R71,最优选SEQ ID NO:23的氨基酸位置G6、T67、L68和R71。
附图说明
图1:所示RemA蛋白的多序列比对。对每个单一序列和共有序列都标明了蛋白序列编号。比对显示为10个位点的区块。与共有序列不同的氨基酸变化以粗体字母表示。
图2:所示RemB蛋白的多序列比对。对每个单一序列和共有序列都标明了蛋白序列编号。比对显示为10个位点的区块。与共有序列不同的氨基酸变化以粗体字母表示。
发明详述
应当理解,如在说明书和权利要求书中所用,“一个(a)”或“一个(an)”可以表示一个或多个,这取决于其使用的上下文。因此,例如,提到“一个细胞”可以表示可以使用至少一个细胞。
此外,应当理解,如本文所用的术语“至少一个”表示可以按照本发明使用该术语后面提到的一个或多个项目。例如,如果该术语表示应当使用至少一种进料溶液,这可以理解为一种进料溶液或一种以上的进料溶液,即两种、三种、四种、五种或任何其他数量的进料溶液。根据该术语所指的项目,技术人员理解该术语可能指的上限(如果有的话)。
如本文所用的术语“约”表示对于所述术语之后列举的任何数字,存在区间精度,在该区间内可以实现技术效果。因此,如本文提到的约优选是指精确数值或所述精确数值±20%左右的范围,优选±15%,更优选±10%,甚至更优选±5%。
如本文所用的术语“包含”不应当理解为限制意义。该术语表示可能存在比实际提到的项目更多的项目,例如,如果它是指包含某些步骤的方法,则不应当排除其他步骤的存在。然而,术语“包含”还涵盖仅存在所提到的项目的实施方案,即它在“由…组成”的意义上具有限制性含义。
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可互换使用,是指任何长度的聚合不分支形式的核苷酸,通常是脱氧核糖核苷酸。术语“多肽”和“蛋白”在本文中可互换使用,是指任何长度的聚合形式的氨基酸,通过肽键连接在一起。
术语“编码(coding for)”和“编码(encoding)”在本文中可互换使用。通常,这些术语是指多核苷酸(如基因、cDNA或mRNA)中特定核苷酸序列的特性,用作合成其他大分子的模板,如确定的氨基酸序列。因此,如果对应于该基因的mRNA的转录和翻译在细胞或其他生物系统中产生蛋白,则该基因编码蛋白。
为了本发明的目的,关于细胞或生物体的术语“修饰的”、“遗传修饰的”或“遗传修饰”(在本文中也称作“重组的”或“转基因的”)表示所述细胞或生物体含有异源多核苷酸,其获得自不同生物体或由人类通过基因技术产生。因此,修饰的细胞是非天然细胞。
术语“天然”(或野生型或内源)细胞或生物体以及“天然”(或野生型或内源)多核苷酸或多肽分别是指在自然界中发现的细胞或生物体以及在细胞中以其天然形式和遗传环境发现的所讨论的多核苷酸或多肽(即,没有任何人为干预)。
如本文所用的术语“改变的蛋白”是指已经由人通过基因技术修改的蛋白,可以由修饰的内源基因或外源基因(也称作对宿主细胞异源)编码,例如,插入宿主细胞的编码所述蛋白的外源基因,优选与编码未改变的蛋白的缺失或失活的内源基因一起。因此,改变的蛋白是非天然蛋白。
术语“无义突变”是在蛋白编码序列的编码区内导致终止密码子的点突变。
术语“错义突变”是在相应的氨基酸位置导致另一氨基酸的点突变。
术语“使基因失活”表示与对照细胞中的表达相比,基因的表达已有所降低。优选地,与对照细胞中的相应表达相比,本发明的细菌宿主细胞中基因的表达已降低至少40%,如至少50%、至少60%、至少70%、至少80%或至少90%。更优选地,所述表达已降低至少95%。最优选地,其已降低100%,即已完全消除。
本文提到的基因失活可以通过任何被认为合适的方法来实现。在一实施方案中,通过突变,即通过突变基因,使基因失活。优选地,所述突变是缺失,优选地,缺失所述基因。
如本文所用,“基因的缺失”是指整个编码序列的缺失,部分编码序列的缺失,或包括侧翼区在内的编码序列的缺失,最终结果是缺失的基因实际上是无功能的。简单地说,“缺失”定义为核苷酸或氨基酸序列的变化,其中一个或多个核苷酸或氨基酸残基分别被去除(即,不存在)。因此,缺失菌株比各自的野生型生物体具有更少的核苷酸或氨基酸。
术语“使蛋白失活”表示蛋白的氨基酸序列发生改变,与未改变的蛋白相比,蛋白在细胞中的功能已经降低。优选地,与未改变的蛋白的相应功能相比,本发明的细菌宿主细胞中蛋白的功能已降低至少10%,如至少40%、至少50%、至少60%、至少70%、至少80%或至少90%。更优选地,所述功能已降低至少95%。最优选地,功能已降低100%,即蛋白是完全无功能的。
如本文提到的“对照细胞”是不携带相应修饰的同一物种的对照细胞,优选其与宿主细胞的不同之处仅在于不携带相应修饰。因此,对照细胞是未修饰的细胞,如野生型细胞,即未修饰的野生型细胞,优选地衣芽孢杆菌细胞,其不携带相应修饰。优选地,对照细胞是地衣芽孢杆菌细胞,其与宿主细胞的不同之处仅在于不携带相应修饰。
宿主细胞
本发明涉及一种芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,优选改变的RemA蛋白。
例如,所述芽孢杆菌宿主细胞可以是嗜碱芽孢杆菌(Bacillus alcalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、蜡样芽孢杆菌(Bacillus cereus)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillusfirmus)、球芽孢杆菌(Bacillus globigii)、耐盐芽孢杆菌(Bacillus halodurans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、副地衣芽孢杆菌(Bacillus paralicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、甲醇芽孢杆菌(Bacillus methanolicus)、甲基营养型芽孢杆菌(Bacillus methylotrophicus)、摩加夫芽孢杆菌(Bacillus mojavensis)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)(嗜热脂肪芽孢杆菌(Bacillus stearothermophilus))、枯草芽孢杆菌、苏云金芽孢杆菌(Bacillusthuringiensis)或贝莱斯芽孢杆菌(Bacillus velezensis)。在一实施方案中,所述细菌宿主细胞是解淀粉芽孢杆菌、贝莱斯芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一实施方案中,所述细菌宿主细胞是地衣芽孢杆菌细胞、短小芽孢杆菌细胞或枯草芽孢杆菌细胞,在一特别优选的实施方案中是地衣芽孢杆菌细胞。
在一优选实施方案中,所述芽孢杆菌宿主细胞是枯草芽孢杆菌细胞。在这个实施方案中,所述芽孢杆菌宿主细胞优选选自解淀粉芽孢杆菌、贝莱斯芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、短小芽孢杆菌和嗜热脂肪芽孢杆菌,优选地,选自地衣芽孢杆菌和短小芽孢杆菌。
在一优选实施方案中,所述宿主细胞是地衣芽孢杆菌宿主细胞。例如,所述宿主细胞可以是地衣芽孢杆菌菌株ATCC14580的宿主细胞(与DSM13相同,参见Veith et al."Thecomplete genome sequence of Bacillus licheniformis DSM13,an organism withgreat industrial potential."J.Mol.Microbiol.Biotechnol.(2004)7:204-211)。
在另一优选实施方案中,所述宿主细胞是贝莱斯芽孢杆菌宿主细胞。例如,所述宿主细胞可以是贝莱斯芽孢杆菌菌株FZB42的宿主细胞。
在另一优选实施方案中,所述宿主细胞是解淀粉芽孢杆菌宿主细胞。例如,所述宿主细胞可以是解淀粉芽孢杆菌菌株XH7的宿主细胞。
在另一优选实施方案中,所述宿主细胞是短小芽孢杆菌宿主细胞。例如,所述宿主细胞可以是短小芽孢杆菌菌株DSM27的宿主细胞。
在另一优选实施方案中,所述宿主细胞是迟缓芽孢杆菌宿主细胞。例如,所述宿主细胞可以是迟缓芽孢杆菌菌株DSM9的宿主细胞。
在另一优选实施方案中,所述宿主细胞是嗜碱芽孢杆菌宿主细胞。例如,所述宿主细胞可以是嗜碱芽孢杆菌菌株ATCC27647的宿主细胞。
在另一优选实施方案中,所述宿主细胞是甲醇芽孢杆菌宿主细胞。例如,所述宿主细胞可以是甲醇芽孢杆菌菌株PB1(DSM16454)或甲醇芽孢杆菌菌株MGA3(ATCC53907)的宿主细胞。
本发明的芽孢杆菌宿主细胞应当是修饰的宿主细胞。具体地,所述芽孢杆菌宿主包含改变的RemA蛋白和/或改变的RemB蛋白,优选改变的RemA蛋白。因此,所述芽孢杆菌宿主包含天然RemA蛋白的变体,或者所述芽孢杆菌宿主包含天然RemB蛋白的变体,优选天然RemA蛋白的变体。特别优选的是芽孢杆菌宿主细胞包含在芽孢杆菌宿主细胞中具有降低的RemA功能的改变的RemA蛋白和/或在芽孢杆菌宿主细胞中具有降低的RemB功能的改变的RemB蛋白。优选的是芽孢杆菌宿主细胞,其包含在芽孢杆菌宿主细胞中具有失活的RemA功能的改变的RemA蛋白和/或在芽孢杆菌宿主细胞中具有失活的RemB功能的改变的RemB蛋白。因此,特别优选所述芽孢杆菌宿主细胞包含失活的RemA蛋白和/或失活的RemB蛋白,优选失活的RemA蛋白。优选地,RemA和/或RemB蛋白的改变是芽孢杆菌宿主细胞中RemA和/或RemB蛋白的失活。在这个特别优选的实施方案中,改变的RemA蛋白和/或改变的RemB蛋白仍然存在,但是RemA蛋白和/或RemB蛋白具有失活的功能,优选没有功能。
在不受理论束缚的情况下,本发明人认为,芽孢杆菌宿主细胞中RemA和/或RemA蛋白功能的降低导致由芽孢杆菌宿主细胞产生的感兴趣的化合物产量增加。因此,优选地,宿主包含改变的RemA蛋白,优选其中RemA蛋白的改变会导致RemA介导的转录激活的丧失。优选地,RemA蛋白的改变会导致RemA蛋白的DNA结合亲和力降低。进一步优选地,所述芽孢杆菌宿主包含改变的RemB蛋白,优选其中RemB蛋白的改变会导致RemB介导的转录激活的丧失。
在一实施方案,RemA蛋白的改变是由编码RemA蛋白的基因中的一个或多个点突变、插入或部分缺失引起的。优选地,RemA蛋白的改变是由编码RemA蛋白的基因中的一个或多个点突变引起的。优选地,编码RemA蛋白的基因中的一个或多个点突变选自错义突变、无义突变和移码突变。优选地,编码RemA蛋白的基因中的一个或多个点突变是一个或多个错义突变。优选地,remA基因中的一个或多个点突变导致芽孢杆菌宿主细胞中RemA蛋白的失活。
优选地,RemB蛋白的改变是由编码RemB蛋白的基因中的一个或多个点突变、插入或部分引起的。优选地,RemB蛋白的改变是由编码RemB蛋白的基因中的一个或多个点突变引起的。优选地,编码RemB蛋白的基因中的一个或多个点突变选自错义突变、无义突变和移码突变。优选地,编码RemB蛋白的基因中的一个或多个点突变是一个或多个错义突变。优选地,remB基因中的一个或多个点突变导致芽孢杆菌宿主细胞中RemB蛋白的失活。
优选地,编码RemA蛋白的基因中的一个或多个错义点突变位于编码RemA蛋白中保守氨基酸的位置。蛋白中的保守氨基酸位置也可以描述为IC值等于或大于2.0的位置。如本文所用的IC(信息量)值是计算值R_Sequence(l),如Schneider,T.D.;Stephens,R.M.Sequence Logos:A New Way to Display Consensus Sequences.Nucleic AcidsRes.1990,18(20),6097–6100所述,使用氨基酸序列的20种状态。优选地,编码RemA蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置的位置,IC值等于或大于2.0,优选等于或大于2.5,更优选等于或大于3.0,或者甚至更优选等于或大于3.2,最优选等于或大于3.5。优选地,编码RemA蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:21的保守氨基酸位置的位置,IC值等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemA蛋白的基因中的一个或多个点突变导致RemA蛋白中的非保守氨基酸取代(如本文所定义,参见,例如,表7)。因此,优选改变的RemA蛋白包含一个或多个非保守氨基酸交换。优选改变的RemA蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemA蛋白的功能降低。优选改变的RemA蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemA蛋白的失活。优选地,编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于2.0,优选等于或大于2.5,更优选等于或大于3.0,或者甚至更优选等于或大于3.2,最优选等于或大于3.5。优选地,编码RemA蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:21的保守氨基酸位置的位置,IC值等于或大于3.2,最优选等于或大于3.5。优选地,编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,优选如表7所示,优选失活取代,IC值等于或大于3.0,或者甚至更优选等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemA蛋白的基因中的一个或多个点突变导致对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置上的非保守氨基酸取代,优选失活取代,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:21的R18和P29的氨基酸位置的一个或多个氨基酸位置。优选改变的RemA蛋白包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S中的至少一个。优选改变的RemA蛋白包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S。
术语“对应于氨基酸位置的氨基酸位置”,后面是某些氨基酸位置,以SEQ ID NO:21的编号或残基和编号表示,应当表示在提到特定RemA蛋白中的某些氨基酸位置时,如图1所示与SEQ ID NO:21进行序列比对,并且使用SEQ ID NO:21在某个氨基酸位置的氨基酸编号作为参考(即,根据SEQ ID NO:21的编号),例如,在SEQ ID NO:29(短小芽孢杆菌的RemA)中,SEQ ID NO:21(地衣芽孢杆菌的RemA)的M84对应于SEQ ID NO:29的I84。
优选地,改变的RemA蛋白包含与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。优选地,改变的RemA蛋白包含与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。
优选地,改变的RemA蛋白包含与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列以及一个或多个氨基酸取代,优选一个或多个非保守氨基酸取代,优选失活取代,在对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72、R76的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:21的R18和P29的氨基酸位置的一个或多个,优选两个氨基酸位置。优选地,改变的RemA蛋白包含与SEQ ID NO:21具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列以及一个或多个非保守氨基酸取代,优选失活取代,在对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:21的R18和P29的氨基酸位置的一个或多个氨基酸位置。优选改变的RemA蛋白包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S中的至少一个。优选改变的RemA蛋白包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S。优选改变的RemA蛋白包含与SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列,并且包含SEQ ID NO:21的氨基酸位置R18和P29上的取代R18W和P29S中的至少一个,优选两个。
优选地,编码RemB蛋白的基因中的一个或多个点突变导致非保守氨基酸取代(如本文所定义,参见,例如,表7)。因此,优选改变的RemB蛋白包含一个或多个非保守氨基酸交换。优选改变的RemB蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemB蛋白的功能降低。优选改变的RemB蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemB蛋白的失活。优选地,编码RemB蛋白的基因中的一个或多个点突变导致SEQID NO:23、25、29、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,或者甚至更优选等于或大于3.2,最优选等于或大于3.5。优选地,编码RemB蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:23的保守氨基酸位置的位置,IC值等于或大于3.2,最优选等于或大于3.5。优选地,编码RemB蛋白的基因中的一个或多个错义点突变位于编码SEQ ID NO:23的保守氨基酸位置的位置,IC值等于或大于3.2,最优选等于或大于3.5。优选地,编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选如表7所示,优选失活取代,IC值等于或大于3.0,或者甚至更优选等于或大于3.2′,最优选等于或大于3.5。
优选地,编码RemB蛋白的基因中的一个或多个错义点突变在编码RemB蛋白中的保守氨基酸的位置,优选在对应于SEQ ID NO:23的氨基酸位置4-71的一个或多个氨基酸位置,优选编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:23的H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。术语“对应于氨基酸位置的氨基酸位置”,后面是某些氨基酸位置,以SEQ IDNO:23的编号或残基和编号表示,应当表示在提到特定RemB蛋白中的某些氨基酸位置时,如图2所示与SEQ ID NO:23进行序列比对,并且使用SEQ ID NO:23在某个氨基酸位置的氨基酸编号作为参考(即,根据SEQ ID NO:23的编号),例如,在SEQ ID NO:31(短小芽孢杆菌的RemB)中,SEQ ID NO:23(地衣芽孢杆菌的RemB)的S80对应于SEQ ID NO:31的V84。
优选地,改变的RemB蛋白包含与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。优选地,RemB蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%,优选至少90%序列相同性。优选地,改变的RemB蛋白包含与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。
优选地,改变的RemB蛋白包含与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列以及一个或多个氨基酸取代,优选在编码RemB蛋白中保守氨基酸的位置上的一个或多个取代,优选在对应于SEQ ID NO:23、27、31、35或39,优选SEQID NO:23的氨基酸位置4-71的一个或多个氨基酸位置,优选RemB蛋白中的一个或多个取代是非保守氨基酸取代,优选失活取代,优选在对应于选自SEQ ID NO:23的H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。
优选地,改变的RemB蛋白包含与SEQ ID NO:23具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列以及在编码RemB蛋白中保守氨基酸的位置上的一个或多个取代,优选在对应于SEQ ID NO:23的氨基酸位置4-71的一个或多个氨基酸位置,优选非保守氨基酸取代,优选失活取代,优选在对应于选自SEQ ID NO:23的H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个位置。
通过修饰内源性remA和/或remB基因和/或通过引入编码改变的RemA和/或RemB蛋白的外源基因,可以在芽孢杆菌宿主细胞中获得改变的RemA蛋白和/或RemB蛋白。在后者的情况下,内源性remA和/或remB基因优选失活,优选缺失。编码改变的RemA蛋白和/或RemB蛋白的外源基因可以作为表达质粒存在于宿主细胞中,或者可以整合到宿主细胞的基因组DNA中。在后者的情况下,编码改变的RemA蛋白和/或RemB蛋白的外源基因的整合优选在编码RemA和/或RemB蛋白的内源基因的基因组位置,从而缺失内源性RemA和/或RemB蛋白。或者,在合适的启动子序列的控制下,编码改变的RemA蛋白和/或RemB蛋白的外源基因的整合在不同的基因组位置,如淀粉酶、蛋白酶aprE或果聚糖蔗糖酶sacB基因座。用于在芽孢杆菌宿主细胞中表达改变的RemA和/或RemB蛋白的适当启动子在本领域是众所周知的,并且在本文的其他地方有更详细的描述。优选地,包含改变的RemA蛋白和/或改变的RemB蛋白(其通过各自的编码序列新引入芽孢杆菌宿主细胞)的修饰的芽孢杆菌宿主细胞包含内源性RemA和/或RemB基因的缺失。因此,优选地,修饰的芽孢杆菌宿主细胞不包含编码内源性RemA和/或内源性RemB蛋白的功能基因。
引入芽孢杆菌宿主细胞的核酸构建体,其编码改变的RemA和/或RemB蛋白,可以包含编码衍生自相同或不同芽孢杆菌物种的RemA和/或RemB蛋白的核酸序列。优选地,引入芽孢杆菌宿主细胞的改变的RemA和/或RemB蛋白来自相同的芽孢杆菌物种,优选来自地衣芽孢杆菌。
因此,在一实施方案中,本发明涉及一种产生包含改变的RemA蛋白和/或改变的RemB蛋白的修饰的芽孢杆菌宿主细胞的方法。优选地,修饰的芽孢杆菌宿主细胞可以通过包括以下步骤的方法获得
a)提供芽孢杆菌细胞,优选地衣芽孢杆菌细胞,以及
b)通过修饰编码内源性RemA和/或内源性RemB蛋白的内源基因以编码如本文所述的改变的RemA和/或改变的RemB蛋白来修饰a)提供的芽孢杆菌细胞,从而获得修饰的芽孢杆菌宿主细胞。
在另一实施方案中,修饰的芽孢杆菌宿主细胞可以通过包括以下步骤的方法获得
a)提供芽孢杆菌细胞,优选地衣芽孢杆菌细胞,
b)通过引入核酸构建体来修饰a)提供的芽孢杆菌细胞,所述核酸构建体包含编码如本文所述的改变的RemA和/或改变的RemB蛋白的基因,优选衍生自天然地衣芽孢杆菌RemA和/或RemB蛋白,优选在合适的启动子序列的控制下,将其引入芽孢杆菌细胞,从而获得修饰的芽孢杆菌宿主细胞,以及
c)任选地失活,优选缺失编码内源性RemA和/或内源性RemB蛋白的内源基因。
本文还描述了芽孢杆菌宿主细胞还可以包含内源性remA基因的缺失或失活或者内源性remB基因的缺失或失活。因此,在一实施方案中,本发明是指芽孢杆菌宿主细胞,其包含内源性remA基因的缺失或失活以及内源性remB基因的缺失或失活。在另一实施方案中,芽孢杆菌宿主细胞包含如本文所述的改变的RemA蛋白以及内源性remB基因的缺失或失活。在另一实施方案中,芽孢杆菌宿主细胞包含如本文所述的改变的RemB蛋白以及内源性remA基因的缺失或失活。
在一实施方案中,芽孢杆菌宿主细胞用于生产如本文其他地方所述的感兴趣的化合物。感兴趣的化合物对宿主细胞可以是内源的或异源的。优选地,感兴趣的化合物是蛋白,优选酶。优选地,感兴趣的化合物对宿主细胞是异源的。优选地,感兴趣的化合物是蛋白,优选酶,对宿主细胞是异源的。
在一实施方案中,宿主细胞包含表达盒,用于产生感兴趣的化合物,优选感兴趣的多肽。在一实施方案中,感兴趣的多肽是酶,如选自淀粉酶、蛋白酶、脂肪酶、磷脂酶、甘露聚糖酶、植酸酶、木聚糖酶、乳糖酶、磷酸酶、葡糖淀粉酶、核酸酶、半乳糖苷酶、内切葡聚糖酶和纤维素酶的酶,优选蛋白酶和/或淀粉酶。
优选地,与不包含改变的RemA蛋白和/或改变的RemB蛋白的芽孢杆菌对照细胞相比,包含改变的RemA蛋白和/或改变的RemB蛋白的修饰的芽孢杆菌宿主细胞包含增加的感兴趣的化合物的生产。优选地,与不包含改变的RemA蛋白和/或改变的RemB蛋白的芽孢杆菌宿主细胞(优选地衣芽孢杆菌对照细胞)相比,包含改变的RemA蛋白和/或改变的RemB蛋白的修饰的芽孢杆菌宿主细胞(优选地衣芽孢杆菌宿主细胞)包含增加的感兴趣的蛋白(优选酶)的生产。
术语“增加”和“增强”在本文中可互换使用,在应用的意义上应当表示优选增加至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%。
术语“减少”和“降低”在本文中可互换使用,在应用的意义上应当表示优选降低至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或95%。在一些实施方案中,基因产物的水平或其活性降低100%。因此,活性被完全消除。这可以通过使基因失活来实现。
产生修饰的芽孢杆菌细胞和改变的蛋白的方法,例如,通过引入外来核酸、染色体基因缺失、取代、突变和失活,是本领域已知的。
将DNA引入宿主细胞,在一实施方案中为芽孢杆菌细胞,可以例如通过原生质体转化(参见,例如,Chang and Cohen,1979,Molecular General Genetics 168:111-115),通过使用感受态细胞(参见,例如,Young and Spizizen,1961,Journal of Bacteriology81:823-829,or Dubnau and Davidoff-Abelson,1971,Journal of Molecular Biology56:209-221),通过电穿孔(参见,例如,Shigekawa and Dower,1988,Biotechniques 6:742-751),或通过接合(参见,例如,Koehler and Thorne,1987,Journal of Bacteriology169:5271-5278)来实现。对于各种类型的宿主细胞,具体转化方案在本领域是已知的(参见,例如,关于大肠杆菌原生质体转化参见Hanahan,1983,J.Mol.Biol.166:557-580)。
基因失活可以通过同源重组实现,即进入的DNA分子包含与待失活的宿主细胞(例如芽孢杆菌)染色体上靶序列的5’和3’侧翼序列同源的序列。随后在同源重组的过程中,所述侧翼序列之间的序列被进入的DNA分子的同源序列取代,即该序列从染色体中缺失。同样,“基因整合”,即DNA序列,如带有或不带有选择标记的基因表达盒,可以通过同源重组整合到细菌宿主细胞的染色体中。因此。待整合的DNA序列两侧是与染色体上的5’和3’侧翼序列同源的DNA序列。根据本发明可以理解,基因整合也可以将基因整合和基因缺失结合在一个步骤中,即染色体上的DNA序列被进入的DNA序列取代以进行基因整合。
同源重组可以通过本领域已知的两种不同方法实现:
通过与环状质粒DNA的连续两轮同源重组(Campbell重组),例如基于众所周知的温度敏感质粒pE194(Nahrstedt et al.,Strain development in Bacilluslicheniformis:construction of biologically contained mutants deficient insporulation and DNA repair.J Biotechnol.2005 Sep 29;119(3):245-54)。
在选择标记的选择条件下,在非允许温度下培养,即阻断质粒复制的温度,通过与第一同源区的第一次同源重组(Campbell重组),实现含有进入的DNA分子的缺失质粒的整合,所述DNA分子包含与染色体上靶序列的5’和3’侧翼序列同源的序列。通过去除选择压力并在允许温度下培养来实现与第二同源区的第二次同源重组,即质粒复制发生,导致从染色体切除质粒。
或者,可以使用非复制性“自杀”质粒,通过在选择标记上选择来迫使整合。只有通过同源重组将质粒整合到基因组中的细胞能够在选择条件下生长。从染色体去除/切除质粒是通过第二次同源重组实现的,通过激活质粒上存在的反选择标记来迫使第二次同源重组。
同源重组的第二种方法是指同时发生的两个同源重组事件,也称作“双交叉”或“双同源重组”。进入的DNA序列是线性的,可以通过PCR、质粒DNA的线性化或染色体DNA的制备获得,这不可避免地导致片段化的线性DNA。WO0308125使用线性DNA构建体(线性化质粒或PCR片段),其包含选择标记,两侧是5’和3’同源区,用于通过双交叉同源重组进行基因组整合。众所周知,在选择标记旁边,额外的DNA,如基因表达盒,当两侧是所述同源区时,被整合到细菌宿主细胞的染色体中。
同源重组需要足够大小的与宿主细胞染色体上靶序列的5’和3’侧翼序列同源的DNA序列,因此应当含有足够数量的核酸,如100-1,500个碱基对,优选400-1,500个碱基对,最优选800-1,500个碱基对,其与相应的靶序列具有高度相同性,以提高同源重组的概率(Dubnau,1993,Genetic exchange and homologous recombination.In Bacillussubtilis and Other Gram-positive Bacteria,p.555-584.Edited by A.I.Sonenshein,J.A.Hoch&R.Losick,Washington DC,American Society for Microbiology;Michel andEhrlich,1984,The EMBO Journal,vol.3,pp.2879-2884)。
通过缺失/插入/取代的基因失活也可以通过CRISPR/Cas9基因组编辑技术来实现,其中CRISPR切割特性可以用于破坏几乎任何生物体基因组中的基因,并且具有前所未有的便利性(Mali P,et al(2013)Science.339(6121):819-823;Cong L,et al(2013)Science 339(6121))。最近很明显,提供修复模板,例如同源区,允许在几乎任何位点用几乎任何期望的序列编辑基因组,将CRISPR转化为强大的基因编辑工具(WO/2014/150624,WO/2014/204728)。
基于CRISPR的基因组编辑系统在革兰氏阳性生物体中的应用已得到了很好的描述,如基于芽孢杆菌的单质粒系统方法,即在单个大肠杆菌-芽孢杆菌穿梭质粒上包含Cas9内切核酸酶、gRNA(例如sgRNA或crRNA/tracrRNA)、修复同源序列(供体DNA)(Altenbuchner,(2016):Applied and environmental microbiology 82(17),5421-5427;Zhou,et al.(2019):International journal of biological macromolecules 122,329–337),或双质粒系统或将Cas9内切核酸酶整合到芽孢杆菌基因组中,如WO2020206202和WO2020206197所述。
除“定向”失活方法外,在本发明的范围内应当理解,通过应用诱变条件如将细胞暴露于UV辐射,或化学诱变化学品如NTG(N-甲基-N'-硝基-N-亚硝基胍)、EMS(甲基磺酸乙酯),结合筛选和/或选择期望的特性,例如降低的脂肪酶/酯酶活性,进行全细胞诱变是实现功能失活的一种众所周知的方法。
此外,可以通过基因沉默使基因失活。基因沉默可以通过引入所述细菌宿主细胞反义表达构建体来实现,所述构建体导致与基因mRNA互补的反义RNA,从而抑制所述基因的表达。或者,可以通过CRISPR-抑制机制阻断转录起始或转录延伸来抑制所述基因的表达(WO18009520)。
改变的RemA和RemB蛋白以及编码它们的核酸
在另一实施方案中,本发明涉及改变的RemA蛋白或改变的RemB蛋白以及编码如本文所述的改变的RemA蛋白或改变的RemB蛋白的核酸,优选涉及改变的RemA蛋白以及编码如本文所述的改变的RemA蛋白的核酸。优选地,改变的RemA蛋白是天然RemA蛋白的变体。优选地,改变的RemB蛋白是天然RemB蛋白的变体。优选地,改变的RemA蛋白和/或RemB蛋白在芽孢杆菌宿主细胞中的功能降低。优选地,RemA和/或RemB蛋白的改变导致芽孢杆菌宿主细胞中RemA和/或RemB蛋白的功能失活。因此,本发明是指RemA和/或RemB蛋白的变体,优选失活的RemA和/或失活的RemB蛋白。优选地,改变的RemA或RemB蛋白包含一个或多个氨基酸交换。优选地,改变的RemA或RemB蛋白包含一个或多个非保守氨基酸取代(优选如表7所示),优选在保守氨基酸位置。
优选地,编码RemA蛋白的基因中的一个或多个点突变在SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置,IC值等于或大于3.0,更优选等于或大于3.2,最优选等于或大于3.5。因此,本发明还涉及编码这种改变的RemA蛋白的核酸分子,其包含编码SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置的三联体中的一个或多个点突变,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemA蛋白的基因中的一个或多个点突变导致RemA蛋白中的非保守氨基酸取代(如本文所定义,参见,例如,表7))。因此,优选改变的RemA蛋白包含一个或多个非保守氨基酸交换。因此,优选改变的RemA蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemA蛋白的功能降低。优选改变的RemA蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemA蛋白的失活。优选地,编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,更优选等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemA蛋白的基因中的一个或多个点突变导致对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置上的非保守氨基酸取代,优选失活取代,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ IDNO:21的氨基酸位置R18和/或P29。优选地,改变的RemA蛋白包含与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。优选地,改变的RemA蛋白包含与SEQ ID NO:21具有至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。
优选地,编码RemB蛋白的基因中的一个或多个错义点突变位于编码RemB蛋白中保守氨基酸的位置。优选地,编码RemB蛋白的基因中的一个或多个点突变在SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置,IC值等于或大于3.0,更优选等于或大于3.2,最优选等于或大于3.5。因此,本发明还涉及编码这种改变的RemB蛋白的核酸分子,其包含编码SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置的三联体中的一个或多个点突变,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5。
优选地,编码RemB蛋白的基因中的一个或多个点突变导致非保守氨基酸取代(如本文所定义)。因此,优选改变的RemB蛋白包含一个或多个非保守氨基酸交换。因此,优选改变的RemB蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemB蛋白的功能降低。优选改变的RemB蛋白包含一个或多个非保守氨基酸交换,其导致芽孢杆菌细胞中RemB蛋白的失活。优选地,编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5。优选地,编码RemB蛋白的基因中的一个或多个错义点突变在编码RemB蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的氨基酸位置4-71的一个或多个氨基酸位置,优选编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选失活取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。优选地,RemB蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%,优选至少90%序列相同性。优选地,改变的RemB蛋白包含与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。优选地,改变的RemB蛋白包含与SEQ ID NO:23具有至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性的氨基酸序列。
在另一实施方案中,本发明涉及编码如本文所述的改变的RemA和/或改变的RemB蛋白的核酸或核酸构建体。优选地,编码改变的RemA蛋白的核酸或核酸构建体包含:
(a)多核苷酸,其编码与SEQ ID NO:21、25、29、33或37具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性的氨基酸序列,优选SEQ ID NO:21、25、29、33或37,优选SEQID NO:21;
(b)多核苷酸,其与SEQ ID NO:20、24、28、32或36,优选SEQ ID NO:20具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性,
(c)多核苷酸,其在高严格性条件下与SEQ ID NO:20、24、28、32或36,优选SEQ IDNO:20中示出的多核苷酸的互补序列杂交,
(d)多核苷酸,其与SEQ ID NO:20、24、28、32或36,优选SEQ ID NO:20具有至少95%、但少于100%序列相同性,其中所述多核苷酸仅通过遗传密码的简并性而进一步不同于SEQ ID NO:20、24、28、32或36,优选SEQ ID NO:20,或者
(e)(a)、(b)、(c)或(d)的片段。
优选地,编码改变的RemB蛋白的核酸或核酸构建体包含:
(a)多核苷酸,其编码与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性的氨基酸序列;
(b)多核苷酸,其与SEQ ID NO:22、26、30、34或38,优选SEQ ID NO:22具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性,
(c)多核苷酸,其在高严格性条件下与SEQ ID NO:22、26、30、34或38,优选SEQ IDNO:22示出的多核苷酸的补体杂交,
(d)多核苷酸,其与SEQ ID NO:22、26、30、34或38,优选SEQ ID NO:22具有至少95%、但少于100%序列相同性,其中所述多核苷酸仅通过遗传密码的简并性而进一步不同于SEQ ID NO:22、26、30、34或38,优选SEQ ID NO:22,或者
(e)(a)、(b)、(c)或(d)的片段。
本文所述的改变的RemA蛋白是亲本RemA蛋白的变体。本文所述的改变的RemB蛋白是亲本RemB蛋白的变体。
亲本蛋白的变体可以具有与亲本序列的氨基酸序列具有一定百分比相同性的氨基酸序列。因此,亲本多肽的变体可以包含与亲本多肽的氨基酸序列至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但低于100%相同的氨基酸序列。因此,变体可以通过它们与亲本多肽相比时的序列相同性来定义。序列相同性通过提供为“%序列相同性”或“%相同性”。为了确定两个氨基酸序列之间的百分比相同性,在第一步中在这两个序列之间产生成对序列比对,其中将两个序列在它们的整个长度上比对(即,成对全局比对)。用实现Needleman和Wunsch算法(J.Mol.Biol.(1979)48,p.443-453)的程序产生比对,优选通过使用程序“NEEDLE”(The European Molecular Biology OpenSoftware Suite(EMBOSS)),用程序默认参数(gapopen=10.0,gapextend=0.5和matrix=EBLOSUM62)。用于本发明目的的优选比对是可以由其确定最高序列相同性的比对。
比对两个序列之后,在第二步中,应当从比对确定相同性值。因此,根据本发明,以下百分比相同性的计算适用:
%-相同性=(相同残基/在其完整长度上显示本发明的相应序列的比对区域的长度)*100。因此,与根据这个实施方案的两个氨基酸序列的比较相关的序列相同性是通过将相同残基的数量除以比对区域的长度来计算的,所述比对区域在其完整长度上显示本发明的相应序列。将这个值乘以100以给出“%-相同性”。
对于计算两个DNA序列的百分比相同性,与计算两个氨基酸序列的百分比相同性相同,具有一些规范。对于编码蛋白的DNA序列,应当在编码区的整个长度上进行成对比对,从起始密码子到终止密码子,不包括内含子。对于非蛋白编码DNA序列,应当在本发明序列的整个长度上进行成对比对,因此将本发明的完整序列与另一序列或另一序列之外的区域进行比较。此外,实现Needleman和Wunsch算法(J.Mol.Biol.(1979)48,p.443-453)的优选比对程序是“NEEDLE”(The European Molecular Biology Open Software Suite(EMBOSS)),用程序默认参数(gapopen=10.0,gapextend=0.5和matrix=EDNAFULL)。
对于核酸,也可以通过使用各自的严格性条件进行杂交来确定相似的序列。术语“高严格性条件”表示对于长度为至少100个核苷酸的探针,在42℃下于5X SSPE、0.3%SDS、200微克/ml剪切变性的鲑鱼精子DNA和50%甲酰胺中,按照标准Southern印迹程序进行预杂交和杂交12-24小时。最后使用2X SSC、0.2%SDS在65℃下洗涤载体材料三次,每次15分钟。术语“非常高严格性条件”表示对于长度为至少100个核苷酸的探针,在42℃下于5XSSPE、0.3%SDS、200微克/ml剪切变性的鲑鱼精子DNA和50%甲酰胺中,按照标准Southern印迹程序进行预杂交和杂交12-24小时。最后使用2X SSC、0.2%SDS在70℃下洗涤载体材料三次,每次15分钟。
在一实施方案中,变体多肽包含1-30、1-20、1-10或1-5个氨基酸取代,优选地,这类取代与酶的功能结构域无关。
变体可以通过它们与亲本多肽相比时的序列相似性来定义。序列相似性通常提供为“%序列相似性”或“%-相似性”。为了计算序列相似性,在第一步中必须如上所述生成序列比对。在第二步中,必须计算百分比-相似性,而百分比序列相似性考虑到定义的氨基酸集合具有相似的特性,例如,它们的大小,它们的疏水性,它们的电荷或其他特征。在这里,一个氨基酸与相似氨基酸的交换被称作“保守突变”。包含保守突变的多肽变体似乎对蛋白折叠的影响最小,导致某些多肽,优选酶,在与亲本多肽的多肽特性相比时,其特性基本上保持不变。
对于根据本发明确定%-相似性,适用以下内容,这也符合BLOSUM62矩阵(矩阵(Henikoff,J.G.;Proc.Natl.Acad.Sci.USA89,10915–10919(1992)),该矩阵式数据库搜索和序列比对中最常用的氨基酸取代矩阵之一。如果字母对的BLOSUM62取代矩阵的值为正,则氨基酸交换被定义为相似。表6示出了保守交换。
表6:
氨基酸A与氨基酸S相似
氨基酸D与氨基酸E;N相似
氨基酸E与氨基酸D;K;Q相似
氨基酸F与氨基酸W;Y相似
氨基酸H与氨基酸N;Y相似
氨基酸I与氨基酸L;M;V相似
氨基酸K与氨基酸E;Q;R相似
氨基酸L与氨基酸I;M;V相似
氨基酸M与氨基酸I;L;V相似
氨基酸N与氨基酸D;H;S相似
氨基酸Q与氨基酸E;K;R相似
氨基酸R与氨基酸K;Q相似
氨基酸S与氨基酸A;N;T相似
氨基酸T与氨基酸S相似
氨基酸V与氨基酸I;L;M相似
氨基酸W与氨基酸F;Y相似
氨基酸Y与氨基酸F;H;W相似。
保守氨基酸取代可能发生在功能蛋白如酶的多肽序列的全长序列上。在一实施方案中,这类突变与酶的功能结构域无关。在另一实施方案中,保守突变与酶的催化中心无关。
因此,根据本发明,以下百分比相似性的计算适用:
%-相似性=[(相同残基+相似残基)/在其完整长度上显示本发明的相应序列的比对区域的长度]*100。因此,与两个氨基酸序列的比较相关的序列相似性是通过将相同残基的数量加上相似残基的数量除以比对区域的长度来计算的,所述比对区域在其完整长度上显示本发明的相应序列。将这个值乘以100以给出“%-相似性”。
特别地,包含保守突变的变体多肽,其与全长多肽序列相比与相应的亲本序列至少m%相似,m是50和100之间的整数,优选50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99,预期具有基本上不变的多肽特性。在另一实施方案中,保守突变与酶的催化中心无关。在一实施方案中,变体多肽包含1-30、1-20、1-10或1-5个保守氨基酸取代,优选地,这类取代与酶的功能结构域无关。
同样,一个氨基酸与非相似氨基酸的交换被称作“非保守突变”。包含非保守突变的酶变体似乎对蛋白折叠有影响,导致某些酶特性与亲本酶的酶特性相比不同。因此,如果字母对的BLOSUM62取代矩阵的值为负,则氨基酸交换被定义为非保守的。表7示出了非保守交换。
表7:
氨基酸A与氨基酸D、E、F、H、I、K、L、M、N、P、Q、R、W、Y不相似
氨基酸C与氨基酸D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y不相似
氨基酸D与氨基酸A、C、F、G、H、I、K、L、M、P、R、T、V、W、Y不相似
氨基酸E与氨基酸A、C、F、G、I、L、M、P、T、V、W、Y不相似
氨基酸F与氨基酸A、C、D、E、G、H、K、N、P、Q、R、S、T、V不相似
氨基酸G与氨基酸C、D、E、F、H、I、K、L、M、P、Q、R、T、V、W、Y不相似
氨基酸H与氨基酸A、C、D、F、G、I、K、L、M、P、S、T、V、W不相似
氨基酸I与氨基酸A、C、D、E、G、H、K、N、P、Q、R、S、T、W、Y不相似
氨基酸K与氨基酸A、C、D、F、G、H、I、L、M、P、T、V、W、Y不相似
氨基酸L与氨基酸A、C、D、E、G、H、K、N、P、Q、R、S、T、W、Y不相似
氨基酸M与氨基酸A、C、D、E、G、H、K、N、P、R、S、T、W、Y不相似
氨基酸N与氨基酸A、C、F、I、L、M、P、V、W、Y不相似
氨基酸P与氨基酸A、C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W、Y不相似
氨基酸Q与氨基酸A、C、F、G、I、L、P、T、V、W、Y不相似
氨基酸R与氨基酸A、C、D、F、G、I、L、M、P、S、T、V、W、Y不相似
氨基酸S与氨基酸C、F、H、I、L、M、P、R、V、W、Y不相似
氨基酸T与氨基酸C、D、E、F、G、H、I、K、L、M、P、Q、R、W、Y不相似
氨基酸V与氨基酸C、D、E、F、G、H、K、N、P、Q、R、S、W、Y不相似
氨基酸W与氨基酸A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T、V不相似
氨基酸Y与氨基酸A、C、D、E、G、I、K、L、M、N、P、Q、R、S、T、V不相似
生产感兴趣的化合物的方法
在另一实施方案中,本发明涉及一种生产感兴趣的化合物,优选感兴趣的多肽的方法。为了生产感兴趣的多肽,修饰的芽孢杆菌宿主细胞应当包含至少一个编码感兴趣的多肽的多核苷酸,其中所述多核苷酸与启动子可操作地连接。因此,宿主细胞应当包含至少一种感兴趣的多肽的表达盒。
因此,本发明涉及一种生产感兴趣的化合物,优选感兴趣的多肽的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,
b)在所述修饰的芽孢杆菌宿主细胞上引入感兴趣的化合物的表达盒,优选感兴趣的多肽,
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地,从培养基分离感兴趣的化合物。
优选地,用于生产感兴趣的化合物的方法的芽孢杆菌宿主细胞选自短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌、嗜碱芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、迟缓芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、摩加夫芽孢杆菌、球芽孢杆菌或枯草芽孢杆菌。例如,用于生产感兴趣的化合物的方法的芽孢杆菌宿主细胞属于物种短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌、地衣芽孢杆菌或枯草芽孢杆菌。在另一优选实施方案中,宿主细胞是枯草芽孢杆菌宿主细胞。例如,宿主细胞可以是枯草芽孢杆菌菌株NCIB 3610的宿主细胞。然而,在一实施方案中,用于生产感兴趣的化合物的方法的宿主细胞不是枯草芽孢杆菌宿主细胞。因此,对于生产感兴趣的化合物的方法,优选宿主细胞选自短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌、嗜碱芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、迟缓芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、摩加夫芽孢杆菌或球芽孢杆菌。优选用于生产感兴趣的化合物的方法的宿主细胞选自基短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌或地衣芽孢杆菌。
上面给出的关于本发明修饰的宿主细胞的解释和定义比照适用于本发明的方法。
如本文所用的术语“培养”是指至少在预定时间内使培养物中包含的修饰的宿主细胞保持存活和/或增殖。该术语涵盖接种后生长开始时的指数细胞生长阶段以及稳定生长阶段。培养条件应当允许表达,即产生感兴趣的多肽。这类条件可以由技术人员选择,无需赘述。实施例3描述了培养修饰的宿主细胞的示例性条件。在本发明的方法的一实施方案中,步骤b)中的培养作为补料分批培养进行。
如果应用,本发明的方法允许增加至少一种感兴趣的化合物,优选多肽的表达,即产生。优选地,与未修饰的对照细胞中的表达相比,表达增加。在一优选实施方案中,与对照细胞中的表达相比,至少一种感兴趣的多肽的表达增加至少10%、20%或至少40%,如至少50%,或至少80%。例如,与对照细胞相比,至少一种感兴趣的多肽的表达可以增加20%-100%,如40%-60%。此外,设想表达增加至少100%、150%、200%、250%或300%,如200%-300%。通常,可以通过确定宿主细胞和/或培养基中感兴趣的化合物的量来测量表达。
在一实施方案中,用于在芽孢杆菌宿主细胞中表达感兴趣的化合物的表达盒对芽孢杆菌宿主细胞是异源的。优选地,编码至少一种感兴趣的多肽的多核苷酸对芽孢杆菌宿主细胞是异源的。优选地,在一实施方案中,编码至少一种感兴趣的多肽的多核苷酸对细菌宿主细胞是异源的。在整个说明书中使用的术语“异源”(或外源或外来或重组或非天然)多肽或蛋白在本文中定义为非宿主细胞天然的多肽或蛋白。类似地,术语“异源”(或外源或外来或重组或非天然)多核苷酸是指非宿主细胞天然的多核苷酸。
在一实施方案中,所述至少一种编码感兴趣的多肽的多核苷酸存在于质粒上。术语“质粒”是指染色体外的环状DNA,即在宿主细胞中自主复制的载体。因此,质粒被理解为染色体外载体。
在一优选实施方案中,质粒的复制应当独立于细菌宿主细胞染色体的复制。对于自主复制,表达载体可以进一步包含复制起点,使载体能够在所述宿主细胞中自主复制。细菌的复制起点包括但不限于允许在大肠杆菌(E.coli)中复制的质粒pBR322、pUC19、pSC101、pACYC177和pACYC184的复制起点(Sambrook,J.and Russell,D.W.Molecularcloning.Alaboratory manual,3rd ed,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY.2001;Cohen,S.N.,Chang,A.C.Y.,Boyer,H.W.,&Helling,R.B.(1973).Construction of Biologically Functional Bacterial Plasmids InVitro.Proceedings of the National Academy of Sciences of the United States ofAmerica,70(11),3240–3244),以及允许在芽孢杆菌中复制的pUB110、pC194、pE194、pTB19、和pTA1060(Janniere,L.,Bruand,C.,and Ehrlich,S.D.(1990).Structurallystable Bacillus subtilis cloning vectors.Gene 87,53-6;Ehrlich,S.D.,Bruand,C.,Sozhamannan,S.,Dabert,P.,Gros,M.F.,Janniere,L.,and Gruss,A.(1991).Plasmidreplication and structural stability in Bacillus subtilis.Res.Microbiol.142,869-873),以及pE194(Dempsey,L.A.and Dubnau,D.A.(1989).Localization of thereplication origin of plasmid pE194.J.Bacteriol.171,2866-2869)。复制起点可以是具有突变的复制起点,使其功能在宿主细胞中对温度敏感。
质粒的拷贝数定义为在正常生长条件下每个细菌细胞或每个染色体的质粒平均数量。此外,有不同类型的复制起点,导致细菌宿主中的拷贝数不同。质粒复制子pBS72(登录号AY102630.1)和质粒pTB19及衍生物pTB51、pTB52在芽孢杆菌细胞内分别赋予6个拷贝和1-8个拷贝的低拷贝数,而质粒pE194(登录号V01278.1)和pUB110(登录号M19465.1)/pBC16(登录号U32369.1)分别赋予每个细胞14-20个拷贝的中低拷贝数和30-50个拷贝的中拷贝数。对质粒pE194进行了更详细的分析(Villafane,et al(1987):J.Bacteriol.169(10),4822-4829),描述的几种pE194–cop突变体在芽孢杆菌内具有85个拷贝至202个拷贝的高拷贝数。此外,质粒pE194对温度敏感,在高达37℃下具有稳定的拷贝数,但在43℃以上停止复制。此外,它存在一种称作pE194ts的pE194变体,在cop-repF区内有两个点突变(nt1235和nt 1431),导致更强烈的温度敏感性–在高达32℃下具有稳定拷贝数,但是在37℃下每个细胞只有1-2个拷贝。
在一实施方案中,载体含有一个或多个选择标记,其允许容易选择转化的细胞。选择标记是编码产物的基因,其提供杀生物剂抗性、重金属抗性、对营养缺陷型的原营养等。细菌选择标记包括但不限于来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者赋予抗生素抗性的标记,如氨苄西林、卡纳霉素、红霉素、氯霉素或四环素抗性。此外,选择可以通过共转化来完成,例如,如WO91/09129所述,其中选择标记在单独的载体上。
在另一实施方案中,将所述至少一种编码感兴趣的多肽的多核苷酸稳定地整合到细菌染色体中。
启动子
所述至少一种编码感兴趣的多肽的多核苷酸应当与启动子可操作地连接。
如本文所用的术语“可操作地连接”是指启动子序列和编码感兴趣的多肽的多核苷酸之间的功能性连接,使得启动子序列能够启动编码感兴趣的多肽的多核苷酸(在本文中也称作感兴趣的基因)的转录。
“启动子”或“启动子序列”是位于基因上游的核苷酸序列,与基因位于同一条链上,使该基因能够转录。启动子之后是基因的转录起始位点。启动子被RNA聚合酶(连同任何所需的转录因子)识别,从而启动转录。启动子的功能片段或功能变体是可被RNA聚合酶识别并能够启动转录的核苷酸序列。
“活性启动子片段”、“活性启动子变体”、“功能性启动子片段”或“功能性启动子变体”描述了仍然具有启动子活性的启动子核苷酸序列的片段或变体。
启动子可以是“诱导物依赖性启动子”或“诱导物非依赖性启动子”,包含组成型启动子或受其他细胞调节因子控制的启动子。
本领域技术人员能够选择合适的启动子来表达第三丙氨酸消旋酶和感兴趣的多肽。例如,编码感兴趣的多肽的多核苷酸优选与“诱导物依赖性启动子”或“诱导物非依赖性启动子”可操作地连接。此外,编码第三丙氨酸消旋酶的多核苷酸优选与“诱导物非依赖性启动子”,如组成型启动子可操作地连接。
“诱导物依赖性启动子”在本文中理解为在发酵培养基中添加“诱导物分子”后,其活性增加,从而使启动子可操作地连接的基因能够转录的启动子。因此,对于诱导物依赖性启动子,诱导物分子的存在会通过信号转导触发与启动子可操作地连接的基因的表达增加。通过诱导物分子的存在激活之前的基因表达不需要不存在,而是也可以以低水平的基础基因表达存在,在添加诱导物分子后增加。“诱导物分子”是一种分子,其在发酵培养基中的存在能够通过增加与基因可操作地连接的诱导物依赖性启动子的活性来影响基因表达的增加。优选地,诱导物分子是碳水化合物或其类似物。在一实施方案中,诱导物分子是芽孢杆菌细胞的次级碳源。在碳水化合物混合物的存在下,细胞选择性地吸收为其提供最多能量和生长优势的碳源(主要碳源)。同时,它们抑制参与不太优选的碳源(次级碳源)的分解代谢和摄取的各种功能。通常,芽孢杆菌的主要碳源是葡萄糖,各种其他糖和糖衍生物被芽孢杆菌用作次级碳源。次级碳源包括例如甘露糖或乳糖,但不限于这些。
诱导物依赖性启动子的实例在下表中通过参考各自的操纵子给出:
/>
与此相反,不依赖于诱导物分子存在的启动子(在本文中称作“诱导物非依赖性启动子”)的活性是组成型活性的,或者可以增加,无论添加至发酵培养基中的诱导物分子是否存在。
组成型启动子不依赖其他细胞调节因子,转录起始依赖于σ因子A(sigA)。sigA依赖性启动子包含σ因子A特异性识别位点‘-35’-区和‘-10’-区。
优选地,“诱导物依赖性启动子”序列选自组成型启动子,其不限于启动子Pveg、PlepA、PserA、PymdA、Pfba及其具有不同基因表达强度的衍生物(Guiziou et al,(2016):Nucleic Acids Res.44(15),7495-7508),编码芽孢杆菌aprE基因的枯草杆菌蛋白酶的aprE启动子,噬菌体SPO1启动子P4、P5、P15(WO15118126),来自苏云金芽孢杆菌的cryIIIA启动子(WO9425612),来自解淀粉芽孢杆菌的amyQ启动子,来自地衣芽孢杆菌的amyL启动子和启动子变体(US5698415)及其组合,或者它们的活性片段或变体,优选aprE启动子序列。
WO9102792公开了碱性蛋白酶基因启动子的功能,用于在地衣芽孢杆菌中大规模生产枯草杆菌蛋白酶Carlsberg型蛋白酶及其在发酵过程中的生产。
编码枯草杆菌蛋白酶的短小芽孢杆菌基因aprE1和aprE2的启动子已用于在短小芽孢杆菌中表达重组蛋白酶和淀粉酶(T,Wiechert W.Microb CellFact.2014Mar24;13(1):46.)。特别地,与PaprE1-IV启动子变体(相对于起始ATG的nt-357)相比,包含相对于起始ATG的核苷酸nt-382的PaprE1-III启动子变体表现出非常高的生产力。
“aprE启动子”、“aprE型启动子”或“aprE启动子序列”是位于aprE基因上游的核苷酸序列(或者其部分或变体),即编码芽孢杆菌枯草杆菌蛋白酶Carlsberg蛋白酶的基因,与aprE基因位于同一条链上,使得aprE基因能够转录。术语“转录起始位点”或“转录的起始位点”应当理解为在基因序列5’端的转录起始的位置。在原核生物中,称作+1的第一个核苷酸一般为腺苷(A)或鸟苷(G)核苷酸。在这种情况下,术语“位点”和“信号”在本文中可互换使用。
进一步任选地,启动子包含5'UTR。这是-1启动子位置下游的转录但不翻译的区域。例如,这种非翻译区应当包含核糖体结合位点,以便在靶基因编码肽或多肽的情况下促进翻译。
WO9102792公开了碱性蛋白酶基因启动子的功能,用于在地衣芽孢杆菌中大规模生产枯草杆菌蛋白酶Carlsberg型蛋白酶。特别地,WO9102792描述了地衣芽孢杆菌编码枯草杆菌蛋白酶Carlsberg蛋白酶的aprE基因的5’区(图27),其包含功能性aprE基因启动子和包含核糖体结合位点的5’UTR(Shine Dalgarno序列)。
术语“转录起始位点”或“转录的起始位点”应当理解为在基因序列5’端的转录起始的位置。在原核生物中,称作+1的第一个核苷酸一般为腺苷(A)或鸟苷(G)核苷酸。在这种情况下,术语“位点”和“信号”在本文中可互换使用。
术语“表达”或“基因表达”是指一个特定基因或多个特定基因或特定核酸构建体的转录。术语“表达”或“基因表达”特别是指一个基因或多个基因或遗传构建体转录为结构RNA(例如,rRNA、tRNA)或mRNA,后者随后翻译或不翻译为蛋白。该过程包括DNA的转录和所得mRNA产物的加工。
进一步任选地,启动子包含5'UTR。这是-1启动子位置下游的转录但不翻译的区域。例如,这种非翻译区应当包含核糖体结合位点,以便在靶基因编码肽或多肽的情况下促进翻译。
关于5'UTR,本发明特别教导将本发明的启动子与包含一个或多个稳定元件的5'UTR组合。这样,可以加工由启动子区合成的mRNA以产生在转录本的5’端具有稳定序列的mRNA转录本。如Hue et al,1995,Journal of Bacteriology 177:3465-3471所述,优选在mRNA转录本5'端的这种稳定物序列增加它们的半衰期。合适的mRNA稳定元件如下所述
-WO08148575,优选WO08140615的SEQ ID NO.1-5,或这些序列中保持mRNA稳定功能的片段,以及
-WO08140615,优选苏云金芽孢杆菌CrylllA mRNA稳定序列或噬菌体SP82mRNA稳定序列,更优选根据WO08140615的SEQ ID NO.4或5的mRNA稳定序列,更优选根据WO08140615的SEQ ID NO.6的修饰的mRNA稳定序列,或者这些序列中保持mRNA稳定功能的片段。
优选的mRNA稳定元件选自aprE、grpE、cotG、SP82、RSBgsiB、CrylllA mRNA稳定元件,或根据这些序列中保持mRNA稳定功能的片段。优选的mRNA稳定元件是grpE mRNA稳定元件(对应于WO08148575的SEQ ID NO.2)。
5'UTR还优选包含位于启动子下游和核糖体结合位点(RBS)上游的修饰的rib前导序列。在本发明的背景下,rib前导序列在此定义为芽孢杆菌细胞(更优选枯草芽孢杆菌细胞)中核黄素生物合成基因(rib操纵子)上游的前导序列。在枯草芽孢杆菌中,包含参与核黄素生物合成的基因的rib操纵子包括ribG(ribD)、ribB(ribE)、ribA和ribH基因。枯草芽孢杆菌中来自rib启动子(Prib)的核黄素操纵子的转录由核糖开关控制,该核糖开关涉及一个近300个核苷酸的非翻译调节前导区(rib前导区),位于操纵子ribG中第一个基因的转录起始和翻译起始密码子之间的rib操纵子的5'-区域。WO2015/1181296,特别是第23-25页中描述了合适的rib前导序列,其援引加入本文。
对于工业发酵过程,可以对细菌宿主细胞进行遗传修饰以满足最高产品纯度和监管要求的需要。因此,在本发明的范围内使用芽孢杆菌生产宿主,其可以额外含有其他基因的修饰,例如,缺失或破坏,这些基因可能不利于感兴趣的多肽的生产、回收或应用。在一实施方案中,细菌宿主细胞是蛋白酶缺陷的细胞。细菌宿主细胞,例如,芽孢杆菌细胞,优选包含胞外蛋白酶基因的破坏或缺失,所述胞外蛋白酶基因包括但不限于aprE、mpr、vpr、bpr和/或epr。此外,优选细菌宿主细胞不产生孢子。此外,优选细菌宿主细胞,例如,芽孢杆菌细胞,包含参与孢子形成的基因的破坏或缺失。参与孢子形成的基因是本领域众所周知的(EP1391502),包括但不限于sigE、sigF、spoIIGA、spoIIE、sigG、spoIVCB、yqfD。在一优选实施方案中,使sigF基因缺失。此外,优选细菌宿主细胞,例如,芽孢杆菌细胞,包含参与表面活性素生物合成的基因之一的破坏或缺失,例如,srfA、srfB、srfC和/或srfD,参见,例如,美国专利第5,958,728号。还优选细菌宿主细胞包含参与聚谷氨酸生物合成的基因之一的破坏或缺失(US2016002591)。因此,使参与多聚γ-谷氨酸(pga)产生的至少一个基因失活(如缺失)。优选地,所述参与多聚γ-谷氨酸(pga)的至少一个基因是选自ywsC(pgsB)、ywtA(pgsC)、ywtB(pgsA)和ywtC(pgsE)的至少一个基因。优选地,所有上述基因,即ywsC(pgsB)、ywtA(pgsC)、ywtB(pgsA)和ywtC(pgsE)已失活(如缺失)。还可以破坏或缺失不利于感兴趣的多肽的生产、回收或应用的其他基因,包括但不限于amyE基因。
在一实施方案中,芽孢杆菌细胞包含选择标记。选择标记可以是抗生素抗性标记,如氨苄西林、卡纳霉素、红霉素、氯霉素或四环素,或者营养缺陷型抗性标记。
任选地,芽孢杆菌细胞可以包含如本文所述的反选择标记。在一优选实施方案中,反选择多肽是参与嘧啶代谢的多肽。因此,反选择多肽,如oroP、pyrE、pyrF、upp,在嘧啶代谢中使用中间体的氟化类似物,如5-氟-乳清酸酯或5-氟-尿苷。或者,毒素-抗毒素系统(TA)的毒素如mazEF、ccdAB可以用作芽孢杆菌中的功能性反选择多肽(参见Dong,H.,Zhang,D.Current development in genetic engineering strategies of Bacillusspecies.Microb Cell Fact 13,63(2014))。在一更优选的实施方案中,反选择多肽是胞嘧啶脱氨酶,如codBA系统提供(Kostner D,Rachinger M,Liebl W,EhrenreichA.Markerless deletion of putative alanine dehydrogenase genes in Bacilluslicheniformis using a codBA-based counterselectiontechnique.Microbiology.2017;163(11):1532-1539)。优选地,反选择剂是5-氟-胞嘧啶
感兴趣的化合物
本发明的宿主细胞应当进一步包含表达盒,用于产生感兴趣的化合物,优选感兴趣的多肽。
感兴趣的化合物可以是聚合物,优选透明质酸,优选如(WO2005098016)所述,或者聚谷氨酸,优选如EP2196534所述,或者可以是维生素,优选维生素B5,优选如WO2010018169所述,或者核黄素,优选如WO2017036903所述,或者可以是多肽,优选酶。
如本文所用的术语“感兴趣的多肽”是指打算在细菌宿主细胞中产生的任何蛋白、肽或其片段。因此,蛋白涵盖多肽、肽、其片段以及融合蛋白等。
优选地,感兴趣的化合物,优选感兴趣的多肽,由芽孢杆菌宿主细胞分泌。
优选地,感兴趣的多肽是酶,如胞外酶。胞外酶(或细胞外酶)是由宿主细胞分泌的酶。
在一特别优选的实施方案中,所述酶被分类为氧化还原酶(EC 1)、转移酶(EC 2)、水解酶(EC 3)、裂解酶(EC 4)、异构酶(EC 5)或连接酶(EC 6)。在一优选实施方案中,感兴趣的蛋白是适合用于洗涤剂、饲料和食品应用的酶。
最优选地,所述酶是水解酶(EC 3),优选糖苷酶(EC 3.2)或肽酶(EC 3.4)。特别优选的酶是选自淀粉酶(特别是α-淀粉酶(EC 3.2.1.1)、β-β淀粉酶(EC 3.2.1.2)、纤维素酶(EC 3.2.1.4)、内切-1,3-β-木聚糖酶木聚糖酶(EC 3.2.1.32)、内切-1,4-β-木聚糖酶(EC3.2.1.8)、乳糖酶(EC 3.2.1.108)、半乳糖苷酶(EC 3.2.1.23和EC 3.2.1.24)、甘露聚糖酶(EC 3.2.1.24和EC 3.2.1.25)、脂肪酶(EC 3.1.1.3)、植酸酶(EC 3.1.3.8)、核酸酶(EC3.1.11至EC 3.1.31)和蛋白酶(EC 3.4)的酶;特别是选自淀粉酶、蛋白酶、脂肪酶、甘露聚糖酶、植酸酶、木聚糖酶、磷酸酶、β-半乳糖苷酶、乳糖酶葡糖淀粉酶、核酸酶和纤维素酶的酶,优选淀粉酶、甘露聚糖酶、乳糖酶或蛋白酶,优选淀粉酶和蛋白酶。最优选的是丝氨酸蛋白酶(EC 3.4.21),优选枯草杆菌蛋白酶。
特别地,优选以下感兴趣的蛋白:
具有蛋白水解活性的酶称为“蛋白酶”或“肽酶”。蛋白酶是发挥“蛋白酶活性”或“蛋白水解活性”的活性蛋白。蛋白酶是EC 3.4类的成员。蛋白酶包括氨肽酶(EC 3.4.11)、二肽酶(EC 3.4.13)、二肽基-肽酶和三肽基-肽酶(EC 3.4.14)、肽基-二肽酶(EC 3.4.15)、丝氨酸型羧肽酶(EC 3.4.16)、金属羧肽酶(EC 3.4.17)、半胱氨酸型羧肽酶(EC 3.4.18)、ω肽酶(EC 3.4.19)、丝氨酸内肽酶(EC 3.4.21)、半胱氨酸内肽酶(EC 3.4.22)、天冬氨酸内肽酶(EC 3.4.23)、金属-内肽酶(EC 3.4.24)、苏氨酸内肽酶(EC 3.4.25)、催化机制未知的内肽酶(EC 3.4.99)。可商购的蛋白酶包括但不限于LavergyTMPro(BASF);DuralaseTM、DurazymTM、/>Ultra、/>Ultra、/> Ultra、/>Coro-/> Ultra、/>和/>(Novozymes A/S),以商品名Prime、Pura-fect/>Purafect/>Purafect/>Ex- 和/>(Dan-isco/DuPont)、AxapemTM(Gist-Brocases N.V.)出售的那些蛋白酶,迟缓芽孢杆菌碱性蛋白酶和来自Kao的KAP(嗜碱芽孢杆菌蛋白酶)。至少一种蛋白酶可以选自丝氨酸蛋白酶(EC3.4.21)。丝氨酸蛋白酶或丝氨酸肽酶(EC 3.4.21)的特征在于在催化活性位点具有丝氨酸,其在催化反应期间与底物形成共价加合物。丝氨酸蛋白酶可以选自胰凝乳蛋白酶(例如,EC 3.4.21.1)、弹性蛋白酶(例如,EC 3.4.21.36)、弹性蛋白酶(例如,EC 3.4.21.37或EC 3.4.21.71)、颗粒酶(例如,EC 3.4.21.78或EC 3.4.21.79)、激肽释放酶(例如,EC3.4.21.34、EC 3.4.21.35、EC 3.4.21.118或EC 3.4.21.119)、纤溶酶(例如,EC3.4.21.7)、胰蛋白酶(例如,EC 3.4.21.4)、凝血酶(例如,EC 3.4.21.5)和枯草杆菌蛋白酶(也称作枯草杆菌肽酶,例如,EC 3.4.21.62),后者在下文中也称作“枯草杆菌蛋白酶”。优选地,所述蛋白酶是迟缓芽孢杆菌碱性蛋白酶(BLAP)的蛋白酶变体,最优选包含取代R101E的BLAP(根据BPN的编号)。根据本发明的蛋白酶具有蛋白水解活性。确定蛋白水解活性的方法在文献中是众所周知的(参见例如Gupta et al.(2002),Appl.Microbiol.Bio-technol.60:381-395)。
因此,本发明涉及一种生产酶的方法,优选蛋白酶或淀粉酶,所述方法包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,
b)在所述修饰的芽孢杆菌宿主细胞上引入酶的表达盒,优选蛋白酶或淀粉酶,
b)在允许表达所述酶的条件下培养宿主细胞,以及
c)任选地从培养基分离所述酶。
优选的实施方案
1.一种修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌细胞。
2.实施方案1的修饰的芽孢杆菌宿主细胞,其中所述RemA蛋白的改变是由编码RemA蛋白的基因中的一个或多个点突变,优选一个或多个错义突变引起的,并且其中所述RemB蛋白的改变是由编码RemB蛋白的基因中的一个或多个点突变,优选一个或多个错义突变引起的。
3.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白和/或改变的RemB蛋白包含在保守氨基酸位置上的由一个或多个错义突变引起的一个或多个非保守突变。
4.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白优选包含在保守氨基酸位置上的一个或多个非保守突变,导致芽孢杆菌宿主细胞中RemA蛋白的失活。
5.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemB包含优选在保守氨基酸位置上的一个或多个非保守突变,导致芽孢杆菌宿主细胞中RemB蛋白的失活。
6.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个错义点突变在编码RemA蛋白中保守氨基酸的位置,优选在对应于SEQ IDNO:21的氨基酸位置5-77的一个或多个氨基酸位置。
7.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ ID NO:21的氨基酸位置R18和/或P29。
8.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S中的至少一个。
9.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemB蛋白的基因中的一个或多个错义点突变在编码RemB蛋白中保守氨基酸的位置,优选在对应于SEQ IDNO:23的氨基酸位置4-71的一个或多个氨基酸位置。
10.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6,I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。
11.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述RemA和/或RemB蛋白的改变是RemA和/或RemB蛋白的失活。
12.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述宿主细胞属于物种嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、蜡样芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、球芽孢杆菌、耐盐芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、甲基营养型芽孢杆菌、摩加夫芽孢杆菌、短小芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、苏云金芽孢杆菌或贝莱斯芽孢杆菌,优选地衣芽孢杆菌。
13.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性,并且其中所述改变的RemB蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性。
14.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性,并且包含SEQ ID NO:21的氨基酸位置R18和P29上的取代X18W和X29S中的至少一个,优选两个,优选其中所述改变的RemA蛋白与SEQ ID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%相同性,并且包含SEQ ID NO:21的氨基酸位置R18和P29上的取代R18W和P29S中的至少一个,优选两个。
15.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remA和/或内源性remB基因的缺失或失活。
16.一种包含改变的RemA蛋白的修饰的芽孢杆菌宿主细胞,其中所述RemA蛋白的改变是由于编码RemA蛋白的基因中的一个或多个错义点突变,所述突变在编码RemA蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌细胞,其中所述RemA蛋白的改变是RemA蛋白的失活,并且其中所述改变的RemA蛋白与SEQ ID NO:21、25、29、33或37,优选SEQ IDNO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性。
17.实施方案16的修饰的芽孢杆菌宿主细胞,其中所述修饰的芽孢杆菌宿主细胞中改变的RemA蛋白由引入芽孢杆菌宿主细胞的外源基因编码。
18.实施方案16或17中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remA基因的缺失或失活。
19.实施方案16-18中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含如本文所述的改变的RemB蛋白。
20.实施方案16-19中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remB基因的缺失或失活。
21.一种包含改变的RemB蛋白的修饰的芽孢杆菌宿主细胞,其中所述RemA蛋白的改变是由于编码RemA蛋白的基因中的一个或多个错义点突变,所述突变在编码RemB蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:23的氨基酸位置5-77的一个或多个氨基酸位置,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌细胞,其中所述RemB蛋白的改变是RemB蛋白的失活,并且其中所述RemA蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性。
22.实施方案21的修饰的芽孢杆菌宿主细胞,其中所述修饰的芽孢杆菌宿主细胞中改变的RemB蛋白由引入芽孢杆菌宿主细胞的外源基因编码。
23.实施方案21或22中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remB基因的缺失或失活。
24.实施方案21-23中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含如本文所述的改变的RemA蛋白。
25.实施方案21-24中任一项的修饰的芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含内源性remA基因的缺失或失活。
26.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述修饰的芽孢杆菌宿主细胞是地衣芽孢杆菌宿主细胞。
27.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述宿主细胞包含表达盒,用于生产感兴趣的化合物,优选感兴趣的多肽。
28.实施方案27的修饰的芽孢杆菌宿主细胞,其中感兴趣的多肽是酶,如选自淀粉酶、蛋白酶、脂肪酶、磷脂酶、甘露聚糖酶、植酸酶、木聚糖酶、乳糖酶、磷酸酶、葡糖淀粉酶、核酸酶、半乳糖苷酶、内切葡聚糖酶和纤维素酶的酶,优选蛋白酶。
29.实施方案27或28中任一项的修饰的芽孢杆菌宿主细胞,其中与不包含改变的RemA蛋白和/或改变的RemB蛋白的芽孢杆菌对照细胞相比,所述修饰的芽孢杆菌宿主细胞包含增加的感兴趣的化合物产量。
30.前述实施方案中任一项的修饰的芽孢杆菌宿主细胞,其中所述修饰的芽孢杆菌宿主细胞包含如本文所述的改变的RemA蛋白和缺失的内源性RemB蛋白,或者其中所述修饰的芽孢杆菌宿主细胞包含如本文所述的改变的RemB蛋白和缺失的内源性RemA蛋白。
31.一种生产感兴趣的化合物,优选感兴趣的多肽的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离感兴趣的化合物。
32.一种增加由芽孢杆菌细胞生产感兴趣的化合物,优选感兴趣的多肽的纯度的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离感兴趣的化合物。
33.一种生产酶的方法,优选蛋白酶或淀粉酶,所述方法包括
a)提供修饰的芽孢杆菌宿主细胞,其包含如本文所述的改变的RemA蛋白和/或改变的RemB蛋白,优选地,其中所述的改变的RemA蛋白和/或改变的RemB蛋白包含在保守氨基酸位置上的一个或多个非保守氨基酸突变,优选失活突变。
b)在允许表达感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离感兴趣的化合物。
34.实施方案31-33中任一项的生产感兴趣的化合物的方法,其中所述芽孢杆菌宿主细胞选自嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、蜡样芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、球芽孢杆菌、耐盐芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、甲基营养型芽孢杆菌、摩加夫芽孢杆菌、短小芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、枯草芽孢杆菌、苏云金芽孢杆菌或贝莱斯芽孢杆菌,优选地衣芽孢杆菌。
35.一种改变的RemA或RemB蛋白,其中所述改变的RemA蛋白包含在SEQ ID NO:21的保守氨基酸位置上的一个或多个非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ ID NO:21的氨基酸位置R18和/或P29,并且其中所述改变的RemB蛋白包含在SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的一个或多个非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选SEQ ID NO:23的氨基酸位置G6、I19、S62、T67、L68和R71,最优选SEQ ID NO:23的氨基酸位置G6、T67、L68和R71。
36.实施方案35的改变的RemA蛋白和/或改变的RemB,其中在保守氨基酸位置上的非保守氨基酸取代是降低芽孢杆菌细胞中RemA蛋白和/或RemB蛋白功能的取代。
37.实施方案35或36中任一项的改变的RemA蛋白,其中所述改变的RemA蛋白与SEQID NO:21具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列相同性。
38.实施方案35或36中任一项的改变的RemB蛋白,其中所述改变的RemB蛋白与SEQID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列相同性。
39.如本文所述的改变的RemA蛋白和/或改变的RemB蛋白在增加芽孢杆菌细胞产生感兴趣的化合物中的用途,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌细胞。
实施例
材料和方法
以下实施例仅用于说明本发明。对本领域技术人员显而易见的许多可能的变化也落在本发明的范围内。
除非另有说明,以下实验是通过应用如遗传工程和通过微生物培养发酵生产化合物中使用的标准设备、方法、化学品和生物化学品进行的。还参见Sambrook等人(Sambrook,J.and Russell,D.W.Molecular cloning.A laboratory manual,3rd ed,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY.2001)和Chmiel等人(Bioprocesstechnik 1.Einführung in die Bioverfahrenstechnik,Gustav FischerVerlag,Stuttgart,1991)。
电转感受态地衣芽孢杆菌细胞和电穿孔
通过电穿孔,如US5352604所述将DNA转化到地衣芽孢杆菌菌株中。电转感受态地衣芽孢杆菌细胞的制备和DNA的转化基本上如Brigidi等人(Brigidi,P.,Mateuzzi,D.(1991).Biotechnol.Techniques 5,5)所述进行,有以下修改:DNA转化后,将细胞在1mlLBSPG缓冲液中恢复并在37℃下温育60min(J.,1989,FEMS Microbio.Lett.,61:165-170),然后在选择性LB-琼脂平板上铺板。
为了克服地衣芽孢杆菌菌株的地衣芽孢杆菌特异性限制性修饰系统,如下所述从Ec#098细胞分离质粒DNA。
质粒分离
通过(Sambrook,J.and Russell,D.W.Molecular cloning.A laboratorymanual,3rd ed,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY.2001)中描述的标准分子生物学方法或碱性裂解方法(Birnboim,H.C.,Doly,J.(1979).NucleicAcids Res 7(6):1513-1523)从芽孢杆菌或大肠杆菌细胞分离质粒DNA。在细胞裂解之前,将芽孢杆菌细胞与在37C下用10mg/ml溶菌酶处理30min的大肠杆菌进行比较。
分子生物学方法和技术
分子生物学中的标准方法不限于芽孢杆菌和大肠杆菌微生物的培养、DNA的电穿孔、基因组和质粒DNA的分离、PCR反应、克隆技术,基本上如Sambrook和Rusell.(Sambrook,J.and Russell,D.W.Molecular cloning.A laboratory manual,3rd ed,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY.2001.)所述进行。
菌株
大肠杆菌菌株Ec#098
大肠杆菌菌株Ec#098是携带编码DNA-甲基转移酶的表达质粒pMDS003WO2019016051的大肠杆菌INV110菌株(Life technologies)。
地衣芽孢杆菌基因k.o菌株的产生
为了在如US5352604所述的地衣芽孢杆菌菌株及其衍生物中进行基因缺失,将缺失质粒转化到根据Chung的方法制备的感受态大肠杆菌菌株Ec#098中(Chung,C.T.,Niemela,S.L.,and Miller,R.H.(1989).One-step preparation of competentEscherichia coli:transformation and storage of bacterial cells in the same solution.Proc.Natl.Acad.Sci.U.S.A 86,2172-2175),然后在含有100μg/ml氨苄西林和30μg/ml氯霉素的LB-琼脂平板上于37℃下选择。从单个克隆中分离质粒DNA,并通过PCR分析来分析其正确性。分离的质粒DNA携带如WO2019016051所述的地衣芽孢杆菌的DNA甲基化模式,并且在转移到地衣芽孢杆菌中时免受降解。
aprE基因缺失菌株Bli#002
如上所述制备US5352604中所述的电转感受态的地衣芽孢杆菌细胞,用1μg分离自大肠杆菌Ec#098的pDel003 aprE基因缺失质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如下所述进行基因缺失过程:
使携带质粒的地衣芽孢杆菌细胞在具有5μg/ml红霉素的LB-琼脂平板上于45℃下生长,迫使缺失质粒通过Campbell重组整合到染色体中,pDel003的同源区之一与aprE基因的序列5’或3’同源。挑取克隆,在没有选择压力的LB-培养基中于45℃下培养6小时,然后在30℃下涂布于具有5μg/ml红霉素的LB-琼脂平板上。挑取单个克隆,用寡核苷酸SEQ ID 06和SEQ ID 07通过菌落-PCR分析aprE基因的成功缺失。挑取推定的缺失阳性单个克隆,在不含抗生素的LB培养基中于45℃下连续两次过夜培养以固化质粒,并且涂布在LB-琼脂平板上于30℃下过夜培养。将单克隆再次在具有5μg/ml红霉素的LB-琼脂平板上重新划线,并且通过菌落PCR分析aprE基因的成功缺失。分离出具有正确缺失的aprE基因的单个红霉素敏感克隆,命名为Bli#002。
amyB基因缺失菌株Bli#003
如上所述制备电转感受态的地衣芽孢杆菌Bli#002细胞,用1μg分离自大肠杆菌Ec#098的pDel004 amyB基因缺失质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如对aprE基因所述进行基因缺失过程。
用寡核苷酸SEQ ID 09和SEQ ID 10通过PCR分析amyB基因的缺失。将得到的具有缺失的aprE和缺失的amyB基因的地衣芽孢杆菌菌株命名为Bli#003。
sigF基因缺失菌株Bli#004
如上所述制备电转感受态的地衣芽孢杆菌Bli#003细胞,用1μg分离自大肠杆菌Ec#098的pDel005 sigF基因缺失质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如对aprE基因所述进行基因缺失过程。
用寡核苷酸SEQ ID 12和SEQ ID 13通过PCR分析sigF基因的缺失。将得到的具有缺失的aprE、缺失的amyB基因和缺失的sigF基因的地衣芽孢杆菌菌株命名为Bli#004。如所述(WO9703185)地衣芽孢杆菌菌株Bli#004不再能够产孢。
多聚γ谷氨酸合成基因缺失菌株Bli#008
如上所述制备电转感受态的地衣芽孢杆菌Bli#004细胞,用1μg分离自大肠杆菌Ec#098的pDel007 pga基因缺失质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如对aprE基因缺失所述进行基因缺失过程。
用寡核苷酸SEQ ID 15和SEQ ID 16通过PCR分析pga基因的缺失。将得到的具有缺失的aprE、缺失的amyB基因、缺失的sigF基因和缺失的pga基因簇的地衣芽孢杆菌菌株命名为Bli#008。
remA R18W P29S菌株Bli#030
如上所述制备电转感受态的地衣芽孢杆菌Bli#008细胞,用1μg分离自大肠杆菌Ec#098的pDel034 remA基因编辑质粒转化,然后在30℃下涂布于含有5μg/ml红霉素的LB-琼脂平板上。
如对aprE基因缺失所述进行基因缺失过程。
用ClaI限制性内切核酸酶进行限制性酶切割后,用寡核苷酸SEQ ID 18和SEQ ID19通过PCR分析remA基因的基因编辑。将得到的具有缺失的aprE、缺失的amyB基因、缺失的sigF基因、缺失的pga基因簇和突变的remA R18W P19S的地衣芽孢杆菌菌株命名为Bli#030。
质粒
pEC194RS-芽孢杆菌温度敏感缺失质粒
将质粒pE194(Villafane,et al(1987):J.Bacteriol.169(10),4822-4829)用具有侧翼PvuII位点的寡核苷酸SEQ ID 01和SEQ ID 02进行PCR扩增,用限制性内切核酸酶PvuII消化并连接至用限制性酶SmaI消化的载体pCE1中。pCE1是pUC18衍生物,其中氨苄西林抗性基因内的BsaI位点已通过沉默突变去除。将连接混合物转化到大肠杆菌DH10B细胞(Life technologies)中。将转化子涂布在含有100μg/ml氨苄西林的LB-琼脂平板上,在37C下培养过夜。从单个克隆中分离质粒DNA,并通过限制性消化分析其正确性。将得到的质粒命名为pEC194S。
从质粒pBSd141R(登录号:KY995200)(Radeck,J.,Mascher,T.2017;Sci.Rep.7:14134)PCR扩增II型组装mRFP盒,用寡核苷酸SEQ ID 03和SEQ ID 04,包含限制性位点BamHI的额外核苷酸。将PCR片段和pEC194S用限制性酶BamHI限制,然后连接并转化到大肠杆菌DH10B细胞(Life technologies)中。将转化子涂布在含有100μg/ml氨苄西林的LB-琼脂平板上,在37C下培养过夜。从单个克隆中分离质粒DNA,并通过限制性消化分析其正确性。得到的质粒pEC194RS携带mRFP盒,其开放阅读框与红霉素抗性基因的阅读框相反。
pDel003–aprE基因缺失质粒
地衣芽孢杆菌aprE基因的基因缺失质粒是用质粒pEC194RS和基因合成构建体SEQID 05构建的,基因合成构建体SEQ ID 05包含aprE基因的基因组区域5’和3’,侧翼是与pEC194RS相容的BsaI位点。如(Radeck et al.,2017)所述用限制性内切核酸酶BsaI进行II型组装,随后将反应混合物转化到大肠杆菌DH10B细胞(Life technologies)中。将转化子涂布在含有100μg/ml氨苄西林的LB-琼脂平板上,在37C下培养过夜。从单个克隆中分离质粒DNA,并通过限制性消化分析其正确性。将得到的aprE缺失质粒命名为pDel003。
pDel004–amyB基因缺失质粒
如对pDel003所述构建地衣芽孢杆菌amyB基因的基因缺失质粒,但是使用基因合成构建体SEQ ID 08,其包含amyB基因的基因组区域5’和3’,侧翼是与pEC194RS相容的BsaI位点。将得到的amyB缺失质粒命名为pDel004。
pDel005-sigF基因缺失质粒
如对pDel003所述构建地衣芽孢杆菌sigF基因(spoIIAC基因)的基因缺失质粒,但是使用基因合成构建体SEQ ID 11,其包含sigF基因的基因组区域5’和3’,侧翼是与pEC194RS相容的BsaI位点。将得到的sigF缺失质粒命名为pDel005。
pDel007–多聚γ-谷氨酸合成基因缺失质粒
如对pDel003所述构建用于缺失参与聚γ-谷氨酸(pga)产生的基因,即地衣芽孢杆菌的ywsC(pgsB)、ywtA(pgsC)、ywtB(pgsA)、ywtC(pgsE)的缺失质粒,但是使用基因合成构建体SEQ ID 14,其包含ywsC、ywtA(pgsC)、ywtB(pgsA)、ywtC(pgsE)基因侧翼的基因组区域5’和3’,侧翼是与pEC194RS相容的BsaI位点。将得到的pga缺失质粒命名为pDel007。
pDel034-remA功能缺失质粒
为了使RemA失活,地衣芽孢杆菌的野生型等位基因在其天然基因座上被remA基因的突变拷贝交换,导致表达具有组合功能缺失突变R18W和P29S的RemA(Winkelman,J.TKearns,D.B.(2009):Journal of bacteriology 191(12),S.3981–3991)。将具有5’和3’侧翼区域的侧翼是与pEC194RS相容的BsaI位点的remAR18W,P29S基因订购为基因合成构建体SEQ ID 17。如对pDel003所述构建基因编辑质粒。将得到的remA编辑质粒命名为pDel034。
实施例
实施例1:RemA和RemB内保守氨基酸位置的鉴定
感兴趣的蛋白序列中氨基酸的保守位置可以如下确定:
在第一步中,用感兴趣的序列和来自数据库的序列创建多序列比对,优选使用作用于UniRef30数据库(优选版本2020_06)的程序HHblits(优选版本3.3.0),使用默认参数。
HHblits是HH-套件(Steinegger M,Meier M,Mirdita M,H,Haunsberger S J,and/>J(2019)HH-suite3 for fast remote homology detectionand deep protein annotation,BMC Bioinformatics,473)的一部分,可以例如下载自https://github.com/soedinglab/hh-suite/。
数据库UniRef30(Mirdita M,von den Driesch L,Galiez C,Martin MJ,J,Steinegger M.Uniclust databases of clustered and deeply annotated proteinsequences and alignments.Nucleic Acids Res.2017Jan 4;45(D1):D170-D176.)可以例如下载自https://uniclust.mmseqs.com/。
为了便于对比对中的每个位置进行后续统计计算,还可以将得到的比对转化为FASTA格式。例如,可以用工具“reformat.pl”将A3M比对格式转化为FASTA格式,该工具也包括在HH-套件内,使用-r参数。
在第二步中,对于每个比对位置,信息含量(IC)值应当计算为值R_Sequence(l),如Schneider,T.D.;Stephens,R.M.Sequence Logos:A New Way to Display ConsensusSequences.Nucleic Acids Res.1990,18(20),6097–6100所述,使用氨基酸序列的20种状态。
保守位置被定义为具有2.0或更高的信息含量。
表1列出了参考RemA的查询序列(SEQ ID 21)在氨基酸位置的多序列比对(MAS)的IC值。
/>
/>
Pos.=位置
AA=氨基酸
IC=信息含量
C.=IC>2.0的保守氨基酸;用*(星号)标记
MAS.=多序列比对
表2列出了参考RemB查询序列(SEQ ID 23)在氨基酸位置的多序列比对(MAS)的IC值。
/>
/>
实施例2:地衣芽孢杆菌酶表达菌株的产生
如上所述将表3中所列的地衣芽孢杆菌菌株制备感受态。从枯草芽孢杆菌Bs#056菌株(WO2019016051)分离蛋白酶表达质粒pUK56(WO2019016051),以携带地衣芽孢杆菌特异性DNA甲基化模式。在所示菌株中转化质粒,并涂布在具有20μg/μl卡那霉素的LB-琼脂平板上。通过限制性消化分析单个克隆的质粒DNA正确性,并且通过将单个克隆转移到具有1%脱脂奶的LB-平板上以清除蛋白酶生成菌株的区域形成来评估功能酶的表达。得到的地衣芽孢杆菌表达菌株列于表1中。
表3:地衣芽孢杆菌表达菌株概述
地衣芽孢杆菌表达菌株 | 表达质粒 | 地衣芽孢杆菌菌株 |
BES#130 | pUK56 | Bli#008 |
BES#131 | pUK56 | Bli#030 |
实施例3:地衣芽孢杆菌蛋白酶表达菌株的培养
使用化学成分确定的发酵培养基在发酵过程中培养来自实施例2的地衣芽孢杆菌菌株。
在发酵过程中提供以下常量元素:
在发酵过程中提供以下微量元素:
用含有8g/l葡萄糖的培养基开始发酵。使用含有50%葡萄糖的溶液作为进料溶液。在发酵期间使用氨调整pH。在两个实验中,添加的化学成分确定的碳源总量保持在每升初始培养基200g以上。在有氧条件下进行发酵,持续时间超过70小时。
在发酵过程结束时,取出样品并通过光度法测定蛋白酶活性:通过使用琥珀酰-Ala-Ala-Pro-Phe-对硝基酰苯胺(Suc-AAPF-pNA,短AAPF;参见例如DelMar et al.(1979),Analytical Biochem 99,316-320)作为底物来测定蛋白水解活性。通过在30℃,pH8.6TRIS缓冲液中进行蛋白水解切割,将pNA从底物分子上切割下来,导致释放黄色的游离pNA,通过在OD405处测量进行定量。
通过将产物滴度除以每最终反应器体积添加的葡萄糖量来计算蛋白酶产量。将菌株BES#130的蛋白酶产量设定为100%,菌株BFS#131的蛋白酶产量相应地参考BES#130(表4)。与地衣芽孢杆菌表达菌株BES#130相比,具有突变的remA基因(导致包含突变R18W和P29S的改变的RemA蛋白)的地衣芽孢杆菌表达菌株BES#131的蛋白酶产量提高了10%。
表4地衣芽孢杆菌表达菌株的蛋白酶产量
地衣芽孢杆菌表达菌株 | 蛋白酶产量[%] |
BES#130 | 100 |
BES#131 | 110 |
表5:不同生物体的RemA和RemB的基因名称、蛋白名称和序列
/>
/>
序列表
<110> 巴斯夫欧洲公司
<120> 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞
<130> 210448WO01
<160> 39
<170> According Wipo Std 25
<210> 1
<211> 32
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of pE194
<400> 1
tatatacagc tggattcaca aaaaataggc ac 32
<210> 2
<211> 33
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of pE194
<400> 2
tatatacagc tggattatgt cttttgcgca gtc 33
<210> 3
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of functional mRFP
cassette
<400> 3
tatatggatc cgtaatcagg gtatcgaggc 30
<210> 4
<211> 31
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of functional mRFP
cassette
<400> 4
tatatggatc cctcattagg cgggctacta a 31
<210> 5
<211> 1027
<212> DNA
<213> Artificial sequence
<220>
<223> Homology region of the fusion of 5-prime and 3-prime
regions of aprE gene with flanking BsaI sites
<400> 5
ggtctcgacc cgaagttctt ttttaacata taggtaaaac aatacgaaaa aaggcgccaa 60
gtattgaaga attgcagcag ccgcggcatt tcccttttcg attgaagcaa aaaacgtata 120
ttgaacagta agcattccaa aaatggaaaa tactaaaatc gaacaaatat ctgttttttt 180
cttccatatc tgacacacat gttgaaaacc gtttttcatt gaaacatata acaagagaat 240
gactcccgat gccagaagcc tgacagagac aagcgagccg gcttcaaccg ctcccctttc 300
aaatatgtac tgtgcagcgc ttcccgataa tccccacaat gaagcccctg caagcaccat 360
caatacgcct ttcacatgag ctgatttcat atctttcacc cgtttctgta tgcgatatat 420
tgcatatttt aatagatgat cgacaaggcc gcaacctcct tcggcaaaaa atgatctcat 480
aaaataaatg aatagtattt tcataaaatg agctcaataa catattctaa caaatagcat 540
atagaaaaag ctagtgtttt tagcactagc tttttcttca ttctgatgaa ggttgttcaa 600
tattttgaat ccgttccatg atcgtcggat ggccgtattt aaaaatcttg acgagaaacg 660
gcgggtttgc ctcgctcagc ccggcttttg agagctcttg aaacgtcgaa accgctgcat 720
cgctgttttg cgtcagttca atcgcatact ggtcagcagc tttttcctga tgcctcgaaa 780
ctgcgttcgt aaatggagac gacgcgaaag agatgacccc catcagcatc agaagaagcg 840
gaagtgcggc tagatcggat tttcctgcaa tatgaaggct tcttccatag cggccgatga 900
tccgcttgta cagcttgtcg atcacataaa agacagcaag ggataaaagc agatacccgc 960
caagtcctat gtaaacatgc ttcatcacat agtgccccat ttcgtgcgcc atgatgctca 1020
ggagacc 1027
<210> 6
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of aprE genomic region
<400> 6
ccggttgtca ttgatccttt a 21
<210> 7
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of aprE genomic region
<400> 7
atcctcctgc aaaaaccgta t 21
<210> 8
<211> 1022
<212> DNA
<213> Artificial sequence
<220>
<223> Homology region of the fusion of 5-prime and 3-prime
regions of amyB gene with flanking BsaI sites
<400> 8
ggtctcgacc cacaaggctg tcaaacgaaa aagcgtatca ggagattaac gacacgcaag 60
aaatgatcga aaaaatcagc ggacacctgc ctgtacactt gcgtcctcca tacggcggga 120
tcaatgattc cgtccgctcg ctttccaatc tgaaggtttc attgtgggat gttgatccgg 180
aagattggaa gtacaaaaat aagcaaaaga ttgtcaatca tgtcatgagc catgcgggag 240
acggaaaaat cgtcttaatg cacgatattt atgcaacgtc cgcagatgct gctgaagaga 300
ttattaaaaa gctgaaagca aaaggctatc aattggtaac tgtatctcag cttgaagaag 360
tgaagaagca gagaggctat tgaataaatg agtagaaagc gccatatcgg cgcttttctt 420
ttggaagaaa atatagggaa aatggtattt gttaaaaatt cggaatattt atacaatatc 480
atatgtttca cattgaaagg ggaggagaat ctagaagagc agagaggacg gatttcctga 540
aggaaatccg tttttttatt ttgcccgtct tataaatttc tttgattaca ttttataatt 600
aattttaaca aagtgtcatc agccctcagg aaggacttgc tgacagtttg aatcgcatag 660
gtaaggcggg gatgaaatgg caacgttatc tgatgtagca aagaaagcaa atgtgtcgaa 720
aatgacggta tcgcgggtga tcaatcatcc tgagactgtg acggatgaat tgaaaaagct 780
tgttcattcc gcaatgaagg agctcaatta tataccgaac tatgcagcaa gagcgctcgt 840
tcaaaacaga acacaggtcg tcaagctgct catactggaa gaaatggata caacagaacc 900
ttattatatg aatctgttaa cgggaatcag ccgcgagctg gaccgtcatc attatgcttt 960
gcagcttgtc acaaggaaat ctctcaatat cggccagtgc gacggcatta tctcaggaga 1020
cc 1022
<210> 9
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of amyB genomic region
<400> 9
agaagcatga agggcatgcg ac 22
<210> 10
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of amyB genomic region
<400> 10
caacaacagg ctgtctgacg g 21
<210> 11
<211> 1022
<212> DNA
<213> Artificial sequence
<220>
<223> Homology region of the fusion of 5-prime and 3-prime
regions of sigF gene with flanking BsaI sites
<400> 11
ggtctcgacc caaaatcatt cgccttgagc aatcagagca gcgtgcactt gaaacgttgg 60
gggtggcgtc atgaaaaatg aaatgaacat tcagtttaca gcgctcagcc aaaatgaatc 120
gtttgcacgg gtgacagtcg ctgcttttat cgctcagctt gacccgacga tggatgaact 180
gaccgaaatt aaaacggtcg tatccgaagc ggtcacaaac gcgatcattc acggttatga 240
aaactcaggg cagggaaacg tatatatttc cgtcactctc gaggaccata ttgtctattt 300
aacgatccgc gacgaaggag tcggcatccc tgatcttgaa gaagcgcgcc agcccctgtt 360
cacgacaaag cctgaactcg agcggtcggg aatgggcttt acgatcatgg aaaatttcat 420
ggatgatatt tcgatcgact cctcacctga gatgggaacc acaatacact taacaaagca 480
cttatcaaaa agcaaagcgc tttgcaatta atgaggctgc tcatgttgca ggcagcctcg 540
gatgtccgat gaaaaaccgg acgctcttgg gagcgttccg gttttttttg tgtggtaatt 600
tatggtcttt tgcgcctttc tgaatgataa atgggatgta cttcatacta caactataac 660
catcatatag gaagtgaccc agatggaacg tcaagttttt atcagactcc gccaccggct 720
tgaggcagat ccggatgaat tgattttgct cggccatatc gcacaggtag cgggtgaccg 780
cggatacaaa gaaaagcttg aacggctgcc tatttatcag gtcagcaaag cggatcaaag 840
catggtggtg ctggacgtga tgaaggtgat tgaagctgta cataaatcgt ttcctgacct 900
tgatgtccaa accgtcggcg gttctgaaac catcgtggag atccaatatc cgaaaagggg 960
tctgtcgccc gtgcttttca tcgccgtctg gctgctcttg ttcgtcggtg cctcaggaga 1020
cc 1022
<210> 12
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of sigF genomic region
<400> 12
agcagctcgg cggagaaat 19
<210> 13
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of sigF genomic region
<400> 13
accttgcccg tcaccatttc g 21
<210> 14
<211> 1363
<212> DNA
<213> Artificial sequence
<220>
<223> Homology region of the fusion of 5-prime and 3-prime
regions of pga genes with flanking BsaI sites
<400> 14
ggtctcgacc cgaacactga aattttagac cgggctggga tatcgagaca tatatagggg 60
cgtttaatgg cgaatacagt aacaatgaga atagtaagaa aaattaaaaa tgttaaagtt 120
tgatgaatta tcattgaaaa aaattaatgg ctttttaaat cctaggattt taacctaaaa 180
tctgaagaaa taaggtggat cgaacgactc acaaaatatt tggatttgtc aatgaatccc 240
gctttatgct aaaagagatt ttcatttttt gatagatggt ctgattgtca taggacggat 300
ttgttttgaa gagggaacat tggtgacttt ttaacctgtt cgaaaagagc gaaaatacta 360
aaagaaaaga gacatcccgg ctgacagccc atttaaaggg gattgcggcc gggggaaaaa 420
agagatcctg aatccatcct tcaacctttc atctgaaata gggagaaaag tacaaaaatc 480
ataatgtcga attttgaaag cgcatactta aaacgctgac aaaaatctga taggaattaa 540
gaactttcga tttccaaaaa tatcaataaa aagataggca ttaatgactc gggcgaggtg 600
atctttgtca cggaaaattt cgtcgtcttc tgttacataa tgccgattgt gatttcatag 660
tgaaccctga tcccggttat aaaagacctg tgaaaagcgg ccggtttgaa agggaaacac 720
gacaattttc ttaaccggtc agtgtataaa gttttataga aaatcaggag gatatataca 780
tggttttggg gttcatgttt attgtattct tttgaaggga ataaaaactg acaaatttcg 840
actgaagcaa aatttgaaaa tgcatcacct taccaattcg ggatgggaac cgcacctcat 900
gttcatgacc tctttagaat atttcccttc atctttttaa tccgcgctta ggtgaaaaag 960
ctgatcatgc tgtgctgagc gtttcttctc gctatgacgc tgctgtacat gcaaaaaaag 1020
tcctttaaat atcccagttg aatgacgatg aaagaggaaa gaagaggagg aacagatcaa 1080
ttgataaaaa aagcggcaaa caaaaagttg gttttgtttt gtggaattgc ggtgctttgg 1140
atgtctttat ttttaacgaa tcataatgat gtacgcgccg atacgatcgg cgagaaaata 1200
gcggaaactg ccagacagct tgagggtgcg aaatacagct acggcggaga gaagccgaaa 1260
acggggtttg actcgtcagg ctttgtgcaa tatgtgtttc aatcgctcga tattacgctt 1320
ccgagaacgg taaaggaaca atcgactctt ggctcaggag acc 1363
<210> 15
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of pga genomic region
<400> 15
aaagccttct cctctctatt 20
<210> 16
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of pga genomic region
<400> 16
ttcttgaaaa agacaaggtc 20
<210> 17
<211> 794
<212> DNA
<213> Artificial sequence
<220>
<223> Homology regions of gene synthesis HomA + HomB remA R18W,
P29S
<400> 17
ggtggtctct acccaagtcg cactgtttgc agaccgttcg gatatcacgg aagaagtgac 60
gaggctgaaa agccatttcc gccagttccg cgatatttgc aaagcgggag gagccgcggg 120
gagaaagctc gatttcctcg tccaggagct caaccgtgaa gcgaacacga tcggttcaaa 180
agcgaatgat caccagatca caaaacatgt ggtcgaaatg aaaagctcta ttgaaaaaat 240
aaaagaacaa gtgcaaaata tagaatagcg attgtgcgta ttgtttacgg atgttctctg 300
caggttaaac tagagacgtc caagtacagg gggaacgtat aggatgacga ttaaactgat 360
caatatcggc tttggaaata tcatatccgc gaattggctg atctcgattg tgagtcctga 420
gtccgcatcg attaagcgga tgatccagga tgcccgcgac agaggcatgc ttatagatgc 480
tacatatgga agaagaaccc gtgcggttgt cattatggac agtgaccata tcatcttatc 540
tgccgtccag cctgagacag tagcacaaag gctttccgtt aaagaagaaa ttatggatga 600
agggcaggga taagagcttt atgaaagaaa gaggtttgtt aatcgttctc tccggccctt 660
ccggcgtcgg aaaaggaaca gtcaggcagg cgctgtttgc tcaggaggac acaaaatttg 720
aatattcgat ttcggtgacg acaagaaaac cgcgtcaagg cgaaagagac ggcgtcgact 780
ctcaagagac cacc 794
<210> 18
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of remA genomic region
<400> 18
tccaggttga ctggccgctg cttg 24
<210> 19
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Oligonucleotide: PCR-amplification of remA genomic region
<400> 19
tttcaattcg gcgaggctcg gagg 24
<210> 20
<211> 270
<212> DNA
<213> Bacillus licheniformis
<220>
<223> CDS of ylzA (remA), strain ATCC 14580
<400> 20
atgacgatta aactgatcaa tatcggcttt ggaaatatca tatccgcgaa tcggctgatc 60
tcgattgtga gtcctgagtc cgcgcctatt aagcggatga tccaggatgc cagagaccgc 120
ggcatgctta tagatgctac atatggaaga agaacccgtg cggttgtcat tatggacagt 180
gaccatatca tcttatctgc cgtccagcct gagacagtag cacaaaggct ttccgttaaa 240
gaagaaatta tggatgaagg gcagggataa 270
<210> 21
<211> 89
<212> PRT
<213> Bacillus licheniformis
<220>
<223> Protein of RemA, strain ATCC 14580
<400> 21
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Leu Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Ile Met Asp Ser Asp His Ile Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala Gln Arg Leu Ser Val Lys
65 70 75 80
Glu Glu Ile Met Asp Glu Gly Gln Gly
85
<210> 22
<211> 243
<212> DNA
<213> Bacillus licheniformis
<220>
<223> CDS of yaaB (remB), strain ATCC 14580
<400> 22
ttgtatatcc acttaggtga cgattttgtc gtctcaacgc gtgaaattgt ggctattttt 60
gattacaagg caaagacatc gccgattgtt gaggagtttt taagcaagca aaaacagcgg 120
attgtctctt ctaacagcac gccgaagtca attgttgtca cattacaatc gatttatttt 180
tctcctttag cctcaggcac gttgaaaaaa cgggcgcaat ccaagccgga aatcgattca 240
taa 243
<210> 23
<211> 80
<212> PRT
<213> Bacillus licheniformis
<220>
<223> Protein of RemB, strain ATCC 14580
<400> 23
Met Tyr Ile His Leu Gly Asp Asp Phe Val Val Ser Thr Arg Glu Ile
1 5 10 15
Val Ala Ile Phe Asp Tyr Lys Ala Lys Thr Ser Pro Ile Val Glu Glu
20 25 30
Phe Leu Ser Lys Gln Lys Gln Arg Ile Val Ser Ser Asn Ser Thr Pro
35 40 45
Lys Ser Ile Val Val Thr Leu Gln Ser Ile Tyr Phe Ser Pro Leu Ala
50 55 60
Ser Gly Thr Leu Lys Lys Arg Ala Gln Ser Lys Pro Glu Ile Asp Ser
65 70 75 80
<210> 24
<211> 270
<212> DNA
<213> Bacillus subtilis
<220>
<223> CDS of ylzA (remA)
<400> 24
atgacgatta aactgattaa tatcggattt ggcaatatca tctccgccaa tcggatgatt 60
tcgattgtca gcccggagtc tgcgccaatc aaacggatga ttcaggatgc aagagaccgc 120
ggaatgctaa ttgacgctac atacggacga agaacccgtg cagttgtcgt catggatagt 180
gatcacatta tcttatctgc cgtccagcct gagacagttg cacacagact ttctgttaaa 240
gaagaaatta tggatgaagg gcaggggtaa 270
<210> 25
<211> 89
<212> PRT
<213> Bacillus subtilis
<220>
<223> Protein of RemA
<400> 25
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Met Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Val Met Asp Ser Asp His Ile Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala His Arg Leu Ser Val Lys
65 70 75 80
Glu Glu Ile Met Asp Glu Gly Gln Gly
85
<210> 26
<211> 246
<212> DNA
<213> Bacillus subtilis
<220>
<223> CDS of yaaB (remB)
<400> 26
ttgtatattc atttaggtga tgactttgtg gtttcaacac gagatattgt cggcattttt 60
gactttaaag ccaacatgtc gcctattgtt gaagaatttc tgaaaaaaca gaaacacaag 120
gtggtgcctt ccgtaaacgg cacgcccaaa tctatcgtag tcacggttca gaatatatat 180
tactctccct tatcttccag cacattaaaa aaacgtgcgc aatttatgtt tgaaatagat 240
tcttag 246
<210> 27
<211> 81
<212> PRT
<213> Bacillus subtilis
<220>
<223> Protein of RemB
<400> 27
Met Tyr Ile His Leu Gly Asp Asp Phe Val Val Ser Thr Arg Asp Ile
1 5 10 15
Val Gly Ile Phe Asp Phe Lys Ala Asn Met Ser Pro Ile Val Glu Glu
20 25 30
Phe Leu Lys Lys Gln Lys His Lys Val Val Pro Ser Val Asn Gly Thr
35 40 45
Pro Lys Ser Ile Val Val Thr Val Gln Asn Ile Tyr Tyr Ser Pro Leu
50 55 60
Ser Ser Ser Thr Leu Lys Lys Arg Ala Gln Phe Met Phe Glu Ile Asp
65 70 75 80
Ser
<210> 28
<211> 270
<212> DNA
<213> Bacillus pumilus
<220>
<223> CDS of ylzA (remA)
<400> 28
atgaccataa agttgatcaa tatcggattt ggaaacatca tttcagcgaa tcggatgatt 60
tcgatcgtca gtccggaatc agcaccgatt aaacgaatga tacaagacgc aagagatcga 120
ggcatgctca tagatgctac ttacggaaga agaacccgtg ctgttgtcat tatggacagt 180
gaccatgtca tcttatctgc cgttcagcct gagactgtcg cgcaaagact ttctgtaaaa 240
gaagaaatca tagatgaagg gcaggggtaa 270
<210> 29
<211> 89
<212> PRT
<213> Bacillus pumilus
<220>
<223> Protein of RemA
<400> 29
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Met Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Ile Met Asp Ser Asp His Val Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala Gln Arg Leu Ser Val Lys
65 70 75 80
Glu Glu Ile Ile Asp Glu Gly Gln Gly
85
<210> 30
<211> 255
<212> DNA
<213> Bacillus pumilus
<220>
<223> CDS of yaaB (remB)
<400> 30
gtgtgggtct tgtatattca tttaggtgat gattgtgttg tttctacacg agagattgtc 60
gcaattgttg attacaaaat gaggtcgtct tctgttgtag aagagtttct tcaaaaacaa 120
gaaggacaaa tcatttcgtt atcacaaggg acacccaaat ccatcgtcgt cacaactaaa 180
tctgtttatt actctcctct ttcctcaagc acgctcaaaa aacgtgcttc atttgtgatt 240
gaaattgaag tctaa 255
<210> 31
<211> 84
<212> PRT
<213> Bacillus pumilus
<220>
<223> Protein of RemB
<400> 31
Met Trp Val Leu Tyr Ile His Leu Gly Asp Asp Cys Val Val Ser Thr
1 5 10 15
Arg Glu Ile Val Ala Ile Val Asp Tyr Lys Met Arg Ser Ser Ser Val
20 25 30
Val Glu Glu Phe Leu Gln Lys Gln Glu Gly Gln Ile Ile Ser Leu Ser
35 40 45
Gln Gly Thr Pro Lys Ser Ile Val Val Thr Thr Lys Ser Val Tyr Tyr
50 55 60
Ser Pro Leu Ser Ser Ser Thr Leu Lys Lys Arg Ala Ser Phe Val Ile
65 70 75 80
Glu Ile Glu Val
<210> 32
<211> 270
<212> DNA
<213> Bacillus velezensis
<220>
<223> CDS of ylzA (remA)
<400> 32
atgacgatta aactgattaa tatcggattt ggcaatatca tctccgccaa tcggatgatt 60
tcgattgtca gcccggagtc tgcgccaata aagcgaatga tccaggatgc aagagaccgc 120
ggaatgctaa tagacgctac atacggacga agaacccgtg cagttgtcgt catggatagt 180
gatcacatta tcttatctgc cgtccagcct gagacagttg cacacagact ttctgtgaaa 240
gaagaaatta tggatgaagg gcaggggtaa 270
<210> 33
<211> 89
<212> PRT
<213> Bacillus velezensis
<220>
<223> Protein of RemA
<400> 33
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Met Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Val Met Asp Ser Asp His Ile Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala His Arg Leu Ser Val Lys
65 70 75 80
Glu Glu Ile Met Asp Glu Gly Gln Gly
85
<210> 34
<211> 246
<212> DNA
<213> Bacillus velezensis
<220>
<223> CDS of yaaB (remB)
<400> 34
ttgtatattc atttaggtga cgactttgtc gtttcaacac gcgatatcgt cggcattttt 60
gactgcaagg tcaatgtatc gccgattgtt gaagaatttc tggacagaca gaaagaaaaa 120
gtagtgccgt ccgtaaacgg cacgccaaag tctatcgtag tcacgactga gaatatatat 180
tactctccct tatcttccgg cacactgaag aaacgtgcgc aatttatgtt agaaatagat 240
tcttag 246
<210> 35
<211> 81
<212> PRT
<213> Bacillus velezensis
<220>
<223> Protein of RemB
<400> 35
Met Tyr Ile His Leu Gly Asp Asp Phe Val Val Ser Thr Arg Asp Ile
1 5 10 15
Val Gly Ile Phe Asp Cys Lys Val Asn Val Ser Pro Ile Val Glu Glu
20 25 30
Phe Leu Asp Arg Gln Lys Glu Lys Val Val Pro Ser Val Asn Gly Thr
35 40 45
Pro Lys Ser Ile Val Val Thr Thr Glu Asn Ile Tyr Tyr Ser Pro Leu
50 55 60
Ser Ser Gly Thr Leu Lys Lys Arg Ala Gln Phe Met Leu Glu Ile Asp
65 70 75 80
Ser
<210> 36
<211> 270
<212> DNA
<213> Bacillus amyloliquefaciens
<220>
<223> CDS of ylzA (remA)
<400> 36
atgacgatta aactgattaa tatcggattt ggcaatatca tctccgccaa tcggatgatt 60
tcgattgtca gcccggagtc tgcgccaata aagcgaatga ttcaggatgc aagagaccgc 120
ggaatgctaa tagacgctac atacggacga agaacccgtg cagttgtcgt catggatagt 180
gatcacatta tcttatctgc cgtccagcct gagacagttg cacacagact ttctgtgaaa 240
ggagaaatta tggatgaagg gcaggggtaa 270
<210> 37
<211> 89
<212> PRT
<213> Bacillus amyloliquefaciens
<220>
<223> Protein of RemA
<400> 37
Met Thr Ile Lys Leu Ile Asn Ile Gly Phe Gly Asn Ile Ile Ser Ala
1 5 10 15
Asn Arg Met Ile Ser Ile Val Ser Pro Glu Ser Ala Pro Ile Lys Arg
20 25 30
Met Ile Gln Asp Ala Arg Asp Arg Gly Met Leu Ile Asp Ala Thr Tyr
35 40 45
Gly Arg Arg Thr Arg Ala Val Val Val Met Asp Ser Asp His Ile Ile
50 55 60
Leu Ser Ala Val Gln Pro Glu Thr Val Ala His Arg Leu Ser Val Lys
65 70 75 80
Gly Glu Ile Met Asp Glu Gly Gln Gly
85
<210> 38
<211> 246
<212> DNA
<213> Bacillus amyloliquefaciens
<220>
<223> CDS of yaaB (remB)
<400> 38
ttgtatattc atttaggtga cgactttgtc gtttcaacac gcgatatcgt cggcattttt 60
gactgcaagg tcaatgtatc gccgatcgtt gaagaatttc tggacagaca gaaagaaaaa 120
gtagtgccgt ccgtaaatgg cacaccaaag tctatcgtag tcacgactga gaatatatat 180
tactctccct tatcttccgg cacactgaag aaacgtgcgc aatttatgtt agaaatagat 240
tcttag 246
<210> 39
<211> 81
<212> PRT
<213> Bacillus amyloliquefaciens
<220>
<223> Protein of RemB
<400> 39
Met Tyr Ile His Leu Gly Asp Asp Phe Val Val Ser Thr Arg Asp Ile
1 5 10 15
Val Gly Ile Phe Asp Cys Lys Val Asn Val Ser Pro Ile Val Glu Glu
20 25 30
Phe Leu Asp Arg Gln Lys Glu Lys Val Val Pro Ser Val Asn Gly Thr
35 40 45
Pro Lys Ser Ile Val Val Thr Thr Glu Asn Ile Tyr Tyr Ser Pro Leu
50 55 60
Ser Ser Gly Thr Leu Lys Lys Arg Ala Gln Phe Met Leu Glu Ile Asp
65 70 75 80
Ser
Claims (18)
1.一种修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,其中所述芽孢杆菌宿主细胞不是枯草芽孢杆菌(Bacillus subtilis)细胞。
2.权利要求1的修饰的芽孢杆菌宿主细胞,其中所述RemA蛋白的改变是由编码RemA蛋白的基因中的一个或多个点突变,优选一个或多个错义突变引起的,并且其中所述RemB蛋白的改变是由编码RemB蛋白的基因中的一个或多个点突变,优选一个或多个错义突变引起的。
3.权利要求2的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个错义点突变在编码RemA蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:21的氨基酸位置5-77的一个或多个氨基酸位置。
4.权利要求3的修饰的芽孢杆菌宿主细胞,其中编码RemA蛋白的基因中的一个或多个点突变导致SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21的保守氨基酸位置上的非保守氨基酸取代,优选地,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:21的R18和P29的氨基酸位置的一个或多个氨基酸位置。
5.权利要求2的修饰的芽孢杆菌宿主细胞,其中编码RemB蛋白的基因中的一个或多个错义点突变在编码RemB蛋白中保守氨基酸的位置,优选在对应于SEQ ID NO:23的氨基酸位置4-71的一个或多个氨基酸位置。
6.权利要求5的修饰的芽孢杆菌宿主细胞,其中编码RemB蛋白的基因中的一个或多个点突变导致SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的非保守氨基酸取代,优选地,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。
7.前述权利要求中任一项的修饰的芽孢杆菌宿主细胞,其中所述RemA和/或RemB蛋白的改变是RemA和/或RemB蛋白的失活。
8.前述权利要求中任一项的修饰的芽孢杆菌宿主细胞,其中所述宿主细胞属于物种嗜碱芽孢杆菌(Bacillus alcalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、蜡样芽孢杆菌(Bacillus cereus)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillus firmus)、球芽孢杆菌(Bacillus globigii)、耐盐芽孢杆菌(Bacillus halodurans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、副地衣芽孢杆菌(Bacillus paralicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、甲醇芽孢杆菌(Bacillus methanolicus)、甲基营养型芽孢杆菌(Bacillus methylotrophicus)、摩加夫芽孢杆菌(Bacillus mojavensis)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)(嗜热脂肪芽孢杆菌(Bacillusstearothermophilus))、苏云金芽孢杆菌(Bacillus thuringiensis)或贝莱斯芽孢杆菌(Bacillus velezensis),优选地衣芽孢杆菌。
9.前述权利要求中任一项的修饰的芽孢杆菌宿主细胞,其中所述改变的RemA蛋白与SEQ ID NO:21、25、29、33或37,优选SEQ ID NO:21具有至少60%、但低于100%序列相同性,并且其中所述改变的RemB蛋白与SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23具有至少60%、但低于100%序列相同性。
10.前述权利要求中任一项的修饰的芽孢杆菌宿主细胞,其中所述宿主细胞包含表达盒,用于生产感兴趣的化合物,优选感兴趣的多肽。
11.权利要求10的修饰的芽孢杆菌宿主细胞,其中感兴趣的多肽是酶,如选自淀粉酶、蛋白酶、脂肪酶、磷脂酶、甘露聚糖酶、植酸酶、木聚糖酶、乳糖酶、磷酸酶、葡糖淀粉酶、核酸酶、半乳糖苷酶、内切葡聚糖酶和纤维素酶的酶。
12.权利要求10或11的修饰的芽孢杆菌宿主细胞,其中与不包含改变的RemA蛋白和/或改变的RemB蛋白的芽孢杆菌对照细胞相比,所述修饰的芽孢杆菌宿主细胞包含增加的感兴趣的化合物产生。
13.一种生产感兴趣的化合物,优选感兴趣的多肽的方法,包括
a)提供修饰的芽孢杆菌宿主细胞,其包含改变的RemA蛋白和/或改变的RemB蛋白,
b)在允许表达所述感兴趣的化合物的条件下培养宿主细胞,以及
c)任选地从培养基分离所述感兴趣的化合物。
14.权利要求13的生产感兴趣的化合物的方法,其中所述芽孢杆菌宿主细胞选自短小芽孢杆菌、贝莱斯芽孢杆菌、解淀粉芽孢杆菌、嗜碱芽孢杆菌、地衣芽孢杆菌、副地衣芽孢杆菌、迟缓芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、甲醇芽孢杆菌、嗜热脂肪地芽孢杆菌(嗜热脂肪芽孢杆菌)、摩加夫芽孢杆菌、球芽孢杆菌和枯草芽孢杆菌,优选地衣芽孢杆菌。
15.一种改变的RemA蛋白,其中所述改变的RemA蛋白包含在SEQ ID NO:21的保守氨基酸位置上的一个或多个非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自SEQ ID NO:21的I8、G9、F10、G11、N12、R18、S27、P29、K31、R32、D45、T47、G49、R50、T52、D59、L65、S66、T72和R76的氨基酸位置的一个或多个氨基酸位置,最优选在SEQ ID NO:21的氨基酸位置R18和/或P29。
16.权利要求15的改变的RemA蛋白,其中所述改变的RemA蛋白与SEQ ID NO:21具有至少97%、至少98%、或至少99%、但少于100%序列相同性,但与SEQ ID NO:21具有少于100%序列相同性。
17.一种改变的RemB蛋白,其中所述改变的RemB蛋白包含在SEQ ID NO:23、27、31、35或39,优选SEQ ID NO:23的保守氨基酸位置上的一个或多个非保守氨基酸取代,IC值等于或大于3.0,优选等于或大于3.2,最优选等于或大于3.5,优选在对应于选自H4、G6、I19、K49、S50、Y59、S61、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,更优选在选自对应于SEQ ID NO:23的G6、I19、S62、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置,最优选在选自对应于SEQ ID NO:23的G6、T67、L68和R71的氨基酸位置的一个或多个氨基酸位置。
18.权利要求17的改变的RemB蛋白,其中所述改变的RemB蛋白与SEQ ID NO:23具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%序列相同性。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21181347.2 | 2021-06-24 | ||
EP21181347 | 2021-06-24 | ||
PCT/EP2022/067442 WO2022269084A1 (en) | 2021-06-24 | 2022-06-24 | Improved bacillus host cell with altered rema/remb protein |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117693587A true CN117693587A (zh) | 2024-03-12 |
Family
ID=76971611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280051979.8A Pending CN117693587A (zh) | 2021-06-24 | 2022-06-24 | 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4359546A1 (zh) |
CN (1) | CN117693587A (zh) |
BR (1) | BR112023027016A2 (zh) |
WO (1) | WO2022269084A1 (zh) |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2144990T3 (es) | 1989-08-25 | 2000-07-01 | Henkel Of America Inc | Enzima proteolitica alcalina y metodo de produccion. |
DK639689D0 (da) | 1989-12-18 | 1989-12-18 | Novo Nordisk As | Indfoering af dna i celler |
CA2123496C (en) | 1991-11-14 | 2004-02-03 | Steen T. Jorgensen | A bacillus promoter derived from a variant of a bacillus licheniforms x-amylase promoter |
FR2704860B1 (fr) | 1993-05-05 | 1995-07-13 | Pasteur Institut | Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire. |
CN1190434A (zh) | 1995-07-07 | 1998-08-12 | 诺沃挪第克公司 | 用不能形成芽孢的芽孢杆菌生产蛋白质的方法 |
US5958728A (en) | 1996-11-18 | 1999-09-28 | Novo Nordiskbiotech, Inc. | Methods for producing polypeptides in mutants of bacillus cells |
US5936547A (en) | 1997-07-15 | 1999-08-10 | Ameritech Corporation | System and method for providing user-selected information to a paging-capable device |
US5955310A (en) | 1998-02-26 | 1999-09-21 | Novo Nordisk Biotech, Inc. | Methods for producing a polypeptide in a bacillus cell |
US6509185B1 (en) | 2000-01-07 | 2003-01-21 | Genencor International, Inc. | Mutant aprE promotor |
EP1297170B1 (en) | 2000-06-23 | 2016-03-02 | Novozymes A/S | Method for stable chromosomal multi-copy integration of genes |
WO2002097064A1 (fr) | 2001-05-29 | 2002-12-05 | Kao Corporation | Micro-organismes hotes |
WO2003008125A1 (de) | 2001-07-19 | 2003-01-30 | Ralph Meichtry | Vorrichtung und verfahren zum entbeulen von blechteilen |
AU2003228393A1 (en) | 2002-03-29 | 2003-10-13 | Genencor International, Inc. | Ehanced protein expression in bacillus |
DE60321901D1 (de) | 2002-04-10 | 2008-08-14 | Novozymes As | Verbesserte bacillus-wirtszelle |
EP1735455A2 (en) | 2004-03-31 | 2006-12-27 | Novozymes Biopolymer A/S | Methods for producing hyaluronic acid in a bacillus cell |
DK1805296T3 (da) | 2004-10-22 | 2010-01-18 | Novozymes As | Stabil genomisk integrering af multipie polynukleotidkopier |
EP2210898A1 (en) | 2006-11-29 | 2010-07-28 | Novozymes Inc. | Bacillus Licheniformis chromosome |
WO2008140615A2 (en) | 2006-12-21 | 2008-11-20 | Novozymes, Inc. | Modified messenger rna stabilizing sequences for expressing genes in bacterial cells |
DE102007021001A1 (de) | 2007-05-04 | 2008-11-06 | Ab Enzymes Gmbh | Expressionssystem zur antibiotikafreien Produktion von Polypeptiden |
WO2008148575A2 (en) | 2007-06-07 | 2008-12-11 | Dsm Ip Assets B.V. | Increased production of a target product via stabilization of mrna |
EP2196534B1 (en) | 2007-09-20 | 2016-08-24 | Kao Corporation | A recombinant microorganism and method for producing poly-gamma-glutamic acid |
FR2934810A1 (fr) | 2008-08-11 | 2010-02-12 | Imaje Sa | Dispositif d'impression a jet d'encre a compensation de vitesse de jet |
WO2014150624A1 (en) | 2013-03-14 | 2014-09-25 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
EP3011032B1 (en) | 2013-06-17 | 2019-10-16 | The Broad Institute, Inc. | Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells |
WO2015055558A1 (en) | 2013-10-17 | 2015-04-23 | Dsm Ip Assets B.V. | Protein expression system |
DK3102669T3 (da) | 2014-02-07 | 2019-08-19 | Dsm Ip Assets Bv | Forbedret bacillevært |
WO2015181296A1 (de) | 2014-05-30 | 2015-12-03 | Mahle International Gmbh | VORRICHTUNG UND VERFAHREN ZUM FASERSPRITZGIEßEN VON SPRITZGUSSTEILEN |
CN107250365A (zh) | 2015-02-19 | 2017-10-13 | 丹尼斯科美国公司 | 增强的蛋白质表达 |
CN107922464B (zh) | 2015-08-28 | 2022-03-15 | 帝斯曼知识产权资产管理有限公司 | 经改进的维生素生产 |
KR20180069057A (ko) * | 2015-10-30 | 2018-06-22 | 다니스코 유에스 인크. | 향상된 단백질 발현 및 이의 방법 |
WO2018009520A1 (en) | 2016-07-06 | 2018-01-11 | Novozymes A/S | Improving a microorganism by crispr-inhibition |
US11066653B2 (en) | 2017-07-21 | 2021-07-20 | Basf Se | Method of transforming bacterial cells |
JP2022526414A (ja) | 2019-04-05 | 2022-05-24 | ダニスコ・ユーエス・インク | 二重環状組換えDNAコンストラクトを使用するバチルス(Bacillus)のゲノムへのポリヌクレオチド組込みのための方法及びその組成物 |
JP2022526982A (ja) | 2019-04-05 | 2022-05-27 | ダニスコ・ユーエス・インク | 線状組換えDNAコンストラクトを使用してバチルス(Bacillus)のゲノムにドナーDNA配列を組み込むための方法及びその組成物 |
-
2022
- 2022-06-24 WO PCT/EP2022/067442 patent/WO2022269084A1/en active Application Filing
- 2022-06-24 BR BR112023027016A patent/BR112023027016A2/pt unknown
- 2022-06-24 EP EP22737858.5A patent/EP4359546A1/en active Pending
- 2022-06-24 CN CN202280051979.8A patent/CN117693587A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
BR112023027016A2 (pt) | 2024-03-12 |
WO2022269084A1 (en) | 2022-12-29 |
EP4359546A1 (en) | 2024-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5170793B2 (ja) | バチルスにおけるタンパク質発現の増大 | |
US8293499B2 (en) | Bacillus strain for increased protein production | |
US20110117598A1 (en) | Enhanced Protein Production in Bacillus | |
EP2133416A1 (en) | Recombinant microorganism | |
EP2152732B1 (en) | A modified secretion system to increase expression of polypeptides in bacteria | |
CN117813316A (zh) | 用于生产纯度更高的感兴趣的化合物的地衣芽孢杆菌宿主细胞 | |
WO2023117970A1 (en) | Method for improved production of intracellular proteins in bacillus | |
US20230272358A1 (en) | Alanine racemase single deletion and transcomplementation | |
CN117693587A (zh) | 具有改变的RemA/RemB蛋白的改良芽孢杆菌宿主细胞 | |
US20220282234A1 (en) | Compositions and methods for increased protein production in bacillus lichenformis | |
EP1141310B1 (en) | Production of proteins in gram-positive microorganisms | |
CN116745422A (zh) | 丙氨酸消旋酶双缺失和反式互补 | |
EP4359424A1 (en) | Improved bacillus production host | |
JP5847458B2 (ja) | 改変rRNAオペロンを有する組換え微生物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |