CN1836036A - 改进的蛋白酶及其制备方法 - Google Patents
改进的蛋白酶及其制备方法 Download PDFInfo
- Publication number
- CN1836036A CN1836036A CNA2004800236184A CN200480023618A CN1836036A CN 1836036 A CN1836036 A CN 1836036A CN A2004800236184 A CNA2004800236184 A CN A2004800236184A CN 200480023618 A CN200480023618 A CN 200480023618A CN 1836036 A CN1836036 A CN 1836036A
- Authority
- CN
- China
- Prior art keywords
- seq
- polypeptide
- sequence
- proteolytic enzyme
- polynucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091005804 Peptidases Proteins 0.000 title claims abstract description 251
- 239000004365 Protease Substances 0.000 title claims abstract description 67
- 102000035195 Peptidases Human genes 0.000 title claims description 246
- 238000000034 method Methods 0.000 title claims description 96
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 226
- 229920001184 polypeptide Polymers 0.000 claims abstract description 203
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 203
- 230000000694 effects Effects 0.000 claims abstract description 83
- 230000035800 maturation Effects 0.000 claims abstract description 12
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims abstract 4
- 108090000623 proteins and genes Proteins 0.000 claims description 170
- 108090000790 Enzymes Proteins 0.000 claims description 92
- 102000004190 Enzymes Human genes 0.000 claims description 91
- 229940088598 enzyme Drugs 0.000 claims description 82
- 108091033319 polynucleotide Proteins 0.000 claims description 76
- 102000040430 polynucleotide Human genes 0.000 claims description 76
- 239000002157 polynucleotide Substances 0.000 claims description 76
- 239000000203 mixture Substances 0.000 claims description 75
- 102000004169 proteins and genes Human genes 0.000 claims description 70
- 235000018102 proteins Nutrition 0.000 claims description 67
- 239000012634 fragment Substances 0.000 claims description 66
- 241001465754 Metazoa Species 0.000 claims description 64
- 235000001014 amino acid Nutrition 0.000 claims description 64
- 150000001413 amino acids Chemical class 0.000 claims description 61
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 44
- 238000002360 preparation method Methods 0.000 claims description 36
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 31
- 239000000654 additive Substances 0.000 claims description 29
- 239000013604 expression vector Substances 0.000 claims description 21
- 230000000996 additive effect Effects 0.000 claims description 20
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 19
- 239000000047 product Substances 0.000 claims description 19
- 230000009261 transgenic effect Effects 0.000 claims description 17
- 239000003795 chemical substances by application Substances 0.000 claims description 16
- 102100037611 Lysophospholipase Human genes 0.000 claims description 15
- 239000006228 supernatant Substances 0.000 claims description 15
- 230000007062 hydrolysis Effects 0.000 claims description 14
- 238000006460 hydrolysis reaction Methods 0.000 claims description 14
- 235000019750 Crude protein Nutrition 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 11
- 229930003231 vitamin Natural products 0.000 claims description 11
- 235000013343 vitamin Nutrition 0.000 claims description 11
- 239000011782 vitamin Substances 0.000 claims description 11
- 229940088594 vitamin Drugs 0.000 claims description 11
- 108700028369 Alleles Proteins 0.000 claims description 10
- 108090000553 Phospholipase D Proteins 0.000 claims description 8
- 108010030291 alpha-Galactosidase Proteins 0.000 claims description 8
- 239000006053 animal diet Substances 0.000 claims description 8
- 108020002496 Lysophospholipase Proteins 0.000 claims description 7
- 230000008034 disappearance Effects 0.000 claims description 7
- 238000003259 recombinant expression Methods 0.000 claims description 7
- 230000003248 secreting effect Effects 0.000 claims description 7
- 238000003780 insertion Methods 0.000 claims description 6
- 230000037431 insertion Effects 0.000 claims description 6
- 230000000050 nutritive effect Effects 0.000 claims description 6
- 150000003722 vitamin derivatives Chemical class 0.000 claims description 6
- 101710152845 Arabinogalactan endo-beta-1,4-galactanase Proteins 0.000 claims description 5
- 101710147028 Endo-beta-1,4-galactanase Proteins 0.000 claims description 5
- 239000011573 trace mineral Substances 0.000 claims description 5
- 235000013619 trace mineral Nutrition 0.000 claims description 5
- 108010011619 6-Phytase Proteins 0.000 claims description 4
- 101710130006 Beta-glucanase Proteins 0.000 claims description 4
- 102100031415 Hepatic triacylglycerol lipase Human genes 0.000 claims description 4
- 108010013563 Lipoprotein Lipase Proteins 0.000 claims description 4
- 102000011420 Phospholipase D Human genes 0.000 claims description 4
- 102100032967 Phospholipase D1 Human genes 0.000 claims description 4
- 108010058864 Phospholipases A2 Proteins 0.000 claims description 4
- 102000014384 Type C Phospholipases Human genes 0.000 claims description 4
- 108010079194 Type C Phospholipases Proteins 0.000 claims description 4
- 102000005840 alpha-Galactosidase Human genes 0.000 claims description 4
- 108010091371 endoglucanase 1 Proteins 0.000 claims description 4
- 108010091384 endoglucanase 2 Proteins 0.000 claims description 4
- 108010092450 endoglucanase Z Proteins 0.000 claims description 4
- 229940085127 phytase Drugs 0.000 claims description 4
- 102100035200 Phospholipase A and acyltransferase 4 Human genes 0.000 claims description 3
- 108010082495 Dietary Plant Proteins Proteins 0.000 claims description 2
- 229910052717 sulfur Inorganic materials 0.000 claims description 2
- 229910052720 vanadium Inorganic materials 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 description 122
- 239000002773 nucleotide Substances 0.000 description 98
- 125000003729 nucleotide group Chemical group 0.000 description 96
- 108020004414 DNA Proteins 0.000 description 84
- 241000187654 Nocardia Species 0.000 description 66
- 235000019419 proteases Nutrition 0.000 description 61
- 229940024606 amino acid Drugs 0.000 description 58
- 238000003752 polymerase chain reaction Methods 0.000 description 49
- 241000196324 Embryophyta Species 0.000 description 47
- 150000007523 nucleic acids Chemical class 0.000 description 44
- 239000000523 sample Substances 0.000 description 41
- 235000005911 diet Nutrition 0.000 description 40
- 230000037213 diet Effects 0.000 description 40
- 230000014509 gene expression Effects 0.000 description 40
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 38
- 108091028043 Nucleic acid sequence Proteins 0.000 description 35
- 230000029087 digestion Effects 0.000 description 35
- 230000001580 bacterial effect Effects 0.000 description 33
- 241000894006 Bacteria Species 0.000 description 32
- 210000002784 stomach Anatomy 0.000 description 32
- 239000013612 plasmid Substances 0.000 description 31
- 102000039446 nucleic acids Human genes 0.000 description 28
- 108020004707 nucleic acids Proteins 0.000 description 28
- 244000063299 Bacillus subtilis Species 0.000 description 25
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 25
- 239000000243 solution Substances 0.000 description 25
- 235000014469 Bacillus subtilis Nutrition 0.000 description 24
- 230000004087 circulation Effects 0.000 description 23
- 238000006243 chemical reaction Methods 0.000 description 22
- -1 methane amide Chemical class 0.000 description 22
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 21
- 108010047495 alanylglycine Proteins 0.000 description 21
- 230000004927 fusion Effects 0.000 description 21
- 235000021118 plant-derived protein Nutrition 0.000 description 21
- 239000000758 substrate Substances 0.000 description 21
- 108010064851 Plant Proteins Proteins 0.000 description 20
- 230000010354 integration Effects 0.000 description 20
- 230000008859 change Effects 0.000 description 19
- 108010005233 alanylglutamic acid Proteins 0.000 description 18
- 238000013016 damping Methods 0.000 description 18
- 239000012530 fluid Substances 0.000 description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 18
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 17
- 238000009413 insulation Methods 0.000 description 17
- 108091026890 Coding region Proteins 0.000 description 16
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 16
- 241000880493 Leptailurus serval Species 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 15
- 108010059892 Cellulase Proteins 0.000 description 14
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 14
- 102000004882 Lipase Human genes 0.000 description 14
- 108090001060 Lipase Proteins 0.000 description 14
- 239000004367 Lipase Substances 0.000 description 14
- 229940106157 cellulase Drugs 0.000 description 14
- 235000019421 lipase Nutrition 0.000 description 14
- 229940072367 zymine Drugs 0.000 description 14
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 13
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 13
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 13
- 239000002253 acid Substances 0.000 description 13
- 230000002538 fungal effect Effects 0.000 description 13
- 230000000968 intestinal effect Effects 0.000 description 13
- 239000003550 marker Substances 0.000 description 13
- 108010020132 microbial serine proteinases Proteins 0.000 description 13
- 239000000126 substance Substances 0.000 description 13
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 12
- 238000012408 PCR amplification Methods 0.000 description 12
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 12
- 240000008042 Zea mays Species 0.000 description 12
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 12
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 12
- 235000005822 corn Nutrition 0.000 description 12
- 238000000855 fermentation Methods 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 11
- 239000004382 Amylase Substances 0.000 description 11
- 108010065511 Amylases Proteins 0.000 description 11
- 102000013142 Amylases Human genes 0.000 description 11
- 241000233866 Fungi Species 0.000 description 11
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 11
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 11
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 11
- 235000019418 amylase Nutrition 0.000 description 11
- 230000004151 fermentation Effects 0.000 description 11
- 108010070643 prolylglutamic acid Proteins 0.000 description 11
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 10
- 125000000539 amino acid group Chemical group 0.000 description 10
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 10
- 239000007788 liquid Substances 0.000 description 10
- 230000012976 mRNA stabilization Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000008521 reorganization Effects 0.000 description 10
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 9
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 9
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 9
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 9
- 230000008676 import Effects 0.000 description 9
- 235000013336 milk Nutrition 0.000 description 9
- 239000008267 milk Substances 0.000 description 9
- 210000004080 milk Anatomy 0.000 description 9
- 229940049547 paraxin Drugs 0.000 description 9
- ZWLUXSQADUDCSB-UHFFFAOYSA-N phthalaldehyde Chemical compound O=CC1=CC=CC=C1C=O ZWLUXSQADUDCSB-UHFFFAOYSA-N 0.000 description 9
- 229960000268 spectinomycin Drugs 0.000 description 9
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 9
- 235000013311 vegetables Nutrition 0.000 description 9
- 238000005406 washing Methods 0.000 description 9
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 8
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 8
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 8
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 8
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 8
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 8
- 108020005038 Terminator Codon Proteins 0.000 description 8
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 8
- ICPRIGUXAFULPH-ILWGZMRPSA-N Trp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O ICPRIGUXAFULPH-ILWGZMRPSA-N 0.000 description 8
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 238000002744 homologous recombination Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 8
- 229930182817 methionine Natural products 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 230000010076 replication Effects 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- MFTVXYMXSAQZNL-DJFWLOJKSA-N Asp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)O)N MFTVXYMXSAQZNL-DJFWLOJKSA-N 0.000 description 7
- 240000006439 Aspergillus oryzae Species 0.000 description 7
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 7
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 7
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 7
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 7
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 7
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 7
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 7
- 108010022999 Serine Proteases Proteins 0.000 description 7
- 102000012479 Serine Proteases Human genes 0.000 description 7
- 241000282898 Sus scrofa Species 0.000 description 7
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 7
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 7
- 108010084389 glycyltryptophan Proteins 0.000 description 7
- 238000004128 high performance liquid chromatography Methods 0.000 description 7
- 108010018006 histidylserine Proteins 0.000 description 7
- 230000006801 homologous recombination Effects 0.000 description 7
- 244000005700 microbiome Species 0.000 description 7
- 239000002853 nucleic acid probe Substances 0.000 description 7
- 235000016709 nutrition Nutrition 0.000 description 7
- 101150044611 pel gene Proteins 0.000 description 7
- 108010029020 prolylglycine Proteins 0.000 description 7
- 229920001817 Agar Polymers 0.000 description 6
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 6
- 241000228245 Aspergillus niger Species 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 238000001712 DNA sequencing Methods 0.000 description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 6
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 6
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 6
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 6
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 6
- 241000579835 Merops Species 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- 240000007594 Oryza sativa Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 102000003992 Peroxidases Human genes 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 6
- 239000008272 agar Substances 0.000 description 6
- 108010087924 alanylproline Proteins 0.000 description 6
- 238000000540 analysis of variance Methods 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 239000003599 detergent Substances 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 235000013305 food Nutrition 0.000 description 6
- 210000000936 intestine Anatomy 0.000 description 6
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 6
- 108010087558 pectate lyase Proteins 0.000 description 6
- 108040007629 peroxidase activity proteins Proteins 0.000 description 6
- 229910052698 phosphorus Inorganic materials 0.000 description 6
- 235000009566 rice Nutrition 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 5
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 5
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 5
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 5
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 5
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 5
- 241000351920 Aspergillus nidulans Species 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 241000194108 Bacillus licheniformis Species 0.000 description 5
- 241000193764 Brevibacillus brevis Species 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 5
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 5
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 5
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 5
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 5
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- FPNWKONEZAVQJF-GUBZILKMSA-N His-Asn-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FPNWKONEZAVQJF-GUBZILKMSA-N 0.000 description 5
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 5
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 5
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 5
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 5
- 241000209510 Liliopsida Species 0.000 description 5
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 5
- 241000203616 Nocardiopsis prasina Species 0.000 description 5
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 5
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 5
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 239000004141 Sodium laurylsulphate Substances 0.000 description 5
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 5
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 5
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 5
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 5
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 5
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 5
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 5
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 5
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 5
- 108010047506 alanyl-glutaminyl-glycyl-valine Proteins 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 239000002585 base Substances 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 239000008367 deionised water Substances 0.000 description 5
- 229910021641 deionized water Inorganic materials 0.000 description 5
- 238000010790 dilution Methods 0.000 description 5
- 239000012895 dilution Substances 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 230000001175 peptic effect Effects 0.000 description 5
- 230000037039 plant physiology Effects 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 244000144977 poultry Species 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 5
- 108010029384 tryptophyl-histidine Proteins 0.000 description 5
- 108010038745 tryptophylglycine Proteins 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 241000251468 Actinopterygii Species 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 4
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 4
- 241000228212 Aspergillus Species 0.000 description 4
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 4
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 4
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 4
- 244000025254 Cannabis sativa Species 0.000 description 4
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 4
- 108010059378 Endopeptidases Proteins 0.000 description 4
- 102000005593 Endopeptidases Human genes 0.000 description 4
- 241000206602 Eukaryota Species 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 241000223221 Fusarium oxysporum Species 0.000 description 4
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- IROABALAWGJQGM-OALUTQOASA-N Gly-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)CN IROABALAWGJQGM-OALUTQOASA-N 0.000 description 4
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- 241000203619 Nocardiopsis dassonvillei Species 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 4
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 4
- 241000235403 Rhizomucor miehei Species 0.000 description 4
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 4
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 4
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 4
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 4
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 4
- 241000190932 Rhodopseudomonas Species 0.000 description 4
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 4
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 4
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 4
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 4
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 4
- 240000006677 Vicia faba Species 0.000 description 4
- 235000010749 Vicia faba Nutrition 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 229910052791 calcium Inorganic materials 0.000 description 4
- 239000011575 calcium Substances 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 241001233957 eudicotyledons Species 0.000 description 4
- 235000019688 fish Nutrition 0.000 description 4
- 238000002523 gelfiltration Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 229910052500 inorganic mineral Inorganic materials 0.000 description 4
- 235000014655 lactic acid Nutrition 0.000 description 4
- 235000013372 meat Nutrition 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 4
- 235000010755 mineral Nutrition 0.000 description 4
- 239000011707 mineral Substances 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 230000035764 nutrition Effects 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 239000011574 phosphorus Substances 0.000 description 4
- 235000019833 protease Nutrition 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000002741 site-directed mutagenesis Methods 0.000 description 4
- 235000014347 soups Nutrition 0.000 description 4
- 239000004094 surface-active agent Substances 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 3
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 3
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 3
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 3
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 3
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 3
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 3
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 3
- XHTUGJCAEYOZOR-UBHSHLNASA-N Asn-Ser-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XHTUGJCAEYOZOR-UBHSHLNASA-N 0.000 description 3
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 3
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 3
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 3
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 3
- 101100136076 Aspergillus oryzae (strain ATCC 42149 / RIB 40) pel1 gene Proteins 0.000 description 3
- 244000075850 Avena orientalis Species 0.000 description 3
- 235000007319 Avena orientalis Nutrition 0.000 description 3
- 235000007558 Avena sp Nutrition 0.000 description 3
- 108090000145 Bacillolysin Proteins 0.000 description 3
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- HQZGVYJBRSISDT-BQBZGAKWSA-N Cys-Gly-Arg Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQZGVYJBRSISDT-BQBZGAKWSA-N 0.000 description 3
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 3
- 241000223218 Fusarium Species 0.000 description 3
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 3
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 3
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 3
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 3
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 3
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 3
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 3
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 3
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 3
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 3
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 3
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 3
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 3
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 3
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 3
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 3
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 240000005979 Hordeum vulgare Species 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- 241000223198 Humicola Species 0.000 description 3
- 241001480714 Humicola insolens Species 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 3
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 3
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 3
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 3
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 3
- 239000006142 Luria-Bertani Agar Substances 0.000 description 3
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 102000035092 Neutral proteases Human genes 0.000 description 3
- 108091005507 Neutral proteases Proteins 0.000 description 3
- 241000520851 Nocardiopsis alba Species 0.000 description 3
- 241000233654 Oomycetes Species 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 3
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 3
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 3
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 3
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 3
- 102000018120 Recombinases Human genes 0.000 description 3
- 108010091086 Recombinases Proteins 0.000 description 3
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 3
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 3
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 3
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 3
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 description 3
- 238000002105 Southern blotting Methods 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- 108090000787 Subtilisin Proteins 0.000 description 3
- 241000223258 Thermomyces lanuginosus Species 0.000 description 3
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 3
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 3
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- 244000098338 Triticum aestivum Species 0.000 description 3
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 3
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 3
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 3
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 3
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 3
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 3
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 3
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 3
- 235000002098 Vicia faba var. major Nutrition 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 3
- 229950006790 adenosine phosphate Drugs 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 101150019439 aldB gene Proteins 0.000 description 3
- 125000000217 alkyl group Chemical group 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 3
- 239000004327 boric acid Substances 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 235000019621 digestibility Nutrition 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 239000004744 fabric Substances 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 239000004310 lactic acid Substances 0.000 description 3
- 229960000448 lactic acid Drugs 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 101150040383 pel2 gene Proteins 0.000 description 3
- 101150050446 pelB gene Proteins 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 3
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 210000001938 protoplast Anatomy 0.000 description 3
- 230000009257 reactivity Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000008279 sol Substances 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 2
- GVJHHUAWPYXKBD-UHFFFAOYSA-N (±)-α-Tocopherol Chemical compound OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 241000186361 Actinobacteria <class> Species 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 2
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 2
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 2
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 2
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 241000272525 Anas platyrhynchos Species 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 2
- 241000235349 Ascomycota Species 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241001328122 Bacillus clausii Species 0.000 description 2
- 241000193422 Bacillus lentus Species 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 241000219193 Brassicaceae Species 0.000 description 2
- 241000871189 Chenopodiaceae Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- BYALSSDCQYHKMY-XGEHTFHBSA-N Cys-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O BYALSSDCQYHKMY-XGEHTFHBSA-N 0.000 description 2
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 2
- 101150015836 ENO1 gene Proteins 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical group C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 2
- 241000220485 Fabaceae Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 2
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 2
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 2
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 2
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 2
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 2
- DJTXYXZNNDDEOU-WHFBIAKZSA-N Gly-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)C(=O)N DJTXYXZNNDDEOU-WHFBIAKZSA-N 0.000 description 2
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000007696 Kjeldahl method Methods 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 108010029541 Laccase Proteins 0.000 description 2
- 241001071864 Lethrinus laticaudis Species 0.000 description 2
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 2
- MJVAVZPDRWSRRC-UHFFFAOYSA-N Menadione Chemical compound C1=CC=C2C(=O)C(C)=CC(=O)C2=C1 MJVAVZPDRWSRRC-UHFFFAOYSA-N 0.000 description 2
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 241001221335 Nocardiopsis sp. Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- BPQQTUXANYXVAA-UHFFFAOYSA-N Orthosilicate Chemical compound [O-][Si]([O-])([O-])[O-] BPQQTUXANYXVAA-UHFFFAOYSA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 244000292693 Poa annua Species 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 2
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 2
- 241000235527 Rhizopus Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 2
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 2
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 2
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 241001313536 Thermothelomyces thermophila Species 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 2
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- AXEJRUGTOJPZKG-XGEHTFHBSA-N Thr-Val-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O AXEJRUGTOJPZKG-XGEHTFHBSA-N 0.000 description 2
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 2
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 2
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 2
- 229930003756 Vitamin B7 Natural products 0.000 description 2
- 239000005862 Whey Substances 0.000 description 2
- 108010046377 Whey Proteins Proteins 0.000 description 2
- 102000007544 Whey Proteins Human genes 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 108010084631 acetolactate decarboxylase Proteins 0.000 description 2
- 229920006243 acrylic copolymer Polymers 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- 125000003342 alkenyl group Chemical group 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 239000007844 bleaching agent Substances 0.000 description 2
- 239000005018 casein Substances 0.000 description 2
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 2
- 235000021240 caseins Nutrition 0.000 description 2
- 230000036978 cell physiology Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 239000013611 chromosomal DNA Substances 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 238000005336 cracking Methods 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000012470 diluted sample Substances 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000002191 fatty alcohols Chemical class 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 101150105920 npr gene Proteins 0.000 description 2
- 235000006180 nutrition needs Nutrition 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 150000004965 peroxy acids Chemical class 0.000 description 2
- HXITXNWTGFUOAU-UHFFFAOYSA-N phenylboronic acid Chemical class OB(O)C1=CC=CC=C1 HXITXNWTGFUOAU-UHFFFAOYSA-N 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920005862 polyol Polymers 0.000 description 2
- 150000003077 polyols Chemical class 0.000 description 2
- 239000003910 polypeptide antibiotic agent Substances 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 239000002002 slurry Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 150000005846 sugar alcohols Chemical class 0.000 description 2
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N thiocyanic acid Chemical compound SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 229910052721 tungsten Inorganic materials 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 235000011912 vitamin B7 Nutrition 0.000 description 2
- 239000011735 vitamin B7 Substances 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- LDVVTQMJQSCDMK-UHFFFAOYSA-N 1,3-dihydroxypropan-2-yl formate Chemical compound OCC(CO)OC=O LDVVTQMJQSCDMK-UHFFFAOYSA-N 0.000 description 1
- RNAGYCQGSMZTOH-UHFFFAOYSA-N 1-(2-hydroxyphenyl)nonan-1-one Chemical compound CCCCCCCCC(=O)C1=CC=CC=C1O RNAGYCQGSMZTOH-UHFFFAOYSA-N 0.000 description 1
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- IEORSVTYLWZQJQ-UHFFFAOYSA-N 2-(2-nonylphenoxy)ethanol Chemical compound CCCCCCCCCC1=CC=CC=C1OCCO IEORSVTYLWZQJQ-UHFFFAOYSA-N 0.000 description 1
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 description 1
- XDAVBNHKLPHGGU-UHFFFAOYSA-N 2-methylpentadec-2-enoic acid Chemical compound CCCCCCCCCCCCC=C(C)C(O)=O XDAVBNHKLPHGGU-UHFFFAOYSA-N 0.000 description 1
- 101150106899 28 gene Proteins 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- FRXSZNDVFUDTIR-UHFFFAOYSA-N 6-methoxy-1,2,3,4-tetrahydroquinoline Chemical compound N1CCCC2=CC(OC)=CC=C21 FRXSZNDVFUDTIR-UHFFFAOYSA-N 0.000 description 1
- 101710197633 Actin-1 Proteins 0.000 description 1
- 241000203809 Actinomycetales Species 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241000743339 Agrostis Species 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- 108010039627 Aprotinin Proteins 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- AECPDLSSUMDUAA-ZKWXMUAHSA-N Asn-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N AECPDLSSUMDUAA-ZKWXMUAHSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 206010003645 Atopy Diseases 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108700003918 Bacillus Thuringiensis insecticidal crystal Proteins 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 108091005658 Basic proteases Proteins 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000589513 Burkholderia cepacia Species 0.000 description 1
- 101100520142 Caenorhabditis elegans pin-2 gene Proteins 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 1
- 241001674939 Caulanthus Species 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 240000006162 Chenopodium quinoa Species 0.000 description 1
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000701248 Chlorella virus Species 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241001478240 Coccus Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 1
- 241000020428 Colea Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000222511 Coprinus Species 0.000 description 1
- 244000251987 Coprinus macrorhizus Species 0.000 description 1
- 241000238424 Crustacea Species 0.000 description 1
- 241000252233 Cyprinus carpio Species 0.000 description 1
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 108010002069 Defensins Proteins 0.000 description 1
- 102000000541 Defensins Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 241000234642 Festuca Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 235000019733 Fish meal Nutrition 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- NJMYZEJORPYOTO-BQBZGAKWSA-N Gln-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O NJMYZEJORPYOTO-BQBZGAKWSA-N 0.000 description 1
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- PYUCNHJQQVSPGN-BQBZGAKWSA-N Gly-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)CN=C(N)N PYUCNHJQQVSPGN-BQBZGAKWSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- RIUZKUJUPVFAGY-HOTGVXAUSA-N Gly-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)CN RIUZKUJUPVFAGY-HOTGVXAUSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 244000286779 Hansenula anomala Species 0.000 description 1
- 235000014683 Hansenula anomala Nutrition 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- QAMFAYSMNZBNCA-UWVGGRQHSA-N His-Gly-Met Chemical compound CSCC[C@H](NC(=O)CNC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O QAMFAYSMNZBNCA-UWVGGRQHSA-N 0.000 description 1
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- 235000003332 Ilex aquifolium Nutrition 0.000 description 1
- 241000209027 Ilex aquifolium Species 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- IFQSXNOEEPCSLW-DKWTVANSSA-N L-cysteine hydrochloride Chemical compound Cl.SC[C@H](N)C(O)=O IFQSXNOEEPCSLW-DKWTVANSSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 101800004361 Lactoferricin-B Proteins 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- 102000010445 Lactoferrin Human genes 0.000 description 1
- 101710094902 Legumin Proteins 0.000 description 1
- 244000211187 Lepidium sativum Species 0.000 description 1
- 235000007849 Lepidium sativum Nutrition 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000209082 Lolium Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241001284241 Metapenaeus bennettae Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108010011756 Milk Proteins Proteins 0.000 description 1
- 102000014171 Milk Proteins Human genes 0.000 description 1
- 101000749398 Monascus ruber Citrinin polyketide synthase Proteins 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- QPCDCPDFJACHGM-UHFFFAOYSA-N N,N-bis{2-[bis(carboxymethyl)amino]ethyl}glycine Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(=O)O)CCN(CC(O)=O)CC(O)=O QPCDCPDFJACHGM-UHFFFAOYSA-N 0.000 description 1
- 108010064696 N,O-diacetylmuramidase Proteins 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241000028301 Nocardiopsis composta Species 0.000 description 1
- 241000923014 Nocardiopsis dassonvillei subsp. dassonvillei Species 0.000 description 1
- 241000364954 Nocardiopsis exhalans Species 0.000 description 1
- 241001246790 Nocardiopsis kunsanensis Species 0.000 description 1
- 241000790153 Nocardiopsis metallicus Species 0.000 description 1
- 241001558963 Nocardiopsis tropica Species 0.000 description 1
- 241000364953 Nocardiopsis umidischolae Species 0.000 description 1
- 241000560541 Nocardiopsis xinjiangensis Species 0.000 description 1
- IGFHQQFPSIBGKE-UHFFFAOYSA-N Nonylphenol Natural products CCCCCCCCCC1=CC=C(O)C=C1 IGFHQQFPSIBGKE-UHFFFAOYSA-N 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 241000194109 Paenibacillus lautus Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 241000209049 Poa pratensis Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Chemical group OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000168225 Pseudomonas alcaligenes Species 0.000 description 1
- 241000589540 Pseudomonas fluorescens Species 0.000 description 1
- 241000589630 Pseudomonas pseudoalcaligenes Species 0.000 description 1
- 241000577556 Pseudomonas wisconsinensis Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101001076706 Saccharomyces cerevisiae Invertase 1 Proteins 0.000 description 1
- 101001053411 Saccharomyces cerevisiae Invertase 3 Proteins 0.000 description 1
- 101001053412 Saccharomyces cerevisiae Invertase 4 Proteins 0.000 description 1
- 101001053409 Saccharomyces cerevisiae Invertase 5 Proteins 0.000 description 1
- 101001053400 Saccharomyces cerevisiae Invertase 7 Proteins 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 102100032849 Sentan Human genes 0.000 description 1
- 101710205302 Sentan Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 239000004902 Softening Agent Substances 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 1
- 241001655322 Streptomycetales Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 108010056079 Subtilisins Proteins 0.000 description 1
- 102000005158 Subtilisins Human genes 0.000 description 1
- BGRWYDHXPHLNKA-UHFFFAOYSA-N Tetraacetylethylenediamine Chemical compound CC(=O)N(C(C)=O)CCN(C(C)=O)C(C)=O BGRWYDHXPHLNKA-UHFFFAOYSA-N 0.000 description 1
- 241000223257 Thermomyces Species 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- YOPQYBJJNSIQGZ-JNPHEJMOSA-N Thr-Tyr-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 YOPQYBJJNSIQGZ-JNPHEJMOSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241000276707 Tilapia Species 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- 101800003783 Tritrpticin Proteins 0.000 description 1
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 1
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- UBKKNELWDCBNCF-STQMWFEESA-N Tyr-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBKKNELWDCBNCF-STQMWFEESA-N 0.000 description 1
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 1
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 235000005072 Vigna sesquipedalis Nutrition 0.000 description 1
- 244000090207 Vigna sesquipedalis Species 0.000 description 1
- FPIPGXGPPPQFEQ-BOOMUCAASA-N Vitamin A Natural products OC/C=C(/C)\C=C\C=C(\C)/C=C/C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-BOOMUCAASA-N 0.000 description 1
- 229930003779 Vitamin B12 Natural products 0.000 description 1
- QYSXJUFSXHHAJI-XFEUOLMDSA-N Vitamin D3 Natural products C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C/C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-XFEUOLMDSA-N 0.000 description 1
- 229930003427 Vitamin E Natural products 0.000 description 1
- 229930003448 Vitamin K Natural products 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 229910021536 Zeolite Inorganic materials 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 1
- 235000019770 animal feed premixes Nutrition 0.000 description 1
- 239000003674 animal food additive Substances 0.000 description 1
- 235000020244 animal milk Nutrition 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 230000001857 anti-mycotic effect Effects 0.000 description 1
- 230000000433 anti-nutritional effect Effects 0.000 description 1
- 101150085125 apr gene Proteins 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 229960004405 aprotinin Drugs 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- 230000000468 autoproteolytic effect Effects 0.000 description 1
- JXLHNMVSKXFWAO-UHFFFAOYSA-N azane;7-fluoro-2,1,3-benzoxadiazole-4-sulfonic acid Chemical compound N.OS(=O)(=O)C1=CC=C(F)C2=NON=C12 JXLHNMVSKXFWAO-UHFFFAOYSA-N 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010019077 beta-Amylase Proteins 0.000 description 1
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010055059 beta-Mannosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004061 bleaching Methods 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000005282 brightening Methods 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 1
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- POIUWJQBRNEFGX-XAMSXPGMSA-N cathelicidin Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C1=CC=CC=C1 POIUWJQBRNEFGX-XAMSXPGMSA-N 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- KAFGYXORACVKTE-UEDJBKKJSA-N chembl503567 Chemical compound C([C@H]1C(=O)N[C@H]2CSSC[C@H](NC(=O)[C@H](CC=3C=CC=CC=3)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@H](C(=O)N[C@@H](CSSC[C@@H](C(N1)=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CCCNC(N)=N)CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)C1=CC=C(O)C=C1 KAFGYXORACVKTE-UEDJBKKJSA-N 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 235000019784 crude fat Nutrition 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000645 desinfectant Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002478 diastatic effect Effects 0.000 description 1
- 235000021373 diet component Nutrition 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000021245 dietary protein Nutrition 0.000 description 1
- GSPKZYJPUDYKPI-UHFFFAOYSA-N diethoxy sulfate Chemical compound CCOOS(=O)(=O)OOCC GSPKZYJPUDYKPI-UHFFFAOYSA-N 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- HNPSIPDUKPIQMN-UHFFFAOYSA-N dioxosilane;oxo(oxoalumanyloxy)alumane Chemical compound O=[Si]=O.O=[Al]O[Al]=O HNPSIPDUKPIQMN-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000004851 dishwashing Methods 0.000 description 1
- YNPKJCSIKJCODK-UHFFFAOYSA-N disodium boric acid hydrogen borate decahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].OB(O)O.OB(O)O.OB(O)O.OB([O-])[O-] YNPKJCSIKJCODK-UHFFFAOYSA-N 0.000 description 1
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 210000003746 feather Anatomy 0.000 description 1
- 235000021050 feed intake Nutrition 0.000 description 1
- 239000004467 fishmeal Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 description 1
- 108010043649 gastrin I Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229960002442 glucosamine Drugs 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010050792 glutenin Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 238000005469 granulation Methods 0.000 description 1
- 230000003179 granulation Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000000413 hydrolysate Substances 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 239000002471 hydroxymethylglutaryl coenzyme A reductase inhibitor Substances 0.000 description 1
- 150000003949 imides Chemical class 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 230000000937 inactivator Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- ZPNFWUPYTFPOJU-LPYSRVMUSA-N iniprol Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC=4C=CC=CC=4)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]2N(CCC2)C(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N3)C(=O)NCC(=O)NCC(=O)N[C@@H](C)C(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](C(=O)N1)C(C)C)[C@@H](C)O)[C@@H](C)CC)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 ZPNFWUPYTFPOJU-LPYSRVMUSA-N 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 239000002563 ionic surfactant Substances 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 1
- 238000010829 isocratic elution Methods 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- CFFMZOZGXDAXHP-HOKBLYKWSA-N lactoferricin Chemical compound C([C@H](NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CSSC[C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CO)C(=O)N[C@H](C(N[C@H](C(=O)N1)[C@@H](C)O)=O)[C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CFFMZOZGXDAXHP-HOKBLYKWSA-N 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- 229940078795 lactoferrin Drugs 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 235000021239 milk protein Nutrition 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 235000021278 navy bean Nutrition 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- MGFYIUFZLHCRTH-UHFFFAOYSA-N nitrilotriacetic acid Chemical compound OC(=O)CN(CC(O)=O)CC(O)=O MGFYIUFZLHCRTH-UHFFFAOYSA-N 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 229920000847 nonoxynol Polymers 0.000 description 1
- SNQQPOLDUKLAAF-UHFFFAOYSA-N nonylphenol Chemical compound CCCCCCCCCC1=CC=CC=C1O SNQQPOLDUKLAAF-UHFFFAOYSA-N 0.000 description 1
- 238000002414 normal-phase solid-phase extraction Methods 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 235000021048 nutrient requirements Nutrition 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 108010032563 oligopeptidase Proteins 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 108010073895 ovispirin Proteins 0.000 description 1
- 235000019629 palatability Nutrition 0.000 description 1
- 229940055726 pantothenic acid Drugs 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 235000011837 pasties Nutrition 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 229960003330 pentetic acid Drugs 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- SHUZOJHMOBOZST-UHFFFAOYSA-N phylloquinone Natural products CC(C)CCCCC(C)CCC(C)CCCC(=CCC1=C(C)C(=O)c2ccccc2C1=O)C SHUZOJHMOBOZST-UHFFFAOYSA-N 0.000 description 1
- 229940068041 phytic acid Drugs 0.000 description 1
- 239000000467 phytic acid Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 229920005646 polycarboxylate Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 229940093916 potassium phosphate Drugs 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 238000002975 protease activity determination Methods 0.000 description 1
- 108010032966 protegrin-1 Proteins 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 235000021251 pulses Nutrition 0.000 description 1
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000002133 sample digestion Methods 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- MWNQXXOSWHCCOZ-UHFFFAOYSA-L sodium;oxido carbonate Chemical compound [Na+].[O-]OC([O-])=O MWNQXXOSWHCCOZ-UHFFFAOYSA-L 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000003019 stabilising effect Effects 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 150000003457 sulfones Chemical class 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- 108010075550 termamyl Proteins 0.000 description 1
- 108010032153 thanatin Proteins 0.000 description 1
- 230000001550 time effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- FTKYRNHHOBRIOY-HQUBJAAMSA-N tritrptcin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)C(C)C)C1=CC=CC=C1 FTKYRNHHOBRIOY-HQUBJAAMSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 101150079396 trpC2 gene Proteins 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 235000019163 vitamin B12 Nutrition 0.000 description 1
- 239000011715 vitamin B12 Substances 0.000 description 1
- 235000019158 vitamin B6 Nutrition 0.000 description 1
- 239000011726 vitamin B6 Substances 0.000 description 1
- 235000005282 vitamin D3 Nutrition 0.000 description 1
- 239000011647 vitamin D3 Substances 0.000 description 1
- QYSXJUFSXHHAJI-YRZJJWOYSA-N vitamin D3 Chemical compound C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C\C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-YRZJJWOYSA-N 0.000 description 1
- 235000019165 vitamin E Nutrition 0.000 description 1
- 229940046009 vitamin E Drugs 0.000 description 1
- 239000011709 vitamin E Substances 0.000 description 1
- 235000019168 vitamin K Nutrition 0.000 description 1
- 239000011712 vitamin K Substances 0.000 description 1
- 150000003721 vitamin K derivatives Chemical class 0.000 description 1
- 235000012711 vitamin K3 Nutrition 0.000 description 1
- 239000011652 vitamin K3 Substances 0.000 description 1
- 229940045997 vitamin a Drugs 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 229940021056 vitamin d3 Drugs 0.000 description 1
- 229940046010 vitamin k Drugs 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 101150103630 yfmD gene Proteins 0.000 description 1
- 229910052727 yttrium Inorganic materials 0.000 description 1
- 239000010457 zeolite Substances 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
衍生自S2A或S1E蛋白酶的分泌的成熟多肽,当其成熟后具有蛋白酶活性,该多肽在其被表达时和成熟之前含有异源前-区。
Description
发明领域
多种由微生物衍生的相关蛋白酶很难以工业化规模大量生产,这些蛋白酶倾向于以多种形式被降解和/或具有不稳定性。本发明提供了通过将其表达成含有异源前-序列的蛋白酶来生产所述蛋白酶的方法。本发明还提供了所获得的含有所述异源前序列的蛋白酶。
本发明涉及分离的多肽,其具有与拟诺卡氏菌蛋白酶相关的蛋白酶活性,还涉及分离的编码所述蛋白酶的核酸序列。本发明还涉及含有这些核酸序列的核酸构建体,载体和宿主细胞,以及制备和使用(尤其在动物饲料中)所述蛋白酶的方法。
背景
具有蛋白酶活性的多肽或蛋白酶有时也被称为肽酶或肽水解酶。蛋白酶可以是始于任一端水解肽的外切型蛋白酶或在多肽链内部发挥作用的内切型蛋白酶(内肽酶)。内肽酶对N-和C-末端被封闭的肽底物显示出活性,所述底物与该蛋白酶的特异性有关。
本文将术语“蛋白酶”定义为水解肽键的酶。它包括任何属于EC 3.4组的酶(包括其13个亚类中的每一个)。EC编号可参照源自NC-IUBMB,Academic Press,San Diego,California的Enzyme Nomenclature 1992,包括分别公开于Eur.J.Biochem.1994,223,1-5;Eur.J.Biochem.1995,232,1-6;Eur.J.Biochem.1996,237,1-5;Eur.J.Biochem.1997,250,1-6和Eur.J.Biochem.1999,264,610-650的增补本1-5。命名会定期得以增补和更新;参见例如网址
http://www.chem.qmw.ac.uk/iubmb/enzyme/index.html)。
美国专利公开号2002/0182672A1公开了下述内容:如果多肽C-末端最后两个氨基酸中的一个或两个是带电的极性氨基酸:D或E(带负电)或者K,R或H(带正电),可以认为尾部是极性带电的,这使得多肽能够抵抗识别分泌蛋白质之非-极性C-末端尾的蛋白酶亚类的降解。
另有文献报道:新生多肽链C-末端的脯氨酸残基导致多肽降解(2002.Prolin residues at the C terminus of nascent chains induce SsrA tagging duringtranslation termination.J.Biol.Chem.277:33825-33823)。
发明简述
在表达具有蛋白酶解活性的多肽的技术中,一个众所周知的问题是:此类多肽大多具有内在的不稳定性,它们可能会遭受自我蛋白酶解,或者成为在其制备过程中已经形成的其它蛋白酶降解的目标,导致产量较低。多种其它因素也可能会导致其不稳定性,目前尚未完全了解所有因素。重要的是提供稳定性有所增强的蛋白酶多肽,从而以较高产量制备这些多肽。
归类为S2A和/或S1E的分泌蛋白酶常具有前-区,该前区从蛋白酶上被裂解下来,产生蛋白酶的成熟部分。本发明人发现:与生产未经改变的野生型蛋白酶相比,以融合多肽的形式生产含有异源前-区的S2A和/或S1E蛋白酶,会导致产量有较大提高。
因此,第一方面,本发明涉及分泌的成熟多肽,其成熟后具有蛋白酶活性,该多肽在被表达时和成熟前含有异源前-区,该多肽:
(a)含有与SEQ ID NO:28;SEQ ID NO:33;SEQ ID NO:37;SEQ ID NO:41;SEQ ID NO:43或SEQ ID NO:45所示多肽成熟部分的氨基酸序列至少70%相同,或优选75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列;
(b)含有与SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:25;SEQ ID NO:31;SEQ ID NO:32;SEQ ID NO:36;SEQ ID NO:40或SEQ ID NO:44所示多核苷酸编码的多肽的成熟部分的氨基酸序列至少70%相同,或优选75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列;
(c)含有成熟部分,该部分是具有SEQ ID NO:28;SEQ ID NO:33;SEQID NO:37;SEQ ID NO:41;SEQ ID NO:43或SEQ ID NO:45所示氨基酸序列的多肽的成熟部分的变体,该区段含有一个或多个氨基酸取代,缺失,延伸和/或插入;
(d)由在很低,低,中-低,中,中-高,高或很高严紧度的条件下,能与下列序列杂交的核酸序列编码:
(I)编码蛋白酶成熟部分的多核苷酸,所述多核苷酸可使用引物SEQ IDNO:26和27获自达松维尔拟诺卡氏菌达松维尔亚种(Nocardiopsisdassonvillei subsp.dassonvillei)DSM 43235的基因组DNA;使用引物SEQ IDNO:34和35获自白拟诺卡氏菌(Nocardiopsis Alba)DSM 15647的基因组DNA;使用引物SEQ ID NO:38和39获自葱绿拟诺卡氏菌(Nocardiopsisprasina)DSM 15648的基因组DNA;或使用引物SEQ ID NO:42和39获自葱绿拟诺卡氏菌DSM 15649的基因组DNA;
(II)SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:25;SEQ ID NO:31;SEQID NO:32;SEQ ID NO:36;SEQ ID NO:40或SEQ ID NO:44的多核苷酸;
(III)为(I)或(II)的至少500个核苷酸,优选400,300,200或100个核苷酸的亚序列,或
(IV)为(I),(II)或(III)的互补链;
(e)是(a),(b),(c)或(d)的等位基因变体;或
(f)是(a),(b),(c),(d)或(e)的片段。,
第二方面,本发明涉及分离的编码第一方面所限定多肽的多核苷酸;或分离的编码融合多肽的多核苷酸,所述融合多肽成熟后具有蛋白酶活性,成熟前含有异源前-区,所述多肽:
(a)含有与SEQ ID NO:28;SEQ ID NO:33;SEQ ID NO:37;SEQ ID NO:41;SEQ ID NO:43或SEQ ID NO:45所示多肽成熟部分的氨基酸序列至少70%相同,或优选75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列;
(b)含有与SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:25;SEQ ID NO:31;SEQ ID NO:32;SEQ ID NO:36;SEQ ID NO:40或SEQ ID NO:44所示多核苷酸编码的多肽的成熟部分的氨基酸序列至少70%相同,或优选75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列;
(c)含有成熟部分,该部分是具有SEQ ID NO:28;SEQ ID NO:33;SEQID NO:37;SEQ ID NO:41;SEQ ID NO:43或SEQ ID NO:45所示氨基酸序列的多肽的成熟部分的变体,该区段含有一个或多个氨基酸取代,缺失,延伸和/或插入;
(d)由在很低,低,中-低,中,中-高,高或很高严紧度的条件下,能与下列序列杂交的核酸序列编码:
(I)编码蛋白酶成熟部分的多核苷酸,所述多核苷酸可使用引物SEQ IDNO:26和27获自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的基因组DNA;使用引物SEQ ID NO:34和35获自白拟诺卡氏菌DSM 15647的基因组DNA;使用引物SEQ ID NO:38和39获自葱绿拟诺卡氏菌DSM 15648的基因组DNA;或使用引物SEQ ID NO:42和39获自葱绿拟诺卡氏菌DSM15649的基因组DNA;
(II)SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:25;SEQ ID NO:31;SEQID NO:32;SEQ ID NO:36;SEQ ID NO:40或SEQ ID NO:44的多核苷酸;
(III)为(I)或(II)的至少500个核苷酸,优选400,300,200或100个核苷酸的亚序列,或
(IV)为(I),(II)或(III)的互补链;
(e)是(a),(b),(c)或(d)的等位基因变体;或
(f)是(a),(b),(c),(d)或(e)的片段。
第三方面,本发明涉及含有第二方面所限定的多核苷酸的重组表达载体或多核苷酸构建体。
第四方面,本发明涉及含有第二方面所限定的多核苷酸,或第三方面所限定的表达载体或多核苷酸构建体的重组宿主细胞。
第五方面,本发明还涉及含有第二方面所限定的多核苷酸,或第三方面所限定的表达载体或多核苷酸构建体的转基因植物或植物部分。
第六方面,本发明涉及含有第二方面所限定的多核苷酸,或第三方面所限定的表达载体或多核苷酸构建体的转基因非人动物,或其产物或元件。
第七方面,本发明涉及制备第一方面所限定的多肽的方法,所述方法包括:(a)培养第四方面所限定的重组宿主细胞,或第五或第六方面所限定的转基因植物或动物,以产生含有多肽的上清液,和任选(b)回收多肽。
在其它方面,本发明涉及:动物饲料添加剂,其含有至少一种第一方面所限定的多肽;和
(a)至少一种脂溶性维生素,和/或
(b)至少一种水溶性维生素,和/或
(c)至少一种痕量矿物质;
动物饲料组合物,其中的粗蛋白含量为50至800g/kg,并且含有至少一种第一方面所限定的多肽,或至少一种前一方面所限定的饲料添加剂;
组合物,其含有至少一种第一方面所限定的多肽,以及至少一种选自下列的其它酶:植酸酶(EC 3.1.3.8或3.1.3.26);木聚糖酶(EC 3.2.1.8);半乳聚糖酶(EC 3.2.1.89);α-半乳糖苷酶(EC 3.2.1.22);蛋白酶(EC 3.4.-.-);磷脂酶A1(EC 3.1.1.32);磷脂酶A2(EC 3.1.1.4);溶血磷脂酶(EC 3.1.1.5);磷脂酶C(3.1.4.3);磷脂酶D(EC 3.1.4.4)和/或β-葡聚糖酶(EC 3.2.1.4或EC3.2.1.6);
使用至少一种第一方面所限定的多肽改善动物饲料的营养价值,增加动物饮食中可消化和/或可溶的蛋白质,增加动物饮食中蛋白质的水解程度,和/或处理植物蛋白质的方法,所述方法包括使动物饲料和/或用于动物饲料的组合物中包含多肽。
使用至少一种第一方面所限定的多肽的方法,包括使清洁剂配方中包含多肽。
发明详述
根据蛋白酶的催化机理将其分为下列几组:丝氨酸蛋白酶(S),半胱氨酸蛋白酶(C),天冬氨酸蛋白酶(A),金属蛋白酶(M)和未知的或仍未分类的蛋白酶(U),参见Handbook of Proteolytic Enzymes,A.J.Barrett,N.D.Rawlings,J.F.Woessner(eds),Academic Press(1998),尤其是其概括性的导言部分。
丝氨酸蛋白酶是普遍存在的,在病毒,细菌和真核生物中已发现此酶;它们包括外切肽酶,内肽酶,寡肽酶和ω-肽酶活性。已鉴定出20多个丝氨酸蛋白酶家族(表示为S1-S27),根据结构相似性和功能证据将它们分为6个族,表示为SA,SB,SC,SE,SF和SG(Barrett et al.1998.Handbook ofproteolytic enzymes)。其中至少4个族(SA,SB,SC和SE)的结构是已知的,这些结构似乎完全不相关,这表明丝氨酸蛋白酶至少有4个进化起源。α-裂解内肽酶属于胰凝乳蛋白酶(SA)族,在该族中,它被指定为S2家族的A亚族(S2A)。
蛋白酶的另一个分类系统基于序列信息,因此更常用于分子生物学技术;它描述于Rawlings,N.D.et al.,2002,MEROPS:The protease database.Nucleic Acids Res.30:343-346。MEROPS电子数据库可免费获自http://www.merops.ac.uk。根据MEROPS系统,在′蛋白酶手册′中被分类为S2A的蛋白酶在MEROPS中被分类为′S1E′蛋白酶(Rawlings ND,Barrett AJ.(1993)Evolutionary families of peptidases,Biochem.J.290:205-218)。
在具体实施方案中,本发明和根据本发明使用的蛋白酶选自:
(a)属于EC3.4.-.-酶组的蛋白酶;
(b)属于上述手册中的S组的丝氨酸蛋白酶;
(c1)S2A肽酶家族的丝氨酸蛋白酶;
(c2)描述于Biochem.J.290:205-218(1993)和MEROPS蛋白酶数据库,release 6.20,March 24,2003,(www.merops.ac.uk)的S1E肽酶家族的丝氨酸蛋白酶。该数据库描述于Rawlings,N.D.,O′Brien,E.A.& Barrett,A.J.(2002)MEROPS:the protease database.Nucleic Acids Res.30,343-346。
为了测定给定蛋白酶是否为丝氨酸蛋白酶和S2A家族的蛋白酶,可参考上述手册和其中述及的原理。可对所有蛋白酶类型进行测定,而不论其是天然或野生型蛋白酶;还是经基因工程改造或合成的蛋白酶。
可使用任何测定法测定蛋白酶活性,在所述方法中使用底物,该底物包括与所述蛋白酶的特异性相关的肽键。使检测-pH和检测-温度同样地适合所述蛋白酶。检测-pH值的例子为pH 2,3,4,5,6,7,8,9,10,11或12。检测-温度的例子为30,35,37,40,45,50,55,60,65,70,80,90或95℃。
蛋白酶底物的例子为酪蛋白,如Azurine-Crosslinked Casein(AZCL-酪蛋白)。本文实施例2中描述了两种蛋白酶测定法,可使用其中的任一种测定蛋白酶活性。本发明优选所谓的pNA测定法。
对本发明和/或本发明使用的蛋白酶的来源没有限制。因此,术语蛋白酶不仅包括得自任何微生物属的天然或野生型蛋白酶,还包括其表现出蛋白酶活性的任何突变体,变体,片段等,以及合成的蛋白酶,如经改组的蛋白酶和共有蛋白酶。可按照本技术领域公知的方法,如通过定点诱变,PCR(在PCR反应中使用含有所需突变的PCR片段作为引物之一),或随机诱变制备经基因工程改造的蛋白酶。共有蛋白质的制备描述于例如EP897985。本文所用的与给定来源有关的术语“得自”应该指:通过该来源或通过其中存在有得自该来源的核酸序列的细胞产生由核酸序列编码的多肽。在优选实施方案中,多肽被分泌至细胞外。
在具体实施方案中,蛋白酶是低-变应原性变体,它被设计成当暴露于包括人的动物时,引发降低的免疫反应。术语免疫反应可被理解成暴露于蛋白酶的动物的免疫系统所作出的任何反应。一种类型的免疫反应是导致暴露动物IgE水平升高的变应性反应。可使用本领域已知技术制备低-变应原性变体。例如,蛋白酶可与聚合物组成成分保护部分或参与免疫反应的蛋白酶表位偶联。与聚合物偶联包括在体外使聚合物与蛋白酶进行化学偶联,参见例如WO 96/17929,WO 98/30682,WO 98/35026和/或WO 99/00489。偶联另外还包括或可选择地包括在体内使聚合物与蛋白酶偶联。所述偶联可通过下述方法获得:对编码蛋白酶的核苷酸序列进行基因工程改造,在蛋白酶中插入编码额外糖基化位点的共有序列,并在能糖基化蛋白酶的宿主中表达蛋白酶,参见例如WO 00/26354。另一种提供低-变应原性变体的方法是对编码蛋白酶的核苷酸序列进行基因工程改造,从而导致蛋白酶自我-寡聚化,以便蛋白酶单体可保护其它蛋白酶单体的表位,从而降低寡聚体的抗原性。所述产物及其制备描述于例如WO 96/16177。通过多种方法,如WO 00/26230和WO 01/83559所述的噬菌体展示法,或者EP 561907所述的随机法,可以鉴定出参与免疫反应的表位。一旦鉴定出表位,可通过已知的基因操作技术,如定点诱变(参见例如WO 00/26230,WO 00/26354和/或WO 00/22103)改变其氨基酸序列以使蛋白酶的免疫特性发生改变,和/或以足够近的距离使聚合物与表位偶联,以使聚合物能保护表位。
第一方面,本发明涉及分泌的成熟多肽,其成熟后具有蛋白酶活性,该多肽在被表达时和成熟前含有异源前-区,该多肽:
(a)含有与SEQ ID NO:28;SEQ ID NO:33;SEQ ID NO:37;SEQ ID NO:41;SEQ ID NO:43或SEQ ID NO:45所示多肽成熟部分的氨基酸序列至少70%相同,或优选75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列;
(b)含有与SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:25;SEQ ID NO:31;SEQ ID NO:32;SEQ ID NO:36;SEQ ID NO:40或SEQ ID NO:44所示多核苷酸编码的多肽的成熟部分的氨基酸序列至少70%相同,或优选75%,80%,85%,86%,87%,88%,89%,90%,9 1%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列;
(c)含有成熟部分,该部分是具有SEQ ID NO:28;SEQ ID NO:33;SEQID NO:37;SEQ ID NO:41;SEQ ID NO:43或SEQ ID NO:45所示氨基酸序列的多肽的成熟部分的变体,该区段含有一个或多个氨基酸取代,缺失,延伸和/或插入;
(d)由在很低,低,中-低,中,中-高,高或很高严紧度的条件下,能与下列序列杂交的核酸序列编码:
(I)编码蛋白酶成熟部分的多核苷酸,所述多核苷酸可使用引物SEQ IDNO:26和27获自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的基因组DNA;使用引物SEQ ID NO:34和35获自白拟诺卡氏菌DSM 15647的基因组DNA;使用引物SEQ ID NO:38和39获自葱绿拟诺卡氏菌DSM 15648的基因组DNA;或使用引物SEQ ID NO:42和39获自葱绿拟诺卡氏菌DSM15649的基因组DNA;
(II)SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:25;SEQ ID NO:31;SEQID NO:32;SEQ ID NO:36;SEQ ID NO:40或SEQ ID NO:44的多核苷酸;
(III)为(I)或(II)的至少500个核苷酸,优选400,300,200或100个核苷酸的亚序列,或
(IV)为(I),(II)或(III)的互补链;
(e)是(a),(b),(c)或(d)的等位基因变体;或
(f)是(a),(b),(c),(d)或(e)的片段。
在本发明中,通过程序″align″测定两个氨基酸序列之间以及两个核苷酸序列之间的同一性程度,所述程序是Needleman-Wunsch比对(即全面比对)。使用该程序进行多肽以及核苷酸序列的比对。使用缺省评分矩阵BLOSUM50进行多肽比对,使用缺省同一性矩阵进行核苷酸比对。对多肽而言,缺口第一个残基的罚分为-12,对核苷酸而言该罚分为-16。对多肽而言,缺口更远残基的罚分为-2,对核苷酸而言该罚分为-4。
″Align″是v20u6版FASTA程序包的一部分(参见W.R.Pearson and D.J.Lipman(1988),″Improved Tools for Biological Sequence Analysis″,PNAS85:2444-2448和W.R.Pearson(1990)″Rapid and Sensitive SequenceComparison with FASTP and FASTA,″Methods in Enzymology 183:63-98)。FASTA蛋白质比对使用Smith-Waterman算法,该算法对缺口大小没有限制(参见″Smith-Waterman algorithm″,T.F.Smith and M.S.Waterman(1981)J.Mol.Biol.147:195-197)。
也可通过Clustal法(Higgins,1989,CABIOS 5:151-153)测定两个氨基酸序列之间的同一性程度,该方法使用具有同一性桌面和下列成组比对参数的LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI):缺口罚分为10,缺口长度罚分为10。成对的比对参数是:Ktuple=1,缺口罚分=3,窗口=5和对角线=5。可使用具有下列设置的与上述相同的算法和软件包测定两个核苷酸序列之间的同一性程度:缺口罚分为10,缺口长度罚分为10。成对的比对参数是:Ktuple=3,缺口罚分=3和窗口=20。
本发明编码多核苷酸序列之一的片段是编码多肽的多核苷酸,与全长氨基酸序列相比,该多肽的氨基和/或羧基末端缺失了一个或多个氨基酸。在一个实施方案中,片段编码至少75个氨基酸残基,或至少100个氨基酸残基,或至少125个氨基酸残基,或至少150个氨基酸残基,或至少160个氨基酸残基,或至少165个氨基酸残基,或至少170个氨基酸残基,或至少175个氨基酸残基。
等位基因变体表示占据相同染色体基因座之基因的任意两个或多个可替换形式。等位基因变体可通过突变天然产生,也可由种群中的多态性引起。基因突变可以是沉默的(其编码的多肽没有变化),或者编码具有经改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
本发明还涉及分离的具有蛋白酶活性的多肽,该多肽由在很低,低,中-低,中,中-高,高或很高严紧度的条件下,能与核酸探针杂交的核酸序列编码,所述探针能在相同条件下与下列多核苷酸杂交:(I)编码蛋白酶成熟部分的多核苷酸,所述多核苷酸可使用引物SEQ ID NO:26和27获自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的基因组DNA;使用引物SEQID NO:34和35获自白拟诺卡氏菌DSM 15647的基因组DNA;使用引物SEQ ID NO:38和39获自葱绿拟诺卡氏菌DSM 15648的基因组DNA;或使用引物SEQ ID NO:42和39获自葱绿拟诺卡氏菌DSM 15649的基因组DNA;(II)SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:25;SEQ ID NO:31;SEQ ID NO:32;SEQ ID NO:36;SEQ ID NO:40或SEQ ID NO:44的多核苷酸;(III)(I)或(II)的至少500个核苷酸,优选400,300,200或100个核苷酸的亚序列,或(IV)(I),(II)或(III)的互补链(J.Sambrook,E.F.Fritsch,and T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,2nd edition,ColdSpring Harbor,New York)。在一个具体的实施方案中,核酸探针选自上文(a),(b)或(c)的核酸序列。优选的探针是对应于SEQ ID NO:1,SEQ ID NO:25,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:36,SEQ ID NO:40或SEQ IDNO:44的成熟肽编码部分的多核苷酸。
可根据本领域众所周知的方法,使用SEQ ID NO:1,SEQ ID NO:25,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:36,SEQ ID NO:40或SEQ IDNO:44的核酸序列或其亚序列以及SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:33,SEQ ID NO:37,SEQ ID NO:41,SEQ ID NO:43或SEQ ID NO:45的氨基酸序列或其片段,甚至是可使用引物SEQ ID NO:26和27获自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的基因组DNA;使用引物SEQ IDNO:34和35获自白拟诺卡氏菌DSM 15647的基因组DNA;使用引物SEQID NO:38和39获自葱绿拟诺卡氏菌DSM 15648的基因组DNA;或使用引物SEQ ID NO:42和39获自葱绿拟诺卡氏菌DSM 15649的基因组DNA的编码蛋白酶的基因组多核苷酸或其亚序列设计核酸探针,以从不同属或种的菌株中鉴定和克隆出编码具有蛋白酶活性的多肽的DNA。具体地说,可根据标准的Southern印迹法,使用该探针与感兴趣的属或种的基因组或cDNA杂交,以从中鉴定和分离出相应的基因。该探针可以比完整的序列短很多,但其长度应该是至少15,优选至少25,更优选至少35个核苷酸。也可使用较长的探针。可使用DNA和RNA探针。一般需标记探针以检测相应的基因(例如,用32P,3H,35S,生物素或亲和素)。本发明包括所述探针。
因此,可从制备自其它生物体的基因组DNA或cDNA文库中筛选出与上述探针杂交的DNA,所述DNA编码具有蛋白酶活性的多肽。通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术,可从其它生物体中分离基因组或其它DNA。可将得自文库的DNA或分离的DNA转移至和固定在硝酸纤维素或其它适当的载体材料上。为了鉴定出与SEQ ID NO:1或其亚序列同源的克隆或DNA,在Southern印迹中使用载体材料。在本发明中,杂交表示在很低至很高的严紧条件下,核酸序列能与对应于SEQ ID NO:1所示核酸序列,其互补链或其亚序列的经标记核酸探针杂交。可使用X-射线胶片检测能在这些条件下与核酸探针杂交的分子。
对于长度至少为100个核苷酸的长探针而言,根据标准的Southern印迹法,很低至很高的严紧度条件被定义为于42℃在5×SSPE,0.3%SDS,200μg/ml经剪切和变性的鲑精DNA,和25%甲酰胺(很低和低严紧度),或35%甲酰胺(中和中-高严紧度),或50%甲酰胺(高和很高严紧度)中进行预杂交和杂交。
对于长度至少为100个核苷酸的长探针而言,最终用0.2×SSC,0.2%SDS,20%甲酰胺将载体材料洗涤3次,每次15分钟,洗涤温度优选至少为45℃(很低严紧度),更优选至少为50℃(低严紧度),更优选至少为55℃(中严紧度),更优选至少为60℃(中-高严紧度),甚至更优选至少为65℃(高严紧度),最优选至少为70℃(很高严紧度)。
对于长度约为15个核苷酸至约70个核苷酸的短探针而言,根据标准的Southern印迹法,严紧条件被定义为:在比用Bolton和McCarthy算法(1962,Proceedings of the National Academy of Sciences USA 48:1390)算出的Tm低5℃至10℃的温度下,在0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1×Denhardt′s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mMATP和0.2mg酵母RNA/ml中进行预杂交,杂交和洗涤后的杂交。
对于长度约为15个核苷酸至约70个核苷酸的短探针而言,在比计算出的Tm低5℃至10℃的温度下,用6×SSC加上0.1%SDS将载体材料洗涤一次,时间为15分钟,用6×SSC洗涤两次,每次15分钟。
本发明还涉及本发明多肽的变体,其含有一个或多个氨基酸的取代,缺失和/或插入。
在具体实施方案中,氨基酸变化的性质是次要的,它是不会显著影响蛋白质折叠和/或活性的保守氨基酸取代;一般为1至约30个氨基酸的小缺失;小的氨基-或羧基-末端延伸,如氨基-末端的甲硫氨酸残基;多达约20-25个残基的小肽;或便于通过改变净电荷或另一种功能进行纯化的小延伸,如聚-组氨酸序列,抗原表位或结合结构域。
保守取代在如下所述的各组氨基酸内部进行:碱性氨基酸(精氨酸,赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),极性氨基酸(谷氨酰胺和天冬酰胺),疏水氨基酸(亮氨酸,异亮氨酸和缬氨酸),芳香族氨基酸(苯丙氨酸,色氨酸和酪氨酸),和小氨基酸(甘氨酸,丙氨酸,丝氨酸,苏氨酸和甲硫氨酸)。本领域已知通常不会改变比活性的氨基酸取代,其描述于例如H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York。最常发生的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly及其逆交换。
在具体实施方案中,本发明的以及本发明所用的多肽具有酸-稳定性。在本发明中,术语酸-稳定性指的是:与在pH 9.0和5℃保温2小时后相应样品的残留活性相比,在pH 3.0和37℃保温2小时后的残留活性至少为50%。在具体实施方案中,残留活性至少为60%,70%,80%或至少为90%。
在具体实施方案中,本发明的多肽是:i)细菌蛋白酶;ii)放线菌门的蛋白酶;iii)放线菌纲的蛋白酶;iv)放线菌目的蛋白酶;v)拟诺卡氏菌科的蛋白酶;vi)拟诺卡氏菌属的蛋白酶;和/或得自vii)拟诺卡氏菌,如白拟诺卡氏菌,南极拟诺卡氏菌,葱绿拟诺卡氏菌,Nocardiopsis composta,Nocardiopsis exhalans,嗜盐拟诺卡氏菌,耐盐拟诺卡氏菌,Nocardiopsiskunsanensis,李氏拟诺卡氏菌,卢森坦拟诺卡氏菌,Nocardiopsis metallicus,线团拟诺卡氏菌,海藻糖拟诺卡氏菌,Nocardiopsis tropica,Nocardiopsisumidischolae,Nocardiopsis xinjiangensis或达松维尔拟诺卡氏菌,例如,达松维尔拟诺卡氏菌DSM 43235的蛋白酶。
上述分类学根据的是G.M.Garrity & J.G.Holt的著作“系统细菌学伯捷氏手册”,2001,第二版,第1卷,David R.Bone,Richard W.Castenholz中的章节“The road map to the Manual”。
应理解对上述种而言,本发明包括其完美和不完美的状态以及其它分类学等同物,如无性型,而不论其为人所知的是什么种名。本领域熟练技术人员可以容易地认识到适当等同物的特性。
在多个培养物保藏中心,如美国典型培养物保藏中心(ATCC),DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH (DSM),Centraalbureau Voor Schimmelcultures(CBS)和Agricultural Research ServicePatent Culture Collection,Northern Regional Research Center(NRRL),公众可以容易地获得这些种的菌株。例如公众可从DSMZ(Deutsche Sammlung vonMIkroorganismen und Zellkulturen GmbH,Braunschweig,Germany)获得达松维尔拟诺卡氏菌达松维尔亚种DSM 43235。其它保藏机构也保藏了该菌株,它们的保藏号如下:ATCC 23219,IMRU 1250,NCTC 10489。
另外,可使用上述探针由其它来源,包括从自然界(如土壤,堆肥,水等)分离的微生物中鉴定和获得多肽。从自然生活环境分离微生物的技术是本领域众所周知的。然后,通过类似地筛选另一种微生物的基因组或cDNA文库即可获得核酸序列。一旦用探针检测到编码多肽的核酸序列,通过利用本领域普通技术人员已知的技术即可分离或克隆该序列(参见例如Sambrook et al.,1989,文献同上)。
本文所限定的“分离的”多肽是经SDS-PAGE测定,实质上不含其它多肽的多肽,例如至少约20%纯,优选至少约40%纯,更优选约60%纯,甚至更优选约80%纯,最优选约90%纯,甚至最优选约95%纯。
由本发明的核酸序列编码的多肽还包括融合多肽或可裂解的融合多肽,其中另一种多肽与多肽或其片段的N-末端或C-末端融合。通过使编码另一种多肽的核酸序列(或其部分)与本发明的核酸序列(或其部分)融合即可产生融合多肽。产生融合多肽的技术是本领域已知的,例如PCR,或连接编码多肽的编码序列,使得它们在框内,且融合多肽的表达在相同启动子和终止子的控制之下。
在本文上下文中,非-极性氨基酸是G,A,V,L,I,M,P,F或W;不带电的极性氨基酸是S,T,N,Q,Y或C。当用于描述多肽中的氨基酸时,术语“非-极性”和“不带电的极性”一般被本领域技术人员认为是氨基酸的侧链特征。因此,例如,当测定氨基酸是非-极性的还是不带电的极性氨基酸时,不考虑多肽C-末端氨基酸的游离羧酸。
优选实施方案涉及第一方面的多肽,其成熟部分是野生型多肽;野生型多肽的人工变体,与野生型相比,所述变体的C-末端添加了一个或多个氨基酸,优选一个或多个添加的氨基酸是非-极性或不带电的,甚至更优选一个或多个添加的氨基酸是Q,S,V,A或P中的一个或多个;经改组的多肽;或蛋白质-经改造的多肽。
另一个优选实施方案涉及第一方面的多肽,该多肽在其C-末端的最后4个氨基酸中含有至少3个非-极性或不带电的极性氨基酸。
另一个优选实施方案涉及第一方面的多肽,其中一个或多个添加的氨基酸选自QSHVQSAP,QSAP,QP,TL,TT, QL,TP,LP,TI,IQ,QP,PI,LT,TQ,IT,QQ和PQ。
如下文实施例所示,本发明人测定:当本发明多肽以与异源前-区融合和/或与异源分泌信号肽融合的成熟蛋白酶形式被表达时,即可以更高的产量制备所述多肽。
因此,优选实施方案涉及第一方面的多肽,当其被表达时和成熟前,含有异源分泌信号-肽,当多肽被分泌时,该信号肽从多肽上裂解下来,优选异源分泌信号肽得自异源蛋白酶,优选异源分泌信号肽含有与SEQ IDNO:2或SEQ ID NO:44的多核苷酸1-81所编码氨基酸序列的序列同一性至少为70%,或优选为75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的氨基酸序列。
因此,优选实施方案涉及第一方面的多肽,当其被表达和成熟前,含有蛋白酶的异源前-区;优选前-区得自S2A或S1E蛋白酶,更优选前-区由下述多核苷酸编码,所述多核苷酸能在很低,低,中-低,中,中-高,高或很高严紧度的条件下,与编码前-区的多核苷酸杂交,所述前-区示于SEQ IDNO:28的第-166至-1位,SEQ ID NO:30的第1-166位,SEQ ID NO:33的第-167至-1位,SEQ ID NO:37的第-165至-1位,SEQ ID NO:41的第-165至-1位,SEQ ID NO:43的第-165至-1位,SEQ ID NO:45的第-165至-1位,SEQ ID NO:46的第1-165位,SEQ ID NO:47的第1-166位,SEQ ID NO:48的第1-166位,SEQ ID NO:49的第1-166位,SEQ ID NO:50的第1-166位,SEQ ID NO:51的第1-165位,SEQ ID NO:52的第1-166位或SEQ ID NO:53的第1-166位;最优选它与示于SEQ ID NO:28的第-166至-1位,SEQ ID NO:30的第1-166位,SEQ ID NO:33的第-167至-1位,SEQ ID NO:37的第-165至-1位,SEQ ID NO:41的第-165至-1位,SEQ ID NO:43的第-165至-1位,SEQ ID NO:45的第-165至-1位,SEQ ID NO:46的第1-165位,SEQ ID NO:47的第1-166位,SEQ ID NO:48的第1-166位,SEQ ID NO:49的第1-166位,SEQ ID NO:50的第1-166位,SEQ ID NO:51的第1-165位,SEQ ID NO:52的第1-166位或SEQ ID NO:53的第1-166位的前-区至少70%相同,或优选75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同。
核酸序列
本发明还涉及分离的编码本发明多肽的核酸序列。本发明的具体核酸序列是SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:25,SEQ ID NO:31,SEQID NO:32,SEQ ID NO:36,SEQ ID NO:40或SEQ ID NO:44的多核苷酸。本发明的另一种具体核酸序列是可得自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235基因组DNA的序列,优选的是其成熟多肽编码区序列。本发明还包括编码多肽的核酸序列,所述多肽具有SEQ ID NO:43的第1至188位或第-165至188位所示氨基酸的氨基酸序列,由于遗传密码的简并性,所述核酸序列与SEQ ID NO:1的对应部分有所不同。本发明还涉及上述多核苷酸的亚序列,其编码具有蛋白酶活性的多肽片段。
多核苷酸的亚序列是5′和/或3′末端缺失一个或多个核苷酸的核酸序列。优选亚序列含有至少225个核苷酸,更优选至少300个氨基酸,甚至更优选至少375,450,500,531,600,700,800,900或1000个核苷酸。本发明还涉及与SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:25,SEQ ID NO:31,SEQID NO:32,SEQ ID NO:36,SEQ ID NO:40或SEQ ID NO:44所示多核苷酸的同一性水平至少为85%,86,87,88,89,90,91,92,93,94,95,96,97,98或至少为99%的核苷酸序列。
本领域已知分离或克隆编码多肽的核酸序列的技术,其包括从基因组DNA中分离,由cDNA制备或其组合。例如,通过使用众所周知的聚合酶链反应(PCR)或用抗体筛选表达文库以检测出具有共用结构特征的克隆DNA片段,即可从基因组DNA中克隆出本发明的核酸序列。参见例如Inniset al.,1990,PCR:A Guide to Methods and Application,Academic Press,NewYork。也可使用其它核酸扩增法,如连接酶链反应(LCR),连接激活转录(LAT)和基于核酸序列的扩增(NASBA)。核酸序列可克隆自拟诺卡氏菌属的菌株或另一种或相关生物体,因此,所述核酸序列可以是核酸序列的多肽编码区的等位基因变体或种变体。
本文所用术语“分离的核酸序列”指的是:通过琼脂糖电泳测定,实质上不含其它核酸序列的核酸序列,例如至少约20%纯,优选至少约40%纯,更优选至少约60%纯,甚至更优选至少约80%纯,最优选至少约90%纯。例如,通过基因工程中所用的将核酸序列从其天然位置重新定位至复制它的不同位点的标准克隆方法,即可获得分离的核酸序列。克隆方法包括切割和分离合乎需要的含有编码多肽的核酸序列的核酸片段,将所述片段插入载体分子,并将重组载体掺入复制多拷贝或多克隆核酸序列的宿主细胞。核酸序列可以源于基因组,cDNA,RNA,半合成,合成或其任意组合。
为了合成与本发明的多肽基本上类似的多肽,必须修饰编码本发明多肽的核酸序列。术语与多肽“基本上类似”指的是非-天然形式的多肽。这些多肽以一些经改造的方式区别于分离自其天然来源的多肽,例如比活,热稳定性,最适pH,变应原性等有所不同的变体。变体序列的构建可基于表现为本发明多核苷酸的多肽编码部分,例如其亚序列的核酸序列,和/或通过导入不会导致核酸序列所编码多肽的氨基酸序列发生变化,但对应于欲制备蛋白酶的宿主生物体的密码子偏好性的核苷酸取代,或通过导入可产生不同氨基酸序列的核苷酸取代来进行。有关核苷酸取代的一般性描述可参见例如Ford et al.,1991,Protein Expression and Purification 2:95-107。可按上文所述制备低-变应原性多肽。
本领域技术人员清楚地知道:所述取代可在对分子功能至关重要的区域外部进行,此时仍会产生活性多肽。可根据本领域已知的方法,如定点诱变或丙氨酸-扫描诱变(参见例如Cunningham and Wells,1989,Science 244:1081-1085),鉴定出对于本发明分离的核酸序列所编码多肽的活性而言为必需的,因此优选不被取代的氨基酸残基。在后一技术中,在分子中的每一个带正电的残基处导入突变,检测所得突变分子的蛋白酶活性以鉴定出对分子活性至关重要的氨基酸残基。也可通过诸如核磁共振分析,晶体学或光亲和标记的技术(参见例如de Vos et al.,1992,Science 255:306-312;Smithet al.,1992,Journal of Molecular Biology 224:899-904;Wlodaver et al.,1992,FEBS Letters 309:59-64)测定三维结构,通过分析三维结构测定底物-蛋白酶相互作用的位点。
本发明还涉及分离的编码本发明多肽的核酸序列,在很低严紧度的条件下,优选在低严紧度的条件下,更优选在中严紧度的条件下,更优选在中-高严紧度的条件下,甚至更优选在高严紧度的条件下,最优选在很高严紧度的条件下,所述核酸序列能与核酸探针杂交,所述核酸探针能在相同条件下与本文所限定的本发明的核酸序列或其互补链;或其等位基因变体和亚序列杂交(Sambrook et al.,1989,出处同上)。
本发明还涉及通过下述方法产生的分离的核酸序列:(a)在很低,低,中,中-高,高或很高严紧度的条件下,使DNA与(i)本发明的多核苷酸,(ii)(i)的亚序列,或(iii)(i)或(ii)的互补链杂交;和(b)分离核酸序列。优选亚序列是至少为100个核苷酸的序列,例如编码具有蛋白酶活性的多肽片段的序列。
通过使用任何本领域已知的方法进行定点诱变,可将突变导入核酸序列以用一个核苷酸替换另一个核苷酸。特别有用的方法利用了具有重要插入物的超螺旋双链DNA载体和两个含有所需突变的合成引物。在利用PfuDNA聚合酶进行的循环变温过程中,各自与载体的相反链互补的寡核苷酸引物延伸。通过引物的掺入,产生含有交错切口的突变质粒。循环变温之后,用特异于甲基化和半甲基化DNA的DpnI处理产物,以消化亲代DNA模板并选择出含突变的合成DNA。也可使用本领域已知的其它方法。本发明还涉及分离的编码第一方面所限定多肽的多核苷酸。
核酸构建体
本发明还涉及含有本发明的核酸序列的核酸构建体,所述核酸序列与一个或多个控制序列可操作相连,在与控制序列相容的条件下,所述控制序列能介导编码序列在适当宿主细胞中表达。应理解表达包括任何与多肽产生有关的步骤,包括但不限于转录,转录后修饰,翻译,翻译后修饰和分泌。
本文将“核酸构建体”定义为单链或双链核酸分子,所述分子分离自天然基因或经修饰后含有以自然界中可能不会存在的方式联合和并列的核酸区段。当核酸构建体含有表达本发明的编码序列所需的全部控制序列时,术语核酸构建体与表达盒是同义词。本文将术语“编码序列”定义为直接指定其蛋白质产物的氨基酸序列的核酸序列。一般通过核糖体结合位点(原核生物)或紧接mRNA 5’末端开放阅读框上游的ATG起始密码子(真核生物)以及紧接mRNA 3’末端开放阅读框下游的转录终止序列来测定编码序列的边界。编码序列包括但不限于DNA,cDNA和重组核酸序列。
可用多种方法处理分离的编码本发明多肽的核酸序列以提供多肽表达。根据表达载体的不同,在将核酸序列插入载体之前可能需要或必须对其进行处理。利用重组DNA法修饰核酸序列的技术是本领域众所周知的。
本文将术语“控制序列”定义为包括所有为表达本发明多肽所必需或对其有利的组件。对编码多肽的核酸序列而言,每个控制序列可以是天然的或外源的。所述控制序列包括但不限于前导序列,聚腺苷酸化序列,前肽序列,启动子,信号肽序列和转录终止子。控制序列至少包括启动子以及转录和翻译终止信号。为了导入特异性限制性位点,可以接头的形式提供控制序列,所述位点便于连接控制序列与编码多肽的核酸序列的编码区。本文将术语“可操作地相连”定义为一种构型,其中相对于DNA序列的编码序列而言,控制序列被安放于适当的位置,使得控制序列能介导多肽表达。
控制序列可以是适当的启动子序列(一种由宿主细胞识别以表达核酸序列的核酸序列)。启动子序列含有介导多肽表达的转录控制序列。启动子可以是任何在选定宿主细胞中显示出转录活性的核酸序列,包括突变的,截短的和杂合的启动子,启动子可得自对宿主细胞而言为同源或异源的编码细胞外或细胞内多肽的基因。
介导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的适当启动子的例子有:得自大肠杆菌lac操纵子,天蓝色链霉菌琼脂糖酶基因(dagA),枯草芽孢杆菌果聚糖蔗糖酶基因(sacB),地衣芽孢杆菌α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM),解淀粉芽孢杆菌α-淀粉酶基因(amyQ),地衣芽孢杆菌青霉素酶基因(penP),枯草芽孢杆菌xylA和xylB基因和原核生物β-内酰胺酶基因(Villa-Kamaroff et al.,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731)的启动子,以及tac启动子(DeBoer et al.,1983,Proceedings of the National Academyof Sciences USA 80:21-25)。其它启动子描述于″Useful proteins fromrecombinant bacteria″in Scientific American,1980,242:74-94以及Sambrooket al.,1989,文献同上。
介导本发明的核酸构建体在丝状真菌宿主细胞中转录的适当启动子的例子有:得自米曲霉TAKA淀粉酶,米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶,黑曲霉中性α-淀粉酶,黑曲霉酸稳定性α-淀粉酶,黑曲霉或泡盛曲霉葡糖淀粉酶(glaA),米赫根毛霉脂肪酶,米曲霉碱性蛋白酶,米曲霉丙糖磷酸异构酶,构巢曲霉乙酰胺酶和尖孢镰孢胰蛋白酶-样蛋白酶(WO96/00787)基因的启动子,以及NA2-tpi启动子(得自黑曲霉中性α-淀粉酶基因与米曲霉丙糖磷酸异构酶基因的启动子的杂合体),及其突变的,截短的和杂合的启动子。
在酵母宿主中,有用的启动子得自酿酒酵母烯醇化酶(ENO-1),酿酒酵母半乳糖激酶(GAL1),酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶的基因。其它对酵母宿主细胞有用的启动子描述于Romanos et al.,1992,Yeast 8:423-488。
控制序列也可以是适当的转录终止序列(一种由宿主细胞识别以终止转录的序列)。终止序列与编码多肽的核酸序列的3’末端可操作相连。本发明可以使用任何能在选定宿主细胞中起作用的终止子。
对于丝状真菌宿主细胞而言,优选的终止子得自米曲霉TAKA淀粉酶,黑曲霉葡糖淀粉酶,构巢曲霉邻氨基苯甲酸合酶,黑曲霉α-葡糖苷酶和尖孢镰孢胰蛋白酶-样蛋白酶的基因。
对于酵母宿主细胞而言,优选的终止子得自酿酒酵母烯醇化酶,酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。其它对酵母宿主细胞有用的终止子描述于Romanos et al.,1992,文献同上。
对于细菌宿主细胞,如芽孢杆菌属宿主细胞而言,优选的终止子是得自地衣芽孢杆菌α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)或解淀粉芽孢杆菌α-淀粉酶基因(amyQ)的终止子。
控制序列也可以是适当的前导序列(一种对宿主细胞翻译至关重要的mRNA的非翻译区)。前导序列与编码多肽的核酸序列的5’末端可操作相连。本发明可以使用任何能在选定宿主细胞中起作用的前导序列。
对于丝状真菌宿主细胞而言,优选的前导序列得自米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因。
对于酵母宿主细胞而言,适当的前导序列得自酿酒酵母烯醇化酶(ENO-1),酿酒酵母3-磷酸甘油酸激酶,酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因。
控制序列也可以是聚腺苷酸化序列(一种与核酸序列的3’末端可操作相连的序列,当其被转录时,作为信号被宿主细胞识别以在被转录的mRNA中添加聚腺苷残基)。本发明可以使用任何能在选定宿主细胞中起作用的聚腺苷酸化序列。
对于丝状真菌宿主细胞而言,优选的聚腺苷酸化序列得自米曲霉TAKA淀粉酶,黑曲霉葡糖淀粉酶,构巢曲霉邻氨基苯甲酸合酶,尖孢镰孢胰蛋白酶-样蛋白酶和黑曲霉α-葡糖苷酶的基因。
对于酵母宿主细胞而言,有用的聚腺苷酸化序列描述于Guo andSherman,1995,Molecular Cellular Biology 15:5983-5990。
控制序列也可以是信号肽编码区,该编码区编码与多肽的氨基末端相连的氨基酸序列,并介导编码的多肽进入细胞分泌途径。核酸序列的编码序列的5’末端可内在含有在翻译读框内与编码分泌多肽的编码区区段天然相连的信号肽编码区。或者,编码序列的5’末端可含有对编码序列而言为外源的信号肽编码区。当编码序列不天然含有信号肽编码区时,就需要外源的信号肽编码区。或者,为了增强多肽的分泌,可简单地用外源信号肽编码区置换天然信号肽编码区。然而,本发明可使用任何能介导表达的多肽进入选定宿主细胞的分泌途径的信号肽编码区。
对于细菌宿主细胞而言,有效的信号肽编码区是得自芽孢杆菌NCIB11837产麦芽糖淀粉酶,嗜热脂肪芽孢杆菌α-淀粉酶,地衣芽孢杆菌枯草蛋白酶,地衣芽孢杆菌α-淀粉酶,嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA的基因的信号肽编码区。其它信号肽描述于Simonen and Palva,1993,Microbiological Reviews 57:109-137。
对于丝状真菌宿主细胞而言,有效的信号肽编码区是得自米曲霉TAKA淀粉酶,黑曲霉中性淀粉酶,黑曲霉葡糖淀粉酶,米赫根毛霉天冬氨酸蛋白酶,Humicola insolens纤维素酶和Humicola lanuginosa脂肪酶的基因的信号肽编码区。
对于酵母宿主细胞而言,有用的信号肽得自酿酒酵母α-因子和酿酒酵母转化酶的基因。其它有用的信号肽编码区描述于Romanos et al.,1992,文献同上。
控制序列也可以是编码位于多肽氨基末端的氨基酸序列的前肽编码区。已知所得多肽是酶原或多肽原。多肽原一般是无活性的,通过前肽的催化或自催化,可由多肽原转变为成熟的活性多肽。前肽编码区可得自枯草芽孢杆菌碱性蛋白酶(aprE),枯草芽孢杆菌中性蛋白酶(nprT), 酿酒酵母α-因子,米赫根毛霉天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO95/33836)的基因。
当多肽的氨基末端同时存在信号肽和前肽区时,前肽区紧接多肽的氨基末端,而信号肽区紧接前肽区的氨基末端。
还需要添加相对于宿主细胞的生长而言能调节多肽表达的调节序列。调节系统的例子是那些能导致基因表达对化学或物理刺激物,包括调节化合物的存在作出反应而被开启或关闭的系统。原核系统的调节系统包括lac,tac和trp操纵系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可将TAKAα-淀粉酶启动子,黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子用作调节序列。其它调节序列的例子是允许基因扩增的序列。在真核系统中,它们包括在氨甲蝶呤的存在下可扩增的二氢叶酸还原酶基因和在重金属存在下可扩增的金属硫蛋白基因。在这些情况下,编码多肽的核酸序列与调节序列可操作相连。
表达载体
本发明还涉及重组表达载体,其含有本发明的核酸序列,启动子以及转录和翻译终止信号。可将上述的多种核酸和控制序列连接在一起以产生重组表达载体,该载体可包括一个或多个便利的限制性位点,以允许在该位点插入或取代编码多肽的核酸序列。或者,可通过将核酸序列或含有该序列的核酸构建体插入适当的表达载体来表达本发明的核酸序列。在产生表达载体时,编码序列位于载体中,以使编码序列与表达所需的适当控制序列可操作相连。
重组表达载体可以是任何能方便地经受重组DNA程序并能致使核酸序列表达的载体(如质粒或病毒)。对载体的选择一般取决于载体与欲导入该载体的宿主细胞之间的相容性。载体可以是线型或封闭环状质粒。
载体可以是自主复制型载体,即作为染色体外的实体存在,其复制不依赖于染色体复制的载体,例如质粒,染色体外元件,微型染色体或人工染色体。载体可含有任何能确保自我复制的元件。或者,载体是当导入宿主细胞时,能整合至基因组并同与其整合的染色体一起复制的载体。另外,可使用单个载体或质粒,或两个或多个合起来含有欲导入宿主细胞基因组的总DNA的载体或质粒,或者转座子。
本发明的载体优选含有一个或多个能容易地选择转化细胞的选择标记。选择标记是一种基因,其产物可提供抗微生物剂或病毒抗性,对重金属的抗性,针对营养缺陷型的原养型等。细菌选择标记的例子是枯草芽孢杆菌或地衣芽孢杆菌的dal基因。针对酵母宿主细胞的适当标记是ADE2,HIS3,LEU2,LYS2,MET3,TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶),argB(鸟氨酸转氨甲酰酶),bar(膦丝菌素乙酰转移酶),hygB(潮霉素磷酸转移酶),niaD(硝酸盐还原酶),pyrG(乳清苷-5’-磷酸脱羧酶),sC(硫酸盐腺苷酸转移酶),trpC(邻氨基苯甲酸合酶)及其等同物。优选用于曲霉细胞的选择标记是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌的bar基因。
本发明的载体优选含有允许载体稳定整合至宿主细胞基因组,或在细胞中不依赖于基因组而自主复制载体的元件。
为了整合至宿主细胞基因组中,载体可依靠编码多肽的核酸序列或载体的任何其它元件以通过同源或非同源重组将载体稳定整合至基因组中。或者,载体可含有额外的核酸序列以通过同源重组介导对宿主细胞基因组的整合。这些额外的核酸序列能使载体在精确的染色体位置处整合至宿主细胞基因组。为了增加在精确位置整合的可能性,整合元件应优选含有足够数目的核酸,如100至1,500个碱基对,优选400至1,500个碱基对,最优选800至1,500个碱基对,所述核酸与相应的靶序列高度同源以增加同源重组的可能性。整合元件可以是任何与宿主细胞基因组中的靶序列同源的序列。另外,整合元件可以是非-编码或编码核酸序列。另一方面,可通过非-同源重组将载体整合至宿主细胞基因组。
为了进行自主复制,载体还可含有能使载体在所述宿主细胞中自主复制的复制起点。细菌复制起点的例子是允许在大肠杆菌中复制的质粒pBR322,pUC19,pACYC177和pACYC184的复制起点,以及允许在芽孢杆菌中复制的pUB110,pE194,pTA1060和pAMβ1的复制起点。用于酵母宿主细胞的复制起点的例子是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合以及ARS4和CEN6的组合。复制起点可以具有突变,所述突变使其在宿主细胞中的功能为温度敏感型(参见例如Ehrlich,1978,Proceedings ofthe National Academy of Sciences USA 75:1433)。
可将多于1拷贝的本发明的核酸序列插入宿主细胞以提高基因产物的产量。通过将至少一个额外拷贝的序列整合至宿主细胞基因组,或通过将核酸序列与可扩增的选择标记基因包括在一起,在适当选择试剂的存在下培养细胞,选择出含有扩增的选择标记基因拷贝因而含有额外的核酸序列拷贝的细胞,即可使核酸序列的拷贝数增加。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员众所周知的(参见例如Sambrook et al.,1989,文献同上)。
蛋白酶也可与至少一种对动物饲料较为重要的其它酶一起被共表达,例如植酸酶(EC 3.1.3.8或3.1.3.26);木聚糖酶(EC 3.2.1.8);半乳聚糖酶(EC3.2.1.89);α-半乳糖苷酶(EC 3.2.1.22);蛋白酶(EC 3.4.-.-);磷脂酶A1(EC3.1.1.32);磷脂酶A2(EC 3.1.1.4);溶血磷脂酶(EC 3.1.1.5);磷脂酶C(3.1.4.3);磷脂酶D(EC 3.1.4.4)和/或β-葡聚糖酶(EC 3.2.1.4或EC 3.2.1.6)。
可由不同载体,一个载体或混合使用这两项技术共表达酶。当使用不同载体时,载体可具有不同的选择标记和不同的复制起点。当仅使用一个载体时,可由一个或多个启动子表达基因。如果在一个启动子(双-或多-顺反子)的调节下进行克隆,基因被克隆的次序会影响蛋白质的表达水平。也可将蛋白酶表达为融合蛋白,即编码蛋白酶的基因在框内与编码另一种蛋白质的基因融合。该蛋白质可以是另一种酶或另一种酶的功能结构域。
因此,本发明还涉及重组表达载体或含有本发明的多核苷酸的多核苷酸构建体。
宿主细胞
本发明还涉及含有本发明的核酸序列的重组宿主细胞,该细胞可有利地用于重组制备多肽。将含有本发明的核酸序列的载体导入宿主细胞,从而以如上所述的染色体整合体或自我-复制的染色体外载体的形式维持载体。术语“宿主细胞”包括亲代细胞的任何后代,所述后代因复制过程中发生的突变而与亲代细胞不同。宿主细胞的选择在很大程度上取决于编码多肽的基因及其来源。宿主细胞可以是单细胞微生物,如原核生物,也可以是非-单细胞微生物,如真核生物。
有用的单细胞细胞是细菌细胞,如革兰氏阳性细菌,包括但不限于芽孢杆菌属细胞或链霉菌属细胞或乳酸菌细胞;或革兰氏阴性细菌,如大肠杆菌和假单胞菌属的菌种。乳酸菌包括但不限于下列属的种:乳球菌,乳杆菌,明串珠菌,链球菌,片球菌和肠球菌。有用的单细胞细胞是细菌细胞,如革兰氏阳性细菌,包括但不限于芽孢杆菌属细胞,如嗜碱芽孢杆菌,解淀粉芽孢杆菌,短芽孢杆菌,环状芽孢杆菌,克劳氏芽孢杆菌,凝结芽孢杆菌,灿烂芽孢杆菌,迟缓芽孢杆菌,地衣芽孢杆菌,巨大芽孢杆菌,嗜热脂肪芽孢杆菌,枯草芽孢杆菌和苏云金芽孢杆菌;或链霉菌属细胞,如浅青紫链霉菌或鼠灰链霉菌,或革兰氏阴性细菌,如大肠杆菌和假单胞菌属的菌种。在优选实施方案中,细菌宿主细胞是迟缓芽孢杆菌,地衣芽孢杆菌,嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选实施方案中,芽孢杆菌属细胞是嗜碱的芽孢杆菌。
通过使用下述方法可将载体导入细菌宿主细胞,所述方法如原生质体转化(参见例如Chang and Cohen,1979,Molecular General Genetics 168:111-115),使用感受态细胞(参见例如Young and Spizizin,1961,Journal ofBacteriology 81:823-829,or Dubnau and Davidoff-Abelson,1971,Journal ofMolecular Biology 56:209-221),电穿孔(参见例如Shigekawa and Dower,1988,Biotechniques 6:742-751)或接合(参见例如Koehler and Thorne,1987,Journalof Bacteriology 169:5771-5278)。宿主细胞可以是真核生物,如非-人动物细胞,昆虫细胞,植物细胞或真菌细胞。在一个具体实施方案中,宿主细胞是真菌细胞。本文所用“真菌”包括子囊菌门(Ascomycota),担子菌门(Basidiomycota),壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth et al.,In,Ainsworth and Bisy’s Dictionary of The Fungi,8thedition,1995,CAB International,University Press,Cambridge,UK所定义)以及卵菌门(Oomycota)(如Hawksworth et al.,1995,文献同上,page 171所提及)和所有有丝分裂孢子真菌(Hawksworth et al.,1995,文献同上)。
在另一个具体实施方案中,真菌宿主细胞是酵母细胞。本文所用“酵母”包括产子囊酵母(Endomycetales),产担孢子酵母和属于半知菌类的酵母(酵母菌)。由于将来酵母的分类可能会发生变化,为了本发明的目的,应该如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)所述定义酵母。
酵母宿主细胞可以是假丝酵母属,汉逊氏酵母属,克鲁维氏酵母属,毕赤氏酵母属,酿酒酵母属,裂殖糖酵母属或Yarrowia细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌亚门和卵菌门(定义于Hawksworth et al.,1995,文献同上)的所有丝状形式。丝状真菌的特征在于其菌丝壁由壳多糖,纤维素,葡聚糖,壳聚糖,甘露聚糖和其它复杂的多糖组成。营养生长通过菌丝延长来进行,碳分解代谢是专性需氧的。与之形成对照的是,诸如酿酒酵母的酵母的营养生长通过单细胞菌体芽殖来进行,碳分解代谢可以是发酵的。
丝状真菌宿主细胞的例子是包括但不限于下述属的菌种细胞:支顶孢属,曲霉属,镰孢属,腐质霉属,毛霉属,毁丝霉属,链孢霉属,青霉属,草根霉属,Tolypocladium或木霉属。
以本来已知的方式,通过包括原生质体形成,原生质体转化和细胞壁再生的方法转化真菌细胞。转化曲霉属宿主细胞的适当方法描述于EP 238023和Yelton et al.,1984,Proceedings of the National Academy of Sciences USA81:1470-1474。转化镰孢属菌种的适当方法描述于Malardier et al.,1989,Gene 78:147-156和WO 96/00787。可使用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,NewYork;Ito et al.,1983,Journal of Bacteriology 153:163;和Hinnen et al.,1978,Proceedings of the National Academy of Sciences USA 75:1920中所述的方法转化酵母。
本发明涉及含有本发明的多核苷酸,或本发明的表达载体或多核苷酸构建体的重组宿主细胞。在优选实施方案中,重组宿主细胞是芽孢杆菌属细胞。
植物
本发明还涉及被编码本发明多肽的核酸序列转化,从而能以可回收的量表达和产生多肽的转基因植物,植物部分或植物细胞,其中所述多肽具有蛋白酶活性。可从植物或植物部分中回收多肽。或者,可使用含有重组多肽的植物或植物部分改善食品或饲料的品质,例如改善营养价值,适口性和流变学特性,或破坏抗营养因子。
在具体实施方案中,多肽靶向种子的胚乳贮存液泡。通过将其合成为具有适当信号肽的前体即可达到此目的,参见Horvath et al in PNAS,Feb.15,2000,vol.97,no.4,p.1914-1919。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)或其经改造的变体。单子叶植物的例子是草,如草地草(早熟禾),草料草,如羊茅属,黑麦草属,temperate草,如剪股颖属和谷物,如小麦,燕麦,黑麦,大麦,水稻,高粱和玉米。双子叶植物的例子是烟草,豆类,如羽扇豆,马铃薯,糖甜菜,豌豆,蚕豆和大豆,以及十字花科植物(Brassicaceae科),如花椰菜,油菜和密切相关的模式生物拟南芥。经改造的植物的例子是美国专利号5,689,054和6,111,168中所述的低-植酸植物。
植物部分的例子是茎,愈伤组织,叶,根,果实,种子和块茎。特殊的植物组织,如叶绿体,质外体,线粒体,液泡,过氧化物酶体和细胞质也被认为是植物部分。另外,不论其组织来源如何,任何植物细胞都被看成是植物部分。
本发明的范围内还包括所述植物,植物部分和植物细胞的后代。
可根据本领域已知的方法构建表达本发明多肽的转基因植物或植物细胞。简单地说,通过将一个或多个编码本发明多肽的表达构建体掺入植物宿主基因组,并将所得经修饰的植物或植物细胞繁殖成转基因植物或植物细胞,即可构建植物或植物细胞。
为了便利起见,表达构建体是核酸构建体,其含有编码本发明多肽的核酸序列,所述序列与在选定植物或植物部分中表达核酸序列所需的适当调节序列可操作相连。另外,表达构建体可含有用于鉴定整合了表达构建体的宿主细胞的选择标记和将构建体导入所述植物所需的DNA序列(后者取决于所用的DNA导入法)。
例如,可根据需要表达多肽的时机,地点和方式来选择调节序列,如启动子,终止序列以及非强制地选择信号或转运序列。例如,编码本发明多肽的基因的表达可以是组成型或诱导型的,或者可以是发育,时期或组织特异性的,基因产物可以靶向特定的组织或植物部分,如种子或叶。调节序列描述于例如Tague et al.,1988,Plant Physiology 86:506。
为了进行组成型表达,可使用35S-CaMV启动子(Franck et al.,1980,Cell21:285-294)。器官-特异性启动子可以是例如得自贮藏库组织,如种子,马铃薯块茎和果实(Edwards & Coruzzi,1990,Ann.Rev.Genet.24:275-303)的启动子,或是得自代谢库组织,如分生组织的启动子(Ito et al.,1994,Plant Mol.Biol.24:863-878),种子特异性启动子,如水稻的麦谷蛋白,谷醇溶蛋白,球蛋白或白蛋白启动子(Wu et al.,1998,Plant and Cell Physiology 39:885-889),蚕豆的豆球蛋白B4和未知种子蛋白基因的Vicia faba启动子(Conrad et al.,1998,Journal of Plant Physiology 152:708-711),种子油体蛋白的启动子(Chen et al.,1998,Plant and Cell Physiology 39:935-941),欧洲油菜的贮存蛋白napA启动子或者本领域已知的任何其它种子特异性启动子,例如,WO 91/14772中描述的那些启动子。另外,启动子可以是叶特异性启动子,如水稻或番茄的rbcs启动子(Kyozuka et al.,1993,Plant Physiology 102:991-1000),小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra and Higgins,1994,Plant Molecular Biology 26:85-93)或水稻aldP基因启动子(Kagaya etal.,1995,Molecular and General Genetics 248:668-674)或创伤诱导型启动子,如马铃薯pin2启动子(Xu et al.,1993,Plant Molecular Biology 22:573-588)。
也可以使用启动子增强子元件在植物中获得较高的蛋白酶表达量。例如,启动子增强子元件可以是位于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如,Xu et al.,1993,文献同上公开了使用水稻肌动蛋白1基因的第一个内含子来增强表达。
此外,可针对所述植物物种使密码子的使用最优化以改进表达(参见Horvath et al,文献同上)。
选择标记基因和表达构建体的任何其它部分都是本领域已知的。
根据本领域已知的常规技术将核酸构建体掺入植物基因组,所述技术包括农杆菌-介导的转化,病毒-介导的转化,微量注射,颗粒轰击,biolistic转化和电穿孔(Gasser et al.,1990,Science 244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto et al.,1989,Nature 338:274)。
目前,根瘤农杆菌-介导的基因转移是产生转基因双子叶植物所选择的方法(综述参见Hooykas and Schilperoort,1992,Plant Molecular Biology 19:15-38)。然而,该方法也可用于转化单子叶植物,但是,单子叶植物一般优选其它转化方法。目前,产生转基因单子叶植物所选择的方法是用颗粒轰击(用转化DNA包被的金粒子或钨颗粒)胚愈伤组织或发育中的胚(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current OpinionBiotechnology 5:158-162;Vasil et al.,1992,Bio/Technology 10:667-674)。另一种可选择的转化单子叶植物的方法基于Omirulleh et al.,1993,PlantMolecular Biology 21:415-428所述的原生质体转化。
转化之后,根据本领域众所周知的方法选择其中掺入了表达构建体的转化体,并将其再生为完整的植株。
本发明还涉及制备本发明多肽的方法,其包括(a)在有助于制备多肽的条件下培养含有编码本发明多肽的核酸序列的转基因植物或植物细胞,其中所述多肽具有蛋白酶活性;和(b)回收多肽。本发明涉及含有权利要求8所限定的多核苷酸,或本发明的表达载体或多核苷酸构建体的转基因植物或植物部分。
动物
本发明还涉及转基因的非人动物及其产物或其组件,例如体液,如乳汁和血液,器官,肉和动物细胞。在例如哺乳动物细胞中表达蛋白质的技术是本领域已知的,参见例如手册Protein Expression:A Practical Approach,Higgins and Hames(eds),Oxford University Press(1999)和该系列的其它三本与基因转录,RNA加工和翻译后加工有关的手册。一般说来,为了制备转基因动物,需用编码本发明多肽的核酸序列转化选定动物的选定细胞以表达和制备多肽,其中所述多肽具有蛋白酶活性。可从动物,例如从雌性动物的乳汁中回收多肽,或者为了动物自身的利益而表达多肽,例如有助于动物的消化。在下文标题为“动物饲料”的章节中提到了动物的例子。
为了以从动物乳汁中回收蛋白酶为目的而产生转基因动物,可使用转基因表达载体将编码蛋白酶的基因插入所述动物的受精卵中,其中所述载体含有适当的乳汁蛋白启动子和编码蛋白酶的基因。将转基因表达载体微量注射至受精卵,优选使其永久地整合至染色体。一旦受精卵开始生长和分裂,即将有潜力的胚植入代孕母体,并鉴定携有转基因的动物。然后通过常规饲养繁殖所得动物。可从动物的乳汁中纯化多肽,参见例如Meade,H.M.et al(1999):Expression of recombinant proteins in the milk of transgenicanimals,Gene expression systems:Using nature for the art of expression.J.M.Fernandez and J.P.Hoeffler(eds.),Academic Press。
在另一个可替代的技术方案中,为了产生在其体细胞和/或生殖细胞的基因组中携有核酸序列的转基因非人动物,可使转基因与WO 2000064247中公开的首选用于在唾液腺中特异性表达蛋白酶的调节序列可操作相连,其中所述核酸序列包括异源转基因构建体,所述构建体包括编码蛋白酶的转基因。
本发明还涉及含有本发明的多核苷酸或表达载体或多核苷酸构建体的转基因非人动物或其产物或组件。
制备方法
本发明还涉及制备本发明多肽的方法,其包括(a)在有助于在上清液中产生多肽的条件下培养宿主细胞或转基因植物或动物;和任选(b)回收多肽。
在本发明的制备方法中,使用本领域已知的方法在适于制备多肽的营养培养基中培养细胞。例如,可通过在允许多肽被表达和/或分离的条件下于适当培养基中进行的摇瓶培养,实验室或工业发酵罐中的小规模或大规模发酵(包括连续,分批,补料分批或固体状态的发酵)来培养细胞。使用本领域已知的方法,在含有碳和氮源以及无机盐的适当营养培养基中进行培养。适当的培养基可以商购或可根据已公开的组成(例如美国典型培养物保藏中心的目录)来制备。如果多肽分泌至营养培养基中,可直接从培养基中回收多肽。如果多肽是不分泌的,可从细胞裂解物中回收多肽。
可使用本领域已知的特异于多肽的方法检测多肽。这些检测方法包括使用特异性抗体,形成产物或使底物消失。例如,可使用蛋白酶试验测定本文所述多肽的活性。
可通过本领域已知的方法回收所得多肽。例如,可通过包括但不限于离心,过滤,提取,喷雾干燥,蒸发或沉淀的常规方法,从营养培养基中回收多肽。
可通过本领域已知的多种方法纯化本发明的多肽,所述方法包括但不限于层析(如离子交换,亲和,疏水,层析聚焦和大小排阻层析),电泳法(如制备性等电聚焦电泳),差异溶解性(如硫酸铵沉淀),SDS-PAGE或提取(参见例如Protein Purification,J.-C.Janson and Lars Ryden,editors,VCHPublishers,New York,1989)。
组合物
另一方面,本发明涉及含有本发明多肽的组合物。可根据本领域已知的方法制备多肽组合物,组合物可以是液体形式或是干燥组合物。例如,多肽组合物可以是颗粒或微粒形式。可根据本领域已知的方法使组合物中包括的多肽稳定化。下文给出了本发明多肽或多肽组合物的优选用途的例子。
动物饲料
本发明还涉及在动物饲料中使用本发明多肽的方法,以及含有本发明多肽的饲料组合物和饲料添加剂。术语动物包括所有动物,包括人。动物的例子有非-反刍动物和反刍动物,如牛,羊和马。在具体实施方案中,动物是非-反刍动物。非-反刍动物包括单胃动物,如猪(包括但不限于小猪,生长中的猪和大母猪);家禽,如火鸡,鸭和鸡(包括但不限于适于烤焙的小鸡,蛋鸡);小牛;和鱼(包括但不限于鲑鱼,鳟鱼,罗非鱼,鲶鱼和鲤鱼);和甲壳类动物(包括但不限于河虾和对虾)。
术语饲料或饲料组合物指的是适于或欲让动物摄取的任何化合物,制品,混合物或组合物。
在根据本发明的用途中,可在饮食之前,之后或同时给动物饲喂蛋白酶。优选后者。
在具体实施方案中,适当限定了往饲料中添加的蛋白酶或包括在饲料添加剂中的蛋白酶。适当限定指的是经大小排阻层析(参见WO 01/58275的实施例12)测定,蛋白酶制品至少为50%纯。在其它具体实施方案中,经此方法测定,蛋白酶制品至少为60,70,80,85,88,90,92,94或至少为95%纯。适当限定的蛋白酶制品是有利的。例如,对于实质上不受其它蛋白酶干扰或污染的蛋白酶而言,更容易确定它在饲料中的正确剂量。术语确定正确剂量具体指的是以获得一致和不变的结果为目的,基于所需效果最优化剂量的能力。
然而,为了在动物饲料中使用,蛋白酶不必那么纯;可以例如包括其它酶,此时可将其称为蛋白酶制品。蛋白酶制品可以(a)直接添加至饲料中(或直接用于植物蛋白质的处理过程),或(b)可用于制备一种或多种随后被添加至饲料中(或用于处理过程)的中间组合物,如饲料添加剂或预混物。不论是否根据上述(a)或(b)来使用,上文所述的纯度指的都是原始蛋白酶制品的纯度。
具体地说,使用重组制备方法即可获得纯度为上述数量级的蛋白酶制品,然而,当通过传统的发酵方法制备蛋白酶时,要想获得所述蛋白酶制品却并非易事,而且,批次与批次之间会有较高的差异。所述蛋白酶制品当然可以与其它蛋白酶混合。
在具体实施方案中,用于本发明的蛋白酶能溶解植物蛋白质。实施例11公开了测定溶解蛋白质的适当测定法。
本文所用术语植物蛋白质指的是包括至少一种衍生自或源自植物的蛋白质,包括修饰的蛋白质和蛋白质-衍生物的任何化合物,组合物,制品或混合物。在具体实施方案中,植物蛋白质的蛋白质含量至少为10,20,30,40,50或60%(w/w)。植物蛋白质可以衍生自植物蛋白质来源,如豆类和谷类,例如得自Fabaceae(豆科),十字花科,藜科和早熟禾科植物的材料,如大豆粉,羽扇豆粉和油菜籽粉。在具体实施方案中,植物蛋白质来源是得自Fabaceae科的一种或多种植物,如大豆,羽扇豆,豌豆或蚕豆的材料。
在另一个具体实施方案中,植物蛋白质来源是得自藜科的一种或多种植物,如甜菜,糖甜菜,菠菜或奎奴亚藜的材料。植物蛋白质来源的其它例子是油菜和甘蓝。大豆是优选的植物蛋白质来源。植物蛋白质来源的其它例子是谷类,如大麦,小麦,黑麦,燕麦,玉米,水稻和高粱。
根据本发明用至少一种本发明的蛋白酶处理植物蛋白质导致植物蛋白质的溶解增加。以下是在单胃体外模型中使用本发明的蛋白酶可获得的溶解蛋白质百分比的例子:相对于空白对照而言至少为102%,103%,104%,105%,106%或至少为107%。使用实施例11的单胃体外模型测定溶解蛋白质的百分比。术语蛋白质的溶解基本上指的是使蛋白质进入溶液中。所述溶解可能是由于在蛋白酶的介导下,蛋白质与通常复合而成的天然组合物,如饲料的其它组分分离而被释放出来所致。
在另一个具体实施方案中,用于本发明的蛋白酶能增加可消化植物蛋白质的量。以下是在单胃体外模型中使用本发明的蛋白酶可获得的已消化或可消化蛋白质百分比的例子:相对于空白对照而言至少为104%,105%,106%,107%,108%,109%或至少为110%。使用实施例11的体外模型测定已消化或可消化蛋白质的百分比。
以下是在水产动物体外模型中使用本发明的蛋白酶可获得的已消化或可消化蛋白质百分比的例子:相对于空白对照而言至少为103%,104%,105%,106%,107%,108%,109%或至少为110%。使用实施例12的水产动物体外模型测定已消化或可消化蛋白质的百分比。
在另一个具体实施方案中,用于本发明的蛋白酶能增加植物蛋白质的水解程度(DH)。以下是在单胃体外模型中可获得的水解程度增加的例子:相对于空白对照而言至少为102%,103%,104%,105%,106%或至少为107%。使用实施例11的单胃体外模型测定DH。以下是在水产动物体外模型中可获得的水解程度增加的例子:相对于空白对照而言至少为102%,103%,104%,105%,106%或至少为107%。使用实施例12的水产动物体外模型测定DH。
在本发明(预-)处理过程的具体实施方案中,所述蛋白酶影响植物蛋白质或蛋白质来源(或对其发挥作用或施加溶解影响)。为了达到此目的,一般将植物蛋白质或蛋白质来源悬浮于溶剂,例如含水溶剂,如水中,并适当关注所用酶的特征,以此调节pH和温度值。例如,可在能使实际蛋白酶的活性至少为40%,50%,60%,70%,80%或至少为90%的pH值下进行处理。类似地,例如,可在能使实际蛋白酶的活性至少为40%,50%,60%,70%,80%或至少为90%的温度下进行处理。上述活性百分比指示是相对于最大活性而言的。持续进行酶解反应直至获得所需结果,然后可以通过例如热-处理步骤灭活酶来终止反应,或者也可以不终止反应。
在本发明处理过程的另一个具体实施方案中,蛋白酶作用被维持,这意味着例如将蛋白酶加入植物蛋白质或蛋白质来源,但其溶解影响可以说尚未开启,直到后来当有此需求时,一旦建立了适当的溶解条件,或一旦灭活了任何酶抑制剂,或不论使用何种其它方式延迟了酶的作用,才会开启其溶解影响。
在一个实施方案中,处理是预-处理动物饲料或用于动物饲料的植物蛋白质。
术语改善动物饲料的营养价值指的是改善蛋白质的可利用性和/或可消化程度,从而导致从饮食组分中提取的蛋白质增加,较高的蛋白质产量,增加的蛋白质降解和/或改善的蛋白质利用。因此,饲料的营养价值得以增加,动物的表现,如生长速度和/或体重增加量和/或动物的饲料转化率(即相对于体重增加量的饲料摄取量)也得以改善。
在具体实施方案中,饲料转化率增加至少1%,2%,3%,4%,5%,6%,7%,8%,9%或至少10%。在另一个具体实施方案中,体重增加量增加至少2%,3%,4%,5%,6%,7%,8%,9%,10%或至少11%。这些数据是相对于未添加蛋白酶的对照实验而言的。
可按EEC(1986):Directive de la Commission du 9 avril 1986 fixant laméthode de calcul de la valeur énérgetique des aliments composés destinés àlavolaille.Journal Officiel des Communautés Européennes,L130,53-54所述计算饲料转化率(FCR)和体重增加量。
可将任何形式的蛋白酶添加至饲料中,所述形式有:作为相对纯的蛋白酶,或与欲添加至动物饲料的其它组分的混合物,即动物饲料添加剂,如所谓的动物饲料预混物。
另一方面,本发明涉及用于动物饲料的组合物,如动物饲料和动物饲料添加剂,如预混物。
除了本发明的蛋白酶外,本发明的动物饲料添加剂含有至少一种脂溶性维生素和/或至少一种水溶性维生素和/或至少一种痕量矿物质。饲料添加剂也可含有至少一种巨量矿物质。
另外,任选的饲料-添加剂成份是着色剂,香味化合物,稳定剂,抗菌肽,包括抗真菌多肽,和/或至少一种选自下列的其它酶:植酸酶(EC 3.1.3.8或3.1.3.26);木聚糖酶(EC 3.2.1.8);半乳聚糖酶(EC 3.2.1.89);α-半乳糖苷酶(EC 3.2.1.22);蛋白酶(EC 3.4.-.-);磷脂酶A1(EC 3.1.1.32);磷脂酶A2(EC3.1.1.4);溶血磷脂酶(EC 3.1.1.5);磷脂酶C(3.1.4.3);磷脂酶D(EC 3.1.4.4)和/或β-葡聚糖酶(EC 3.2.1.4或EC 3.2.1.6)。
在具体实施方案中,这些其它酶是被适当限定的(上文提及蛋白酶制品时已定义过)。
抗菌肽(AMP)的例子有:CAP18,Leucocin A,Tritrpticin,Protegrin-1,Thanatin,防卫素,Lactoferrin,Lactoferricin和Ovispirin,如Novispirin(RobertLehrer,2000),Plectasins和Statins,包括PCT/DK02/00781和PCT/DK02/00812中公开的化合物和多肽以及保留了抗菌活性的上述物质的变体或片段。
抗真菌多肽(AFP)的例子有WO 94/01459和WO 02/090384中公开的巨大曲霉和黑曲霉肽,及其保留了抗真菌活性的变体或片段。
通常,脂溶性和水溶性维生素以及痕量矿物质形成欲添加至饲料的所谓预混物的一部分,而通常在饲料中单独添加巨量矿物质。本发明的动物饲料添加剂的一个例子是富含本发明蛋白酶的预混物。
在具体实施方案中,动物饮食或饲料中欲以0.01至10.0%;更具体地为0.05至5.0%或0.2至1.0%的水平包括(或按规定不得不包括)本发明的动物饲料添加剂(%指的是每100g饲料中添加剂的g数)。具体地说,对预混物也是如此。
下文列出了这些组分的非-排他性例子:
脂溶性维生素的例子有:维生素A,维生素D3,维生素E和维生素K,如维生素K3。
水溶性维生素的例子有维生素B12,生物素和胆碱,维生素B1,维生素B2,维生素B6,烟酸,叶酸和泛酸,如Ca-D-泛酸。
痕量矿物质的例子有锰,锌,铁,铜,碘,硒和钴。
宏量矿物质的例子有钙,磷和钠。
这些成分的营养需求(以家禽和小猪/猪举例)列于WO 01/58275中的表A。营养需求指的是应在饮食中以所示浓度提供这些组分。
在可替代的实施方案中,本发明的动物饲料添加剂含有WO 01/58275中的表A所详细说明的单个组分中的至少一种。至少一种指的是一种或两种或三种或四种等直至所有十三种单个组分中的一种或多种,或直至所有15种单个组分。更具体地,本发明的添加剂包括至少一种单个组分,其含量能使其在饲料中的浓度落入表A第4或第5或第6栏所示的范围。
本发明还涉及动物饲料组合物。动物饲料组合物或饮食具有相对较高的蛋白质含量。家禽和猪饮食的特征如WO 01/58275,表B第2-3栏所示。鱼食的特征如表B第4栏所示。另外,所述鱼食通常具有的粗脂肪含量为200-310g/kg。WO 01/58275相当于US 09/779334,被列入本文作为参考。
本发明的动物饲料组合物具有的粗蛋白含量为50-800g/kg,此外还含有至少一种本文所要求的蛋白酶。
另外,或在可替代(上述粗蛋白含量)的实施方案中,本发明的动物饲料组合物具有的可代谢能量的含量为10-30MJ/kg;和/或钙含量为0.1-200g/kg;和/或可利用的磷含量为0.1-200g/kg;和/或甲硫氨酸含量为0.1-100g/kg;和/或甲硫氨酸加半胱氨酸的含量为0.1-150g/kg;和/或赖氨酸的含量为0.5-50g/kg。
在具体实施方案中,可代谢能量,粗蛋白,钙,磷,甲硫氨酸,甲硫氨酸加半胱氨酸和/或赖氨酸的含量落入WO 01/58275,表B,范围2,3,4或5中的任何一个中(R.2-5)。
粗蛋白被计算为氮(N)乘以因数6.25,即粗蛋白(g/kg)=N(g/kg)×6.25。通过Kjeldahl法(A.O.A.C.,1984,Official Methods of Analysis 14th ed.,Association of Official Analytical Chemists,Washington DC)测定氮含量。
可根据NRC出版物Nutrient requirements in swine,ninth revised edition1988,subcommittee on swine nutrition,committee on animal nutrition,board ofagriculture,national research council.National Academy Press,Washington,D.C.,pp.2-6以及European Table of Energy Values for Poultry Feed-stuffs,Spelderholt centre for poultry research and extension,7361 DA Beekbergen,TheNetherlands.Grafisch bedrijf Ponsen & looijen bv,Wageningen.ISBN90-71463-12-5计算可代谢的能量。
可根据饲料表,如Veevoedertabel 1997,gegevens over chemischesamenstelling,verteerbaarheid en voederwaarde van voedermiddelen,CentralVeevoederbureau,Runderweg 6,8219 pk Lelystad.ISBN 90-72839-13-7计算完全动物饮食中钙,可利用的磷和氨基酸的饮食含量。
在具体实施方案中,本发明的动物饲料组合物含有至少一种如上文所限定的植物蛋白质或蛋白质来源。
在另一个具体实施方案中,本发明的动物饲料组合物含有0-80%玉米;和/或0-80%高粱;和/或0-70%小麦;和/或0-70%大麦;和/或0-30%燕麦;和/或0-40%大豆粉;和/或0-10%鱼粉;和/或0-20%乳清。
可将动物饮食制备成例如糊状饲料(非小球形)或小球形饲料。一般将碾碎的饲料原料混合,再根据所针对动物物种的规格加入足够量的必需维生素和矿物质。以固体或液体酶制剂的形式加入酶。例如,一般在混合步骤之前或在混合的同时加入固体酶制剂;一般在造粒步骤之后加入液体酶制品。也可以将酶掺入饲料添加剂或预混物。
饮食中最终的酶浓度范围为0.01-200mg酶蛋白质/kg饮食,例如0.5-25mg酶蛋白质/kg动物饮食。
当然,应该以有效量,即足以改善饲料的溶解和/或营养价值的量使用蛋白酶。目前期望以下述量(剂量范围)中的一种或多种施用酶:0.01-200;0.01-100;0.5-100;1-50;5-100;10-100;0.05-50或0.10-10-所有范围都是每kg饲料中蛋白酶蛋白质的mg数(ppm)。
为了测定每kg饲料中酶蛋白质的mg数,从饲料组合物中纯化蛋白酶,使用相关试验(参见蛋白酶活性,底物和试验)测定纯化蛋白酶的比活性。使用相同试验测定所述饲料组合物的蛋白酶活性,在这两次测定的基础上计算出以每kg饲料中酶蛋白质的mg数计的剂量。
使用相同的原理测定饲料添加剂中的酶蛋白质mg数。当然,如果可获得制备饲料添加剂或饲料所用蛋白酶的样品,可由该样品测定比活性(无需从饲料组合物或添加剂中纯化蛋白酶)。
下文的实施例进一步描述了本发明,不应将其理解为对本发明范围的限制。
清洁剂组合物
可在清洁剂组合物中添加本发明的蛋白酶,因此所述蛋白酶成为清洁剂组合物的组分。例如,可将本发明的清洁剂组合物配制成手洗或机洗清洁剂组合物,包括适于预处理带有污渍的织物的洗衣用添加剂组合物和漂洗中添加的织物柔顺剂组合物,或配制成用于一般性的家中难清洁表面的清洗操作的清洁剂组合物,或配制成手或机器洗碗盘操作所用的清洁剂组合物。
在具体的方面,本发明提供了含有本发明的蛋白酶的清洁剂添加剂。清洁剂添加剂以及清洁剂组合物含有一种或多种其它酶,如另一种蛋白酶,如得自芽孢杆菌的碱性蛋白酶,脂肪酶,角质酶,淀粉酶,糖酶,纤维素酶,果胶酶,甘露聚糖酶,阿拉伯聚糖酶,半乳聚糖酶,木聚糖酶,氧化酶,例如漆酶和/或过氧化物酶。
一般说来,选定酶的特性应与选定清洁剂相容(即最适pH,与其它酶和非酶成分的相容性等),酶应以有效量存在。
适当的脂肪酶包括来源于细菌或真菌的脂肪酶。包括经化学修饰或蛋白质工程改造的突变体。有用脂肪酶的例子包括腐质霉属(Thermomyces的同义词)的脂肪酶,例如EP 258068和EP 305216所述的得自H.lanuginosa(T.lanuginosus)的脂肪酶,或WO 96/13580所述的得自H.insolens的脂肪酶,假单胞菌属的脂肪酶,如得自产碱假单胞菌或类产碱假单胞菌(EP 218272),葱头假单胞菌(EP 331376),司徒茨氏假单胞菌(GB 1,372,034),荧光假单胞菌,假单胞菌菌株SD 705(WO 95/06720和WO 96/27002),P.wisconsinensis(WO 96/12012)的脂肪酶,芽孢杆菌属的脂肪酶,例如得自枯草芽孢杆菌(Dartois et al.(1993),Biochemica et Biophysica Acta,1131,253-360),嗜热脂肪芽孢杆菌(JP 64/744992)或短小芽孢杆菌(WO 91/16422)的脂肪酶。其它例子是如WO 92/05249,WO 94/01541,EP 407225,EP 260105,WO 95/35381,WO 96/00292,WO 95/30744,WO 94/25578,WO 95/14783,WO 95/22615,WO 97/04079和WO 97/07202中所述的脂肪酶变体。优选的商购脂肪酶包括LipolaseTM和Lipolase UltraTM(Novozymes A/S)。
适当的淀粉酶(α-和/或β-淀粉酶)包括来源于细菌或真菌的淀粉酶。包括经化学修饰或蛋白质工程改造的突变体。淀粉酶包括例如得自芽孢杆菌属的α-淀粉酶,如GB 1,296,839中详细描述的地衣芽孢杆菌特定菌株的α-淀粉酶。有用淀粉酶的例子是WO 94/02597,WO 94/18314,WO 96/23873和WO 97/43424中所述的变体,特别是在下述的一个或多个位置中具有取代的变体:15,23,105,106,124,128,133,154,156,181,188,190,197,202,208,209,243,264,304,305,391,408和444。可商购的淀粉酶是DuramylTM,TermamylTM,FungamylTM和BANTM(Novozymes A/S),RapidaseTM和PurastarTM(购自Genencor International Inc.)。
适当的纤维素酶包括来源于细菌或真菌的纤维素酶。包括经化学修饰或蛋白质工程改造的突变体。适当的纤维素酶包括得自芽孢杆菌属,假单胞菌属,腐质霉属,镰孢属,草根霉属,支顶孢属的纤维素酶,例如US4,435,307,US 5,648,263,US 5,691,178,US 5,776,757和WO 89/09259中公开的由Humicola insolens,Myceliophthora thermophila和尖孢镰孢产生的真菌纤维素酶。特别合适的纤维素酶是碱性或中性纤维素酶,它们的好处在于能保护颜色。所述纤维素酶的例子是EP 0 495257,EP 531372,WO96/11262,WO 96/29397,WO 98/08940中描述的纤维素酶。其它例子是如WO 94/07998,EP 0 531 315,US 5,457,046,US 5,686,593,US 5,763,254,WO 95/24471,WO 98/12307和WO 99/01544所述的纤维素酶变体。可商购的纤维素酶包括CelluzymeTM和CarezymeTM(Novozymes A/S),ClazinaseTM和Puradax HATM(Genencor International Inc.)以及KAC-500(B)TM(KaoCorporation)。
适当过氧化物酶/氧化酶来源包括植物,细菌或真菌。包括经化学修饰或蛋白质工程改造的突变体。有用过氧化酶的例子包括得自Coprinus的过氧化物酶,例如WO 93/24618,WO 95/10602和WO 98/15257中所述的得自C.cinereus的过氧化物酶及其变体。可商购的过氧化物酶包括GuardzymeTM(Novozymes)。
通过分开加入各含一种或多种酶的添加剂,或通过加入含有所有这些酶的混合添加剂,使清洁剂组合物中包括清洁剂酶。可将本发明的清洁剂添加剂,即各自分开的添加剂或混合添加剂配制成例如颗粒,液体,浆液等。优选的清洁剂添加剂剂型是颗粒(特别是不带粉尘的颗粒),液体(特别是稳定的液体)或浆液。
不带粉尘的颗粒可按照例如US 4,106,991和4,661,452所公开的方法制备,并任选通过本领域已知的方法对其进行包被。光滑的包被材料的例子有平均分子量为1000至20000的聚(环氧乙烷)产品(聚乙二醇,PEG);具有16至50个环氧乙烷单位的乙氧基化壬基酚;具有15至80个环氧乙烷单位的乙氧基化脂肪族醇,其中醇含有12至20个碳原子;脂肪族醇;脂肪酸以及脂肪酸的单酸甘油酯,甘油二酯和甘油三酯。GB 1483591给出了适用于流体床技术的可形成薄膜的包被材料的例子。例如,可根据已建立的方法,通过加入如丙二醇的多羟基化合物,糖或糖醇,乳酸或硼酸来稳定液体酶制品。可根据EP 238216中公开的方法制备受保护的酶。
本发明的清洁剂组合物可以是任何便利的形式,如条状,片状,粉末,颗粒,糊状或液体。液体清洁剂可以是含水的,一般含有高达70%的水和0-30%有机溶剂,或者也可以是不含水的。
清洁剂组合物含有一种或多种表面活性剂,所述表面活性剂可以是包括半-极性表面活性剂的非离子型表面活性剂和/或阴离子型和/或阳离子型和/或两性离子型表面活性剂。表面活性剂一般以占重量0.1%至60%的水平存在。
当包括于其中时,清洁剂通常含有约1%至约40%的阴离子型表面活性剂,如直链烷基苯磺酸盐,α-烯属磺酸酯,烷基硫酸酯(脂肪族醇的硫酸酯),脂肪醇乙氧基硫酸盐,仲链烷磺酸盐,α-磺基脂肪酸甲基酯,烷基或烯基琥珀酸或肥皂。
当包括于其中时,清洁剂通常含有约0.2%至约40%的非离子型表面活性剂,如醇乙氧基化物,壬基酚乙氧基化物,烷基聚苷,烷基二甲基氧化胺,乙氧基化脂肪酸单乙醇氨化物,脂肪酸单乙醇氨化物,多羟基烷基脂肪酸氨化物或葡萄糖胺的N-酰基N-烷基衍生物(“glucamides”)。
清洁剂可含有0-65%的清洁剂增洁剂或配位剂,如沸石,二磷酸盐,三磷酸盐,膦酸盐,碳酸盐,柠檬酸盐,次氮基三乙酸,乙二胺四乙酸,二乙三胺五乙酸,烷基或烯基琥珀酸,可溶的硅酸盐或分层的硅酸盐(如得自Hoechst的SKS-6)。
清洁剂可含有一种或多种聚合物,例如羧甲基纤维素,聚(乙烯吡咯烷酮),聚(乙二醇),聚(乙烯醇),聚(乙烯嘧啶-N-氧化物),聚(乙烯咪唑),聚羧酸酯,如聚丙烯酸酯,马来酸/丙烯酸共聚物和月桂基异丁烯酸/丙烯酸共聚物。
清洁剂可含有漂白体系,该体系可含有H2O2来源,如过硼酸盐或过碳酸盐,所述来源可与形成过酸的漂白催化剂,如四乙酰乙二胺或壬酰羟苯磺酸盐混合。或者,漂白体系可含有例如酰胺,酰亚胺或砜类的过氧酸。
可使用常规的稳定剂稳定化本发明清洁剂组合物中的酶,所述稳定剂是例如如丙二醇或甘油的多羟基化合物,糖或糖醇,乳酸,硼酸或如芳香硼酸酯的硼酸衍生物,或如4-甲酰基苯基硼酸的苯基硼酸衍生物,可按照例如WO 92/19709和WO 92/19708中所述的方法配制组合物。
清洁剂也可含有其它常规的清洁剂组分,例如包括粘土的织物调节剂,泡沫增强剂,泡沫抑制剂,抗侵蚀剂,污物悬浮剂,抗污物再沉淀剂,染料,杀菌剂,光亮剂,助水溶物,光泽度保持剂或香味剂。
目前期望在清洁剂组合物中加入任何酶,特别是本发明的酶,加入量相当于每升洗涤液加0.01-100mg酶蛋白质,优选每升洗涤液加0.05-5mg酶蛋白质,特别优选每升洗涤液加0.1-1mg酶蛋白质。
另外,可在WO 97/07202公开的清洁剂制剂中掺入本发明的酶。
本文描述和要求权利的发明的保护范围不受本文公开的具体实施方案限制,因为提供这些实施方案只是为了阐明本发明的几个方面。任何等效的实施方案都落入本发明的范围。实际上,除了本文所示和描述的内容以外,对本发明的多种修饰对阅读了上文的本领域熟练技术人员而言都是显而易见的。所述修饰也落入所附权利要求书的保护范围之内。当出现冲突时,本发明中包括定义的公开内容将会控制局面。
本文提及的多篇参考文献的全部内容皆列入本文作为参考。
实施例
材料和方法
菌株:
枯草芽孢杆菌PL1801(Diderichsen,B et al.1990.编码α-乙酰乳酸脱羧酶的aldB克隆,所述酶是短芽孢杆菌(Bacillus brevis)的胞外酶(exoenzyme),J.Bacteriol.,172,4315-4321)
枯草芽孢杆菌MB1053
枯草芽孢杆菌PL3598-37
枯草芽孢杆菌MB1510
枯草芽孢杆菌PL2306。该菌株是apr和npr基因被破坏的枯草芽孢杆菌DN1885(Diderichsen,B.,Wedsted,U.,Hedegaard,L.,Jensen,B.R.,Sjholm,C.(1990)编码α-乙酰乳酸脱羧酶的aldB克隆,所述酶是短芽孢杆菌的胞外酶,J.Bacteriol.,172,4315-4321),其已知的枯草芽孢杆菌纤维素酶基因的转录单位也被破坏,使其成为纤维素酶阴性细胞。所述破坏实质上按照(Eds.A.L.Sonenshein,J.A.Hoch and Richard Losick(1993)Bacillus subtilis andother Gram-Positive Bacteria,American Society for microbiology,p.618)所述的方法进行。
分离基因组DNA的方法
收集1.5ml培养物并将其重悬浮于100μl TEL。在37℃放置30分钟。
加入500μl硫氰酸盐缓冲液,在室温下放置10分钟。
加入250μl NH4Ac并在冰上放置10分钟。
加入500μl CIA并混合。
转移至微量离心管中,全速离心10分钟。
将上清液转移至新的Eppendorf管并加入0.54倍体积冰冷的异丙醇。充分混合。
离心并用70%EtOH洗涤DNA沉淀。
将基因组DNA重悬浮于100μl TER。
TE: 10mM Tris-HCl,pH 7.4
1mM EDTA,pH 8.0
TEL: 含50mg/ml溶菌酶的TE-缓冲液
硫氰酸盐: 5M硫氰酸胍
100mM EDTA
0.6%w/v N-月桂基肌氨酸,钠盐
60g硫氰酸盐,20ml 0.5M EDTA,pH 8.0,20ml H2O,
于65℃溶解。冷却至室温并加入0.6g N-月桂基肌氨酸。
加入H2O至100ml并通过0.2μ经消毒的滤器过滤。
NH4Ac: 7.5M CH3COONH4
TER: 含1μg/ml Rnase A的TE-缓冲液
CIA: 氯仿/异戊醇24∶1
纯化PCR带和DNA测序
根据厂商说明,使用GFXTM PCR DNA和Gel BandTM纯化试剂盒(Pharmacia Biotech)纯化PCR片段。使用50-100ng模板,Taq脱氧-末端循环测序试剂盒(Perkin Elmer,USA),经荧光标记的终止子和5pmol选定的测序引物,在ABI PRISMTM 3700 DNA分析仪(Perkin Elmer,USA)上测定扩增PCR片段的核苷酸序列。
培养基
TY:(描述于Ausubel,F.M.et al.(eds.)“Current protocols in MolecularBiology”.John Wiley and Sons,1995)。
LB琼脂:(描述于Ausubel,F.M.et al.(eds.)“Current protocols inMolecular Biology”.John Wiley and Sons,1995)。
LB-PG琼脂:添加有0.5%葡萄糖和0.05M磷酸钾,pH 7.0的LB琼脂。
蛋白酶活性
除非另有说明,使用以琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对硝基苯胺(paranitroanilide)为底物的PNA试验测定S2A蛋白酶活性。PNA试验的原理描述于Rothgeb,T.M.,Goodlander,B.D.,Garrison,P.H.,and Smith,L.A.,Joumal of the American Oil Chemists′Society,Vol.65(5)pp.806-810(1988)。
枯草芽孢杆菌宿主中的基因表达
通过同源重组将下述实施例中所有的表达基因整合至枯草芽孢杆菌宿主细胞基因组。在三联启动子系统(如WO 99/43835中所述)的控制下表达基因,所述启动子系统由地衣芽孢杆菌α-淀粉酶基因启动子(amyL),解淀粉芽孢杆菌α-淀粉酶基因启动子(amyQ)和包括稳定化序列的苏云金芽孢杆菌cryIIIA启动子组成。将编码氯霉素乙酰转移酶的基因用作标记。(描述于例如Diderichsen,B.;Poulsen,G.B.;Joergensen,S.T.;A useful cloning vector forBacillus subtilis.Plasmid 30:312(1993))。
实施例1.构建具有Savinase信号的合成的10R尾-变体基因
构建合成的10R基因(10RS),其编码拟诺卡氏菌NRRL 18262被称为10R的S2A蛋白酶(WO 01/58276),所述基因具有SEQ ID NO:1所示的核苷酸序列。通过PCR使该合成基因与编码SAVINASETM(Novozymes)的信号肽的DNA在框内融合,产生SEQ ID NO:2所示的编码序列Sav-10RS。制备该构建体的几个尾-变体。与SEQ ID NO:2编码的Sav-10RS蛋白酶相比,尾变体构建体Sav-10RS HV0被构建成在C-末端具有8个额外的氨基酸:QSHVQSAP(SEQ ID NO:3),它由插入SEQ ID NO:2的TAA终止密码子之前的下述DNA序列延伸编码:
(SEQ ID NO:4):caatcgcatgttcaatccgctcca
尾变体Sav-10RS HV1被构建成在C-末端具有4个额外的氨基酸:QSAP(SEQ ID NO:5),在TAA终止密码子之前插入了下述DNA序列延伸:
(SEQ ID NO:6):caatcggctcct
尾变体Sav-10RS HV3被构建成在C-末端具有2个额外的氨基酸:QP(SEQ ID NO:7),在TAA终止密码子之前插入了下述DNA序列延伸:
(SEQ ID NO:8):caacca
尾变体Sav-10RS HV2被构建成在C-末端具有1个额外的氨基酸:P(SEQ ID NO:9),在TAA终止密码子之前插入了下述DNA序列延伸:
(SEQ ID NO:10):cca
通过同源重组将10RS基因和4个编码尾-变体的基因整合至枯草芽孢杆菌MB1053宿主细胞基因组。在1%脱脂乳LB-PG琼脂平板(添加有6μg/ml氯霉素)上检查氯霉素抗性转化子的蛋白酶活性。通过对插入物进行DNA测序,进一步分析一些蛋白酶阳性菌落以确保正确的基因DNA序列,选出5个各含有上述构建体之一的菌株,分别将它们称为:枯草芽孢杆菌Sav-10RS,枯草芽孢杆菌Sav-10RS HV0,枯草芽孢杆菌Sav-10RS HV1,枯草芽孢杆菌Sav-10RS HV2和枯草芽孢杆菌Sav-10RS HV3。
实施例2.具有Savinase信号的10R尾-变体的发酵产量
在回转式摇床上的500ml带挡板Erlenmeyer烧瓶中进行发酵以产生本发明的尾-变体酶,所述烧瓶各含有100ml添加有6mg/l氯霉素的TY。
对得自实施例1的5个枯草芽孢杆菌菌株中的每一个,平行地在6个Erlenmeyer烧瓶中进行发酵。6个Erlenmeyer烧瓶中的2个在37℃(250rpm)保温,2个在30℃(250rpm)保温,最后2个在26℃(250rpm)保温。在第1,2和3天对每个摇瓶取样,分析其蛋白酶活性。结果示于表1-3。从表1-3可以看出,通过培养物肉汤中的活性测定,尾的作用是令人惊奇地大大改善了蛋白酶的表达水平。26℃和30℃时作用最显著,但37℃时作用也很明显,在发酵早期观察到的作用尤其如此。
表1:37℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 | |
Sav-10RS | 1,0 | 1,0 | 1,0 |
Sav-10RS HV0 | 3,3 | 0,7 | 0,8 |
Sav-10RS HV1 | 4,7 | 1,3 | 1,2 |
Sav-10RS HV2 | 2,2 | 0,6 | 0,4 |
Sav-10RS HV3 | 5,3 | 1,4 | 1,7 |
表2:30℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 |
Sav-10RS | 1,0 | 1,0 | 1,0 |
Sav-10RS HV0 | 1,7 | 2,2 | 2,9 |
Sav-10RS HV1 | 4,6 | 3,1 | 4,9 |
Sav-10RS HV2 | 2,4 | 1,9 | 2,3 |
Sav-10RS HV3 | 4,8 | 3,0 | 4,4 |
表3:26℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 | |
Sav-10RS | 1,0 | 1,0 | 1.0 |
Sav-10RS HV0 | 1,8 | 2,5 | 3,1 |
Sav-10RS HV1 | 2,5 | 3,6 | 4,3 |
Sav-10RS HV2 | 1,8 | 2,6 | 2,8 |
Sav-10RS HV3 | 2,6 | 3,5 | 4,6 |
实施例3.尾-变体基因的染色体整合
使用下述构建体将编码尾-变体的基因整合至染色体。将众所周知的枯草杆菌蛋白酶BPN′蛋白酶的编码序列与三联启动子可操作相连,使标记基因与之融合(被解离酶res-位点包围的壮观霉素抗性基因),使编码枯草芽孢杆菌果胶酸盐裂合酶的基因作为侧翼区段与构建体融合,所述区段分别含有编码尾-变体的多核苷酸上游的5’多核苷酸区域[yfmD-ytmC-yfmB-yfmA-Pel-start]和下游的3’多核苷酸区域[Pel-end-yflS-citS(start)]。通过将几个不同的PCR片段连接在一起制备出整合盒。最终的PCR反应之后,用PCR产物转化天然感受态枯草芽孢杆菌细胞。选择一个被称为PL3598-37的克隆,通过测序证实其含有正确的构建体。
因此PL3598-37克隆含有下述元件:
1.与枯草芽孢杆菌基因组区域100%同源的侧翼区(表现为上游片段yfmD-ytmC-yfmB-yfmA-Pelstart和下游片段Pel-end-yflS-citS(start))。
2.侧翼有解离酶位点(res)的壮观霉素抗性基因。
3.三联启动子区域加CryIIIA mRNA稳定化前导序列。
4.BPN’开放阅读框。
构建三联启动子BPN′盒
构建含有BPN’文库整合盒的PCR片段,由此使三联启动子(如WO99/43835所述;Novozymes)与芽孢杆菌属菌株的BPN’表达盒可操作相连。三联启动子是得自最优化的芽孢杆菌amyL的启动子(如WO 93/10249所示;Novozymes)与两个启动子scBAN和cryIIIA的融合物,其中第一个是解淀粉芽孢杆菌淀粉酶BAN启动子的共有版本,后者包括mRNA-稳定化序列(如WO 99/43835所述;Novozymes)。适当的引物可得自公众可获得的序列(Vasantha,N.et al.Genes for alkaline protease and neutral protease fromBacillus amyloliquefaciens contain a large open reading frame between theregions coding for signal sequence and mature protein.J.Bacteriol.159:811(1984)EMBL:accession No.K02496)。使用下述引物在每一末端导入侧翼于PCR片段的KpnI和SalI限制性位点:
#252639(SEQ ID NO:11):catgtgcatgtgggtaccgcaacgttcgcagatgctgctgaagag
#251992(SEQ ID NO:12):catgtgcatgtggtcgaccgattatggagcggattgaacatgcg
随后,使用PCR片段中的KpnI和SalI限制性位点将片段克隆至经KpnI-SalI消化的Pecl-Spec PCR片段。Pecl-Spec片段含有插入枯草芽孢杆菌果胶酸盐裂合酶基因中间的壮观霉素抗性基因,加上约2.3kb的上游基因组DNA和约1.7kb的下游基因组DNA。通过使用下述引物PCR扩增枯草芽孢杆菌菌株MB1053的基因组DNA以产生Pecl-Spec片段:
#179541(SEQ ID NO:13):gcgttgagacgcgcggccgcgagcgccgtttggctgaatgatac
#179542(SEQ ID NO:14):gcgttgagacagctcgagcagggaaaaatggaaccgctttttc
构建MB1053
通过将PCR产物整合至野生型枯草芽孢杆菌模式菌株的基因组以缺失果胶酸盐裂合酶(Pel)基因,从而构建出MB1053枯草芽孢杆菌菌株。通过PCR扩增直接位于枯草芽孢杆菌果胶酸盐裂合酶基因下游和上游的基因组DNA,即可达到此目的。
通过使用引物插入与编码标记基因的第三PCR片段的末端所限定的DNA序列100%同源的序列,即可延长直接位于Pel基因之前并起始Pel基因的基因组DNA的末端,其中所述标记基因被解离酶(Res)位点包围。在这一特定的情况下,标记基因(Spec)赋予对壮观霉素的抗性,该基因位于全部存在于质粒pSJ3358(描述于美国专利号5,882,888)上的两个Res位点之间。最初产生了3个不同的PCR片段。
片段1:该片段覆盖yfmD基因至Pel基因中间部位,并在Pel基因的Res-Spec-Res盒中导入突出端。片段1的大小是2.8kb。通过使用下述引物PCR扩增枯草芽孢杆菌菌株PL2306的染色体DNA即可产生片段1:
#179541(SEQ ID NO:13),和
在#179154 Spec引物上加上突出端的#179539(SEQ ID NO:15):
ccatttgatcagaattcactggccgtcgttttacaaccattgcggaaaatagtcataggcatcc
片段2:该片段覆盖Pel基因中间部位至CitS基因末端之后,并在位于Pel基因中间的Res-Spec-Res盒中导入突出端。片段2的大小是2.3kb。通过使用下述引物PCR扩增枯草芽孢杆菌菌株PL2306的染色体DNA即可产生片段2:
#179542(SEQ ID NO:14),和
在#179153 Spec引物上加上突出端的#179540(SEQ ID NO:16):
ggatccagatctggtacccgggtctagagtcgacgcggcggttcgcgtccggacagcaca
片段3:该片段含有被Res位点包围的壮观霉素基因,并在末端含有与PCR片段1和2重叠的DNA序列。片段3的大小是1.6kb。通过使用下述引物PCR扩增质粒pSJ3358即可产生片段3:
#179154(SEQ ID NO:17):gttgtaaaacgacggccagtgaattctgatcaaatgg
#179153(SEQ ID NO:18):ccgcgtcgacactagacacgggtacctgatctagatc
PCR反应的标准条件
为了PCR扩增片段1-3,使用HiFi ExpandTM PCR系统(Roche)以及下述循环方案:
5μl缓冲液2
14μldNTP(各1.25mM)
2.5ud20μM引物1
2.5μl20μM引物2
xμl水
在此混合物中加入3μl DNA(约100ng)和0.75μl酶混合物(使用热启动)。
总体积为50μl。
循环线路如下:
94℃ 120秒1个循环
暂停。
94℃ 15秒,60℃ 60秒,72℃ 240秒,10个循环。
94℃ 15秒,60℃ 60秒,20个循环(72℃ 180秒每个循环加20秒)。
68℃ 600秒1个循环。
制备这3个PCR片段,并在随后的JOINING-PCR反应中将它们连接在一起。这3个PCR片段是单个线条分明的带,不需要凝胶纯化。在下述JOINING-PCR之前仅需进行QiagenTM PCR纯化。
连接片段1+3(连接片段2+3的方法相同):
5μl缓冲液2
8μldNTP(各1.25mM)
5.0μl片段3
5.0μl片段1
9.25μl水
94℃ 120秒1个循环
暂停。加入酶
94℃ 15秒,60℃ 60秒,72℃ 240秒,10个循环。
暂停。加入引物
94℃ 15秒,60℃ 60秒,15个循环(72℃ 180秒每个循环加20秒)。
68℃ 600秒1个循环。
在94℃ 120秒的第一个循环之后有一个暂停,此时加入0.75μl酶混合物。
总体积目前是45.0μl。
在最初的10个循环之后,在循环中还有一个暂停,针对片段1+3;加入2.5μl(20μM#179541)和2.5μl(20μM#179153),针对片段2+3:加入2.5μl(20μM#179542)和2.5μl(20μM#179154),再继续进行15个循环。
然后对PCR产物进行凝胶纯化:片段1+3的大小应为3.4kb,片段2+3的大小应为3.4kb。在最后的PCR反应(ExpandTM long system,Roche)中将这两个片段连接在一起:
5μl缓冲液1
14μldNTP(各1.25mM)
5.0μl片段1+3
5.0μl片段2+3
17.75μl水
在94℃ 120秒的第一个循环之后有一个暂停,此时加入0.75μl酶混合物。
总体积目前是45.0μl。
在最初的10个循环之后,在循环中还有一个暂停,加入2.5μl(20μM#179541)和2.5μl(20μM#179542),再继续进行15个循环。
94℃ 120秒1个循环
暂停。加入酶
94℃ 15秒,60℃ 60秒,68℃ 240秒,10个循环。
暂停。加入引物
94℃ 15秒,60℃ 60秒,68℃ 180秒每个循环加20秒,15个循环。
68℃ 600秒1个循环。
连接在一起的PCR片段的大小为6.8kb。使用QiagenTM PCR纯化试剂盒纯化该PCR片段,将50μl经洗脱DNA中的5μl用于转化标准的枯草芽孢杆菌菌株。转化之后,将细胞铺于LBPG-120μg/ml壮观霉素上。第二天,可发现1000多个菌落。使用最后一次JOINING PCR扩增所用的PCR引物检查其中8个菌落,如果未发生缺失,会产生6.8kb而不是预期的5.2kb的PCR片段。另外,用Mancini免疫测定法检查克隆的果胶酸盐裂合酶活性,它对果胶酸盐裂合酶活性未显示出反应性。和Spec抗性合起来考虑,我们认为已经发生缺失。选择一个这样的克隆,并称之为MB1053。
将与res-spec-res邻接的BPN′表达盒插入MB1053
在使用PCR引物#179541和#179542的PCR扩增中,将经消化的PCR扩增的三联启动子BPN’表达盒与经KpnI-Sal消化的Pecl-Spec PCR片段的连接混合物用作模板。这会产生约9kb的PCR片段,使用该片段转化枯草芽孢杆菌PL1801(Diderichsen,B et al.1990.Cloning of aldB,which encodesalpha-acetolactate decarboxylase,an exoenzyme from Bacillus brevis.J.Bacteriol.,172,4315-4321)感受态细胞。将经转化的细胞铺于含脱脂乳的LB-120μg/ml壮观霉素琼脂平板。将具有大的脱脂乳清亮带的壮观霉素抗性菌落重新划线于壮观霉素琼脂平板,并使用引物#179541(SEQ ID NO:13)和#179542(SEQ ID NO:14)进行PCR,以分析PCR片段的整合。
出现9kb的片段表示PCR片段已整合至宿主细胞基因组。对几个这样的克隆进行测序以进一步证实表达盒的整合,选择一个这样的克隆,将其称为PL3598-37。
实施例4.构建携有质粒的染色体整合盒
可在体内构建携有大肠杆菌质粒的文库整合盒。用于本发明方法的整合盒可存在于大肠杆菌质粒(仅能在大肠杆菌中复制,不能在枯草芽孢杆菌中复制)上,所述质粒含有:
i)编码通常已知为Savinase的枯草杆菌蛋白酶的前-原-结构域的DNA序列,在其之前并与其可操作相连的
ii)含有mRNA稳定化区段的DNA序列,在这一特定情况下,所述区段得自CryIIIa基因;
iii)标记基因(氯霉素抗性基因),和
iv)分别作为5′和3′侧翼区段的枯草芽孢杆菌基因组DNA:多核苷酸上游的同源5’多核苷酸区域[yfmD-ytmC-yfmB-yfmA-Pel-start],和多核苷酸下游的3’多核苷酸区域[Pel-end-yflS-citS(start)]。
通过几个克隆步骤制备盒,所述步骤包括在常用质粒pUC19中具有的对几个不同PCR片段都合适的限制性内切核酸酶位点处消化pUC19质粒和PCR片段。每次将PCR片段连接至质粒之后,将连接混合物转化至按厂商(BIO-RAD)描述制备的电感受态DH5α大肠杆菌细胞,转化是通过按厂商的描述,使用购自BIO-RAD的Gene PulserTM电穿孔仪电穿孔而进行的。通过测序证实一个最终的质粒构建体含有上文所述的正确构建体,将其称为pMB1508。
因此,pMB1508质粒含有下述元件:
i)包括核糖体结合序列(RBS)的CryIIIA mRNA稳定化前导序列,与其可操作相连的
ii)编码通常已知为Savinase的枯草杆菌蛋白酶的前-原-结构域的DNA,其包括KpnI和NotI位点以用于克隆;
iii)氯霉素抗性操纵子;
iv)与枯草芽孢杆菌区域99-100%同源的3′下游侧翼区域[Pel-end-yflS-citS(start)]。
将上述的4个元件克隆至pUC19载体(分离自大肠杆菌ATCC 37254;Vieira J,Messing J.The pUC plasmids,an M13mp7-derived system for insertionmutagenesis and sequencing with synthetic universal primers.Gene 19:259-268,1982.)的EcoRI和SalI位点,获得pMB1508。为了使所得质粒高效整合至枯草芽孢杆菌基因组的特定位点,建立了新的菌株。新菌株是枯草芽孢杆菌168 BGSC,登记号:1A1 168 trpC2的衍生物。按上文所述使该菌株成为感受态并对其进行转化。使用上文所述PL3598-37克隆的元件,建立被称为MB1510的新整合菌株,其特征在于含有得自PL3598-37的下述元件:
i)三联启动子和mRNA稳定化元件。
ii)侧翼区段,其含有下述同源的位于三联启动子上游的多核苷酸区域[yfmD-ytmC-yfmB-yfmA-Pel-start],和位于mRNA稳定化元件下游的多核苷酸区域[Pel-end-yflS-citS(start)]。
因此,当使用MB1510感受态细胞时,pMB1508(或其衍生物)可直接整合至MB1510基因组中,所述基因组中设有与三联启动子和mRNA稳定化元件融合的两个侧翼区,从而构建出pMB1508 DNA的引入PrePro编码DNA与三联启动子,mRNA稳定化元件和RBS一起整合至正确阅读框的构建体。由此导致MB1510基因组中已存在的启动子元件所引发的整合基因的高表达。
建立用大肠杆菌制备质粒pMB1508转化的枯草芽孢杆菌菌株MB1510的转化效率。为了进一步检测使用该方法的潜力,使用两个PCR引物PCR扩增Bacillus clausii的Savinase编码基因:
引物#317(SEQ ID NO:19)tggcgcaatcggtaccatgggg
引物#139 NotI(SEQ ID NO:20)catgtgcatgcggccgcattaacgcgttgccgcttctgcg
用KpnI和NotI消化所得的~0.8kb Savinase片段和pMB1508质粒,然后通过琼脂糖凝胶电泳纯化所得片段。连接这两个片段,使用连接混合物转化感受态大肠杆菌细胞,然后将所述细胞铺于LB-琼脂平板或置于液体培养基中,37℃生长过夜;两种培养基都含有50-100μg/ml氨苄青霉素。保温之后,由液体培养物制备质粒制品。用纯化的质粒转化MB1510感受态细胞(每次转化使用100-10.000ng质粒)。将经转化的细胞铺于含2%脱脂乳和6μg/ml氯霉素的TY培养基上以进行选择。37℃保温过夜之后,在整合盒适当整合至细胞中的那些菌落周围出现了清亮区,这表明Savinase的高表达。
该方法也可用于制备任何可在枯草芽孢杆菌中表达的有价值基因的高多样性文库,其中不只是编码一种酶的基因,任何可表达的多核苷酸皆可插入质粒pMB1508并整合至MB1510菌株供随后筛选。
质粒pMB1508的序列(SEO ID NO:21)
质粒pMB1508具有以碱基对位置表示的下述组分:
BP 5186-395:大肠杆菌克隆ATCC 37254的pUC19序列,Vieira J,Messing J.The pUC plasmids,an M13mp7-derived system for insertionmutagenesis and sequencing with synthetic universal primers.Gene 19:259-268,1982。
BP396-1021:EcoRI克隆位点(BP396-401)和CryIIIA mRNA稳定化元件(描述于WO 9634963-A1)。
BP 1022-1412:编码Savinase的Pre-Pro序列和NotI克隆位点。(Pre-Pro部分描述于例如WO 9623073-A1,通过PCR引物导入NotI位点以及Pre-Pro和NotI之间的间隔)。
BP 1413-2512:Bgl II克隆位点(BP1413-1418)和pDN1050的氯霉素乙酰转移酶操纵子(描述于例如Diderichsen,B.;Poulsen,GB.;Joergensen,S.T.;Auseful cloning vector for Bacillus subtilis.P1asmid 30:312(1993))。
BP2513-5185:枯草芽孢杆菌基因组的pelB基因座下游的多核苷酸区域[Pel-end-yflS-citS(start)]。(描述于下述文献和相应的数据库:F.Kunst,N.Ogasawara,I.Moszer,<146 other authors>,H.Yoshikawa,A.Danchin.″Thecomplete genome sequence of the Gram-positive bacterium Bacillus subtilis″Nature(1997)390:249-256)。
枯草芽孢杆菌菌株MB1510
MB1510在pelB基因座及其周围具有下述特征:
i)三联启动子和包括RBS(核糖体结合序列)的mRNA稳定化元件。
ii)侧翼区段,其含有下述同源的位于三联启动子上游的多核苷酸区域[yfmD-ytmC-yfmB-yfmA-Pel-start],和位于mRNA稳定化序列下游的多核苷酸区域[Pel-end-yflS-citS(start)]。
MB1510基因组整合区域的序列(SEQ ID NO:22)
BP1-2873:对应于枯草芽孢杆菌基因组yfmD-ytmC-yfmB-yfmA-Pel-start的序列(描述于下述文献和相应的数据库:F.Kunst et al.″The complete genome sequence of the Gram-positive bacteriumBacillus subtilis″Nature(1997)390:249-256)。
BP3102-4082:三联启动子和CryIIIA mRNA稳定化元件加RBS。(描述于上文的PL3598-37构建体)。
BP4083-5718:枯草芽孢杆菌基因组的pelB基因座末端和下游的多核苷酸区域[Pel-end-yflS-citS(start)](描述于下述文献和相应的数据库:F.Kunst,N.Ogasawara,I.Moszer,<146 other authors>,H.Yoshikawa,A.Danchin.″Thecomplete genome sequence of the Gram-positive bacterium Bacillus subtils″Nature(1997)390:249-256)。
实施例5.构建2氨基酸尾-变体文库
本实施例显示了尾-变体文库的构建。在此文库中,在10R蛋白的C-末端导入了两个氨基酸。可使用上述方法,在以枯草芽孢杆菌10RS的基因组DNA为模板的PCR反应中使用下述PCR引物制备所述尾-文库:
1605(SEQ ID NO:23):gacggccagtgaattcgataaaagtgc
1606(SEQ ID NO:24):ccagatctctatnktnktgtacggagtctaactccccaagag
其中N=A,C,G或T;K=T或G。
用EcoR I和Bgl 11消化所得PCR产物,并连接至经EcoR I和Bgl 11消化的pMB1508。随后根据上文所述的原理进行操作。
通过自动化菌落挑选仪从生物测定平板上挑选氯霉素抗性枯草芽孢杆菌转化子,并将其转移至含有添加了6mg/l氯霉素的0.05×TY的384孔微滴板(MTP)(60μl/孔)。于26℃将MTP保温72小时。保温之后分析每个孔的蛋白酶活性。
选择30个具有最高蛋白酶活性的枯草芽孢杆菌转化子,以通过DNA测序测定每个转化子中的两个尾氨基酸,测序结果简述于表4和表5。
AA尾 | 转化子数目 |
TL | 4 |
TT | 4 |
QL | 3 |
TP | 3 |
LP | 3 |
TI | 2 |
IQ | 2 |
QP | 2 |
PI | 2 |
LT | 1 |
TQ | 1 |
IT | 1 |
1 | |
PQ | 1 |
总计 | 30 |
表4:第1栏显示出尾的氨基酸序列,第2栏显示出经测序具有该特定氨基酸尾序列的枯草芽孢杆菌转化子的数目。
位置1的可能性 | 结果 | 位置2的可能性 | 结果 |
K | 0 | K | 0 |
R | 0 | R | 0 |
T | 14 | T | 6 |
I | 3 | I | 4 |
Q | 6 | Q | 5 |
P | 3 | P | 8 |
L | 4 | L | 7 |
总计 | 30 | 总计 | 30 |
表5:此表显示出可由构建文库所用引物导入的氨基酸和通过对分离自筛选过程的30个菌落进行DNA测序而发现的实际情况。
实施例6.构建枯草芽孢杆菌菌株L2,L2 HV0和L2 HV1
按照与构建枯草芽孢杆菌菌株10RS类似的方法,通过PCR使编码达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的S2A蛋白酶原-型(被称为L2)的DNA在框内与编码SAVINASETM(众所周知可得自Bacillus clausii的商用蛋白酶,可购自Novozymes,Denmark)信号肽的DNA融合以制备枯草芽孢杆菌菌株,将所得菌株称为枯草芽孢杆菌Say-L2。
用引物1423和1475扩增的,包括达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的前成熟S2A蛋白酶编码区的DNA序列示于SEQ ID NO:25。相应编码的L2蛋白酶原-型氨基酸序列示于SEQ ID NO:28。
1423(SEQ ID NO:26):gcttttagttcatcgatcgcatcggctgctccggcccccgtcccccag
1475(SEQ ID NO:27):ggagcggattgaacatgcgattaggtccggatcctgacaccccag
还制备了该构建体的两个尾-变体。通过使用在TAA终止密码子之前插入的SEQ ID NO:4所示DNA序列延伸,将尾变体Sav-L2 HV0构建成C-末端具有8个额外的氨基酸:QSHVQSAP(SEQ ID NO:3)。通过使用在TAA终止密码子之前插入的SEQ ID NO:6所示DNA序列延伸,将尾变体Sav-L2HV1构建成C-末端具有4个额外的氨基酸:QSAP(SEQ ID NO:5)。就象在Sav--L2中一样,这两个尾变体都具有与前成熟编码序列在框内融合的SAVINASETM信号肽编码序列。
如上文所述,通过同源重组将Sav-L2基因和两个尾变体Sav-L2 HV0和Sav-L2 HV1整合至枯草芽孢杆菌MB1053宿主细胞基因组。在1%脱脂乳LB-PG琼脂平板(添加有6μg/ml氯霉素)上检查氯霉素抗性转化子的蛋白酶活性。通过对插入物进行DNA测序,进一步分析一些蛋白酶阳性菌落以证实正确的DNA序列,针对每个构建体选择一个菌株,分别称之为枯草芽孢杆菌Sav-L2,枯草芽孢杆菌Sav-L2 HV0和枯草芽孢杆菌Sav-L2 HV1。
实施例7.实施例6的芽孢杆菌菌株的发酵产量
在回转式摇床上的500ml带挡板Erlenmeyer烧瓶中发酵实施例6的3个枯草芽孢杆菌菌株,所述烧瓶各含有100ml添加有6mg/l氯霉素的TY。对3个枯草芽孢杆菌菌株中的每一个,平行地在6个Erlenmeyer烧瓶中进行发酵。6个Erlenmeyer烧瓶中的2个在37℃(250rpm)保温,2个在30℃(250rpm)保温,最后2个在26℃(250rpm)保温。在第1,2和3天对每个摇瓶取样,分析其蛋白酶活性。结果示于表6-8。从表6-8可以看出,当在枯草芽孢杆菌中表达时,尾的作用也能增加达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的Sav-L2蛋白酶的表达水平。在此实验中观察到高达40%的增加,但在所有3个测试温度下,皆观察到这两个尾-变体的全面改善。
表6.37℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 | |
Sav-L2 | 1,0 | 1,0 | 1,0 |
Sav-L2 HV1 | 1,4 | 1,3 | 1,2 |
Sav-L2 HV0 | 1,3 | 1,1 | 1,4 |
表7.30℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 | |
Sav-L2 | 1,0 | 1,0 | 1,0 |
Sav-L2 HV1 | 1,0 | 1,2 | 1,4 |
Sav-L2 HV0 | 1,1 | 1,3 | 1,3 |
表8.26℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 | |
Sav-L2 | 1,0 | 1,0 | 1,0 |
Sav-L2 HV1 | 1,3 | 1,1 | 1,1 |
Sav-L2 HV0 | 0,2 | 1,1 | 1,1 |
实施例8.芽孢杆菌中具有异源前-区的10R尾变体
编码达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的L2蛋白酶前-区的DNA序列示于SEQ ID NO:29,对应的氨基酸序列示于SEQ ID NO:30。制备被称为L210R的枯草芽孢杆菌菌株,该菌株类似于枯草芽孢杆菌菌株10RS,但用编码L2前-区的DNA替代了编码10RS前-区的DNA。包括L2前-区的完整L210R蛋白酶编码序列示于SEQ ID NO:31。
还制备了上述构建体的两个尾-变体。通过使用在编码序列的TAA终止密码子之前插入的SEQ ID NO:4所示DNA,将尾变体HV0构建成C-末端具有8个额外的氨基酸:QSHVQSAP(SEQ ID NO:3)。通过使用在编码序列的TAA终止密码子之前插入的SEQ ID NO:6所示DNA序列,将尾变体HV1构建成C-末端具有4个额外的氨基酸:QSAP(SEQ ID NO:5)。
通过同源重组将10RL2构建体和两个尾变体整合至枯草芽孢杆菌MB1053宿主细胞基因组。在1%脱脂乳LB-PG琼脂平板(添加有6μg/ml氯霉素)上检查氯霉素抗性转化子的蛋白酶活性。通过对插入物进行DNA测序,进一步分析一些蛋白酶阳性菌落以证实正确的DNA序列,针对每个构建体选择一个菌株,分别称之为枯草芽孢杆菌L210R,枯草芽孢杆菌L210RHV0和枯草芽孢杆菌L210R HV1。
实施例9.具有异源前-区的10R尾变体的发酵产量
在回转式摇床上的500ml带挡板Erlenmeyer烧瓶中发酵6个枯草芽孢杆菌菌株10RS,10RS HV0,10RS HV1,L210R,L210R HV0和L210R HV1,所述烧瓶各含有100ml添加有6mg/l氯霉素的TY。对枯草芽孢杆菌菌株中的每一个,平行地在6个Erlenmeyer烧瓶中进行发酵。6个Erlenmeyer烧瓶中的2个在37℃(250rpm)保温,2个在30℃(250rpm)保温,最后2个在26℃(250rpm)保温。在第1,2和3天对每个摇瓶取样,分析其蛋白酶活性。结果示于图1和表9-11。从结果中可以看出,通过37℃时培养物肉汤中的蛋白酶活性测定,用L2蛋白酶的前区替换10R前区的效果导致10R蛋白酶的表达水平令人惊奇地大有改善。两个尾变体中的效果最为显著。
表9.37℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 | |
10RS | 1,0 | 1,0 | 1,0 |
10RS HV0 | 3,7 | 8,9 | 3,5 |
10RS HV1 | 3,9 | 8,5 | 4,3 |
L210R | 1.9 | 2,3 | 1,6 |
L210R HV0 | 5,3 | 14,4 | 7,3 |
L210R HV1 | 9,1 | 20,9 | 7,6 |
表10.30℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 | |
10RS | 1,0 | 1,0 | 1,0 |
10RS HV0 | 2,8 | 3,1 | 4,3 |
10RS HV1 | 3,6 | 3,6 | 4,9 |
L210R | 0,6 | 0,4 | 0,9 |
L210R HV0 | 3,5 | 3,2 | 4,5 |
L210R HV1 | 3,7 | 3,2 | 4,5 |
表11.26℃时的相对蛋白酶活性
第1天 | 第2天 | 第3天 | |
10RS | 1,0 | 1,0 | 1,0 |
10RS HV0 | 2,6 | 3,0 | 2,8 |
10RS HV1 | 3,7 | 3,3 | 3,1 |
L210R | 0,4 | 0,7 | 0,4 |
L210R HV0 | 2,3 | 2,1 | 1,9 |
L210R HV1 | 2,2 | 1,7 | 1,7 |
实施例10.用其它10R-样蛋白酶重复实施例1-9
完全类似于上文实施例1至9,用下述拟诺卡氏菌属菌株的蛋白酶进行类似的实验:
(a)WO 88/03947中描述的达松维尔拟诺卡氏菌NRRL 18133;
(b)WO 88/03947中描述的拟诺卡氏菌NRRL 18262,得自拟诺卡氏菌NRRL 18262的蛋白酶的DNA和氨基酸序列示于DK专利申请号199600013,WO 01/58276描述了与得自拟诺卡氏菌NRRL 18262的蛋白酶相关的酸-稳定性蛋白酶在动物饲料中的用途;
(c)白拟诺卡氏菌DSM 15647;该蛋白酶的氨基酸序列是SEQ ID NO:33,编码核苷酸序列是SEQ ID NO:32;使用下述两个引物进行PCR扩增从该菌株的基因组DNA中分离基因:
1421(SEQ ID NO:34):gttcatcgatcgcatcggctgcgaccggccccctcccccagtc
1604(SEQ ID NO:35):gcggatcctatcaggtgcgcagggtcagacc。
(d)葱绿拟诺卡氏菌DSM 15648;该蛋白酶的氨基酸序列是SEQID NO:37,编码核苷酸序列是SEQ ID NO:36;使用下述两个引物进行PCR扩增从该菌株的基因组DNA中分离基因:
1346(SEQ ID NO:38):gttcatcgatcgcatcggctgccaccggaccgctcccccagtc
1602(SEQ ID NO:39):gcggatcctattaggtccggagacggacgccccaggag。
(e)葱绿拟诺卡氏菌DSM 15649;该蛋白酶的氨基酸序列是SEQ ID NO:41,编码核苷酸序列是SEQ ID NO:40;使用下述两个引物进行PCR扩增从该菌株的基因组DNA中分离基因:
1603(SEQ ID NO:42):gttcatcgatcgcatcggctgccaccggaccactcccccagtc和1602(SEQ ID NO:39)。
实施例11.得自DSM 43235的10R-样蛋白酶的体内单胃表现
在单胃体外消化模型中测定达松维尔拟诺卡氏菌达松维尔亚种DSM43235蛋白酶的表现。在单胃动物刺激消化的体外模型中检测SEQ ID NO:28所示蛋白酶成熟部分的纯化制品(按上文所述制备)的表现。具体检测蛋白酶改善玉米/-SBM(玉米/-大豆粉)蛋白质的溶解和消化状况的能力。在下表中,该蛋白酶被称为“本发明的蛋白酶”。
体外系统由15个瓶组成,其中最初使玉米/-SBM底物与HCl/胃蛋白酶一起保温-刺激胃消化-随后与胰酶制剂一起保温以刺激肠消化。在胃阶段开始时,在10个瓶中加入一定剂量的蛋白酶,而将其余瓶用作空白对照。在肠保温阶段结束时,取出体外消化物样品并分析已溶解和消化的蛋白质。
表12:体外消化程序概要
加入的组分 | pH | 温度 | 时间进程 | 刺激的消化阶段 |
10g玉米/-SBM底物(6∶4),41ml HCl(0.105M) | 3.0 | 40℃ | t=0分钟 | 混合 |
5ml HCl(0.105M)/胃蛋白酶(3000U/g底物),1mL本发明的蛋白酶 | 3.0 | 40℃ | t=30分钟 | 胃消化 |
16ml H2O | 3.0 | 40℃ | t=1.0小时 | 胃消化 |
7ml NaOH(0,39M) | 6.8 | 40℃ | t=1.5小时 | 肠消化 |
5ml NaHCO3(1M)/胰酶制剂(8mg/g饮食) | 6.8 | 40℃ | t=2.0小时 | 肠消化 |
终止保温 | 7.0 | 40℃ | t=6.0小时 |
条件
底物: 4g SBM,6g玉米(预混的)
pH: 3.0胃阶段/6.8-7.0肠阶段
HCl: 0.105M,1.5小时(即30分钟HCl-底物预混)
胃蛋白酶: 3000U/g饮食,1小时
胰酶制剂: 8mg/g饮食,4小时
温度: 40℃
重复次数: 5
溶液
0.39MNaOH
0.105MHCl
0.105MHCl,每5ml含有6000U胃蛋白酶
1MNaHCO3,每ml含有16mg胰酶制剂
125mM NaAc-缓冲液,pH6.0
酶蛋白酶测定
使用S.C.Gill & P.H.von Hippel,Analytical Biochemistry 182,319-326,(1989)中概述的原理,根据A280值和氨基酸序列(氨基酸组成)计算蛋白酶酶蛋白质的量(下文将酶蛋白质简称为EP)。
体外模型的实验方法
实验方法根据的是上文所述的内容,在1,2.5和5.5小时的时间点测定pH。6小时后终止保温,取出30ml样品,置于冰上,然后离心(10000×g,10分钟,4℃)。取出上清液储存于-20℃。
分析
用OPA法分析所有样品的蛋白质水平百分比,并用凝胶过滤分析所有样品中被溶解和消化的蛋白质含量。
通过OPA-法测定DH
使用基于半自动化微滴板的比色法(Nielsen,P.M.;Petersen,D.;Dambmann,C.Improved method for determining food protein degree ofhydrolysis.J.Food Sci.2001,66,642-646)测定不同样品中蛋白质的水解程度(DH)。按下述制备OPA试剂:将7.620g四硼酸二钠十水合物和200mg十二烷基硫酸钠(SDS)溶解于150ml去离子水中。在继续之前将试剂完全溶解。将160mg o-邻苯二醛97%(OPA)溶解于4ml乙醇中。通过用去离子水冲洗将OPA溶液定量转移至上述溶液。在溶液中加入176mg二硫苏糖醇99%(DTT),用去离子水使体积达到200ml。通过将50mg丝氨酸(Merck,Germany)溶解于500ml去离子水中,制备出丝氨酸标准(0.9516meqv/l)。
将每个样品稀释至光吸收度(280nm)约为0.5以制备出样品溶液。一般使用自动化Tecan稀释站(Mnnedorf,Switzerland)稀释上清液(100×)。使用去离子水作为对照,在340nm下进行所有其它分光光度计的读数。使25 μl样品(标准样品和盲试样品)散布于微滴板中。将微滴板插入iEMS MF读出器(Labsystems,Finland),自动分散200μl OPA试剂。振动微滴板(2分钟;700rpm),然后测定光吸收值。最后计算出DH。对所有样品进行8次测定。
估计经溶解和消化的蛋白质
通过使用凝胶过滤HPLC定量粗蛋白(CP)来估计体外消化样品的上清液中溶解蛋白质的含量。使上清液解冻,通过0.45μm聚碳酸酯滤器过滤并用H2O稀释(1∶50,v/v)。使用Superdex Peptide PE(7.5×300mm)凝胶过滤柱(Global)进行HPLC以层析经稀释的样品。用于等度洗脱的洗脱液是含有150mM NaCl的50mM磷酸钠缓冲液(pH7.0)。每次洗脱时所用洗脱液的总体积是26ml,流速是0.4ml/分钟。记录214nm下的洗脱分布图,通过积分法测定分布图下的总面积。为了由积分的面积估计蛋白质含量,由具有已知总蛋白质含量的,经成倍稀释的体外消化玉米/-SBM参照样品绘制校正曲线(R2=0.9993)。使用Kjeldahl法(测定氮的百分比;A.O.A.C.(1984)Official Methods of Analysis 14th ed.,Washington DC)进行参照样品中的蛋白质测定。
通过对与分子量为1500道尔顿或以下的肽和氨基酸相对应的层析图面积进行积分,估计出经消化蛋白质的含量(Savoie,L.;Gauthier,S.F.DialysisCell For The In-vitro Measurement Of Protein Digestibility.J.Food Sci.1986,51,494-498;Babinszky,L.;Van,D.M.J.M.;Boer,H.;Den,H.L.A.An In-vitroMethod for Prediction of The Digestible Crude Protein Content in Pig Feeds.J.Sci.Food Agr.1990,50,173-178;Boisen,S.;Eggum,B.O.Critical Evaluation ofIn-vitro Methods for Estimating Digestibility in Simple-Stomach Animals.Nutrition Research Reviews 1991,4,141-162)。为了确定1500道尔顿的区分线,使用细胞色素C(Boehringer,Germany),抑蛋白酶肽,胃泌素I和P物质(Sigma Aldrich,USA)作为分子量标准校正凝胶过滤柱。
结果
下文表13和14所示的结果表明蛋白酶显著增加了水解程度(DH)以及可溶和可消化的蛋白质。
表13:水解程度(DH),绝对值和相对值
酶(以mg EP计的剂量/kg饲料) | n | 占总蛋白质的百分比 | 相对于空白对照的百分比 | ||||
%DH | SD | %DH | %CV | ||||
空白对照 | 5 | 26.84 | a | 0.69 | 100.0 | a | 2.57 |
本发明的蛋白酶(100) | 5 | 28.21 | b | 0.35 | 105.1 | b | 1.25 |
相同栏内的不同字母表示显著差异(1-way ANOVA,Tukey-Kramer试验,P<0.05)。SD=标准差,%CV=变异系数=(SD/平均值)×100%。
表14:通过KTA HPLC测定的经溶解和消化的粗蛋白
酶(以mgEP计的剂量/kg饲料) | n | 占总蛋白质的百分比 | 相对于空白对照的百分比 | ||||||||||
%经消化CP | SD | %经溶解CP | SD | %经消化CP | CV% | %经溶解CP | CV% | ||||||
空白对照 | 5 | 54.1 | a | 1.1 | 90.1 | a | 1.1 | 100.0 | a | 2.0 | 100.0 | a | 1.2 |
本发明的蛋白酶(50) | 5 | 57.7 | b | 1.1 | 93.2 | b | 1.4 | 106.7 | b | 1.9 | 103.4 | b | 1.5 |
(100) | 5 | 58.9 | b | 0.8 | 94.8 | b | 0.9 | 108.9 | b | 1.3 | 105.2 | b | 0.9 |
相同栏内的不同字母表示显著差异(1-way ANOVA,Tukey-Kramer试验,P<0.05)。SD=标准差,%CV=变异系数=(SD/平均值)×100%。
实施例12.得自DSM 43235的10R-样蛋白酶的体外水产动物表现
在水产动物体外模型中测定达松维尔拟诺卡氏菌达松维尔亚种DSM43235蛋白酶的表现。在冷水性鱼类刺激消化的水产动物体外模型中检测实施例3所述蛋白酶制品。体外系统由15个瓶组成,其中最初使SBM底物与HCl/胃蛋白酶一起保温-刺激胃消化-随后与胰酶制剂一起保温以刺激肠消化。在胃阶段开始时,在10个瓶中加入一定剂量的蛋白酶,而将其余5个瓶用作空白对照。在肠保温阶段结束时,取出体外消化物样品并分析已溶解和消化的蛋白质。
表15:水产动物体外消化程序概要
加入的组分 | pH | 温度 | 时间进程 | 刺激的消化阶段 |
10g挤压出的SBM底物,62mL HCl(0.155M)/胃蛋白酶(4000U/g底物),1mL本发明的蛋白酶 | 3.0 | 15℃ | t=0分钟 | 胃消化 |
7mL NaOH(1.1M) | 6.8 | 15℃ | t=6小时 | 肠消化 |
5mL NaHCO3(1M)/胰酶制剂(8mg/g饮食) | 6.8 | 15℃ | t=7小时 | 肠消化 |
终止保温 | 7.0 | 15℃ | t=24小时 |
条件
底物: 10g挤压出的SBM
pH: 3.0胃阶段/6.8-7.0肠阶段
HCl: 0.155M,6小时
胃蛋白酶:4000U/g饮食,6小时
胰酶制剂:8mg/g饮食,17小时
温度: 15℃
重复次数:5
溶液
1.1M NaOH
0.155M HCl/胃蛋白酶(4000U/g饮食)
1M NaHCO3,其中含有16mg胰酶制剂/mL
125mM NaAc-缓冲液,pH6.0
水产动物体外模型的实验方法
实验方法根据的是上文所述的内容,在1,5,8和23小时的时间点测定pH。24小时后终止保温,取出30ml样品,置于冰上,然后离心(13000×g,10分钟,0℃)。取出上清液储存于-20℃。
分析
用OPA法分析所有上清液(水解程度的百分比),并通过KTA HPLC测定被溶解和消化的蛋白质(参见单胃实施例)。
用EASY SPE柱预处理体外上清液
在KTAHPLC上分析之前,使用固相样品纯化技术预处理得自体外系统的上清液。这样做的目的是为了改善层析,从而防止不稳定的洗脱分布图和基线。用于提取的柱是固相提取柱(Chromabond EASY SPE Columns,Macherey-Nagel)。通过使用真空室(真空0.15×100kPa)使2mL milliQ水穿过柱被洗脱出来。随后将3mL体外样品分散到柱上并洗脱(真空0.1×100kPa),弃去前面mL洗脱样品,在柱下放置干净的管,然后洗脱其余样品,留作进一步稀释。
结果
下文表16和17所示的结果表明蛋白酶显著增加了水解程度和蛋白质的可消化性。
表16:通过OPA法测定的水解程度(DH),绝对值和相对值
酶(mg EP/kg饮食) | n | 占总蛋白质的百分比 | 相对于空白对照的百分比 | ||||
%DH | SD | %DH | %CV | ||||
空白对照 | 5 | 21.30 | a | 0.52 | 100.0 | a | 2.42 |
本发明的蛋白酶(50) | 5 | 21.98 | b | 0.22 | 103.2 | b | 1.00 |
相同栏内的不同字母表示显著差异(1-way ANOVA,Tukey-Kramer试验,P<0.05)。SD=标准差,%CV=变异系数=(SD/平均值)×100%。
表17:通过KTA HPLC测定的经溶解和消化的粗蛋白,绝对值和相对值
酶(mg EP/kg饮食) | N | 占总蛋白质的百分比 | 相对于空白对照的百分比 | ||||||||||
%经消化的CP | SD | %经溶解的CP | SD | %经消化的CP | %CV | %经溶解的CP | %CV | ||||||
空白对照 | 5 | 50.0 | a | 2.2 | 89.9 | a | 3.2 | 100.0 | a | 4.5 | 100.0 | a | 3.5 |
本发明的蛋白酶(50) | 5 | 52.3 | b | 1.1 | 91.4 | a | 1.5 | 104.8 | b | 2.1 | 101.7 | a | 1.6 |
(100) | 5 | 53.4 | b | 0.4 | 91.6 | a | 1.0 | 107.0 | b | 0.7 | 101.9 | a | 1.1 |
相同栏内的不同字母表示显著差异(1-way ANOVA,Tukey-Kramer试验,P<0.05)。SD=标准差,%CV=变异系数=(SD/平均值)×100%。
实施例13.具有Savinase信号的10R尾-变体TQ和TP的发酵和活性
在回转式摇床上的500ml带挡板Erlenmeyer烧瓶中发酵实施例5中的2个枯草芽孢杆菌菌株,即具有氨基酸尾-变体TQ的菌株209和具有尾-变体TP的菌株211以及枯草芽孢杆菌Sav-10RS,所述烧瓶各含有100ml添加有6mg/l氯霉素的TY。对这3个枯草芽孢杆菌菌株中的每一个,平行地在12个Erlenmeyer烧瓶中进行发酵。12个Erlenmeyer烧瓶中的4个在37℃(250rpm)保温,4个在30℃(250rpm)保温,最后4个在26℃(250rpm)保温。在第1,2和3天对每个摇瓶取样,分析其蛋白酶活性。结果示于下文表18-20。
从下表中可以看出,经培养物肉汤中的活性测定,2氨基酸尾的作用是令人惊奇地大大改善了蛋白酶的产量。2氨基酸尾的作用与实施例1中用Sav-10RS HV1和Sav-10RS HV3观察到的作用差不多。
表18:37℃时的相对蛋白酶活性
1 | 2 | 3 | |
10R synt-15 | 1,0 | 1,0 | 1,0 |
209 | 7,0 | 7,0 | 6,0 |
211 | 7,2 | 7,7 | 4,9 |
表19:30℃时的相对蛋白酶活性
1 | 2 | 3 | |
10R synt-15 | 1,0 | 1,0 | 1,0 |
209 | 4,5 | 3,6 | 4,9 |
211 | 4,0 | 4,1 | 5,0 |
表20:26℃时的相对蛋白酶活性
1 | 2 | 3 | |
10R synt-15 | 1,0 | 1,0 | 1,0 |
209 | 6,4 | 4,3 | 4,0 |
211 | 3,7 | 4,1 | 4,2 |
实施例14.合成的具有信号的经改组10R-样蛋白酶尾-变体
用信号肽和SEQ ID NO:3的8氨基酸C-末端尾构建另一个合成的尾变体10R蛋白酶编码基因(被称为G-MAT-22),并将所述基因导入枯草芽孢杆菌宿主以进行表达。令人惊奇地获得了高产量的蛋白酶(数据未显示)。G-MAT-22的完整编码DNA序列示于SEQ ID NO:44,编码的前-原-蛋白酶示于SEQ ID NO:45。G-mat-22蛋白酶是α-裂解蛋白酶-样酶(肽酶家族S1E-旧称:S2A)。如图1所示,该蛋白酶比10R蛋白酶的最适温度更高(在pH9时)。
实施例15:10R-样蛋白酶经改组的前-序列
按Ness,J.E.et al 2002[Nature Biotechnology,Vol.20(12),pp.1251-1255,2002]所述,通过合成改组,可不受亲代特定序列的支配,独立完成蛋白酶基因的重组。设计合成的寡核苷酸,其DNA序列是简并的,从而提供在该套亲代蛋白酶中出现所有氨基酸的可能性,根据参考文献装配基因。可对全长序列进行改组,或仅对部分序列进行改组,然后与基因的其余部分组合产生全长序列。
在此实施例中,SEQ ID NO:28;SEQ ID NO:33;SEQ ID NO:37;SEQID NO:41;SEQ ID NO:43或SEQ ID NO:45给出的亲代蛋白酶前-肽部分的氨基酸序列由一套寡核苷酸编码,将所得经改组的基因片段组合至全长蛋白酶基因的上下文中,此时所述基因由编码信号序列,(经改组的)前-肽和(在这种情况下)10R蛋白酶的成熟蛋白质的DNA组成。经改组的前-肽序列的例子示于SEQ ID NO:46(O-2.19),SEQ ID NO:47(G-2.73),SEQ ID NO:48(G-1.43),SEQ ID NO:49(G-2.6),SEQ ID NO:50(G-2.5),SEQ ID NO:51(G-2.3),SEQ ID NO:52(G-1.4)和SEQ ID NO:53(G-1.2)。
通过上文所述的同源重组将完整的蛋白酶编码基因插入枯草芽孢杆菌基因组,使用富含营养的培养基在摇瓶中表达蛋白酶。在30℃发酵5天,离心分离上清液,然后测定蛋白酶活性。作为对照,在相同条件下发酵由相同构建方法构建的,表达得自拟诺卡氏菌NRRL 18262的野生型蛋白酶10R的枯草芽孢杆菌克隆。计算蛋白酶活性,下表描述了相对于野生型10R蛋白酶活性的蛋白酶活性。显然,异源前-区提供了超越10R蛋白酶天然前-区的优点。
相对活性 | |
10RG-1.2G-1.4G-2.3G-2.4G-2.5G-2.6G-2.7 | 1,02,91,41,63,43,04,21,6 |
表21:用异源经改组的前-肽表达的10R蛋白酶的相对活性。
实施例16.尾-变体10R-HV1的体内单胃表现
本实施例描述了在单胃体外模型中,使用10,25,50和100mg EP/kg,以10R蛋白酶作为基准或对照,用10R蛋白酶的4氨基酸尾变体HV1进行的剂量/反应研究。如上所述,尾变体10R-HV1被构建成C-末端具有4个额外的氨基酸:QSAP(SEQ ID NO:5)。
体外条件:
底物: 4g SBM,6g玉米(预混的)
pH: 3.0胃阶段/6.8-7.0肠阶段
HCl: 0.105M,1.5小时(即30分钟,HCl-底物预混)
胃蛋白酶:3000U/g饮食,1小时
胰酶制剂:8mg/g饮食,4小时
保温: 40℃
重复次数:5
酶:
10R蛋白酶:FFE-2003-00047;批号PPA21400;154mg EP/g产品
冻干的10R-HV1 FFE-2003-00077;370mg EP/g产品
溶液A:10R,100mg EP/kg饮食:
100mg EP/kg饮食~1mg EP/瓶1mg EP/mL
(1mg EP/mL*10mL)/154mg EP/g产品=0.0649g
制备10mL:将0.0649g酶溶解于10mL NaAc缓冲液
溶液C:10R-HV1,100mg EP/kg饮食:
100mg EP/kg饮食~1mgEP/瓶1mg EP/mL
(1mg EP/mL*20mL)/370mg EP/g产品=0.05405g
制备20mL:将0.0541g酶溶解于20mL NaAc缓冲液
溶液D:10R-HV1,50mg EP/kg饮食:
50mg EP/kg饮食~0.50mg EP/1ml瓶=0.50mg EP/ml
制备10mL:将C稀释2倍:5ml溶液C+5ml 125mM NaAc-缓冲液
溶液E:10R-HV1,25mg EP/kg饮食:
25mg EP/kg饮食~0.25mg EP/1ml瓶=0.25mg EP/ml
制备12mL:将C稀释4倍:3ml溶液C+9ml 125mM NaAc-缓冲液
溶液F:10R-HV1,10mg EP/kg饮食:
25mg EP/kg饮食~0.25mg EP/1ml瓶=0.25mg EP/ml
制备10mL:将C稀释10倍:1ml溶液C+9ml 125mM NaAc-缓冲液
底物:
预混物(40%SBM/60%玉米),FFS-2002-00121
10g样品含有6g玉米和4g SBM,经计算,蛋白质含量为23.48%蛋白质(~2.35g/瓶)。
化学制品
4.005M HCl,AT-1-00061/29
4.007M NaOH,AT-1-00002/36
胰酶制剂FFE-2002-00052,8xUSP
胃蛋白酶FFE-2003-00048,471U/mg
NaOH 0.39M:
制备500mL:
48.97mL 3.982M NaOH,用milliQ补加至500mL。
HCl1溶液0.105M
制备2000mL:
52.43mL 4.005 HCl,用milliQ补加至2000mL。
HCL2(HCl/胃蛋白酶)溶液:0.105M,含有30000U胃蛋白酶/5mL
制备250mL:
从HCl-溶液中取出约150mL,加入3.18g胃蛋白酶,用HCl溶液补加至250mL。
125mM NaAc-缓冲液,pH6.0:
制备自2M NaAc-缓冲液(KLu 04-07-2003/实验室书籍14169,第104页)→12.5mL 2M NaAc-缓冲液,用milliQ补加至200mL。
溶解于1M NaHCO3的胰酶制剂,含有8mg胰酶制剂/g饮食:
预先制备NaHCO3-胰酶制剂,分成小份并冷冻。制备29-04-2003并冷冻,使其在冰箱中缓慢解冻过夜。贮存物的制备描述于实验室书籍14165的第068页。
流程图:
在预混阶段(t=0),10g底物与41ml HCl1混合;然后在胃阶段(t=30分钟)加入5ml HCl-2(HCl/胃蛋白酶)+1ml酶(或缓冲液),随后(t=1小时)测定pH并加入16ml水;然后在肠阶段(t=1小时30分钟)加入7ml 0.39 NaOH,随后(t=2小时)加入5ml NaHCO3/胰酶制剂,再度两次测定pH(t=2小时30分钟&t=5小时30分钟);最后(t=6小时)取出30ml悬浮液样品以进行离心。立即并小心地将每个离心管中的上清液取出并移入玻璃管。将上清液分成两个等份试样以供进一步分析。结果示于表22。
表22:在单胃体外模型中处理样品
样品 | 酶溶液 | 酶 | pH | 酶剂量/kg饮食: | 胃蛋白酶U/g饮食: | 胰酶制剂mg/g饮食: |
1-5 | 1ml缓冲液 | 空白对照 | 3.0 | 0mg EP | 3000 | 8.0 |
6-10 | 1ml溶液A | 10R(FFE-2003-00047) | 3.0 | 100mgEP | 3000 | 8.0 |
11-15 | 1ml溶液C | 10R-HV1(PPA22873) | 3.0 | 100mgEP | 3000 | 8.0 |
16-20 | 1ml溶液D | 10R-HV1(PPA22873) | 3.0 | 50mg EP | 3000 | 8.0 |
21-25 | 1ml溶液E | 10R-HV1(PPA22873) | 3.0 | 25mg EP | 3000 | 8.0 |
26-30 | 1ml溶液F | 10R-HV1(PPA22873) | 3.0 | 10mg EP | 3000 | 8.0 |
可溶和可消化的蛋白质:
使用KTA HPLC(Superdex 30肽柱)测定水解产物的可溶相中可溶和可消化粗蛋白水平的改变。结果示于表23。
当10R-HV1的剂量为100mg EP/kg饮食时,与空白对照相比,可消化的蛋白质水平显著增加9.8%。对照10R显示出7.7%的相对改善。在较低的酶浓度(50,25和10mg EP/kg饮食)下,可消化蛋白质的相对改善分别为5.7%,3.3%和0.7%。
表23:10R-HV1和10R的HPLC结果,相对于空白对照而言,可消化CP(%dig.CP)和可溶CP(%sol.CP)的百分比有所改变。上标的不同字母表示显著差异(1-ANOVA,Tukey,95%)。
MoFi030043,第2日酶[mg EP/kg] | n | 占总蛋白质的百分比 | 相对于空白对照的百分比 | ||||||
%dig.CP | SD | %sol.CP | SD | %dig.CP | CV% | %sol.CP | CV% | ||
Blank10RHV1[100]10RHV1[50]10RHV1[25]10RHV1[10]10R[100] | 1155555 | 54,860,258,056,755,259,1 | 1,20,80,60,81,30,8 | 83,988,386,986,384,387,1 | 1,61,10,81,01,91,9 | 100,0a109,8e105,7cd103,3bc100,7ab107,7de | 2,31,31,11,42,41,4 | 100,0a105,3c103,6bc102,9bc100,5ab103,9bc | 1,91,30,91,22,22,2 |
原始的10R[100mg 10R[100mg EP/kg饮食]将可溶蛋白质的水平提高了约4%。10R-HV1的作用稍高(相对增加为5.3%)并且较显著。当剂量为50和25mg EP/kg饮食时,相对改善分别为3.6%和2.9%并且较为显著。当剂量为10mg EP/kg饮食时,相对改善为0.5%。
水解程度:
使用OPA法测定水解程度(DH)。结果示于表24。
酶[mgEP/kg] | n | 占总蛋白质的百分比 | 相对于空白对照的百分比 | ||||
%DH | SD | %DH | SD | ||||
空白对照 | 5 | 25,89 | a | 0,43 | 100,0 | a | 1,65 |
10R(FFE-2003-00047)[100] | 5 | 27,19 | bc | 0,67 | 105,0 | bc | 2,46 |
10RHV1[100] | 5 | 27,89 | c | 0,36 | 107,7 | c | 1,29 |
10RHV1[50] | 5 | 27,34 | bc | 0,57 | 105,6 | bc | 2,08 |
10RHV1[25] | 5 | 26,42 | ab | 0,57 | 102,0 | ab | 2,16 |
10RHV1[10] | 5 | 25,52 | a | 0,96 | 98,6 | S | 3,76 |
表24:通过OPA法测定的水解程度(DH)。表中显示出绝对值和相对值。不同字母表示显著差异(1-way ANOVA,Tukey 95%)。
与空白对照相比,尾-变体10R-HV1将DH改善了7.7%。对较低剂量(50和25mg EP/kg饮食)的蛋白酶而言,改善幅度分别为5.6-2.0%,这与以前的发现一致。当剂量最低[10mg EP/kg饮食]时,未发现有什么作用。相对于空白对照而言,原始10R[100mg EP/kg饮食]显示出5%的改善。
HLPC KTA分析和DH测定的结果清楚地表明给10R加上4氨基酸(SEQ ID NO:5)长尾不会在任何显著的程度上影响10R蛋白酶的表现。
序列表
<110>诺维信公司(Novozymes A/S)
<120>改进的蛋白酶及其制备方法
<130>10495.204-WO
<160>53
<170>PatentIn version 3.2
<210>1
<211>1062
<212>DNA
<213>拟诺卡氏菌(Nocardiopsis sp.)NRRL 18262
<220>
<221>misc_feature
<222>(1)..(495)
<223>编码位于SEQ ID NO:43中第-165位至第-1位的前-区
<220>
<221>misc_feature
<222>(496)..(1059)
<223>编码位于SEQ ID NO:43中第1位至第188位的成熟区
<400>1
gctactggag cattacctca gtctcctaca cctgaagcag atgcagtatc gatgcaagaa 60
gcattacaac gtgatcttga tcttacatca gctgaagctg aggaattact tgctgcacaa 120
gatacagcct ttgaagttga tgaagctgcc gctgaagcag ctggtgatgc atatggtggt 180
tcagtattcg atactgaatc actcgaactt actgtactag tgaccgatgc agcagctgtt 240
gaagctgttg aagccacagg tgcaggtaca gagctcgtat cttatggtat tgatggatta 300
gatgagatcg tacaagagct taatgcagct gatgccgttc caggtgtagt tggatggtat 360
cctgatgtag caggtgatac tgttgtctta gaagttcttg aaggctctgg agctgatgtt 420
tctggacttt tagcagacgc aggagtcgat gcatccgcgg ttgaagtgac cacgtcagat 480
cagcctgaac tctatgccga tatcattgga ggcctagcgt acacaatggg tggtcgctgc 540
agcgtaggat ttgcagccac aaatgcagct ggacaacctg gcttcgtgac agctggacat 600
tgcggccgcg tcggtacaca ggttactatc ggcaatggaa gaggtgtctt tgagcaaagc 660
gtatttcccg ggaatgatgc tgccttcgtt agaggtacgt ccaactttac gcttactaac 720
ttagtatcta gatacaacac tggcggatat gcaactgtag caggtcacaa tcaagcacct 780
attggctcta gcgtctgccg ctcagggtcg actacaggat ggcattgtgg aaccattcaa 840
gctagaggtc agagcgtgag ctatcctgaa ggtaccgtaa cgaacatgac tcgtacgact 900
gtatgtgcag aaccaggtga ctctggaggt tcatatatca gcggtacgca agcgcaaggc 960
gttacctcag gtggatccgg taactgtagg acaggtggca caacgttcta ccaggaagtg 1020
acaccgatgg tgaactcttg gggagttaga ctccgtacat aa 1062
<210>2
<211>1143
<212>DNA
<213>人工序列
<220>
<223>合成的10R基因(10Rsynt-15),其编码被称为″10R″的S2A蛋白酶,通过PCR使该合成基因与异源蛋白酶Savinase的信号肽编码序列在框内融合。
<400>2
atgaagaaac cgttggggaa aattgtcgca agcaccgcac tactcatttc tgttgctttt 60
agttcatcga tcgcatcggc tgctactgga gcattacctc agtctcctac acctgaagca 120
gatgcagtat cgatgcaaga agcattacaa cgtgatcttg atcttacatc agctgaagct 180
gaggaattac ttgctgcaca agatacagcc tttgaagttg atgaagctgc cgctgaagca 240
gctggtgatg catatggtgg ttcagtattc gatactgaat cactcgaact tactgtacta 300
gtgaccgatg cagcagctgt tgaagctgtt gaagccacag gtgcaggtac agagctcgta 360
tcttatggta ttgatggatt agatgagatc gtacaagagc ttaatgcagc tgatgccgtt 420
ccaggtgtag ttggatggta tcctgatgta gcaggtgata ctgttgtctt agaagttctt 480
gaaggctctg gagctgatgt ttctggactt ttagcagacg caggagtcga tgcatccgcg 540
gttgaagtga ccacgtcaga tcagcctgaa ctctatgccg atatcattgg aggcctagcg 600
tacacaatgg gtggtcgctg cagcgtagga tttgcagcca caaatgcagc tggacaacct 660
ggcttcgtga cagctggaca ttgcggccgc gtcggtacac aggttactat cggcaatgga 720
agaggtgtct ttgagcaaag cgtatttccc gggaatgatg ctgccttcgt tagaggtacg 780
tccaacttta cgcttactaa cttagtatct agatacaaca ctggcggata tgcaactgta 840
gcaggtcaca atcaagcacc tattggctct agcgtctgcc gctcagggtc gactacagga 900
tggcattgtg gaaccattca agctagaggt cagagcgtga gctatcctga aggtaccgta 960
acgaacatga ctcgtacgac tgtatgtgca gaaccaggtg actctggagg ttcatatatc 1020
agcggtacgc aagcgcaagg cgttacctca ggtggatccg gtaactgtag gacaggtggc 1080
acaacgttct accaggaagt gacaccgatg gtgaactctt ggggagttag actccgtaca 1140
taa 1143
<210>3
<211>8
<212>PRT
<213>人工序列
<220>
<223>C-末端氨基酸尾,表达为与本发明蛋白酶的融合蛋白
<400>3
Gln Ser His Val Gln Ser Ala Pro
1 5
<210>4
<211>24
<212>DNA
<213>人工序列
<220>
<223>编码C-末端氨基酸尾的多核苷酸,所述尾表达为与本发明蛋白酶的融合蛋白
<400>4
caatcgcatg ttcaatccgc tcca 24
<210>5
<211>4
<212>PRT
<213>人工序列
<220>
<223>C-末端氨基酸尾,表达为与本发明蛋白酶的融合蛋白
<400>5
Gln Ser Ala Pro
1
<210>6
<211>12
<212>DNA
<213>人工序列
<220>
<223>编码C-末端氨基酸尾的多核苷酸,所述尾表达为与本发明蛋白酶的融合蛋白
<400>6
caatcggctc ct 12
<210>7
<211>2
<212>PRT
<213>人工序列
<220>
<223>C-末端氨基酸尾,表达为与本发明蛋白酶的融合蛋白
<400>7
Gln Pro
1
<210>8
<211>6
<212>DNA
<213>人工序列
<220>
<223>编码C-末端氨基酸尾的多核苷酸,所述尾表达为与本发明蛋白酶的融合蛋白
<400>8
caacca 6
<210>9
<211>1
<212>PRT
<213>人工序列
<220>
<223>C-末端氨基酸尾,表达为与本发明蛋白酶的融合蛋白
<400>9
Pro
1
<210>10
<211>3
<212>DNA
<213>人工序列
<220>
<223>编码C-末端氨基酸尾的多核苷酸,所述尾表达为与本发明蛋白酶的融合蛋白
<400>10
cca 3
<210>11
<211>45
<212>DNA
<213>人工序列
<220>
<223>引物 #252639
<400>11
catgtgcatg tgggtaccgc aacgttcgca gatgctgctg aagag 45
<210>12
<211>44
<212>DNA
<213>人工序列
<220>
<223>引物 #251992
<400>12
catgtgcatg tggtcgaccg attatggagc ggattgaaca tgcg 44
<210>13
<211>44
<212>DNA
<213>人工序列
<220>
<223>引物 #179541
<400>13
gcgttgagac gcgcggccgc gagcgccgtt tggctgaatg atac 44
<210>14
<211>43
<212>DNA
<213>人工序列
<220>
<223>引物 #179542
<400>14
gcgttgagac agctcgagca gggaaaaatg gaaccgcttt ttc 43
<210>15
<211>64
<212>DNA
<213>人工序列
<220>
<223>引物 #179539
<400>15
ccatttgatc agaattcact ggccgtcgtt ttacaaccat tgcggaaaat agtcataggc 60
atcc 64
<210>16
<211>60
<212>DNA
<213>人工序列
<220>
<223>引物 #179540
<400>16
ggatccagat ctggtacccg ggtctagagt cgacgcggcg gttcgcgtcc ggacagcaca 60
<210>17
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物 #179154
<400>17
gttgtaaaac gacggccagt gaattctgat caaatgg 37
<210>18
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物 #179153
<400>18
ccgcgtcgac actagacacg ggtacctgat ctagatc 37
<210>19
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物 #317
<400>19
tggcgcaatc ggtaccatgg gg 22
<210>20
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物 #139 NotI
<400>20
catgtgcatg cggccgcatt aacgcgttgc cgcttctgcg 40
<210>21
<211>7443
<212>DNA
<213>人工序列
<220>
<223>质粒pMB1508的序列
<400>21
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgataaaagt gctttttttg 420
ttgcaattga agaattatta atgttaagct taattaaaga taatatcttt gaattgtaac 480
gcccctcaaa agtaagaact acaaaaaaag aatacgttat atagaaatat gtttgaacct 540
tcttcagatt acaaatatat tcggacggac tctacctcaa atgcttatct aactatagaa 600
tgacatacaa gcacaacctt gaaaatttga aaatataact accaatgaac ttgttcatgt 660
gaattatcgc tgtatttaat tttctcaatt caatatataa tatgccaata cattgttaca 720
agtagaaatt aagacaccct tgatagcctt actataccta acatgatgta gtattaaatg 780
aatatgtaaa tatatttatg ataagaagcg acttatttat aatcattaca tatttttcta 840
ttggaatgat taagattcca atagaatagt gtataaatta tttatcttga aaggagggat 900
gcctaaaaac gaagaacatt aaaaacatat atttgcaccg tctaatggat ttatgaaaaa 960
tcattttatc agtttgaaaa ttatgtatta tggagctctg aaaaaaagga gaggataaag 1020
aatgaagaaa ccgttgggga aaattgtcgc aagcaccgca ctactcattt ctgttgcttt 1080
tagttcatcg atcgcatcgg ctgctgaaga agcaaaagaa aaatatttaa ttggctttaa 1140
tgagcaggaa gctgtcagtg agtttgtaga acaagtagag gcaaatgacg aggtcgccat 1200
tctctctgag gaagaggaag tcgaaattga attgcttcat gaatttgaaa cgattcctgt 1260
tttatccgtt gagttaagcc cagaagatgt ggacgcgctt gaactcgatc cagcgatttc 1320
ttatattgaa gaggatgcag aagtaacgac aatggcgcaa tcggtaccat ggggtatatc 1380
aacgcgttaa tccgcggata tatagcggcc gcagatctgg gaccaataat aatgactaga 1440
gaagaaagaa tgaagattgt tcatgaaatt aaggaacgaa tattggataa agtgggatat 1500
ttttaaaata tatatttatg ttacagtaat attgactttt aaaaaaggat tgattctaat 1560
gaagaaagca gacaagtaag cctcctaaat tcactttaga taaaaattta ggaggcatat 1620
caaatgaact ttaataaaat tgatttagac aattggaaga gaaaagagat atttaatcat 1680
tatttgaacc aacaaacgac ttttagtata accacagaaa ttgatattag tgttttatac 1740
cgaaacataa aacaagaagg atataaattt taccctgcat ttattttctt agtgacaagg 1800
gtgataaact caaatacagc ttttagaact ggttacaata gcgacggaga gttaggttat 1860
tgggataagt tagagccact ttatacaatt tttgatggtg tatctaaaac attctctggt 1920
atttggactc ctgtaaagaa tgacttcaaa gagttttatg atttatacct ttctgatgta 1980
gagaaatata atggttcggg gaaattgttt cccaaaacac ctatacctga aaatgctttt 2040
tctctttcta ttattccatg gacttcattt actgggttta acttaaatat caataataat 2100
agtaattacc ttctacccat tattacagca ggaaaattca ttaataaagg taattcaata 2160
tatttaccgc tatctttaca ggtacatcat tctgtttgtg atggttatca tgcaggattg 2220
tttatgaact ctattcagga attgtcagat aggcctaatg actggctttt ataatatgag 2280
ataatgccga ctgtactttt tacagtcggt tttctaacga tacattaata ggtacgaaaa 2340
agcaactttt tttgcgctta aaaccagtca taccaataac ttaagggtaa ctagcctcgc 2400
cggaaagagc gaaaatgcct cacatttgtg ccacctaaaa aggagcgatt tacatatgag 2460
ttatgcagtt tgtagaatgc aaaaagtgaa atcagctgga ctaaaagggg ccgcagagta 2520
gaatggaaaa ggggatcgga aaacaagtat ataggaggag acctatttat ggcttcagaa 2580
aaagacgcag gaaaacagtc agcagtaaag cttgttccat tgcttattac tgtcgctgtg 2640
ggactaatca tctggtttat tcccgctccg tccggacttg aacctaaagc ttggcatttg 2700
tttgcgattt ttgtcgcaac aattatcggc tttatctcca agcccttgcc aatgggtgca 2760
attgcaattt ttgcattggc ggttactgca ctaactggaa cactatcaat tgaggataca 2820
ttaagcggat tcgggaataa gaccatttgg cttatcgtta tcgcattctt tatttcccgg 2880
ggatttatca aaaccggtct cggtgcgaga atttcgtatg tattcgttca gaaattcgga 2940
aaaaaaaccc ttggactttc ttattcactg ctattcagtg atttaatact ttcacctgct 3000
attccaagta atacggcgcg tgcaggaggc attatatttc ctattatcag atcattatcc 3060
gaaacattcg gatcaagccc ggcaaatgga acagagagaa aaatcggtgc attcttatta 3120
aaaaccggtt ttcaggggaa tctgatcaca tctgctatgt tcctgacagc gatggcggcg 3180
aacccgctga ttgccaagct ggcccatgat gtcgcagggg tggacttaac atggacaagc 3240
tgggcaattg ccgcgattgt accgggactt gtaagcttaa tcatcacgcc gcttgtgatt 3300
tacaaactgt atccgccgga aatcaaagaa acaccggatg cggcgaaaat cgcaacagaa 3360
aaactgaaag aaatgggacc gttcaaaaaa tcggagcttt ccatggttat cgtgtttctt 3420
ttggtgcttg tgctgtggat ttttggcggc agcttcaaca tcgacgctac cacaaccgca 3480
ttgatcggtt tggccgttct cttattatca caagttctga cttgggatga tatcaagaaa 3540
gaacagggcg cttgggatac gctcacttgg tttgcggcgc ttgtcatgct cgccaacttc 3600
ttgaatgaat taggcatggt gtcttggttc agtaatgcca tgaaatcatc cgtatcaggg 3660
ttctcttgga ttgtggcatt catcatttta attgttgtgt attattactc tcactatttc 3720
tttgcaagtg cgacagccca catcagtgcg atgtattcag catttttggc tgtcgtcgtg 3780
gcagcgggcg caccgccgct tttagcagcg ctgagcctcg cgttcatcag caacctgttc 3840
gggtcaacga ctcactacgg ttctggagcg gctccggtct tcttcggagc aggctacatc 3900
ccgcaaggca aatggtggtc catcggattt atcctgtcga ttgttcatat catcgtatgg 3960
cttgtgatcg gcggattatg gtggaaagta ctaggaatat ggtagaaaga aaaaggcaga 4020
cgcggtctgc ctttttttat tttcactcct tcgtaagaaa atggattttg aaaaatgaga 4080
aaattccctg tgaaaaatgg tatgatctag gtagaaagga cggctggtgc tgtggtgaaa 4140
aagcggttcc atttttccct gcaaacaaaa ataatggggc tgattgcggc tctgctggtc 4200
tttgtcattg gtgtgctgac cattacgtta gccgttcagc atacacaggg agaacggaga 4260
caggcagagc agctggcggt tcaaacggcg agaaccattt cctatatgcc gccggttaaa 4320
gagctcattg agagaaaaga cggacatgcg gctcagacgc aagaggtcat tgaacaaatg 4380
aaagaacaga ctggtgcgtt tgccatttat gttttgaacg aaaaaggaga cattcgcagc 4440
gcctctggaa aaagcggatt aaagaaactg gagcgcagca gagaaatttt gtttggcggt 4500
tcgcatgttt ctgaaacaaa agcggatgga cgaagagtga tcagagggag cgcgccgatt 4560
ataaaagaac agaagggata cagccaagtg atcggcagcg tgtctgttga ttttctgcaa 4620
acggagacag agcaaagcat caaaaagcat ttgagaaatt tgagtgtgat tgctgtgctt 4680
gtactgctgc tcggatttat tggcgccgcc gtgctggcga aaagcatcag aaaggatacg 4740
ctcgggcttg aaccgcatga gatcgcggct ctatatcgtg agaggaacgc aatgcttttc 4800
gcgattcgag aagggattat tgccaccaat cgtgaaggcg tcgtcaccat gatgaacgta 4860
tcggcggccg agatgctgaa gctgcccgag cctgtgatcc atcttcctat agatgacgtc 4920
atgccgggag cagggctgat gtctgtgctt gaaaaaggag aaatgctgcc gaaccaggaa 4980
gtaagcgtca acgatcaagt gtttattatc aatacgaaag tgatgaatca aggcgggcag 5040
gcgtatggga ttgtcgtcag cttcagggag aaaacagagc tgaagaagct gatcgacaca 5100
ttgacagagg ttcgcaaata ttcagaggat ctcagggcgc agactcatga attttcaaat 5160
aagctttatg cgattttagg gctgcgtcga cctgcaggca tgcaagcttg gcgtaatcat 5220
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 5280
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 5340
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 5400
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 5460
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 5520
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5580
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5640
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5700
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5760
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5820
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5880
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5940
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 6000
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 6060
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 6120
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6180
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 6240
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 6300
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 6360
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 6420
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 6480
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 6540
caccggattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6600
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6660
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6720
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6780
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6840
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6900
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6960
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 7020
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 7080
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 7140
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 7200
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 7260
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 7320
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 7380
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 7440
gtc 7443
<210>22
<211>5718
<212>DNA
<213>人工序列
<220>
<223>MB1510基因组整合区的序列
<400>22
gagcgccgtt tggctgaatg atacaacagt ctcacttcct tactgcgtct ggttgcaaaa 60
acgaagaagc aaggattccc ctcgcttctc atttgtccta tttattatac acttttttaa 120
gcacatcttt ggcgcttgtt tcactagact tgatgcctct gaatcttgtc caagtgtcac 180
ggtccgcatc atagacttgt ccatttttca ccgctttgag atttttccag agcgggttcg 240
ttttccactc atctacaatg gttttgcctt cgttggctga gatgaacaaa atatcaggat 300
cgattttgct caattgctca aggctgacct cttgataggc gttatctgac ttcacagcgt 360
gtgtaaagcc tagcatttta aagatttctc cgtcatagga tgatgatgta tgaagctgga 420
aggaatccgc tcttgcaacg ccgagaacga tgttgcggtt ttcatctttc ggaagttcgg 480
cttttagatc gttgatgact tttttgtgct cggcaagctt ttcttttcct tcatcttctt 540
tatttaatgc tttagcaatg gtcgtaaagc tgtcgatcgt ttcgtcatat gtcgcttcac 600
ggctttttaa ttcaatcgtc ggggcgattt ttttcagctg tttataaatg tttttatggc 660
gctcagcgtc agcgatgatt aaatcaggct tcaaggaact gatgacctca agattgggtt 720
cgctgcgtgt gcctacagat gtgtaatcaa tggagctgcc gacaagcttt ttaatcatat 780
cttttttgtt gtcatctgcg atgcccaccg gcgtaatgcc gagattgtga acggcatcca 840
agaatgaaag ctcaagcaca accacccgct taggtgtgcc gcttactgtc gtttttcctt 900
cttcgtcatg gatcactctg gaatccttag actcgctttt gccgcttccg ttgttattct 960
ggcttgatga acagccggat acaatgaggc aggcgagcaa taaaacactc atgatggcaa 1020
tcaacttgtt agaataggtg cgcatgtcat tcttcctttt ttcagattta gtaatgagaa 1080
tcattatcac atgtaacact ataatagcat ggcttatcat gtcaatattt ttttagtaaa 1140
gaaagctgcg tttttactgc tttctcatga aagcatcatc agacacaaat aagtggtatg 1200
cagcgttacc gtgtcttcga gacaaaaacg catgggcgtt ggctttagag gtttcgaaca 1260
tatcagcagt gacataagga aggagagtgc tgagataacc ggacaatttc ttttctattt 1320
catctgttag tgcaaattca atgtcgccga tattcatgat aatcgagaaa acaaagtcga 1380
tatcgatatg aaaatgttcc tcggcaaaaa ccgcaagctc gtgaattcct ggtgaacatc 1440
cggcacgctt atggaaaatc tgtttgacta aatcactcac aatccaagca ttgtattgct 1500
gttctggtga aaagtattgc attagacata cctcctgctc gtacggataa aggcagcgtt 1560
tcatggtcgt gtgctccgtg cagcggcttc tccttaattt tgatttttct gaaaataggt 1620
cccgttccta tcactttacc atggacggaa aacaaatagc tactaccatt cctcctgttt 1680
ttctcttcaa tgttctggaa tctgtttcag gtacagacga tcgggtatga aagaaatata 1740
gaaaacatga aggaggaata tcgacatgaa accagttgta aaagagtata caaatgacga 1800
acagctcatg aaagatgtag aggaattgca gaaaatgggt gttgcgaaag aggatgtata 1860
cgtcttagct cacgacgatg acagaacgga acgcctggct gacaacacga acgccaacac 1920
gatcggagcc aaagaaacag gtttcaagca cgcggtggga aatatcttca ataaaaaagg 1980
agacgagctc cgcaataaaa ttcacgaaat cggtttttct gaagatgaag ccgctcaatt 2040
tgaaaaacgc ttagatgaag gaaaagtgct tctctttgtg acagataacg aaaaagtgaa 2100
agcttgggca taaagcaagg aaaaaaccaa aaggccaatg tcggcctttt ggtttttttg 2160
cggtctttgc ggtgggattt tgcagaatgc cgcaatagga tagcggaaca ttttcggttc 2220
tgaatgtccc tcaatttgct attatatttt tgtgataaat tggaataaaa tctcacaaaa 2280
tagaaaatgg gggtacatag tggatgaaaa aagtgatgtt agctacggct ttgtttttag 2340
gattgactcc agctggcgcg aacgcagctg atttaggcca ccagacgttg ggatccaatg 2400
atggctgggg cgcgtactcg accggcacga caggcggatc aaaagcatcc tcctcaaatg 2460
tgtataccgt cagcaacaga aaccagcttg tctcggcatt agggaaggaa acgaacacaa 2520
cgccaaaaat catttatatc aagggaacga ttgacatgaa cgtggatgac aatctgaagc 2580
cgcttggcct aaatgactat aaagatccgg agtatgattt ggacaaatat ttgaaagcct 2640
atgatcctag cacatggggc aaaaaagagc cgtcgggaac acaagaagaa gcgagagcac 2700
gctctcagaa aaaccaaaaa gcacgggtca tggtggatat ccctgcaaac acgacgatcg 2760
tcggttcagg gactaacgct aaagtcgtgg gaggaaactt ccaaatcaag agtgataacg 2820
tcattattcg caacattgaa ttccaggatg cctatgacta ttttccgcaa tggttgtaaa 2880
acgacggcca gtgaattctg atcaaatggt tcagtgagag cgaagcgaac acttgatttt 2940
ttaattttct atcttttata ggtcattaga gtatacttat ttgtcctata aactatttag 3000
cagcataata gatttattga ataggtcatt taagttgagc atattagagg aggaaaatct 3060
tggagaaata tttgaagaac ccgagatcta gatcaggtac cgcaacgttc gcagatgctg 3120
ctgaagagat tattaaaaag ctgaaagcaa aaggctatca attggtaact gtatctcagc 3180
ttgaagaagt gaagaagcag agaggctatt gaataaatga gtagaaagcg ccatatcggc 3240
gcttttcttt tggaagaaaa tatagggaaa atggtacttg ttaaaaattc ggaatattta 3300
tacaatatca tatgtatcac attgaaagga ggggcctgct gtccagactg tccgctgtgt 3360
aaaaataagg aataaagggg ggttgacatt attttactga tatgtataat ataatttgta 3420
taagaaaatg gaggggccct cgaaacgtaa gatgaaacct tagataaaag tgcttttttt 3480
gttgcaattg aagaattatt aatgttaagc ttaattaaag ataatatctt tgaattgtaa 3540
cgcccctcaa aagtaagaac tacaaaaaaa gaatacgtta tatagaaata tgtttgaacc 3600
ttcttcagat tacaaatata ttcggacgga ctctacctca aatgcttatc taactataga 3660
atgacataca agcacaacct tgaaaatttg aaaatataac taccaatgaa cttgttcatg 3720
tgaattatcg ctgtatttaa ttttctcaat tcaatatata atatgccaat acattgttac 3780
aagtagaaat taagacaccc ttgatagcct tactatacct aacatgatgt agtattaaat 3840
gaatatgtaa atatatttat gataagaagc gacttattta taatcattac atatttttct 3900
attggaatga ttaagattcc aatagaatag tgtataaatt atttatcttg aaaggaggga 3960
tgcctaaaaa cgaagaacat taaaaacata tatttgcacc gtctaatgga tttatgaaaa 4020
atcattttat cagtttgaaa attatgtatt atggagctct gaaaaaaagg agaggataaa 4080
gagaaaaggg gatcggaaaa caagtatata ggaggagacc tatttatggc ttcagaaaaa 4140
gacgcaggaa aacagtcagc agtaaagctt gttccattgc ttattactgt cgctgtggga 4200
ctaatcatct ggtttattcc cgctccgtcc ggacttgaac ctaaagcttg gcatttgttt 4260
gcgatttttg tcgcaacaat tatcggcttt atctccaagc ccttgccaat gggtgcaatt 4320
gcaatttttg cattggcggt tactgcacta actggaacac tatcaattga ggatacatta 4380
agcggattcg ggaataagac catttggctt atcgttatcg cattctttat ttcccgggga 4440
tttatcaaaa ccggtctcgg tgcgagaatt tcgtatgtat tcgttcagaa attcggaaaa 4500
aaaacccttg gactttctta ttcactgcta ttcagtgatt taatactttc acctgctatt 4560
ccaagtaata cggcgcgtgc aggaggcatt atatttccta ttatcagatc attatccgaa 4620
acattcggat caagcccggc aaatggaaca gagagaaaaa tcggtgcatt cttattaaaa 4680
accggttttc aggggaatct gatcacatct gctatgttcc tgacagcgat ggcggcgaac 4740
ccgctgattg ccaagctggc ccatgatgtc gcaggggtgg acttaacatg gacaagctgg 4800
gcaattgccg cgattgtacc gggacttgta agcttaatca tcacgccgct tgtgatttac 4860
aaactgtatc cgccggaaat caaagaaaca ccggatgcgg cgaaaatcgc aacagaaaaa 4920
ctgaaagaaa tgggaccgtt caaaaaatcg gagctttcca tggttatcgt gtttcttttg 4980
gtgcttgtgc tgtggatttt tggcggcagc ttcaacatcg acgctaccac aaccgcattg 5040
atcggtttgg ccgttctctt attatcacaa gttctgactt gggatgatat caagaaagaa 5100
cagggcgctt gggatacgct cacttggttt gcggcgcttg tcatgctcgc caacttcttg 5160
aatgaattag gcatggtgtc ttggttcagt aatgccatga aatcatccgt atcagggttc 5220
tcttggattg tggcattcat cattttaatt gttgtgtatt attactctca ctatttcttt 5280
gcaagtgcga cagcccacat cagtgcgatg tattcagcat ttttggctgt cgtcgtggca 5340
gcgggcgcac cgccgctttt agcagcgctg agcctcgcgt tcatcagcaa cctgttcggg 5400
tcaacgactc actacggttc tggagcggct ccggtcttct tcggagcagg ctacatcccg 5460
caaggcaaat ggtggtccat cggatttatc ctgtcgattg ttcatatcat cgtatggctt 5520
gtgatcggcg gattatggtg gaaagtacta ggaatatggt agaaagaaaa aggcagacgc 5580
ggtctgcctt tttttatttt cactccttcg taagaaaatg gattttgaaa aatgagaaaa 5640
ttccctgtga aaaatggtat gatctaggta gaaaggacgg ctggtgctgt ggtgaaaaag 5700
cggttccatt tttccctg 5718
<210>23
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物 1605
<400>23
gacggccagt gaattcgata aaagtgc 27
<210>24
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物 1606
<220>
<221>misc_feature
<222>(13)..(13)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(16)..(16)
<223>n是a,c,g或t
<400>24
ccagatctct atnktnktgt acggagtcta actccccaag ag 42
<210>25
<211>1112
<212>DNA
<213>达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43235
<400>25
gcttttagtt catcgatcgc atcggctgct ccggcccccg tcccccagac ccccgtcgcc 60
gacgacagcg ccgccagcat gaccgaggcg ctcaagcgcg acctcgacct cacctcggcc 120
gaggccgagg agcttctctc ggcgcaggaa gccgccatcg agaccgacgc cgaggccacc 180
gaggccgcgg gcgaggccta cggcggctca ctgttcgaca ccgagaccct cgaactcacc 240
gtgctggtca ccgacgcctc cgccgtcgag gcggtcgagg ccaccggagc ccaggccacc 300
gtcgtctccc acggcaccga gggcctgacc gaggtcgtgg aggacctcaa cggcgccgag 360
gttcccgaga gcgtcctcgg ctggtacccg gacgtggaga gcgacaccgt cgtggtcgag 420
gtgctggagg gctccgacgc cgacgtcgcc gccctgctcg ccgacgccgg tgtggactcc 480
tcctcggtcc gggtggagga ggccgaggag gccccgcagg tctacgccga catcatcggc 540
ggcctggcct actacatggg cggccgctgc tccgtcggct tcgccgcgac caacagcgcc 600
ggtcagcccg gtttcgtcac cgccggccac tgcggcaccg tcggcaccgg cgtgaccatc 660
ggcaacggca ccggcacctt ccagaactcg gtcttccccg gcaacgacgc cgccttcgtc 720
cgcggcacct ccaacttcac cctgaccaac ctggtctcgc gctacaactc cggcggctac 780
cagtcggtga ccggtaccag ccaggccccg gccggctcgg ccgtgtgccg ctccggctcc 840
accaccggct ggcactgcgg caccatccag gcccgcaacc agaccgtgcg ctacccgcag 900
ggcaccgtct actcgctcac ccgcaccaac gtgtgcgccg agcccggcga ctccggcggt 960
tcgttcatct ccggctcgca ggcccagggc gtcacctccg gcggctccgg caactgctcc 1020
gtcggcggca cgacctacta ccaggaggtc accccgatga tcaactcctg gggtgtcagg 1080
atccggacct aatcgcatgt tcaatccgct cc 1112
<210>26
<211>48
<212>DNA
<213>人工序列
<220>
<223>引物1423
<400>26
gcttttagtt catcgatcgc atcggctgct ccggcccccg tcccccag 48
<210>27
<211>45
<212>DNA
<213>人工序列
<220>
<223>引物1475
<400>27
ggagcggatt gaacatgcga ttaggtccgg atcctgacac cccag 45
<210>28
<211>354
<212>PRT
<213>达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43235
<220>
<221>PROPEP
<222>(1)..(166)
<220>
<221>mat_peptide
<222>(167)..(354)
<400>28
Ala Pro Ala Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala
-165 -160 -155
Ala Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asp Leu Thr Ser
-150 -145 -140
Ala Glu Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu
-135 -130 -125
Thr Asp Ala Glu Ala Thr Glu Ala Ala Gly Glu Ala Tyr Gly Gly
-120 -115 -110
Ser Leu Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp
-105 -100 -95
Ala Ser Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gln Ala Thr Val
-90 -85 -80 -75
Val Ser His Gly Thr Glu Gly Leu Thr Glu Val Val Glu Asp Leu Asn
-70 -65 -60Gly Ala Glu Val Pro Glu Ser Val Leu Gly Trp Tyr Pro Asp Val Glu
-55 -50 -45Ser Asp Thr Val Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val
-40 -35 -30Ala Ala Leu Leu Ala Asp Ala Gly Val Asp Ser Ser Ser Val Arg Val
-25 -20 -15
Glu Glu Ala Glu Glu Ala Pro Gln Val Tyr Ala Asp Ile Ile Gly Gly
-10 -5 -1 1 5
Leu Ala Tyr Tyr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr
10 15 20
Asn Ser Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr
25 30 35
Val Gly Thr Gly Val Thr Ile Gly Asn Gly Thr Gly Thr Phe Gln Asn
40 45 50
Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn
55 60 65 70
Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Gln
75 80 85
Ser Val Thr Gly Thr Ser Gln Ala Pro Ala Gly Ser Ala Val Cys Arg
90 95 100
Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn
105 110 115
Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr
120 125 130
Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly
135 140 145 150
Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Val
155 160 165
Gly Gly Thr Thr Tyr Tyr Gln Glu Val Thr Pro Met Ile Asn Ser Trp
170 175 180
Gly Val Arg Ile Arg Thr
185
<210>29
<211>498
<212>DNA
<213>达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43235
<400>29
gctccggccc ccgtccccca gacccccgtc gccgacgaca gcgccgccag catgaccgag 60
gcgctcaagc gcgacctcga cctcacctcg gccgaggccg aggagcttct ctcggcgcag 120
gaagccgcca tcgagaccga cgccgaggcc accgaggccg cgggcgaggc ctacggcggc l80
tcactgttcg acaccgagac cctcgaactc accgtgctgg tcaccgacgc ctccgccgtc 240
gaggcggtcg aggccaccgg agcccaggcc accgtcgtct cccacggcac cgagggcctg 300
accgaggtcg tggaggacct caacggcgcc gaggttcccg agagcgtcct cggctggtac 360
ccggacgtgg agagcgacac cgtcgtggtc gaggtgctgg agggctccga cgccgacgtc 420
gccgccctgc tcgccgacgc cggtgtggac tcctcctcgg tccgggtgga ggaggccgag 480
gaggccccgc aggtctac 498
<210>30
<211>166
<212>PRT
<213>达松维尔拟诺卡氏菌(Nocardiopsis das sonvillei)DSM 43235
<400>30
Ala Pro Ala Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala Ala
1 5 10 15
Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asp Leu Thr Ser Ala Glu
20 25 30
Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu Thr Asp Ala
35 40 45
Glu Ala Thr Glu Ala Ala Gly Glu Ala Tyr Gly Gly Ser Leu Phe Asp
50 55 60
Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val
65 70 75 80
Glu Ala Val Glu Ala Thr Gly Ala Gln Ala Thr Val Val Ser His Gly
85 90 95
Thr Glu Gly Leu Thr Glu Val Val Glu Asp Leu Asn Gly Ala Glu Val
100 105 110
Pro Glu Ser Val Leu Gly Trp Tyr Pro Asp Val Glu Ser Asp Thr Val
115 120 125
Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val Ala Ala Leu Leu
130 135 140
Ala Asp Ala Gly Val Asp Ser Ser Ser Val Arg Val Glu Glu Ala Glu
145 150 155 160
Glu Ala Pro Gln Val Tyr
165
<210>31
<211>1146
<212>DNA
<213>人工序列
<220>
<223>编码与A1918L2蛋白酶尾-变体编码基因融合在框内的SEQ ID NO:29前-区的DNA
序列;完整构建体:10R(proA1918L2)。
<400>31
atgaagaaac cgttggggaa aattgtcgca agcaccgcac tactcatttc tgttgctttt 60
agttcatcga tcgcatcggc tgctccggcc cccgtccccc agacccccgt cgccgacgac 120
agcgccgcca gcatgaccga ggcgctcaag cgcgacctcg acctcacctc ggccgaggcc 180
gaggagcttc tctcggcgca ggaagccgcc atcgagaccg acgccgaggc caccgaggcc 240
gcgggcgagg cctacggcgg ctcactgttc gacaccgaga ccctcgaact caccgtgctg 300
gtcaccgacg cctccgccgt cgaggcggtc gaggccaccg gagcccaggc caccgtcgtc 360
tcccacggca ccgagggcct gaccgaggtc gtggaggacc tcaacggcgc cgaggttccc 420
gagagcgtcc tcggctggta cccggacgtg gagagcgaca ccgtcgtggt cgaggtgctg 480
gagggctccg acgccgacgt cgccgccctg ctcgccgacg ccggtgtgga ctcctcctcg 540
gtccgggtgg aggaggccga ggaggccccg caggtctatg ccgatatcat tggaggccta 600
gcgtacacaa tgggtggtcg ctgcagcgta ggatttgcag ccacaaatgc agctggacaa 660
cctggcttcg tgacagctgg acattgcggc cgcgtcggta cacaggttac tatcggcaat 720
ggaagaggtg tctttgagca aagcgtattt cccgggaatg atgctgcctt cgttagaggt 780
acgtccaact ttacgcttac taacttagta tctagataca acactggcgg atatgcaact 840
gtagcaggtc acaatcaagc acctattggc tctagcgtct gccgctcagg gtcgactaca 900
ggatggcatt gtggaaccat tcaagctaga ggtcagagcg tgagctatcc tgaaggtacc 960
gtaacgaaca tgactcgtac gactgtatgt gcagaaccag gtgactctgg aggttcatat 1020
atcagcggta cgcaagcgca aggcgttacc tcaggtggat ccggtaactg taggacaggt 1080
ggcacaacgt tctaccagga agtgacaccg atggtgaact cttggggagt tagactccgt 1140
acataa 1146
<210>32
<211>1068
<212>DNA
<213>白拟诺卡氏菌(Nocardiopsis Alba)DSM 15647
<400>32
gcgaccggcc ccctccccca gtcccccacc ccggatgaag ccgaggccac caccatggtc 60
gaggccctcc agcgcgacct cggcctgtcc ccctctcagg ccgacgagct cctcgaggcg 120
caggccgagt ccttcgagat cgacgaggcc gccaccgcgg ccgcagccga ctcctacggc 180
ggctccatct tcgacaccga cagcctcacc ctgaccgtcc tggtcaccga cgcctccgcc 240
gtcgaggcgg tcgaggccgc cggcgccgag gccaaggtgg tctcgcacgg catggagggc 300
ctggaggaga tcgtcgccga cctgaacgcg gccgacgctc agcccggcgt cgtgggctgg 360
taccccgaca tccactccga cacggtcgtc ctcgaggtcc tcgagggctc cggtgccgac 420
gtggactccc tgctcgccga cgccggtgtg gacaccgccg acgtcaaggt ggagagcacc 480
accgagcagc ccgagctgta cgccgacatc atcggcggtc tcgcctacac catgggtggg 540
cgctgctcgg tcggcttcgc ggccaccaac gcctccggcc agcccgggtt cgtcaccgcc 600
ggccactgcg gcaccgtcgg caccccggtc agcatcggca acggccaggg cgtcttcgag 660
cgttccgtct tccccggcaa cgactccgcc ttcgtccgcg gcacctcgaa cttcaccctg 720
accaacctgg tcagccgcta caacaccggt ggttacgcga ccgtctccgg ctcctcgcag 780
gcggcgatcg gctcgcagat ctgccgttcc ggctccacca ccggctggca ctgcggcacc 840
gtccaggccc gcggccagac ggtgagctac ccccagggca ccgtgcagaa cctgacccgc 900
accaacgtct gcgccgagcc cggtgactcc ggcggctcct tcatctccgg cagccaggcc 960
cagggcgtca cctccggtgg ctccggcaac tgctccttcg gtggcaccac ctactaccag 1020
gaggtcaacc cgatgctgag cagctggggt ctgaccctgc gcacctga 1068
<210>33
<211>355
<212>PRT
<213>白拟诺卡氏菌(Nocardiopsis Alba)DSM 15647
<220>
<221>PROPEP
<222>(1)..(167)
<220>
<221>mat_peptide
<222>(168)..(355)
<400>33
Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Asp Glu Ala Glu
-165 -160 -155
Ala Thr Thr Met Val Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser
-150 -145 -140
Pro Ser Gln Ala Asp Glu Leu Leu Glu Ala Gln Ala Glu Ser Phe
-135 -130 -125
Glu Ile Asp Glu Ala Ala Thr Ala Ala Ala Ala Asp Ser Tyr Gly
-120 -115 -110
Gly Ser Ile Phe Asp Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr
-105 -100 -95
Asp Ala Ser Ala Val Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys
-90 -85 -80
Val Val Ser His Gly Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu
-75 -70 -65 -60
Asn Ala Ala Asp Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile
-55 -50 -45
His Ser Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp
-40 -35 -30
Val Asp Ser Leu Leu Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys
-25 -20 -15
Val Glu Ser Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly
-10 -5 -1 1 5
Gly Leu Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala
10 15 20
Thr Asn Ala Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly
25 30 35
Thr Val Gly Thr Pro Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu
40 45 50
Arg Ser Val Phe Pro Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser
55 60 65
Asn Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr
70 75 80 85
Ala Thr Val Ser Gly Ser Ser Gln Ala Ala Ile Gly Ser Gln Ile Cys
90 95 100
Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Val Gln Ala Arg
105 110 115
Gly Gln Thr Val Ser Tyr Pro Gln Gly Thr Val Gln Asn Leu Thr Arg
120 125 130
Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser
135 140 145
Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser
150 155 160 165
Phe Gly Gly Thr Thr Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser
170 175 180
Trp Gly Leu Thr Leu Arg Thr
185
<210>34
<211>43
<212>DNA
<213>人工序列
<220>
<223>引物1421
<400>34
gttcatcgat cgcatcggct gcgaccggcc ccctccccca gtc 43
<210>35
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物1604
<400>35
gcggatccta tcaggtgcgc agggtcagac c 31
<210>36
<211>1062
<212>DNA
<213>葱绿拟诺卡氏菌(Nocardiopsis prasina)DSM 15648
<400>36
gccaccggac cgctccccca gtcacccacc ccggaggccg acgccgtctc catgcaggag 60
gcgctccagc gcgacctcgg cctgaccccg cttgaggccg atgaactgct ggccgcccag 120
gacaccgcct tcgaggtcga cgaggccgcg gccgcggccg ccggggacgc ctacggcggc 180
tccgtcttcg acaccgagac cctggaactg accgtcctgg tcaccgacgc cgcctcggtc 240
gaggctgtgg aggccaccgg cgcgggtacc gaactcgtct cctacggcat cgagggcctc 300
gacgagatca tccaggatct caacgccgcc gacgccgtcc ccggcgtggt cggctggtac 360
ccggacgtgg cgggtgacac cgtcgtcctg gaggtcctgg agggttccgg agccgacgtg 420
agcggcctgc tcgccgacgc cggcgtggac gcctcggccg tcgaggtgac cagcagtgcg 480
cagcccgagc tctacgccga catcatcggc ggtctggcct acaccatggg cggccgctgt 540
tcggtcggat tcgcggccac caacgccgcc ggtcagcccg gattcgtcac cgccggtcac 600
tgtggccgcg tgggcaccca ggtgagcatc ggcaacggcc agggcgtctt cgagcagtcc 660
atcttcccgg gcaacgacgc cgccttcgtc cgcggcacgt ccaacttcac gctgaccaac 720
ctggtcagcc gctacaacac cggcggttac gccaccgtcg ccggccacaa ccaggcgccc 780
atcggctcct ccgtctgccg ctccggctcc accaccggct ggcactgcgg caccatccag 840
gcccgcggcc agtcggtgag ctaccccgag ggcaccgtca ccaacatgac ccggaccacc 900
gtgtgcgccg agcccggcga ctccggcggc tcctacatct ccggcaacca ggcccagggc 960
gtcacctccg gcggctccgg caactgccgc accggcggga ccaccttcta ccaggaggtc 1020
acccccatgg tgaactcctg gggcgtccgt ctccggacct aa 1062
<210>37
<211>353
<212>PRT
<213>葱绿拟诺卡氏菌(Nocardiopsis prasina)DSM 15648
<220>
<221>PROPEP
<222>(1)..(165)
<220>
<221>mat_peptide
<222>(166)..(353)
<400>37
Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala
-165 -160 -155
Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro
-150 -145 -140
Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu
-135 -130 -125
Val Asp Glu Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly
-120 -115 -110
Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp
-105 -100 -95 -90
Ala Ala Ser Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu
-85 -80 -75
Val Ser Tyr Gly Ile Glu Gly Leu Asp Glu Ile Ile Gln Asp Leu Asn
-70 -65 -60
Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala
-55 -50 -45
Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val
-40 -35 -30
Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val
-25 -20 -15 -10
Thr Ser Ser Ala Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu
-5 -1 1 5
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
10 15 20
Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val
25 30 35
Gly Thr Gln Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu Gln Ser
40 45 50 55
Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
60 65 70
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr
75 80 85
Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser
90 95 100
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln
105 110 115
Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr
120 125 130 135
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Sec Gly Asn
140 145 150
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly
155 160 165
Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly
170 175 180
Val Arg Leu Arg Thr
185
<210>38
<211>43
<212>DNA
<213>人工序列
<220>
<223>引物1346
<400>38
gttcatcgat cgcatcggct gccaccggac cgctccccca gtc 43
<210>39
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物1602
<400>39
gcggatccta ttaggtccgg agacggacgc cccaggag 38
<210>40
<211>1062
<212>DNA
<213>葱绿拟诺卡氏菌(Nocardiopsis prasina)DSM 15649
<400>40
gccaccggac cactccccca gtcacccacc ccggaggccg acgccgtctc catgcaggag 60
gcgctccagc gcgacctcgg cctgaccccg cttgaggccg atgaactgct ggccgcccag 120
gacaccgcct tcgaggtcga cgaggccgcg gccgaggccg ccggtgacgc ctacggcggc 180
tccgtcttcg acaccgagac cctggaactg accgtcctgg tcaccgactc cgccgcggtc 240
gaggcggtgg aggccaccgg cgccgggacc gaactggtct cctacggcat cacgggcctc 300
gacgagatcg tcgaggagct caacgccgcc gacgccgttc ccggcgtggt cggctggtac 360
ccggacgtcg cgggtgacac cgtcgtgctg gaggtcctgg agggttccgg cgccgacgtg 420
ggcggcctgc tcgccgacgc cggcgtggac gcctcggcgg tcgaggtgac caccaccgag 480
cagcccgagc tgtacgccga catcatcggc ggtctggcct acaccatggg cggccgctgt 540
tcggtcggct tcgcggccac caacgccgcc ggtcagcccg ggttcgtcac cgccggtcac 600
tgtggccgcg tgggcaccca ggtgaccatc ggcaacggcc ggggcgtctt cgagcagtcc 660
atcttcccgg gcaacgacgc cgccttcgtc cgcggaacgt ccaacttcac gctgaccaac 720
ctggtcagcc gctacaacac cggcggctac gccaccgtcg ccggtcacaa ccaggcgccc 780
atcggctcct ccgtctgccg ctccggctcc accaccggtt ggcactgcgg caccatccag 840
gcccgcggcc agtcggtgag ctaccccgag ggcaccgtca ccaacatgac gcggaccacc 900
gtgtgcgccg agcccggcga ctccggcggc tcctacatct ccggcaacca ggcccagggc 960
gtcacctccg gcggctccgg caactgccgc accggcggga ccaccttcta ccaggaggtc 1020
acccccatgg tgaactcctg gggcgtccgt ctccggacct aa 1062
<210>41
<211>353
<212>PRT
<213>葱绿拟诺卡氏菌(Nocardiopsis prasina)DSM 15649
<220>
<221>PROPEP
<222>(1)..(165)
<220>
<221>mat_peptide
<222>(166)..(353)
<400>41
Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala
-165 -160 -155
Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro
-150 -145 -140
Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu
-135 -130 -125
Val Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly
-120 -115 -110
Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp
-105 -100 -95 -90
Ser Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu
-85 -80 -75
Val Ser Tyr Gly Ile Thr Gly Leu Asp Glu Ile Val Glu Glu Leu Asn
-70 -65 -60
Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala
-55 -50 -45
Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val
-40 -35 -30
Gly Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val
-25 -20 -15 -10
Thr Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu
-5 -1 1 5
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
10 15 20
Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val
25 30 35
Gly Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser
40 45 50 55
Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
60 65 70
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr
75 80 85
Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser
90 95 100
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln
105 110 115
Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr
120 125 130 135
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Asn
140 145 150
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly
155 160 165
Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly
170 175 180
Val Arg Leu Arg Thr
185
<210>42
<211>43
<212>DNA
<213>人工序列
<220>
<223>引物1603
<400>42
gttcatcgat cgcatcggct gccaccggac cactccccca gtc 43
<210>43
<211>353
<212>PRT
<213>拟诺卡氏菌(Nocardiopsis sp.)NRRL 18262
<220>
<221>PROPEP
<222>(1)..(165)
<220>
<221>mat_peptide
<222>(166)..(1059)
<400>43
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala
-165 -160 -155
Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser
-150 -145 -140
Ala Glu Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu
-135 -130 -125
Val Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly
-120 -115 -110
Ser Val Phe Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp
-105 -100 -95 -90
Ala Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu
-85 -80 -75
Val Ser Tyr Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn
-70 -65 -60
Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala
-55 -50 -45
Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val
-40 -35 -30
Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val
-25 -20 -15 -10
Thr Thr Ser Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu
-5 -1 1 5
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
10 15 20
Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val
25 30 35
Gly Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser
40 45 50 55
Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
60 65 70
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr
75 80 85
Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser
90 95 100
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln
105 110 115
Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr
120 125 130 135
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr
140 145 150
Gin Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly
155 160 165
Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly
170 175 180
Val Arg Leu Arg Thr
185
<210>44
<211>1164
<212>DNA
<213>人工序列
<220>
<223>合成性蛋白酶编码基因
<220>
<221>CDS
<222>(1)..(1164)
<223>全长蛋白酶
<220>
<221>sig_peptide
<222>(1)..(81)
<220>
<221>misc_feature
<222>(82)..(1164)
<223>前肽
<220>
<221>mat_peptide
<222>(577)..(1164)
<400>44
atg aaa aaa ccg ctg gga aaa att gtc gca agc aca gca ctt ctt 45
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
-190 -185 -180
att tca gtg gca ttt agc tca tct att gca tca gca gct aca gga 90
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
-175 -170 -165
gca tta ccg cag tct ccg aca ccg gaa gca gat gca gtc tca atg 135
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
-160 -155 -150
caa gaa gca ctg caa aga gat ctt gat ctt aca tca gca gaa gca 180
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
-145 -140 -135
gaa gaa ctt ctt gct gca caa gat aca gca ttt gaa gtg gat gaa 225
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
-130 -125 -120
gca gcg gca gaa gca gca gga gat gca tat ggc ggc tca gtt ttt 270
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
-115 -110 -105
gat aca gaa tca ctt gaa ctt aca gtt ctt gtt aca gat gca gca gca 318
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
-100 -95 -90
gtt gaa gca gtt gaa gca aca gga gca gga aca gta ctt gtt tca tat 366
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Val Leu Val Ser Tyr
-85 -80 -75
gga att gat ggc ctt gat gaa att gtt caa gaa ctg aat gca gct gat 414
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70 -65 -60 -55
gct gtt ccg ggc gtt gtt ggc tgg tat ccg gat gtt gct gga gat aca 462
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
-50 -45 -40
gtt gtc ctt gaa gtt ctt gaa gga tca ggc gca gat gtt tca ggc ctg 510
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
-35 -30 -25
ctg gca gac gca gga gtc gat gca tca gca gtt gaa gtt aca aca tca 558
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
-20 -15 -10
gat caa ccg gaa ctt tat gca gat att att ggc ggc ctg gca tat tat 606
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Tyr
-5 -1 1 5 10
atg ggc ggc aga tgc agc gtt ggc ttt gca gca aca aat gca tca ggc 654
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ser Gly
15 20 25
caa ccg ggc ttt gtt aca gca ggc cat tgc ggc aca gtt ggc aca cca 702
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Pro
30 35 40
gtt tca att ggc aat ggc aaa ggc gtt ttt gaa cga agc att ttt ccg 750
Val Ser Ile Gly Asn Gly Lys Gly Val Phe Glu Arg Ser Ile Phe Pro
45 50 55
ggc aat gat tca gca ttt gtt aga ggc aca tca aat ttt aca ctt aca 798
Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
60 65 70
aat ctg gtt tca aga tat aat tca ggc ggc tat gca aca gtt gca ggc 846
Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Ala Thr Val Ala Gly
75 80 85 90
cat aat caa gca ccg att ggc tca gca gtt tgc aga tca ggc tca aca 894
His Asn Gln Ala Pro Ile Gly Ser Ala Val Cys Arg Ser Gly Ser Thr
95 100 105
aca ggc tgg cat tgc ggc aca att caa gca aga aat caa aca gtt agg 942
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg
110 115 120
tat ccg caa ggc aca gtt tat agt ctg aca aga aca aca gtt tgt gca 990
Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr Thr Val Cys Ala
125 130 135
gaa ccg ggc gat tca ggc ggc tca tat att agc ggc act caa gca caa 1038
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
140 145 150
ggc gtt aca tca ggc ggc tca ggc aat tgc agt gct ggc ggc aca aca 1086
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Ala Gly Gly Thr Thr
155 160 165 170
tat tac caa gaa gtt aat ccg atg ctt agt tca tgg ggc ctt aca ctt 1134
Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser Trp Gly Leu Thr Leu
175 180 185
aga aca caa tcg cat gtt caa tcc gct cca 1164
Arg Thr Gln Ser His Val Gln Ser Ala Pro
190 195
<210>45
<211>388
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>45
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
-190 -185 -180
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
-175 -170 -165
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
-160 -155 -150
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
-145 -140 -135
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
-130 -125 -120
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
-115 -110 -105
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
-100 -95 -90
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Val Leu Val Ser Tyr
-85 -80 -75
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70 -65 -60 -55
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
-50 -45 -40
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
-35 -30 -25
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
-20 -15 -10
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Tyr
-5 -1 1 5 10
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ser Gly
15 20 25
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Pro
30 35 40
Val Ser Ile Gly Asn Gly Lys Gly Val Phe Glu Arg Ser Ile Phe Pro
45 50 55
Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
60 65 70
Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Ala Thr Val Ala Gly
75 80 85 90
His Asn Gln Ala Pro Ile Gly Ser Ala Val Cys Arg Ser Gly Ser Thr
95 100 105
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg
110 115 120
Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr Thr Val Cys Ala
125 130 135
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
140 145 150
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Ala Gly Gly Thr Thr
155 160 165 170
Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser Trp Gly Leu Thr Leu
175 180 185
Arg Thr Gln Ser His Val Gln Ser Ala Pro
190 195
<210>46
<211>165
<212>PRT
<213>人工序列
<220>
<223>改组的前肽0-2.19
<220>
<221>PROPEP
<222>(1)..(165)
<400>46
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val
1 5 10 15
Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu
20 25 30
Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
35 40 45
Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe Asp
50 55 60
Thr Glu Ser Leu Thr Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val
65 70 75 80
Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly
85 90 95
Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala
100 105 110
Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val
115 120 125
Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu
130 135 140
Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser Asp
145 150 155 160
Gln Pro Glu Leu Tyr
165
<210>47
<211>166
<212>PRT
<213>人工序列
<220>
<223>改组的前肽G-2.73
<220>
<221>PROPEP
<222>(1)..(166)
<400>47
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val
1 5 10 15
Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Ser Ser Ala Glu
20 25 30
Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
35 40 45
Ala Ala Ala Gly Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe Asp
50 55 60
Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val
65 70 75 80
Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly
85 90 95
Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala
100 105 110
Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val
115 120 125
Val Val Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu
130 135 140
Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr
145 150 155 160
Glu Gln Pro Glu Leu Tyr
165
<210>48
<211>166
<212>PRT
<213>人工序列
<220>
<223>改组的前肽G-1.43
<220>
<221>PROPEP
<222>(1)..(166)
<400>48
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val
1 5 10 15
Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser Ser Ser Gln
20 25 30
Ala Glu Glu Leu Leu Asp Ala Gln Ala Glu Ser Phe Glu Ile Asp Glu
35 40 45
Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Ile Phe Asp
50 55 60
Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val
65 70 75 80
Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly
85 90 95
Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala
100 105 110
Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val
115 120 125
Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu
130 135 140
Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr
145 150 155 160
Glu Gln Pro Glu Leu Tyr
165
<210>49
<211>166
<212>PRT
<213>人工序列
<220>
<223>改组的前肽G-2.6
<220>
<221>PROPEP
<222>(1)..(166)
<400>49
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val
1 5 10 15
Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu
20 25 30
Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
35 40 45
Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Ile Phe Asp
50 55 60
Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ser Ser Ser Val
65 70 75 80
Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly
85 90 95
Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala
100 105 110
Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val
115 120 125
Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu
130 135 140
Ala Gly Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr
145 150 155 160
Glu Gln Pro Glu Leu Tyr
165
<210>50
<211>165
<212>PRT
<213>人工序列
<220>
<223>改组的前肽G-2.5
<220>
<221>PROPEP
<222>(1)..(165)
<400>50
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val
1 5 10 15
Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro Leu Glu
20 25 30
Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
35 40 45
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe Asp
50 55 60
Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val
65 70 75 80
Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly
85 90 95
Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala
100 105 110
Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val
115 120 125
Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu
130 135 140
Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Pro Ala Ala
145 150 155 160
Arg Pro Glu Leu Tyr
165
<210>51
<211>166
<212>PRT
<213>人工序列
<220>
<223>改组的前肽G-2.3
<220>
<221>PROPEP
<222>(1)..(166)
<400>51
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Asp Gly Ala Glu Ala
1 5 10 15
Thr Thr Met Val Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro Ala
20 25 30
Glu Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp
35 40 45
Glu Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Ile Phe
50 55 60
Asp Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr Asp Ala Ala Ala
65 70 75 80
Val Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His
85 90 95
Gly Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp
100 105 110
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
115 120 125
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Tyr Ser Leu
130 135 140
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Pro Ala
145 150 155 160
Ala Gln Pro Glu Leu Tyr
165
<210>52
<211>166
<212>PRT
<213>人工序列
<220>
<223>改组的前肽G-1.4
<220>
<221>PROPEP
<222>(1)..(166)
<400>52
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val
1 5 10 15
Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser Ser Ser Gln
20 25 30
Ala Glu Glu Leu Leu Asp Ala Gln Ala Glu Ser Phe Glu Ile Asp Glu
35 40 45
Ala Ala Ala Ala Ala Ala Ala Asp Ser Tyr Gly Gly Ser Ile Phe Asp
50 55 60
Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val
65 70 75 80
Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly
85 90 95
Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala
100 105 110
Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val
115 120 125
Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu
130 135 140
Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr
145 150 155 160
Glu Gln Pro Glu Leu Tyr
165
<210>53
<211>166
<212>PRT
<213>人工序列
<220>
<223>改组的前肽G-1.2
<220>
<221>PROPEP
<222>(1)..(166)
<400>53
Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val
1 5 10 15
Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu
20 25 30
Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
35 40 45
Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Ile Phe Asp
50 55 60
Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ser Ser Ser Val
65 70 75 80
Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly
85 90 95
Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala
100 105 110
Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val
115 120 125
Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu
130 135 140
Ala Gly Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr
145 150 155 160
Glu Gln Pro Glu Leu Tyr
165
Claims (21)
1.分泌的成熟多肽,其成熟后具有蛋白酶活性,该多肽在被表达时和成熟前含有异源前-区,该多肽:
(a)含有与SEQ ID NO:28;SEQ ID NO:33;SEQ ID NO:37;SEQ ID NO:41;SEQ ID NO:43或SEQ ID NO:45所示多肽成熟部分的氨基酸序列至少70%相同的氨基酸序列;
(b)含有与SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:25;SEQ ID NO:31;SEQ ID NO:32;SEQ ID NO:36;SEQ ID NO:40或SEQ ID NO:44所示多核苷酸编码的多肽的成熟部分的氨基酸序列至少70%相同的氨基酸序列;
(c)含有成熟部分,该部分是具有SEQ ID NO:28;SEQ ID NO:33;SEQID NO:37;SEQ ID NO:41;SEQ ID NO:43或SEQ ID NO:45所示氨基酸序列的多肽的成熟部分的变体,该区段含有一个或多个氨基酸取代,缺失,延伸和/或插入;
(d)是(a),(b)或(c)的等位基因变体;
(e)是(a),(b),(c)或(d)的片段。
2.根据权利要求1的多肽,其中异源前-区得自蛋白酶,优选前-区得自S2A或S1E蛋白酶,最优选它与SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:33,SEQ ID NO:37,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ IDNO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:52或SEQ ID NO:53所示的前-区至少70%相同。
3.根据权利要求1或2的多肽,它是野生型多肽,野生型多肽的人工变体,经改组的多肽或蛋白质-经改造的多肽,其中与野生型相比,所述变体在C-末端添加了一个或多个氨基酸。
4.根据权利要求1-3中任一项的多肽,其中多肽C-末端的最后4个氨基酸中含有至少3个非-极性的或不带电的极性氨基酸。
5.根据权利要求3的多肽,其中一个或多个添加的氨基酸是非-极性的或不带电的。
6.根据权利要求5的多肽,其中一个或多个添加的氨基酸是Q,S,V, A或P中的一个或多个。
7.根据权利要求3的多肽,其中一个或多个添加的氨基酸选自:QSHVQSAP,QSAP,QP,TL,TT,QL,TP,LP,TI,IQ,QP,PI,LT,TQ,IT,QQ和PQ。
8.根据权利要求1-7中任一项的多肽,当其被表达和成熟前,含有异源分泌信号肽,当多肽被分泌时,所述信号肽从多肽上被裂解下来,优选异源分泌信号肽得自异源蛋白酶。
9.根据权利要求8的多肽,其中异源分泌信号肽含有与SEQ ID NO:2或SEQ ID NO:44的多核苷酸1-81所编码氨基酸序列的序列同一性至少为70%的氨基酸序列。
10.分离的多核苷酸,其编码权利要求1-9中任一项所限定的多肽。
11.重组表达载体或多核苷酸构建体,其含有权利要求10所限定的多核苷酸。
12.重组宿主细胞,其含有权利要求10所限定的多核苷酸,或权利要求11所限定的表达载体或多核苷酸构建体。
13.根据权利要求12的重组宿主细胞,其为芽孢杆菌属细胞。
14.转基因植物或植物部分,其含有权利要求10所限定的多核苷酸,或权利要求11所限定的表达载体或多核苷酸构建体。
15.转基因的非-人动物或其产物或其组件,其含有权利要求10所限定的多核苷酸,或权利要求11所限定的表达载体或多核苷酸构建体。
16.制备权利要求1-9中任一项所限定的多肽的方法,所述方法包括:(a)培养权利要求12或13所限定的重组宿主细胞,或权利要求14或15所限定的转基因植物或动物,以产生含有多肽的上清液,和任选(b)回收多肽。
17.动物饲料添加剂,其含有至少一种由权利要求1-9中任一项所限定的多肽;和
(a)至少一种脂溶性维生素,和/或
(b)至少一种水溶性维生素,和/或
(c)至少一种痕量矿物质。
18.动物饲料组合物,其粗蛋白含量为50至800g/kg,并含有至少一种由权利要求1-9中任一项所限定的多肽,或至少一种权利要求17所述的饲料添加剂。
19.组合物,其含有至少一种由权利要求1-9中任一项所限定的多肽,以及至少一种选自植酸酶(EC 3.1.3.8或3.1.3.26);木聚糖酶(EC 3.2.1.8);半乳聚糖酶(EC 3.2.1.89);α-半乳糖苷酶(EC 3.2.1.22);蛋白酶(EC 3.4.-.-);磷脂酶A1(EC 3.1.1.32);磷脂酶A2(EC 3.1.1.4);溶血磷脂酶(EC 3.1.1.5);磷脂酶C(3.1.4.3);磷脂酶D(EC 3.1.4.4)和/或β-葡聚糖酶(EC 3.2.1.4或EC3.2.1.6)的其它酶。
20.使用至少一种由权利要求1-9中任一项所限定的多肽改善动物饲料的营养价值,增加动物饮食中可消化和/或可溶的蛋白质,增加动物饮食中蛋白质的水解程度,和/或处理植物蛋白质的方法,所述方法包括使动物饲料和/或用于动物饲料的组合物中包含多肽。
21.使用至少一种由权利要求1-9中任一项所限定的多肽的方法,所述方法包括使清洁剂配方中包含多肽。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DKPA200300916 | 2003-06-19 | ||
DKPA200300916 | 2003-06-19 | ||
DKPA200301847 | 2003-12-12 | ||
DKPA200400334 | 2004-03-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1836036A true CN1836036A (zh) | 2006-09-20 |
Family
ID=37003298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800236184A Pending CN1836036A (zh) | 2003-06-19 | 2004-06-21 | 改进的蛋白酶及其制备方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1836036A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102378581A (zh) * | 2009-04-02 | 2012-03-14 | 诺维信公司 | 用于制备基于乳的蛋白质水解产物的方法 |
CN104114034A (zh) * | 2011-11-17 | 2014-10-22 | 帝斯曼知识产权资产管理有限公司 | 酸稳定的蛋白酶在动物饲料中的用途,优选地是增加球虫疫苗接种的肉鸡的生产性能 |
-
2004
- 2004-06-21 CN CNA2004800236184A patent/CN1836036A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102378581A (zh) * | 2009-04-02 | 2012-03-14 | 诺维信公司 | 用于制备基于乳的蛋白质水解产物的方法 |
CN104114034A (zh) * | 2011-11-17 | 2014-10-22 | 帝斯曼知识产权资产管理有限公司 | 酸稳定的蛋白酶在动物饲料中的用途,优选地是增加球虫疫苗接种的肉鸡的生产性能 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1836035A (zh) | 改进的蛋白酶及其制备方法 | |
CN1809635A (zh) | 蛋白酶 | |
AU782372B2 (en) | Subtilase variants having an improved wash performance on egg stains | |
CN1774504A (zh) | 蛋白酶 | |
CN1262639C (zh) | 新的宿主细胞和生产蛋白质的方法 | |
CN1247777C (zh) | 具有氨肽酶活性的多肽及其编码核酸 | |
CN1263859C (zh) | 具有蛋白酶活性的多肽的编码核酸 | |
CN1867668A (zh) | 蛋白酶变体 | |
CN1211483C (zh) | 具有分支酶活性的多肽及其编码核酸 | |
CN1314951A (zh) | 生产葡糖胺的方法和原料 | |
CN1902310A (zh) | 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸 | |
CN1128879C (zh) | 超耐热蛋白酶基因 | |
CN1509330A (zh) | 具有纤维二糖酶活性的多肽和编码其的多核苷酸 | |
CN1878785A (zh) | 适于改变油质酵母中多不饱和脂肪酸水平的△12去饱和酶 | |
CN1447855A (zh) | 枯草杆菌酶 | |
CN1620501A (zh) | 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸 | |
CN1871344A (zh) | 在洗涤剂中具有改善稳定性的蛋白酶 | |
US8465959B2 (en) | Proteases and methods for producing them | |
CN1845989A (zh) | 抗微生物剂的重组产生 | |
CN1809634A (zh) | 蛋白酶 | |
CN1190495C (zh) | 在单端孢菌毒素缺陷的丝状真菌突变细胞中生产异源多肽的方法 | |
CN1195058C (zh) | 草酰乙酸水解酶缺陷型真菌宿主细胞 | |
CN1268746C (zh) | 用于在真菌细胞中生产多肽的方法 | |
US6727085B2 (en) | Subtilase variants having an improved wash performance on egg stains | |
CN1301307A (zh) | 在丝状真菌突变细胞中生产多肽的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20060920 |