CN101035898A - 具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸 - Google Patents
具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸 Download PDFInfo
- Publication number
- CN101035898A CN101035898A CNA2005800338182A CN200580033818A CN101035898A CN 101035898 A CN101035898 A CN 101035898A CN A2005800338182 A CNA2005800338182 A CN A2005800338182A CN 200580033818 A CN200580033818 A CN 200580033818A CN 101035898 A CN101035898 A CN 101035898A
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- seq
- leu
- sequence
- nucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010011619 6-Phytase Proteins 0.000 title claims abstract description 127
- 230000000694 effects Effects 0.000 title claims abstract description 89
- 108090000765 processed proteins & peptides Proteins 0.000 title claims description 436
- 229920001184 polypeptide Polymers 0.000 title claims description 416
- 102000004196 processed proteins & peptides Human genes 0.000 title claims description 416
- 229940085127 phytase Drugs 0.000 title claims description 110
- 102000040430 polynucleotide Human genes 0.000 title claims description 100
- 108091033319 polynucleotide Proteins 0.000 title claims description 100
- 239000002157 polynucleotide Substances 0.000 title claims description 100
- 241001465754 Metazoa Species 0.000 claims abstract description 70
- 238000004519 manufacturing process Methods 0.000 claims abstract description 11
- 125000003729 nucleotide group Chemical group 0.000 claims description 145
- 239000002773 nucleotide Substances 0.000 claims description 143
- 235000001014 amino acid Nutrition 0.000 claims description 101
- 150000001413 amino acids Chemical class 0.000 claims description 101
- 238000000034 method Methods 0.000 claims description 66
- 239000000203 mixture Substances 0.000 claims description 49
- 150000007523 nucleic acids Chemical class 0.000 claims description 40
- 102000039446 nucleic acids Human genes 0.000 claims description 39
- 108020004707 nucleic acids Proteins 0.000 claims description 39
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 38
- 239000000654 additive Substances 0.000 claims description 29
- 239000012634 fragment Substances 0.000 claims description 23
- 230000000996 additive effect Effects 0.000 claims description 22
- 230000008859 change Effects 0.000 claims description 21
- 238000009396 hybridization Methods 0.000 claims description 21
- 238000002360 preparation method Methods 0.000 claims description 19
- 230000009261 transgenic effect Effects 0.000 claims description 18
- 239000013604 expression vector Substances 0.000 claims description 17
- 235000013311 vegetables Nutrition 0.000 claims description 14
- 230000000295 complement effect Effects 0.000 claims description 13
- 229940088594 vitamin Drugs 0.000 claims description 13
- 229930003231 vitamin Natural products 0.000 claims description 13
- 235000013343 vitamin Nutrition 0.000 claims description 13
- 239000011782 vitamin Substances 0.000 claims description 13
- 102000035195 Peptidases Human genes 0.000 claims description 11
- 108091005804 Peptidases Proteins 0.000 claims description 11
- 239000004382 Amylase Substances 0.000 claims description 10
- 108010065511 Amylases Proteins 0.000 claims description 10
- 102000013142 Amylases Human genes 0.000 claims description 10
- 235000019418 amylase Nutrition 0.000 claims description 10
- 238000003259 recombinant expression Methods 0.000 claims description 9
- 235000019750 Crude protein Nutrition 0.000 claims description 8
- 230000000050 nutritive effect Effects 0.000 claims description 8
- 239000011573 trace mineral Substances 0.000 claims description 8
- 235000013619 trace mineral Nutrition 0.000 claims description 8
- 150000003722 vitamin derivatives Chemical class 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 6
- 230000037431 insertion Effects 0.000 claims description 6
- 101710152845 Arabinogalactan endo-beta-1,4-galactanase Proteins 0.000 claims description 4
- 101710130006 Beta-glucanase Proteins 0.000 claims description 4
- 101710147028 Endo-beta-1,4-galactanase Proteins 0.000 claims description 4
- 102000005840 alpha-Galactosidase Human genes 0.000 claims description 4
- 108010030291 alpha-Galactosidase Proteins 0.000 claims description 4
- 102000004157 Hydrolases Human genes 0.000 claims description 3
- 108090000604 Hydrolases Proteins 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 239000002253 acid Substances 0.000 abstract description 36
- 241001494522 Citrobacter amalonaticus Species 0.000 abstract description 19
- 241000949040 Citrobacter gillenii Species 0.000 abstract description 15
- 241000588923 Citrobacter Species 0.000 abstract description 9
- 108091069661 histidine phosphatase family Proteins 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 152
- 108090000623 proteins and genes Proteins 0.000 description 103
- 229940024606 amino acid Drugs 0.000 description 91
- 241000196324 Embryophyta Species 0.000 description 50
- 108020004414 DNA Proteins 0.000 description 48
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 44
- 102000004169 proteins and genes Human genes 0.000 description 43
- 241000193830 Bacillus <bacterium> Species 0.000 description 42
- 235000018102 proteins Nutrition 0.000 description 40
- 239000000523 sample Substances 0.000 description 32
- 230000014509 gene expression Effects 0.000 description 31
- 241000894006 Bacteria Species 0.000 description 30
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 30
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 29
- 102000004190 Enzymes Human genes 0.000 description 28
- 108090000790 Enzymes Proteins 0.000 description 28
- 229940088598 enzyme Drugs 0.000 description 28
- 108010076504 Protein Sorting Signals Proteins 0.000 description 27
- 239000000047 product Substances 0.000 description 21
- BLGYKMPTFOIOCW-UHFFFAOYSA-N 2-hydroxypropane-1,2,3-tricarboxylic acid;propanedioic acid Chemical compound OC(=O)CC(O)=O.OC(=O)CC(O)(C(O)=O)CC(O)=O BLGYKMPTFOIOCW-UHFFFAOYSA-N 0.000 description 19
- 230000001580 bacterial effect Effects 0.000 description 17
- -1 methane amide Chemical class 0.000 description 17
- 238000012360 testing method Methods 0.000 description 17
- 108091026890 Coding region Proteins 0.000 description 16
- 230000002538 fungal effect Effects 0.000 description 16
- 230000000968 intestinal effect Effects 0.000 description 15
- 239000000463 material Substances 0.000 description 15
- 241000282326 Felis catus Species 0.000 description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 239000000758 substrate Substances 0.000 description 14
- 230000033228 biological regulation Effects 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 13
- 239000003550 marker Substances 0.000 description 13
- 241000194108 Bacillus licheniformis Species 0.000 description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 12
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 12
- 239000002853 nucleic acid probe Substances 0.000 description 12
- 238000003752 polymerase chain reaction Methods 0.000 description 12
- 241000228245 Aspergillus niger Species 0.000 description 11
- 240000006439 Aspergillus oryzae Species 0.000 description 11
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 11
- 241000233866 Fungi Species 0.000 description 11
- 229910052799 carbon Inorganic materials 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 239000000126 substance Substances 0.000 description 11
- 230000014616 translation Effects 0.000 description 11
- 101100148259 Actinobacillus pleuropneumoniae apxIIA gene Proteins 0.000 description 10
- 240000007594 Oryza sativa Species 0.000 description 10
- 235000007164 Oryza sativa Nutrition 0.000 description 10
- 241000499912 Trichoderma reesei Species 0.000 description 10
- 108010047495 alanylglycine Proteins 0.000 description 10
- 101150050411 appA gene Proteins 0.000 description 10
- 238000013461 design Methods 0.000 description 10
- 235000005911 diet Nutrition 0.000 description 10
- 230000037213 diet Effects 0.000 description 10
- 244000005700 microbiome Species 0.000 description 10
- 235000009566 rice Nutrition 0.000 description 10
- 239000006228 supernatant Substances 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 9
- 108010082495 Dietary Plant Proteins Proteins 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 238000010168 coupling process Methods 0.000 description 9
- 238000005859 coupling reaction Methods 0.000 description 9
- 230000012010 growth Effects 0.000 description 9
- 230000010076 replication Effects 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 108700028369 Alleles Proteins 0.000 description 8
- 241000228212 Aspergillus Species 0.000 description 8
- 241000351920 Aspergillus nidulans Species 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 8
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 8
- 235000002949 phytic acid Nutrition 0.000 description 8
- 241001513093 Aspergillus awamori Species 0.000 description 7
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 241000282898 Sus scrofa Species 0.000 description 7
- 238000013016 damping Methods 0.000 description 7
- 230000008034 disappearance Effects 0.000 description 7
- 239000012530 fluid Substances 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 229910052500 inorganic mineral Inorganic materials 0.000 description 7
- 239000008101 lactose Substances 0.000 description 7
- 235000010755 mineral Nutrition 0.000 description 7
- 239000011707 mineral Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 6
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 6
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 6
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 6
- 241000235349 Ascomycota Species 0.000 description 6
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 6
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 6
- 241000223221 Fusarium oxysporum Species 0.000 description 6
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 6
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 6
- OEIDWQHTRYEYGG-QEJZJMRPSA-N Gln-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N OEIDWQHTRYEYGG-QEJZJMRPSA-N 0.000 description 6
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 6
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 6
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 6
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 6
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 6
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 6
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 6
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 6
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 6
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 6
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 6
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 6
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 6
- 101710137500 T7 RNA polymerase Proteins 0.000 description 6
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 6
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 6
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 6
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 6
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 6
- 240000008042 Zea mays Species 0.000 description 6
- FENRSEGZMITUEF-ATTCVCFYSA-E [Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].OP(=O)([O-])O[C@@H]1[C@@H](OP(=O)([O-])[O-])[C@H](OP(=O)(O)[O-])[C@H](OP(=O)([O-])[O-])[C@H](OP(=O)(O)[O-])[C@H]1OP(=O)([O-])[O-] Chemical compound [Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].OP(=O)([O-])O[C@@H]1[C@@H](OP(=O)([O-])[O-])[C@H](OP(=O)(O)[O-])[C@H](OP(=O)([O-])[O-])[C@H](OP(=O)(O)[O-])[C@H]1OP(=O)([O-])[O-] FENRSEGZMITUEF-ATTCVCFYSA-E 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010087924 alanylproline Proteins 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 6
- 108010038633 aspartylglutamate Proteins 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 108010060199 cysteinylproline Proteins 0.000 description 6
- 239000004459 forage Substances 0.000 description 6
- 108010078144 glutaminyl-glycine Proteins 0.000 description 6
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 6
- 235000016709 nutrition Nutrition 0.000 description 6
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 6
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 6
- 108010090894 prolylleucine Proteins 0.000 description 6
- 230000008521 reorganization Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 229940083982 sodium phytate Drugs 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 5
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 5
- 244000063299 Bacillus subtilis Species 0.000 description 5
- 241000221198 Basidiomycota Species 0.000 description 5
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 5
- 241000223218 Fusarium Species 0.000 description 5
- 239000007995 HEPES buffer Substances 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 5
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 5
- 241000235403 Rhizomucor miehei Species 0.000 description 5
- 241000209140 Triticum Species 0.000 description 5
- 235000021307 Triticum Nutrition 0.000 description 5
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 239000011575 calcium Substances 0.000 description 5
- 229910052791 calcium Inorganic materials 0.000 description 5
- 238000004040 coloring Methods 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 235000014304 histidine Nutrition 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 230000037039 plant physiology Effects 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 239000011734 sodium Substances 0.000 description 5
- QAOWNCQODCNURD-UHFFFAOYSA-N sulfuric acid Substances OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 4
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 4
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 4
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 4
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 4
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 4
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 4
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 4
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 4
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 4
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 4
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 4
- PYDIIVKGTBRIEL-SZMVWBNQSA-N Arg-Trp-Pro Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(O)=O PYDIIVKGTBRIEL-SZMVWBNQSA-N 0.000 description 4
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 4
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 4
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 4
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 4
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 4
- JTRDJYIZIKCIRC-AJNGGQMLSA-N Asp-Leu-Leu-Gln Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JTRDJYIZIKCIRC-AJNGGQMLSA-N 0.000 description 4
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 241000219193 Brassicaceae Species 0.000 description 4
- 244000025254 Cannabis sativa Species 0.000 description 4
- 108010059892 Cellulase Proteins 0.000 description 4
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 4
- 108010000912 Egg Proteins Proteins 0.000 description 4
- 102000002322 Egg Proteins Human genes 0.000 description 4
- 241000567178 Fusarium venenatum Species 0.000 description 4
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 4
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 4
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 4
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 4
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 4
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 4
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 4
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 4
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 4
- ISXJHXGYMJKXOI-GUBZILKMSA-N Glu-Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O ISXJHXGYMJKXOI-GUBZILKMSA-N 0.000 description 4
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 4
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 4
- JDAYMLXPUJRSDJ-XIRDDKMYSA-N Glu-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 JDAYMLXPUJRSDJ-XIRDDKMYSA-N 0.000 description 4
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 4
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 4
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 4
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 4
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 4
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 4
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 4
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 4
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 4
- 241000235058 Komagataella pastoris Species 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 4
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 4
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 4
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 4
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 4
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 4
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 4
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 4
- 241000209510 Liliopsida Species 0.000 description 4
- 241000219745 Lupinus Species 0.000 description 4
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 4
- MLLKLNYPZRDIQG-GUBZILKMSA-N Lys-Cys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N MLLKLNYPZRDIQG-GUBZILKMSA-N 0.000 description 4
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 4
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 4
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 4
- ZDJICAUBMUKVEJ-CIUDSAMLSA-N Met-Ser-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O ZDJICAUBMUKVEJ-CIUDSAMLSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 241000233654 Oomycetes Species 0.000 description 4
- 244000046052 Phaseolus vulgaris Species 0.000 description 4
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 4
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- 241000209504 Poaceae Species 0.000 description 4
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 4
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 4
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 4
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 4
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 4
- 241000209056 Secale Species 0.000 description 4
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 4
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 4
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 4
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 4
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 4
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 4
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 4
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 4
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 4
- 241000223259 Trichoderma Species 0.000 description 4
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 4
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 4
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 4
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 4
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 4
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- 239000000839 emulsion Substances 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 241001233957 eudicotyledons Species 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 230000004151 fermentation Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 4
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 4
- 108010079547 glutamylmethionine Proteins 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 238000011081 inoculation Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 229910052742 iron Inorganic materials 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 210000001161 mammalian embryo Anatomy 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 229910052698 phosphorus Inorganic materials 0.000 description 4
- 239000011574 phosphorus Substances 0.000 description 4
- 244000144977 poultry Species 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 210000001938 protoplast Anatomy 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 108010009962 valyltyrosine Proteins 0.000 description 4
- MOYPZVWCTBPWEH-YFKPBYRVSA-N (2s)-2-amino-3-(1-phosphonoimidazol-4-yl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CN(P(O)(O)=O)C=N1 MOYPZVWCTBPWEH-YFKPBYRVSA-N 0.000 description 3
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 3
- 108010013043 Acetylesterase Proteins 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 244000075850 Avena orientalis Species 0.000 description 3
- 235000007319 Avena orientalis Nutrition 0.000 description 3
- 235000007558 Avena sp Nutrition 0.000 description 3
- 241000193422 Bacillus lentus Species 0.000 description 3
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 3
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 3
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 3
- 241000146399 Ceriporiopsis Species 0.000 description 3
- 241000580513 Citrobacter braakii Species 0.000 description 3
- 108091035707 Consensus sequence Proteins 0.000 description 3
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 235000019733 Fish meal Nutrition 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 241000219146 Gossypium Species 0.000 description 3
- 240000005979 Hordeum vulgare Species 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- 241000588748 Klebsiella Species 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 241000235395 Mucor Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 3
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 3
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 3
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 3
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 3
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 3
- 235000007238 Secale cereale Nutrition 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 description 3
- 235000021536 Sugar beet Nutrition 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 3
- 235000010749 Vicia faba Nutrition 0.000 description 3
- 240000006677 Vicia faba Species 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 238000012867 alanine scanning Methods 0.000 description 3
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 description 3
- 239000002585 base Substances 0.000 description 3
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 3
- 229960000846 camphor Drugs 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 235000019688 fish Nutrition 0.000 description 3
- 239000004467 fishmeal Substances 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000000774 hypoallergenic effect Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- MEFBJEMVZONFCJ-UHFFFAOYSA-N molybdate Chemical compound [O-][Mo]([O-])(=O)=O MEFBJEMVZONFCJ-UHFFFAOYSA-N 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 235000021048 nutrient requirements Nutrition 0.000 description 3
- 210000004681 ovum Anatomy 0.000 description 3
- 150000003016 phosphoric acids Chemical class 0.000 description 3
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000001810 trypsinlike Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 2
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 2
- GVJHHUAWPYXKBD-UHFFFAOYSA-N (±)-α-Tocopherol Chemical compound OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 2
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 2
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 2
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 2
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 2
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 2
- 108010025188 Alcohol oxidase Proteins 0.000 description 2
- 108010037870 Anthranilate Synthase Proteins 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 2
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 2
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- AZHXYLJRGVMQKW-UMPQAUOISA-N Arg-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N)O AZHXYLJRGVMQKW-UMPQAUOISA-N 0.000 description 2
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 2
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 2
- MLJZMGIXXMTEPO-UBHSHLNASA-N Asn-Trp-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O MLJZMGIXXMTEPO-UBHSHLNASA-N 0.000 description 2
- AECPDLSSUMDUAA-ZKWXMUAHSA-N Asn-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N AECPDLSSUMDUAA-ZKWXMUAHSA-N 0.000 description 2
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 2
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 2
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 2
- KACWACLNYLSVCA-VHWLVUOQSA-N Asp-Trp-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KACWACLNYLSVCA-VHWLVUOQSA-N 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 108090000145 Bacillolysin Proteins 0.000 description 2
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 235000016068 Berberis vulgaris Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 2
- 241001466517 Ceriporiopsis aneirina Species 0.000 description 2
- 241000871189 Chenopodiaceae Species 0.000 description 2
- 240000006162 Chenopodium quinoa Species 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 241000588919 Citrobacter freundii Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 2
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 2
- RGHNJXZEOKUKBD-SQOUGZDYSA-N D-gluconic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O RGHNJXZEOKUKBD-SQOUGZDYSA-N 0.000 description 2
- RGHNJXZEOKUKBD-UHFFFAOYSA-N D-gluconic acid Natural products OCC(O)C(O)C(O)C(O)C(O)=O RGHNJXZEOKUKBD-UHFFFAOYSA-N 0.000 description 2
- 241000238557 Decapoda Species 0.000 description 2
- 108010002069 Defensins Proteins 0.000 description 2
- 102000000541 Defensins Human genes 0.000 description 2
- 101710088194 Dehydrogenase Proteins 0.000 description 2
- 101710132690 Endo-1,4-beta-xylanase A Proteins 0.000 description 2
- 241000588921 Enterobacteriaceae Species 0.000 description 2
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 2
- 241000220485 Fabaceae Species 0.000 description 2
- 241000234642 Festuca Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 2
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 2
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 2
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 2
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 2
- QQAPDATZKKTBIY-YUMQZZPRSA-N Gln-Gly-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O QQAPDATZKKTBIY-YUMQZZPRSA-N 0.000 description 2
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 2
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 2
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 2
- SAEBUDRWKUXLOM-ACZMJKKPSA-N Glu-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O SAEBUDRWKUXLOM-ACZMJKKPSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- 102100022624 Glucoamylase Human genes 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- LGQZOQRDEUIZJY-YUMQZZPRSA-N Gly-Cys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O LGQZOQRDEUIZJY-YUMQZZPRSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- QLQDIJBYJZKQPR-BQBZGAKWSA-N Gly-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN QLQDIJBYJZKQPR-BQBZGAKWSA-N 0.000 description 2
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 2
- 102100031415 Hepatic triacylglycerol lipase Human genes 0.000 description 2
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 2
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- PBJOQLUVSGXRSW-YTQUADARSA-N His-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CN=CN4)N)C(=O)O PBJOQLUVSGXRSW-YTQUADARSA-N 0.000 description 2
- PZUZIHRPOVVHOT-KBPBESRZSA-N His-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CN=CN1 PZUZIHRPOVVHOT-KBPBESRZSA-N 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 241001480714 Humicola insolens Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 2
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- 108010029541 Laccase Proteins 0.000 description 2
- 244000211187 Lepidium sativum Species 0.000 description 2
- 235000007849 Lepidium sativum Nutrition 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 2
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 2
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 2
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 2
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 2
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 2
- MJVAVZPDRWSRRC-UHFFFAOYSA-N Menadione Chemical compound C1=CC=C2C(=O)C(C)=CC(=O)C2=C1 MJVAVZPDRWSRRC-UHFFFAOYSA-N 0.000 description 2
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 2
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 2
- WVTYEEPGEUSFGQ-LPEHRKFASA-N Met-Cys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WVTYEEPGEUSFGQ-LPEHRKFASA-N 0.000 description 2
- RMHHNLKYPOOKQN-FXQIFTODSA-N Met-Cys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O RMHHNLKYPOOKQN-FXQIFTODSA-N 0.000 description 2
- KRLKICLNEICJGV-STQMWFEESA-N Met-Phe-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 KRLKICLNEICJGV-STQMWFEESA-N 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- 108010064696 N,O-diacetylmuramidase Proteins 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 241000221961 Neurospora crassa Species 0.000 description 2
- 102000035092 Neutral proteases Human genes 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 2
- 241000194109 Paenibacillus lautus Species 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 241001676646 Peniophora lycii Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 2
- YVIVIQWMNCWUFS-UFYCRDLUSA-N Phe-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N YVIVIQWMNCWUFS-UFYCRDLUSA-N 0.000 description 2
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 2
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 2
- GAMLAXHLYGLQBJ-UFYCRDLUSA-N Phe-Val-Tyr Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC1=CC=C(C=C1)O)C(C)C)CC1=CC=CC=C1 GAMLAXHLYGLQBJ-UFYCRDLUSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000222350 Pleurotus Species 0.000 description 2
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 2
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 2
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000190932 Rhodopseudomonas Species 0.000 description 2
- 241000282849 Ruminantia Species 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 241000222480 Schizophyllum Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 2
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 2
- NJSPTZXVPZDRCU-UBHSHLNASA-N Ser-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N NJSPTZXVPZDRCU-UBHSHLNASA-N 0.000 description 2
- TUYBIWUZWJUZDD-ACZMJKKPSA-N Ser-Cys-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O TUYBIWUZWJUZDD-ACZMJKKPSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- TVPQRPNBYCRRLL-IHRRRGAJSA-N Ser-Phe-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O TVPQRPNBYCRRLL-IHRRRGAJSA-N 0.000 description 2
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 2
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 2
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 2
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 2
- 241000228341 Talaromyces Species 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 244000152045 Themeda triandra Species 0.000 description 2
- 241000223258 Thermomyces lanuginosus Species 0.000 description 2
- 241001313536 Thermothelomyces thermophila Species 0.000 description 2
- 241001494489 Thielavia Species 0.000 description 2
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 2
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 2
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- 235000019714 Triticale Nutrition 0.000 description 2
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 2
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 2
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 2
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 2
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 2
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 2
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 2
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 2
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 2
- 235000002098 Vicia faba var. major Nutrition 0.000 description 2
- 229930003756 Vitamin B7 Natural products 0.000 description 2
- 241000607734 Yersinia <bacteria> Species 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical class N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 2
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000000433 anti-nutritional effect Effects 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 229940054340 bacillus coagulans Drugs 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- QTPILKSJIOLICA-UHFFFAOYSA-N bis[hydroxy(phosphonooxy)phosphoryl] hydrogen phosphate Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(=O)OP(O)(=O)OP(O)(O)=O QTPILKSJIOLICA-UHFFFAOYSA-N 0.000 description 2
- 244000309466 calf Species 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000036978 cell physiology Effects 0.000 description 2
- 229940106157 cellulase Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000000536 complexating effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 229960005135 eicosapentaenoic acid Drugs 0.000 description 2
- 235000020673 eicosapentaenoic acid Nutrition 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 229950006191 gluconic acid Drugs 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 229960000367 inositol Drugs 0.000 description 2
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 2
- 230000009027 insemination Effects 0.000 description 2
- 150000002500 ions Chemical group 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000000442 meristematic effect Effects 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 230000001937 non-anti-biotic effect Effects 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000035764 nutrition Effects 0.000 description 2
- 229940049547 paraxin Drugs 0.000 description 2
- 238000002823 phage display Methods 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000003910 polypeptide antibiotic agent Substances 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 102200007392 rs10794537 Human genes 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 2
- 210000000582 semen Anatomy 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- 229910052708 sodium Inorganic materials 0.000 description 2
- 239000001632 sodium acetate Substances 0.000 description 2
- 229960004249 sodium acetate Drugs 0.000 description 2
- 235000017281 sodium acetate Nutrition 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- 230000005477 standard model Effects 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 2
- 229940038773 trisodium citrate Drugs 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 235000011912 vitamin B7 Nutrition 0.000 description 2
- 239000011735 vitamin B7 Substances 0.000 description 2
- 241000228158 x Triticosecale Species 0.000 description 2
- 101150052264 xylA gene Proteins 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 1
- ASZCVNVMQXNJGH-ZYRRHWMLSA-N (1S,2R,9S,12S)-4,12-dimethyl-13-oxotetracyclo[10.2.1.01,9.03,8]pentadeca-3,5,7-triene-2-carboxylic acid Chemical compound Cc1cccc2[C@H]3CC[C@@]4(C)C[C@@]3(CC4=O)[C@@H](C(O)=O)c12 ASZCVNVMQXNJGH-ZYRRHWMLSA-N 0.000 description 1
- JQFLYFRHDIHZFZ-RXMQYKEDSA-N (2s)-3,3-dimethylpyrrolidine-2-carboxylic acid Chemical compound CC1(C)CCN[C@@H]1C(O)=O JQFLYFRHDIHZFZ-RXMQYKEDSA-N 0.000 description 1
- CNPSFBUUYIVHAP-AKGZTFGVSA-N (2s)-3-methylpyrrolidine-2-carboxylic acid Chemical compound CC1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-AKGZTFGVSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 description 1
- OMGHIGVFLOPEHJ-UHFFFAOYSA-N 2,5-dihydro-1h-pyrrol-1-ium-2-carboxylate Chemical compound OC(=O)C1NCC=C1 OMGHIGVFLOPEHJ-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- 108010080981 3-phytase Proteins 0.000 description 1
- XNPKNHHFCKSMRV-UHFFFAOYSA-N 4-(cyclohexylamino)butane-1-sulfonic acid Chemical compound OS(=O)(=O)CCCCNC1CCCCC1 XNPKNHHFCKSMRV-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 101150008391 A1 gene Proteins 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 101710197633 Actin-1 Proteins 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241001660906 Agrocybe pediades Species 0.000 description 1
- 241000743339 Agrostis Species 0.000 description 1
- 241000220433 Albizia Species 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 241001677738 Aleuron Species 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- 108700042778 Antimicrobial Peptides Proteins 0.000 description 1
- 102000044503 Antimicrobial Peptides Human genes 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000228195 Aspergillus ficuum Species 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241000228243 Aspergillus giganteus Species 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- JEBFVOLFMLUKLF-IFPLVEIFSA-N Astaxanthin Natural products CC(=C/C=C/C(=C/C=C/C1=C(C)C(=O)C(O)CC1(C)C)/C)C=CC=C(/C)C=CC=C(/C)C=CC2=C(C)C(=O)C(O)CC2(C)C JEBFVOLFMLUKLF-IFPLVEIFSA-N 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 239000008000 CHES buffer Substances 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100520142 Caenorhabditis elegans pin-2 gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 108010031396 Catechol oxidase Proteins 0.000 description 1
- 102000030523 Catechol oxidase Human genes 0.000 description 1
- 206010057248 Cell death Diseases 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241001646018 Ceriporiopsis gilvescens Species 0.000 description 1
- 241001277875 Ceriporiopsis rivulosa Species 0.000 description 1
- 241000524302 Ceriporiopsis subrufa Species 0.000 description 1
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000701248 Chlorella virus Species 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 241000949030 Citrobacter farmeri Species 0.000 description 1
- 241000936506 Citrobacter intermedius Species 0.000 description 1
- 241000588917 Citrobacter koseri Species 0.000 description 1
- 241000949041 Citrobacter murliniae Species 0.000 description 1
- 241000949031 Citrobacter rodentium Species 0.000 description 1
- 241000949032 Citrobacter sedlakii Species 0.000 description 1
- 241000949039 Citrobacter werkmanii Species 0.000 description 1
- 241000920610 Citrobacter youngae Species 0.000 description 1
- 241000020428 Colea Species 0.000 description 1
- 244000251987 Coprinus macrorhizus Species 0.000 description 1
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 1
- 241000238424 Crustacea Species 0.000 description 1
- 241000252233 Cyprinus carpio Species 0.000 description 1
- 102100028717 Cytosolic 5'-nucleotidase 3A Human genes 0.000 description 1
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241001063191 Elops affinis Species 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 235000002756 Erythrina berteroana Nutrition 0.000 description 1
- 101000688187 Escherichia coli (strain K12) Phytase AppA Proteins 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 241000221207 Filobasidium Species 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000192128 Gammaproteobacteria Species 0.000 description 1
- 241000146398 Gelatoporia subvermispora Species 0.000 description 1
- 241000726221 Gemma Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- ASZCVNVMQXNJGH-UHFFFAOYSA-N Gibberic acid Natural products C12CCC(C3)(C)C(=O)CC23C(C(O)=O)C2=C1C=CC=C2C ASZCVNVMQXNJGH-UHFFFAOYSA-N 0.000 description 1
- 108010068370 Glutens Proteins 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 1
- DZLNHFMRPBPULJ-VKHMYHEASA-N L-thioproline Chemical compound OC(=O)[C@@H]1CSCN1 DZLNHFMRPBPULJ-VKHMYHEASA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- KKJQZEWNZXRJFG-UHFFFAOYSA-N L-trans-4-Methyl-2-pyrrolidinecarboxylic acid Chemical compound CC1CNC(C(O)=O)C1 KKJQZEWNZXRJFG-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 101800004361 Lactoferricin-B Proteins 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- 102000010445 Lactoferrin Human genes 0.000 description 1
- 101710094902 Legumin Proteins 0.000 description 1
- 241001071864 Lethrinus laticaudis Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100037611 Lysophospholipase Human genes 0.000 description 1
- 108020002496 Lysophospholipase Proteins 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010054377 Mannosidases Proteins 0.000 description 1
- 102000001696 Mannosidases Human genes 0.000 description 1
- 235000019735 Meat-and-bone meal Nutrition 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 101100063932 Micromonospora echinospora gacH gene Proteins 0.000 description 1
- 108010011756 Milk Proteins Proteins 0.000 description 1
- 102000014171 Milk Proteins Human genes 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- MKWKNSIESPFAQN-UHFFFAOYSA-N N-cyclohexyl-2-aminoethanesulfonic acid Chemical compound OS(=O)(=O)CCNC1CCCCC1 MKWKNSIESPFAQN-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- PGRUPJPMVMMUJE-JEDNCBNOSA-N N[C@@H](CC1=CNC=N1)C(=O)O.[P] Chemical compound N[C@@H](CC1=CNC=N1)C(=O)O.[P] PGRUPJPMVMMUJE-JEDNCBNOSA-N 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241001452677 Ogataea methanolica Species 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 101710157860 Oxydoreductase Proteins 0.000 description 1
- 102000004020 Oxygenases Human genes 0.000 description 1
- 108090000417 Oxygenases Proteins 0.000 description 1
- 101150048253 PHYA gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001233115 Paxillus involutus Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000222397 Phlebia radiata Species 0.000 description 1
- 108090000553 Phospholipase D Proteins 0.000 description 1
- 102000011420 Phospholipase D Human genes 0.000 description 1
- 108010058864 Phospholipases A2 Proteins 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 244000208734 Pisonia aculeata Species 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 244000252132 Pleurotus eryngii Species 0.000 description 1
- 235000001681 Pleurotus eryngii Nutrition 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 244000292693 Poa annua Species 0.000 description 1
- 241000209049 Poa pratensis Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- 235000010829 Prunus spinosa Nutrition 0.000 description 1
- 241000588756 Raoultella terrigena Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 1
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108010043943 Starch Phosphorylase Proteins 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 241001468239 Streptomyces murinus Species 0.000 description 1
- 241001655322 Streptomycetales Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000218636 Thuja Species 0.000 description 1
- 241000276707 Tilapia Species 0.000 description 1
- HXWJFEZDFPRLBG-UHFFFAOYSA-N Timnodonic acid Natural products CCCC=CC=CCC=CCC=CCC=CCCCC(O)=O HXWJFEZDFPRLBG-UHFFFAOYSA-N 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000222354 Trametes Species 0.000 description 1
- 241000222357 Trametes hirsuta Species 0.000 description 1
- 241001676647 Trametes pubescens Species 0.000 description 1
- 241000222355 Trametes versicolor Species 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 101800003783 Tritrpticin Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- 102000014384 Type C Phospholipases Human genes 0.000 description 1
- 108010079194 Type C Phospholipases Proteins 0.000 description 1
- HSCJRCZFDFQWRP-ABVWGUQPSA-N UDP-alpha-D-galactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-ABVWGUQPSA-N 0.000 description 1
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 description 1
- 108010075202 UDP-glucose 4-epimerase Proteins 0.000 description 1
- 108010082433 UDP-glucose-hexose-1-phosphate uridylyltransferase Proteins 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102400000757 Ubiquitin Human genes 0.000 description 1
- 244000090207 Vigna sesquipedalis Species 0.000 description 1
- FPIPGXGPPPQFEQ-BOOMUCAASA-N Vitamin A Natural products OC/C=C(/C)\C=C\C=C(\C)/C=C/C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-BOOMUCAASA-N 0.000 description 1
- 229930003779 Vitamin B12 Natural products 0.000 description 1
- QYSXJUFSXHHAJI-XFEUOLMDSA-N Vitamin D3 Natural products C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C/C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-XFEUOLMDSA-N 0.000 description 1
- 229930003427 Vitamin E Natural products 0.000 description 1
- 229930003448 Vitamin K Natural products 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 101000649206 Xanthomonas campestris pv. campestris (strain 8004) Uridine 5'-monophosphate transferase Proteins 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- FJWGYAHXMCUOOM-QHOUIDNNSA-N [(2s,3r,4s,5r,6r)-2-[(2r,3r,4s,5r,6s)-4,5-dinitrooxy-2-(nitrooxymethyl)-6-[(2r,3r,4s,5r,6s)-4,5,6-trinitrooxy-2-(nitrooxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-3,5-dinitrooxy-6-(nitrooxymethyl)oxan-4-yl] nitrate Chemical compound O([C@@H]1O[C@@H]([C@H]([C@H](O[N+]([O-])=O)[C@H]1O[N+]([O-])=O)O[C@H]1[C@@H]([C@@H](O[N+]([O-])=O)[C@H](O[N+]([O-])=O)[C@@H](CO[N+]([O-])=O)O1)O[N+]([O-])=O)CO[N+](=O)[O-])[C@@H]1[C@@H](CO[N+]([O-])=O)O[C@@H](O[N+]([O-])=O)[C@H](O[N+]([O-])=O)[C@H]1O[N+]([O-])=O FJWGYAHXMCUOOM-QHOUIDNNSA-N 0.000 description 1
- 239000008351 acetate buffer Substances 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 239000011717 all-trans-retinol Substances 0.000 description 1
- 235000019169 all-trans-retinol Nutrition 0.000 description 1
- 230000002009 allergenic effect Effects 0.000 description 1
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 101150078331 ama-1 gene Proteins 0.000 description 1
- 239000011609 ammonium molybdate Substances 0.000 description 1
- APUPEJJSWDHEBO-UHFFFAOYSA-P ammonium molybdate Chemical compound [NH4+].[NH4+].[O-][Mo]([O-])(=O)=O APUPEJJSWDHEBO-UHFFFAOYSA-P 0.000 description 1
- 235000018660 ammonium molybdate Nutrition 0.000 description 1
- 229940010552 ammonium molybdate Drugs 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 230000001857 anti-mycotic effect Effects 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 229940114079 arachidonic acid Drugs 0.000 description 1
- 235000021342 arachidonic acid Nutrition 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 235000013793 astaxanthin Nutrition 0.000 description 1
- 239000001168 astaxanthin Substances 0.000 description 1
- MQZIGYBFDRPAKN-ZWAPEEGVSA-N astaxanthin Chemical compound C([C@H](O)C(=O)C=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C(=O)[C@@H](O)CC1(C)C MQZIGYBFDRPAKN-ZWAPEEGVSA-N 0.000 description 1
- 229940022405 astaxanthin Drugs 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108010047754 beta-Glucosidase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 1
- FAPWYRCQGJNNSJ-UBKPKTQASA-L calcium D-pantothenic acid Chemical compound [Ca+2].OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O.OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O FAPWYRCQGJNNSJ-UBKPKTQASA-L 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- POIUWJQBRNEFGX-XAMSXPGMSA-N cathelicidin Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C1=CC=CC=C1 POIUWJQBRNEFGX-XAMSXPGMSA-N 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- KAFGYXORACVKTE-UEDJBKKJSA-N chembl503567 Chemical compound C([C@H]1C(=O)N[C@H]2CSSC[C@H](NC(=O)[C@H](CC=3C=CC=CC=3)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@H](C(=O)N[C@@H](CSSC[C@@H](C(N1)=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CCCNC(N)=N)CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)C1=CC=C(O)C=C1 KAFGYXORACVKTE-UEDJBKKJSA-N 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- 229920000547 conjugated polymer Polymers 0.000 description 1
- 101150081158 crtB gene Proteins 0.000 description 1
- 235000019784 crude fat Nutrition 0.000 description 1
- 108010005400 cutinase Proteins 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000019621 digestibility Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- DVSZKTAMJJTWFG-UHFFFAOYSA-N docosa-2,4,6,8,10,12-hexaenoic acid Chemical compound CCCCCCCCCC=CC=CC=CC=CC=CC=CC(O)=O DVSZKTAMJJTWFG-UHFFFAOYSA-N 0.000 description 1
- MBMBGCFOFBJSGT-KUBAVDMBSA-N docosahexaenoic acid Natural products CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O MBMBGCFOFBJSGT-KUBAVDMBSA-N 0.000 description 1
- 210000003278 egg shell Anatomy 0.000 description 1
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 108010091371 endoglucanase 1 Proteins 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092413 endoglucanase V Proteins 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 230000001076 estrogenic effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002270 exclusion chromatography Methods 0.000 description 1
- 108010000165 exo-1,3-alpha-glucanase Proteins 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000011790 ferrous sulphate Substances 0.000 description 1
- 235000003891 ferrous sulphate Nutrition 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 229940098330 gamma linoleic acid Drugs 0.000 description 1
- VZCCETWTMQHEPK-UHFFFAOYSA-N gamma-Linolensaeure Natural products CCCCCC=CCC=CCC=CCCCCC(O)=O VZCCETWTMQHEPK-UHFFFAOYSA-N 0.000 description 1
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 description 1
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 description 1
- 229940050410 gluconate Drugs 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 101150016365 gntK gene Proteins 0.000 description 1
- 101150092851 gntP gene Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 238000005469 granulation Methods 0.000 description 1
- 230000003179 granulation Effects 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- 150000002411 histidines Chemical class 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 239000002471 hydroxymethylglutaryl coenzyme A reductase inhibitor Substances 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- YQYJSBFKSSDGFO-FWAVGLHBSA-N hygromycin A Chemical compound O[C@H]1[C@H](O)[C@H](C(=O)C)O[C@@H]1Oc1ccc(\C=C(/C)C(=O)N[C@@H]2[C@@H]([C@H]3OCO[C@H]3[C@@H](O)[C@@H]2O)O)cc1O YQYJSBFKSSDGFO-FWAVGLHBSA-N 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 description 1
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 1
- CFFMZOZGXDAXHP-HOKBLYKWSA-N lactoferricin Chemical compound C([C@H](NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CSSC[C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CO)C(=O)N[C@H](C(N[C@H](C(=O)N1)[C@@H](C)O)=O)[C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CFFMZOZGXDAXHP-HOKBLYKWSA-N 0.000 description 1
- 229940078795 lactoferrin Drugs 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 239000010871 livestock manure Substances 0.000 description 1
- 235000012680 lutein Nutrition 0.000 description 1
- 229960005375 lutein Drugs 0.000 description 1
- KBPHJBAIARWVSC-RGZFRNHPSA-N lutein Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\[C@H]1C(C)=C[C@H](O)CC1(C)C KBPHJBAIARWVSC-RGZFRNHPSA-N 0.000 description 1
- 239000001656 lutein Substances 0.000 description 1
- ORAKUVXRZWMARG-WZLJTJAWSA-N lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C ORAKUVXRZWMARG-WZLJTJAWSA-N 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 235000021239 milk protein Nutrition 0.000 description 1
- 238000003801 milling Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 238000005121 nitriding Methods 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 108010073895 ovispirin Proteins 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 235000019629 palatability Nutrition 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 229940055726 pantothenic acid Drugs 0.000 description 1
- 230000002351 pectolytic effect Effects 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- JRKICGRDRMAZLK-UHFFFAOYSA-L persulfate group Chemical group S(=O)(=O)([O-])OOS(=O)(=O)[O-] JRKICGRDRMAZLK-UHFFFAOYSA-L 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- KCRZDTROFIOPBP-UHFFFAOYSA-N phosphono 2,3-dihydroxypropanoate Chemical compound OCC(O)C(=O)OP(O)(O)=O KCRZDTROFIOPBP-UHFFFAOYSA-N 0.000 description 1
- 238000005375 photometry Methods 0.000 description 1
- 101150110490 phyB gene Proteins 0.000 description 1
- SHUZOJHMOBOZST-UHFFFAOYSA-N phylloquinone Natural products CC(C)CCCCC(C)CCC(C)CCCC(=CCC1=C(C)C(=O)c2ccccc2C1=O)C SHUZOJHMOBOZST-UHFFFAOYSA-N 0.000 description 1
- 229940068041 phytic acid Drugs 0.000 description 1
- 239000000467 phytic acid Substances 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 108010032966 protegrin-1 Proteins 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 235000021251 pulses Nutrition 0.000 description 1
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000003642 reactive oxygen metabolite Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 102220281055 rs759653160 Human genes 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- MWNQXXOSWHCCOZ-UHFFFAOYSA-L sodium;oxido carbonate Chemical compound [Na+].[O-]OC([O-])=O MWNQXXOSWHCCOZ-UHFFFAOYSA-L 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 235000020238 sunflower seed Nutrition 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 108010032153 thanatin Proteins 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229960002203 tilactase Drugs 0.000 description 1
- KBPHJBAIARWVSC-XQIHNALSSA-N trans-lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C KBPHJBAIARWVSC-XQIHNALSSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- FTKYRNHHOBRIOY-HQUBJAAMSA-N tritrptcin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)C(C)C)C1=CC=CC=C1 FTKYRNHHOBRIOY-HQUBJAAMSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 235000019163 vitamin B12 Nutrition 0.000 description 1
- 239000011715 vitamin B12 Substances 0.000 description 1
- 235000019158 vitamin B6 Nutrition 0.000 description 1
- 239000011726 vitamin B6 Substances 0.000 description 1
- QYSXJUFSXHHAJI-YRZJJWOYSA-N vitamin D3 Chemical compound C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C\C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-YRZJJWOYSA-N 0.000 description 1
- 235000005282 vitamin D3 Nutrition 0.000 description 1
- 239000011647 vitamin D3 Substances 0.000 description 1
- 235000019165 vitamin E Nutrition 0.000 description 1
- 229940046009 vitamin E Drugs 0.000 description 1
- 239000011709 vitamin E Substances 0.000 description 1
- 235000019168 vitamin K Nutrition 0.000 description 1
- 239000011712 vitamin K Substances 0.000 description 1
- 150000003721 vitamin K derivatives Chemical class 0.000 description 1
- 235000012711 vitamin K3 Nutrition 0.000 description 1
- 239000011652 vitamin K3 Substances 0.000 description 1
- 229940045997 vitamin a Drugs 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 229940021056 vitamin d3 Drugs 0.000 description 1
- 229940046010 vitamin k Drugs 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- FJHBOVDFOQMZRV-XQIHNALSSA-N xanthophyll Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C=C(C)C(O)CC2(C)C FJHBOVDFOQMZRV-XQIHNALSSA-N 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 229960003487 xylose Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8247—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Nutrition Science (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及来源于无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)、Citrobacter gillenii的柠檬酸细菌肌醇六磷酸酶和有关的肌醇六磷酸酶。肌醇六磷酸酶属于酸性组氨酸磷酸酶家族,具有酸稳定性,预期具有高比活性。本发明也涉及相应的DNA、生产该肌醇六磷酸酶的重组和野生型方式,以及其用途,特别是在动物饲料中的用途。
Description
发明背景
发明领域
本发明涉及具有肌醇六磷酸酶活性的分离的多肽和编码该多肽的分离的多核苷酸。多肽与来源于无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)和Citrobacter gillenii的柠檬酸细菌属(Citrobacter)肌醇六磷酸酶有关,他们的氨基酸序列在附加的序列表显示为SEQ ID NOs:4和6。发明也涉及包含多核苷酸的核酸构建体、载体和宿主细胞,以及生产和使用该多肽的方法,特别是在动物饲料中使用多肽。
相关技术描述
肌醇六磷酸酶(phytase)是公知的酶,他们具有添加到动物食品,包括人食品中的优点。已经从许多来源,包括许多真菌和细菌菌株中分离出肌醇六磷酸酶。
已知大肠杆菌的酸性组氨酸磷酸酶appA和其他革兰氏阴性细菌肌醇六磷酸酶具有高比活性。
Kim等在Biotechnology Letters 25:1231-1234,2003中报道了布氏柠檬酸杆菌(Citrobacter braakii)YH-15生产胞内肌醇六磷酸酶的情况。KR-2004-A-045267和WO-2004/085638中以SEQ ID NO:7公开了来自保藏号为KCCM 10427的布氏柠檬酸杆菌(Citrobacter braakii)YH-15的肌醇六磷酸酶的氨基酸序列。WO-2004/085638的公开日是2004年7月10日,即是在本申请的第一个优先权日之后公开的。
提供具有肌醇六磷酸酶活性的可选择的多肽和编码该多肽的多核苷酸是本发明的一目的。本发明的多肽优选具有被改变的特性,更优选具有改进的特性,例如不同的底物特异性、更高的比活性(specific activity)、增加的稳定性(例如酸稳定性、热稳定性和/或蛋白酶稳定性,特别是胃蛋白酶稳定性)、改变的pH最适条件(例如,更低或更高的pH最适条件),和/或在动物饲料中改善的性能(例如,改善的肌醇六磷酸盐的释放和/或降解)。
发明概述
本发明涉及从由:(a)具有与(i)SEQ ID NO:2的氨基酸1-409、(ii)SEQID NO:2的成熟多肽部分、(iii)SEQ ID NO:4的氨基酸1-410、(iv)SEQ IDNO:4的成熟多肽部分、(v)SEQ ID NO:6的氨基酸1-414、和/或(vi)SEQ IDNO:6的成熟多肽部分有至少75%同一性的氨基酸序列的多肽;(b)至少在中等严谨条件下与(i)SEQ ID NO:1的核苷酸67-1293、(ii)SEQ ID NO:1的成熟多肽编码部分、(iii)SEQ ID NO:3的核苷酸67-1296、(iv)SEQ ID NO:3的成熟多肽编码部分、(v)SEQ ID NO:5的核苷酸67-1308、(vi)SEQ ID NO:5的成熟多肽编码部分、和/或(vii)(i)、(ii)、(iii)、(iv)、(v)或(vi)任何一项的互补链杂交的多核苷酸编码的多肽;(c)包含一个或多个氨基酸保守取代、缺失和/或插入的(a)(i)-(a)(vi)的任何一个多肽的变体;和(d)(a)(i)-(a)(vi)的任何一个多肽的片段组成的组中选择出来的具有肌醇六磷酸酶活性的多肽。
本发明也涉及编码具有肌醇六磷酸酶活性的多肽的分离的多核苷酸,其选自:(a)编码具有与(i)SEQ ID NO:2的氨基酸1-409、(ii) SEQ ID NO:4的氨基酸1-410、和/或(iii)SEQ ID NO:6的氨基酸1-414中的任何一个有至少75%同一性的氨基酸序列的多肽的多核苷酸;(b)与(i)SEQ ID NO:1的核苷酸67-1293、(ii)SEQ ID NO:3的核苷酸67-1296、和/或(iii)SEQ ID NO:5的氨基酸67-1308中的任何一个有至少75%同一性的多核苷酸;(c)至少在中等严谨条件下与(i)SEQ ID NO:1的核苷酸67-1293、(ii)SEQ ID NO:1的成熟多肽编码部分、(iii)SEQ ID NO:3的核苷酸67-1296、(iv)SEQ ID NO:3的成熟多肽编码部分、(v)SEQ ID NO:5的核苷酸67-1308、(vi)SEQ ID NO:5的成熟多肽编码部分、和/或(vii)(i)、(ii)、(iii)、(iv)、(v)或(vi)任何一项的互补链杂交的多核苷酸。
本发明也涉及包含该多核苷酸的核酸构建体、重组表达载体和重组宿主细胞。
本发明也涉及生产这种具有肌醇六磷酸酶活性的多肽的方法,包括(a)在有助于生产这种多肽的条件下培养包含含有编码该多肽的多核苷酸的核酸构建体的重组宿主细胞;和(b)回收多肽。
本发明也涉及在动物饲料,以及包含该多肽的动物饲料和动物饲料添加剂组合物中使用本发明的多肽的方法。
本发明更进一步地涉及包含操作性地与编码信号肽的核苷酸序列相连的编码蛋白质的基因的核酸构建体,其中信号肽由(i)SEQ ID NO:1的核苷酸1-66,(ii)SEQ ID NO:3的核苷酸1-66,或(iii)SEQ ID NO:5的核苷酸1-66组成,基因与核苷酸序列异源。
定义
肌醇六磷酸酶活性:在本发明的上下文中具有肌醇六磷酸酶活性的多肽(肌醇六磷酸酶)是催化肌醇六磷酸盐(肌醇六磷酸盐(myo-inositol hexakis-phosphate))水解成(1)肌醇和/或(2)它的单、二、三、四和/或五磷酸盐和(3)无机磷酸盐的酶。
互联网上的ENZYME网址(http://www.expasy.ch/enzyme/)是酶术语有关信息的贮藏处。它主要以国际生物化学和分子生物联合会(IUB-MB)学术委员会(Nomenclature Committee)的推荐为基础,描述了已经提供EC(酶委员会)编号的每种酶的特性(Bairoch A.The ENZYME database,2000,Nucleic Acids Res 28:304-305)。也可见参见来自NC-IUBMB,1992的酶术语手册。
根据ENZYME网址可知三种不同类型的肌醇六磷酸酶已经已知。3-肌醇六磷酸酶(肌醇六磷酸盐(myo-inositol hexaphosphate)3-磷酸水解酶,EC3.1.3.8)、6-肌醇六磷酸酶(肌醇六磷酸盐6-磷酸水解酶,EC3.1.3.26),和5-肌醇六磷酸酶(EC3.1.3.72)。对本发明来说,上述所有类型的肌醇六磷酸酶都包含在肌醇六磷酸酶的定义中。
在特定实施方案中,本发明的肌醇六磷酸酶属于包含大肠杆菌pH2.5酸性磷酸酶(基因appA)和真菌肌醇六磷酸酶,例如泡盛曲霉(Aspergillusawamorii)肌醇六磷酸酶A和B(EC:3.1.3.8)(基因phyA和phyB)的酸性组氨酸磷酸酶家族。组氨酸酸性磷酸酶共有两个序列相似区域,每个区域都以保守的组氨酸残基为中心。这两个组氨酸可能与酶的催化机制有关。第一个组氨酸位于N-末端部分,形成磷-组氨酸中间物,而第二个组氨酸位于C末端部分,可能作为质子供体起作用。
在更进一步的特定实施方案中,本发明的肌醇六磷酸酶具有保守的活性部位基序,即R-H-G-X-R-X-P,其中X指任一氨基酸(参见SEQ ID NO:2的氨基酸16-22,SEQ ID NO:4的氨基酸16-22和SEQ ID NO:6的氨基酸16-22)。
在本发明中以FYT为单位确定肌醇六磷酸酶的活性,一个FYT是每分钟,在下列条件下:pH5.5;温度37℃;底物:浓度为0.0050mol/l的肌醇六磷酸钠(C6H6O24P6Na12)下释放1微摩尔无机正磷酸盐的酶含量。适当的肌醇六磷酸酶测定是WO00/20569的实施例1中描述的FYT和FTU测定。FTU用于确定饲料和预混合料(premix)中的肌醇六磷酸酶活性。也可以利用此处实施例4中的肌醇六磷酸酶测定确定肌醇六磷酸酶活性。
通过在各种不同的pH值,用浓度预先确定的底物和固定的孵育温度孵育肌醇六磷酸酶来确定本发明多肽的pH最适条件。从肌醇六磷酸酶活性对pH的图表确定pH-最适条件。在特定实施方案中使用了FYT测定,即底物是5mM肌醇六磷酸钠,反应温度为37℃,利用适当的缓冲液,确定各个不同的pH值,例如pH2-12的范围内以FYT单位计的活性。100mM琥珀酸、100mM HEPES、100mM CHES、100mM CABS、1mM CaCl2、150mM KCl、用HCl或NaOH将pH值调节为2.0、2.5、3.0、3.5、4.0、5.0、6.0、7.0、8.0、9.0、10.0、11.0和12.0的0.01%Triton X-100。在另一个特定实施方案中使用了实施例4中的肌醇六磷酸酶测定,即底物是溶于具有目的pH值的缓冲液(例如上述的缓冲液)中的0.5mM,优选5mM的肌醇六磷酸钠,通过与钼酸盐/铁的络合作用和750nm处的光密度测量确定可溶的磷酸盐。Blind:混合20ul样品、100ul底物和120ul显色试剂(color reagent),37℃孵育5分钟,在750nm处测量ODBlind。样品:混合20ul样品、100ul底物,37℃孵育30分钟,添加120ul显色试剂,37℃孵育5分钟,在750nm处测量OD样品。测量的肌醇六磷酸酶的活性为OD=OD样品-ODBlind。相对低的pH-最适条件指低于pH5.0,例如低于pH4.5、4.0、3.5、3.0、2.5,甚至低于2.0的pH-最适条件。相对高的pH-最适条件指高于pH5.0,例如高于pH5.5、6.0、6.5、7.0、7.5、8.0、8.5,甚至高于9.0的pH-最适条件。
分离的多肽:这里使用的术语″分离的多肽″指通过SDS-PAGE确定时,纯度为至少20%,优选至少40%,更优选至少60%,甚至更加优选至少80%,最优选至少90%,甚至最优选至少95%的多肽。
基本上纯的多肽:术语″基本上纯的多肽(substantially purepolypeptide)″在这里表示按重量计算包含最多10%、优选最多8%、更优选最多6%、更优选最多5%、更优选最多4%、最多3%、更加优选最多2%、最优选最多1%,甚至最优选最多0.5%的与多肽天然关联的(nativelyassociated)其他多肽材料的多肽制剂。因此基本上纯的多肽优选是制品中存在按总多肽材料重量计算,纯度为至少92%,优选为至少94%,更优选为至少95%,更优选为至少96%,更优选为至少96%,更优选为至少97%,更优选为至少98%、甚至更加优选为至少99%,最优选为至少99.5%,甚至最优选为100%的多肽。
本发明的多肽优选是基本上纯的形式。特别优选″本质上(essentially)纯的形式″的多肽,即本质上不含与多肽天然关联的其他多肽材料的多肽制品。例如,通过利用众所周知的重组方法或通过典型的提纯法制备多肽可以实现这一目的。
在这里,术语″基本上纯的多肽″与术语″分离的多肽″和″分离形式的多肽″同义。
同一性:用参数″同一性″来描述两个氨基酸序列或两个核苷酸序列之间的相关联关系。
在本发明中,通过程序″align″来确定两个氨基酸序列,以及两个核苷酸序列之间的同一性程度,″align″是可用于蛋白质和DNA比对的Needleman-Wunsch比对(即总体比对)。默认得分模型(matrix)BLOSUM50和默认同一性模型分别用于蛋白质和DNA比对。蛋白质比对时缺口(gap)中的第一个残基计罚分-12,DNA比对时计罚分-16。蛋白质比对时缺口中的附加残基计罚分-2,DNA比对时计罚分-4。
″Align″是FASTA程序包版本v20u6的一部分(参见W.R.Pearson and D.J.Lipman(1988),″Improved Tools for Biological Sequence Analysis″,PNAS85:2444-2448和W.R.Pearson(1990)″Rapid and Sensitive SequenceComparison with FASTP and FASTA,″Methods in Enzymology 183:63-98)。FASTA蛋白质比对使用对缺口大小没有限制的Smith-Waterman算法(参见″Smith-Waterman algorithm″,T.F.Smith and M.S.Waterman(1981)J.Mol.Biol.147:195-197)。
Needleman,S.B.and Wunsch,C.D.,(1970),Journal of Molecular Biology,48:443-453中描述了Needleman-Wunsch算法,Myers and W.Miller在″Optimal Alignments in Linear Space″CABIOS(生命科学中的计算机应用)(1988)4:11-17中描述了align程序。
也可以按照如下描述确定靶(或样品或测试)序列和规定序列(例如SEQID NO:2的氨基酸1-409)之间的同一性程度:利用程序″align″比对序列。确定比对中完全匹配的数目(″N-完全-匹配″)(完全匹配指比对时相同位置有相同的氨基酸残基,在比对中通常被指定为″|″)。确定规定序列的长度(氨基酸残基数目)(″N-规定(N-specified)″,在上述实施方案中=411)。″N-完全匹配″和″N-规定″之间的比例计算为同一性程度(为了转化成百分比同一性,可以乘以100)。
在可选择的实施方案中,也可以按照如下描述确定靶(或样品或测试)序列和规定序列(例如SEQ ID NO:2的氨基酸1-409)之间的同一性程度:利用程序″align″比对这两个序列。确定比对中完全匹配的数目(″N-完全-匹配″)(完全匹配指比对时相同位置有相同的氨基酸残基,在比对中通常被指定为″|″)。并确定两个比对序列的共有长度,即比对重叠部分的氨基酸总数(″N-重叠″)。″N-完全匹配″和″N-重叠(N-overlap)″之间的比例计算为同一性程度(为了转化成百分比同一性,可以乘以100)。在一个实施方案中,如果有缺口,N-重叠包括比对产生的追踪和导向缺口。在另一个实施方案中,如果有缺口,N-重叠排除了比对产生的追踪(trailing)和导向缺口(leading gaps)。
在另一个可选择的实施方案中,也可以按照如下描述确定靶(或样品或测试)序列和规定序列(例如SEQ ID NO:2的氨基酸1-409)之间的同一性程度:利用程序″align″比对序列。确定比对中完全匹配的数目(″N-完全-匹配″)(完全匹配指比对时相同位置有相同的氨基酸残基,在比对中通常被指定为″|″)。确定目标序列的长度(氨基酸残基数目)(″N-靶″)。″N-完全匹配″和″N-靶″之间的比例计算为同一性程度(为了转化成百分比同一性,可以乘以100)。
重叠优选是规定序列(specified sequence)的至少20%(上文限定的″N-重叠″除以规定序列的氨基酸数目(″N-规定″)并乘以100),更优选是至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或至少95%。这意味着当样品序列与规定序列进行比对时,规定序列至少20%(优选25-95%)的氨基酸包含在重叠中。
在可选择的方案中,重叠是靶(或样品或测试)序列的至少20%(上文限定的″N-重叠″除以上文限定的″N-靶″并乘以100),更优选是至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或至少95%。这意味着当与规定序列进行比对时,目标序列至少20%(优选25-95%)的氨基酸包含在重叠中。
多肽片段:术语″多肽片段″在这里限定为在SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6或这些序列中任何同源序列的成熟肽部分的氨基和/或羧基末端缺失一个或多个氨基酸的多肽,其中片段具有肌醇六磷酸酶活性。在特定的实施方案中,片段包含至少350、360、370、380、390、400、405或至少410个氨基酸残基。
子序列:术语″子序列″在这里限定为在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或这些序列中任何一个的同源序列的成熟肽编码部分的5′和/或3′末端缺失一个或多个核苷酸的核苷酸序列,其中子序列编码具有肌醇六磷酸酶活性的多肽片段。在特定的实施方案中,子序列包含至少1050、1080、1110、1140、1170、1200、1215或至少1230个核苷酸。
等位基因变体:术语″等位基因变体″在此处表示基因的两种或更多种可选择形式中的任何一种,其占据相同的染色体位点。等位基因变异由天然的突变引起,在群体中会产生多态性。基因突变可以是沉默突变(编码的多肽没有变化)或者可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
基本上纯的多核苷酸:这里使用的术语″基本上纯的多核苷酸″指不含其他外来核苷酸或不需要的核苷酸,以适合于在遗传工程蛋白质生产系统中使用的形式存在的多核苷酸制品。因此,基本上纯的多核苷酸按重量计算包含最多10%、优选最多8%、更优选最多6%、更优选最多5%、更优选最多4%、更优选最多3%、更加优选最多2%、最优选最多1%,甚至最优选最多0.5%的与多核苷酸天然关联的其他多核苷酸物质。但是,基本上纯的多核苷酸可以包括天然存在的5′和3′非翻译区,例如启动子和终止子。基本上纯的多核苷酸优选是按重量计算纯度为至少90%,优选为至少92%,优选为至少94%,更优选为至少95%,更优选为至少96%,更优选为至少97%,更加优选为至少98%、最优选为至少99%,甚至最优选为至少99.5%的多核苷酸。本发明的多核苷酸优选是基本上纯的形式。这里公开的多核苷酸特别优选是″本质上纯的形式(essentially pure form)″,即本质上(essentially)不含与多核苷酸天然关联的其他多核苷酸物质的多核苷酸制品。在这里,术语″基本上纯的多核苷酸″与术语″分离的多核苷酸″和″分离形式的多核苷酸″同义。多核苷酸可以是基因组、cDNA、RNA、半合成来源,合成来源或他们的任何组合。
核酸构建体:这里使用的术语″核酸构建体″指分离自天然存在基因或以不存在于自然界的方式修饰的包含核酸片段的单链或双链核酸分子。当核酸构建体包含表达本发明的编码序列需要的控制序列时,术语核酸构建体与术语″表达盒″同义。
控制序列:术语″控制序列″在这里限定为包括编码本发明的多肽的多核苷酸表达必需的或对表达有利的所有组件。每个控制序列可能是编码多肽的核苷酸序列与生俱来的或与编码多肽的核苷酸序列异源。这种控制序列包括,但不局限于引导序列,多腺苷酸化序列,前肽序列,启动子,信号肽序列和转录终止子。控制序列至少包括启动子转录和翻译终止信号。可以用接头来提供控制序列,这样可以引入特异的限制性内切位点,便于将控制序列与编码多肽的核苷酸序列的编码区连接。
操作性连接:术语″操作性连接″在这里表示为控制序列位于多核苷酸序列的编码序列的相对适当的位置,从而使控制序列能指导多肽编码序列表达的构型。
编码序列:这里使用的术语″编码序列″指直接规定它的蛋白质产物的氨基酸序列的核苷酸序列。通常通过开放阅读框确定编码序列的界线,通过开始于ATG起始密码子或替换的起始密码子,例如GTG和TTG。编码序列可以是DNA、cDNA或重组核苷酸序列。
成熟多肽部分:这里使用的术语″成熟多肽部分″或″成熟肽部分″指包含编码多肽的多核苷酸作为它的部分遗传物质(equipment)的细胞分泌的多肽部分。换句话说,成熟多肽部分指在信号肽部分实现了指导编码的多肽进入细胞分泌路径后,切除信号肽部分保留的多肽部分。SEQ ID NO:2、SEQ ID NO:4和SEQ ID NO:6的预计的信号肽部分是它们的氨基酸-22到-1,这意味着SEQ ID NO:2、4和6的预计的成熟多肽部分分别相当于氨基酸1-409、1-410和1-414。但是从宿主细胞到宿主细胞有可能会发生一些轻微的变异,因此优选表达的成熟多肽部分。
成熟多肽编码部分:这里使用的术语″成熟多肽编码部分″或″成熟多肽编码序列″指编码多肽的多核苷酸的编码成熟多肽部分的那部分。例如,SEQID NO:1、SEQ ID NO:3和SEQ ID NO:5的预计的成熟多肽编码部分分别相当于它们的核苷酸67-1293、67-1296和67-1308(分别编码SEQ ID NO:2的氨基酸1-409、SEQ ID NO:4的氨基酸1-410和SEQ ID NO:6的氨基酸1-414)。
表达:术语″表达″包括涉及生产多肽的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语″表达载体″在这里限定为包含编码本发明的多肽的多核苷酸的线性或环状DNA分子,其中多核苷酸操作性地与供其表达的附加核苷酸连接。
宿主细胞:这里使用的术语″宿主细胞″包括对用包含本发明的多核苷酸的核酸构建体进行的转化、转染、转导等易感的任何细胞类型。
修饰:术语″修饰″在这里指由SEQ ID NO:2的氨基酸1-409、SEQ IDNO:4的氨基酸1-410、SEQ ID NO:6的氨基酸1-414组成的多肽的任何化学修饰,以及编码这些多肽的DNA的遗传操作。修饰可以是氨基酸的取代、缺失和/或插入,以及氨基酸侧链的替换。
人工变体:这里使用的术语″人工变体″指表达SEQ ID NO:1、SEQ IDNO:3或SEQ ID NO:5的修饰的核苷酸序列的生物体产生的具有肌醇六磷酸酶活性的多肽。通过人工干预修饰SEQ ID NOs:1、3和5中公开的核苷酸序列可以获取修饰的核苷酸序列。
发明详述
具有肌醇六磷酸酶活性的多肽
第一方面,本发明涉及具有与SEQ ID NO:2的氨基酸1-409、SEQ IDNO:4的氨基酸1-410或SEQ ID NO:6的氨基酸1-414(即成熟多肽)有至少75%同一性的氨基酸序列的有肌醇六磷酸酶活性的分离多肽(在下文中称为″同源多肽″)。在特定实施方案中,同一性程度是至少76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或至少99%。
在其他特定实施方案中,同源多肽具有与SEQ ID NO:2的氨基酸1-409、SEQ ID NO:4的氨基酸1-410和SEQ ID NO:6的氨基酸1-414中的任何一个相差二十、十八、十六、十四、十二、十个、八个、六个、五个、四个、三个、两个或一个氨基酸的氨基酸序列。
在可选择的实施方案中,与SEQ ID NO:2的氨基酸1-409、SEQ ID NO:4的氨基酸1-410或SEQ ID NO:6的氨基酸1-414(即成熟多肽)的同一性程度是至少60、62、65、66、68、70、71、72、73或至少74%。
在特定实施方案中,本发明的多肽包含SEQ ID NOs:2、4或6的氨基酸序列或其等位基因变体;或其具有肌醇六磷酸酶活性的片段。在更进一步的特定实施方案中,多肽包含SEQ ID NO:2的氨基酸1-409、SEQ ID NO:4的氨基酸1-410或SEQ ID NO:6的氨基酸1-414或其等位基因变体;或其具有肌醇六磷酸酶活性的片段。
第二方面,本发明涉及具有肌醇六磷酸酶活性的由在至少中等严谨条件下,优选中等严谨条件下与(i)SEQ ID NO:1的核苷酸67-1293、SEQ IDNO:3的核苷酸67-1296或SEQ ID NO:5的核苷酸67-1308;(ii)SEQ ID NOs:1、3或5的成熟多肽编码部分;和/或(iii)(i)、(ii)任何一项的互补链;和/或(iv)(i)、(ii)或(iii)的子序列杂交的多核苷酸编码的分离多肽(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQ ID NO:1、3或5的子序列包含至少100个连续的核苷酸,或者优选包含至少200个连续的核苷酸。而且,子序列可以编码具有肌醇六磷酸酶活性的多肽片段。
在特定实施方案中,杂交可以发生在至少中等-高,至少高或至少很高的严谨条件下;优选发生在中等-高,高或很高的严谨条件下。
在可选择的实施方案中,可在很低或低严谨条件下实施杂交。
SEQ ID NO:1、3或5的核苷酸序列,这些序列中的任何序列的子序列,以及SEQ ID NO:2、4或6的氨基酸序列可以用来设计核酸探针,利用本领域众所周知的方法,可以用设计的核酸探针从不同属或种的菌株中鉴定和克隆编码具有肌醇六磷酸酶活性的多肽的DNA。特别地,为了鉴定和分离目的属或种的对应基因,可按照标准的Southern印迹方法将这种探针与目的属或种的基因组或cDNA进行杂交。这种探针可大大短于全长序列,但其长度应该是至少14,优选至少25,更优选至少35,最优选至少70个核苷酸。但是这种核酸探针的长度优选是至少100个核苷酸。例如:这核酸探针的长度可以是至少200个核苷酸、优选是至少300个核苷酸、更优选是至少400个核苷酸、最优选是至少500个核苷酸。可以使用更长的探针,例如,长度是至少600个核苷酸、优选是至少700个核苷酸、更优选是至少800个核苷酸、最优选是至少900个核苷酸的核酸探针。DNA和RNA探针都可以使用。为了检测对应基因,典型地需要对探针进行标记(例如:用32P、3H、35S、生物素或抗生物素蛋白进行标记)。这种探针也包括在本发明的范围内。
因此可以筛选从其他的这种生物体中制备的基因组DNA库中的与如上所述的探针杂交的编码具有肌醇六磷酸酶活性的多肽的DNA。通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他的分离技术可以分离来自其他这种生物体的基因组DNA或其他DNA。来自库的DNA或分离的DNA可以转移并固定到硝酸纤维或其他合适的载体材料上。为了鉴定与SEQ ID NO:1、3或5,或这些序列中任何一个序列的子序列同源的克隆或DNA,可以在Southern印迹中使用载体材料。
在本发明中,杂交表明核苷酸序列在很低到很高的严谨条件下与标记的核酸探针杂交,其中核酸探针相应于SEQ ID NO:1、3和/或5显示的核苷酸序列,他们的互补链或子序列。可以使用X线胶片检测在这些条件下与核酸探针杂交的分子。
在特定实施方案中,核酸探针是SEQ ID NOs:1、3、5或7-18中的任何一个。在另一个特定实施方案中,核酸探针是SEQ ID NO:1、3或5的核苷酸67-450、核苷酸450-900或核苷酸900-1293的互补链。在更进一步的特定实施方案中,核酸探针是编码SEQ ID NO:2、4或6的多肽或这些多肽中任何一个的子序列的多核苷酸序列。在更进一步的特定实施方案中,核酸探针是SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5,特别是他们的成熟多肽编码区。
对长度为至少100个核苷酸的长探针来说,极低-很高严谨条件被定义为按照标准Southern印迹程序于42℃在5X SSPE、0.3%SDS、200ug/ml的剪切和变性的鲑鱼精DNA和甲酰胺中进行预杂交和杂交,其进行最佳12-24个小时,其中极低和低严谨条件的甲酰胺浓度为25%,中等和中-高严谨条件的甲酰胺浓度为35%,高和很高严谨条件的甲酰胺浓度为50%。
对长度为至少100个核苷酸的长探针来说,最后用2X SSC、0.2%SDS在至少45℃(极低严谨条件)、更优选至少50℃(低严谨条件)、更优选至少55℃(中等严谨条件)、更优选至少60℃(中等-高严谨条件)、甚至更优选至少65℃(高严谨条件)、最优选至少70℃(很高的严谨条件)的条件下洗涤载体材料三次,每次15分钟。
对长度为大约15-70个核苷酸的短探针来说,严谨条件被定义为在低于计算的Tm大约5-10℃的条件下,遵循标准的Southern印迹步骤,在0.9MNaCl、0.09M Tris-HCl pH7.6、6mM EDTA、0.5%NP-40、1X Denhardt′s溶液、1mM焦磷酸钠、1mM磷酸二氢钠(sodium monobasic phosphate)、0.1mM ATP和0.2mg酵母RNA/ml中进行预杂交,杂交和杂交后洗涤,其中Tm是依照Bolton和McCarthy(1962,Proceedings of the National Academy ofSciences USA 48:1390)进行计算的。
对长度为大约15-70个核苷酸的短探针来说,在6X SCC加0.1%SDS中洗涤载体一次,洗涤15分钟,并利用6X SSC在低于计算的Tm 5-10℃的条件下洗涤两次,每次15分钟。
在包含盐的杂交条件下,有效的Tm是控制探针和滤膜(filter)结合的DNA之间成功杂交需要的同一性程度的温度。利用下面的分子式确定各种严谨条件下两个DNAs之间杂交需要的同一性程度可以确定有效的Tm。
有效的Tm=81.5+16.6(log M[Na+])+0.41(%G+C)-0.72(%甲酰胺)
(参见www.ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)
″G+C″指探针中G和T核苷酸的含量。例如,中等严谨条件下甲酰胺是35%,5X SSPE的Na+浓度是0.75M。
第三方面,本发明涉及具有肌醇六磷酸酶活性和下列物理化学特性(对基本上纯的多肽进行的分析)的分离的多肽:
(i)高比活性,例如,对肌醇六磷酸的比活性为大肠杆菌appA比活性的至少50%(SPTREMBL:Q8GN88),优选以每毫克肌醇六磷酸酶蛋白质的FYT单位来计量比活性;
(ii)酸稳定性;例如
(a)37℃,在pH2.2的甘氨酸/盐酸缓冲液中孵育过夜后的剩余活性是(relative to)37℃,在pH7.0的HEPES缓冲液中孵育过夜后的残余活性的至少60%、优选至少65%、至少70%,或至少75%;
(b)37℃,在pH3.0的甘氨酸/盐酸缓冲液中孵育过夜后的剩余活性是37℃,在pH7.0的HEPES缓冲液中孵育过夜后的残余活性的至少80%、优选至少85%、至少90%,或至少95%;和/或
(c)在温度为25、30、35或37℃,优选为37℃,pH为2.2、2.4、2.5、2.6、2.8、3.0、3.2、3.4或3.5,优选pH为2.2或3.0的甘氨酸/盐酸缓冲液中孵育2小时后剩余的肌醇六磷酸酶活性与大肠杆菌appA(SPTREMBL:Q8GN88)的剩余活性相比为至少50%;
(iii)热稳定性,例如,在pH为5.5和温度为55、60、65、70、75、80、85或95℃,优选70℃的条件下孵育0.5、1、1.5或2小时,优选0.5小时后剩余的肌醇六磷酸酶活性与大肠杆菌appA(SPTREMBL:Q8GN88)的剩余活性相比为至少50%;
(iv)蛋白酶稳定性,例如,存在0.1mg/ml的胃蛋白酶时,在温度为20、25、30、35或37℃,优选37℃和pH为5.5的条件下孵育0.5、1、1.5或2小时,优选1小时后剩余的肌醇六磷酸酶活性与大肠杆菌appA(SPTREMBL:Q8GN88)的剩余活性相比为至少50%;和/或
(v)利用上文中描述的FYT测定和/或实施例4中的测定确定的pH-最适条件低于pH5.0,例如低于pH4.5、4.0、3.5、3.0、2.5,甚至低于pH2.0。
在涉及上述(i)的特定实施方案中,比活性是大肠杆菌appA比活性的至少60、70、80、90、100、110、120、130、140,或者至少150%。在涉及上述(ii)-(iv)的特定实施方案中,剩余活性是大肠杆菌appA剩余活性的至少60、70、80、90、100、110、120、130、140,或者至少150%,或者对实施方案(ii)(a)和(ii)(b)来说,其是相对于pH7.0的剩余活性。
第四方面,本发明涉及包含SEQ ID NO:2、4、6或他们的任何成熟多肽的一个或更多个氨基酸的保守取代、缺失和/或插入的人工变体。插入可以发生在分子内,和/或分子的N和/或C末端,当插入发生在末端时也被称为延伸。优选的氨基酸变化是次要(minor)性质的变化,即保守氨基酸替换;小的缺失,典型地缺失1到大约30个氨基酸;小的氨基或羧基末端的延伸,例如氨基末端的甲硫氨酸残基;达到大约20-25个残基的小连接肽;或通过改变净电荷促进纯化或产生另外功能的小延伸,例如多聚组氨酸带(tract)、抗原表位或结合域-换句话说就是不显著影响蛋白质折叠和/或蛋白质活性的变化。
保守替换的实例发生在碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)群组内。
保守替换的其他实例是用非标准氨基酸(例如,4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)替换20个标准氨基酸。保守替换也可以包括对非遗传密码编码的氨基酸和非天然氨基的替换。″非天然氨基酸″是蛋白质合成后已经被修饰的氨基酸,和/或他们的侧链具有不同于标准氨基酸侧链的化学结构。可以化学合成非天然氨基酸,优选从市场上购买,非天然氨基酸包括六氢吡啶羧酸、噻唑烷羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸和3,3-二甲基脯氨酸。
或者,氨基酸变化可以是这种具有改变多肽理化性质特性的变化。例如:氨基酸变化可以改善多肽热稳定性、改变底物特异性和pH最适条件等等。
可以依照本领域已知的方法,例如定位诱变或丙氨酸扫描诱变(Cunningham and Wells,1989,Science 244:1081-1085)鉴定亲代多肽中的必需氨基酸。在近来的技术中,在分子的每个残基处引入单个丙氨酸突变,测定得到的突变分子的生物活性(即肌醇六磷酸酶活性)以鉴定对该分子的活性重要的氨基酸残基。也可参见Hilton et al.,1996,J.Biol.Chem.271:4699-4708。也可以通过诸如核磁共振、晶体学、电子衍射或光亲和性标记这样的技术确定的物理结构分析结合推定的接触部位的氨基酸突变来确定酶的活性部位或其他的生物学相互作用。参见,例如de Vos et al.,1992,Science 255:306-312;Smith et al.,1992,J.Mol.Biol.224:899-904;Wlodaveret al.,1992,FEBS Lett.309:59-64。也可以通过与本发明的多肽有关的多肽的同一性分析推定必需氨基酸的同一性。
利用已知的诱变、重组和/或改组方法,以及随后的相关筛选程序,例如Reidhaar-Olson and Sauer,1988,Science 241:53-57;Bowie and Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413或WO 95/22625公开的方法可以制备和测试单个或多个氨基酸替换。可以使用的其他方法包括易错PCR、噬菌体展示(例如,Lowman et al.,1991,Biochem.30:10832-10837;美国专利No.5,223,409;WO 92/06204)和区域定向诱变(Derbyshire et al.,1986,Gene 46:145;Ner et al.,1988,DNA 7:127)。
诱变/改组方法可以与高通量自动筛选方法组合以检测宿主细胞表达的克隆的诱变处理的多肽的活性。可以从宿主细胞中回收编码活性多肽的诱变处理的DNA分子并利用本领域的标准方法对其进行快速测序。这些方法允许快速确定目的多肽中个体氨基酸残基的重要性,而且这适用于结构未知的多肽。
SEQ ID NO:2的氨基酸序列1-409、SEQ ID NO:4的氨基酸序列1-410、SEQ ID NO:6的氨基酸序列1-414中的氨基酸替换(优选保守替换)、缺失和/或插入的总数是最多10个,优选最多9个,更优选最多8个,更优选最多7个,更优选最多6个,更优选最多5个,更优选最多4个,更加优选最多3个,最优选2个,甚至最优选1个。
SEQ ID NO:2的氨基酸1-409、SEQ ID NO:4的氨基酸1-410、SEQ IDNO:6的氨基酸1-414中的氨基酸替换、缺失和/或插入的总数是10个,优选9个,更优选8个,更优选7个,更优选最多6个,更优选最多5个,更优选4个,更加优选3个,最优选2个,甚至最优选1个。或者,SEQ IDNO:2的氨基酸序列1-409、SEQ ID NO:4的氨基酸序列1-410、SEQ ID NO:6的氨基酸序列1-414中的氨基酸替换(优选保守替换)、缺失和/或插入的总数是最多50、45、40、35、30、25、20、19、18、17、16、15、14、13、12或最多11个。
在具体实施方案中,本发明的多肽是设计的暴露给动物,包括人时能引起降低的免疫反应的低过敏性变体。术语免疫反应被理解为暴露给多肽的动物的免疫系统的任何反应。一种免疫反应是导致暴露动物IgE水平增加的变态反应。可以利用本领域已知的技术制备低变应原(allergenic)变体。例如,可以用遮蔽参与免疫反应的多肽部分或表位的聚合物部分结合多肽。与聚合物的结合涉及参照例如,WO96/17929,WO98/30682,WO98/35026和/或WO99/00489的描述在体外将聚合物化学偶合到多肽上。结合可以另外或可选地涉及体内将聚合物偶合到多肽上。通过用基因工程手段操纵编码多肽的核苷酸序列、插入编码多肽中附加糖基化位点的共有序列和在能糖基化多肽的宿主中表达多肽,例如,参见WO00/26354可以实现这种结合。提供低过敏性变体的另一种方法是采用基因工程方法操纵编码多肽的核苷酸序列促使多肽自身寡聚体化,产生的多肽单体可以遮蔽(shield)其他多肽单体的表位,从而能够降低寡聚物的抗原性。例如,在WO96/16177中描述了这种产物和他们的制备过程。通过多种方法,例如WO00/26230和WO01/83559中描述的噬菌体展示方法或EP561907中描述的随机法可以鉴定参与免疫反应的表位。一旦鉴定出表位,就可以通过已知的基因操作技术,例如定位诱变(参见,例如WO00/26230、WO00/26354和/或WO00/22103)改变多肽的氨基酸序列以产生免疫特性改变的多肽,和/或可以在充分接近表位的位置结合聚合物使聚合物遮蔽表位。
具有肌醇六磷酸酶活性的多肽的来源
可以从任何属的微生物中获得本发明的多肽。对本发明来说,这里使用的与约定来源有关的术语″从...获得(obtain from)″指通过该来源或已经插入该来源的核苷酸序列的菌株产生核苷酸序列编码的多肽。在优选方案中,从给定来源获得的多肽被分泌到细胞外。
本发明的多肽可以是细菌多肽。例如:该多肽可以是革兰氏阳性细菌多肽,例如,芽孢杆菌属(Bacillus)多肽或链霉菌属(Streptomyces)多肽或革兰氏阴性细菌多肽,例如,大肠杆菌(Escherichia coli)、耶尔森氏菌属(Yersinia)、克雷伯氏菌属(Klebsiella)、柠檬酸细菌属(Citrobacter)或假单胞菌属(Pseudomonas)多肽。在特定实施方案中,多肽源自于Proteobacteria,例如Gammaproteobacteria,例如Enterobacteriales,例如Enterobacteriaceae。
在特定的方面中,来源于Enterobacteriaceae的多肽是柠檬酸细菌属多肽,例如例如无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)、布氏柠檬酸杆菌(Citrobacter braakii)、法氏柠檬酸杆菌(Citrobacter farmeri)、弗氏柠檬酸杆菌(Citrobacter freundii)、Citrobacter gillenii、中间柠檬酸细菌(Citrobacter intermedius)、差异柠檬酸杆菌(Citrobacter koseri)、Citrobactermurliniae、Citrobacter rodentium、塞氏柠檬酸杆菌(Citrobacter sedlakii)、魏氏柠檬酸杆菌(Citrobacter werkmanii)、杨氏柠檬酸杆菌(Citrobacter youngae)或柠檬酸细菌属种多肽。
在更优选的方案中,多肽是Citrobacter gillenii多肽,最优选是Citrobactergillenii DSM 13694多肽,例如SEQ ID NO:4的多肽。具体菌株公众可以从德意志微生物和细胞培养物保藏中心(Deutsche Sammlung vonMIkroorganismen und Zellkulturen)(DSM)获得。
在另一个更优选的方案中,多肽是无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)多肽,最优选是无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)ATCC 25405或无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407多肽,例如SEQ ID NO:6的多肽。这些具体菌株公众可以从美国典型培养物保藏中心ATCC获得。
本发明的多肽也可以是真菌多肽,例如,酵母多肽或丝状真菌多肽。
公众很容易从许多菌种保藏单位,例如美国典型培养物保藏中心(American Type Culture Collection)(ATCC),德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(DSM),真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构保藏中心(Agricultural Research Service Patent CultureCollection,Northern Regional Research Regional Research Center)(NRRL)获得上述微生物菌株。
而且,可以利用上述探针,从包括分离自自然界(例如,土壤、堆肥、水等等)的微生物的其他来源中鉴定和获得这种多肽。从天然生长环境中分离微生物的技术在本领域为大家熟知。然后通过相似的方法筛选另一个微生物的基因组或cDNA库可以获得多核苷酸。一旦用探针检测到编码多肽的多核苷酸序列,就可以利用本领域普通技术人员熟知的技术(参见,例如,Sambrook et al.,1989,上文)分离或克隆多核苷酸。
本发明的多肽也包括其中另一个多肽融合在该多肽或其片段的N末端或C末端的融合多肽或可切割融合多肽。通过将编码另一个多肽的核苷酸序列(或其部分)与本发明的核苷酸序列(或其部分)融合可以制备融合多肽。制备融合多肽的技术在本领域是已知的,包括连接编码多肽的编码序列,这样编码序列就处在阅读框中,融合多肽的表达也受相同启动子和终止子的控制。
多核苷酸
本发明也涉及具有编码本发明的多肽的核苷酸序列的分离的多核苷酸。在优选方案中,核苷酸序列在SEQ ID NO:1、3或5中列出。在另一个优选方案中,核苷酸序列是SEQ ID NO:1、3或5的成熟多肽编码区。本发明也包括因为遗传密码的简并性编码具有SEQ ID NO:2、4或6的氨基酸序列的多肽或这些序列中任何的成熟多肽的分别不同于SEQ ID NO:1、3和5的核苷酸序列。本发明也涉及SEQ ID NO:1、3和5的分别编码SEQ ID NO:2、4或6的具有肌醇六磷酸酶活性的片段的子序列。
本发明也涉及在SEQ ID NO:1、3或5的成熟多肽编码序列中包含至少一个突变的多核苷酸突变体,其中核苷酸序列突变体编码分别由SEQ IDNO:2或4的氨基酸1-409或SEQ ID NO:6的氨基酸1-414组成的多肽。
用于分离或克隆编码多肽的多核苷酸的技术在本领域已经已知,该技术包括从基因组DNA分离、从cDNA制备或他们的组合。例如,通过利用众所周知的聚合酶链反应(PCR)或检测具有共用结构特点的DNA克隆片段的表达库的抗体筛选可以实现从这种基因组DNA中克隆本发明的多核苷酸的目的。例如:参见Innis et al.,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其他核酸扩增方法,例如连接酶链反应(LCR)、连接活化转录(LAT)和核苷酸序列依赖的扩增(NASBA)。可以从柠檬酸属细菌菌株,或另一种生物体或相关生物体中克隆多核苷酸,因此得到的多核苷酸可以是,例如该核苷酸序列的多肽编码区域的等位基因变体或种变体。
本发明也涉及具有与SEQ ID NO:1、3或5的成熟多肽编码序列(即分别是他们的核苷酸67-1293、67-1296和67-1308)有至少75%同一性的编码具有肌醇六磷酸酶活性的多肽的核苷酸序列的多核苷酸。在特定实施方案中,同一性程度是至少大约76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。在可选择的实施方案中,同一性程度是至少61%、或至少62%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%或至少74%。
编码本发明的多肽的核苷酸序列的修饰对合成与该多肽基本相似的多肽可能是必需的。术语与该多肽″基本相似″指多肽的非天然发生形式。这些多肽可以在一些加工方式上不同于分离自天然来源的多肽,例如,在比活性、热稳定性、pH最适条件等方面不同的人工变体。以SEQ ID NO:1、3或5的多肽编码区域呈递的核苷酸序列,例如其子序列为基础,和/或通过引入不产生另一个氨基酸序列的核苷酸序列编码的多肽,但相当于为产生该多肽而设计的宿主生物体密码子用法的核苷酸替换,或者通过引入产生不同氨基酸序列的核苷酸替换可以构建变体序列。核苷酸取代的一般说明可以参见,例如Ford et al.,1991,Protein Expression and Purification 2:95-107。
在分子功能关键区外发生的仍然产生活性多肽的这种替换对本领域熟练技术人员来说是显而易见的。依照本领域已知的方法,例如定位诱变或丙氨酸扫描诱变(参见,例如,Cunningham and Wells,1989,Science 2441081-1085)可以鉴定维持本发明的分离多核苷酸编码的多肽的活性必需的优选不经受替换的氨基酸残基。丙氨酸扫描诱变技术是在分子的每个带正电荷的残基处引入突变,测定得到的突变分子的肌醇六磷酸酶活性以鉴定对该分子的活性重要的氨基酸残基。也可以通过象核磁共振分析、晶体照相术或光亲和性标记这样的技术确定的三维结构分析来确定底物多肽相互作用位点(参见,例如de Vos et al.,1992,Science 255:306-312;Smith et al.,1992,J.Mol.Biol.224:899-904;Wlodaver et al.,1992,FEBS Lett.309:59-64)。
本发明也涉及在中等严谨条件下,更优选中-高严谨条件下,更加优选高严谨条件下,最优选非常高的严谨条件下与(i)SEQ ID NO:1的核苷酸67-1293、SEQ ID NO:3的核苷酸67-1296或SEQ ID NO:5的核苷酸67-1308;(ii)SEQ ID NO:1、3或5的成熟多肽编码部分;和/或(iii)(i)和/或(ii)中任何一项的互补链;或这里限定的等位基因变体和子序列(Sambrook etal.,1989,supra)杂交的编码本发明的多肽的分离的多核苷酸。在可选择的实施方案中,可在很低或低严谨条件下实施杂交。
本发明也涉及通过(a)在极低、低、中等、中-高、高或很高的严谨条件下与(i)SEQ ID NO:1的核苷酸67-1293、SEQ ID NO:3的核苷酸67-1296或SEQ ID NO:5的核苷酸67-1308;(ii)SEQ ID NOs:1、3或5的成熟多肽编码部分;和/或(iii)(i)和/或(ii)中任何一项的互补链杂交;和(b)分离杂交的编码具有肌醇六磷酸酶活性的多肽的多核苷酸获得或可获得的分离的多核苷酸。
核酸构建体
本发明也涉及包含操作性地与一个或多个控制序列相连的本发明的分离的多核苷酸的核酸构建体,其中控制序列指导编码序列在控制序列相容的条件下在适当的宿主细胞中表达。
可以用多种方式操纵编码本发明的多肽的分离的多核苷酸,为多肽表达作准备。将多核苷酸序列插入到载体之前操纵多核苷酸序列可能是合乎需要的或必需的,这取决于表达载体。利用重组DNA方法修饰多核苷酸序列的技术为本领域熟知。
控制序列可以是适当的启动子序列,即被表达编码本发明的多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列包含介导多肽表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核苷酸序列,包括突变的、截短的和杂种启动子,可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因中获得启动子。
指导本发明的核酸构建体转录,尤其是在细菌宿主细胞中转录的适当启动子的例子有:得自大肠杆菌(E.coli)乳糖(lac)操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核生物β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the NationalAcademy of Sciences USA 75:3727-3731)的启动子、以及tac启动子(DeBoer等,1983,Proceedings of the National Academy of Sciences USA 80:21-25)。其它启动子描述于“Useful proteins from recombinant bacteria”ScientificAmerican,1980,242:74-94;以及Sambrook等,1989,文献同上。
指导本发明的核酸构建体在丝状真菌宿主细胞中转录的适当启动子的例子有:得自米曲霉(Aspergillus oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶、Fusarium venenatum淀粉葡萄糖苷酶(WO00/5 6900)、Fusarium venenatum Daria(WO00/5 6900)、Fusarium venenatum Quinn(WO00/56900)、尖孢镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO96/00787)、Trichoderma reesiβ-葡糖苷酶、Trichoderma reesei纤维二糖水解酶(cellobiohydrolase)I、Trichoderma reesei葡聚糖内切酶I、Trichoderma reesei葡聚糖内切酶II、Trichoderma reesei葡聚糖内切酶III、Trichoderma reesei葡聚糖内切酶IV、Trichoderma reesei葡聚糖内切酶V、Trichoderma reesei木聚糖酶I、Trichoderma reesei木聚糖酶II、Trichoderma reeseiβ-木糖苷酶基因中获得的启动子和NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂种);以及突变的、截短的和他们的杂种启动子。
在酵母宿主中有用的启动子是从酿酒酵母烯醇酶(ENO-1),酿酒酵母半乳糖激酶(GAL1),酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP),酿酒酵母磷酸丙糖异构酶(TPI),酿酒酵母metallothionine(CUP1)和酿酒酵母3-磷酸甘油酸(phosphoglycerate)激酶和巴斯德毕赤氏酵母(Pichia pastoris)醇氧化酶(AOX1)基因中获得的。Romanos etal.,1992,Yeast 8:423-488中描述了适合于酵母宿主细胞的其他有用的启动子。
控制序列也可以是适当的被宿主细胞识别后能终止转录的转录终止序列。终止序列操作性地与编码多肽的核苷酸序列的3′末端相连。在选择的宿主细胞中有功能的任何终止子都可以用于本发明。
对于丝状真菌宿主细胞,优选的终止子得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶和尖孢镰孢胰蛋白酶样蛋白酶的基因。
对于酵母宿主细胞,优选的终止子得自酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。其它用于酵母宿主细胞的终止子描述于Romanos等,1992,文献同上。
控制序列也可以适当的前导序列,前导序列是对宿主细胞进行的翻译很重要的mRNA非翻译区。前导序列操作性地与编码多肽的核苷酸序列的5′末端相连。在选择的宿主细胞中有功能的任何前导序列都可以用于本发明。
控制序列也可以适当的前导序列,前导序列是对宿主细胞进行的翻译很重要的mRNA非翻译区。前导序列操作性地与编码多肽的核苷酸序列的5′末端相连。在选择的宿主细胞中有功能的任何前导序列都可以用于本发明。
适合于丝状真菌宿主细胞的前导序列是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶基因中获得的。
适合于酵母宿主细胞的适当的前导序列是从酿酒酵母烯醇酶(ENO-1)、酿酒酵母3磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因中获得的。
控制序列也可以是操作性地与核苷酸序列的3′末端相连的多腺苷酸化序列,转录时,该序列会作为添加多聚腺苷残基到转录的mRNA上的信号被宿主细胞识别。在选择的宿主细胞中有功能的任何多腺苷酸化序列都可以用于本发明。
适合于丝状真菌宿主细胞的多腺苷酸化序列优选是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶基因中获得的。
Guo and Sherman,1995,Molecular Cellular Biology 15:5983-5990中描述了适合于酵母宿主细胞的有用的多腺苷酸化序列。
控制序列也可以是编码与多肽的氨基末端相连的氨基酸序列和指导编码的多肽进入细胞分泌路径的信号肽编码区。核苷酸序列的编码序列的5′端可以固有地包含在翻译阅读框中天然地与编码分泌多肽的编码区片段连接的信号肽编码区。换句话说,编码序列的5′端可以包含与编码序列异源的信号肽编码区。当编码序列天然地不包含信号肽编码区时,可能需要外来的信号肽编码区。换句话说,外来的信号肽编码区可以简单地替换天然的信号肽编码区以增加多肽的分泌。但是,在本发明中可以使用指导表达的多肽进入选择的宿主细胞的分泌路径的任何信号肽编码区。
适合于细菌宿主细胞的有效的信号肽编码区是从芽孢杆菌属NCIB11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA基因中获得的信号肽编码区。Simonen and Palva,1993,Microbiological Reviews 57:109-137中描述了更进一步的信号肽。
适合于丝状真菌宿主细胞的有效的信号肽编码区是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、Humicola insolens纤维素酶和Humicola lanuginosa脂肪酶基因中获得的信号肽编码区。
适合于酵母宿主细胞的有用的信号肽是从酿酒酵母α因子和酿酒酵母转化酶基因中获得的。上文的Romanos et al.,1992和Xiong等在Journal ofApplied Microbiology 2005,98,418-428中描述了其他有用的信号肽编码区。
在优选方案中,信号肽编码区是分别编码SEQ ID NO:2、4和6的氨基酸1-22的SEQ ID NO:1、3或5的核苷酸1-66。
控制序列也可以是编码位于多肽氨基末端的氨基酸序列的前肽编码区。合成的多肽被称为原肽或前肽(或者有时被称为酶原)。前肽通常是非活性的,通过从前多肽上催化切割或自身催化切割除去前肽,可以将前多肽转变为成熟的有活性的多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、米赫根毛霉天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO95/33836)基因中获得前肽编码区。
当信号肽和前肽区都存在于多肽的氨基末端时,前肽区紧靠着多肽的氨基末端,信号肽区紧靠着前肽的氨基末端。
添加允许相对于宿主细胞的生长调节多肽表达的调节序列也可能是合乎需要的。调节系统的实例是那些使基因响应化学或物理刺激开始或停止表达的调节系统,其中刺激包括存在调节化合物。原核生物系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中可以使用ADH2系统或GAL1系统。在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可以用作调节序列。调节序列的其他实例是那些允许基因扩增的序列。
表达载体
本发明也涉及包含本发明的多核苷酸、启动子,以及转录和翻译终止信号的重组表达载体。可以将如上所述的各种核酸和控制序列连接在一起产生包含一个或多个方便的限制性内切位点的重组表达载体,其中限制性内切位点允许在该位点插入或替换编码多肽的核苷酸序列。换句话说,通过将核苷酸序列或包含该序列的核酸构建体插入到适当的表达载体中可以表达本发明的核苷酸序列。构建表达载体时,编码序列位于载体中以便使编码序列操作性地与适当的表达控制序列连接。
重组表达载体可以是能方便地经受重组DNA过程和使核苷酸序列表达的任何载体(例如,质粒或病毒)。载体的选择典型地取决于载体与载体被插入其中的宿主细胞的相容性。载体可以是线性质粒或闭合环状质粒。
载体可以是自主复制载体,即作为染色体外实体,例如质粒,染色体外元件,微型染色体或人工染色体存在的载体,这种载体的复制不依赖于染色体复制。载体可以包含任何保证自我复制的工具。换句话说,载体可以是被引入宿主细胞时,能被整合到基因组中并与已经整合它的染色体一起复制的载体。而且,可以使用单个载体或质粒,或者使用共同包含被引入宿主细胞基因组的总DNA的两个或更多个载体或质粒,或转座子。
条件必需基因可以作为非抗生素选择标记。细菌的条件必需非抗生素选择标记的非限制性实例有在缺少D丙氨酸的条件下进行培养时才需要的来自枯草芽孢杆菌、地衣芽孢杆菌或其他芽孢杆菌的dal基因。因此当细胞在存在半乳糖的条件下生长或在产生半乳糖的培养基中生长时,参与UDP半乳糖循环(turnover of UDP-galactose)的酶编码基因可以作为细胞中的条件必需标记起作用。这种基因的非限制性实例有来自枯草芽孢杆菌或地衣芽孢杆菌的UTP-依赖性磷酸化酶(EC2.7.7.10)、UDP-葡萄糖-依赖型尿苷酰转移酶(uridylyltransferase)(EC2.7.7.12)或UDP-半乳糖差向异构酶(EC5.1.3.2)的基因。在含有作为唯一碳源的木糖的基本培养基中生长的细胞中,诸如芽孢杆菌的xylA的木糖异构酶基因也可用作为选择标记。在含有作为唯一碳源的葡糖酸/盐的基本培养基中生长的细胞中,对于利用葡糖酸/盐(gluconate)、gntK和gntP必需的基因也可用作为选择标记。条件必需基因的其它例子为本领域已知。抗生素选择标记赋予对这样的抗生素,如氨苄青霉素、卡那霉素、氯霉素、红霉素、四环素、新霉素、潮霉素或氨甲喋呤以抗生素抗性。
对于酵母宿主细胞,适当的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于,amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶)、sC(硫酸腺苷转移酶)、trpC(邻氨基苯甲酸合成酶)及其等价物。优选用于曲霉细胞的是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyceshygroscopicus)的bar基因。
本发明的载体优选包含一个或多个允许容易选择转化细胞的可选择标记。可选择标记是其产物提供杀生物剂抗性或病毒抗性,重金属抗性和营养缺陷原养型(prototrophy to auxotrophs)等等的基因。
细菌的可选择标记的实例有来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者是赋予抗生素抗性,例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。
本发明的载体优选包含允许载体整合到宿主细胞基因组中或者允许载体在细胞中不依赖于基因组自主复制的元件。
为了整合到宿主细胞基因组中,载体可以依靠编码多肽的多核苷酸序列或载体的任何其他元件通过同源重组或非同源重组整合到基因组中。换句话说,载体可以包含指导在染色体的精确位置通过同源重组整合到宿主细胞的基因组中的附加核苷酸序列。为了增加在精确位置整合的可能性,整合元件应该优选包含足量的核酸,例如100-10,000个碱基对,优选400-10,000个碱基对,最优选800-10,000个碱基对,其中核酸与对应的目标序列具有高度的同一性以增加同源重组的概率。整合元件可以是与宿主细胞基因组中的目标序列同源的任何序列。而且,整合元件可以是非编码或编码核苷酸序列。另一方面,可以通过非同源重组将载体整合到宿主细胞的基因组中。
为了进行自主复制,载体可以更进一步地包含使载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的调节自主复制的任何质粒复制基因。术语″复制起点″或″质粒复制物″(plasmidreplicator)在这里限定为使质粒或载体能够在体内复制的核苷酸序列。
细菌复制起点的实例有允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点和允许在芽孢杆菌属中复制的pUB110、pE194、pTA1060和pAMβ1。
供酵母宿主细胞用的复制起点的实例有复制的2微米起点、ARS1、ARS4、ARS1和CEN3的组合,以及ARS4和CEN6的组合。
对丝状真菌细胞有用的复制起点的实例有AMA1和ANS1(Gems et al.,1991,Gene 98:61-67;Cullen et al.,1987,Nucleic Acids Research 15:9163-9175;WO00/24883)。依照WO00/24883中公开的方法可以实现分离AMA1基因和构建包含该基因的质粒或载体的目的。
可以将本发明一个拷贝以上的多核苷酸插入宿主细胞以增加基因产物的产生。通过将序列的至少一个附加拷贝整合到宿主细胞基因组中,或者通过用包含扩增拷贝的可选择标记基因的细胞中的多核苷酸包括可扩增的选择标记基因可以实现多核苷酸拷贝数的增加,这样通过在存在适当选择试剂的情况下培养细胞就可以选择出多核苷酸的附加拷贝。
用来连接如上所述的元件以构建本发明重组表达载体的过程为本领域熟练技术人员熟知(例如,参见Sambrook et al.,1989,上文)。
宿主细胞
本发明也涉及包含本发明的多核苷酸的重组宿主细胞,在重组生产多肽时可以方便地使用这些重组宿主细胞。包含本发明的多核苷酸的载体被引入宿主细胞,这样就可以依照以前的描述将载体作为染色体整合体或自我复制的染色体外载体来维持。术语″宿主细胞″包括亲代细胞的任何由于复制期间发生的突变而不同于亲代细胞的子代。宿主细胞的选择很大程度上取决于编码该多肽的基因和其来源。
宿主细胞可以是单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。
有用的单细胞微生物有细菌细胞,例如包括,但不局限于芽孢杆菌细胞,例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状杆菌(Bacilluscirculans)、Bacillus clausii、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏云金杆菌细胞(Bacillus thuringiensis)的革兰氏阳性细菌。或链霉菌属细胞,如浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus),或革兰氏阴性菌,例如大肠杆菌和假单胞菌属的菌种。在一个优选的实施方案中,细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选的实施方案中,芽孢杆菌属细胞是嗜碱的芽孢杆菌。
通过使用下述方法可将载体导入细菌宿主细胞,所述方法如原生质体转化(参见如,Chang和Cohen,1979,Molecular General Genetics 168:111-115)、使用感受态细胞(参见如,Young和Spizizin,1961,Journal ofBacteriology 81:823-829或Dubnau和Davidoff-Abelson,1971,Journal ofMolecular Biology 56:209-221)、电穿孔(参见如,Shigekawa和Dower,1988,Biotechniques 6:742-751)、或接合(参见如,Koehler和Thorne,1987,Journalof Bacteriology 169:5771-5278)。
宿主细胞也可以是真核生物,例如哺乳动物、昆虫、植物或真菌细胞。
在优选方案中,宿主细胞是真菌细胞。在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth等,在Ainsworth和Bisby’s Dictionary of TheFungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义的)以及卵菌门(Oomycota)(如Hawksworth等,1995,文献同上,第171页中所提及的)以及所有有丝分裂孢子(mitosporic)真菌(Hawksworth等,1995,文献同上)。
在更优选的方面,真菌宿主细胞是酵母细胞。在此使用的“酵母”包括产子囊酵母(ascosporogenous)(内孢霉目(Endomycetales))、产担子孢子囊酵母(basidiosporogenous)和属于半知菌(芽孢纲(Blastomycetes))的酵母。由于酵母的分类将来可能会有所变化,对本发明而言,应按照Biology and Activities ofYeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.,编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述的定义酵母。
在更加优选方案中,酵母宿主细胞可以是念珠菌属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、糖酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或Yarrowia细胞。
在最优选的的方案中,酵母宿主细胞是巴斯德毕赤氏酵母(Pichiapastoris)、Pichia methanolica、卡尔斯伯糖酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化糖酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomyces norbensis或卵形糖酵母(Saccharomyces oviformis)细胞。在另一个最优选的方案中,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方案中,酵母宿主细胞是Yarrowia lipolytica细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)(如Hawksworth等,1995,文献同上所定义的)所有丝状形式的亚类。丝状真菌特征在于通常由几丁质、纤维素、葡聚糖、脱乙酰壳多糖、甘露聚糖、以及其它复合多糖组成的菌丝体壁。营养生长依靠菌丝延长,且碳分解代谢是专性需氧的。相反,诸如酿酒酵母的酵母的营养生长通过单细胞原植体的芽殖进行,且碳分解代谢可以是发酵的。
在一甚至更优选的方面中,丝状真菌宿主细胞的例子是不限于支顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、Ceriporiopsis、鬼伞属(Coprinus)、采绒革盖菌(Coriolus)、隐球菌属(Cryptococcus)、Filobasidium、镰孢霉属(Fusarium)、腐质霉属(Humicola)、Magnaporthe、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、Phanerochaete、Phlebia、Piromyces、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、耐热子囊菌(Thermoascus)、梭孢壳属(Thielavia)、Tolypocladium、Trametes或木霉属(Trichoderma)细胞。
在最优选的方案中,丝状真菌宿主细胞是泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillus oryzae)细胞。在另一个最优选的方案中,丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactridioides)、Fusariumcerealis、Fusarium crookwellense,大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum细胞。在另一个最优选的方面中,丝状真菌宿主细胞为黑刺烟管菌(Bjerkanderaadusta)、Ceriporiopsis aneirina、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、Coprinus cinereus、Coriolushirsutus、Humicola insolens、Humicola lanuginosa、米赫毛霉(Mucor miehei)、Myceliophthora thermophila、粗糙链孢霉(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、Phanerochaete chrysosporium、辐射射脉菌(Phlebia radiata)、Pleurotus eryngii、Thielavia terrestris、Trametes villosa、Trametes versicolor、Trichoderma harzianum、康氏木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichodermaviride)菌株细胞。
可通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身已知的方式来转化真菌细胞。用于转化曲霉属宿主细胞的适当方法描述于EP 238 023和Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中。用于转化镰刀霉(Fusarium)菌种宿主细胞的适当方法描述于Malardier等,1989,Gene 78:147-156和WO96/00787中。可使用Becker和Guarente,在Abelson,J.N.和Simon,M.I.,编,Guide to YeastGenetics and Molecular Biology,Methods in Enzymology,Volume 194,pp182-187,Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology153:163;和Hinnen等,1978,Proceedings of the National Academy of SciencesUSA 75:1920中描述的方法转化酵母细胞。
生产方法
本发明也涉及生产本发明的多肽的方法,包含(a)在有助于产生多肽的条件下培养细胞,其野生型形式能够产生所述多肽;和(b)回收多肽。细胞优选是柠檬酸细菌属的细胞,更优选是Citrobacter gillenii或无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)。
本发明也涉及生产本发明的多肽的方法,包含(a)在有助于生产多肽的条件下培养宿主细胞;和(b)回收多肽。
本发明也涉及生产本发明的多肽的方法,包含(a)在有助于生产多肽的条件下培养宿主细胞,其中宿主细胞包含在SEQ ID NO:1、3或5的成熟多肽编码区中包含至少一个突变的核苷酸序列突变体,其中突变核苷酸序列编码分别由SEQ ID NO:2或4的氨基酸1-409或SEQ ID NO:6的氨基酸1-414组成的多肽;和(b)回收多肽。
在本发明的生产方法中,可以利用本领域众所周知的生产方法在适合于生产多肽的营养培养基中培养细胞。例如:可以通过摇瓶培养,以及在允许表达多肽和/或分离多肽的条件下,在适当的培养基中,在实验室或工业发酵罐中完成的小规模或大规模发酵(连续不断的发酵、分批发酵、分级-分批发酵或固态发酵)来培养细胞。使用本领域已知的方法,在包含碳源,氮源和无机盐的合适的营养培养基中可以进行培养。合适的培养基购自商品供应商或可以按照公布的组成(例如在American Type Culture Collection的产品目录中)制备。如果多肽被分泌到营养培养基中,就可以直接从培养基中回收多肽。如果多肽没有被分泌,可以从细胞溶解产物中回收多肽。
利用本领域已知的特异性针对多肽的方法可以检测多肽。这些检测方法可以包括使用特异的抗体、形成多肽产物或多肽底物消失。例如:可以用多肽测定来确定这里描述的多肽的活性。
可以利用本领域已知的方法回收产生的多肽。例如,通过包括但不限于离心、过滤、抽提、喷雾干燥、蒸发或沉淀的常规程序可以从营养培养基中回收多肽。
可以通过本领域公知的各种操作步骤纯化本发明的多肽,包括,但不限于色谱法(例如离子交换、疏水、色谱聚焦和大小排阻)、电泳操作步骤(例如制备型等电位焦距)、差别溶解(例如硫酸铵沉淀)、SDS-PAGE或提取(例如,参见Protein Purification,J.-C.Janson和Lars Ryden,editors,VCHPublishers,New York,1989)。典型的纯化方案可以包括离心、细菌过滤(germfiltration)、硫酸铵沉淀(例如,利用80%饱和的硫酸铵)、离心、将沉淀再悬浮在缓冲液A(例如,50mM醋酸钠、1.5M硫酸铵pH4.5)、过滤、疏水性相互作用色谱法(Phenyl Toyopearl,用缓冲液A装载,用缓冲液B(50mM醋酸钠pH4.5)洗脱)和阳离子交换色谱法(SP-琼脂糖凝胶、用10mM的pH4.0的柠檬酸钠装载,用线性的盐梯度(10mM柠檬酸钠pH4.0+1M NaCl)洗脱)。
转基因植物
本发明也涉及已经用编码具有本发明的肌醇六磷酸酶活性的多肽的核苷酸序列转化的转基因植物、植物部分或植物细胞,转化是为了使转基因植物、植物部分或植物细胞能表达和产生可回收量的多肽。可以从植物或植物部分中回收多肽。或者,包含重组多肽的植物或植物部分可以用来改善食品或饲料的品质,例如改善营养价值、风味(palatability)和流变性质,或者可以用来破坏抗营养因子(antinutritive factor)。
在特定实施方案中,多肽靶向种子中胚乳储藏液泡(endosperm storagevaculoes)。用适当的信号肽可以合成作为前体的这种多肽,参见Horvath et alin PNAS,Feb.15,2000,vol.97,no.4,p.1914-1919。
转基因植物可以为双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草类/禾本科(grasses),例如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa)),饲用牧草(forage grass),例如羊茅属(Festuca)、黑麦草属(Lolium)、寒地型牧草(temperate grass),例如Agrostis,和谷类,例如小麦、燕麦、黑麦、大麦、稻、高粱、triticale(小麦(triticum))和黑麦(Secale)的稳定杂种和玉蜀黍(玉米)。双子叶植物植物的实例有烟草、豆类(legumes),例如向日葵(Helianthus)、棉花(Gossypium)、羽扇豆(lupin)、马铃薯、甜菜(sugarbeet)、豌豆、菜豆和大豆,和十字花科植物(十字花科(Brassicaceae)科),例如花椰菜、油菜籽(rape seed)、和紧密相关的模型生物拟南芥(Arabidopsisthaliana)以及十字花科植物(Brassicaceae家族),例如菜花、菜籽(rape seed)和密切相关的模型生物体拟南芥(Arabidopsis thaliana)。美国专利no.5,689,054和美国专利no.6,111,168中描述的低肌醇六磷酸植物是工程化植物实例。
植物部分的实例为茎、愈伤组织、叶、根、果实、种子和根茎类以及包括这些部分的各组织,例如表皮、叶肉、薄壁组织、维管组织、分生组织。将具体的植物细胞小室,诸如叶绿体、质外体、线粒体、液泡、过氧化物酶体和细胞质也认为是植物部分。此外,任意的植物细胞,无论是否为组织来源,均被认为是植物部分。同样,也认为诸如分离以有利于本发明应用的具体组织和细胞是植物部分,例如胚、胚乳、糊粉和种皮。
本发明范围内还包括这类植物、植物部分和植物细胞的子代。
可以按照本领域公知的方法构建表达本发明多肽的转基因植物或植物细胞。简言之,通过将编码本发明多肽的一种或多种表达构建体掺入植物宿主基因组并且使所得修饰的植物或植物细胞繁殖成转基因植物或植物细胞来构建植物或植物细胞。
表达构建体便利地为包括编码本发明多肽的核酸序列的核酸构建体,所述的核酸可操作地与表达所选择的植物或植物部分中的核酸序列所需的合适的调节序列连接。此外,该表达构建体可以包括用于鉴定已经整合入了所述表达构建体的宿主细胞的选择标记和将该构建体导入所述植物所必需的DNA序列(后者依赖于使用的DNA导入方法)。
例如,基于当需要、如果需要表达和需要如何表达来确定调节序列的选择,诸如启动子和终止子序列和任选的信号或转运序列。例如,编码本发明多肽的基因表达可以为组成型或诱导型的,或可以为发育、阶段或组织特异性的,并且基因产物可以靶向于具体组织或植物部分,诸如种子或叶。例如,调节序列描述在Tague等,1988,Plant Physiology 86:506中。
为了进行组成型表达,可以使用35S-CaMV(Franck等,1980,Cell 21:285-294),玉米泛蛋白1(Christensen AH,Sharrock RA and Quail 1992.Maizepolyubiquitin genes:structure,thermal perturbation of expression and transcriptsplicing,and promoter activity following transfer to protoplasts byelectroporation)、或稻肌动蛋白启动子(Plant Mo.Biol.18,675-689.;Zhang W,McElroy D.and Wu R 1991,Analysis of rice Act1 5′region activity in transgenicrice plants.Plant Cell 3,1155-1165)。例如,器官-特异性启动子可以为来自贮存库组织,诸如种子、马铃薯根茎类和果实(Edwards & Coruzzi,1990,Ann.Rev.Genet.24:275-303)或来自代谢库组织,诸如分生组织(Ito等,1994,PlantMol.Biol.24:863-878)的启动子;种子特异性启动子,诸如来自稻的谷蛋白、醇溶蛋白、球蛋白或清蛋白启动子(Wu等,1998,Plant and Cell Physiology 39:885-889);来自豆球蛋白B4和来自蚕豆(Vicia faba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology 152:708-711);来自种子油体蛋白的启动子(Chen等,1998,Plant and Cell Physiology 39:935-941);来自欧洲油菜(Brassica napus)的储存蛋白napA启动子或任意其它本领域中公知的,例如如WO91/14772中所述的种子特异性启动子。此外,启动子可以为叶特异性启动子,诸如来自稻米或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000;小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins,1994,Plant Molecular Biology 26:85-93)或来自水稻的aldP基因启动子(Kagaya等,1995,Molecular和General Genetics 248:668-674);或伤口诱导型启动子,诸如马铃薯pin2启动子(Xu等,1993,PlantMolecular Biology 22:573-588)。同样,启动子可以通过非生物性处理,诸如温度、干旱或盐浓度改变而成为诱导型的或通过活化启动子的外部施用的物质诱导,所述的外部施用的物质例如为乙醇、雌激素、植物激素,诸如乙烯、脱落酸和赤霉酸和/或重金属。
启动子增强子元件也可以用于本发明多肽在植物中的高度表达。例如,启动子增强子元件可以为置于启动子与编码本发明多肽的核苷酸序列之间的内含子。例如,Xu等,1993,文献同上中披露了第一内含子在强化表达的水稻肌动蛋白1基因中的应用。
更进一步地可以依据植物品种优化密码子用法以改善表达(参见上文提到的Horvath et al)。
可以从可获得的现有技术中挑选表达构建体的可选择标记基因和任何其他部分。
可以根据本领域已知的常规方法,包括农杆菌介导的转化、病毒介导的转化、显微注射、粒子轰击、生物射弹转化和电穿孔将核酸构建体掺入植物基因组(Gasser等,1990,Science 244:1293:Potrykus,1990,Bio/Technology 8:535:Shimamoto等,1989,Nature 338:274)。
目前,根癌土壤杆菌(Agrobacterium tumefaciens)-介导的基因转移为用于生产转基因双子叶植物而的选择方法(就综述而言,参见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15-38)并且还可以用于转化单子叶植物,不过,其它转化方法通常用于这些植物。目前,为生产转基因单子叶植物而选择的方法为对胚愈伤组织或发育的胚进行粒子轰击(用转化的DNA包被的微观金或钨粒子)(Christou,1992,Plant Journal 2:275-281:Shimamoto,1994,Current Opinion Biotechnology 5:158-162:Vasil等,1992,Bio/Technology 10:667-674)。用于单子叶植物转化的备选方法基于如Omirulleh等在1993,Plant Molecular Biology 21:415-428中所述的原生质体转化。
在转化后,选择掺入了所述表达载体的转化体并且按照本领域众所周知的方法将其再生成完整植物。通常设计转化操作步骤以便通过使用例如与两种单独的T-DNA构建体共转化或用特异性重组酶对选择基因进行位点特异性切除在再生过程中或在以下的子代中对选择基因进行选择性淘汰。
本发明也涉及生产本发明的多肽的方法,包含(a)在有助于生产多肽的条件下培养包含编码本发明的具有肌醇六磷酸酶活性的多肽的核酸序列的转基因植物或植物细胞;和(b)回收多肽。
转基因动物
本发明也涉及转基因非人动物,以及其产物或元件,产物实例有体液,例如乳液和血液、器官、肉和动物细胞。在哺乳动物细胞中表达蛋白质的技术在本领域是已知的,例如,参见蛋白质表达手册(handbook ProteinExpression):A Practical Approach,Higgins和Hames(eds),牛津大学出版社(1999),以及该系列中与基因转录、RNA处理和翻译后处理有关的其他三本手册。一般说来,为了制备转基因动物,可以用编码本发明的具有肌醇六磷酸酶活性的多肽的核酸序列转化所选择动物的选定细胞以表达和生产多肽。可以从动物中回收多肽,例如从雌性动物的乳液中回收多肽,或者为了有益于动物本身,例如协助动物消化,也可以表达该多肽。动物实例有下文的动物饲料部分提到的动物。
为了产生用于从动物乳液中回收多肽的转基因动物,可以使用包含适当乳蛋白质启动子和编码该多肽的基因的转基因表达载体将编码多肽的基因插入到所讨论动物的授精卵中。转基因表达载体被通过显微注射到授精卵中,优选被永久整合到染色体中。一旦卵开始生长和分裂,就可以将有能力的胚植入到代孕母亲中,并鉴定携带转基因的动物。然后可以通过常规繁殖方法繁殖得到的动物。从动物的乳液中纯化多肽,可以参见Meade,H.M.et al(1999):Expression of recombinant proteins in the milk of transgenicanimals,Gene expression systems:Using nature for the art of expression.J.M.Fernandez and J.P.Hoeffler(eds.),Academic Press。
在可替换的方案中,为了产生在体细胞和/或生殖细胞中携带有包括含有编码多肽的转基因的异源转基因构建体的核酸序列的转基因非人动物,转基因可以操作性地与该多肽的唾液腺特异表达第一调节序列相连。
组合物和用途
在更进一步的方案中,本发明涉及包含本发明的多肽的组合物,以及使用这些组合物的方法。
可以依照本领域已知的方法制备多肽组合物,制备的多肽组合物可以是液体形式的组合物或干燥组合物。例如,多肽组合物可以是颗粒或微粒形式。可以依照本领域已知的方法,稳定包含在组合物中的多肽。
本发明的肌醇六磷酸酶在任何工业中都可以用来降解例如,肌醇六磷酸/酯(phytate)、肌醇六磷酸(phytic acid)、和/或肌醇的单、二、三、四和/或五磷酸盐。已经公知这些化合物的磷酸盐部分螯合有二价和三价阳离子,例如金属离子、营养必需的钙、铁、锌和镁离子,以及微量矿物锰、铜和钼。此外,肌醇六磷酸在一定程度上也可以通过静电作用结合蛋白质。
因此,本发明的多肽的优选用途是用于动物饲料制品(包括人食品)中或这种制品的添加剂中。
在特定实施方案中,本发明的多肽可以用来改善动物饲料的营养价值。改善动物饲料(包括人食品)营养价值的非限制性实例有:改善饲料的可消化性;促进动物生长;改善饲料的利用性;改善蛋白质的生物利用度;增加可消化磷酸盐的水平;改善肌醇六磷酸的释放和/或降解;改善微量矿物质的生物利用度;改善大分子矿物质的生物利用度;消除添加补充的磷酸盐、微量矿物质和/或大分子矿物质的需要;和/或改善蛋壳质量。因此提高了饲料的营养价值,而且也可以改善动物的增长率和/或体重增加和/或饲料转化率(即摄取的饲料重量/增加的体重)。
而且,本发明的多肽可用于降低粪(manure)中的肌醇六磷酸水平。
动物、动物饲料和动物饲料添加剂
术语动物包括所有动物,包括人类。动物实例有非反刍动物和反刍动物。反刍动物包括如绵羊、山羊、马和牛,例如,肉牛、奶牛和小牛的动物。在特定实施方案中,动物是非反刍动物。非反刍动物包括单胃动物,例如猪或猪类(包括但不限于小猪、正在成长的猪和母猪);家禽,例如火鸡、鸭和小鸡(包括但不是限于肉用仔鸡,蛋鸡);小牛;鱼(包括但不是限于鲑鱼、鳟鱼、罗非鱼、鲶鱼和鲤鱼);和甲壳动物(包括但不是限于虾和对虾)。
术语饲料或饲料成分(composition)指适合被动物摄取或为被动物摄取而设计的任何化合物、制品、混合物或组合物。
依照本发明的用途,可以在饮食之前、之后或同时给动物饲喂本发明的多肽。优选后者。
在特定实施方案中,添加到饲料中的多肽或包含在饲料添加剂中的多肽是基本上纯的多肽形式。在特定实施方案中,已经明确限定这一点。术语″明确限定″指用分子排阻色谱确定时,肌醇六磷酸酶制品的纯度为至少50%。在其他特定实施方案,用这种方法确定的肌醇六磷酸酶制品的纯度为至少60、70、80、85、88、90、92、94或至少95%。
基本上纯的多肽制品和/或明确限定的多肽制品是有利的。例如,以准确剂量将基本上没有其他干扰多肽或其他污染多肽的多肽添加到饲料中相对更容易。术语准确剂量特别指获得一致和恒定结果的目标和基于预期效果优化剂量的能力。
但是,在动物饲料中使用的本发明的肌醇六磷酸酶多肽不必是纯肌醇六磷酸酶多肽;它可以包括其他多肽,在这种情况下可以将其称为肌醇六磷酸酶制品。
肌醇六磷酸酶制品可以(a)直接添加到饲料中(或者在蛋白质治疗过程中直接使用);或(b)可用于产生一种或多种中间组合物,例如随后被添加到饲料中(或用于治疗过程)的饲料添加剂或预混合料。不论是依照上述的(a),还是(b)进行使用,如上所述的纯度都指原始多肽制品的纯度。
利用重组生产方式可特别获得纯度为该数量级的多肽制品,但是当用传统发酵方法生产该多肽时,不能这么容易地获得该数量级的多肽制品,而且批间差异更高。
毫无疑问,多肽可以与其他多肽混合。
可以以任何形式将该多肽添加到饲料中,添加的多肽可以是相对纯的多肽,或者可以是与计划添加到动物饲料中的其他成分混合的混合物,即动物饲料添加剂的形式,例如所谓的动物饲料前混合物。
在更进一步的方案中,本发明涉及在动物饲料,例如动物饲料和动物饲料添加剂,例如预混合料中使用的组合物。
除本发明的多肽以外,本发明的动物饲料添加剂可以包含至少一种脂溶性维生素,和/或至少一种水溶性维生素、和/或至少一种微量矿物质。饲料添加剂也可以包含至少一种大分子矿物质。
更进一步地,饲料添加剂组分可以随意地是着色剂,例如类胡萝卜素,比如β-胡萝卜素、虾青素和叶黄素(lutein);芳香族化合物;稳定剂;抗菌肽;多不饱和脂肪酸;活性氧产生物质;和/或至少一种从肌醇六磷酸酶(EC3.1.3.8或3.1.3.26);木聚糖酶(EC3.2.1.8);半乳聚糖酶(EC3.2.1.89);α-半乳糖苷酶(EC3.2.1.22);蛋白酶(EC3.4-.-)、磷脂酶A1(EC3.1.1.32);磷脂酶A2(EC3.1.1.4);溶血磷脂酶(EC3.1.1.5);磷脂酶C(3.1.4.3);磷脂酶D(EC3.1.4.4);淀粉酶,例如,α淀粉酶(EC3.2.1.1);和/或β-葡聚糖酶(EC3.2.1.4或者EC3.2.1.6)中选择出来的其他多肽。
在特定实施方案中,明确限定了这些其他多肽(就象上文限定肌醇六磷酸酶制品一样)。
在特别优选的实施方案中,本发明的具有相对低的pH最适条件的肌醇六磷酸酶可以与至少一种具有更高pH最适条件的肌醇六磷酸酶组合。具有更高pH最适条件的肌醇六磷酸酶的优选实例有芽孢杆菌属肌醇六磷酸酶,例如来自地衣芽孢杆菌和枯草芽孢杆菌的肌醇六磷酸酶,以及其具有肌醇六磷酸酶活性的衍生物、变体或片段。
本发明的肌醇六磷酸酶也可以与其他的肌醇六磷酸酶,例如子囊菌(ascomycete)肌醇六磷酸酶,例如曲霉肌醇六磷酸酶,例如来源于无花果曲霉(Aspergillus ficuum)、黑曲霉或泡盛曲霉的肌醇六磷酸酶;或担子菌(basidiomycete)肌醇六磷酸酶,例如来源于Peniophora lycii、Agrocybepediades、Trametes pubescens或Paxillus involutus的肌醇六磷酸酶;或其具有肌醇六磷酸酶活性的衍生物、片段或变体组合。
因此,在用于本发明的动物饲料的优选实施方案和用于本发明的动物饲料添加剂和动物饲料的优选实施方案中,本发明的肌醇六磷酸酶可以与这些肌醇六磷酸酶组合。
上述子囊菌和担子菌肌醇六磷酸酶,特别是来源于Peniophora lycii的RONOZYME P肌醇六磷酸酶,以及其衍生物、变体和片段也可以与芽孢杆菌属肌醇六磷酸酶,特别是地衣芽孢杆菌肌醇六磷酸酶,以及其衍生物、片段和变体组合以特别用于动物饲料中。
抗微生物肽(AMP′s)的实例是CAP18、Leucocin A、Tritrpticin、protegrin-1、Thanatin、防卫素(Defensin)、Lactoferrin、Lactoferricin和Ovispirin,例如Novispirin(Robert Lehrer,2000)、Plectasins、和抑制素(Statins),包括在WO03/044049和WO03/048148中公开的化合物和多肽,以及上述保持抗微生物活性的肽的变体或片段。
抗真菌多肽(AFP′s)的实例是巨大曲霉(Aspergillus giganteus),和黑曲霉(Aspergillus niger)肽,以及保持抗真菌活性的其变体和片段,如在WO94/01459和WO02/090384中所公开的。
多聚不饱和脂肪酸的实例是C18、C20和C22多聚不饱和脂肪酸,例如花生四烯酸、二十二碳六烯酸(docosohexaenoic acid)、二十碳五烯酸(eicosapentaenoic acid)和γ-亚油酸。
产生活性氧物质类的实例是例如过硼酸盐、过硫酸盐、或过碳酸盐的化学试剂;和例如氧化酶、加氧酶或合成酶的多肽。
通常脂溶或水溶性的维生素,以及微量矿物质形成将加入饲料的所谓预混合料的部分,而通常将大量矿物质单独加入饲料。任何这些组合物的类型,在富集本发明蛋白酶时,是本发明的动物饲料添加剂。
在特定的实施方案中,本发明的动物饲料添加剂预期包括(或如必须包括时规定)在动物的日常饮食中,或以0.01至10.0%;更具体为0.05至5.0%;或0.2至1.0%的水平喂饲(%是指每100g饲料的g添加剂)。这特别地用于预混合料。
以下是这些成分实例的非排它列表:
脂溶性维生素的实例有维生素A、维生素D3、维生素E和维生素K,例如维生素K3。
水溶性维生素的实例有维生素B12、生物素和胆碱、维生素B1、维生素B2、维生素B6、烟酸、叶酸和泛酸(panthothenate),例如D-泛酸钙(Ca-D-panthothenate)。
微量无机物的实例有锰、锌、铁、铜、碘、硒和钴。
大分子矿物质的实例有钙、磷和钠。
这些成分的营养需要量(以家禽和仔猪/猪例证)如WO01/58275的表A所列。营养需要量是指在日常饮食中应以指明的浓度提供这些成分。
可选的,本发明的动物饲料添加剂包括WO01/58275的表A中列举的至少一种单独成分。在本文中,至少一种意味着任何一种、一种或多种、一种或2、或3、或4种等直到所有的13种、或直到所有的15种单独成分。更具体地说,这个至少一种单一成分包括在本发明的添加剂中,其在饲料浓度中呈现的数量是在表A的第4栏、第5栏、或第6栏指明的范围内。
本发明也涉及动物饲料组合物。动物饲料组合物或日常饮食具有相对高含量的蛋白质。可如WO01/58275的表B中第2-3栏所指明的表征家禽和猪的调养饲料。可如该表B的第4栏中所指明的表征鱼饮食饲料。此外这种鱼饮食饲料通常具有200-310g/kg含量的粗脂肪。
WO01/58275对应US09/779334,其包含在本文作为参考。
本发明所述的动物饲料组合物具有50-800g/kg含量的粗蛋白,而且包括至少一种在此所要求保护的蛋白酶变体。
此外,或可选的(关于如上所述的粗蛋白含量),本发明的动物饲料组合物具有10-30MJ/kg的可代谢能量含量;和/或0.1-200g/kg的钙含量;和/或0.1-200g/kg的有效磷含量;和/或0.1-100g/kg的甲硫氨酸含量;和/或0.1-150g/kg的甲硫氨酸加半胱氨酸含量;和/或0.5-50g/kg的赖氨酸含量。
在特定的实施方案中,代谢能量、粗蛋白、钙、磷、甲硫氨酸、甲硫氨酸加半胱氨酸、和/或赖氨酸的含量是在WO01/58275表B中第2、3、4或5中任何一项的范围内(R.2-5)。
通过将氮(N)乘以因子6.25来计算粗蛋白,即粗蛋白(g/kg)=N(g/kg)×6.25。通过Kjeldahl定氮法(A.O.A.C.,1984,Official Methods ofAnalysis第14版,Association of Official Analytical Chemists,Washington DC)确定含氮量。
可根据NRC出版物Nutrient requirements in swine,第9修订版,1988,subcommittee on swine nutrition,committee on animal nutrition,board ofagriculture,national research council.National Academy Press,华盛顿,D.C.,第2-6页,和用于家禽饲料-原料的能量值欧洲表,Spelderholt centre forpoultry research and extension,7361 DA Beekbergen,荷兰,Grafisch bedrijfPonsen & looijen bv,Wageningen.ISBN 90-71463-12-5来计算可代谢能量。
根据例如Veevoedertabel 1997,gegevens over chemische samenstelling,verteerbaarheid en voederwaarde van voedermiddelen,Central Veevoederbureau,Runderweg 6,8219 pk Lelystad.ISBN 90-72839-13-7的饲料表来计算完全的动物调养饲料中的饮食性钙、有效磷和氨基酸含量。
具体的实施方案中,本发明的动物饲料组合物含有至少一种蛋白。所述蛋白可以是动物蛋白,诸如肉和骨类粉,和/或鱼粉(fish meal);或在具体实施方案中,其可以是植物蛋白质。术语植物蛋白是指包括至少一种衍生自或起源于植物的蛋白质,包括修饰的蛋白质和蛋白质-衍生物的任何化合物、组合物、制剂或混合物。在特定的实施方案中,植物蛋白的蛋白质含量是至少10、20、30、40、50、或60%(w/w)。
植物蛋白可衍生自植物蛋白来源,例如豆类和谷类,例如来自豆科(Fabaceae)(Leguminosae)、十字花科、藜科(Chenopodiaceae)、和禾本科(Poaceae)植物的材料,例如大豆粗粉、羽扇豆粗粉和油菜籽粉。
在特定的实施方案中,植物蛋白来源是来自一种或多种豆科植物,例如大豆、羽扇豆、豌豆或菜豆的材料。
在另一个特定的实施方案中,植物蛋白来源是来自一种或多种藜科植物,例如甜菜、制糖甜菜(sugar beet)、菠菜或奎藜籽(quinoa)的材料。
植物蛋白来源的其它实例是油菜籽,葵花籽,棉花籽和卷心菜。
大豆是优选的植物蛋白来源。
植物蛋白来源的其它实例是谷类,例如大麦、小麦、黑麦、燕麦、王蜀黍(玉米)、稻(rice),triticale,和高粱。
在更进一步的特定实施方案中,本发明的动物饲料组合物包含0-80%的玉米;和/或0-80%的高粱;和/或0-70%的小麦;和/或0-70%的大麦;和/或0-30%的燕麦;和/或0-40%的大豆粉;和/或0-25%的鱼粉;0-25%肉和骨粉;和/或0-20%的乳清。
可将动物膳食(diet)制备成例如粉料(mash feed)(非颗粒)或颗粒(pelleted)饲料。一般地,混合碾磨的饲料-原料并且根据所述种属的规格加入足够数量的必需维生素和矿物质。可加入固体的酶或液体酶制剂。例如,一般在混合步骤前或在混合期间加入固体酶制剂;而一般在造粒(pelleting)步骤后加入液体多肽制剂。也可将多肽掺入到饲料添加剂或预混合料中。
膳食中的最终酶浓度是在每kg膳食0.01-200mg多肽蛋白的范围内,例如在每kg动物膳食5-30mg多肽蛋白的范围内。
毫无疑问,应施用有效量的本发明的肌醇六磷酸酶,即足以改善饲料增溶作用和/或营养价值的量。目前考虑施用含量为如下数量(剂量范围)中的一个或多个的多肽:0.01-200;0.01-100;0.5-100;1-50;5-100;10-100;0.05-50或0.10-10,所有这些范围都是每公斤饲料中以毫克记的肌醇六磷酸酶多肽蛋白质(百万分之一)。
为了确定每公斤饲料中肌醇六磷酸酶多肽蛋白质的毫克数,可以从饲料成分中纯化肌醇六磷酸酶,并利用相关的测定确定纯化的肌醇六磷酸酶的比活性。也可以利用相同的测定同样地确定饲料成分的肌醇六磷酸酶活性,并以这两个测定为基础计算每公斤饲料中以毫克记的肌醇六磷酸酶多肽蛋白质的剂量。
相同的原则也适用于确定饲料添加剂中肌醇六磷酸酶多肽蛋白质的毫克数。毫无疑问,如果可以获得用于制备饲料添加剂或饲料的肌醇六磷酸酶样品,那么可由此样品确定比活性(不需要从饲料成分或添加剂中纯化肌醇六磷酸酶)。
信号肽
本发明也涉及包含与SEQ ID NO:1、3或5的核苷酸1-66组成的第一核苷酸序列操作性相连的蛋白质编码基因的核酸构建体,其中SEQ ID NO:1、3或5的核苷酸1-66组成的第一核苷酸序列分别编码由SEQ ID NO:2、4或6的氨基酸1-22组成的信号肽,而且蛋白质编码基因与第一核苷酸序列异源。
本发明也涉及包含这种核酸构建体的重组表达载体和重组宿主细胞。
本发明也涉及生产蛋白质的的方法,包含(a)在有助于生产该蛋白质的的条件下培养这种重组宿主细胞;和(b)回收蛋白质。
第一核苷酸序列可以单独通过其他的控制序列或与其他的控制序列组合操作性地与异源基因相连。上文描述了这种其他的控制序列。
蛋白质可以是宿主细胞与生俱来的或者与宿主细胞异源。术语″蛋白质″在这里并不涉及编码产物的具体长度,因此它包括肽、寡肽和蛋白质。术语蛋白质也包括组合形成编码产物的两个或更多个多肽。蛋白质也包括包含从至少两个不同的蛋白质获得的部分或完全多肽序列的组合的杂种多肽,其中一种或多种蛋白质可以是宿主细胞与生俱来的或者与宿主细胞异源。蛋白质可以更进一步地包括上述蛋白质和杂化蛋白的天然发生的等位基因变异和加工设计的变异。
蛋白质优选是激素或其变体、多肽、受体或其部分、抗体或其部分或者受体。在更优选的方案中,蛋白质是氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在更加优选的方案中,蛋白质氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α半乳糖苷酶、β半乳糖苷酶、葡糖淀粉酶、α葡糖苷酶、β葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果胶溶解多肽(pectinolytic polypeptide)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解多肽、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
可以从任何原核生物、真核生物或其他来源中获取该基因。
下列实施例更进一步地描述了本发明,不应认为实施例是限制本发明的范围。
实施例
实施例1:克隆Citrobacter gillenii肌醇六磷酸酶
对下列酸性组氨酸磷酸酶进行多重比对:大肠杆菌appA(SPTREMBL:Q8GN88)、Klebsiella terrigenaphyk(SPTREMBL:Q7WSY1),以及YersiniapestisCO92(SPTREMBL:Q8ZFP6)。以共有序列为基础设计两个简并的寡核苷酸引物:
5′-CGC GTG GTG ATT GTG TCC MGN CAY GGN GT-3′(SEQ ID NO:7,正向引物)
5′-C CAG GTT GGT ATC ATG GCC NGC DAT RAA-3′(SEQ ID NO:8,反向引物)
引物用于在45、48和50℃的退火温度通过PCR筛选许多细菌种属。
在Citrobacter gillenii DSM 13694中鉴定到形式为900bp DNA片段的部分肌醇六磷酸酶基因。
PCR片段被克隆到pEZSeq钝端克隆试剂盒(来自Lucigen Corporation的目录号40501-1,2120 West Greenview Dr.,Ste 9,Middleton,WI 53562,US)。首先,用PCRTerminator末端修复试剂盒(PCRTerminator End Repair Kit)(是pEZSeq钝端克隆试剂盒的一部分)处理PCR片段,PCRTerminator末端修复试剂盒包含已经优化的能在任何种类的PCR产物上产生钝的5′磷酸化末端的具有酶活性的混合物。克隆到pEZSeq载体中以后,可以利用两个特异的载体引物对克隆进行测序。核苷酸序列的翻译证实克隆的DNA片段是肌醇六磷酸酶基因的一部分。
为了获得该基因的全长核苷酸序列,使用了设计的能捕获未知目标位点的DNA Walking SpeedUp试剂盒(DWSK-V102 from Seegene,Inc.,2nd Fl.,Myungji Bldg.,142-21,Samsung-dong,Kangnam-gu,Seoul,135-090,Korea)。为了实现这一目的,设计了4个特异的寡核苷酸和该试剂盒一起使用。
TSP1N:5′-AGACTTCCGCCAGCCCG-3′(SEQ ID NO:9)
TSP1C:5′-AAGCAGCTGGGCAGTCTGC-3′(SEQ ID NO:10)
TSP2N:5′-AAGCGGCGTGAACTTTGTCGG-3′(SEQ ID NO:
11)TSP2C:5′-ATGGGGACTGGCTTCAACCCTG-3′(SEQ ID NO:12)
来自Citrobacter gillenii DSM 13694的编码肌醇六磷酸酶的全长核苷酸序列为序列表显示的SEQ ID NO:3,编码的对应氨基酸序列为SEQ ID NO:4。预计SEQ ID NOs:2和4的开始的22个氨基酸是信号肽(通过信号PV3.0进行预计)。SEQ ID NO:1是包含下列13个替换:T99G、C102G、C105T、C108G、A109T、G110C、T111C、T117C、C975T、A989C、T991(-)、C992(-)、A1005(-)的SEQ ID NO:3的变体。SEQ ID NO:4是包含下列5个替换:N330T、I331K、S332R、A334(-)、L335I的SEQ ID NO:2的变体。
该Citrobacter gillenii DSM 13694肌醇六磷酸酶基因被克隆到没有融合标记的pET-30a(+)大肠杆菌表达载体中(来自Novagen的目录号69909,从Bie & Berntsen A/S,7 Sandbaekvej,DK-2610 Roedovre,Denmark可买到)。在该系统中,通过提供在大肠杆菌BL21 star(DE)的pLysS宿主菌株中T7 RNA聚合酶来源(来自Novagen的目录号69388,从Bie & Berntsen可买到)诱导该基因的表达,其中大肠杆菌BL21star(DE)的pLysS宿主菌株包含在lacUV5启动子控制下的T7 RNA聚合酶基因的染色体拷贝。通过添加乳糖到培养基中可以实现对靶基因的诱导。乳糖将结合阻遏物,从而导致它从操纵子上解离以允许从启动子开始转录。
为了表达肌醇六磷酸酶基因,转化的大肠杆菌菌株的单个集落被转移到不允许表达T7 RNA聚合酶的非诱导培养基(包含葡萄糖作为唯一的碳源)中进行接种培养。使用包含空pET-30(+)载体的大肠杆菌(BL21star(DE)pLysS)作为阴性对照。将小等分(大约150微升)的接种培养物转移到包含乳糖作为唯一碳源的细颈瓶里。37℃以300rpm的转速振摇培养诱导培养物过夜。
离心收获细胞并通过SDS-PAGE分析15微升等分的上清液。10微升超精确蛋白质标准样品(Precision Plus protein standard)(目录号161-0363,市场上从Bio-Rad Laboratories Headquarters,1000 Alfred Nobel Drive,Hercules,CA 94547,US可买到)作为分子量(MW)标记。在来自重组大肠杆菌菌株的上清液中鉴定到MW为大约50kDa的清晰条带,但在阴性对照中没有鉴定到。
溶解收获的细胞小丸,并且也通过如上所述的SDS-PAGE分析溶解的胞内部分。在MW 50kDa处也出现了条带。
这是表明重组肌醇六磷酸酶蛋白质被部分分泌到培养基中的证据。但是,大量的酶仍然保留在胞内部分。
通过使用实施例4的测定确认上清液和胞内部分的肌醇六磷酸酶活性。
实施例2:制备Citrobacter gillenii肌醇六磷酸酶制品
30℃在添加了0.1%(w/w)肌醇六磷酸钠的LB培养基(25g LB Bouillon,Merck 0285,离子交换水1000ml)中摇振(225rpm)生长Citrobacter gilleniiDSM 13694过夜。离心(4000rpm,60min)收获细胞,弃去上清液。将细胞小丸再悬浮在有100mg/ml溶菌酶的两体积蒸馏水中,37℃孵育过夜使细胞溶解。离心溶解的细胞(4000rpm,2h),保留上清液并用它进行酸稳定性分析。
实施例3:Citrobacter gillenii肌醇六磷酸酶的耐酸性
实施例2中获得的50微升溶解产物与pH值分别为2.2、3.0(甘氨酸/盐酸)和7.0(HEPES)的50微升的100mM的缓冲液混合。37℃孵育样品过夜,利用实施例4中描述的分析方法分析剩余的肌醇六磷酸酶活性。以吸光度表示的剩余的肌醇六磷酸酶活性显示在下表1中。而且,计算了该活性相对pH7的剩余活性的百分比。
表1
在一定的pH条件下孵育后的剩余活性[OD] | pH2.2 | pH2.2相对于pH7.0的百分比 | pH3.0 | pH3.0相对于pH7.0的百分比 | pH7.0 | pH7.0相对于pH7.0的百分比 |
菌株: | ||||||
CitrobactergilleniiDSM13694 | 0.07 | 81 | 0.10 | 116 | 0.09 | 100 |
实施例4:肌醇六磷酸酶测定
基于与钼酸盐/铁的络合作用确定可溶解的磷酸盐和对微量滴定板中的蓝色进行的光度测量来进行测定。
底物是溶解在0.1M醋酸盐缓冲液中的pH=5.5的0.5mM的肌醇六磷酸钠(Sigma,P-8810)。在特定实施方案中,底物浓度是5mM。
按照如下描述制备显色试剂:1%的钼酸铵(Merck 1181,(NH4)6Mo7O24,4H2O)溶于3.2%的硫酸(Merck 731)中。1.1g硫酸亚铁(Merck 3965)溶于15ml上述的钼酸盐试剂中,并添加10ml 0.5M的硫酸。每天新鲜配制,保藏在黑暗中。
Blind:混合20ul样品、100ul底物和120ul显色试剂,37℃孵育5分钟,在750nm处测量ODBlind。
样品:混合20ul样品、100ul底物,37℃孵育30分钟,添加120ul显色试剂,37℃孵育5分钟,在750nm处测量OD样品。
OD=OD样品-ODBlind。
实施例5:无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)肌醇六磷酸酶的克隆
对下列酸性组氨酸磷酸酶进行多重比对:大肠杆菌appA(SPTREMBL:Q8GN88)、Klebsiella terrigena)phyk(SPTREMBL:Q7WSY1),以及YersiniapestisCO92(SPTREMBL:Q8ZFP6)。以共有序列为基础设计两个简并的寡核苷酸引物:
5′-CGC GTG GTG ATT GTG TCC MGN CAY GGN GT-3′(SEQ IDNO:13,正向引物)
5′-C CAG GTT GGT ATC ATG GCC NGC DAT RAA-3′(SEQ ID NO:14,反向引物)。
引物用于在45、48和50℃的退火温度通过PCR筛选许多细菌种属。
在无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25405和无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407中鉴定到形式为900bpDNA片段的部分肌醇六磷酸酶基因。PCR片段被克隆到pEZSeq钝端克隆试剂盒(来自Lucigen Corporation的目录号40501-1,2120 West Greenview Dr.,Ste 9,Middleton,WI 53562,US)。首先,用PCRTerminator末端修复试剂盒(PCRTerminator End Repair Kit)(是pEZSeq钝端克隆试剂盒的一部分)处理PCR片段,PCRTerminator末端修复试剂盒包含已经优化的能在任何种类的PCR产物上产生钝的5′磷酸化末端的具有多肽活性的混合物。克隆到pEZSeq载体中以后,可以利用两个特异的载体引物对克隆进行测序。核苷酸序列的翻译证实克隆的DNA片段是肌醇六磷酸酶基因的一部分。
为了获得该基因的全长核苷酸序列,使用了设计的能捕获未知目标位点的DNA Walking SpeedUp试剂盒(DWSK-V102 from Seegene,Inc.,2nd Fl.,Myungji Bldg.,142-21,Samsung-dong,Kangnam-gu,Seoul,135-090,Korea)。为了实现这一目的,设计了4个特异的寡核苷酸和该试剂盒一起使用。
例如:为了获得来自无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407的肌醇六磷酸酶基因的N-末端和C末端序列,使用了寡核苷酸TSP1N/TSP2N和TSP1C/TSP2C:
TSP1N:5′-TTT ACG AGT GCG CTG ATC GG-3′(SEQ ID NO:15)
TSP2N:5′-ATA ACT GCC ACC TGT TCT GGT GAC G-3′(SEQ ID NO:16)
TSP1C:5′-ACT CAG GGT TTC TGC GGA TAC C-3′(SEQ ID NO:17)
TSP2C:5′-AAT GCC AGA GGT TGC GTG GGG-3′(SEQ ID NO:18)
编码来自无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407的肌醇六磷酸酶的全长核苷酸序列为序列表显示的SEQ ID NO:5,编码的对应氨基酸序列为SEQ ID NO:6。预计SEQ ID NO:6起始的22个氨基酸是信号肽(通过Signal P V3.0进行预计)。来自无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)ATCC 25405的肌醇六磷酸酶具有如SEQ ID NO:6显示的氨基酸序列正好相同的序列,对应的核苷酸序列与来自SEQ ID NO:5的核苷酸序列仅仅相差三个核苷酸,即T78C、C118T和T120G,相差的这三个核苷酸都是不产生任何不同氨基酸的沉默变化。
该无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407肌醇六磷酸酶基因被克隆到没有融合标记的pET-30a(+)大肠杆菌表达载体中(来自Novagen的目录号69909,从Bie & Berntsen A/S,7 Sandbaekvej,DK-2610Roedovre,Denmark可买到)。在这个系统中,通过提供在大肠杆菌BL21star(DE)的pLysS宿主菌株中的T7RNA聚合酶来源(来自Novagen的目录号69388,从Bie & Berntsen可买到)诱导该基因的表达,其中大肠杆菌BL21star(DE)的pLysS宿主菌株包含在lacUV5启动子控制下的T7RNA聚合酶基因的染色体拷贝。通过添加乳糖到培养基中可以实现对靶基因的诱导。乳糖将结合阻遏物,从而导致它从操纵子上解离以允许从启动子开始转录。
为了表达肌醇六磷酸酶基因,转化的大肠杆菌菌株的单个集落被转移到不允许表达T7 RNA聚合酶的非诱导培养基(包含葡萄糖作为唯一的碳源)中进行接种培养。使用包含空pET-30(+)载体的大肠杆菌(BL21star(DE)pLYsS)作为阴性对照。将小等分(大约150微升)的接种培养物转移到包含乳糖作为唯一碳源的细颈瓶里。37℃以300rpm的转速振摇培养诱导培养物过夜。
离心收获细胞并通过SDS-PAGE分析15微升等分的上清液。10微升超精确蛋白质标准样品(Precision Plus protein standard)(目录号161-0363,市场上从Bio-Rad Laboratories Headquarters,1000 Alfred Nobel Drive,Hercules,CA 94547,US可买到)作为分子量(MW)标记。在来自重组大肠杆菌菌株的上清液中鉴定到MW为大约50kDa的清晰条带,但在阴性对照中没有鉴定到。
溶解收获的细胞小丸,并且也通过如上所述的SDS-PAGE分析溶解的胞内部分。在MW 50kDa处也出现了条带。
这是表明重组肌醇六磷酸酶蛋白质被部分分泌到培养基中的证据。但是,大量的多肽仍然保留在胞内部分。
通过使用实施例4的测定确认上清液和胞内部分的肌醇六磷酸酶活性。
实施例6:制备无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)肌醇六磷酸酶制品
30℃在添加了0.1%(w/w)肌醇六磷酸钠的LB培养基(25g LBBouillon,Merck 0285,离子交换水1000ml)中摇振(225rpm)生长无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25405过夜。离心(4000rpm,60min)收获细胞,弃去上清液。将细胞小丸再悬浮在含有100mg/ml溶菌酶的两体积蒸馏水中,在37℃孵育过夜使细胞裂解。离心裂解的细胞(4000rpm,2h),保留上清液并用它进行酸稳定性分析。
实施例7:无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)肌醇六磷酸酶的酸稳定性
实施例2中获得的50微升裂解产物与pH值分别为2.2、3.0(甘氨酸/盐酸)和7.0(HEPES)的50微升的100mM的缓冲液混合。37℃孵育样品过夜,利用实施例4中描述的分析方法分析剩余的肌醇六磷酸酶活性。以吸光度表示的剩余的肌醇六磷酸酶活性显示在下表1中。而且,计算了该活性占pH7的剩余活性的百分比。
表1
在一定的pH条件下孵育后的剩余活性[OD]: | pH2.2 | pH2.2相对于pH7.0的百分比 | pH3.0 | pH3.0相对于pH7.0的百分比 | pH7.0 | pH7.0相对于pH7.0的百分比 |
菌株: | ||||||
无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)ATCC 25405 | 0.12 | 78 | 0.14 | 100 | 0.14 | 100 |
特定的实施方案
以下是本发明附加的特定实施方案:
I.具有肌醇六磷酸酶活性的分离的多肽,选自由(a)具有与(i)SEQ ID NO:2的氨基酸1-409、(ii)SEQ ID NO:2的成熟多肽部分、(iii)SEQ ID NO:4的氨基酸1-410、和/或(iv)SEQ ID NO:4的成熟多肽部分中的任何一个有至少72%同一性的氨基酸序列的多肽;(b)至少在中等严谨条件下与(i)SEQID NO:1的核苷酸67-1293、(ii)SEQ ID NO:1的成熟多肽编码部分、(iii)SEQ ID NO:3的核苷酸67-1296、(iv)SEQ ID NO:3的成熟多肽编码部分、和/或(v)(i)、(ii)、(iii)或(iv)任何一项的互补链杂交的多核苷酸编码的多肽;(c)包含一个或多个氨基酸保守替换、缺失和/或插入的(a)(i)-(a)(iv)的任何一个多肽的变体;和(d)(a)(i)-(a)(iv)的任何一个多肽的片段组成的群组。
II.包含编码I的多肽的核苷酸序列的分离的多核苷酸。
III.编码具有肌醇六磷酸酶活性的多肽的分离的多核苷酸,选自由:(a)编码具有与SEQ ID NO:2的氨基酸1-409、SEQ ID NO:4的氨基酸1-410有至少72%同一性的氨基酸序列的多肽的多核苷酸;(b)与SEQ ID NO:1的核苷酸67-1293或SEQ ID NO:3的核苷酸67-1296有至少72%同一性的多核苷酸;和(c)至少在中等严谨条件下与(i)SEQ ID NO:1的核苷酸67-1293、(ii)SEQ ID NO:1的成熟多肽编码部分、(iii)SEQ ID NO:3的核苷酸67-1296、(iv)SEQ ID NO:3的成熟多肽编码部分、和/或(v)(i)、(ii)、(iii)或(iv)任何一项的互补链杂交的多核苷酸组成的组。
IV.II和III中任何一项的分离的多核苷酸,在SEQ ID NO:1或SEQ IDNO:3的成熟多肽编码序列中具有至少一个突变,其中核苷酸序列突变体编码包含SEQ ID NO:2的氨基酸1-409或SEQ ID NO:4的氨基酸1-410的多肽。
V.含II-IV中任何一项的多核苷酸的核酸构建体,其中多核苷酸操作性地与一个或多个指导表达宿主产生多肽的控制序列相连。
VI.包含V的核酸构建体的重组表达载体。
VII.包含V的核酸构建体的重组宿主细胞。
VIII.生产I的多肽的方法,包含(a)在有助于生产多肽的条件下培养其野生型能产生多肽的细胞;和(b)回收多肽。
IX.生产I的多肽的方法,包含(a)在有助于生产多肽的条件下培养包含核酸构建体的重组宿主细胞,其中核酸构建体包含编码该多肽的核苷酸序列;和(b)回收多肽。
X.已经用编码I的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。
XI.能表达I的多肽的转基因非人动物,以及其产物或元件。
XII.I的至少一种多肽在动物饲料中的用途。
XIII.I的至少一种多肽在制备用于动物饲料的组合物中的用途。
XIV.改善动物饲料营养价值的方法,其中I的至少一种多肽被添加到饲料中。
XV.动物饲料添加剂,包含(a)权利要求1的至少一种多肽;和(b)至少一种脂溶性维生素,(c)至少一种水溶性维生素、和/或(d)至少一种微量矿物质。
XVI.XV的动物饲料添加剂,更进一步地包含至少一种淀粉酶、至少一种附加的肌醇六磷酸酶、至少一种木聚糖酶、至少一种半乳聚糖酶、至少一种α-半乳糖苷酶、至少一种蛋白酶、至少一种磷脂酶和/或至少一种β-葡聚糖酶。
XVII.XVI的动物饲料添加剂,其中附加的肌醇六磷酸酶的pH最适条件比具有SEQ ID NO:2的氨基酸1-409或SEQ ID NO:4的氨基酸1-410的氨基酸序列的多肽的pH最适条件高。
XVIII.粗蛋白含量为50-800g/kg的包含I的至少一种多肽的动物饲料组合物。
XXI.具有肌醇六磷酸酶活性的分离的多肽,选自由(a)具有与(i)SEQ IDNO:6的氨基酸1-414、和/或(ii)SEQ ID NO:6的成熟多肽部分有至少70%同一性的氨基酸序列的多肽;(b)至少在中等严谨条件下与(i)SEQ ID NO:5的核苷酸67-1308、(ii)SEQ ID NO:5的成熟多肽编码部分、和/或(iii)(i)、(ii)或(iii)任何一项的互补链杂交的多核苷酸编码的多肽;(c)包含一个或多个氨基酸保守替换、缺失和/或插入的(a)(i)-(a)(ii)的任何一个多肽的变体;和(d)(a)(i)-(a)(ii)的任何一个多肽的片段组成的组。
XXII.包含编码XXI的多肽的核苷酸序列的分离的多核苷酸。
XXIII.编码具有肌醇六磷酸酶活性的多肽的分离的多核苷酸,选自由:(a)编码具有与SEQ ID NO:6的氨基酸1-414有至少70%同一性的氨基酸序列的多肽的多核苷酸;(b)与SEQ ID NO:5的核苷酸67-1308有至少71%同一性的多核苷酸;和(c)至少在中等严谨条件下与(i)SEQ ID NO:5的核苷酸67-1308、(ii)SEQ ID NO:5的成熟多肽编码部分、和/或(iii)(i)、(ii)或(iii)任何一项的互补链杂交的多核苷酸组成的组。
XXIV.XXII和XXIII任何一项的分离的多核苷酸,在SEQ ID NO:5的成熟多肽编码序列中有至少一个突变,其中核苷酸序列突变体编码包含SEQ ID NO:6的氨基酸1-414的多肽。
XXV.包含XXII-XXIV中任何一项的多核苷酸的核酸构建体,其中多核苷酸操作性地与一个或多个指导表达宿主产生多肽的控制序列相连。
XXVI.包含XXV的核酸构建体的重组表达载体。
XXVII.包含XXV的核酸构建体的重组宿主细胞。
XXIIX.生产XXI的多肽的方法,包含(a)在有助于生产多肽的条件下培养其野生型能产生该多肽的细胞;和(b)回收多肽。
XXIX.生产XXI的多肽的方法,包含(a)在有助于生产多肽的条件下培养包含核酸构建体的重组宿主细胞,其中核酸构建体包含编码该多肽的核苷酸序列;和(b)回收多肽。
XXX.已经用编码XXI的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。
XXXI.能表达XXI的多肽的转基因非人动物,以及其产物或元件。
XXXII.XXI的至少一种多肽在动物饲料中的用途。
XXXIII.XXI的至少一种多肽在制备用于动物饲料的组合物中的用途。
XXXIV.改善动物饲料营养价值的方法,其中XXI的至少一种多肽被添加到饲料中。
XXXV.动物饲料添加剂,包含(a)XXI的至少一种多肽;和(b)至少一种脂溶性维生素,(c)至少一种水溶性维生素、和/或(d)至少一种微量矿物质。
XXXVI.XXXV的动物饲料添加剂,更进一步地包含至少一种淀粉酶、至少一种附加的肌醇六磷酸酶、至少一种木聚糖酶、至少一种半乳聚糖酶、至少一种α-半乳糖苷酶、至少一种蛋白酶、至少一种磷脂酶和/或至少一种β-葡聚糖酶。
XXXVII.XXXVI的动物饲料添加剂,其中附加的肌醇六磷酸酶的pH最适条件比具有SEQ ID NO:6的氨基酸1-414的氨基酸序列的多肽的pH最适条件高。
XXXIIX.粗蛋白含量为50-800g/kg的包含XXI的至少一种多肽的动物饲料组合物。
本发明在这里描述和要求保护的内容并不限于这里公开的特定方案,因为这些方案只是用于解释说明本发明的几个方案。规定任何等效方案都在本发明的范围内。实际上,在上述内容的基础上,这里显示和描述的方案之外的各种修饰对本领域熟练技术人员来说都是很明显的。这种修饰也在附加的权利要求的范围内。在发生冲突的情况下,本发明中包含定义的公开内容将起控制作用。
这里引用的各种参考文献的公开内容全部引入作为参考。
序列表
<110>诺维信公司(Novozymes A/S)
<120>具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸
<130>10676.504-WO
<160>18
<170>PatentIn version 3.3
<210>1
<211>1296
<212>DNA
<213>人工的
<220>
<223>SEQ ID NO:3的变体
(T99G+C102G+C105T+C108G+A109T+G110C+T111C+T117C+C975T+A989C+T991(-)
+C992(-)+A1005(-))
<220>
<221>CDS
<222>(1)..(1293)
<220>
<221>mat_peptide
<222>(67)..(1293)
<400>1
atg agt aca ctg atc att cgt tta ttg ttc tta acg att ata ttg gcc 48
Met Ser Thr Leu Ile Ile Arg Leu Leu Phe Leu Thr Ile Ile Leu Ala
-20 -15 -10
cct gtt tca tta cgc gcc gat gaa cag agc gga atg cag ctt gag cgt 96
Pro Val Ser Leu Arg Ala Asp Glu Gln Ser Gly Met Gln Leu Glu Arg
-5 -1 1 5 10
gtg gtg att gtg tcc cgt cac ggc gtc agg gca ccg aca aag ttc acg 144
Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr
15 20 25
ccg ctt atg cag caa gtc act ccc gac cgc tgg ccg caa tgg gac gtt 192
Pro Leu Met Gln Gln Val Thr Pro Asp Arg Trp Pro Gln Trp Asp Val
30 35 40
cct ctg ggg tgg ttg act cct cgc ggc ggg gca ctc att act gag tta 240
Pro Leu Gly Trp Leu Thr Pro Arg Gly Gly Ala Leu Ile Thr Glu Leu
45 50 55
gga cgg tat caa cgt tta cgc ctg gcg gac aaa ggt ctg ctg gat aat 288
Gly Arg Tyr Gln Arg Leu Arg Leu Ala Asp Lys Gly Leu Leu Asp Asn
60 65 70
aaa acg tgt cca acg gca ggg cag gtc gcg gtc att gcc gat agc gat 336
Lys Thr Cys Pro Thr Ala Gly Gln Val Ala Val Ile Ala Asp Ser Asp
75 80 85 90
caa cgt acc cgt aaa acg ggt gaa gca ttc ctg gca gga ctg gct ccg 384
Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Leu Ala Pro
95 100 105
gaa tgt aaa gta cag gtt tat tat caa caa gat aag tca aaa tct gat 432
Glu Cys Lys Val Gln Val Tyr Tyr Gln Gln Asp Lys Ser Lys Ser Asp
110 115 120
ccc ctt ttt aat ccc atc aag gcg ggg cgg tgt tcg ctg aac aca tcg 480
Pro Leu Phe Asn Pro Ile Lys Ala Gly Arg Cys Ser Leu Asn Thr Ser
125 130 135
cag gtg aaa gag gcc atc ctg acc cgg gct ggc gga agt ctt gat gag 528
Gln Val Lys Glu Ala Ile Leu Thr Arg Ala Gly Gly Ser Leu Asp Glu
140 145 150
tac acg cgc cac tac caa ccc gca ttt caa gcc ctg gaa cgg gtg tta 576
Tyr Thr Arg His Tyr Gln Pro Ala Phe Gln Ala Leu Glu Arg Val Leu
155 160 165 170
aat ttc tcc cag tca gaa aag tgt caa gca gct ggg cag tct gca cag 624
Asn Phe Ser Gln Ser Glu Lys Cys Gln Ala Ala Gly Gln Ser Ala Gln
175 180 185
tgt acg cta acc gac gtc tta cct gct gaa ctc aag gtc tct cca gaa 672
Cys Thr Leu Thr Asp Val Leu Pro Ala Glu Leu Lys Val Ser Pro Glu
190 195 200
aat ata tcg ttg tca ggc tca tgg gga ctg gct tca acc ctg acg gaa 720
Asn Ile Ser Leu Ser Gly Ser Trp Gly Leu Ala Ser Thr Leu Thr Glu
205 210 215
atc ttc ctg ctg caa caa gca caa ggg atg tcg cag gtg gcc tgg ggg 768
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Ser Gln Val Ala Trp Gly
220 225 230
cgt att cat ggc gat aaa gaa tgg cgt aca tta tta agt ctg cac aat 816
Arg Ile His Gly Asp Lys Glu Trp Arg Thr Leu Leu Ser Leu His Asn
235 240 245 250
gcg cag ttt gac ctt ctg cag aaa acc ccg gag gtt gcc cgt agc agg 864
Ala Gln Phe Asp Leu Leu Gln Lys Thr Pro Glu Val Ala Arg Ser Arg
255 260 265
gcc aca ccg tta ctt gat ttg ata cgt aca gca ctc gta aca cag ggg 912
Ala Thr Pro Leu Leu Asp Leu Ile Arg Thr Ala Leu Val Thr Gln Gly
270 275 280
gca aca gaa aat aaa tac gca att cag ttg ccc gtc tct ttg ttg ttt 960
Ala Thr Glu Asn Lys Tyr Ala Ile Gln Leu Pro Val Ser Leu Leu Phe
285 290 295
att gcg ggg cat gat acc aat ctt gcc act aag cgg ggc att ggc ctt 1008
Ile Ala Gly His Asp Thr Asn Leu Ala Thr Lys Arg Gly Ile Gly Leu
300 305 310
aac gtg ttt ctg ccc ggt cag cca gat aat acg ccg ccg ggt gga gag 1056
Asn Val Phe Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu
315 320 325 330
ttt gtt ttc gaa agg tgg aaa cgg gtc agc gat cat tct gat tgg gtg 1104
Phe Val Phe Glu Arg Trp Lys Arg Val Ser Asp His Ser Asp Trp Val
335 340 345
cag gtt tct ttt atg tat cag aca ttg cag gaa atg cgt gat atg caa 1152
Gln Val Ser Phe Met Tyr Gln Thr Leu Gln Glu Met Arg Asp Met Gln
350 355 360
cct ttg tcg ttg caa tcg cct ccc gga aaa att gtg ctg ccc tta gcg 1200
Pro Leu Ser Leu Gln Ser Pro Pro Gly Lys Ile Val Leu Pro Leu Ala
365 370 375
gcc tgc gat gag aaa aat acg cag gga atg tgc tca tta aaa aat ttt 1248
Ala Cys Asp Glu Lys Asn Thr Gln Gly Met Cys Ser Leu Lys Asn Phe
380 385 390
tct gca ctg att gat tcc gtt cgc gtg tcc gaa tgt gct gag aaa taa 1296
Ser Ala Leu Ile Asp Ser Val Arg Val Ser Glu Cys Ala Glu Lys
395 400 405
<210>2
<211>431
<212>PRT
<213>人工的
<220>
<223>合成构建体
<400>2
Met Ser Thr Leu Ile Ile Arg Leu Leu Phe Leu Thr Ile Ile Leu Ala
-20 -15 -10
Pro Val Ser Leu Arg Ala Asp Glu Gln Ser Gly Met Gln Leu Glu Arg
-5 -1 1 5 10
Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr
15 20 25
Pro Leu Met Gln Gln Val Thr Pro Asp Arg Trp Pro Gln Trp Asp Val
30 35 40
Pro Leu Gly Trp Leu Thr Pro Arg Gly Gly Ala Leu Ile Thr Glu Leu
45 50 55
Gly Arg Tyr Gln Arg Leu Arg Leu Ala Asp Lys Gly Leu Leu Asp Asn
60 65 70
Lys Thr Cys Pro Thr Ala Gly Gln Val Ala Val Ile Ala Asp Ser Asp
75 80 85 90
Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Leu Ala Pro
95 100 105
Glu Cys Lys Val Gln Val Tyr Tyr Gln Gln Asp Lys Ser Lys Ser Asp
110 115 120
Pro Leu Phe Asn Pro Ile Lys Ala Gly Arg Cys Ser Leu Asn Thr Ser
125 130 135
Gln Val Lys Glu Ala Ile Leu Thr Arg Ala Gly Gly Ser Leu Asp Glu
140 145 150
Tyr Thr Arg His Tyr Gln Pro Ala Phe Gln Ala Leu Glu Arg Val Leu
155 160 165 170
Asn Phe Ser Gln Ser Glu Lys Cys Gln Ala Ala Gly Gln Ser Ala Gln
175 180 185
Cys Thr Leu Thr Asp Val Leu Pro Ala Glu Leu Lys Val Ser Pro Glu
190 195 200
Asn Ile Ser Leu Ser Gly Ser Trp Gly Leu Ala Ser Thr Leu Thr Glu
205 210 215
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Ser Gln Val Ala Trp Gly
220 225 230
Arg Ile His Gly Asp Lys Glu Trp Arg Thr Leu Leu Ser Leu His Asn
235 240 245 250
Ala Gln Phe Asp Leu Leu Gln Lys Thr Pro Glu Val Ala Arg Ser Arg
255 260 265
Ala Thr Pro Leu Leu Asp Leu Ile Arg Thr Ala Leu Val Thr Gln Gly
270 275 280
Ala Thr Glu Asn Lys Tyr Ala Ile Gln Leu Pro Val Ser Leu Leu Phe
285 290 295
Ile Ala Gly His Asp Thr Asn Leu Ala Thr Lys Arg Gly Ile Gly Leu
300 305 310
Asn Val Phe Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu
315 320 325 330
Phe Val Phe Glu Arg Trp Lys Arg Val Ser Asp His Ser Asp Trp Val
335 340 345
Gln Val Ser Phe Met Tyr Gln Thr Leu Gln Glu Met Arg Asp Met Gln
350 355 360
Pro Leu Ser Leu Gln Ser Pro Pro Gly Lys Ile Val Leu Pro Leu Ala
365 370 375
Ala Cys Asp Glu Lys Asn Thr Gln Gly Met Cys Ser Leu Lys Asn Phe
380 385 390
Ser Ala Leu Ile Asp Ser Val Arg Val Ser Glu Cys Ala Glu Lys
395 400 405
<210>3
<211>1296
<212>DNA
<213>Citrobacter gillenii DSM 13694
<220>
<221>CDS
<222>(1)..(1296)
<220>
<221>mat_peptide
<222>(67)..(1296)
<400>3
atg agt aca ctg atc att cgt tta ttg ttc tta acg att ata ttg gcc 48
Met Ser Thr Leu Ile Ile Arg Leu Leu Phe Leu Thr Ile Ile Leu Ala
-20 -15 -10
cct gtt tca tta cgc gcc gat gaa cag agc gga atg cag ctt gag cgt 96
Pro Val Ser Leu Arg Ala Asp Glu Gln Ser Gly Met Gln Leu Glu Arg
-5 -1 1 5 10
gtt gtc atc gtc agt cgt cat ggc gtc agg gca ccg aca aag ttc acg 144
Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr
15 20 25
ccg ctt atg cag caa gtc act ccc gac cgc tgg ccg caa tgg gac gtt 192
Pro Leu Met Gln Gln Val Thr Pro Asp Arg Trp Pro Gln Trp Asp Val
30 35 40
cct ctg ggg tgg ttg act cct cgc ggc ggg gca ctc att act gag tta 240
Pro Leu Gly Trp Leu Thr Pro Arg Gly Gly Ala Leu Ile Thr Glu Leu
45 50 55
gga cgg tat caa cgt tta cgc ctg gcg gac aaa ggt ctg ctg gat aat 288
Gly Arg Tyr Gln Arg Leu Arg Leu Ala Asp Lys Gly Leu Leu Asp Asn
60 65 70
aaa acg tgt cca acg gca ggg cag gtc gcg gtc att gcc gat agc gat 336
Lys Thr Cys Pro Thr Ala Gly Gln Val Ala Val Ile Ala Asp Ser Asp
75 80 85 90
caa cgt acc cgt aaa acg ggt gaa gca ttc ctg gca gga ctg gct ccg 384
Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Leu Ala Pro
95 100 105
gaa tgt aaa gta cag gtt tat tat caa caa gat aag tca aaa tct gat 432
Glu Cys Lys Val Gln Val Tyr Tyr Gln Gln Asp Lys Ser Lys Ser Asp
110 115 120
ccc ctt ttt aat ccc atc aag gcg ggg cgg tgt tcg ctg aac aca tcg 480
Pro Leu Phe Asn Pro Ile Lys Ala Gly Arg Cys Ser Leu Asn Thr Ser
125 130 135
cag gtg aaa gag gcc atc ctg acc cgg gct ggc gga agt ctt gat gag 528
Gln Val Lys Glu Ala Ile Leu Thr Arg Ala Gly Gly Ser Leu Asp Glu
140 145 150
tac acg cgc cac tac caa ccc gca ttt caa gcc ctg gaa cgg gtg tta 576
Tyr Thr Arg His Tyr Gln Pro Ala Phe Gln Ala Leu Glu Arg Val Leu
155 160 165 170
aat ttc tcc cag tca gaa aag tgt caa gca gct ggg cag tct gca cag 624
Asn Phe Ser Gln Ser Glu Lys Cys Gln Ala Ala Gly Gln Ser Ala Gln
175 180 185
tgt acg cta acc gac gtc tta cct gct gaa ctc aag gtc tct cca gaa 672
Cys Thr Leu Thr Asp Val Leu Pro Ala Glu Leu Lys Val Ser Pro Glu
190 195 200
aat ata tcg ttg tca ggc tca tgg gga ctg gct tca acc ctg acg gaa 720
Asn Ile Ser Leu Ser Gly Ser Trp Gly Leu Ala Ser Thr Leu Thr Glu
205 210 215
atc ttc ctg ctg caa caa gca caa ggg atg tcg cag gtg gcc tgg ggg 768
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Ser Gln Val Ala Trp Gly
220 225 230
cgt att cat ggc gat aaa gaa tgg cgt aca tta tta agt ctg cac aat 816
Arg Ile His Gly Asp Lys Glu Trp Arg Thr Leu Leu Ser Leu His Asn
235 240 245 250
gcg cag ttt gac ctt ctg cag aaa acc ccg gag gtt gcc cgt agc agg 864
Ala Gln Phe Asp Leu Leu Gln Lys Thr Pro Glu Val Ala Arg Ser Arg
255 260 265
gcc aca ccg tta ctt gat ttg ata cgt aca gca ctc gta aca cag ggg 912
Ala Thr Pro Leu Leu Asp Leu Ile Arg Thr Ala Leu Val Thr Gln Gly
270 275 280
gca aca gaa aat aaa tac gca att cag ttg ccc gtc tct ttg ttg ttt 960
Ala Thr Glu Asn Lys Tyr Ala Ile Gln Leu Pro Val Ser Leu Leu Phe
285 290 295
att gcg ggg cat gac acc aat ctt gcc aat atc agc ggg gca tta ggc 1008
Ile Ala Gly His Asp Thr Asn Leu Ala Asn Ile Ser Gly Ala Leu Gly
300 305 310
ctt aac gtg ttt ctg ccc ggt cag cca gat aat acg ccg ccg ggt gga 1056
Leu Asn Val Phe Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly
315 320 325 330
gag ttt gtt ttc gaa agg tgg aaa cgg gtc agc gat cat tct gat tgg 1104
Glu Phe Val Phe Glu Arg Trp Lys Arg Val Ser Asp His Ser Asp Trp
335 340 345
gtg cag gtt tct ttt atg tat cag aca ttg cag gaa atg cgt gat atg 1152
Val Gln Val Ser Phe Met Tyr Gln Thr Leu Gln Glu Met Arg Asp Met
350 355 360
caa cct ttg tcg ttg caa tcg cct ccc gga aaa att gtg ctg ccc tta 1200
Gln Pro Leu Ser Leu Gln Ser Pro Pro Gly Lys Ile Val Leu Pro Leu
365 370 375
gcg gcc tgc gat gag aaa aat acg cag gga atg tgc tca tta aaa aat 1248
Ala Ala Cys Asp Glu Lys Asn Thr Gln Gly Met Cys Ser Leu Lys Asn
380 385 390
ttt tct gca ctg att gat tcc gtt cgc gtg tcc gaa tgt gct gag aaa 1296
Phe Ser Ala Leu Ile Asp Ser Val Arg Val Ser Glu Cys Ala Glu Lys
395 400 405 410
<210>4
<211>432
<212>PRT
<213>Citrobacter gillenii DSM 13694
<400>4
Met Ser Thr Leu Ile Ile Arg Leu Leu Phe Leu Thr Ile Ile Leu Ala
-20 -15 -10
Pro Val Ser Leu Arg Ala Asp Glu Gln Ser Gly Met Gln Leu Glu Arg
-5 -1 1 5 10
Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr
15 20 25
Pro Leu Met Gln Gln Val Thr Pro Asp Arg Trp Pro Gln Trp Asp Val
30 35 40
Pro Leu Gly Trp Leu Thr Pro Arg Gly Gly Ala Leu Ile Thr Glu Leu
45 50 55
Gly Arg Tyr Gln Arg Leu Arg Leu Ala Asp Lys Gly Leu Leu Asp Asn
60 65 70
Lys Thr Cys Pro Thr Ala Gly Gln Val Ala Val Ile Ala Asp Ser Asp
75 80 85 90
Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Leu Ala Pro
95 100 105
Glu Cys Lys Val Gln Val Tyr Tyr Gln Gln Asp Lys Ser Lys Ser Asp
110 115 120
Pro Leu Phe Asn Pro Ile Lys Ala Gly Arg Cys Ser Leu Asn Thr Ser
125 130 135
Gln Val Lys Glu Ala Ile Leu Thr Arg Ala Gly Gly Ser Leu Asp Glu
140 145 150
Tyr Thr Arg His Tyr Gln Pro Ala Phe Gln Ala Leu Glu Arg Val Leu
155 160 165 170
Asn Phe Ser Gln Ser Glu Lys Cys Gln Ala Ala Gly Gln Ser Ala Gln
175 180 185
Cys Thr Leu Thr Asp Val Leu Pro Ala Glu Leu Lys Val Ser Pro Glu
190 195 200
Asn Ile Ser Leu Ser Gly Ser Trp Gly Leu Ala Ser Thr Leu Thr Glu
205 210 215
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Ser Gln Val Ala Trp Gly
220 225 230
Arg Ile His Gly Asp Lys Glu Trp Arg Thr Leu Leu Ser Leu His Asn
235 240 245 250
Ala Gln Phe Asp Leu Leu Gln Lys Thr Pro Glu Val Ala Arg Ser Arg
255 260 265
Ala Thr Pro Leu Leu Asp Leu Ile Arg Thr Ala Leu Val Thr Gln Gly
270 275 280
Ala Thr Glu Asn Lys Tyr Ala Ile Gln Leu Pro Val Ser Leu Leu Phe
285 290 295
Ile Ala Gly His Asp Thr Asn Leu Ala Asn Ile Ser Gly Ala Leu Gly
300 305 310
Leu Asn Val Phe Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly
315 320 325 330
Glu Phe Val Phe Glu Arg Trp Lys Arg Val Ser Asp His Ser Asp Trp
335 340 345
Val Gln Val Ser Phe Met Tyr Gln Thr Leu Gln Glu Met Arg Asp Met
350 355 360
Gln Pro Leu Ser Leu Gln Ser Pro Pro Gly Lys Ile Val Leu Pro Leu
365 370 375
Ala Ala Cys Asp Glu Lys Asn Thr Gln Gly Met Cys Ser Leu Lys Asn
380 385 390
Phe Ser Ala Leu Ile Asp Ser Val Arg Val Ser Glu Cys Ala Glu Lys
395 400 405 410
<210>5
<211>1311
<212>DNA
<213>无丙二酸柠檬酸杆菌(Citrobacter amalonaticus)ATCC 25407
<220>
<221>CDS
<222>(1)..(1308)
<220>
<221>mat_peptide
<222>(67)..(1308)
<400>5
atg aat acg cta ctt ttt cga tta ata atg ttt ata ttc atg ttt ggt 48
Met Asn Thr Leu Leu Phe Arg Leu Ile Met Phe Ile Phe Met Phe Gly
-20 -15 -10
tct ttc cca tta cag gcg gaa gtg cca gat gac atg aag ctt gaa cga 96
Ser Phe Pro Leu Gln Ala Glu Val Pro Asp Asp Met Lys Leu Glu Arg
-5 -1 1 5 10
gtt gtg ata gta agt cgc cac ggt gta aga gca cca aca aag ttc acc 144
Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr
15 20 25
cca ttg atg cag gaa atc aca cct tac cat tgg ccg caa tgg gat gtt 192
Pro Leu Met Gln Glu Ile Thr Pro Tyr His Trp Pro Gln Trp Asp Val
30 35 40
ccc ctg ggc tgg ttg acg gct cgg ggt ggt gag ctc gtc acc gaa atg 240
Pro Leu Gly Trp Leu Thr Ala Arg Gly Gly Glu Leu Val Thr Glu Met
45 50 55
gga cga tat caa caa aaa gta tta atc gat aac ggc gtt ctg gaa agt 288
Gly Arg Tyr Gln Gln Lys Val Leu Ile Asp Asn Gly Val Leu Glu Ser
60 65 70
aat gta tgt ccg tca cca gaa cag gtg gca gtt att gcc gat acc gat 336
Asn Val Cys Pro Ser Pro Glu Gln Val Ala Val Ile Ala Asp Thr Asp
75 80 85 90
cag cgc act cgt aaa acc ggt gag gca ttt ctg gct gga ttt gcg ccg 384
Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Phe Ala Pro
95 100 105
gga tgt aaa aat aag gtt cat tat caa aaa gat cac gat aaa aaa gat 432
Gly Cys Lys Asn Lys Val His Tyr Gln Lys Asp His Asp Lys Lys Asp
110 115 120
cct ctt ttt aat cca gta aaa atg ggg gtg tgc gct ttt aat gta caa 480
Pro Leu Phe Asn Pro Val Lys Met Gly Val Cys Ala Phe Asn Val Gln
125 130 135
aaa act cag gaa gcg att ctg aca cgt gcg gaa gga aac att gaa cgg 528
Lys Thr Gln Glu Ala Ile Leu Thr Arg Ala Glu Gly Asn Ile Glu Arg
140 145 150
tac act cag cgt tat gac tct gca ttc cgt act ctg gaa cag gtt ctc 576
Tyr Thr Gln Arg Tyr Asp Ser Ala Phe Arg Thr Leu Glu Gln Val Leu
155 160 165 170
aat ttc tcc cgg tca gca gca tgc cga tca gca agc cag tct ggt tgc 624
Asn Phe Ser Arg Ser Ala Ala Cys Arg Ser Ala Ser Gln Ser Gly Cys
175 180 185
acg cta cca gga acc tta cct tca gaa ctc agg gtt tct gcg gat acc 672
Thr Leu Pro Gly Thr Leu Pro Ser Glu Leu Arg Val Ser Ala Asp Thr
190 195 200
gtt tcc tta tct ggc gcg tgg agt ctt tct tcc atg ctg acg gaa ata 720
Val Ser Leu Ser Gly Ala Trp Ser Leu Ser Ser Met Leu Thr Glu Ile
205 210 215
ttt cta ttg caa gag gcg cag gga atg cca gag gtt gcg tgg ggg cga 768
Phe Leu Leu Gln Glu Ala Gln Gly Met Pro Glu Val Ala Trp Gly Arg
220 225 230
att cat ggg gag aaa gaa tgg aca gcg tta tta agt ctg cat aat gct 816
Ile His Gly Glu Lys Glu Trp Thr Ala Leu Leu Ser Leu His Asn Ala
235 240 245 250
cag ttt gac ctt ttg caa aga act ccc gaa gtt gcc cgc agc aga gca 864
Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala
255 260 265
aca cca tta ctc gat ttg atc agc gaa gca tta gtg agt aat ggg tca 912
Thr Pro Leu Leu Asp Leu Ile Ser Glu Ala Leu Val Ser Asn Gly Ser
270 275 280
aca gaa aat cat tac gga att aaa tta ccc gtc tca tta ttg ttt att 960
Thr Glu Asn His Tyr Gly Ile Lys Leu Pro Val Ser Leu Leu Phe Ile
285 290 295
gct ggt cat gat acc aat ctt gca aat ctc agt ggg gta ttt gat ctt 1008
Ala Gly His Asp Thr Asn Leu Ala Asn Leu Ser Gly Val Phe Asp Leu
300 305 310
aac tgg tct cta cct ggg cag cca gat aat aca cct cct ggc ggg gag 1056
Asn Trp Ser Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu
315 320 325 330
ctg gtt ttc gaa aga tgg acg cga gtg agt gat aac act gac tgg att 1104
Leu Val Phe Glu Arg Trp Thr Arg Val Ser Asp Asn Thr Asp Trp Ile
335 340 345
caa att tcg ttt gtt tat cag act ctt caa caa atg cgt aag ttt aaa 1152
Gln Ile Ser Phe Val Tyr Gln Thr Leu Gln Gln Met Arg Lys Phe Lys
350 355 360
cct ttt tca tct tcg tct ctc cca aac aag att gtg ctt acg ttg ccc 1200
Pro Phe Ser Ser Ser Ser Leu Pro Asn Lys Ile Val Leu Thr Leu Pro
365 370 375
tct tgc cag gat aaa aat cct gag ggt atg tgt cca tta aag cat ttt 1248
Ser Cys Gln Asp Lys Asn Pro Glu Gly Met Cys Pro Leu Lys His Phe
380 385 390
att gac att gtg cag aca gca cgt att cca caa tgt gca gtg atg gct 1296
Ile Asp Ile Val Gln Thr Ala Arg Ile Pro Gln Cys Ala Val Met Ala
395 400 405 410
gat gta aac cgt taa 1311
Asp Val Asn Arg
<210>6
<211>436
<212>PRT
<213>无丙二酸柠檬酸杆菌ATCC 25407
<400>6
Met Asn Thr Leu Leu Phe Arg Leu Ile Met Phe Ile Phe Met Phe Gly
-20 -15 -10
Ser Phe Pro Leu Gln Ala Glu Val Pro Asp Asp Met Lys Leu Glu Arg
-5 -1 1 5 10
Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Phe Thr
15 20 25
Pro Leu Met Gln Glu Ile Thr Pro Tyr His Trp Pro Gln Trp Asp Val
30 35 40
Pro Leu Gly Trp Leu Thr Ala Arg Gly Gly Glu Leu Val Thr Glu Met
45 50 55
Gly Arg Tyr Gln Gln Lys Val Leu Ile Asp Asn Gly Val Leu Glu Ser
60 65 70
Asn Val Cys Pro Ser Pro Glu Gln Val Ala Val Ile Ala Asp Thr Asp
75 80 85 90
Gln Arg Thr Arg Lys Thr Gly Glu Ala Phe Leu Ala Gly Phe Ala Pro
95 100 105
Gly Cys Lys Asn Lys Val His Tyr Gln Lys Asp His Asp Lys Lys Asp
110 115 120
Pro Leu Phe Asn Pro Val Lys Met Gly Val Cys Ala Phe Asn Val Gln
125 130 135
Lys Thr Gln Glu Ala Ile Leu Thr Arg Ala Glu Gly Asn Ile Glu Arg
140 145 150
Tyr Thr Gln Arg Tyr Asp Ser Ala Phe Arg Thr Leu Glu Gln Val Leu
155 160 165 170
Asn Phe Ser Arg Ser Ala Ala Cys Arg Ser Ala Ser Gln Ser Gly Cys
175 180 185
Thr Leu Pro Gly Thr Leu Pro Ser Glu Leu Arg Val Ser Ala Asp Thr
190 195 200
Val Ser Leu Ser Gly Ala Trp Ser Leu Ser Ser Met Leu Thr Glu Ile
205 210 215
Phe Leu Leu Gln Glu Ala Gln Gly Met Pro Glu Val Ala Trp Gly Arg
220 225 230
Ile His Gly Glu Lys Glu Trp Thr Ala Leu Leu Ser Leu His Asn Ala
235 240 245 250
Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala
255 260 265
Thr Pro Leu Leu Asp Leu Ile Ser Glu Ala Leu Val Ser Asn Gly Ser
270 275 280
Thr Glu Asn His Tyr Gly Ile Lys Leu Pro Val Ser Leu Leu Phe Ile
285 290 295
Ala Gly His Asp Thr Asn Leu Ala Asn Leu Ser Gly Val Phe Asp Leu
300 305 310
Asn Trp Ser Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu
315 320 325 330
Leu Val Phe Glu Arg Trp Thr Arg Val Ser Asp Asn Thr Asp Trp Ile
335 340 345
Gln Ile Ser Phe Val Tyr Gln Thr Leu Gln Gln Met Arg Lys Phe Lys
350 355 360
Pro Phe Ser Ser Ser Ser Leu Pro Asn Lys Ile Val Leu Thr Leu Pro
365 370 375
Ser Cys Gln Asp Lys Asn Pro Glu Gly Met Cys Pro Leu Lys His Phe
380 385 390
Ile Asp Ile Val Gln Thr Ala Arg Ile Pro Gln Cys Ala Val Met Ala
395 400 405 410
Asp Val Asn Arg
<210>7
<211>29
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(19)..(19)
<223>m是A,或C
<220>
<221>misc_feature
<222>(21)..(21)
<223>n是a,c,g,或t
<220>
<221>misc_feature
<222>(24)..(24)
<223>y是C,或T
<220>
<221>misc_feature
<222>(27)..(27)
<223>n是a,c,g,或t
<400>7
cgcgtggtga ttgtgtccmg ncayggngt 29
<210>8
<211>28
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(20)..(20)
<223>n是a,c,g,或t
<220>
<221>misc_feature
<222>(23)..(23)
<223>d是A,G,或T
<220>
<221>misc_feature
<222>(26)..(26)
<223>r是A,或G
<400>8
ccaggttggt atcatggccn gcdatraa 28
<210>9
<211>17
<212>DNA
<213>人工的
<220>
<223>引物
<400>9
agacttccgc cagcccg 17
<210>10
<211>19
<212>DNA
<213>人工的
<220>
<223>引物
<400>10
aagcagctgg gcagtctgc 19
<210>11
<211>21
<212>DNA
<213>人工的
<220>
<223>引物
<400>11
aagcggcgtg aactttgtcg g 21
<210>12
<211>22
<212>DNA
<213>人工的
<220>
<223>引物
<400>12
atggggactg gcttcaaccc tg 22
<210>13
<211>29
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(19)..(19)
<223>m是A,或C
<220>
<221>misc_feature
<222>(21)..(21)
<223>n是a,c,g,或t
<220>
<221>misc_feature
<222>(24)..(24)
<223>y是C,或T
<220>
<221>misc_feature
<222>(27)..(27)
<223>n是a,c,g,或t
<400>13
cgcgtggtga ttgtgtccmg ncayggngt 29
<210>14
<211>28
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(20)..(20)
<223>n是a,c,g,或t
<220>
<221>misc_feature
<222>(23)..(23)
<223>d是A,G,或T
<220>
<221>misc_feature
<222>(26)..(26)
<223>r是A,或G
<400>14
ccaggttggt atcatggccn gcdatraa 28
<210>15
<211>20
<212>DNA
<213>人工的
<220>
<223>引物
<400>15
tttacgagtg cgctgatcgg 20
<210>16
<211>25
<212>DNA
<213>人工的
<220>
<223>引物
<400>16
ataactgcca cctgttctgg tgacg 25
<210>17
<211>22
<212>DNA
<213>人工的
<220>
<223>引物
<400>17
actcagggtt tctgcggata cc 22
<210>18
<211>21
<212>DNA
<213>人工的
<220>
<223>引物
<400>18
aatgccagag gttgcgtggg g 21
Claims (17)
1.具有肌醇六磷酸酶活性的分离的多肽,选自下组:
(a)具有氨基酸序列的多肽,所述氨基酸序列与(i)SEQ ID NO:2的氨基酸1-409、(ii)SEQ ID NO:2的成熟多肽部分、(iii)SEQ ID NO:4的氨基酸1-410、(iv)SEQ ID NO:4的成熟多肽部分、(v)SEQ ID NO:6的氨基酸1-414、和/或(vi)SEQ ID NO:6的成熟多肽部分有至少75%同一性;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中等严谨条件下与(i)SEQ ID NO:1的核苷酸67-1293、(ii)SEQ ID NO:1的成熟多肽编码部分、(iii)SEQ ID NO:3的核苷酸67-1296、(iv)SEQ ID NO:3的成熟多肽编码部分、(v)SEQ ID NO:5的核苷酸67-1308、(vi)SEQ ID NO:5的成熟多肽编码部分、和/或(vii)(i)、(ii)、(iii)、(iv)、(v)或(vi)任何一项的互补链杂交;
(c)(a)(i)-(a)(vi)任何一个多肽的变体,其包含一个或多个氨基酸缺失、插入和/或保守取代;和
(d)(a)(i)-(a)(vi)的任何一个多肽的片段。
2.分离的多核苷酸,其包含编码权利要求1的多肽的核苷酸序列。
3.编码具有肌醇六磷酸酶活性的多肽的分离的多核苷酸,选自:
(a)编码多肽的多核苷酸,所述多肽具有的氨基酸序列与(i)SEQ ID NO:2的氨基酸1-409、(ii)SEQ ID NO:4的氨基酸1-410和/或(iii)SEQ ID NO:6的氨基酸1-414中的任何一个有至少75%的同一性;
(b)与(i)SEQ ID NO:1的核苷酸67-1293、(ii)SEQ ID NO:3的核苷酸67-1296、和/或(iii)SEQ ID NO:5的核苷酸67-1308中的任何一个有至少75%同一性的多核苷酸;
(c)多核苷酸,其在至少中等严谨条件下与(i)SEQ ID NO:1的核苷酸67-1293、(ii)SEQ ID NO:1的成熟多肽编码部分、(iii)SEQ ID NO:3的核苷酸67-1296、(iv)SEQ ID NO:3的成熟多肽编码部分、(v)SEQ ID NO:5的核苷酸67-1308、(vi)SEQ ID NO:5的成熟多肽编码部分、和/或(vii)(i)、(ii)、(iii)、(iv)、(v)或(vi)任何一项的互补链杂交。
4.权利要求2和3中任何一项的分离的多核苷酸,在SEQ ID NO:1、SEQID NO:3或SEQ ID NO:5的成熟多肽编码序列中具有至少一个突变,其中突变体核苷酸序列编码包含SEQ ID NO:2的氨基酸1-409、SEQ ID NO:4的氨基酸1-410或SEQ ID NO:6的氨基酸1-414的多肽。
5.包含权利要求2-4中任何一项的多核苷酸的核酸构建体,所述多核苷酸可操作地与一个或多个控制序列相连,所述控制序列指导表达宿主产生多肽。
6.包含权利要求5的核酸构建体的重组表达载体。
7.包含权利要求5的核酸构建体的重组宿主细胞。
8.生产权利要求1的多肽的方法,包含(a)在有助于生产多肽的条件下培养其野生型能产生该多肽的细胞;和(b)回收多肽。
9.生产权利要求1的多肽的方法,包含(a)在有助于生产多肽的条件下培养包含核酸构建体的重组宿主细胞,所述核酸构建体包含编码该多肽的核苷酸序列;和(b)回收多肽。
10.已经用编码权利要求1的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。
11.能表达权利要求1的多肽的转基因非人动物,或产物或其元件。
12.权利要求1的至少一种多肽在动物饲料中的用途。
13.权利要求1的至少一种多肽在制备用于动物饲料的组合物中的用途。
14.改善动物饲料营养价值的方法,其中将权利要求1的至少一种多肽添加到饲料中。
15.动物饲料添加剂,包含(a)权利要求1的至少一种多肽;和(b)至少一种脂溶性维生素,(c)至少一种水溶性维生素、和/或(d)至少一种痕量矿物质。
16.权利要求15的动物饲料添加剂,更进一步地包含至少一种淀粉酶、至少一种附加的肌醇六磷酸酶、至少一种木聚糖酶、至少一种半乳聚糖酶、至少一种α-半乳糖苷酶、至少一种蛋白酶、至少一种磷脂酶和/或至少一种β-葡聚糖酶。
17.动物饲料组合物,其具有粗蛋白含量为50-800g/kg并包含权利要求1的至少一种多肽。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310117149.3A CN103224918B (zh) | 2004-10-04 | 2005-10-04 | 具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DKPA200401514 | 2004-10-04 | ||
DKPA200401515 | 2004-10-04 | ||
DKPA200401515 | 2004-10-04 | ||
DKPA200401998 | 2004-12-23 | ||
DKPA200401999 | 2004-12-23 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310117149.3A Division CN103224918B (zh) | 2004-10-04 | 2005-10-04 | 具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101035898A true CN101035898A (zh) | 2007-09-12 |
Family
ID=34956237
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800338182A Pending CN101035898A (zh) | 2004-10-04 | 2005-10-04 | 具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101035898A (zh) |
-
2005
- 2005-10-04 CN CNA2005800338182A patent/CN101035898A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101035892A (zh) | 具有肌醇六磷酸酶活性的多肽及编码其的多核苷酸 | |
US7923232B2 (en) | Hafnia phytase | |
US8450096B2 (en) | Polypeptides having phytase activity and polynucleotides encoding same | |
CN1606567A (zh) | 来自假黑盘菌的抗微生物多肽 | |
CN1630719A (zh) | 肌醇六磷酸酶变体 | |
CN1610510A (zh) | 含有肌醇六磷酸酶的动物食物和方法 | |
CN1845989A (zh) | 抗微生物剂的重组产生 | |
CN101031643A (zh) | 具有α-葡糖苷酶活性的多肽及编码其的多核苷酸 | |
CN1602357A (zh) | 新的肌醇六磷酸酶和制造这些新肌醇六磷酸酶的方法 | |
CN1816561A (zh) | 抗微生物多肽 | |
CN101052721A (zh) | Botryosphaeria Rhodina的多肽 | |
CN1656217A (zh) | 修饰的植酸酶 | |
CN101035898A (zh) | 具有肌醇六磷酸酶活性的多肽和编码它的多核苷酸 | |
AU2008231749B2 (en) | Hafnia phytase |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20070912 |