KR102613549B1 - 신규 세린 프로테아제 변이체 - Google Patents
신규 세린 프로테아제 변이체 Download PDFInfo
- Publication number
- KR102613549B1 KR102613549B1 KR1020210032885A KR20210032885A KR102613549B1 KR 102613549 B1 KR102613549 B1 KR 102613549B1 KR 1020210032885 A KR1020210032885 A KR 1020210032885A KR 20210032885 A KR20210032885 A KR 20210032885A KR 102613549 B1 KR102613549 B1 KR 102613549B1
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- thr
- ala
- ser
- val
- Prior art date
Links
- 101000964562 Homo sapiens Zinc finger FYVE domain-containing protein 9 Proteins 0.000 title abstract description 4
- 102100040801 Zinc finger FYVE domain-containing protein 9 Human genes 0.000 title abstract description 4
- 150000001413 amino acids Chemical group 0.000 claims description 147
- 102000012479 Serine Proteases Human genes 0.000 claims description 100
- 108010022999 Serine Proteases Proteins 0.000 claims description 100
- 108091033319 polynucleotide Proteins 0.000 claims description 65
- 102000040430 polynucleotide Human genes 0.000 claims description 65
- 239000002157 polynucleotide Substances 0.000 claims description 65
- 239000000203 mixture Substances 0.000 claims description 35
- 244000005700 microbiome Species 0.000 claims description 31
- 238000006467 substitution reaction Methods 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 23
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 16
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 15
- 102000035195 Peptidases Human genes 0.000 claims description 10
- 108091005804 Peptidases Proteins 0.000 claims description 10
- 239000004365 Protease Substances 0.000 claims description 9
- 108010061238 threonyl-glycine Proteins 0.000 description 151
- 235000001014 amino acid Nutrition 0.000 description 149
- 229940024606 amino acid Drugs 0.000 description 146
- 125000003275 alpha amino acid group Chemical group 0.000 description 98
- 108090000623 proteins and genes Proteins 0.000 description 71
- 230000000694 effects Effects 0.000 description 68
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 60
- 102000004169 proteins and genes Human genes 0.000 description 60
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 57
- 235000018102 proteins Nutrition 0.000 description 54
- 230000000875 corresponding effect Effects 0.000 description 53
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 47
- 241000880493 Leptailurus serval Species 0.000 description 46
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 42
- 108010050848 glycylleucine Proteins 0.000 description 41
- 108010089804 glycyl-threonine Proteins 0.000 description 40
- 108020004414 DNA Proteins 0.000 description 37
- 108090000765 processed proteins & peptides Proteins 0.000 description 37
- 102000004196 processed proteins & peptides Human genes 0.000 description 36
- 229920001184 polypeptide Polymers 0.000 description 35
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 32
- 108010029020 prolylglycine Proteins 0.000 description 32
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 31
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 30
- 108010047506 alanyl-glutaminyl-glycyl-valine Proteins 0.000 description 30
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 29
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 29
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 29
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 29
- 238000000034 method Methods 0.000 description 29
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 28
- MHQXIBRPDKXDGZ-ZFWWWQNUSA-N Met-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MHQXIBRPDKXDGZ-ZFWWWQNUSA-N 0.000 description 28
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 28
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 28
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 28
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 27
- 241000203780 Thermobifida fusca Species 0.000 description 27
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 27
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 26
- SRZZZTMJARUVPI-JBDRJPRFSA-N Cys-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N SRZZZTMJARUVPI-JBDRJPRFSA-N 0.000 description 26
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 26
- 108010005233 alanylglutamic acid Proteins 0.000 description 26
- 210000004027 cell Anatomy 0.000 description 26
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 26
- 108010015796 prolylisoleucine Proteins 0.000 description 26
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 25
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 25
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 25
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 25
- 108010090461 DFG peptide Proteins 0.000 description 24
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 24
- 241001647802 Thermobifida Species 0.000 description 24
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 23
- 102000004190 Enzymes Human genes 0.000 description 23
- 108090000790 Enzymes Proteins 0.000 description 23
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 23
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 23
- 229940088598 enzyme Drugs 0.000 description 23
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 22
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 22
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 22
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 22
- 108010016616 cysteinylglycine Proteins 0.000 description 22
- 230000035772 mutation Effects 0.000 description 22
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 21
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 21
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 21
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 21
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 20
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 20
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 19
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 19
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 19
- 108010047495 alanylglycine Proteins 0.000 description 19
- 108010070783 alanyltyrosine Proteins 0.000 description 19
- 108010077245 asparaginyl-proline Proteins 0.000 description 19
- 108010093581 aspartyl-proline Proteins 0.000 description 19
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 18
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 18
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 18
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 18
- WKWJJQZZZBBWKV-JYJNAYRXSA-N Val-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WKWJJQZZZBBWKV-JYJNAYRXSA-N 0.000 description 17
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 16
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 16
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 16
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 16
- 230000014509 gene expression Effects 0.000 description 16
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 15
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 15
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 15
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 15
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 15
- 229940009098 aspartate Drugs 0.000 description 15
- 229960001153 serine Drugs 0.000 description 15
- 235000004400 serine Nutrition 0.000 description 15
- 229960004441 tyrosine Drugs 0.000 description 15
- 235000002374 tyrosine Nutrition 0.000 description 15
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 14
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 14
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 14
- 235000013305 food Nutrition 0.000 description 14
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 13
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 13
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 13
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 13
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 13
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 13
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 13
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 13
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 13
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 12
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 12
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 12
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 12
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 12
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 12
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 12
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 12
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 12
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 12
- 108010079364 N-glycylalanine Proteins 0.000 description 12
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 12
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 12
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 12
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 12
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 12
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 12
- 108010005942 methionylglycine Proteins 0.000 description 12
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 11
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 11
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 11
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 11
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 11
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 11
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 11
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 11
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 11
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 11
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 11
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 11
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 11
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 11
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 11
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 11
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 11
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 11
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 11
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 11
- 239000003599 detergent Substances 0.000 description 11
- 108010044292 tryptophyltyrosine Proteins 0.000 description 11
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 10
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 10
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 10
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 10
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 10
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 10
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 10
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 10
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 10
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 10
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 10
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 10
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 10
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 10
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 10
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 10
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 10
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 10
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 10
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 10
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 10
- 108010044940 alanylglutamine Proteins 0.000 description 10
- 102220311754 rs191837710 Human genes 0.000 description 10
- 108010080629 tryptophan-leucine Proteins 0.000 description 10
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 9
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 9
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 9
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 9
- FMWHSNJMHUNLAG-FXQIFTODSA-N Asp-Cys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FMWHSNJMHUNLAG-FXQIFTODSA-N 0.000 description 9
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 9
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 9
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 9
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 9
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 9
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 9
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 9
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 9
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 9
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 9
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 9
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 9
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 9
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 9
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 9
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 9
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 9
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 9
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 9
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 9
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 9
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 9
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 9
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 9
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 9
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 9
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 9
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 9
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- 108010037850 glycylvaline Proteins 0.000 description 9
- 150000007523 nucleic acids Chemical class 0.000 description 9
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 9
- 108010003137 tyrosyltyrosine Proteins 0.000 description 9
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 8
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 8
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 8
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 8
- 244000063299 Bacillus subtilis Species 0.000 description 8
- 235000014469 Bacillus subtilis Nutrition 0.000 description 8
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 8
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 8
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 8
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 8
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 8
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 8
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 8
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 8
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 8
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 8
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 8
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 8
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 8
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 8
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 8
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 8
- 235000004279 alanine Nutrition 0.000 description 8
- 229960003767 alanine Drugs 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 108010008355 arginyl-glutamine Proteins 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 8
- FJPHHBGPPJXISY-KBPBESRZSA-N (2s)-2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CNC(=O)CN)CC1=CC=C(O)C=C1 FJPHHBGPPJXISY-KBPBESRZSA-N 0.000 description 7
- 239000004475 Arginine Substances 0.000 description 7
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 7
- 239000004471 Glycine Substances 0.000 description 7
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 7
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 7
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 7
- 239000004473 Threonine Substances 0.000 description 7
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 7
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 7
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 7
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 7
- 229960003121 arginine Drugs 0.000 description 7
- 235000009697 arginine Nutrition 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 108010078144 glutaminyl-glycine Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 7
- 235000008729 phenylalanine Nutrition 0.000 description 7
- 229960005190 phenylalanine Drugs 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 229960002898 threonine Drugs 0.000 description 7
- 235000008521 threonine Nutrition 0.000 description 7
- 108010038745 tryptophylglycine Proteins 0.000 description 7
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 6
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 6
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- 241000203622 Nocardiopsis Species 0.000 description 6
- 241000028301 Nocardiopsis composta Species 0.000 description 6
- 241000756485 Nocardiopsis potens Species 0.000 description 6
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 6
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 6
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 6
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 6
- 241001339347 Spinactinospora alkalitolerans Species 0.000 description 6
- 241001295025 Thermobifida cellulosilytica Species 0.000 description 6
- 241000208189 Thermobifida halotolerans Species 0.000 description 6
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 6
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 6
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 6
- -1 aromatic amino acids Chemical class 0.000 description 6
- 229960001230 asparagine Drugs 0.000 description 6
- 235000009582 asparagine Nutrition 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 235000014304 histidine Nutrition 0.000 description 6
- 229960002885 histidine Drugs 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 6
- 235000014705 isoleucine Nutrition 0.000 description 6
- 229960000310 isoleucine Drugs 0.000 description 6
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 229960002429 proline Drugs 0.000 description 6
- 235000013930 proline Nutrition 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 229960004799 tryptophan Drugs 0.000 description 6
- 241000301844 Actinorugispora Species 0.000 description 5
- 241001474057 Actinorugispora endophytica Species 0.000 description 5
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 5
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 5
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 5
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 5
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 5
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 5
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 5
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 5
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 5
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 5
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 5
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 5
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 5
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 5
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 5
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 5
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 5
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 5
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 5
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 5
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 5
- 229960002433 cysteine Drugs 0.000 description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 5
- 235000018417 cysteine Nutrition 0.000 description 5
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 5
- 235000004554 glutamine Nutrition 0.000 description 5
- 229960002743 glutamine Drugs 0.000 description 5
- 108010018006 histidylserine Proteins 0.000 description 5
- 239000004615 ingredient Substances 0.000 description 5
- 235000005772 leucine Nutrition 0.000 description 5
- 229960003136 leucine Drugs 0.000 description 5
- 235000018977 lysine Nutrition 0.000 description 5
- 229960003646 lysine Drugs 0.000 description 5
- 229930182817 methionine Natural products 0.000 description 5
- 229960004452 methionine Drugs 0.000 description 5
- 235000006109 methionine Nutrition 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 5
- 229960004295 valine Drugs 0.000 description 5
- 239000004474 valine Substances 0.000 description 5
- 235000014393 valine Nutrition 0.000 description 5
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 4
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 4
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 4
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 4
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 4
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 4
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 4
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 4
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 4
- AECPDLSSUMDUAA-ZKWXMUAHSA-N Asn-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N AECPDLSSUMDUAA-ZKWXMUAHSA-N 0.000 description 4
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 4
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 4
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 4
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 4
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 4
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 4
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 4
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 4
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 4
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 4
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 4
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 4
- RIUZKUJUPVFAGY-HOTGVXAUSA-N Gly-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)CN RIUZKUJUPVFAGY-HOTGVXAUSA-N 0.000 description 4
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 4
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 4
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 4
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 4
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 4
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 4
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- 241001474785 Spinactinospora Species 0.000 description 4
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 4
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 4
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 4
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 4
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 4
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 4
- XEEHBQOUZBQVAJ-BPUTZDHNSA-N Trp-Arg-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N XEEHBQOUZBQVAJ-BPUTZDHNSA-N 0.000 description 4
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 4
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 4
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 4
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 4
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 4
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 4
- 108010065713 glycyl-glycyl-tyrosyl-arginine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 239000000546 pharmaceutical excipient Substances 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 4
- 108010037335 tyrosyl-prolyl-glycyl-glycine Proteins 0.000 description 4
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 3
- LKDMKWNDBAVNQZ-WJNSRDFLSA-N 4-[[(2s)-1-[[(2s)-1-[(2s)-2-[[(2s)-1-(4-nitroanilino)-1-oxo-3-phenylpropan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-4-oxobutanoic acid Chemical compound OC(=O)CCC(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)NC=1C=CC(=CC=1)[N+]([O-])=O)CC1=CC=CC=C1 LKDMKWNDBAVNQZ-WJNSRDFLSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 3
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 3
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 3
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 3
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 3
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 3
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 3
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 3
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 3
- DBPRUZCKPFOVDV-UHFFFAOYSA-N Clorprenaline hydrochloride Chemical compound O.Cl.CC(C)NCC(O)C1=CC=CC=C1Cl DBPRUZCKPFOVDV-UHFFFAOYSA-N 0.000 description 3
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 3
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 3
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 3
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 3
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 3
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 3
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 3
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 3
- IROABALAWGJQGM-OALUTQOASA-N Gly-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)CN IROABALAWGJQGM-OALUTQOASA-N 0.000 description 3
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 3
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 3
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 3
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 3
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 3
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 3
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 3
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 3
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 3
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 3
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 3
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 3
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 3
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 3
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 3
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 3
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 3
- XKTWZYNTLXITCY-QRTARXTBSA-N Trp-Val-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 XKTWZYNTLXITCY-QRTARXTBSA-N 0.000 description 3
- RWTFCAMQLFNPTK-UMPQAUOISA-N Trp-Val-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 RWTFCAMQLFNPTK-UMPQAUOISA-N 0.000 description 3
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 3
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 3
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 3
- 238000002835 absorbance Methods 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 239000003674 animal food additive Substances 0.000 description 3
- 229940121363 anti-inflammatory agent Drugs 0.000 description 3
- 239000002260 anti-inflammatory agent Substances 0.000 description 3
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 235000013365 dairy product Nutrition 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 229960001031 glucose Drugs 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 244000144972 livestock Species 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 239000008194 pharmaceutical composition Substances 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 235000020183 skimmed milk Nutrition 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- HMUNWXXNJPVALC-UHFFFAOYSA-N 1-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C(CN1CC2=C(CC1)NN=N2)=O HMUNWXXNJPVALC-UHFFFAOYSA-N 0.000 description 2
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 2
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 2
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- SAKCBXNPWDRWPE-BQBZGAKWSA-N Asp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N SAKCBXNPWDRWPE-BQBZGAKWSA-N 0.000 description 2
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 2
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 2
- DJTXYXZNNDDEOU-WHFBIAKZSA-N Gly-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)C(=O)N DJTXYXZNNDDEOU-WHFBIAKZSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 2
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 102000005741 Metalloproteases Human genes 0.000 description 2
- 108010006035 Metalloproteases Proteins 0.000 description 2
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 2
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- 208000007536 Thrombosis Diseases 0.000 description 2
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 2
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 2
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 2
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 2
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 2
- MWUYSCVVPVITMW-IGNZVWTISA-N Tyr-Tyr-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 MWUYSCVVPVITMW-IGNZVWTISA-N 0.000 description 2
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 2
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 2
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 2
- 230000009102 absorption Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- WNLRTRBMVRJNCN-UHFFFAOYSA-N adipic acid Chemical compound OC(=O)CCCCC(O)=O WNLRTRBMVRJNCN-UHFFFAOYSA-N 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 235000006708 antioxidants Nutrition 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 2
- 108010041102 azocasein Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000007123 defense Effects 0.000 description 2
- 230000001079 digestive effect Effects 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000003925 fat Substances 0.000 description 2
- 235000019197 fats Nutrition 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 229940049906 glutamate Drugs 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- 229960002449 glycine Drugs 0.000 description 2
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 239000010985 leather Substances 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 235000014593 oils and fats Nutrition 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 239000000467 phytic acid Substances 0.000 description 2
- 235000002949 phytic acid Nutrition 0.000 description 2
- 229940068041 phytic acid Drugs 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 229960004793 sucrose Drugs 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229910052719 titanium Inorganic materials 0.000 description 2
- 239000010936 titanium Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 2
- 229960004319 trichloroacetic acid Drugs 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 2
- PFTAWBLQPZVEMU-DZGCQCFKSA-N (+)-catechin Chemical compound C1([C@H]2OC3=CC(O)=CC(O)=C3C[C@@H]2O)=CC=C(O)C(O)=C1 PFTAWBLQPZVEMU-DZGCQCFKSA-N 0.000 description 1
- ZXJZGWOMAFPSJH-DCAQKATOSA-N (2S)-1-[2-[[2-[[(2S)-2-[[(2S)-2-[(2-aminoacetyl)amino]-3-carboxypropanoyl]amino]-3-hydroxypropanoyl]amino]acetyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O ZXJZGWOMAFPSJH-DCAQKATOSA-N 0.000 description 1
- PJVXUVWGSCCGHT-ZPYZYFCMSA-N (2r,3s,4r,5r)-2,3,4,5,6-pentahydroxyhexanal;(3s,4r,5r)-1,3,4,5,6-pentahydroxyhexan-2-one Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O.OC[C@@H](O)[C@@H](O)[C@H](O)C(=O)CO PJVXUVWGSCCGHT-ZPYZYFCMSA-N 0.000 description 1
- VWWKKDNCCLAGRM-GVXVVHGQSA-N (2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetyl]amino]-3-methylbutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VWWKKDNCCLAGRM-GVXVVHGQSA-N 0.000 description 1
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 description 1
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 1
- TUSDEZXZIZRFGC-UHFFFAOYSA-N 1-O-galloyl-3,6-(R)-HHDP-beta-D-glucose Natural products OC1C(O2)COC(=O)C3=CC(O)=C(O)C(O)=C3C3=C(O)C(O)=C(O)C=C3C(=O)OC1C(O)C2OC(=O)C1=CC(O)=C(O)C(O)=C1 TUSDEZXZIZRFGC-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- LDXJRKWFNNFDSA-UHFFFAOYSA-N 2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound C1CN(CC2=NNN=C21)CC(=O)N3CCN(CC3)C4=CN=C(N=C4)NCC5=CC(=CC=C5)OC(F)(F)F LDXJRKWFNNFDSA-UHFFFAOYSA-N 0.000 description 1
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- LKDMKWNDBAVNQZ-UHFFFAOYSA-N 4-[[1-[[1-[2-[[1-(4-nitroanilino)-1-oxo-3-phenylpropan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-4-oxobutanoic acid Chemical compound OC(=O)CCC(=O)NC(C)C(=O)NC(C)C(=O)N1CCCC1C(=O)NC(C(=O)NC=1C=CC(=CC=1)[N+]([O-])=O)CC1=CC=CC=C1 LKDMKWNDBAVNQZ-UHFFFAOYSA-N 0.000 description 1
- TYMLOMAKGOJONV-UHFFFAOYSA-N 4-nitroaniline Chemical compound NC1=CC=C([N+]([O-])=O)C=C1 TYMLOMAKGOJONV-UHFFFAOYSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- FHVDTGUDJYJELY-UHFFFAOYSA-N 6-{[2-carboxy-4,5-dihydroxy-6-(phosphanyloxy)oxan-3-yl]oxy}-4,5-dihydroxy-3-phosphanyloxane-2-carboxylic acid Chemical compound O1C(C(O)=O)C(P)C(O)C(O)C1OC1C(C(O)=O)OC(OP)C(O)C1O FHVDTGUDJYJELY-UHFFFAOYSA-N 0.000 description 1
- 244000215068 Acacia senegal Species 0.000 description 1
- 235000006491 Acacia senegal Nutrition 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- BMNVSPMWMICFRV-DCAQKATOSA-N Arg-His-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CN=CN1 BMNVSPMWMICFRV-DCAQKATOSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 239000005996 Blood meal Substances 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000004173 Cathepsin G Human genes 0.000 description 1
- 108090000617 Cathepsin G Proteins 0.000 description 1
- PTHCMJGKKRQCBF-UHFFFAOYSA-N Cellulose, microcrystalline Chemical compound OC1C(O)C(OC)OC(CO)C1OC1C(O)C(O)C(OC)C(CO)O1 PTHCMJGKKRQCBF-UHFFFAOYSA-N 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 241000219104 Cucurbitaceae Species 0.000 description 1
- FANFRJOFTYCNRG-JYBASQMISA-N Cys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CS)N)O FANFRJOFTYCNRG-JYBASQMISA-N 0.000 description 1
- 102000005927 Cysteine Proteases Human genes 0.000 description 1
- 108010005843 Cysteine Proteases Proteins 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 108010082495 Dietary Plant Proteins Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 239000004386 Erythritol Substances 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 239000001263 FEMA 3042 Substances 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 235000019733 Fish meal Nutrition 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- 108010068370 Glutens Proteins 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- 229920000084 Gum arabic Polymers 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- RLAOTFTXBFQJDV-KKUMJFAQSA-N His-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CN=CN1 RLAOTFTXBFQJDV-KKUMJFAQSA-N 0.000 description 1
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- 241000824268 Kuma Species 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 1
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- 108010011756 Milk Proteins Proteins 0.000 description 1
- 102000014171 Milk Proteins Human genes 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- LRBQNJMCXXYXIU-PPKXGCFTSA-N Penta-digallate-beta-D-glucose Natural products OC1=C(O)C(O)=CC(C(=O)OC=2C(=C(O)C=C(C=2)C(=O)OC[C@@H]2[C@H]([C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)O2)OC(=O)C=2C=C(OC(=O)C=3C=C(O)C(O)=C(O)C=3)C(O)=C(O)C=2)O)=C1 LRBQNJMCXXYXIU-PPKXGCFTSA-N 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 229920000388 Polyphosphate Polymers 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000588768 Providencia Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 101150099282 SPL7 gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- LZLREEUGSYITMX-JQWIXIFHSA-N Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(O)=O)=CNC2=C1 LZLREEUGSYITMX-JQWIXIFHSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 102000003667 Serine Endopeptidases Human genes 0.000 description 1
- 108090000083 Serine Endopeptidases Proteins 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- YTHWAWACWGWBLE-MNSWYVGCSA-N Trp-Tyr-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 YTHWAWACWGWBLE-MNSWYVGCSA-N 0.000 description 1
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 1
- SEFNTZYRPGBDCY-IHRRRGAJSA-N Tyr-Arg-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O SEFNTZYRPGBDCY-IHRRRGAJSA-N 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- GPLTZEMVOCZVAV-UFYCRDLUSA-N Tyr-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 GPLTZEMVOCZVAV-UFYCRDLUSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- UBTBGUDNDFZLGP-SRVKXCTJSA-N Val-Arg-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UBTBGUDNDFZLGP-SRVKXCTJSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 229910021536 Zeolite Inorganic materials 0.000 description 1
- INAPMGSXUVUWAF-GCVPSNMTSA-N [(2r,3s,5r,6r)-2,3,4,5,6-pentahydroxycyclohexyl] dihydrogen phosphate Chemical compound OC1[C@H](O)[C@@H](O)C(OP(O)(O)=O)[C@H](O)[C@@H]1O INAPMGSXUVUWAF-GCVPSNMTSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 235000010489 acacia gum Nutrition 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000001361 adipic acid Substances 0.000 description 1
- 235000011037 adipic acid Nutrition 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 229940072056 alginate Drugs 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 229940087168 alpha tocopherol Drugs 0.000 description 1
- 102000016679 alpha-Glucosidases Human genes 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-N alpha-hydroxysuccinic acid Natural products OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 235000021120 animal protein Nutrition 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000843 anti-fungal effect Effects 0.000 description 1
- 230000002785 anti-thrombosis Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 235000021405 artificial diet Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 239000007621 bhi medium Substances 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 235000019658 bitter taste Nutrition 0.000 description 1
- 229940036811 bone meal Drugs 0.000 description 1
- 239000002374 bone meal Substances 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 235000010216 calcium carbonate Nutrition 0.000 description 1
- 239000000378 calcium silicate Substances 0.000 description 1
- 229910052918 calcium silicate Inorganic materials 0.000 description 1
- 235000012241 calcium silicate Nutrition 0.000 description 1
- OYACROKNLOSFPA-UHFFFAOYSA-N calcium;dioxido(oxo)silane Chemical compound [Ca+2].[O-][Si]([O-])=O OYACROKNLOSFPA-UHFFFAOYSA-N 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 235000005487 catechin Nutrition 0.000 description 1
- ADRVNXBAWSRFAJ-UHFFFAOYSA-N catechin Natural products OC1Cc2cc(O)cc(O)c2OC1c3ccc(O)c(O)c3 ADRVNXBAWSRFAJ-UHFFFAOYSA-N 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229940045110 chitosan Drugs 0.000 description 1
- 229950001002 cianidanol Drugs 0.000 description 1
- 239000007891 compressed tablet Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000882 contact lens solution Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 239000000032 diagnostic agent Substances 0.000 description 1
- 229940039227 diagnostic agent Drugs 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000021245 dietary protein Nutrition 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 102000038379 digestive enzymes Human genes 0.000 description 1
- 108091007734 digestive enzymes Proteins 0.000 description 1
- 208000010643 digestive system disease Diseases 0.000 description 1
- HNPSIPDUKPIQMN-UHFFFAOYSA-N dioxosilane;oxo(oxoalumanyloxy)alumane Chemical compound O=[Si]=O.O=[Al]O[Al]=O HNPSIPDUKPIQMN-UHFFFAOYSA-N 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 230000002554 disease preventive effect Effects 0.000 description 1
- 238000004851 dishwashing Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007937 eating Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000001804 emulsifying effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 235000019414 erythritol Nutrition 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 229940009714 erythritol Drugs 0.000 description 1
- 229940023064 escherichia coli Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 239000003527 fibrinolytic agent Substances 0.000 description 1
- 239000004467 fishmeal Substances 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 239000010794 food waste Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 235000013376 functional food Nutrition 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 235000020688 green tea extract Nutrition 0.000 description 1
- 229940094952 green tea extract Drugs 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 239000007952 growth promoter Substances 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 235000013402 health food Nutrition 0.000 description 1
- 235000019534 high fructose corn syrup Nutrition 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 229960001375 lactose Drugs 0.000 description 1
- 108010009932 leucyl-alanyl-glycyl-valine Proteins 0.000 description 1
- 229940069445 licorice extract Drugs 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000002366 lipolytic effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229940057995 liquid paraffin Drugs 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 239000002075 main ingredient Substances 0.000 description 1
- 239000001630 malic acid Substances 0.000 description 1
- 235000011090 malic acid Nutrition 0.000 description 1
- 239000000845 maltitol Substances 0.000 description 1
- 235000010449 maltitol Nutrition 0.000 description 1
- VQHSOMBJVWLPSR-WUJBLJFYSA-N maltitol Chemical compound OC[C@H](O)[C@@H](O)[C@@H]([C@H](O)CO)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O VQHSOMBJVWLPSR-WUJBLJFYSA-N 0.000 description 1
- 229940035436 maltitol Drugs 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 229960001855 mannitol Drugs 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 235000010981 methylcellulose Nutrition 0.000 description 1
- LXCFILQKKLGQFO-UHFFFAOYSA-N methylparaben Chemical compound COC(=O)C1=CC=C(O)C=C1 LXCFILQKKLGQFO-UHFFFAOYSA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000021239 milk protein Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000006072 paste Substances 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 150000008442 polyphenolic compounds Chemical class 0.000 description 1
- 235000013824 polyphenols Nutrition 0.000 description 1
- 239000001205 polyphosphate Substances 0.000 description 1
- 235000011176 polyphosphates Nutrition 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 235000013594 poultry meat Nutrition 0.000 description 1
- 235000008476 powdered milk Nutrition 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 235000013772 propylene glycol Nutrition 0.000 description 1
- QELSKZZBTMNZEB-UHFFFAOYSA-N propylparaben Chemical compound CCCOC(=O)C1=CC=C(O)C=C1 QELSKZZBTMNZEB-UHFFFAOYSA-N 0.000 description 1
- 229960003415 propylparaben Drugs 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 229940092258 rosemary extract Drugs 0.000 description 1
- 235000020748 rosemary extract Nutrition 0.000 description 1
- 239000001233 rosmarinus officinalis l. extract Substances 0.000 description 1
- 102220046369 rs587782872 Human genes 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 108010027322 single cell proteins Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 229960002920 sorbitol Drugs 0.000 description 1
- 235000010356 sorbitol Nutrition 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 229940032147 starch Drugs 0.000 description 1
- 108010082371 succinyl-alanyl-alanyl-prolyl-phenylalanine-4-nitroanilide Proteins 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 235000012222 talc Nutrition 0.000 description 1
- 235000015523 tannic acid Nutrition 0.000 description 1
- 229920002258 tannic acid Polymers 0.000 description 1
- LRBQNJMCXXYXIU-NRMVVENXSA-N tannic acid Chemical compound OC1=C(O)C(O)=CC(C(=O)OC=2C(=C(O)C=C(C=2)C(=O)OC[C@@H]2[C@H]([C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)O2)OC(=O)C=2C=C(OC(=O)C=3C=C(O)C(O)=C(O)C=3)C(O)=C(O)C=2)O)=C1 LRBQNJMCXXYXIU-NRMVVENXSA-N 0.000 description 1
- 229940033123 tannic acid Drugs 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 229960000103 thrombolytic agent Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 229960000984 tocofersolan Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 235000019871 vegetable fat Nutrition 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
- 239000000811 xylitol Substances 0.000 description 1
- 235000010447 xylitol Nutrition 0.000 description 1
- 229960002675 xylitol Drugs 0.000 description 1
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
- 239000010457 zeolite Substances 0.000 description 1
- 239000002076 α-tocopherol Substances 0.000 description 1
- 235000004835 α-tocopherol Nutrition 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23K—FODDER
- A23K20/00—Accessory food factors for animal feeding-stuffs
- A23K20/10—Organic substances
- A23K20/189—Enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23K—FODDER
- A23K10/00—Animal feeding-stuffs
- A23K10/10—Animal feeding-stuffs obtained by microbiological or biochemical processes
- A23K10/14—Pretreatment of feeding-stuffs with enzymes
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23K—FODDER
- A23K10/00—Animal feeding-stuffs
- A23K10/10—Animal feeding-stuffs obtained by microbiological or biochemical processes
- A23K10/16—Addition of microorganisms or extracts thereof, e.g. single-cell proteins, to feeding-stuff compositions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/02—Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Polymers & Plastics (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Animal Husbandry (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Physiology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Detergent Compositions (AREA)
Abstract
본 출원은 신규한 세린 프로테아제 변이체에 관한 것이다.
Description
본 출원은 신규한 세린 프로테아제 변이체에 관한 것이다.
단백질 분해효소(protease)는 생체내에서 소화, 흡수, 방어 등의 다양한 기능을 하고 있으며 활성 자리의 구조에 따라 세린 단백질 분해효소(serine protease), 시스테인 단백질 분해효소(cystein protease), 아스파테이트 단백질 분해효소(sapartic protease) 그리고 메탈로단백질 분해효소(metalloprotease)로 구분된다. 그 중 세린 프로테아제(또는 세린 엔도펩티다아제)는 주로 활성 부위에 활성 세린 잔기를 공통적으로 갖는 것을 특징으로, 세린이 프로테아제의 활성 부위에서 친핵성 아미노산으로 작용하여 단백질 내 펩티드 결합을 절단하는 효소이다(Hedstrom, 2002. Chem Rev 102: 4501-4524).
세린 프로테아제는 그 용도가 다양하여 혈전의 용해 등과 같은 인류의 질병 치료 이외에도 의류용 세제의 성분, 콘택트렌즈 세정제의 성분으로 이용될 뿐만 아니라 우유 단백질의 변형, 견 섬유의 고무질 제거(silk degumming), 가죽의 침지(soaking), 제모(unhairing), 올리고 펩타이드 합성 및 폐 Xray 필름으로부터 은의 회수, 사료 및 식품의 제조와 개선(한국공개특허 10-2005-0068750호) 등에 다양하게 이용되고 있다. 그러나, 보다 뛰어난 산업적 경제성 및 효능을 확보하기 위하여 활성 등의 측면에서 개선된 세린 프로테아제가 요구되는 실정이다.
본 출원의 목적은 세린 프로테아제 변이체를 제공하는 것이다.
본 출원의 다른 목적은 상기 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드 및 이를 포함하는 벡터를 제공하는 것이다.
본 출원의 또 다른 목적은 상기 세린 프로테아제 변이체; 상기 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는, 미생물을 제공하는 것이다.
본 출원의 또 다른 목적은 상기 세린 프로테아제 변이체 및 상기 미생물 중 하나 이상을 포함하는, 사료용 조성물을 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.
또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 출원에 기재된 본 출원의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 출원에 포함되는 것으로 의도된다.
본 출원의 하나의 양태는 세린 프로테아제 변이체를 제공한다.
본 출원의 용어 "세린 프로테아제(serine protease)"는 프로테아제의 하위그룹에 속하며 단백질 분해 활성을 갖는 효소를 의미한다. 구체적으로, 세린 프로테아제는 펩티드 결합을 가수분해함으로써 단백질을 분해하고 기본적으로 활성 부위에 활성 세린 잔기를 갖는 효소일 수 있으며, 보다 구체적으로 세 작용기 촉매(catalytic triad)라고 칭해질 수 있는 아미노산 잔기인 히스티딘, 아스파테이트와 세린의 공간 배치를 갖는 효소일 수 있으나 이에 제한되지 않는다.
본 출원의 세린 프로테아제는, 이에 제한되지는 않으나, 써모비피다(Thermobifida) 속, 노카르디옵시스(Nocardiopsis) 속, 액티노루기스포라(Actinorugispora) 속, 또는 스핀액티노스포라(Spinactinospora) 속 미생물 유래인 것일 수 있다. 구체적으로, 본 출원에서 상기 세린 프로테아제의 야생형은 써모비피다 푸스카(Thermobifida fusca), 써모비피다 셀룰로실리티카(Thermobifida cellulosilytica), 써모비피다 할로톨러런스(Thermobifida halotolerans), 액티노루기스포라 엔도피티카(Actinorugispora endophytica), 스핀액티노스포라 알칼리톨러런스(Spinactinospora alkalitolerans), 노카르디옵시스 컴포스타(Nocardiopsis composta), 또는 노카르디옵시스 포텐스(Nocardiopsis potens) 유래 세린 프로테아제일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제는 서열번호 31로 기재된 아미노산 서열을 포함하거나, 이로 필수적으로 이루어지거나(consisting essentially of) 또는 이루어진 폴리펩티드일 수 있으나, 이에 제한되지 않는다. 일 구현예로, 상기 서열번호 31의 아미노산 서열은 서열번호 40 또는 서열번호 2로부터 유래하는 아미노산 서열일 수 있으나 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제는 서열번호 49 내지 54 중 어느 하나의 아미노산 서열을 포함하거나, 이로 필수적으로 이루어지거나(consisting essentially of) 또는 이루어진 것일 수 있으나 이에 제한되지 않는다. 일 구현예로, 상기 서열번호 49 내지 54의 아미노산 서열은 서열번호 67 내지 72 중 어느 하나의 아미노산 서열로부터 유래한 것일 수 있으나, 이에 제한되지는 않는다.
본 출원의 세린 프로테아제는 전술한 아미노산 서열과 동일한 활성을 갖는 서열은 제한 없이 포함할 수 있다. 또한, 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열 또는 이와 60% 이상의 상동성(homology) 또는 동일성(identity)을 갖는 아미노산 서열을 포함하거나, 이로 필수적으로 이루어지거나(consisting essentially of) 또는 이루어진 것일 수 있으나, 이에 제한되는 것은 아니다. 구체적으로 상기 아미노산 서열은 서열번호 31 및 49 내지 54로 기재되는 아미노산 서열 중 어느 하나 또는 상기 서열번호 31 및 49 내지 54로 기재되는 아미노산 서열 중 어느 하나와 적어도 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원의 범위 내에 포함됨은 자명하다.
즉, 본 출원에서 '특정 서열번호로 기재된 아미노산 서열을 갖는 단백질 또는 폴리펩티드', '특정 서열번호로 기재된 아미노산 서열을 포함하는 단백질 또는 폴리펩티드'라고 기재되어 있다 하더라도, 해당 서열번호의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원에서 사용될 수 있음은 자명하다. 예를 들어, '서열번호 31의 아미노산 서열을 포함하는 폴리펩티드'는, 이와 동일 혹은 상응하는 활성을 가지는 경우라면 '서열번호 31의 아미노산 서열로 이루어진 폴리펩티드'에 속할 수 있음은 자명하다.
본 출원에서 용어 '상동성(homology)' 또는 '동일성(identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열과 관련된 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된 (conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나 (homologous) 또는 동일한 (identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%를 따라 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 코돈 대신 축퇴 코돈을 함유하는 폴리뉴클레오티드 또한 고려된다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 예를 들어, Pearson et al (1988)[Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다. (GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol.48 : 443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의한다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.
또한, 임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 정의된 엄격한 조건하에서 써던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법으로 결정될 수 있다.
일 구현예로, 본 출원에서 제공하는 세린 프로테아제 변이체는, 상기에서 설명한 세린 프로테아제 활성을 갖는 단백질 중, 특이적 위치의 아미노산이 치환되어, 효소 활성이 변이 전 단백질 대비 100% 초과되는 변이체를 의미할 수 있다.
하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열을 포함하는 야생형 효소 대비, 약 100% 초과, 구체적으로 약 110%, 약 120%, 약 130%, 약 140%, 약 150%, 약 160%, 약 170%, 약 180%, 약 190%, 또는 약 200% 이상의 증가된 효소 활성을 가질 수 있으나, 이에 제한되지 않는다.
상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.
본 출원에서 용어, "변이체(variant)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)에 있어서 상기 열거된 서열 (the recited sequence)과 상이하나, 상기 단백질의 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 변이체는 수 개의 아미노산 치환, 결실 또는 부가에 의해 식별되는 서열(identified sequence)과 상이하다. 이러한 변이체는 일반적으로 상기 폴리펩티드 서열 중 하나를 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 식별될 수 있다. 즉, 변이체의 능력은 본래 단백질(native protein)에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다.
또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질 (mature protein)의 N- 및/또는 C- 말단으로부터 일부분이 제거되거나, 혹은 부가된 변이형을 포함할 수 있다.
상기 용어 "변이체"는 변형/변이된 단백질, 변이형 폴리펩티드, 변이 등의 용어(영문 표현으로는 modification, modified protein, modified polypeptide, mutant, mutein, divergent, variant 등)가 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다.
상기 변이체는 천연의 야생형 또는 비변형 단백질 대비 변이된 단백질의 활성이 증가된 것일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 상기 변이체는 하나 이상의 생물학적 활성을 여전히 보유하면서, 예를 들어 하나 이상의 보존적 치환을 가질 수 있다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 예를 들면, 전하를 띠는 곁사슬(electrically charged amino acid)을 갖는 아미노산 중 양으로 하전된(염기성) 아미노산은 아르기닌, 라이신, 및 히스티딘을, 음으로 하전된(산성) 아미노산은 글루탐산 및 아스파테이트를 포함하고; 전하를 띠지 않는 곁사슬(uncharged amino acid)을 갖는 아미노산 중 비극성 아미노산(nonpolar amino acid)은 글리신, 알라닌, 발린, 류신, 이소류신, 메티오닌, 페닐알라닌, 트립토판 및 프롤린을 포함하고, 극성(polar) 또는 친수성(hydrophilic) 아미노산은 세린, 쓰레오닌, 시스테인, 타이로신, 아스파라긴 및 글루타민을 포함하고, 상기 아미노산 중 방향족 아미노산은 페닐알라닌, 트립토판 및 타이로신을 포함한다. 또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 폴리펩티드는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이전(transfer)에 관여하는 단백질 N-말단의 시그널 (또는 리더)서열과 컨쥬게이트 할 수 있다. 또한 상기 폴리펩티드는 폴리펩티드를 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.
본 출원에서 용어, "세린 프로테아제 변이체"는 세린 프로테아제 활성을 갖는 폴리펩티드의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는 폴리펩티드를 의미한다.
본 출원의 세린 프로테아제 변이체는 서열번호 31의 N-말단으로부터 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 것을 포함할 수 있다. 구체적으로, 상기 세린 프로테아제 변이체는 서열번호 31의 12번 아미노산 및/또는 116번 아미노산에 상응하는 아미노산의 치환을 포함하고, 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열과 60% 이상 100% 미만의 상동성 또는 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31의 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산의 치환을 포함하고, 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열과 60% 이상, 예를 들어 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 상동성 또는 동일성을 가지는 것일 수 있으나, 이에 제한되지 않는다.
한편, 서열번호 31의 N-말단으로부터 12번 아미노산 및 116번 아미노산은 서열번호 49 내지 54의 N-말단으로부터 12번 아미노산 및 116번 아미노산에 대응하므로, 서열번호 31을 기준으로 아미노산의 위치에 대해 기재한 내용은 서열번호 49 내지 54 중 어느 하나의 아미노산 서열의 12번 아미노산 및 116번 아미노산에도 동일하게 적용될 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 54의 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산의 치환을 포함하고, 서열번호 52 내지 54 중 어느 하나의 아미노산 서열과 60% 이상, 예를 들어 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 상동성 또는 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다. 구체적으로 상기 세린 프로테아제 변이체는 서열번호 54의 12번 아미노산에 상응하는 위치의 아미노산의 치환을 포함하고, 서열번호 54의 아미노산 서열과 60% 이상, 예를 들어 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 상동성 또는 동일성을 가지는 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31 및 49 내지 54 중에서 선택되는 어느 하나의 아미노산 서열 내 N-말단으로부터 12번 위치, 116번 위치, 또는 12번 및 116번 위치에 상응하는 아미노산 모두가 다른 아미노산으로 치환된 단백질일 수 있다. 상기 '다른 아미노산'은 치환 전과는 다른 아미노산을 의미하며, 치환 전의 아미노산을 제외한 아미노산이면 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31 및 49 내지 51 중 선택되는 어느 하나의 아미노산 서열에서 12번 위치의 페닐알라닌(phenylalanine)이 글리신(glycine), 알라닌 (alanine), 아르기닌 (arginine), 아스파테이트 (aspartate), 시스테인 (cysteine), 글루탐산 (glutamate), 아스파라긴 (asparagine), 글루타민 (glutamine), 히스티딘 (histidine), 프롤린 (proline), 세린 (serine), 타이로신 (tyrosine), 이소류신 (isoleucine), 류신 (leucine), 라이신 (lysine), 트립토판 (tryptophan), 발린 (valine), 메티오닌 (methionine) 또는 쓰레오닌 (threonine)으로 치환되거나/되고, 116번 위치의 아스파라긴이 글리신, 알라닌, 아르기닌, 아스파테이트, 시스테인, 글루탐산, 글루타민, 히스티딘, 프롤린, 세린, 타이로신, 이소류신, 류신, 라이신, 페닐알라닌, 트립토판, 발린, 메티오닌 또는 쓰레오닌으로 치환된 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 52 내지 54 중 선택되는 어느 하나의 아미노산 서열에서 12번 위치의 프롤린 (proline)이 페닐알라닌(phenylalanine), 글리신(glycine), 알라닌 (alanine), 아르기닌 (arginine), 아스파테이트 (aspartate), 시스테인 (cysteine), 글루탐산 (glutamate), 아스파라긴 (asparagine), 글루타민 (glutamine), 히스티딘 (histidine), 세린 (serine), 타이로신 (tyrosine), 이소류신 (isoleucine), 류신 (leucine), 라이신 (lysine), 트립토판 (tryptophan), 발린 (valine), 메티오닌 (methionine) 또는 쓰레오닌 (threonine)으로 치환되거나/되고, 116번 위치의 아스파라긴이 글리신, 알라닌, 아르기닌, 아스파테이트, 시스테인, 글루탐산, 글루타민, 히스티딘, 프롤린, 세린, 타이로신, 이소류신, 류신, 라이신, 페닐알라닌, 트립토판, 발린, 메티오닌 또는 쓰레오닌으로 치환된 것일 수 있으나, 이에 제한되지 않는다.
구체적으로, 상기 변이체는 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열에서 12번 위치에 상응하는 아미노산이 타이로신(Y), 세린(S), 알라닌(A) 또는 아르기닌(R)으로 치환되거나, 116번 위치에 상응하는 아미노산이 아스파테이트(D), 세린(S), 쓰레오닌(T) 또는 글리신(G)으로 치환되거나, 또는 서열번호 31의 아미노산 서열에서 12번 및 116번 위치에 상응하는 아미노산이 각각 타이로신(Y) 및 아스파테이트(D); 타이로신(Y) 및 세린(S); 세린(S) 및 아스파테이트(D); 세린(S) 및 쓰레오닌(T); 또는, 알라닌(A) 및 글리신(G)으로 치환된 것을 포함하는 단백질일 수 있으나, 이에 제한되지 않는다. 일 구현예로, 상기 세린 프로테아제 변이체는 서열번호 52 내지 54 중 선택되는 어느 하나의 아미노산 서열에서 12번 위치의 프롤린이 타이로신, 알라닌, 세린 또는 아르기닌으로 치환된 것일 수 있으나, 이에 제한되지 않는다.
상기 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열에서 12번 및/또는 116번 위치의 아미노산이 다른 아미노산으로 치환된 변이체는, 상기 위치에 상응하는 아미노산이 다른 아미노산으로 치환된 변이체를 포함하는 것은 자명하다.
또한, 상기 변이체는 위에서 설명한 서열번호 31 및 49 내지 54 중 선택되는 어느 하나로 기재되는 아미노산 서열 또는 상기 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열과 적어도 60% 이상, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 가지는 아미노산 서열에서, 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열의 N-말단으로부터 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 것을 포함한다.
일 구현예로, 상기 변이체 중 서열번호 31의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는, 서열번호 32 내지 39에서 선택되는 어느 하나의 서열번호로 기재되는 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 49의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 55 또는 56의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 50의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 57 또는 58의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 51의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 59 또는 60의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 52의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 61 또는 62의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 53의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 63 또는 64의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 변이체 중 서열번호 54의 아미노산 서열에서 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체는 서열번호 65 또는 66의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열의 12번째 및/또는 116번째 위치에 상응하는 위치에서 다른 아미노산으로의 치환을 포함하고, 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열과 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 서열 상동성을 가지며, 세린 프로테아제 활성을 가지는 것일 수 있다.
본 출원의 세린 프로테아제 변이체는 변이 전의 폴리펩티드, 천연의 야생형 폴리펩티드 또는 비변형 폴리펩티드에 비해 활성이 강화된 것일 수 있으나 이에 제한되지 않는다. 또한, 이러한 상동성을 가지며 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원의 범위 내에 포함됨은 자명하다.
또한 본 출원의 변이체와 동일 혹은 상응하는 활성을 가지는 경우라면 상기 12번째 및/또는 116번째 아미노산의 변이 또는 이에 상응하는 위치의 변이 이외에 해당 서열번호의 아미노산 서열 앞뒤의 무의미한 서열 추가 또는 자연적으로 발생할 수 있는 돌연변이, 혹은 이의 잠재성 돌연변이 (silent mutation)를 제외하는 것이 아니며, 이러한 서열 추가 혹은 돌연변이를 가지는 경우에도 본원의 범위 내에 속하는 것이 자명하다.
한편, NCBI Reference Sequence WP_016188200.1 (서열번호 40)의 mature region은 본 출원의 서열번호 31에 상응하며, 서열번호 40에서 signal peptide만을 제외한 서열은 본 출원의 서열번호 2에 상응한다.
본 출원의 세린 프로테아제 변이체는, 전술한대로 서열번호 31의 12번, 116번에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 세린 프로테아제의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있음은 자명하다. 또한, 당업자라면 당업계에 알려진 서열 얼라인먼트를 통해 본 출원의 서열번호 31의 N-말단으로부터 12번, 116번 위치가 서열번호 40의 193, 297번 위치, 서열번호 2의 163, 267번 위치에 상응하는 것임을 알 수 있으며, 서열번호 31이 서열번호 2 및 서열번호 40에 포함되는 것을 알 수 있다.
따라서 본 출원의 세린 프로테아제 변이체는, 서열번호 31의 아미노산 서열을 포함하는 서열번호 2 및 서열번호 40에 대해서, 서열번호 31의 12, 116번에 상응하는 위치의 아미노산 (서열번호 2에서 163 및/또는 267번째 아미노산, 서열번호 40에서 193 및/또는 297번째 아미노산)이 치환된 변이체를 포함한다. 또한 본 출원에서 서열번호 31 및 이의 12, 116번째 아미노산에 대해 설명한 내용을 서열번호 2 및 이의 163, 267번째 아미노산, 서열번호 40 및 이의 193, 297번째 아미노산에 적용할 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 31의 12 및/또는 116번에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 아미노산 서열을 포함하고, 서열번호 2와 적어도 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상, 100% 미만의 서열 상동성을 가지는 것일 수 있다. 다른 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 2의 163 및/또는 267번째 아미노산이 다른 아미노산으로 치환되고, 서열번호 2와 60% 이상 100% 미만의 서열 상동성을 갖는 것일 수 있으며, 서열번호 3 내지 10 중에서 선택되는 어느 하나의 아미노산 서열과 60% 이상의 서열 상동성을 갖는 것일 수 있다. 그러나, 이에 제한되지 않는다.
한편 서열번호 49 내지 54 중 어느 하나의 아미노산 서열을 포함하는 폴리펩티드에서 서열번호 49 내지 54의 N-말단으로부터 12번 및/또는 116번 위치에 상응하는 아미노산의 치환을 포함하는 변이체 역시 본 출원의 세린 프로테아제의 범위에 포함되는 것은 자명하다.
상기 서열번호 49 내지 54 중 어느 하나의 아미노산 서열을 포함하는 폴리펩티드의 서열은, 예를 들어 GenBank Accession: KUP96625.1(서열번호 67), NCBI Reference Sequence: WP_068687914.1(서열번호 68), NCBI Reference Sequence: WP_133739400.1(서열번호 69), NCBI Reference Sequence: WP_179641868.1(서열번호 70), NCBI Reference Sequence: WP_184391208.1(서열번호 71), 또는 NCBI Reference Sequence: WP_017594871.1 (서열번호 72) 등에 기재된 아미노산 서열일 수 있다.
당업자라면 당업계에 알려진 서열 얼라인먼트를 통해 서열번호 67 내지 72에서 서열번호 49 내지 54의 N-말단으로부터 12번 및/또는 116번 위치에 상응하는 아미노산을 확인하여, 서열번호 49 내지 54의 N-말단으로부터 12번 및/또는 116번 위치에 대해 설명한 내용을 적용할 수 있다.
일 구현예로 본 출원의 세린 프로테아제 변이체는 서열번호 49 내지 54 중 어느 하나의 아미노산 서열의 N-말단으로부터 12번 및/또는 116번 위치에 상응하는 아미노산의 다른 아미노산으로의 치환을 포함하고, 서열번호 67 내지 72 중 어느 하나의 아미노산 서열과 60% 이상, 예를 들어 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 54로 기재되는 아미노산 서열을 기준으로 12번 위치에 상응하는 아미노산의 치환을 포함하고, 서열번호 70 내지 72 중 어느 하나로 기재되는 아미노산 서열과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 67로 기재되는 아미노산 서열을 기준으로 198번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 67과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 49의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 49와 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 68로 기재되는 아미노산 서열을 기준으로 178번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 68과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 50의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 50과 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 69로 기재되는 아미노산 서열을 기준으로 207번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 69와 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 51의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 51과 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 70으로 기재되는 아미노산 서열을 기준으로 203번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 70과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 52의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 52와 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 71로 기재되는 아미노산 서열을 기준으로 201번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 71과 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 53의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 53과 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
일 구현예로, 본 출원의 세린 프로테아제 변이체는 서열번호 72로 기재되는 아미노산 서열을 기준으로 201번 위치에 상응하는 아미노산의 치환을 포함하는 것일 수 있다. 상기 변이체는 서열번호 72와 60% 이상, 예를 들어 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 갖는 것일 수 있다. 예를 들어, 상기 변이체는 서열번호 54의 12번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환되고, 서열번호 54와 70% 이상 서열 동일성을 가지는 아미노산 서열을 포함하는 것일 수 있다.
그러나, 이에 제한되지 않는다.
본 출원에서, 용어 "상응하는(corresponding to)"은, 단백질 또는 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 단백질 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다.예를 들어, 임의의 아미노산 서열을 서열번호 31과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 31의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.
이러한 정렬에는 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지는 않는다. 또한 다중 서열 정렬(Multiple sequence alignment)을 통해 상응하는 아미노산 잔기를 식별할 수 있다. 당업계에 알려진 다중 서열 정렬 프로그램의 예시로 MUSCLE (multiple sequence comparison by log-expectation; 3.5 버전 이상; Edgar, 2004, Nucleic Acids Research 32: 1792-1797), MAFFT (6.857 버전 이상; Katoh and Kuma, 2002, Nucleic Acids Research 30: 3059-3066; Katoh et al., 2005, Nucleic Acids Research 33: 511-518; Katoh and Toh, 2007, Bioinformatics 23: 372-374; Katoh et al., 2009, Methods in Molecular Biology 537: 39-64; Katoh and Toh, 2010, Bioinformatics 26: 1899-1900) 등의 프로그램 및 ClustalW를 사용하는 EMBOSS EMMA (1.83 이상; Thompson et al., 1994, Nucleic Acids Research 22 : 4673-4680) 등이 있으며, 상기 프로그램 각각의 기본 매개 변수를 사용할 수 있으며, 이에 제한되지는 않는다.
본 출원의 다른 하나의 양태는 상기 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.
본 출원의 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드는, 본 출원의 강화된 활성을 갖는 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드 서열이라면 제한 없이 포함할 수 있다. 일 구현예로, 본 출원에서 야생형 세린 프로테아제를 코딩하는 유전자는 써모비피다(Thermobifida) 속, 노카르디옵시스(Nocardiopsis) 속, 액티노루기스포라(Actinorugispora) 속, 또는 스핀액티노스포라(Spinactinospora) 속 미생물 유래일 수 있고, 구체적으로 써모비피다 푸스카(Thermobifida fusca), 써모비피다 셀룰로실리티카(Thermobifida cellulosilytica), 써모비피다 할로톨러런스(Thermobifida halotolerans), 액티노루기스포라 엔도피티카(Actinorugispora endophytica), 스핀액티노스포라 알칼리톨러런스(Spinactinospora alkalitolerans), 노카르디옵시스 컴포스타(Nocardiopsis composta), 노카르디옵시스 포텐스(Nocardiopsis potens), 유래일 수 있으나, 이에 제한되지 않는다.
본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 폴리펩티드를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 폴리펩티드의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 아미노산 서열의 N-말단으로부터 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체를 코딩하는 폴리뉴클레오티드 서열이라면 제한 없이 포함할 수 있다.
예를 들어, 본 출원의 폴리뉴클레오티드는 본 출원의 변이체, 구체적으로는 서열번호 32 내지 39 및 서열번호 55 내지 66 중에서 선택되는 어느 하나의 서열번호로 기재되는 아미노산 서열로 이루어진 폴리펩티드 또는 이와 상동성을 가지는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 서열번호 32 내지 39 중에서 선택되는 어느 하나의 서열번호로 기재되는 아미노산 서열로 이루어진 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열은 서열번호 41 내지 48에서 선택되는 어느 하나의 서열번호로 기재되는 폴리뉴클레오티드 서열로 구성된 것일 수 있으나, 이에 제한되는 것은 아니다.
또한, 전술한대로 본 출원의 세린 프로테아제 변이체는 서열번호 31 및 49 내지 54 중 어느 하나의 아미노산 서열을 포함하는 폴리펩티드에서 상기 서열의 12번 및/또는 116번에 상응하는 위치의 아미노산이 치환된 변이체를 포함하므로, 이러한 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드 서열 또한 본 출원의 범위에 포함됨은 자명하다.
일 예로, 서열번호 2 및 서열번호 40에서 서열번호 31의 12번 및/또는 116번에 상응하는 위치의 아미노산(서열번호 2에서 163 및/또는 267번째 아미노산, 서열번호 40에서 193 및/또는 297번째 아미노산)이 치환된 변이체 또한 본 출원의 세린 프로테아제의 범위에 포함되므로, 이를 코딩하는 폴리뉴클레오티드 서열 또한 본 출원의 범위에 포함된다. 예를 들어, 상기 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드 서열은 서열번호 3 내지 10 중에서 선택되는 어느 하나의 서열번호로 기재되는 아미노산 서열을 코딩하는 것일 수 있으며, 구체적으로는 서열번호 23 내지 30에서 선택되는 어느 하나의 서열번호로 기재되는 폴리뉴클레오티드 서열로 구성된 것일 수 있으나, 이에 제한되지 않는다.
또한 공지의 유전자 서열로부터 조제될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화하여, 서열번호 31 및 49 내지 54 중 선택되는 어느 하나의 N-말단으로부터 12번 아미노산 및/또는 116번 아미노산에 상응하는 위치의 아미노산이 다른 아미노산으로 치환된 변이체의 활성을 가지는 단백질을 코딩하는 서열이라면 제한 없이 포함될 수 있다.
상기 "엄격한 조건"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 공지된 문헌에 구체적으로 기재되어 있다. 예를 들어, 상동성이 높은 유전자끼리, 40% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 더욱 구체적으로는 97% 이상, 특히 구체적으로는 99% 이상의 상동성을 갖는 유전자끼리 하이브리드화하고, 그보다 상동성이 낮은 유전자끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화의 세척 조건인 60℃, 1X SSC, 0.1% SDS, 구체적으로는 60℃, 0.1X SSC, 0.1% SDS, 보다 구체적으로는 68℃, 0.1X SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세정하는 조건을 열거할 수 있다. 그러나 이에 제한되는 것은 아니며, 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치 (mismatch)가 가능할지라도, 두 개의 폴리뉴클레오티드가 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원은 또한 실질적으로 유사한 폴리뉴클레오티드 서열뿐만 아니라 전체 서열에 상보적인 단리된 폴리뉴클레오티드 단편을 포함할 수 있다.
구체적으로, 상동성을 가지는 폴리뉴클레오티드는 55℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60℃, 63℃ 또는 65℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다.
본 출원의 다른 하나의 양태는 본 출원의 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다.
본 출원의 용어 "벡터"는 적합한 숙주 내에서 목적 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 상기 목적 단백질을 코딩하는 폴리뉴클레오티드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 단백질을 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다. 작동 가능한 연결은 당업계의 공지된 유전자 재조합 기술을 이용하여 제조할 수 있으며, 부위-특이적 DNA 절단 및 연결은 당업계의 절단 및 연결 효소 등을 사용하여 제작할 수 있으나, 이에 제한되지 않는다.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계, pET계 및 pUB110계 등을 사용할 수 있다. 구체적으로는 pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC, pSM704 벡터 등을 사용할 수 있다. 본 출원에서 사용 가능한 벡터는 특별히 제한되는 것이 아니며 공지된 발현 벡터를 사용할 수 있다.
일 구현예로, 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 목적 변이체를 코딩하는 폴리뉴클레오티드를 변이된 폴리뉴클레오티드로 교체시킬 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 변이형 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원의 다른 하나의 양태는, 본 출원의 세린 프로테아제 변이체; 상기 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 하나 이상을 포함하는 숙주세포를 제공한다.
상기 숙주세포는, 구체적으로, 미생물 일 수 있다.
상기 세린 프로테아제 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드 및 이를 포함하는 벡터 중 하나 이상을 포함하는 미생물은, 구체적으로 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어 제조되는 미생물일 수 있으나, 이에 제한되지 않는다.
상기 미생물은 세린 프로테아제 변이체를 발현하는 미생물 일 수 있다.
본 출원에서 용어, 단백질이 "발현되도록/되는/하는"은 목적 단백질이 미생물 내에 도입되거나, 미생물내에서 발현되도록 변형된 상태를 의미할 수 있다. 본 출원의 목적상 "목적 단백질"은 전술한 세린 프로테아제 변이체일 수 있다.
구체적으로, "단백질의 도입"은, 미생물이 본래 가지고 있지 않았던 특정 단백질의 활성을 나타나게 되는 것 또는 해당 단백질의 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타나게 되는 것을 의미할 수 있다. 예를 들어, 특정 단백질을 코딩하는 폴리뉴클레오티드가 미생물 내 염색체로 도입되거나, 특정 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터가 미생물 내로 도입되어 이의 활성이 나타나는 것일 수 있다.
본 출원의 미생물은 재조합 미생물일 수 있다. 상기 재조합은 형질전환과 같은 유전적 변형(genetically modification)에 의해 이루어질 수 있다.
본 출원에서 용어 "형질전환"은 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 표적 단백질을 코딩하는 DNA 및 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로 도입되는 것이든 상관없다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 한정되지 않는다. 상기 형질전환 하는 방법은 폴리뉴클레오티드를 세포 내로 도입하는 어떤 방법도 포함되며, 숙주세포에 따라 당 분야에서 공지된 바와 같이 적합한 표준 기술을 선택하여 수행할 수 있다. 예를 들어, 전기천공법(electroporation), 인산칼슘(Ca(H2PO4)2, CaHPO4, 또는 Ca3(PO4)2) 침전, 염화칼슘(CaCl2) 침전, 미세주입법(microinjection), 폴리에틸렌글리콜(PEG)법, DEAE-덱스트란법, 양이온 리포좀법, 천연 수용성(natural competence)(예를 들어, 문헌[Perry and Kuramitsu, 1981, Infect. Immun. 32: 1295-1297] 참조) 및 초산 리튬-DMSO법 등이 있으나, 이에 제한되지 않는다.
상기 재조합 미생물은, 본 출원의 세린 프로테아제 활성이 강화된 것일 수 있다.
상기 "활성의 강화"는 미생물이 가진 특정 단백질의 내재적 활성 또는 변형 전 활성에 비하여 활성이 향상된 것을 의미할 수 있다. "내재적 활성"은 자연적, 또는 인위적 요인에 의한 유전적 변이로 미생물의 형질이 변화하는 경우, 형질 변화 전 모균주가 본래 가지고 있던 특정 단백질의 활성을 의미할 수 있다.
구체적으로, 본 출원에서 상기 단백질 변이체의 활성 강화는, 상기 단백질 변이체를 코딩하는 유전자의 세포 내 카피수 증가, 상기 단백질 변이체를 코딩하는 유전자의 발현 조절 서열에 변이를 도입하는 방법, 상기 단백질 변이체를 코딩하는 유전자 발현 조절 서열을 활성이 강력한 서열로 교체하는 방법, 염색체상의 세린 프로테아제 활성을 갖는 자연형 단백질을 코딩하는 유전자를 상기 단백질 변이체를 코딩하는 유전자로 대체하는 방법, 상기 단백질 변이체의 활성이 강화되도록 상기 변이체를 코딩하는 유전자에 변이를 추가적으로 도입시키는 방법 중 어느 하나 이상의 방법으로 이루어질 수 있으나 이에 제한되지 않는다.
다음으로, 폴리뉴클레오티드의 발현이 증가하도록 발현 조절서열을 변형하는 것은, 특별히 이에 제한되지 않으나, 상기 발현 조절서열의 활성을 더욱 강화하도록 핵산 서열을 결실, 삽입, 비보전적 또는 보전적 치환 또는 이들의 조합으로 서열상의 변이를 유도하여 수행하거나, 더욱 강한 활성을 갖는 핵산 서열로 교체함에 의하여 수행될 수 있다. 상기 발현 조절서열은, 특별히 이에 제한되지 않으나, 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다.
상기 폴리뉴클레오티드 발현 단위의 상부에는 본래의 프로모터 대신 강력한 프로모터가 연결될 수 있으며 이에 한정되는 것은 아니다. 공지된 강력한 프로모터의 예에는 cj1 내지 cj7 프로모터(US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터 (US 10584338 B2), O2 프로모터(US 10273491 B2), tkt 프로모터 및 yccA 프로모터 등이 있으나 이에 한정되는 것은 아니다.
아울러, 염색체상의 폴리뉴클레오티드 서열의 변형은, 특별히 이에 제한되지 않으나, 상기 폴리뉴클레오티드 서열의 활성을 더욱 강화하도록 핵산 서열을 결실, 삽입, 비보전적 또는 보전적 치환 또는 이들의 조합으로 발현 조절서열상의 변이를 유도하여 수행하거나, 더욱 강한 활성을 갖도록 개량된 폴리뉴클레오티드 서열로 교체함에 의하여 수행될 수 있다.
이와 같은 단백질 활성의 도입 및 강화는, 상응하는 단백질의 활성 또는 농도가 야생형이나 비변형 미생물 균주에서의 단백질의 활성 또는 농도를 기준으로 하여 일반적으로 최소 1%, 10%, 25%, 50%, 75%, 100%, 150%, 200%, 300%, 400% 또는 500%, 최대 1000% 또는 2000%까지 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 숙주세포 또는 미생물은 본 출원의 폴리뉴클레오티드 또는 본 출원의 벡터를 포함하여 세린 프로테아제 변이체를 발현하는 미생물일 수 있으면 모두 가능하다. 구체적으로, 에스케리키아(Escherichia) 속, 세라티아(Serratia) 속, 어위니아(Erwinia) 속, 엔테로박테리아(Enterobacteria) 속, 프로비덴시아(Providencia) 속, 살모넬라(Salmonella) 속, 스트렙토마이세스(Streptomyces) 속, 슈도모나스(Pseudomonas) 속, 브레비박테리움(Brevibacterium) 속, 코리네박테리움(Corynebacterium) 속 또는 바실러스 속 등의 미생물 균주가 포함될 수 있으며, 구체적으로 바실러스 섭틸리스(Bacillus subtilis), 바실러스 리체니포르미스 (Bacillus licheniformis), 바실러스 아미롤리케파시엔스 (Bacillus amyloliquefaciens), 바실러스 벨레젠시스 (Bacillus velezensis), 대장균(Escherichiacoli), 코리네박테리움 글루타미쿰(Corynebacterum glutamicum), 아스퍼질러스 오리제(Aspergillusoryzae) 등의 균주일 수 있고, 보다 구체적으로는 바실러스 섭틸리스(Bacillus subtilis) 일 수 있으나 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 본 출원의 세린 프로테아제 변이체를 제조하는 방법을 제공한다.
본 출원의 변이체를 제조하는 방법은 본 출원의 세린 프로테아제 변이체; 상기 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는 미생물을 배양하는 단계를 포함하는 것일 수 있다.
본 출원에서, 용어 "배양"은 상기 숙주 세포를 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및 유가식일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, "배지"는 상기 숙주 세포를 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 숙주 세포의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 숙주 세포의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 숙주 세포를 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.
일 구현예로, 본 출원의 변이체를 제조하는 방법은 상기 배양단계에서 발현되는 본 출원의 변이체를 회수하는 단계를 더 포함할 수 잇다.
다른 하나의 구체예로, 상기 배양단계에서 발현된 변이체는 본 발명이 속하는 분야에 알려져 있는 방법을 사용하여 회수될 수 있다. 예를 들어, 변이체는 수집, 원심분리, 여과, 추출, 분무-건조, 증발 또는 침전을 포함하나 이들에 한정되지 않는 통상적인 절차에 의해 영양 배지로부터 회수될 수 있다.
상기 회수 방법은 본 출원의 숙주 세포의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 변이체를 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 및 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 숙주 세포로부터 변이체를 회수할 수 있다.
다른 하나의 구체예로, 배양단계에서 숙주 세포에 의해 발현되는 변이체는 회수되지 않을 수 있다. 상기 구체예에서, 변이체를 발현하는 숙주 세포 자체를 변이체의 공급원으로 사용할 수 있다.
본 출원의 다른 하나의 양태는, 본 출원의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 사료용 조성물을 제공한다.
본 출원의 사료용 조성물에 포함되는 세린 프로테아제 변이체는 이를 발현하는 미생물 자체가 포함되거나, 혹은 이를 발현하는 미생물로부터 분리 정제된 형태일 수 있으나 이에 제한되지 않는다.
본 출원의 "사료용 조성물"은 동물이 먹고, 섭취하며, 소화시키기 위한 또는 이에 적당한 임의의 천연 또는 인공 규정식, 한끼식 등 또는 상기 한끼식의 성분으로, 사료는 당업계의 공지된 다양한 형태의 사료로 제조 가능하다.
상기 사료용 조성물은, 사료 첨가제 일 수 있다.
상기 사료의 종류는 특별히 제한되지 아니하며, 당해 기술 분야에서 통상적으로 사용되는 사료를 사용할 수 있다. 상기 사료의 비제한적인 예로는, 곡물류, 근과류, 식품 가공 부산물류, 조류, 섬유질류, 제약 부산물류, 유지류, 전분류, 박 류 또는 곡물 부산물류 등과 같은 식물성 사료; 단백질류, 무기물류, 유지류, 광물성류, 유지류, 단세포 단백질류, 동물성 플랑크톤류 또는 음식물 등과 같은 동물성 사료를 들 수 있다. 이들은 단독으로 사용되거나 2종 이상을 혼합하여 사용될 수 있다.
본 출원의 사료용 조성물은 구연산, 후말산, 아디픽산, 젖산 및 사과산 등과 같은 유기산; 인산나트륨, 인산칼륨, 산성피로인산염, 폴리인산염(중합인산염)등과 같은 인산염; 폴리페놀, 카테킨(catechin), 알파-토코페롤, 로즈메리 추출물(rosemary extract), 비타민 C, 녹차 추출물, 감초 추출물, 키토산, 탄닌산, 피틴산 등과 같은 천연 항산화제;로부터 선택되는 하나 이상을 더 포함할 수 있다.
본 출원의 사료용 조성물은 아미노산, 무기염류, 비타민, 항생물질, 항균물질, 항산화, 항곰팡이 효소 및 다른 생균 형태의 미생물 제제 등과 같은 보조제 성분; 곡물, 예를 들어, 분쇄 또는 파쇄된 밀, 귀리, 보리, 옥수수 및 쌀; 식물성 단백질 사료, 예를 들어, 평지, 콩 및 해바라기를 주성분으로 하는 것; 동물성 단백질 사료, 예를 들어, 혈분, 육분, 골분 및 생선분; 당분 및 유제품, 예를 들어, 각종 분유 및 유장 분말로 이루어지는 건조성분; 지질, 예를 들어, 가열에 의해 임의로 액화시킨 동물성 지방 및 식물성 지방 등과 같은 주성분; 영양보충제, 소화 및 흡수향상제, 성장촉진제, 질병예방제 등과 같은 첨가제;로부터 선택되는 하나 이상을 더 포함할 수 있다.
본 출원의 사료용 조성물은 건조 또는 액체 상태의 제제 형태일 수 있으며, 사료 첨가용 부형제를 포함할 수 있다. 상기 사료 첨가용 부형제로는 예를 들어, 제올라이트, 옥분 또는 미강 등이 있으나, 이에 제한되지 않는다.
본 출원의 사료용 조성물은 상기 세린 프로테아제 변이체 외의 효소 제제를 더 포함할 수 있다. 예를 들어, 리파아제(lipase)와 같은 지방 분해효소, 피틴산(phytic acid)을 분해하여 인산염과 이노시톨인산염을 만드는 파이타제(phytase), 녹말과 글리코겐 등에 포함되어 있는 알파-1,4-글리코시드 결합(α-1,4-glycoside bond)을 가수분해하는 효소인 아밀라제, 유기인산에스테르를 가수분해하는 효소인 포스파타제(phosphatase), 말토오스를 두 분자의 글루코스로 가수분해하는 말타제 및 사카로스를 가수분해하여 글루코스-프룩토스 혼합물을 만드는 전환효소 등으로부터 선택되는 하나 이상을 더 포함할 수 있다. 그러나 이에 제한되지 않는다.
본 출원의 사료용 조성물은 동물에게 단독으로 투여되거나 식용 담체 중에서 다른 사료 첨가제와 조합되어 투여될 수 있다. 또한, 상기 사료용 조성물은 사료 첨가제로서, 탑 드레싱으로서 또는 이들을 가축 사료에 직접 혼합하거나 또는 사료와 별도로, 별도의 경구 제형으로, 또는 다른 성분과 조합하여 쉽게 투여할 수 있다. 또한 당해 기술분야에서 통상적으로 알려진 바와 같이 단독 일일 섭취량 또는 분할 일일 섭취량을 사용할 수 있다.
본 출원의 사료용 조성물이 사용될 수 있는 동물은 예를 들어 식용우, 젖소, 송아지, 돼지, 돼지새끼, 양, 염소, 말, 토끼, 개, 고양이 등과 같은 가축, 병아리, 알닭, 가정용 닭, 수탉, 오리, 거위, 칠면조, 메추라기, 작은새 등과 같은 가금류를 포함하나, 이에 제한되지 않는다.
본 출원의 사료용 조성물에 포함되는 본 출원의 세린 프로테아제 변이체의 양은 특별히 한정되지 않고 그 목적에 따라 적절히 조절할 수 있다. 일 구현예로, 본 출원이 속하는 기술분야에서 통상적으로 알려진 바와 같이 가축의 소화관에서 장기간 생존하면서 단백질원 물질을 분해하기에 적합한 양으로 포함될 수 있으나 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 본 출원의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 식품 조성물을 제공한다. 상기 프로테아제 단백질은 액체 또는 고체 형태의 식품 조성물에 사용이 가능할 수 있다. 또한, 상기 식품은 분말, 환, 음료, 차 또는 일반 식품의 첨가물일 수 있다.
일 구현예로, 상기 식품은 유제품, 배변용 또는 다이어트용 건강기능식품, 고혈압 예방용 기능성 건강기능식품 등 프로테아제를 필요로 하는 식품군일 수 있다.
다른 구현예로, 상기 프로테아제 변이체는 다양한 식품 조성물에 포함되어 식품의 가용화 또는 연화제, 육질 개질제로서 사용될 수 있다. 그 밖에 다양한 구현예로서, 제빵 과정에 첨가되어, 글루텐 망을 파괴하는 단계에서 사용될 수 있다. 또는, 식품 단백질(예를 들어, 우유 중의 단백질)을 가수분해하는데 사용될 수 있다. 또는, 렌더링, 향료 제조, 쓴맛 저감, 에멀젼화 특성 변화, 생체활성(bioactive) 펩타이드 생성, 단백질의 알레르기 유발 항원 감소 등의 용도로서 다양한 식품 조성물에 포함되어 사용 될 수 있으나, 이는 일 예시로, 전술한 용도에 제한되지 않는다.
상기 식품 조성물 내의 세린 프로테아제 변이체의 양은, 목적하는 바에 따라 당업자가 적절히 조절할 수 있다.
본 출원의 다른 하나의 양태는 본 출원의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 세제 조성물을 제공한다.
본 출원에 따른 세제 조성물은 1부 및 2부 수성 세제 조성물, 비수성 액체 세제 조성물, 성형 고체(cast solid), 과립 형태, 입자 형태, 압축 정제, 겔, 페이스트 또는 슬러리 형태일 수 있다. 상기 세제 조성물은 음식물의 찌든 때, 음식물 잔류막 및 기타 소량의 식품 조성물 제거에 이용 될 수 있다.
본 출원에 따른 세제 조성물은 단단한 표면을 세정하는 세제 조성물, 직물을 세정하는 세제 조성물, 설거지용 세제 조성물, 구강 세정용 세제 조성물, 의치 세정용 세제 또는 콘택트 렌즈 세정 용액과 같은 형태로 제공될 수 있다. 그러나 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는 본 출원의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 약학 조성물을 제공한다.
본 출원의 약학 조성물은, 소화기의 질환, 소화 이상, 소화기 수술 후의 비정상적 질환을 개선하기 위한 소화 효소용 약학적 조성물, 혈전에 직접 작용하여 피브린을 용해시키는 혈전 용해제 내지는 항혈전용 조성물, 생체내 방어 시스템으로서 작용하여 염증성 물질 또는 괴사 조직을 제거하는 소염제 또는 수술 또는 외상후 부종을 경감시키기 위한 소염제로서의 용도를 포함한다.
상기 약학적 조성물은, 사용방법 및 사용목적에 따라 약제학적으로 허용되거나 영양학적으로 허용되는 담체, 부형제, 희석제 또는 부성분을 추가로 포함할 수 있다. 상기 담체, 부형제 또는 희석제는 락토스, 덱스트로스, 수크로스, 솔비톨, 만니톨, 자이리톨, 에리스리톨, 말티톨, 전분, 아키시아 고무, 알지네이트, 젤라틴, 칼슘 포스페이트, 칼슘 실리케이트, 셀룰로오스, 메틸 셀룰로오스, 미정질 셀루로오스, 폴리비닐 피롤리돈, 물, 메틸하이드록시벤조에이트, 프로필하이드록시벤조에이트, 탈크, 마그네슘 스테아레이트 및 광물유, 덱스트린, 칼슘카보네이드, 프로필렌글리콜, 리퀴드 파라핀, 생리식염수로 이루어진 군에서 선택된 1 이상일 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 세린 프로테아제 변이체 또는 이를 발현하는 미생물은, 전술한 용도 외에도 예를 들어 화장품, 피혁 가공, 약제, 진단제, 폐기물 관리 및 학술 연구용 화학제 제조 등의 용도로 사용될 수 있다. 다만 상기 용도는 일 예시이며, 그 밖에 당업계에 알려진 단백질성 물질의 변성, 분해 또는 제거와 관련된 임의의 용도로 사용 될 수 있다.
본 출원의 세린 프로테아제 변이체는 기존 세린 프로테아제에 비해 우수한 활성을 가지므로 산업적으로 유용하게 이용될 수 있다.
도 1은 써모비피다 푸스카 유래 세린 프로테아제 변이체의 3차 구조에서 변이가 도입된 잔기의 위치를 나타낸 것이다.
이하 본 출원을 실시예 및 실험예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예 및 실험예는 본 출원을 예시적으로 설명하기 위한 것으로 본 출원의 범위가 이들 실시예 및 실험예에 한정되는 것은 아니다.
실시예 1.
Thermobifida fusca
유래 세린 프로테아제 변이체 선별
실시예 1-1: Thermobifida fusca 유래 세린 프로테아제 라이브러리 제작
Thermobifida fusca 유래 세린 프로테아제의 mature region에 해당하는 아미노산(서열번호 31)을 암호화하는 유전자에 error-prone PCR을 통해 랜덤 변이를 도입하였다. Error prone PCR은 Diversify™ PCR Random Mutagenesis Kit (Clontech, Cat# 630703)을 사용하였으며, PCR 조건은 [표1]과 같다. 하기 조건으로 진행 시, 6.2mutations/Kb의 빈도로 변이가 삽입됨을 확인하였다.
조성 | 함량 | 비고 |
주형 DNA | 0.5ng | 서열번호 1 |
프라이머_정방향 | 5uM | 서열번호 11 |
프라이머_역방향 | 5uM | 서열번호 12 |
10X Titanium Taq buffer | 5uL | |
MnSO4 | 640uM | |
dGTP | 40uM | |
50X Diversify dNTP mix | 1uL | |
50X dNTP mix | 1uL | |
Titanium Taq Polymerase | 1uL | |
Total | 50uL | Adjust to 50ul with DW |
PCR 조건 | ||
I. 94 ℃ | 30sec | II, III 50사이클 반복 |
II. 94 ℃ | 30sec | |
III. 68 ℃ | 1min | |
IV. 68 ℃ | 1min | |
V. 4 ℃ | ∞ |
상기 과정을 통해 얻은 PCR fragment는 [표2]에 표기한 프라이머를 이용하여 증폭한 벡터에 In-FusionR HD cloning kit (clontech)을 이용하여 라이게이션한 후, DH5α에 형질전환하여 콜로니를 획득하였다. 획득한 콜로니로부터 플라스미드를 정제하여 약 5*104 사이즈의 라이브러리를 확보하였다.
주형 DNA(pBE-S-TAP) | 서열번호 1 |
프라이머_정방향 | 서열번호 13 |
프라이머_역방향 | 서열번호 14 |
실시예 1-2: Thermobifida fusca 유래 세린 프로테아제 라이브러리 스크리닝
실시예 1-1에서 제작된 프로테아제 라이브러리를 단백질 분비가 용이한 바실러스 서브틸리스(Bacillus subtilis) LB700 균주에 형질전환하여 스크리닝을 진행하였다. 스크리닝은 총 2단계에 걸쳐서 진행하였다. 1단계는 라이브러리를 형질전환한 바실러스 서브틸리스 균주를 2% 스킴밀크 플레이트에 도말한 후, 형성된 halo 사이즈를 기준으로 선별하는 방식이다. 바실러스 서브틸리스 형질전환은 Groningen method를 따라서 진행하였고, 스크리닝에 사용한 스킴밀크 플레이트 조성은 [표3]과 같다.
조성 | 함량 | 비고 |
M9 minimal salts | 11.28 g | BD, cat#248510 |
Agar | 20 g | |
Skim milk | 20 g | BD, cat#232100 |
50%Glucose | 20 g | |
1M MgSO4 | 2 mM | |
1M CaCl2 | 0.1mM | |
Kanamycin | 50ug/ml |
(1L 기준)
2단계는 1단계에서 1차적으로 선별된 콜로니를 Azocasein 발색을 통해 선별하는 방식이다. 96 deep well 플레이트에 카나마이신 항생제가 포함된 BHI(Brain Heart Infusion, bd, cat#53286) 액체배지를 넣고, 1단계에서 선별된 콜로니를 접종하여 37℃, 20-24시간 배양하였다. 배양 후, 원심분리를 통해 효소가 포함되어 있는 상등액을 얻고, 상등액과 기질인 2%(w/v) Azocasein을 동량으로 섞은 후, 37℃에서 1시간 반응을 진행하였다. 효소 반응액에 10% TCA(Trichloro acetic acid)를 3배 볼륨으로 첨가하여 반응을 중단시키고, 원심분리를 통해 응고된 단백질을 제거하였다. NaOH를 동량으로 섞어 발색반응을 진행 후, 440nm에서 흡광을 측정함으로써 발색 정도를 비교하였다. 이 과정을 통해 야생형 세린 프로테아제 대비 흡광도가 150% 이상 증가된 콜로니를 선별하였다.
실시예 2. 선별된 변이체 제조 및 활성 평가
실시예 2-1: 변이체 제작
스크리닝을 통해서 선별된 변이체의 시퀀스 분석결과 서열번호 31의 12번째 아미노산(페닐알라닌, Phe), 116번째 아미노산(아스파라긴, Asn)이 각각 타이로신(Tyr), 아스파테이트(Asp)으로 치환되어 있음을 최종적으로 확인하였다. [도 1]에는 상기 변이의 위치를 표시하였다. 선별된 변이 2종(F12, N116)은 site directed mutagenesis를 통해서 pBE-S-TAP 플라스미드에 단독변이 형태로 재도입한 후, double 변이 및 single 변이 형태의 활성을 야생형의 활성과 비교 평가하였다. 변이체 제작시 사용한 프라이머는 [표4]와 같다.
TAP_F12Y_F | 서열번호 15 |
TAP_F12Y_R | 서열번호 16 |
TAP_N116D_F | 서열번호 17 |
TAP_N116D_R | 서열번호 18 |
실시예 2-2: 활성평가
상기 제작된 플라스미드를 바실러스 서브틸리스 LB700 균주에 형질전환 하여 발현시킨 후, N-SUCCINYL-ALA-ALA-PRO-PHE-P-NITROANILIDE(Sigma, cat#S7388, 이하 SUC-AAPF-pNA로 표기) 펩타이드를 기질로 하여 활성평가를 진행하였다. 형질전환 된 바실러스 서브틸리스 균주를 카나마이신 항생제가 포함된 BHI 배지에 접종하여 37℃에서 20-24시간 배양 후, 세포를 제외하고 배양액 일부를 25mM Tris-HCl(pH7.5) buffer, 1mM Suc-AAPF-pNA와 섞은 후, 37℃에서 30분간 반응하였다. 상기의 반응액은 410nm에서 흡광을 측정하였다. 효소 생성물인 para-nitroaniline의 문헌에 알려진 extinction coefficient는 410nm에서 8,800M-1cm-1이며, 이를 토대로 효소의 유닛을 환산하였다(Barrett, A. J., Cathepsin G. Methods Enzymol., 80, Pt. C, 561-565, (1981)). 측정된 활성은 [표5]와 같다.
효소활성 (unit/ml) | |
야생형 | 16.3 |
F12Y | 34.0 |
F12YN116D | 63.8 |
측정 결과, pH7.5, 37℃ 조건에서 야생형 대비 F12Y, F12YN116D 변이 각각 약 2.1배, 3.9배 활성이 증가된 것을 확인할 수 있었다.
실시예 2-3: 열안정성 평가
변이체 도입시 열안정성에 미치는 영향을 확인하기 위하여 다음과 같은 실험을 진행하였다.
구체적으로, 실시예 2-2에서 활성평가를 진행한 동일 샘플을 상온, 70℃, 80℃, 90℃의 온도 조건에서 각각 5분간 정치 후, 효소 활성을 측정하였다. 측정된 활성은 [표6]과 같다.
효소활성 (unit/ml) | ||||
열처리 조건 | RT, 5분 | 70℃, 5분 | 80℃, 5분 | 90℃, 5분 |
야생형 | 16.3 | 15.9 | 10.6 | 0.3 |
F12Y | 34.0 | 34.7 | 22.8 | 0.1 |
F12YN116D | 63.8 | 63.3 | 41.7 | 0.1 |
측정 결과, F12Y, F12YN116D 변이는 80℃에서도 야생형 대비 각각 약 2배 및 약 4배의 효소 활성을 유지하는 것을 확인하였다. 이를 통해, 본 출원의 세린 프로테아제 변이체는 고온에서도 활성이 높게 유지되는 것을 확인하였는 바, 산업적으로 유용하게 사용 될 수 있다.
실시예 3. 포화 변이 라이브러리(Saturation mutagenesis library) 제작 및 선별
실시예 3-1. F12, N116 잔기 포화 변이 라이브러리 제작
앞서 선별한 변이체인 F12, N116 잔기를 타이로신, 아스파테이트 이외의 다른 잔기로 치환하여 활성에 미치는 영향을 확인하고자 2개의 잔기에 대하여 포화 변이 라이브러리를 제작하였다.
pBE-S-TAP를 주형으로 서열번호 11 및 12, 서열번호 13 및 14 프라이머를 각각 이용하여 두 개의 PCR fragment를 얻었고, In-Fusion HD cloning kit를 이용하여 라이게이션한 후, DH5α에 형질전환하여 콜로니를 획득하였다. 획득한 콜로니로부터 플라스미드를 정제하여 약 4x103 사이즈의 라이브러리를 확보하였다.
주형 DNA(pBE-S-TAP) | 서열번호 1 |
Saturation mutagenesis_F_1 | 서열번호 19 |
Saturation mutagenesis_R_1 | 서열번호 20 |
Saturation mutagenesis_F_2 | 서열번호 21 |
Saturation mutagenesis_R_2 | 서열번호 22 |
실시예 3-2: 포화 변이 라이브러리 스크리닝 및 활성 평가
실시예 3-1에서 제작된 포화 변이 라이브러리는 실시예 1-2에서 언급한 것과 동일한 방법으로 스크리닝을 진행하였다. 스크리닝을 통해 F12YN116D 변이체 대비 활성이 동등 또는 증가한 변이체를 선별하였고, 이 변이체들에 대해 서열 분석 및 Suc-AAPF-pNA를 기질로 하여 활성 평가를 진행하였다.
효소활성 (unit/ml) | |
야생형 | 23.52 |
F12YN116D | 65 |
F12YN116S | 77.35 |
F12SN116D | 61.75 |
F12SN116T | 117.65 |
F12AN116G | 94.9 |
F12A | 94.25 |
F12R | 58.5 |
확인 결과, F12, N116 잔기는 실시예 2에서 확인한 타이로신, 아스파테이트 이외에도 F12S, F12A, F12R, N116S, N116T, N116G 등의 다른 아미노산으로 치환되어도 활성이 증가하는 결과를 보였다.
실시예 4. Thermobifida fusca 유래 세린 프로테아제 유사 단백질의 12번, 116번 잔기 영향성 확인
실시예 4-1: 야생형 및 변이체 제작
서열번호 31번과 서열 상동성을 갖는 다른 세린 프로테아제에서도 서열번호 31의 12번, 116번에 상응하는 아미노산 잔기가 활성 증가에 영향을 미치는지 확인하기 위해, 각각 87.2%, 81.8%, 81.3%, 73.8%, 69.9%, 66.7% 의 서열 상동성을 갖는 세린 프로테아제의 12번, 116번 잔기를 타이로신(Y), 아스파테이트(D)로 치환한 후, 야생형과 활성을 비교하였다. 각 세린 프로테아제의 유래 및 서열 정보는 [표9]와 같다.
유래 | 서열번호 | 서열번호 31과 상동성 (%) | 서열번호 54와 상동성(%) |
Thermobifida fusca | 서열번호 31 | - | 66.7 |
Thermobifida cellulosilytica | 서열번호 49 | 87.2 | 65.1 |
Thermobifida halotolerans | 서열번호 50 | 81.8 | 61.3 |
Actinorugispora endophytica | 서열번호 51 | 81.3 | 64 |
Spinactinospora alkalitolerans | 서열번호 52 | 73.8 | 75.4 |
Nocardiopsis composta | 서열번호 53 | 69.9 | 86.6 |
Nocardiopsis potens | 서열번호 54 | 66.7 | - |
각 세린 프로테아제의 12번, 116번 잔기를 타이로신(Y)과 아스파테이트(D)로 치환하여, 서열 번호 55번-66번의 변이체를 제작하였다.
실시예 4-2: 활성평가
상기 제작된 플라스미드를 바실러스 서브틸리스 LB700 균주에 형질전환하여 발현 시킨 후, 실시예 2-2에서 언급한 활성 측정법과 동일한 방법으로 활성평가를 진행하였다. 측정된 활성은 [표10]과 같다.
유래 | 변이형 | activity (U/ml) |
Thermobifida cellulosilytica | WT | 13.6 |
F12Y | 16.3 | |
F12YN116D | 29.1 | |
Thermobifida halotolerans | WT | 4.0 |
F12Y | 6.3 | |
Actinorugispora endophytica | WT | 10.4 |
F12Y | 14.0 | |
Spinactinospora alkalitolerans | WT | 2.0 |
P12Y | 2.6 | |
Nocardiopsis composta | WT | 12.1 |
P12Y | 26.5 | |
Nocardiopsis potens | WT | 33.1 |
P12Y | 86.3 |
측정 결과, Thermobifida fusca 유래 세린 프로테아제와 마찬가지로 이와 서열 상동성을 갖는 6종의 단백질 역시, 12번 잔기에 변이 도입 시 활성이 증가함을 확인하였다.
이를 통해 12번, 116번 잔기는 세린 프로테아제 효소 활성에 중요한 잔기이며, 서열번호 31을 통해 확인한 바와 마찬가지로 이를 다른 아미노산으로 치환함으로써 효소활성을 증가시킬 수 있음을 확인하였는 바, 본 출원의 세린 프로테아제 변이체는 효소활성이 증가되어 산업적으로 유용하게 사용될 수 있다.
이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.
<110> CJ CheilJedang Corporation
<120> A novel serine protease variant
<130> KPA210177-KR
<160> 72
<170> KoPatentIn 3.0
<210> 1
<211> 6922
<212> DNA
<213> Artificial Sequence
<220>
<223> pBE-S-TFP
<400> 1
actagtgttc ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga 60
tgatatacct aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc 120
catctattac aataaattca cagaatagtc ttttaagtaa gtctactctg aacttaagca 180
aaaggagagg gacgcgtgtg agaagcaaaa aattgtggat cagcttgttg tttgcgttaa 240
cgttaatctt tacgatggcg ttcagcaaca tgtctgcgca ggctgcggcc ggtgcacata 300
tgcaagagct ggcgttgaaa cgggacctcg gcctctctga cgcagaagta gccgaactcc 360
gggctgctga ggcggaagcg gtcgagctcg aggaggagct ccgcgattca ttagggtcag 420
acttcggcgg tgtatatctg gatgctgaca ccaccgaaat tacggtcgcg gtaaccgacc 480
cggcagcggt aagtcgtgtc gacgcggatg atgtcacagt tgatgttgtc gatttcgggg 540
aaacagcttt gaatgatttt gtggcttcat taaatgccat tgccgacacg gcagacccta 600
aagtcactgg atggtatacc gatctcgaaa gtgatgccgt agtcattacg accttgcgtg 660
gcgggactcc tgctgccgag gaacttgctg agagagcggg tctcgacgaa agagccgttc 720
ggattgtgga agaagatgaa gaaccacaga gcttggctgc aattattggt ggaaacccgt 780
actatttcgg aaattacaga tgcagtatcg ggtttagtgt ccgtcagggc tctcaaacgg 840
gattcgcgac cgcaggccac tgcggatcca cggggacgcg tgtgtcttct ccttcaggaa 900
cagttgcagg aagttatttc ccgggtcgcg atatgggctg ggtgcggatt acatcagcag 960
atactgtaac accactcgta aatcggtata atgggggaac tgttacggtc actgggtcac 1020
aagaagctgc caccggatcc tccgtttgtc gctctggagc aacaacgggc tggcgctgcg 1080
gaactatcca atcaaaaaac caaacggttc gctatgcaga agggactgtt actggtttaa 1140
caagaactac agcctgtgct gaaggtgggg attctggagg gccatggctc acaggtagcc 1200
aggcgcaagg ggttacaagc ggcggaacag gcgattgcag aagtggaggg attacctttt 1260
tccaaccaat caatccattg cttagctatt tcggccttca attagtgacc ggctgaaagc 1320
ttgtcgacct gcagtctaga catcaccatc atcaccacta atgcggtagt ttatcacagt 1380
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1440
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1500
tatttcactt tttgcattct acaaactgca taactattat gtaaatcgct cctttttagg 1560
tggcacaaat gtgaggcatt ttcgctcttt ccggcaacca cttccaagta aagtataaca 1620
cactatactt tatattcata aagtgtgtgc tctgcgaggc tgtcggcagt gccgaccaaa 1680
accataaaac ctttaagacc tttctttttt ttacgagaaa aaagaaacaa aaaaacctgc 1740
cctctgccac ctcagcaaag gggggttttg ctctcgtgct cgtttaaaaa tcagcaaggg 1800
acaggtagta ttttttgaga agatcactca aaaaatctcc acctttaaac ccttgccaat 1860
ttttattttg tccgttttgt ctagcttacc gaaagccaga ctcagcaaga ataaaatttt 1920
tattgtcttt cggttttcta gtgtaacgga caaaaccact caaaataaaa aagatacaag 1980
agaggtctct cgtatctttt attcagcaat cgcgcccgat tgctgaacag attaataata 2040
gattttagct ttttatttgt tgaaaaaagc taatcaaatt gttgtcggga tcaattactg 2100
caaagtctcg ttcatcccac cactgatctt ttaatgatgt attggggtgc aaaatgccca 2160
aaggcttaat atgttgatat aattcatcaa ttccctctac ttcaatgcgg caactagcag 2220
taccagcaat aaacgactcc gcacctgtac aaaccggtga atcattacta cgagagcgcc 2280
agccttcatc acttgcctcc catagatgaa tccgaacctc attacacatt agaactgcga 2340
atccatcttc atggtgaacc aaagtgaaac ctagtttatc gcaataaaaa cctatactct 2400
ttttaatatc cccgactggc aatgccggga tagactgtaa cattctcacg cataaaatcc 2460
cctttcattt tctaatgtaa atctattacc ttattattaa ttcaattcgc tcataattaa 2520
tcctttttct tattacgcaa aatggcccga tttaagcaca ccctttattc cgttaatgcg 2580
ccatgacagc catgataatt actaatacta ggagaagtta ataaatacga gcaaaaggcc 2640
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 2700
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 2760
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 2820
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 2880
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 2940
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 3000
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 3060
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 3120
gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 3180
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 3240
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 3300
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 3360
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 3420
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 3480
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 3540
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 3600
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 3660
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 3720
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 3780
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 3840
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 3900
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 3960
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 4020
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 4080
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 4140
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 4200
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 4260
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 4320
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 4380
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 4440
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 4500
gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca gtaaccaaca tgattaacaa 4560
ttattagagg tcatcgttca aaatggtatg cgttttgaca catccactat atatccgtgt 4620
cgttctgtcc actcctgaat cccattccag aaattctcta gcgattccag aagtttctca 4680
gagtcggaaa gttgaccaga cattacgaac tggcacagat ggtcataacc tgaaggaaga 4740
tctgattgct taactgcttc agttaagacc gaagcgctcg tcgtataaca gatgcgatga 4800
tgcagaccaa tcaacatggc acctgccatt gctacctgta cagtcaagga tggtagaaat 4860
gttgtcggtc cttgcacacg aatattacgc catttgcctg catattcaaa cagctcttct 4920
acgataaggg cacaaatcgc atcgtggaac gtttgggctt ctaccgattt agcagtttga 4980
tacactttct ctaagtatcc acctgaatca taaatcggca aaatagagaa aaattgacca 5040
tgtgtaagcg gccaatctga ttccacctga gatgcataat ctagtagaat ctcttcgcta 5100
tcaaaattca cttccacctt ccactcaccg gttgtccatt catggctgaa ctctgcttcc 5160
tctgttgaca tgacacacat catctcaata tccgaatagg gcccatcagt ctgacgacca 5220
agagagccat aaacaccaat agccttaaca tcatccccat atttatccaa tattcgttcc 5280
ttaatttcat gaacaatctt cattctttct tctctagtca ttattattgg tccattcact 5340
attctcattc ccttttcaga taattttaga tttgcttttc taaataagaa tatttggaga 5400
gcaccgttct tattcagcta ttaataactc gtcttcctaa gcatccttca atccttttaa 5460
taacaattat agcatctaat cttcaacaaa ctggcccgtt tgttgaacta ctctttaata 5520
aaataatttt tccgttccca attccacatt gcaataatag aaaatccatc ttcatcggct 5580
ttttcgtcat catctgtatg aatcaaatcg ccttcttctg tgtcatcaag gtttaatttt 5640
ttatgtattt cttttaacaa accaccatag gagattaacc ttttacggtg taaaccttcc 5700
tccaaatcag acaaacgttt caaattcttt tcttcatcat cggtcataaa atccgtatcc 5760
tttacaggat attttgcagt ttcgtcaatt gccgattgta tatccgattt atatttattt 5820
ttcggtcgaa tcatttgaac ttttacattt ggatcatagt ctaatttcat tgcctttttc 5880
caaaattgaa tccattgttt ttgattcacg tagttttctg tattcttaaa ataagttggt 5940
tccacacata ccaatacatg catgtgctga ttataagaat tatctttatt atttattgtc 6000
acttccgttg cacgcataaa accaacaaga tttttattaa tttttttata ttgcatcatt 6060
cggcgaaatc cttgagccat atctgacaaa ctcttattta attcttcgcc atcataaaca 6120
tttttaactg ttaatgtgag aaacaaccaa cgaactgttg gcttttgttt aataacttca 6180
gcaacaacct tttgtgactg aatgccatgt ttcattgctc tcctccagtt gcacattgga 6240
caaagcctgg atttacaaaa ccacactcga tacaactttc tttcgcctgt ttcacgattt 6300
tgtttatact ctaatatttc agcacaatct tttactcttt cagccttttt aaattcaaga 6360
atatgcagaa gttcaaagta atcaacatta gcgattttct tttctctcca tggtctcact 6420
tttccacttt ttgtcttgtc cactaaaacc cttgattttt catctgaata aatgctacta 6480
ttaggacaca taatattaaa agaaaccccc atctatttag ttatttgttt agtcacttat 6540
aactttaaca gatggggttt ttctgtgcaa ccaattttaa gggttttcaa tactttaaaa 6600
cacatacata ccaacacttc aacgcacctt tcagcaacta aaataaaaat gacgttattt 6660
ctatatgtat caagataaga aagaacaagt tcaaaaccat caaaaaaaga caccttttca 6720
ggtgcttttt ttattttata aactcattcc ctgatctcga cttcgttctt tttttacctc 6780
tcggttatga gttagttcaa attcgttctt tttaggttct aaatcgtgtt tttcttggaa 6840
ttgtgctgtt ttatccttta ccttgtctac aaacccctta aaaacgtttt taaaggcttt 6900
taagccgtct gtacgttcct aa 6922
<210> 2
<211> 338
<212> PRT
<213> Unknown
<220>
<223> Thermobifida fusca
<400> 2
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Phe Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 3
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163Y)
<400> 3
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Tyr Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 4
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163Y_N267D)
<400> 4
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Tyr Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asp Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 5
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163Y_N267S)
<400> 5
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Tyr Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Ser Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 6
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163S_N267D)
<400> 6
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Ser Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asp Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 7
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163S_N267T)
<400> 7
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Ser Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Thr Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 8
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163A_N267G)
<400> 8
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Ala Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Gly Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 9
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163A)
<400> 9
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Ala Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 10
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163R)
<400> 10
Met Gln Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu
1 5 10 15
Val Ala Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu
20 25 30
Glu Leu Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp
35 40 45
Ala Asp Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val
50 55 60
Ser Arg Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly
65 70 75 80
Glu Thr Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp
85 90 95
Thr Ala Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp
100 105 110
Ala Val Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu
115 120 125
Leu Ala Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu
130 135 140
Glu Asp Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro
145 150 155 160
Tyr Tyr Arg Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln
165 170 175
Gly Ser Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly
180 185 190
Thr Arg Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro
195 200 205
Gly Arg Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr
210 215 220
Pro Leu Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser
225 230 235 240
Gln Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr
245 250 255
Gly Trp Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr
260 265 270
Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu
275 280 285
Gly Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly
290 295 300
Val Thr Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe
305 310 315 320
Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val
325 330 335
Thr Gly
<210> 11
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> TAP_mature region_F
<400> 11
aagaagatga agaaccacag agcttggctg caattattgg tggaaac 47
<210> 12
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> TAP_mature region_R
<400> 12
gactgcaggt cgacaagctt tcagccggtc actaattgaa ggcc 44
<210> 13
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> pBE-S-vector-F
<400> 13
aagcttgtcg acctgcagtc tag 23
<210> 14
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> pBE-S-vector-R
<400> 14
ctgtggttct tcatcttctt ccac 24
<210> 15
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> TAP_F12Y_F
<400> 15
gtggaaaccc gtactattac ggaaattaca gatgcag 37
<210> 16
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> TAP_F12Y_R
<400> 16
ctgcatctgt aatttccgta atagtacggg tttccac 37
<210> 17
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> TAP_N116D_F
<400> 17
ggaactatcc aatcaaaaga ccaaacggtt cgctatgc 38
<210> 18
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> TAP_N116D_R
<400> 18
gcatagcgaa ccgtttggtc ttttgattgg atagttcc 38
<210> 19
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Saturation mutagenesis_F_1
<400> 19
gtggaaaccc gtactatnnn ggaaattaca gatgcag 37
<210> 20
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Saturation mutagenesis_R_1
<400> 20
gcatagcgaa ccgtttgnnn ttttgattgg atagttcc 38
<210> 21
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Saturation mutagenesis_F_2
<400> 21
ggaactatcc aatcaaaann ncaaacggtt cgctatgc 38
<210> 22
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Saturation mutagenesis_R_2
<400> 22
ctgcatctgt aatttccnnn atagtacggg tttccac 37
<210> 23
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F12Y)
<400> 23
atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60
cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120
gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180
ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240
gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300
aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360
ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420
cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480
tactattacg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540
ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600
acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660
gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720
caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780
ggaactatcc aatcaaaaaa ccaaacggtt cgctatgcag aagggactgt tactggttta 840
acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900
caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960
ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017
<210> 24
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163Y_N267D)
<400> 24
atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60
cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120
gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180
ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240
gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300
aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360
ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420
cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480
tactattacg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540
ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600
acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660
gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720
caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780
ggaactatcc aatcaaaaga ccaaacggtt cgctatgcag aagggactgt tactggttta 840
acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900
caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960
ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017
<210> 25
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163Y_N267S)
<400> 25
atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60
cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120
gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180
ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240
gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300
aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360
ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420
cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480
tactattacg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540
ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600
acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660
gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720
caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780
ggaactatcc aatcaaaaag tcaaacggtt cgctatgcag aagggactgt tactggttta 840
acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900
caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960
ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017
<210> 26
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163S_N267D)
<400> 26
atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60
cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120
gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180
ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240
gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300
aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360
ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420
cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480
tactatagtg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540
ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600
acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660
gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720
caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780
ggaactatcc aatcaaaaga tcaaacggtt cgctatgcag aagggactgt tactggttta 840
acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900
caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960
ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017
<210> 27
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163S_N267T)
<400> 27
atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60
cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120
gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180
ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240
gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300
aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360
ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420
cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480
tactatagtg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540
ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600
acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660
gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720
caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780
ggaactatcc aatcaaaaac tcaaacggtt cgctatgcag aagggactgt tactggttta 840
acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900
caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960
ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017
<210> 28
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163A_N267G)
<400> 28
atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60
cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120
gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180
ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240
gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300
aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360
ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420
cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480
tactatgctg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540
ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600
acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660
gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720
caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780
ggaactatcc aatcaaaagg tcaaacggtt cgctatgcag aagggactgt tactggttta 840
acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900
caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960
ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017
<210> 29
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163A)
<400> 29
atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60
cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120
gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180
ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240
gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300
aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360
ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420
cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480
tactatgctg gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540
ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600
acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660
gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720
caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780
ggaactatcc aatcaaaaaa tcaaacggtt cgctatgcag aagggactgt tactggttta 840
acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900
caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960
ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017
<210> 30
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca (F163R)
<400> 30
atgcaagagc tggcgttgaa acgggacctc ggcctctctg acgcagaagt agccgaactc 60
cgggctgctg aggcggaagc ggtcgagctc gaggaggagc tccgcgattc attagggtca 120
gacttcggcg gtgtatatct ggatgctgac accaccgaaa ttacggtcgc ggtaaccgac 180
ccggcagcgg taagtcgtgt cgacgcggat gatgtcacag ttgatgttgt cgatttcggg 240
gaaacagctt tgaatgattt tgtggcttca ttaaatgcca ttgccgacac ggcagaccct 300
aaagtcactg gatggtatac cgatctcgaa agtgatgccg tagtcattac gaccttgcgt 360
ggcgggactc ctgctgccga ggaacttgct gagagagcgg gtctcgacga aagagccgtt 420
cggattgtgg aagaagatga agaaccacag agcttggctg caattattgg tggaaacccg 480
tactatagag gaaattacag atgcagtatc gggtttagtg tccgtcaggg ctctcaaacg 540
ggattcgcga ccgcaggcca ctgcggatcc acggggacgc gtgtgtcttc tccttcagga 600
acagttgcag gaagttattt cccgggtcgc gatatgggct gggtgcggat tacatcagca 660
gatactgtaa caccactcgt aaatcggtat aatgggggaa ctgttacggt cactgggtca 720
caagaagctg ccaccggatc ctccgtttgt cgctctggag caacaacggg ctggcgctgc 780
ggaactatcc aatcaaaaaa tcaaacggtt cgctatgcag aagggactgt tactggttta 840
acaagaacta cagcctgtgc tgaaggtggg gattctggag ggccatggct cacaggtagc 900
caggcgcaag gggttacaag cggcggaaca ggcgattgca gaagtggagg gattaccttt 960
ttccaaccaa tcaatccatt gcttagctat ttcggccttc aattagtgac cggctga 1017
<210> 31
<211> 187
<212> PRT
<213> Unknown
<220>
<223> Thermobifida fusca_mature region
<400> 31
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Phe Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 32
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12Y)
<400> 32
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 33
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12Y_N116D)
<400> 33
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asp Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 34
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12Y_N116S)
<400> 34
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Ser Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 35
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12S_N116D)
<400> 35
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Ser Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asp Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 36
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12S_N116T)
<400> 36
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Ser Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Thr Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 37
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12A_N116G)
<400> 37
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Ala Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Gly Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 38
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12A)
<400> 38
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Ala Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 39
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12R)
<400> 39
Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr Arg Gly Asn Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser Gln Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg Val Ser Ser Pro Ser
35 40 45
Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Thr Gly
145 150 155 160
Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
180 185
<210> 40
<211> 368
<212> PRT
<213> Unknown
<220>
<223> Thermobifida fusca
<400> 40
Met Asn His Ser Ser Arg Arg Thr Thr Ser Leu Leu Phe Thr Ala Ala
1 5 10 15
Leu Ala Ala Thr Ala Leu Val Ala Ala Thr Thr Pro Ala Ser Ala Gln
20 25 30
Glu Leu Ala Leu Lys Arg Asp Leu Gly Leu Ser Asp Ala Glu Val Ala
35 40 45
Glu Leu Arg Ala Ala Glu Ala Glu Ala Val Glu Leu Glu Glu Glu Leu
50 55 60
Arg Asp Ser Leu Gly Ser Asp Phe Gly Gly Val Tyr Leu Asp Ala Asp
65 70 75 80
Thr Thr Glu Ile Thr Val Ala Val Thr Asp Pro Ala Ala Val Ser Arg
85 90 95
Val Asp Ala Asp Asp Val Thr Val Asp Val Val Asp Phe Gly Glu Thr
100 105 110
Ala Leu Asn Asp Phe Val Ala Ser Leu Asn Ala Ile Ala Asp Thr Ala
115 120 125
Asp Pro Lys Val Thr Gly Trp Tyr Thr Asp Leu Glu Ser Asp Ala Val
130 135 140
Val Ile Thr Thr Leu Arg Gly Gly Thr Pro Ala Ala Glu Glu Leu Ala
145 150 155 160
Glu Arg Ala Gly Leu Asp Glu Arg Ala Val Arg Ile Val Glu Glu Asp
165 170 175
Glu Glu Pro Gln Ser Leu Ala Ala Ile Ile Gly Gly Asn Pro Tyr Tyr
180 185 190
Phe Gly Asn Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Gln Gly Ser
195 200 205
Gln Thr Gly Phe Ala Thr Ala Gly His Cys Gly Ser Thr Gly Thr Arg
210 215 220
Val Ser Ser Pro Ser Gly Thr Val Ala Gly Ser Tyr Phe Pro Gly Arg
225 230 235 240
Asp Met Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu
245 250 255
Val Asn Arg Tyr Asn Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu
260 265 270
Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ala Thr Thr Gly Trp
275 280 285
Arg Cys Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu
290 295 300
Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly
305 310 315 320
Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr
325 330 335
Ser Gly Gly Thr Gly Asp Cys Arg Ser Gly Gly Ile Thr Phe Phe Gln
340 345 350
Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu Gln Leu Val Thr Gly
355 360 365
<210> 41
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12Y)
<400> 41
ttggctgcaa ttattggtgg aaacccgtac tattacggaa attacagatg cagtatcggg 60
tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120
gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180
atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240
gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300
tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaaacca aacggttcgc 360
tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420
tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480
gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540
ggccttcaat tagtgaccgg ctga 564
<210> 42
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12Y_N116D)
<400> 42
ttggctgcaa ttattggtgg aaacccgtac tattacggaa attacagatg cagtatcggg 60
tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120
gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180
atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240
gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300
tctggagcaa caacgggctg gcgctgcgga actatccaat caaaagacca aacggttcgc 360
tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420
tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480
gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540
ggccttcaat tagtgaccgg ctga 564
<210> 43
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12Y_N116S)
<400> 43
ttggctgcaa ttattggtgg aaacccgtac tattacggaa attacagatg cagtatcggg 60
tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120
gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180
atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240
gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300
tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaagtca aacggttcgc 360
tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420
tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480
gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540
ggccttcaat tagtgaccgg ctga 564
<210> 44
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12S_N116D)
<400> 44
ttggctgcaa ttattggtgg aaacccgtac tatagtggaa attacagatg cagtatcggg 60
tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120
gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180
atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240
gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300
tctggagcaa caacgggctg gcgctgcgga actatccaat caaaagatca aacggttcgc 360
tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420
tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480
gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540
ggccttcaat tagtgaccgg ctga 564
<210> 45
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12S_N116T)
<400> 45
ttggctgcaa ttattggtgg aaacccgtac tatagtggaa attacagatg cagtatcggg 60
tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120
gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180
atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240
gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300
tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaactca aacggttcgc 360
tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420
tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480
gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540
ggccttcaat tagtgaccgg ctga 564
<210> 46
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12A_N116G)
<400> 46
ttggctgcaa ttattggtgg aaacccgtac tatgctggaa attacagatg cagtatcggg 60
tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120
gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180
atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240
gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300
tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaggtca aacggttcgc 360
tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420
tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480
gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540
ggccttcaat tagtgaccgg ctga 564
<210> 47
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12A)
<400> 47
ttggctgcaa ttattggtgg aaacccgtac tatgctggaa attacagatg cagtatcggg 60
tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120
gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180
atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240
gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300
tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaaatca aacggttcgc 360
tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420
tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480
gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540
ggccttcaat tagtgaccgg ctga 564
<210> 48
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Thermobifida fusca_mature region (F12R)
<400> 48
ttggctgcaa ttattggtgg aaacccgtac tatagaggaa attacagatg cagtatcggg 60
tttagtgtcc gtcagggctc tcaaacggga ttcgcgaccg caggccactg cggatccacg 120
gggacgcgtg tgtcttctcc ttcaggaaca gttgcaggaa gttatttccc gggtcgcgat 180
atgggctggg tgcggattac atcagcagat actgtaacac cactcgtaaa tcggtataat 240
gggggaactg ttacggtcac tgggtcacaa gaagctgcca ccggatcctc cgtttgtcgc 300
tctggagcaa caacgggctg gcgctgcgga actatccaat caaaaaatca aacggttcgc 360
tatgcagaag ggactgttac tggtttaaca agaactacag cctgtgctga aggtggggat 420
tctggagggc catggctcac aggtagccag gcgcaagggg ttacaagcgg cggaacaggc 480
gattgcagaa gtggagggat tacctttttc caaccaatca atccattgct tagctatttc 540
ggccttcaat tagtgaccgg ctga 564
<210> 49
<211> 187
<212> PRT
<213> Unknown
<220>
<223> Thermobifida cellulosilytica
<400> 49
Phe Ala Asp Val Ile Gly Gly Asn Pro Tyr Tyr Phe Gly Gly Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Lys Gly Ser Asp Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Glu Thr Gly Thr Leu Thr Arg Ser Pro Glu
35 40 45
Gly Val Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Leu Thr Gly Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asp
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Val Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Ile Ile
100 105 110
Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Ala Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Arg Thr Gly Gly Ile Thr Tyr Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Glu Leu Val Thr Gly
180 185
<210> 50
<211> 187
<212> PRT
<213> Unknown
<220>
<223> Thermobifida halotolerans
<400> 50
Phe Thr Asp Ile Ile Gly Gly Asn Pro Tyr Tyr Phe Asp Gly Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Arg Gly Ser Glu Ser Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Glu Glu Gly Thr Glu Thr Ser Asp Pro Glu
35 40 45
Gly Thr Val Ala Gly Ala Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Asp Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Glu Asn Val Thr Val Ala Gly Ser Arg Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Arg Ser Lys Asn Gln Thr Val Arg Tyr Ile Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Gly Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Thr Leu Gly Gly Val Thr Tyr Phe Gln Pro Leu Asn Pro Leu
165 170 175
Leu Ser His Phe Asp Leu Asp Leu Val Thr Gly
180 185
<210> 51
<211> 187
<212> PRT
<213> Unknown
<220>
<223> Actinorugispora endophytica
<400> 51
Leu Ala Asn Val Ile Gly Gly Asn Ala Tyr Tyr Phe Gly Gly Tyr Arg
1 5 10 15
Cys Ser Val Gly Phe Ser Val Arg His Ser Ser Gly Pro Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Asp Val Gly Thr Arg Thr Thr Ser Pro Thr
35 40 45
Gly Thr Ile Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Ser Tyr Ile Thr Val Thr Gly Ser Ser Glu Ala Ala Asn Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asn Gln Thr Val Asn Tyr Ala Glu Gly Ser Val Ala Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Ser
130 135 140
Trp Leu Thr Gly Thr Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Thr Trp Gly Gly Thr Thr Tyr Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Asn Leu Thr Leu Val Thr Gly
180 185
<210> 52
<211> 183
<212> PRT
<213> Unknown
<220>
<223> Spinactinospora alkalitolerans
<400> 52
Phe Ala Asp Ile Ile Gly Gly Asn Ala Tyr Tyr Pro Gly Ser Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ala Val Gln Gly Gly Phe Val Thr Ala Gly His
20 25 30
Cys Gly Ser Thr Gly Thr Arg Thr Ser Ser Pro Ser Gly Thr Val Ala
35 40 45
Gly Ser Trp Phe Pro Gly Arg Asp Met Gly Trp Val Arg Thr Gly Ser
50 55 60
Gly Asp Thr Pro Arg Pro Trp Val Asn Asn Tyr Arg Gly Gly Tyr Val
65 70 75 80
Thr Val Ala Gly Ser Gln Glu Ala Gly Ile Gly Ser Ser Val Cys Arg
85 90 95
Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ser Lys Asn
100 105 110
Gln Thr Val Arg Tyr Ser Gln Gly Ser Val Tyr Gly Leu Thr Arg Thr
115 120 125
Ser Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Val Thr Gly
130 135 140
Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Trp
145 150 155 160
Gly Gly Thr Thr Tyr Phe Gln Pro Val Asn Pro Ile Leu Ser Gln Tyr
165 170 175
Gly Leu Arg Leu Val Thr Gly
180
<210> 53
<211> 186
<212> PRT
<213> Unknown
<220>
<223> Nocardiopsis composta
<400> 53
Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Pro Gly Gly Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His
20 25 30
Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly
35 40 45
Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg
50 55 60
Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly
65 70 75 80
Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser
85 90 95
Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile Gln
100 105 110
Ala Lys Asn Gln Thr Val Arg Tyr Pro Glu Gly Thr Val Asn Gly Leu
115 120 125
Thr Arg Thr Thr Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp
130 135 140
Leu Ser Gly Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn
145 150 155 160
Cys Ser Ser Gly Gly Thr Thr Phe Phe Gln Pro Leu Asn Pro Ile Leu
165 170 175
Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly
180 185
<210> 54
<211> 186
<212> PRT
<213> Unknown
<220>
<223> Nocardiopsis potens
<400> 54
Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Pro Gly Gly Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His
20 25 30
Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly
35 40 45
Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg
50 55 60
Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly
65 70 75 80
Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser
85 90 95
Ile Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln
100 105 110
Ala Lys Asn Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Gly Leu
115 120 125
Thr Arg Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp
130 135 140
Ile Ser Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn
145 150 155 160
Cys Ser Thr Gly Gly Thr Thr Phe Tyr Gln Pro Ile Asn Pro Ile Leu
165 170 175
Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly
180 185
<210> 55
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida cellulosilytica_F12Y
<400> 55
Phe Ala Asp Val Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Gly Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Lys Gly Ser Asp Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Glu Thr Gly Thr Leu Thr Arg Ser Pro Glu
35 40 45
Gly Val Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Leu Thr Gly Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asp
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Val Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Ile Ile
100 105 110
Gln Ser Lys Asn Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Ala Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Arg Thr Gly Gly Ile Thr Tyr Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Glu Leu Val Thr Gly
180 185
<210> 56
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida cellulosilytica_F12YN116D
<400> 56
Phe Ala Asp Val Ile Gly Gly Asn Pro Tyr Tyr Tyr Gly Gly Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Lys Gly Ser Asp Thr Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Glu Thr Gly Thr Leu Thr Arg Ser Pro Glu
35 40 45
Gly Val Val Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Leu Thr Gly Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asp
65 70 75 80
Gly Gly Thr Val Thr Val Thr Gly Ser Gln Glu Ala Val Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Ile Ile
100 105 110
Gln Ser Lys Asp Gln Thr Val Arg Tyr Ala Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Ala Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Arg Thr Gly Gly Ile Thr Tyr Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Gly Leu Glu Leu Val Thr Gly
180 185
<210> 57
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida halotolerans_F12Y
<400> 57
Phe Thr Asp Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Asp Gly Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Arg Gly Ser Glu Ser Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Glu Glu Gly Thr Glu Thr Ser Asp Pro Glu
35 40 45
Gly Thr Val Ala Gly Ala Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Asp Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Glu Asn Val Thr Val Ala Gly Ser Arg Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Arg Ser Lys Asn Gln Thr Val Arg Tyr Ile Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Gly Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Thr Leu Gly Gly Val Thr Tyr Phe Gln Pro Leu Asn Pro Leu
165 170 175
Leu Ser His Phe Asp Leu Asp Leu Val Thr Gly
180 185
<210> 58
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Thermobifida halotolerans_F12YN116D
<400> 58
Phe Thr Asp Ile Ile Gly Gly Asn Pro Tyr Tyr Tyr Asp Gly Tyr Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Arg Arg Gly Ser Glu Ser Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Glu Glu Gly Thr Glu Thr Ser Asp Pro Glu
35 40 45
Gly Thr Val Ala Gly Ala Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Asp Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Glu Asn Val Thr Val Ala Gly Ser Arg Glu Ala Ala Thr Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile
100 105 110
Arg Ser Lys Asp Gln Thr Val Arg Tyr Ile Glu Gly Thr Val Thr Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Pro
130 135 140
Trp Leu Thr Gly Ser Gln Gly Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Thr Leu Gly Gly Val Thr Tyr Phe Gln Pro Leu Asn Pro Leu
165 170 175
Leu Ser His Phe Asp Leu Asp Leu Val Thr Gly
180 185
<210> 59
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Actinorugispora endophytica_F12Y
<400> 59
Leu Ala Asn Val Ile Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Tyr Arg
1 5 10 15
Cys Ser Val Gly Phe Ser Val Arg His Ser Ser Gly Pro Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Asp Val Gly Thr Arg Thr Thr Ser Pro Thr
35 40 45
Gly Thr Ile Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Ser Tyr Ile Thr Val Thr Gly Ser Ser Glu Ala Ala Asn Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asn Gln Thr Val Asn Tyr Ala Glu Gly Ser Val Ala Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Ser
130 135 140
Trp Leu Thr Gly Thr Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Thr Trp Gly Gly Thr Thr Tyr Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Asn Leu Thr Leu Val Thr Gly
180 185
<210> 60
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> Actinorugispora endophytica_F12YN116D
<400> 60
Leu Ala Asn Val Ile Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Tyr Arg
1 5 10 15
Cys Ser Val Gly Phe Ser Val Arg His Ser Ser Gly Pro Gly Phe Ala
20 25 30
Thr Ala Gly His Cys Gly Asp Val Gly Thr Arg Thr Thr Ser Pro Thr
35 40 45
Gly Thr Ile Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met Gly Trp Val
50 55 60
Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn Arg Tyr Asn
65 70 75 80
Gly Ser Tyr Ile Thr Val Thr Gly Ser Ser Glu Ala Ala Asn Gly Ser
85 90 95
Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile
100 105 110
Gln Ser Lys Asp Gln Thr Val Asn Tyr Ala Glu Gly Ser Val Ala Gly
115 120 125
Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser Gly Gly Ser
130 135 140
Trp Leu Thr Gly Thr Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly
145 150 155 160
Asn Cys Thr Trp Gly Gly Thr Thr Tyr Phe Gln Pro Ile Asn Pro Leu
165 170 175
Leu Ser Tyr Phe Asn Leu Thr Leu Val Thr Gly
180 185
<210> 61
<211> 183
<212> PRT
<213> Artificial Sequence
<220>
<223> Spinactinospora alkalitolerans_F12Y
<400> 61
Phe Ala Asp Ile Ile Gly Gly Asn Ala Tyr Tyr Tyr Gly Ser Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ala Val Gln Gly Gly Phe Val Thr Ala Gly His
20 25 30
Cys Gly Ser Thr Gly Thr Arg Thr Ser Ser Pro Ser Gly Thr Val Ala
35 40 45
Gly Ser Trp Phe Pro Gly Arg Asp Met Gly Trp Val Arg Thr Gly Ser
50 55 60
Gly Asp Thr Pro Arg Pro Trp Val Asn Asn Tyr Arg Gly Gly Tyr Val
65 70 75 80
Thr Val Ala Gly Ser Gln Glu Ala Gly Ile Gly Ser Ser Val Cys Arg
85 90 95
Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ser Lys Asn
100 105 110
Gln Thr Val Arg Tyr Ser Gln Gly Ser Val Tyr Gly Leu Thr Arg Thr
115 120 125
Ser Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Val Thr Gly
130 135 140
Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Trp
145 150 155 160
Gly Gly Thr Thr Tyr Phe Gln Pro Val Asn Pro Ile Leu Ser Gln Tyr
165 170 175
Gly Leu Arg Leu Val Thr Gly
180
<210> 62
<211> 183
<212> PRT
<213> Artificial Sequence
<220>
<223> Spinactinospora alkalitolerans_F12YN116D
<400> 62
Phe Ala Asp Ile Ile Gly Gly Asn Ala Tyr Tyr Tyr Gly Ser Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ala Val Gln Gly Gly Phe Val Thr Ala Gly His
20 25 30
Cys Gly Ser Thr Gly Thr Arg Thr Ser Ser Pro Ser Gly Thr Val Ala
35 40 45
Gly Ser Trp Phe Pro Gly Arg Asp Met Gly Trp Val Arg Thr Gly Ser
50 55 60
Gly Asp Thr Pro Arg Pro Trp Val Asn Asn Tyr Arg Gly Gly Tyr Val
65 70 75 80
Thr Val Ala Gly Ser Gln Glu Ala Gly Ile Gly Ser Ser Val Cys Arg
85 90 95
Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ser Lys Asp
100 105 110
Gln Thr Val Arg Tyr Ser Gln Gly Ser Val Tyr Gly Leu Thr Arg Thr
115 120 125
Ser Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Val Thr Gly
130 135 140
Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Trp
145 150 155 160
Gly Gly Thr Thr Tyr Phe Gln Pro Val Asn Pro Ile Leu Ser Gln Tyr
165 170 175
Gly Leu Arg Leu Val Thr Gly
180
<210> 63
<211> 186
<212> PRT
<213> Artificial Sequence
<220>
<223> Nocardiopsis composta_F12Y
<400> 63
Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His
20 25 30
Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly
35 40 45
Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg
50 55 60
Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly
65 70 75 80
Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser
85 90 95
Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile Gln
100 105 110
Ala Lys Asn Gln Thr Val Arg Tyr Pro Glu Gly Thr Val Asn Gly Leu
115 120 125
Thr Arg Thr Thr Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp
130 135 140
Leu Ser Gly Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn
145 150 155 160
Cys Ser Ser Gly Gly Thr Thr Phe Phe Gln Pro Leu Asn Pro Ile Leu
165 170 175
Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly
180 185
<210> 64
<211> 186
<212> PRT
<213> Artificial Sequence
<220>
<223> Nocardiopsis composta_F12YN116D
<400> 64
Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His
20 25 30
Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly
35 40 45
Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg
50 55 60
Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly
65 70 75 80
Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser
85 90 95
Val Cys Arg Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile Gln
100 105 110
Ala Lys Asp Gln Thr Val Arg Tyr Pro Glu Gly Thr Val Asn Gly Leu
115 120 125
Thr Arg Thr Thr Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp
130 135 140
Leu Ser Gly Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn
145 150 155 160
Cys Ser Ser Gly Gly Thr Thr Phe Phe Gln Pro Leu Asn Pro Ile Leu
165 170 175
Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly
180 185
<210> 65
<211> 186
<212> PRT
<213> Artificial Sequence
<220>
<223> Nocardiopsis potens_F12Y
<400> 65
Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His
20 25 30
Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly
35 40 45
Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg
50 55 60
Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly
65 70 75 80
Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser
85 90 95
Ile Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln
100 105 110
Ala Lys Asn Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Gly Leu
115 120 125
Thr Arg Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp
130 135 140
Ile Ser Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn
145 150 155 160
Cys Ser Thr Gly Gly Thr Thr Phe Tyr Gln Pro Ile Asn Pro Ile Leu
165 170 175
Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly
180 185
<210> 66
<211> 186
<212> PRT
<213> Artificial Sequence
<220>
<223> Nocardiopsis potens_F12YN116D
<400> 66
Phe Gly Asp Ile Val Gly Gly Asn Ala Tyr Tyr Tyr Gly Gly Ser Arg
1 5 10 15
Cys Ser Ile Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His
20 25 30
Cys Gly Ser Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly
35 40 45
Thr Val Ala Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg
50 55 60
Val Asn Ser Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly
65 70 75 80
Gly Arg Val Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser
85 90 95
Ile Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln
100 105 110
Ala Lys Asp Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Gly Leu
115 120 125
Thr Arg Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp
130 135 140
Ile Ser Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn
145 150 155 160
Cys Ser Thr Gly Gly Thr Thr Phe Tyr Gln Pro Ile Asn Pro Ile Leu
165 170 175
Ser Gln Trp Gly Leu Thr Leu Thr Thr Gly
180 185
<210> 67
<211> 374
<212> PRT
<213> Unknown
<220>
<223> Thermobifida cellulosilytica
<400> 67
Met Asn Arg Pro Ser Thr Arg Arg Thr Val Arg Ala Leu Leu Thr Ala
1 5 10 15
Ala Leu Ala Ala Thr Ala Leu Thr Ala Pro Ala Ala Pro Ser Leu Ala
20 25 30
Gln Glu Ala Ser Gln Glu Ala Ala Leu Thr Arg Asp Leu Asp Leu Thr
35 40 45
Gly Thr Glu Val Ala Leu Leu Arg Ala Ala Glu Ser Glu Ala Met Asp
50 55 60
Arg Glu Glu Glu Leu Ser Ala Val Leu Gly Ser Asp Phe Gly Gly Val
65 70 75 80
Tyr Leu Ala Pro Glu Thr Gly Glu Val Thr Val Ala Val Thr Asp Pro
85 90 95
Ala Ala Val Pro Val Val Glu Gln Ser Gly Ala Thr Ala Gln Val Val
100 105 110
Thr Phe Gly Glu Thr Ala Leu Asn Asp Phe Val Asp Ser Leu Asn Ala
115 120 125
Val Ala Asp Arg Ala Asp Glu Gln Ile Thr Gly Trp Tyr Thr Asp Leu
130 135 140
Ala Ala Asp Thr Val Val Ile Thr Ala Phe Pro Gly Gly Ser Ala Ala
145 150 155 160
Ala Glu Glu Leu Ala Ala Leu Ala Gly Val Asp Glu Arg Ala Val Arg
165 170 175
Val Thr Glu Ser Ala Ala Arg Pro Gln Leu Phe Ala Asp Val Ile Gly
180 185 190
Gly Asn Pro Tyr Tyr Phe Gly Gly Tyr Arg Cys Ser Ile Gly Phe Ser
195 200 205
Val Arg Lys Gly Ser Asp Thr Gly Phe Ala Thr Ala Gly His Cys Gly
210 215 220
Glu Thr Gly Thr Leu Thr Arg Ser Pro Glu Gly Val Val Ala Gly Ser
225 230 235 240
Tyr Phe Pro Gly Arg Asp Met Gly Trp Val Arg Leu Thr Gly Ala Asp
245 250 255
Thr Val Thr Pro Leu Val Asn Arg Tyr Asp Gly Gly Thr Val Thr Val
260 265 270
Thr Gly Ser Gln Glu Ala Val Thr Gly Ser Ser Val Cys Arg Ser Gly
275 280 285
Ser Thr Thr Gly Trp Arg Cys Gly Ile Ile Gln Ser Lys Asn Gln Thr
290 295 300
Val Arg Tyr Ala Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala
305 310 315 320
Cys Ala Glu Ala Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln
325 330 335
Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly
340 345 350
Ile Thr Tyr Phe Gln Pro Ile Asn Pro Leu Leu Ser Tyr Phe Gly Leu
355 360 365
Glu Leu Val Thr Gly Ala
370
<210> 68
<211> 354
<212> PRT
<213> Unknown
<220>
<223> Thermobifida halotolerans
<400> 68
Met Val Ala Thr Ala Leu Thr Ala Ser Ala Thr Pro Ala Ser Ala Asp
1 5 10 15
Arg His Asp Ala Leu Lys Arg Asp Leu Gly Leu Thr Asp Ser Glu Val
20 25 30
Ala Arg Leu Arg Thr Ala Glu Thr Glu Ala Met Asp Arg Glu Ala Glu
35 40 45
Leu Arg Asp Thr Leu Gly Ser Asp Phe Gly Gly Val His Leu Asp Ala
50 55 60
Ala Ser Gly Glu Leu Thr Ile Ala Val Thr Asp Pro Glu Ala Val Pro
65 70 75 80
Thr Val Glu Arg Ala Gly Ala Asn Ala Glu Val Val Thr Phe Gly Glu
85 90 95
Ser Ala Leu Asn Gly Phe Val Asp Ser Leu Asn Ser Val Ala Asp Gln
100 105 110
Ala Asp Glu Gln Val Thr Gly Trp Tyr Ala Asp Ile Ala Asp Asp Ser
115 120 125
Val Val Ile Thr Val Arg Glu Gly Gly Thr Ala Ala Ala Glu Ala Leu
130 135 140
Val Ala Arg Ala Gly Val Asp Glu Arg Ala Val Arg Val Thr Lys Ser
145 150 155 160
Asp Glu Arg Pro Gln Leu Phe Thr Asp Ile Ile Gly Gly Asn Pro Tyr
165 170 175
Tyr Phe Asp Gly Tyr Arg Cys Ser Ile Gly Phe Ser Val Arg Arg Gly
180 185 190
Ser Glu Ser Gly Phe Ala Thr Ala Gly His Cys Gly Glu Glu Gly Thr
195 200 205
Glu Thr Ser Asp Pro Glu Gly Thr Val Ala Gly Ala Tyr Phe Pro Gly
210 215 220
Arg Asp Met Gly Trp Val Arg Ile Thr Asp Ala Asp Thr Val Thr Pro
225 230 235 240
Leu Val Asn Arg Tyr Asn Gly Glu Asn Val Thr Val Ala Gly Ser Arg
245 250 255
Glu Ala Ala Thr Gly Ser Ser Val Cys Arg Ser Gly Ser Thr Thr Gly
260 265 270
Trp Arg Cys Gly Thr Ile Arg Ser Lys Asn Gln Thr Val Arg Tyr Ile
275 280 285
Glu Gly Thr Val Thr Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly
290 295 300
Gly Asp Ser Gly Gly Pro Trp Leu Thr Gly Ser Gln Gly Gln Gly Val
305 310 315 320
Thr Ser Gly Gly Ser Gly Asn Cys Thr Leu Gly Gly Val Thr Tyr Phe
325 330 335
Gln Pro Leu Asn Pro Leu Leu Ser His Phe Asp Leu Asp Leu Val Thr
340 345 350
Gly Ala
<210> 69
<211> 383
<212> PRT
<213> Unknown
<220>
<223> Actinorugispora endophytica
<400> 69
Met Lys Arg Ser Ser Val Phe Arg Ala Leu Gly Gly Thr Ile Leu Thr
1 5 10 15
Ala Gly Leu Val Ile Thr Ala Ala Pro Phe Ala Ser Ala Ala Pro Val
20 25 30
His Thr Glu Thr Thr Pro Thr Ala Ala Glu Ala Gly Asp Gln Leu Ser
35 40 45
Ala Leu Lys Arg Asp Leu Gly Leu Ser Thr Ala Glu Val Glu Glu Leu
50 55 60
Gln Ala Ala Glu Ala Glu Ala Met Asp Val Glu Glu Gly Leu Arg Glu
65 70 75 80
Thr Leu Gly Ser Asp Phe Gly Gly Ala His Phe Asp Ile Asp Ser Gly
85 90 95
Glu Leu Thr Val Ser Val Thr Asp Ala Ala Ala Val Ser Thr Val Glu
100 105 110
Ala Ala Gly Ala Asn Ala Glu Val Val Asp Phe Gly Glu Pro Ala Leu
115 120 125
Asp Ala Ile Val Glu Asp Leu Asn Thr Val Ala Glu Glu Ala Asp Asp
130 135 140
Ser Val Thr Gly Trp Tyr Val Asp Thr Ala Asp Asp Ser Val Val Ile
145 150 155 160
Thr Val Leu Glu Gly Asp Thr Glu Ala Ala Glu Ala Leu Val Ala Glu
165 170 175
Ala Asp Val Asp Gly Lys Ala Val Arg Val Glu Glu Thr Thr Glu Gln
180 185 190
Pro Lys Leu Leu Ala Asn Val Ile Gly Gly Asn Ala Tyr Tyr Phe Gly
195 200 205
Gly Tyr Arg Cys Ser Val Gly Phe Ser Val Arg His Ser Ser Gly Pro
210 215 220
Gly Phe Ala Thr Ala Gly His Cys Gly Asp Val Gly Thr Arg Thr Thr
225 230 235 240
Ser Pro Thr Gly Thr Ile Ala Gly Ser Tyr Phe Pro Gly Arg Asp Met
245 250 255
Gly Trp Val Arg Ile Thr Ser Ala Asp Thr Val Thr Pro Leu Val Asn
260 265 270
Arg Tyr Asn Gly Ser Tyr Ile Thr Val Thr Gly Ser Ser Glu Ala Ala
275 280 285
Asn Gly Ser Ser Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys
290 295 300
Gly Thr Ile Gln Ser Lys Asn Gln Thr Val Asn Tyr Ala Glu Gly Ser
305 310 315 320
Val Ala Gly Leu Thr Arg Thr Thr Ala Cys Ala Glu Gly Gly Asp Ser
325 330 335
Gly Gly Ser Trp Leu Thr Gly Thr Gln Ala Gln Gly Val Thr Ser Gly
340 345 350
Gly Ser Gly Asn Cys Thr Trp Gly Gly Thr Thr Tyr Phe Gln Pro Ile
355 360 365
Asn Pro Leu Leu Ser Tyr Phe Asn Leu Thr Leu Val Thr Gly Ala
370 375 380
<210> 70
<211> 375
<212> PRT
<213> Unknown
<220>
<223> Spinactinospora alkalitolerans
<400> 70
Met Arg Lys Ser Pro Ile Ile Arg Ala Val Gly Gly Ala Ala Ile Thr
1 5 10 15
Phe Gly Leu Val Ile Ala Ala Ala Pro Phe Ala Ser Ala Asp Ser Gly
20 25 30
Ser Glu Thr Thr Ala Gly Ser Val Gly Gln Leu Gly Ala Met Gln Arg
35 40 45
Asp Leu Gly Leu Ser Ala Thr Glu Ala Thr Ala Leu Leu Asp Gln Glu
50 55 60
Glu Gln Ala Arg Thr Leu Glu Gly Glu Leu Arg Glu Thr Leu Gly Gly
65 70 75 80
Asp Phe Gly Gly Ala Val Phe Asp Ile Glu Ser Gly Glu Leu Thr Val
85 90 95
Ser Val Thr Asp Glu Asp Ala Val Asp Glu Val Arg Glu Ala Gly Ala
100 105 110
Glu Ala Glu Val Val Thr Tyr Gly Glu Gln Arg Leu Asp Ala Ile Val
115 120 125
Asp Asp Leu Asn Ala Thr Glu Asp Thr Ala Asp Glu Ser Val Thr Gly
130 135 140
Trp Tyr Val Asp Thr Ala Asp Asp Ser Val Val Val Thr Val Met Glu
145 150 155 160
Gly Glu Glu Ala Ala Ala Glu Lys Leu Ile Ala Thr Ala Asp Val Glu
165 170 175
Gly Thr Ala Val Arg Val Glu Glu Thr Thr Glu Gln Pro Glu Thr Phe
180 185 190
Ala Asp Ile Ile Gly Gly Asn Ala Tyr Tyr Pro Gly Ser Ser Arg Cys
195 200 205
Ser Ile Gly Phe Ala Val Gln Gly Gly Phe Val Thr Ala Gly His Cys
210 215 220
Gly Ser Thr Gly Thr Arg Thr Ser Ser Pro Ser Gly Thr Val Ala Gly
225 230 235 240
Ser Trp Phe Pro Gly Arg Asp Met Gly Trp Val Arg Thr Gly Ser Gly
245 250 255
Asp Thr Pro Arg Pro Trp Val Asn Asn Tyr Arg Gly Gly Tyr Val Thr
260 265 270
Val Ala Gly Ser Gln Glu Ala Gly Ile Gly Ser Ser Val Cys Arg Ser
275 280 285
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ser Lys Asn Gln
290 295 300
Thr Val Arg Tyr Ser Gln Gly Ser Val Tyr Gly Leu Thr Arg Thr Ser
305 310 315 320
Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Val Thr Gly Asn
325 330 335
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Trp Gly
340 345 350
Gly Thr Thr Tyr Phe Gln Pro Val Asn Pro Ile Leu Ser Gln Tyr Gly
355 360 365
Leu Arg Leu Val Thr Gly Ala
370 375
<210> 71
<211> 376
<212> PRT
<213> Unknown
<220>
<223> Nocardiopsis composta
<400> 71
Met Arg Lys Ser Pro Tyr Ile Pro Leu Leu Gly Ala Ser Val Leu Ala
1 5 10 15
Leu Gly Met Ile Ala Ala Ser Pro Thr Ala Ala Ser Ala Asp Glu Ala
20 25 30
Thr Asp Ser Ser Pro Ala Arg Ala Leu Ala Ser Gly Leu Asp Met Ser
35 40 45
Thr Ala Gln Ala Ala Glu Leu Leu Asp Ala Glu Ala Gln Ala Arg Thr
50 55 60
Ala Glu Gln Glu Ala Arg Glu Leu Ala Gly Ala Ser Phe Ala Gly Ala
65 70 75 80
Val Phe Asp Ala Asp Thr Arg Lys Leu Thr Val Ser Val Thr Asp Ala
85 90 95
Ala Ala Ala Glu Ala Val Gln Ala Thr Gly Ala Glu Thr Arg Val Val
100 105 110
Glu Ala Ser Ala Asp Glu Leu Asp Ala Ala Val Ala Asp Leu Asn Ala
115 120 125
Glu Glu Arg Gly Leu Gly Ser Glu Ile Asp Gly Val Thr Gly Trp Tyr
130 135 140
Val Asp Gln Ala Ala Asn Glu Leu Val Val Thr Val Leu Asp Gly Glu
145 150 155 160
Thr Glu Ala Ala Glu Thr Leu Leu Asp Glu Ala Gly Val Asp Ser Val
165 170 175
Pro Val Arg Val Asp Gln Gly Ala Glu Gln Pro Glu Thr Phe Gly Asp
180 185 190
Ile Val Gly Gly Asn Ala Tyr Tyr Pro Gly Gly Ser Arg Cys Ser Ile
195 200 205
Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His Cys Gly Ser
210 215 220
Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly Thr Val Ala
225 230 235 240
Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg Val Asn Ser
245 250 255
Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly Gly Arg Val
260 265 270
Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser Val Cys Arg
275 280 285
Ser Gly Ser Thr Thr Gly Trp Arg Cys Gly Thr Ile Gln Ala Lys Asn
290 295 300
Gln Thr Val Arg Tyr Pro Glu Gly Thr Val Asn Gly Leu Thr Arg Thr
305 310 315 320
Thr Ala Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Leu Ser Gly
325 330 335
Asn Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Ser
340 345 350
Gly Gly Thr Thr Phe Phe Gln Pro Leu Asn Pro Ile Leu Ser Gln Trp
355 360 365
Gly Leu Thr Leu Thr Thr Gly Ala
370 375
<210> 72
<211> 376
<212> PRT
<213> Unknown
<220>
<223> Nocardiopsis potens
<400> 72
Met Arg Lys Ser Pro Tyr Ile Ser Phe Leu Gly Ala Ser Ala Leu Ala
1 5 10 15
Leu Gly Met Ile Ala Ala Ser Pro Ala Ala Ala Ser Ala Asp Glu Ala
20 25 30
Ala Asp Thr Ser Pro Ala Glu Ala Leu Ala Ser Gly Leu Asp Met Ser
35 40 45
Ala Ser Gln Ala Ala Asp Leu Leu Asp Ala Glu Ala Glu Ala Arg Gly
50 55 60
Thr Glu Ala Glu Ala Arg Glu Ala Ala Gly Gly Ser Phe Ala Gly Ala
65 70 75 80
Val Phe Asp Ala Glu Ser Gln Val Leu Thr Val Ser Val Thr Asp Ala
85 90 95
Ala Ala Ala Glu Ala Val Glu Ala Thr Gly Ala Glu Thr Arg Val Val
100 105 110
Glu Ala Ser Glu Asp Glu Leu Asp Ser Ala Val Ser Asp Leu Asn Ala
115 120 125
Glu Glu Ser Ser Leu Gly Ser Ala Ile Glu Gly Val Thr Gly Trp Tyr
130 135 140
Val Asp Pro Ala Ala Asn Glu Val Val Val Thr Val Leu Asp Gly Glu
145 150 155 160
Thr Ala Ala Ala Glu Thr Leu Leu Asp Glu Ala Gly Val Asp Gly Val
165 170 175
Pro Val Arg Ile Asp Glu Gly Ala Glu Gln Pro Glu Thr Phe Gly Asp
180 185 190
Ile Val Gly Gly Asn Ala Tyr Tyr Pro Gly Gly Ser Arg Cys Ser Ile
195 200 205
Gly Phe Ser Val Gln Gly Gly Phe Ala Thr Ala Gly His Cys Gly Ser
210 215 220
Gln Gly Thr Arg Val Thr Gly Gly Ala Gly Glu Ser Gly Thr Val Ala
225 230 235 240
Gly Ser Ile Phe Pro Gly Arg Asp Met Gly Trp Val Arg Val Asn Ser
245 250 255
Gly Trp Asn Pro Ser Pro Tyr Val Asn Asn Tyr Ser Gly Gly Arg Val
260 265 270
Leu Val Thr Gly Ser Gln Glu Ala Ser Val Gly Ala Ser Ile Cys Arg
275 280 285
Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Lys Asn
290 295 300
Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Gly Leu Thr Arg Thr
305 310 315 320
Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Trp Ile Ser Gly
325 330 335
Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Thr
340 345 350
Gly Gly Thr Thr Phe Tyr Gln Pro Ile Asn Pro Ile Leu Ser Gln Trp
355 360 365
Gly Leu Thr Leu Thr Thr Gly Ala
370 375
Claims (15)
- 서열번호 54로 기재되는 아미노산 서열을 기준으로 12번 위치에 상응하는 아미노산의 타이로신(Y)으로의 치환을 포함하고, 서열번호 54로 기재되는 아미노산 서열과 70% 이상 100% 미만의 상동성 또는 동일성을 가지는 아미노산 서열을 포함하는, 세린 프로테아제 변이체.
- 삭제
- 제1항에 있어서, 상기 변이체는 서열번호 54로 기재되는 아미노산 서열과 75% 이상 100% 미만의 상동성 또는 동일성을 가지는, 세린 프로테아제 변이체.
- 삭제
- 삭제
- 제1항에 있어서, 상기 세린 프로테아제 변이체는 서열번호 71 또는 72로 기재되는 아미노산 서열을 기준으로 201번 위치에 상응하는 아미노산의 치환을 포함하는, 세린 프로테아제 변이체.
- 제1항에 있어서, 상기 세린 프로테아제 변이체는 서열번호 70으로 기재되는 아미노산 서열을 기준으로 203번 위치에 상응하는 아미노산의 치환을 포함하는, 세린 프로테아제 변이체.
- 제1항에 있어서, 상기 세린 프로테아제 변이체는 서열번호 70 내지 72 중 어느 하나로 기재되는 아미노산 서열과 적어도 60% 이상, 100% 미만의 서열 상동성을 가지는, 세린 프로테아제 변이체.
- 삭제
- 삭제
- 제1항, 제3항, 제6항, 제7항 및 제8항 중 어느 한 항의 프로테아제 변이체를 포함하는 조성물.
- 제1항, 제3항, 제6항, 제7항 및 제8항 중 어느 한 항의 세린 프로테아제 변이체를 코딩하는 폴리뉴클레오티드.
- 제12항의 폴리뉴클레오티드를 포함하는 벡터.
- 제1항, 제3항, 제6항, 제7항 및 제8항 중 어느 한 항의 세린 프로테아제 변이체; 상기 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는, 숙주세포.
- 제1항, 제3항, 제6항, 제7항 및 제8항 중 어느 한 항의 세린 프로테아제 변이체; 및 이를 발현하는 미생물 중 하나 이상을 포함하는, 사료용 조성물.
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210032885A KR102613549B1 (ko) | 2021-03-12 | 2021-03-12 | 신규 세린 프로테아제 변이체 |
CA3175414A CA3175414A1 (en) | 2021-03-12 | 2022-03-11 | Novel serine protease variant |
CN202280004542.9A CN115698280A (zh) | 2021-03-12 | 2022-03-11 | 新的丝氨酸蛋白酶变体 |
TW111108938A TW202237835A (zh) | 2021-03-12 | 2022-03-11 | 新穎絲胺酸蛋白酶變異體 |
PCT/KR2022/003415 WO2022191653A1 (ko) | 2021-03-12 | 2022-03-11 | 신규 세린 프로테아제 변이체 |
JP2022562328A JP2023521203A (ja) | 2021-03-12 | 2022-03-11 | 新規セリンプロテアーゼ変異体 |
US17/997,455 US20230174964A1 (en) | 2021-03-12 | 2022-03-11 | Novel serine protease variant |
EP22767549.3A EP4116416A4 (en) | 2021-03-12 | 2022-03-11 | NEW VARIANT OF SERINE PROTEASE |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210032885A KR102613549B1 (ko) | 2021-03-12 | 2021-03-12 | 신규 세린 프로테아제 변이체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220128171A KR20220128171A (ko) | 2022-09-20 |
KR102613549B1 true KR102613549B1 (ko) | 2023-12-13 |
Family
ID=83228190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210032885A KR102613549B1 (ko) | 2021-03-12 | 2021-03-12 | 신규 세린 프로테아제 변이체 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230174964A1 (ko) |
EP (1) | EP4116416A4 (ko) |
JP (1) | JP2023521203A (ko) |
KR (1) | KR102613549B1 (ko) |
CN (1) | CN115698280A (ko) |
CA (1) | CA3175414A1 (ko) |
TW (1) | TW202237835A (ko) |
WO (1) | WO2022191653A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116904428B (zh) * | 2023-09-11 | 2024-01-02 | 中国农业科学院北京畜牧兽医研究所 | 一种改良高温碱性蛋白酶AprThc的稳定性的方法及突变体 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10619177B2 (en) | 2014-12-01 | 2020-04-14 | Novozymes A/S | Method for producing a protein hydrolysate |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100534660B1 (ko) | 2003-12-30 | 2005-12-08 | 주식회사 해찬들 | 단백질 분해효소 생성량이 증가된 메주의 제조방법 및 된장 |
KR100620092B1 (ko) | 2004-12-16 | 2006-09-08 | 씨제이 주식회사 | 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법 |
US7618801B2 (en) * | 2007-10-30 | 2009-11-17 | Danison US Inc. | Streptomyces protease |
US9801398B2 (en) * | 2012-01-26 | 2017-10-31 | Novozymes A/S | Use of polypeptides having protease activity in animal feed and detergents |
AU2014214032A1 (en) * | 2013-02-06 | 2015-07-09 | Novozymes A/S | Use of polypeptides having protease activity in animal feed |
KR101632642B1 (ko) | 2015-01-29 | 2016-06-22 | 씨제이제일제당 주식회사 | 신규한 프로모터 및 그의 용도 |
ES2907694T3 (es) | 2016-08-31 | 2022-04-26 | Cj Cheiljedang Corp | Nuevo promotor y uso del mismo |
CN110381746B (zh) * | 2016-12-21 | 2023-12-01 | 杜邦营养生物科学有限公司 | 使用热稳定丝氨酸蛋白酶的方法 |
KR102316445B1 (ko) * | 2019-11-29 | 2021-10-26 | 씨제이제일제당 주식회사 | 신규 세린 프로테아제 변이체 |
-
2021
- 2021-03-12 KR KR1020210032885A patent/KR102613549B1/ko active IP Right Grant
-
2022
- 2022-03-11 CA CA3175414A patent/CA3175414A1/en active Pending
- 2022-03-11 US US17/997,455 patent/US20230174964A1/en active Pending
- 2022-03-11 TW TW111108938A patent/TW202237835A/zh unknown
- 2022-03-11 EP EP22767549.3A patent/EP4116416A4/en active Pending
- 2022-03-11 JP JP2022562328A patent/JP2023521203A/ja active Pending
- 2022-03-11 WO PCT/KR2022/003415 patent/WO2022191653A1/ko unknown
- 2022-03-11 CN CN202280004542.9A patent/CN115698280A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10619177B2 (en) | 2014-12-01 | 2020-04-14 | Novozymes A/S | Method for producing a protein hydrolysate |
Non-Patent Citations (1)
Title |
---|
NCBI, GenBank accession no. WP_067965505.1, S1 family peptidase [Nocardiopsis trehalosi] 2020.04.17 |
Also Published As
Publication number | Publication date |
---|---|
WO2022191653A1 (ko) | 2022-09-15 |
US20230174964A1 (en) | 2023-06-08 |
TW202237835A (zh) | 2022-10-01 |
JP2023521203A (ja) | 2023-05-23 |
CA3175414A1 (en) | 2022-09-15 |
CN115698280A (zh) | 2023-02-03 |
EP4116416A4 (en) | 2023-10-11 |
EP4116416A1 (en) | 2023-01-11 |
KR20220128171A (ko) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU782372B2 (en) | Subtilase variants having an improved wash performance on egg stains | |
KR20120051705A (ko) | 형질 전환체 및 그의 제조 방법, 및 락트산의 제조 방법 | |
CN111926042B (zh) | 一种树突状细胞制剂及其应用 | |
KR102613549B1 (ko) | 신규 세린 프로테아제 변이체 | |
KR102402604B1 (ko) | 신규 세린 프로테아제 변이체 | |
CN1836035B (zh) | 改进的蛋白酶及其制备方法 | |
KR101614679B1 (ko) | 돼지 생식기 호흡기 증후군 바이러스의 키메릭 변이주 | |
CN102002509A (zh) | 一种大肠杆菌-枯草芽孢杆菌穿梭表达载体及其应用 | |
KR101756338B1 (ko) | L-시스테인 생산용 변이미생물 및 이를 이용한 l-시스테인의 제조방법 | |
CN110944656A (zh) | 编码人类fkrp蛋白的新型多核苷酸 | |
CA2319096C (en) | Method for treating acute intermittent porphyria (aip) and other porphyric diseases | |
US20030199077A1 (en) | Subtilase variants having an improved wash performance on egg stains | |
CN113046369B (zh) | 一种新型冠状病毒的mRNA疫苗 | |
US5700665A (en) | Method for the extraction of periplasmic proteins from prokaryotic microorganisms in the presence of arginine | |
CN109251897A (zh) | 一种猪圆环病毒3型毒株及其制备方法和应用 | |
CN114716520B (zh) | 一种库德里阿兹威毕赤酵母三羧酸转运蛋白及其编码基因与应用 | |
KR20220169517A (ko) | 흰 반점 증후군 바이러스 외피 단백질을 발현하는 형질전환 미세조류를 유효성분으로 포함하는 흰 반점 증후군의 예방 또는 개선용 사료첨가제 조성물 및 이의 용도 | |
KR102454110B1 (ko) | ppGpp 생합성 관련 유전자 발현의 저해물질 탐색용 재조합 플라스미드 및 돌연변이 균주 | |
CN111206024B (zh) | 一种表达果胶酸内切水解酶的工程菌及其应用 | |
CN110607267B (zh) | 一种绵羊李斯特菌平衡致死系统、构建方法及应用 | |
CN114907997B (zh) | 薯蓣皂素合成菌株构建及应用 | |
CN101880652A (zh) | 表达猪干扰素(α、β或γ)的重组新城疫弱毒疫苗株 | |
KR20120043657A (ko) | 인간 혈액응고 7인자의 대량 생산 방법 | |
CN111560392B (zh) | miRNA表达载体及其应用 | |
CN101870963A (zh) | 表达狗干扰素(α、β或γ)的重组新城疫弱毒疫苗株 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |