KR20230078754A - 페타제 효소의 활성 및 열안정성 개선을 위한 돌연변이 - Google Patents
페타제 효소의 활성 및 열안정성 개선을 위한 돌연변이 Download PDFInfo
- Publication number
- KR20230078754A KR20230078754A KR1020237014443A KR20237014443A KR20230078754A KR 20230078754 A KR20230078754 A KR 20230078754A KR 1020237014443 A KR1020237014443 A KR 1020237014443A KR 20237014443 A KR20237014443 A KR 20237014443A KR 20230078754 A KR20230078754 A KR 20230078754A
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- ala
- gly
- asn
- thr
- Prior art date
Links
- 230000035772 mutation Effects 0.000 title claims description 77
- 230000000694 effects Effects 0.000 title description 82
- 102000004190 Enzymes Human genes 0.000 title description 69
- 108090000790 Enzymes Proteins 0.000 title description 69
- 101000693873 Unknown prokaryotic organism Leaf-branch compost cutinase Proteins 0.000 claims abstract description 75
- 101000693878 Ideonella sakaiensis (strain NBRC 110686 / TISTR 2288 / 201-F6) Poly(ethylene terephthalate) hydrolase Proteins 0.000 claims abstract description 74
- 229920000139 polyethylene terephthalate Polymers 0.000 claims description 143
- 239000005020 polyethylene terephthalate Substances 0.000 claims description 140
- 102220155062 rs150457771 Human genes 0.000 claims description 54
- 102220525187 Peroxisome biogenesis factor 2_S121E_mutation Human genes 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 36
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 33
- -1 poly(ethylene terephthalate) Polymers 0.000 claims description 31
- 102200120990 rs772912674 Human genes 0.000 claims description 19
- 241000589776 Pseudomonas putida Species 0.000 claims description 17
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 15
- 102000040430 polynucleotide Human genes 0.000 claims description 14
- 108091033319 polynucleotide Proteins 0.000 claims description 14
- 239000002157 polynucleotide Substances 0.000 claims description 14
- 238000011534 incubation Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 9
- 230000000593 degrading effect Effects 0.000 claims description 8
- 102220534918 Importin subunit alpha-6_S61D_mutation Human genes 0.000 claims description 6
- 102220539527 Prostaglandin D2 receptor 2_S58Y_mutation Human genes 0.000 claims description 6
- 108010025037 T140 peptide Proteins 0.000 claims description 6
- 230000001580 bacterial effect Effects 0.000 claims description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 5
- 102220579175 SUN domain-containing protein 5_S58P_mutation Human genes 0.000 claims description 5
- 230000000813 microbial effect Effects 0.000 claims description 5
- 102000004157 Hydrolases Human genes 0.000 claims description 4
- 102220608481 Suppressor of cytokine signaling 2_S61E_mutation Human genes 0.000 claims description 4
- 102220053041 rs543765307 Human genes 0.000 claims description 4
- 102200148363 rs672601362 Human genes 0.000 claims description 4
- 230000002538 fungal effect Effects 0.000 claims description 2
- 102220497380 14-3-3 protein zeta/delta_S58A_mutation Human genes 0.000 claims 3
- 102220497377 14-3-3 protein zeta/delta_S58E_mutation Human genes 0.000 claims 3
- 108010047495 alanylglycine Proteins 0.000 description 64
- 230000015556 catabolic process Effects 0.000 description 64
- 238000006731 degradation reaction Methods 0.000 description 64
- 108090000623 proteins and genes Proteins 0.000 description 61
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 58
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 58
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 58
- 108090000765 processed proteins & peptides Proteins 0.000 description 56
- 229920003023 plastic Polymers 0.000 description 52
- 239000004033 plastic Substances 0.000 description 52
- 102000004196 processed proteins & peptides Human genes 0.000 description 52
- 229920001184 polypeptide Polymers 0.000 description 51
- 102000004169 proteins and genes Human genes 0.000 description 51
- 210000004027 cell Anatomy 0.000 description 49
- 235000018102 proteins Nutrition 0.000 description 48
- 108010048818 seryl-histidine Proteins 0.000 description 41
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 36
- 108010077245 asparaginyl-proline Proteins 0.000 description 36
- 238000006467 substitution reaction Methods 0.000 description 36
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 35
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 35
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 35
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 35
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 35
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 35
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 35
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 35
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 35
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 34
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 34
- 235000001014 amino acid Nutrition 0.000 description 32
- 241000880493 Leptailurus serval Species 0.000 description 30
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 30
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 29
- YBPLKDWJFYCZSV-ZLUOBGJFSA-N Ala-Asn-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N YBPLKDWJFYCZSV-ZLUOBGJFSA-N 0.000 description 29
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 29
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 29
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 29
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 29
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 29
- ABMMIOIRQJNRHG-XKNYDFJKSA-N Asn-Asn-Pro-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ABMMIOIRQJNRHG-XKNYDFJKSA-N 0.000 description 29
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 29
- OFYVKOXTTDCUIL-FXQIFTODSA-N Asp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OFYVKOXTTDCUIL-FXQIFTODSA-N 0.000 description 29
- PLBJMUUEGBBHRH-ZLUOBGJFSA-N Cys-Ala-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLBJMUUEGBBHRH-ZLUOBGJFSA-N 0.000 description 29
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 29
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 29
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 29
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 29
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 29
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 29
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 29
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 29
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 29
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 29
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 29
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 29
- OPJRECCCQSDDCZ-TUSQITKMSA-N Lys-Trp-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OPJRECCCQSDDCZ-TUSQITKMSA-N 0.000 description 29
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 29
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 29
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 29
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 29
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 29
- OAOLATANIHTNCZ-IHRRRGAJSA-N Phe-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N OAOLATANIHTNCZ-IHRRRGAJSA-N 0.000 description 29
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 29
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 29
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 29
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 29
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 29
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 29
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 29
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 29
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 29
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 29
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 29
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 29
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 29
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 29
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 29
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 29
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 29
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 29
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 29
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 29
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 29
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 29
- 108010087924 alanylproline Proteins 0.000 description 29
- 108010008355 arginyl-glutamine Proteins 0.000 description 29
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 29
- 108010037850 glycylvaline Proteins 0.000 description 29
- 108010038745 tryptophylglycine Proteins 0.000 description 29
- 108010009962 valyltyrosine Proteins 0.000 description 29
- VVJTWSRNMJNDPN-IUCAKERBSA-N Arg-Met-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O VVJTWSRNMJNDPN-IUCAKERBSA-N 0.000 description 28
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 28
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 28
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 25
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 23
- 125000000539 amino acid group Chemical group 0.000 description 23
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 22
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 22
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 22
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 22
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 22
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 22
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 22
- GNCPKOZDOCQRAF-BPUTZDHNSA-N Trp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GNCPKOZDOCQRAF-BPUTZDHNSA-N 0.000 description 22
- 239000000047 product Substances 0.000 description 22
- 229940024606 amino acid Drugs 0.000 description 21
- 239000000178 monomer Substances 0.000 description 21
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 20
- LTLBNCDNXQCOLB-UBHSHLNASA-N Trp-Asp-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 LTLBNCDNXQCOLB-UBHSHLNASA-N 0.000 description 20
- 150000001413 amino acids Chemical class 0.000 description 20
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 20
- 229920002799 BoPET Polymers 0.000 description 19
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 19
- 238000003556 assay Methods 0.000 description 18
- 238000006460 hydrolysis reaction Methods 0.000 description 17
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 16
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 16
- 238000013528 artificial neural network Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 16
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 15
- 150000007523 nucleic acids Chemical group 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 14
- 108020004707 nucleic acids Proteins 0.000 description 14
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 13
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 13
- 230000002255 enzymatic effect Effects 0.000 description 13
- 239000000126 substance Substances 0.000 description 13
- 241001269524 Dura Species 0.000 description 12
- 108010079364 N-glycylalanine Proteins 0.000 description 12
- 230000003197 catalytic effect Effects 0.000 description 12
- JNLDTVRGXMSYJC-UVBJJODRSA-N Ala-Pro-Trp Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JNLDTVRGXMSYJC-UVBJJODRSA-N 0.000 description 10
- 108090000371 Esterases Proteins 0.000 description 10
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 10
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- 230000007613 environmental effect Effects 0.000 description 10
- 230000006872 improvement Effects 0.000 description 10
- KKEYFWRCBNTPAC-UHFFFAOYSA-L terephthalate(2-) Chemical compound [O-]C(=O)C1=CC=C(C([O-])=O)C=C1 KKEYFWRCBNTPAC-UHFFFAOYSA-L 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 9
- 239000001257 hydrogen Chemical group 0.000 description 9
- 229910052739 hydrogen Inorganic materials 0.000 description 9
- 230000007062 hydrolysis Effects 0.000 description 9
- 102220238245 rs1555952639 Human genes 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 8
- 241001575835 Ideonella sakaiensis Species 0.000 description 8
- 238000006065 biodegradation reaction Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 239000013502 plastic waste Substances 0.000 description 8
- 238000004064 recycling Methods 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 7
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 7
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 7
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 7
- BFOGZWSSGMLYKV-DCAQKATOSA-N His-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N BFOGZWSSGMLYKV-DCAQKATOSA-N 0.000 description 7
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 7
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 7
- 238000010367 cloning Methods 0.000 description 7
- 230000002209 hydrophobic effect Effects 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 108010005942 methionylglycine Proteins 0.000 description 7
- 229920000728 polyester Polymers 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 6
- RGJTZDRUTUWWTD-UHFFFAOYSA-N (7-oxophenoxazin-3-yl) butanoate Chemical compound C1=CC(=O)C=C2OC3=CC(OC(=O)CCC)=CC=C3N=C21 RGJTZDRUTUWWTD-UHFFFAOYSA-N 0.000 description 6
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 6
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 6
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 6
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 6
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 6
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 6
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 6
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 6
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 6
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 6
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 6
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 6
- RWGDABDXVXRLLH-ACZMJKKPSA-N Cys-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N RWGDABDXVXRLLH-ACZMJKKPSA-N 0.000 description 6
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 6
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 6
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 6
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 6
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 6
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 6
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 6
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 6
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 6
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 6
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 6
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 6
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 6
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 6
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 6
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 6
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 6
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 6
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 6
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 6
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 6
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 6
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 6
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 6
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 6
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 6
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 6
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 6
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 6
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 6
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 6
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 6
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 6
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 6
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 6
- FBGDDUKYOBNZJL-WDSOQIARSA-N Trp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N FBGDDUKYOBNZJL-WDSOQIARSA-N 0.000 description 6
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 6
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 6
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 6
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 6
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 6
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 6
- 235000009582 asparagine Nutrition 0.000 description 6
- 229960001230 asparagine Drugs 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 230000001747 exhibiting effect Effects 0.000 description 6
- 108010049041 glutamylalanine Proteins 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 230000003301 hydrolyzing effect Effects 0.000 description 6
- 238000011065 in-situ storage Methods 0.000 description 6
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 239000011541 reaction mixture Substances 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M sodium hydroxide Inorganic materials [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 239000002699 waste material Substances 0.000 description 6
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 5
- JMCUQXTXLJEQSY-XKNYDFJKSA-N Ala-Asn-Asn-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O JMCUQXTXLJEQSY-XKNYDFJKSA-N 0.000 description 5
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 5
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 5
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 5
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 5
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 5
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 5
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 5
- 241001509283 Ideonella Species 0.000 description 5
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- MHQXIBRPDKXDGZ-ZFWWWQNUSA-N Met-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MHQXIBRPDKXDGZ-ZFWWWQNUSA-N 0.000 description 5
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 5
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 5
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 5
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 5
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 5
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 5
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 5
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 5
- 239000004473 Threonine Substances 0.000 description 5
- UPOGHWJJZAZNSW-XIRDDKMYSA-N Trp-His-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O UPOGHWJJZAZNSW-XIRDDKMYSA-N 0.000 description 5
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 5
- 239000013078 crystal Substances 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 230000007515 enzymatic degradation Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 238000004806 packaging method and process Methods 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 238000005067 remediation Methods 0.000 description 5
- 239000013603 viral vector Substances 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 4
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- 241000320117 Pseudomonas putida KT2440 Species 0.000 description 4
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 4
- KKEYFWRCBNTPAC-UHFFFAOYSA-N Terephthalic acid Chemical compound OC(=O)C1=CC=C(C(O)=O)C=C1 KKEYFWRCBNTPAC-UHFFFAOYSA-N 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000010364 biochemical engineering Methods 0.000 description 4
- 238000006555 catalytic reaction Methods 0.000 description 4
- 230000010261 cell growth Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 108010029384 tryptophyl-histidine Proteins 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 239000004474 valine Substances 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 108090000604 Hydrolases Proteins 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 3
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 3
- 241000219095 Vitis Species 0.000 description 3
- 235000009754 Vitis X bourquina Nutrition 0.000 description 3
- 235000012333 Vitis X labruscana Nutrition 0.000 description 3
- 235000014787 Vitis vinifera Nutrition 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 239000011942 biocatalyst Substances 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 108010005400 cutinase Proteins 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 238000000113 differential scanning calorimetry Methods 0.000 description 3
- 238000004821 distillation Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000009477 glass transition Effects 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 239000005014 poly(hydroxyalkanoate) Substances 0.000 description 3
- 229920000903 polyhydroxyalkanoate Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000035484 reaction time Effects 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 102200021640 rs2722372 Human genes 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000004753 textile Substances 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- BCBHDSLDGBIFIX-UHFFFAOYSA-N 4-[(2-hydroxyethoxy)carbonyl]benzoic acid Chemical compound OCCOC(=O)C1=CC=C(C(O)=O)C=C1 BCBHDSLDGBIFIX-UHFFFAOYSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 2
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 101710092326 Leaf-branch compost cutinase Proteins 0.000 description 2
- 239000006137 Luria-Bertani broth Substances 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 229920000426 Microplastic Polymers 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 241000589614 Pseudomonas stutzeri Species 0.000 description 2
- 241000187810 Saccharomonospora viridis Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 235000019764 Soybean Meal Nutrition 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 241000203780 Thermobifida fusca Species 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 241000235015 Yarrowia lipolytica Species 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 150000001450 anions Chemical class 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 235000013361 beverage Nutrition 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004440 column chromatography Methods 0.000 description 2
- 239000002361 compost Substances 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 2
- 238000002425 crystallisation Methods 0.000 description 2
- 230000008025 crystallization Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011033 desalting Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000009881 electrostatic interaction Effects 0.000 description 2
- 239000003344 environmental pollutant Substances 0.000 description 2
- 230000009088 enzymatic function Effects 0.000 description 2
- 230000007071 enzymatic hydrolysis Effects 0.000 description 2
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000000099 in vitro assay Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000009456 molecular mechanism Effects 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 238000001179 sorption measurement Methods 0.000 description 2
- 239000004455 soybean meal Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 108010018381 streptavidin-binding peptide Proteins 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 229920002994 synthetic fiber Polymers 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- OCUSNPIJIZCRSZ-ZTZWCFDHSA-N (2s)-2-amino-3-methylbutanoic acid;(2s)-2-amino-4-methylpentanoic acid;(2s,3s)-2-amino-3-methylpentanoic acid Chemical compound CC(C)[C@H](N)C(O)=O.CC[C@H](C)[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O OCUSNPIJIZCRSZ-ZTZWCFDHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- DOURAOODTFJRIC-CIUDSAMLSA-N Asn-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N DOURAOODTFJRIC-CIUDSAMLSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000589151 Azotobacter Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- DCJNIJAWIRPPBB-CIUDSAMLSA-N Cys-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N DCJNIJAWIRPPBB-CIUDSAMLSA-N 0.000 description 1
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101000989724 Ideonella sakaiensis (strain NBRC 110686 / TISTR 2288 / 201-F6) Mono(2-hydroxyethyl) terephthalate hydrolase Proteins 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- 241001506991 Komagataella phaffii GS115 Species 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 229920001410 Microfiber Polymers 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 241001057811 Paracoccus <mealybug> Species 0.000 description 1
- 241000206744 Phaeodactylum tricornutum Species 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- 241001515941 Pseudomonas umsongensis Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000007171 acid catalysis Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 239000003945 anionic surfactant Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 239000012237 artificial material Substances 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000000089 atomic force micrograph Methods 0.000 description 1
- 238000004630 atomic force microscopy Methods 0.000 description 1
- 238000010533 azeotropic distillation Methods 0.000 description 1
- 230000002210 biocatalytic effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229920000704 biodegradable plastic Polymers 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 125000001314 canonical amino-acid group Chemical group 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000012691 depolymerization reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108010064118 glucan 1,4-maltotetraohydrolase Proteins 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 239000007986 glycine-NaOH buffer Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 238000000892 gravimetry Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 244000005709 gut microbiome Species 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000005984 hydrogenation reaction Methods 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000002386 leaching Methods 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 230000005226 mechanical processes and functions Effects 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 239000003658 microfiber Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 238000001728 nano-filtration Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004306 orthophenyl phenol Substances 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000004014 plasticizer Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 210000004896 polypeptide structure Anatomy 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000000197 pyrolysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- HSSLDCABUXLXKM-UHFFFAOYSA-N resorufin Chemical compound C1=CC(=O)C=C2OC3=CC(O)=CC=C3N=C21 HSSLDCABUXLXKM-UHFFFAOYSA-N 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000004626 scanning electron microscopy Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 239000002910 solid waste Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 230000003746 surface roughness Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000012209 synthetic fiber Substances 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 239000004758 synthetic textile Substances 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000005292 vacuum distillation Methods 0.000 description 1
- 238000007738 vacuum evaporation Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
- 239000013585 weight reducing agent Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/18—Carboxylic ester hydrolases (3.1.1)
-
- C—CHEMISTRY; METALLURGY
- C08—ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
- C08J—WORKING-UP; GENERAL PROCESSES OF COMPOUNDING; AFTER-TREATMENT NOT COVERED BY SUBCLASSES C08B, C08C, C08F, C08G or C08H
- C08J11/00—Recovery or working-up of waste materials
- C08J11/04—Recovery or working-up of waste materials of polymers
- C08J11/10—Recovery or working-up of waste materials of polymers by chemically breaking down the molecular chains of polymers or breaking of crosslinks, e.g. devulcanisation
- C08J11/105—Recovery or working-up of waste materials of polymers by chemically breaking down the molecular chains of polymers or breaking of crosslinks, e.g. devulcanisation by treatment with enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/78—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W30/00—Technologies for solid waste management
- Y02W30/50—Reuse, recycling or recovery technologies
- Y02W30/62—Plastics recycling; Rubber recycling
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Sustainable Development (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Polymers & Plastics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
온도 및 pH의 범위에 걸쳐 활성을 갖는 PET 가수분해효소가 제공된다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 10월 6일에 출원한 미합중국 가출원 제63/088,321호의 우선권의 이익을 주장하며, 이는 모든 목적을 위하여 원용된다.
요즘, 플라스틱은 우리 일상 생활에서 가장 흔한 인공 재료가 되었다. 이의 우수한 물리적 및 화학적 특성으로 인해, 플라스틱은 포장, 의류, 자동차, 전자, 가정, 농업, 건물 및 건축과 같은 많은 산업에서 필수불가결한 매우 다양한 제품으로 제조되고 있다. 2018년 전 세계 플라스틱 생산량은 3억 5,900만 톤에 달했지만, 현재 우리의 플라스틱 수요는 여전히 빠르게 증가하고 있다.
아이러니하게도, 대부분의 플라스틱은 1회용으로 설계된 단수명 제품이지만, 이의 매우 안정적인 분자구조로 인해 수명이 현저히 길다. 저항력이 강한 플라스틱 제품의 생산과 소비가 지속적으로 증가함에 따라, 플라스틱 폐기물의 축적은 우리 생태계에 점점 더 큰 위협이 되고 있다. 연소 또는 열분해와 같은 종래의 플라스틱 폐기물 관리 기술은 종종 추가적인 환경 오염물질을 생성할 수 있는 에너지 집약적 공정이다. 이와 대조적으로, 최근에 등장한 가수분해성 플라스틱의 효소적 분해는 온화한 조건하에서 기능할 수 있고 잠재적으로 해중합 반응으로부터 플라스틱 단량체를 복원할 수 있다. 따라서, 이는 학계와 산업계 모두의 많은 관심을 받고 있다. 특히, 최근 들어 네 번째로 많이 생산되는 플라스틱 중합체인 PET를 효소적 가수분해하면서 상당한 진전이 있었다.
지난 10년 동안, 다수의 효소가 PET 단량체: 테레프탈레이트(TPA)와 에틸렌 글리콜(EG) 사이의 에스테르 결합을 절단할 수 있는 것으로 밝혀졌다. 대표적으로, Thermobifida fusca KW3의 TfCut1 및 TfCut2(Furukawa, Makoto et al., 2019. “Efficient Degradation of Poly(Ethylene Terephthalate) with Thermobifida Fusca Cutinase Exhibiting Improved Catalytic Activity Generated Using Mutagenesis and Additive-Based Approaches.” Scientific Reports. https://doi.org/10.1038/s41598-019-52379-z; Then et al. 2016; 2015; Herrero Acero et al. 2011), Saccharomonospora viridis AHK190의 Cut190(Oda, Masayuki et al., 2018. “Enzymatic Hydrolysis of PET: Functional Roles of Three Ca2+ Ions Bound to a Cutinase-like Enzyme, Cut190*, and Its Engineering for Improved Activity.” Applied Microbiology and Biotechnology. https://doi.org/10.1007/s00253-018-9374-x; Kawai, Fusako et al., 2014. “A Novel Ca2+-Activated, Thermostabilized Polyesterase Capable of Hydrolyzing Polyethylene Terephthalate from Saccharomonospora Viridis AHK190.” Applied Microbiology and Biotechnology. https://doi.org/10.1007/s00253-014-5860-y), 및 잎 퇴비 메타게놈에서 파생된 LC-큐티나제(Tournier, V. et al., 2020. “An Engineered PET Depolymerase to Break down and Recycle Plastic Bottles.” Nature. https://doi.org/10.1038/s41586-020-2149-4; Shirke, Abhijit N et al., 2018. “Stabilizing Leaf and Branch Compost Cutinase (LCC) with Glycosylation: Mechanism and Effect on PET Hydrolysis.” Biochemistry. https://doi.org/10.1021/acs.biochem.7b01189)는 다른 PET 가수분해효소에 비해 상대적으로 높은 PET 분해 활성을 갖는 것으로 보고되었다. 하지만, 이러한 효소들은 온화한 온도에서 매우 낮은 활성을 보이며, 이의 최적의 활성을 수행하기 위해서는 상당히 높은 작동 온도(> 60°C)를 요구하므로, 이는 환경 복원 전략으로서 전세포 생촉매에서의 적용을 제한한다. 최근, Yoshida et. al은 PET 병 재순환 사이트로부터 신규 PET-동화 박테리아인 Ideonella sakaiensis 201-F6이 성공적으로 분리되었다고 보고하였다: Yoshida, Shosuke et al., 2016. “A Bacterium That Degrades and Assimilates Poly(Ethylene Terephthalate).” Science 351 (6278): 1196 LP - 1199. https://doi.org/10.1126/science.aad6359. 상기 박테리아는 주위 온도에서 지금까지 확인된 다른 PET-분해 효소 중에서 가장 높은 PET 분해 활성을 나타내는 큐티나제-유사 효소 - Is페타제(IsPETase)를 분비하였고, 이는 이의 유망한 환경 적용성을 나타낸다. 환경적 PET 복원을 위한 전세포 생물촉매 시스템을 개발하기 위해, 연구자들은 효모를 포함한 몇몇 상이한 섀시(chassis)에 Is페타제를 배치하려고 시도하였다(Pichia pastoris GS115, Yarrowia lipolytica IMUFRJ 50,682)(Costa, Andressa Maio da et al., 2020 “Poly(Ethylene Terephthalate) (PET) Degradation by Yarrowia Lipolytica: Investigations on Cell Growth, Enzyme Production and Monomers Consumption.” Process Biochemistry. https://doi.org/10.1016/j.procbio.2020.04.001; Chen, Zhuozhi et al., 2020. “Efficient Biodegradation of Highly Crystallized Polyethylene Terephthalate through Cell Surface Display of Bacterial PETase.” Science of the Total Environment. https://doi.org/10.1016/j.scitotenv.2019.136138), and microalga (Phaeodactylum tricornutum, Chlamydomonas reinhardtii CC-124 and CC-503) (Kim, Ji Won et al., 2020. “Functional Expression of Polyethylene Terephthalate-Degrading Enzyme (PETase) in Green Microalgae.” Microbial Cell Factories. https://doi.org/10.1186/s12934-020-01355-8; Moog, Daniel et al., 2019. “Using a Marine Microalga as a Chassis for Polyethylene Terephthalate (PET) Degradation.” Microbial Cell Factories. https://doi.org/10.1186/s12934-019-1220-z).
하지만, Is페타제의 주요 결함은 이것이 단지 48.8°C의 용융 온도(Tm)를 나타내는 열-불안정성 효소라는 것이다. Is페타제는 30°C에서 24시간 배양 후 이의 대부분의 효소 활성을 잃었다는 것으로 보고되었다(Son, Hyeoncheol Francis et al., 2019. “Rational Protein Engineering of Thermo-Stable PETase from Ideonella Sakaiensis for Highly Efficient PET Degradation.” ACS Catalysis 9 (4): 3519-26. https://doi.org/10.1021/acscatal.9b00568). 그럼에도 불구하고, 분해 효율을 최대화하기 위해, 생물적 환경 정화에 적용된 PET-분해 효소는 가혹한 세포외 환경(예컨대, 야생형 페타제의 최적 조건(온도, pH, 염 농도)을 벗어난 조건) 하에서도 장기간 이의 효소 활성을 유지할 수 있는 것이 더 이상적이다. 명백하게도, Is페타제의 낮은 열 안정성은 PET의 실제적인 효소 분해에 대한 이의 활용을 방해할 것이다. Is페타제의 활성 및 안정성을 개선시키기 위하여, Is페타제의 결정구조를 결정하고 이의 촉매기작을 규명하기 위한 실질적인 연구 노력이 있어왔고(Joo, Sungjun et al., 2018. “Structural Insight into Molecular Mechanism of Poly(Ethylene Terephthalate) Degradation.” Nature Communications. https://doi.org/10.1038/s41467-018-02881-1; Austin, Harry P. et al., 2018. “Characterization and Engineering of a Plastic-Degrading Aromatic Polyesterase.” Proceedings of the National Academy of Sciences of the United States of America. https://doi.org/10.1073/pnas. 1718804115), 이는 상기 효소의 합리적 단백질 공학을 위한 새로운 기회를 열고 있다. Is페타제에 대한 구조적 정보를 이용하여, 몇몇 연구들은 PET분해에 대한 1.2- 내지 3.1-배 더 높은 촉매 활성을 제공할 수 있는 단일 점 돌연변이를 성공적으로 도입하였다(Taniguchi, Ikuo et al., 2019. “Biodegradation of PET: Current Status and Application Aspects.” ACS Catalysis 9 (5). https://doi.org/10.1021/acscatal.8b05171). 최근에, Son et. al은 야생형 Is페타제에 비해 향상된 열 안정성(Tm = 57.7°C) 및 40°C에서 14배 더 높은 PET 분해 활성을 나타내는 Is페타제S121E/D186H/R280A 변이체를 생성하였다(Son, Hyeoncheol Francis et al., 2019. “Rational Protein Engineering of Thermo-Stable PETase from Ideonella Sakaiensis for Highly Efficient PET Degradation.” ACS Catalysis 9 (4): 3519-26. https://doi.org/10.1021/acscatal.9b00568). 보다 최근에, Cui et. al은 대폭 개선된 열내성(Tm = 79.8°C) 및 PET 분해 활성에서 두 자릿수(100배) 이상의 향상을 갖는 컴퓨터 상으로 설계된 Is페타제 L117F/ Q119Y/T140D/ W159H, G165A/ I168R/A180I/ S188Q/S214H/R280A를 보고하였다(Cui, Ying-Lu et al., 2019. Computational Redesign of PETase for Plastic Biodegradation by GRAPE Strategy. https://doi.org/10.1101/787069).
일부 구현예들에서, 서열번호 1과 실질적으로(예컨대, 적어도 70, 75, 80, 85, 90, 95, 98, 99%) 동일하고 N233, S58, N114, S121, N225, M262, T270, T140, S61, I208 및 R224로 이루어진 군으로부터 선택된 서열번호 1에 대한 위치에 대응하는 적어도 하나의 돌연변이를 갖는 아미노산 서열을 포함하는 조작된 PET(폴리(에틸렌 테레프탈레이트)) 가수분해효소. 일부 구현예들에서, 상기 적어도 하나의 돌연변이는 N233K, S58E, S58A, N114T, S121E, N225C, M262L, T270V, T140D, S61T, I208V, 및 R224Q로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 상기 적어도 하나의 돌연변이는 S58Y, S58M, S58L, S58V, S58P, S61D, S61E, S61Y, S61F, N114H, N114L, N114R, N114S, N114T, S121E, T140Y, T140L, T140I, T140V, T140S, I208M, I208H, I208F, I208Y, I208P, I208A, R224D, R224E, R224S, R224T, R224N, R224Q, N225N, N225I, N225V, N225M, N225A, N225L, N225S, N225T, N233R, N233Y, N233H, N233P, M262L, M262I, M262A, M262V, M262F, M262W, T270Y, T270R, T270H, R43K, A240C, 및 H186D로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 상기 아미노산 서열은 서열번호 1, 서열번호 2 또는 서열번호 3과 적어도 95%, 98% 또는 99% 동일하다. 일부 구현예들에서, 상기 아미노산 서열은 상기 적어도 하나의 돌연변이를 제외하고는 서열번호 1, 서열번호 2 또는 서열번호 3과 동일하다. 일부 구현예들에서, 상기 아미노산 서열은 서열번호 6 내지 서열번호 34 중 하나 이상과 적어도 95%, 98%, 99% 또는 100% 동일하다.
일부 구현예들에서, 상기 아미노산 서열은 N233K, S58E, S58A, N114T, S121E, N225C, M262L, T270V, T140D, S61T, I208V, 및 R224Q로 이루어진 군으로부터 선택된 서열번호 1에 대한 위치에 대응하는 적어도 2개의 돌연변이를 가진다. 일부 구현예들에서, 상기 아미노산 서열은 N233K, S58E, S58A, N114T, N225C, M262L, T270V, T140D, S61T, I208V, R224Q, S58Y, S58M, S58L, S58V, S58P, S61D, S61E, S61Y, S61F, N114H, N114L, N114R, N114S, N114T, S121E, T140Y, T140L, T140I, T140V, T140S, I208M, I208H, I208F, I208Y, I208P, I208A, R224D, R224E, R224S, R224T, R224N, R224Q, N225N, N225I, N225V, N225M, N225A, N225L, N225S, N225T, N233R, N233Y, N233H, N233P, M262L, M262I, M262A, M262V, M262F, M262W, T270Y, T270R, T270H, R43K, A240C, 및 H186D로 이루어진 군으로부터 선택된 서열번호 1에 대한 위치에 대응하는 2개 또는 3개(또는 4, 5, 6, 7, 8, 9, 또는 10개)의 돌연변이를 가진다.
또한, 상기 또는 본원의 다른 곳에 기재된 바와 같은 조작된 PET 가수분해효소를 인코딩하는 폴리뉴클레오티드를 제공한다. 일부 구현예들에서, 상기 조작된 PET 가수분해효소는 신호 펩티드를 추가로 포함한다.
또한, 프로모터가 상기 조작된 PET 가수분해효소의 발현을 제어하도록 상기 또는 본원에 다른 곳에 기재된 바와 같은 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함하는, 벡터를 제공한다.
또한, 상기 또는 본원의 다른 곳에 기재된 바와 같은 폴리뉴클레오티드 또는 벡터를 포함하는 숙주 세포를 제공한다. 일부 구현예들에서, 상기 숙주 세포는 미생물 세포이다. 일부 구현예들에서, 상기 숙주 세포는 박테리아 세포이다. 일부 구현예들에서, 상기 박테리아 세포는 슈도모나스 푸티다(Pseudomonas putida)이다. 일부 구현예들에서, 상기 숙주 세포는 곰팡이 세포이다.
또한, PET를 분해하는 조건하에서 PET를 상기 또는 본원의 다른 곳에서 기재된 바와 같은 조작된 PET 가수분해효소와 접촉시키는 단계를 포함하는, 폴리(에틸렌 테레프탈레이트)(PET)의 분해 방법을 제공한다. 일부 구현예들에서, 상기 방법은 상기 PET를 상기 조작된 PET 가수분해효소를 발현하고 분비하는 숙주 세포와 접촉시키는 단계를 포함한다. 일부 구현예들에서, 상기 조작된 PET 가수분해효소가 정제된다.
일부 구현예들에서, 상기 조건은 25~70°C 사이의 온도에서의 인큐베이션을 포함한다. 일부 구현예들에서, 상기 온도는 25~40°C 또는 30~40°C 또는 25~45°C이다. 일부 구현예들에서, 상기 온도는 40~70°C 또는 45~65°C 또는 45~55°C이다.
일부 구현예들에서, 상기 조건은 pH 6~10(예컨대, 6~8, 7~8.5, 또는 8~10)에서의 인큐베이션을 포함한다.
정의
"PET 가수분해효소"는 폴리에틸렌 테레프탈레이트(PET) 플라스틱의 단량체성 모노-2-히드록시에틸 테레프탈레이트(MHET)로의 가수분해를 촉매하는 효소들의 에스테라제 부류로부터 유도된다. PET 가수분해효소의 예는 야생형 이데오넬라 사카이엔시스(Ideonella sakaiensis) "Is페타제"인 서열 번호 1이다. PET 가수분해효소 활성은 PET 필름을 분해하는 효소의 능력을 측정함으로써 결정될 수 있고, 이는 설정된 시간 동안 설정된 조건 하에서 효소와 함께 인큐베이션한 후 필름의 중량 변화에 의해 측정될 수 있다. 예컨대 실시예 7을 참조.
"폴리뉴클레오티드"는 전형적으로 5'에서 3' 말단으로 판독되는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일- 또는 이중 가닥 중합체이다. 폴리뉴클레오티드는 RNA 및 DNA를 포함하고, 천연 공급원으로부터 분리되거나, 시험관내에서 합성되거나, 또는 천연 및 합성 분자의 조합으로부터 제조될 수 있다. 상기 용어가 이중 가닥 분자에 적용될 때, 전체 길이를 나타내는 데 사용되며 용어 "염기쌍"과 동등한 것으로 이해될 것이다.
"폴리펩티드" 또는 "단백질"은 천연 또는 합성적으로 생성되든지 간에 펩티드 결합에 의해 연결된 아미노산 잔기의 중합체이다.
2개의 핵산 서열 또는 폴리펩티드는 2개의 서열에서 각각 뉴클레오티드 또는 아미노산 잔기의 서열이 하기에 기재된 바와 같이 최대 일치를 위해 정렬될 때 동일하다면 "동일"하다고 한다. 2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 용어 "동일한" 또는 퍼센트 "동일성"은, 하기 서열 비교 알고리즘 중 하나를 사용하여 또는 수동 정렬 및 시각적 검사에 의해 측정시, 비교 창에 걸쳐 최대 일치를 위해 비교 및 정렬될 때 동일하거나 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 백분율을 갖는 2개 이상의 서열 또는 하위서열을 지칭한다. 서열 동일성의 백분율이 단백질 또는 펩티드와 관련하여 사용되는 경우, 동일하지 않은 잔기 위치는 보존적 아미노산 치환에 의해 종종 상이하며, 여기서 아미노산 잔기는 유사한 화학적 특성(예컨대, 전하 또는 소수성)을 갖는 다른 아미노산 잔기에 대해 치환되고, 따라서 분자의 기능적 특성을 변화시키지 않는 것으로 인식된다. 서열이 보존적 치환에서 상이한 경우, 퍼센트 서열 동일성은 치환의 보존적 성질을 보정하기 위해 상향으로 조정될 수 있다. 이러한 조절을 위한 수단은 당업자에게 일반적으로 공지되어 있다. 전형적으로, 이는 완전 불일치보다는 부분적인 것으로 보존적 치환을 점수화(scoring)하는 것을 포함하며, 이에 의해 퍼센트 서열 동일성이 증가한다. 따라서, 예를 들어, 동일한 아미노산이 1의 점수가 주어지고 비-보존적 치환이 0의 점수가 주어지는 경우, 보존적 치환은 0과 1 사이의 점수가 주어진다. 보존적 치환의 점수화는, 예컨대, Meyers & Miller, Computer Applic. Biol. Sci. 4:11-17 (1988)의 알고리즘에 따라, 예컨대, 프로그램 PC/GENE(Intelligenetics, Mountain View, California, USA)에서 구현된 바와 같이 계산된다.
2개의 핵산 또는 폴리펩티드의 맥락에서 사용되는 어구 "실질적 동일성" 또는 "실질적으로 동일한"은 참조 서열과 적어도 70%의 서열 동일성을 갖는 서열을 지칭한다. 대안적으로, 퍼센트 동일성은 70% 내지 100%의 임의의 정수일 수 있다. 일부 구현예들에서, 서열이 본원에 기재된 방법; 바람직하게는 하기 기재된 바와 같은 표준 매개변수를 사용하는 BLAST를 사용하여 측정된 바와 같이 참조 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가진 경우, 참조 서열과 실질적으로 동일하다. 본 개시의 구현예들은 서열번호 1 내지 서열번호 3 중 하나 이상과 실질적으로 동일하고 본원에 기재된 바와 같은 적어도 하나의 아미노산 치환을 함유하는 폴리펩티드를 제공한다.
서열 비교를 위해, 전형적으로 하나의 서열이 이에 대해 시험 서열이 비교되는 참조 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 참조 서열을 컴퓨터에 입력하고, 필요에 따라 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 매개변수를 지정한다. 기본 프로그램 매개변수를 사용할 수 있거나, 또는 대안적인 매개변수를 지정할 수 있다. 그런 다음, 서열 비교 알고리즘은 프로그램 매개변수들에 기초하여, 참조 서열과 비교하여 시험 서열에 대한 퍼센트 서열 동일성을 계산한다.
퍼센트 서열 동일성 및 서열 유사성을 결정하는데 적합한 알고리즘은 BLAST 및 BLAST 2.0 알고리즘이며, 이는 Altschul et al. (1990) J. Mol. Biol. 215: 403-410 및 Altschul et al. (1977) Nucleic Acids Res. 25: 3389-3402에 각각 기재되어 있다. BLAST 분석을 실시하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information, NCBI) 웹 사이트를 통해 공개적으로 입수가능하다. 상기 알고리즘은 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 일부 양의 값의 임계 점수(T)와 일치하거나 이를 만족시키는 길이 W의 짧은 단어를 쿼리 서열(query sequence)에서 식별함으로써 고득점 서열 쌍(HSP)을 먼저 식별하는 것을 포함한다. T는 인근 단어 점수 임계치(neighborhood word score threshold)로 지칭된다(Altschul et al, supra). 이들 초기 인근 단어 적중(neighborhood word hit)은 이들을 함유하는 더 긴 HSP를 찾기 위한 검색을 개시하기 위한 씨드(seed)로서 작용한다. 그런 다음, 단어 적중은 누적 정렬 점수가 증가될 수 있는 한 각각의 서열을 따라 양 방향으로 연장된다. 누계 점수는 뉴클레오티드 서열에 대해, 매개변수 M(일치하는 잔기의 쌍에 대한 보상 점수; 항상 > 0) 및 N(일치하지 않은 잔기에 대한 벌칙 점수; 항상 < 0)을 사용하여 계산된다. 아미노산 서열에 대해서는, 점수화 매트릭스를 사용하여 누적 점수를 계산한다. 각 방향에서 단어 적중의 확장은: 누적 정렬 점수가 이의 최대 달성된 값으로부터 X의 양만큼 떨어지거나; 누적 점수가 하나 이상의 음의 점수화 잔기 정렬(negative-scoring residue alignment)의 누적으로 인해 0 이하가 되거나; 또는 어느 하나의 서열의 말단에 도달할 때 중단된다. BLAST 알고리즘 매개변수 W, T, 및 X는 정렬의 민감도 및 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열에 대한)은 기본값으로서 단어 크기(W) 28, 기대값(E) 10, M=1, N=-2, 및 양 가닥의 비교를 사용한다. 아미노산 서열에 대해, BLASTP 프로그램은 기본값으로서 단어 크기(W) 3과, 기대값(E) 10과, BLOSUM62 점수화 매트릭스(Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1989)를 참조)를 사용한다.
BLAST 알고리즘은 또한 2개의 서열 사이의 유사성에 대한 통계적 분석을 실시한다(예컨대, Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90:5873-5787 (1993)을 참조). BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 최소 합계 확률(P(N))이며, 이는 2개의 뉴클레오티드 또는 아미노산 서열 사이의 일치가 우연히 일어날 확률의 표시를 제공한다. 예를 들어, 핵산은 시험 핵산과 참조 핵산의 비교에서 가장 작은 합계 확률이 약 0.01 미만, 더 바람직하게는 약 10-5 미만, 및 가장 바람직하게는 약 10-20 미만인 경우 참조 서열과 유사한 것으로 간주된다.
"아미노산 돌연변이"는 주어진 위치의 아미노산 잔기(예컨대, 야생형 PET 가수분해효소 또는 다른 비-천연 PET 가수분해효소에서 발생하는 천연 발생 아미노산 잔기)를 다른 아미노산 잔기(예를 들어, 천연 발생 잔기 이외의 것)로 대체하는 것을 지칭한다. 예를 들어, 야생형 이데오넬라 사카이엔시스 Is페타제 야생형 서열(서열번호 1)의 위치 233에 있는 천연 발생 아미노산 잔기는 아스파라긴(N)(N233)이다; 이에 따라, N233에서의 아미노산 치환은 천연 발생 아스파라긴을 아스파라긴 이외의 임의의 아미노산 잔기로 대체하는 것을 의미한다.
인코딩된 서열에서 단일 아미노산 또는 적은 비율의 아미노산을 변화시키는 폴리펩티드 서열에 대한 개별적인 치환은 "보존적으로 변형된 변이체"를 발생시키고, 여기서 변화는 화학적으로 유사한 아미노산을 갖는 아미노산의 치환을 발생시킨다. 하기의 아미노산은 서로에 대한 보존적 치환이다: 1) 알라닌(A), 글리신(G); 2) 아스파르트산(D), 글루탐산(E); 3) 아스파라긴(N), 글루타민(Q); 4) 아르기닌(R), 리신(K); 5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V); 6) 페닐알라닌(F), 티로신(Y), 트립토판(W); 7) 세린(S), 트레오닌(T); 및 8) 시스테인(C), 메티오닌(M)(예컨대, Creighton, Proteins (1984)를 참조).
"[명시된 서열]에서 아미노산 잔기[X]에 대응하는” 아미노산 잔기, 또는 "[명시된 서열]에서 아미노산 치환[X]에 대응하는” 아미노산 치환 및 유사한 것은 폴리펩티드 및 서열이 최적으로 정렬될 때 명시된 서열의 동등한 아미노산과 정렬되는 관심 폴리펩티드 내의 아미노산을 지칭한다. 예를 들어, 서열번호 1의 위치에 대응하는 아미노산은 BLAST와 같은 정렬 알고리즘을 사용하여 결정될 수 있다. 일부 구현예들에서, 아미노산 위치의 "대응"은 다른 PET 가수분해효소 서열에 대해 서열번호 1을 정렬함으로써 결정된다. 시험 PET 가수분해효소 서열이 서열번호 1과 상이한 경우(예컨대, 아미노산의 변화 또는 아미노산의 부가 또는 결실에 의해), 예를 들어, 시험 PET 가수분해효소가 서열번호 1에 대해 삽입된 아미노 말단 신호 서열 또는 하나 이상의 아미노산을 갖지만, 정렬에 의해 결정된 바와 같이 위치가 여전히 서열번호 1의 위치와 "대응"하는 경우, 개선된 PET 가수분해효소 활성과 관련된 특정 돌연변이는 서열번호 1에서와 동일한 숫자 위치 번호에 있지 않을 것일 수 있다.
용어 "숙주 세포"는 이종 폴리뉴클레오티드를 복제 및/또는 전사 및/또는 번역할 수 있는 임의의 세포를 지칭한다. 따라서, "숙주 세포"는 시험관내 또는 생체내에 위치되든지 간에 임의의 원핵 세포(대장균을 포함하지만 이에 제한되지 않음) 또는 진핵 세포(효모 세포, 포유동물 세포, 조류 세포, 양서류 세포, 식물 세포, 어류 세포 및 곤충 세포를 포함하지만 이에 제한되지 않음)를 지칭한다. 예를 들어, 숙주 세포는 형질전환 동물 또는 형질전환 식물에 위치할 수 있다. 숙주 세포는, 예를 들어, 이종 폴리뉴클레오티드로 형질전환될 수 있다.
"벡터"는 코딩 서열 및 상기 코딩 서열의 발현에 필요한 서열을 포함하는 핵산을 지칭한다. 상기 벡터는 바이러스성 또는 비바이러스성일 수 있다. “플라스미드"는 비-바이러스 벡터, 예컨대, 유전자 및/또는 유전자의 발현에 필요한 조절 요소를 인코딩하는 핵산 분자이다. "바이러스 벡터"는 다른 핵산을 세포 내로 수송할 수 있는 바이러스 유래 핵산이다. 바이러스 벡터는 적절한 환경에 존재할 때 벡터에 의해 운반되는 하나 이상의 유전자에 의해 인코딩되는 단백질 또는 단백질들의 발현을 지시할 수 있다. 바이러스 벡터의 예는 레트로바이러스, 아데노바이러스, 렌티바이러스 및 아데노-관련 바이러스 벡터를 포함하지만, 이에 제한되지는 않는다.
도 1은 야생형 Is페타제와 비교하여 신경망 분석에 의해 예측되는 일련의 돌연변이, 비활성화 Is페타제, 및 써모(Thermo)페타제를 함유하는 Is페타제 변이체의 에스테라제 활성을 나타내는 막대 그래프이다. 야생형 Is페타제 및 이의 변이체의 에스터라제 활성은 레소루핀 부티레이트 검정에 의해 측정된다. "써모(Thermo)"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "데드(Dead)"는 이의 효소 기능을 상실하도록 돌연변이(S160A)된 비활성화 Is페타제를 나타내고; "WT"는 야생형 Is페타제를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 2는 야생형 Is페타제와 비교하여 신경망 분석에 의해 예측되는 일련의 돌연변이, 비활성화 Is페타제, 및 써모페타제를 함유하는 Is페타제 변이체의 PET 분해 활성을 나타내는 막대 그래프이다. 기질로서 PET 필름을 사용하였고, 200 nM의 효소 농도에서 야생형 Is페타제 및 이의 변이체의 가수분해 활성을 측정하였다. 검정 반응물을 40°C에서 96시간 동안 배양하였다. 효소 처리 전후의 PET 필름 샘플을 비교하여 생성된 페타제 처리 필름의 질량 손실을 측정하였다. 생성된 페타제-처리된 필름의 사진은 Is페타제 변이체의 상이한 분해 활성으로 인해 상이한 표면 부식의 정도를 나타낸다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "데드"는 이의 효소 기능을 상실하도록 돌연변이(S160A)된 비활성화 Is페타제를 나타내고; "WT"는 야생형 Is페타제를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 3은 야생형 Is페타제와 비교하여 더 높은 PET 분해 활성을 나타내는 초기 예측된 신경망 돌연변이 7종의 잔기 현장을 도시한다.
도 4는 야생형 Is페타제와 비교하여 Is페타제 변이체의 에스터라제 활성을 나타낸 바 그래프이다. 야생형 Is페타제 및 이의 변이체의 에스터라제 활성은 레소루핀 부티레이트 검정에 의해 측정된다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "TNK"는 돌연변이 N233K를 함유하는 써모페타제 변이체를 나타내고; "듀라(Dura)"는 돌연변이 L117F, Q119Y, T140D, W159H, G165A, I168R, A180I, S188Q, S214H, R280A를 함유하는 듀라페타제를 나타내고; "DNK"는 돌연변이 N233K를 함유하는 듀라페타제 변이체를 나타내며; “WT”는 야생형 Is페타제를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 5는 상이한 온도에서 Is페타제 변이체의 PET 분해 활성을 나타낸 막대 그래프이다. 기질로서 PET 필름을 사용하였고, 200 nM의 효소 농도에서 야생형 Is페타제 변이체의 가수분해 활성을 측정하였다. 검정 반응은 30 및 40°C에서 96시간, 50°C에서 48시간 동안 배양하였다. 효소 처리 전후의 PET 필름 샘플을 비교하여 생성된 페타제 처리 필름의 질량 손실을 측정하였다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "TNK"는 돌연변이 N233K를 함유하는 써모페타제 변이체를 나타내고; "듀라"는 돌연변이 L117F, Q119Y, T140D, W159H, G165A, I168R, A180I, S188Q, S214H, R280A를 함유하는 듀라페타제를 나타내며; "DNK"는 돌연변이 N233K를 함유하는 듀라페타제 변이체를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 6은 신경망 분석에 의해 예측된 일련의 돌연변이, 써모페타제 및 듀라페타제를 함유하는 TNK(돌연변이 S121E, D186H, R280A 및 N233K를 함유하는 Is페타제 변이체) 변이체의 에스터라제 활성을 TNK와 비교하여 보여주는 막대 그래프이다. 써모페타제, 듀라페타제, TNK 및 이의 변이체의 에스터라제 활성은 레소루핀 부티레이트 검정에 의해 측정된다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "TNK"는 돌연변이 N233K를 함유하는 써모페타제 변이체를 나타내고; “TNK + X”는 신경망 분석에 의해 예측된 돌연변이들 중 하나를 함유하는 TNK 변이체를 나타내고; "듀라"는 돌연변이 L117F, Q119Y, T140D, W159H, G165A, I168R, A180I, S188Q, S214H, R280A를 함유하는 듀라페타제를 나타내며; "DNK"는 돌연변이 N233K를 함유하는 듀라페타제 변이체를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 7은 신경망 분석에 의해 예측된 일련의 돌연변이, 써모페타제 및 듀라페타제를 함유하는 TNK(돌연변이 S121E, D186H, R280A 및 N233K를 함유하는 Is페타제 변이체) 변이체의 PET 분해 활성을 상이한 온도에서 TNK와 비교하여 보여주는 막대 그래프이다. 기질로서 PET 필름을 사용하였고, 200 nM의 효소 농도에서 야생형 Is페타제 변이체의 가수분해 활성을 측정하였다. 검정 반응물을 30, 40, 50 또는 55°C에서 96시간 동안 배양하였다. 효소 처리 전후의 PET 필름 샘플을 비교하여 생성된 페타제 처리 필름의 질량 손실을 측정하였다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "TNK"는 돌연변이 N233K를 함유하는 써모페타제 변이체를 나타내고; “TNK + X”는 신경망 분석에 의해 예측된 돌연변이들 S58E, N114T, N225C, M262L, T270V, T67D, Q91I, S121E, T67D, Q91I, S61T, I208V, S58A 및 R224Q 중 하나를 함유하는 TNK Net 단일 변이체를 나타내고; "듀라"는 돌연변이 L117F, Q119Y, T140D, W159H, G165A, I168R, A180I, S188Q, S214H, R280A를 함유하는 듀라페타제를 나타내며; "DNK"는 돌연변이 N233K를 함유하는 듀라페타제 변이체를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 8은 야생형 Is페타제(서열번호 1)와 비교하여, WT Is페타제의 결정학적 구조를 기초로 신경망 모델링에 의해 예측되는 10개의 선택된 치환을 포함하는 WT NET(서열번호 5), 및 써모페타제의 결정학적 구조를 기초로 신경망 모델링에 의해 예측되는 6개의 선택된 치환을 포함하는 써모 NET(서열번호 5)의 아미노산 서열의 정렬이다. 돌연변이체 서열에서의 변형이 강조되어 있다.
도 9a-도 9c: 기계 학습 유도 예측은 다양한 페타제 스캐폴드에 대해 개선된 효소 성능을 부여하였다. 9a. 뮤트컴퓨트(Mutcompute)의 출력에 의해 제공된 야생형 페타제 단백질 구조. 페타제의 각각의 아미노산 잔기는 뮤트컴퓨트에 의해 평가되어, 이웃하는 화학적 미세환경과 각각의 20개의 아미노산의 화학적 일치를 반영하는 확률 분포를 생성하였다. 낮은 야생형 확률(선호되지 않음)이 할당된 잔기는 적색인 반면, 높은 야생형 확률(선호됨)이 할당된 잔기는 청색이다. 본 연구에서 활용된 두 결정 구조 모두에 대한 뮤트컴퓨트의 대화형 시각화는 https://www.mutcompute.com/petase/5xjh 및 https://www.mutcompute.com/petase/6ij6에서 공개적으로 입수 가능하다. 9b. 뮤트컴퓨트에 의해 예측되는 4가지 주요 돌연변이의 미세환경. 9c. 뮤트컴퓨트에 의해 예측되는 돌연변이의 하향 선택(down-selection)의 개략도 및 하향 선택된 돌연변이에 의한 돌연변이유발을 통해 생성된 변이체의 효소적 성능의 비교. 야생형 페타제 및 써모페타제 둘 모두의 결정 구조를 갖는 뮤트컴퓨트를 실시함으로써, 예측의 2개의 라이브러리가 생성되었다. 그런 다음, 예측은 예측한 아미노산과 야생형 아미노산 사이의 확률의 배수 변화에 의해 순위를 매겼다. 단계적 조합 전략을 사용하여, 단일 또는 다수의 예측된 돌연변이를 다양한 페타제 스캐폴드에 혼입시켜 159개의 변이체를 생성하였다. 변이체의 실험적 특성화를 통해, 4개의 주요 돌연변이를 하향 선택하고, 3개의 페타제 스캐폴드: 야생형 페타제(WT), 써모페타제(써모), 및 듀라페타제(듀라)에 걸쳐 조합에 의해 조립하여, 모든 가능한 조합을 생성하였다. 히트맵(heatmap)은 생성된 변이체의 PET-가수분해 활성 및 변이체 각각의 스캐폴드에 걸친 활성의 배수 변화를 나타낸다. PET-가수분해 활성은 96시간의 반응 시간 후에 페타제 변이체에 의해 gf-PET 필름을 가수분해하여 방출된 PET 단량체(TPA와 MHET의 합)의 양을 측정함으로써 평가하였다. 상기 도면에 표시된 모든 효소에 대해 KH2PO4-NaOH(pH8) 완충액을 사용하였다. 모든 측정은 3회 실시하였다(n=3).
도 10은 ατASE의 PET-가수분해 활성은 온화한 온도 및 적당한 pH에서 다양한 PHEs를 능가하였다. 반응 온도 40°C에서 pH 범위(6.5~8.0)에 걸친 알파(α)페타제, 야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라), 베타(β)페타제, LCC 및 ICCM에 대한 PET-가수분해 활성의 비교. PET-가수분해 활성은 96시간의 반응 시간 후 시험된 PHEs에 의해 가수분해 중인 gf-PET 필름으로부터 방출된 PET 단량체(TPA와 MHET의 합)의 양을 측정함으로써 평가하였다. 모든 측정은 3회 실시하였다(n=3).
도 11a-도 11d는 소비 이후의 PET 플라스틱 및 폴리에스테르 제품의 효소 해중합에서 알파페타제의 우수한 성능을 도시한다. 11a. 51개의 소비 이후의 플라스틱 제품으로부터 구멍 뚫린 pc-PET 필름의 완전한 분해. 11b. 반응 온도 50°C에서 알파페타제, 야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라), 베타페타제, LCC 및 ICCM에 대한 PET-가수분해 활성의 시간 경로. PET-가수분해 활성은 다양한 시점에서 시험된 PHEs에 의해 가수분해 중인 pc-PET 필름(콩깻묵 플라스틱 용기)으로부터 방출된 PET 단량체(TPA와 MHET의 합)의 양을 측정함으로써 평가하였다. 상기 도면에 표시된 모든 효소에 대해 KH2PO4-NaOH(pH8) 완충액을 사용하였다. 모든 측정은 3회 실시하였다(n=3). 11c. αPEΤase를 사용한 다양한 노출 시간 후의 pc-PET 필름의 원자력 현미경 이미지. 11d. 50°C에서 알파페타제를 사용한 대형 미처리 PET 용기의 완전한 분해. 50°C에서 알파페타제, 야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라), 베타페타제, LCC 및 ICCM을 사용한 상업적 폴리에스테르 제품의 분해.
도 12a-도 12c는 PET의 효소-화학적 재순환 및 원위치(in situ) 생물적 환경 정화에서 알파페타제의 응용. 12a. 알파페타제 및 화학적 중합에 의한 사용 후 플라스틱 폐기물 해중합을 포함하는 폐쇄된 루프 PET 재순환 공정의 개략도. 재생된 미사용 PET의 결정도는 시차 주사 열량계에 의해 58%로 결정되었다. 12b. P. 푸티다(putida) Go19 및 외인성 PHEs: 알파페타제, 야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라), 베타페타제, LCC 및 ICCM을 조합한 동시 공정. PHE(알파페타제/WT/써모/듀라/베타페타제/LCC/ICCM) & GO19는 P. 푸티다 Go 19를 사용한 PHE의 동시 공정을 나타내는 반면, PHE는 효소가 P. 푸티다 Go 19 없이 제공되는 조절 조건을 나타낸다. 유리된 PET 단량체, pc-PET 필름의 질량 손실, 및 P. 푸티다 Go19의 세포 밀도를 96시간의 인큐베이션 후에 측정하였다. 모든 측정은 3회 실시하였다(n=3). 12c. 알파페타제/WT/써모/듀라/베타페타제를 분비할 수 있는 P. 푸티다 Go19 균주의 통합된 공정. 유리된 PET 단량체, pc-PET 필름의 질량 손실, 및 P. 푸티다 Go19의 세포 밀도를 120시간의 인큐베이션 후에 측정하였다. 모든 측정은 3회 실시하였다(n=3).
도 13 | 뮤트컴퓨트에 의해 예측된 돌연변이 및 이들 각각의 스캐폴드-야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라)을 포함하는 페타제 변이체의 열안정성. 각 효소의 용융 온도는 시차 주사 열량계에 의해 결정되었다. 모든 측정은 3회 실시하였다(n=3).
도 14 | 질량, 결정도%, 및 αPEΤase에 의한 다양한 pc-PET 필름의 완전한 분해 시간. 순환하는 pc-PET 필름(직경 6 mm)을 지역 식료품 가맹점(월마트, 코스트코, 및 HEB)에서 입수가능한 식품, 음료, 약품, 사무용품, 생활용품 및 화장품의 포장에 사용되는 51개의 상이한 사용 후 플라스틱 제품으로부터 구멍을 뚫었다. pc-PET 필름을 50°C에서 알파페타제로 일련의 처리를 실시하여 필름이 분해될 때까지 가수분해하였다. 효소 용액(100 mM KH2PO4-NaOH(pH8) 완충액 중 200 nM의 알파페타제)을 24시간마다 보충하였다. 원형의 pc-PET 필름의 결정도%는 시차 주사 열량계에 의해 결정되었다. 필름의 초기 질량을 디지털 저울에 의해 중량 측정으로 결정하였다. DSC 및 중량 측정 둘 모두를 3회 실시하였다. 평균 ± s.d. (n=3)이 도시되어 있다.
도 2는 야생형 Is페타제와 비교하여 신경망 분석에 의해 예측되는 일련의 돌연변이, 비활성화 Is페타제, 및 써모페타제를 함유하는 Is페타제 변이체의 PET 분해 활성을 나타내는 막대 그래프이다. 기질로서 PET 필름을 사용하였고, 200 nM의 효소 농도에서 야생형 Is페타제 및 이의 변이체의 가수분해 활성을 측정하였다. 검정 반응물을 40°C에서 96시간 동안 배양하였다. 효소 처리 전후의 PET 필름 샘플을 비교하여 생성된 페타제 처리 필름의 질량 손실을 측정하였다. 생성된 페타제-처리된 필름의 사진은 Is페타제 변이체의 상이한 분해 활성으로 인해 상이한 표면 부식의 정도를 나타낸다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "데드"는 이의 효소 기능을 상실하도록 돌연변이(S160A)된 비활성화 Is페타제를 나타내고; "WT"는 야생형 Is페타제를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 3은 야생형 Is페타제와 비교하여 더 높은 PET 분해 활성을 나타내는 초기 예측된 신경망 돌연변이 7종의 잔기 현장을 도시한다.
도 4는 야생형 Is페타제와 비교하여 Is페타제 변이체의 에스터라제 활성을 나타낸 바 그래프이다. 야생형 Is페타제 및 이의 변이체의 에스터라제 활성은 레소루핀 부티레이트 검정에 의해 측정된다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "TNK"는 돌연변이 N233K를 함유하는 써모페타제 변이체를 나타내고; "듀라(Dura)"는 돌연변이 L117F, Q119Y, T140D, W159H, G165A, I168R, A180I, S188Q, S214H, R280A를 함유하는 듀라페타제를 나타내고; "DNK"는 돌연변이 N233K를 함유하는 듀라페타제 변이체를 나타내며; “WT”는 야생형 Is페타제를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 5는 상이한 온도에서 Is페타제 변이체의 PET 분해 활성을 나타낸 막대 그래프이다. 기질로서 PET 필름을 사용하였고, 200 nM의 효소 농도에서 야생형 Is페타제 변이체의 가수분해 활성을 측정하였다. 검정 반응은 30 및 40°C에서 96시간, 50°C에서 48시간 동안 배양하였다. 효소 처리 전후의 PET 필름 샘플을 비교하여 생성된 페타제 처리 필름의 질량 손실을 측정하였다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "TNK"는 돌연변이 N233K를 함유하는 써모페타제 변이체를 나타내고; "듀라"는 돌연변이 L117F, Q119Y, T140D, W159H, G165A, I168R, A180I, S188Q, S214H, R280A를 함유하는 듀라페타제를 나타내며; "DNK"는 돌연변이 N233K를 함유하는 듀라페타제 변이체를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 6은 신경망 분석에 의해 예측된 일련의 돌연변이, 써모페타제 및 듀라페타제를 함유하는 TNK(돌연변이 S121E, D186H, R280A 및 N233K를 함유하는 Is페타제 변이체) 변이체의 에스터라제 활성을 TNK와 비교하여 보여주는 막대 그래프이다. 써모페타제, 듀라페타제, TNK 및 이의 변이체의 에스터라제 활성은 레소루핀 부티레이트 검정에 의해 측정된다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "TNK"는 돌연변이 N233K를 함유하는 써모페타제 변이체를 나타내고; “TNK + X”는 신경망 분석에 의해 예측된 돌연변이들 중 하나를 함유하는 TNK 변이체를 나타내고; "듀라"는 돌연변이 L117F, Q119Y, T140D, W159H, G165A, I168R, A180I, S188Q, S214H, R280A를 함유하는 듀라페타제를 나타내며; "DNK"는 돌연변이 N233K를 함유하는 듀라페타제 변이체를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 7은 신경망 분석에 의해 예측된 일련의 돌연변이, 써모페타제 및 듀라페타제를 함유하는 TNK(돌연변이 S121E, D186H, R280A 및 N233K를 함유하는 Is페타제 변이체) 변이체의 PET 분해 활성을 상이한 온도에서 TNK와 비교하여 보여주는 막대 그래프이다. 기질로서 PET 필름을 사용하였고, 200 nM의 효소 농도에서 야생형 Is페타제 변이체의 가수분해 활성을 측정하였다. 검정 반응물을 30, 40, 50 또는 55°C에서 96시간 동안 배양하였다. 효소 처리 전후의 PET 필름 샘플을 비교하여 생성된 페타제 처리 필름의 질량 손실을 측정하였다. "써모"는 돌연변이 S121E, D186H 및 R280A를 함유하는 써모페타제를 나타내고; "TNK"는 돌연변이 N233K를 함유하는 써모페타제 변이체를 나타내고; “TNK + X”는 신경망 분석에 의해 예측된 돌연변이들 S58E, N114T, N225C, M262L, T270V, T67D, Q91I, S121E, T67D, Q91I, S61T, I208V, S58A 및 R224Q 중 하나를 함유하는 TNK Net 단일 변이체를 나타내고; "듀라"는 돌연변이 L117F, Q119Y, T140D, W159H, G165A, I168R, A180I, S188Q, S214H, R280A를 함유하는 듀라페타제를 나타내며; "DNK"는 돌연변이 N233K를 함유하는 듀라페타제 변이체를 나타낸다. 모든 샘플은 정제된 단백질 샘플이고 단백질 농도로 정규화된다.
도 8은 야생형 Is페타제(서열번호 1)와 비교하여, WT Is페타제의 결정학적 구조를 기초로 신경망 모델링에 의해 예측되는 10개의 선택된 치환을 포함하는 WT NET(서열번호 5), 및 써모페타제의 결정학적 구조를 기초로 신경망 모델링에 의해 예측되는 6개의 선택된 치환을 포함하는 써모 NET(서열번호 5)의 아미노산 서열의 정렬이다. 돌연변이체 서열에서의 변형이 강조되어 있다.
도 9a-도 9c: 기계 학습 유도 예측은 다양한 페타제 스캐폴드에 대해 개선된 효소 성능을 부여하였다. 9a. 뮤트컴퓨트(Mutcompute)의 출력에 의해 제공된 야생형 페타제 단백질 구조. 페타제의 각각의 아미노산 잔기는 뮤트컴퓨트에 의해 평가되어, 이웃하는 화학적 미세환경과 각각의 20개의 아미노산의 화학적 일치를 반영하는 확률 분포를 생성하였다. 낮은 야생형 확률(선호되지 않음)이 할당된 잔기는 적색인 반면, 높은 야생형 확률(선호됨)이 할당된 잔기는 청색이다. 본 연구에서 활용된 두 결정 구조 모두에 대한 뮤트컴퓨트의 대화형 시각화는 https://www.mutcompute.com/petase/5xjh 및 https://www.mutcompute.com/petase/6ij6에서 공개적으로 입수 가능하다. 9b. 뮤트컴퓨트에 의해 예측되는 4가지 주요 돌연변이의 미세환경. 9c. 뮤트컴퓨트에 의해 예측되는 돌연변이의 하향 선택(down-selection)의 개략도 및 하향 선택된 돌연변이에 의한 돌연변이유발을 통해 생성된 변이체의 효소적 성능의 비교. 야생형 페타제 및 써모페타제 둘 모두의 결정 구조를 갖는 뮤트컴퓨트를 실시함으로써, 예측의 2개의 라이브러리가 생성되었다. 그런 다음, 예측은 예측한 아미노산과 야생형 아미노산 사이의 확률의 배수 변화에 의해 순위를 매겼다. 단계적 조합 전략을 사용하여, 단일 또는 다수의 예측된 돌연변이를 다양한 페타제 스캐폴드에 혼입시켜 159개의 변이체를 생성하였다. 변이체의 실험적 특성화를 통해, 4개의 주요 돌연변이를 하향 선택하고, 3개의 페타제 스캐폴드: 야생형 페타제(WT), 써모페타제(써모), 및 듀라페타제(듀라)에 걸쳐 조합에 의해 조립하여, 모든 가능한 조합을 생성하였다. 히트맵(heatmap)은 생성된 변이체의 PET-가수분해 활성 및 변이체 각각의 스캐폴드에 걸친 활성의 배수 변화를 나타낸다. PET-가수분해 활성은 96시간의 반응 시간 후에 페타제 변이체에 의해 gf-PET 필름을 가수분해하여 방출된 PET 단량체(TPA와 MHET의 합)의 양을 측정함으로써 평가하였다. 상기 도면에 표시된 모든 효소에 대해 KH2PO4-NaOH(pH8) 완충액을 사용하였다. 모든 측정은 3회 실시하였다(n=3).
도 10은 ατASE의 PET-가수분해 활성은 온화한 온도 및 적당한 pH에서 다양한 PHEs를 능가하였다. 반응 온도 40°C에서 pH 범위(6.5~8.0)에 걸친 알파(α)페타제, 야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라), 베타(β)페타제, LCC 및 ICCM에 대한 PET-가수분해 활성의 비교. PET-가수분해 활성은 96시간의 반응 시간 후 시험된 PHEs에 의해 가수분해 중인 gf-PET 필름으로부터 방출된 PET 단량체(TPA와 MHET의 합)의 양을 측정함으로써 평가하였다. 모든 측정은 3회 실시하였다(n=3).
도 11a-도 11d는 소비 이후의 PET 플라스틱 및 폴리에스테르 제품의 효소 해중합에서 알파페타제의 우수한 성능을 도시한다. 11a. 51개의 소비 이후의 플라스틱 제품으로부터 구멍 뚫린 pc-PET 필름의 완전한 분해. 11b. 반응 온도 50°C에서 알파페타제, 야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라), 베타페타제, LCC 및 ICCM에 대한 PET-가수분해 활성의 시간 경로. PET-가수분해 활성은 다양한 시점에서 시험된 PHEs에 의해 가수분해 중인 pc-PET 필름(콩깻묵 플라스틱 용기)으로부터 방출된 PET 단량체(TPA와 MHET의 합)의 양을 측정함으로써 평가하였다. 상기 도면에 표시된 모든 효소에 대해 KH2PO4-NaOH(pH8) 완충액을 사용하였다. 모든 측정은 3회 실시하였다(n=3). 11c. αPEΤase를 사용한 다양한 노출 시간 후의 pc-PET 필름의 원자력 현미경 이미지. 11d. 50°C에서 알파페타제를 사용한 대형 미처리 PET 용기의 완전한 분해. 50°C에서 알파페타제, 야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라), 베타페타제, LCC 및 ICCM을 사용한 상업적 폴리에스테르 제품의 분해.
도 12a-도 12c는 PET의 효소-화학적 재순환 및 원위치(in situ) 생물적 환경 정화에서 알파페타제의 응용. 12a. 알파페타제 및 화학적 중합에 의한 사용 후 플라스틱 폐기물 해중합을 포함하는 폐쇄된 루프 PET 재순환 공정의 개략도. 재생된 미사용 PET의 결정도는 시차 주사 열량계에 의해 58%로 결정되었다. 12b. P. 푸티다(putida) Go19 및 외인성 PHEs: 알파페타제, 야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라), 베타페타제, LCC 및 ICCM을 조합한 동시 공정. PHE(알파페타제/WT/써모/듀라/베타페타제/LCC/ICCM) & GO19는 P. 푸티다 Go 19를 사용한 PHE의 동시 공정을 나타내는 반면, PHE는 효소가 P. 푸티다 Go 19 없이 제공되는 조절 조건을 나타낸다. 유리된 PET 단량체, pc-PET 필름의 질량 손실, 및 P. 푸티다 Go19의 세포 밀도를 96시간의 인큐베이션 후에 측정하였다. 모든 측정은 3회 실시하였다(n=3). 12c. 알파페타제/WT/써모/듀라/베타페타제를 분비할 수 있는 P. 푸티다 Go19 균주의 통합된 공정. 유리된 PET 단량체, pc-PET 필름의 질량 손실, 및 P. 푸티다 Go19의 세포 밀도를 120시간의 인큐베이션 후에 측정하였다. 모든 측정은 3회 실시하였다(n=3).
도 13 | 뮤트컴퓨트에 의해 예측된 돌연변이 및 이들 각각의 스캐폴드-야생형 페타제(WT), 써모페타제(써모), 듀라페타제(듀라)을 포함하는 페타제 변이체의 열안정성. 각 효소의 용융 온도는 시차 주사 열량계에 의해 결정되었다. 모든 측정은 3회 실시하였다(n=3).
도 14 | 질량, 결정도%, 및 αPEΤase에 의한 다양한 pc-PET 필름의 완전한 분해 시간. 순환하는 pc-PET 필름(직경 6 mm)을 지역 식료품 가맹점(월마트, 코스트코, 및 HEB)에서 입수가능한 식품, 음료, 약품, 사무용품, 생활용품 및 화장품의 포장에 사용되는 51개의 상이한 사용 후 플라스틱 제품으로부터 구멍을 뚫었다. pc-PET 필름을 50°C에서 알파페타제로 일련의 처리를 실시하여 필름이 분해될 때까지 가수분해하였다. 효소 용액(100 mM KH2PO4-NaOH(pH8) 완충액 중 200 nM의 알파페타제)을 24시간마다 보충하였다. 원형의 pc-PET 필름의 결정도%는 시차 주사 열량계에 의해 결정되었다. 필름의 초기 질량을 디지털 저울에 의해 중량 측정으로 결정하였다. DSC 및 중량 측정 둘 모두를 3회 실시하였다. 평균 ± s.d. (n=3)이 도시되어 있다.
본 개시는 야생형 효소와 비교하여 향상된 효소 활성을 나타내는 PET 가수분해효소(즉, 페타제)의 돌연변이체 형태를 제공한다. 본원에 기재된 Is페타제의 돌연변이체 형태는 더 넓은 범위의 온도에 걸쳐, 예컨대, 야생형 효소보다 더 낮은 온도에 걸쳐 촉매 활성뿐만 아니라 더 넓은 pH 범위에 걸쳐 개선된 활성을 유지할 수 있다.
예를 들어, 이데오넬라 사카이엔시스(Ideonella sakaiensis) Is페타제 야생형 서열(서열번호 1에 도시됨) 내 아미노산 잔기 N233, S58, N114, N225, M262, T270, 또는 T140을 리신(N233K), 글루탐산(S58E), 트레오닌(N114T), 시스테인(N225C), 류신(M262L), 발린(T270V), 또는 아스파르트산(T140D)을 이용하여 단일 치환하는 것은 야생형 효소와 비교하여 PET 분해 활성을 증가시키는 것으로 밝혀졌다. 이들 단일 돌연변이체 중에서, 돌연변이 N233K를 함유하는 Is페타제 변이체는 가장 큰 개선을 나타내었으며, 이는 PET 필름 분해 검정에서 40°C에서 야생형 Is페타제보다 대략 8.5배 더 높은 PET 분해 활성을 나타내었다.
또한, 2개의 공개된 Is페타제 변이체의 서열에서 아미노산 잔기 N233을(Cui, Ying-Lu et al., 2019. Computational Redesign of PETase for Plastic Biodegradation by GRAPE Strategy. https://doi.org/10.1101/787069; Son, Hyeoncheol Francis et al., 2019. “Rational Protein Engineering of Thermo-Stable PETase from Ideonella Sakaiensis for Highly Efficient PET Degradation.” ACS Catalysis 9 (4): 3519-26. https://doi.org/10.1021/acscatal.9b00568)― Is페타제S121E/D186H/R280A(본원에서는 “써모페타제”로 지칭됨) 및 Is페타제 L117F/ Q119Y/T140D/ W159H, G165A/ I168R/A180I/ S188Q/S214H/R280A(본원에서는 “듀라페타제”로 지칭됨) 리신(N233K)을 이용하여 치환하는 것이 써모페타제 및 듀라페타제와 비교하여 더 높은 열 안정성 및 PET 분해 활성의 증가를 발생시키는 것으로 밝혀졌다. 써모페타제 및 듀라페타제의 아미노산 서열은 서열번호 2 및 서열번호 3에 각각 나타낸다. 더 구체적으로, N233K의 아미노산 치환을 함유하는 써모페타제 변이체("TNK"로 표기되며, 이의 서열은 서열번호 4에 나타냄)는 50°C에서 써모페타제보다 대략 6.4배 더 높은 PET 분해 활성을 나타낸다.
또한, Is페타제 변이체-TNK 서열(서열번호 4에 나타냄) 내의 아미노산 잔기 S58, N114, N225, M262, T270, S61, I208, 또는 R224를 글루타민산(S58E) 또는 알라닌(S58A), 트레오닌(N114T), 시스테인(N225C), 류신(M262L), 발린(T270V), 트레오닌(S61T), 발린(I208V) 또는 글루타민(R224Q)을 이용하여 단일 치환하는 것이 TNK 효소와 비교하여 PET 분해 활성을 추가로 증가시키는 것으로 밝혀졌다. 구체적으로, R224Q의 아미노산 치환을 함유하는 TNK 변이체는 30, 40, 50 및 55°C 온도에서 TNK보다 높은 PET 분해 활성을 나타내었다.
본 개시는 대조군 PET 가수분해효소와 비교하여 특정 아미노산 변화를 갖는 조작된(즉, 비-천연) PET(폴리(에틸렌 테레프탈레이트)) 가수분해효소를 제공하여, 조작된 PET 가수분해효소가 대조군 PET 가수분해효소와 비교하여 특정 온도 또는 pH에서 개선된 열안정성, 개선된 활성, 또는 이들의 조합을 갖는다. 대조군 PET 가수분해효소는 인용된 돌연변이가 결여되지만 그렇지 않으면 동일한 PET 가수분해효소일 것이고, 전형적으로 돌연변이가 도입되는 PET 가수분해효소일 것이다.
실시예에서 논의된 바와 같이, 돌연변이는 여러 상이한 PET 가수분해효소 내로 삽입되었으며, 일반적으로 각각의 경우에 나타낸 활성의 개선이 있었다. 이에 따라, 본 개시는 서열번호 1 또는 서열번호 2 또는 서열번호 3과 실질적으로(예컨대, 적어도 70, 80, 90, 또는 95%) 동일하고 N233, S58, N114, S121, N225, M262, T270, T140, S61, I208, 및 R224로 이루어진 군으로부터 선택된 서열번호 1에 대한 위치에 대응하는 적어도 하나의 돌연변이를 갖는 아미노산 서열 내로 돌연변이 중 하나 이상의 도입을 제공한다. 일부 구현예들에서, 적어도 하나의 돌연변이는 N233K, S58E, S58A, N114T, S121E, N225C, M262L, T270V, T140D, S61T, I208V, 및 R224Q로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 적어도 하나의 돌연변이는 S58Y/M/L/V/P, S61D/E/Y/F, N114H/L/R/S/T, T140Y/L/I/V/S, I208M/H/F/Y/P/A, R224D/E/S/T/N/Q, N225N/I/V/M/A/L/S/T, N233R/Y/H/P, M262L/I/A/V/F/W, 및 T270Y/R/H의 군으로부터 선택된다.
일부 구현예들에서, 상기 PET 가수분해효소는 상기 기재된 돌연변이들 중 2, 3, 4, 5, 6, 7개 이상을 포함할 수 있다. 구체적으로 개시된 돌연변이의 예시적인 조합은 표 2에 기재된 것들을 포함하며, 이는 예를 들어, 서열번호 1, 서열번호 2 또는 서열번호 3과 실질적으로 실질적으로(예컨대, 적어도 70, 80, 90 또는 95%) 동일한 아미노산 서열에 도입될 수 있다. 예를 들어, 일부 구현예들에서, 상기 PET 가수분해효소는 N233 치환(예를 들어, 하지만 N233K에 제한되지는 않음) 및 S58, N114, N225, M262, T270, S61, I208, R224, R43, A240, 및 H186(예를 들어, 하지만 S58E, S58A, N114T, N225C, M262L, T270V, T140D, S61T, I208V, R224Q, R43K, A240C, or H186D 중 하나에 제한되지는 않음)에서 적어도 하나의 추가적인 치환을 포함한다. 예를 들어, 일부 구현예들에서, 상기 PET 가수분해효소는 N233 치환(예를 들어, 하지만 N233K에 제한되지는 않음) 및 R224 치환(예를 들어, 하지만 R224Q에 제한되지는 않음)을 포함한다. 일부 구현예들에서, 상기 열거된 치환들 중 임의의 것은 S121E/D186H/R280A 중 1개, 2개 또는 3개 모두와 조합될 수 있다.
예를 들어, 서열번호 1, 2, 또는 3과 적어도 95%, 98%, 99% 또는 다르게는 100% 동일한 아미노산 서열에 포함될 수 있는 예시적인 돌연변이체는 하기의: N233K(예컨대, 서열번호 1), S121E(예컨대, 서열번호 1), T140D(예컨대, 서열번호 1), R224Q(예컨대, 서열번호 1), N233K+S121E(예컨대, 서열번호 1), N233K+R224Q(예컨대, 서열번호 1), R224Q+S121E(예컨대, 서열번호 1), N233K+T140D(예컨대, 서열번호 1), R224Q+T140D(예컨대, 서열번호 1), S121E+T140D(예컨대, 서열번호 1), N233K+R224Q+S121E(예컨대, 서열번호 1), N233K+R224Q+T140D(예컨대, 서열번호 1), N233K+S121E+T140D(예컨대, 서열번호 1), R224Q+S121E+T140D(예컨대, 서열번호 1), N233K+R224Q+S121E+T140D(예컨대, 서열번호 1), N233K(예컨대, 서열번호 2), T140D(예컨대, 서열번호 2), R224Q(예컨대, 서열번호 2), N233K+T140D(예컨대, 서열번호 2), N233K+R224Q(예컨대, 서열번호 1 또는 2), R224Q+T140D(예컨대, 서열번호 2), N233K+R224Q+T140D(예컨대, 서열번호 2), N233K(예컨대, 서열번호 3) , S121E(예컨대, 서열번호 3), R224Q(예컨대, 서열번호 3), N233K+ R224Q(예컨대, 서열번호 3), N233K+ S121E(예컨대, 서열번호 3), R224Q+ S121E(예컨대, 서열번호 3), 또는 R224Q+S121E+N233K(예컨대, 서열번호 3)를 포함할 수 있지만, 이에 제한되지는 않는다.
예시적인 서열은 하기와 같은 서열번호 6 내지 서열번호 34를 포함하지만, 이에 제한되지는 않는다:
본 개시는 본원에 개시된 조작된 PET 가수분해효소, 예컨대, 서열번호 1 또는 서열번호 2 또는 서열번호 3과 실질적으로(예컨대, 적어도 70, 80, 90, 또는 95%) 동일하고 N233, S58, N114, S121, N225, M262, T270, T140, S61, I208, 및 R224로 이루어진 군으로부터 선택된 서열번호 1에 대한 위치에 대응하는 적어도 하나의 돌연변이를 갖는 아미노산 서열을 포함하는 PET 가수분해효소를 인코딩하는 핵산을 제공한다. 일부 구현예들에서, 핵산은 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 코딩 서열은 그것이 발현될 세포에 대해 코돈 최적화될 수 있다.
폴리펩티드를 인코딩하는 핵산은 재조합 유전학 분야에서 통상적인 기술을 사용하여 발현될 수 있다. 이러한 기술을 개시하는 기본 문헌은 Sambrook and Russell, Molecular Cloning, A Laboratory Manual (3rd ed. 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); and Current Protocols in Molecular Biology (Ausubel et al., eds., 1994-1999)을 포함한다. 폴리펩티드의 변형은 생물학적 활성을 감소시키지 않으면서 추가로 이루어질 수 있다. 도메인의 클로닝, 발현, 또는 통합을 용이하게 하기 위해 일부 변형이 이루어질 수 있다. 본원에 기재된 단백질은 당업자에게 일반적으로 공지된 표준 방법을 사용하여 제조될 수 있다. 대장균과 같은 원핵 세포 또는 다른 원핵 숙주를 포함하지만 이에 제한되지 않는 다양한 숙주 세포에서의 재조합 발현은 당업계에 일반적으로 공지되어 있다.
복합체 내의 원하는 단백질을 인코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 및 재조합 발현 벡터를 함유하는 숙주 세포뿐만 아니라 이러한 벡터 및 숙주 세포를 재조합 방법에 의해 제조하는 방법은 당업자에게 일반적으로 공지되어 있다.
폴리뉴클레오티드는 당업계에 일반적으로 공지된 기술에 의해 합성 또는 제조될 수 있다. 원하는 단백질을 인코딩하는 뉴클레오티드 서열은 당업자에게 공지된 기술에 따라 합성 및/또는 클로닝되고 발현될 수 있다. 일부 구현예들에서, 폴리뉴클레오티드 서열은 표준 방법론을 사용하여 특정 수용체에 대해 코돈 최적화될 것이다. 예를 들어, 단백질을 인코딩하는 DNA 구조체는 미생물 숙주, 예컨대, 효모 또는 박테리아에서의 발현을 위해 코돈 최적화될 수 있다.
유용한 박테리아의 예는 대장균(Escherichia), 엔터로박터(Enterobacter), 아조토박터(Azotobacter), 에르비니아(Erwinia), 바실루스(Bacillus), 슈도모나스(Pseudomonas), 클레브시엘라(Klebsielia), 프로테우스(Proteus), 살모넬라(Salmonella), 세라티아(Serratia), 시겔라(Shigella), 근류(Rhizobia), 비트레오스실라(Vitreoscill), 및 파라코커스(Paracoccus)를 포함하지만, 이에 제한되지는 않는다. 원하는 단백질을 인코딩하는 핵산은 각 숙주에 대해 적절한 발현 조절 서열에 작동가능하게 연결된다. 대장균의 경우, 이는, 예를 들어, 프로모터, 예컨대, T7, trp 또는 람다 프로모터, 리보솜 결합 부위 및 바람직하게는 전사 종결 신호를 포함할 수 있다. 단백질은 또한 포유동물, 곤충, 식물 또는 효모 세포와 같은 다른 세포에서 발현될 수 있다.
일부 구현예들에서, 폴리펩티드 구조체는, 예컨대, 검출 또는 정제의 목적을 위해 하나 이상의 친화성 태그를 함유한다. 다수의 적합한 태그는, 예를 들어, Kimple et al. (Curr Protoc Protein Sci. 2013; 73(1): 9.9.1-9.9.23)에 기재된 것들을 포함하여 폴리펩티드 구조체에 포함될 수 있다. 친화성 태그의 예는 칼모둘린 결합 펩티드(CBP), 키틴 결합 도메인(CBD), 디히드로엽산환원효소(DHFR) 모이어티, FLAG 에피토프, 글루타티온 S-트랜스퍼라제(GST) 태그, 헤마글루티닌(HA) 태그; 말토스 결합 단백질(MBP) 모이어티; Myc 에피토프; 폴리히스티딘 태그(예컨대, HHHHHH); 및 스트렙타비딘-결합 펩티드(예컨대, 미국 특허 제No. 5,506,121호에 기재된 것들)를 포함하지만, 이에 제한되지는 않는다. 친화성 태그는 폴리펩티드 구조체 내의 하나 이상의 위치에 포함될 수 있다. 스트렙타비딘-결합 펩티드와 같은 친화성 태그는, 예를 들어, 폴리펩티드 구조체의 N-말단 또는 폴리펩티드 구조체의 C-말단에 존재할 수 있다. 일부 구현예들에서, 링커 펩티드는 친화성 태그, 예컨대, 추가의 아미노산 잔기가 있거나 없는 서열 DYKDDDDDDK을 함유하는 FLAG 에피토프를 포함한다.
본원에 기재된 폴리펩티드는 세포 내에서 발현될 수 있거나 세포로부터 분비될 수 있다. 일부 구현예들, 신호 펩티드는 폴리펩티드가 세포로부터 분비되도록 발현된 폴리펩티드의 아미노 말단에 연결된다.
일단 발현되면, 폴리펩티드는 황산암모늄 침전, 친화성 칼럼, 칼럼 크로마토그래피, 겔 전기영동 등을 포함한 당업계의 표준 절차에 따라 정제될 수 있다(일반적으로 R. Scopes, Protein Purification, Springer-Verlag, N.Y. (1982), Deutscher, Methods in Enzymology Vol. 182: Guide to Protein Purification., Academic Press, Inc. N.Y. (1990)를 참조). 적어도 약 90 내지 95%의 균질성(예컨대, 98 내지 99% 이상의 균질성)의 실질적으로 순수한 조성물이 특정 구현예들에서 제공된다.
또한, 본원에 기재된 바와 같은 PET 플라스틱 디스크 및 하나 이상의 조작된 PET 가수분해효소를 포함하는 반응 혼합물, 및 효소와 함께 인큐베이션한 후 디스크의 질량 손실 백분율에 의해 측정되는 바와 같은 PET 플라스틱의 분해를 입증하기 위해 이러한 반응 혼합물을 사용하는 방법이 제공된다. 반응 혼합물에서 조작된 PET 가수분해효소는 정제된 형태일 수 있거나 숙주 세포에서 발현될 수 있다(즉, 효소를 발현하는 숙주 세포는 반응 혼합물에 있을 수 있다). 기재된 PET 가수분해효소의 일부 이점은 이들이 승온에서 개선된 활성을 나타낼 수 있는 동시에, 앞서 기재된 조작된 또는 천연 페타제보다 더 낮은 pH 조건 및 더 높은 활성 수준의 더 낮은 온도에서 플라스틱을 분해시킬 수 있는 이점을 갖는다는 것이다.
폴리에스테르 함유 물질의 분해에 필요한 시간은 폴리에스테르 함유 물질 자체(즉, 플라스틱 제품의 성질 및 기원, 이의 조성, 형상 등), 사용된 효소의 정확한 효소 및 양뿐만 아니라 다양한 공정 매개변수(즉, 온도, pH, 추가 작용제, 교반 등)에 따라 달라질 수 있다.
일부 구현예들에서, 분해 방법의 조건은 주위 온도, 예를 들어, 25~45°C의 온도를 포함한다. 이들 온도는 숙주 세포(예컨대, 박테리아 세포)가 PET 가수분해효소를 발현하고 숙주 세포가 반응 혼합물 내의 PET 플라스틱과 접촉되는 구현예에서 특히 유용할 수 있다. 세포에 의한 최적의 생존 및 효소 발현을 위한 정밀한 온도를 선택할 수 있다.
대안적으로, 일부 구현예들에서, PET 가수분해효소는 더 높은 온도, 예를 들어, 40~70°C 또는 45~65°C 또는 45~55°C에서 PET 플라스틱과 함께 인큐베이션된다.
일부 구현예들에서, 상기 온도는 분해되는 재료에서 PET 플라스틱의 유리 전이 온도(Tg) 미만으로 유지된다. 일부 구현예들에서, 상기 온도는 분해되는 재료에서 PET 플라스틱의 유리 전이 온도(Tg) 이상으로 유지된다. 일부 구현예들에서, 이러한 공정은 효소가 수회 사용 및/또는 재순환될 수 있는 온도에서 연속적인 방식으로 구현된다.
다양한 pH가 기재된 효소와 함께 사용될 수 있다. 일부 구현예들에서, 효소 및 PET 플라스틱은 6~10의 pH(예컨대, 6~8, 7~8.5, 또는 8~10) 하에서 반응한다. 예를 들어, 효소를 발현하는 세포가 플라스틱과 함께 인큐베이션되는 경우, 좀 더 중성의 pH 범위가 사용될 수 있다.
일부 구현예들에서, 이의 구조를 물리적으로 변화시키기 위해 PET 가수분해효소와 접촉되기 전에 전처리됨으로써, 플라스틱 함유 물질은 플라스틱과 PET 가수분해효소 사이의 접촉 표면을 증가시킬 수 있다.
선택적으로, 상기 해중합으로부터 생성되는 단량체 및/또는 올리고머는 순차적으로 또는 연속적으로 복원될 수 있다. 출발 플라스틱 함유 물질에 따라, 단일 유형의 단량체 및/또는 올리고머 또는 몇몇 상이한 유형의 단량체 및/또는 올리고머가 복원될 수 있다.
일부 구현예들에서, 본원에 기재된 바와 같은 하나 이상의 PET 가수분해효소는 플라스틱 생성물을 분해하기 위해 제2 효소와(동시에 또는 순차적으로) 조합된다. 예를 들어, 일부 구현예들에서, 제2 효소는 MHETase 효소이다(예를 들어, Palm et al., Nat Commun. 10: 1717 (2019)를 참조).
복원된 단량체 및/또는 올리고머는 모든 적합한 정제 방법을 사용하여 추가로 정제되고 재중합성 형태로 컨디셔닝(conditioning)될 수 있다. 정제 방법의 예는 스트리핑(stripping) 공정, 수용액에 의한 분리, 증기 선택적 응축, 바이오공정 후 매질의 여과 및 농축, 분리, 증류, 진공 증발, 추출, 전기투석, 흡착, 이온 교환, 침전, 결정화, 농축 및 산 첨가 탈수 및 침전, 나노여과, 산 촉매 처리, 반 연속 모드 증류 또는 연속 모드 증류, 용매 추출, 증발 농도, 증발 결정화, 액체/액체 추출, 수소화, 공비 증류 공정, 흡착, 컬럼 크로마토그래피, 단순 진공 증류 및 미세여과(조합 또는 미조합)를 포함한다. 대안적으로, 복원된/유리된 단량체는 일련의 생성물의 제조를 위한 탄소 공급원으로서 사용되도록 세포에 의해 (명시적 복원을 갖거나 갖지 않고) 사용될 수 있다. 이는 세포를 플라스틱 및 효소와 공동-인큐베이션하거나 또는 순차적 과정으로 달성될 수 있다.
하기의 실시예는 본 발명의 양태를 예시하며, 이를 제한하도록 의도되지 않는다.
실시예
실시예 1: 신경망 분석에 의해 예측되는 돌연변이
Is페타제의 열적 안정성을 추가로 개선시키기 위해, 본 발명가들은 더 높은 적합성을 가진 Is페타제 변이체를 설계하기 위한 구조 기반 딥러닝 인공지능(A.I.) 모델을 도입하였다(Shroff, Raghav et al., 2019. “A Structure-Based Deep Learning Framework for Protein Engineering.” BioRxiv, January, 833905. https://doi.org/10.1101/833905). 이 3D 컨볼루션 신경망 A.I. 모델은 아미노산 잔기와 이의 주변 화학 환경 사이의 정확한 연관성을 학습하도록 훈련되었다. 단백질 구조에서 불리한 아미노산 잔기를 식별하고 최상의 치환을 예측하여 전체적인 단백질 접힘 및 기능을 개선할 수 있다. Is페타제 및 PET 필름 분해 검정의 신경망 분석을 통해, 본 발명자들은 Is페타제의 PET 분해 활성을 촉진할 수 있는 점 돌연변이를 식별하였다.
야생형 페타제의 열안정성을 개선하기 위해, 3D 컨볼루션 신경망 A.I. 모델(Shroff et al. 2019)이 더 높은 적합성을 갖는 Is페타제 변이체를 재설계하기 위해 적용되었다. 먼저, 야생형 Is페타제에 대해 신경망 분석을 실시하였다. RCSB 단백질 데이터 뱅크(Protein Data Bank(PDB): 6EQE, 5XG0, 5XJH)에 기탁된 야생형 Is페타제의 결정학적 구조를 사용하여, 불리한 야생형 아미노산 잔기가 식별되고, 효소의 전체 적합성을 촉진할 수 있는 아미노산 잔기로 대체되는 것으로 제안된다. 그 결과, N233K, S58E, N114T, N225C, M262L, T270V, 또는 T140D, S121E, T67D, 및 Q91I를 포함하는 10개의 아미노산 치환이 야생형 Is페타제의 돌연변이유발을 위해 선택되었다(표 1). 이어서, RCSB 단백질 데이터 뱅크(PDB: 6iJ6)에 기탁된 이의 결정학적 구조를 사용하여 써모페타제에 대한 신경망 분석을 실시하였다. 그 결과, 10개의 아미노산 치환을 신경망 모델에 의해 예측하였다(표 1). 이들 두 세트의 예측에서의 중복 돌연변이 및 TNK 효소에 존재하는 돌연변이를 제외하고, S58E, N114T, N225C, M262L, T270V, T67D, Q91I, S121E, T67D, Q91I, S61T, I208V, S58A 및 R224Q를 포함하는 11개의 아미노산 치환을 TNK 효소의 돌연변이유발을 위해 추가로 선택하였다.
단일 또는 다중 신경망 돌연변이(들)를 상이한 유전자 배경(WT Is페타제, 써모페타제, 듀라페타제)에 도입하였다. 표 2는 생성되고 특성화된 돌연변이체의 목록이다. "√" 마크는 WT Is페타제, 써모페타제, 또는 듀라페타제 배경에서 특이적 돌연변이(들)의 돌연변이체들이 생성되었음을 나타낸다. "+" 마크는 이의 각각의 이전 효소와 비교하여 PET 분해 활성의 개선을 나타낸 돌연변이체를 강조한다. 표 3에서는 다양한 효소반응 온도에서 PET 분해 활성이 개선된 모든 돌연변이체를 정리하였다. "+" 마크는 특정 온도에서 이의 각각의 이전 효소와 비교하여 PET 분해 활성의 개선을 나타낸 돌연변이체를 강조한다. 이와 대조적으로, "-" 마크는 특정 온도에서 이의 각각의 이전 효소와 비교하여 PET 분해 활성의 개선 또는 저하를 나타내지 않은 돌연변이체를 강조한다.
표 1
표 2
표 3
실시예 2:
이데오넬라 사카이엔시스
201-F6
Is
페타제 유전자의 클로닝
슈도모나스 푸티다(Pseudomonas putida) KT2440에서 Is페타제의 분비를 가능하게 하기 위해, 슈도모나스 스투트제리(Pseudomonas stutzeri) MO-19(Fujita, M et al., 1989. “Cloning and Nucleotide Sequence of the Gene (AmyP) for Maltotetraose-Forming Amylase from Pseudomonas Stutzeri MO-19.” Journal of Bacteriology. https://doi.org/10.1128/jb.171.3.1333-1339.1989)의 말토테트라오스-형성 아밀라아제로부터 신호 펩티드 SPpstu(21개 아미노산)의 뉴클레오티드 서열을 사용하여 Is페타제의 원래 신호 펩티드 서열(처음 27개 아미노산) 치환함으로써 클로닝을 위한 합성 유전자를 생성하였다. N-말단에 SPpstu가 존재하는 Is페타제 유전자를 상기 합성 유전자를 주형으로 한 중합효소 연쇄반응(polymerase chain reaction, PCR)으로 증폭하였다. 이어서, 깁슨 어셈블리(Gibson Assembly) 방법을 이용하여, PCR 생성물을 변형된 pBTK552 벡터(Leonard, Sean P., et al. 2018. “Genetic Engineering of Bee Gut Microbiome Bacteria with a Toolkit for Modular Assembly of Broad-Host-Range Plasmids.” ACS Synthetic Biology. https://doi.org/10.1021/acssynbio.7b00399)에 서브클로닝하였고, 여기에서 항생제 내성 마커는 스펙티노마이신에서 카나마이신 내성 유전자로 전환되었다. 전기천공 적격(electrocompetent) 세포 대장균(Escherichia coli) DH10β를 표준 전기천공 프로토콜에 따라 깁슨 어셈블리 생성물로 형질전환시켰다. 생성된 발현 플라스미드(pLH2로 지정됨) DNA를 QIAprep Spin Miniprep 키트(Qiagen)를 사용하여 클로닝 숙주의 밤새 배양물로부터 추출하였다. 추출된 플라스미드의 DNA 서열을 생어 서열분석(Sanger sequencing)에 의해 확인하였다. P. 푸티다 KT2440의 전기천공 적격 세포를 생성된 발현 플라스미드 pLH2로 형질전환시켰다.
실시예 3:
Is
페타제 단백질 발현 및 정제
발현 플라스미드 pLH2를 보유하는 P. 푸티다 KT2440 균주의 단일 집락을 50 μg/ml 카나마이신을 포함하는 2 ml의 루리아 베르타니 브로쓰(Luria Bertani broth, LB) 배지에 접종하고, 30°C/225 rpm에서 밤새 성장시켰다. 밤새 배양한 배양물(150 μl 사용)을 500-ml 진탕 플라스크에서 1000배 희석액으로 확장하고, 37°C/225 rpm에서 0.6(광학 밀도[OD600])의 세포 밀도로 성장시켰다. 이소프로필 β-D-1-티오갈락토피라노사이드(IPTG) 0.2 mM을 첨가하여 단백질 발현을 유도하고, 세포를 30°C/225 rpm에서 24시간 동안 배양하였다.
분비된 Is페타제의 분리를 위해, 유도된 세포 배양물을 14,000 g에서 10분간 원심분리하여 분비 단백질을 수용하는 상등액을 수득하였다. 상청액을 제조사의 지침에 따라 HisPur™ Ni-NTA Resin(Thermo Fisher Scientific)으로 정제하였다. 단백질 용출의 탈염은 Sephadex G-25 PD-10 컬럼(GE Healthcare)을 이용하여 제조사의 지침에 따라 실시하였다. 모든 정제 및 탈염 단계는 차가운 방에서 4°C에서 실시하였다. 그 후, 정제된 단백질을 Amicon® Ultra Centrifugal Filters 장치(50 ml, 10KDa 컷오프)로 농축하고, 둘베코 인산염 완충 식염수(Dulbecco's Phosphate Buffered Saline, pH 7.0)에 보존하였다. 단백질 농도는 Coomassie Plus Bradford Assay 키트(Thermo Fisher Scientific)를 사용하여 측정하였다.
실시예 4: 이데오넬라 사카이엔시스 201-F6
Is
페타제 변이체 유전자의 클로닝
신경망 모델링에 의해 예측되는 단일 점 돌연변이를 갖는 Is페타제 변이체를 생성하기 위해, Q5® 부위-지정 돌연변이유발 키트(New England Biolabs)에 기재된 PCR 방법을 사용하여 부위-지정 돌연변이유발을 실시하였다. 플라스미드 pLH2를 돌연변이유발 PCR 반응을 위한 주형으로 사용하였다. 대응하는 프라이머 서열 및 어닐링 온도를 NEBaseChanger™ 도구를 사용하여 설계 및 생성하였다. Stellar™ Competent Cells(Clontech Laboratories)를 클로닝 숙주로 사용하였고 제조자의 지침에 제공된 열 충격 방법을 사용하여 결찰된 플라스미드로 형질전환시켰다. 플라스미드 추출, 서열분석, 및 Is페타제 변이체를 인코딩하는 플라스미드를 갖는 P. 푸티다 KT2440으로의 형질전환을 플라스미드 pLH2에 대해 실시예 2에 기재된 바와 동일한 조건하에 실시하였다.
실시예 5:
Is
페타제 변이체 단백질 발현 및 정제
Is페타제 변이체의 발현 및 정제를 Is페타제 단백질에 대해 실시예 3에 기재된 바와 동일한 조건하에서 실시하였다.
실시예 6: 레조루핀 부티레이트를 이용한 에스테라제 활성 분석의 시험관내 분석
레조루핀 부티레이트 에스테르에 대한 효소 활성을 비교하기 위해, 200 mM 정제된 효소를 실온에서 100 mM 인산 완충액(pH 8.0) 중 10 mM 레조루핀 부티레이트(시그마-알드리치)와 함께 인큐베이션하였다. 더 구체적으로, 정제된 효소를 먼저 100 mM 인산 완충액으로 희석시켜 200 nM의 최종 농도를 수득하였다. 이어서, 각각의 희석된 효소 샘플 10 μl를 96-웰 백 폴리스티렌 마이크로티터 플레이트(Costar 3603, Corning)의 웰에 피펫팅하였다. 각 샘플 웰에 90 μl의 검정 시약-레소루핀 부티레이트를 첨가하고, 즉시 Infinite 200® PRO 마이크로플레이트 판독기(Tecan Group AG)에 의해 10분 동안 레소루핀의 형광의 연속 측정(Ex/Em = 535/588 nm)에 의해 검정 반응을 개시하였다.
실시예 7: 상업적 PET 필름을 사용한 PET 분해 활성의 시험관내 분석
Is페타제 및 이의 효소 변이체에 의한 PET의 분해 속도를 평가하기 위해, 상업적 PET 필름(Goodfellow, U.S. 577-529-50; 사양: 1.3-1.4 g cm-3 밀도, 1.58-1.64 굴절률, 100x10-13 cm3. cm cm-2 s-1 Pa-1 투수성 @25°C, 20-80 x10-6 K-1 열팽창계수, 0.13-0.15 W m-1 K-1 @23°C 열전도도)을 정제된 Is페타제 효소 및 이의 변이체가 P. 푸티다로부터 분비되는 분해 검정을 위한 기질로서 사용하였다. PET 필름은 직경 6 mm의 순환하는 형태로 제조하여 1% SDS, 20% 에탄올 및 탈이온수로 3회 세척하였다. 이어서, 상기 필름을 50 mM pH 9.0 글리신-NaOH 완충액 중의 200 nM의 정제된 Is페타제를 함유하는 유리 시험관에 첨가하였다. 그런 다음, 반응 혼합물을 30/40/50/55°C에서 48/96시간 동안 인큐베이션하였다. 이어서, 생성된 페타제 처리된 필름을 다시 3회 세척하고, 중량 측정 전에 샘플을 30°C에서 24시간 동안 진공하에 건조시켰다. 효소 처리 전후의 PET 필름 샘플의 무게를 비교하여 질량 손실을 계산하였다.
일 실험에서, 상기 기재된 바와 같은 PET 필름 분해 검정을 사용하여, Is페타제 Net 단일 변이체의 PET 분해 활성을 야생형 Is페타제, 활성의 완전한 손실을 갖는 돌연변이된 페타제, 및 써모페타제와 비교한다. 검정 반응물을 40°C에서 96시간 동안 인큐베이션하였다. 이의 결과는 도 2에 나타낸다. 상기 결과는 N233K, S58E, N114T, N225C, M262L, T270V, T140D가 야생형 Is페타제에 비해 돌연변이체의 더 높은 PET 분해 활성을 유도할 수 있는 유리한 치환임을 입증한다. 이들 단일 돌연변이체 중에서, 돌연변이 N233K를 포함하는 변이체는 야생형 Is페타제보다 대략 8.5배 더 높은 PET 분해 활성을 나타내는 가장 큰 개선을 유도하였다.
일 실험에서, 상기 기재된 바와 동일한 PET 필름 분해 검정을 사용하여, TNK 및 DNK의 PET 분해 활성을 각각 써모페타제 및 듀라페타제와 비교하였다. 검정 반응은 30/40°C에서 96시간 동안 또는 50°C에서 48시간 동안 인큐베이션하였다. 이의 결과는 도 5에 나타낸다. 상기 결과는 써모페타제 및 듀라페타제의 아미노산 서열에서 치환 N233K가 또한 개선된 PET 분해 성능을 발생시킨다는 것을 입증한다. 구체적으로, TNK는 30 및 40°C에서 써모페타제와 거의 유사한 PET 분해 활성을 보였지만, 50°C에서는 써모페타제보다 6.4배 높은 활성을 보였다. 이는 치환 N233K가 써모페타제의 열 내성을 더 개선시킨다는 것을 암시하였다. 이와 대조적으로, DNK는 50°C에서 듀라페타제에 비해 약간 높은 PET 분해활성이 나타내었다.
다른 실험에서, 상기 기재된 바와 같은 PET 필름 분해 검정을 사용하여, TNK Net 단일 변이체의 PET 분해 활성을 써모페타제, 듀라페타제 및 TNK와 비교한다. 검정 반응은 30/40/50/55°C에서 96시간 동안 인큐베이션하였다. 이의 결과는 도 7에 나타낸다. 상기 결과는 S58E, N114T, N225C, M262L, T270V, S58A, S61T, I208V 및 R224Q가 야생형 Is페타제에 비해 돌연변이체의 더 높은 PET 분해 활성을 유도할 수 있는 유리한 치환임을 입증한다. 이들 단일 돌연변이체 중에서, 돌연변이 N233K를 포함하는 변이체는 야생형 Is페타제보다 대략 8.5배 더 높은 PET 분해 활성을 나타내는 가장 큰 개선을 유도하였다.
실시예 8:
효소의 구조적 분석에 기초하여, 활성을 개선시키기 위한 치환에 대해 하기의 추가 잔기를 식별하였다:
S58Y - 티로신은 R59와의 양이온-파이 상호작용, S142 및 S143과의 수소 결합 및 근처의 물 분자를 형성할 수 있으며, 이는 단백질이 더 높은 온도에서 풀리는 것을 방지한다.
S58M/L/V - 메티오닌, 류신, 이소류신 및 발린은 구조화되지 않은 루프를 알파 나선과 베타 시트 사이에 형성된 소수성 포켓으로 붕괴시켜 더 높은 온도에서 함께 유지할 수 있도록 한다.
S58P - 프롤린은 2개의 베타 가닥 사이의 비구조화된 루프의 유연성을 제한하여 더 높은 온도에서 함께 유지할 수 있도록 한다.
S61D/E - 세린은 현재 R132와 수소 결합을 형성하고 있다. 상기 아르기닌은 임의의 음이온성 잔기에 가깝지 않고 오히려 R59에 가까워서 반발성 정전기적 상호작용을 발생시킨다. 이러한 잔기에서 ASP 또는 GLU는 R59와 R132 사이에 음이온을 추가하여, 단백질을 더 높은 온도에서 접히도록 끌어당기는 정전기적 특성을 발생시킬 것이다.
S61Y/F - R59 및 R132 둘 다와 양이온 파이 상호작용을 형성할 수 있으며, 이는 단백질을 더 높은 온도에서 접히도록 끌어당기는 정전기적 특성을 발생시킬 것이다.
N114H/L/R - D118과 염 가교를 형성할 수 있고, Q126 및 골격 잔기 T63 및 G64와 수소 결합할 수 있다.
N114S/T - D118 및 Q126 및 골격 잔기 T63 및 G64와 수소 결합할 수 있다.
T140: 상기 트레오닌은 부분적으로 용매가 노출된 비구조화된 루프에 있다.
T140Y - 티로신은 용매와 수소 결합을 보존할 수 있고, 잠재적으로 R59와 양이온-pi 상호작용을 형성할 수 있다.
T140L/I/V - 베타 시트와 상기 비구조화된 루프가 유래하는 알파 나선 사이의 소수성 붕괴를 도울 수 있다.
T140S - 비구조화된 루프 내의 S142 및 S143과 용매 및 수소 결합과의 상호작용을 도와 상기 루프를 팽팽하게 유지할 수 있다.
I208M/H/F/Y - 인접한 잔기(Y87, W185, H237) 및 테레프탈레이트 기질의 벤젠 고리의 pi 전자와 상호작용할 수 있다.
I208P - D206을 촉매 3가 원소(catalytic triad)에 적절하게 배치하려면 몇 가지 순서가 필요한 비구조적화된 루프이다. 이러한 비구조화된 루프 내에서 약간의 유연성을 제거하면 촉매 3가 원소가 더 높은 온도에서 기능할 수 있을 것이다.
I208A - 활성 부위의 친핵성 S160에 대한 잠재적인 입체 장애를 제거할 것이다.
R224D/E - 상기 아르기닌은 가까운 음이온성 잔기 없이 노출된 용매이고, K177, K227, R260과 반발성 상호작용을 갖는 것으로 보인다. 따라서, 음이온성 아미노산(ASP/GLU)을 배치하면 영역의 정전기적 특성을 개선시키고, 열 안정성을 증가시킬 것이다.
R224S/T/N/Q - 이들 아미노산은 반발성 양이온을 제거하고 영역에서 정전기적 상호작용을 용이하게 하며 수소 결합에 기여한다.
N225N- ASN은 소수성 포켓에 있다. 하지만, 수소는 주쇄 카르보닐과 결합한다.
N225I/V/M/A/L - 포켓의 소수성을 증가시키고 더 높은 온도에서 펼쳐지지 않도록 한다.
N225S/T - T195 및 V196에 대한 주쇄 수소 결합을 유지하지만, 소수성 포켓 내로 멀리 돌출하지 않는다.
N233R/Y/H - 상기 아스파라긴은 3개의 음이온(E204, E231, D283) 옆에 있고 양이온은 영역에서 강한 반발성 정전기적 특성을 완화시킬 것이다.
N233P - 상기 아스파라긴은 베타-가닥의 가장 말단에 있고 활성 부위에 촉매 히스티딘을 보유하는 비구조화된 루프의 시작부에 있다. 프롤린은 상기 베타 가닥을 덮고 촉매 His에 대한 약간의 강성을 보조하여, 더 높은 온도에서 촉매 활성을 유지할 것이다.
M262: 상기 메티오닌은 중심 베타-시트를 가진 단단한 소수성 포켓 안에 있다.
M262L/I/A/V - 다른 소수성 잔기는 입체 구조(sterics)로 인해 더 강한 소수성 상호작용을 가질 수 있고 더 높은 온도에서 단백질이 펼쳐지지 않도록 한다.
M262F/W - F106을 사용한 pi-pi 적층은 소수성 붕괴를 강화할 수 있다.
T270Y/R/H- 양이온은 E274와 염 가교 및 F271과의 양이온-pi 상호작용을 형성하여, 이 영역이 보다 높은 온도에서 국부 구조를 보유하게 할 수 있다.
실시예 9:
플라스틱 쓰레기의 증가된 생산 및 축적은 생태학적인 도전을 제기한다. 현재의 플라스틱 폐기물 관리는 대부분 지속 가능하지 않고, 에너지-집약적이거나, 심지어 위험한 물리화학적 및 기계적 공정들에 의존하지만, 효소 분해는 플라스틱 폐기물 재순환을 위한 환경친화적이고 지속 가능한 경로를 제공한다. 폴리(에틸렌 테레프탈레이트)(PET)는 포장재와 직물 및 일회용 용기의 제조에 널리 사용되어 왔으며, 이는 전체 고형 폐기물의 12%를 차지한다. 하지만, 지금까지 보고된 몇 가지 PET 가수분해효소에도 불구하고, 생물적 환경 정화를 포함한 이들의 실제 적용은 견고성의 결여 또는 상당히 높은 반응 온도(약 70°C)의 요건으로 인해 방해를 받는다. 여기서, 본 발명가들은 이데오넬라 사카이엔시스로부터 고도로 강건하고 기능적인 PET 가수분해효소를 조작하기 위해 구조 기반의 딥 러닝 모델을 사용한다. 본 발명가들의 최상의 결과로서 생성된 돌연변이체(알파페타제)는 적당한 온도(특히 30~50°C)의 넓은 범위에 걸쳐 잎-가지 퇴비 큐티나제 및 이의 돌연변이체를 포함한 이의 대응물보다 우수한 PET-가수분해 활성을 나타낼 뿐만 아니라, 향상된 열안정성 및 pH 내성을 갖는다. 본 발명가들은 51종의 상이한 플라스틱 제품으로부터 비처리된, 사용 후 PET가 모두 50°C에서 1주 이내에 그리고 적게는 24시간 내에 알파페타제에 의해 완전히 분해될 수 있다는 것을 입증하였다. 본 발명가들은 또한 미사용 PET가 알파페타제에 의한 PET 폐기물의 효소적 해중합으로부터 복원된 단량체를 중합시킴으로써 재합성될 수 있음을 보여주며, 이는 폐쇄된 루프 PET 재순환 공정을 나타낸다. 중간 온도에서의 우세한 활성 및 미생물과의 뛰어난 상용성은 효소-기반 및 세포-기반 플랫폼 둘 모두에 대한 이상적인 촉매로서 알파페타제를 제공한다. 이와 관련하여, 본 발명가들은 분비된 알파페타제를 발현하는 조작된 슈도모나스(Pseudomonas) 균주가 PET를 분해할 수 있고, 분해산물인 테레프탈산을 성장을 위한 탄소 및 에너지원으로서 활용함으로써, 환경적 생물 정화 적용에 대한 알파페타제의 큰 잠재력을 제시하는 순차적 및 통합된 생물처리를 입증하였다.
폴리(에틸렌 테레프탈레이트)(PET)는 합성 직물 섬유의 70% 및 비-섬유 플라스틱 포장이 10%를 구성하고(Geyer, R., Jambeck, J. R. & Law, K. L. Production, use, and fate of all plastics ever made. Sci. Adv. 3, (2017)), 그에 상응하여 일회용으로 제조된 재료의 막대한 폐기물 더미를 나타낸다. 하지만, PET를 위한 순환하는 탄소 경제는 이론적으로 빠른 효소 해중합 및 이어서 화학적 재중합 또는 다른 생성물로의 업사이클링(upcycling)/고부가가치화(valorization)를 통해 달성될 수 있다(Simon, N. et al. A binding global agreement to address the life cycle of plastics. Science (80-. ). 373, 43 LP - 47 (2021)), (Kawai, F., Kawabata, T. & Oda, M. Current knowledge on enzymatic PET degradation and its possible application to waste stream management and other fields. Applied Microbiology and Biotechnology 103, (2019)). 하지만, 모든 기존의 PET-가수분해 효소(PHE)는 적당한 pH/온도 범위 내에서 기능하거나, 미처리된 사용 후 플라스틱을 직접 활용하는 그들의 용량에 있어서 제한된다. 이러한 형질들은 원위치(in situ) 생물적 환경 정화 및 단순화된 저비용 산업 규모 공정에 필수적이다(Taniguchi, I. et al. Biodegradation of PET: Current Status and Application Aspects. ACS Catal. (2019). doi:10.1021/acscatal.8b05171). 이러한 한계를 극복하기 위해, 본 발명가들은 딥 러닝 및 단백질 공학 접근법을 사용하여 광범위한 미가공 PET 기질(모델 및 실제 사용 후 PET 둘 모두), 온도 및 pH 수준에 걸쳐 다른 모든 공지된 PHE 및 유도된 돌연변이체를 능가하는 방식으로 예외적으로 높은 활성을 갖는 PHE를 생성하였다.
PET의 효소적 해중합은 2005년에 처음 보고되었으며, 최근 에스테라제, 리파제 및 큐티나제로부터 유래된 19개의 별개의 PHE를 사용하여 입증되었다(Taniguchi, I. et al. Biodegradation of PET: Current Status and Application Aspects. ACS Catal. (2019). doi:10.1021/acscatal.8b05171), (Inderthal, H., Tai, S. L. & Harrison, S. T. L. Non-Hydrolyzable Plastics - An Interdisciplinary Look at Plastic Bio-Oxidation. Trends in Biotechnology (2021). doi:10.1016/j.tibtech.2020.05.004), (Chen, C. C., Dai, L., Ma, L. & Guo, R. T. Enzymatic degradation of plant biomass and synthetic polymers. Nature Reviews Chemistry (2020). doi:10.1038/s41570-020-0163-6). 하지만, 이들 효소의 대부분은 단지 높은 반응 온도(즉, 약 70°C의 PET 유리 전이 온도 또는 이의 초과)에서 상당한 가수분해 활성을 나타낸다. 예를 들어, 조작된 잎-가지 퇴비 큐티나제(LCC)는 72°C 및 pH 8.0에서 10시간 내에 전처리된 사용 후 PET의 90%를 분해할 수 있다(Tournier, V. et al. An engineered PET depolymerase to break down and recycle plastic bottles. Nature (2020). doi:10.1038/s41586-020-2149-4). 대부분의 다른 PHEs도 마찬가지로 보통의 온도(Yoshida, S. et al. A bacterium that degrades and assimilates poly(ethylene terephthalate). Science (80-. ). (2016). doi:10.1126/science.aad6359) 및 좀 더 중성의 pH 조건에서(Chen, C. C. et al. General features to enhance enzymatic activity of poly(ethylene terephthalate) hydrolysis. Nat. Catal. (2021). doi:10.1038/s41929-021-00616-y)에서 빈약한 활성을 보이며, 이는 PET 폐기물을 위한 원위치/미생물학적으로-가능한 환경적 생물 정화 해결책을 크게 제한한다. 이러한 제한은 수집이 불가능한 플라스틱의 40%가 자연 환경 내에 머물기 때문에 심각한 문제가 된다(Worm, B., Lotze, H. K., Jubinville, I., Wilcox, C. & Jambeck, J. Plastic as a Persistent Marine Pollutant. Annual Review of Environment and Resources (2017). doi:10.1146/annurev-environ-102016-060700). 또한, 상승된 온도 및 전처리가 순 운용 비용(net operating cost)을 증가시키는 반면, 근접 환경 온도에서 미처리된 사용 후 플라스틱 폐기물을 전환시키는 것이 산업적 응용에 바람직할 것이다.
PET-동화 박테리아인 이데오넬라 사카이엔시스로부터 유래한 PHE(Yoshida, S. et al. A bacterium that degrades and assimilates poly(ethylene terephthalate). Science (80-. ). 351, 1196 LP - 1199 (2016).) (페타제)는 주위 조건에서 작동할 수 있으며, 매우 불안정하여 24시간 후 37°C에서도 활성을 잃음에 따라(Son, H. F. et al. Rational Protein Engineering of Thermo-Stable PETase from Ideonella sakaiensis for Highly Efficient PET Degradation. ACS Catal. 9, 3519-3526 (2019)), 실제 응용을 제한한다. 그럼에도 불구하고, 이러한 중온성 효소에 대해서는 열안정성, 강건성 및 기능을 향상시키기 위한 시도를 한 적이 있다(Son, H. F. et al. Rational Protein Engineering of Thermo-Stable PETase from Ideonella sakaiensis for Highly Efficient PET Degradation. ACS Catal. 9, 3519-3526 (2019)), (Austin, H. P. et al. Characterization and engineering of a plastic-degrading aromatic polyesterase. Proc. Natl. Acad. Sci. U. S. A. 115, E4350-E4357 (2018)), (Joo, S. et al. Structural insight into molecular mechanism of poly(ethylene terephthalate) degradation. Nat. Commun. 9, (2018)), (Han, X. et al. Structural insight into catalytic mechanism of PET hydrolase. Nat. Commun. (2017). doi:10.1038/s41467-017-02255-z), (Furukawa, M., Kawakami, N., Oda, K. & Miyamoto, K. Acceleration of Enzymatic Degradation of Poly(ethylene terephthalate) by Surface Coating with Anionic Surfactants. ChemSusChem (2018). doi:10.1002/cssc.201802096), (Cui, Y. et al. Computational Redesign of a PETase for Plastic Biodegradation under Ambient Condition by the GRAPE Strategy. ACS Catal. (2021). doi:10.1021/acscatal.0c05126), (Chen, K., Hu, Y., Dong, X. & Sun, Y. Molecular Insights into the Enhanced Performance of EKylated PETase Toward PET Degradation. ACS Catal. 11, 7358-7370 (2021)). 가장 주목할만한 조작된 페타제 변이체 - 써모페타제(Son, H. F. et al. Rational Protein Engineering of Thermo-Stable PETase from Ideonella sakaiensis for Highly Efficient PET Degradation. ACS Catal. 9, 3519-3526 (2019)) 및 듀라페타제(Cui, Y.-L. et al. Computational redesign of PETase for plastic biodegradation by GRAPE strategy. (2019). doi:10.1101/787069) -는 각각 합리적 단백질 공학 및 계산적 재설계 전략을 통해 생성되었다. 특정 조건하에서 이들 두 돌연변이체들의 열 안정성 및 촉매 활성이 개선되었지만(Son, H. F. et al. Rational Protein Engineering of Thermo-Stable PETase from Ideonella sakaiensis for Highly Efficient PET Degradation. ACS Catal. 9, 3519-3526 (2019)), (Cui, Y. et al. Computational Redesign of a PETase for Plastic Biodegradation under Ambient Condition by the GRAPE Strategy. ACS Catal. (2021). doi:10.1021/acscatal.0c05126), 온화한 온도에서 전체적으로 더 낮은 PET-가수분해 활성을 가졌다.
본 발명가들은 좀 더 집중된 단백질 공학 접근법이 전반적인 안정성과 활성 사이의 진화적 교환을 극복할 수 없고, 중성의 구조 기반의 딥 러닝 신경망이 일반적으로 모든 조건에 걸쳐 효소 기능을 개선할 수 있다고 가정하였다. 이를 위해, 3D 자체 지도 컨볼루션 신경망인 뮤트컴퓨트(MutCompute)를 사용하였다(Shroff, R. et al. Discovery of novel gain-of-function mutations guided by structure-based deep learning. ACS Synth. Biol. (2020). doi:10.1021/acssynbio.0c00345). 이러한 알고리즘은 단백질 데이터 뱅크로부터 19,000개가 넘는 다양한 단백질 구조에 대해 훈련되어 아미노산 잔기와 국소 화학적 미세환경을 연결한다. 구체적으로, 본 발명가들은 뮤트컴퓨트를 사용하여 야생형 페타제 및 써모페타제(결정 구조 PDB: 5XJH 및 6IJ6) 둘 모두에서 각각의 잔기에서 20개의 모든 정규 아미노산을 시뮬레이션하는 구조적 적합성에 대한 이산 확률 분포를 수득하였다. 돌연변이에 대한 중요한 잔기의 하향 선택을 돕기 위해, 이러한 분포를 단백질 결정 구조(도 9a) 상에 제공하여, 야생형 아미노산 잔기가 잠재적 치환보다 '덜 들어맞는' 위치를 식별하였다. 실험적 단백질 조작 노력에 집중하기 위해, 이들 예측은 또한 돌연변이유발을 위한 가장 고도로 부적합한 잔기를 식별하고 표적화하기 위해 적합 확률(fit probabilities)의 예측된 배수 변화에 의해 순위를 매겼다. 단계적 조합 전략을 사용하여, 본 발명가들은 단일 또는 다수의 예측된 돌연변이를 다양한 페타제 스캐폴드에 통합하기 위해 이러한 목록 상의 잔기를 사용하여 총 159개의 변이체를 생성하였다. 개선된 촉매 활성(에스테라제 활성 및 플라스틱 분해율로 측정됨) 및 열 안정성(단백질 용융 온도(Tm)로 측정됨)을 나타내는 변이체가 추가로 특성화되었다. 이러한 세트 중에서, 4개의 예측된 돌연변이(S121E, N233K, R224Q 및 T140D)(도 9b)가 단독으로 및 조합하여 가장 높은 개선을 보였고, 따라서 추가의 조합 조립 및 후속 분석을 위해 선택되었다.
본 발명가들은 3개의 페타제 스캐폴드(야생형 페타제, 써모페타제, 및 듀라페타제)에 걸쳐 이들 4개의 돌연변이에 대한 29개의 가능한 모든 조합을 조립하였다. 여러 번 시도한 후, 듀라페타제 배경을 사용하여 두 개를 정제할 수 없었다. 나머지 27개의 돌연변이체의 열안정성 분석은 24개(약 89%)가 이의 각각의 스캐폴드에 비해 상승된 Tm을 발생시킴을 나타내었다(도 13). Tm이 58.1°C인 변이체 페타제N233K/T140D(WT 페타제로부터 ΔΤm=10°C), Tm이 67.4°C인 써모페타제N233K/R224Q(써모페타제로부터 ΔΤm=9°C), 및 Tm이 83.5°C인 듀라페타제N233K(듀라페타제로부터 ΔΤm=5°C)에서 이의 각각의 페타제 스캐폴드에 비해 가장 높은 열안정성 변화를 관찰하였다. 후자의 돌연변이체는 현재까지 보고된 가장 열안정한 페타제 돌연변이체를 나타낸다. 27개의 변이체 모두의 단백질 수율이 모 스캐폴드와 비교하여 개선되었으며(최대 3.8배 증가), 더 높은 안정성의 돌연변이체를 식별하는 뮤트컴퓨트의 능력을 추가로 강조하였다. 스캐폴드에 걸친 이들 돌연변이의 이식성 및 조합 상승효과는 이러한 신경망-기반 접근법의 능력을 입증한다.
다음으로, 본 발명가들은 문헌에서 일반적으로 사용되는 무정형 PET 필름(gf-PET, Goodfellow로부터 공급됨)을 사용하여 30 내지 60°C의 온도 범위에 걸쳐 이들 보다 안정한 변이체의 PET 가수분해 활성을 평가하고자 하였다(Tournier, V. et al. An engineered PET depolymerase to break down and recycle plastic bottles. Nature (2020). doi:10.1038/s41586-020-2149-4). 이러한 비교는 즉시 기계 학습 유도 예측이 PET 가수분해 활성을 크게 향상시키고 모든 스캐폴드에서 작동 온도의 범위를 확장시킴을 나타내었다(도 9c). 특히, 페타제 N233K/R224Q/S121E는 30°C 및 40°C에서 야생형 페타제에 비해 각각 3.4배 및 29배의 PET 가수분해 활성 증가를 나타내었다(도 9c). 써모페타제 스캐폴드에 기초한 효소 돌연변이체들은 확장된 범위의 작업 온도(30~60 °C)를 나타내었으며, 그들의 대응물들보다 상당히 높은 활성을 나타내었다. 이러한 세트 내에서, 알파페타제로 명명되는 최상의 써모페타제 변이체-써모페타제N233K/R224Q는 써모페타제 단독에 비해 40 및 50°C에서 각각 2.4배 및 38배 더 높은 활성을 나타내었다(도 9c). 50°C에서, 알파페타제는 모든 돌연변이체에서 가장 높은 전체 분해를 나타내었고 96시간 내에 33.8 mM의 PET 단량체를 방출하는 온도 활성을 나타내었다(도 9c). 듀라페타제 스캐폴드는 일반적으로 온화한 온도(30~50°C)에서 비교적 낮은 활성을 나타내지만, 그럼에도 불구하고 가장 열안정한 페타제 돌연변이체-듀라페타제N233K(베타페타제로도 지칭됨)에 의해 입증된 바와 같이 더 높은 온도(55~60°C)에서 개선이 실현되었다(도 9c).
이들 돌연변이체의 환경 조건에 대한 촉매 복원력을 평가하기 위해, 알파페타제 및 베타페타제를 40°C에서 pH(6.5~8.0)의 범위에 걸쳐 gf-PET를 사용하여 야생형 페타제, 써모페타제, 듀라페타제, LCC, 가장 활성인 돌연변이체 LCC F243I/D238C/S283C/N246M (ICCM)를 포함하는 이전에 보고된 야생형 및 돌연변이체 PHEs와 비교하였다(도 10). 이러한 비교 분석은 낮은 pH 수준 및 주위 온도에서 기능하는 알파페타제의 고유한 촉매 능력을 입증하였다. 구체적으로, 알파페타제는 모든 pH 조건에서 다른 PHEs를 능가하였다. 특히 pH 7에서, 알파페타제는 40°C에서 야생형 페타제에 비해 115배 높은 활성을 나타내었다(도 10). 이러한 효소 성능은 알파페타제를 원위치 플라스틱 환경적 생물정화 조건에서 관찰되는 PET의 온화한 온도 및 적당한 pH 효소 분해에 대한 우수한 후보물질로 만든다.
모델 플라스틱 기질을 넘어, 가공되지 않은, 미처리된 사용 후 PET(pc-PET)에 대한 페타제 효소의 성능을 입증하는 것이 중요하다. 특히, 상기 및 문헌 전반에 걸쳐 사용된 gf-PET와 달리, 단수의 사용 후 PET 기질은 없다. 이를 위해, 본 발명가들은 지역 식료품 가맹점에서 입수 가능한 식품, 음료, 약품, 사무용품, 생활용품 및 화장품의 포장에 사용되는 51개의 사용 후 플라스틱 제품 샘플을 수집하고, 이 원료를 50°C에서 알파페타제로 효소적으로 처리하였다(도 14). 결정성 및 두께와 같은 물리적 특성뿐만 아니라 첨가제 및 가소제를 포함하는 상이한 조성물을 포함하는 이들의 이질성에도 불구하고, 이러한 광범위한 PET 제품으로부터 구멍이 뚫린 샘플은 모두 1주 내에 그리고 적게는 24시간 내에 알파페타제에 의해 완전히 분해되었다(도 11a). 플라스틱의 두께는 분해 시간과 상관관계가 있었지만(두께 및 질량이 관련되기 때문에), 이러한 메트릭 또는 결정도는 단독으로는 전체 분해 속도를 결정하지 않았다.
상기 시험된 사용 후 제품 중에서, 본 발명가들은 24시간 내에 50°C에서 알파페타제에 의해 완전히 분해된 콩깻묵 용기로부터의 샘플을 추가로 평가하였다. 시간 경로 분석(도 11b)에서는 이 pc-PET 필름의 분해가 방출된 총 PET 단량체의 관점에서 알파페타제를 사용하여 거의 선형 감쇠율을 나타낸다는 것이 밝혀졌다. 동시에, 알파페타제에 의한 pc-PET 필름의 분해는 24시간에 걸쳐 결정화도를 1.2%에서 7.7%로 증가시켰다. 원자력 현미경(도 11c) 및 주사 전자 현미경은 또한 알파페타제의 반응 진행이 pc-PET 표면에서 점점 더 깊고 더 큰 구멍을 생성함에 따라 반응 시간에 걸쳐 표면 거칠기를 증가시킨다는 것을 나타내었다. 이와 대조적으로, 상기 pc-PET에 대한 야생형 페타제, 써모페타제, 듀라페타제, 베타페타제, LCC 및 ICCM의 PET 가수분해 활성은 동일한 조건에서 알파페타제에 비해 실질적으로 낮았다(4.2 내지 295배)(도 11b). 흥미롭게도, 심지어 이전에 보고된 72°C의 최적 반응 온도에서도(Tournier, V. et al. An engineered PET depolymerase to break down and recycle plastic bottles. Nature (2020). doi:10.1038/s41586-020-2149-4), LCC 및 ICCM의 활성은 50°C에서 알파페타제의 활성보다 여전히 6.3배 및 2.7배 더 낮았다. 추가의 실험 분석은 LCC 및 ICCM이 60°C에서 상기 pc-PET 필름에 대해 가장 높은 분해율을 나타냄을 보여주었다. 하지만, 60°C에서도 LCC 및 ICCM의 활성은 여전히 50°C에서 알파페타제의 활성 보다 낮았다. 또한, 본 발명가들은 알파페타제를 사용한 방법이 단지 순 반응 부피를 증가시킴으로써 대형의 미처리된 플라스틱 조각(이 경우, 11 mg이 아닌 4 g)으로 쉽게 확장 가능함을 입증하였다(도 11d). 이들 결과를 고려하면, 알파페타제는 더 높은 반응 온도를 필요로 하는 ICCM과 달리, 더 낮은 운용 비용 및 더 높은 사용 후 PET의 분해 효율의 이점과 함께, 가공되지 않은, 미처리된 PET 폐기물을 재순환시키는 것을 목표로 하는 효소-기반 플랫폼에 대한 유망한 생촉매로서 작용할 수 있다.
포장재를 넘어 합성 섬유 업계에서도 PET가 많이 사용되고 있다. 이를 위해, 본 발명가들은 상업적 폴리에스테르 제품을 부분적 분해시키는 알파페타제의 잠재적인 적용을 평가하였다. 5종의 상이한 상업적 폴리에스테르 제품을 50°C에서 알파페타제로 처리하여, 다른 PHE로 처리한 샘플에 비해 더 많은 양의 테레프탈산(TPA) 및 모노-(2-히드록시에틸)테레프탈레이트를 방출하였다(도 11e). 이는 알파페타제가 직물에 매립된 미세플라스틱의 신속하고 효율적인 분해에 잠재적으로 사용되어, 상업적 폴리에스테르 제품으로부터 PET 단량체를 복원하고 미세섬유의 환경으로의 침출을 감소시키기 위한 잠재적인 경로를 제공할 수 있음을 나타낸다.
주변 온도 및 pH 조건에서의 이러한 알파페타제 돌연변이체의 높은 활성을 고려하여, 본 발명가들은 상기 효소가 PET의 다양한 효소-미생물 및 효소-화학적 처리에 적합할 것이라고 가정하였다. 이와 관련하여, PET 분해는 순환하는 플라스틱 경제(plastic economy)의 절반에 불과하며, 본 발명가들은 여기서 알파페타제가 화학적 및 생물학적 재순환/업사이클링 적용 둘 모두와 상용성을 가짐을 입증한다. 첫째, 본 발명가들은 먼저 알파페타제를 활용하여 사용 후 플라스틱 폐기물을 해중합하고 이어서 단량체를 복원함으로써 폐쇄 주기의 PET 재구성을 입증한다. 그런 다음, 본 발명가들은 화학적 중합을 사용하여 분해 용액으로부터 직접 미사용 PET를 재생하였다(도 12a). 재중합에 대한 분해의 완전한 주기는 단지 수일의 과정에 걸쳐 완료되었다. 이들 결과는 비석유 자원으로부터 미사용 PET를 생성하기 위한 폐쇄된 루프의 효소/화학적 재순환 공정의 실행가능성을 입증한다.
둘째, 본 발명가들은 단량체의 직접적인 해중합 및 미생물 고부가가치화/환경적 생물정화를 가능하게 하기 위해 주위 온도에서 알파페타제의 분해 능력을 활용하고자 하였다. 이를 위해, 본 발명가들은 알파페타제를 사용하여 동시 및 통합된 생분해 방식 둘 모두를 평가하였다. 특히, TPA를 탄소 및 에너지원으로 자연스럽게 활용할 수 있는 토양 박테리아 슈도모나스 푸티다 Go19 (Narancic, T. et al. Genome analysis of the metabolically versatile Pseudomonas umsongensis GO16: the genetic basis for PET monomer upcycling into polyhydroxyalkanoates. Microb. Biotechnol. (2021). doi:10.1111/1751-7915.13712), (Kenny, S. T. et al. Up-cycling of PET (Polyethylene Terephthalate) to the biodegradable plastic PHA (Polyhydroxyalkanoate). Environ. Sci. Technol. (2008). doi:10.1021/es801010e)를 사용하였다. 처음에, 본 발명가들은 동시 PET 해중합 및 발효의 가능성을 탐색하기 위해 외인성 알파페타제를 이 숙주와 조합하고자 하였다. P. 푸티다 Go19를 임의의 다른 탄소원이 없는 전처리되지 않은 pc-PET 필름으로 보충된 최소 배지에 접종하였다. 200 mM의 정제된 알파페타제를 배양 배지에 첨가하고 35°C에서 인큐베이션하면, 불투명성을 나타내고 이의 초기 중량의 11.5 ± 0.3%를 손실한 분해된 pc-PET 필름과 함께 P. 푸티다 Go19의 성장이 관찰되었다(도 12b). 본 실험을 통해, 알파페타제에 의한 pc-PET 필름의 가수분해로부터 유리된 TPA가 성장을 위해 P. 푸디다 Go19에 의해 소모되는 것을 관찰하였다(도 12b). 이와 대조적으로, 야생형 페타제, 써모페타제, 듀라페타제, 베타페타제, LCC, 또는 ICCM을 촉매로 사용한 경우에는 P. 푸티다 Go 19의 세포 밀도 및 pc-PET 필름의 중량 감소가 모두 알파페타제를 사용한 경우보다 유의적으로 낮았다(도 12b). 이들 결과는 알파페타제가 시험된 다른 PHE와 비교할 때 세포-성장 상용성 조건하에서 가장 높은 PET-가수분해 활성을 나타낸다는 것을 보여주었다.
마지막으로, 본 발명가들은 P. 푸티다 Go 19에 알파페타제 발현을 혼입시켜 pc-PET를 바이오매스로 전환시킴으로써 통합된 생물처리를 개발하고자 하였다. 이를 위해, 본 발명가들은 P. 푸티다 Go 19를 30 mg/L의 높은 수율로 알파페타제를 효율적으로 분비하도록 조작하였다. 일부 TPA로 통합된 공정(consolidated process)을 프라이밍한 후, pc-PET 필름을 단독 탄소원으로서 조작된 균주에 제공하였다. 35°C에서 96시간 인큐베이션 후, P. 푸티다 Go 19는 필름 불투명도 및 18.1 ± 3.1%의 중량 손실에 의해 증명되는 바와 같이 pc-PET 필름을 부분적으로 분해시켰다. 마찬가지로, 유리된 단량체를 세포 성장을 실시할 수 있도록 직접 고부가가치화하였다(도 12c). 이러한 시연은 주위 온도 및 중성 pH에서 현장의 PET 해중합 및 바이오매스로의 TPA 전환을 실시하기 위해 효소 생산을 통합하는 제1 통합 생물처리를 나타낸다.
결론적으로, 본 연구는 구조 기반 딥러닝 모델을 활용하여 다양한 페타제 스캐폴드에 걸쳐 개선된 안정성과 기능을 부여하는 이동이 쉬운 돌연변이를 식별하였다. 최상의 변이체인 알파페타제는 광범위한 온도(30~50°C)에 걸쳐 우세한 활성 및 세포 성장 조건과의 뛰어난 상용성을 나타낸다. 본 발명가들은 벌크(bulk)의 미처리된 사용 후 PET 폐기물의 신속하고 효율적인 분해 및 직물에 매립된 미세플라스틱의 감소를 통해 이러한 능력을 입증한다. 상기 돌연변이체의 특징은 P. 푸티다 Go 19를 사용한 동시 및 통합 생물처리 둘 모두에 의해 입증되는 바와 같이 저비용 산업 재순환 및 원위치 플라스틱 환경적 생물정화 적용 둘 모두에 적합하다. 종합하면, 이러한 결과는 단백질 공학 및 중온성 효소의 유용성이 직접적인 플라스틱 해중합을 위한 넓은 범위의 생촉매로 진화될 수 있다는 것을 입증한다.
서열
서열번호 1
길이: 290
기타 정보: 야생형 Is페타제
서열 1
서열번호 2
길이: 290
기타 정보: 써모페타제 (Is페타제S121E/D186H/R280A/N233K)
서열 2
서열번호 3
길이: 290
기타 정보: 듀라페타제 (Is페타제 L117F/ Q119Y/T140D/ W159H, G165A/ I168R/A180I/ S188Q/S214H/R280A)
서열 3
서열번호 4
길이: 290
기타 정보: 써모페타제 (Is페타제S121E/D186H/R280A/N233K)
서열 4
서열번호 5
길이: 290
기타 정보: WT NET
서열 5
전술한 발명이 이해의 명확성을 위해 예시 및 실시예의 방식으로 일부 상세히 설명되었지만, 당업자는 특정 변경들 및 수정들이 첨부된 청구항들의 범위 내에서 실시될 수 있음을 인식할 것이다. 또한, 본원에 제공된 각각의 참조는 각각의 참조가 개별적으로 원용된 것과 동일한 정도로 그 전체가 원용된다. 본 출원과 본원에 제공된 참조 사이에 충돌이 있는 경우, 본 출원이 우선한다.
SEQUENCE LISTING
<110> BOARD OF REGENTS, THE UNIVERSIRY OF TEXAS SYSTEM
<120> MUTATIONS FOR IMPROVING ACTIVITY AND THERMOSTABILITY OF PETASE
ENZYMES
<130> 093331-1271053
<140> PCT/US2021/053530
<141> 2021-10-05
<150> 63/088,321
<151> 2020-10-06
<160> 37
<170> PatentIn version 3.5
<210> 1
<211> 290
<212> PRT
<213> Ideonella sakaiensis
<400> 1
Met Asn Phe Pro Arg Ala Ser Arg Leu Met Gln Ala Ala Val Leu Gly
1 5 10 15
Gly Leu Met Ala Val Ser Ala Ala Ala Thr Ala Gln Thr Asn Pro Tyr
20 25 30
Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu Glu Ala Ser Ala Gly
35 40 45
Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg Pro Ser Gly Tyr Gly
50 55 60
Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly Gly Thr Val Gly Ala
65 70 75 80
Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln Ser Ser Ile Lys Trp
85 90 95
Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val Val Ile Thr Ile Asp
100 105 110
Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg Ser Ser Gln Gln Met
115 120 125
Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly Thr Ser Ser Ser Pro
130 135 140
Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly Val Met Gly Trp Ser
145 150 155 160
Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala Asn Asn Pro Ser Leu
165 170 175
Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser Ser Thr Asn Phe Ser
180 185 190
Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys Glu Asn Asp Ser Ile
195 200 205
Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr Asp Ser Met Ser Arg
210 215 220
Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly Ser His Ser Cys Ala
225 230 235 240
Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly Lys Lys Gly Val Ala
245 250 255
Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg Tyr Ser Thr Phe Ala
260 265 270
Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp Phe Arg Thr Ala Asn
275 280 285
Cys Ser
290
<210> 2
<211> 290
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 2
Met Asn Phe Pro Arg Ala Ser Arg Leu Met Gln Ala Ala Val Leu Gly
1 5 10 15
Gly Leu Met Ala Val Ser Ala Ala Ala Thr Ala Gln Thr Asn Pro Tyr
20 25 30
Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu Glu Ala Ser Ala Gly
35 40 45
Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg Pro Ser Gly Tyr Gly
50 55 60
Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly Gly Thr Val Gly Ala
65 70 75 80
Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln Ser Ser Ile Lys Trp
85 90 95
Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val Val Ile Thr Ile Asp
100 105 110
Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg Ser Ser Gln Gln Met
115 120 125
Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly Thr Ser Ser Ser Pro
130 135 140
Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly Val Met Gly Trp Ser
145 150 155 160
Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala Asn Asn Pro Ser Leu
165 170 175
Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser Ser Thr Asn Phe Ser
180 185 190
Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys Glu Asn Asp Ser Ile
195 200 205
Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr Asp Ser Met Ser Arg
210 215 220
Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly Ser His Ser Cys Ala
225 230 235 240
Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly Lys Lys Gly Val Ala
245 250 255
Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg Tyr Ser Thr Phe Ala
260 265 270
Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp Phe Arg Thr Ala Asn
275 280 285
Cys Ser
290
<210> 3
<211> 290
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 3
Met Asn Phe Pro Arg Ala Ser Arg Leu Met Gln Ala Ala Val Leu Gly
1 5 10 15
Gly Leu Met Ala Val Ser Ala Ala Ala Thr Ala Gln Thr Asn Pro Tyr
20 25 30
Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu Glu Ala Ser Ala Gly
35 40 45
Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg Pro Ser Gly Tyr Gly
50 55 60
Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly Gly Thr Val Gly Ala
65 70 75 80
Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln Ser Ser Ile Lys Trp
85 90 95
Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val Val Ile Thr Ile Asp
100 105 110
Thr Asn Ser Thr Phe Asp Tyr Pro Ser Ser Arg Ser Ser Gln Gln Met
115 120 125
Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly Asp Ser Ser Ser Pro
130 135 140
Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly Val Met Gly His Ser
145 150 155 160
Met Gly Gly Gly Ala Ser Leu Arg Ser Ala Ala Asn Asn Pro Ser Leu
165 170 175
Lys Ala Ala Ile Pro Gln Ala Pro Trp Asp Ser Gln Thr Asn Phe Ser
180 185 190
Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys Glu Asn Asp Ser Ile
195 200 205
Ala Pro Val Asn Ser His Ala Leu Pro Ile Tyr Asp Ser Met Ser Arg
210 215 220
Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly Ser His Ser Cys Ala
225 230 235 240
Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly Lys Lys Gly Val Ala
245 250 255
Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg Tyr Ser Thr Phe Ala
260 265 270
Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp Phe Arg Thr Ala Asn
275 280 285
Cys Ser
290
<210> 4
<211> 290
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 4
Met Asn Phe Pro Arg Ala Ser Arg Leu Met Gln Ala Ala Val Leu Gly
1 5 10 15
Gly Leu Met Ala Val Ser Ala Ala Ala Thr Ala Gln Thr Asn Pro Tyr
20 25 30
Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu Glu Ala Ser Ala Gly
35 40 45
Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg Pro Ser Gly Tyr Gly
50 55 60
Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly Gly Thr Val Gly Ala
65 70 75 80
Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln Ser Ser Ile Lys Trp
85 90 95
Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val Val Ile Thr Ile Asp
100 105 110
Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg Ser Ser Gln Gln Met
115 120 125
Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly Thr Ser Ser Ser Pro
130 135 140
Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly Val Met Gly Trp Ser
145 150 155 160
Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala Asn Asn Pro Ser Leu
165 170 175
Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser Ser Thr Asn Phe Ser
180 185 190
Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys Glu Asn Asp Ser Ile
195 200 205
Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr Asp Ser Met Ser Arg
210 215 220
Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly Ser His Ser Cys Ala
225 230 235 240
Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly Lys Lys Gly Val Ala
245 250 255
Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg Tyr Ser Thr Phe Ala
260 265 270
Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp Phe Arg Thr Ala Asn
275 280 285
Cys Ser
290
<210> 5
<211> 290
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 5
Met Asn Phe Pro Arg Ala Ser Arg Leu Met Gln Ala Ala Val Leu Gly
1 5 10 15
Gly Leu Met Ala Val Ser Ala Ala Ala Thr Ala Gln Thr Asn Pro Tyr
20 25 30
Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu Glu Ala Ser Ala Gly
35 40 45
Pro Phe Thr Val Arg Ser Phe Thr Val Glu Arg Pro Ser Gly Tyr Gly
50 55 60
Ala Gly Asp Val Tyr Tyr Pro Thr Asn Ala Gly Gly Thr Val Gly Ala
65 70 75 80
Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Ile Ser Ser Ile Lys Trp
85 90 95
Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val Val Ile Thr Ile Asp
100 105 110
Thr Thr Ser Thr Leu Asp Gln Pro Glu Ser Arg Ser Ser Gln Gln Met
115 120 125
Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly Asp Ser Ser Ser Pro
130 135 140
Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly Val Met Gly Trp Ser
145 150 155 160
Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala Asn Asn Pro Ser Leu
165 170 175
Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser Ser Thr Asn Phe Ser
180 185 190
Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys Glu Asn Asp Ser Ile
195 200 205
Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr Asp Ser Met Ser Arg
210 215 220
Cys Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly Ser His Ser Cys Ala
225 230 235 240
Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly Lys Lys Gly Val Ala
245 250 255
Trp Met Lys Arg Phe Leu Asp Asn Asp Thr Arg Tyr Ser Val Phe Ala
260 265 270
Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp Phe Arg Thr Ala Asn
275 280 285
Cys Ser
290
<210> 6
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 6
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 7
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 7
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 8
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 8
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 9
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 9
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 10
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 10
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 11
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 11
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 12
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 12
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 13
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 13
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 14
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 14
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 15
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 15
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 16
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 16
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 17
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 17
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 18
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 18
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 19
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 19
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 20
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 20
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 21
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 21
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 22
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 22
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 23
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 23
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 24
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 24
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 25
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Thr Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 26
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 26
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 27
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 27
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Leu Asp Gln Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly Trp Ser Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ala Pro Gln Ala Pro Trp His Ser
145 150 155 160
Ser Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 28
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 28
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Phe Asp Tyr Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly His Ser Met Gly Gly Gly Ala Ser Leu Arg Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ile Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Gln Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser His Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 29
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 29
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Phe Asp Tyr Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly His Ser Met Gly Gly Gly Ala Ser Leu Arg Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ile Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Gln Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser His Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 30
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 30
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Phe Asp Tyr Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly His Ser Met Gly Gly Gly Ala Ser Leu Arg Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ile Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Gln Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser His Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 31
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 31
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Phe Asp Tyr Pro Ser Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly His Ser Met Gly Gly Gly Ala Ser Leu Arg Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ile Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Gln Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser His Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 32
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 32
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Phe Asp Tyr Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly His Ser Met Gly Gly Gly Ala Ser Leu Arg Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ile Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Gln Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser His Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Arg Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 33
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 33
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Phe Asp Tyr Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly His Ser Met Gly Gly Gly Ala Ser Leu Arg Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ile Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Gln Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser His Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 34
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 34
Gln Thr Asn Pro Tyr Ala Arg Gly Pro Asn Pro Thr Ala Ala Ser Leu
1 5 10 15
Glu Ala Ser Ala Gly Pro Phe Thr Val Arg Ser Phe Thr Val Ser Arg
20 25 30
Pro Ser Gly Tyr Gly Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly
35 40 45
Gly Thr Val Gly Ala Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln
50 55 60
Ser Ser Ile Lys Trp Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val
65 70 75 80
Val Ile Thr Ile Asp Thr Asn Ser Thr Phe Asp Tyr Pro Glu Ser Arg
85 90 95
Ser Ser Gln Gln Met Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly
100 105 110
Asp Ser Ser Ser Pro Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly
115 120 125
Val Met Gly His Ser Met Gly Gly Gly Ala Ser Leu Arg Ser Ala Ala
130 135 140
Asn Asn Pro Ser Leu Lys Ala Ala Ile Pro Gln Ala Pro Trp Asp Ser
145 150 155 160
Gln Thr Asn Phe Ser Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys
165 170 175
Glu Asn Asp Ser Ile Ala Pro Val Asn Ser His Ala Leu Pro Ile Tyr
180 185 190
Asp Ser Met Ser Gln Asn Ala Lys Gln Phe Leu Glu Ile Lys Gly Gly
195 200 205
Ser His Ser Cys Ala Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly
210 215 220
Lys Lys Gly Val Ala Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg
225 230 235 240
Tyr Ser Thr Phe Ala Cys Glu Asn Pro Asn Ser Thr Ala Val Ser Asp
245 250 255
Phe Arg Thr Ala Asn Cys Ser
260
<210> 35
<211> 290
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 35
Met Asn Phe Pro Arg Ala Ser Arg Leu Met Gln Ala Ala Val Leu Gly
1 5 10 15
Gly Leu Met Ala Val Ser Ala Ala Ala Thr Ala Gln Thr Asn Pro Tyr
20 25 30
Ala Leu Gly Pro Asn Pro Thr Ala Ala Ser Leu Glu Ala Ser Ala Gly
35 40 45
Pro Phe Thr Val Arg Ser Phe Thr Val Ala Arg Pro Thr Gly Tyr Gly
50 55 60
Ala Gly Thr Val Tyr Tyr Pro Thr Asn Ala Gly Gly Thr Val Gly Ala
65 70 75 80
Ile Ala Ile Val Pro Gly Tyr Thr Ala Arg Gln Ser Ser Ile Lys Trp
85 90 95
Trp Gly Pro Arg Leu Ala Ser His Gly Phe Val Val Ile Thr Ile Asp
100 105 110
Thr Asn Ser Thr Leu Asp Gln Pro Ser Ser Arg Ser Ser Gln Gln Met
115 120 125
Ala Ala Leu Arg Gln Val Ala Ser Leu Asn Gly Thr Ser Ser Ser Pro
130 135 140
Ile Tyr Gly Lys Val Asp Thr Ala Arg Met Gly Val Met Gly Trp Ser
145 150 155 160
Met Gly Gly Gly Gly Ser Leu Ile Ser Ala Ala Asn Asn Pro Ser Leu
165 170 175
Lys Ala Ala Ala Pro Gln Ala Pro Trp Asp Ser Ser Thr Asn Phe Ser
180 185 190
Ser Val Thr Val Pro Thr Leu Ile Phe Ala Cys Glu Asn Asp Ser Val
195 200 205
Ala Pro Val Asn Ser Ser Ala Leu Pro Ile Tyr Asp Ser Met Ser Gln
210 215 220
Asn Ala Lys Gln Phe Leu Glu Ile Asn Gly Gly Ser His Ser Cys Cys
225 230 235 240
Asn Ser Gly Asn Ser Asn Gln Ala Leu Ile Gly Lys Lys Gly Val Ala
245 250 255
Trp Met Lys Arg Phe Met Asp Asn Asp Thr Arg Tyr Ser Thr Phe Ala
260 265 270
Cys Glu Asn Pro Asn Ser Thr Arg Val Ser Asp Phe Arg Thr Ala Asn
275 280 285
Cys Ser
290
<210> 36
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 36
His His His His His His
1 5
<210> 37
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 37
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
Claims (23)
- 서열번호 1과 적어도 90% 동일하고 N233, S58, N114, S121, N225, M262, T270, T140, S61, I208 및 R224로 이루어진 군으로부터 선택된 서열번호 1에 대한 위치에 대응하는 적어도 하나의 돌연변이를 갖는 아미노산 서열을 포함하는 조작된 PET(폴리(에틸렌 테레프탈레이트)) 가수분해효소.
- 제1항에 있어서,
상기 적어도 하나의 돌연변이는 N233K, S58E, S58A, N114T, S121E, N225C, M262L, T270V, T140D, S61T, I208V, 및 R224Q로 이루어진 군으로부터 선택되는, 조작된 PET 가수분해효소. - 제1항에 있어서,
상기 적어도 하나의 돌연변이는 S58Y, S58M, S58L, S58V, S58P, S61D, S61E, S61Y, S61F, N114H, N114L, N114R, N114S, N114T, T140Y, T140L, T140I, T140V, T140S, I208M, I208H, I208F, I208Y, I208P, I208A, R224D, R224E, R224S, R224T, R224N, R224Q, N225N, N225I, N225V, N225M, N225A, N225L, N225S, N225T, N233R, N233Y, N233H, N233P, M262L, M262I, M262A, M262V, M262F, M262W, T270Y, T270R, 및 T270H로 이루어진 군으로부터 선택되는, 조작된 PET 가수분해효소. - 제1항 또는 제2항 또는 제3항에 있어서,
상기 아미노산 서열은 서열번호 1, 서열번호 2 또는 서열번호 3과 적어도 95%, 98% 또는 99% 동일한, 조작된 PET 가수분해효소. - 제1항 또는 제2항 또는 제3항에 있어서,
상기 아미노산 서열은 상기 적어도 하나의 돌연변이를 제외하고는 서열번호 1, 서열번호 2 또는 서열번호 3과 동일한, 조작된 PET 가수분해효소. - 제1항 또는 제2항 또는 제3항에 있어서,
상기 아미노산 서열은 서열번호 6 내지 서열번호 34 중 하나 이상과 적어도 95%, 98%, 99% 또는 100% 동일한, 조작된 PET 가수분해효소. - 제1항 또는 제4항에 있어서,
상기 아미노산 서열은 N233K, S58E, S58A, N114T, S121E, N225C, M262L, T270V, T140D, S61T, I208V, 및 R224Q로 이루어진 군으로부터 선택된 서열번호 1에 대한 위치에 대응하는 적어도 2개의 돌연변이를 갖는, 조작된 PET 가수분해효소. - 제1항 또는 제4항에 있어서,
상기 아미노산 서열은 N233K, S58E, S58A, N114T, S121E, N225C, M262L, T270V, T140D, S61T, I208V, R224Q, S58Y, S58M, S58L, S58V, S58P, S61D, S61E, S61Y, S61F, N114H, N114L, N114R, N114S, N114T, T140Y, T140L, T140I, T140V, T140S, S121E, I208M, I208H, I208F, I208Y, I208P, I208A, R224D, R224E, R224S, R224T, R224N, R224Q, N225N, N225I, N225V, N225M, N225A, N225L, N225S, N225T, N233R, N233Y, N233H, N233P, M262L, M262I, M262A, M262V, M262F, M262W, T270Y, T270R, 및 T270H로 이루어진 군으로부터 선택된 서열번호 1에 대한 위치에 대응하는 2개 또는 3개의 돌연변이를 갖는, 조작된 PET 가수분해효소. - 제1항 내지 제8항 중 어느 한 항에 따른 조작된 PET 가수분해효소를 인코딩하는 폴리뉴클레오티드.
- 제9항에 있어서,
상기 조작된 PET 가수분해효소는 신호 펩티드를 추가로 포함하는, 폴리뉴클레오티드. - 프로모터가 상기 조작된 PET 가수분해효소의 발현을 제어하도록 제9항 또는 제10항에 따른 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함하는, 벡터.
- 제9항 또는 제10항에 따른 폴리뉴클레오티드 또는 제11항에 따른 벡터를 포함하는, 숙주 세포.
- 제12항에 있어서,
상기 숙주 세포는 미생물 세포인, 숙주 세포. - 제12항에 있어서,
상기 숙주 세포는 박테리아 세포인, 숙주 세포. - 제 항에 있어서,
상기 박테리아 세포는 슈도모나스 푸티다(Pseudomonas putida)인, 숙주 세포. - 제12항에 있어서,
상기 숙주 세포는 곰팡이 세포인, 숙주 세포. - PET를 분해하는 조건하에서 PET를 제1항 내지 제8항 중 어느 한 항에 따른 조작된 PET 가수분해효소와 접촉시키는 단계를 포함하는, 폴리(에틸렌 테레프탈레이트)(PET)의 분해 방법.
- 제17항에 있어서,
상기 PET를 상기 조작된 PET 가수분해효소를 발현하고 분비하는 숙주 세포와 접촉시키는 단계를 포함하는, 방법. - 제17항에 있어서,
상기 조작된 PET 가수분해효소가 정제되는, 방법. - 제17항 내지 제19항 중 어느 한 항에 있어서,
상기 조건은 25~70°C 사이의 온도에서의 인큐베이션을 포함하는, 방법. - 제20항에 있어서,
상기 온도는 25~40°C 또는 30~40°C 또는 25~45°C인, 방법. - 제20항에 있어서,
상기 온도는 40~70°C 또는 45~65°C 또는 45~55°C인, 방법. - 제17항 내지 제22항 중 어느 한 항에 있어서,
상기 조건은 pH 6~10(예컨대, 6~8, 7~8.5, 또는 8~10)에서의 인큐베이션을 포함하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063088321P | 2020-10-06 | 2020-10-06 | |
US63/088,321 | 2020-10-06 | ||
PCT/US2021/053530 WO2022076380A2 (en) | 2020-10-06 | 2021-10-05 | Mutations for improving activity and thermostability of petase enzymes |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230078754A true KR20230078754A (ko) | 2023-06-02 |
Family
ID=81127136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237014443A KR20230078754A (ko) | 2020-10-06 | 2021-10-05 | 페타제 효소의 활성 및 열안정성 개선을 위한 돌연변이 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP4225334A2 (ko) |
JP (1) | JP2023544194A (ko) |
KR (1) | KR20230078754A (ko) |
CN (1) | CN116745414A (ko) |
WO (1) | WO2022076380A2 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023154690A2 (en) * | 2022-02-10 | 2023-08-17 | Board Of Regents, The University Of Texas System | Leaf-branch compost cutinase mutants |
GB202207298D0 (en) * | 2022-05-18 | 2022-06-29 | Cambridge Entpr Ltd | Improved plastic degrading enzymes |
CN114891776B (zh) * | 2022-05-24 | 2024-03-12 | 天津大学 | 双酶分层级联纳米晶体的构建及其作用pet塑料降解的方法 |
CN115927248B (zh) * | 2022-08-18 | 2023-11-07 | 湖北大学 | 一种短糖链修饰的IsPETase及其制备方法和应用 |
-
2021
- 2021-10-05 EP EP21878340.5A patent/EP4225334A2/en active Pending
- 2021-10-05 CN CN202180068731.8A patent/CN116745414A/zh active Pending
- 2021-10-05 KR KR1020237014443A patent/KR20230078754A/ko not_active Application Discontinuation
- 2021-10-05 WO PCT/US2021/053530 patent/WO2022076380A2/en active Application Filing
- 2021-10-05 JP JP2023521049A patent/JP2023544194A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN116745414A (zh) | 2023-09-12 |
EP4225334A2 (en) | 2023-08-16 |
WO2022076380A2 (en) | 2022-04-14 |
JP2023544194A (ja) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yan et al. | Thermophilic whole‐cell degradation of polyethylene terephthalate using engineered Clostridium thermocellum | |
JP7392029B2 (ja) | 新規エステラーゼ及びその使用 | |
KR20230078754A (ko) | 페타제 효소의 활성 및 열안정성 개선을 위한 돌연변이 | |
US12098398B2 (en) | Esterases and uses thereof | |
CN116286727A (zh) | 一种角质酶变体及其制备方法和在塑料降解中的应用 | |
Lu et al. | Deep learning redesign of PETase for practical PET degrading applications | |
AU2021367905A1 (en) | Novel esterases and uses thereof | |
US20240327809A1 (en) | Enzymes and Uses Thereof | |
EP4237550A1 (en) | Novel esterases and uses thereof | |
WO2023154690A2 (en) | Leaf-branch compost cutinase mutants | |
WO2024040310A1 (en) | Enzymes and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
WITB | Written withdrawal of application |