PL213994B1 - Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB - Google Patents
Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIBInfo
- Publication number
- PL213994B1 PL213994B1 PL394914A PL39491407A PL213994B1 PL 213994 B1 PL213994 B1 PL 213994B1 PL 394914 A PL394914 A PL 394914A PL 39491407 A PL39491407 A PL 39491407A PL 213994 B1 PL213994 B1 PL 213994B1
- Authority
- PL
- Poland
- Prior art keywords
- proteinase
- splb
- seq
- val
- sequence
- Prior art date
Links
- 108091005804 Peptidases Proteins 0.000 title claims description 180
- 102000035195 Peptidases Human genes 0.000 title claims description 180
- 235000019833 protease Nutrition 0.000 title claims description 176
- 108090000765 processed proteins & peptides Proteins 0.000 title description 47
- 102000004196 processed proteins & peptides Human genes 0.000 title description 43
- 108090000623 proteins and genes Proteins 0.000 claims description 91
- 102000004169 proteins and genes Human genes 0.000 claims description 88
- 238000000034 method Methods 0.000 claims description 47
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 37
- 102000004190 Enzymes Human genes 0.000 claims description 36
- 108090000790 Enzymes Proteins 0.000 claims description 36
- 238000002360 preparation method Methods 0.000 claims description 17
- 239000002773 nucleotide Substances 0.000 claims description 16
- 125000003729 nucleotide group Chemical group 0.000 claims description 16
- 230000001580 bacterial effect Effects 0.000 claims description 14
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 12
- 244000063299 Bacillus subtilis Species 0.000 claims description 6
- 238000001042 affinity chromatography Methods 0.000 claims description 5
- 239000000872 buffer Substances 0.000 claims description 5
- 230000028327 secretion Effects 0.000 claims description 5
- 238000005119 centrifugation Methods 0.000 claims description 4
- 238000004255 ion exchange chromatography Methods 0.000 claims description 4
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 claims description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 claims description 2
- 235000011130 ammonium sulphate Nutrition 0.000 claims description 2
- 239000007853 buffer solution Substances 0.000 claims description 2
- 238000000855 fermentation Methods 0.000 claims description 2
- 230000004151 fermentation Effects 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 239000001166 ammonium sulphate Substances 0.000 claims 1
- 235000013351 cheese Nutrition 0.000 description 213
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 196
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 176
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 166
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 160
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 149
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 125
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 118
- 235000001014 amino acid Nutrition 0.000 description 83
- 229940024606 amino acid Drugs 0.000 description 83
- 235000018102 proteins Nutrition 0.000 description 83
- 150000001413 amino acids Chemical class 0.000 description 82
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 79
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 53
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 53
- 239000000758 substrate Substances 0.000 description 53
- 229920001184 polypeptide Polymers 0.000 description 36
- 229940088598 enzyme Drugs 0.000 description 35
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 32
- 241000282326 Felis catus Species 0.000 description 22
- 239000012634 fragment Substances 0.000 description 22
- 238000006460 hydrolysis reaction Methods 0.000 description 22
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 21
- 108020001507 fusion proteins Proteins 0.000 description 21
- 102000037865 fusion proteins Human genes 0.000 description 21
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 20
- 230000000694 effects Effects 0.000 description 20
- 230000007062 hydrolysis Effects 0.000 description 19
- 108010017391 lysylvaline Proteins 0.000 description 18
- 102000011632 Caseins Human genes 0.000 description 17
- 108010076119 Caseins Proteins 0.000 description 17
- 108010076504 Protein Sorting Signals Proteins 0.000 description 16
- 230000003197 catalytic effect Effects 0.000 description 16
- 238000003776 cleavage reaction Methods 0.000 description 16
- 230000007017 scission Effects 0.000 description 16
- 108010051110 tyrosyl-lysine Proteins 0.000 description 16
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 15
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 14
- 230000002209 hydrophobic effect Effects 0.000 description 14
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 13
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 12
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 11
- 108091026890 Coding region Proteins 0.000 description 11
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 11
- 230000029087 digestion Effects 0.000 description 11
- 108010053725 prolylvaline Proteins 0.000 description 11
- 230000001810 trypsinlike Effects 0.000 description 11
- 235000021247 β-casein Nutrition 0.000 description 11
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 10
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 10
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 10
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 10
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 10
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 10
- 108010092854 aspartyllysine Proteins 0.000 description 10
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 10
- 230000002797 proteolythic effect Effects 0.000 description 10
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 9
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 9
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 9
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 9
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 9
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 9
- SAPLASXFNUYUFE-CQDKDKBSSA-N His-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N SAPLASXFNUYUFE-CQDKDKBSSA-N 0.000 description 9
- CHIAUHSHDARFBD-ULQDDVLXSA-N His-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 CHIAUHSHDARFBD-ULQDDVLXSA-N 0.000 description 9
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 9
- 241000191967 Staphylococcus aureus Species 0.000 description 9
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 9
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 9
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 9
- 238000011534 incubation Methods 0.000 description 9
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 8
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 8
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 8
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 8
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 8
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 8
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 8
- -1 Leu Chemical group 0.000 description 8
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 8
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 8
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 8
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 8
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 8
- 235000014304 histidine Nutrition 0.000 description 8
- 108010054155 lysyllysine Proteins 0.000 description 8
- 229960004072 thrombin Drugs 0.000 description 8
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 7
- 108091035707 Consensus sequence Proteins 0.000 description 7
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 7
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 7
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 7
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 7
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 7
- 108010070643 prolylglutamic acid Proteins 0.000 description 7
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 6
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 6
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 6
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 6
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 6
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 239000005018 casein Substances 0.000 description 6
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 6
- 235000021240 caseins Nutrition 0.000 description 6
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 5
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 5
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 5
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 5
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 5
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 5
- 108090000190 Thrombin Proteins 0.000 description 5
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 108010021889 valylvaline Proteins 0.000 description 5
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 4
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 4
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 4
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 4
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 4
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 4
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 4
- 101000856199 Homo sapiens Chymotrypsin-like protease CTRL-1 Proteins 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 4
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 4
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 4
- 241000579835 Merops Species 0.000 description 4
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 4
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 4
- SWRNSCMUXRLHCR-ULQDDVLXSA-N Pro-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 SWRNSCMUXRLHCR-ULQDDVLXSA-N 0.000 description 4
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 244000269722 Thea sinensis Species 0.000 description 4
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 4
- 108090000631 Trypsin Proteins 0.000 description 4
- 102000004142 Trypsin Human genes 0.000 description 4
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 4
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 4
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 4
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 4
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 4
- 235000004554 glutamine Nutrition 0.000 description 4
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 229910052716 thallium Inorganic materials 0.000 description 4
- BKVIYDNLLOSFOA-UHFFFAOYSA-N thallium Chemical compound [Tl] BKVIYDNLLOSFOA-UHFFFAOYSA-N 0.000 description 4
- 239000012588 trypsin Substances 0.000 description 4
- 108010009962 valyltyrosine Proteins 0.000 description 4
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 3
- 102100025566 Chymotrypsin-like protease CTRL-1 Human genes 0.000 description 3
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 3
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 3
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 3
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 3
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 3
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 3
- FADYJNXDPBKVCA-STQMWFEESA-N Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FADYJNXDPBKVCA-STQMWFEESA-N 0.000 description 3
- 101100422130 Staphylococcus aureus splB gene Proteins 0.000 description 3
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 3
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 3
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 3
- 102220131994 rs200737977 Human genes 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 2
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 2
- 241001474374 Blennius Species 0.000 description 2
- 239000008001 CAPS buffer Substances 0.000 description 2
- 108010075031 Cytochromes c Proteins 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108010069304 Exfoliatins Proteins 0.000 description 2
- 108010014173 Factor X Proteins 0.000 description 2
- 108010024636 Glutathione Proteins 0.000 description 2
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- 201000005569 Gout Diseases 0.000 description 2
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 2
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 2
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 2
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 2
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 2
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- 239000008351 acetate buffer Substances 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 210000000991 chicken egg Anatomy 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 229960003180 glutathione Drugs 0.000 description 2
- 150000002411 histidines Chemical class 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 229940052586 pro 12 Drugs 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 235000004400 serine Nutrition 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 101150040819 splB gene Proteins 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000007805 zymography Methods 0.000 description 2
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- QXRNAOYBCYVZCD-BQBZGAKWSA-N Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 102100033312 Alpha-2-macroglobulin Human genes 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 1
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 1
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101000984722 Bos taurus Pancreatic trypsin inhibitor Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 101100228200 Caenorhabditis elegans gly-5 gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 241000283153 Cetacea Species 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 101710131551 Chymotrypsin-like serine proteinase Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000186031 Corynebacteriaceae Species 0.000 description 1
- 102100030497 Cytochrome c Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 1
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 1
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- JMEWFDUAFKVAAT-WDSKDSINSA-N Met-Asn Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O JMEWFDUAFKVAAT-WDSKDSINSA-N 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 102100030856 Myoglobin Human genes 0.000 description 1
- 108010062374 Myoglobin Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- VEQPNABPJHWNSG-UHFFFAOYSA-N Nickel(2+) Chemical compound [Ni+2] VEQPNABPJHWNSG-UHFFFAOYSA-N 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108010058846 Ovalbumin Proteins 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- 108010015078 Pregnancy-Associated alpha 2-Macroglobulins Proteins 0.000 description 1
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 101000903582 Rattus norvegicus Cytosolic acyl coenzyme A thioester hydrolase Proteins 0.000 description 1
- 101100229449 Rattus norvegicus Gcg gene Proteins 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108050000761 Serpin Proteins 0.000 description 1
- 102000008847 Serpin Human genes 0.000 description 1
- 102220493338 Sodium/calcium exchanger 3_H39A_mutation Human genes 0.000 description 1
- 101000898015 Staphylococcus aureus Exfoliative toxin A Proteins 0.000 description 1
- 101000829189 Staphylococcus aureus Glutamyl endopeptidase Proteins 0.000 description 1
- 101900341021 Staphylococcus aureus Glutamyl endopeptidase Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- PCMDGXKXVMBIFP-VEVYYDQMSA-N Thr-Met-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMDGXKXVMBIFP-VEVYYDQMSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000004338 Transferrin Human genes 0.000 description 1
- 108090000901 Transferrin Proteins 0.000 description 1
- 101710162629 Trypsin inhibitor Proteins 0.000 description 1
- 229940122618 Trypsin inhibitor Drugs 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 108010062636 apomyoglobin Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000012926 crystallographic analysis Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000002901 elastaselike Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 229940066758 endopeptidases Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000013383 initial experiment Methods 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229910001453 nickel ion Inorganic materials 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 229940092253 ovalbumin Drugs 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000007065 protein hydrolysis Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000003001 serine protease inhibitor Substances 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 239000012581 transferrin Substances 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010036320 valylleucine Proteins 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
Landscapes
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
Opis wynalazku
Wynalazek dotyczy mutanta proteinazy SplB i sposobu otrzymywania mutanta proteinazy SplB. Ujawniono metodę otrzymywania proteinazy SplB, jej zastosowania do specyficznej hydrolizy łańcucha polipeptydowego, sekwencji aminokwasowych przez nią rozpoznawanych oraz ich zastosowań.
Enzymy proteolityczne (proteinazy) o wysokiej specyficzności działania (rozpoznające i hydrolizujące jedynie wybrane wiązania peptydowe) są stosowane na szeroką skalę w laboratoriach i przemyśle biotechnologicznym do specyficznej hydrolizy polipeptydów (przede wszystkim następujące: enterokinaza, czynnik X, trombina, proteinaza TEV, proteinaza PreScission™ oraz o mniejszej specyficzności, ale też szeroko wykorzystywane jak V8 i trypsyna). W szczególności, lecz nie jedynie, stosuje się omawiane enzymy do usuwania tzw. metek fuzyjnych, fragmentów polipeptydów rekombinowanych użytecznych na pośrednich etapach analizy lub produkcji (służących np. do detekcji, oczyszczania) jednak niepożądanych w produkcie końcowym. W teorii wysoka specyficzność zastosowanego enzymu w połączeniu z wydajnie rozpoznawanym przez niego miejscem wprowadzonym pomiędzy „metką” a częścią polipeptydu stanowiącą ostatecznie pożądany produkt pozwala na precyzyjne usunięcie ,,metki” bez ryzyka degradacji pożądanego polipeptydu. Niestety brak całkowicie specyficznych enzymów proteolitycznych powoduje, że w wielu przypadkach rezultatem ich działania jest nie tylko pożądane odcięcie metki” fuzyjnej, ale także niespecyficzna degradacja interesującego polipeptydu, jeśli zawiera on miejsca podobne do sekwencji specyficznie rozpoznawanej przez enzym. Ponadto najpopularniejsze ze stosowanych obecnie enzymów nie są dostępne w postaci białek zrekombinowanych lub z uwagi na trudności w produkcji są w tej formie znacznie droższe od białek natywnych izolowanych z osocza krwi (trombina, czynnik X) lub jelit (enterokinaza). Zastosowanie białek natywnych stwarza jednak ryzyko zanieczyszczenia preparatów niepożądaną aktywnością innych enzymów lub patogenami. Wymienione czynniki stwarzają zapotrzebowanie na nowe enzymy, które będą mogły sprostać specyficznym zadaniom.
Szczególnie pożądane jest uzyskanie proteinaz o wąskiej specyficzności substratowej, które mogłyby znaleźć zastosowanie jako precyzyjne narzędzie biotechnologiczne (przykładowe opisy patentowe: US 4 543 329, US 5 013 653, US 6 906 176, US 7 189 540 ).
Sekwencja aminokwasowa proteinazy SplB pochodzącej ze Staphylococcus aureus jest znana i została opisana w publikacji J. Mol. Biol. (2006) 358, 270-279. W pracy tej ujawniono także mało wydajną, niewygodną, laboratoryjną metodę produkcji rekombinowanej proteinazy SplB poprzez ekspresję w E. coli oraz wykazano aktywność proteolityczną na kazeinie powyższego preparatu metodą zymografii. Nie była jednak poznana specyficzność substratowa tego enzymu ani wydajny sposób jego otrzymywania. Ponadto, znane jest wiele proteinaz serynowych chymotrypsynopodobnych (w przypadku podobieństw strukturalnych określenie chymotrypsynopodobny odnosi się do tej samej grupy proteinaz co określenie trypsynopodobny i są one tutaj stosowane zamiennie; jedynie w przypadku określania typów aktywności określenia te są rozdzielne jednak jako takie nie są używane w opisie), do których należy proteinaza SplB (MEROPS: S01.282). Podobieństwo sekwencji aminokwasowej do innych proteinaz z tej grupy pozwoliła zaliczyć proteinazę SplB do rodziny S1 wg ogólnie przyjętej klasyfikacji za bazą danych MEROPS (http ://me/O£>s.sanger.ac.uk/; Rawlings, N.D., Morton, F.R. & Barrett, A.J. (2006) MEROPS'. the peptidase database. Nucleic Acids Res 34, D270-D272). Zgodnie z powszechnym przeświadczeniem wyrażonym m.in. w wiodącej referencji z dziedziny enzymów proteolitycznych, bazie danych MEROPS uznaje się, że: „Wszystkie scharakteryzowane peptydazy należące do rodziny chymotrypsynopodobnych są endopeptydazami. Istnieją także liczne, nie będące peptydazami homologii, w których reszty katalityczne zostały zastąpione. Istnieją trzy główne typy aktywności: trypsynopodobny, w którym następuje odtrawienie substratu amidowego następującego po resztach Arg lub Lys w pozycji P1, chymotrypsynopodobny, w którym trawienie następuje za jednym z aminokwasów hydrofobowych w P1 i elastazopodobny, w którym trawienie następuje za resztą Ala w pozycji P1. Specyficzność substratowa rodziny S1 zależy jedynie od aminokwasu znajdującego się w pozycji P1. Większość peptydaz należących do tej rodziny podlega sekrecji i posiada N-końcowy sekrecyjny peptyd sygnałowy. Są one syntetyzowane w postaci prekursorów z dodatkową sekwencją na N-końcu, której usunięcie daje aktywną formę enzymu. Aktywacja nie zawsze wymaga usunięcia propeptydu. Jak pokazano w dalszej części niniejszego opisu ogólne wskazówki zawarte w stanie techniki mogą prowadzić jedynie do błędnych wniosków dotyczących specyficzności substratowej proteinazy SplB i uznania ją za enzym o nikłej przydatności przemysłowej.
PL 213 994 Β1
W świetle opisanego stanu techniki celem niniejszego wynalazku jest dostarczenie wysoce specyficznej proteinazy oraz sposobu jej otrzymywania oraz charakterystyki jej aktywności pozwalającej na jej przemysłowe wykorzystywanie.
Nieoczekiwanie twórcy tego wynalazku ustalili, że proteinaza SplB posiada dużo węższą niż oczekiwana specyficzność substratową. Bazując na tym odkryciu zaproponowano nowe specyficzne substraty dla proteinazy SplB oraz sposoby hydrolizy i/lub otrzymywania białek wykorzystujące takie peptydy (fragmenty sekwencji) oraz nowe zastosowania proteinazy SplB. Uzyskanie tych wyników było możliwe dzięki opracowaniu wydajnej metody produkcji proteinazy SplB, którą ujawniono w niniejszym opisie.
W opisie ujawniono polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB posiadający sekwencję aminokwasowąXaa1-Xaa2-Xaa3-Xaa4-Xaa5, gdzie:
Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly,
Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr,
Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,
Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,
Xaa5 jest pominięty lub jest dowolnym aminokwasem.
Ujawniony polipeptyd charakteryzuje się tym, że korzystnie posiada sekwencję wybraną spośród:
Trp-Glu-Leu-Gln-Gly,
Trp-Glu-Leu-GIn,
Trp-Glu-Leu-Thr,
Trp-Glu-Val-Gln,
Val-Glu-Leu-Gln,
Trp-GIn-Leu-Asp,
Trp-Val-Leu-Gln,
Phe-Glu-Val-Glu,
Gly-Arg-Gly-Val-Gly,
Gly-Arg-Gly-Val,
Val-Glu-lle-Asp.
Kolejno w niniejszym opisie ujawniono białko rozpoznawane przez proteinazę SplB posiadające sekwencję aminokwasową zawierającą zdefiniowany powyżej polipeptyd. Następnie ujawniono sekwencję nukleotydową kodującą ujawniony polipeptyd zdefiniowany powyżej oraz sekwencję nukleotydową kodującą ujawnione białko zdefiniowane powyżej.
Ujawniono również zastosowanie sekwencji polipeptydu zdefiniowanej powyżej lub jego pochodnej przy wytwarzaniu białka rozpoznawanego przez proteinazę SplB lub jej pochodną.
Ujawniono kolejno sposób otrzymywania pożądanego białka charakteryzujący się tym, że:
a) dostarcza się białko fuzyjne posiadające sekwencję Z1-Xaa1-Xaa2-Xaa3-Xaa4-Z2, gdzie: Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly, Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr, Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,
Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,
Z1 i Z2 oznacza polipeptyd zawierający jeden lub więcej aminokwasów, przy czym jeden z nich oznacza polipeptyd zawierający pożądane białko a drugi polipeptyd zawierający polipeptyd znacznikowy,
b) izoluje się białko fuzyjne, korzystnie techniką chromatograficzną stosując złoże posiadające powinowactwo do polipeptydu znacznikowego,
c) prowadzi się reakcję hydrolizy białka fuzyjnego za pomocą proteinazy posiadającej aktywność enzymatyczną proteinazy SplB, przy czym korzystnie izoluje się pożądane białko z mieszaniny reakcyjnej.
Dla celów niniejszego opisu jako polipeptyd zawierający polipeptyd znacznikowy, zwany też w niniejszym opisie metką lub polipeptydem znacznikowym, należy rozumieć sekwencję pozwalającą na izolowanie zawierającego ją polipeptydu, zwłaszcza techniką chromatografii powinowactwa. Specjalista będzie w stanie zaproponować opierając się na powszechnie dostępnej wiedzy szereg tego rodzaju sekwencji, które można wykorzystać do zaprojektowania układu do izolowania produkowanego białka w szczególności techniką chromatografii powinowactwa. Przykładowo, wprowadzenie sekwencji rozpoznawanej przez przeciwciało pozwala na izolowanie zawierającego ją białka za pomocą tego przeciwciała. Innym przykładem są sekwencje aminokwasowe posiadające powinowactwo do glutationu. Kolejnym przykładem są techniki opierające się na znanym zjawisku tworzenia kompleksów niektórych jonów metali z niektórymi
PL213 994B1 resztami aminokwasowymi. Najbardziej znanym przykładem takiego układu jest kompleksowanie jonów niklu przez pierścienie imidazolowe histydyn wprowadzonych do izolowanego łańcucha polipeptydowego. Wszystkie tego typu układy składające się ze znacznikowej sekwencji aminokwasowej i substancji, do której taka sekwencja posiada odpowiednio silne powinowactwo, pozwalają zaprojektować system oczyszczania białka zawierającego sekwencję znacznikową. Zwykle będzie to technika chromatografii powinowactwa na złożu zawierającym wspomnianą substancję.
W związku z powyższym, znacznikowa sekwencja aminokwasowa może zawierać sekwencję składającą się z sześciu kolejnych histydyn (His6).
Pożądane białko wchodzące w skład ujawnionego białka fuzyjnego wspominanego powyżej może być dowolnym znanym białkiem, dla którego znana jest sekwencja aminokwasowa lub sekwencja kodująca. Przykładowo, może to być białko lecznicze, którego produkcja pożądana jest ze względu na jego właściwości terapeutyczne. W oparciu o instrukcje ujawnione w niniejszym opisie oraz powszechnie dostępną wiedzę fachowiec będzie w stanie opracować sekwencję kodującą białko fuzyjne zawierającą sekwencję kodującą pożądane białko. Sekwencje aminokwasowe lub sekwencje kodujące znanych białek mogą być przykładowo pozyskane z bazy GenBank dostępnej w sieci internet pod adresem http://www.ncbi.nim.nih.gov/Genbank/index.html, w której zgromadzono sekwencje znanych genów oraz sekwencje aminokwasowe znanych białek. Aby zwiększyć poziom ekspresji białka fuzyjnego w układzie bakteryjnym można zastosować znane metody podnoszenia poziomu ekspresji w komórkach bakteryjnych, które obejmują stosowanie silnych promotorów, stosowanie sekwencji wzmacniających transkrypcję lub stosowanie kodonów preferowanych przez wybraną komórkę bakteryjną.
Ujawniony sposób charakteryzuje się tym, że, białko fuzyjne posiada, korzystnie, sekwencję wybraną spośród:
Z1 -T rp-Glu-Leu-Gln-Z2,
Z1 -T rp-Glu-Leu-Thr-Z2,
Z1-Trp-Glu-Val-Gln-Z2,
Z1 -Val-Glu-Leu-Gln-Z2,
Z1 -T rp-Gln-Leu-Asp-Z2,
Z1 -T rp-Val-Leu-Gln-Z2,
Z1-Phe-Glu-Val-Glu-Z2,
Z1 -Gly-Arg-Gly-Val-Gly-Z2,
Z1-Gly-Arg-Gly-Val-Z2, Z1-Val-Glu-lle-Asp-Z2.
W ujawnionym sposobie hydrolizę prowadzi się korzystnie w temperaturze od 0°C do 45°C, w pH od 6,0 do 9,0 lub w buforze fosforanowym, Bis-Tris, CAPS lub Tris o stężeniu od 1 do 250mM lub w roztworze zawierającym od 0 do 500mM NaCI.
Przedmiotem wynalazku jest mutant proteinazy SplB charakteryzujący się tym, że posiada sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.
Korzystnie, sekwencja sekrecyjna jest bakteryjną sekwencją sekrecyjną z Bacillus subtilis. Kolejnym przedmiotem wynalazku jest sekwencja nukleotydowa kodująca mutanta proteinazy SplB posiadającego sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.
Korzystnie sekwencja nukleotydową posiada sekwencję wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11.
Kolejnym przedmiotem wynalazku jest sposób otrzymywania mutanta proteinazy SplB, charakteryzujący się tym, że:
a) w komórkach gospodarza bakteryjnego prowadzi się ekspresję mutanta proteinazy SplB posiadającego sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12, korzystnie kodowanego przez sekwencję nukleotydową wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11, a następnie;
b) izoluje się pożądany enzym lub zawierającą go frakcję.
Korzystnie, gospodarzem bakteryjnym jest szczep Bacillus subtilis ekspresjonujący białko kodowane przez sekwencję nukleotydową przedstawioną jako SEQ ID No.: 3.
Korzystnie, w etapie b) oddziela się brzeczkę fermentacyjną od masy bakteryjnej poprzez wirowanie, białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysala się siarczanem
PL 213 994 Β1 amonu, oddziela się wysolone białka i rozpuszcza w niewielkiej ilości roztworu buforowego i dializuje się do buforu o pH około 5,5.
Korzystnie, w etapie b) dodatkowo oczyszcza się wyizolowane białko techniką chromatografii powinowactwa, chromatografii jonowymiennej i/lub sączenia molekularnego, a ostatecznie oczyszczony preparat zagęszcza się i ewentualnie poddaje krystalizacji.
W jednej z korzystnych realizacji sposobu produkcji aktywnej proteinazy SplB można wykorzystać zdolności katalityczne samego enzymu. W metodzie tej produkuje się enzym z N-terminalną metką fuzyjną wybraną korzystnie z bogatej puli opisanych metek lub nowym peptydem o własnościach pożądanych dla metki. Metkę taką może stanowić przykładowo, lecz nie jedynie metka histydynowa (tzw. ang. His-tag). Pomiędzy metkę fuzyjną a sekwencję proteinazy SplB wstawia się dogodnie sekwencję rozpoznawaną i przecinaną przez proteinazę SplB. Po wyprodukowaniu opisanego białka fuzyjnego izoluje się je wykorzystując właściwości metki, a następnie odcina się metkę przy pomocy katalitycznych ilości proteinazy SplB. Uwolniona od metki proteinaza SplB zwiększa pulę aktywnego enzymu przyspieszając zakończenie procesu odcinania. Odcinanie metki można prowadzić bezpośrednio na złożu stosowanym do izolacji białka fuzyjnego lub też po elucji, przy czym pierwsza metoda pozwala na jednoczesne oczyszczenie proteinazy od metki fuzyjnej, natomiast w drugim przypadku konieczne jest wprowadzenie dodatkowego stopnia oczyszczania.
W opisie ujawniono zastosowanie proteinazy SplB do specyficznej hydrolizy polipeptydu zawierającego sekwencję aminokwasowąXaa1-Xaa2-Xaa3-Xaa4, gdzie:
Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly, Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr, Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly, Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn.
Hydrolizowany polipeptyd może posiadać sekwencję aminokwasową zawierającą sekwencję wybraną spośród:
Trp-Glu-Leu-Gln-Gly,
Trp-Glu-Leu-GIn,
Trp-Glu-Leu-Thr,
Trp-Glu-Val-Gln,
Val-Glu-Leu-Gln,
Trp-GIn-Leu-Asp,
Trp-Val-Leu-Gln,
Phe-Glu-Val-Glu,
Gly-Arg-Gly-Val-Gly,
Gly-Arg-Gly-Val,
Val-Glu-lle-Asp.
Hydrolizę można prowadzić w temperaturze od 0°C do 45°C, w pH od 6,0 do 9,0. Hydrolizę prowadzi się również w buforze fosforanowym, Bis-Tris, CAPS lub Tris o stężeniu od 1 do 250mM lub w roztworze zawierającym od 0 do 500mM NaCI.
Ujawniono również proteinazę posiadającą aktywność proteinazy Sól posiadającą centrum aktywne tworzone przez triadę katalityczną His, Asp i Ser, przy czym RMSD atomów aminokwasów tworzących triadę katalityczną jest niewiększe niż 1,7A, korzystnie niewiększe niż 1,5A, w zestawieniu z His 39, Asp 77 i Ser 157 zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.
Korzystnie, ujawniona proteinaza charakteryzuje się tym, że RMSD węgli Ca łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych rdzenia cząsteczki (a więc nie uwzględniając pętli, innych elementów ruchomych, fragmentów eksponowanych na zewnątrz cząsteczki oraz jej słabo zdefiniowanych elementów wg sztuki) jest niewiększe niż 2A, korzystnie niewiększe niż 1,5A, w zestawieniu z odpowiadającymi im strukturalnie węglami Ca łańcucha głównego zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że dobrze zdefiniowana struktura drugorzędowa rdzenia cząsteczki zawiera fragmenty odpowiadające strukturalnie fragmentowi białka SplB wybranemu korzystnie spośród następujących sekwencji: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199.
PL213 994B1
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że zawiera fragment tworzący α-helisę odpowiadający strukturalnie fragmentowi białka SplB wybranemu korzystnie spośród następujących sekwencji: Lys38 do Ser41, Lys196 do Glu200.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że zawiera fragmenty tworzące β-harmonijkę odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród następujących sekwencji: Val4 do Thr5, Val18 do Ala20, Thr25 do Val28, Thr33 do Thr36, Arg49 do Ala52, Ile63 do Asn71, Ser79 do Val83, Arg115 do Ile119, Tyr132 do Gly136, Ser145 do Tyr148, Val 161 do Leu162, Gly170 do Ser175, Ala185 do Val 188.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że posiada strukturę trzeciorzędową dla której RMSD węgli Ca łańcucha głównego jest niewiększe niż 2,2A, korzystnie niewiększe niż 1,8A, w zestawieniu z odpowiadającymi im węglami Ca łańcucha głównego zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że posiada następujące elementy strukturalne:
- w pozycji odpowiadającej Val28 w sekwencji SplB zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Val29 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Ile34 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Leu35 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Thr36 zawiera aminokwas wybrany spośród Ser, Thr;
- w pozycji odpowiadającej His39 zawiera His;
- w pozycji odpowiadającej Ile66 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Ile69 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Asp77 zawiera Asp;
- w pozycji odpowiadającej Val78 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Val80 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;
- w pozycji odpowiadającej Ile81 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;
- w pozycji odpowiadającej Val118 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Ser, Thr;
- w pozycji odpowiadającej Gly120 zawiera Gly;
- w pozycji odpowiadającej Tyr121 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;
- w pozycji odpowiadającej Leu131 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;
- w pozycji odpowiadającej Gly155 zawiera Gly;
- w pozycji odpowiadającej Asn156 zawiera aminokwas wybrany spośród Asn, Gin, Asp, Glu;
- w pozycji odpowiadającej Ser157 zawiera Ser;
- w pozycji odpowiadającej Gly158 zawiera Gly;
- w pozycji odpowiadającej Ser159 zawiera aminokwas wybrany spośród Val, Ala, Ser, Thr, Gly;
- w pozycji odpowiadającej Pro160 zawiera Pro;
- w pozycji odpowiadającej Gly170 zawiera Gly;
- w pozycji odpowiadającej Ile171 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Phe197 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;
- w pozycji odpowiadającej Ile198 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala.
Uszczegóławiając w opisie ujawniono polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB posiadający sekwencję aminokwasowąXaa1-Xaa2-Xaa3, Xaa4-Xaa5, gdzie
Xaa1 jest aminokwasem z hydrofobowym łańcuchem bocznym lub aminokwasem z niewielkim łańcuchem bocznym, korzystnie wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly,
Xaa2 to kwas glutaminowy, glutamina, kwas asparaginowy, asparagina lub aminokwas z niewielkim łańcuchem bocznym lub arginina, korzystnie Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr,
Xaa3 to aminokwas z niewielkim hydrofobowym łańcuchem bocznym albo aminokwas z niewielkim łańcuchem bocznym, korzystnie Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,
Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,
Xaa5 jest pominięty lub jest dowolnym aminokwasem.
W sekwencjach odpowiednie symbole oznaczają: A, Ala, alanina; V, Val, walina; L, Leu, leucyna; I, Ile, izoleucyna; P, Pro, prolina; F, Phe, fenyloalanina; W, Trp, tryptofan; M, Met, metionina; G,
PL 213 994 Β1
Gly, glicyna; S, Ser, seryna; T, Thr, treonina; C, Cys, cysteina; Y, Tyr, tyrozyna; N, Asn, asparagina; Q Gin, glutamina; D, Asp, kwas asparaginowy; E, Glu, kwas glutaminowy; K. Lys, lizyna; R, Arg, arginina; H, His, histydyna;
Xaa5 może być w przypadku proteinazy SplB pominięty lub być dowolnym aminokwasem gdyż nieoczekiwanie proteinaza SplB odróżnia się od innych proteinaz cechujących się wysoką specyficznością substratową, które wykazują zazwyczaj określoną specyficzność również wobec aminokwasu znajdującego się bezpośrednio za hydrolizowanym wiązaniem (na nowym N-końcu powstającym w wyniku hydrolizy wiązania peptydowego; tj. w miejscu PT zgodnie z systemem numeracji przyjętym w tym zgłoszeniu, a zaproponowanym przez: Schechter, I., and Berger, A. (1967) Blochem. Biophys. Res. Commun. 27,157-162). W przypadku proteinazy SplB preferencji takiej nie obserwujemy.
Cecha ta jest szczególnie korzystna, ponieważ pozwala na dowolne projektowanie N-końca uwalnianych produktów.
Kolejny aspekt ujawnienia dotyczy białek posiadających ustaloną aktywność proteinazy SplB dzięki zachowaniu przez te białka struktury trzeciorzędowej proteinazy SplB przedstawionej w tabeli 1.
Istnieje powszechnie stosowany parametr określający podobieństwo struktur trzeciorzędowych, który pozwala na zdefiniowanie grupy ujawnionych białek o pożądanych właściwościach. Parametr ten to RMS distance (deviation) (ang. root mean square distance (deviation)) określany także jako RMSD. Wartość parametru RMSD wylicza się porównując położenia odpowiadających sobie atomów po uprzednim nałożeniu na siebie porównywanych struktur w celu ich optymalnego dopasowania. Wartość parametru wyraża się w angstremach (A) i tak też przyjęto w dalszym tekście. Ogólnie, im niższa wartość parametru tym struktury bardziej podobne.
Zatem niniejszy opis ujawnia białka o wzmiankowanej aktywności proteolitycznej, których struktura trzeciorzędowa jest dostatecznie podobna do struktury proteinazy SplB. Rzeczone podobieństwo mierzymy wartością parametru RMSD dla istotnych komponentów strukturalnych proteinazy SplB w stosunku do odpowiadających im komponentów strukturalnych porównywanego białka. W szczególności ujawniono enzym, którego:
a) RMSD wszystkich atomów reszt triady katalitycznej (seryny, histydyny i kwasu asparaginowego) jest mniejsze lub równe 1,7A, korzystnie mniejsze lub równe 1,5A, przy czym korzystnie dodatkowo spełnia ona co najmniej jedno z następujących kryteriów:
b) RMSD odpowiadających strukturalnie węgli Ca łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych jest mniejsze lub równe 2,0A, korzystnie mniejsze lub równe 1,5A,
c) tak jak w (b) z tym ze dobrze zdefiniowane strukturalnie elementy cząsteczki obejmują fragmenty łańcucha polipeptydowego wybrane korzystnie spośród następujących fragmentów określonych wg numeracji SplB oraz odpowiadających im strukturalnie fragmentów porównywanej cząsteczki: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199;
d) RMSD atomów łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych jest mniejsze lub równe 2,2A, korzystnie mniejsze lub równe 1,8A;
e) tak jak w (d) z tym ze dobrze zdefiniowane strukturalnie elementy cząsteczki obejmują fragmenty łańcucha polipeptydowego wybrane korzystnie spośród następujących fragmentów określonych wg numeracji SplB oraz odpowiadających im strukturalnie fragmentów porównywanej cząsteczki: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199;
f) Fragmenty odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród określonych poniżej tworzą β-harmonijkę: Val4 do Thr5, Val18 do Ala20, Thr25 do Val28, Thr33 do Thr36, Arg49 do Ala52, Ile63 do Asn71, Ser79 do Val83, Arg115 do Ile119, Tyr132 do Gly136, Ser145 do Tyr148, Val161 do Leu162, Gly 170 do Ser175, Ala185 do Val188
g) Fragmenty odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród określonych poniżej tworzą α-helisę: Lys38 do Ser41, Lys196 do Glu200.
Analiza struktury trzeciorzędowej proteinazy SplB pozwoliła zlokalizować regiony oraz reszty szczególnie istotne w procesie rozpoznawania substratu i katalizy. Ujawniono zatem białka posiadające reszty odpowiadające następującym kluczowym resztom aminokwasowym w sekwencji proteinazy SplB:
PL213 994B1
a. ) reszty tzw. triady katalitycznej które w przypadku proteinazy SplB stanowią: S157, H39 i D77. Zamiana tych reszt skutkuje całkowitą utratą zdolności katalitycznych. Przykładowo, dla proteinazy SplB wykazano, że mutant S157—>A jest całkowicie pozbawiony aktywności proteolitycznej.
b. ) reszty odpowiedzialne za rozpoznanie substratu:
P1: przede wszystkim S175, H172, T152 do N156, A174
P2: przede wszystkim F173, H39 i D77
P3: przede wszystkim S175
P4: przede wszystkim F173 i Y186,
d.) reszta kwasu glutaminowego na N-końcu łańcucha polipeptydowego, która to reszta jest odpowiedzialna za stabilizację N-końca białka przez wiązania wodorowe a tym samym umożliwia wyrażanie pełnej aktywności proteolitycznej. Reszta ta może być ewentualnie zastąpiona resztą kwasu asparaginowego wykazującą podobne właściwości fizykochemiczne.
Ujawnione w pracy J. Mol. Biol. (2006) 358, 270-279 porównanie sekwencji aminokwasowych homologicznych białek gronkowcowych (proteinazy V8 oraz toksyn epidermolitycznych) i trypsyny wskazuje na ważne rejony w sekwencji białka niezbędne dla prawidłowego fałdowania i/lub zachowania funkcji (fig. 1): V28 do V40; D77 do 181; G120 do P122 oraz G155 do 1171. Ponadto widać wyraźnie konserwację pojedynczych reszt: 150; S134; 1146; V188 i 1198. Jednak dopiero rozwiązanie struktury trzeciorzędowej proteinazy SplB pozwala na stworzenie porównania sekwencji na podstawie porównania struktur - a więc porównania sekwencji odpowiadających sobie elementów strukturalnych (najpierw porównuje się struktury, a następnie tam gdzie są podobne zestawia się tylko sekwencje, nawet jeśli nie są one homologiczne w klasycznym rozumieniu). Rozwiązanie takie niesie ze sobą dużo więcej informacji niż zwykłe porównanie sekwencji gdyż wskazuje elementy ważne dla zachowania funkcji białka. Porównanie takie zostało przedstawione na fig. 2, gdzie odpowiednie fragmenty są zgrupowane na podstawie podobieństw strukturalnych. Takie podejście pozwala na ewidentne wyróżnienie regionów konserwatywnych istotnych dla funkcji białka. Zatem ujawnione białko powinno posiadać w miejscach odpowiadających następującym aminokwasom w sekwencji SplB następujące reszty:
Val28 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Val29 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Ile34 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Leu35 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Thr36 - optymalnie zawiera aminokwasy wybrane spośród Ser, Thr;
His39 - histydyna triady katalitycznej;
Ile66 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Ile69 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Asp77 - kwas asparaginowy triady katalitycznej;
Val78 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Val80 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met;
Ile81 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met;
Val118 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Ser, Thr;
Gly120 - optymalnie Gly;
Tyr121 - optymalnie zawiera aminokwasy z dużym, hydrofobowym łańcuchem bocznym wybrane spośród Tyr, Phe, Trp;
Leu131 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met
Gly155 - optymalnie Gly;
Asn156 - optymalnie zawiera aminokwasy wybrane spośród Asn, Gin, Asp, Glu;
Ser157 - seryna triady katalitycznej o której była mowa wcześniej, musi być Ser;
Gly158 - optymalnie Gly;
Ser159 - optymalnie zawiera aminokwasy wybrane spośród Val, Ala, Ser, Thr, Gly;
Pro160 - optymalnie Pro;
PL 213 994 Β1
Gly170 - optymalnie Gly;
Ile171 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala;
Phe197 - optymalnie zawiera aminokwasy z dużym, hydrofobowym łańcuchem bocznym wybrane spośród Tyr, Phe, Trp;
Ile198 -optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala.
Szczególną realizacjąjest białko posiadające strukturę proteinazy SplB określoną w tabeli 1.
Zgodnie z ujawnieniem proteinaza SplB rozpoznaje specyficzną sekwencję aminokwasową i hydrolizuje łańcuch polipeptydowy zaraz za lub w obrębie rozpoznawanej sekwencji. Z uwagi na długość rozpoznawanej sekwencji (cztery kolejne aminokwasy) liczba identycznych sekwencji w proteomie człowieka wynosi zaledwie kilkanaście, a więc enzym ten nadaje się m.in. do odcinania metek fuzyjnych przy produkcji pozostałych kilkudziesięciu tysięcy białek ludzkich. Ujawniono przede wszystkim sekwencje aminokwasowe łańcucha polipeptydowego specyficznie rozpoznawane lub specyficznie rozpoznawane i hydrolizowane przez proteinazę SplB, sekwencje nukleotydowe kodujące rzeczone sekwencje aminokwasowe (a więc pozwalające na produkcję polipeptydów je zawierających przy pomocy technologii białek rekombinowanych) oraz metodę specyficznej hydrolizy polipeptydów zawierających rzeczone sekwencje aminokwasowe przy pomocy proteinazy SplB. Ujawniono także samą proteinazę SplB jako enzym rozpoznający lub rozpoznający i hydrolizujący wybrane sekwencje aminokwasowe oraz sposoby produkcji proteinazy SplB w systemie rekombinowanym. Ponadto ujawniono syntetyczne substraty oparte na sekwencjach specyficznie rozpoznawanych i hydrolizowanych przez proteinazę SplB.
Podsumowując najważniejsze zalety prezentowanego wynalazku, należy uznać, że przedmiot wynalazku oraz szczególnie korzystne ujawnione aspekty mogą znaleźć zastosowanie w następujących procesach:
a) rozpoznanie specyficznej sekwencji aminokwasowej łańcucha polipeptydowego (w szczególności sekwencji białka rekombinowanego) i jego specyficzna hydroliza w ściśle określonym miejscu w obrębie lub w niewielkiej odległości od rozpoznawanej sekwencji,
b) wysoce wydajna produkcja proteinazy SplB.
Przedmioty wynalazku zostały zdefiniowane w zastrzeżeniach patentowych.
Dla lepszego zilustrowania istoty wynalazku i ujawnionych aspektów niniejszy opis wzbogacono o wykaz sekwencji i figury.
Sekwencja nr 1 (SEQ ID NO 1) prezentuje sekwencję kodującą proteinazę SplB ze Staphylococcus aureus wraz z jej natywnym peptydem sygnalnym.
Sekwencja nr 2 (SEQ ID NO 2) prezentuje sekwencję aminokwasową proteinazy SplB ze Staphylococcus aureus (dojrzałe białko: aminokwasy od 1 do 204) wraz z jej natywnym peptydem sygnalnym (aminokwasy od -36 do -1).
Sekwencja nr 3 (SEQ ID NO 3) prezentuje sekwencję kodującą wariant proteinazy SplB ze Staphylococcus aureus, w której sekwencję kodującą natywny peptyd sygnalny zastąpiono sekwencją kodującą peptyd sygnalny pochodzący z Bacillus subtilis.
Sekwencja nr 4 (SEQ ID NO 4) prezentuje sekwencję aminokwasową wariantu proteinazy SplB ze Staphylococcus aureus, w której sekwencję natywnego peptydu sygnalnego zastąpiono sekwencją peptydu sygnalnego pochodzącego z Bacillus subtilis (aminokwasy od -29 do -1).
Sekwencja nr 5 (SEQ ID NO 5) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję S157A natomiast sekwencja nr 6 (SEQ ID NO 6) prezentuje sekwencję aminokwasowątego wariantu.
Sekwencja nr 7 (SEQ ID NO 7) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję H39A natomiast sekwencja nr 8 (SEQ ID NO 8) prezentuje sekwencję aminokwasową tego wariantu.
Sekwencja nr 9 (SEQ ID NO 9) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję D77A natomiast sekwencja nr 10 (SEQ ID NO 10) prezentuje sekwencję aminokwasową tego wariantu.
Sekwencja nr 11 (SEQ ID NO 11) prezentuje sekwencję kodującą białko fuzyjne zawierające sekwencję dojrzałej formy SplB z S. aureus, do której przyłączono metkę histydynową i sekwencję rozpoznawaną przez SplB natomiast sekwencja nr 12 (SEQ ID NO 12) prezentuje sekwencję aminokwasową tego białka.
PL213 994B1
Figura 1 zawiera porównanie sekwencji aminokwasowych blisko spokrewnionych proteinaz: proteinaza SplB, proteinaza SpIC, V8 (proteinaza V8 ze Staphylococcus aureus zwana inaczej glutamylendopeptydazą), ETA - toksyna epidermolityczna A ze Staphylococcus aureus oraz daleko spokrewnionego enzymu - trypsyny (modelowy enzym dla grupy proteinaz trypsynopodobnych). Podobieństwa sekwencji oznaczono odcieniami szarości - im ciemniejsze tym większe podobieństwo. Regiony o wyraźnej homologii sekwencji oraz pojedyncze konserwatywne reszty zaznaczono ramkami.
Figura 2 prezentuje porównanie sekwencji aminokwasowych blisko spokrewnionych proteinaz stworzone na podstawie znajomości ich struktur trzeciorzędowych oraz znajomości struktury trzeciorzędowej ustalonej dla proteinazy SplB; wskazano reszty szczególnie istotne dla zachowania struktury i aktywności proteinazy.
Poniższe przykłady zostały umieszczone jedynie w celu lepszego wyjaśnienia poszczególnych aspektów wynalazku i nie powinny być utożsamiane z całym jego zakresem, który zdefiniowano w załączonych zastrzeżeniach.
Przykład 1. Wstępna charakterystyka proteinazy SplB
Wyjściowym eksperymentem, umożliwiającym dalsze prace było wyznaczenie optimum pH i temperatur, dopuszczalnych stężeń soli i innych odczynników oraz stabilności enzymu. W tym celu należało opracować ilościową metodę oznaczania aktywności enzymu. Przeprowadzone liczne próby z syntetycznymi substratami niskocząsteczkowymi opisane w J. Mol. Biol. (2006) 358, 270-279 oraz kontynuowane również po opublikowaniu tej pracy dla większej liczby substratów nie pozwoliły jednak uzyskać lepszej charakterystyki proteinazy SplB. Enzym wykorzystany w tych eksperymentach otrzymano techniką opisaną w J. Mol. Biol. (2006) 358, 270-279. Wśród znanych substratów proteinaz trypsynopodobnych nie zidentyfikowano substratu trawionego nawet w minimalnym stopniu przez proteinazę SplB. Po długich poszukiwaniach ustalono, że FTC kazeina (kazeina znakowana barwnikiem fluorescencyjnym, umożliwiająca badanie hydrolizy metodą spektrofluorescencji) jest mało wydajnym substratem białkowym trawionym przez proteinazę SplB. W przypadku trawienia tego substratu konieczne było stosowanie nadmiaru molowego enzymu w stosunku do substratu oraz długich (rzędu godzin) czasów inkubacji. Przy jego użyciu udało się jednak określić wstępną charakterystykę aktywności proteinazy SplB jako: optimum pH na 8,25 (+/- 1,5 jednostki w dół i 1 jednostkę w górę), brak wyraźnej zależności aktywności od stężeń popularnych soli do 0,5M, brak wpływu środków redukujących do kilku mM, szeroką tolerancję temperaturową.
Na tej podstawie ustalono podstawowe parametry reakcji hydrolizy zalecane dla reakcji prowadzonej z wykorzystaniem proteinazy SplB. W efekcie, wszystkie kolejne eksperymenty prowadzono w temperaturze od 20°C do 37°C, w 10 do 10OmM buforze fosforanowym lub Tris przy wartości pH od 7,0 do 8,5 i stężeniu NaCI od 0 do 150mM. Ponadto ustalono, że enzym można przechowywać w stanie zamrożonym bez wyraźnej utraty aktywności, oraz kilkakrotnie zamrażać i rozmrażać a także liofilizować. Można go także przechowywać kilka miesięcy w temperaturze 4°C bez wyraźnej utraty aktywności. Wszystkie powyższe warunki stanowią dogodne formy przechowywania enzymu, co jest niezwykle istotne w codziennej praktyce.
Przykład 2. Wstępne próby ustalenia specyficzności substratowej proteinazy SplB
Trawienie β-kazeiny
Standardowo dla oznaczenia specyficzności substratowej proteinazy kontaktuje się ją z różnymi białkami, oznacza się miejsca hydrolizy i na podstawie odpowiedniej ilości prób metodami analizy statystycznej ustala się najbardziej optymalne miejsce cięcia. Takie standardowe postępowanie zastosowane zostało w pierwszym podejściu także dla proteinazy SplB, jednak nie przyniosło ono spodziewanych wyników. Wykazano, że szereg testowanych białek (lizozym białka jaja kury, inhibitor trypsyny z nasion soi, transferyna osocza ludzkiego, albumina osocza wołowego, owalbumina jaja kury, β-galaktozydaza E. coli, anhydraza węglanowa, alfa-2-makroglobulina osocza ludzkiego, cytochrom c, kozie przeciwciała IgG, RNAza, fibrynogen, mioglobina wieloryba, cała gama serpin ludzkich i mysich) nawet przy przedłużonej inkubacji z nadmiarem enzymu nie ulega proteolizie.
Wykrywalną aktywność białka SplB wykazano jedynie metodązymografii na β-kazeinie (J. Mol. Biol. (2006) 358, 270-279). Dalsze eksperymenty innymi metodami (kontaktowanie proteinazy i kazeiny w roztworze, analiza produktów proteolizy przy pomocy SDS-PAGE) potwierdziły ten fakt jednak wykazały też, że dla przeprowadzenia reakcji hydrolizy potrzeba zastosowania molowego nadmiaru enzymu i bardzo długich czasów inkubacji - kilkunastu godzin. Oznacza to, że enzym „bardzo niechętnie” hydrolizuje β-kazeinę (standardowo przy tego typu badaniach stosuje się katalityczne ilości enzymu - 100x i mniej niż substratu oraz krótkie czasy inkubacji - rzędu minut). Metodami spektrometrii
PL 213 994 Β1 masowej oraz chemicznego sekwencjonowania aminokwasowego udało się oznaczyć cztery miejsca cięcia w obrębie cząsteczki β-kazeiny (spacja oznacza miejsce cięcia):
EEQQQ FAQTQ FTESQ LPLLQ
TEDEL SLVYP SLTLT
SWMHQ
Na podstawie tej niewielkiej (a więc mało reprezentatywnej) grupy można by założyć, że zgodnie z wiedzą, iż w tego typu proteinazach specyficzność determinuje reszta w pozycji P1 proteinaza SplB potrzebuje reszty glutaminy (Q) w miejscu P1 substratu (wyróżnione tłustym drukiem). Założenie takie nie tłumaczy zupełnie dlaczego trawieniu nie ulegają inne białka zawierające bardzo wiele reszt glutaminy (Q) w szczególności sama β-kazeina która była trawiona jedynie na kilka fragmentów pomimo, że zawiera kilkanaście reszt Q. Ponadto założenie takie nie tłumaczy także, dlaczego proteinaza SplB jest tak mało wydajna.
Warto także zauważyć, że w pozostałych pozycjach sekwencji trawionych przez SplB w kazeinie, poza P1 ’, tj. P5 do P2 oraz P2’ do P5’ nie można ustalić żadnego wspólnego elementu czy charakterystycznego układu, który sugerowałby znaczenie tych pozycji dla specyficzności substratowej badanej proteinazy. Wydaje się jedynie, że w pozycji PT preferowane są reszty S lub T.
Trawienie substratów syntetycznych, denaturowanych białek i peptydów syntetycznych
W obliczu niepowodzenia eksperymentów opisanych powyżej przyjęto robocze założenie, że proteinaza SplB może trawić jedynie w specjalnych, eksponowanych rejonach białek, a z uwagi na ukrycie innych rejonów zawierających reszty Q wewnątrz struktury cząsteczki białek stosowanych jako substraty nie są one rozpoznawane i trawione. Dlatego przeanalizowano ponownie wybrane białka po uprzedniej denaturacji (karboksymetylowany lizozym, karboksymetylowany BPTI, apomioglobina i apocytochrom c w formie zdenaturowanej, po usunięciu cząsteczki hemu), oraz syntetyczny peptyd (KEGLTETTFEEDGVATGNHEYCVEV) i fluorescencyjne substraty syntetyczne charakteryzujące się brakiem struktur drugorzędowych (Abz-Glu-Ala-Leu-Gly-Thr-Ser-Pro-Arg-Lys(Dnp)-Asp-OH i Abz-GInGly-lle-Gly-Thr-Ser-Arg-Pro-Lys(Dnp)-Asp-OH). Ponadto zsyntetyzowano chemicznie i testowano peptydy odpowiadające regionom flankującym miejsce cięcia zidentyfikowane w cząsteczce kazeiny, mianowicie: FTESOSLTLT oraz EEQQQTEDEL.
We wszystkich przypadkach, pomimo stosowania także nadmiarów molowych proteinazy SplB oraz przedłużonych czasów inkubacji (do 72h) nie udało się wykazać hydrolizy badanych polipeptydów.
Wynik ten jest szczególnie zaskakujący w przypadku dwóch ostatnich peptydów o sekwencji identycznej do oznaczonych wcześniej miejsc cięcia.
Zatem, standardowa metoda oznaczania specyficzności substratowej opisana powyżej, w przypadku proteinazy SplB zupełnie zawiodła.
Potwierdzenie, że białko SplB jest proteinazą
W świetle powyższych wyników, w obliczu wykazanego trawienia cząsteczki β-kazeiny przy zastosowaniu nadmiaru enzymu i przedłużonego czasu inkubacji możliwym do zaakceptowania wytłumaczeniem było zanieczyszczenie badanego preparatu proteinazy SplB śladami innej aktywności proteolitycznej. Innymi słowy proteinaza SplB mogła być, tak jak blisko spokrewniona, homologiczna proteinaza SpIC, białkiem bez aktywności proteolitycznej (w pracy J. Mol. Biol. (2006) 358, 270-279 wykazano, brak aktywności proteolitycznej białka SpIC bardzo blisko spokrewnionego z proteinazą SplB) a przy stosowaniu jej nadmiaru drobne zanieczyszczenia stosowanego preparatu mogły ujawniać swoją aktywność.
Ewentualność taką wyeliminowano zamieniając katalityczną resztę seryny enzymu na resztę alaniny. W proteinazach trypsynopodobnych zamiana taka prowadzi zawsze do całkowitego zahamowania aktywności. Oczyszczony preparat muteiny proteinazy SplB (S157—>A) nie wykazywał zdolności hydrolizy β-kazeiny nawet przy trzykrotnym nadmiarze molowym i 72 godzinnej inkubacji. Eksperyment ten dowiódł roli reszty S157 w mechanizmie katalizy proteinazy SplB oraz potwierdził, że to właśnie ten enzym a nie zanieczyszczenia obecne w preparacie są odpowiedzialne za hydrolizę β-kazeiny.
Przykład 3. Nowa metoda otrzymywania proteinazy SplB
SEQ ID NO: 1 i 2 przedstawia odpowiednio sekwencję nukleotydową genu kodującego proteinazę SplB ze Staphylococcus aureus oraz odpowiadającą jej sekwencję aminokwasową. Numeracja nukleotydów rozpoczyna się od „a(1)” trójki startu translacji (atg) a kończy na ,,a(723)” trójki stopu translacji (taa). Łańcuch polipeptydowy proteinazy powstaje w procesie translacji w połączeniu z pep
PL213 994B1 tydem sygnalnym (numeracja reszt aminokwasowych od M(-36) do A(-1) który w procesie sekrecji jest odcinany przez proteinazę sygnalną. Powstaje wtedy aktywna zewnątrzkomórkowa forma proteinazy SplB, którą można wyizolować z pożywki hodowlanej (numeracja reszt aminokwasowych od E1 do K204). W dalszym opisie stosuje się numerację wprowadzoną na tych sekwencjach.
Sekwencje kodujące dojrzałą formę proteinazy SplB (E1 do K204) sklonowano do odpowiedniego plazmidu ekspresyjnego otrzymując plazmid umożliwiający produkcję zewnątrzkomórkową dojrzalej formy proteinazy SplB w bakteriach gramdodatnich. Sekwencję białka fuzyjnego składającego się z sygnałowej sekwencji sekrecyjnej specyficznej dla B. subtilis oraz dojrzałej formy proteinazy SplB, a także sekwencję nukleotydową kodującą to białko przedstawiono odpowiednio jako SEQ ID No. 3 i SEQ ID No. 4.
W celu uzyskania białka zrekombinowanego bakterie B. subtilis szczep WB800 transformowano plazmidem ekspresyjnym i prowadzono selekcję transformantów na płytkach zawierających kanamycynę (50pg/ml). Wyselekcjonowanymi klonami inokulowano niewielką ilość płynnej pożywki (TSB; Sigma) zawierającej antybiotyk selekcyjny i inkubowano w 37°C z intensywnym mieszaniem przez 8 do 10 h. Tak przygotowaną hodowlą startową inokulowano hodowlę właściwą (4-16L płynnej pożywki z antybiotykami) i inkubowano przy intensywnym mieszaniu w 37°C przez 13 do 16 godzin. Wszystkie dalsze etapy oczyszczania przeprowadzano w 4°C. Bakterie oddzielano od pożywki przez wirowanie przy przyspieszeniu 6000xg przez 30min. Białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysalano siarczanem amonu do 80% nasycenia (561 g/L w 4°C). Wysolone białka oddzielano od pożywki przez wirowanie (15000xg, 1 h), rozpuszczano w niewielkiej ilości 50 mM buforu octanowego pH 5,5 i dializowano przez noc do dużego nadmiaru tego samego buforu. Przedializowaną próbkę poddawano chromatografii jonowymiennej na złożu SP Sepharose FF (GE Healthcare) i zbierano frakcje zawierające największy szczyt białkowy wymywający się przy przewodnictwie buforu wynoszącym ok. 30 mS/cm. W razie wątpliwości frakcje testowano na obecność aktywności proteolitycznej metodą zymografii lub na obecność białka o odpowiedniej masie cząsteczkowej przy pomocy elektroforezy SDS-PAGE albo w inny dogodny sposób. Preparat dializowano do 50 mM buforu octanowego pH 4,8 i poddawano chromatografii jonowymiennej na złożu SOURCE 15S (GE Healthcare). Zbierano frakcje zawierające główny szczyt białkowy i poddawano sączeniu molekularnemu na złożu Superdex S75 w buforze PBS. Tak przygotowany, oczyszczony preparat zagęszczano, porcjowano i przechowywano zamrożony w -20°C.
Przykład 4. Ustalenie struktury trzeciorzędowej i specyficzności substratowej proteinazy SplB.
Metoda opisana w przykładzie 3 pozwoliła na wydajną produkcję badanego białka umożliwiając prowadzenie dalszej analizy jego struktury, a zwłaszcza uzyskanie krystalicznej postaci proteinazy SplB i ustalenie struktury trzeciorzędowej badanej proteinazy, co w efekcie przyczyniło się do określenia specyficzności substratowej proteinazy SplB.
Analiza struktury trzeciorzędowej proteinazy SplB
W celu wskazania na ewentualne determinanty strukturalne obserwowanej bardzo słabej kinetyki hydrolizy wiązań peptydowych oraz ewentualne wskazanie lepszych substratów, metodą krystalografii rentgenowskiej określono strukturę trzeciorzędową proteinazy SplB. Ustalone koordynaty poszczególnych atomów białka dojrzałej proteinazy SplB zgromadzono w tabeli 1. Analiza otrzymanego modelu strukturalnego wskazała, że proteinaza SplB wykazuje budowę charakterystyczną dla proteinaz rodziny S1 (trypsynopodobnych i chymotrypsynopodobnych) nie wykazując wyraźnych uwarunkowań w budowie triady katalitycznej dla obserwowanej słabej aktywności. Ponadto analiza wykazała dobrze wykształcone miejsce P1 zdolne do przyjęcia aminokwasów: D, E, Q lub N oraz charakterystyczną hydrofobową „łatę” na powierzchni białka w okolicy miejsca P3/P4 wskazującą na możliwość, że proteinaza SplB rozpoznaje poza resztą P1 także dalsze reszty substratu, a brak takiego rozpoznania (tj. odpowiedniego miejsca w badanych substratach) może warunkować obserwowaną we wcześniejszych eksperymentach słabą aktywność proteolityczną.
Kluczowe reszty aminokwasowe w sekwencji proteinazy SplB
Ze stanu techniki wiadomo, że kluczowymi resztami dla aktywności trypsynopodobnych proteinaz serynowych są reszty tzw. triady katalitycznej. W przypadku proteinazy SplB, uzyskana struktura trzeciorzędowa potwierdza, że są to: S157, H39 i D77. Zamiana tych reszt skutkuje całkowitą utratą zdolności katalitycznych. Odpowiednie sekwencje nukleotydowe i aminokwasowe takich mutantów przedstawione zostały jako SEQ ID No: 5-10. Stosując ujawnione sekwencje oraz metodę opisanąw przykładzie 3 można uzyskać białka odpowiednich mutantów i poddać je dalszej analizie. Przykładowo, potwierdzono eksperymentalnie, że mutant S157—>A jest całkowicie pozbawiony aktywności proteolitycznej.
PL 213 994 Β1
Na podstawie ustalonej struktury trzeciorzędowej proteinazy SplB oraz modelowania sposobu dokowania substratu m.in. na podstawie znajomości struktur kompleksów homologicznych białek z ich substratami i inhibitorami wynika, że reszty odpowiedzialne za rozpoznanie substratu to:
P1: przede wszystkim S175, H172, T152 do N156, A174
P2: przede wszystkim F173, H39 i D77
P3: przede wszystkim S175
P4: przede wszystkim F173 i Y186
Porównanie struktur trzeciorzędowych form w pełni aktywnej (identyczna z natywną) i słaboaktywnej (zawierająca dwa dodatkowe aminokwasy na N-końcu) proteinazy SplB wskazuje na rolę dokładnego umiejscowienia N-terminalu białka oraz początkowej reszty kwasu glutaminowego (E1).
Porównanie sekwencji aminokwasowych oraz struktur trzeciorzędowych homologicznych białek gronkowcowych (proteinazy V8 oraz toksyn epidermolitycznych) i trypsyny wskazuje na ważne rejony w sekwencji białka niezbędne dla prawidłowego fałdowania i/lub zachowania funkcji (patrz figura 1): V28 do V40; D77 do 181; G120 do P122 oraz G155 do 1171. Ponadto widać wyraźnie konserwację pojedynczych reszt: 150; S134; 1146; V188 i 1198.
Analiza bibliotek substratów syntetycznych
Bazując na wynikach analizy krystalograficznej, w dalszym etapie poszukiwania optymalnych substratów dla proteinazy SplB wykorzystano kombinatoryczną bibliotekę substratów syntetycznych zawierającą 104976 różnych substratów. Biblioteka zawiera substraty, w których na pozycjach P4 do P1 znajdują się wszystkie możliwe permutacje 18 aminokwasów (poza metioniną i cysteiną) a pozycję PT zajmuje 7-amido-4-fluorometylokumaryna, barwnik wykazujący fluorescencję po odcięciu przez proteinazę od części peptydowej, co pozwala na detekcję preferowanych substratów (szczegółowy opis Biol. Chem. (2004). 385:1093-1098). W pierwszym etapie badań skupiono się na ustaleniu preferowanej reszty w pozycji P1. Przegląd biblioteki proteinazą SplB pozwolił na ustalenie, że proteinaza SplB w pozycji P1 na 18 testowanych peptydów toleruje jedynie następujące aminokwasy: Asp, Asn, Gin (wynik zgodny z wynikami trawienia β-kazeiny oraz z przewidywaniami na podstawie analizy struktury proteinazy). Szybkość trawienia wyselekcjonowanych substratów była porównywalna z innymi proteinazami demonstrując, że proteinaza SplB wcale nie jest mało wydajna jak sugerowały wyniki wcześniejszych eksperymentów opisanych w stanie techniki i przykładach 1 i 2.
Stosowana biblioteka nie umożliwia odczytania wyników selekcji w pozycjach P2 do P4. Rozważając jednak odpowiedź na pytanie dlaczego proteinaza SplB nie trawi innych poza β-kazeiną białek, w których znajduje się cały szereg reszt Asp, Asn i Gin, na tym etapie prac stało się oczywiste, że trypsynopodobna proteinaza SplB posiada znacznie większą specyficzność substratową w porównaniu z jej bliskimi (proteinaza V8) i dalekimi (trypsyna, chymotrypsyna i wiele innych) homologami.
Analiza biblioteki kombinatorycznej CLiPS
Wysoka specyficzność substratowa zmusza do przesiania znacznie większej ilości substratów dla znalezienia tego właściwego i stąd konieczność zastosowania bardziej zaawansowanej metody CLiPS (opisanej w publikacji PNAS, (2006). 130: 7583-7588). Bardzo ogólnie, w uzyskanej tą techniką bibliotece jedno z białek zewnętrznej błony komórkowej bakterii jest tak skonstruowane syntetycznie, że zawiera wszystkie możliwe permutacje liniowej sekwencji kilku aminokwasów (każdy szczep bakterii należący do biblioteki zawiera białko o konkretnej sekwencji, ale inne niż pozostałe szczepy bakterie należące do biblioteki). Za sekwencją zmienną znajduje się sekwencja umożliwiająca detekcję fluorescencyjną. Pierwszy etap selekcji (cytometria przepływowa) wybiera komórki fluoryzujące (gdzie interesujące białko ulega ekspresji) następnie komórki te kontaktuje się z testowaną proteinazą i selekcjonuje się te, które nie fluoryzują, a więc te, dla których proteinaza odcięła część fluoryzującą. Następnie dla wyselekcjonowanych w ten sposób szczepów określa się sekwencję interesującego białka, a więc i sekwencje cięcia. Zastosowanie tej metody pozwala na przesianie 64 milionów substratów i uzyskanie informacji co do aminokwasów występujących w pozycjach P5 do PT, a nie tylko P1 (jak w technice opisanej powyżej). Wykorzystując tą metodę wyselekcjonowano następujące sekwencje rozpoznawane i cięte przez proteinazę SplB:
PL213 994B1
| P4P3P2Pi * Pi' | szybkość cięcia |
| G WELQ*S | 0,81 |
| SWELQ*G | 0,62 |
| S WELT*G | 0,62 |
| S WELT* V | 0,90 |
| SWEVQ*E | 0,84 |
| VVELQ‘S | 0,65 |
| S WELQ* V | 0,61 |
| S WELQ‘S | 0,86 |
| S WELQ* E | 0,82 |
| SWELQ*M | 0,75 |
| E WELQ*S | 0,58 |
| S WELQ* A | 0,53 |
| SWQLD*A | 0,57 |
| SWVLQ*A | 0,32 |
| WELQ* | Sekwencja konsensusową |
Wytłuszczoną czcionką zaznaczono aminokwasy odpowiadające dokładnie wyselekcjonowanej sekwencji konsensusowej, podkreślono aminokwasy dobiegające od sekwencji konsensusowej, gwiazdką oznaczono miejsce cięcia. Liczba po prawej stronie sekwencji jest miarą szybkości trawienia.
W świetle wcześniejszych eksperymentów i stanu techniki uzyskany wynik jest co najmniej nieoczywisty. Dotychczasowa wiedza o biochemii dziesiątek proteinaz trypsynopodobnych wskazuje prawie wyłącznie na miejsce P1 jako determinujące specyficzność substratową w tego typu białkach. Również wysoce homologiczna do proteinazy SplB - proteinaza V8 także ze Staphylococcus aureus wykazuje specyficzność jedynie dla reszty P1. Dlatego pierwotnie oczekiwano, zgodnie z ogólnym stanem wiedzy, że tak samo będzie w przypadku proteinazy SplB. Ponieważ proteinazy specyficzne tylko dla P1 nie są szczególnie specyficzne mierząc miarą metody CLiPS, metoda ta nie jest zalecana do określania specyficzności takich enzymów. Dopiero wiele niepowodzeń przy próbach przyrównania proteinazy SplB do wiedzy wynikającej ze stanu techniki skłoniło twórców do postawienia i przetestowania innej, mniej prawdopodobniej hipotezy dotyczącej specyficzności badanej proteinazy, która to hipoteza nieoczekiwanie okazała się prawdziwa.
Przykład 5. Wykorzystanie proteinazy SplB do specyficznej hydrolizy białek zawierających sekwencje aminokwasowe według wynalazku.
Trafność wyboru sekwencji konsensusowej oraz przydatność proteinazy SplB zostały potwierdzone w kolejnych eksperymentach. Wykorzystano plazmid umożliwiający ekspresję stafostatyny A jako białka fuzyjnego z GST odcinalnym przy pomocy trombiny (opisany w Mol. Microbiol (2003). 49: 1051-1066; zawierający sekwencję kodującą białko stafostatyna A, którą sklonowano techniką PCR z matrycy genomowego DNA S. aureus do plazmidu pGEX-5T w miejsca BamHI/Xhol uzyskując plazmid umożliwiający ekspresję białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A). Inkubacja białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A z proteinazą SplB, nawet przy przedłużonym czasie inkubacji z nadmiarem enzymu, nie prowadzi do widocznej w metodzie SDS-PAGE hydrolizy interesującego łańcucha polipeptydowego. Metodami inżynierii genetycznej (mutageneza punktowa) zamieniono w omówionym wyżej plazmidzie sekwencję nukleotydową kodującą miejsce cięcia dla trombiny (LVPR*G) na sekwencję konsensusową (WELQ*G) uzyskując plazmid umożliwiający ekspresję białka fuzyjnego GST-miejsce cięcia proteinazy SplB-stafostatyna A. Białko to wyprodukowano w bakteriach E. coli szczepu BL21 pLysS i oczyszczono wykorzystując powinowactwo białka fuzyjnego GST do immobilizowanego glutationu analogicznie jak opisano Mol Microbiol (2003). 49: 1051-1066 dla białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A. Kontaktując tak przygotowane białko z proteinazą SplB wykazano bardzo szybką hydrolizę łańcucha polipeptydowego (w czasie rzędu kilkunastu minut przy stukrotnym nadmiarze molowym substratu nad proteinazą SplB). Oznacza to, że proteinaza SplB nie jest mało wydajnym katalitycznie enzymem jak sugerowały eksperymenty z trawieniem β-kazeiny. Przeciwnie, dowodzi to, że jest ona enzymem bardzo wydajnym katalitycznie ale jedynie w stosunku do substratów o prawidłowej sekwencji, która jest nieoczekiwanie znacznie bardziej rozbudowana w porównaniu ze znanymi proteinazami trypsynopodobnymi.
PL 213 994 Β1
Ponadto wyizolowano stafostatynę A uwolnioną z białka fuzyjnego przez trawienie proteinazą SplB i oznaczono metodą degradacji Edmana jej N-końcową sekwencję wykazując, że proteinaza SplB tnie specyficznie i precyzyjnie w obrębie rozpoznawanej sekwencji jedynie w określonym * miejscu (WELCTG).
Podobny wynik powinien przynieść eksperyment, w którym sekwencję rozpoznawaną przez proteinazę SplB wg opisu, zwłaszcza sekwencję konsensusową WELQG, umieszcza się pomiędzy „metką” histydynową (His-Tag), lub dowolną inną „metką” a dowolnym interesującym białkiem, lub między dowolnym interesującym białkiem a dowolną metką, by tak samo jak poprzednio uzyskać precyzyjne odcinanie metki od interesującego białka.
Przykład 6. Rola miejsca P1 ’ w rozpoznaniu substratu
Dla wielu specyficznych proteinaz dużą rolę w rozpoznaniu substratu grają nie tylko miejsca P ale także P’ a głównie PT (np. dla trombiny musi to być mały aminokwas (zwykle Gly)). Jest to dość niewygodne gdyż nie pozwala na dowolne kształtowanie N- końca białka po odcięciu metki. Z analizy substratów wyselekcjonowanych w metodzie CLiPS wynika, że w przypadku proteinazy SplB reszta ta nie ma większego znaczenia (na miejscu PT znajdujemy S, G, V, A ale też aminokwasy o dużym łańcuchu bocznym jak E lub M).
Podobny wynik powinien przynieść eksperyment, w którym w białku fuzyjnym GST- miejsce cięcia przez proteinazę SplB - stafostatyna A w pozycji PT umieszcza się różne aminokwasy (np. zamiana sekwencji WELQ*G na WELQ*Q, WELQ*N), by w sposób analogiczny do opisanego w przykładzie 5, potwierdzić brak wpływu wprowadzonej zamiany na szybkość hydrolizy wiązania.
W tym celu, do białka fuzyjnego GST-miejsce cięcia przez proteinazę SplB - stafostatyna A wprowadzono na pozycji PT następujące aminokwasy: E, K, N, Q, L, F, M. W efekcie uzyskano konstrukty zawierające w białku fuzyjnym opisanym w przykładzie 5 w miejsce sekwencji WELQ GS następujące fragmenty sekwencji:
WELQ ES
WELQ KS
WELQ NS
WELQ QS
WELQ LS
WELQ FS
WELQ MS
Wszystkie białka zrekombinowane otrzymane z tych konstruktów były cięte równie wydajnie przez proteinazę SplB potwierdzając brak wpływu miejsca PT na rozpoznawanie i hydrolizę substratu. Miejsce cięcia zaraz za rozpoznawaną sekwencją konsensusową (WELQ) potwierdzono w każdym przypadku przez sekwencjonowanie uwolnionego nowego N-końca białka metodą degradacji Edmana.
Tabela I. Koordynaty struktury trzeciorzędowej proteinazy SplB ze Staphylococcus aureus, oznaczenia: NA- numer porządkowy atomu, A - rodzaj atomu, AK- rodzaj aminokwasu, NAK - numer porządkowy aminokwasu w strukturze pierwszorzędowej, X, Y, Z - koordynaty atomu
PL213 994B1
| ΝΑ | A | AK | NAK | X | Y | Z | NA | A | AK | NAK | X | Ϊ | Z |
| i | N | GLU | 1 | 10.688 | 39.517 | 6.273 | 89 | CA | ILE | 12 | 23.045 | 38.511 | 29.008 |
| 2 | CA | GLU | 1 | 10.569 | 40.577 | 7.2Θ8 | 90 | CP | TLE | 12 | 21.702 | 39.218 | 29.455 |
| 3 | CB | GLU | 1 | 10.333 | 39.952 | 8.665 | 91 | CG1 | ILE | 12 | 21.029 | 39.865 | 28.261 |
| 4 | CG | GLU | i | 9.837 | 40.901 | 9.754 | 92 | CDI | ILE | 12 | 19.625 | 4C.425 | 28.547 |
| 5 | CD | GLU | 1 | 9.251 | 40.165 | 10.946 | 93 | CG2 | ILE | 12 | 21.983 | 40.226 | 30.542 |
| 6 | OE1 | GLU | 1 | 3.374 | 39.289 | 10.757 | 94 | C | ILE | 12 | 22.717 | 37.420 | 28.001 |
| 7 | OE2 | GLU | 1 | 9.667 | 40.471 | 12.083 | 95 | O | ILE | 12 | 22.994 | 37,538 | 26.795 |
| 8 | C | GLU | 1 | 11.858 | 41.360 | 7.274 | 96 | N | PHE | 13 | 22.123 | 36.351 | 28.496 |
| 9 | 0 | GLU | 1 | 12-925 | 40.827 | 6,940 | 97 | CA | PHE | 13 | 21.724 | 35.268 | 27.610 |
| 10 | N | ASN | 2 | 11.763 | 42.633 | 7.613 | 98 | CR | PHE | 13 | 21 .355 | 34.321 | 28.430 |
| 11 | CA | ASN | 2 | 12.949 | 43.448 | 7.819 | 99 | CG | PHE | 13 | 20.971 | 32.844 | 27.592 |
| 12 | CB | ASN | 2 | 13.143 | 44.442 | 6.674 | 100 | CDI | PHE | 13 | 19.632 | 32.556 | 27,322 |
| 13 | CG | ASN | 2 | 14.510 | 45.115 | 6.693 | 101 | CE1 | PHE | 13 | 19.283 | 31.462 | 26,521 |
| 14 | CDI | ASN | 2 | 15.192 | 45.178 | 7.728 | 102 | C2 | PHE | 13 | 20.251 | 30.646 | 25,987 |
| 15 | ND2 | ASN | 2 | 14.926 | 45.631 | 5.526 | 103 | CE2 | PHE | 13 | 21.614 | 30.923 | 26,241 |
| 16 | c | ASN | 2 | 12.789 | 44.141 | 9.162 | 104 | CD2 | PHE | 13 | 21.958 | 32.029 | 27,048 |
| 17 | 0 | ASN | 2 | 12.416 | 45.328 | 9.242 | 105 | C | PHE | 13 | 20.542 | 35.792 | 26.787 |
| 18 | N | ASN | 3 | 13.033 | 43.376 | 10.222 | 106 | O | PHE | 13 | 19.660 | 36.488 | 27,352 |
| 19 | CA | ASN | 3 | 12.929 | 43.887 | 11.577 | 107 | N | PRO | 14 | 20.437 | 35.414 | 25,489 |
| 20 | CB | ASN | 3 | 11.732 | 43.269 | 12.308 | 108 | CA | PRO | 14 | 21.259 | 34.446 | 24,695 |
| 21 | CG | ASN | 3 | 11.568 | 43.811 | 13.722 | 109 | CB | PRO | 14 | 20.313 | 34.045 | 23.559 |
| 22 | OD1 | ASN | 3 | 1] .626 | 44.991 | 13.985 | 110 | CG | PRO | 1.4 | 19.526 | 35.319 | 23.294 |
| 23 | ND2 | ASN | 3 | 11.12B | 42.953 | 14.637 | 111 | CD | PRO | 14 | 19.357 | 35.597 | 24.666 |
| 24 | C | ASN | 3 | 14.232 | 43.633 | 12.315 | 112 | C | PRO | 14 | 22.523 | 35.03S | 24.111 |
| 25 | 0 | ASN | 3 | 14.395 | 42.625 | 12.997 | 113 | O | PRO | 14 | 23.323 | 34.295 | 23.506 |
| 2 6 | N | VAL | 4 | 15.154 | 44.569 | 12.147 | 114 | N | TYR | 15 | 22.736 | 36.339 | 24.304 |
| 27 | CA | VAL | 4 | 16.495 | 44.448 | 12.647 | 115 | CA | TYR | 15 | 23.S13 | 37.C51 | 23.597 |
| 28 | CB | VAL | 4 | 17.501 | 44.721 | 11.514 | 116 | CB | TYR | 15 | 23.613 | 38.555 | 23.694 |
| 29 | CG1 | VAL | 4 | 18.926 | 44.579 | 12.001 | 117 | CG | TYR | 15 | 22.173 | 38.891 | 23.362 |
| 30 | CG2 | VAL | 4 | 17.218 | 43.B10 | 10.339 | 118 | CDI | TYR | 15 | 21.688 | 38.763 | 22.058 |
| 31 | C | VAL | 4 | 16.553 | 45.484 | 13.730 | 119 | CE1 | TYR | 15 | 20.350 | 39.033 | 21.753 |
| 32 | 0 | VAL | 4 | 16.344 | 46.660 | 13.50B | 120 | CS | TYR | 15 | 19.497 | 39.423 | 22.773 |
| 33 | N | THR | 5 | 17.111 | 45.065 | 14.908 | 121 | OH | TYR | 15 | 18.188 | 39.684 | 22.470 |
| 34 | CA | THR | 5 | 17.231 | 45.982 | 16.043 | 122 | CE2 | TYR | 15 | 19.947 | 39.551 | 24.082 |
| 35 | CB | THR | 5 | 16.038 | 45.834 | 17,033 | 123 | CD2 | TYR | 15 | 21-284 | 39.273 | 24.370 |
| 36 | 091 | THR | 5 | 16.019 | 44.513 | 17.581 | 124 | C | TYR | 15 | 25.205 | 36.659 | 24.060 |
| 37 | CG 2 | THR | 5 | 14.704 | 46.067 | 16.330 | 125 | 0 | TYR | 15 | 26.195 | 36.864 | 23.342 |
| 3B | C | THR | 5 | 18.547 | 45.772 | 16.767 | 126 | N | THR | 16 | 25.2?: | 35.112 | 25.270 |
| 39 | O | THR | 5 | 19.031 | 44.642 | 16.866 | 127 | CA | THR | 16 | 26.512 | 35.543 | 25.808 |
| 40 | N | LYS | 6 | 19.123 | 46.856 | 17.260 | 128 | CB | THR | 16 | 26.452 | 35.379 | 27.349 |
| 41 | Cft | LYS | 6 | 20.371 | 46.797 | 18.306 | 129 | OG1 | THR | 16 | 25.250 | 34.677 | 27.717 |
| 42 | CB | LYS | 6 | 20.966 | 48.199 | 19.161 | 130 | CG2 | THR | 16 | 26.478 | 36.779 | 27.980 |
| 43 | CG | LYS | 6 | 22.207 | 49.286 | 19.024 | 131 | C | THR | 16 | 26.973 | 34 .254 | 25.110 |
| 44 | CD | LYS | 6 | 22.759 | 49.707 | 18.992 | 132 | O | THR | 16 | 28.076 | 33.759 | 25.400 |
| 47 | C | LYS | 6 | 20.157 | 46.136 | 19.366 | 133 | N | GLY | 17 | 26.166 | 33.746 | 24.173 |
| 48 | 0 | LYS | 6 | 19.220 | 46.465 | 20.090 | 134 | CA | GLY | 17 | 26.599 | 32.636 | 23.303 |
| 49 | N | VAL | 7 | 21.038 | 45.202 | 19.711 | 135 | c | GLY | 17 | 27.200 | 33.085 | 21.980 |
| 50 | CA | VAL | 7 | 20.924 | 44.523 | 20.986 | 136 | O | GLY | 17 | 27.612 | 32.242 | 21.177 |
| 51 | CB | VAL | 7 | 21.754 | 43.195 | 21.045 | 137 | N | VAL | 1S | 27.246 | 34.405 | 21.738 |
| 52 | CG1 | VAL | 7 | 21.655 | 42.613 | 22.448 | 138 | CA | VAL | 19 | 27.700 | 34.908 | 20.465 |
| 53 | CG2 | VAL | 7 | 21.196 | 42.170 | 20.048 | 139 | CE | VAŁ | 13 | 26.709 | 36.016 | 19.994 |
| 54 | c | VAL | 7 | 21.300 | 45.455 | 22.126 | 140 | CCI | VAL | 18 | 27.257 | 36.589 | 18,5B0 |
| 55 | 0 | VAL | 7 | 22.444 | 45.904 | 22.233 | 141 | CG 2 | VAL | 18 | 25.341 | 35.415 | 19.687 |
| 56 | N | LYS | 8 | 20.319 | 45.738 | 22.983 | 142 | C | VAL | IB | 29.122 | 35.457 | 20.571 |
| 57 | CA | LYS | 8 | 20.528 | 46.643 | 24.119 | 143 | O | VAL | 18 | 29.542 | 36.050 | 21.599 |
| 58 | CB | LYS | 8 | 19.201 | 46.882 | 24.875 | 1 44 | N | VAL | '.9 | 29.894 | 35.203 | 19.503 |
| 63 | C | LYS | 8 | 21.612 | 46.093 | 25.057 | 145 | CA | VAL | 19 | 31.254 | 35.703 | 19.397 |
| 64 | O | LYS | 8 | 22.62 9 | 46.755 | 25.305 | 146 | CB | VAL | 19 | 32.523 | 34.534 | 19.460 |
| 65 | N | ASP | 9 | 21.429 | 44.863 | 25.546 | 147 | CG1 | VAL | 19 | 32.147 | 33.697 | 20.733 |
| ο6 | CA | ASP | 9 | 22.397 | 44.307 | 26.498 | 149 | CG 2 | VAL | 19 | 32.201 | 33.660 | 18.213 |
| 67 | CB | ASP | 9 | 21,740 | 44,015 | 27.844 | 149 | C | VAL | 19 | 31.455 | 36.120 | 18.050 |
| 68 | CG | ASP | 9 | 22.755 | 43,777 | 28.947 | 150 | O | VAL | 19 | 30.702 | 36.196 | 17.068 |
| 69 | CDI | ASP | 9 | 23.926 | 43.454 | 28.637 | 151 | K | ALA | 20 | 32.464 | 37.286 | 18.043 |
| 70 | CD2 | ASP | 9 | 22.391 | 43.920 | 30.139 | 152 | CA | ALA | 20 | 32.792 | 38.120 | 16.685 |
| 71 | c | ASP | 9 | 23.048 | 43.037 | 25.940 | 153 | CD | ALA | 20 | 32.876 | 39.58B | '.7.315 |
| 72 | 0 | ASP | 9 | 22.404 | 42.015 | 25.800 | 154 | C | ALA | 20 | 34.128 | 37.741 | 16.245 |
| 73 | N | THR | 1C | 24.327 | 43.136 | 25.629 | 155 | O | ALA | 20 | 35.153 | 37.687 | 16.904 |
| 74 | CA | THR | 10 | 25.040 | 42.046 | 24.939 | 156 | N | PHE | 21 | 34 .090 | 37.514 | 14.929 |
| 75 | CB | THR | 1 0 | 26.085 | 42.628 | 23.969 | 157 | CA | EHE | 21 | 35.281 | 37.599 | 14.075 |
| 76 | OG1 | THR | 10 | 26.877 | 43.598 | 24.665 | 158 | CB | EHE | 21 | 35.088 | 36.631 | 12.911 |
| 77 | CG2 | THR | 10 | 25.395 | 43.294 | 22.773 | 159 | CG | PHE | 21 | 34.989 | 35.193 | 13,339 |
| 78 | C | THR | 10 | 25.702 | 41.075 | 25.918 | 160 | CDI | PHE | 21 | 36.146 | 34.385 | 13.393 |
| 79 | O | THR | 10' | 26.357 | 40.112 | 25.504 | 1 €1 | CE1 | PHE | 21 | 36.047 | 33.035 | 13.801 |
| 80 | N | ASN | 11 | 25.513 | 41.333 | 27.218 | 162 | cz | EHE | 21 | 34 .784 | 32.506 | 14.130 |
| 81 | CA | ASN | 11 | 26.149 | 40.583 | 28.306 | 163 | CE2 | PHE | 21 | 33.649 | 33.312 | 14.091 |
| 82 | CB | ASN | 11 | 26.927 | 41.530 | 29.238 | 164 | CD2 | PHE | 21 | 33.760 | 34.651 | 13.668 |
| 86 | C | ASN | 11 | 25.149 | 39.726 | 29.088 | 165 | c | PHE | 21 | 35.394 | 39.055 | 13.562 |
| 87 | O | ASN | 11 | 25.394 | 39.312 | 30.241 | 166 | O | EHE | 21 | 34.553 | 39.887 | 13.907 |
| 88 | N | ILE | 12 | 24.021 | 39.431 | 28.456 | 167 | N | LYS | 22 | 36.410 | 39.359 | 12.733 |
PL 213 994 B1
| A | AK | NAK | X | Y | Z | NA | A | AK | NAK | X | Y | Z |
| CA | LYS | 22 | 36.596 | 40.704 | 12.116 | 251 | N | ILE | 34 | 33.306 | 26.826 | 19.163 |
| CB | LYS | 22 | 37.718 | 40.669 | 11.056 | 252 | CA | ILE | 34 | 32.368 | 27.717 | 18.459 |
| C | LYS | 22 | 35.322 | 41.294 | 11.5C2 | 253 | CB | ILE | 34 | 32.910 | 29.166 | 18.4 35 |
| 0 | LYS | 22 | 34.921 | 42.431 | 11.839 | 254 | CG1 | ILE | 34 | 34.134 | 29.314 | 17.530 |
| N | SER | 23 | 34.666 | 40.535 | 10.623 | 255 | CDI | TLE | 34 | 34.5B1 | 30.783 | 17.235 |
| CA | SER | 23 | 33.413 | 41.017 | 10.031 | 256 | CG2 | ILE | 34 | 33.212 | 29.759 | 19.311 |
| CB | SER | 23 | 33.696 | 41.760 | 8.729 | 257 | C | TLE | 34 | 32.068 | 27.161 | 17.358 |
| OG | SER | 23 | 34.054 | 40.822 | 7,740 | 258 | C | TLE | 34 | 32.816 | 26.300 | 16.543 |
| C | SER | 23 | 32.444 | 39.866 | 9.907 | 259 | N | LEU | 35 | 30.923 | 27.551 | 16.495 |
| 0 | SER | 23 | 31.776 | 39.770 | 3.769 | 260 | CA | LEO | 35 | 30.576 | 27.230 | 15.119 |
| N | ALA | 24 | 32.366 | 38.978 | 10.801 | 261 | CB | LEU | 35 | 29.186 | 26.583 | 15.051 |
| CA | ALA | 24 | 31.463 | 37,953 | 10.726 | 262 | OG | LEU | 35 | 28.954 | 25.460 | 14.090 |
| CB | ALA | 24 | 32.085 | 36.712 | 9.948 | 263 | CDI | LEU | 35 | 29.960 | 24.312, | 14.419 |
| C | ALA | 24 | 31.154 | 37.435 | 12.172 | 264 | CD2 | LEU | 35 | 27.527 | 24.985 | 14.255 |
| 0 | ALA | 24 | 31.710 | 38.007 | 13.127 | 265 | C | LEU | 35 | 30.567 | 28.513 | 14.304 |
| N | THR | 25 | 30.278 | 36.442 | 12.288 | 265 | O | LEU | 35 | 30.199 | 29.589 | 14.768 |
| CA | THR | 25 | 29.734 | 35.999 | 13.559 | 267 | N | THR | 36 | 31.024 | 28.417 | 13.055 |
| CB | THR | 25 | 23.196 | 36.155 | 13.529 | 2 63 | CA | THR | 36 | 30.840 | 29.566 | 12.134 |
| OGl | THR | 25 | 27.869 | 37.496 | 13.076 | 2 69 | CB | THR | 36 | 31.992 | 30.616 | 12.197 |
| CG2 | THR | 25 | 27.561 | 35.922 | 14.929 | 270 | OGl | THR | 36 | 31.663 | 31.784 | 11.405 |
| C | THR | 25 | 30.112 | 34.523 | 13.777 | 271 | CG 2 | THR | 36 | 33.356 | 30.000 | 11.694 |
| 0 | THR | 25 | 30.394 | 33.8C8 | 12.925 | 272 | C | THR | 36 | 30.719 | 28.942 | 10.740 |
| N | GLY | 26 | 30.074 | 34.062 | 15.028 | 273 | O | THR | 36 | 30.522 | 27.710 | 10.640 |
| CA | GLY | 26 | 29.965 | 32.620 | 15.269 | 274 | N | ASN | 37 | 30 .773 | 29.750 | 9.672 |
| C | GLY | 26 | 29.278 | 32.455 | 16.608 | 275 | CA | ASN | 37 | 30.744 | 29.156 | 8.314 |
| 0 | GLY | 26 | 28.869 | 33.445 | 17.219 | 276 | CB | ASN | 37 | 33.149 | 30.148 | 7.238 |
| N | PHE | 27 | 29.199 | 31.237 | 17.118 | 277 | CG | ASN | 37 | 28.740 | 30.615 | 7.617 |
| CA | PHE | 27 | 28.500 | 31.078 | 18.399 | 278 | OD1 | ASN | 37 | 2Θ.41Ζ | 31.794 | 7.373 |
| CB | PHE | 27 | 26.960 | 31.025 | 18.211 | 279 | ND2 | ASN | 37 | 27.914 | 29.740 | 8.118 |
| CG | PHE | 27 | 26.472 | 29.939 | 17.310 | 280 | C | ASN | 37 | 32.150 | 28.849 | 7.808 |
| CDI | PHE | 27 | 26.108 | 28.697 | 17.824 | 281 | 0 | ASN | 3 J | 33.112 | 29.512 | 8.220 |
| CE1 | PHE | 27 | 25.644 | 27.720 | 17.015 | 282 | N | LYS | 38 | 32.263 | 27.881 | 6.870 |
| CZ | PHE | 27 | 25.519 | 27,938 | 15.626 | 283 | CA | LYS | 38 | 33.563 | 27.630 | 6.236 |
| CE2 | PHE | 27 | 25.867 | 29.187 | 15.1C6 | 284 | CB | LYS | 38 | 33.476 | 26.501 | 5.216 |
| CD2 | PHE | 2? | 26.350 | 30.157 | 15.936 | 285 | CG | LYS | 36 | 33.184 | 25.163 | 5.809 |
| C | PHE | 27 | 28.983 | 29.849 | 19.128 | 286 | CD | LYS | 36 | 32.697 | 24 .253 | 4.713 |
| 0 | PHE | 27 | 29.545 | 28.944 | 18.512 | 297 | CE | LYS | 38 | 32.468 | 22.874 | 5.223 |
| N | VAL | 28 | 28.744 | 29.814 | 20.432 | 288 | NZ | LYS | 38 | 31.657 | 22.015 | 4.218 |
| CA | VAL | 28 | 29.341 | 28.760 | 21.282 | 2B9 | C | LYS | 38 | 34.041 | 28.869 | 5.532 |
| CB | VAL | 28 | 29.472 | 29.266 | 22.756 | 290 | O | LYS | 38 | 35.229 | 29.144 | 5.543 |
| CG1 | VAL | 28 | 30.061 | 28.192 | 23.651 | 291 | N | HIS | 39 | 33.119 | 29.655 | 4.952 |
| CG2 | VAL | 28 | 3C.362 | 30.506 | 22,807 | 292 | CA | HIS | 39 | 33.552 | 30.815 | 4.168 |
| C | VAL | 28 | 28.475 | 27.517 | 21.247 | 293 | CB | HIS | 39 | 32.458 | 31.299 | 3.193 |
| 0 | VAL | 28 | 27.270 | 27.598 | 21.431 | 294 | CG | HIS | 39 | 31.335 | 32.046 | 3.828 |
| N | VAL | 29 | 29.097 | 26.334 | 21.068 | 295 | KDl | HIS | 39 | 30.077 | 31.502 | 3.979 |
| CA | VAL | 29 | 28.313 | 25.092 | 21.066 | 296 | CE1 | HIS | 39 | 29.279 | 32.413 | 4.517 |
| CB | VAL | 29 | 28.368 | 24.405 | 19.679 | 297 | NE2 | HIS | 39 | 29.976 | 33.512 | 4.716 |
| CG1 | VAL | 29 | 27.482 | 25.221 | 18.678 | 298 | CD2 | HIS | 39 | 31.254 | 33.318 | 4.267 |
| CG2 | VAL | 29 | 29.831 | 24.296 | 19.160 | 299 | C | HIS | 39 | 34.072 | 31.895 | 5.058 |
| C | VAL | 29 | 23.763 | 24.113 | 22.161 | 300 | c | HIS | 39 | 34.767 | 32.603 | 4.607 |
| 0 | VAL | 29 | 29.094 | 23.123 | 22.453 | 301 | N | VAL | 40 | 33.761 | 31.805 | 6.359 |
| N | GLY | 30 | 29.885 | 24.411 | 22.770 | 302 | CA | VAL | 40 | 34 . 416 | 32.647 | 7.358 |
| CA | GLY | 30 | 30.387 | 23.518 | 23.805 | 303 | CB | VAL | 40 | 33.502 | 32.875 | 8.592 |
| C | GLY | 30 | 31.656 | 24 .C18 | 24.411 | 30-1 | CG1 | VAL | 40 | 34.228 | 33.641 | 9.746 |
| 0 | GLY | 30 | 32.107 | 25.123 | 24.129 | 305 | CG2 | VAL | 40 | 32.257 | 33.586 | 8.143 |
| N | LYS | 31 | 32.306 | 23.147 | 25.185 | 306 | c | VAL | 40 | 35.776 | 32.096 | 7.799 |
| CA | LYS | 31 | 33.552 | 23.532 | 25.352 | 307 | O | VAL | 40 | 36.795 | 32.809 | 7.763 |
| CB | LYS | 31 | 34.118 | 22.312 | 26.593 | 308 | 6’ | SER | 41 | 35.807 | 3C.843 | 8.231 |
| CG | LYS | 31 | 35.392 | 22.633 | 27.358 | 309 | CA | SER | 41 | 37.044 | 30.291 | 8.823 |
| CD | LYS | 31 | 35.949 | 21.312 | 27.929 | 310 | CB | SER | 41 | 36.802 | 28.919 | 9.443 |
| CE | LYS | 31 | 37.189 | 21.599 | 28.747 | 311 | OG | SER | 41 | 36.231 | 28.010 | 8.527 |
| NZ | LYS | 31 | 37.531 | 20.378 | 29.569 | 312 | C | SER | 41 | 38.189 | 30.201 | 7.B06 |
| C | LYS | 31 | 34.596 | 24.013 | 24.852 | 313 | O | SER | 41 | 39.353 | 30.135 | 8.194 |
| 0 | LYS | 31 | 34.949 | 23.254 | 23.927 | 314 | N | LYS | 42 | 37.849 | 30.206 | 6.513 |
| N | ASN | 32 | 35.107 | 25-237 | 25.042 | 315 | CA | LYS | 42 | 39.910 | 30.108 | 5.531 |
| CA | ASN | 32 | 36.114 | 25.845 | 24.185 | 316 | CB | LYS | 42 | 38.333 | 29.867 | 4 . 117 |
| CB | ASN | 32 | 37.472 | 25.158 | 24.377 | 317 | CG | LYS | 42 | 37.6o4 | 31.042 | 3.506 |
| CG | ASN | 32 | 37.910 | 25.177 | 25.B24 | 318 | CD | LYS | 42 | 37.411 | 30.717 | 2.308 |
| OD1 | ASN | 32 | 37.621 | 26.139 | 26.561 | 319 | CE | LYS | 42 | 36.334 | 31.603 | 1.422 |
| ND2 | ASN | 32 | 38.544 | 24.109 | 26.255 | 320 | NZ | LYS | 42 | 36.729 | 33.035 | 1.463 |
| C | ASN | 32 | 35.797 | 25.818 | 22.705 | 321 | c | LYS | 42 | 39.837 | 31.309 | 5.517 |
| 0 | ASN | 32 | 36.730 | 25.901 | 21.895 | 322 | 0 | LYS | 42 | 40.996 | 31.226 | 5.083 |
| N | THR | 33 | 34.527 | 25.694 | 22.355 | 323 | N | ASN | 43 | 39.351 | 32.415 | 6.064 |
| CA | THR | 33 | 34.167 | 25.434 | 20.942 | 324 | CA | ASN | 43 | 40.163 | 33.613 | 6.256 |
| CB | THR | 33 | 33.800 | 23.964 | 20.738 | 325 | CB | ASN | 43 | 39.267 | 34.84C | 6.091 |
| OGl | THR | 33 | 34.860 | 23.140 | 21.266 | 326 | CG | ASN | 43 | 38.699 | 34.922 | 4.700 |
| CG2 | THR | 33 | 33.632 | 23.650 | 19.226 | 327 | 001 | ASN | 43 | 39.337 | 34 . 500 | 3.739 |
| C | THR | 33 | 33.049 | 26.295 | 20.372 | 323 | ND2 | ASN | 43 | 37.464 | 35.440 | 4 . 588 |
| 0 | THR | 33 | 31.993 | 26.432 | 20.986 | 329 | c | ASN | 43 | 40.931 | 33.700 | 7.561 |
PL213 994B1
| ΝΑ | A | AK | NAK | X | Y | Z | NA | A | AK | NAK | X | V | Z |
| 330 | 0 | ASN | 43 | 41.640 | 34.685 | 7.800 | 409 | CD2 | HIS | 53 | 29.900 | 39.050 | 26.624 |
| 331 | Ν | TYR | 44 | 40.766 | 32.680 | 8.403 | 410 | C | HIS | 53 | 30.503 | 40.410 | 23.375 |
| 332 | CA | TYR | 44 | 41.380 | 32.640 | 9.715 | 411 | 0 | HIS | 53 | 30.140 | 41.003 | 24.407 |
| 333 | CB | TYR | 44 | 40.282 | 32.499 | 10.799 | 412 | N | PRO | 54 | 31.208 | 41.014 | 22.392 |
| 334 | CG | TYR | 44 | 39.581 | 33.816 | 10,912 | 413 | CA | PRO | 54 | 31.604 | 42.425 | 22.535 |
| 335 | CDI | TYR | 44 | 40.054 | 34.799 | 11.782 | 414 | CB | PRO | 54 | 32.485 | 42.680 | 21.294 |
| 336 | CE1 | TYR | 44 | 39.450 | 36.043 | 11.842 | 415 | CG | PRO | 54 | 31.968 | 41.691 | 20.246 |
| 337 | CZ | TYR | 44 | 38.381 | 36.321 | 11.010 | 416 | CD | PRO | 54 | 31.655 | 40.446 | 21.100 |
| 338 | OH | TYR | 44 | 37.781 | 37.580 | 11.082 | 417 | C | PRO | 54 | 30.382 | 43.355 | 22.502 |
| 339 | CE2 | TYR | 44 | 37.896 | 35.369 | 10.144 | 418 | 0 | PRO | 54 | 29.368 | 43.046 | 21.832 |
| 340 | CD2 | TYR | 44 | 38.500 | 34.124 | 10.093 | 419 | N | ASN | 55 | 30.493 | 44.460 | 23.249 |
| 341 | C | TYR | 44 | 42.385 | 31.519 | 9.786 | 420 | CA | ASN | 55 | 29.509 | 45.545 | 23.220 |
| 342 | 0 | TYR | 44 | 42.372 | 30.645 | 8.942 | 421 | CB | ASN | 55 | 29.217 | 46.031 | 24.642 |
| 343 | N | LYS | 45 | 43.222 | 31.545 | 10-815 | 425 | C | ASN | 55 | 30.063 | 46.689 | 22.356 |
| 344 | CA | LYS | 45 | 44.121 | 30.439 | 11.052 | 426 | 0 | ASN | 55 | 31.219 | 46.647 | 21.935 |
| 345 | CB | LYS | 45 | 45.518 | 30.800 | 10.531 | 427 | N | SER | 56 | 29.245 | 47.710 | 22.C35 |
| 346 | CG | LYS | 45 | 46.108 | 32.001 | 11.242 | 428 | CA | SER | 56 | 29.630 | 48.765 | 21.126 |
| 347 | CD | LYS | 45 | 47.533 | 32.302 | 10.745 | 429 | CB | SER | 56 | 28.466 | 49,744 | 20.890 |
| 348 | CE | LYS | 45 | 48.226 | 33.306 | 11.667 | 430 | OG | SER | 56 | 27,245 | 49.058 | 20.621 |
| 349 | NZ | LYS | 45 | 47.618 | 34.698 | 11.675 | 431 | C | SER | 56 | 30,897 | 49.547 | 21.530 |
| 350 | C | 1YS | 45 | 44.212 | 30.222 | 12.557 | 432 | 0 | SER | 56 | 31.576 | 50.134 | 20.673 |
| 35; | 0 | LYS | 45 | 43.819 | 31.077 | 13.346 | 433 | N | ASP | 57 | 31.218 | 49.544 | 22.827 |
| 352 | N | VAL | 46 | 44.742 | 29.069 | 12.932 | 434 | CA | ASP | 57 | 32.317 | 50.355 | 23.352 |
| 353 | CA | VAL | 46 | 45.187 | 28.823 | 14.308 | 435 | CB | ASP | 57 | 31,796 | 51.720 | 23.632 |
| 354 | CB | VAL | 46 | 45.883 | 27.426 | 14.411 | 439 | C | ASP | 57 | 33.095 | 49.647 | 24.469 |
| 355 | CG1 | VAL | 46 | 46.455 | 27.200 | 15.766 | 440 | 0 | ASP | 57 | 32.705 | 49.693 | 25.656 |
| 356 | CG2 | VAL | 46 | 44.904 | 26.320 | 14.070 | 441 | N | LYS | 58 | 34.173 | 48.973 | 24.058 |
| 357 | C | VAL | 46 | 46.117 | 29.974 | 14.748 | 442 | CA | LYS | 58 | 35.207 | 48.449 | 24.966 |
| 359 | 0 | VAL | 46 | 47.065 | 30.366 | 14.024 | 443 | CB | LYS | 58 | 35.63C | 49.521 | 26.001 |
| 359 | N | GLY | 47 | 45.841 | 30.504 | 15.943 | 448 | C | LYS | 58 | 34.902 | 47.098 | 25.647 |
| 360 | CA | GLY | 47 | 46.545 | 31.646 | 16.469 | 449 | 0 | LYS | 58 | 35.796 | 46.248 | 25.732 |
| 361 | C | GLY | 47 | 45.863 | 32.989 | 16.291 | 450 | N | GLY | 59 | 33.667 | 46.883 | 26.113 |
| 362 | 0 | GLY | 47 | 46.262 | 33.964 | 16.930 | 451 | CA | GLY | 59 | 33.378 | 45.702 | 26.960 |
| 363 | N | ASP | 48 | 44.887 | 33.077 | 15.389 | 452 | C | GLY | 59 | 33.155 | 44.394 | 26.196 |
| 364 | CA | ASP | 48 | 44.088 | 34.307 | 15.275 | 453 | 0 | GLY | 59 | 32.487 | 44.404 | 25.149 |
| 365 | CB | ASP | 48 | 43.230 | 34.309 | 14.035 | 454 | N | ASN | 60 | 33.681 | 43.276 | 26.729 |
| 366 | CG | ASP | 48 | 44.028 | 34.571 | 12.783 | 455 | CA | ASN | 60 | 33.534 | 41.948 | 26.086 |
| 367 | OD1 | ASP | 48 | 45.175 | 35.085 | 12.879 | 456 | CB | ASN | 60 | 34.532 | 41,846 | 24.904 |
| 368 | OD2 | ASP | 48 | 43.498 | 34.235 | 11.718 | 457 | CG | ASN | 60 | 35.984 | 41.917 | 25.350 |
| 369 | C | ASP | 48 | 43.152 | 34.421 | 16,456 | 4 56 | OD1 | ASN | 60 | 36.392 | 41.201 | 26,263 |
| 370 | 0 | ASP | 48 | 42.951 | 33,447 | 17.144 | 459 | ND2 | ASN | 60 | 36.780 | 42.770 | 24,706 |
| 371 | N | ARG | 49 | 42.527 | 35.590 | 16.613 | 460 | C | ASN | 60 | 33.708 | 40.791 | 27.110 |
| 372 | CA | ARG | 49 | 41.737 | 35,848 | 17.809 | 461 | O | ASN | 60 | 34,027 | 41.045 | 28.263 |
| 373 | CB | ARG | 49 | 42.343 | 37.017 | 18.582 | 462 | N | GLY | 61 | 33.514 | 39.540 | 26.677 |
| 374 | CG | ARG | 49 | 43.592 | 36.533 | 19.290 | 463 | CA | GLY | 61 | 33.667 | 38.360 | 27.557 |
| 375 | CD | ARG | 49 | 44.783 | 37.415 | 19.028 | 464 | C | GLY | 61 | 35.061 | 37.740 | 27 .451 |
| 376 | NE | ARG | 49 | 46-003 | 36.865 | 19.623 | 465 | O | GLY | 61 | 35.315 | 36.643 | 27.924 |
| 377 | CZ | ARG | 49 | 46.839 | 37.540 | 20.411 | 466 | N | GLY | 62 | 35.964 | 38.484 | 26.842 |
| 378 | NH1 | ARG | 49 | 46.616 | 38.618 | 20.717 | 467 | CA | GLY | 62 | 37.338 | 38.043 | 26.679 |
| 379 | NH2 | ARG | 49 | 47,917 | 36,926 | 20.883 | 468 | C | GLY | 62 | 37.713 | 37.938 | 25.218 |
| 380 | C | ARG | 49 | 40,251 | 36.036 | 17.523 | 469 | O | GLY | 62 | 36.846 | 37 .365 | 24.335 |
| 381 | 0 | ARG | 49 | 39.848 | 36.404 | 16.409 | 470 | N | ILE | 63 | 39.019 | 37.886 | 24.995 |
| 382 | N | ILE | 50 | 39.424 | 35.681 | 18.503 | 471 | CA | ILE | 63 | 39.616 | 37.666 | 23.672 |
| 383 | CA | ILE | 50 | 37.985 | 36.000 | 18.452 | 472 | CB | ILE | 63 | 40,591 | 38.8C3 | 23.289 |
| 384 | CB | ILE | 50 | 37.060 | 34.752 | 18.196 | 473 | CG1 | ILE | 63 | 39.807 | 40.115 | 23.141 |
| 385 | CG1 | ILE | 50 | 37.132 | 33.663 | 19.296 | 474 | CDI | ILE | 63 | 40.666 | 41.323 | 22.959 |
| 386 | CDI | ILE | 50 | 36.338 | 33.925 | 20.613 | 475 | CG2 | ILE | 63 | 41.272 | 38.474 | 21.965 |
| 387 | CG2 | ILE | 50 | 37.447 | 34.048 | 16.894 | 476 | C | ILE | 63 | 40.339 | 36.334 | 23,746 |
| 388 | C | ILE | 50 | 37.635 | 36.694 | 19.760 | 477 | O | ILE | 63 | 41.083 | 36.C92 | 24.680 |
| 389 | 0 | ILE | 50 | 38.339 | 36.522 | 20.761 | 478 | N | TYR | 64 | 40.059 | 35.449 | 22.790 |
| 390 | N | THR | 51 | 36.557 | 37.473 | 19.743 | 479 | CA | TYR | 64 | 40.546 | 34,068 | 22.B17 |
| 391 | CA | THR | 51 | 36.133 | 38.234 | 20.926 | 480 | CB | TYR | 64 | 39.369 | 33.105 | 23.041 |
| 392 | CB | THR | 51 | 36.113 | 39.742 | 20.659 | 481 | CG | TYR | 64 | 38.678 | 33.439 | 24.340 |
| 393 | OG1 | THR | 51 | 37.451 | 40.114 | 20.32.6 | 482 | CDI | TYR | 64 | 39.104 | 32.874 | 25.544 |
| 394 | CG2 | THR | 51 | 35.766 | 40.479 | 21.965 | 483 | CE1 | TYR | 64 | 38.489 | 33.207 | 26.740 |
| 395 | C | THR | 51 | 34.764 | 37.742 | 21.330 | 484 | CZ | TYR | 64 | 37.451 | 34,114 | 25.734 |
| 396 | 0 | THR | 51 | 33.894 | 37.598 | 20.506 | 485 | OH | TYR | 64 | 36.836 | 34.509 | 27.915 |
| 397 | N | ALA | 52 | 34.601 | 37.439 | 22.616 | 486 | CE2 | TYR | 64 | 37.021 | 34.701 | 25.569 |
| 398 | CA | ALA | 52 | 33.336 | 36.903 | 23.087 | 487 | CD2 | TYR | 64 | 37.620 | 34.358 | 24.365 |
| 399 | CB | ALA | 52 | 33.535 | 36.050 | 24.309 | 488 | C | TYR | 64 | 41.280 | 33.697 | 21.540 |
| 400 | C | ALA | 52 | 32.398 | 38.076 | 23.406 | 489 | O | TYR | 64 | 40.938 | 34.178 | 20.468 |
| 401 | 0 | ALA | 52 | 32.791 | 39.018 | 24.087 | 490 | N | SER | 65 | 42.279 | 32.832 | 21.690 |
| 402 | N | HIS | 53 | 31.180 | 37.969 | 22.900 | 491 | CA | SER | 65 | 43.130 | 32.365 | 20.575 |
| 403 | CA | HIS | 53 | 30.089 | 3S.950 | 23.146 | 492 | CB | SER | 65 | 44.504 | 31.982 | 21.184 |
| 404 | CB | HIS | 53 | 29.099 | 38.446 | 24.218 | 493 | OG | SER | 65 | 45.431 | 31.657 | 20.174 |
| 405 | CG | HIS | 53 | 29.686 | 38.203 | 25.588 | 494 | C | SER | 65 | 42.504 | 31.137 | 19.919 |
| 406 | ND1 | HIS | 53 | 30.017 | 36.942 | 26.054 | 495 | 0 | SER | 65 | 42.039 | 30.202 | 20.607 |
| 407 | CE1 | HIS | 53 | 30.444 | 37.036 | 27,304 | 496 | N | ILE | 66 | 42.453 | 31.088 | 18.583 |
| 408 | NE2 | HIS | 53 | 30.381 | 38.302 | 27,671 | 497 | CA | ILE | 66 | 42.003 | 29.915 | 17.903 |
PL 213 994 B1
| A | AK | NAK | X | Y | Z | NA | A | AK | NAK | X | Y | Z | |
| CB | ILE | 66 | 41.714 | 30.237 | 16 | .411 | 577 | Ó | LYS | 75 | 2B .367 | 22.833 | 1.760 |
| CG1 | ILE | 66 | 40.496 | 31.207 | 16 | .327 | 578 | N | GLU | 76 | 27.526 | 21.421 | 3,284 |
| CDI | ILE | 66 | 40.191 | 31.666 | 14 | .874 | 579 | CA | GLU | 76 | 27.055 | 22.480 | 4,189 |
| CG 2 | ILE | 66 | 41.396 | 28.923 | 15 | .662 | 580 | CB | GLU | 76 | 26.204 | 21.864 | 5.318 |
| C | ILE | 66 | 43.021 | 28.765 | 18 | .024 | 581 | CG | GLU | 76 | 24.892 | 31 ,208 | 4,762 |
| 0 | ILE | 66 | 44.196 | 28.976 | 17 | .758 | 582 | CD | GLU | 76 | 25.054 | 19.758 | 4.319 |
| N | LYS | 67 | 42.578 | 27.571 | 18 | .424 | 583 | OE1 | GLU | 76 | 26.192 | 19.216 | 4.324 |
| CA | LYS | 67 | 43.503 | 26.389 | 18 | .506 | 584 | OE2 | GLU | 76 | 24.005 | 19.173 | 3.967 |
| CB | LYS | 67 | 43.577 | 25.815 | 19 | .948 | 585 | Λ | GLU | 76 | 23.145 | 23.372 | 4.735 |
| CG | LYS | 67 | 42.368 | 25-092 | 20 | .370 | 596 | 0 | GLU | 76 | 29.257 | 22.909 | 5.068 |
| CD | LYS | 67 | 42,601 | 24.493 | 21 | .754 | 597 | N | ASP | 77 | 27.832 | 24.670 | 4,831 |
| CE | LYS | 67 | 41.373 | 23.768 | 22 | .323 | 586 | CA | ASP | 77 | 28.813 | 25.725 | 5.103 |
| NZ | LYS | 67 | 41.905 | 23.005 | 23 | .560 | 599 | CB | ASP | 77 | 28.306 | 27.048 | 4.480 |
| C | LYS | 67 | 43.257 | 25.294 | 17 | .494 | 590 | CG | ASP | 77 | 29.384 | 28.086 | 4.250 |
| 0 | LYS | 67 | 44.131 | 24.401 | 17 | .257 | 591 | OD1 | ASP | 77 | 30.521 | 27,925 | 4.763 |
| M | LYS | 68 | 42.088 | 25.280 | 16 | . 878 | 592 | OD2 | ASP | 77 | 29.112 | 29.101 | 3.582 |
| CA | LYS | 68 | 41.769 | 24.287 | 15 | .868 | 593 | C | ASP | 77 | 28.989 | 25.853 | 6.647 |
| CB | LYS | 68 | 41.333 | 22.973 | 16 | .525 | 594 | O | ASP | 7 7 | 20,567 | 26.839 | 7.261 |
| CG | LYS | 68 | 41.596 | 21.719 | 15 | .698 | 595 | N | VAL | 78 | 29.616 | 24.840 | 7.251 |
| CD | LYS | 68 | 41.330 | 20.400 | 16 | .474 | 596 | CA | VAL | 78 | 29.703 | 24.730 | 8,710 |
| CE | LYS | 68 | 41.533 | 19.209 | 15 | .514 | 597 | CB | VAL | 78 | 28.817 | 23.564 | 9,223 |
| NZ | LYS | 68 | 41.215 | 17.878 | 16 | .112 | 598 | CG1 | VAL | 78 | 29.094 | 23.278 | 10.776 |
| 2 | LYS | 68 | 40.670 | 24.797 | 14 | .994 | 599 | CG2 | VAL | 78 | 27.344 | 23.967 | 6.992 |
| 0 | LYS | €8 | 39.768 | 25.465 | 15 | .487 | 600 | C | VAL | 78 | 31.141 | 24.423 | 9.07C |
| N | ILE | 69 | 40.742 | 24,448 | 13 | .702 | 601 | C | VAL | 78 | 31 .736 | 23.493 | 6.503 |
| CA | ILE | 69 | 39.675 | 24.748 | 12 | .715 | 602 | N | SER | 79 | 31.706 | 25.184 | 10.003 |
| CB | ILE | 69 | 40.140 | 25.815 | 11 | .653 | 603 | CA | SER | 79 | 33.070 | 24.944 | 10.454 |
| CG1 | ILE | 69 | 40.541 | 27.110 | 12 | .360 | 604 | CB | SER | 79 | 33.941 | 26.044 | 9,817 |
| CDI | ILE | 69 | 41.188 | 28.224 | 11 | .503 | 605 | CG | SER | 79 | 35.276 | 25.966 | 10.239 |
| CG2 | ILE | 69 | 39.067 | 26.038 | 10 | .599 | 606 | C | SER | 79 | 33.117 | 24.973 | 11.983 |
| C | ILE | 69 | 39.348 | 23.433 | 12 | .049 | 607 | O | SER | 79 | 32.500 | 25.852 | 12.585 |
| 0 | ILE | 69 | 40.252 | 22.748 | 11 | .495 | 609 | H | VAL | 80 | 33.858 | 24.040 | 12.58Θ |
| N | ILE | 70 | 38.088 | 23.031 | 12 | .130 | 609 | CA | VAL | 30 | 34.044 | 24.010 | 14.064 |
| CA | ILE | 70 | 37.681 | 21.741 | 11 | , 601 | 610 | CB | VAL | BO | 34.051 | 22.539 | 14.584 |
| CB | ILE | 70 | 37.272 | 20.726 | 12 | . 689 | 611 | CG1 | VAL | 80 | 34.466 | 22.489 | 16.035 |
| CG1 | TLE | 70 | 38.328 | 20.598 | 13 | .787 | 612 | CG2 | VAL | BO | 32.665 | 21 .910 | 14.427 |
| CDI | ILE | 70 | 37.861 | 21.152 | 15 | .071 | 613 | C | VAL | BO | 35.363 | 24.698 | 14.389 |
| CG2 | ILE | 70 | 36.992 | 19.360 | 12 | .081 | 614 | O | VAL | 80 | 36.389 | 24.406 | 13.775 |
| C | ILE | 70 | 36.477 | 21.963 | 10 | .738 | 615 | N | ILE | 81 | 35.331 | 25,621 | 15.942 |
| 0 | TLE | 70 | 35.402 | 22.199 | 11 | .250 | 616 | CA | ILE | 81 | 36.494 | 26.372 | 15.745 |
| N | ASN | 71 | 36.641 | 21.983 | 9. | 423 | 617 | CB | ILE | 01 | 36.259 | 27.903 | 15.544 |
| CA | ASN | 71 | 35.499 | 22.025 | 8 . | 513 | 618 | CG1 | ILE | 81 | 35.722 | 28.206 | 14.145 |
| CB | ASN | 71 | 35.987 | 22.385 | 7. | 099 | 619 | CDI | ILE | 81 | 36.676 | 27.853 | 13.094 |
| CG | ASN | 71 | 36.525 | 23.821 | 6. | 991 | 620 | CG2 | ILE | 81 | 37.525 | 28 . 681 | 15.00 7 |
| OD1 | ASN | 71 | 36.554 | 24.583 | 7 . | 961 | 621 | C | ILE | 81 | 36.693 | 26.153 | 17.243 |
| ND2 | ASN | 71 | 36.939 | 24.196 | 5. | 770 | 622 | c | ILE | 81 | 35.797 | 26.49C | IB.051 |
| C | ASN | 71 | 34.692 | 20.748 | 8 . | 429 | 623 | N | GLN | 82 | 37.827 | 25.58C | 17.626 |
| U | ASN | 71 | 35.265 | 19.632 | 8 . | 437 | 624 | CA | CtTiN | 92 | 38.170 | 25.472 | 19.073 |
| N | TYR | 72 | 33.377 | 20.891 | 9. | 302 | 625 | CB | GLN | 92 | 38.844 | 24.134 | 19.3Θ4 |
| CA | TYR | 72 | 32.469 | 19.760 | B . | 114 | 626 | CG | GLN | 82 | 38.051 | 22.928 | 18.981 |
| CB | TYR | 72 | 31.015 | 20.236 | B . | 218 | 627 | CD | GLN | 82 | 38.764 | 21.646 | 19.374 |
| CG | TYR | 72 | 29.993 | 19.149 | 7. | 932 | 628 | OEl | GLN | 82 | 39.895 | 21.689 | 19.850 |
| CDI | TYR | 72 | 29.979 | 17.976 | 8. | 686 | 629 | NE2 | GLN | 82 | 38.136 | 20,515 | 19.120 |
| CEl | TYR | 72 | 29.038 | 16.971 | B. | 457 | 630 | ς | CLN | 82 | 39.097 | 26.598 | 19.412 |
| CZ | TYR | 72 | 28.114 | 17.112 | 7. | 455 | 631 | o | GLN | B2 | 39.9C2 | 27.013 | 18.562 |
| OH | TYR | 72 | 27.203 | 16.093 | 7. | 235 | 632 | K | VAL | 83 | 39.0C4 | 27.082 | 20.659 |
| CE2 | TYR | 72 | 28.087 | 18.261 | 6. | 675 | 633 | CA | VAL | 83 | 39.842 | 28.144 | 21.172 |
| CD2 | TYR | 72 | 29.030 | 19.290 | 6. | 924 | 634 | CB | VAL | 83 | 39.021 | 29.425 | 21.551 |
| C | TYR | 72 | 32.680 | 19.126 | 6. | 719 | 635 | CG1 | VAL | 83 | 39.455 | 30.087 | 20.263 |
| 0 | TYR | 72 | 32.611 | 19.826 | 5. | 729 | 636 | CG2 | VAL | 83 | 37.951 | 29.084 | 22.61C |
| N | PRO | 73 | 32.965 | 17.810 | 6. | 657 | 637 | C | VAL | 83 | 40.617 | 27.654 | 22.399 |
| CA | PRO | 73 | 33.037 | 17.180 | 5. | 341 | 638 | O | VAL | 83 | 40.176 | 26.722 | 23.070 |
| CB | PRO | 73 | 33.818 | 15.868 | 5 . | 619 | 639 | N | GLU | 84 | 41.771 | 28.253 | 22.650 |
| CG | PRO | 73 | 34.387 | 16.043 | 7. | 065 | 640 | CA | GLU | 84 | 42.471 | 28.040 | 23.921 |
| CD | PRO | 73 | 33.268 | 16.626 | 7. | 722 | 641 | CB | GLU | 04 | 43.7B0 | 28.837 | 23.987 |
| C | PRO | 73 | 31.629 | 16.959 | 4. | 776 | 642 | CG | GLU | 84 | 44.947 | 28.145 | 23.251 |
| 0 | PRO | 73 | 30.889 | 16.057 | 5. | 190 | 643 | CD | GLU | 04 | 45.246 | 26.717 | 23.778 |
| N | GLY | 74 | 31.237 | 17.833 | 3 . | 857 | 644 | CEl | GLU | 84 | 45.090 | 26.422 | 25.000 |
| CA | GLY | 74 | 29.910 | 17.767 | 3 . | 26B | 645 | CE2 | GLU | 84 | 45.622 | 25.868 | 22.950 |
| c | GLY | 74 | 29.673 | 19.118 | 2. | 611 | 646 | c | GLU | 81 | 11.544 | 28.435 | 25.056 |
| 0 | GLY | 74 | 30.491 | 20.025 | 2 . | 764 | 647 | 0 | GLU | 84 | 40.893 | 29.491 | 24,993 |
| N | LYS | 75 | 28.574 | 19.252 | 1. | 634 | 648 | N | GLU | 95 | 41.417 | 27.547 | 26.029 |
| CA | ŁYS | 75 | 28.286 | 20.514 | 1. | 163 | 649 | CA | GLU | 95 | 40.569 | 27.766 | 27.210 |
| CB | LYS | 75 | 27.101 | 20.355 | 0. | 175 | 6S0 | CB | GLU | 95 | 40.651 | 26.536 | 28.130 |
| CG | LYS | 75 | 25.766 | 20.104 | 0. | 824 | 651 | CG | GLU | 35 | 39.573 | 26.486 | 29.232 |
| CD | LYS | 75 | 24.594 | 19.932 | -0 | .116 | 652 | CD | GLU | 35 | 39.283 | 25.087 | 29.780 |
| CE | LYS | 75 | 23.270 | 20.077 | 0. | 652 | 653 | OE1 | GLU | 35 | 39.476 | 24,053 | 29.086 |
| NZ | LYS | 75 | 22.050 | 19.684 | -0 | .133 | 654 | OE2 | GLU | B5 | 38.788 | 25.033 | 30.912 |
| C | LYS | 75 | 28.052 | 21.691 | 2. | 098 | 6S5 | C | GLU | 85 | 40.928 | 29.032 | 27.987 |
PL213 994B1
| ΝΑ | A | AK | NAK | X | Y | Z | NA | A | AK | NAK | X | Y | Z |
| 656 | 0 | GLU | 85 | 40.033 | 29.712 | 28.541 | 735 | O | PHE | 95 | 40.075 | 32.535 | 30.170 |
| 657 | Ν | ARG | 86 | 42.222 | 29.351 | 28.034 | 736 | N | ASN | 96 | 38.944 | 31.938 | 32.024 |
| 658 | CA | ARG | 86 | 42.717 | 30.548 | 28.716 | 737 | CA | ASN | 96 | 38.388 | 30.743 | 31.386 |
| 659 | CB | ARG | 86 | 44.106 | 30.345 | 29.352 | 738 | CB | ASN | 96 | 37.901 | 29.741 | 32.432 |
| 660 | CG | ARG | 86 | 44.641 | 31.626 | 30-051 | 739 | CG | ASN | 96 | 37.748 | 28.353 | 31.870 |
| 661 | CD | ARG | B6 | 46.065 | 31.476 | 30.632 | 740 | ODl | ASN | 96 | 36,998 | 28.131 | 30.929 |
| 662 | NE | ARG | 86 | 46.463 | 32.746 | 31.257 | 741 | ND 2 | ASN | 96 | 38.445 | 27.401 | 32.454 |
| 663 | CZ | ARG | 86 | 46.162 | 33.093 | 32.513 | 742 | c | ASN | 96 | 37.260 | 31.071 | 30.427 |
| 664 | NE1 | ARG | 86 | 45.478 | 32.264 | 33.296 | 743 | 0 | ASN | 96 | 36.230 | 31.614 | 30.830 |
| 665 | NH2 | ARG | 86 | 46.546 | 34.267 | 32.995 | 744 | N | PHE | 97 | 37.446 | 30.701 | 29.160 |
| 666 | C | ARG | 86 | 42.737 | 31.742 | 27.781 | 745 | CA | PHE | 97 | 36.436 | 30.880 | 28.116 |
| 667 | 0 | ARG | 86 | 43.477 | 31.757 | 26.766 | 746 | CB | PHE | 97 | 36.835 | 29.997 | 26.906 |
| 668 | N | ALA | 87 | 41.915 | 32.750 | 28.123 | 747 | CG | PHE | 97 | 35.867 | 30.057 | 25.749 |
| 669 | CA | ALA | 87 | 41.866 | 34.012 | 27.371 | 748 | CDI | PHE | 97 | 35.813 | 31.184 | 24.915 |
| 670 | CB | ALA | 87 | 40.861 | 35.017 | 27.996 | 749 | CEl | PHE | 97 | 34.895 | 31.204 | 23.817 |
| 671 | c | ALA | 87 | 43.221 | 34.666 | 27.204 | 750 | cz | PHE | 97 | 34.077 | 30.109 | 23.576 |
| 672 | 0 | ALA | S7 | 44.070 | 34.631 | 28.112 | 751 | CE2 | PHE | 97 | 34.127 | 28.991 | 24.427 |
| 673 | N | ILE | 88 | 43.406 | 35.270 | 26.030 | 752 | CD2 | PHE | 97 | 35.032 | 20.980 | 25.482 |
| 674 | CA | ILE | 88 | 44.512 | 36.184 | 25.791 | 753 | C | PHE | 97 | 35.081 | 30.439 | 28.596 |
| 675 | CB | ILE | 88 | 44.633 | 36.544 | 24.261 | 754 | O | PHE | 97 | 34.087 | 31.153 | 28.428 |
| 676 | CG1 | ILE | 88 | 44.833 | 35.272 | 23.431 | 755 | N | ASN | 98 | 35.047 | 29.256 | 29,221 |
| 677 | CDI | ILE | 88 | 45.976 | 34.312 | 23.950 | 756 | CA | ASN | 98 | 33.797 | 28.620 | 29.557 |
| 678 | CG2 | ILE | 88 | 45.743 | 37.582 | 23.992 | 757 | CB | ASN | 98 | 34.040 | 27.160 | 29.832 |
| 679 | C | ILE | 68 | 44.251 | 37.425 | 26.652 | 758 | CG | ASN | 98 | 34.743 | 26.504 | 28.662 |
| 680 | O | ILE | 88 | 45.148 | 37.919 | 27.342 | 759 | ODl | ASN | 98 | 34.188 | 26.453 | 27.546 |
| 681 | N | GLU | 89 | 43.014 | 37.916 | 26.612 | 760 | ND2 | ASN | 98 | 35.996 | 26.119 | 28.868 |
| 682 | CA | GLU | 89 | 42.575 | 39.003 | 27.490 | 761 | C | ASN | 98 | 33.027 | 29.272 | 30.689 |
| 683 | CB | GLU | 89 | 42.258 | 40,261 | 26.695 | 7 62 | O | ASN | 98 | 31.840 | 28.995 | 30.863 |
| 684 | CG | GLU | 89 | 43.507 | 40.865 | 26.047 | 7 63 | N | ASP | 99 | 33.733 | 30.072 | 31.466 |
| 685 | GD | GLU | 89 | 43.225 | 42.087 | 25.211 | 7 64 | CA | ASP | 99 | 33.089 | 30.857 | 32.555 |
| 686 | OSI | GLU | 89 | 42.225 | 42.803 | 25.503 | 765 | CB | ASP | 99 | 34.121 | 31.186 | 33.616 |
| 687 | OE2 | GLU | 89 | 44.018 | 42.331 | 24.262 | 766 | CG | ASP | 99 | 34.529 | 29.980 | 34.431 |
| 688 | c | GLU | 89 | 41.358 | 38.527 | 28.267 | 767 | ODl | ASP | 99 | 33.704 | 29.035 | 34.655 |
| 689 | 0 | GLU | 89 | 40.396 | 38.081 | 27.669 | 768 | OD2 | ASP | 99 | 35.690 | 29.971 | 34.Θ79 |
| 690 | N | ARG | 90 | 41.433 | 38.584 | 29.598 | 769 | c | ASP | 99 | 32.475 | 32.136 | 32.006 |
| 691 | CA | ARG | 90 | 40.378 | 38.046 | 30.473 | 770 | 0 | ASP | 99 | 31.648 | 32.768 | 32.679 |
| 692 | CB | ARG | 90 | 40.702 | 38.115 | 31.967 | 771 | N | ASN | 100 | 32.877 | 32.530 | 30.709 |
| 693 | CG | ARG | 90 | 40.658 | 39.490 | 32.648 | 772 | CA | ASN | 100 | 32.458 | 33.820 | 30.232 |
| 694 | CD | ARG | 90 | 41.204 | 39.387 | 34.097 | 773 | CB | ASN | 100 | 33.656 | 34.538 | 29,629 |
| 695 | NE | ARG | 90 | 40.267 | 38.800 | 35.070 | 774 | CG | ASN | 100 | 34.508 | 35.176 | 30.653 |
| 696 | CZ | ARG | 90 | 40.597 | 38.086 | 36.166 | 775 | ODl | ASN | 100 | 34.178 | 36.245 | 31.178 |
| 697 | NH1 | ARG | 90 | 39.640 | 37.642 | 36.988 | 776 | ND2 | ASN | 100 | 35.644 | 34.547 | 30.943 |
| 69S | ΝΗΞ | ARG | 90 | 41.862 | 37,787 | 36.457 | 777 | c | ASN | 100 | 31.378 | 33.720 | 29,171 |
| 699 | c | ARG | 90 | 39.023 | 38.694 | 30.257 | 778 | 0 | ASN | 100 | 30.838 | 34.738 | 28,762 |
| 700 | 0 | ARG | 90 | 38.914 | 39.845 | 29.789 | 779 | N | VAL | 101 | 31,090 | 32.509 | 28.697 |
| 701 | N | GLY | 91 | 37.983 | 37.930 | 30.547 | 780 | CA | VAL | 101 | 30.135 | 32.307 | 27.635 |
| 702 | CA | GLY | 91 | 36.635 | 38.474 | 30.570 | 781 | CB | VAL | 101 | 30.863 | 31.866 | 26.311 |
| 703 | C | GLY | 91 | 36.291 | 38.863 | 32.003 | 782 | CG1 | VAL | 101 | 31.962 | 32.812 | 25.927 |
| 704 | 0 | GLY | 91 | 37.138 | 38,745 | 32.926 | 783 | CG2 | VAL | 101 | 31.424 | 30.381 | 26.485 |
| 705 | N | PRO | 92 | 35.068 | 39.360 | 32.205 | 784 | C | VAL | 101 | 29.104 | 31.263 | 27.998 |
| 706 | CA | PRO | 92 | 34.661 | 39.755 | 33.564 | 785 | O | VAL | 101 | 29.296 | 30.471 | 28.953 |
| 707 | Cd | PRO | 92 | 33.282 | 40.419 | 33.344 | 786 | N | THR | 102 | 28.013 | 31.227 | 27.224 |
| 708 | CG | PRO | 92 | 33.349 | 40,885 | 31.940 | 787 | CA | THR | 102 | 26.924 | 30.307 | 27 , 444 |
| 709 | CD | PRO | 92 | 34.022 | 39.707 | 31.228 | 788 | CB | THR | 102 | 25.645 | 31.045 | 27.917 |
| 710 | C | PRO | 92 | 34.582 | 38.592 | 34.535 | 789 | OGl | THR | 102 | 25.304 | 32.054 | 26.945 |
| 711 | O | PRO | 92 | 34.621 | 38.810 | 35.760 | 790 | CG2 | THR | 102 | 25.877 | 31.735 | 29.262 |
| 712 | N | LYS | 93 | 34.484 | 37.368 | 34.014 | 791 | c | THR | 102 | 26.614 | 29.600 | 26.123 |
| 713 | CA | LYS | 93 | 34.425 | 36.179 | 34.844 | 792 | 0 | THR | 102 | 26.143 | 30.233 | 25.195 |
| 714 | CB | LYS | 93 | 33.242 | 35.294 | 34.444 | 793 | N | PRO | 103 | 26.872 | 28.294 | 26.036 |
| 715 | CG | LYS | 93 | 31.881 | 35,983 | 34.587 | 794 | CA | PRO | 103 | 26.547 | 27.494 | 24.844 |
| 716 | CD | LYS | 93 | 30.743 | 34.991 | 34.310 | 795 | CB | PRO | 103 | 27.016 | 26.064 | 25.235 |
| 717 | CE | LYS | 93 | 30.572 | 33.989 | 35.450 | 796 | CG | PRO | 103 | 28.020 | 26.277 | 26.324 |
| 718 | NZ | LYS | 93 | 30.525 | 32.535 | 35.018 | 797 | CD | PRO | 103 | 27.528 | 27.495 | 27.092 |
| 719 | C | LYS | 93 | 35.766 | 35.407 | 34.788 | 798 | C | PRO | 103 | 25.046 | 27.440 | 24.560 |
| 720 | 0 | LYS | 93 | 35.824 | 34.225 | 35.098 | 799 | O | PRO | 103 | 24.232 | 27.489 | 25.505 |
| 721 | N | GLY | &4 | 36.827 | 36.122 | 34.446 | 800 | N | PHE | 104 | 24.669 | 27,307 | 23.295 |
| 722 | CA | GLY | 94 | 38.175 | 35.601 | 34.534 | 801 | CA | PHE | 104 | 23.277 | 27.081 | 22.945 |
| 723 | C | GLY | 94 | 38.703 | 35.093 | 33.195 | 802 | CB | PHE | 104 | 22.998 | 27.633 | 21.536 |
| 724 | 0 | GLY | 94 | 38.155 | 35.398 | 32.145 | 803 | CG | PHE | 104 | 23.078 | 29.139 | 21.463 |
| 725 | N | PHE | 95 | 39.784 | 34.333 | 33.271 | 804 | CDI | PHE | 104 | 22.131 | 29,929 | 22.112 |
| 726 | CA | PHE | 95 | 40.474 | 33-849 | 32.078 | 805 | CEl | PHE | 104 | 22.222 | 31.333 | 22.058 |
| 727 | CB | PHE | 95 | 41.941 | 33.523 | 32.397 | 806 | CZ | PHE | 104 | 23.262 | 31.960 | 21.383 |
| 728 | CG | PHE | 95 | 42.804 | 34.727 | 32.401 | 807 | CE2 | PHE | 1D4 | 24.208 | 31.192 | 20.757 |
| 729 | CDI | PHE | 95 | 43.291 | 35.235 | 31.204 | 808 | CD2 | PHE | 104 | 24.110 | 29.768 | 20.816 |
| 730 | CEl | PHE | 95 | 44.080 | 36.400 | 31.173 | 809 | C | PHE | 104 | 22.863 | 25.618 | 23.017 |
| 731 | CZ | PHE | 95 | 44.365 | 37.063 | 32.352 | Θ10 | O | PHE | 104 | 23.667 | 24.735 | 22.817 |
| 732 | CE2 | PHE | 95 | 43.874 | 36.579 | 33.559 | 811 | N | LYS | 105 | 21.583 | 25.403 | 23.263 |
| 733 | CD2 | PHE | 95 | 43.085 | 35.409 | 33.591 | 812 | CA | LYS | 105 | 20.941 | 24.106 | 23.229 |
| 734 | C | PHE | 95 | 39.805 | 32.709 | 31.354 | 813 | CB | LYS | 105 | 19.981 | 24.015 | 24.426 |
PL 213 994 Β1
| NA | A | AK | NAK | X | Y | Z | 698 | CA | LYS 117 15.878 | 35.522 | 15.289 |
| 814 | CG | LYS | 105 | 18.987 | 22.837 | 24.458 | 699 | CB | ŁYS 117 15.929 | 36.175 | 16.6Θ2 |
| 815 | CD | LYS | 105 | 17,790 | 23.152 | 25.344 | 900 | CG | LYS 117 16.217 | 35.196 | 27.815 |
| 818 | C | LYS | 105 | 20-155 | 24.015 | 21.925 | 901 | CD | LYS 117 15.916 | 35.800 | 19.208 |
| 819 | 0 | LYS | 105 | 19.518 | 24.994 | 21.501 | 902 | CE | LYS 117 14.580 | 35.300 | 19.740 |
| 820 | N | TYR | 106 | 20.150 | 22.834 | 21.319 | 903 | NZ | LYS 117 14.530 | 35.544 | 21.203 |
| 821 | CA | TYR | 106 | 19.346 | 22.613 | 20*121 | 904 | U | LYS 117 17.262 | 35.114 | 14.842 |
| 822 | CB | TYR | 106 | 19.639 | 21.241 | 19.498 | 905 | 0 | LYS 117 17.752 | 34.019 | 15.201 |
| 823 | CG | TYR | 106 | 21.025 | 21.069 | 18.931 | 906 | N | VAL 118 17.868 | 36.004 | 14.067 |
| 824 | CDI | TYR | 106 | 21.525 | 21.922 | 17*942 | 907 | CA | VAL 118 19.235 | 35.874 | 13.589 |
| 825 | C21 | TYR | 106 | 22.822 | 21.743 | 17.403 | 908 | CB | VAL 118 19.339 | 36*087 | 12.045 |
| 826 | cz | TYR | 106 | 23.584 | 23.683 | 17.840 | 909 | CGl | VAL 118 20.792 | 35*799 | 11.555 |
| 827 | OH | TYR | 106 | 24.325 | 20.4ac | 17.326 | 910 | CG2 | VAL 118 18.3C5 | 35.193 | 11*344 |
| 828 | CE2 | TYR | 106 | 23.096 | 19.524 | 18.818 | 911 | c | VAL 118 20.028 | 36.926 | 14.311 |
| 629 | CD2 | TYR | 106 | 21.841 | 20,021 | 19.358 | 912 | 0 | VA1. 118 19.752 | 38.136 | 14.179 |
| 630 | C | TYR | 106 | 17.871 | 22.629 | 20.438 | 913 | N | ILE 119 21.001 | 36.481 | 15.106 |
| 831 | c | TYR | 106 | 17.433 | 21*995 | 21.409 | 914 | CA | ILE 119 21.781 | 37.397 | 15.937 |
| 832 | N | ALA | 107 | 17.110 | 23.303 | 19.577 | 915 | CB | ILE 119 21.754 | 36.982 | 17.453 |
| 833 | CA | ALA | 107 | 15.670 | 23*130 | 19.492 | 916 | CG1 | ILE 119 20.324 | 36.862 | 17.944 |
| 834 | CB | ALA | 107 | 15.092 | 24.112 | 10.468 | 917 | CDI | ILE 119 20.186 | 35.972 | 19.208 |
| 835 | C | ALA | 107 | 15.300 | 21.685 | 19.120 | 918 | CG2 | ILE 119 22.613 | 37.924 | 18.310 |
| 836 | 0 | ALA | 107 | 16.093 | 20.963 | 16.498 | 919 | C | ILE 119 23.233 | 37.444 | 15.467 |
| 837 | N | ALA | 108 | 14.095 | 21.261 | 19.497 | 920 | 0 | TLE 119 23.887 | 36,408 | 15.363 |
| 838 | CA | ALA | 108 | 13.584 | 19.950 | 19.090 | 921 | N | GI.Y 120 23.734 | 38.647 | 15.213 |
| 839 | CB | ALA | 103 | 12.249 | 19.684 | 19.733 | 922 | CA | GLY 120 25.102 | 38.805 | 14 .742 |
| 840 | C | ALA | 109 | 13.455 | 19.B81 | 17.574 | 923 | C | GLY 120 25.459 | 40.236 | 14.444 |
| 841 | 0 | ALA | 108 | 13.612 | 18.814 | 16.975 | 924 | 0 | GLY 120 24.Θ46 | 41.165 | 14.986 |
| 842 | N | GLY | 109 | 13.186 | 21.023 | 16.961 | 925 | N | TYR 121 26. 428 | 40.407 | 13.548 |
| 843 | CA | GLY | 109 | 13.022 | 21.102 | 15.519 | 926 | CA | TYR 121 27.017 | 41.703 | 13.281 |
| 844 | C | GLY | 109 | 12,616 | 22.494 | 15.132 | 927 | CB | TYR 121 28*494 | 41.642 | 13.62 9 |
| 845 | 0 | GLY | 109 | 12.702 | 23.432 | 15.921 | 928 | CG | TYK 121 28*729 | 41.169 | 15.027 |
| 846 | N | ALA | 110 | 12.167 | 22.643 | 13.896 | 929 | CDI | TYR 121 28.623 | 42.054 | 16.108 |
| 847 | CA | ALA | 110 | 11.661 | 23.928 | 13.459 | 930 | CE1 | TYR 121 28.830 | 41.633 | 17.418 |
| 84 8 | CB | ALA | 110 | 12.799 | 24.854 | 13.008 | 931 | CZ | TYR 121 29.116 | 40.293 | 17.660 |
| 849 | C | ALA | 110 | 10.657 | 23.684 | 12.351 | 932 | CH | TYR 121 29.261 | 39*895 | 18.959 |
| 850 | 0 | ALA | 110 | 10.773 | 22.715 | 11.624 | 933 | CE2 | TYR 121 29.211 | 39.392 | 16.619 |
| 951 | N | LYS | 111 | 9.658 | 24.556 | 12.250 | 934 | CD2 | TYR 121 29.011 | 39.821 | 15.298 |
| 852 | CA | LYS | 111 | 9.631 | 24.387 | 11.233 | 935 | C | TYR 121 26.627 | 42.161 | 11.821 |
| 653 | CB | LYS | 111 | 7.388 | 23.659 | 11.8(P | 936 | 0 | TYR 121 27.760 | 42.C99 | 11.033 |
| 854 | CG | LYS | 111 | 6.526 | 24.519 | 12.735 | 937 | K | PRO 122 25.615 | 42.587 | 11.449 |
| 858 | C | LYS | 111 | 8.303 | 25.731 | 10.585 | 938 | CA | PRO 122 25.402 | 42.888 | 10.020 |
| 859 | 0 | LYS | 111 | 8.431 | 26.793 | 11-216 | 939 | CB | PRC 122 23.881 | 43.001 | 9.903 |
| 860 | tJ | ALA | 112 | 7.954 | 25.663 | 9.297 | 940 | CG | PRO 122 23.432 | 43,427 | 11.272 |
| 861 | CA | ALA | 112 | 7.393 | 26.783 | 8.546 | 94L | CD | PRO 122 21.387 | 42,763 | 12,243 |
| 862 | CB | ALA | 112 | 6.771 | 26.274 | 7.256 | 942 | C | PRO 12 2 2 6.111 | 44,148 | 9.463 |
| 8 63 | C | ALA | 112 | 6.363 | 27.533 | 9.376 | 943 | 0 | PRO 122 26.053 | 44.380 | 8*249 |
| 864 | 0 | ALA | 112 | 5.526 | 26.918 | 10.058 | 944 | N | HTS 123 2 6.7 83 | 44.930 | 13.319 |
| 865 | N | GLY | 113 | 6.453 | 28.852 | 9.366 | 945 | CA | HIS 123 27,455 | 46.185 | 9.909 |
| B66 | CA | GLY | 113 | 5.519 | 29.675 | 10.149 | 946 | CB | HIS 123 26. 616 | 47.3Θ3 | 10.345 |
| 867 | C | GLY | 113 | 6.086 | 30.209 | 11.446 | 947 | CG | HIS 123 25.171 | 47.299 | 9.957 |
| 868 | 0 | GLY | 113 | 5.Θ41 | 31.357 | 11.809 | 948 | KD1 | HIS 123 24.151 | 47.3B6 | 10.880 |
| 869 | N | GLU | 114 | 6.876 | 29.401 | 12.159 | 949 | CE1 | HIS 123 22.986 | 47.290 | 10.260 |
| 870 | CA | GLU | 114 | 7.423 | 29.893 | 13.425 | 950 | NE2 | HIS 123 23.213 | 47.154 | 8.965 |
| 871 | CB | GLU | 114 | e .022 | 28.748 | 14.262 | 961 | CD2 | HIS 123 24.572 | 47.160 | 8.748 |
| 872 | CG | GLU | 114 | 9.495 | 28.425 | 14.000 | 952 | C | HIS 123 28.880 | 46.327 | 10.4S6 |
| 873 | CD | GLU | 114 | 9.979 | 27.343 | 14.932 | 953 | 0 | HIS 123 29.033 | 46.460 | 11.715 |
| 874 | OE1 | GLU | 114 | 9,640 | 26.155 | 14.592 | 954 | N | PRO 12 4 2 9.927 | 46.348 | 9.639 |
| 875 | OE2 | GLU | 114 | 10.430 | 27.683 | 16.037 | 955 | CA | PRO 124 31.306 | 46.112 | 13.11S |
| 876 | c | GLU | 114 | 8.391 | 31-051 | 13.231 | 956 | CB | PRO 124 31.955 | 45.432 | Θ.906 |
| 877 | 0 | GLU | 114 | 9.001 | 31.199 | 12.157 | 957 | CG | PRO 124 31.245 | 46.082 | 7.69 0 |
| 878 | N | ARG | 115 | 8.494 | 31.908 | 14.248 | 958 | CD | PRO 124 29.901 | 46.609 | 8.181 |
| 879 | CA | ARG | 115 | 9.347 | 33.094 | 14.179 | 959 | C | PRO 124 32.135 | 47.351 | 10.503 |
| 880 | CB | ARG | 115 | 9.696 | 34.288 | 14.886 | 960 | 0 | PRO 124 33.344 | 47.375 | 10.237 |
| 881 | CG | ARG | 115 | 7.450 | 34.815 | 14.145 | 961 | N | TYR x25 31.501 | 48.335 | 11.143 |
| 982 | CD | ARG | 115 | 6.817 | 36.023 | 14.851 | 9 62 | CA | TYR 125 32.085 | 49.672 | 11.400 |
| 883 | NE | ARG | 115 | 7.690 | 37.203 | 14.953 | 963 | CB | TYR 125 31.018 | 50.580 | 12.037 |
| 884 | cz | ARG | 115 | 8.099 | 37.925 | 13.918 | 964 | CG | TYR 125 29.973 | 49.824 | 12.827 |
| 885 | NH1 | ARG | 115 | 7.744 | 37.579 | 12.687 | 971 | C | TYR 125 33.426 | 49.756 | 12.180 |
| 886 | KH2 | ARG | 115 | 8.886 | 33.975 | 14.107 | 972 | 0 | TYR 125 34.074 | 48.736 | 12,440 |
| 887 | C | ARG | 115 | 10.743 | 32.833 | 14.760 | 973 | N | LYS 126 33-829 | 50.989 | 12.523 |
| 883 | 0 | ARG | 115 | 10.374 | 32.237 | 15.325 | 974 | CA | LYS 126 35.069 | 51.307 | 13.273 |
| 869 | N | ILE | 116 | 11.772 | 33.282 | 14*052 | 975 | CB | LYS 126 34*767 | 51.671 | 14.740 |
| 890 | CA | ILE | 116 | 13.137 | 33.055 | 14.530 | 976 | CG | LYS 126 33.652 | 52.710 | 14.944 |
| 891 | CB | ILE | 116 | 13.883 | 32*051 | 13.597 | 960 | C | LYS 126 36,265 | 50.314 | 13-076 |
| 892 | CG1 | ILE | 116 | 13.753 | 32.453 | 12.105 | 961 | 0 | LYS 126 36.80-4 | 50.273 | 11.960 |
| 893 | CDI | ILE | 116 | 14.584 | 33.682 | 11.737 | 982 | N | ASN 127 36.727 | 49.542 | 14.077 |
| 894 | CG2 | ILE | 116 | 13.320 | 30.660 | 13.775 | 983 | CA | ASN 127 36*367 | 49.613 | 15.497 |
| B95 | C | ILE | 116 | 13.845 | 34.392 | 14*707 | 988 | c | ASN 127 35.156 | 48.785 | 15.943 |
| 396 | 0 | ILE | 116 | 13.292 | 35.463 | 14.400 | 939 | 0 | ASN 127 35.008 | 47.603 | 15.591 |
| 897 | N | LYS | 117 | 15.050 | 34.356 | 15.247 | 990 | N | LYS 12B 34.316 | 49.450 | 16.741 |
213 994
| A | AK | NAK | X | Y | Z | NA | A | AK | NAK | X | Y | Z |
| CA | LYS | 129 | 33.058 | 48.947 | 17.324 | 1074 | CG1 | VAL | 138 | 11.2C2 | 27.816 | 9.037 |
| CB | LYS | 129 | 32.048 | bC.102 | 17.400 | 1075 | CG 2 | VAL | 138 | 11*669 | 29.305 | 10.953 |
| C | LYS | 129 | 32.3B9 | 47.721 | 16.678 | 1076 | C | VAL | 138 | 9.7 6C | 30.007 | 7*661 |
| 0 | LYS | 128 | 32.064 | 47.715 | 15.486 | 1077 | O | VAL | 138 | 8.534 | 29.850 | 7.777 |
| N | TYR | 129 | 32.213 | 46.678 | 17.484 | 1078 | N | MET | 139 | 10.399 | 29.94B | 6.489 |
| CA | TYR | 129 | 31.340 | 45.566 | 17.135 | 1079 | CA | MET | 139 | 9.693 | 29.682 | 5.229 |
| CB | TYR | 129 | 31.BID | 44.278 | 17.807 | 1080 | 03 | MET | 139 | 10.335 | 30.453 | 4,0?S |
| CG | TYR | 129 | 33.169 | 43.756 | 17.400 | 1081 | CG | MET | 139 | 10,555 | 31.920 | 4.382 |
| CDI | TYR | 129 | 33.367 | 43.195 | 16.140 | 1002 | SD | MET | 13 9 | 9.036 | 32.905 | 4.502 |
| CE1 | TYR | 129 | 34.600 | 42.698 | 15.755 | 1083 | CS | MET | 139 | 8.073 | 32.220 | 5.8C0 |
| CZ | TYR | 12 9 | 35.658 | 42.735 | ' 6.642- | 1004 | c | MET | 139 | 9.613 | 28.216 | 4.902 |
| OH | TYR | 129 | 36.876 | 42.229 | 16.245 | 1085 | 0 | MET | 139 | 8.574 | 27.741 | 4.441 |
| CE2 | TYR | 12 9 | 35.495 | 43.281 | 17.916 | 1086 | N | SER | 140 | 10.699 | 27.470 | 5.158 |
| CD2 | TYR | 129 | 34.240 | 43.785 | 18.282 | 1097 | CA | SER | 140 | 10.716 | 26.030 | 4.940 |
| C | TYR | 129 | 29.974 | 45.918 | 17.704 | 1098 | CB | SER | 140 | 10.887 | 25.721 | 3.455 |
| C | TYR | 12 9 | 29.B56 | 46,215 | 18.894 | 1099 | OG | SER | 140 | 12.003 | 26.439 | 2.963 |
| N | VAL | 130 | 28.944 | 45.896 | 16.874 | 1090 | C | SER | 140 | 11.873 | 25.367 | 5.669 |
| CA | VAL | 130 | 27.606 | 46,192 | 17.342 | 1091 | O | SER | 140 | 12 .867 | 26.019 | 6.001 |
| CB | VAL | 130 | 27.049 | 47.522 | 16.732 | 1092 | N | VAL | 141 | 11.713 | 24.068 | 5.900 |
| CG1 | VAL | 130 | 25.711 | 47.847 | 17.309 | 1093 | CA | VAL | 141 | 12.7B9 | 23.216 | 6.428 |
| CG2 | VAL | 130 | 28.030 | 48.660 | 16.927 | 1094 | CB | VAL | 141 | 12.564 | 22.873 | 7.916 |
| 0 | VAL | 130 | 26.685 | 45.023 | 17.013 | 1095 | CG1 | VAL | 141 | 13.592 | 21.816 | 8.396 |
| 0 | VAL | 130 | 26.436 | 44.704 | 15.845 | 1096 | CG2 | VAL | 141 | 12.618 | 24.141 | 8.761 |
| N | LEU | 131 | 26.168 | 44.380 | 16.052 | 1097 | C | VAL | 141 | 12.857 | 21.949 | 5.594 |
| CA | LEU | 131 | 25.333 | 43.212 | 17.857 | 1098 | O | VAL | 141 | 11 .881 | 21,189 | 5.526 |
| CB | LEU | 131 | 25.33C | 42.363 | 19.134 | 1099 | N | GLU | 142 | 13.998 | 21.714 | 4.960 |
| CG | LEU | 131 | 24.819 | 40.941 | 18.972 | 1100 | CA | GLU | 142 | 14.167 | 20.557 | 4.124 |
| CDI | LEU | 131 | 25.813 | 40.167 | 18.095 | 1101 | CB | GLU | 142 | 13.900 | 20.949 | 2.674 |
| CD2 | LEU | 131 | 24.684 | 40.303 | 20.372 | 1102 | CG | GLU | 142 | 13.913 | 19.764 | 1.703 |
| C | LEU | 131 | 23.921 | 43.601 | 17.491 | 1106 | C | GLU | 142 | 15.595 | 20.026 | 4,293 |
| 0 | LEU | 131 | 23.338 | 44.497 | 18.121 | 1107 | O | GLU | 142 | 16.565 | 20.731 | 3.984 |
| N | TYR | 132 | 23.359 | 42.943 | 16.485 | 1108 | N | GLY | 143 | 15.712 | 18,814 | 4.826 |
| CA | TYR | 132 | 21.970 | 43.153 | 16.126 | 1109 | CA | GLY | 143 | 17.023 | 18.253 | 5.185 |
| CB | TYR | 132 | 21.834 | 43.698 | 14.694 | 1110 | C | GLY | 143 | 17.884 | 19.251 | 5.952 |
| CG | TYR | 132 | 22.235 | 45.145 | 14.560 | 1111 | O | GLY | 143 | 17.493 | 19.744 | 7.000 |
| CDI | TYR | 132 | 21.265 | 46.141 | 14.361 | 1112 | M | SER | 144 | 19.060 | 19.549 | 5.421 |
| CE1 | TYR | 132 | 21.610 | 47.463 | 14.246 | 1113 | CA | SER | 144 | 19.933 | 20.450 | 6.103 |
| CZ | TYR | 132 | 22.943 | 47.909 | 14.269 | 1114 | CB | SER | 144 | 21.434 | 20.038 | 5.834 |
| OH | TYR | 132 | 23.300 | 49.130 | 14.155 | 1'. 15 | OG | SER | 144 | 21.732 | 20.215 | 4.451 |
| CE2 | TYR | 132 | 23.927 | 46.848 | 14.466 | 1116 | C | SER | 144 | 19.740 | 21.919 | 5.742 |
| CD2 | TYR | 132 | 23.559 | 45.520 | 14.588 | 1117 | O | SER | 144 | 20.564 | 22.778 | 6.026 |
| C | TYR | 132 | 21.209 | 41.873 | 16.221 | 1118 | N | SER | 145 | 18.606 | 22.214 | 5.101 |
| 0 | TYR | 132 | 21.808 | 40.794 | 16.225 | 1119 | CA | SER | 145 | 18.340 | 23.592 | 4.718 |
| N | GL U | 133 | 19.892 | 42.000 | 16.345 | 1120 | CB | SER | 145 | 18.037 | 23.721 | 3.213 |
| CA | GL U | 133 | 18.961 | 40.894 | 16.270 | 1121 | CG | SER | 145 | 17.777 | 25.103 | 2.951 |
| CB | GLU | 133 | 18.218 | 40.743 | 17.599 | 1122 | C | SER | 145 | 17.191 | 24.173 | 5.500 |
| CG | GLU | 133 | 17.224 | 39.610 | 17.642 | 1123 | O | SER | 145 | 16.106 | 23.618 | 5.496 |
| CD | GLU | 133 | 16.815 | 39.267 | 19.075 | 1124 | N | ILE | 146 | 17.443 | 25.292 | 6.169 |
| OE1 | GLU | 133 | 17.673 | 39.351 | 19.981 | 1125 | CA | ILE | 146 | 16.363 | 26.067 | 6.789 |
| OE2 | GLU | 133 | 15.633 | 38.897 | 19.284 | 1126 | CR | ILE | 146 | 16.432 | 26.142 | 8.374 |
| c | GLU | 133 | 17.981 | 41.167 | 15.139 | 1127 | CG1 | ILE | 146 | 15.193 | 26.924 | 8.912 |
| 0 | GLU | 133 | 17.387 | 42.271 | 15.065 | 1128 | CDI | ILE | 146 | 15.025 | 26.913 | 10.472 |
| N | SER | 134 | 17.813 | 40.183 | 14.260 | 1129 | CG2 | ILE | 146 | 17.746 | 26.788 | 8.854 |
| CA | SER | 134 | 16.905 | 49.303 | 13.102 | 1130 | C | ILE | 146 | 16.336 | 27.427 | 6.141 |
| CB | SER | 134 | 17.682 | 40.295 | 11.767 | 1131 | O | ILE | 146 | 17.375 | 28.118 | 6.017 |
| OG | SER | 134 | 16.783 | 40.127 | 10.678 | 1132 | N | VAL | 147 | 15.131 | 27.B06 | 5.702 |
| C | SER | 134 | 15.870 | 39.212 | 13.121 | 1133 | CA | VAL | 147 | 14.926 | 29.071 | 5.026 |
| O | SER | 134 | 16.215 | 33.025 | 13.207 | 1134 | CB | VAL | 147 | 14.337 | 28.846 | 3.588 |
| N | THR | 135 | 14.579 | 39.587 | 13.051 | 1135 | CG1 | VAL | 147 | 14.176 | 3C.187 | 2.873 |
| CA | THR | 135 | 13.504 | 38.612 | 13.225 | 1136 | CS2 | VAL | 147 | 15.248 | 27.910 | 2.767 |
| CB | THR | 135 | 12.513 | 39.042 | 14.334 | 1137 | C | VAL | 147 | 14,015 | 29.987 | 5.855 |
| OG1 | IHR | 135 | 11.845 | 40.239 | 13.916 | 1138 | O | VAL | 147 | 13.019 | 29.541 | 6.380 |
| CG2 | THR | 135 | 13.241 | 39.299 | 15.630 | 1139 | N | TYR | 148 | 14.390 | 31.250 | 5.979 |
| C | THR | 135 | 12.717 | 38.307 | 11.952 | 1140 | CA | TYR | 148 | 13.637 | 32.178 | 6.807 |
| O | THR | 135 | 12.720 | 39.095 | 10.997 | 1141 | CB | TYR | 148 | 14.198 | 32.227 | 8.248 |
| N | GLY | 136 | 12.071 | 37,151 | 11.928 | 1142 | CC | TYR | 143 | 15.717 | 32.119 | 8.302 |
| CA | GLY | 136 | 11.275 | 36.746 | 10.772 | 1143 | CDI | TYR | 148 | 16.526 | 33.249 | 8.243 |
| C | GLY | 136 | 10.772 | 35.335 | 1O.B00 | 1144 | CE1 | TYR | 148 | 17,904 | 33.150 | 8.259 |
| O | GLY | 136 | 11.254 | 34.524 | 11.606 | 1145 | CZ | TYR | 148 | 18.487 | 31.392 | 8.357 |
| N | PRO | 137 | 9.804 | 35.005 | 9,915 | 1146 | OH | TYR | 148 | 19.850 | 31.775 | 8.355 |
| CA | PRO | 137 | 9.256 | 33.674 | 9.905 | 1147 | CE2 | TYR | 148 | 17.732 | 3C.765 | 8.415 |
| CB | PRO | 137 | 7.911 | 33.845 | 9,180 | 1148 | CD2 | TYR | 148 | 16.337 | 30.973 | 8.383 |
| CG | PRO | 137 | 8.131 | 34.944 | 8.277 | 1149 | C | TYR | 148 | 13.654 | 33.552 | 6.188 |
| CD | PRO | 137 | 9.178 | 35.854 | 8.885 | 1150 | O | TYR | 148 | 14.661 | 34.014 | 5.618 |
| C | ERO | 137 | 10.115 | 32.678 | 9.151 | 1151 | N | SER | 149 | 12.539 | 34.244 | 6.333 |
| 0 | PRO | 137 | 10.774 | 33.032 | 8.162 | 1152 | CA | SER | 149 | 12.504 | 35.599 | 5.819 |
| N | VAL | 133 | 10.093 | 31.439 | 9.634 | 1153 | CB | SER | 149 | 11.152 | 35.886 | 5.164 |
| CA | VAL | 138 | 10.627 | 30.285 | 8.900 | 1154 | OG | SER | 149 | 11.188 | 37.127 | 4.645 |
| CB | VAI, | 138 | 10.726 | 29.026 | 9.812 | 1155 | C | SER | 149 | 12.339 | 36.625 | 6.901 |
PL 213 994 Β1
| NA | A | AK | NAK | X | Y | Z | NA | A | ΛΚ | NAR | X | Y | Z |
| 1156 | 0 | SER | 149 | 11.955 | 37.251 | 7.498 | 1235 | O | VAL | 161 | 18.740 | 29.392 | 15.510 |
| 1157 | N | ALA | 150 | 14.130 | 36.815 | 7.123 | 1236 | N | LEU | 162 | 17.833 | 31.371 | 16.113 |
| 1158 | CA | ALA | 150 | 14.617 | 37.739 | 8.110 | 1237 | CA | LEU | 162 | 17.222 | 30.865 | 17.345 |
| 1159 | CB | ALA | 150 | 15.109 | 36.972 | 9.345 | 1238 | CB | LEU | 162 | 17.651 | 31.731 | 18.539 |
| 1160 | C | ALA | 150 | 15.755 | 38.487 | 7.456 | 1239 | CG | LEU | 162 | 19.122 | 31.862 | 18.951 |
| 1161 | 0 | ALA | 150 | 16.581 | 37.880 | 6.789 | 1240 | CDI | LEU | 162 | 19.254 | 32.588 | 20.288 |
| 1162 | M | HIS | 151 | 15.813 | 39.799 | 7.626 | 1241 | CD2 | LEU | 162 | 19.841 | 30.505 | 19.026 |
| 1163 | CA | HIS | 151 | 16.847 | 40.568 | 6.957 | 1242 | C | LEU | 162 | 15.708 | 30.885 | 17.242 |
| 1164 | CB | HIS | 151 | 16.521 | 42.068 | 6.966 | 1243 | O | LEU | 162 | 15.147 | 31.746 | 16.533 |
| 1165 | CG | HIS | 151 | 17.523 | 42.890 | 6.224 | 1244 | N | ASN | 163 | 15.050 | 29.959 | 17.923 |
| 1166 | ND1 | HIS | 151 | 17.444 | 43.104 | 4.862 | 1245 | CA | ASN | 163 | 13.573 | 30.031 | 18.032 |
| 1167 | CE1 | HIS | 151 | 18.456 | 43.857 | 4.480 | 1246 | CB | ASN | 163 | 12.959 | 28.656 | 18.161 |
| 1168 | NE2 | HIS | 151 | 19.196 | 44.130 | 5.541 | 1247 | CG | ASN | 163 | 13.286 | 27.966 | 19.490 |
| 1169 | CD2 | HIS | 151 | 18.630 | 43.540 | 6.64 4 | 1248 | OD1 | ASN | 163 | 13.723 | 28.611 | 20,438 |
| 1170 | C | HIS | 151 | 18.253 | 40.351 | 7.508 | 1249 | ND2 | ASN | 163 | 13.059 | 26.645 | 19.556 |
| 1171 | 0 | HIS | 151 | 18.481 | 40.478 | 8.706 | 1250 | C | ASN | 163 | 13.123 | 30.988 | 19.141 |
| 1172 | N | THR | 152 | 19.197 | 40.C52 | 6.608 | 1251 | 0 | ASN | 163 | 13.945 | 31.699 | 19.721 |
| 1173 | CA | THR | 152 | 20.604 | 39.836 | 6.970 | 1252 | N | SER | 164 | 11.805 | 31.046 | 19.397 |
| 1174 | CB | THR | 152 | 20.963 | 38.321 | 6.935 | 1253 | CA | SER | 164 | 11.263 | 32,019 | 20.375 |
| 1175 | 051 | THR | 152 | 20.607 | 37.770 | 5.656 | 1254 | CB | SER | 164 | 9.766 | 32.066 | 20.325 |
| 117 6 | CG2 | THR | 152 | 20.165 | 37.575 | 7.994 | 1255 | OG | SER | 164 | 9.249 | 30.768 | 20.363 |
| 1177 | C | THR | 152 | 21.575 | 40.574 | 6.056 | 1256 | C | SER | 164 | 11.760 | 31.729 | 21.799 |
| 1178 | 0 | THR | 152 | 21.224 | 40.997 | 4.926 | 1257 | O | SER | 164 | 11.821 | 32.631 | 22.644 |
| 1179 | N | GLU | 153 | 22.784 | 40.833 | 6.563 | 1258 | N | ASN | 165 | 12,142 | 30.481 | 22.043 |
| neo | CA | GLU | 153 | 23.890 | 41.345 | 5.780 | 1259 | CA | ASN | 165 | 12.711 | 30.123 | 23.318 |
| 1181 | CB | GLU | 153 | 24.333 | 42.703 | 6.306 | 126C | CB | ASN | 165 | 12.139 | 28.801 | 23.812 |
| 1182 | CG | GLU | 153 | 23.265 | 43.830 | 6.178 | 1261 | CG | ASN | 165 | 12.441 | 28.589 | 25.281 |
| 1183 | CD | GLU | 153 | 22.814 | 44.137 | 4.740 | 1262 | OD1 | ASN | 165 | 12.424 | 29.547 | 26.057 |
| 1184 | OE1 | GLU | 153 | 23.563 | 43.838 | 3.779 | 1263 | ND2 | ASN | 1 65 | 12.783 | 27.371 | 25.653 |
| 1185 | OE2 | GLU | 153 | 21.696 | 44.700 | 4.573 | 1264 | c | ASN | 165 | 14.254 | 30.125 | 23.351 |
| 1186 | C | GLU | 153 | 25.063 | 40.353 | 5.827 | 1265 | 0 | ASN | 165 | 14.884 | 29.565 | 24.260 |
| 1187 | 0 | GLU | 153 | 24.998 | 39.358 | 6.545 | 1266 | N | ASN | 166 | 14.852 | 30.775 | 22.359 |
| 1180 | N | SER | 154 | 26.134 | 40.633 | 5.089 | 1267 | CA | ASN | 166 | 16.300 | 30.974 | 22.293 |
| 1189 | CA | SER | 154 | 27.242 | 39.681 | 4.990 | 1268 | CB | ASN | 166 | 16.821 | 31.814 | 23.482 |
| 1190 | CB | SER | 154 | 28.302 | 40.158 | 4.001 | 1269 | CG | ASN | 166 | 16.438 | 33.291 | 23.356 |
| 1191 | OG | SER | 154 | 29.000 | 41.261 | 4.517 | 12/0 | OD1 | ASN | 166 | 16.334 | 33.815 | 22.246 |
| 1192 | C | SER | 154 | 27.873 | 39.367 | 6.356 | 1271 | ND2 | ASN | 166 | 16.199 | 33.956 | 24.492 |
| 1193 | 0 | SER | 154 | 28.288 | 38.230 | 6.583 | 1272 | C | ASN | 1Ć6 | 17.076 | 29.676 | 22.137 |
| 1194 | N | GLY | 155 | 27.941 | 40.376 | 7.237 | 1273 | O | ASN | 166 | 18.220 | 29.603 | 22,548 |
| 1195 | CA | GLY | 155 | 28.390 | 40.207 | 8.618 | 1274 | N | GLU | 167 | 16.423 | 28.663 | 21,576 |
| 1196 | C | GLY | 155 | 27.626 | 39.171 | 9.442 | 1275 | CA | GLU | 167 | 17,071 | 27.397 | 21.263 |
| 1197 | 0 | GLY | 155 | 28.139 | 38.732 | 10.481 | 1276 | CB | GLU | 167 | 16.129 | 26.211 | 21.445 |
| 1198 | N | ASN | 1.56 | 26.416 | 38.805 | 9.020 | 1277 | CG | GLU | 167 | 15.478 | 26.204 | 22.842 |
| 1199 | CA | ASN | 156 | 25.636 | 37.752 | 9.696 | 1273 | CD | GLU | 167 | 14.256 | 25.339 | 22.941 |
| 1200 | CB | ASN | 156 | 24.146 | 37.786 | 9.333 | 1279 | OE1 | GLU | 167 | 13.603 | 25.063 | 21.901 |
| 1201 | CG | ASN | 156 | 23.376 | 38.872 | 10.099 | 1280 | OE2 | GLU | 167 | 13.936 | 24.935 | 24.080 |
| 1202 | OD1 | ASN | 156 | 22.871 | 39.825 | 9.486 | 1281 | C | GLU | 1 67 | 17,531 | 27.458 | 19.816 |
| 1203 | KD2 | ASN | 156 | 23.345 | 38.776 | 11.454 | 1282 | O | GLU | 167 | 16.913 | 28.136 | 18.963 |
| 1204 | C | ASN | 156 | 26.156 | 36.327 | 9.426 | 1283 | N | LEU | 168 | 18.622 | 26.749 | 19.538 |
| 1205 | O | ASN | 156 | 25.627 | 35.372 | 10.010 | 1284 | CA | LEU | 168 | 19.244 | 26.785 | 18.230 |
| 1206 | N | SER | 157 | 27.071 | 36.181 | 8.461 | 1285 | CB | LEU | 168 | 20.674 | 26.197 | 1Θ .403 |
| 1207 | CA | SER | 157 | 27.749 | 34.892 | 8.231 | 1286 | OG | LEU | 168 | 21.662 | 26.327 | 17.291 |
| 1208 | CB | SER | 157 | 29.046 | 35.134 | 7.467 | 1287 | CDI | LEU | 168 | 21.999 | 27.7B5 | 16.934 |
| 1209 | OG | SER | 157 | 28.723 | 35.358 | 6.083 | 12ΘΒ | CD2 | LEU | 168 | 22.903 | 25.546 | 17.775 |
| 1210 | C | SER | 157 | 28.089 | 34.311 | 9.594 | 1289 | 2 | LEU | 168 | 18.486 | 25.998 | 17.160 |
| 1211 | O | SER | 157 | 28.762 | 34.958 | 10.387 | 1290 | 0 | LEU | 168 | 18.188 | 24.792 | 17.339 |
| 1212 | N | GLY | 158 | 27.626 | 33.102 | 9.844 | 1291 | N | VAL | 169 | 18.148 | 26.672 | 16.055 |
| 1213 | CA | GLY | 158 | 27.97B | 32.389 | 11.095 | 1292 | CA | VAL | 169 | 17.502 | 26.001 | 14.922 |
| 1214 | C | GLY | 158 | 27.033 | 32.675 | 12.246 | 1293 | CB | VAL | 169 | 16.092 | 26.546 | 14.531 |
| 1215 | O | GLY | 158 | 27.190 | 32.106 | 13.324 | 1294 | CGl | VAL | 169 | 15.096 | 26.348 | 15.717 |
| 1216 | K | SER | 159 | 26.003 | 33.517 | 12.028 | 1295 | CG2 | VAL | 169 | 16.141 | 27.965 | 14.084 |
| 1217 | CA | SER | 159 | 25.011 | 33.799 | 13.089 | 1296 | s | VAL | 169 | 18.339 | 25.938 | 13.653 |
| 3 21B | CB | SER | 159 | 24.045 | 34.924 | 12.638 | 1297 | 0 | VAL | 169 | 17.998 | 25.167 | 12.747 |
| 1219 | OG | SER | 159 | 24.76= | 36.155 | 12.500 | 1298 | N | GLY | 170 | 19.366 | 26,749 | 13.561 |
| 1220 | C | SER | 159 | 24.168 | 32.600 | 13.538 | 1299 | CA | GLY | 170 | 20.295 | 26,641 | 12.427 |
| 1221 | 0 | SER | 159 | 23.716 | 31.826 | 12.738 | 1300 | c | GLY | 170 | 21.426 | 27.617 | 12.557 |
| 1222 | N | PRO | 160 | 23.891 | 32.487 | 14.866 | 1301 | 0 | GLY | 170 | 21.529 | 28.315 | 13.566 |
| 1223 | CA | PRO | 160 | 22.909 | 31.501 | 15.288 | 1302 | N | ILE | 171 | 22.346 | 27.610 | 11.574 |
| 122 4 | CB | PRO | 160 | 22.979 | 31.553 | 16.839 | 1303 | CA | ILE | 171 | 23.411 | 28.623 | 11.500 |
| 1225 | CG | PRO | 160 | 23.50C | 33.009 | 17.143 | 1304 | CB | ILE | 171 | 24 . Θ54 | 28.023 | 11.647 |
| 1226 | CD | PRO | 160 | 24.42C | 33.313 | 15.973 | 1305 | CGl | ILE | 171 | 25.938 | 29.079 | 11.407 |
| 1227 | C | PRO | 160 | 21.571 | 32.006 | 14.833 | 1306 | CDI | ILE | 171 | 27.370 | 28.574 | 11-711 |
| 1228 | O | PRO | 160 | 21.34C | 33.229 | 14.841 | 1307 | CG2 | ILE | 171 | 25.019 | 26.723 | 10.836 |
| 1229 | N | VAL | 161 | 20.713 | 31.067 | 14.484 | 1308 | C | ILE | 171 | 23.305 | 29.324 | 10.147 |
| 1230 | CA | VAL | 161 | 19.32C | 31.310 | 14.211 | 1309 | □ | ILE | 171 | 23.217 | 28.653 | 9.n« |
| 1231 | CB | VAL | 161 | 18.935 | 30.688 | 12.892 | 1310 | N | HIS | 172 | 23.336 | 30.651 | 10 . 185 |
| 1232 | CGl | VAL | 161 | 17.425 | 30.917 | 12.599 | 1311 | CA | HIS | 172 | 23.134 | 31.457 | 8.976 |
| 1233 | CG2 | VAL | 161 | 19.855 | 31.244 | 11.790 | 1312 | CB | HIS | 172 | 23.024 | 32.925 | 9.379 |
| 1234 | C | VAL | 161 | 18.601 | 30.598 | 15.344 | 1313 | CG | HIS | 172 | 22.829 | 33.843 | 8.209 |
PL213 994B1
| ΝΑ | A | AK | NAK | X | Y | Z | NA | A | AK | NAK | X | Y | Z |
| 1314 | ND1 | HIS | 172 | 21.652 | 33.874 | 7.493 | 1397 | N | TYR | 186 | 19.229 | 31.994 | 4.258 |
| 1315 | CE1 | HIS | 172 | 21.773 | 34.739 | 6.500 | 3 9B | CA | TYR | 186 | 19.437 | 30.564 | 4.223 |
| 1316 | NE2 | HIS | 172 | 22.988 | 35.260 | 6.541 | 1399 | CB | TYR | 186 | 20,055 | 30.119 | 2.866 |
| 1317 | CD2 | HIS | 172 | 23.669 | 34.718 | 7.607 | 1400 | CG | TYR | 186 | 19.163 | 30.586 | 1.764 |
| 1318 | C | HIS | 172 | 24.331 | 31.291 | Θ . 371 | 1401 | CDI | TYR | 186 | 19.430 | 31.788 | 1.128 |
| 1319 | 0 | HIS | 172 | 25.477 | 31.320 | 8.568 | 1402 | CE1 | TYR | 186 | 18.549 | 32.286 | 0.147 |
| 1320 | N | PHE | 173 | 24.117 | 31.176 | 6.748 | 1403 | CZ | TYR | 186 | 17.4C3 | 31.599 | -0.140 |
| 1321 | CA | PHE | 173 | 25.280 | 31.236 | 5.840 | 1404 | OH | TYR | 186 | 16.577 | 32.140 | -1.101 |
| 1322 | CB | PHE | 173 | 25.783 | 23.820 | 5.453 | 1405 | CE2 | TYR | 186 | 17.082 | 30.416 | 0.4S9 |
| 1323 | CG | PHE | 173 | 24.981 | 29.182 | 4.385 | 1406 | CD2 | TYR | 186 | 17.967 | 29.924 | 1.4B4 |
| 1324 | cm | PHE | 173 | 25.431 | 29.228 | 3.056 | 1407 | C | TYR | 186 | 20.349 | 30.187 | 5.371 |
| 1325 | CE1 | PHE | 173 | 24.657 | 28.684 | 2.045 | 1408 | O | TYR | 186 | 21.369 | 30.829 | 5.611 |
| 1326 | cz | PHE | 173 | 23.433 | 28.082 | 2.347 | 1409 | N | GLY | 187 | 19.926 | 29.168 | 6.094 |
| 1327 | CE2 | PHE | 173 | 22.987 | 28.031 | 3.666 | 1410 | CA | GLY | 187 | 20.779 | 28.609 | 7.172 |
| 1328 | CD2 | PHE | 173 | 23.761 | 28.583 | 4.665 | 1411 | C | GLY | 187 | 20.946 | 27.103 | 6.998 |
| 1329 | C | PHE | 173 | 25.124 | 32.151 | 4.578 | 1412 | O | GLY | 187 | 20.189 | 26.437 | 6.281 |
| 1330 | O | PHE | 173 | 26.124 | 32.620 | 4.019 | 1413 | N | VAL | 188 | 21.935 | 26.556 | 7.704 |
| 1331 | N | ALA | 174 | 23.892 | 32.4S2 | 4.206 | 1414 | CA | VAL | 188 | 22.100 | 25.091 | 7.793 |
| 1332 | CA | ALA | 174 | 23.675 | 33.243 | S.948 | 1415 | CB | VAL | 188 | 23.574 | 24.705 | 7.963 |
| 1333 | CB | ALA | 174 | 23.694 | 32.283 | 1.751 | 1416 | CG1 | VAL | 183 | 23.715 | 23.179 | 8.023 |
| 1334 | C | ALA | 174 | 22.359 | 34.016 | 2.942 | 1417 | CG2 | VAL | 183 | 24.402 | 25.266 | 6.815 |
| 1335 | 0 | ALA | 174 | 21.404 | 33.626 | 3.590 | 1418 | C | VAL | 188 | 21.307 | 24.632 | 8.988 |
| 1336 | N | SER | 175 | 22.289 | 35.063 | 2.128 | 1419 | O | VAL | 1 B | 21.470 | 25.160 | 10.071 |
| 1337 | CA | SER | 175 | 20.974 | 35.536 | 1.793 | 1420 | N | TYR | 189 | 20.437 | 23.603 | 8.760 |
| 1338 | CB | SER | 175 | 20.695 | 36.924 | 2.538 | 1421 | CA | TYR | 189 | 19.627 | 23.C75 | 9,815 |
| 1339 | GG | SER | 175 | 21.905 | 37.573 | 2.966 | 1422 | CB | TYR | 189 | 18.379 | 22.555 | 9,156 |
| 1340 | c | SER | 175 | 20.826 | 35.876 | 0.298 | 1423 | CG | TYR | 189 | 17.332 | 22.049 | 10.094 |
| 1341 | 0 | SER | 175 | 21.752 | 35.635 | -0.478 | 1424 | cm | TYR | 189 | 16.522 | 22.942 | 10,Bil |
| 1342 | N | ASP | 176 | 19.641 | 36.312 | -0.097 | 1425 | CE1 | TYR | 189 | 15.527 | 22.474 | 11.668 |
| 1343 | CA | ASP | 176 | 19.443 | 36.799 | -1.448 | 1426 | cz | TYR | 189 | 15.334 | 21.115 | 11.796 |
| 1344 | CB | ASP | 176 | 18.048 | 36.413 | -1.944 | 1427 | OH | TYR | 189 | 14 .328 | 20.627 | 12.607 |
| 1345 | CG | ASP | 176 | 17.087 | 34.894 | -2.123 | 1428 | CE2 | TYR | 189 | 16.118 | 20.205 | 11.0B0 |
| 1346 | ODl | ASP | 176 | 18.807 | 34.190 | -2.399 | 1429 | CD2 | TYR | 189 | 17.105 | 20.678 | 10.226 |
| 1347 | OD2 | ASP | 176 | 16.764 | 34.399 | -1.980 | 1430 | c | ΤΪΕ | 189 | 20.437 | 21.892 | 10.394 |
| 1348 | C | ASP | 176 | 19.634 | 38.297 | -1.445 | 1431 | 0 | TYR | 189 | 21.094 | 21,197 | 9.664 |
| 1349 | 0 | ASP | 176 | 19.380 | 38.965 | -0.449 | 1432 | N | PHE | 190 | 20.797 | 21.668 | 11.699 |
| 1350 | N | VAL | 177 | 20.157 | 38.839 | -2.529 | 1433 | CA | PHE | 190 | 21.160 | 2C.674 | 12.319 |
| 1351 | CA | VAL | 177 | 20.052 | 40.286 | -2.728 | 1434 | C3 | PHE | 190 | 21.542 | 21.083 | 13.743 |
| 1352 | CB | VAL | 177 | 21.376 | 40.943 | -3.134 | 1435 | CG | PHE | 190 | 22.365 | 22.356 | 13.785 |
| 1353 | CG1 | VAL | 177 | 21.967 | 40.268 | -4.379 | 1436 | CDI | PHE | 190 | 21.807 | 23.545 | 14.239 |
| 1354 | CG2 | VAL | 177 | 21.141 | 42.447 | -3.321 | 1437 | CE1 | PHE | 190 | 22.559 | 24.706 | 14.261 |
| 1355 | C | VAL | 177 | 19.918 | 40.666 | -3.692 | 1438 | cz | PHE | 190 | 23.869 | 24.711 | 13.812 |
| 1356 | O | VAL | 177 | 17.744 | 40.801 | -3.282 | 14 39 | CE2 | PHE | 190 | 24.429 | 23.537 | 13.337 |
| 1357 | N | AS? | 181 | 11.008 | 44.174 | 3.566 | 144C | CD? | PHE | 190 | 23.674 | 22.377 | 13.316 |
| 1358 | CA | ASP | 181 | 11.761 | 43.230 | 2.730 | 1441 | C | PHE | 190 | 20.567 | 19.207 | 12.212 |
| 1363 | C | ASP | 181 | 11.331 | 41.773 | 2.954 | 1442 | c | PHE | 190 | 19.791 | 18.832 | 13.053 |
| 1364 | 0 | ASP | 181 | 11.519 | 41.213 | 4.047 | 1443 | N | THR | 191 | 20.944 | 18.617 | 11,140 |
| 1365 | N | ASN | 182 | 10.750 | 41.157 | 1.930 | 1444 | CA | THR | 191 | 20.490 | 17.258 | 10.B95 |
| 1366 | CA | ASN | 182 | 10.327 | 39.764 | 2.054 | 1445 | CB | THR | 191 | 20.752 | 16.848 | 9.457 |
| 1367 | CB | ASN | 182 | 8.831 | 39.611 | 1.754 | 1446 | OG1 | THR | 191 | 22.198 | 16.965 | 9.231 |
| 1368 | CG | ASN | 182 | 7,950 | 39.849 | 3.011 | 1447 | CG2 | THR | 191 | 20.014 | 17.714 | 8.459 |
| 1369 | ODl | ASN | 182 | 8.107 | 40.858 | 3.726 | 1448 | C | THR | 191 | 21.336 | 16.346 | 11.809 |
| 1370 | ND2 | ASN | 182 | 7.074 | 36,900 | 3.297 | 1449 | O | THR | 191 | 22.366 | 16.763 | 12.323 |
| 1371 | c | ASN | 1B2 | 11.251 | 38.760 | 1.321 | 1450 | N | PRO | 192 | 20.823 | 15.115 | 12.031 |
| 1372 | 0 | ASN | 182 | 10.836 | 37.681 | 0.878 | 1451 | CA | PRO | 192 | 21.590 | 14.167 | 12.872 |
| 1373 | N | ARG | 183 | 12.521 | 39.140 | 1.245 | 1452 | CB | PRO | 192 | 20.846 | 12.830 | 12.656 |
| 1374 | CA | ARG | 183 | 13.560 | 3B.299 | 0.679 | 1453 | CG | PRO | 192 | 19.471 | 13.225 | 12.331 |
| 1375 | CB | ARG | 183 | 14.795 | 39.135 | 0.313 | 1454 | CE | PRO | 192 | 19.560 | 14 .519 | 11.550 |
| 1376 | CG | ARG | 183 | 15.655 | 39.641 | 1.474 | 1455 | C | PRO | 192 | 23.060 | 14 .C29 | 12.472 |
| 1377 | CD | ARG | 183 | 16.914 | 40.297 | C . 942 | 1456 | O | PRO | 192 | 23.940 | 13.997 | 13.324 |
| 1378 | NE | ARG | 183 | 17,890 | 40.594 | 1.994 | 1457 | N | GLU | 193 | 23.327 | 13.944 | 11.172 |
| 1379 | CZ | ARG | 183 | 19.011 | 41.290' | 1.807 | 1458 | CA | GLU | 193 | 24.674 | 13.789 | 10.676 |
| 1380 | NH1 | ARG | 183 | 19.303 | 41.782 | 0.604 | 1459 | CB | C-LU | 193 | 24.610 | 13.584 | 9.145 |
| 1381 | NH2 | ARG | 183 | 19.842 | 41 .514 | 2.820 | 1460 | CG | GLU | 193 | 25-935 | 13.348 | 8.487 |
| 1382 | C | ARG | 1B3 | 13.892 | 37.179 | 1.661 | 1461 | CD | GLU | 193 | 25.834 | 13.028 | 6.987 |
| 1383 | 0 | ARG | 183 | 13.674 | 37.312 | 2.872 | 1462 | CE1 | GLU | 193 | 26.823 | 12.480 | 6.410 |
| 1384 | N | ASN | 184 | 14.397 | 36.0/1 | 1.130 | 1463 | OE2 | GLU | 193 | 24-763 | 13.311 | 6.387 |
| 1385 | CA | ASN | 164 | 14.733 | 34.925 | 1.968 | 1464 | C | GLU | 193 | 25.559 | 14.988 | 11-050 |
| 1386 | CB | ASN | 184 | 14.219 | 33.634 | 1.328 | 1465 | 0 | GLU | 193 | 26.723 | 14.845 | 11.447 |
| 1387 | CG | ASN | 184 | 12.718 | 33.501 | 1.417 | 1466 | N | ILE | 194 | 25.007 | 16.196 | 10.928 |
| 1388 | ODl | ASN | 184 | 12.065 | 34.165 | 2.235 | 1467 | CA | ILE | 194 | 25.737 | 17.369 | 11,285 |
| 1389 | ND2 | ASN | 184 | 12.155 | 32.634 | 0.593 | 1468 | CB | ILE | 194 | 25.178 | 18.663 | 10.651 |
| 1390 | c | ASN | 184 | 16.223 | 34.851 | 2.317 | 1469 | CG1 | ILE | 194 | 25.213 | 18-553 | 9.108 |
| 1391 | 0 | ASN | 184 | 17.103 | 35.343 | 1.586 | 1470 | CDI | ILE | 194 | 24.346 | 19.662 | 8.390 |
| 1392 | N | ALA | 185 | 16.495 | 34.252 | 3.474 | 1471 | CG2 | ILE | 194 | 25.957 | 19.845 | 11.092 |
| 1393 | CA | ALA | 185 | 17.863 | 33.995 | 3.916 | 1472 | C | ILE | 194 | 26.002 | 17.497 | 12.827 |
| 1394 | CB | ALA | 185 | 18.198 | 34.827 | 5.153 | 1473 | O | ILE | 194 | 27.085 | 17.816 | 13.334 |
| 1395 | C | ALA | 185 | 17.993 | 32.493 | 4.194 | 1474 | N | LYS | 195 | 24.969 | Π .212 | 13,595 |
| 1396 | O | ALA | 185 | 16.984 | 31.780 | 4.323 | 1175 | CA | LYS | 195 | 25.097 | 17.144 | 15,056 |
PL 213 994 Β1
| NA | A | AK | NAK | X | Y | Z | NA | A | AK | NAK | X | Y | Z |
| 1476 | CB | LYS | 195 | 23.779 | 16.672 | 15.648 | 1517 | CA | GLU | 200 | 32.864 | 14.611 | 17.685 |
| 1477 | CG | LYS | 195 | 22.734 | 17.783 | 15.597 | 1518 | CB | GLU | 200 | 32.984 | 13.848 | 16.366 |
| 1478 | CD | LYS | 195 | 21.483 | 17.402 | 16.428 | 1519 | CG | GLU | 200 | 32.132 | 12.660 | 16.244 |
| 1479 | CE | LYS | 195 | 20.397 | 18.478 | 16.341 | 1520 | CD | GLU | 200 | 32.032 | 12.152 | 14.804 |
| 1480 | NZ | LYS | 195 | 19.188 | 17.946 | 17.115 | 1521 | OE1 | GLU | 200 | 31.413 | 11.073 | 14.627 |
| 1481 | C | LYS | 195 | 26.185 | 16.217 | 15.541 | 1522 | OE2 | GLU | 200 | 32.528 | 12.852 | 13-863 |
| 1482 | 0 | LYS | 195 | 26.924 | 16.543 | 16.459 | 1523 | C | GLU | 200 | 33.982 | 15.639 | 17.804 |
| 1483 | N | LYS | 196 | 26.239 | 15.038 | 14.951 | 1524 | 0 | GLU | 200 | 35.087 | 15.321 | 18.252 |
| 1484 | CA | LYS | 196 | 27.281 | 14.046 | 15.242 | 1525 | N | ASN | 201 | 33.688 | 16.903 | 17.483 |
| 1485 | CB | LYS | 196 | 27.032 | 12.778 | 14.434 | 1526 | CA | ASN | 201 | 34.714 | 17.900 | 17.377 |
| 1486 | CG | LYS | 196 | 28.078 | 11.668 | 14.671 | 1527 | CB | ASN | 201 | 34.726 | 19.421 | 15.943 |
| 1487 | CD | LYS | 196 | 27.969 | 10.638 | 13.546 | 1528 | CG | ASN | 201 | 35.313 | 17.430 | 15.015 |
| 1488 | CE | LYS | 196 | 26.505 | 10.198 | 13.407 | 1529 | ODl | ASN | 201 | 36.526 | 17.193 | 15.050 |
| 1489 | NZ | LYS | 196 | 25.958 | 10.253 | 12.014 | 1530 | ND2 | ASN | 201 | 34.467 | 16.756 | 14.265 |
| 1490 | c | LYS | 196 | 28.681 | 14.583 | 14,989 | 1531 | C | ASN | 201 | 34.672 | 19.048 | 18.388 |
| 1491 | 0 | LYS | 196 | 29.556 | 14.481 | 15.845 | 1532 | 0 | ASN | 201 | 35.502 | 19.972 | 18.358 |
| 1492 | N | PHE | 197 | 28.903 | 15.184 | 13.815 | 1533 | N | ILE | 202 | 33.733 | 18.961 | 19.312 |
| 1493 | CA | PHE | 197 | 30.177 | 15.790 | 13.531 | 1534 | CA | ILE | 202 | 33.783 | 19.830 | 20.495 |
| 1494 | CB | PHE | 197 | 30.160 | 16.384 | 12.096 | 1535 | CB | ILE | 202 | 32.417 | 19.831 | 21.230 |
| 1495 | CG | PHE | 197 | 31.242 | 17.380 | 11.870 | 1536 | CGl | ILE | 202 | 31.464 | 20.780 | 20.486 |
| 1496 | CDI | PHE | 197 | 30.974 | 18.760 | 11.981 | 1537 | CDI | ILE | 202 | 30.012 | 20.508 | 20.697 |
| 1497 | CE1 | PHE | 197 | 31.991 | 19.686 | 11.792 | 1538 | CG2 | ILE | 202 | 32.559 | 20.334 | 22.693 |
| 1498 | CZ | PHE | 197 | 33.288 | 19.244 | 11.501 | 1539 | C | ILE | 202 | 34.976 | 19.440 | 21.405 |
| 1499 | CE2 | PHE | 197 | 33.539 | 17.890 | 11.383 | 1540 | 0 | ILE | 202 | 35.248 | 18.232 | 21.606 |
| 1500 | CD2 | PHE | 197 | 32.503 | 16.966 | 11.557 | 1541 | N | ASP | 203 | 35.705 | 20.433 | 21.918 |
| 1501 | C | PHE | 197 | 30.536 | 16.865 | 14.555 | 1542 | CA | ASP | 203 | 36.840 | 20.174 | 22.902 |
| 1502 | 0 | PHE | 197 | 31.656 | 16.937 | 15.033 | 1543 | CB | ASP | 203 | 37.550 | 21.468 | 23.221 |
| 1503 | N | ILE | 198 | 29.570 | 17.727 | 14.916 | 1544 | CG | ASP | 203 | 38.949 | 21.209 | 23.777 |
| 1504 | CA | ILE | 19B | 29.854 | 18.745 | 15.880 | 1545 | ODl | ASP | 203 | 39.523 | 20.127 | 23.477 |
| 1505 | CB | ILE | 198 | 28.665 | 19.718 | 16.021 | 1546 | OD 2 | ASP | 203 | 39.474 | 22.068 | 24.504 |
| 1506 | CGl | ILE | 198 | 28.511 | 20.491 | 14.715 | 1547 | C | ASP | 203 | 36.400 | 19.387 | 24.032 |
| 1507 | CDI | ILE | 198 | 27.152 | 21.285 | 14.651 | 1540 | 0 | ASP | 203 | 35.332 | 19.632 | 24.593 |
| 1508 | CG2 | ILE | 198 | 28.924 | 20.695 | 17.181 | 1549 | N | LYS | 204 | 37.247 | 13.444 | 24.459 |
| 1509 | C | ILE | 198 | 30.220 | 18.107 | 17.228 | 1550 | CA | LYS | 204 | 36.866 | 17.556 | 25.556 |
| 1510 | 0 | ILE | 198 | 31.190 | 18.479 | 17.829 | 1551 | CB | LYS | 204 | 36.428 | 16.176 | 25.034 |
| 1511 | N | ALA | 199 | 29.488 | 17.093 | 17.627 | 1552 | CG | LYS | 204 | 35.002 | 16.097 | 24.529 |
| 1512 | CA | ALA | 199 | 29.763 | 16.450 | 18.925 | 1553 | CD | LYS | 204 | 34.783 | 14.864 | 23.684 |
| 1513 | CB | ALA | 199 | 28.649 | 15.466 | 19.288 | 1554 | CE | LYS | 204 | 33.638 | 14.997 | 22.643 |
| 1514 | c | ALA | 199 | 31.120 | 15.778 | 18.939 | 1555 | NZ | LYS | 204 | 34.161 | 15.549 | 21.407 |
| 1515 | 0 | ALA | 199 | 31.828 | 15.856 | 19.930 | 1556 | C | LYS | 204 | 37.990 | 17.387 | 26.553 |
| 1516 | N | GLU | 200 | 31.533 | 15.217 | 17.795 | 1557 | 0 | LYS | 204 | 39.177 | 17.448 | 26.148 |
| 1558 | ΟΧΤ | LYS | 204 | 37.695 | 17.196 | 27.776 |
PL213 994B1
Wykaz sekwencji <110> BioCentrum Sp. z o.o.
Dubin, Grzegorz
Potempa, Jan
| <120> | Proteinaza SplB i peptydy przez nią rozpoznawane oraz ich zastosowania | |
| <130> | PK/0428/RW | |
| <160 | 12 | |
| <170> | Patentln version 3.3 | |
| <210 <211> <212> <213> | 1 723 DNA Staphylococcus aureus | |
| <220> <221> <222> <223> | CDS (1)..(720) gen kodujący proteinazę SplB ZC peptydem sygnalnym | Staphylococcus aureus wraz z |
| <220 <221> <222> | mat peptide (109).. (720) | |
| <400> | 1 |
| atg Met | aac Asn -35 | aaa Lys | aac Asn | gta Val | gtc val | atc aag | agt Ser | tta Leu | gca Ala | gca Ala -25 | tta Leu | aca Thr | att Ile | tta Leu | 4& | |
| ile -30 | Lys | |||||||||||||||
| aca | tct | gta | aca | ggt | att | gga | aca | aca | ttg | gtt | gag | gaa | gta | caa | caa | 96 |
| Thr | Ser | Val | Thr | Gly | Ile | Gly | Thr | Thr | Leu | val | Glu | Glu | Val | Gin | Gin | |
| -20 | -15 | 0 | -5 | |||||||||||||
| act | gcc | aaa | gca | gaa | aat | aat | gtc | aca | aaa | gtt | aaa | gat | act | aat | att | 144 |
| Thr | Ala | Lys | Ala | Glu | Asn | Asn | Val | Thr | Lys | Val | Lys | Asp | Thr | Asn | lic | |
| -1 | 1 | 5 | 10 | |||||||||||||
| ttt | cca | tat | act | ggt | gta | gtt | gct | ttt | aaa | agt | gca | ant | gga | ttt | qta | 192 |
| Phe | Pro | Tyr | Thr | Gly | val | Val | Ala | Phe | Lys | Ser | Ala | Thr | Gly | Phe | Val | |
| 15 | 20 | 25 | ||||||||||||||
| gtt | gga | aag | aat | act | att | tta | aca | aat | aaa | cat | gtg | reg | aaa | aa Ł | tac | 240 |
| Val | Gly | Lys | Asn | Thr | ile | Leu | Thr | Asn | Lys | His | vai | Ser | Lys | Asn | Tyr | |
| 30 | 35 | 40 | ||||||||||||||
| aaa | gtg | qgc | gat | cgt | att | act | gca | cat | cca | aat | agt | gat | aaa | ggt | aat | 288 |
| Lys | Val | Gly | Asp | Arg | Ile | Thr | Ala | Hi s | Pro | Asn | ser | Asp | Lys | Gly | Asn | |
| 45 | 5C | 55 | 60 | |||||||||||||
| ggt | ggt | att | tat | tog | att | aaa | aag | att | att | aat | tat | cca | ggt | aaa | gaa | 336 |
| Gly | Gly | I le | Tyr | Ser | Ile | Lys | Lys | Ile | Ile | Asn | Tyr | Pro | Gly | Lys | Glu | |
| 65 | 70 | 75 | ||||||||||||||
| gat | gta | tca | gtc | att | caa | gtt | gaa | gag | cgt | gca | ata | gaa | cgt | gga | cca | 384 |
| Asp | Val | Ser | Val | Ile | Gin | Val | Glu | Glu | Arg | Ala | ile | Glu | Arg | Gly | Pro | |
| 80 | Θ5 | 90 | ||||||||||||||
| aąa | ggc | ttt | aat | ttt | aat | gat | aat | gta | acg | cca | ttc | aaa | rat | gcg | gca | 432 |
| Lys | Gly | Phe | Asn. | Phe | Asn | Asp | Asn | Val | Thr | Pro | Phe | Lys | Tyr | Ala | Ala | |
| 95 | 100 | 105 | ||||||||||||||
| ggg | gct | aaa | gct | ggt | gag | ega | att | aaa | gtg | att | ggt | tat | cca | cac | cca | 4 80 |
| Gly | Ala | Lys | Ala | Gly | Glu | Arg | I le | Lys | Val | Ile | Gly | Tyr | Pro | His | Pro | |
| 110 | 115 | 120 | ||||||||||||||
| tac | aaa | aat | aaa | tat | gtt | tta | tal | gag | tca | act | ggc | cct | gtg | atg | tca | 528 |
| Tyr | Lys | Asn | Lys | Tyr | Val | Leu | Tyr | Glu | Ser | Thr | Gly | Pro | Val | Met | Ser | |
| 125 | 130 | 135 | 140 | |||||||||||||
| gta | gaa | ggt | ago | agt | att | gta | tat | tca | gcg | cat | ac t | gaa | age | qqa | aac | 575 |
| val | Glu | Gly | Ser | Ser | Ile | Val | Tyr | Ser | Ala | His | Thr | Glu | Ser | Gly | Asn | |
| 145 | 150 | 155 | ||||||||||||||
| tct | gga | tca | cct | gta | zta | aac | age | aac | aac | gaa | t.t a | gtt | ggt | att | aat | 624 |
PL 213 994 Β1
672
| Ser Gly | Ser | Pro Val 160 | Leu Asn Ser | Asn 165 | Asn | Glu | Leu | Val | Gly 170 | Ile | His | ||||
| ttt | gct | tct | gat | gta | aaa | aat | gat | gat | aac | aga | aat | gca | tat | ggc | gtc |
| Phe | Ala | Ser | Asp | Val | Lys | Asn | Asp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | val |
| 175 | 100 | 185 | |||||||||||||
| tac | ttt | aca | cca | gaa | att | aaa | aaa | ttc | att | gca | gaa | aac | ata | gat | aaa |
| Tyr | Phe | Thr | Pro | Glu | Ile | Lys | T.ys | Phe | Tle | Ala | Glu | Asn | Tle | Asp | Lys |
190 195 2C0
723 taa <210> 2 <211>240 <212> PRT <213> Staphylococcus aureus <400>2
| Met Asn -35 | Lys Asn | Val Val | Ile -30 | Lys | ser Leu | Ala | Ala -25 | Leu | Thr | ile | Leu | ||||
| Thr | Ser | Val | Thr | Gly | Ile | Gly | Thr | Thr | Leu | Val | Glu | Glu | Val | Gin | Gin |
| -20 | -15 | -10 | - 5 | ||||||||||||
| Thr | Ala | Lys | Ala | Glu | Asn | Asn | val | Thr | Lys | Val | Lys | Asp | Thr | Asn | Ile |
| -1 | 1 | 5 | 10 | ||||||||||||
| Phe | Pro | Tyr | Thr | Gly | Val | Val | Ala | Phe | Lys | Ser | Ala | Thr | Gly | Phe | val |
| 15 | 2Q | 25 | |||||||||||||
| val | Gly | Lys | Asn | Thr | Ile | Leu | Thr | Asn | Lys | His | Val | Ser | Lys | Asn | Tyr |
| 30 | 35 | 40 | |||||||||||||
| Lys | va.L | Gly | Asp | Arg | Ile | Thr | Ala | His | Pro | Asr. | Ser | Asp | Lys | Gly | Asn |
| 45 | 50 | 55 | 60 | ||||||||||||
| Gly | Gly | Ile | Tyr | Ser | Ile | Lys | Lys | Ile | Ile | Asn | Tyr | Pro | Gly | Lys | Glu |
| 65 | 70 | 75 | |||||||||||||
| Asp | val | Ser | Val | Ile | Gin | val | Glu | Glu | Arg | Ala | IL.e | Glu | Arg | Gly | Pro |
| 80 | 95 | 90 | |||||||||||||
| Lys | Gly | Phe | Asn | Phe | Asn | Asp | Asn | Val | Thr | Pro | Phe | Lys | Tyr | Ala | Ala |
| 95 | 100 | 105 | |||||||||||||
| Gly | Ala | Lys | Ala | Gly | Glu | Arg | Ile | Lys | Val | Ile | Gly | Jyt | Pro | His | Pro |
| 110 | 115 | 120 | |||||||||||||
| Tyr | Lys | Asn | lys | Tyr | Val | Leu | Tyr | Glu | Ser | Thr | G1 y | Pro | vai | Met | Ser |
| 125 | 130 | 135 | 1 40 | ||||||||||||
| Val | Glu | Gly | Ser | Ser | Ile | Val | Tyr | Ser | Ala | His | Thr | Glu | Ser | Gly | Λεη |
| 145 | 150 | 155 | |||||||||||||
| Ser | Gly | Ser | Pro | Val | Leu | Asn | Ser | Asn | Asn | Glu | Leu | val | Gly | Ile | His |
| 150 | 165 | 170 | |||||||||||||
| Phe | Ala | Ser | Asp | Val | Lys | Asn | ASp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | Val |
| 175 | 180 | 135 | |||||||||||||
| Tyr | Phe | Thr | Pro | Glu | Tle | Lys | Lys | Phe | Ile | Ala | Glu | Asn | Ile | Asp | Lys |
| 190 | 195 | 200 |
<210>3 <211>702 <212> DNA <213> Artificial seąuence <220>
<223> sekwencją kodująca wariant białka SplB z peptydem sygnalnym subtilrs <220>
<221> CDS <222> (1)..(699) <220>
<221> rnat_peptide
723 z B.
PL213 994B1 <222> (88)..(699) <400> 3
| atg aac atc | aaa Lys | aag ttt | gca Ala | aaa Lys | caa gca aca | gta Val | tta Leu | acc Thr | t.t.t Phe -15 | act Thr | •18 | |||||
| Met | Asn | Tle | Lys -25 | Phe | Gin | Ala Thr -20 | ||||||||||
| acc | gca | ctg | ctg | gca | gga | ggc | gca | act | caa | gct | ttt | gcc | gaa | aat | aat | 96 |
| Thr | Ala | Leu | Leu | Ala | Gly | Gly | Ala | Thr | Gin | Ala | Phe | Ala | Glu | Asn | Asn | |
| -10 | -5 | -1 | 1 | |||||||||||||
| gtc | aca | aaa | gtt | aaa | gat | act | aat | att | ttt | cca | tat | act | ggt | gta | gtt | 144 |
| Val | Thr | Lys | Val | Lys | Asp | Thr | Asn | Ile | Phe | Pro | Tyr | Thr | Gly | val | Val | |
| 5 | 10 | 15 | ||||||||||||||
| gct | ttt | aaa | agt | gca | act | gga | ttt | gta | gtt | gga | aag | aat | act | att | tta | 192 |
| Ala | Phe | Lys | Ser | Ala | Thr | Gly | Phe | Val | Val | Gly | Lys | Asn | Thr | Ile | Leu | |
| 20 | 25 | 30 | 35 | |||||||||||||
| aca | aat | aaa | cat | gtg | tcg | aaa | aat | tac | aaa | gtg | ggc | gat | cgt | att | act | 240 |
| Thr | Asn | Lys | His | Val | Ser | Lys | Asn | Tyr | Lys | val | Gly | Asp | Arg | Tle | Thr | |
| 40 | 45 | 50 | ||||||||||||||
| gca | cat | cca | aat | agt | gat | aaa | ggt | aat | ggt | ggt | att | tat | tcg | att. | aaa | 28B |
| Ala | His | Er© | Asn | Ser | Asp | Lys | Gly | Asn | Gly | Gly | ile | Tyr | Ser | TLe | Lys | |
| 55 | 60 | 65 | ||||||||||||||
| aag | att | att | aat | tat | cca | ggt | aaa | gaa | gat | gta | tca | gtc | att | caa | gtt | 336 |
| Lys | Ile | Ile | Asn | Tyr | Pro | Gly | Lys | Glu | Asp | vai | Ser | Val | Ile | Gin | Val | |
| 73 | 75 | 80 | ||||||||||||||
| gaa | gag | cgt | gca | ata | gaa | cgt | gga | cca | aaa | ggc | ttt | aat | ttt | aat | gat | 3S4 |
| Glu | Glu | Arg | Ala | Ile | Glu | Arg | Gly | Pro | Lys | Gly | Phe | Asn | Phe | Asn | ńsp | |
| 85 | 90 | 95 | ||||||||||||||
| aat | gta | acg | cca | ttc | aaa | tat | gcg | gca | ggg | gct | aaa | gct | ggt | gag | ega | 432 |
| Asr. | Val | Thr | Pro | Phe | Lys | Tyr | Ala | Ala | Gly | Ala | I.ys | Ala | Gly | Glu | Arg | |
| 100 | 105 | 110 | 115 | |||||||||||||
| att | aaa | gtc | att | ggt | tat | cca | cac | cca | tac | aaa | aat | aaa | tat | gtt | tta | |
| Ile | Lys | Val | Ile | Gly | Tyr | Pro | His | Pro | Tyr | Lys | Asn | Lys | Tyr | Val | Leu | |
| 120 | 125 | 130 | ||||||||||||||
| tai | gag | tca | act | ggc | cct | gtg | atg | tca | gta | qaa | ggt | agc | agt | att | gta | 528 |
| Tyr | Glu | Ser | Thr | Gly | Pro | val | Met | Ser | Val | Glu | Gly | Ser | Ser | lic | val | |
| 135 | 140 | 145 | ||||||||||||||
| tat | rca | gcg | cat | act | gaa | agc | gga | aac | tct | gga | tca | cct | gta | tta | aac | 0 7 6 |
| Tyr | Ser | Ala | His | Thr | Glu | Ser | Gly | Asn | Ser | Gly | Ser | Pro | Val | Leu | Asn | |
| 150 | 155 | 160 | ||||||||||||||
| ago | aac | aas | gaa | tta | gtt | ggt | att | cat | ttt | gct | tct | gat | gta | aaa | aat | 621 |
| Ser | Asn | Asn | G1U | Leu | Val | Gly | ile | His | Phe | Ala | Ser | ASp | tal | Lys | Asn | |
| 165 | 170 | 175 | ||||||||||||||
| gat | gat | aac | aga | a a t | gca | tat | ggc | gtc | tac | ttt | aca | cca | gaa | att | aaa | 6 /2 |
| ASp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | Val | Tyr | Phe | Thr | Pro | Glu | Ile | Lys | |
| 180 | 185 | 190 | 195 | |||||||||||||
| aaa | ttc | att | gca | gaa | aac | ata | gat | aaa | taa | 7C2 | ||||||
| Lys | Phe | Ile | Ala | Glu | Asn | Ile | Asp | Lys |
200
| <210> | 4 |
| <211> | 233 |
| <212> | PRT |
| <213> | artificial seąuence |
| <220 <223> | synthetic Construct |
| <4C0> | 4 |
| Met | Asn | Ile | Lys | Lys -25 | Phe | Ala | Lys | Gin | Ala -20 | Thr | Val | Leu | Thr | Phe -15 | Thr |
| Thr | Ala | Leu | Leu | Ala | Gly | Gly | Ala | Thr | Gin | Ala | Phe | Ala | Glu | Asn | Asn |
| -10 | -5 | -1 | 1 |
Val Thr Lys VaL Lys Asp Thr Asn T.Le Phe Pro Tyr Thr Gly Val Val
PL 213 994 Β1
10 15
| Ala 20 | Phe | Lys | Ser | Ala | tsw 35 | Gly | Phe | Val | val | Gly 30 | Łys | ASH | Thr | 11* | leó 35 |
| Thr | Asn | l>ys | His | Val | Ser | Łys | Asr. | Tyr | Lys | Val | Gly | AS? | Arg | Ile | Thr |
| 40 | 45 | 50 | |||||||||||||
| Ala | His | Pro | Asn | Ser | »Sp | Lys | Gly | ASfj. | Gly | Gly | .i la | Tyr | Set | II® | I>ys |
| 55 | 60 | 65 | |||||||||||||
| Lys | Ile | Ile | Asn | Tyr | Pro | Gly | Lys | GXu | Asp | Val | Ser | Val | Ile | &1ϊ) | vai |
| 70 | 75 | 80 | |||||||||||||
| Glu | G1U | Arg | Ais | Ile | G.Ui | Arg | Gly | Lys | Gly | Phe | Asn | Phe | Aen | Asp | |
| 85 | 90 | 95 | |||||||||||||
| Asn | Val | Thr | PW | Phe | Lys | Tyr | Ala | Ala | Gry | Alą | hys | aia | Gly | Glu | •Arg |
| 100 | 105 | 1.10 | 115 | ||||||||||||
| Ile | Łys | Val | XI c | Gly | Tyr | Pro | His | Pro | Tyr | Lys | Asr> | Łya | Tyr | Val | Łeu |
| 120 | 125 | 130 | |||||||||||||
| Tyr | Gid | Ser | Thr | Cly | Pro | val | Met | Ser | val | Glu | Gly | Ser | Ser | ile | Val |
| 135 | 140 | 145 | |||||||||||||
| Tyr | Ser | Al a | His | Thr | Glu | Ser | Gly | Asn | Ber. | Gly | Ser | Pro | Val | Leu | Asn |
| ISO | 15S | 150 | |||||||||||||
| Ser | Asn | Asn | Glu | Leu | Vai | Gly | Ile | His | Phe | Ala | S’ir | A$p | Vai | I-ys | Asr; |
| 16S | 100 | 3.75 | |||||||||||||
| Asp | Asp | Ases | Arę | Asn | Ais | Tyr | Giy | val | Tyr | Phe | Th s | Fr.fj | G1U | 1 le | i.ys |
| 180 | 185 | .190 | 195 | ||||||||||||
| Łys | Phe | Ile | Ala | Giu | Asn | ile | Asp | Lys |
200
| <210 <211> <212> <213> | 5 702 DBA Artificial sequence |
| <220> | |
| <223> | sekwencja kodującą białko mutanta SplB S157A a p-sptydssi sygnalnym z B, subtilis |
| <220> | |
| <221> | COS |
| <222> | iii -,<7021 |
<400> 5
| atg aac | atc aaa | aag i<ys 25 | ttt Phe | ęf;a «aa | caa Girs | gca Ala -20 | aca Thr | gta Val | tt.a acc | ttt Phe -15 | act Ths | iS | ||||
| Met | Asn | ile | Lys | Ala | Lys | heu | Thr | |||||||||
| acc | ęca | Ctę | erg | gca | ega | ęgc | gca | act | ca a | gct | rt.t | gcc | gaa | aat | ąat | 96 |
| Thr | Ala | Leu | Leu. | Ala | Gly | w | Ala | Thr. | Gin | Ala | Phe | Ala | Glu | Asn | Asii | |
| -10 | „ s | “1 | ||||||||||||||
| gtc | a ca | a a a | ętt | a aa | gat | act | aat | att | ttt | cca | Lat | ac t | gęt | ęta | gtt | 144 |
| Val | Thr | hys | Val | Łys | Asp | Thr | A$n | Ile | Phe | Pro | Tyr | Th5' | Gly | Vai | Ve.I | |
| c. | 10 | 15 | ||||||||||||||
| gct | ter | SeS | agt | ęca | act | gga | hit | gta | gtt | ęęa | asy | aat | act | att | tta | 192 |
| Ala | Piie | Lys | Ser | Ala | Thr. | Gly | Phe | val | Val | Gly | Ly» | Α5Π | Thr | Ile | Łeu | |
| 20 | 25 | 30 | 35 | |||||||||||||
| 3C& | aat | 11-3$ | chi | ętę | tog | aaa | aat | tac | aaa | ętg | ęgc | gat | cęt | att | act. | 240 |
| Thr | Aso | Łys | Bis | Val | Ser | Lys | As π | Tyr | Lys | w. | Gly | Asp | Arg | Ile | Thr | |
| 40 | 45 | 55 | ||||||||||||||
| gca | cat | cca | aat | aęt | gat | aaa | ęgt | aat | ggt | gęt | att | tat | tcę | at t | a aa | 288 |
| Α1ώ | His | Pro | Asa | 3<*r | Aep | tys | Gly | Asa | Giy | Gly | Ile | Tyr | Ser | 11 e | ||
| 55 | 60 | 6$ | ||||||||||||||
| 8.ĆUJ | att | att | aat | tat | cca | ggt. | aa a | gria | gat | gta | tca | ętc | att | caa | gt.t | 338 |
| Lys | Ile | Ile | Asn | Tyr | Pro | Gly | Lys | Glu | Asp | Val | Ser | Val | Ile | Gin | Val | |
| 70 | 75 | 80 |
PL213 994B1 <210> 8 <211> 233 <21Ξ> PRT <213> artificial sequence <220>
<223> Synthetic Construct <400> 8
| Met Asn Ile | Lys | Lys -25 | Phe Ala | Lys | Gin Ala -20 | Thr | Val | Leu | Thr | Phe -15 | Thr | ||||
| Thr | Ala | Leu | Leu | Ala | Gly | Gly | Ala | Thr | Gin | Ala | Phe | Ala | Glu | Asn | Asn |
| -10 | -5 | -1 | 1 | ||||||||||||
| val | Thr | Lys | val | Lys | Asp | Thr | Asn | Ile | Phe | Pro | Tyr | Thr | Gly | Val | Val |
| 5 | 10 | 15 | |||||||||||||
| Ala | Phe | Lys | Ser | Ala | Thr | Gly | Phe | Val | Val | Gly | Lys | Asn | Thr | ile | Leu |
| 20 | 25 | 30 | 35 | ||||||||||||
| Thr | Asn | Lys | Ala | Val | Ser | Lys | Asn | Tyr | Lys | Val | Gly | Asp | Arg | Ile | Thr |
| 40 | 45 | 50 | |||||||||||||
| Ala | His | ?EO | Asn | Ser | Asp | Lys | Gly | Asn | G1 y | Gly | ile | Tyr | Ser | Ile | Lys |
| 55 | 60 | 65 | |||||||||||||
| Lys | Ile | He | Asn | Tyr | Pro | Gly | Lys | Glu | Asp | Val | Ser | Val | Ile | Gin | Vai |
| 70 | 75 | 80 | |||||||||||||
| Glu | Glu | Arg | Ala | Ile | Glu | Arg | Gly | Pro | Lys | Gly | Phe | Asn | Phe | Asn | Asp |
| 85 | 90 | 95 | |||||||||||||
| Asn | Val | Thr | Pro | Phe | Lys | Tyr | Ala | Ala | Gly | Ala | Lys | Ala | Gly | Glu | Arg |
| 100 | 105 | 110 | 115 | ||||||||||||
| Ile | Lys | Val | Ile | Gly | Tyr | Pro | His | Pro | Tyr | Lys | Asn | Lys | Tyr | Val | Leu |
| 120 | 125 | 13C | |||||||||||||
| Tyr | Glu | Ser | Thr | Gly | Pro | val | Met | Ser | Val | Glu | Gly | Ser | Ser | ile | val |
| 135 | 140 | 14 □ | |||||||||||||
| Tyr | Ser | Ala | His | Thr | Glu | Ser | Gly | Asn | Ser | Gly | Ser | Pro | Val | Leu | Asn |
| 150 | 155 | 16C | |||||||||||||
| Ser | Asn | Asn | Glu | Leu | Val | Gly | Ile | His | Phe | Ala | Ser | Asp | Val | Lys | Asn |
| 165 | 170 | 175 | |||||||||||||
| Asp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | val | Tyr | Phe | Thr | Pro | Glu | ile | Lys |
| 180 | 185 | 190 | 195 | ||||||||||||
| Lys | Phe | Ile | Ala | Glu | Asn | Ile | Asp | Lys |
200 <210> 9 <211> 02 <21Ξ> DNA <213> artificial sequence <220 <223> sekwencja kodująca białko mutanta SplB D77A z peptydem sygnalnym z B. subtilis <220 <221> COS <222> (1) . . (702)
| <400 | 9 atc Ile | aaa Lys | aag Lys -25 | ttt Phe | gca Ala | aaa Lys | caa Gin | gca Ala -20 | aca Thr | gta Val | tta Leu | acc Thr | ttt Phe -15 | act Thr | 48 | |
| atg Met | aac Asn | |||||||||||||||
| acc | gca | ctg | ctg | gca | gga | ggc | gca | act | caa | get | ttt | qcc | gaa | aat | aat | 96 |
| Thr | Ala | Leu | Leu | Ala | Gly | Gly | Ala | Thr | Gin | Ala | Phe | Ala | Glu | Asn | Asn | |
| -10 | -5 | -1 | 1 | |||||||||||||
| gtc | aca | aaa | gtt | aaa | gat | act | aat | att | ttt | cca | tal | act | ggt | gta | gtu | 144 |
| val | Thr | Lys | Val | Lys | Asp | Thr | Asn | ile | Phe | Pro | Tyr | Thr | Gly | Val | Val |
PL 213 994 Β1
Asp Asp Asn Arg Asn Ala Tyr Gly Val Tyr Phe Thr Pro Glu Ile Lys
180 165 190 195
Lys Phe Ile Ala Glu Asn Ile ASp Lys
200
| <210> | 7 |
| <211> | 702 |
| <212> | DNA |
| <2L3> | artificial secuence |
| <220> | sekwencja kodującą białko mutanta SplB Η39Ά z peptydem sygnalnym z B. subtills |
| <220> <221> | CDS |
| <222> | (1) .. (702) |
| <400> | 7 |
| atg aac | atc Ile | aaa Lys | aag Lys -25 | ttt Phe | gca Al a | aaa Lys | caa Gin | gca aca gta | tta Leu | acc Thr | ttt Phe -15 | act Thr | 45 | |||
| Met | Asn | Ala -20 | Thr | Vai | ||||||||||||
| acc | gca | c tg | ctg | gca | gga | ggc | gca | act | caa | gct | ttt | gcc | gaa | aat | aat | 96 |
| Thr | Ala | Leu | Leu | Ala | Gly | Gly | Ala | Thr | Gin | Ala | Phe | Ala | Glu | Asn | Asn | |
| -10 | -5 | -1 | 1 | |||||||||||||
| gtc | aca | aaa | gtt | aaa | gat | act | aat | att | ttt | cca | tat | act | ggt | gta | gtt | 144 |
| val | Thr | hys | Val | Lys | Asp | Thr | Asn | Ile | Phe | Pro | Tyr | Thr | GLy | val | Val | |
| 5 | 10 | 15 | ||||||||||||||
| gct | ttt | aaa | agt | gca | act | gga | ttt | gta | gtt | gga | aag | aat | act | att | tta | 192 |
| Ala | Phe | Lys | Ser | Ala | Thr | Gly | Phe | val | val | Gly | Lys | Asn | Thr | Ile | Leu | |
| 20 | 25 | 30 | 35 | |||||||||||||
| aca | aat | a aa | gcg | gtg | tcg | aaa | aat | tac | aaa | Qtg | ggc | gat | cgt | att | act | 240 |
| Thr | Asn | Lys | Ala | Val | Ser | Lvs | Asn | Tyr | Lys | Val | Gly | Asp | Arg | ile | Thr | |
| 40 | 45 | 50 | ||||||||||||||
| gca | cat | cca | aat | agt | gat | aaa | ggt | aat | ggt | ggt | att | lat | tcg | att | aaa | 2 38 |
| Ala | His | Pro | Asn | Ser | Asp | Lys | Gly | Asn | Gly | Gly | Ile | Tyr | 5er | lic | Lys | |
| 55 | 60 | 65 | ||||||||||||||
| aag | alt | att | aat | tat | cca | ggt | aaa | gaa | gat | gta | tca | gtc | att | caa | gtt | 336 |
| Lys | Ile | Ile | Asn | Tyr | Prc | Gly | Lys | G1U | Asp | Val | Ser | val | Ile | Gin | Val | |
| 70 | 75 | 50 | ||||||||||||||
| gaa | gag | cgt | gca | ata | gaa | cgt | gga | cca | aaa | ggc | ttt | aat | ttt | aat | gat | 384 |
| Glu | Glu | Arg | Ala | ile | Glu | Arg | Gly | Pro | Lys | Gly | Phe | Asn | Phe | Asn | Asp | |
| 83 | 90 | 95 | ||||||||||||||
| aat | gta | acg | cca | ttc | aaa | tat | gcg | gca | ggg | gct | aa a | gct | ggt | gag | ega | 432 |
| Asn | Val | Thr | Pro | Phe | Lys | Tyr | Ala | Ala | Gly | Ala | Lys | Ala | Gly | Glu | Arg | |
| 100 | 105 | 110 | 115 | |||||||||||||
| att | aaa | gtg | att | ggt | tat | cca | cac | cca | tac | aaa | aat | aaa | tat | gtt | tta | 48C |
| ile | Lys | Val | Ile | Gly | Tyr | Pro | His | Pro | Tyr | Lys | Asn | Lys | Tyr | Vai | Leu | |
| 120 | 125 | 130 | ||||||||||||||
| tat | tca | act | ggc | cct | gtg | atg | tca | gta | gaa | ggt | agc | agt | att | qta | 528 | |
| Tyr | Glu | Ser | Thr | Gly | Pro | Val | Met | Ser | val | Glu | Gly | Ser | Ser | Tle | Val | |
| 135 | 140 | 145 | ||||||||||||||
| tat | tca | gcg | cat | act | gaa | agc | gga | aac | tct | gga | tca | cct | gta | tta | aac | 576 |
| Tyr | ser | Ala | His | Thr | Glu | Ser | Gly | Asn | Ser | Gly | Ser | Pro | Val | Leu | Asn | |
| 150 | 155 | 160 | ||||||||||||||
| agc | aac | aac | gaa | tta | gtt | ggt | att | cat | ttt | gct | tct | gat | gta | aaa | aat | 624 |
| Ser | Asn | Asn | Glu | Leu | val | Gly | Ile | His | Phe | Ala | Ser | Asp | Val | Lys | Asn | |
| 155 | 170 | 175 | ||||||||||||||
| gat | gat | aac | aga | aat | gca | tat | ggc | gtc | tac | ttt | aca | cca | gaa | att | aaa | 672 |
| Asp | ASp | Asn | Arg | Asn | Ala | Tyr | Gly | Val | Tyr | Phe | Thr | FIC | Glu | Ile | Lys | |
| 180 | 165 | 190 | 195 | |||||||||||||
| aaa | ttc | att | gca | gaa | aac | ata | gat | aaa | Caa | 702 | ||||||
| Lys | Phe | Ile | Ala | Glu | Asn | ile | Asp | Lys |
200
PL213 994B1 <210> 8
| <211> <212> <213> | 233 PRT artificial | seąuence |
| <220> | ||
| <223> | Synthetic | Construct |
| <4C0> | 8 |
| Met | Asn | Ile | Lys | Lys -25 | Phe | Ala | Lys | Gin | A-l a -20 | Thr | Val | Leu | Tlir | Phe -15 | Thr |
| Thr | Ala | Leu | Leu | Ala | Gly | Gly | Ala | Thr | Gin | Ala | Phe | Ala | Glu | Asn | Asn |
| -10 | -5 | -1 | 1 | ||||||||||||
| Va_ | Thr | Lys | Val | Lys | Asp | Thr | Asn | Ile | Phe | Fro | Tyr | Thr | Gly | Val | Val |
| 5 | 10 | 15 | |||||||||||||
| Ala | Phe | Lys | Ser | Ala | Thr | Gly | Phe | Vdl | Vdl | Gly | Lys | Asn | Thr | Ile | Leu |
| 20 | 25 | 3C | 35 | ||||||||||||
| Thr | Asn | Lys | Ala | Val | Ser | Lys | Asn | Tyr | Lys | Val | Gly | Asp | Arg | Ile | Thr |
| 40 | 45 | 5 0 | |||||||||||||
| Ala | His | Pro | Asti | Ser | Asp | Lys | Gly | Asn | Gly | Gly | ile | Tyr | Ser | Ile | Lys |
| 55 | 50 | 65 | |||||||||||||
| Lys | ile | Ile | Asn | Tyr | Pro | Gly | Lys | Glu | ASp | Val | Ser | Val | Ile | Gin. | Va 1 |
| 70 | 75 | 8 0 | |||||||||||||
| Glu | Glu | Arg | Ala | Ile | Glu | Arg | Gly | Pro | Lys | Gly | Phe | Asn | Phe | Asn | Asp |
| 85 | 90 | 95 | |||||||||||||
| Asn | val | Thr | Pro | Phe | Lys | Tyr | Ala | Ala | Gly | Ala | Lys | Ala | Gly | Glu | Arg |
| 100 | 105 | 110 | l ) 5 | ||||||||||||
| Ile | Lys | Val | Ile | Gly | Tyr | Pro | His | Pro | Tyr | Lys | Asn | lys | yr | V=1 | Leu |
| 120 | 125 | 13 0 | |||||||||||||
| Tyr | Glu | Ser | Thr | Gly | Pro | Val | Met | Ser | Val | Glu | Gly | Scx | Ser | lic | Val |
| 135 | 140 | 145 | |||||||||||||
| Tyr | Ser | Ala | His | Thr | Glu | Ser | Gly | Asn | Ser | Gly | Ser | Pro | Val | leu | Asn |
| 150 | 15 5 | 160 | |||||||||||||
| Ser | Agn | Asn | Glu | Lcu | Val | Gly | Ile | His | Phe | Ala | Ser | Asp | Val | Lys | Asn |
| 165 | 17C | 175 | |||||||||||||
| Asp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | Val | Tyr | Phe | Thr | Pro | Glu | Ile | Lys |
| 180 | 1 35 | 190 | 195 | ||||||||||||
| l.ys | P?ie | Tle | Ala | Glu | Asn | Ile | ASP | Lys |
200 <210> 9 <211> 702 <21Ξ> DNA <213> artificial sequer.ce <220>
<223> sekwencja kodująca białko mutanta Sp'R D77A z peptydem sygnalnym z 3. subtilis <220>
<221> CDS <222> (1)..{702)
| <400> i | gca Ala - 2 0 | aca Thr | gla Val | tta Leu | a cc Thr | ttt Phe -15 | ar. 7. Thr | 48 | ||||||||
| atg Me t | aac Asn | atc Ile | aaa Lys | aag Lys -25 | ttt Ph e= | gca Al a | aaa Lys | caa Gin | ||||||||
| acc | gca | ctg | ctg | gca | gga | ggc | gca | dC. | caa | get | ttt | gee | gaa | aat | aat | 96 |
| Thr | Ala | Leu | Leu | Ala | Gly | Gly | Ala | Thr | Gin | Ala | Phe | Al a | Glu | Asn | Asn | |
| -LC | -5 | -1 | 1 | |||||||||||||
| gtc | ara | aa a | gt t | aaa | gat | act | a a t | at.r. | -.tr. | cca | rat | act | ggt | gta | git | 144 |
| Val | Thr | Lys | Val | Lys | Asp | Thr | Asn | Ile | Phe | Pro | Tyr | Thr | Gly | va1 | val |
PL 213 994 Β1
| gct Ala 20 | ttt aaa | agt Ser | gca Ala | act Thr 25 | gga Gly | ttt Phe | gta Val | gtt Val | gga Gly 30 | aag Lys | aat Asn | act. Thr | att Ile | tta Leu 35 | 192 | |
| Phe | Lys | |||||||||||||||
| aca | aat | ddd | cat | gtg | tcg | aaa | aat | tac | aaa | gtg | ggc | gat | cgt | att | act | 240 |
| Thr | Asn | Lys | His | val | Ser | Lys | Asn | Tyr | Lys | Val | Gly | Asp | Arg | Ile | Thr | |
| 40 | 45 | 50 | ||||||||||||||
| gca | cat | cca | aat | agt | gat | aaa | ggu | aat | ggt | ggt | att | tat | tcg | att | aaa | 288 |
| Ala | His | Pro | Asn | Ser | Asp | Lys | Gly | Asn | Gly | Gly | Ile | Tyr | Ser | Ile | Lys | |
| 55 | 60 | 65 | ||||||||||||||
| aag | att | att | aat | tat | cca | ggt | aaa | gaa | gcg | gta | tca | gtc | att | caa | gtt | 336 |
| Lys | Ile | Ile | Asn | Tyr | Pro | Gly | Lys | Glu | Ala | Val | Ser | val | Ile | Gin | Val | |
| 70 | 75 | 80 | ||||||||||||||
| gaa | gag | cgt | gca | ata | gaa | cgt | gga | cca | aaa | ggc | ttt | aat | ttt | aat | gat | 384 |
| Glu | Glu | Arg | Ala | ile | C-lu | Arg | Gly | Pro | Lys | Gly | Phe | Asn | Phe | Asn | Asp | |
| 85 | 90 | 95 | ||||||||||||||
| aat | gta | acg | cca | ttc | aaa | tat | gcg | gca | ggg | gct | aaa | gct | ggt | gag | ega | 432 |
| Asn | Val | Thr | Pro | Phe | LyS | Tyr | Ala | Ala | Gly | Ala | Lys | Ala | Gly | Glu | Arg | |
| 100 | 105 | 110 | 115 | |||||||||||||
| att | aaa | g tg | att | ggt | tat | cca | CBC | cca | tac | aaa | aat | aaa | tat | gtt | tta | 480 |
| ile | Lys | Val | Ile | Gly | Tyr | Pro | His | Pro | Tyr | Lys | Asn | Lys | Tyr | val | Leu | |
| 120 | 125 | 130 | ||||||||||||||
| tat | gag | tca | act | ggc | cct | atg | cca | gta | gaa | gqt | agc | agt | att | gt.a | 523 | |
| Tyr | Glu | Ser | Thr | Gly | Pro | val | Met | Ser | Val | Glu | Gly | Ser | Ser | Ile | Val | |
| 135 | 140 | 145 | ||||||||||||||
| tat | tca | gcg | cat | act | gaa | agc | gga | aac | tct | gga | tca | cct | gta | tta | aac | 576 |
| Tyr | Ser | Ala | His | Thr | Glu | Ser | Gly | Asn | Ser | Gly | Ser | Pro | vai | Leu | Asn | |
| 150 | 155 | 160 | ||||||||||||||
| agc | aac | aac | gaa | tta | gtt | qgt | att | cat | ttt | gct | tct | gat | gta | aaa | aat | 624 |
| Ser | Asn | Asn | Glu | Leu | tal | Gly | Ile | His | Phe | Ala | Ser | Asp | Val | Lys | Asr. | |
| 165 | 170 | 175 | ||||||||||||||
| gat | ga^ | aac | aga | aat | gca | tat | ggc | ctc | tac | ttt | aca | cca | gaa | atu | aaa | 672 |
| Asp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | vai | Tyr | Phe | Thr | Pro | Glu | Ile | Lys | |
| 180 | 155 | 190 | 195 | |||||||||||||
| aaa | ttc | att | gca | gaa | aac | ata | gat | aaa | taa | 702 | ||||||
| Lys | Phe | Ile | Ala | Glu | Asn | ile | Asp | T.ys |
200 <210 10 <211> 233 <212> PRT <213> artificial sequen.ce <220>
<223> Synthetic Construct
| <400 10 | Lys | Gin | Ala -20 | Thr | Val | Leu | Thr | Phe -15 | Thr | ||||||
| Met Asn | Ile | Lys | Lys -25 | Phe | Ala | ||||||||||
| Thr | Ala | Leu | Leu | Ala | Gly | Gly | Ala | Thr | C-ln | Ala | Phe | Ala | Glu | Asn | Asn |
| -10 | -5 | -1 | 1 | ||||||||||||
| Val | Thr | Lys | Val | Lys | Asp | Thr | Asn | Ile | Phe | pro | Tyr | Thr | Gly | Val | Val |
| 5 | 10 | 15 | |||||||||||||
| Ala | ?he | Lys | Ser | Ala | Thr | Gly | Phe | vai | val | Gly | Lys | Asn | Thr | Ile | Leu |
| 20 | 25 | 30 | 35 | ||||||||||||
| Thr | Asn | Lys | His | val | Ser | Lys | Asn | Tyr | Lys | Val | Gly | Asp | Arg | Ile | lhr |
| 40 | 45 | 50 | |||||||||||||
| Ala | His | Pro | Asr. | Ser | Asp | Lys | Gly | Asn | Gly | Gly | Ile | Tyr | Ser | Ile | Lys |
| 55 | 60 | 65 |
Lys Ile Ile Asn Tyr Pro Gly Lys Glu Ala Val Ser Val Ile Gin Val
75 80
PL213 994B1
| Glu Glu Arg 85 | Ala | Ile Gl.u | Arg Gly 90 | Pro | Lys | Gly | Phe 95 | Asn | Phe | Asn | Asp | ||||
| Asn | Val | Thr | Pró | Phe | Lys | Tyr | Ala | Ala | Gly | Ala | Lys | Ala | Gly | Glu | Arg |
| 100 | 105 | 110 | 115 | ||||||||||||
| lie | Lys | val | Ile | Gly | Tyr | Prc | His | Pro | Tyr | Lys | Asn | Lys | Tyr | Val | Leu |
| 120 | 125 | 130 | |||||||||||||
| Tyr | Glu | Ser | Thr | Gly | Pro | val | Mer | Ser | Val | Glu | Gly | Ser | Ser | Ile | Val |
| 135 | 140 | 145 | |||||||||||||
| Tyr | Ser | Ala | His | Thr | Glu | Ser | Gly | Asn | Ser | Gly | Ser | Pro | Val | Leu | Asn |
| 150 | 155 | 160 | |||||||||||||
| Ser | Asn | Asn | Glu | Leu | Val | Gly | Ile | His | Phe | Ala | Ser | Asp | Val | Lys | Asn |
| 165 | 170 | 175 | |||||||||||||
| Asp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | val | Tyr | Phe | Thr | Pro | Glu | Ile | Lys |
| 180 | 185 | 190 | 195 | ||||||||||||
| Lys | Phe | Ile | Ala | Glu | Asn | Ile | Asp | Lys |
200 <210 11 <211> 663 <212> DNA <213> artificxal seguence <220 <223> sekwencja kodująca białko fuzujne zawierające dojrzałą sekwencję splB do której przyłączono metkę hiatydynewą i sekwencję rozpoznawaną przez splB <220>
<221> CDS <222> (1)..(663) <400 11
| atg ggc | age age cat | cat His | cat His | cat His -10 | cat His | cac His | age age | ggc tgg | gaa Glu | ctg Leu | 46 | |||||
| Met | Gly | Ser -15 | Ser | His | Ser | Ser | Gly -5 | irp | ||||||||
| cag | gaa | aat | aat | gtc | a ca | aaa | gtt | aaa | gat | act | aat | att | ttt | cca | tat | 96 |
| Gir. | Glu | Asn | Asn | Val | Thr | Lys | Val | Lys | Asp | Thr | Asn | He | Phe | Pro | Tyr | |
| -1 | 1 | 5 | 10 | 15 | ||||||||||||
| act | ggt | gta | gtt | get | ttt | aaa | agt | gca | act | gga | ttt | gta | gtt | gga | aag | 144 |
| Thr | Gly | Val | Val | Alą | Phe | Lys | Ser | Ala | Thr | Gly | Phe | Val | Val | Gly | Lys | |
| 20 | 25 | 30 | ||||||||||||||
| aat | act | att | tta | ac:a | aat | ddd | cat | gtg | teg | aaa | aat | tac | aaa | gtg | ggr. | 192 |
| Asn | Thr | Ile | Leu | Thr | Asn | Lys | His | V<al | Ser | Lys | Asn | Tyr | Lys | Val | Gly | |
| 35 | 40 | 45 | ||||||||||||||
| gat | cgt | ątr | act | gca | cat. | cca | aat | agt | gat | aaa | ggt | aat | ggt | ggt | att | 240 |
| Asp | Arg | Ile | Thr | Ala | His | Pro | Asn | Ser | Asp | Lys | Gly | Asn | Gly | Gly | Ile | |
| 50 | 55 | 60 | ||||||||||||||
| tat | teg | att | aaa | aag | att | att | aat | tat | cca | ggt | aaa | gaa | gat | gta | tea | 288 |
| Tyr | Ser | Ile | Lys | Lys | Ile | Ile | Asn | Tyr | Pro | Gly | Lys | Glu | Asp | Val | Ser | |
| 65 | 70 | 75 | ||||||||||||||
| gtc | att | caa | gtt | gaa | gag | cgt | gca | ata | gaa | cgt | gga | cca | aaa | ggc | ttt | 336 |
| Val | ile | Gir. | val | Glu | Glu | Arg | Ala | Ile | Glu | Arg | Gly | Pro | Lys | Gly | Phe | |
| 80 | 05 | 90 | 95 | |||||||||||||
| aat | ttt | aat | gat | aat | gta | acg | cca | ttc | aaa | tat | gcg | gca | ggg | get | aaa | 384 |
| Asn | Phe | Asn | Asp | Asn | Val | Thr | Pro | Phe | Lys | Tyr | Ala | Ala | G1 y | Ala | Lys | |
| 100 | 105 | 110 | ||||||||||||||
| get | ggt | gag | ega | att | aaa | gtg | att | ggt | tat | cca | cac | cca | tac | aaa | aat | 432 |
| Ala | Gly | Glu | Arg | ile | Lys | Val | Ile | Gly | Tyr | Pro | His | Pro | Tyr | Lys | Asn | |
| 115 | 120 | 125 | ||||||||||||||
| aaa | tat | gtt | tta | tat | gag | tea | act | ggc | cct | gtg | atg | lea | gta | gaa | ggt | <180 |
| Lys | Tyr | Val | Leu | Tyr | Glu | Ser | Thr | Gly | Prc | Val | Met | Ser | Val | Glu | Gly | |
| 130 | 135 | 140 | ||||||||||||||
| ago | agt | att | gta | tat | tea | gcg | cat | act | gaa | age | gga | aac | tet | gga | tea | 528 |
PL 213 994 Β1
| Ser | Ser 145 | Ile | Val | Tyr | Ser | Ala 150 | His | Thr | Glu | Ser | Gly 155 | Asn | Ser | Gly | Ser | |
| cct | gta | tta | aac | agc | aac | aac | gaa | tta | gtt | ggt | att | cat | ttt | gct | tct | 576 |
| Pro | Val | Leu | Asn | Ser | Asn | Asn | Glu | Leu | vai | Gly | Ile | His | Phe | Ala | Ser | |
| 160 | 165 | 170 | 175 | |||||||||||||
| gat | gta | aaa | aat | gat | gat | aac | aga | aat | gca | tat | ggc | gtc | tac | ttt | aca | 624 |
| Asp | Val | Lys | Asn | Asp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | Val | Tyr | Phe | Thr | |
| 180 | 185 | 190 | ||||||||||||||
| cca | gaa | att | aaa | aaa | ttc | att | gca | gaa | aac | ata | gat | aaa | 663 | |||
| Pro | Glu | Ile | Lys | Lys | Phe | Ile | Ala | Glu | Asn | Ile | Asp | Lys |
195 200 <210> 12 <211> 221 <212> PRT <213> artifrcial seąuence <220>
<223> Synthetic Construct <400> 12
| Met Gly | Ser -15 | Ser | His His | His | His -10 | His His | Ser | Ser | Gly Thr -5 | Ala | Lys | ||||
| Ala | Glu | Asn | Asn | Val | Thr | Lys | val | Lys | Asp | Thr | Asn | Ile | Phe | Pro | Tyr |
| -1 | 1 | 5 | 10 | 15 | |||||||||||
| Thr | Gly | Val | Val | Ala | Phe | T.ys | Ser | Ala | Thr | Gly | Phe | Val | Val | Gly | Lys |
| 20 | 25 | 30 | |||||||||||||
| Asn | Thr | Ile | Leu | Thr | Asn | Lys | His | Val | Ser | Lys | Asn | Tyr | Lys | Val | Gly |
| 35 | 40 | 45 | |||||||||||||
| Asp | Arg | Ile | Thr | Ala | His | Pro | Asn | Ser | Asp | Lys | Gly | Asn | Gly | Gly | Ile |
| 50 | 55 | 60 | |||||||||||||
| Tyr | Ser | Ile | Lys | Lys | Ile | Ile | Asn | Tyr | Pro | Gly | Lys | Glu | Asp | Val | Ser |
| 65 | 70 | 75 | |||||||||||||
| Val | Ile | Gin | Val | Glu | Glu | Arg | Ala | Ile | Glu | Arg | Gly | Pro | Lys | Gly | Phe |
| 80 | 85 | 90 | 95 | ||||||||||||
| Asn | Phe | Asn | Asp | Asn | Val | Thr | Pro | Phe | Lys | Tyr | Ala | Ala | Gly | Ala | Lys |
| 100 | 105 | 110 | |||||||||||||
| Ala | Gly | Glu | Arg | Ile | Lys | Val | Ile | Gly | Tyr | Pro | His | Pro | Tyr | Lys | Asn |
| 115 | 120 | 125 | |||||||||||||
| Lys | Tyr | val | Leu | Tyr | Glu | Ser | Thr | Gly | Pro | Val | Met | Ser | Val | Glu | Gly |
| 130 | 135 | 140 | |||||||||||||
| Ser | Ser | Ile | Val | Tyr | Ser | Ala | His | Thr | Glu | Ser | Gly | Asn | Ser | Gly | Ser |
| 145 | 150 | 155 | |||||||||||||
| Pro | Val | Leu | Asn | Ser | Asn | Asn | Glu | Leu | Val | Gly | He | His | Phe | Ala | Ser |
| 160 | 165 | 170 | 175 | ||||||||||||
| Asp | Val | Lys | Asn | Asp | Asp | Asn | Arg | Asn | Ala | Tyr | Gly | Val | Tyr | Phe | Thr |
| 180 | 185 | 190 |
Pro Glu Ile Lys Lys Phe Ile Ala Glu Asn Ile Asp Lys
195 200
PL213 994B1
Claims (8)
1. Mutant proteinazy SplB, znamienny tym, że posiada sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.
2. Mutant proteinazy według zastrz. 1, znamienny tym, że sekwencja sekrecyjna jest bakteryjną sekwencją sekrecyjną z Bacillus subtilis.
3. Sekwencja nukleotydowa kodująca mutanta proteinazy jak określono w zastrz. 1.
4. Sekwencja nukleotydowa według zastrz. 3, znamienna tym, że posiada sekwencję nukleotydową wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11.
5. Sposób otrzymywania mutanta proteinazy SplB, znamienny tym, że:
a) w komórkach gospodarza bakteryjnego prowadzi się ekspresję białka jak określono w zastrz. 1, korzystnie kodowanego przez sekwencję nukleotydowąjak określono w zastrz. 3 albo 4, a następnie;
b) izoluje się pożądany enzym lub zawierającą go frakcję.
6. Sposób według zastrz. 5, znamienny tym, że gospodarzem bakteryjnym jest szczep Bacillus subtilis ekspresjonujący białko kodowane przez sekwencję nukleotydową przedstawioną jako SEQ ID No.: 3.
7. Sposób według zastrz. 5, znamienny tym, że w etapie b) oddziela się brzeczkę fermentacyjną od masy bakteryjnej poprzez wirowanie, białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysala się siarczanem amonu, oddziela się wysolone białka i rozpuszcza w niewielkiej ilości roztworu buforowego i dializuje się do buforu o pH około 5,5.
8. Sposób według zastrz. 7, znamienny tym, że w etapie b) dodatkowo oczyszcza się wyizolowane białko techniką chromatografii powinowactwa, chromatografii jonowymiennej i/lub sączenia molekularnego, a ostatecznie oczyszczony preparat zagęszcza się i ewentualnie poddaje krystalizacji.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PL394914A PL213994B1 (pl) | 2007-06-11 | 2007-06-11 | Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PL394914A PL213994B1 (pl) | 2007-06-11 | 2007-06-11 | Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| PL394914A1 PL394914A1 (pl) | 2011-12-19 |
| PL213994B1 true PL213994B1 (pl) | 2013-06-28 |
Family
ID=45374329
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PL394914A PL213994B1 (pl) | 2007-06-11 | 2007-06-11 | Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB |
Country Status (1)
| Country | Link |
|---|---|
| PL (1) | PL213994B1 (pl) |
-
2007
- 2007-06-11 PL PL394914A patent/PL213994B1/pl not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| PL394914A1 (pl) | 2011-12-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Lu et al. | Crystal structure of enteropeptidase light chain complexed with an analog of the trypsinogen activation peptide | |
| KR20080055843A (ko) | 트립신 변이체에 의한 인슐린 전구체의 절단 | |
| EP1327143A1 (en) | Crystal structure of bace and uses thereof | |
| WO2008153429A2 (en) | A protease from staphylococcus aureus, particularly spia or spib, peptides it recognises and their use | |
| Esau et al. | Differential effects of N-and C-terminal deletions on the two activities of Rubisco activase | |
| Dostál et al. | The precursor of secreted aspartic proteinase Sapp1p from Candida parapsilosis can be activated both autocatalytically and by a membrane-bound processing proteinase. | |
| WO2001019970A2 (en) | Chymotrypsin-free trypsin | |
| Kobayashi et al. | Structural basis for the kexin-like serine protease from Aeromonas sobria as sepsis-causing factor | |
| CN100362105C (zh) | 胰羧肽酶原b、其同工型和突变蛋白的制备及应用 | |
| PL213994B1 (pl) | Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB | |
| Austin et al. | The substrate specificity of Metarhizium anisopliae and Bos taurus carboxypeptidases A: insights into their use as tools for the removal of affinity tags | |
| Baker et al. | Autocatalytic processing of pro-papaya proteinase IV is prevented by crowding of the active-site cleft | |
| CA2486195C (en) | Recombinantly expressed carboxypeptidase b and purification thereof | |
| IL100623A (en) | PROCESS FOR THE PRODUCTION OF RECOMBINANT IgA PROTEASE AND THE IgA PROTEASE PRODUCED THEREBY | |
| PL214451B1 (pl) | Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB, białko sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplB | |
| PL213995B1 (pl) | Proteinaza posiadajaca aktywnosc proteinazy SpIB | |
| US20250283065A1 (en) | Truncated polypeptides having protein ligase activity and methods of production thereof | |
| Gaur et al. | Role of aspartic acid 121 in human pancreatic ribonuclease catalysis | |
| JP2845558B2 (ja) | メチオニンアミノペプチダーゼのdna配列 | |
| KR20020011399A (ko) | 에어로모나스 아미노펩티다제로 ν-말단 알라닌 잔기를폴리펩티드로부터 제거하는 방법 | |
| Kim et al. | Secretory expression of active clostripain in Escherichia coli | |
| PL221052B1 (pl) | Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA | |
| PL214122B1 (pl) | Proteinaza posiadajaca aktywnosc proteinazy SplA | |
| JPH03219892A (ja) | タンパク質の製造法 | |
| CN119855902A (zh) | 用于活化酶原形式的转谷氨酰胺酶的固定化蛋白酶 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Decisions on the lapse of the protection rights |
Effective date: 20100611 |