PL213994B1 - Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB - Google Patents

Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB

Info

Publication number
PL213994B1
PL213994B1 PL394914A PL39491407A PL213994B1 PL 213994 B1 PL213994 B1 PL 213994B1 PL 394914 A PL394914 A PL 394914A PL 39491407 A PL39491407 A PL 39491407A PL 213994 B1 PL213994 B1 PL 213994B1
Authority
PL
Poland
Prior art keywords
proteinase
splb
seq
val
sequence
Prior art date
Application number
PL394914A
Other languages
English (en)
Other versions
PL394914A1 (pl
Inventor
Grzegorz Dubin
Jan Potempa
Original Assignee
Biocentrum Spolka Z Ograniczona Odpowiedzialnoscia
Univ Jagiellonski
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biocentrum Spolka Z Ograniczona Odpowiedzialnoscia, Univ Jagiellonski filed Critical Biocentrum Spolka Z Ograniczona Odpowiedzialnoscia
Priority to PL394914A priority Critical patent/PL213994B1/pl
Publication of PL394914A1 publication Critical patent/PL394914A1/pl
Publication of PL213994B1 publication Critical patent/PL213994B1/pl

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

Opis wynalazku
Wynalazek dotyczy mutanta proteinazy SplB i sposobu otrzymywania mutanta proteinazy SplB. Ujawniono metodę otrzymywania proteinazy SplB, jej zastosowania do specyficznej hydrolizy łańcucha polipeptydowego, sekwencji aminokwasowych przez nią rozpoznawanych oraz ich zastosowań.
Enzymy proteolityczne (proteinazy) o wysokiej specyficzności działania (rozpoznające i hydrolizujące jedynie wybrane wiązania peptydowe) są stosowane na szeroką skalę w laboratoriach i przemyśle biotechnologicznym do specyficznej hydrolizy polipeptydów (przede wszystkim następujące: enterokinaza, czynnik X, trombina, proteinaza TEV, proteinaza PreScission™ oraz o mniejszej specyficzności, ale też szeroko wykorzystywane jak V8 i trypsyna). W szczególności, lecz nie jedynie, stosuje się omawiane enzymy do usuwania tzw. metek fuzyjnych, fragmentów polipeptydów rekombinowanych użytecznych na pośrednich etapach analizy lub produkcji (służących np. do detekcji, oczyszczania) jednak niepożądanych w produkcie końcowym. W teorii wysoka specyficzność zastosowanego enzymu w połączeniu z wydajnie rozpoznawanym przez niego miejscem wprowadzonym pomiędzy „metką” a częścią polipeptydu stanowiącą ostatecznie pożądany produkt pozwala na precyzyjne usunięcie ,,metki” bez ryzyka degradacji pożądanego polipeptydu. Niestety brak całkowicie specyficznych enzymów proteolitycznych powoduje, że w wielu przypadkach rezultatem ich działania jest nie tylko pożądane odcięcie metki” fuzyjnej, ale także niespecyficzna degradacja interesującego polipeptydu, jeśli zawiera on miejsca podobne do sekwencji specyficznie rozpoznawanej przez enzym. Ponadto najpopularniejsze ze stosowanych obecnie enzymów nie są dostępne w postaci białek zrekombinowanych lub z uwagi na trudności w produkcji są w tej formie znacznie droższe od białek natywnych izolowanych z osocza krwi (trombina, czynnik X) lub jelit (enterokinaza). Zastosowanie białek natywnych stwarza jednak ryzyko zanieczyszczenia preparatów niepożądaną aktywnością innych enzymów lub patogenami. Wymienione czynniki stwarzają zapotrzebowanie na nowe enzymy, które będą mogły sprostać specyficznym zadaniom.
Szczególnie pożądane jest uzyskanie proteinaz o wąskiej specyficzności substratowej, które mogłyby znaleźć zastosowanie jako precyzyjne narzędzie biotechnologiczne (przykładowe opisy patentowe: US 4 543 329, US 5 013 653, US 6 906 176, US 7 189 540 ).
Sekwencja aminokwasowa proteinazy SplB pochodzącej ze Staphylococcus aureus jest znana i została opisana w publikacji J. Mol. Biol. (2006) 358, 270-279. W pracy tej ujawniono także mało wydajną, niewygodną, laboratoryjną metodę produkcji rekombinowanej proteinazy SplB poprzez ekspresję w E. coli oraz wykazano aktywność proteolityczną na kazeinie powyższego preparatu metodą zymografii. Nie była jednak poznana specyficzność substratowa tego enzymu ani wydajny sposób jego otrzymywania. Ponadto, znane jest wiele proteinaz serynowych chymotrypsynopodobnych (w przypadku podobieństw strukturalnych określenie chymotrypsynopodobny odnosi się do tej samej grupy proteinaz co określenie trypsynopodobny i są one tutaj stosowane zamiennie; jedynie w przypadku określania typów aktywności określenia te są rozdzielne jednak jako takie nie są używane w opisie), do których należy proteinaza SplB (MEROPS: S01.282). Podobieństwo sekwencji aminokwasowej do innych proteinaz z tej grupy pozwoliła zaliczyć proteinazę SplB do rodziny S1 wg ogólnie przyjętej klasyfikacji za bazą danych MEROPS (http ://me/O£>s.sanger.ac.uk/; Rawlings, N.D., Morton, F.R. & Barrett, A.J. (2006) MEROPS'. the peptidase database. Nucleic Acids Res 34, D270-D272). Zgodnie z powszechnym przeświadczeniem wyrażonym m.in. w wiodącej referencji z dziedziny enzymów proteolitycznych, bazie danych MEROPS uznaje się, że: „Wszystkie scharakteryzowane peptydazy należące do rodziny chymotrypsynopodobnych są endopeptydazami. Istnieją także liczne, nie będące peptydazami homologii, w których reszty katalityczne zostały zastąpione. Istnieją trzy główne typy aktywności: trypsynopodobny, w którym następuje odtrawienie substratu amidowego następującego po resztach Arg lub Lys w pozycji P1, chymotrypsynopodobny, w którym trawienie następuje za jednym z aminokwasów hydrofobowych w P1 i elastazopodobny, w którym trawienie następuje za resztą Ala w pozycji P1. Specyficzność substratowa rodziny S1 zależy jedynie od aminokwasu znajdującego się w pozycji P1. Większość peptydaz należących do tej rodziny podlega sekrecji i posiada N-końcowy sekrecyjny peptyd sygnałowy. Są one syntetyzowane w postaci prekursorów z dodatkową sekwencją na N-końcu, której usunięcie daje aktywną formę enzymu. Aktywacja nie zawsze wymaga usunięcia propeptydu. Jak pokazano w dalszej części niniejszego opisu ogólne wskazówki zawarte w stanie techniki mogą prowadzić jedynie do błędnych wniosków dotyczących specyficzności substratowej proteinazy SplB i uznania ją za enzym o nikłej przydatności przemysłowej.
PL 213 994 Β1
W świetle opisanego stanu techniki celem niniejszego wynalazku jest dostarczenie wysoce specyficznej proteinazy oraz sposobu jej otrzymywania oraz charakterystyki jej aktywności pozwalającej na jej przemysłowe wykorzystywanie.
Nieoczekiwanie twórcy tego wynalazku ustalili, że proteinaza SplB posiada dużo węższą niż oczekiwana specyficzność substratową. Bazując na tym odkryciu zaproponowano nowe specyficzne substraty dla proteinazy SplB oraz sposoby hydrolizy i/lub otrzymywania białek wykorzystujące takie peptydy (fragmenty sekwencji) oraz nowe zastosowania proteinazy SplB. Uzyskanie tych wyników było możliwe dzięki opracowaniu wydajnej metody produkcji proteinazy SplB, którą ujawniono w niniejszym opisie.
W opisie ujawniono polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB posiadający sekwencję aminokwasowąXaa1-Xaa2-Xaa3-Xaa4-Xaa5, gdzie:
Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly,
Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr,
Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,
Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,
Xaa5 jest pominięty lub jest dowolnym aminokwasem.
Ujawniony polipeptyd charakteryzuje się tym, że korzystnie posiada sekwencję wybraną spośród:
Trp-Glu-Leu-Gln-Gly,
Trp-Glu-Leu-GIn,
Trp-Glu-Leu-Thr,
Trp-Glu-Val-Gln,
Val-Glu-Leu-Gln,
Trp-GIn-Leu-Asp,
Trp-Val-Leu-Gln,
Phe-Glu-Val-Glu,
Gly-Arg-Gly-Val-Gly,
Gly-Arg-Gly-Val,
Val-Glu-lle-Asp.
Kolejno w niniejszym opisie ujawniono białko rozpoznawane przez proteinazę SplB posiadające sekwencję aminokwasową zawierającą zdefiniowany powyżej polipeptyd. Następnie ujawniono sekwencję nukleotydową kodującą ujawniony polipeptyd zdefiniowany powyżej oraz sekwencję nukleotydową kodującą ujawnione białko zdefiniowane powyżej.
Ujawniono również zastosowanie sekwencji polipeptydu zdefiniowanej powyżej lub jego pochodnej przy wytwarzaniu białka rozpoznawanego przez proteinazę SplB lub jej pochodną.
Ujawniono kolejno sposób otrzymywania pożądanego białka charakteryzujący się tym, że:
a) dostarcza się białko fuzyjne posiadające sekwencję Z1-Xaa1-Xaa2-Xaa3-Xaa4-Z2, gdzie: Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly, Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr, Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,
Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,
Z1 i Z2 oznacza polipeptyd zawierający jeden lub więcej aminokwasów, przy czym jeden z nich oznacza polipeptyd zawierający pożądane białko a drugi polipeptyd zawierający polipeptyd znacznikowy,
b) izoluje się białko fuzyjne, korzystnie techniką chromatograficzną stosując złoże posiadające powinowactwo do polipeptydu znacznikowego,
c) prowadzi się reakcję hydrolizy białka fuzyjnego za pomocą proteinazy posiadającej aktywność enzymatyczną proteinazy SplB, przy czym korzystnie izoluje się pożądane białko z mieszaniny reakcyjnej.
Dla celów niniejszego opisu jako polipeptyd zawierający polipeptyd znacznikowy, zwany też w niniejszym opisie metką lub polipeptydem znacznikowym, należy rozumieć sekwencję pozwalającą na izolowanie zawierającego ją polipeptydu, zwłaszcza techniką chromatografii powinowactwa. Specjalista będzie w stanie zaproponować opierając się na powszechnie dostępnej wiedzy szereg tego rodzaju sekwencji, które można wykorzystać do zaprojektowania układu do izolowania produkowanego białka w szczególności techniką chromatografii powinowactwa. Przykładowo, wprowadzenie sekwencji rozpoznawanej przez przeciwciało pozwala na izolowanie zawierającego ją białka za pomocą tego przeciwciała. Innym przykładem są sekwencje aminokwasowe posiadające powinowactwo do glutationu. Kolejnym przykładem są techniki opierające się na znanym zjawisku tworzenia kompleksów niektórych jonów metali z niektórymi
PL213 994B1 resztami aminokwasowymi. Najbardziej znanym przykładem takiego układu jest kompleksowanie jonów niklu przez pierścienie imidazolowe histydyn wprowadzonych do izolowanego łańcucha polipeptydowego. Wszystkie tego typu układy składające się ze znacznikowej sekwencji aminokwasowej i substancji, do której taka sekwencja posiada odpowiednio silne powinowactwo, pozwalają zaprojektować system oczyszczania białka zawierającego sekwencję znacznikową. Zwykle będzie to technika chromatografii powinowactwa na złożu zawierającym wspomnianą substancję.
W związku z powyższym, znacznikowa sekwencja aminokwasowa może zawierać sekwencję składającą się z sześciu kolejnych histydyn (His6).
Pożądane białko wchodzące w skład ujawnionego białka fuzyjnego wspominanego powyżej może być dowolnym znanym białkiem, dla którego znana jest sekwencja aminokwasowa lub sekwencja kodująca. Przykładowo, może to być białko lecznicze, którego produkcja pożądana jest ze względu na jego właściwości terapeutyczne. W oparciu o instrukcje ujawnione w niniejszym opisie oraz powszechnie dostępną wiedzę fachowiec będzie w stanie opracować sekwencję kodującą białko fuzyjne zawierającą sekwencję kodującą pożądane białko. Sekwencje aminokwasowe lub sekwencje kodujące znanych białek mogą być przykładowo pozyskane z bazy GenBank dostępnej w sieci internet pod adresem http://www.ncbi.nim.nih.gov/Genbank/index.html, w której zgromadzono sekwencje znanych genów oraz sekwencje aminokwasowe znanych białek. Aby zwiększyć poziom ekspresji białka fuzyjnego w układzie bakteryjnym można zastosować znane metody podnoszenia poziomu ekspresji w komórkach bakteryjnych, które obejmują stosowanie silnych promotorów, stosowanie sekwencji wzmacniających transkrypcję lub stosowanie kodonów preferowanych przez wybraną komórkę bakteryjną.
Ujawniony sposób charakteryzuje się tym, że, białko fuzyjne posiada, korzystnie, sekwencję wybraną spośród:
Z1 -T rp-Glu-Leu-Gln-Z2,
Z1 -T rp-Glu-Leu-Thr-Z2,
Z1-Trp-Glu-Val-Gln-Z2,
Z1 -Val-Glu-Leu-Gln-Z2,
Z1 -T rp-Gln-Leu-Asp-Z2,
Z1 -T rp-Val-Leu-Gln-Z2,
Z1-Phe-Glu-Val-Glu-Z2,
Z1 -Gly-Arg-Gly-Val-Gly-Z2,
Z1-Gly-Arg-Gly-Val-Z2, Z1-Val-Glu-lle-Asp-Z2.
W ujawnionym sposobie hydrolizę prowadzi się korzystnie w temperaturze od 0°C do 45°C, w pH od 6,0 do 9,0 lub w buforze fosforanowym, Bis-Tris, CAPS lub Tris o stężeniu od 1 do 250mM lub w roztworze zawierającym od 0 do 500mM NaCI.
Przedmiotem wynalazku jest mutant proteinazy SplB charakteryzujący się tym, że posiada sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.
Korzystnie, sekwencja sekrecyjna jest bakteryjną sekwencją sekrecyjną z Bacillus subtilis. Kolejnym przedmiotem wynalazku jest sekwencja nukleotydowa kodująca mutanta proteinazy SplB posiadającego sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.
Korzystnie sekwencja nukleotydową posiada sekwencję wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11.
Kolejnym przedmiotem wynalazku jest sposób otrzymywania mutanta proteinazy SplB, charakteryzujący się tym, że:
a) w komórkach gospodarza bakteryjnego prowadzi się ekspresję mutanta proteinazy SplB posiadającego sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12, korzystnie kodowanego przez sekwencję nukleotydową wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11, a następnie;
b) izoluje się pożądany enzym lub zawierającą go frakcję.
Korzystnie, gospodarzem bakteryjnym jest szczep Bacillus subtilis ekspresjonujący białko kodowane przez sekwencję nukleotydową przedstawioną jako SEQ ID No.: 3.
Korzystnie, w etapie b) oddziela się brzeczkę fermentacyjną od masy bakteryjnej poprzez wirowanie, białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysala się siarczanem
PL 213 994 Β1 amonu, oddziela się wysolone białka i rozpuszcza w niewielkiej ilości roztworu buforowego i dializuje się do buforu o pH około 5,5.
Korzystnie, w etapie b) dodatkowo oczyszcza się wyizolowane białko techniką chromatografii powinowactwa, chromatografii jonowymiennej i/lub sączenia molekularnego, a ostatecznie oczyszczony preparat zagęszcza się i ewentualnie poddaje krystalizacji.
W jednej z korzystnych realizacji sposobu produkcji aktywnej proteinazy SplB można wykorzystać zdolności katalityczne samego enzymu. W metodzie tej produkuje się enzym z N-terminalną metką fuzyjną wybraną korzystnie z bogatej puli opisanych metek lub nowym peptydem o własnościach pożądanych dla metki. Metkę taką może stanowić przykładowo, lecz nie jedynie metka histydynowa (tzw. ang. His-tag). Pomiędzy metkę fuzyjną a sekwencję proteinazy SplB wstawia się dogodnie sekwencję rozpoznawaną i przecinaną przez proteinazę SplB. Po wyprodukowaniu opisanego białka fuzyjnego izoluje się je wykorzystując właściwości metki, a następnie odcina się metkę przy pomocy katalitycznych ilości proteinazy SplB. Uwolniona od metki proteinaza SplB zwiększa pulę aktywnego enzymu przyspieszając zakończenie procesu odcinania. Odcinanie metki można prowadzić bezpośrednio na złożu stosowanym do izolacji białka fuzyjnego lub też po elucji, przy czym pierwsza metoda pozwala na jednoczesne oczyszczenie proteinazy od metki fuzyjnej, natomiast w drugim przypadku konieczne jest wprowadzenie dodatkowego stopnia oczyszczania.
W opisie ujawniono zastosowanie proteinazy SplB do specyficznej hydrolizy polipeptydu zawierającego sekwencję aminokwasowąXaa1-Xaa2-Xaa3-Xaa4, gdzie:
Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly, Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr, Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly, Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn.
Hydrolizowany polipeptyd może posiadać sekwencję aminokwasową zawierającą sekwencję wybraną spośród:
Trp-Glu-Leu-Gln-Gly,
Trp-Glu-Leu-GIn,
Trp-Glu-Leu-Thr,
Trp-Glu-Val-Gln,
Val-Glu-Leu-Gln,
Trp-GIn-Leu-Asp,
Trp-Val-Leu-Gln,
Phe-Glu-Val-Glu,
Gly-Arg-Gly-Val-Gly,
Gly-Arg-Gly-Val,
Val-Glu-lle-Asp.
Hydrolizę można prowadzić w temperaturze od 0°C do 45°C, w pH od 6,0 do 9,0. Hydrolizę prowadzi się również w buforze fosforanowym, Bis-Tris, CAPS lub Tris o stężeniu od 1 do 250mM lub w roztworze zawierającym od 0 do 500mM NaCI.
Ujawniono również proteinazę posiadającą aktywność proteinazy Sól posiadającą centrum aktywne tworzone przez triadę katalityczną His, Asp i Ser, przy czym RMSD atomów aminokwasów tworzących triadę katalityczną jest niewiększe niż 1,7A, korzystnie niewiększe niż 1,5A, w zestawieniu z His 39, Asp 77 i Ser 157 zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.
Korzystnie, ujawniona proteinaza charakteryzuje się tym, że RMSD węgli Ca łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych rdzenia cząsteczki (a więc nie uwzględniając pętli, innych elementów ruchomych, fragmentów eksponowanych na zewnątrz cząsteczki oraz jej słabo zdefiniowanych elementów wg sztuki) jest niewiększe niż 2A, korzystnie niewiększe niż 1,5A, w zestawieniu z odpowiadającymi im strukturalnie węglami Ca łańcucha głównego zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że dobrze zdefiniowana struktura drugorzędowa rdzenia cząsteczki zawiera fragmenty odpowiadające strukturalnie fragmentowi białka SplB wybranemu korzystnie spośród następujących sekwencji: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199.
PL213 994B1
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że zawiera fragment tworzący α-helisę odpowiadający strukturalnie fragmentowi białka SplB wybranemu korzystnie spośród następujących sekwencji: Lys38 do Ser41, Lys196 do Glu200.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że zawiera fragmenty tworzące β-harmonijkę odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród następujących sekwencji: Val4 do Thr5, Val18 do Ala20, Thr25 do Val28, Thr33 do Thr36, Arg49 do Ala52, Ile63 do Asn71, Ser79 do Val83, Arg115 do Ile119, Tyr132 do Gly136, Ser145 do Tyr148, Val 161 do Leu162, Gly170 do Ser175, Ala185 do Val 188.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że posiada strukturę trzeciorzędową dla której RMSD węgli Ca łańcucha głównego jest niewiększe niż 2,2A, korzystnie niewiększe niż 1,8A, w zestawieniu z odpowiadającymi im węglami Ca łańcucha głównego zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że posiada następujące elementy strukturalne:
- w pozycji odpowiadającej Val28 w sekwencji SplB zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Val29 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Ile34 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Leu35 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Thr36 zawiera aminokwas wybrany spośród Ser, Thr;
- w pozycji odpowiadającej His39 zawiera His;
- w pozycji odpowiadającej Ile66 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Ile69 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Asp77 zawiera Asp;
- w pozycji odpowiadającej Val78 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Val80 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;
- w pozycji odpowiadającej Ile81 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;
- w pozycji odpowiadającej Val118 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Ser, Thr;
- w pozycji odpowiadającej Gly120 zawiera Gly;
- w pozycji odpowiadającej Tyr121 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;
- w pozycji odpowiadającej Leu131 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;
- w pozycji odpowiadającej Gly155 zawiera Gly;
- w pozycji odpowiadającej Asn156 zawiera aminokwas wybrany spośród Asn, Gin, Asp, Glu;
- w pozycji odpowiadającej Ser157 zawiera Ser;
- w pozycji odpowiadającej Gly158 zawiera Gly;
- w pozycji odpowiadającej Ser159 zawiera aminokwas wybrany spośród Val, Ala, Ser, Thr, Gly;
- w pozycji odpowiadającej Pro160 zawiera Pro;
- w pozycji odpowiadającej Gly170 zawiera Gly;
- w pozycji odpowiadającej Ile171 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Phe197 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;
- w pozycji odpowiadającej Ile198 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala.
Uszczegóławiając w opisie ujawniono polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB posiadający sekwencję aminokwasowąXaa1-Xaa2-Xaa3, Xaa4-Xaa5, gdzie
Xaa1 jest aminokwasem z hydrofobowym łańcuchem bocznym lub aminokwasem z niewielkim łańcuchem bocznym, korzystnie wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly,
Xaa2 to kwas glutaminowy, glutamina, kwas asparaginowy, asparagina lub aminokwas z niewielkim łańcuchem bocznym lub arginina, korzystnie Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr,
Xaa3 to aminokwas z niewielkim hydrofobowym łańcuchem bocznym albo aminokwas z niewielkim łańcuchem bocznym, korzystnie Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,
Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,
Xaa5 jest pominięty lub jest dowolnym aminokwasem.
W sekwencjach odpowiednie symbole oznaczają: A, Ala, alanina; V, Val, walina; L, Leu, leucyna; I, Ile, izoleucyna; P, Pro, prolina; F, Phe, fenyloalanina; W, Trp, tryptofan; M, Met, metionina; G,
PL 213 994 Β1
Gly, glicyna; S, Ser, seryna; T, Thr, treonina; C, Cys, cysteina; Y, Tyr, tyrozyna; N, Asn, asparagina; Q Gin, glutamina; D, Asp, kwas asparaginowy; E, Glu, kwas glutaminowy; K. Lys, lizyna; R, Arg, arginina; H, His, histydyna;
Xaa5 może być w przypadku proteinazy SplB pominięty lub być dowolnym aminokwasem gdyż nieoczekiwanie proteinaza SplB odróżnia się od innych proteinaz cechujących się wysoką specyficznością substratową, które wykazują zazwyczaj określoną specyficzność również wobec aminokwasu znajdującego się bezpośrednio za hydrolizowanym wiązaniem (na nowym N-końcu powstającym w wyniku hydrolizy wiązania peptydowego; tj. w miejscu PT zgodnie z systemem numeracji przyjętym w tym zgłoszeniu, a zaproponowanym przez: Schechter, I., and Berger, A. (1967) Blochem. Biophys. Res. Commun. 27,157-162). W przypadku proteinazy SplB preferencji takiej nie obserwujemy.
Cecha ta jest szczególnie korzystna, ponieważ pozwala na dowolne projektowanie N-końca uwalnianych produktów.
Kolejny aspekt ujawnienia dotyczy białek posiadających ustaloną aktywność proteinazy SplB dzięki zachowaniu przez te białka struktury trzeciorzędowej proteinazy SplB przedstawionej w tabeli 1.
Istnieje powszechnie stosowany parametr określający podobieństwo struktur trzeciorzędowych, który pozwala na zdefiniowanie grupy ujawnionych białek o pożądanych właściwościach. Parametr ten to RMS distance (deviation) (ang. root mean square distance (deviation)) określany także jako RMSD. Wartość parametru RMSD wylicza się porównując położenia odpowiadających sobie atomów po uprzednim nałożeniu na siebie porównywanych struktur w celu ich optymalnego dopasowania. Wartość parametru wyraża się w angstremach (A) i tak też przyjęto w dalszym tekście. Ogólnie, im niższa wartość parametru tym struktury bardziej podobne.
Zatem niniejszy opis ujawnia białka o wzmiankowanej aktywności proteolitycznej, których struktura trzeciorzędowa jest dostatecznie podobna do struktury proteinazy SplB. Rzeczone podobieństwo mierzymy wartością parametru RMSD dla istotnych komponentów strukturalnych proteinazy SplB w stosunku do odpowiadających im komponentów strukturalnych porównywanego białka. W szczególności ujawniono enzym, którego:
a) RMSD wszystkich atomów reszt triady katalitycznej (seryny, histydyny i kwasu asparaginowego) jest mniejsze lub równe 1,7A, korzystnie mniejsze lub równe 1,5A, przy czym korzystnie dodatkowo spełnia ona co najmniej jedno z następujących kryteriów:
b) RMSD odpowiadających strukturalnie węgli Ca łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych jest mniejsze lub równe 2,0A, korzystnie mniejsze lub równe 1,5A,
c) tak jak w (b) z tym ze dobrze zdefiniowane strukturalnie elementy cząsteczki obejmują fragmenty łańcucha polipeptydowego wybrane korzystnie spośród następujących fragmentów określonych wg numeracji SplB oraz odpowiadających im strukturalnie fragmentów porównywanej cząsteczki: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199;
d) RMSD atomów łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych jest mniejsze lub równe 2,2A, korzystnie mniejsze lub równe 1,8A;
e) tak jak w (d) z tym ze dobrze zdefiniowane strukturalnie elementy cząsteczki obejmują fragmenty łańcucha polipeptydowego wybrane korzystnie spośród następujących fragmentów określonych wg numeracji SplB oraz odpowiadających im strukturalnie fragmentów porównywanej cząsteczki: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199;
f) Fragmenty odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród określonych poniżej tworzą β-harmonijkę: Val4 do Thr5, Val18 do Ala20, Thr25 do Val28, Thr33 do Thr36, Arg49 do Ala52, Ile63 do Asn71, Ser79 do Val83, Arg115 do Ile119, Tyr132 do Gly136, Ser145 do Tyr148, Val161 do Leu162, Gly 170 do Ser175, Ala185 do Val188
g) Fragmenty odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród określonych poniżej tworzą α-helisę: Lys38 do Ser41, Lys196 do Glu200.
Analiza struktury trzeciorzędowej proteinazy SplB pozwoliła zlokalizować regiony oraz reszty szczególnie istotne w procesie rozpoznawania substratu i katalizy. Ujawniono zatem białka posiadające reszty odpowiadające następującym kluczowym resztom aminokwasowym w sekwencji proteinazy SplB:
PL213 994B1
a. ) reszty tzw. triady katalitycznej które w przypadku proteinazy SplB stanowią: S157, H39 i D77. Zamiana tych reszt skutkuje całkowitą utratą zdolności katalitycznych. Przykładowo, dla proteinazy SplB wykazano, że mutant S157—>A jest całkowicie pozbawiony aktywności proteolitycznej.
b. ) reszty odpowiedzialne za rozpoznanie substratu:
P1: przede wszystkim S175, H172, T152 do N156, A174
P2: przede wszystkim F173, H39 i D77
P3: przede wszystkim S175
P4: przede wszystkim F173 i Y186,
d.) reszta kwasu glutaminowego na N-końcu łańcucha polipeptydowego, która to reszta jest odpowiedzialna za stabilizację N-końca białka przez wiązania wodorowe a tym samym umożliwia wyrażanie pełnej aktywności proteolitycznej. Reszta ta może być ewentualnie zastąpiona resztą kwasu asparaginowego wykazującą podobne właściwości fizykochemiczne.
Ujawnione w pracy J. Mol. Biol. (2006) 358, 270-279 porównanie sekwencji aminokwasowych homologicznych białek gronkowcowych (proteinazy V8 oraz toksyn epidermolitycznych) i trypsyny wskazuje na ważne rejony w sekwencji białka niezbędne dla prawidłowego fałdowania i/lub zachowania funkcji (fig. 1): V28 do V40; D77 do 181; G120 do P122 oraz G155 do 1171. Ponadto widać wyraźnie konserwację pojedynczych reszt: 150; S134; 1146; V188 i 1198. Jednak dopiero rozwiązanie struktury trzeciorzędowej proteinazy SplB pozwala na stworzenie porównania sekwencji na podstawie porównania struktur - a więc porównania sekwencji odpowiadających sobie elementów strukturalnych (najpierw porównuje się struktury, a następnie tam gdzie są podobne zestawia się tylko sekwencje, nawet jeśli nie są one homologiczne w klasycznym rozumieniu). Rozwiązanie takie niesie ze sobą dużo więcej informacji niż zwykłe porównanie sekwencji gdyż wskazuje elementy ważne dla zachowania funkcji białka. Porównanie takie zostało przedstawione na fig. 2, gdzie odpowiednie fragmenty są zgrupowane na podstawie podobieństw strukturalnych. Takie podejście pozwala na ewidentne wyróżnienie regionów konserwatywnych istotnych dla funkcji białka. Zatem ujawnione białko powinno posiadać w miejscach odpowiadających następującym aminokwasom w sekwencji SplB następujące reszty:
Val28 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Val29 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Ile34 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Leu35 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Thr36 - optymalnie zawiera aminokwasy wybrane spośród Ser, Thr;
His39 - histydyna triady katalitycznej;
Ile66 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Ile69 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Asp77 - kwas asparaginowy triady katalitycznej;
Val78 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Val80 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met;
Ile81 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met;
Val118 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Ser, Thr;
Gly120 - optymalnie Gly;
Tyr121 - optymalnie zawiera aminokwasy z dużym, hydrofobowym łańcuchem bocznym wybrane spośród Tyr, Phe, Trp;
Leu131 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met
Gly155 - optymalnie Gly;
Asn156 - optymalnie zawiera aminokwasy wybrane spośród Asn, Gin, Asp, Glu;
Ser157 - seryna triady katalitycznej o której była mowa wcześniej, musi być Ser;
Gly158 - optymalnie Gly;
Ser159 - optymalnie zawiera aminokwasy wybrane spośród Val, Ala, Ser, Thr, Gly;
Pro160 - optymalnie Pro;
PL 213 994 Β1
Gly170 - optymalnie Gly;
Ile171 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala;
Phe197 - optymalnie zawiera aminokwasy z dużym, hydrofobowym łańcuchem bocznym wybrane spośród Tyr, Phe, Trp;
Ile198 -optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala.
Szczególną realizacjąjest białko posiadające strukturę proteinazy SplB określoną w tabeli 1.
Zgodnie z ujawnieniem proteinaza SplB rozpoznaje specyficzną sekwencję aminokwasową i hydrolizuje łańcuch polipeptydowy zaraz za lub w obrębie rozpoznawanej sekwencji. Z uwagi na długość rozpoznawanej sekwencji (cztery kolejne aminokwasy) liczba identycznych sekwencji w proteomie człowieka wynosi zaledwie kilkanaście, a więc enzym ten nadaje się m.in. do odcinania metek fuzyjnych przy produkcji pozostałych kilkudziesięciu tysięcy białek ludzkich. Ujawniono przede wszystkim sekwencje aminokwasowe łańcucha polipeptydowego specyficznie rozpoznawane lub specyficznie rozpoznawane i hydrolizowane przez proteinazę SplB, sekwencje nukleotydowe kodujące rzeczone sekwencje aminokwasowe (a więc pozwalające na produkcję polipeptydów je zawierających przy pomocy technologii białek rekombinowanych) oraz metodę specyficznej hydrolizy polipeptydów zawierających rzeczone sekwencje aminokwasowe przy pomocy proteinazy SplB. Ujawniono także samą proteinazę SplB jako enzym rozpoznający lub rozpoznający i hydrolizujący wybrane sekwencje aminokwasowe oraz sposoby produkcji proteinazy SplB w systemie rekombinowanym. Ponadto ujawniono syntetyczne substraty oparte na sekwencjach specyficznie rozpoznawanych i hydrolizowanych przez proteinazę SplB.
Podsumowując najważniejsze zalety prezentowanego wynalazku, należy uznać, że przedmiot wynalazku oraz szczególnie korzystne ujawnione aspekty mogą znaleźć zastosowanie w następujących procesach:
a) rozpoznanie specyficznej sekwencji aminokwasowej łańcucha polipeptydowego (w szczególności sekwencji białka rekombinowanego) i jego specyficzna hydroliza w ściśle określonym miejscu w obrębie lub w niewielkiej odległości od rozpoznawanej sekwencji,
b) wysoce wydajna produkcja proteinazy SplB.
Przedmioty wynalazku zostały zdefiniowane w zastrzeżeniach patentowych.
Dla lepszego zilustrowania istoty wynalazku i ujawnionych aspektów niniejszy opis wzbogacono o wykaz sekwencji i figury.
Sekwencja nr 1 (SEQ ID NO 1) prezentuje sekwencję kodującą proteinazę SplB ze Staphylococcus aureus wraz z jej natywnym peptydem sygnalnym.
Sekwencja nr 2 (SEQ ID NO 2) prezentuje sekwencję aminokwasową proteinazy SplB ze Staphylococcus aureus (dojrzałe białko: aminokwasy od 1 do 204) wraz z jej natywnym peptydem sygnalnym (aminokwasy od -36 do -1).
Sekwencja nr 3 (SEQ ID NO 3) prezentuje sekwencję kodującą wariant proteinazy SplB ze Staphylococcus aureus, w której sekwencję kodującą natywny peptyd sygnalny zastąpiono sekwencją kodującą peptyd sygnalny pochodzący z Bacillus subtilis.
Sekwencja nr 4 (SEQ ID NO 4) prezentuje sekwencję aminokwasową wariantu proteinazy SplB ze Staphylococcus aureus, w której sekwencję natywnego peptydu sygnalnego zastąpiono sekwencją peptydu sygnalnego pochodzącego z Bacillus subtilis (aminokwasy od -29 do -1).
Sekwencja nr 5 (SEQ ID NO 5) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję S157A natomiast sekwencja nr 6 (SEQ ID NO 6) prezentuje sekwencję aminokwasowątego wariantu.
Sekwencja nr 7 (SEQ ID NO 7) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję H39A natomiast sekwencja nr 8 (SEQ ID NO 8) prezentuje sekwencję aminokwasową tego wariantu.
Sekwencja nr 9 (SEQ ID NO 9) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję D77A natomiast sekwencja nr 10 (SEQ ID NO 10) prezentuje sekwencję aminokwasową tego wariantu.
Sekwencja nr 11 (SEQ ID NO 11) prezentuje sekwencję kodującą białko fuzyjne zawierające sekwencję dojrzałej formy SplB z S. aureus, do której przyłączono metkę histydynową i sekwencję rozpoznawaną przez SplB natomiast sekwencja nr 12 (SEQ ID NO 12) prezentuje sekwencję aminokwasową tego białka.
PL213 994B1
Figura 1 zawiera porównanie sekwencji aminokwasowych blisko spokrewnionych proteinaz: proteinaza SplB, proteinaza SpIC, V8 (proteinaza V8 ze Staphylococcus aureus zwana inaczej glutamylendopeptydazą), ETA - toksyna epidermolityczna A ze Staphylococcus aureus oraz daleko spokrewnionego enzymu - trypsyny (modelowy enzym dla grupy proteinaz trypsynopodobnych). Podobieństwa sekwencji oznaczono odcieniami szarości - im ciemniejsze tym większe podobieństwo. Regiony o wyraźnej homologii sekwencji oraz pojedyncze konserwatywne reszty zaznaczono ramkami.
Figura 2 prezentuje porównanie sekwencji aminokwasowych blisko spokrewnionych proteinaz stworzone na podstawie znajomości ich struktur trzeciorzędowych oraz znajomości struktury trzeciorzędowej ustalonej dla proteinazy SplB; wskazano reszty szczególnie istotne dla zachowania struktury i aktywności proteinazy.
Poniższe przykłady zostały umieszczone jedynie w celu lepszego wyjaśnienia poszczególnych aspektów wynalazku i nie powinny być utożsamiane z całym jego zakresem, który zdefiniowano w załączonych zastrzeżeniach.
Przykład 1. Wstępna charakterystyka proteinazy SplB
Wyjściowym eksperymentem, umożliwiającym dalsze prace było wyznaczenie optimum pH i temperatur, dopuszczalnych stężeń soli i innych odczynników oraz stabilności enzymu. W tym celu należało opracować ilościową metodę oznaczania aktywności enzymu. Przeprowadzone liczne próby z syntetycznymi substratami niskocząsteczkowymi opisane w J. Mol. Biol. (2006) 358, 270-279 oraz kontynuowane również po opublikowaniu tej pracy dla większej liczby substratów nie pozwoliły jednak uzyskać lepszej charakterystyki proteinazy SplB. Enzym wykorzystany w tych eksperymentach otrzymano techniką opisaną w J. Mol. Biol. (2006) 358, 270-279. Wśród znanych substratów proteinaz trypsynopodobnych nie zidentyfikowano substratu trawionego nawet w minimalnym stopniu przez proteinazę SplB. Po długich poszukiwaniach ustalono, że FTC kazeina (kazeina znakowana barwnikiem fluorescencyjnym, umożliwiająca badanie hydrolizy metodą spektrofluorescencji) jest mało wydajnym substratem białkowym trawionym przez proteinazę SplB. W przypadku trawienia tego substratu konieczne było stosowanie nadmiaru molowego enzymu w stosunku do substratu oraz długich (rzędu godzin) czasów inkubacji. Przy jego użyciu udało się jednak określić wstępną charakterystykę aktywności proteinazy SplB jako: optimum pH na 8,25 (+/- 1,5 jednostki w dół i 1 jednostkę w górę), brak wyraźnej zależności aktywności od stężeń popularnych soli do 0,5M, brak wpływu środków redukujących do kilku mM, szeroką tolerancję temperaturową.
Na tej podstawie ustalono podstawowe parametry reakcji hydrolizy zalecane dla reakcji prowadzonej z wykorzystaniem proteinazy SplB. W efekcie, wszystkie kolejne eksperymenty prowadzono w temperaturze od 20°C do 37°C, w 10 do 10OmM buforze fosforanowym lub Tris przy wartości pH od 7,0 do 8,5 i stężeniu NaCI od 0 do 150mM. Ponadto ustalono, że enzym można przechowywać w stanie zamrożonym bez wyraźnej utraty aktywności, oraz kilkakrotnie zamrażać i rozmrażać a także liofilizować. Można go także przechowywać kilka miesięcy w temperaturze 4°C bez wyraźnej utraty aktywności. Wszystkie powyższe warunki stanowią dogodne formy przechowywania enzymu, co jest niezwykle istotne w codziennej praktyce.
Przykład 2. Wstępne próby ustalenia specyficzności substratowej proteinazy SplB
Trawienie β-kazeiny
Standardowo dla oznaczenia specyficzności substratowej proteinazy kontaktuje się ją z różnymi białkami, oznacza się miejsca hydrolizy i na podstawie odpowiedniej ilości prób metodami analizy statystycznej ustala się najbardziej optymalne miejsce cięcia. Takie standardowe postępowanie zastosowane zostało w pierwszym podejściu także dla proteinazy SplB, jednak nie przyniosło ono spodziewanych wyników. Wykazano, że szereg testowanych białek (lizozym białka jaja kury, inhibitor trypsyny z nasion soi, transferyna osocza ludzkiego, albumina osocza wołowego, owalbumina jaja kury, β-galaktozydaza E. coli, anhydraza węglanowa, alfa-2-makroglobulina osocza ludzkiego, cytochrom c, kozie przeciwciała IgG, RNAza, fibrynogen, mioglobina wieloryba, cała gama serpin ludzkich i mysich) nawet przy przedłużonej inkubacji z nadmiarem enzymu nie ulega proteolizie.
Wykrywalną aktywność białka SplB wykazano jedynie metodązymografii na β-kazeinie (J. Mol. Biol. (2006) 358, 270-279). Dalsze eksperymenty innymi metodami (kontaktowanie proteinazy i kazeiny w roztworze, analiza produktów proteolizy przy pomocy SDS-PAGE) potwierdziły ten fakt jednak wykazały też, że dla przeprowadzenia reakcji hydrolizy potrzeba zastosowania molowego nadmiaru enzymu i bardzo długich czasów inkubacji - kilkunastu godzin. Oznacza to, że enzym „bardzo niechętnie” hydrolizuje β-kazeinę (standardowo przy tego typu badaniach stosuje się katalityczne ilości enzymu - 100x i mniej niż substratu oraz krótkie czasy inkubacji - rzędu minut). Metodami spektrometrii
PL 213 994 Β1 masowej oraz chemicznego sekwencjonowania aminokwasowego udało się oznaczyć cztery miejsca cięcia w obrębie cząsteczki β-kazeiny (spacja oznacza miejsce cięcia):
EEQQQ FAQTQ FTESQ LPLLQ
TEDEL SLVYP SLTLT
SWMHQ
Na podstawie tej niewielkiej (a więc mało reprezentatywnej) grupy można by założyć, że zgodnie z wiedzą, iż w tego typu proteinazach specyficzność determinuje reszta w pozycji P1 proteinaza SplB potrzebuje reszty glutaminy (Q) w miejscu P1 substratu (wyróżnione tłustym drukiem). Założenie takie nie tłumaczy zupełnie dlaczego trawieniu nie ulegają inne białka zawierające bardzo wiele reszt glutaminy (Q) w szczególności sama β-kazeina która była trawiona jedynie na kilka fragmentów pomimo, że zawiera kilkanaście reszt Q. Ponadto założenie takie nie tłumaczy także, dlaczego proteinaza SplB jest tak mało wydajna.
Warto także zauważyć, że w pozostałych pozycjach sekwencji trawionych przez SplB w kazeinie, poza P1 ’, tj. P5 do P2 oraz P2’ do P5’ nie można ustalić żadnego wspólnego elementu czy charakterystycznego układu, który sugerowałby znaczenie tych pozycji dla specyficzności substratowej badanej proteinazy. Wydaje się jedynie, że w pozycji PT preferowane są reszty S lub T.
Trawienie substratów syntetycznych, denaturowanych białek i peptydów syntetycznych
W obliczu niepowodzenia eksperymentów opisanych powyżej przyjęto robocze założenie, że proteinaza SplB może trawić jedynie w specjalnych, eksponowanych rejonach białek, a z uwagi na ukrycie innych rejonów zawierających reszty Q wewnątrz struktury cząsteczki białek stosowanych jako substraty nie są one rozpoznawane i trawione. Dlatego przeanalizowano ponownie wybrane białka po uprzedniej denaturacji (karboksymetylowany lizozym, karboksymetylowany BPTI, apomioglobina i apocytochrom c w formie zdenaturowanej, po usunięciu cząsteczki hemu), oraz syntetyczny peptyd (KEGLTETTFEEDGVATGNHEYCVEV) i fluorescencyjne substraty syntetyczne charakteryzujące się brakiem struktur drugorzędowych (Abz-Glu-Ala-Leu-Gly-Thr-Ser-Pro-Arg-Lys(Dnp)-Asp-OH i Abz-GInGly-lle-Gly-Thr-Ser-Arg-Pro-Lys(Dnp)-Asp-OH). Ponadto zsyntetyzowano chemicznie i testowano peptydy odpowiadające regionom flankującym miejsce cięcia zidentyfikowane w cząsteczce kazeiny, mianowicie: FTESOSLTLT oraz EEQQQTEDEL.
We wszystkich przypadkach, pomimo stosowania także nadmiarów molowych proteinazy SplB oraz przedłużonych czasów inkubacji (do 72h) nie udało się wykazać hydrolizy badanych polipeptydów.
Wynik ten jest szczególnie zaskakujący w przypadku dwóch ostatnich peptydów o sekwencji identycznej do oznaczonych wcześniej miejsc cięcia.
Zatem, standardowa metoda oznaczania specyficzności substratowej opisana powyżej, w przypadku proteinazy SplB zupełnie zawiodła.
Potwierdzenie, że białko SplB jest proteinazą
W świetle powyższych wyników, w obliczu wykazanego trawienia cząsteczki β-kazeiny przy zastosowaniu nadmiaru enzymu i przedłużonego czasu inkubacji możliwym do zaakceptowania wytłumaczeniem było zanieczyszczenie badanego preparatu proteinazy SplB śladami innej aktywności proteolitycznej. Innymi słowy proteinaza SplB mogła być, tak jak blisko spokrewniona, homologiczna proteinaza SpIC, białkiem bez aktywności proteolitycznej (w pracy J. Mol. Biol. (2006) 358, 270-279 wykazano, brak aktywności proteolitycznej białka SpIC bardzo blisko spokrewnionego z proteinazą SplB) a przy stosowaniu jej nadmiaru drobne zanieczyszczenia stosowanego preparatu mogły ujawniać swoją aktywność.
Ewentualność taką wyeliminowano zamieniając katalityczną resztę seryny enzymu na resztę alaniny. W proteinazach trypsynopodobnych zamiana taka prowadzi zawsze do całkowitego zahamowania aktywności. Oczyszczony preparat muteiny proteinazy SplB (S157—>A) nie wykazywał zdolności hydrolizy β-kazeiny nawet przy trzykrotnym nadmiarze molowym i 72 godzinnej inkubacji. Eksperyment ten dowiódł roli reszty S157 w mechanizmie katalizy proteinazy SplB oraz potwierdził, że to właśnie ten enzym a nie zanieczyszczenia obecne w preparacie są odpowiedzialne za hydrolizę β-kazeiny.
Przykład 3. Nowa metoda otrzymywania proteinazy SplB
SEQ ID NO: 1 i 2 przedstawia odpowiednio sekwencję nukleotydową genu kodującego proteinazę SplB ze Staphylococcus aureus oraz odpowiadającą jej sekwencję aminokwasową. Numeracja nukleotydów rozpoczyna się od „a(1)” trójki startu translacji (atg) a kończy na ,,a(723)” trójki stopu translacji (taa). Łańcuch polipeptydowy proteinazy powstaje w procesie translacji w połączeniu z pep
PL213 994B1 tydem sygnalnym (numeracja reszt aminokwasowych od M(-36) do A(-1) który w procesie sekrecji jest odcinany przez proteinazę sygnalną. Powstaje wtedy aktywna zewnątrzkomórkowa forma proteinazy SplB, którą można wyizolować z pożywki hodowlanej (numeracja reszt aminokwasowych od E1 do K204). W dalszym opisie stosuje się numerację wprowadzoną na tych sekwencjach.
Sekwencje kodujące dojrzałą formę proteinazy SplB (E1 do K204) sklonowano do odpowiedniego plazmidu ekspresyjnego otrzymując plazmid umożliwiający produkcję zewnątrzkomórkową dojrzalej formy proteinazy SplB w bakteriach gramdodatnich. Sekwencję białka fuzyjnego składającego się z sygnałowej sekwencji sekrecyjnej specyficznej dla B. subtilis oraz dojrzałej formy proteinazy SplB, a także sekwencję nukleotydową kodującą to białko przedstawiono odpowiednio jako SEQ ID No. 3 i SEQ ID No. 4.
W celu uzyskania białka zrekombinowanego bakterie B. subtilis szczep WB800 transformowano plazmidem ekspresyjnym i prowadzono selekcję transformantów na płytkach zawierających kanamycynę (50pg/ml). Wyselekcjonowanymi klonami inokulowano niewielką ilość płynnej pożywki (TSB; Sigma) zawierającej antybiotyk selekcyjny i inkubowano w 37°C z intensywnym mieszaniem przez 8 do 10 h. Tak przygotowaną hodowlą startową inokulowano hodowlę właściwą (4-16L płynnej pożywki z antybiotykami) i inkubowano przy intensywnym mieszaniu w 37°C przez 13 do 16 godzin. Wszystkie dalsze etapy oczyszczania przeprowadzano w 4°C. Bakterie oddzielano od pożywki przez wirowanie przy przyspieszeniu 6000xg przez 30min. Białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysalano siarczanem amonu do 80% nasycenia (561 g/L w 4°C). Wysolone białka oddzielano od pożywki przez wirowanie (15000xg, 1 h), rozpuszczano w niewielkiej ilości 50 mM buforu octanowego pH 5,5 i dializowano przez noc do dużego nadmiaru tego samego buforu. Przedializowaną próbkę poddawano chromatografii jonowymiennej na złożu SP Sepharose FF (GE Healthcare) i zbierano frakcje zawierające największy szczyt białkowy wymywający się przy przewodnictwie buforu wynoszącym ok. 30 mS/cm. W razie wątpliwości frakcje testowano na obecność aktywności proteolitycznej metodą zymografii lub na obecność białka o odpowiedniej masie cząsteczkowej przy pomocy elektroforezy SDS-PAGE albo w inny dogodny sposób. Preparat dializowano do 50 mM buforu octanowego pH 4,8 i poddawano chromatografii jonowymiennej na złożu SOURCE 15S (GE Healthcare). Zbierano frakcje zawierające główny szczyt białkowy i poddawano sączeniu molekularnemu na złożu Superdex S75 w buforze PBS. Tak przygotowany, oczyszczony preparat zagęszczano, porcjowano i przechowywano zamrożony w -20°C.
Przykład 4. Ustalenie struktury trzeciorzędowej i specyficzności substratowej proteinazy SplB.
Metoda opisana w przykładzie 3 pozwoliła na wydajną produkcję badanego białka umożliwiając prowadzenie dalszej analizy jego struktury, a zwłaszcza uzyskanie krystalicznej postaci proteinazy SplB i ustalenie struktury trzeciorzędowej badanej proteinazy, co w efekcie przyczyniło się do określenia specyficzności substratowej proteinazy SplB.
Analiza struktury trzeciorzędowej proteinazy SplB
W celu wskazania na ewentualne determinanty strukturalne obserwowanej bardzo słabej kinetyki hydrolizy wiązań peptydowych oraz ewentualne wskazanie lepszych substratów, metodą krystalografii rentgenowskiej określono strukturę trzeciorzędową proteinazy SplB. Ustalone koordynaty poszczególnych atomów białka dojrzałej proteinazy SplB zgromadzono w tabeli 1. Analiza otrzymanego modelu strukturalnego wskazała, że proteinaza SplB wykazuje budowę charakterystyczną dla proteinaz rodziny S1 (trypsynopodobnych i chymotrypsynopodobnych) nie wykazując wyraźnych uwarunkowań w budowie triady katalitycznej dla obserwowanej słabej aktywności. Ponadto analiza wykazała dobrze wykształcone miejsce P1 zdolne do przyjęcia aminokwasów: D, E, Q lub N oraz charakterystyczną hydrofobową „łatę” na powierzchni białka w okolicy miejsca P3/P4 wskazującą na możliwość, że proteinaza SplB rozpoznaje poza resztą P1 także dalsze reszty substratu, a brak takiego rozpoznania (tj. odpowiedniego miejsca w badanych substratach) może warunkować obserwowaną we wcześniejszych eksperymentach słabą aktywność proteolityczną.
Kluczowe reszty aminokwasowe w sekwencji proteinazy SplB
Ze stanu techniki wiadomo, że kluczowymi resztami dla aktywności trypsynopodobnych proteinaz serynowych są reszty tzw. triady katalitycznej. W przypadku proteinazy SplB, uzyskana struktura trzeciorzędowa potwierdza, że są to: S157, H39 i D77. Zamiana tych reszt skutkuje całkowitą utratą zdolności katalitycznych. Odpowiednie sekwencje nukleotydowe i aminokwasowe takich mutantów przedstawione zostały jako SEQ ID No: 5-10. Stosując ujawnione sekwencje oraz metodę opisanąw przykładzie 3 można uzyskać białka odpowiednich mutantów i poddać je dalszej analizie. Przykładowo, potwierdzono eksperymentalnie, że mutant S157—>A jest całkowicie pozbawiony aktywności proteolitycznej.
PL 213 994 Β1
Na podstawie ustalonej struktury trzeciorzędowej proteinazy SplB oraz modelowania sposobu dokowania substratu m.in. na podstawie znajomości struktur kompleksów homologicznych białek z ich substratami i inhibitorami wynika, że reszty odpowiedzialne za rozpoznanie substratu to:
P1: przede wszystkim S175, H172, T152 do N156, A174
P2: przede wszystkim F173, H39 i D77
P3: przede wszystkim S175
P4: przede wszystkim F173 i Y186
Porównanie struktur trzeciorzędowych form w pełni aktywnej (identyczna z natywną) i słaboaktywnej (zawierająca dwa dodatkowe aminokwasy na N-końcu) proteinazy SplB wskazuje na rolę dokładnego umiejscowienia N-terminalu białka oraz początkowej reszty kwasu glutaminowego (E1).
Porównanie sekwencji aminokwasowych oraz struktur trzeciorzędowych homologicznych białek gronkowcowych (proteinazy V8 oraz toksyn epidermolitycznych) i trypsyny wskazuje na ważne rejony w sekwencji białka niezbędne dla prawidłowego fałdowania i/lub zachowania funkcji (patrz figura 1): V28 do V40; D77 do 181; G120 do P122 oraz G155 do 1171. Ponadto widać wyraźnie konserwację pojedynczych reszt: 150; S134; 1146; V188 i 1198.
Analiza bibliotek substratów syntetycznych
Bazując na wynikach analizy krystalograficznej, w dalszym etapie poszukiwania optymalnych substratów dla proteinazy SplB wykorzystano kombinatoryczną bibliotekę substratów syntetycznych zawierającą 104976 różnych substratów. Biblioteka zawiera substraty, w których na pozycjach P4 do P1 znajdują się wszystkie możliwe permutacje 18 aminokwasów (poza metioniną i cysteiną) a pozycję PT zajmuje 7-amido-4-fluorometylokumaryna, barwnik wykazujący fluorescencję po odcięciu przez proteinazę od części peptydowej, co pozwala na detekcję preferowanych substratów (szczegółowy opis Biol. Chem. (2004). 385:1093-1098). W pierwszym etapie badań skupiono się na ustaleniu preferowanej reszty w pozycji P1. Przegląd biblioteki proteinazą SplB pozwolił na ustalenie, że proteinaza SplB w pozycji P1 na 18 testowanych peptydów toleruje jedynie następujące aminokwasy: Asp, Asn, Gin (wynik zgodny z wynikami trawienia β-kazeiny oraz z przewidywaniami na podstawie analizy struktury proteinazy). Szybkość trawienia wyselekcjonowanych substratów była porównywalna z innymi proteinazami demonstrując, że proteinaza SplB wcale nie jest mało wydajna jak sugerowały wyniki wcześniejszych eksperymentów opisanych w stanie techniki i przykładach 1 i 2.
Stosowana biblioteka nie umożliwia odczytania wyników selekcji w pozycjach P2 do P4. Rozważając jednak odpowiedź na pytanie dlaczego proteinaza SplB nie trawi innych poza β-kazeiną białek, w których znajduje się cały szereg reszt Asp, Asn i Gin, na tym etapie prac stało się oczywiste, że trypsynopodobna proteinaza SplB posiada znacznie większą specyficzność substratową w porównaniu z jej bliskimi (proteinaza V8) i dalekimi (trypsyna, chymotrypsyna i wiele innych) homologami.
Analiza biblioteki kombinatorycznej CLiPS
Wysoka specyficzność substratowa zmusza do przesiania znacznie większej ilości substratów dla znalezienia tego właściwego i stąd konieczność zastosowania bardziej zaawansowanej metody CLiPS (opisanej w publikacji PNAS, (2006). 130: 7583-7588). Bardzo ogólnie, w uzyskanej tą techniką bibliotece jedno z białek zewnętrznej błony komórkowej bakterii jest tak skonstruowane syntetycznie, że zawiera wszystkie możliwe permutacje liniowej sekwencji kilku aminokwasów (każdy szczep bakterii należący do biblioteki zawiera białko o konkretnej sekwencji, ale inne niż pozostałe szczepy bakterie należące do biblioteki). Za sekwencją zmienną znajduje się sekwencja umożliwiająca detekcję fluorescencyjną. Pierwszy etap selekcji (cytometria przepływowa) wybiera komórki fluoryzujące (gdzie interesujące białko ulega ekspresji) następnie komórki te kontaktuje się z testowaną proteinazą i selekcjonuje się te, które nie fluoryzują, a więc te, dla których proteinaza odcięła część fluoryzującą. Następnie dla wyselekcjonowanych w ten sposób szczepów określa się sekwencję interesującego białka, a więc i sekwencje cięcia. Zastosowanie tej metody pozwala na przesianie 64 milionów substratów i uzyskanie informacji co do aminokwasów występujących w pozycjach P5 do PT, a nie tylko P1 (jak w technice opisanej powyżej). Wykorzystując tą metodę wyselekcjonowano następujące sekwencje rozpoznawane i cięte przez proteinazę SplB:
PL213 994B1
P4P3P2Pi * Pi' szybkość cięcia
G WELQ*S 0,81
SWELQ*G 0,62
S WELT*G 0,62
S WELT* V 0,90
SWEVQ*E 0,84
VVELQ‘S 0,65
S WELQ* V 0,61
S WELQ‘S 0,86
S WELQ* E 0,82
SWELQ*M 0,75
E WELQ*S 0,58
S WELQ* A 0,53
SWQLD*A 0,57
SWVLQ*A 0,32
WELQ* Sekwencja konsensusową
Wytłuszczoną czcionką zaznaczono aminokwasy odpowiadające dokładnie wyselekcjonowanej sekwencji konsensusowej, podkreślono aminokwasy dobiegające od sekwencji konsensusowej, gwiazdką oznaczono miejsce cięcia. Liczba po prawej stronie sekwencji jest miarą szybkości trawienia.
W świetle wcześniejszych eksperymentów i stanu techniki uzyskany wynik jest co najmniej nieoczywisty. Dotychczasowa wiedza o biochemii dziesiątek proteinaz trypsynopodobnych wskazuje prawie wyłącznie na miejsce P1 jako determinujące specyficzność substratową w tego typu białkach. Również wysoce homologiczna do proteinazy SplB - proteinaza V8 także ze Staphylococcus aureus wykazuje specyficzność jedynie dla reszty P1. Dlatego pierwotnie oczekiwano, zgodnie z ogólnym stanem wiedzy, że tak samo będzie w przypadku proteinazy SplB. Ponieważ proteinazy specyficzne tylko dla P1 nie są szczególnie specyficzne mierząc miarą metody CLiPS, metoda ta nie jest zalecana do określania specyficzności takich enzymów. Dopiero wiele niepowodzeń przy próbach przyrównania proteinazy SplB do wiedzy wynikającej ze stanu techniki skłoniło twórców do postawienia i przetestowania innej, mniej prawdopodobniej hipotezy dotyczącej specyficzności badanej proteinazy, która to hipoteza nieoczekiwanie okazała się prawdziwa.
Przykład 5. Wykorzystanie proteinazy SplB do specyficznej hydrolizy białek zawierających sekwencje aminokwasowe według wynalazku.
Trafność wyboru sekwencji konsensusowej oraz przydatność proteinazy SplB zostały potwierdzone w kolejnych eksperymentach. Wykorzystano plazmid umożliwiający ekspresję stafostatyny A jako białka fuzyjnego z GST odcinalnym przy pomocy trombiny (opisany w Mol. Microbiol (2003). 49: 1051-1066; zawierający sekwencję kodującą białko stafostatyna A, którą sklonowano techniką PCR z matrycy genomowego DNA S. aureus do plazmidu pGEX-5T w miejsca BamHI/Xhol uzyskując plazmid umożliwiający ekspresję białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A). Inkubacja białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A z proteinazą SplB, nawet przy przedłużonym czasie inkubacji z nadmiarem enzymu, nie prowadzi do widocznej w metodzie SDS-PAGE hydrolizy interesującego łańcucha polipeptydowego. Metodami inżynierii genetycznej (mutageneza punktowa) zamieniono w omówionym wyżej plazmidzie sekwencję nukleotydową kodującą miejsce cięcia dla trombiny (LVPR*G) na sekwencję konsensusową (WELQ*G) uzyskując plazmid umożliwiający ekspresję białka fuzyjnego GST-miejsce cięcia proteinazy SplB-stafostatyna A. Białko to wyprodukowano w bakteriach E. coli szczepu BL21 pLysS i oczyszczono wykorzystując powinowactwo białka fuzyjnego GST do immobilizowanego glutationu analogicznie jak opisano Mol Microbiol (2003). 49: 1051-1066 dla białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A. Kontaktując tak przygotowane białko z proteinazą SplB wykazano bardzo szybką hydrolizę łańcucha polipeptydowego (w czasie rzędu kilkunastu minut przy stukrotnym nadmiarze molowym substratu nad proteinazą SplB). Oznacza to, że proteinaza SplB nie jest mało wydajnym katalitycznie enzymem jak sugerowały eksperymenty z trawieniem β-kazeiny. Przeciwnie, dowodzi to, że jest ona enzymem bardzo wydajnym katalitycznie ale jedynie w stosunku do substratów o prawidłowej sekwencji, która jest nieoczekiwanie znacznie bardziej rozbudowana w porównaniu ze znanymi proteinazami trypsynopodobnymi.
PL 213 994 Β1
Ponadto wyizolowano stafostatynę A uwolnioną z białka fuzyjnego przez trawienie proteinazą SplB i oznaczono metodą degradacji Edmana jej N-końcową sekwencję wykazując, że proteinaza SplB tnie specyficznie i precyzyjnie w obrębie rozpoznawanej sekwencji jedynie w określonym * miejscu (WELCTG).
Podobny wynik powinien przynieść eksperyment, w którym sekwencję rozpoznawaną przez proteinazę SplB wg opisu, zwłaszcza sekwencję konsensusową WELQG, umieszcza się pomiędzy „metką” histydynową (His-Tag), lub dowolną inną „metką” a dowolnym interesującym białkiem, lub między dowolnym interesującym białkiem a dowolną metką, by tak samo jak poprzednio uzyskać precyzyjne odcinanie metki od interesującego białka.
Przykład 6. Rola miejsca P1 ’ w rozpoznaniu substratu
Dla wielu specyficznych proteinaz dużą rolę w rozpoznaniu substratu grają nie tylko miejsca P ale także P’ a głównie PT (np. dla trombiny musi to być mały aminokwas (zwykle Gly)). Jest to dość niewygodne gdyż nie pozwala na dowolne kształtowanie N- końca białka po odcięciu metki. Z analizy substratów wyselekcjonowanych w metodzie CLiPS wynika, że w przypadku proteinazy SplB reszta ta nie ma większego znaczenia (na miejscu PT znajdujemy S, G, V, A ale też aminokwasy o dużym łańcuchu bocznym jak E lub M).
Podobny wynik powinien przynieść eksperyment, w którym w białku fuzyjnym GST- miejsce cięcia przez proteinazę SplB - stafostatyna A w pozycji PT umieszcza się różne aminokwasy (np. zamiana sekwencji WELQ*G na WELQ*Q, WELQ*N), by w sposób analogiczny do opisanego w przykładzie 5, potwierdzić brak wpływu wprowadzonej zamiany na szybkość hydrolizy wiązania.
W tym celu, do białka fuzyjnego GST-miejsce cięcia przez proteinazę SplB - stafostatyna A wprowadzono na pozycji PT następujące aminokwasy: E, K, N, Q, L, F, M. W efekcie uzyskano konstrukty zawierające w białku fuzyjnym opisanym w przykładzie 5 w miejsce sekwencji WELQ GS następujące fragmenty sekwencji:
WELQ ES
WELQ KS
WELQ NS
WELQ QS
WELQ LS
WELQ FS
WELQ MS
Wszystkie białka zrekombinowane otrzymane z tych konstruktów były cięte równie wydajnie przez proteinazę SplB potwierdzając brak wpływu miejsca PT na rozpoznawanie i hydrolizę substratu. Miejsce cięcia zaraz za rozpoznawaną sekwencją konsensusową (WELQ) potwierdzono w każdym przypadku przez sekwencjonowanie uwolnionego nowego N-końca białka metodą degradacji Edmana.
Tabela I. Koordynaty struktury trzeciorzędowej proteinazy SplB ze Staphylococcus aureus, oznaczenia: NA- numer porządkowy atomu, A - rodzaj atomu, AK- rodzaj aminokwasu, NAK - numer porządkowy aminokwasu w strukturze pierwszorzędowej, X, Y, Z - koordynaty atomu
PL213 994B1
ΝΑ A AK NAK X Y Z NA A AK NAK X Ϊ Z
i N GLU 1 10.688 39.517 6.273 89 CA ILE 12 23.045 38.511 29.008
2 CA GLU 1 10.569 40.577 7.2Θ8 90 CP TLE 12 21.702 39.218 29.455
3 CB GLU 1 10.333 39.952 8.665 91 CG1 ILE 12 21.029 39.865 28.261
4 CG GLU i 9.837 40.901 9.754 92 CDI ILE 12 19.625 4C.425 28.547
5 CD GLU 1 9.251 40.165 10.946 93 CG2 ILE 12 21.983 40.226 30.542
6 OE1 GLU 1 3.374 39.289 10.757 94 C ILE 12 22.717 37.420 28.001
7 OE2 GLU 1 9.667 40.471 12.083 95 O ILE 12 22.994 37,538 26.795
8 C GLU 1 11.858 41.360 7.274 96 N PHE 13 22.123 36.351 28.496
9 0 GLU 1 12-925 40.827 6,940 97 CA PHE 13 21.724 35.268 27.610
10 N ASN 2 11.763 42.633 7.613 98 CR PHE 13 21 .355 34.321 28.430
11 CA ASN 2 12.949 43.448 7.819 99 CG PHE 13 20.971 32.844 27.592
12 CB ASN 2 13.143 44.442 6.674 100 CDI PHE 13 19.632 32.556 27,322
13 CG ASN 2 14.510 45.115 6.693 101 CE1 PHE 13 19.283 31.462 26,521
14 CDI ASN 2 15.192 45.178 7.728 102 C2 PHE 13 20.251 30.646 25,987
15 ND2 ASN 2 14.926 45.631 5.526 103 CE2 PHE 13 21.614 30.923 26,241
16 c ASN 2 12.789 44.141 9.162 104 CD2 PHE 13 21.958 32.029 27,048
17 0 ASN 2 12.416 45.328 9.242 105 C PHE 13 20.542 35.792 26.787
18 N ASN 3 13.033 43.376 10.222 106 O PHE 13 19.660 36.488 27,352
19 CA ASN 3 12.929 43.887 11.577 107 N PRO 14 20.437 35.414 25,489
20 CB ASN 3 11.732 43.269 12.308 108 CA PRO 14 21.259 34.446 24,695
21 CG ASN 3 11.568 43.811 13.722 109 CB PRO 14 20.313 34.045 23.559
22 OD1 ASN 3 1] .626 44.991 13.985 110 CG PRO 1.4 19.526 35.319 23.294
23 ND2 ASN 3 11.12B 42.953 14.637 111 CD PRO 14 19.357 35.597 24.666
24 C ASN 3 14.232 43.633 12.315 112 C PRO 14 22.523 35.03S 24.111
25 0 ASN 3 14.395 42.625 12.997 113 O PRO 14 23.323 34.295 23.506
2 6 N VAL 4 15.154 44.569 12.147 114 N TYR 15 22.736 36.339 24.304
27 CA VAL 4 16.495 44.448 12.647 115 CA TYR 15 23.S13 37.C51 23.597
28 CB VAL 4 17.501 44.721 11.514 116 CB TYR 15 23.613 38.555 23.694
29 CG1 VAL 4 18.926 44.579 12.001 117 CG TYR 15 22.173 38.891 23.362
30 CG2 VAL 4 17.218 43.B10 10.339 118 CDI TYR 15 21.688 38.763 22.058
31 C VAL 4 16.553 45.484 13.730 119 CE1 TYR 15 20.350 39.033 21.753
32 0 VAL 4 16.344 46.660 13.50B 120 CS TYR 15 19.497 39.423 22.773
33 N THR 5 17.111 45.065 14.908 121 OH TYR 15 18.188 39.684 22.470
34 CA THR 5 17.231 45.982 16.043 122 CE2 TYR 15 19.947 39.551 24.082
35 CB THR 5 16.038 45.834 17,033 123 CD2 TYR 15 21-284 39.273 24.370
36 091 THR 5 16.019 44.513 17.581 124 C TYR 15 25.205 36.659 24.060
37 CG 2 THR 5 14.704 46.067 16.330 125 0 TYR 15 26.195 36.864 23.342
3B C THR 5 18.547 45.772 16.767 126 N THR 16 25.2?: 35.112 25.270
39 O THR 5 19.031 44.642 16.866 127 CA THR 16 26.512 35.543 25.808
40 N LYS 6 19.123 46.856 17.260 128 CB THR 16 26.452 35.379 27.349
41 Cft LYS 6 20.371 46.797 18.306 129 OG1 THR 16 25.250 34.677 27.717
42 CB LYS 6 20.966 48.199 19.161 130 CG2 THR 16 26.478 36.779 27.980
43 CG LYS 6 22.207 49.286 19.024 131 C THR 16 26.973 34 .254 25.110
44 CD LYS 6 22.759 49.707 18.992 132 O THR 16 28.076 33.759 25.400
47 C LYS 6 20.157 46.136 19.366 133 N GLY 17 26.166 33.746 24.173
48 0 LYS 6 19.220 46.465 20.090 134 CA GLY 17 26.599 32.636 23.303
49 N VAL 7 21.038 45.202 19.711 135 c GLY 17 27.200 33.085 21.980
50 CA VAL 7 20.924 44.523 20.986 136 O GLY 17 27.612 32.242 21.177
51 CB VAL 7 21.754 43.195 21.045 137 N VAL 1S 27.246 34.405 21.738
52 CG1 VAL 7 21.655 42.613 22.448 138 CA VAL 19 27.700 34.908 20.465
53 CG2 VAL 7 21.196 42.170 20.048 139 CE VAŁ 13 26.709 36.016 19.994
54 c VAL 7 21.300 45.455 22.126 140 CCI VAL 18 27.257 36.589 18,5B0
55 0 VAL 7 22.444 45.904 22.233 141 CG 2 VAL 18 25.341 35.415 19.687
56 N LYS 8 20.319 45.738 22.983 142 C VAL IB 29.122 35.457 20.571
57 CA LYS 8 20.528 46.643 24.119 143 O VAL 18 29.542 36.050 21.599
58 CB LYS 8 19.201 46.882 24.875 1 44 N VAL '.9 29.894 35.203 19.503
63 C LYS 8 21.612 46.093 25.057 145 CA VAL 19 31.254 35.703 19.397
64 O LYS 8 22.62 9 46.755 25.305 146 CB VAL 19 32.523 34.534 19.460
65 N ASP 9 21.429 44.863 25.546 147 CG1 VAL 19 32.147 33.697 20.733
ο6 CA ASP 9 22.397 44.307 26.498 149 CG 2 VAL 19 32.201 33.660 18.213
67 CB ASP 9 21,740 44,015 27.844 149 C VAL 19 31.455 36.120 18.050
68 CG ASP 9 22.755 43,777 28.947 150 O VAL 19 30.702 36.196 17.068
69 CDI ASP 9 23.926 43.454 28.637 151 K ALA 20 32.464 37.286 18.043
70 CD2 ASP 9 22.391 43.920 30.139 152 CA ALA 20 32.792 38.120 16.685
71 c ASP 9 23.048 43.037 25.940 153 CD ALA 20 32.876 39.58B '.7.315
72 0 ASP 9 22.404 42.015 25.800 154 C ALA 20 34.128 37.741 16.245
73 N THR 1C 24.327 43.136 25.629 155 O ALA 20 35.153 37.687 16.904
74 CA THR 10 25.040 42.046 24.939 156 N PHE 21 34 .090 37.514 14.929
75 CB THR 1 0 26.085 42.628 23.969 157 CA EHE 21 35.281 37.599 14.075
76 OG1 THR 10 26.877 43.598 24.665 158 CB EHE 21 35.088 36.631 12.911
77 CG2 THR 10 25.395 43.294 22.773 159 CG PHE 21 34.989 35.193 13,339
78 C THR 10 25.702 41.075 25.918 160 CDI PHE 21 36.146 34.385 13.393
79 O THR 10' 26.357 40.112 25.504 1 €1 CE1 PHE 21 36.047 33.035 13.801
80 N ASN 11 25.513 41.333 27.218 162 cz EHE 21 34 .784 32.506 14.130
81 CA ASN 11 26.149 40.583 28.306 163 CE2 PHE 21 33.649 33.312 14.091
82 CB ASN 11 26.927 41.530 29.238 164 CD2 PHE 21 33.760 34.651 13.668
86 C ASN 11 25.149 39.726 29.088 165 c PHE 21 35.394 39.055 13.562
87 O ASN 11 25.394 39.312 30.241 166 O EHE 21 34.553 39.887 13.907
88 N ILE 12 24.021 39.431 28.456 167 N LYS 22 36.410 39.359 12.733
PL 213 994 B1
A AK NAK X Y Z NA A AK NAK X Y Z
CA LYS 22 36.596 40.704 12.116 251 N ILE 34 33.306 26.826 19.163
CB LYS 22 37.718 40.669 11.056 252 CA ILE 34 32.368 27.717 18.459
C LYS 22 35.322 41.294 11.5C2 253 CB ILE 34 32.910 29.166 18.4 35
0 LYS 22 34.921 42.431 11.839 254 CG1 ILE 34 34.134 29.314 17.530
N SER 23 34.666 40.535 10.623 255 CDI TLE 34 34.5B1 30.783 17.235
CA SER 23 33.413 41.017 10.031 256 CG2 ILE 34 33.212 29.759 19.311
CB SER 23 33.696 41.760 8.729 257 C TLE 34 32.068 27.161 17.358
OG SER 23 34.054 40.822 7,740 258 C TLE 34 32.816 26.300 16.543
C SER 23 32.444 39.866 9.907 259 N LEU 35 30.923 27.551 16.495
0 SER 23 31.776 39.770 3.769 260 CA LEO 35 30.576 27.230 15.119
N ALA 24 32.366 38.978 10.801 261 CB LEU 35 29.186 26.583 15.051
CA ALA 24 31.463 37,953 10.726 262 OG LEU 35 28.954 25.460 14.090
CB ALA 24 32.085 36.712 9.948 263 CDI LEU 35 29.960 24.312, 14.419
C ALA 24 31.154 37.435 12.172 264 CD2 LEU 35 27.527 24.985 14.255
0 ALA 24 31.710 38.007 13.127 265 C LEU 35 30.567 28.513 14.304
N THR 25 30.278 36.442 12.288 265 O LEU 35 30.199 29.589 14.768
CA THR 25 29.734 35.999 13.559 267 N THR 36 31.024 28.417 13.055
CB THR 25 23.196 36.155 13.529 2 63 CA THR 36 30.840 29.566 12.134
OGl THR 25 27.869 37.496 13.076 2 69 CB THR 36 31.992 30.616 12.197
CG2 THR 25 27.561 35.922 14.929 270 OGl THR 36 31.663 31.784 11.405
C THR 25 30.112 34.523 13.777 271 CG 2 THR 36 33.356 30.000 11.694
0 THR 25 30.394 33.8C8 12.925 272 C THR 36 30.719 28.942 10.740
N GLY 26 30.074 34.062 15.028 273 O THR 36 30.522 27.710 10.640
CA GLY 26 29.965 32.620 15.269 274 N ASN 37 30 .773 29.750 9.672
C GLY 26 29.278 32.455 16.608 275 CA ASN 37 30.744 29.156 8.314
0 GLY 26 28.869 33.445 17.219 276 CB ASN 37 33.149 30.148 7.238
N PHE 27 29.199 31.237 17.118 277 CG ASN 37 28.740 30.615 7.617
CA PHE 27 28.500 31.078 18.399 278 OD1 ASN 37 2Θ.41Ζ 31.794 7.373
CB PHE 27 26.960 31.025 18.211 279 ND2 ASN 37 27.914 29.740 8.118
CG PHE 27 26.472 29.939 17.310 280 C ASN 37 32.150 28.849 7.808
CDI PHE 27 26.108 28.697 17.824 281 0 ASN 3 J 33.112 29.512 8.220
CE1 PHE 27 25.644 27.720 17.015 282 N LYS 38 32.263 27.881 6.870
CZ PHE 27 25.519 27,938 15.626 283 CA LYS 38 33.563 27.630 6.236
CE2 PHE 27 25.867 29.187 15.1C6 284 CB LYS 38 33.476 26.501 5.216
CD2 PHE 2? 26.350 30.157 15.936 285 CG LYS 36 33.184 25.163 5.809
C PHE 27 28.983 29.849 19.128 286 CD LYS 36 32.697 24 .253 4.713
0 PHE 27 29.545 28.944 18.512 297 CE LYS 38 32.468 22.874 5.223
N VAL 28 28.744 29.814 20.432 288 NZ LYS 38 31.657 22.015 4.218
CA VAL 28 29.341 28.760 21.282 2B9 C LYS 38 34.041 28.869 5.532
CB VAL 28 29.472 29.266 22.756 290 O LYS 38 35.229 29.144 5.543
CG1 VAL 28 30.061 28.192 23.651 291 N HIS 39 33.119 29.655 4.952
CG2 VAL 28 3C.362 30.506 22,807 292 CA HIS 39 33.552 30.815 4.168
C VAL 28 28.475 27.517 21.247 293 CB HIS 39 32.458 31.299 3.193
0 VAL 28 27.270 27.598 21.431 294 CG HIS 39 31.335 32.046 3.828
N VAL 29 29.097 26.334 21.068 295 KDl HIS 39 30.077 31.502 3.979
CA VAL 29 28.313 25.092 21.066 296 CE1 HIS 39 29.279 32.413 4.517
CB VAL 29 28.368 24.405 19.679 297 NE2 HIS 39 29.976 33.512 4.716
CG1 VAL 29 27.482 25.221 18.678 298 CD2 HIS 39 31.254 33.318 4.267
CG2 VAL 29 29.831 24.296 19.160 299 C HIS 39 34.072 31.895 5.058
C VAL 29 23.763 24.113 22.161 300 c HIS 39 34.767 32.603 4.607
0 VAL 29 29.094 23.123 22.453 301 N VAL 40 33.761 31.805 6.359
N GLY 30 29.885 24.411 22.770 302 CA VAL 40 34 . 416 32.647 7.358
CA GLY 30 30.387 23.518 23.805 303 CB VAL 40 33.502 32.875 8.592
C GLY 30 31.656 24 .C18 24.411 30-1 CG1 VAL 40 34.228 33.641 9.746
0 GLY 30 32.107 25.123 24.129 305 CG2 VAL 40 32.257 33.586 8.143
N LYS 31 32.306 23.147 25.185 306 c VAL 40 35.776 32.096 7.799
CA LYS 31 33.552 23.532 25.352 307 O VAL 40 36.795 32.809 7.763
CB LYS 31 34.118 22.312 26.593 308 6’ SER 41 35.807 3C.843 8.231
CG LYS 31 35.392 22.633 27.358 309 CA SER 41 37.044 30.291 8.823
CD LYS 31 35.949 21.312 27.929 310 CB SER 41 36.802 28.919 9.443
CE LYS 31 37.189 21.599 28.747 311 OG SER 41 36.231 28.010 8.527
NZ LYS 31 37.531 20.378 29.569 312 C SER 41 38.189 30.201 7.B06
C LYS 31 34.596 24.013 24.852 313 O SER 41 39.353 30.135 8.194
0 LYS 31 34.949 23.254 23.927 314 N LYS 42 37.849 30.206 6.513
N ASN 32 35.107 25-237 25.042 315 CA LYS 42 39.910 30.108 5.531
CA ASN 32 36.114 25.845 24.185 316 CB LYS 42 38.333 29.867 4 . 117
CB ASN 32 37.472 25.158 24.377 317 CG LYS 42 37.6o4 31.042 3.506
CG ASN 32 37.910 25.177 25.B24 318 CD LYS 42 37.411 30.717 2.308
OD1 ASN 32 37.621 26.139 26.561 319 CE LYS 42 36.334 31.603 1.422
ND2 ASN 32 38.544 24.109 26.255 320 NZ LYS 42 36.729 33.035 1.463
C ASN 32 35.797 25.818 22.705 321 c LYS 42 39.837 31.309 5.517
0 ASN 32 36.730 25.901 21.895 322 0 LYS 42 40.996 31.226 5.083
N THR 33 34.527 25.694 22.355 323 N ASN 43 39.351 32.415 6.064
CA THR 33 34.167 25.434 20.942 324 CA ASN 43 40.163 33.613 6.256
CB THR 33 33.800 23.964 20.738 325 CB ASN 43 39.267 34.84C 6.091
OGl THR 33 34.860 23.140 21.266 326 CG ASN 43 38.699 34.922 4.700
CG2 THR 33 33.632 23.650 19.226 327 001 ASN 43 39.337 34 . 500 3.739
C THR 33 33.049 26.295 20.372 323 ND2 ASN 43 37.464 35.440 4 . 588
0 THR 33 31.993 26.432 20.986 329 c ASN 43 40.931 33.700 7.561
PL213 994B1
ΝΑ A AK NAK X Y Z NA A AK NAK X V Z
330 0 ASN 43 41.640 34.685 7.800 409 CD2 HIS 53 29.900 39.050 26.624
331 Ν TYR 44 40.766 32.680 8.403 410 C HIS 53 30.503 40.410 23.375
332 CA TYR 44 41.380 32.640 9.715 411 0 HIS 53 30.140 41.003 24.407
333 CB TYR 44 40.282 32.499 10.799 412 N PRO 54 31.208 41.014 22.392
334 CG TYR 44 39.581 33.816 10,912 413 CA PRO 54 31.604 42.425 22.535
335 CDI TYR 44 40.054 34.799 11.782 414 CB PRO 54 32.485 42.680 21.294
336 CE1 TYR 44 39.450 36.043 11.842 415 CG PRO 54 31.968 41.691 20.246
337 CZ TYR 44 38.381 36.321 11.010 416 CD PRO 54 31.655 40.446 21.100
338 OH TYR 44 37.781 37.580 11.082 417 C PRO 54 30.382 43.355 22.502
339 CE2 TYR 44 37.896 35.369 10.144 418 0 PRO 54 29.368 43.046 21.832
340 CD2 TYR 44 38.500 34.124 10.093 419 N ASN 55 30.493 44.460 23.249
341 C TYR 44 42.385 31.519 9.786 420 CA ASN 55 29.509 45.545 23.220
342 0 TYR 44 42.372 30.645 8.942 421 CB ASN 55 29.217 46.031 24.642
343 N LYS 45 43.222 31.545 10-815 425 C ASN 55 30.063 46.689 22.356
344 CA LYS 45 44.121 30.439 11.052 426 0 ASN 55 31.219 46.647 21.935
345 CB LYS 45 45.518 30.800 10.531 427 N SER 56 29.245 47.710 22.C35
346 CG LYS 45 46.108 32.001 11.242 428 CA SER 56 29.630 48.765 21.126
347 CD LYS 45 47.533 32.302 10.745 429 CB SER 56 28.466 49,744 20.890
348 CE LYS 45 48.226 33.306 11.667 430 OG SER 56 27,245 49.058 20.621
349 NZ LYS 45 47.618 34.698 11.675 431 C SER 56 30,897 49.547 21.530
350 C 1YS 45 44.212 30.222 12.557 432 0 SER 56 31.576 50.134 20.673
35; 0 LYS 45 43.819 31.077 13.346 433 N ASP 57 31.218 49.544 22.827
352 N VAL 46 44.742 29.069 12.932 434 CA ASP 57 32.317 50.355 23.352
353 CA VAL 46 45.187 28.823 14.308 435 CB ASP 57 31,796 51.720 23.632
354 CB VAL 46 45.883 27.426 14.411 439 C ASP 57 33.095 49.647 24.469
355 CG1 VAL 46 46.455 27.200 15.766 440 0 ASP 57 32.705 49.693 25.656
356 CG2 VAL 46 44.904 26.320 14.070 441 N LYS 58 34.173 48.973 24.058
357 C VAL 46 46.117 29.974 14.748 442 CA LYS 58 35.207 48.449 24.966
359 0 VAL 46 47.065 30.366 14.024 443 CB LYS 58 35.63C 49.521 26.001
359 N GLY 47 45.841 30.504 15.943 448 C LYS 58 34.902 47.098 25.647
360 CA GLY 47 46.545 31.646 16.469 449 0 LYS 58 35.796 46.248 25.732
361 C GLY 47 45.863 32.989 16.291 450 N GLY 59 33.667 46.883 26.113
362 0 GLY 47 46.262 33.964 16.930 451 CA GLY 59 33.378 45.702 26.960
363 N ASP 48 44.887 33.077 15.389 452 C GLY 59 33.155 44.394 26.196
364 CA ASP 48 44.088 34.307 15.275 453 0 GLY 59 32.487 44.404 25.149
365 CB ASP 48 43.230 34.309 14.035 454 N ASN 60 33.681 43.276 26.729
366 CG ASP 48 44.028 34.571 12.783 455 CA ASN 60 33.534 41.948 26.086
367 OD1 ASP 48 45.175 35.085 12.879 456 CB ASN 60 34.532 41,846 24.904
368 OD2 ASP 48 43.498 34.235 11.718 457 CG ASN 60 35.984 41.917 25.350
369 C ASP 48 43.152 34.421 16,456 4 56 OD1 ASN 60 36.392 41.201 26,263
370 0 ASP 48 42.951 33,447 17.144 459 ND2 ASN 60 36.780 42.770 24,706
371 N ARG 49 42.527 35.590 16.613 460 C ASN 60 33.708 40.791 27.110
372 CA ARG 49 41.737 35,848 17.809 461 O ASN 60 34,027 41.045 28.263
373 CB ARG 49 42.343 37.017 18.582 462 N GLY 61 33.514 39.540 26.677
374 CG ARG 49 43.592 36.533 19.290 463 CA GLY 61 33.667 38.360 27.557
375 CD ARG 49 44.783 37.415 19.028 464 C GLY 61 35.061 37.740 27 .451
376 NE ARG 49 46-003 36.865 19.623 465 O GLY 61 35.315 36.643 27.924
377 CZ ARG 49 46.839 37.540 20.411 466 N GLY 62 35.964 38.484 26.842
378 NH1 ARG 49 46.616 38.618 20.717 467 CA GLY 62 37.338 38.043 26.679
379 NH2 ARG 49 47,917 36,926 20.883 468 C GLY 62 37.713 37.938 25.218
380 C ARG 49 40,251 36.036 17.523 469 O GLY 62 36.846 37 .365 24.335
381 0 ARG 49 39.848 36.404 16.409 470 N ILE 63 39.019 37.886 24.995
382 N ILE 50 39.424 35.681 18.503 471 CA ILE 63 39.616 37.666 23.672
383 CA ILE 50 37.985 36.000 18.452 472 CB ILE 63 40,591 38.8C3 23.289
384 CB ILE 50 37.060 34.752 18.196 473 CG1 ILE 63 39.807 40.115 23.141
385 CG1 ILE 50 37.132 33.663 19.296 474 CDI ILE 63 40.666 41.323 22.959
386 CDI ILE 50 36.338 33.925 20.613 475 CG2 ILE 63 41.272 38.474 21.965
387 CG2 ILE 50 37.447 34.048 16.894 476 C ILE 63 40.339 36.334 23,746
388 C ILE 50 37.635 36.694 19.760 477 O ILE 63 41.083 36.C92 24.680
389 0 ILE 50 38.339 36.522 20.761 478 N TYR 64 40.059 35.449 22.790
390 N THR 51 36.557 37.473 19.743 479 CA TYR 64 40.546 34,068 22.B17
391 CA THR 51 36.133 38.234 20.926 480 CB TYR 64 39.369 33.105 23.041
392 CB THR 51 36.113 39.742 20.659 481 CG TYR 64 38.678 33.439 24.340
393 OG1 THR 51 37.451 40.114 20.32.6 482 CDI TYR 64 39.104 32.874 25.544
394 CG2 THR 51 35.766 40.479 21.965 483 CE1 TYR 64 38.489 33.207 26.740
395 C THR 51 34.764 37.742 21.330 484 CZ TYR 64 37.451 34,114 25.734
396 0 THR 51 33.894 37.598 20.506 485 OH TYR 64 36.836 34.509 27.915
397 N ALA 52 34.601 37.439 22.616 486 CE2 TYR 64 37.021 34.701 25.569
398 CA ALA 52 33.336 36.903 23.087 487 CD2 TYR 64 37.620 34.358 24.365
399 CB ALA 52 33.535 36.050 24.309 488 C TYR 64 41.280 33.697 21.540
400 C ALA 52 32.398 38.076 23.406 489 O TYR 64 40.938 34.178 20.468
401 0 ALA 52 32.791 39.018 24.087 490 N SER 65 42.279 32.832 21.690
402 N HIS 53 31.180 37.969 22.900 491 CA SER 65 43.130 32.365 20.575
403 CA HIS 53 30.089 3S.950 23.146 492 CB SER 65 44.504 31.982 21.184
404 CB HIS 53 29.099 38.446 24.218 493 OG SER 65 45.431 31.657 20.174
405 CG HIS 53 29.686 38.203 25.588 494 C SER 65 42.504 31.137 19.919
406 ND1 HIS 53 30.017 36.942 26.054 495 0 SER 65 42.039 30.202 20.607
407 CE1 HIS 53 30.444 37.036 27,304 496 N ILE 66 42.453 31.088 18.583
408 NE2 HIS 53 30.381 38.302 27,671 497 CA ILE 66 42.003 29.915 17.903
PL 213 994 B1
A AK NAK X Y Z NA A AK NAK X Y Z
CB ILE 66 41.714 30.237 16 .411 577 Ó LYS 75 2B .367 22.833 1.760
CG1 ILE 66 40.496 31.207 16 .327 578 N GLU 76 27.526 21.421 3,284
CDI ILE 66 40.191 31.666 14 .874 579 CA GLU 76 27.055 22.480 4,189
CG 2 ILE 66 41.396 28.923 15 .662 580 CB GLU 76 26.204 21.864 5.318
C ILE 66 43.021 28.765 18 .024 581 CG GLU 76 24.892 31 ,208 4,762
0 ILE 66 44.196 28.976 17 .758 582 CD GLU 76 25.054 19.758 4.319
N LYS 67 42.578 27.571 18 .424 583 OE1 GLU 76 26.192 19.216 4.324
CA LYS 67 43.503 26.389 18 .506 584 OE2 GLU 76 24.005 19.173 3.967
CB LYS 67 43.577 25.815 19 .948 585 Λ GLU 76 23.145 23.372 4.735
CG LYS 67 42.368 25-092 20 .370 596 0 GLU 76 29.257 22.909 5.068
CD LYS 67 42,601 24.493 21 .754 597 N ASP 77 27.832 24.670 4,831
CE LYS 67 41.373 23.768 22 .323 586 CA ASP 77 28.813 25.725 5.103
NZ LYS 67 41.905 23.005 23 .560 599 CB ASP 77 28.306 27.048 4.480
C LYS 67 43.257 25.294 17 .494 590 CG ASP 77 29.384 28.086 4.250
0 LYS 67 44.131 24.401 17 .257 591 OD1 ASP 77 30.521 27,925 4.763
M LYS 68 42.088 25.280 16 . 878 592 OD2 ASP 77 29.112 29.101 3.582
CA LYS 68 41.769 24.287 15 .868 593 C ASP 77 28.989 25.853 6.647
CB LYS 68 41.333 22.973 16 .525 594 O ASP 7 7 20,567 26.839 7.261
CG LYS 68 41.596 21.719 15 .698 595 N VAL 78 29.616 24.840 7.251
CD LYS 68 41.330 20.400 16 .474 596 CA VAL 78 29.703 24.730 8,710
CE LYS 68 41.533 19.209 15 .514 597 CB VAL 78 28.817 23.564 9,223
NZ LYS 68 41.215 17.878 16 .112 598 CG1 VAL 78 29.094 23.278 10.776
2 LYS 68 40.670 24.797 14 .994 599 CG2 VAL 78 27.344 23.967 6.992
0 LYS €8 39.768 25.465 15 .487 600 C VAL 78 31.141 24.423 9.07C
N ILE 69 40.742 24,448 13 .702 601 C VAL 78 31 .736 23.493 6.503
CA ILE 69 39.675 24.748 12 .715 602 N SER 79 31.706 25.184 10.003
CB ILE 69 40.140 25.815 11 .653 603 CA SER 79 33.070 24.944 10.454
CG1 ILE 69 40.541 27.110 12 .360 604 CB SER 79 33.941 26.044 9,817
CDI ILE 69 41.188 28.224 11 .503 605 CG SER 79 35.276 25.966 10.239
CG2 ILE 69 39.067 26.038 10 .599 606 C SER 79 33.117 24.973 11.983
C ILE 69 39.348 23.433 12 .049 607 O SER 79 32.500 25.852 12.585
0 ILE 69 40.252 22.748 11 .495 609 H VAL 80 33.858 24.040 12.58Θ
N ILE 70 38.088 23.031 12 .130 609 CA VAL 30 34.044 24.010 14.064
CA ILE 70 37.681 21.741 11 , 601 610 CB VAL BO 34.051 22.539 14.584
CB ILE 70 37.272 20.726 12 . 689 611 CG1 VAL 80 34.466 22.489 16.035
CG1 TLE 70 38.328 20.598 13 .787 612 CG2 VAL BO 32.665 21 .910 14.427
CDI ILE 70 37.861 21.152 15 .071 613 C VAL BO 35.363 24.698 14.389
CG2 ILE 70 36.992 19.360 12 .081 614 O VAL 80 36.389 24.406 13.775
C ILE 70 36.477 21.963 10 .738 615 N ILE 81 35.331 25,621 15.942
0 TLE 70 35.402 22.199 11 .250 616 CA ILE 81 36.494 26.372 15.745
N ASN 71 36.641 21.983 9. 423 617 CB ILE 01 36.259 27.903 15.544
CA ASN 71 35.499 22.025 8 . 513 618 CG1 ILE 81 35.722 28.206 14.145
CB ASN 71 35.987 22.385 7. 099 619 CDI ILE 81 36.676 27.853 13.094
CG ASN 71 36.525 23.821 6. 991 620 CG2 ILE 81 37.525 28 . 681 15.00 7
OD1 ASN 71 36.554 24.583 7 . 961 621 C ILE 81 36.693 26.153 17.243
ND2 ASN 71 36.939 24.196 5. 770 622 c ILE 81 35.797 26.49C IB.051
C ASN 71 34.692 20.748 8 . 429 623 N GLN 82 37.827 25.58C 17.626
U ASN 71 35.265 19.632 8 . 437 624 CA CtTiN 92 38.170 25.472 19.073
N TYR 72 33.377 20.891 9. 302 625 CB GLN 92 38.844 24.134 19.3Θ4
CA TYR 72 32.469 19.760 B . 114 626 CG GLN 82 38.051 22.928 18.981
CB TYR 72 31.015 20.236 B . 218 627 CD GLN 82 38.764 21.646 19.374
CG TYR 72 29.993 19.149 7. 932 628 OEl GLN 82 39.895 21.689 19.850
CDI TYR 72 29.979 17.976 8. 686 629 NE2 GLN 82 38.136 20,515 19.120
CEl TYR 72 29.038 16.971 B. 457 630 ς CLN 82 39.097 26.598 19.412
CZ TYR 72 28.114 17.112 7. 455 631 o GLN B2 39.9C2 27.013 18.562
OH TYR 72 27.203 16.093 7. 235 632 K VAL 83 39.0C4 27.082 20.659
CE2 TYR 72 28.087 18.261 6. 675 633 CA VAL 83 39.842 28.144 21.172
CD2 TYR 72 29.030 19.290 6. 924 634 CB VAL 83 39.021 29.425 21.551
C TYR 72 32.680 19.126 6. 719 635 CG1 VAL 83 39.455 30.087 20.263
0 TYR 72 32.611 19.826 5. 729 636 CG2 VAL 83 37.951 29.084 22.61C
N PRO 73 32.965 17.810 6. 657 637 C VAL 83 40.617 27.654 22.399
CA PRO 73 33.037 17.180 5. 341 638 O VAL 83 40.176 26.722 23.070
CB PRO 73 33.818 15.868 5 . 619 639 N GLU 84 41.771 28.253 22.650
CG PRO 73 34.387 16.043 7. 065 640 CA GLU 84 42.471 28.040 23.921
CD PRO 73 33.268 16.626 7. 722 641 CB GLU 04 43.7B0 28.837 23.987
C PRO 73 31.629 16.959 4. 776 642 CG GLU 84 44.947 28.145 23.251
0 PRO 73 30.889 16.057 5. 190 643 CD GLU 04 45.246 26.717 23.778
N GLY 74 31.237 17.833 3 . 857 644 CEl GLU 84 45.090 26.422 25.000
CA GLY 74 29.910 17.767 3 . 26B 645 CE2 GLU 84 45.622 25.868 22.950
c GLY 74 29.673 19.118 2. 611 646 c GLU 81 11.544 28.435 25.056
0 GLY 74 30.491 20.025 2 . 764 647 0 GLU 84 40.893 29.491 24,993
N LYS 75 28.574 19.252 1. 634 648 N GLU 95 41.417 27.547 26.029
CA ŁYS 75 28.286 20.514 1. 163 649 CA GLU 95 40.569 27.766 27.210
CB LYS 75 27.101 20.355 0. 175 6S0 CB GLU 95 40.651 26.536 28.130
CG LYS 75 25.766 20.104 0. 824 651 CG GLU 35 39.573 26.486 29.232
CD LYS 75 24.594 19.932 -0 .116 652 CD GLU 35 39.283 25.087 29.780
CE LYS 75 23.270 20.077 0. 652 653 OE1 GLU 35 39.476 24,053 29.086
NZ LYS 75 22.050 19.684 -0 .133 654 OE2 GLU B5 38.788 25.033 30.912
C LYS 75 28.052 21.691 2. 098 6S5 C GLU 85 40.928 29.032 27.987
PL213 994B1
ΝΑ A AK NAK X Y Z NA A AK NAK X Y Z
656 0 GLU 85 40.033 29.712 28.541 735 O PHE 95 40.075 32.535 30.170
657 Ν ARG 86 42.222 29.351 28.034 736 N ASN 96 38.944 31.938 32.024
658 CA ARG 86 42.717 30.548 28.716 737 CA ASN 96 38.388 30.743 31.386
659 CB ARG 86 44.106 30.345 29.352 738 CB ASN 96 37.901 29.741 32.432
660 CG ARG 86 44.641 31.626 30-051 739 CG ASN 96 37.748 28.353 31.870
661 CD ARG B6 46.065 31.476 30.632 740 ODl ASN 96 36,998 28.131 30.929
662 NE ARG 86 46.463 32.746 31.257 741 ND 2 ASN 96 38.445 27.401 32.454
663 CZ ARG 86 46.162 33.093 32.513 742 c ASN 96 37.260 31.071 30.427
664 NE1 ARG 86 45.478 32.264 33.296 743 0 ASN 96 36.230 31.614 30.830
665 NH2 ARG 86 46.546 34.267 32.995 744 N PHE 97 37.446 30.701 29.160
666 C ARG 86 42.737 31.742 27.781 745 CA PHE 97 36.436 30.880 28.116
667 0 ARG 86 43.477 31.757 26.766 746 CB PHE 97 36.835 29.997 26.906
668 N ALA 87 41.915 32.750 28.123 747 CG PHE 97 35.867 30.057 25.749
669 CA ALA 87 41.866 34.012 27.371 748 CDI PHE 97 35.813 31.184 24.915
670 CB ALA 87 40.861 35.017 27.996 749 CEl PHE 97 34.895 31.204 23.817
671 c ALA 87 43.221 34.666 27.204 750 cz PHE 97 34.077 30.109 23.576
672 0 ALA S7 44.070 34.631 28.112 751 CE2 PHE 97 34.127 28.991 24.427
673 N ILE 88 43.406 35.270 26.030 752 CD2 PHE 97 35.032 20.980 25.482
674 CA ILE 88 44.512 36.184 25.791 753 C PHE 97 35.081 30.439 28.596
675 CB ILE 88 44.633 36.544 24.261 754 O PHE 97 34.087 31.153 28.428
676 CG1 ILE 88 44.833 35.272 23.431 755 N ASN 98 35.047 29.256 29,221
677 CDI ILE 88 45.976 34.312 23.950 756 CA ASN 98 33.797 28.620 29.557
678 CG2 ILE 88 45.743 37.582 23.992 757 CB ASN 98 34.040 27.160 29.832
679 C ILE 68 44.251 37.425 26.652 758 CG ASN 98 34.743 26.504 28.662
680 O ILE 88 45.148 37.919 27.342 759 ODl ASN 98 34.188 26.453 27.546
681 N GLU 89 43.014 37.916 26.612 760 ND2 ASN 98 35.996 26.119 28.868
682 CA GLU 89 42.575 39.003 27.490 761 C ASN 98 33.027 29.272 30.689
683 CB GLU 89 42.258 40,261 26.695 7 62 O ASN 98 31.840 28.995 30.863
684 CG GLU 89 43.507 40.865 26.047 7 63 N ASP 99 33.733 30.072 31.466
685 GD GLU 89 43.225 42.087 25.211 7 64 CA ASP 99 33.089 30.857 32.555
686 OSI GLU 89 42.225 42.803 25.503 765 CB ASP 99 34.121 31.186 33.616
687 OE2 GLU 89 44.018 42.331 24.262 766 CG ASP 99 34.529 29.980 34.431
688 c GLU 89 41.358 38.527 28.267 767 ODl ASP 99 33.704 29.035 34.655
689 0 GLU 89 40.396 38.081 27.669 768 OD2 ASP 99 35.690 29.971 34.Θ79
690 N ARG 90 41.433 38.584 29.598 769 c ASP 99 32.475 32.136 32.006
691 CA ARG 90 40.378 38.046 30.473 770 0 ASP 99 31.648 32.768 32.679
692 CB ARG 90 40.702 38.115 31.967 771 N ASN 100 32.877 32.530 30.709
693 CG ARG 90 40.658 39.490 32.648 772 CA ASN 100 32.458 33.820 30.232
694 CD ARG 90 41.204 39.387 34.097 773 CB ASN 100 33.656 34.538 29,629
695 NE ARG 90 40.267 38.800 35.070 774 CG ASN 100 34.508 35.176 30.653
696 CZ ARG 90 40.597 38.086 36.166 775 ODl ASN 100 34.178 36.245 31.178
697 NH1 ARG 90 39.640 37.642 36.988 776 ND2 ASN 100 35.644 34.547 30.943
69S ΝΗΞ ARG 90 41.862 37,787 36.457 777 c ASN 100 31.378 33.720 29,171
699 c ARG 90 39.023 38.694 30.257 778 0 ASN 100 30.838 34.738 28,762
700 0 ARG 90 38.914 39.845 29.789 779 N VAL 101 31,090 32.509 28.697
701 N GLY 91 37.983 37.930 30.547 780 CA VAL 101 30.135 32.307 27.635
702 CA GLY 91 36.635 38.474 30.570 781 CB VAL 101 30.863 31.866 26.311
703 C GLY 91 36.291 38.863 32.003 782 CG1 VAL 101 31.962 32.812 25.927
704 0 GLY 91 37.138 38,745 32.926 783 CG2 VAL 101 31.424 30.381 26.485
705 N PRO 92 35.068 39.360 32.205 784 C VAL 101 29.104 31.263 27.998
706 CA PRO 92 34.661 39.755 33.564 785 O VAL 101 29.296 30.471 28.953
707 Cd PRO 92 33.282 40.419 33.344 786 N THR 102 28.013 31.227 27.224
708 CG PRO 92 33.349 40,885 31.940 787 CA THR 102 26.924 30.307 27 , 444
709 CD PRO 92 34.022 39.707 31.228 788 CB THR 102 25.645 31.045 27.917
710 C PRO 92 34.582 38.592 34.535 789 OGl THR 102 25.304 32.054 26.945
711 O PRO 92 34.621 38.810 35.760 790 CG2 THR 102 25.877 31.735 29.262
712 N LYS 93 34.484 37.368 34.014 791 c THR 102 26.614 29.600 26.123
713 CA LYS 93 34.425 36.179 34.844 792 0 THR 102 26.143 30.233 25.195
714 CB LYS 93 33.242 35.294 34.444 793 N PRO 103 26.872 28.294 26.036
715 CG LYS 93 31.881 35,983 34.587 794 CA PRO 103 26.547 27.494 24.844
716 CD LYS 93 30.743 34.991 34.310 795 CB PRO 103 27.016 26.064 25.235
717 CE LYS 93 30.572 33.989 35.450 796 CG PRO 103 28.020 26.277 26.324
718 NZ LYS 93 30.525 32.535 35.018 797 CD PRO 103 27.528 27.495 27.092
719 C LYS 93 35.766 35.407 34.788 798 C PRO 103 25.046 27.440 24.560
720 0 LYS 93 35.824 34.225 35.098 799 O PRO 103 24.232 27.489 25.505
721 N GLY &4 36.827 36.122 34.446 800 N PHE 104 24.669 27,307 23.295
722 CA GLY 94 38.175 35.601 34.534 801 CA PHE 104 23.277 27.081 22.945
723 C GLY 94 38.703 35.093 33.195 802 CB PHE 104 22.998 27.633 21.536
724 0 GLY 94 38.155 35.398 32.145 803 CG PHE 104 23.078 29.139 21.463
725 N PHE 95 39.784 34.333 33.271 804 CDI PHE 104 22.131 29,929 22.112
726 CA PHE 95 40.474 33-849 32.078 805 CEl PHE 104 22.222 31.333 22.058
727 CB PHE 95 41.941 33.523 32.397 806 CZ PHE 104 23.262 31.960 21.383
728 CG PHE 95 42.804 34.727 32.401 807 CE2 PHE 1D4 24.208 31.192 20.757
729 CDI PHE 95 43.291 35.235 31.204 808 CD2 PHE 104 24.110 29.768 20.816
730 CEl PHE 95 44.080 36.400 31.173 809 C PHE 104 22.863 25.618 23.017
731 CZ PHE 95 44.365 37.063 32.352 Θ10 O PHE 104 23.667 24.735 22.817
732 CE2 PHE 95 43.874 36.579 33.559 811 N LYS 105 21.583 25.403 23.263
733 CD2 PHE 95 43.085 35.409 33.591 812 CA LYS 105 20.941 24.106 23.229
734 C PHE 95 39.805 32.709 31.354 813 CB LYS 105 19.981 24.015 24.426
PL 213 994 Β1
NA A AK NAK X Y Z 698 CA LYS 117 15.878 35.522 15.289
814 CG LYS 105 18.987 22.837 24.458 699 CB ŁYS 117 15.929 36.175 16.6Θ2
815 CD LYS 105 17,790 23.152 25.344 900 CG LYS 117 16.217 35.196 27.815
818 C LYS 105 20-155 24.015 21.925 901 CD LYS 117 15.916 35.800 19.208
819 0 LYS 105 19.518 24.994 21.501 902 CE LYS 117 14.580 35.300 19.740
820 N TYR 106 20.150 22.834 21.319 903 NZ LYS 117 14.530 35.544 21.203
821 CA TYR 106 19.346 22.613 20*121 904 U LYS 117 17.262 35.114 14.842
822 CB TYR 106 19.639 21.241 19.498 905 0 LYS 117 17.752 34.019 15.201
823 CG TYR 106 21.025 21.069 18.931 906 N VAL 118 17.868 36.004 14.067
824 CDI TYR 106 21.525 21.922 17*942 907 CA VAL 118 19.235 35.874 13.589
825 C21 TYR 106 22.822 21.743 17.403 908 CB VAL 118 19.339 36*087 12.045
826 cz TYR 106 23.584 23.683 17.840 909 CGl VAL 118 20.792 35*799 11.555
827 OH TYR 106 24.325 20.4ac 17.326 910 CG2 VAL 118 18.3C5 35.193 11*344
828 CE2 TYR 106 23.096 19.524 18.818 911 c VAL 118 20.028 36.926 14.311
629 CD2 TYR 106 21.841 20,021 19.358 912 0 VA1. 118 19.752 38.136 14.179
630 C TYR 106 17.871 22.629 20.438 913 N ILE 119 21.001 36.481 15.106
831 c TYR 106 17.433 21*995 21.409 914 CA ILE 119 21.781 37.397 15.937
832 N ALA 107 17.110 23.303 19.577 915 CB ILE 119 21.754 36.982 17.453
833 CA ALA 107 15.670 23*130 19.492 916 CG1 ILE 119 20.324 36.862 17.944
834 CB ALA 107 15.092 24.112 10.468 917 CDI ILE 119 20.186 35.972 19.208
835 C ALA 107 15.300 21.685 19.120 918 CG2 ILE 119 22.613 37.924 18.310
836 0 ALA 107 16.093 20.963 16.498 919 C ILE 119 23.233 37.444 15.467
837 N ALA 108 14.095 21.261 19.497 920 0 TLE 119 23.887 36,408 15.363
838 CA ALA 108 13.584 19.950 19.090 921 N GI.Y 120 23.734 38.647 15.213
839 CB ALA 103 12.249 19.684 19.733 922 CA GLY 120 25.102 38.805 14 .742
840 C ALA 109 13.455 19.B81 17.574 923 C GLY 120 25.459 40.236 14.444
841 0 ALA 108 13.612 18.814 16.975 924 0 GLY 120 24.Θ46 41.165 14.986
842 N GLY 109 13.186 21.023 16.961 925 N TYR 121 26. 428 40.407 13.548
843 CA GLY 109 13.022 21.102 15.519 926 CA TYR 121 27.017 41.703 13.281
844 C GLY 109 12,616 22.494 15.132 927 CB TYR 121 28*494 41.642 13.62 9
845 0 GLY 109 12.702 23.432 15.921 928 CG TYK 121 28*729 41.169 15.027
846 N ALA 110 12.167 22.643 13.896 929 CDI TYR 121 28.623 42.054 16.108
847 CA ALA 110 11.661 23.928 13.459 930 CE1 TYR 121 28.830 41.633 17.418
84 8 CB ALA 110 12.799 24.854 13.008 931 CZ TYR 121 29.116 40.293 17.660
849 C ALA 110 10.657 23.684 12.351 932 CH TYR 121 29.261 39*895 18.959
850 0 ALA 110 10.773 22.715 11.624 933 CE2 TYR 121 29.211 39.392 16.619
951 N LYS 111 9.658 24.556 12.250 934 CD2 TYR 121 29.011 39.821 15.298
852 CA LYS 111 9.631 24.387 11.233 935 C TYR 121 26.627 42.161 11.821
653 CB LYS 111 7.388 23.659 11.8(P 936 0 TYR 121 27.760 42.C99 11.033
854 CG LYS 111 6.526 24.519 12.735 937 K PRO 122 25.615 42.587 11.449
858 C LYS 111 8.303 25.731 10.585 938 CA PRO 122 25.402 42.888 10.020
859 0 LYS 111 8.431 26.793 11-216 939 CB PRC 122 23.881 43.001 9.903
860 tJ ALA 112 7.954 25.663 9.297 940 CG PRO 122 23.432 43,427 11.272
861 CA ALA 112 7.393 26.783 8.546 94L CD PRO 122 21.387 42,763 12,243
862 CB ALA 112 6.771 26.274 7.256 942 C PRO 12 2 2 6.111 44,148 9.463
8 63 C ALA 112 6.363 27.533 9.376 943 0 PRO 122 26.053 44.380 8*249
864 0 ALA 112 5.526 26.918 10.058 944 N HTS 123 2 6.7 83 44.930 13.319
865 N GLY 113 6.453 28.852 9.366 945 CA HIS 123 27,455 46.185 9.909
B66 CA GLY 113 5.519 29.675 10.149 946 CB HIS 123 26. 616 47.3Θ3 10.345
867 C GLY 113 6.086 30.209 11.446 947 CG HIS 123 25.171 47.299 9.957
868 0 GLY 113 5.Θ41 31.357 11.809 948 KD1 HIS 123 24.151 47.3B6 10.880
869 N GLU 114 6.876 29.401 12.159 949 CE1 HIS 123 22.986 47.290 10.260
870 CA GLU 114 7.423 29.893 13.425 950 NE2 HIS 123 23.213 47.154 8.965
871 CB GLU 114 e .022 28.748 14.262 961 CD2 HIS 123 24.572 47.160 8.748
872 CG GLU 114 9.495 28.425 14.000 952 C HIS 123 28.880 46.327 10.4S6
873 CD GLU 114 9.979 27.343 14.932 953 0 HIS 123 29.033 46.460 11.715
874 OE1 GLU 114 9,640 26.155 14.592 954 N PRO 12 4 2 9.927 46.348 9.639
875 OE2 GLU 114 10.430 27.683 16.037 955 CA PRO 124 31.306 46.112 13.11S
876 c GLU 114 8.391 31-051 13.231 956 CB PRO 124 31.955 45.432 Θ.906
877 0 GLU 114 9.001 31.199 12.157 957 CG PRO 124 31.245 46.082 7.69 0
878 N ARG 115 8.494 31.908 14.248 958 CD PRO 124 29.901 46.609 8.181
879 CA ARG 115 9.347 33.094 14.179 959 C PRO 124 32.135 47.351 10.503
880 CB ARG 115 9.696 34.288 14.886 960 0 PRO 124 33.344 47.375 10.237
881 CG ARG 115 7.450 34.815 14.145 961 N TYR x25 31.501 48.335 11.143
982 CD ARG 115 6.817 36.023 14.851 9 62 CA TYR 125 32.085 49.672 11.400
883 NE ARG 115 7.690 37.203 14.953 963 CB TYR 125 31.018 50.580 12.037
884 cz ARG 115 8.099 37.925 13.918 964 CG TYR 125 29.973 49.824 12.827
885 NH1 ARG 115 7.744 37.579 12.687 971 C TYR 125 33.426 49.756 12.180
886 KH2 ARG 115 8.886 33.975 14.107 972 0 TYR 125 34.074 48.736 12,440
887 C ARG 115 10.743 32.833 14.760 973 N LYS 126 33-829 50.989 12.523
883 0 ARG 115 10.374 32.237 15.325 974 CA LYS 126 35.069 51.307 13.273
869 N ILE 116 11.772 33.282 14*052 975 CB LYS 126 34*767 51.671 14.740
890 CA ILE 116 13.137 33.055 14.530 976 CG LYS 126 33.652 52.710 14.944
891 CB ILE 116 13.883 32*051 13.597 960 C LYS 126 36,265 50.314 13-076
892 CG1 ILE 116 13.753 32.453 12.105 961 0 LYS 126 36.80-4 50.273 11.960
893 CDI ILE 116 14.584 33.682 11.737 982 N ASN 127 36.727 49.542 14.077
894 CG2 ILE 116 13.320 30.660 13.775 983 CA ASN 127 36*367 49.613 15.497
B95 C ILE 116 13.845 34.392 14*707 988 c ASN 127 35.156 48.785 15.943
396 0 ILE 116 13.292 35.463 14.400 939 0 ASN 127 35.008 47.603 15.591
897 N LYS 117 15.050 34.356 15.247 990 N LYS 12B 34.316 49.450 16.741
213 994
A AK NAK X Y Z NA A AK NAK X Y Z
CA LYS 129 33.058 48.947 17.324 1074 CG1 VAL 138 11.2C2 27.816 9.037
CB LYS 129 32.048 bC.102 17.400 1075 CG 2 VAL 138 11*669 29.305 10.953
C LYS 129 32.3B9 47.721 16.678 1076 C VAL 138 9.7 6C 30.007 7*661
0 LYS 128 32.064 47.715 15.486 1077 O VAL 138 8.534 29.850 7.777
N TYR 129 32.213 46.678 17.484 1078 N MET 139 10.399 29.94B 6.489
CA TYR 129 31.340 45.566 17.135 1079 CA MET 139 9.693 29.682 5.229
CB TYR 129 31.BID 44.278 17.807 1080 03 MET 139 10.335 30.453 4,0?S
CG TYR 129 33.169 43.756 17.400 1081 CG MET 139 10,555 31.920 4.382
CDI TYR 129 33.367 43.195 16.140 1002 SD MET 13 9 9.036 32.905 4.502
CE1 TYR 129 34.600 42.698 15.755 1083 CS MET 139 8.073 32.220 5.8C0
CZ TYR 12 9 35.658 42.735 ' 6.642- 1004 c MET 139 9.613 28.216 4.902
OH TYR 129 36.876 42.229 16.245 1085 0 MET 139 8.574 27.741 4.441
CE2 TYR 12 9 35.495 43.281 17.916 1086 N SER 140 10.699 27.470 5.158
CD2 TYR 129 34.240 43.785 18.282 1097 CA SER 140 10.716 26.030 4.940
C TYR 129 29.974 45.918 17.704 1098 CB SER 140 10.887 25.721 3.455
C TYR 12 9 29.B56 46,215 18.894 1099 OG SER 140 12.003 26.439 2.963
N VAL 130 28.944 45.896 16.874 1090 C SER 140 11.873 25.367 5.669
CA VAL 130 27.606 46,192 17.342 1091 O SER 140 12 .867 26.019 6.001
CB VAL 130 27.049 47.522 16.732 1092 N VAL 141 11.713 24.068 5.900
CG1 VAL 130 25.711 47.847 17.309 1093 CA VAL 141 12.7B9 23.216 6.428
CG2 VAL 130 28.030 48.660 16.927 1094 CB VAL 141 12.564 22.873 7.916
0 VAL 130 26.685 45.023 17.013 1095 CG1 VAL 141 13.592 21.816 8.396
0 VAL 130 26.436 44.704 15.845 1096 CG2 VAL 141 12.618 24.141 8.761
N LEU 131 26.168 44.380 16.052 1097 C VAL 141 12.857 21.949 5.594
CA LEU 131 25.333 43.212 17.857 1098 O VAL 141 11 .881 21,189 5.526
CB LEU 131 25.33C 42.363 19.134 1099 N GLU 142 13.998 21.714 4.960
CG LEU 131 24.819 40.941 18.972 1100 CA GLU 142 14.167 20.557 4.124
CDI LEU 131 25.813 40.167 18.095 1101 CB GLU 142 13.900 20.949 2.674
CD2 LEU 131 24.684 40.303 20.372 1102 CG GLU 142 13.913 19.764 1.703
C LEU 131 23.921 43.601 17.491 1106 C GLU 142 15.595 20.026 4,293
0 LEU 131 23.338 44.497 18.121 1107 O GLU 142 16.565 20.731 3.984
N TYR 132 23.359 42.943 16.485 1108 N GLY 143 15.712 18,814 4.826
CA TYR 132 21.970 43.153 16.126 1109 CA GLY 143 17.023 18.253 5.185
CB TYR 132 21.834 43.698 14.694 1110 C GLY 143 17.884 19.251 5.952
CG TYR 132 22.235 45.145 14.560 1111 O GLY 143 17.493 19.744 7.000
CDI TYR 132 21.265 46.141 14.361 1112 M SER 144 19.060 19.549 5.421
CE1 TYR 132 21.610 47.463 14.246 1113 CA SER 144 19.933 20.450 6.103
CZ TYR 132 22.943 47.909 14.269 1114 CB SER 144 21.434 20.038 5.834
OH TYR 132 23.300 49.130 14.155 1'. 15 OG SER 144 21.732 20.215 4.451
CE2 TYR 132 23.927 46.848 14.466 1116 C SER 144 19.740 21.919 5.742
CD2 TYR 132 23.559 45.520 14.588 1117 O SER 144 20.564 22.778 6.026
C TYR 132 21.209 41.873 16.221 1118 N SER 145 18.606 22.214 5.101
0 TYR 132 21.808 40.794 16.225 1119 CA SER 145 18.340 23.592 4.718
N GL U 133 19.892 42.000 16.345 1120 CB SER 145 18.037 23.721 3.213
CA GL U 133 18.961 40.894 16.270 1121 CG SER 145 17.777 25.103 2.951
CB GLU 133 18.218 40.743 17.599 1122 C SER 145 17.191 24.173 5.500
CG GLU 133 17.224 39.610 17.642 1123 O SER 145 16.106 23.618 5.496
CD GLU 133 16.815 39.267 19.075 1124 N ILE 146 17.443 25.292 6.169
OE1 GLU 133 17.673 39.351 19.981 1125 CA ILE 146 16.363 26.067 6.789
OE2 GLU 133 15.633 38.897 19.284 1126 CR ILE 146 16.432 26.142 8.374
c GLU 133 17.981 41.167 15.139 1127 CG1 ILE 146 15.193 26.924 8.912
0 GLU 133 17.387 42.271 15.065 1128 CDI ILE 146 15.025 26.913 10.472
N SER 134 17.813 40.183 14.260 1129 CG2 ILE 146 17.746 26.788 8.854
CA SER 134 16.905 49.303 13.102 1130 C ILE 146 16.336 27.427 6.141
CB SER 134 17.682 40.295 11.767 1131 O ILE 146 17.375 28.118 6.017
OG SER 134 16.783 40.127 10.678 1132 N VAL 147 15.131 27.B06 5.702
C SER 134 15.870 39.212 13.121 1133 CA VAL 147 14.926 29.071 5.026
O SER 134 16.215 33.025 13.207 1134 CB VAL 147 14.337 28.846 3.588
N THR 135 14.579 39.587 13.051 1135 CG1 VAL 147 14.176 3C.187 2.873
CA THR 135 13.504 38.612 13.225 1136 CS2 VAL 147 15.248 27.910 2.767
CB THR 135 12.513 39.042 14.334 1137 C VAL 147 14,015 29.987 5.855
OG1 IHR 135 11.845 40.239 13.916 1138 O VAL 147 13.019 29.541 6.380
CG2 THR 135 13.241 39.299 15.630 1139 N TYR 148 14.390 31.250 5.979
C THR 135 12.717 38.307 11.952 1140 CA TYR 148 13.637 32.178 6.807
O THR 135 12.720 39.095 10.997 1141 CB TYR 148 14.198 32.227 8.248
N GLY 136 12.071 37,151 11.928 1142 CC TYR 143 15.717 32.119 8.302
CA GLY 136 11.275 36.746 10.772 1143 CDI TYR 148 16.526 33.249 8.243
C GLY 136 10.772 35.335 1O.B00 1144 CE1 TYR 148 17,904 33.150 8.259
O GLY 136 11.254 34.524 11.606 1145 CZ TYR 148 18.487 31.392 8.357
N PRO 137 9.804 35.005 9,915 1146 OH TYR 148 19.850 31.775 8.355
CA PRO 137 9.256 33.674 9.905 1147 CE2 TYR 148 17.732 3C.765 8.415
CB PRO 137 7.911 33.845 9,180 1148 CD2 TYR 148 16.337 30.973 8.383
CG PRO 137 8.131 34.944 8.277 1149 C TYR 148 13.654 33.552 6.188
CD PRO 137 9.178 35.854 8.885 1150 O TYR 148 14.661 34.014 5.618
C ERO 137 10.115 32.678 9.151 1151 N SER 149 12.539 34.244 6.333
0 PRO 137 10.774 33.032 8.162 1152 CA SER 149 12.504 35.599 5.819
N VAL 133 10.093 31.439 9.634 1153 CB SER 149 11.152 35.886 5.164
CA VAL 138 10.627 30.285 8.900 1154 OG SER 149 11.188 37.127 4.645
CB VAI, 138 10.726 29.026 9.812 1155 C SER 149 12.339 36.625 6.901
PL 213 994 Β1
NA A AK NAK X Y Z NA A ΛΚ NAR X Y Z
1156 0 SER 149 11.955 37.251 7.498 1235 O VAL 161 18.740 29.392 15.510
1157 N ALA 150 14.130 36.815 7.123 1236 N LEU 162 17.833 31.371 16.113
1158 CA ALA 150 14.617 37.739 8.110 1237 CA LEU 162 17.222 30.865 17.345
1159 CB ALA 150 15.109 36.972 9.345 1238 CB LEU 162 17.651 31.731 18.539
1160 C ALA 150 15.755 38.487 7.456 1239 CG LEU 162 19.122 31.862 18.951
1161 0 ALA 150 16.581 37.880 6.789 1240 CDI LEU 162 19.254 32.588 20.288
1162 M HIS 151 15.813 39.799 7.626 1241 CD2 LEU 162 19.841 30.505 19.026
1163 CA HIS 151 16.847 40.568 6.957 1242 C LEU 162 15.708 30.885 17.242
1164 CB HIS 151 16.521 42.068 6.966 1243 O LEU 162 15.147 31.746 16.533
1165 CG HIS 151 17.523 42.890 6.224 1244 N ASN 163 15.050 29.959 17.923
1166 ND1 HIS 151 17.444 43.104 4.862 1245 CA ASN 163 13.573 30.031 18.032
1167 CE1 HIS 151 18.456 43.857 4.480 1246 CB ASN 163 12.959 28.656 18.161
1168 NE2 HIS 151 19.196 44.130 5.541 1247 CG ASN 163 13.286 27.966 19.490
1169 CD2 HIS 151 18.630 43.540 6.64 4 1248 OD1 ASN 163 13.723 28.611 20,438
1170 C HIS 151 18.253 40.351 7.508 1249 ND2 ASN 163 13.059 26.645 19.556
1171 0 HIS 151 18.481 40.478 8.706 1250 C ASN 163 13.123 30.988 19.141
1172 N THR 152 19.197 40.C52 6.608 1251 0 ASN 163 13.945 31.699 19.721
1173 CA THR 152 20.604 39.836 6.970 1252 N SER 164 11.805 31.046 19.397
1174 CB THR 152 20.963 38.321 6.935 1253 CA SER 164 11.263 32,019 20.375
1175 051 THR 152 20.607 37.770 5.656 1254 CB SER 164 9.766 32.066 20.325
117 6 CG2 THR 152 20.165 37.575 7.994 1255 OG SER 164 9.249 30.768 20.363
1177 C THR 152 21.575 40.574 6.056 1256 C SER 164 11.760 31.729 21.799
1178 0 THR 152 21.224 40.997 4.926 1257 O SER 164 11.821 32.631 22.644
1179 N GLU 153 22.784 40.833 6.563 1258 N ASN 165 12,142 30.481 22.043
neo CA GLU 153 23.890 41.345 5.780 1259 CA ASN 165 12.711 30.123 23.318
1181 CB GLU 153 24.333 42.703 6.306 126C CB ASN 165 12.139 28.801 23.812
1182 CG GLU 153 23.265 43.830 6.178 1261 CG ASN 165 12.441 28.589 25.281
1183 CD GLU 153 22.814 44.137 4.740 1262 OD1 ASN 165 12.424 29.547 26.057
1184 OE1 GLU 153 23.563 43.838 3.779 1263 ND2 ASN 1 65 12.783 27.371 25.653
1185 OE2 GLU 153 21.696 44.700 4.573 1264 c ASN 165 14.254 30.125 23.351
1186 C GLU 153 25.063 40.353 5.827 1265 0 ASN 165 14.884 29.565 24.260
1187 0 GLU 153 24.998 39.358 6.545 1266 N ASN 166 14.852 30.775 22.359
1180 N SER 154 26.134 40.633 5.089 1267 CA ASN 166 16.300 30.974 22.293
1189 CA SER 154 27.242 39.681 4.990 1268 CB ASN 166 16.821 31.814 23.482
1190 CB SER 154 28.302 40.158 4.001 1269 CG ASN 166 16.438 33.291 23.356
1191 OG SER 154 29.000 41.261 4.517 12/0 OD1 ASN 166 16.334 33.815 22.246
1192 C SER 154 27.873 39.367 6.356 1271 ND2 ASN 166 16.199 33.956 24.492
1193 0 SER 154 28.288 38.230 6.583 1272 C ASN 1Ć6 17.076 29.676 22.137
1194 N GLY 155 27.941 40.376 7.237 1273 O ASN 166 18.220 29.603 22,548
1195 CA GLY 155 28.390 40.207 8.618 1274 N GLU 167 16.423 28.663 21,576
1196 C GLY 155 27.626 39.171 9.442 1275 CA GLU 167 17,071 27.397 21.263
1197 0 GLY 155 28.139 38.732 10.481 1276 CB GLU 167 16.129 26.211 21.445
1198 N ASN 1.56 26.416 38.805 9.020 1277 CG GLU 167 15.478 26.204 22.842
1199 CA ASN 156 25.636 37.752 9.696 1273 CD GLU 167 14.256 25.339 22.941
1200 CB ASN 156 24.146 37.786 9.333 1279 OE1 GLU 167 13.603 25.063 21.901
1201 CG ASN 156 23.376 38.872 10.099 1280 OE2 GLU 167 13.936 24.935 24.080
1202 OD1 ASN 156 22.871 39.825 9.486 1281 C GLU 1 67 17,531 27.458 19.816
1203 KD2 ASN 156 23.345 38.776 11.454 1282 O GLU 167 16.913 28.136 18.963
1204 C ASN 156 26.156 36.327 9.426 1283 N LEU 168 18.622 26.749 19.538
1205 O ASN 156 25.627 35.372 10.010 1284 CA LEU 168 19.244 26.785 18.230
1206 N SER 157 27.071 36.181 8.461 1285 CB LEU 168 20.674 26.197 1Θ .403
1207 CA SER 157 27.749 34.892 8.231 1286 OG LEU 168 21.662 26.327 17.291
1208 CB SER 157 29.046 35.134 7.467 1287 CDI LEU 168 21.999 27.7B5 16.934
1209 OG SER 157 28.723 35.358 6.083 12ΘΒ CD2 LEU 168 22.903 25.546 17.775
1210 C SER 157 28.089 34.311 9.594 1289 2 LEU 168 18.486 25.998 17.160
1211 O SER 157 28.762 34.958 10.387 1290 0 LEU 168 18.188 24.792 17.339
1212 N GLY 158 27.626 33.102 9.844 1291 N VAL 169 18.148 26.672 16.055
1213 CA GLY 158 27.97B 32.389 11.095 1292 CA VAL 169 17.502 26.001 14.922
1214 C GLY 158 27.033 32.675 12.246 1293 CB VAL 169 16.092 26.546 14.531
1215 O GLY 158 27.190 32.106 13.324 1294 CGl VAL 169 15.096 26.348 15.717
1216 K SER 159 26.003 33.517 12.028 1295 CG2 VAL 169 16.141 27.965 14.084
1217 CA SER 159 25.011 33.799 13.089 1296 s VAL 169 18.339 25.938 13.653
3 21B CB SER 159 24.045 34.924 12.638 1297 0 VAL 169 17.998 25.167 12.747
1219 OG SER 159 24.76= 36.155 12.500 1298 N GLY 170 19.366 26,749 13.561
1220 C SER 159 24.168 32.600 13.538 1299 CA GLY 170 20.295 26,641 12.427
1221 0 SER 159 23.716 31.826 12.738 1300 c GLY 170 21.426 27.617 12.557
1222 N PRO 160 23.891 32.487 14.866 1301 0 GLY 170 21.529 28.315 13.566
1223 CA PRO 160 22.909 31.501 15.288 1302 N ILE 171 22.346 27.610 11.574
122 4 CB PRO 160 22.979 31.553 16.839 1303 CA ILE 171 23.411 28.623 11.500
1225 CG PRO 160 23.50C 33.009 17.143 1304 CB ILE 171 24 . Θ54 28.023 11.647
1226 CD PRO 160 24.42C 33.313 15.973 1305 CGl ILE 171 25.938 29.079 11.407
1227 C PRO 160 21.571 32.006 14.833 1306 CDI ILE 171 27.370 28.574 11-711
1228 O PRO 160 21.34C 33.229 14.841 1307 CG2 ILE 171 25.019 26.723 10.836
1229 N VAL 161 20.713 31.067 14.484 1308 C ILE 171 23.305 29.324 10.147
1230 CA VAL 161 19.32C 31.310 14.211 1309 ILE 171 23.217 28.653 9.n«
1231 CB VAL 161 18.935 30.688 12.892 1310 N HIS 172 23.336 30.651 10 . 185
1232 CGl VAL 161 17.425 30.917 12.599 1311 CA HIS 172 23.134 31.457 8.976
1233 CG2 VAL 161 19.855 31.244 11.790 1312 CB HIS 172 23.024 32.925 9.379
1234 C VAL 161 18.601 30.598 15.344 1313 CG HIS 172 22.829 33.843 8.209
PL213 994B1
ΝΑ A AK NAK X Y Z NA A AK NAK X Y Z
1314 ND1 HIS 172 21.652 33.874 7.493 1397 N TYR 186 19.229 31.994 4.258
1315 CE1 HIS 172 21.773 34.739 6.500 3 9B CA TYR 186 19.437 30.564 4.223
1316 NE2 HIS 172 22.988 35.260 6.541 1399 CB TYR 186 20,055 30.119 2.866
1317 CD2 HIS 172 23.669 34.718 7.607 1400 CG TYR 186 19.163 30.586 1.764
1318 C HIS 172 24.331 31.291 Θ . 371 1401 CDI TYR 186 19.430 31.788 1.128
1319 0 HIS 172 25.477 31.320 8.568 1402 CE1 TYR 186 18.549 32.286 0.147
1320 N PHE 173 24.117 31.176 6.748 1403 CZ TYR 186 17.4C3 31.599 -0.140
1321 CA PHE 173 25.280 31.236 5.840 1404 OH TYR 186 16.577 32.140 -1.101
1322 CB PHE 173 25.783 23.820 5.453 1405 CE2 TYR 186 17.082 30.416 0.4S9
1323 CG PHE 173 24.981 29.182 4.385 1406 CD2 TYR 186 17.967 29.924 1.4B4
1324 cm PHE 173 25.431 29.228 3.056 1407 C TYR 186 20.349 30.187 5.371
1325 CE1 PHE 173 24.657 28.684 2.045 1408 O TYR 186 21.369 30.829 5.611
1326 cz PHE 173 23.433 28.082 2.347 1409 N GLY 187 19.926 29.168 6.094
1327 CE2 PHE 173 22.987 28.031 3.666 1410 CA GLY 187 20.779 28.609 7.172
1328 CD2 PHE 173 23.761 28.583 4.665 1411 C GLY 187 20.946 27.103 6.998
1329 C PHE 173 25.124 32.151 4.578 1412 O GLY 187 20.189 26.437 6.281
1330 O PHE 173 26.124 32.620 4.019 1413 N VAL 188 21.935 26.556 7.704
1331 N ALA 174 23.892 32.4S2 4.206 1414 CA VAL 188 22.100 25.091 7.793
1332 CA ALA 174 23.675 33.243 S.948 1415 CB VAL 188 23.574 24.705 7.963
1333 CB ALA 174 23.694 32.283 1.751 1416 CG1 VAL 183 23.715 23.179 8.023
1334 C ALA 174 22.359 34.016 2.942 1417 CG2 VAL 183 24.402 25.266 6.815
1335 0 ALA 174 21.404 33.626 3.590 1418 C VAL 188 21.307 24.632 8.988
1336 N SER 175 22.289 35.063 2.128 1419 O VAL 1 B 21.470 25.160 10.071
1337 CA SER 175 20.974 35.536 1.793 1420 N TYR 189 20.437 23.603 8.760
1338 CB SER 175 20.695 36.924 2.538 1421 CA TYR 189 19.627 23.C75 9,815
1339 GG SER 175 21.905 37.573 2.966 1422 CB TYR 189 18.379 22.555 9,156
1340 c SER 175 20.826 35.876 0.298 1423 CG TYR 189 17.332 22.049 10.094
1341 0 SER 175 21.752 35.635 -0.478 1424 cm TYR 189 16.522 22.942 10,Bil
1342 N ASP 176 19.641 36.312 -0.097 1425 CE1 TYR 189 15.527 22.474 11.668
1343 CA ASP 176 19.443 36.799 -1.448 1426 cz TYR 189 15.334 21.115 11.796
1344 CB ASP 176 18.048 36.413 -1.944 1427 OH TYR 189 14 .328 20.627 12.607
1345 CG ASP 176 17.087 34.894 -2.123 1428 CE2 TYR 189 16.118 20.205 11.0B0
1346 ODl ASP 176 18.807 34.190 -2.399 1429 CD2 TYR 189 17.105 20.678 10.226
1347 OD2 ASP 176 16.764 34.399 -1.980 1430 c ΤΪΕ 189 20.437 21.892 10.394
1348 C ASP 176 19.634 38.297 -1.445 1431 0 TYR 189 21.094 21,197 9.664
1349 0 ASP 176 19.380 38.965 -0.449 1432 N PHE 190 20.797 21.668 11.699
1350 N VAL 177 20.157 38.839 -2.529 1433 CA PHE 190 21.160 2C.674 12.319
1351 CA VAL 177 20.052 40.286 -2.728 1434 C3 PHE 190 21.542 21.083 13.743
1352 CB VAL 177 21.376 40.943 -3.134 1435 CG PHE 190 22.365 22.356 13.785
1353 CG1 VAL 177 21.967 40.268 -4.379 1436 CDI PHE 190 21.807 23.545 14.239
1354 CG2 VAL 177 21.141 42.447 -3.321 1437 CE1 PHE 190 22.559 24.706 14.261
1355 C VAL 177 19.918 40.666 -3.692 1438 cz PHE 190 23.869 24.711 13.812
1356 O VAL 177 17.744 40.801 -3.282 14 39 CE2 PHE 190 24.429 23.537 13.337
1357 N AS? 181 11.008 44.174 3.566 144C CD? PHE 190 23.674 22.377 13.316
1358 CA ASP 181 11.761 43.230 2.730 1441 C PHE 190 20.567 19.207 12.212
1363 C ASP 181 11.331 41.773 2.954 1442 c PHE 190 19.791 18.832 13.053
1364 0 ASP 181 11.519 41.213 4.047 1443 N THR 191 20.944 18.617 11,140
1365 N ASN 182 10.750 41.157 1.930 1444 CA THR 191 20.490 17.258 10.B95
1366 CA ASN 182 10.327 39.764 2.054 1445 CB THR 191 20.752 16.848 9.457
1367 CB ASN 182 8.831 39.611 1.754 1446 OG1 THR 191 22.198 16.965 9.231
1368 CG ASN 182 7,950 39.849 3.011 1447 CG2 THR 191 20.014 17.714 8.459
1369 ODl ASN 182 8.107 40.858 3.726 1448 C THR 191 21.336 16.346 11.809
1370 ND2 ASN 182 7.074 36,900 3.297 1449 O THR 191 22.366 16.763 12.323
1371 c ASN 1B2 11.251 38.760 1.321 1450 N PRO 192 20.823 15.115 12.031
1372 0 ASN 182 10.836 37.681 0.878 1451 CA PRO 192 21.590 14.167 12.872
1373 N ARG 183 12.521 39.140 1.245 1452 CB PRO 192 20.846 12.830 12.656
1374 CA ARG 183 13.560 3B.299 0.679 1453 CG PRO 192 19.471 13.225 12.331
1375 CB ARG 183 14.795 39.135 0.313 1454 CE PRO 192 19.560 14 .519 11.550
1376 CG ARG 183 15.655 39.641 1.474 1455 C PRO 192 23.060 14 .C29 12.472
1377 CD ARG 183 16.914 40.297 C . 942 1456 O PRO 192 23.940 13.997 13.324
1378 NE ARG 183 17,890 40.594 1.994 1457 N GLU 193 23.327 13.944 11.172
1379 CZ ARG 183 19.011 41.290' 1.807 1458 CA GLU 193 24.674 13.789 10.676
1380 NH1 ARG 183 19.303 41.782 0.604 1459 CB C-LU 193 24.610 13.584 9.145
1381 NH2 ARG 183 19.842 41 .514 2.820 1460 CG GLU 193 25-935 13.348 8.487
1382 C ARG 1B3 13.892 37.179 1.661 1461 CD GLU 193 25.834 13.028 6.987
1383 0 ARG 183 13.674 37.312 2.872 1462 CE1 GLU 193 26.823 12.480 6.410
1384 N ASN 184 14.397 36.0/1 1.130 1463 OE2 GLU 193 24-763 13.311 6.387
1385 CA ASN 164 14.733 34.925 1.968 1464 C GLU 193 25.559 14.988 11-050
1386 CB ASN 184 14.219 33.634 1.328 1465 0 GLU 193 26.723 14.845 11.447
1387 CG ASN 184 12.718 33.501 1.417 1466 N ILE 194 25.007 16.196 10.928
1388 ODl ASN 184 12.065 34.165 2.235 1467 CA ILE 194 25.737 17.369 11,285
1389 ND2 ASN 184 12.155 32.634 0.593 1468 CB ILE 194 25.178 18.663 10.651
1390 c ASN 184 16.223 34.851 2.317 1469 CG1 ILE 194 25.213 18-553 9.108
1391 0 ASN 184 17.103 35.343 1.586 1470 CDI ILE 194 24.346 19.662 8.390
1392 N ALA 185 16.495 34.252 3.474 1471 CG2 ILE 194 25.957 19.845 11.092
1393 CA ALA 185 17.863 33.995 3.916 1472 C ILE 194 26.002 17.497 12.827
1394 CB ALA 185 18.198 34.827 5.153 1473 O ILE 194 27.085 17.816 13.334
1395 C ALA 185 17.993 32.493 4.194 1474 N LYS 195 24.969 Π .212 13,595
1396 O ALA 185 16.984 31.780 4.323 1175 CA LYS 195 25.097 17.144 15,056
PL 213 994 Β1
NA A AK NAK X Y Z NA A AK NAK X Y Z
1476 CB LYS 195 23.779 16.672 15.648 1517 CA GLU 200 32.864 14.611 17.685
1477 CG LYS 195 22.734 17.783 15.597 1518 CB GLU 200 32.984 13.848 16.366
1478 CD LYS 195 21.483 17.402 16.428 1519 CG GLU 200 32.132 12.660 16.244
1479 CE LYS 195 20.397 18.478 16.341 1520 CD GLU 200 32.032 12.152 14.804
1480 NZ LYS 195 19.188 17.946 17.115 1521 OE1 GLU 200 31.413 11.073 14.627
1481 C LYS 195 26.185 16.217 15.541 1522 OE2 GLU 200 32.528 12.852 13-863
1482 0 LYS 195 26.924 16.543 16.459 1523 C GLU 200 33.982 15.639 17.804
1483 N LYS 196 26.239 15.038 14.951 1524 0 GLU 200 35.087 15.321 18.252
1484 CA LYS 196 27.281 14.046 15.242 1525 N ASN 201 33.688 16.903 17.483
1485 CB LYS 196 27.032 12.778 14.434 1526 CA ASN 201 34.714 17.900 17.377
1486 CG LYS 196 28.078 11.668 14.671 1527 CB ASN 201 34.726 19.421 15.943
1487 CD LYS 196 27.969 10.638 13.546 1528 CG ASN 201 35.313 17.430 15.015
1488 CE LYS 196 26.505 10.198 13.407 1529 ODl ASN 201 36.526 17.193 15.050
1489 NZ LYS 196 25.958 10.253 12.014 1530 ND2 ASN 201 34.467 16.756 14.265
1490 c LYS 196 28.681 14.583 14,989 1531 C ASN 201 34.672 19.048 18.388
1491 0 LYS 196 29.556 14.481 15.845 1532 0 ASN 201 35.502 19.972 18.358
1492 N PHE 197 28.903 15.184 13.815 1533 N ILE 202 33.733 18.961 19.312
1493 CA PHE 197 30.177 15.790 13.531 1534 CA ILE 202 33.783 19.830 20.495
1494 CB PHE 197 30.160 16.384 12.096 1535 CB ILE 202 32.417 19.831 21.230
1495 CG PHE 197 31.242 17.380 11.870 1536 CGl ILE 202 31.464 20.780 20.486
1496 CDI PHE 197 30.974 18.760 11.981 1537 CDI ILE 202 30.012 20.508 20.697
1497 CE1 PHE 197 31.991 19.686 11.792 1538 CG2 ILE 202 32.559 20.334 22.693
1498 CZ PHE 197 33.288 19.244 11.501 1539 C ILE 202 34.976 19.440 21.405
1499 CE2 PHE 197 33.539 17.890 11.383 1540 0 ILE 202 35.248 18.232 21.606
1500 CD2 PHE 197 32.503 16.966 11.557 1541 N ASP 203 35.705 20.433 21.918
1501 C PHE 197 30.536 16.865 14.555 1542 CA ASP 203 36.840 20.174 22.902
1502 0 PHE 197 31.656 16.937 15.033 1543 CB ASP 203 37.550 21.468 23.221
1503 N ILE 198 29.570 17.727 14.916 1544 CG ASP 203 38.949 21.209 23.777
1504 CA ILE 19B 29.854 18.745 15.880 1545 ODl ASP 203 39.523 20.127 23.477
1505 CB ILE 198 28.665 19.718 16.021 1546 OD 2 ASP 203 39.474 22.068 24.504
1506 CGl ILE 198 28.511 20.491 14.715 1547 C ASP 203 36.400 19.387 24.032
1507 CDI ILE 198 27.152 21.285 14.651 1540 0 ASP 203 35.332 19.632 24.593
1508 CG2 ILE 198 28.924 20.695 17.181 1549 N LYS 204 37.247 13.444 24.459
1509 C ILE 198 30.220 18.107 17.228 1550 CA LYS 204 36.866 17.556 25.556
1510 0 ILE 198 31.190 18.479 17.829 1551 CB LYS 204 36.428 16.176 25.034
1511 N ALA 199 29.488 17.093 17.627 1552 CG LYS 204 35.002 16.097 24.529
1512 CA ALA 199 29.763 16.450 18.925 1553 CD LYS 204 34.783 14.864 23.684
1513 CB ALA 199 28.649 15.466 19.288 1554 CE LYS 204 33.638 14.997 22.643
1514 c ALA 199 31.120 15.778 18.939 1555 NZ LYS 204 34.161 15.549 21.407
1515 0 ALA 199 31.828 15.856 19.930 1556 C LYS 204 37.990 17.387 26.553
1516 N GLU 200 31.533 15.217 17.795 1557 0 LYS 204 39.177 17.448 26.148
1558 ΟΧΤ LYS 204 37.695 17.196 27.776
PL213 994B1
Wykaz sekwencji <110> BioCentrum Sp. z o.o.
Dubin, Grzegorz
Potempa, Jan
<120> Proteinaza SplB i peptydy przez nią rozpoznawane oraz ich zastosowania
<130> PK/0428/RW
<160 12
<170> Patentln version 3.3
<210 <211> <212> <213> 1 723 DNA Staphylococcus aureus
<220> <221> <222> <223> CDS (1)..(720) gen kodujący proteinazę SplB ZC peptydem sygnalnym Staphylococcus aureus wraz z
<220 <221> <222> mat peptide (109).. (720)
<400> 1
atg Met aac Asn -35 aaa Lys aac Asn gta Val gtc val atc aag agt Ser tta Leu gca Ala gca Ala -25 tta Leu aca Thr att Ile tta Leu 4&
ile -30 Lys
aca tct gta aca ggt att gga aca aca ttg gtt gag gaa gta caa caa 96
Thr Ser Val Thr Gly Ile Gly Thr Thr Leu val Glu Glu Val Gin Gin
-20 -15 0 -5
act gcc aaa gca gaa aat aat gtc aca aaa gtt aaa gat act aat att 144
Thr Ala Lys Ala Glu Asn Asn Val Thr Lys Val Lys Asp Thr Asn lic
-1 1 5 10
ttt cca tat act ggt gta gtt gct ttt aaa agt gca ant gga ttt qta 192
Phe Pro Tyr Thr Gly val Val Ala Phe Lys Ser Ala Thr Gly Phe Val
15 20 25
gtt gga aag aat act att tta aca aat aaa cat gtg reg aaa aa Ł tac 240
Val Gly Lys Asn Thr ile Leu Thr Asn Lys His vai Ser Lys Asn Tyr
30 35 40
aaa gtg qgc gat cgt att act gca cat cca aat agt gat aaa ggt aat 288
Lys Val Gly Asp Arg Ile Thr Ala Hi s Pro Asn ser Asp Lys Gly Asn
45 5C 55 60
ggt ggt att tat tog att aaa aag att att aat tat cca ggt aaa gaa 336
Gly Gly I le Tyr Ser Ile Lys Lys Ile Ile Asn Tyr Pro Gly Lys Glu
65 70 75
gat gta tca gtc att caa gtt gaa gag cgt gca ata gaa cgt gga cca 384
Asp Val Ser Val Ile Gin Val Glu Glu Arg Ala ile Glu Arg Gly Pro
80 Θ5 90
aąa ggc ttt aat ttt aat gat aat gta acg cca ttc aaa rat gcg gca 432
Lys Gly Phe Asn. Phe Asn Asp Asn Val Thr Pro Phe Lys Tyr Ala Ala
95 100 105
ggg gct aaa gct ggt gag ega att aaa gtg att ggt tat cca cac cca 4 80
Gly Ala Lys Ala Gly Glu Arg I le Lys Val Ile Gly Tyr Pro His Pro
110 115 120
tac aaa aat aaa tat gtt tta tal gag tca act ggc cct gtg atg tca 528
Tyr Lys Asn Lys Tyr Val Leu Tyr Glu Ser Thr Gly Pro Val Met Ser
125 130 135 140
gta gaa ggt ago agt att gta tat tca gcg cat ac t gaa age qqa aac 575
val Glu Gly Ser Ser Ile Val Tyr Ser Ala His Thr Glu Ser Gly Asn
145 150 155
tct gga tca cct gta zta aac age aac aac gaa t.t a gtt ggt att aat 624
PL 213 994 Β1
672
Ser Gly Ser Pro Val 160 Leu Asn Ser Asn 165 Asn Glu Leu Val Gly 170 Ile His
ttt gct tct gat gta aaa aat gat gat aac aga aat gca tat ggc gtc
Phe Ala Ser Asp Val Lys Asn Asp Asp Asn Arg Asn Ala Tyr Gly val
175 100 185
tac ttt aca cca gaa att aaa aaa ttc att gca gaa aac ata gat aaa
Tyr Phe Thr Pro Glu Ile Lys T.ys Phe Tle Ala Glu Asn Tle Asp Lys
190 195 2C0
723 taa <210> 2 <211>240 <212> PRT <213> Staphylococcus aureus <400>2
Met Asn -35 Lys Asn Val Val Ile -30 Lys ser Leu Ala Ala -25 Leu Thr ile Leu
Thr Ser Val Thr Gly Ile Gly Thr Thr Leu Val Glu Glu Val Gin Gin
-20 -15 -10 - 5
Thr Ala Lys Ala Glu Asn Asn val Thr Lys Val Lys Asp Thr Asn Ile
-1 1 5 10
Phe Pro Tyr Thr Gly Val Val Ala Phe Lys Ser Ala Thr Gly Phe val
15 2Q 25
val Gly Lys Asn Thr Ile Leu Thr Asn Lys His Val Ser Lys Asn Tyr
30 35 40
Lys va.L Gly Asp Arg Ile Thr Ala His Pro Asr. Ser Asp Lys Gly Asn
45 50 55 60
Gly Gly Ile Tyr Ser Ile Lys Lys Ile Ile Asn Tyr Pro Gly Lys Glu
65 70 75
Asp val Ser Val Ile Gin val Glu Glu Arg Ala IL.e Glu Arg Gly Pro
80 95 90
Lys Gly Phe Asn Phe Asn Asp Asn Val Thr Pro Phe Lys Tyr Ala Ala
95 100 105
Gly Ala Lys Ala Gly Glu Arg Ile Lys Val Ile Gly Jyt Pro His Pro
110 115 120
Tyr Lys Asn lys Tyr Val Leu Tyr Glu Ser Thr G1 y Pro vai Met Ser
125 130 135 1 40
Val Glu Gly Ser Ser Ile Val Tyr Ser Ala His Thr Glu Ser Gly Λεη
145 150 155
Ser Gly Ser Pro Val Leu Asn Ser Asn Asn Glu Leu val Gly Ile His
150 165 170
Phe Ala Ser Asp Val Lys Asn ASp Asp Asn Arg Asn Ala Tyr Gly Val
175 180 135
Tyr Phe Thr Pro Glu Tle Lys Lys Phe Ile Ala Glu Asn Ile Asp Lys
190 195 200
<210>3 <211>702 <212> DNA <213> Artificial seąuence <220>
<223> sekwencją kodująca wariant białka SplB z peptydem sygnalnym subtilrs <220>
<221> CDS <222> (1)..(699) <220>
<221> rnat_peptide
723 z B.
PL213 994B1 <222> (88)..(699) <400> 3
atg aac atc aaa Lys aag ttt gca Ala aaa Lys caa gca aca gta Val tta Leu acc Thr t.t.t Phe -15 act Thr •18
Met Asn Tle Lys -25 Phe Gin Ala Thr -20
acc gca ctg ctg gca gga ggc gca act caa gct ttt gcc gaa aat aat 96
Thr Ala Leu Leu Ala Gly Gly Ala Thr Gin Ala Phe Ala Glu Asn Asn
-10 -5 -1 1
gtc aca aaa gtt aaa gat act aat att ttt cca tat act ggt gta gtt 144
Val Thr Lys Val Lys Asp Thr Asn Ile Phe Pro Tyr Thr Gly val Val
5 10 15
gct ttt aaa agt gca act gga ttt gta gtt gga aag aat act att tta 192
Ala Phe Lys Ser Ala Thr Gly Phe Val Val Gly Lys Asn Thr Ile Leu
20 25 30 35
aca aat aaa cat gtg tcg aaa aat tac aaa gtg ggc gat cgt att act 240
Thr Asn Lys His Val Ser Lys Asn Tyr Lys val Gly Asp Arg Tle Thr
40 45 50
gca cat cca aat agt gat aaa ggt aat ggt ggt att tat tcg att. aaa 28B
Ala His Er© Asn Ser Asp Lys Gly Asn Gly Gly ile Tyr Ser TLe Lys
55 60 65
aag att att aat tat cca ggt aaa gaa gat gta tca gtc att caa gtt 336
Lys Ile Ile Asn Tyr Pro Gly Lys Glu Asp vai Ser Val Ile Gin Val
73 75 80
gaa gag cgt gca ata gaa cgt gga cca aaa ggc ttt aat ttt aat gat 3S4
Glu Glu Arg Ala Ile Glu Arg Gly Pro Lys Gly Phe Asn Phe Asn ńsp
85 90 95
aat gta acg cca ttc aaa tat gcg gca ggg gct aaa gct ggt gag ega 432
Asr. Val Thr Pro Phe Lys Tyr Ala Ala Gly Ala I.ys Ala Gly Glu Arg
100 105 110 115
att aaa gtc att ggt tat cca cac cca tac aaa aat aaa tat gtt tta
Ile Lys Val Ile Gly Tyr Pro His Pro Tyr Lys Asn Lys Tyr Val Leu
120 125 130
tai gag tca act ggc cct gtg atg tca gta qaa ggt agc agt att gta 528
Tyr Glu Ser Thr Gly Pro val Met Ser Val Glu Gly Ser Ser lic val
135 140 145
tat rca gcg cat act gaa agc gga aac tct gga tca cct gta tta aac 0 7 6
Tyr Ser Ala His Thr Glu Ser Gly Asn Ser Gly Ser Pro Val Leu Asn
150 155 160
ago aac aas gaa tta gtt ggt att cat ttt gct tct gat gta aaa aat 621
Ser Asn Asn G1U Leu Val Gly ile His Phe Ala Ser ASp tal Lys Asn
165 170 175
gat gat aac aga a a t gca tat ggc gtc tac ttt aca cca gaa att aaa 6 /2
ASp Asp Asn Arg Asn Ala Tyr Gly Val Tyr Phe Thr Pro Glu Ile Lys
180 185 190 195
aaa ttc att gca gaa aac ata gat aaa taa 7C2
Lys Phe Ile Ala Glu Asn Ile Asp Lys
200
<210> 4
<211> 233
<212> PRT
<213> artificial seąuence
<220 <223> synthetic Construct
<4C0> 4
Met Asn Ile Lys Lys -25 Phe Ala Lys Gin Ala -20 Thr Val Leu Thr Phe -15 Thr
Thr Ala Leu Leu Ala Gly Gly Ala Thr Gin Ala Phe Ala Glu Asn Asn
-10 -5 -1 1
Val Thr Lys VaL Lys Asp Thr Asn T.Le Phe Pro Tyr Thr Gly Val Val
PL 213 994 Β1
10 15
Ala 20 Phe Lys Ser Ala tsw 35 Gly Phe Val val Gly 30 Łys ASH Thr 11* leó 35
Thr Asn l>ys His Val Ser Łys Asr. Tyr Lys Val Gly AS? Arg Ile Thr
40 45 50
Ala His Pro Asn Ser »Sp Lys Gly ASfj. Gly Gly .i la Tyr Set II® I>ys
55 60 65
Lys Ile Ile Asn Tyr Pro Gly Lys GXu Asp Val Ser Val Ile &1ϊ) vai
70 75 80
Glu G1U Arg Ais Ile G.Ui Arg Gly Lys Gly Phe Asn Phe Aen Asp
85 90 95
Asn Val Thr PW Phe Lys Tyr Ala Ala Gry Alą hys aia Gly Glu •Arg
100 105 1.10 115
Ile Łys Val XI c Gly Tyr Pro His Pro Tyr Lys Asr> Łya Tyr Val Łeu
120 125 130
Tyr Gid Ser Thr Cly Pro val Met Ser val Glu Gly Ser Ser ile Val
135 140 145
Tyr Ser Al a His Thr Glu Ser Gly Asn Ber. Gly Ser Pro Val Leu Asn
ISO 15S 150
Ser Asn Asn Glu Leu Vai Gly Ile His Phe Ala S’ir A$p Vai I-ys Asr;
16S 100 3.75
Asp Asp Ases Arę Asn Ais Tyr Giy val Tyr Phe Th s Fr.fj G1U 1 le i.ys
180 185 .190 195
Łys Phe Ile Ala Giu Asn ile Asp Lys
200
<210 <211> <212> <213> 5 702 DBA Artificial sequence
<220>
<223> sekwencja kodującą białko mutanta SplB S157A a p-sptydssi sygnalnym z B, subtilis
<220>
<221> COS
<222> iii -,<7021
<400> 5
atg aac atc aaa aag i<ys 25 ttt Phe ęf;a «aa caa Girs gca Ala -20 aca Thr gta Val tt.a acc ttt Phe -15 act Ths iS
Met Asn ile Lys Ala Lys heu Thr
acc ęca Ctę erg gca ega ęgc gca act ca a gct rt.t gcc gaa aat ąat 96
Thr Ala Leu Leu. Ala Gly w Ala Thr. Gin Ala Phe Ala Glu Asn Asii
-10 „ s “1
gtc a ca a a a ętt a aa gat act aat att ttt cca Lat ac t gęt ęta gtt 144
Val Thr hys Val Łys Asp Thr A$n Ile Phe Pro Tyr Th5' Gly Vai Ve.I
c. 10 15
gct ter SeS agt ęca act gga hit gta gtt ęęa asy aat act att tta 192
Ala Piie Lys Ser Ala Thr. Gly Phe val Val Gly Ly» Α5Π Thr Ile Łeu
20 25 30 35
3C& aat 11-3$ chi ętę tog aaa aat tac aaa ętg ęgc gat cęt att act. 240
Thr Aso Łys Bis Val Ser Lys As π Tyr Lys w. Gly Asp Arg Ile Thr
40 45 55
gca cat cca aat aęt gat aaa ęgt aat ggt gęt att tat tcę at t a aa 288
Α1ώ His Pro Asa 3<*r Aep tys Gly Asa Giy Gly Ile Tyr Ser 11 e
55 60 6$
8.ĆUJ att att aat tat cca ggt. aa a gria gat gta tca ętc att caa gt.t 338
Lys Ile Ile Asn Tyr Pro Gly Lys Glu Asp Val Ser Val Ile Gin Val
70 75 80
PL213 994B1 <210> 8 <211> 233 <21Ξ> PRT <213> artificial sequence <220>
<223> Synthetic Construct <400> 8
Met Asn Ile Lys Lys -25 Phe Ala Lys Gin Ala -20 Thr Val Leu Thr Phe -15 Thr
Thr Ala Leu Leu Ala Gly Gly Ala Thr Gin Ala Phe Ala Glu Asn Asn
-10 -5 -1 1
val Thr Lys val Lys Asp Thr Asn Ile Phe Pro Tyr Thr Gly Val Val
5 10 15
Ala Phe Lys Ser Ala Thr Gly Phe Val Val Gly Lys Asn Thr ile Leu
20 25 30 35
Thr Asn Lys Ala Val Ser Lys Asn Tyr Lys Val Gly Asp Arg Ile Thr
40 45 50
Ala His ?EO Asn Ser Asp Lys Gly Asn G1 y Gly ile Tyr Ser Ile Lys
55 60 65
Lys Ile He Asn Tyr Pro Gly Lys Glu Asp Val Ser Val Ile Gin Vai
70 75 80
Glu Glu Arg Ala Ile Glu Arg Gly Pro Lys Gly Phe Asn Phe Asn Asp
85 90 95
Asn Val Thr Pro Phe Lys Tyr Ala Ala Gly Ala Lys Ala Gly Glu Arg
100 105 110 115
Ile Lys Val Ile Gly Tyr Pro His Pro Tyr Lys Asn Lys Tyr Val Leu
120 125 13C
Tyr Glu Ser Thr Gly Pro val Met Ser Val Glu Gly Ser Ser ile val
135 140 14 □
Tyr Ser Ala His Thr Glu Ser Gly Asn Ser Gly Ser Pro Val Leu Asn
150 155 16C
Ser Asn Asn Glu Leu Val Gly Ile His Phe Ala Ser Asp Val Lys Asn
165 170 175
Asp Asp Asn Arg Asn Ala Tyr Gly val Tyr Phe Thr Pro Glu ile Lys
180 185 190 195
Lys Phe Ile Ala Glu Asn Ile Asp Lys
200 <210> 9 <211> 02 <21Ξ> DNA <213> artificial sequence <220 <223> sekwencja kodująca białko mutanta SplB D77A z peptydem sygnalnym z B. subtilis <220 <221> COS <222> (1) . . (702)
<400 9 atc Ile aaa Lys aag Lys -25 ttt Phe gca Ala aaa Lys caa Gin gca Ala -20 aca Thr gta Val tta Leu acc Thr ttt Phe -15 act Thr 48
atg Met aac Asn
acc gca ctg ctg gca gga ggc gca act caa get ttt qcc gaa aat aat 96
Thr Ala Leu Leu Ala Gly Gly Ala Thr Gin Ala Phe Ala Glu Asn Asn
-10 -5 -1 1
gtc aca aaa gtt aaa gat act aat att ttt cca tal act ggt gta gtu 144
val Thr Lys Val Lys Asp Thr Asn ile Phe Pro Tyr Thr Gly Val Val
PL 213 994 Β1
Asp Asp Asn Arg Asn Ala Tyr Gly Val Tyr Phe Thr Pro Glu Ile Lys
180 165 190 195
Lys Phe Ile Ala Glu Asn Ile ASp Lys
200
<210> 7
<211> 702
<212> DNA
<2L3> artificial secuence
<220> sekwencja kodującą białko mutanta SplB Η39Ά z peptydem sygnalnym z B. subtills
<220> <221> CDS
<222> (1) .. (702)
<400> 7
atg aac atc Ile aaa Lys aag Lys -25 ttt Phe gca Al a aaa Lys caa Gin gca aca gta tta Leu acc Thr ttt Phe -15 act Thr 45
Met Asn Ala -20 Thr Vai
acc gca c tg ctg gca gga ggc gca act caa gct ttt gcc gaa aat aat 96
Thr Ala Leu Leu Ala Gly Gly Ala Thr Gin Ala Phe Ala Glu Asn Asn
-10 -5 -1 1
gtc aca aaa gtt aaa gat act aat att ttt cca tat act ggt gta gtt 144
val Thr hys Val Lys Asp Thr Asn Ile Phe Pro Tyr Thr GLy val Val
5 10 15
gct ttt aaa agt gca act gga ttt gta gtt gga aag aat act att tta 192
Ala Phe Lys Ser Ala Thr Gly Phe val val Gly Lys Asn Thr Ile Leu
20 25 30 35
aca aat a aa gcg gtg tcg aaa aat tac aaa Qtg ggc gat cgt att act 240
Thr Asn Lys Ala Val Ser Lvs Asn Tyr Lys Val Gly Asp Arg ile Thr
40 45 50
gca cat cca aat agt gat aaa ggt aat ggt ggt att lat tcg att aaa 2 38
Ala His Pro Asn Ser Asp Lys Gly Asn Gly Gly Ile Tyr 5er lic Lys
55 60 65
aag alt att aat tat cca ggt aaa gaa gat gta tca gtc att caa gtt 336
Lys Ile Ile Asn Tyr Prc Gly Lys G1U Asp Val Ser val Ile Gin Val
70 75 50
gaa gag cgt gca ata gaa cgt gga cca aaa ggc ttt aat ttt aat gat 384
Glu Glu Arg Ala ile Glu Arg Gly Pro Lys Gly Phe Asn Phe Asn Asp
83 90 95
aat gta acg cca ttc aaa tat gcg gca ggg gct aa a gct ggt gag ega 432
Asn Val Thr Pro Phe Lys Tyr Ala Ala Gly Ala Lys Ala Gly Glu Arg
100 105 110 115
att aaa gtg att ggt tat cca cac cca tac aaa aat aaa tat gtt tta 48C
ile Lys Val Ile Gly Tyr Pro His Pro Tyr Lys Asn Lys Tyr Vai Leu
120 125 130
tat tca act ggc cct gtg atg tca gta gaa ggt agc agt att qta 528
Tyr Glu Ser Thr Gly Pro Val Met Ser val Glu Gly Ser Ser Tle Val
135 140 145
tat tca gcg cat act gaa agc gga aac tct gga tca cct gta tta aac 576
Tyr ser Ala His Thr Glu Ser Gly Asn Ser Gly Ser Pro Val Leu Asn
150 155 160
agc aac aac gaa tta gtt ggt att cat ttt gct tct gat gta aaa aat 624
Ser Asn Asn Glu Leu val Gly Ile His Phe Ala Ser Asp Val Lys Asn
155 170 175
gat gat aac aga aat gca tat ggc gtc tac ttt aca cca gaa att aaa 672
Asp ASp Asn Arg Asn Ala Tyr Gly Val Tyr Phe Thr FIC Glu Ile Lys
180 165 190 195
aaa ttc att gca gaa aac ata gat aaa Caa 702
Lys Phe Ile Ala Glu Asn ile Asp Lys
200
PL213 994B1 <210> 8
<211> <212> <213> 233 PRT artificial seąuence
<220>
<223> Synthetic Construct
<4C0> 8
Met Asn Ile Lys Lys -25 Phe Ala Lys Gin A-l a -20 Thr Val Leu Tlir Phe -15 Thr
Thr Ala Leu Leu Ala Gly Gly Ala Thr Gin Ala Phe Ala Glu Asn Asn
-10 -5 -1 1
Va_ Thr Lys Val Lys Asp Thr Asn Ile Phe Fro Tyr Thr Gly Val Val
5 10 15
Ala Phe Lys Ser Ala Thr Gly Phe Vdl Vdl Gly Lys Asn Thr Ile Leu
20 25 3C 35
Thr Asn Lys Ala Val Ser Lys Asn Tyr Lys Val Gly Asp Arg Ile Thr
40 45 5 0
Ala His Pro Asti Ser Asp Lys Gly Asn Gly Gly ile Tyr Ser Ile Lys
55 50 65
Lys ile Ile Asn Tyr Pro Gly Lys Glu ASp Val Ser Val Ile Gin. Va 1
70 75 8 0
Glu Glu Arg Ala Ile Glu Arg Gly Pro Lys Gly Phe Asn Phe Asn Asp
85 90 95
Asn val Thr Pro Phe Lys Tyr Ala Ala Gly Ala Lys Ala Gly Glu Arg
100 105 110 l ) 5
Ile Lys Val Ile Gly Tyr Pro His Pro Tyr Lys Asn lys yr V=1 Leu
120 125 13 0
Tyr Glu Ser Thr Gly Pro Val Met Ser Val Glu Gly Scx Ser lic Val
135 140 145
Tyr Ser Ala His Thr Glu Ser Gly Asn Ser Gly Ser Pro Val leu Asn
150 15 5 160
Ser Agn Asn Glu Lcu Val Gly Ile His Phe Ala Ser Asp Val Lys Asn
165 17C 175
Asp Asp Asn Arg Asn Ala Tyr Gly Val Tyr Phe Thr Pro Glu Ile Lys
180 1 35 190 195
l.ys P?ie Tle Ala Glu Asn Ile ASP Lys
200 <210> 9 <211> 702 <21Ξ> DNA <213> artificial sequer.ce <220>
<223> sekwencja kodująca białko mutanta Sp'R D77A z peptydem sygnalnym z 3. subtilis <220>
<221> CDS <222> (1)..{702)
<400> i gca Ala - 2 0 aca Thr gla Val tta Leu a cc Thr ttt Phe -15 ar. 7. Thr 48
atg Me t aac Asn atc Ile aaa Lys aag Lys -25 ttt Ph e= gca Al a aaa Lys caa Gin
acc gca ctg ctg gca gga ggc gca dC. caa get ttt gee gaa aat aat 96
Thr Ala Leu Leu Ala Gly Gly Ala Thr Gin Ala Phe Al a Glu Asn Asn
-LC -5 -1 1
gtc ara aa a gt t aaa gat act a a t at.r. -.tr. cca rat act ggt gta git 144
Val Thr Lys Val Lys Asp Thr Asn Ile Phe Pro Tyr Thr Gly va1 val
PL 213 994 Β1
gct Ala 20 ttt aaa agt Ser gca Ala act Thr 25 gga Gly ttt Phe gta Val gtt Val gga Gly 30 aag Lys aat Asn act. Thr att Ile tta Leu 35 192
Phe Lys
aca aat ddd cat gtg tcg aaa aat tac aaa gtg ggc gat cgt att act 240
Thr Asn Lys His val Ser Lys Asn Tyr Lys Val Gly Asp Arg Ile Thr
40 45 50
gca cat cca aat agt gat aaa ggu aat ggt ggt att tat tcg att aaa 288
Ala His Pro Asn Ser Asp Lys Gly Asn Gly Gly Ile Tyr Ser Ile Lys
55 60 65
aag att att aat tat cca ggt aaa gaa gcg gta tca gtc att caa gtt 336
Lys Ile Ile Asn Tyr Pro Gly Lys Glu Ala Val Ser val Ile Gin Val
70 75 80
gaa gag cgt gca ata gaa cgt gga cca aaa ggc ttt aat ttt aat gat 384
Glu Glu Arg Ala ile C-lu Arg Gly Pro Lys Gly Phe Asn Phe Asn Asp
85 90 95
aat gta acg cca ttc aaa tat gcg gca ggg gct aaa gct ggt gag ega 432
Asn Val Thr Pro Phe LyS Tyr Ala Ala Gly Ala Lys Ala Gly Glu Arg
100 105 110 115
att aaa g tg att ggt tat cca CBC cca tac aaa aat aaa tat gtt tta 480
ile Lys Val Ile Gly Tyr Pro His Pro Tyr Lys Asn Lys Tyr val Leu
120 125 130
tat gag tca act ggc cct atg cca gta gaa gqt agc agt att gt.a 523
Tyr Glu Ser Thr Gly Pro val Met Ser Val Glu Gly Ser Ser Ile Val
135 140 145
tat tca gcg cat act gaa agc gga aac tct gga tca cct gta tta aac 576
Tyr Ser Ala His Thr Glu Ser Gly Asn Ser Gly Ser Pro vai Leu Asn
150 155 160
agc aac aac gaa tta gtt qgt att cat ttt gct tct gat gta aaa aat 624
Ser Asn Asn Glu Leu tal Gly Ile His Phe Ala Ser Asp Val Lys Asr.
165 170 175
gat ga^ aac aga aat gca tat ggc ctc tac ttt aca cca gaa atu aaa 672
Asp Asp Asn Arg Asn Ala Tyr Gly vai Tyr Phe Thr Pro Glu Ile Lys
180 155 190 195
aaa ttc att gca gaa aac ata gat aaa taa 702
Lys Phe Ile Ala Glu Asn ile Asp T.ys
200 <210 10 <211> 233 <212> PRT <213> artificial sequen.ce <220>
<223> Synthetic Construct
<400 10 Lys Gin Ala -20 Thr Val Leu Thr Phe -15 Thr
Met Asn Ile Lys Lys -25 Phe Ala
Thr Ala Leu Leu Ala Gly Gly Ala Thr C-ln Ala Phe Ala Glu Asn Asn
-10 -5 -1 1
Val Thr Lys Val Lys Asp Thr Asn Ile Phe pro Tyr Thr Gly Val Val
5 10 15
Ala ?he Lys Ser Ala Thr Gly Phe vai val Gly Lys Asn Thr Ile Leu
20 25 30 35
Thr Asn Lys His val Ser Lys Asn Tyr Lys Val Gly Asp Arg Ile lhr
40 45 50
Ala His Pro Asr. Ser Asp Lys Gly Asn Gly Gly Ile Tyr Ser Ile Lys
55 60 65
Lys Ile Ile Asn Tyr Pro Gly Lys Glu Ala Val Ser Val Ile Gin Val
75 80
PL213 994B1
Glu Glu Arg 85 Ala Ile Gl.u Arg Gly 90 Pro Lys Gly Phe 95 Asn Phe Asn Asp
Asn Val Thr Pró Phe Lys Tyr Ala Ala Gly Ala Lys Ala Gly Glu Arg
100 105 110 115
lie Lys val Ile Gly Tyr Prc His Pro Tyr Lys Asn Lys Tyr Val Leu
120 125 130
Tyr Glu Ser Thr Gly Pro val Mer Ser Val Glu Gly Ser Ser Ile Val
135 140 145
Tyr Ser Ala His Thr Glu Ser Gly Asn Ser Gly Ser Pro Val Leu Asn
150 155 160
Ser Asn Asn Glu Leu Val Gly Ile His Phe Ala Ser Asp Val Lys Asn
165 170 175
Asp Asp Asn Arg Asn Ala Tyr Gly val Tyr Phe Thr Pro Glu Ile Lys
180 185 190 195
Lys Phe Ile Ala Glu Asn Ile Asp Lys
200 <210 11 <211> 663 <212> DNA <213> artificxal seguence <220 <223> sekwencja kodująca białko fuzujne zawierające dojrzałą sekwencję splB do której przyłączono metkę hiatydynewą i sekwencję rozpoznawaną przez splB <220>
<221> CDS <222> (1)..(663) <400 11
atg ggc age age cat cat His cat His cat His -10 cat His cac His age age ggc tgg gaa Glu ctg Leu 46
Met Gly Ser -15 Ser His Ser Ser Gly -5 irp
cag gaa aat aat gtc a ca aaa gtt aaa gat act aat att ttt cca tat 96
Gir. Glu Asn Asn Val Thr Lys Val Lys Asp Thr Asn He Phe Pro Tyr
-1 1 5 10 15
act ggt gta gtt get ttt aaa agt gca act gga ttt gta gtt gga aag 144
Thr Gly Val Val Alą Phe Lys Ser Ala Thr Gly Phe Val Val Gly Lys
20 25 30
aat act att tta ac:a aat ddd cat gtg teg aaa aat tac aaa gtg ggr. 192
Asn Thr Ile Leu Thr Asn Lys His V<al Ser Lys Asn Tyr Lys Val Gly
35 40 45
gat cgt ątr act gca cat. cca aat agt gat aaa ggt aat ggt ggt att 240
Asp Arg Ile Thr Ala His Pro Asn Ser Asp Lys Gly Asn Gly Gly Ile
50 55 60
tat teg att aaa aag att att aat tat cca ggt aaa gaa gat gta tea 288
Tyr Ser Ile Lys Lys Ile Ile Asn Tyr Pro Gly Lys Glu Asp Val Ser
65 70 75
gtc att caa gtt gaa gag cgt gca ata gaa cgt gga cca aaa ggc ttt 336
Val ile Gir. val Glu Glu Arg Ala Ile Glu Arg Gly Pro Lys Gly Phe
80 05 90 95
aat ttt aat gat aat gta acg cca ttc aaa tat gcg gca ggg get aaa 384
Asn Phe Asn Asp Asn Val Thr Pro Phe Lys Tyr Ala Ala G1 y Ala Lys
100 105 110
get ggt gag ega att aaa gtg att ggt tat cca cac cca tac aaa aat 432
Ala Gly Glu Arg ile Lys Val Ile Gly Tyr Pro His Pro Tyr Lys Asn
115 120 125
aaa tat gtt tta tat gag tea act ggc cct gtg atg lea gta gaa ggt <180
Lys Tyr Val Leu Tyr Glu Ser Thr Gly Prc Val Met Ser Val Glu Gly
130 135 140
ago agt att gta tat tea gcg cat act gaa age gga aac tet gga tea 528
PL 213 994 Β1
Ser Ser 145 Ile Val Tyr Ser Ala 150 His Thr Glu Ser Gly 155 Asn Ser Gly Ser
cct gta tta aac agc aac aac gaa tta gtt ggt att cat ttt gct tct 576
Pro Val Leu Asn Ser Asn Asn Glu Leu vai Gly Ile His Phe Ala Ser
160 165 170 175
gat gta aaa aat gat gat aac aga aat gca tat ggc gtc tac ttt aca 624
Asp Val Lys Asn Asp Asp Asn Arg Asn Ala Tyr Gly Val Tyr Phe Thr
180 185 190
cca gaa att aaa aaa ttc att gca gaa aac ata gat aaa 663
Pro Glu Ile Lys Lys Phe Ile Ala Glu Asn Ile Asp Lys
195 200 <210> 12 <211> 221 <212> PRT <213> artifrcial seąuence <220>
<223> Synthetic Construct <400> 12
Met Gly Ser -15 Ser His His His His -10 His His Ser Ser Gly Thr -5 Ala Lys
Ala Glu Asn Asn Val Thr Lys val Lys Asp Thr Asn Ile Phe Pro Tyr
-1 1 5 10 15
Thr Gly Val Val Ala Phe T.ys Ser Ala Thr Gly Phe Val Val Gly Lys
20 25 30
Asn Thr Ile Leu Thr Asn Lys His Val Ser Lys Asn Tyr Lys Val Gly
35 40 45
Asp Arg Ile Thr Ala His Pro Asn Ser Asp Lys Gly Asn Gly Gly Ile
50 55 60
Tyr Ser Ile Lys Lys Ile Ile Asn Tyr Pro Gly Lys Glu Asp Val Ser
65 70 75
Val Ile Gin Val Glu Glu Arg Ala Ile Glu Arg Gly Pro Lys Gly Phe
80 85 90 95
Asn Phe Asn Asp Asn Val Thr Pro Phe Lys Tyr Ala Ala Gly Ala Lys
100 105 110
Ala Gly Glu Arg Ile Lys Val Ile Gly Tyr Pro His Pro Tyr Lys Asn
115 120 125
Lys Tyr val Leu Tyr Glu Ser Thr Gly Pro Val Met Ser Val Glu Gly
130 135 140
Ser Ser Ile Val Tyr Ser Ala His Thr Glu Ser Gly Asn Ser Gly Ser
145 150 155
Pro Val Leu Asn Ser Asn Asn Glu Leu Val Gly He His Phe Ala Ser
160 165 170 175
Asp Val Lys Asn Asp Asp Asn Arg Asn Ala Tyr Gly Val Tyr Phe Thr
180 185 190
Pro Glu Ile Lys Lys Phe Ile Ala Glu Asn Ile Asp Lys
195 200
PL213 994B1

Claims (8)

1. Mutant proteinazy SplB, znamienny tym, że posiada sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.
2. Mutant proteinazy według zastrz. 1, znamienny tym, że sekwencja sekrecyjna jest bakteryjną sekwencją sekrecyjną z Bacillus subtilis.
3. Sekwencja nukleotydowa kodująca mutanta proteinazy jak określono w zastrz. 1.
4. Sekwencja nukleotydowa według zastrz. 3, znamienna tym, że posiada sekwencję nukleotydową wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11.
5. Sposób otrzymywania mutanta proteinazy SplB, znamienny tym, że:
a) w komórkach gospodarza bakteryjnego prowadzi się ekspresję białka jak określono w zastrz. 1, korzystnie kodowanego przez sekwencję nukleotydowąjak określono w zastrz. 3 albo 4, a następnie;
b) izoluje się pożądany enzym lub zawierającą go frakcję.
6. Sposób według zastrz. 5, znamienny tym, że gospodarzem bakteryjnym jest szczep Bacillus subtilis ekspresjonujący białko kodowane przez sekwencję nukleotydową przedstawioną jako SEQ ID No.: 3.
7. Sposób według zastrz. 5, znamienny tym, że w etapie b) oddziela się brzeczkę fermentacyjną od masy bakteryjnej poprzez wirowanie, białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysala się siarczanem amonu, oddziela się wysolone białka i rozpuszcza w niewielkiej ilości roztworu buforowego i dializuje się do buforu o pH około 5,5.
8. Sposób według zastrz. 7, znamienny tym, że w etapie b) dodatkowo oczyszcza się wyizolowane białko techniką chromatografii powinowactwa, chromatografii jonowymiennej i/lub sączenia molekularnego, a ostatecznie oczyszczony preparat zagęszcza się i ewentualnie poddaje krystalizacji.
PL394914A 2007-06-11 2007-06-11 Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB PL213994B1 (pl)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PL394914A PL213994B1 (pl) 2007-06-11 2007-06-11 Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PL394914A PL213994B1 (pl) 2007-06-11 2007-06-11 Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB

Publications (2)

Publication Number Publication Date
PL394914A1 PL394914A1 (pl) 2011-12-19
PL213994B1 true PL213994B1 (pl) 2013-06-28

Family

ID=45374329

Family Applications (1)

Application Number Title Priority Date Filing Date
PL394914A PL213994B1 (pl) 2007-06-11 2007-06-11 Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB

Country Status (1)

Country Link
PL (1) PL213994B1 (pl)

Also Published As

Publication number Publication date
PL394914A1 (pl) 2011-12-19

Similar Documents

Publication Publication Date Title
Lu et al. Crystal structure of enteropeptidase light chain complexed with an analog of the trypsinogen activation peptide
KR20080055843A (ko) 트립신 변이체에 의한 인슐린 전구체의 절단
EP1327143A1 (en) Crystal structure of bace and uses thereof
WO2008153429A2 (en) A protease from staphylococcus aureus, particularly spia or spib, peptides it recognises and their use
Esau et al. Differential effects of N-and C-terminal deletions on the two activities of Rubisco activase
Dostál et al. The precursor of secreted aspartic proteinase Sapp1p from Candida parapsilosis can be activated both autocatalytically and by a membrane-bound processing proteinase.
WO2001019970A2 (en) Chymotrypsin-free trypsin
Kobayashi et al. Structural basis for the kexin-like serine protease from Aeromonas sobria as sepsis-causing factor
CN100362105C (zh) 胰羧肽酶原b、其同工型和突变蛋白的制备及应用
PL213994B1 (pl) Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB
Austin et al. The substrate specificity of Metarhizium anisopliae and Bos taurus carboxypeptidases A: insights into their use as tools for the removal of affinity tags
Baker et al. Autocatalytic processing of pro-papaya proteinase IV is prevented by crowding of the active-site cleft
CA2486195C (en) Recombinantly expressed carboxypeptidase b and purification thereof
IL100623A (en) PROCESS FOR THE PRODUCTION OF RECOMBINANT IgA PROTEASE AND THE IgA PROTEASE PRODUCED THEREBY
PL214451B1 (pl) Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB, białko sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplB
PL213995B1 (pl) Proteinaza posiadajaca aktywnosc proteinazy SpIB
US20250283065A1 (en) Truncated polypeptides having protein ligase activity and methods of production thereof
Gaur et al. Role of aspartic acid 121 in human pancreatic ribonuclease catalysis
JP2845558B2 (ja) メチオニンアミノペプチダーゼのdna配列
KR20020011399A (ko) 에어로모나스 아미노펩티다제로 ν-말단 알라닌 잔기를폴리펩티드로부터 제거하는 방법
Kim et al. Secretory expression of active clostripain in Escherichia coli
PL221052B1 (pl) Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA
PL214122B1 (pl) Proteinaza posiadajaca aktywnosc proteinazy SplA
JPH03219892A (ja) タンパク質の製造法
CN119855902A (zh) 用于活化酶原形式的转谷氨酰胺酶的固定化蛋白酶

Legal Events

Date Code Title Description
LAPS Decisions on the lapse of the protection rights

Effective date: 20100611