PL221052B1 - Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA - Google Patents

Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA

Info

Publication number
PL221052B1
PL221052B1 PL382770A PL38277007A PL221052B1 PL 221052 B1 PL221052 B1 PL 221052B1 PL 382770 A PL382770 A PL 382770A PL 38277007 A PL38277007 A PL 38277007A PL 221052 B1 PL221052 B1 PL 221052B1
Authority
PL
Poland
Prior art keywords
tyr
trp
leu
ser
thr
Prior art date
Application number
PL382770A
Other languages
English (en)
Other versions
PL382770A1 (pl
Inventor
Grzegorz Dubin
Jan Potempa
Original Assignee
Biocentrum Spółka Z Ograniczoną Odpowiedzialnością
Univ Jagiellonski
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biocentrum Spółka Z Ograniczoną Odpowiedzialnością, Univ Jagiellonski filed Critical Biocentrum Spółka Z Ograniczoną Odpowiedzialnością
Priority to PL382770A priority Critical patent/PL221052B1/pl
Priority to PCT/PL2008/000042 priority patent/WO2008153429A2/en
Publication of PL382770A1 publication Critical patent/PL382770A1/pl
Publication of PL221052B1 publication Critical patent/PL221052B1/pl

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Description

Opis wynalazku
Wynalazek dotyczy metody otrzymywania proteinazy SplA, jej zastosowania do specyficznej hydrolizy łańcucha polipeptydowego, sekwencji aminokwasowych przez nią rozpoznawanych oraz ich zastosowań.
Enzymy proteolityczne (proteinazy) o wysokiej specyficzności działania (rozpoznające i hydrolizujące jedynie wybrane wiązania peptydowe) są stosowane na szeroką skalę w laboratoriach i przemyśle biotechnologicznym do specyficznej hydrolizy polipeptydów (przede wszystkim następujące: enterokinaza, czynnik X, trombina, proteinaza TEV, proteinaza PreScission™ oraz o mniejszej specyficzności, ale też szeroko wykorzystywane, jak V8 i trypsyna). W szczególności, lecz nie jedynie, stosuje się omawiane enzymy do usuwania tzw. metek fuzyjnych, fragmentów polipeptydów rekombinowanych użytecznych na pośrednich etapach analizy lub produkcji (służących np. do detekcji, oczyszczania) jednak niepożądanych w produkcie końcowym. W teorii wysoka specyficzność zastosowanego enzymu w połączeniu z wydajnie rozpoznawanym przez niego miejscem wprowadzonym pomiędzy „metką” a częścią polipeptydu stanowiącą ostatecznie pożądany produkt pozwala na precyzyjne usunięcie „metki” bez ryzyka degradacji pożądanego polipeptydu. Niestety, brak całkowicie specyficznych enzymów proteolitycznych powoduje, że w wielu przypadkach rezultatem ich działania jest nie tylko pożądane odcięcie „metki” fuzyjnej, ale także niespecyficzna degradacja interesującego polipeptydu, jeśli zawiera on miejsca podobne do sekwencji specyficznie rozpoznawanej przez enzym. Ponadto, najpopularniejsze ze stosowanych obecnie enzymów nie są dostępne w postaci białek zrekombinowanych lub z uwagi na trudności w produkcji są w tej formie znacznie droższe od białek natywnych izolowanych z osocza krwi (trombina, czynnik X) lub jelit (enterokinaza). Zastosowanie białek natywnych stwarza jednak ryzyko zanieczyszczenia preparatów niepożądaną aktywnością innych enzymów lub patogenami.
Wymienione czynniki stwarzają zapotrzebowanie na nowe enzymy, które będą mogły sprostać specyficznym zadaniom.
Szczególnie pożądane jest uzyskanie proteinaz o wąskiej specyficzności substratowej, które mogłyby znaleźć zastosowanie jako precyzyjne narzędzie biotechnologiczne (przykładowe opisy patentowe nr nr: US 4 543 329, US 5 013 653, US 6 906 176, US 7 189 540).
Sekwencja aminokwasowa białka SplA pochodzącego ze Staphylococus aureus jest znana i została opisana w publikacji J. Mol. Biol. (2006) 358, 270-279. Do tej pory nie została jednak ujawniona metoda produkcji rekombinowanego białka SplA, ani metoda oczyszczania natywnego SplA. Nie wykazano także bezpośrednio aktywności proteolitycznej tego białka, ani nie była poznana specyficzność substratowa tego enzymu. Tak więc, stan techniki w kwestii białka SplA obejmuje jedynie znajomość sekwencji aminokwasowej białka SplA i pozwala stwierdzić jej homologię do sekwencji aminokwasowych chymotrypsynopodobnych proteinaz serynowych. Jednak nie znana jest metoda otrzymywania białka, nie wiadomo czy białko to jest w rzeczywistości proteinazą, nie jest znana jego struktura, ani specyficzność substratowa, a tym samym nie można wskazać na potencjalne zastosowania.
Ponadto, znane jest wiele proteinaz serynowych chymotrypsynopodobnych (w przypadku podobieństw strukturalnych określenie chymotrypsynopodobny odnosi się do tej samej grupy proteinaz co określenie trypsynopodobny i są one tutaj stosowane zamiennie; jedynie w przypadku określania typów aktywności określenia te są rozdzielne jednak jako takie nie są używane w opisie, chyba że zaznaczono inaczej), do których należy proteinaza SplA. Podobieństwo sekwencji aminokwasowej do innych proteinaz z tej grupy pozwoliło zaliczyć proteinazę SplA do rodziny S1 wg ogólnie przyjętej klasyfikacji za bazą danych MEROPS (http://merops.sanger.ac.uk/; Rawlings, N. D., Morton, F. R. & Barrett, A. J. (2006) MEROPS: the peptidase database, 34, D270-D272). Zgodnie z powszechnym przeświadczeniem wyrażonym m. in. w wiodącej referencji z dziedziny enzymów proteolitycznych, bazie danych MEROPS uznaje się, że: „wszystkie scharakteryzowane peptydazy należące do rodziny chymotrypsynopodobnych są endopeptydazami. Istnieją także liczne, nie będące peptydazami homologii, w których reszty katalityczne zostały zastąpione. Istnieją trzy główne typy aktywności: trypsynopodobny, w którym następuje odtrawienie substratu amidowego następującego po resztach Arg lub Lys w pozycji P1, chymotrypsynopodobny, w którym trawienie następuje za jednym z aminokwasów hydrofobowych w P1 i elastazopodobny, w którym trawienie następuje za resztą Ala w pozycji P1. Specyficzność substratowa rodziny S1 zależy jedynie od aminokwasu znajdującego się w pozycji P1. Większość peptydaz należących do tej rodziny podlega sekrecji i posiada N-końcowy sekrecyjny pepPL 221 052 B1 tyd sygnałowy. Są one syntetyzowane w postaci prekursorów z dodatkową sekwencją na N-końcu, której usunięcie daje aktywną formę enzymu. Aktywacja nie zawsze wymaga usunięcia propcptydu”.
Jak pokazano w dalszej części niniejszego opisu ogólne wskazówki zawarte w stanie techniki mogą prowadzić jedynie do błędnych wniosków dotyczących specyficzności substratowej proteinazy SplA i uznania ją za enzym o nikłej przydatności przemysłowej.
W świetle opisanego stanu techniki celem niniejszego wynalazku jest dostarczenie wysoce specyficznej proteinazy oraz sposobu jej otrzymywania oraz charakterystyki jej aktywności pozwalającej na jej przemysłowe wykorzystywanie.
Nieoczekiwanie twórcy tego wynalazku ustalili, że proteinaza SplA posiada dużo węższą niż oczekiwana specyficzność substratową. Bazując na tym odkryciu zaproponowano nowe specyficzne substraty dla proteinazy SplA oraz sposoby hydrolizy i/lub otrzymywania białek wykorzystujące takie peptydy (fragmenty sekwencji) oraz nowe zastosowania proteinazy SplA. Uzyskanie tych wyników było możliwe dzięki opracowaniu wydajnej metody produkcji proteinazy SplA, która stanowi kolejny aspekt tego wynalazku. Przedmiotem wynalazku jest polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA posiadający sekwencję aminokwasową wybraną spośród:
Trp-Leu-Tyr, Trp-Leu-Tyr-Ser, Tyr-Glu-Tyr-Ala, Tyr-Glu-Tyr, Tyr-Met-Tyr, Tyr-Ala- Tyr-Ser, Tyr-Ala-Tyr, Tyr-Thr-Tyr-Ser, Tyr-Thr-Tyr, Tyr-Leu-Tyr-GIy, Tyr-Leu-Tyr, Tyr-Leu-Tyr-Ser, Phe-Leu-Tyr-Ser, Phe-Leu-Tyr, Val-Leu-Tyr-Thr, Val-Leu-Tyr, Trp-Leu-Ser-Thr, Trp-Leu-Ser, Trp-Met-Asn-Thr, Trp-Met-Asn, Trp-Trp-Tyr-Thr, Trp-Trp-Tyr, Tyr-Trp-Trp-Tyr, Tyr-Trp-Trp, Tyr-Trp-Met-Asn, Tyr-Trp-Met, Tyr-Trp-Leu-Ser, Tyr-Trp-Leu, Trp-Leu-Tyr.
Kolejnym przedmiotem wynalazku jest białko rozpoznawane przez proteinazę SplA posiadające sekwencję aminokwasową zawierającą zdefiniowany powyżej polipeptyd według wynalazku.
Kolejnymi przedmiotami wynalazku są sekwencje nukleotydowe kodujące polipeptyd według wynalazku zdefiniowany powyżej oraz sekwencje nukleotydowe kodujące białko według wynalazku zdefiniowane powyżej.
Kolejnym przedmiotem wynalazku jest zastosowanie sekwencji polipeptydu według wynalazku zdefiniowanej powyżej przy wytwarzaniu białka rozpoznawanego przez proteinazę SplA
Kolejnym przedmiotem wynalazku jest sposób otrzymywania pożądanego białka charakteryzujący się tym, że:
a) dostarcza się białko fuzyjne posiadające sekwencję wybraną spośród Z1-Trp-Leu-Tyr-Z2, Z1-Trp-Leu-Tyr-Ser-Z2, Z1-Tyr-Glu-Tyr-Ala-Z2, Z1-Tyr-Glu-Tyr-Z2, Z1-Tyr-Met-Tyr-Z2, Z1-Tyr-Ala-Tyr-Ser-Z2, Z1-Tyr-Ala-Tyr-Z2, Z1-Tyr-Thr-Tyr-Ser-Z2, Z1-Tyr-Thr-Tyr-Z2, Z1-Tyr-Leu-Tyr-Gly-Z2, Z1-Tyr-Leu-Tyr-Z2, Z1-Tyr-Leu-Tyr-Ser-Z2, Z1-Phe-Leu-Tyr-Ser-Z2, Z1-Phe-Leu-Tyr-Z2, Z1-Val-Leu-Tyr-Thr-Z2, Z1-Val-Leu-Tyr-Z2, Z1-Trp-Leu-Ser-Thr-Z2, Z1-Trp-Leu-Ser-Z2, Z1-Trp-Met-Asn-Thr-Z2, Z1-Trp-Met-Asn-Z2, Z1-Trp-Trp-Tyr-Thr-Z2, Z1-Trp-Trp-Tyr-Z2, Z1-Tyr-Trp-Trp-Tyr-Z2, Z1-Tyr-Trp-Trp-Z2, Z1-Tyr-Trp-Met-Asn-Z2, Z1-Tyr-Trp-Met-Z2, Z1-Tyr-Trp-Leu-Ser-Z2, Z1-Tyr-Trp-Leu-Z2, Z1-Trp-Leu-Tyr-Z2, gdzie Z1 i Z2 oznacza polipeptyd zawierający jeden lub więcej aminokwasów, przy czym jeden z nich oznacza polipeptyd zawierający pożądane białko a drugi polipeptyd zawierający polipeptyd znacznikowy,
b) izoluje się białko fuzyjne, korzystnie techniką chromatograficzną, stosując złoże posiadające powinowactwo do polipeptydu znacznikowego,
c) prowadzi się reakcję hydrolizy białka fuzyjnego za pomocą proteinazy posiadającej aktywność enzymatyczną proteinazy SplA, przy czym korzystnie izoluje się pożądane białko z mieszaniny reakcyjnej.
Korzystnie, hydrolizę prowadzi się w temperaturze od 0°C do 45°C, w pH od 5,0 do 8,0.
Korzystniej, hydrolizę prowadzi się w buforze octanowym, cytrynianowym, mrówczanowym, MES, HEPES, PłPES, MOPS, Bis-Tris, fosforanowym lub Tris o stężeniu od 1 do 250 mM.
Najkorzystniej, hydrolizę prowadzi się w roztworze zawierającym od 0 do 500 mM NaCl.
Kolejnym przedmiotem wynalazku jest zastosowanie proteinazy SplA do specyficznej hydrolizy polipeptydu do produkcji białek zawierającego sekwencję aminokwasową Xaa1-Xaa2-Xaa3-Xaa4, gdzie:
Xaa1 jest aminokwasem wybranym spośród: Trp, Tyr, Phe, Vał, He, Leu,
Xaa2 jest aminokwasem wybranym spośród: Leu, Glu, Met, Ala, Thr, Trp, Ile, Val, Ser, Tyr, Phe,
Asp,
Xaa3 jest aminokwasem wybranym spośród: Tyr, Phe, Trp, Leu, Asn, Gln, Ser, Met, Iie, Val, Thr,
PL 221 052 B1
Xaa4 jest pominięty lub jest dowolnym aminokwasem, korzystnie wybranym spośród: Ser, Thr, Gly, Ala, Val, Asn, Asp, Gln, Glu, Tyr.
Korzystnie, hydrolizowany polipeptyd posiada sekwencję aminokwasową zawierającą sekwencję wybraną spośród:
Trp-Leu-Tyr, Trp-Leu-Tyr-Ser, Tyr-Glu-Tyr-Ala, Tyr-Glu-Tyr, Tyr-Met-Tyr, Tyr-Ala- Tyr-Ser, Tyr-Ala-Tyr, Tyr-Thr-Tyr-Ser, Tyr-Thr-Tyr, Tyr-Leu-Tyr-Gly, Tyr-Leu-Tyr, Tyr-Leu-Tyr-Ser, Phe-Leu-Tyr-Ser, Phe-Leu-Tyr, Val-Leu-Tyr-Thr, Val-Leu-Tyr, Trp-Leu-Ser-Thr, Trp-Leu-Ser, Trp-Met-Asn-Thr, Trp-Met-Asn, Trp-Trp-Tyr-Thr, Trp-Trp-Tyr, Tyr-Trp-Trp-Tyr, Tyr-Trp-Trp, Tyr-Trp-Met-Asn, Tyr-Trp-Met, Tyr-Trp-Leu-Ser, Tyr-Trp-Leu, Trp-Leu-Tyr.
Korzystniej, hydrolizę prowadzi się w temperaturze od 0°C do 45°C, w pH od 5,0 do 8,0.
Korzystnie, hydrolizę prowadzi się w buforze octanowym, cytrynianowym, mrówczanowym, MES, HEPES, PIPES, MOPS, Bis-Tris, fosforanowym łub Tris o stężeniu od 1 do 250 mM.
Najkorzystniej, hydrolizę prowadzi się w roztworze zawierającym od 0 do 500 mM NaCl.
Dla celów niniejszego opisu jako polipeptyd zawierający polipeptyd znacznikowy, zwany też w niniejszym opisie metką łub polipeptydem znacznikowym, należy rozumieć sekwencję pozwalającą na izolowanie zawierającego ją polipeptydu, zwłaszcza techniką chromatografii powinowactwa. Specjalista będzie w stanie zaproponować opierając się na powszechnie dostępnej wiedzy szereg tego rodzaju sekwencji, które można wykorzystać do zaprojektowania układu do izolowania produkowanego białka, w szczególności techniką chromatografii powinowactwa. Przykładowo, wprowadzenie sekwencji rozpoznawanej przez przeciwciało pozwała na izolowanie zawierającego ją białka za pomocą tego przeciwciała. Innym przykładem są sekwencje aminokwasowe posiadające powinowactwo do glutationu. Kolejnym przykładem są techniki opierające się na znanym zjawisku tworzenia kompleksów niektórych jonów metali z niektórymi resztami aminokwasowymi. Najbardziej znanym przykładem takiego układu jest kompleksowanie jonów niklu przez pierścienie imidazolowe histydyn wprowadzonych do izolowanego łańcucha polipeptydowego. Wszystkie tego typu układy składające się ze znacznikowej sekwencji aminokwasowej i substancji, do której taka sekwencja posiada odpowiednio silne powinowactwo, pozwalają zaprojektować system oczyszczania białka zawierającego sekwencję znacznikową. Zwykle będzie to technika chromatografii powinowactwa na złożu zawierającym wspomnianą substancję.
W związku z powyższym, w korzystnych realizacjach wynalazku, znacznikowa sekwencja aminokwasowa zawiera sekwencję składającą się z sześciu kolejnych histydyn (His6). Pożądane białko wchodzące w skład białka fuzyjnego według wynalazku wspominanego powyżej może być dowolnym znanym białkiem, dla którego znana jest sekwencja aminokwasowa lub sekwencja kodująca. Przykładowo, może to być białko lecznicze, którego produkcja pożądana jest ze względu na jego właściwości terapeutyczne. W oparciu o instrukcje ujawnione w niniejszym opisie oraz powszechnie dostępną wiedzę, fachowiec będzie w stanie opracować sekwencję kodującą białko fuzyjne zawierającą sekwencję kodującą pożądane białko. Sekwencje aminokwasowe lub sekwencje kodujące znanych białek mogą być przykładowo pozyskane z bazy GenBank dostępnej w sieci internet pod adresem http://www.ncbi.nlm.nih.gov/Genbank/index.html, w której zgromadzono sekwencje znanych genów oraz sekwencje aminokwasowe znanych białek. Aby zwiększyć poziom ekspresji białka fuzyjnego w układzie bakteryjnym można zastosować znane metody podnoszenia poziomu ekspresji w komórkach bakteryjnych, które obejmują stosowanie silnych promotorów, stosowanie sekwencji wzmacniających transkrypcję lub stosowanie kodonów preferowanych przez wybraną komórkę bakteryjną.
W opisie ujawniono wariant proteinazy SplA charakteryzującego się tym, że posiada sekwencję aminokwasową zawierającą następującą modyfikację:
- przyłączenie wiązaniem peptydowym do aminokwasu znajdującego się na N-końcu dojrzałej formy proteinazy SplA polipeptydu zawierającego co najmniej jedną spośród następujących sekwencji: znaną sekwencję sekrecyjną, znaną bakteryjną sekwencję sekrecyjną, sekwencję polipeptydu wykazującego powinowactwo do centrum aktywnego proteinazy SplA, sekwencję rozpoznawaną przez enzym proteolityczny, sekwencję znanego polipeptydu znacznikowego.
Korzystnie, ujawniony wariant proteinazy charakteryzuje się tym, że sekwencja sekrecyjna jest bakteryjną sekwencją sekrecyjną z Bacillus subtilis.
Równie korzystnie ujawniony wariant proteinazy charakteryzuje się tym, że posiada sekwencję wybraną spośród: SEQ ID NO: 4 lub SEQ ID NO: 6.
Kolejno, ujawniono sekwencję nukleotydową kodująca wariant proteinazy według wynalazku zdefiniowanego powyżej.
PL 221 052 B1
Następnie, ujawniono sekwencję nukleotydową posiadającą sekwencję nukleotydową wybraną spośród: SEQ ID NO: 3 lub SEQ ID NO: 5.
Kolejno, ujawniono sposób otrzymywania proteinazy SplA i jej wariantów charakteryzujący się tym, że:
a) w komórkach gospodarza bakteryjnego lub innego prowadzi się ekspresję ujawnionego białka, jak zdefiniowano powyżej, korzystnie kodowanego przez ujawnioną sekwencję nukleotydową zdefiniowaną powyżej, a następnie;
b) izoluje się pożądany enzym lub zawierającą go frakcję.
W korzystnej realizacji ujawnionego sposobu gospodarzem bakteryjnym jest szczep Bacillus subtilis ekspresjonujący białko kodowane przez sekwencję nukleotydową przedstawioną jako SEQ ID NO: 3.
W równie korzystnej realizacji ujawnionego sposobu w etapie b) oddziela się brzeczkę fermentacyjną od masy bakteryjnej poprzez wirowanie, białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysala się siarczanem amonu, oddziela się wysolone białka i rozpuszcza w niewielkiej ilości roztworu buforowego i dializuje się do buforu o pH około 5,5.
W równie korzystnej realizacji ujawnionego sposobu w etapie b) dodatkowo oczyszcza się wyizolowane białko techniką chromatografii powinowactwa, chromatografii jonowymiennej i/lub sączenia molekularnego, a ostatecznie oczyszczony preparat ewentualnie zagęszcza się i ewentualnie poddaje krystalizacji.
W jednej z korzystnych realizacji ujawnionego sposobu produkcji aktywnej proteinazy SplA można wykorzystać zdolności katalityczne samego enzymu lub innego enzymu zdolnego do precyzyjnej hydrolizy łańcucha polipeptydowego. W metodzie tej produkuje się enzym z N-terminalną metką fuzyjną wybraną korzystnie z bogatej puli opisanych metek lub nowym peptydem o własnościach pożądanych dla metki. Metkę taką może stanowić przykładowo, lecz nie jedynie metka histydynowa (tzw. ang. His-tag). Pomiędzy metkę fuzyjną a sekwencję proteinazy SplA wstawia się dogodnie sekwencję rozpoznawaną i przecinaną przez proteinazę SplA lub sekwencję rozpoznawaną i przecinaną przez inny enzym zdolny do precyzyjnej hydrolizy łańcucha polipeptydowego. Po wyprodukowaniu opisanego białka fuzyjnego izoluje się je wykorzystując właściwości metki, a następnie odcina się metkę przy pomocy katalitycznych ilości proteinazy SplA lub innego enzymu zdolnego do precyzyjnej hydrolizy łańcucha polipeptydowego. W przypadku odcinania przy wykorzystaniu proteinazy SplA uwolniona od metki proteinaza SplA zwiększa pulę aktywnego enzymu przyspieszając zakończenie procesu odcinania.
Odcinanie metki można prowadzić bezpośrednio na złożu stosowanym do izolacji białka fuzyjnego lub też po elucji, przy czym pierwsza metoda pozwała na jednoczesne oczyszczenie proteinazy od metki fuzyjnej, natomiast w drugim przypadku konieczne jest wprowadzenie dodatkowego stopnia oczyszczania. Dodatkowy stopień oczyszczania jest także pożądany przy wykorzystaniu enzymu zdolnego do precyzyjnej hydrolizy łańcucha polipeptydowego innego niż SplA, by oddzielić ten enzym od proteinazy SplA.
Kolejno ujawniono zastosowanie proteinazy SplA do specyficznej hydrolizy polipeptydu zawierającego sekwencję aminokwasową Xaa1-Xaa2-Xaa3-Xaa4, gdzie:
Xaa1 jest aminokwasem wybranym spośród: Trp, Tyr, Phe, Val, Ile, Leu,
Xaa2 jest aminokwasem wybranym spośród: Leu, Glu, Met, Ala, Thr, Trp, Ile, Val, Ser, Tyr, Phe,
Asn,
Xaa3 jest aminokwasem wybranym spośród: Tyr, Phe, Trp, Leu, Asn, Gln, Ser, Met, Ile, Val, Thr,
Xaa4 jest pominięty lub jest dowolnym aminokwasem, niemniej w najkorzystniejszej realizacji wynalazku jest on aminokwasem, korzystnie wybranym spośród: Ser, Thr, Gly, Ala, Val, Asn, Asp, Gln, Glu, Tyr.
Korzystnie, hydrolizowany polipeptyd posiada sekwencję aminokwasową zawierającą sekwencję wybraną spośród:
Trp-Leu-Tyr, Trp-Leu-Tyr-Ser, Tyr-Glu-Tyr-Ala, Tyr-Glu-Tyr, Tyr-Met-Tyr, Tyr-Ala-Tyr-Ser, Tyr-Ala-Tyr, Tyr-Thr-Tyr-Ser, Tyr-Thr-Tyr, Tyr-Leu-Tyr-Gly, Tyr-Leu-Tyr, Tyr-Leu-Tyr-Ser, Phe-Leu-Tyr-Ser, Phe-Leu-Tyr, Val-Leu-Tyr-Thr, Val-Leu-Tyr, Trp-Leu-Ser-Thr, Trp-Leu-Ser, Trp-Met-Asn-Thr, Trp-Met-Asn, Trp-Trp-Tyr-Thr, Trp-Trp-Tyr, Tyr-Trp-Trp-Tyr, Tyr-Trp-Trp, Tyr-Trp-Met-Asn, Tyr-Trp-Met, Tyr-Trp-Leu-Ser, Tyr-Trp-Leu, Trp-Leu-Tyr.
Równie korzystnie, hydrolizę prowadzi się w temperaturze od 0°C do 45°C, w pH od 5,0 do 8,0.
PL 221 052 B1
Równie korzystnie, hydrolizę prowadzi się w buforze octanowym, cytrynianowym, mrówczanowym, MES, HEPES, PłPES, MOPS, Bis-Tris, fosforanowym łub Tris o stężeniu od 1 do 250 mM.
Równie korzystnie, hydrolizę prowadzi się w roztworze zawierającym od 0 do 500 mM NaCl.
Kolejno, ujawniono proteinazę posiadającą aktywność proteinazy SplA, charakteryzującą się tym, że posiada centrum aktywne tworzone przez triadę katalityczną zawierającą co najmniej jeden spośród następujących aminokwasów His, Asp i Ser, w szczególności przez wspomniane aminokwasy, przy czym RMSD węgli Ca łańcucha głównego wchodzących w skład aminokwasów tworzących triadę katalityczną jest nie większe niż 2,2 A, korzystnie nie większe niż 1,8 A, w zestawieniu z węglami Ca łańcucha głównego wchodzących w skład aminokwasów His 39, Asp 78 i Ser 154 zawartych w proteinazie SplA o strukturze trzeciorzędowej określonej w tabeli 1.
Korzystnie, ujawniona proteinaza charakteryzuje się tym, że RMSD węgli Ca łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych rdzenia cząsteczki (a więc nie uwzględniając pętli, innych elementów ruchomych, fragmentów eksponowanych na zewnątrz cząsteczki oraz jej słabo zdefiniowanych elementów wg sztuki) jest nie większe niż 2 A, korzystnie nie większe niż 1,5 A, w zestawieniu z odpowiadającymi im strukturalnie węglami Ca łańcucha głównego zawartymi w proteinazie SplA o strukturze trzeciorzędowej określonej w tabeli 1.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że dobrze zdefiniowana struktura drugorzędowa rdzenia cząsteczki zawiera fragmenty odpowiadające strukturalnie fragmentowi białka SplA wybranemu korzystnie spośród następujących sekwencji: Val4 do Glu6, Asn16 do Ala20, Gyy24 do Val29, Thr33 do Asn37, Val51 do Ala53, Asn64 do Val67, He70 do Glu72, Leu79 do His85, Arg112 do He116, Met128 do He135, Phe142 do Phe145, Ser154 do Leu159, Gly167 do Ala171, Asn181 do Tyr185, Glu192 do Gln195.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że zawiera fragment tworzący a-helisę odpowiadający strukturalnie fragmentowi białka SplA wybranemu korzystnie spośród następujących sekwencji: Lys38 do Ala41, Glul92 do Asn196.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że zawiera fragmenty tworzące β-harmonijkę odpowiadające strukturalnie fragmentom białka SplA wybranym korzystnie spośród następujących sekwencji: Val4 do Lys5, Val18 do Ala20, Thr25 do Val28 Thr33 do Thr36, Val51 do Ala53, Asn64 do Val67, Asp69 do Glu72 Ala80 do Val84, Arg112 do He116, Phe129 do Gly133, Phe142 do Phe145, Val158 do Leu159, Gly167 do Ala171, Asn181 do Val184.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że posiada strukturę trzeciorzędową, dla której RMSD węgli Ca łańcucha głównego jest nie większe niż 2,5 A, korzystnie nie większe niż 1,8 A, w zestawieniu z odpowiadającymi im węglami Ca łańcucha głównego zawartymi w proteinazie SplA o strukturze trzeciorzędowej określonej w tabeli 1.
Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że posiada następujące elementy strukturalne:
- w pozycji odpowiadającej Val28 w sekwencji SplA zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Val29 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Ile34 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Val35 zawiera aminokwas wybrany spośród Val, Leu, He, Ala;
- w pozycji odpowiadającej Thr36 zawiera aminokwas wybrany spośród Ser, Thr;
- w pozycji odpowiadającej His39 zawiera His;
- w pozycji odpowiadającej Val67 zawiera aminokwas wybrany spośród Val, Leu, He, Ala;
- w pozycji odpowiadającej Ile70 zawiera aminokwas wybrany spośród Val, Leu, He, Ala;
-w pozycji odpowiadającej Asp78 zawiera Asp;
- w pozycji odpowiadającej Leu79 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Ile81 zawiera aminokwas wybrany spośród Val, Leu, He, Ala, Met;
- w pozycji odpowiadającej Val82 zawiera aminokwas wybrany spośród Val, Leu, He, Ala, Met;
- w pozycji odpowiadającej Val98 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Ser, Thr;
- w pozycji odpowiadającej Gly117 zawiera Gly;
- w pozycji odpowiadającej Tyr118 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;
-w pozycji odpowiadającej Met128 zawiera aminokwas wybrany spośród Val, Leu, He, Ala, Met;
- w pozycji odpowiadającej Gln150 zawiera aminokwas wybrany spośród Asn, Gln, Asp, Glu;
- w pozycji odpowiadającej Pro151 zawiera Pro;
- w pozycji odpowiadającej Gly152 zawiera Gly;
PL 221 052 B1
- w pozycji odpowiadającej Asn 153 zawiera aminokwas wybrany spośród Asn, Gin, Asp, Glu;
- w pozycji odpowiadającej Ser154 zawiera Ser;
- w pozycji odpowiadającej Gly155 zawiera Gly;
- w pozycji odpowiadającej Ser156 zawiera aminokwas wybrany spośród Val, Ala, Ser, Thr, Gly;
- w pozycji odpowiadającej Pro157 zawiera Pro;
- w pozycji odpowiadającej Gly167 zawiera Gly;
- w pozycji odpowiadającej Ile168 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Leu169 zawiera aminokwas wybrany spośród Val, Leu, He, Ala;
- w pozycji odpowiadającej Tyr170 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;
- w pozycji odpowiadającej Ala171 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;
- w pozycji odpowiadającej Gly172 zawiera Gly;
- w pozycji odpowiadającej Glu177 zawiera aminokwas wybrany spośród Asn, Gln, Asp, Glu;
- w pozycji odpowiadającej Ser178 zawiera aminokwas wybrany spośród Ser, Thr, Val, Leu,
He, Ala;
- w pozycji odpowiadającej Asn181 zawiera aminokwas wybrany spośród Asn, Gln, Asp, Glu;
- w pozycji odpowiadającej Phe193 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;
- w pozycji odpowiadającej Ile194 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala.
Zgodnie z powyższym, uszczegóławiając podany powyżej opis istoty kolejnych aspektów niniejszego wynalazku należy uznać, że opis ujawnia polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA posiadający sekwencję aminokwasową Xaa1-Xaa2-Xaa3-Xaa4, gdzie:
Xaa1 jest aminokwasem z hydrofobowym łańcuchem bocznym lub tyrozyną, korzystnie wybranym spośród: Trp, Tyr, Phe, Val, He, Leu,
Xaa2 jest aminokwasem korzystnie wybranym spośród Leu, Glu, Met, Ala, Thr, Trp, Ile, Val,
Ser, Tyr, Phe, Asn,
Xaa3 to aminokwas z hydrofobowym łańcuchem bocznym, tyrozyną albo aminokwas z niewielkim łańcuchem bocznym, korzystnie Xaa3 jest aminokwasem wybranym spośród Tyr, Phe, Trp, Leu,
Asn, Gln, Ser, Met, He, Val, Thr,
Xaa4 jest pominięty lub jest dowolnym aminokwasem, niemniej w najkorzystniejszej realizacji wynalazku jest on aminokwasem korzystnie wybranym spośród: Ser, Thr, Gly, Ala, Val, Asn, Asp, Gln,
Glu, Tyr.
W sekwencjach odpowiednie symbole oznaczają: A, Ala, alanina; V, Val, walina; L, Leu, leucyna; I, Ile, izoleucyna; P, Pro, prolina; F, Phe, fenyloalanina; W, Trp, tryptofan; M, Met, metionina; G, Gly, giicyna; S, Ser, seryna; T, Thr, treonina; C, Cys, cysteina; Y, Tyr, tyrozyna; N, Asn, asparagina; Q Gln, glutamina; D, Asp, kwas asparaginowy; E, Glu, kwas glutaminowy; K. Lys, lizyna; R, Arg, arginina; H, His, histydyna.
Xaa4 może być w przypadku proteinazy SplA pominięty lub być dowolnym aminokwasem, gdyż nieoczekiwanie proteinaza SplA odróżnia się od innych proteinaz cechujących się wysoką specyficznością substratową, które wykazują zazwyczaj określoną specyficzność również wobec aminokwasu znajdującego się bezpośrednio za hydrolizowanym wiązaniem (na nowym N-końcu powstającym w wyniku hydrolizy wiązania peptydowego, tj. w miejscu P1' zgodnie z systemem numeracji przyjętym w tym zgłoszeniu, a zaproponowanym przez: Schechter, I. and Berger, A. (1967) Biochem. Biophys. Res. Commun. 27, 157-162). W przypadku proteinazy SplA obserwujemy jedynie preferencję w stosunku do aminokwasów w pozycji P1' wybranych spośród: Ser, Thr, Gly, Ala, Val. Jednak zastąpienie na tej pozycji preferowanych aminokwasów innymi resztami nie powoduje całkowitej utraty zdolności hydrolizy omawianych wiązań. Cecha ta jest szczególnie korzystna, ponieważ pozwała na dowolne projektowanie N-końca uwalnianych produktów.
Kolejny aspekt dotyczy białek posiadających ustaloną aktywność proteinazy SplA dzięki zachowaniu przez te białka struktury trzeciorzędowej proteinazy SplA przedstawionej w tabeli 1.
Istnieje powszechnie stosowany parametr określający podobieństwo struktur trzeciorzędowych, który pozwała na zdefiniowanie grupy ujawnionych białek o pożądanych właściwościach. Parametr ten to RMS distance (deviation) (ang. root mean square distance (deviation)), określany także jako RMSD lub po prostu RMS (oznaczenia należy traktować równoważnie i tak też stosowano w opisie). Wartość parametru RMSD wylicza się porównując położenia odpowiadających sobie atomów po uprzednim nałożeniu na siebie porównywanych struktur w celu ich optymalnego dopasowania. Wartość parametru wyraża się w angstremach (A) i tak też przyjęto w dalszym tekście. Ogólnie, im niższa wartość parametru, tym struktury bardziej podobne.
PL 221 052 B1
Zatem, ujawniono białka o aktywności proteolitycznej, których struktura trzeciorzędowa jest dostatecznie podobna do struktury proteinazy SplA. Rzeczone podobieństwo mierzymy wartością parametru RMSD dla istotnych komponentów strukturalnych proteinazy SplA w stosunku do odpowiadających im komponentów strukturalnych porównywanego białka. W szczególności ujawniono enzym, który korzystnie spełnia co najmniej jedno z następujących kryteriów:
a) RMSD węgli Ca łańcucha głównego wchodzących w skład aminokwasów tworzących triadę katalityczną (histydyny, seryny i kwasu asparaginowego) jest mniejsze lub równe 2,2 A, korzystnie mniejsze lub równe 1,8 A,
b) RMSD odpowiadających strukturalnie węgli Ca łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych jest mniejsze lub równe 2,0 A, korzystnie mniejsze lub równe 1,5 A,
c) tak jak w (b), z tym, że dobrze zdefiniowane strukturalnie elementy cząsteczki obejmują fragmenty łańcucha polipeptydowego wybrane korzystnie spośród następujących fragmentów określonych wg numeracji SplA oraz odpowiadających im strukturalnie fragmentów porównywanej cząsteczki: Val4 do Glu6, Asn16 do Ala20, Gly24 do Val29, Thr33 do Asn37, Val51 do Ala53, Asn64 do Val67, Ile70 do Glu72, Leu79 do His85, Arg112 do He116, Met128 do Ile135, Phe142 do Phe145, Ser154 do Leu159, Gly167 do Ala171, Asn181 do Tyr185, Glu192 do Gln195;
d) RMSD atomów łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych jest mniejsze łub równe 2,2 A, korzystnie mniejsze lub równe 1,8 A;
e) tak jak w (d), z tym, że dobrze zdefiniowane strukturalnie elementy cząsteczki obejmują fragmenty łańcucha polipeptydowego wybrane korzystnie spośród następujących fragmentów określonych wg numeracji SplA oraz odpowiadających im strukturalnie fragmentów porównywanej cząsteczki: Val4 do Glu6, Asn16 do Ala20, Gly24 do Val29, Thr33 do Asn37, Val51 do Ala53, Asn64 do Val67, Ile70 do Glu72, Leu79 do His85, Arg112 do He116, Met128 do Ile135, Phe142 do Phe145, Ser154 do Leu159, Gly167 do Ala171, Asn181 do Tyr185, Glu192 do Gln195;
f) fragmenty odpowiadające strukturalnie fragmentom białka SplA wybranym korzystnie spośród określonych poniżej tworzą β-harmonijkę: Val4 do Lys5, Val18 do Ala20, Thr25 do Val28 Thr33 do Thr36, Val51 do Ala53, Asn64 do Val67, Asp69 do Glu72, Ala80 do Val84, Arg112 do He116, Phe129 do Gly133, Phe142 do Phe145, Val158 do Leu159, Gly167 do Ala171, Asn181 do Val184;
g) fragmenty odpowiadające strukturalnie fragmentom białka SplA wybranym korzystnie spośród określonych poniżej tworzą helisę: Lys38 do Ala41, Glu192 do Asn196.
Analiza struktury trzeciorzędowej proteinazy SplA pozwoliła zlokalizować regiony oraz reszty szczególnie istotne w procesie rozpoznawania substratu i katalizy. Ujawniano zatem białka posiadające reszty odpowiadające następującym kluczowym resztom aminokwasowym w sekwencji proteinazy SplA:
a. ) reszty tzw. triady katalitycznej, które w przypadku proteinazy SplA stanowią: S154, H39 i D78. Zamiana tych reszt skutkuje całkowitą utratą zdolności katalitycznych.
b. ) reszty odpowiedzialne za rozpoznanie substratu:
P1: przede wszystkim A149, Q150, P151, N153, L169, A171, G172, E177, S178 i N181,
P2: przede wszystkim Y170, H39 i D78,
c. ) reszta kwasu glutaminowego na N-końcu łańcucha polipeptydowego, która to reszta jest odpowiedzialna za stabilizację N-końca białka przez wiązania wodorowe, a tym samym umożliwia wyrażanie pełnej aktywności proteolitycznej. Reszta ta może być ewentualnie zastąpiona resztą kwasu asparaginowego wykazującą podobne właściwości fizykochemiczne.
Ujawnione w pracy J. Mol. Biol. (2006) 358, 270-279 porównanie sekwencji aminokwasowych homologicznych białek gronkowcowych (proteinazy V8 oraz toksyn epidermolitycznych) i trypsyny wskazuje na ważne rejony w sekwencji białka niezbędne dla prawidłowego fałdowania i/lub zachowania funkcji (fig. 1): V28 do 140; D78 do V82; G117 do P119 oraz G152 do I168. Ponadto, widać wyraźnie konserwację pojedynczych reszt: V51; S131; N181; V184 i I194. Jednak dopiero rozwiązanie struktury trzeciorzędowej proteinazy SplA pozwała na stworzenie porównania sekwencji na podstawie porównania struktur - a więc porównania sekwencji odpowiadających sobie elementów strukturalnych (najpierw porównuje się struktury, a następnie tam, gdzie są podobne, zestawia się tylko sekwencje, nawet jeśli nie są one homologiczne w klasycznym rozumieniu). Rozwiązanie takie niesie ze sobą dużo więcej informacji niż zwykłe porównanie sekwencji, gdyż wskazuje elementy ważne dla zachowania funkcji białka. Porównanie takie zostało przedstawione na fig. 2, gdzie odpowiednie fragmenty są zgrupowane na podstawie podobieństw strukturalnych. Takie podejście pozwala na ewidentne wyróżnienie regionów konserwatywnych istotnych dla funkcji białka. Zatem ujawnione białko powinno
PL 221 052 B1 posiadać w miejscach odpowiadających następującym aminokwasom w sekwencji SplA następujące reszty:
Val28 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Val29 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Ile34 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Val35 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Thr36 - optymalnie zawiera aminokwasy wybrane spośród Ser, Thr;
His39 - histydyna triady katalitycznej; optymalnie zawiera His;
Val67 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Ile70 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, He, Ala;
Asp78 - kwas asparaginowy triady katalitycznej; optymalnie zawiera Asp;
Leu79 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;
Ile81 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, He, Ala, Met;
Val82 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met;
Val98 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, He, Ala, Ser, Thr;
Gly117 - optymalnie Gly;
Tyr118 - optymalnie zawiera aminokwasy z dużym, hydrofobowym łańcuchem bocznym wybrane spośród Tyr, Phe, Trp;
Met 128 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, He, Ala, Met;
Ala149 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala;
Gln150 - optymalnie zawiera aminokwasy wybrane spośród Asn, Gln, Asp, Glu;
Pro151 - optymalnie Pro;
Gly152 - optymalnie Gly;
Asn153 - optymalnie zawiera aminokwasy wybrane spośród Asn, Gln, Asp, Glu;
Ser154 - seryna triady katalitycznej o której była mowa wcześniej, musi być Ser;
Gly155 - optymalnie Gly;
Ser156 - optymalnie zawiera aminokwasy wybrane spośród Val, Ala, Ser, Thr, Gly;
Pro157 - optymalnie Pro;
Gly167 - optymalnie Gly;
He168 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, He, Ala;
Leu169 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, He, Ala;
Tyr 170 - optymalnie zawiera aminokwasy wybrane spośród Tyr, Phe, Trp;
Ala171 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala;
Gly172 - optymalnie Gly;
Glu177 - optymalnie zawiera aminokwasy wybrane spośród Asn, Gln, Asp, Glu;
Ser178 - optymalnie zawiera aminokwasy wybrane spośród Ser, Thr, Val, Leu, Ile, Ala;
Asn181 - optymalnie zawiera aminokwasy wybrane spośród Asn, Gln, Asp, Glu;
Phe193 - optymalnie zawiera aminokwasy z dużym, hydrofobowym łańcuchem bocznym wybrane spośród Tyr, Phe, Trp;
Ile194 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala.
Szczególną ujawnioną realizacją jest białko posiadające strukturę proteinazy SplA określoną w tabeli 1.
Zgodnie z prezentowanym wynalazkiem proteinaza SplA rozpoznaje specyficzną sekwencję aminokwasową i hydrolizuje łańcuch polipeptydowy zaraz za lub w obrębie rozpoznawanej sekwencji. Z uwagi na długość rozpoznawanej sekwencji (trzy kolejne aminokwasy) liczba identycznych sekwencji w proteomie człowieka jest niewielka, a więc enzym ten nadaje się m. in. do odcinania metek fuzyjnych przy produkcji pozostałej większości białek ludzkich.
PL 221 052 B1
Wynalazek obejmuje przede wszystkim sekwencje aminokwasowe łańcucha polipeptydowego specyficznie rozpoznawane lub specyficznie rozpoznawane i hydrolizowane przez proteinazę SplA, sekwencje nukleotydowe kodujące rzeczone sekwencje aminokwasowe (a więc pozwalające na produkcję polipeptydów je zawierających przy pomocy technologii białek rekombinowanych) oraz metodę specyficznej hydrolizy polipeptydów zawierających rzeczone sekwencje aminokwasowe przy pomocy proteinazy SplA.
Wynalazek obejmuje także samą proteinazę SplA jako enzym rozpoznający łub rozpoznający i hydrolizujący wybrane sekwencje aminokwasowe oraz sposoby produkcji proteinazy SplA w systemie rekombinowanym. Ponadto wynalazek obejmuje syntetyczne substraty oparte na sekwencjach specyficznie rozpoznawanych i hydrolizowanych przez proteinazę SplA.
Podsumowując, najważniejsze zalety prezentowanego wynalazku, należy uznać, że szczególnie korzystne aspekty wynalazku mogą znaleźć zastosowanie w następujących procesach:
a) rozpoznanie specyficznej sekwencji aminokwasowej łańcucha polipeptydowego (w szczególności sekwencji białka rekombinowanego) i jego specyficzna hydroliza w ściśle określonym miejscu w obrębie lub w niewielkiej odległości od rozpoznawanej sekwencji,
b) wysoce wydajna produkcja proteinazy SplA.
Kolejne przedmioty i poszczególne aspekty niniejszego wynalazku zostały zdefiniowane w zastrzeżeniach patentowych.
Dla lepszego zilustrowania istoty wynalazku niniejszy opis wzbogacono o wykaz sekwencji i figury.
Sekwencja nr 1 (SEQ ID NO 1) prezentuje sekwencję kodującą proteinazę SplA ze Staphylococus aureus wraz z jej natywnym peptydem sygnalnym.
Sekwencja nr 2 (SEQ ID NO 2) prezentuje sekwencję aminokwasową proteinazy SplA ze Staphylococus aureus (dojrzałe białko: aminokwasy od 1 do 200) wraz z jej natywnym peptydem sygnalnym (aminokwasy od -35 do -1).
Sekwencja nr 3 (SEQ ID NO 3) prezentuje sekwencję kodującą wariant proteinazy SplA ze Staphylococus aureus, w której sekwencję kodującą natywny peptyd sygnalny zastąpiono sekwencją kodującą peptyd sygnalny pochodzący z Bacillus subtilis.
Sekwencja nr 4 (SEQ ID NO 4) prezentuje sekwencję aminokwasową wariantu proteinazy SplA ze Staphylococus aureus, w której sekwencję natywnego peptydu sygnalnego zastąpiono sekwencją peptydu sygnalnego pochodzącego z Bacillus subtilis (aminokwasy od -29 do -1).
Sekwencja nr 5 (SEQ ID NO 5) prezentuje sekwencję kodującą białko fuzujne zawierające sekwencję dojrzałej formy SplA z S. aureus, do której przyłączono metkę histydynową i sekwencję rozpoznawaną przez SplA natomiast sekwencja nr 12 (SEQ ID NO 12) prezentuje sekwencję aminokwasową tego białka.
Figura 1 zawiera porównanie sekwencji aminokwasowych blisko spokrewnionych proteinaz: proteinaza SplA, proteinaza SplC, V8 (proteinaza V8 ze Staphylococus aureus zwana inaczej glutamylendopeptydazą), ETA - toksyna epidermolityczna A ze Staphylococus aureus oraz daleko spokrewnionego enzymu - trypsyny (modelowy enzym dla grupy proteinaz trypsynopodobnych). Podobieństwa sekwencji oznaczono odcieniami szarości - im ciemniejsze, tym większe podobieństwo. Regiony o wyraźnej homologii sekwencji oraz pojedyncze konserwatywne reszty zaznaczono ramkami.
Figura 2 prezentuje porównanie sekwencji aminokwasowych blisko spokrewnionych proteinaz stworzone na podstawie znajomości ich struktur trzeciorzędowych oraz znajomości struktury trzeciorzędowej ustalonej dla proteinazy SplA; (chymotryps - chymotrypsyna; enterokina - enterokinaza; czynnik - czynnik X (dziesiąty)); odcieniami szarości wskazano reszty szczególnie istotne dla zachowania struktury i aktywności proteinazy.
Poniższe przykłady zostały umieszczone jedynie w celu lepszego wyjaśnienia poszczególnych aspektów wynalazku i nie powinny być utożsamiane z całym jego zakresem, który zdefiniowano w załączonych zastrzeżeniach.
P r z y k ł a d 1. Wstępna charakterystyka proteinazy SplA
Wyjściowym eksperymentem, umożliwiającym dalsze prace było wyznaczenie optimum pH i temperatur oraz stabilności enzymu. W tym celu należało opracować ilościową metodę oznaczania aktywności enzymu. Wśród znanych substratów proteinaz trypsynopodobnych zidentyfikowano jedynie jeden substrat trawiony tylko w minimalnym stopniu przez proteinazę SplA (N-Suc-Ala-Ala-Pro-Phe-pNA). W przypadku trawienia tego substratu konieczne było stosowanie nadmiaru molowego enzymu w stosunku do substratu oraz długich (rzędu godzin) czasów inkubacji. Pozostałe substraty
PL 221 052 B1 nie były trawione. Przy użyciu zidentyfikowanego substratu udało się jednak określić wstępną charakterystykę aktywności proteinazy SplA jako: optimum pH na 6,5 (± 1,5 jednostki w dół i w górę), brak wyraźnej zależności aktywności od stężeń popularnych soli do 0,5 M, brak wpływu środków redukujących do kilku mM, szeroką tolerancję temperaturową.
Na tej podstawie ustalono podstawowe parametry reakcji hydrolizy zalecane dla reakcji prowadzonej z wykorzystaniem proteinazy SplA. W efekcie, wszystkie kolejne eksperymenty prowadzono w temperaturze od 20°C do 37°C, w 10 do 100 mM buforze octanowym lub cytrynianowym przy wartości pH od 5,5 do 7,5 i stężeniu NaCl od 0 do 150 mM.
Ponadto ustalono, że enzym można przechowywać w stanie zamrożonym bez wyraźnej utraty aktywności, oraz kilkakrotnie zamrażać i rozmrażać, a także liofilizować. Można go także przechowywać kilka miesięcy w temperaturze 4°C bez wyraźnej utraty aktywności. Wszystkie powyższe warunki stanowią dogodne formy przechowywania enzymu, co jest niezwykłe istotne w codziennej praktyce.
P r z y k ł a d 2. Wstępne próby ustalenia specyficzności substratowej proteinazy SplA
Trawienie β-kazeiny
Standardowo dla oznaczenia specyficzności substratowej proteinazy kontaktuje się ją z różnymi białkami, oznacza się miejsca hydrolizy i na podstawie odpowiedniej ilości prób metodami analizy statystycznej ustala się najbardziej optymalne miejsce cięcia. Takie standardowe postępowanie zastosowane zostało w pierwszym podejściu także dla proteinazy SplA, jednak nie przyniosło ono spodziewanych wyników. Wykazano, że szereg testowanych białek lizozym jaja kury, ludzki cytochrom c, mioglobina wieloryba, fibrynogen wołowy, Rnaza, inhibitor trypsyny z nasion soi, elastaza, kozie przeciwciała IgG nawet przy przedłużonej inkubacji z nadmiarem enzymu nie ulega proteolizie.
Wykrywalną aktywność białka SplA wykazano jedynie metodą zymografii na β-kazeinie. Dalsze eksperymenty innymi metodami (kontaktowanie proteinazy i kazeiny w roztworze, analiza produktów proteolizy przy pomocy SDS-PAGE) potwierdziły ten fakt jednak wykazały też, że dla przeprowadzenia reakcji hydrolizy potrzeba zastosowania molowego nadmiaru enzymu i bardzo długich czasów inkubacji - kilkunastu godzin. Oznacza to, że enzym „bardzo niechętnie” hydrolizuje 8-kazeinę (standardowo przy tego typu badaniach stosuje się katalityczne ilości enzymu - 100 x i mniej niż substratu oraz krótkie czasy inkubacji - rzędu minut). Metodami spektrometrii masowej oraz chemicznego sekwencjonowania aminokwasowego udało się oznaczyć trzy miejsca cięcia w obrębie cząsteczki β-kazeiny oraz jedno miejsce cięcia w obrębia karboksymetylowanego lizozymu (cięcie karboksymetylowanego lizozymu opisano poniżej; spacja oznacza miejsce cięcia):
KIHPF AQTQS
PVEPF TESQS
AFLLY QEPVL
GSTDY GILGI
Na podstawie tej niewielkiej (a więc mało reprezentatywnej) grupy można by założyć, że zgodnie z wiedzą, iż w tego typu proteinazach specyficzność determinuje reszta w pozycji P1 proteinaza SplA potrzebuje reszty o dużym relatywnie hydrofobowym łańcuchu bocznym (Y, F) w miejscu P1 substratu (wyróżnione tłustym drukiem). Założenie takie nie tłumaczy zupełnie dlaczego trawieniu nie ulegają inne białka zawierające bardzo wiele reszt tyrozyny i fenyloalaniny, a w szczególności sama β-kazeinia która była trawiona jedynie na kilka fragmentów pomimo, że zawiera łącznie kilkanaście reszt Y i F. Ponadto, założenie takie nie tłumaczy także, dlaczego proteinaza SplA jest tak mało wydajna.
Warto także zauważyć, że w pozostałych pozycjach sekwencji trawionych przez SplA w kazeinie, tj. P5 do P1 oraz P1' do P5' nie można ustalić żadnego wspólnego elementu czy charakterystycznego układu, który sugerowałby znaczenie tych pozycji dla specyficzności substratowej badanej proteinazy.
Trawienie substratów syntetycznych, denaturowanych białek i peptydów syntetycznych
W obliczu niepowodzenia eksperymentów opisanych powyżej przyjęto robocze założenie, że proteinaza SplA może trawić jedynie w specjalnych, eksponowanych rejonach białek, a z uwagi na ukrycie innych rejonów zawierających reszty F i Y wewnątrz struktury cząsteczki białek stosowanych jako substraty nie są one rozpoznawane i trawione. Dlatego przeanalizowano ponownie wybrane białka po uprzedniej denaturacji (karboksymetylowany lizozym, apomioglobina w formie denaturowanej, po usunięciu cząsteczki hemu) oraz wybrane peptydy powstające podczas degradacji cząsteczki hemoglobiny. Testowano także substraty syntetyczne charakteryzujące się brakiem struktur drugorzę12
PL 221 052 B1 dowych a posiadające w miejscu P1 reszty z hydrofobowymi łańcuchami bocznymi, gdyż zgodnie ze stanem wiedzy oraz wynikami eksperymentalnego trawienia kazeiny substraty takie powinny być hydrolizowane. Testowano następujące substraty (reszta w pozycji P1 pogrubiona):
N-Ala-Phe-pNa
N-Gly-Phe-pNA
N-Suc-Phe-pNA
N-Acetyl-L-Tyr-pNa
N-Meo-Suc-Ala-Ala-Pro-Val-pNA
N-Suc-L-Phe-pNA
Nsuc-Ala-Ala-Ala-pNa
Z-Leu-Leu-Leu-Amc
Suc-Ala-Ala-Ala-Amc
We wszystkich przypadkach, pomimo stosowania także nadmiarów molowych proteinazy SplA oraz przedłużonych czasów inkubacji (do 72 h) nie udało się wykazać hydrolizy badanych polipeptydów. Jedynie karboksymetylowany lizozym był słabo hydrolizowany do dużych fragmentów (niewiele miejsc cięcia). Oznaczono jedno z miejsc cięcia w karboksymetylowanym lizozymie.
Zatem, standardowa metoda oznaczania specyficzności substratowej opisana powyżej, w przypadku proteinazy SplA zupełnie zawiodła.
P r z y k ł a d 3. Metoda otrzymywania proteinazy SplA
SEQ ID NO: 1 i 2 przedstawia odpowiednio sekwencję nukleotydową genu kodującego proteinazę SplA ze Staphylococus aureus oraz odpowiadającą jej sekwencję aminokwasową. Numeracja nukleotydów rozpoczyna się od ,,a(1)” trójki startu translacji (atg) a kończy na ,,a(708)” trójki stopu translacji (taa). Łańcuch polipeptydowy proteinazy powstaje w procesie translacji w połączeniu z peptydem sygnalnym (numeracja reszt aminokwasowych od M(-35) do A(-1)), który w procesie sekrecji jest odcinany przez proteinazę sygnalną. Powstaje wtedy aktywna zewnątrzkomórkowa forma proteinazy SplA, którą można wyizolować z pożywki hodowlanej (numeracja reszt aminokwasowych od E1 do K200). W opisie stosuje się numerację wprowadzoną na tych sekwencjach.
Sekwencje kodujące dojrzałą formę proteinazy SplA (E1 do K200) sklonowano do odpowiedniego plazmidu ekspresyjnego otrzymując plazmid umożliwiający produkcję zewnątrzkomórkową dojrzałej formy proteinazy SplA w bakteriach gramdodatnich. Sekwencję białka fuzyjnego składającego się z sygnałowej sekwencji sekrecyjnej specyficznej dla B. subtilis oraz dojrzałej formy proteinazy SplA, a także sekwencję nukleotydową kodującą to białko przedstawiono odpowiednio jako SEQ ID No 4 i SEQ ID No 3.
W celu uzyskania białka zrekombinowanego bakterie B. subtilis szczep WB800 transformowano plazmidem ekspresyjnym i prowadzono selekcję transformantów na płytkach zawierających kanamycynę (50 μg/m). Wyselekcjonowanymi klonami inokulowano niewielką ilość płynnej pożywki (TSB; Sigma) zawierającej antybiotyk selekcyjny i inkubowano w 37°C z intensywnym mieszaniem przez 8 do 10 h. Tak przygotowaną hodowlą startową inokulowano hodowlę właściwą (4-16 L płynnej pożywki z antybiotykami) i inkubowano przy intensywnym mieszaniu w 37°C przez 13 do 16 godzin. Wszystkie dalsze etapy oczyszczania przeprowadzano w 4°C. Bakterie oddzielano od pożywki przez wirowanie przy przyspieszeniu 6000 x g przez 30 min. Białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysalano siarczanem amonu do 80% nasycenia (561 g/L w 4°C). Wysolone białka oddzielano od pożywki przez wirowanie (15000 x g, 1 h), rozpuszczano w niewielkiej ilości 50 mM buforu octanowego pH 5,5 i dializowano przez noc do dużego nadmiaru tego samego buforu. Przedializowaną próbkę poddawano chromatografii jonowymiennej na złożu SP Sepharose FF (GE Healthcare) i zbierano frakcje zawierające największy szczyt białkowy wymywający się przy przewodnictwie buforu wynoszącym ok. 27 mS/cm. W razie wątpliwości frakcje testowano na obecność aktywności proteolitycznej metodą zymografii lub na obecność białka o odpowiedniej masie cząsteczkowej przy pomocy elektroforezy SDS-PAGE albo w inny dogodny sposób. Preparat dializowano do 50 mM buforu octanowego pH 5,0 i poddawano chromatografii jonowymiennej na złożu SOURCE 15S (GE Healthcare). Zbierano frakcje zawierające główny szczyt białkowy i poddawano sączeniu molekularnemu na złożu Superdex S75 w buforze PBS. Tak przygotowany, oczyszczony preparat zagęszczano, porcjowano i przechowywano zamrożony w -20°C.
P r z y k ł a d 4. Ustalenie struktury trzeciorzędowej i specyficzności substratowej proteinazy
SplA
PL 221 052 B1
Metoda opisana w przykładzie 3 pozwoliła na wydajną produkcję badanego białka umożliwiając prowadzenie dalszej analizy jego struktury, a zwłaszcza uzyskanie krystalicznej postaci proteinazy SplA i ustalenie struktury trzeciorzędowej badanej proteinazy, co w efekcie przyczyniło się do określenia specyficzności substratowej proteinazy SplA.
Analiza struktury trzeciorzędowej proteinazy SplA
W celu wskazania na ewentualne determinanty strukturalne obserwowanej bardzo słabej kinetyki hydrolizy wiązań peptydowych oraz ewentualne wskazanie lepszych substratów, metodą krystalografii rentgenowskiej określono strukturę trzeciorzędową proteinazy SplA. Ustalone koordynaty poszczególnych atomów białka dojrzałej proteinazy SplA zgromadzono w tabeli 1. Analiza otrzymanego modelu strukturalnego wskazała, że proteinaza SplA wykazuje budowę charakterystyczną dla proteinaz rodziny SI (trypsynopodobnych/chymotrypsynopodobnych) nie wykazując wyraźnych uwarunkowań w budowie triady katalitycznej dla obserwowanej słabej aktywności. Choć dwa z czterech modeli wykazywały nieznaczne odstępstwo His39 od normalnie obserwowanej pozycji w proteinazach serynowych jest to raczej wynikiem oddziaływań z wewnątrz kryształu, a nie wewnętrzną cechą samej proteinazy SplA. Tym bardziej, że dwa pozostałe modele wykazują bardzo niewielkie odstępstwo od ogólnie przyjętego dła proteinaz serynowych rodziny S1 wzorca. Ponadto, analiza wykazała dobrze wykształcone miejsce P1 zdolne do przyjęcia aminokwasów dużych relatywnie hydrofobowych reszt bocznych aminokwasów, takich jak: Y, F oraz ewentualnie W.
Kluczowe reszty aminokwasowe w sekwencji proteinazy SplA
Ze stanu techniki wiadomo, że kluczowymi resztami dla aktywności trypsynopodobnych proteinaz serynowych są reszty tzw. triady katalitycznej. W przypadku proteinazy SplA, uzyskana struktura trzeciorzędowa potwierdza, że są to: S154, H39 i D78. Zamiana tych reszt skutkuje całkowitą utratą zdolności katalitycznych.
Na podstawie ustalonej struktury trzeciorzędowej proteinazy SplA oraz modelowania sposobu dokowania substratu m. in. na podstawie znajomości struktur kompleksów homologicznych białek z ich substratami i inhibitorami wynika, że reszty odpowiedzialne za rozpoznanie substratu to:
P1: przede wszystkim A149, Q150, P151, N153, L169, A171, G172, E177, S178 i N181,
P2: przede wszystkim Y170, H39 i D78.
Porównanie sekwencji aminokwasowych oraz struktur trzeciorzędowych homologicznych białek gronkowcowych (proteinazy V8 oraz toksyn epidermolitycznych) i trypsyny wskazuje na ważne rejony w sekwencji białka niezbędne dla prawidłowego fałdowania i/lub zachowania funkcji (patrz figura 1): V28 do 140; D78 do V82; G117 do P119 oraz G152 do I168. Ponadto, widać wyraźnie konserwację pojedynczych reszt: V51; S131; N181; V184 i I194.
Analiza bibliotek substratów syntetycznych
Bazując na wynikach analizy krystalograficznej, w dalszym etapie poszukiwania optymalnych substratów dla proteinazy SplA wykorzystano kombinatoryczną bibliotekę substratów syntetycznych zawierającą 104976 różnych substratów. Biblioteka zawiera substraty, w których na pozycjach P4 do P1 znajdują się wszystkie możliwe permutacje 18 aminokwasów (poza metioniną i cysteiną), a pozycję P1' zajmuje 7-amido-4-fluorometylokumaryna, barwnik wykazujący fluorescencję po odcięciu przez proteinazę od części peptydowej co pozwala na detekcję preferowanych substratów (szczegółowy opis Biol. Chem. (2004). 385: 1093-1098). W pierwszym etapie badań zgodnie z przekonaniem wynikającym ze stanu techniki, że reszta w pozycji P1 determinuje specyficzność proteinaz tyrpsynopodobnych skupiono się na ustaleniu preferowanej reszty w pozycji P1. Przegląd biblioteki proteinazą SplA pozwolił na ustalenie, że proteinaza SplA w pozycji P1 na 18 testowanych reszt bocznych toleruje jedynie następujące aminokwasy: Phe i Tyr (wynik zgodny z wynikami trawienia β-kazeiny oraz z przewidywaniami na podstawie analizy struktury proteinazy). Szybkość trawienia wyselekcjonowanych substratów była porównywalna z innymi proteinazami demonstrując, że proteinaza SplA wcale nie jest mało wydajna, jak sugerowały wyniki wcześniejszych eksperymentów opisanych w przykładach 1 i 2.
Stosowana biblioteka nie umożliwia odczytania wyników selekcji w pozycjach P2 do P4. Rozważając jednak odpowiedź na pytanie dlaczego proteianza SplA nie trawi innych poza B-kazeiną białek, w których znajduje się cały szereg reszt Phe i Tyr, na tym etapie prac stało się oczywiste, że trypsynopodobna proteinaza SplA posiada znacznie większą specyficzność substratową w porównaniu z jej bliskimi (proteinaza V8) i dalekimi (trypsyna, chymotrypsyna i wiele innych) homologami.
PL 221 052 B1
Analiza biblioteki kombinatorycznej CLiPS
Wysoka specyficzność substratowa zmusza do przesiania znacznie większej ilości substratów dla znalezienia tego właściwego i stąd konieczność zastosowania bardziej zaawansowanej metody CLiPS (opisanej w publikacji PNAS (2006), 130: 7583-7588). Bardzo ogólnie, w uzyskanej tą techniką bibliotece jedno z białek zewnętrznej błony komórkowej bakterii jest tak skonstruowane syntetycznie, że zawiera wszystkie możliwe permutacje liniowej sekwencji kilku aminokwasów (każdy szczep bakterii należący do biblioteki zawiera białko o konkretnej sekwencji, ale inne niż pozostałe szczepy bakterie należące do biblioteki). Za sekwencją zmienną znajduje się sekwencja umożliwiająca detekcję fluorescencyjną. Pierwszy etap selekcji (cytometria przepływowa) wybiera komórki fluoryzujące (gdzie interesujące białko ulega ekspresji) następnie komórki te kontaktuje się z testowaną proteinazą i selekcjonuje się te, które nie fluoryzują, a więc te, dla których proteinaza odcięła część fluoryzującą. Następnie dla wyselekcjonowanych w ten sposób szczepów określa się sekwencję interesującego białka, a więc i sekwencje cięcia. Zastosowanie tej metody pozwala na przesianie 64 milionów substratów i uzyskanie informacji co do aminokwasów występujących w pozycjach P5 do P1', a nie tylko P1 (jak w technice opisanej powyżej). Wykorzystując tą metodę wyselekcjonowano następujące sekwencje rozpoznawane i cięte przez proteinazę SplA:
P3P2Pl*Pl’ Szybkość cięcia
M RWLY * - - 0,9
- WLY * S E 0,9
T GWLY * - - 0,8
- IYEY * A - 0,6
E LYEY * - - 0,7
T VYEY * - - 0,9
G VYMY * - - 0,7
- VYAY * S - 0,95
- FYTY * S - 0,9
- LYLY * G - 0,9
- AFLY * G- 0,6
T TFLY * - - 0,6
- IVLY * T - 0,3
- VVLY * T - 0,9
- YWLS * T - 0,9
- YWMN * T - 0,8
- YWWY * T- 0,95
G AWLY * - - 0,95
(Y, W, F)LY* Sekwencja konsensusowa
Wytłuszczoną czcionką zaznaczono aminokwasy odpowiadające dokładnie wyselekcjonowanej sekwencji konsensusowej, podkreślono aminokwasy dobiegające od sekwencji konsensuowej, gwiazdką oznaczono miejsce cięcia. Liczba po prawej stronie sekwencji jest miarą szybkości trawienia.
W świetle wcześniejszych eksperymentów i stanu techniki uzyskany wynik jest co najmniej nieoczywisty. Dotychczasowa wiedza o biochemii dziesiątek proteinaz trypsynopodobnych wskazuje prawie wyłącznie na miejsce P1 jako determinujące specyficzność substratową w tego typu białkach. Również wysoce homologiczna do proteinazy SplA - proteinaza V8 także ze Staphylococus aureus wykazuje specyficzność jedynie dla reszty P1. Dlatego pierwotne oczekiwano, zgodnie z ogólnym stanem wiedzy, że tak samo będzie w przypadku proteinazy SplA. Ponieważ proteinazy specyficzne tylko dla P1 nie są szczególnie specyficzne mierząc miarą metody CLiPS, metoda ta nie jest zalecana
PL 221 052 B1 do określania specyficzności takich enzymów. Dopiero wiele niepowodzeń przy próbach przyrównania proteinazy SplA do wiedzy wynikającej ze stanu techniki skłoniło twórców do postawienia i przetestowania innej, mniej prawdopodobniej hipotezy dotyczącej specyficzności badanej proteinazy, która to hipoteza nieoczekiwanie okazała się prawdziwa.
P r z y k ł a d 5. Wykorzystanie proteinazy SplA do specyficznej hydrolizy białek zawierających sekwencje aminokwasowe według wynalazku
Trafność wyboru sekwencji konsensusowej oraz przydatność proteinazy SplA zostały potwierdzone w kolejnych eksperymentach. Wykorzystano plazmid umożliwiający ekspresję stafostatyny A jako białka fuzyjnego z GST odcinalnym przy pomocy trombiny (opisany w Mol. Microbiol. (2003) 49: 1051-1066; zawierający sekwencję kodującą białko stafostatyna A, którą sklonowano techniką PCR z matrycy genomowego DNA S. aureus do plazmidu pGEX-5T w miejsca BamHl/XhoI uzyskując plazmid umożliwiający ekspresję białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A). Inkubacja białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A z proteinazą SplA, nawet przy przedłużonym czasie inkubacji z nadmiarem enzymu, nie prowadzi do widocznej w metodzie SDS-PAGE hydrolizy interesującego łańcucha polipeptydowego.
Metodami inżynierii genetycznej (mutageneza punktowa) zamieniono w omówionym wyżej plazmidzie sekwencję nukleotydową kodującą miejsce cięcia dla trombiny (LVPR*GS) na sekwencję konsensusową (YLY*S) uzyskując plazmid umożliwiający ekspresję białka fuzyjnego GST-miejsce cięcia proteinazy SplA-stafbstatyna A. Białko to wyprodukowano w bakteriach E. coli szczepu BL21 pLysS i oczyszczono wykorzystując powinowactwo białka fuzyjnego GST do immobiłizowanego glutationu analogicznie jak opisano Mol. Microbiol. (2003) 49: 1051-1066 dla białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A.
Kontaktując tak przygotowane białko z proteinazą SplA wykazano bardzo szybką hydrolizę łańcucha polipeptydowego (w czasie rzędu kilkunastu minut przy stukrotnym nadmiarze molowym substratu nad proteinazą SplA). Oznacza to, że proteinaza SplA nie jest mało wydajnym katalitycznie enzymem jak sugerowały eksperymenty z trawieniem B-kazeiny. Przeciwnie, dowodzi to, że jest ona enzymem bardzo wydajnym katalitycznie ale jedynie w stosunku do substratów o prawidłowej sekwencji, która jest nieoczekiwanie znacznie bardziej rozbudowana w porównaniu ze znanymi proteinazami trypsynopodobnymi.
Ponadto, wyizolowano stafostatynę A uwolnioną z białka fuzyjnego przez trawienie proteinazą SplA i oznaczono metodą degradacji Edmana jej N-końcową sekwencję wykazując, że proteinaza SplA tnie specyficznie i precyzyjnie w obrębie rozpoznawanej sekwencji jedynie w określonym * miejscu (YLY*S).
Podobny wynik powinien przynieść eksperyment, w którym sekwencję rozpoznawaną przez proteinazę SplA wg. opisu, zwłaszcza sekwencję konsensusową YLYS, umieszcza się pomiędzy „metką” histydynową (His-Tag) lub dowolną inną „metką” a dowolnym interesującym białkiem lub między dowolnym interesującym białkiem a dowolną metką, by tak samo jak poprzednio uzyskać precyzyjne odcinanie metki od interesującego białka.
PL 221 052 B1
T a b e l a 1
Koordynaty struktury trzeciorzędowej proteinazy SplA ze Staphylococus aureus oznaczenia: NA - numer porządkowy atomu, A - rodzaj atomu, AK - rodzaj aminokwasu,
NAK - numer porządkowy aminokwasu w strukturze pierwszorzędowej, X, Y, Z - koordynaty atomu
MA Α j AC HAK X Y 2 99 CA ERO 14 39.322 -11.100 43.759
1 Μ ! GUI 1 13.268 -17.309 45 -246 Ϊ00 CB PRO 14 .38.224 -11 950 43.012
2 CA i GLU 1 18.925 -17.451 46-600 101 cq PRO 14 37-Θ12 -13.009 43 .912
3 CB j GLU 1 20.353 - 17.991 46,556 102 CD PRO 14 38.622 •13-001 45,172
4 CG OLU 1 20-602 -19.027 45.545 103 c PRO 14 38.701 -9.858 44.276
5 CD GLU 1 21.864 -19.794 45.851 104 G PRO 14 3S ,614 -a.953 43 .487
6 οει GŁt) 1 22.425 -19-813 47.CBS Ϊ.05 N TYK 15 38.547 •9-753 45,571
Ί ΟΕ2 GLU 1 22.279 -20.427 44 .089 1.06 CA TYR 15 37-930 -8-578 46.205
Β C GLU 1 19.003 -15.175 47.393 107 CB TYR 15 37.663 -8.813 47.727
9 Ο GL0 1 19.021 -15.042 46.807 108 CG TYR 15 37.193 -10.229 47.942
10 Μ LYS 2 19.07? -15.373 48.715 109 CDI TYR 15 39.059 -11.236 40.471
11 CA LYG 2 15.421 -15.354 49.657 110 CEł TYR 15 37.605 -12.62J 48-558
13 CB LYS 2 19.273 -15.175 50.646 111 cz TYR 15 36.304 12.944 40.095
13 CG LYS 2 17.446 -13 -903 50.453 112 OH TYR 15 35-768 -14.233 48.13$
14 CD LYS 2 16.021 -14 174 50,791 113 CE2 TYR 15 3^.475 -11-956 47.569
15 CE LYS 2 15.179 -12.908 50.635 114 CD 2 TYR 15 35.926 -10.609 47.504
16 ΝΖ LYS 2 13.516 -13,214 50.178 115 C TYR 15 38.662 -7.201 45.964
17 C LYS 2 20.727 -15 724 50.304 116 O TYR 15 38-039 -6.291 45.931
; 16 Ο LYS 2 20.-514 •15.642 51.605 117 M ASM 16 39.976 -7.354 45-Ή4
19 X ASM 3 31-768 16,101 49.655 HS CA ASM 16 40.7C5 -6.104 45.614
20 CA ASM 3 23 -056 -16,396 50.298 119 CB ASM 16 42,120 -6.103 46.100
21 CB AKM 3 23.523 -17.778 49.817 120 CC ASN Ifi 42.971 -7.063 45-287
22 ; CG AEN 3 24.702 ifi.aai 50.62R 121 GDI ASM 16 42.516 -7,841 44.466
23 001 ASM 3 24.762 -18,123 51,879 122 WD2 ASM 16 44-222 -6.969 45.512
24 ΝΌ2 ASM 3 25.649 -18.960 49-930 123 C ASM 1S 40-550 -5 -459 44.237
25 C ASM 3 24.210 -15.320 50.235 124 O ASM 1S 41.101 -4.348 44.002
26 (5 ASM 3 25-005 -15.270 49.300 125 N SER 17 39.759 -6.105 43.377
27 H VAL 4 24.319 -14-533 51-296 126 CA SER 17 39.441 ”5-549 42.07Ć
26 CA VAL 4 25.074 -13.283 51.368 127 CB SER 17 39.S65 -6.545 40-912
29 ca VAL 4 24.003 -12.086 51.338 328 CG SER 17 30.786 “7.614 40.991
30 CG1 VAL 4 24-603 -10.717 51.691 129 C SER 17 30.034 “4.92 6 42.046
31 CG2 VAL 4 23.241 -12.060 50.020 130 c SER 17 37.557 -4.463 40.991
32 C VAL 4 26.127 -13.1ĆS 52.592 131 H VAL 18 37.382 -4.S91 43-213
33 Ο VAL 4 25.740 -L3.15S 53.784 132 CA VAL 18 36.007 “4.375 43.271
34 X LYS 5 27.436 -13.102 52-277 133 CB YAL ia 35.092 “5.235 44.141
35 CA LYS s 28.532 12.904 53.260 134 CC-1 VAL 18 33.710 -4.624 44-20S
36 C5 LYS 5 29.749 -13.654 53.006 »5 CG2 VAL 18 35.045 -6.756 43.55$
37 CG LYS 5 29.410 -15-174 52.412 136 c VAL 10 3S.090 -2.950 43.715
3S C LYS 5 29.052 11.453 53-133 137 0 VAL 18 36 .787 -2*631 44.6eo
39 Ο LYS 5 23.385 -11.031 52.003 ue M VAL 19 35.414 -2.051 43.010
40 Μ GŁU 6 29.137 -10.721 54 .248 139 CA VAL 29 35.417 -O . 6-68 43.454
41 CA GŁU 6 29.926 -•3-507 54-239 140 CB VAL 29 36.033 0.278 42 . 3W2
42 CB GLU 6 22.821 -8.714 55.529 141 CG1 VAL 19 37.549 -0.062 42-230
43 C£1 GLU 6 31-041 -7.852 55.678 142 CG2 VAL 19 35.397 0.169 41.033
44 CU GLU 6 30.864 -6-650 56.481 143 C VAL 19 34.015 - 0,2.17 43.352
45 GE1 GLC 6 31.616 -5.664 55,257 144 O VAL 19 33.050 -0,721 43.330
46 GE 2 GLU O 29.990 -6.658 57.354 145 H ALA 20 33.924 C-. 742 44.767
47 C GLU 6 31.389 -9.854 53.921 146 CA ALA 20 32.648 1.441 45.094
46 0 GŁU 6 31.896 -10.852 54.358 147 CB ALA 20 32-562 1.785 46 .547
49 X ILE 7 32.045 -9.051 53.005 148 C ALA 20 32-450 2-701 44.280
50 CA ILE 7 33.481 -S.1S6 S2.939 149 O ALA 20 33.308 3 .525 44-174
51 ca ILE 7 33.971 -9.38S SI,526 150 » ?HE 21 31.315 2 <303 41.605
S2 CGl ILE 7 33-510 -10.784 51-056 151 CA PHE 21 30.954 4.077 43.001
53 CDI ILE 7 33 . 382 -10.872 49.642 152 CB PHE 21 30.237 3.913 41.652
54 032 ILE 7 35.493 9.354 51.481 153 CG PHE 21 31.161 3.752 40.552
55 C ILE 7 34.172 -a.152 53.739 154 CDI PHE 21 31.782 2.509 40.337
56 0 ILE Γ 7 34.09S -6.941 53.438 155 CE1 PHE 21 32.734 2 .344 39.326
57 K THR S 34.793 -S .702 54.770 156 CC ?HE 21 33.127 3 .4 87 33-551
CA IMfe 8 35.417 -7.970 55.907 167 CE2 PHE 21 32.533 4.731 38.786
59 ca TH fi 8 35.479 “9.021 57.069 1SB CD2 PHE 21 31-544 Ł-8S? 33.807
60 0G1 THE 3 34.384 -a.77B 57.972 159 C ?:-!£ 21 30.«42 4-650 44.025
61 CG2 THR a 36.S33 9.14C 57.748 160 O PHE 21 29.634 3.995 44.3S7
62 C THR 8 36.750 -7.272 55.544 161 H VAL 22 29.581 5.877 43.813
63 O THS. 8 36.948 -6.092 55.33? 162 CA TOK 22 28.783 0-4Θ5 44.763
64 ti ASP 9 37.612 -S.OOC 54.855 163 CB VAL 22 28.782 e.eeo 44..48S
6S CA ASP 8 38.367 -7.50S 54,377 164 ran VAŁ 22 27.721 8.440 43.437
«δ CB ASP 9 39.991 -0.290 55.105 165 CG2 VAL 22 28.747 8.615 45.791
> 67 CC ASP 3 41.387 '7.734 54 .023 166 C VAL 22 27,373 5-737 44.917
60 CDI ASP 9 41-838 -7.752 53.643 167 o VAL 22 26.087 5.550 46.037
69 002 AS? 9 42.059 -7.281 55.792 160 N GLY 23 26.746 5.3 04 43.821
70 C AS? 9 3S.S52 -7.667 52.331 169 CA GLY 23 25.519 4.513 43.936
71 O ASP 9 33.110 -B .789 52.314 170 C GLY 23 25.535 3.122 43.289
72 N AIA 10 30-900 -6.540 S2.103 171 O GLY 23 24.SS2 2.570 43-649
73 CA ALA 10 38 .814 6.566 50,628 172 N GLY 24 26.762 2.723 43.223
74 CR ALA 10 37 -826 -5.578 50.085 173 CA GLY 24 2S.917 1-216 42.594
75 C AIA 10 40.222 -6.450 49.953 174 C GLY 7.4 28.328 3.671 42-646
76 0 AIA 10 40.388 -5.921 48-535 175 0 GLY 24 29.170 1 . 037 43-502
77 N THR 11 41.214 -7.005 50.633 176 N THR 25 28,603 0.228 41.715
78 CA THR u 42.624 -6-697 50.421 177 CA TUR 25 29 803 -1-001 41.828
73 CB THR 11 43.249 -6 .676 51.823 178 CB THR 2S 29.455 •2.47S 45.313
30 DCI TKR 11 43.670 -5 .347 53 -097 179 OG1 THR 25 25.000 -2.410 43.5B4
81 CG 2 TOR 11 44,374 -7 .069 51.963 łoa CG2 THR 25 30-693 -3.339 45.413
32 c THR 11 43-192 -7.742 49,492 lei C THR 25 30.492 •0.993 40,486
83 0 THR 11 44.037 -7.466 40 - 663 182 O THR 25 25.8B0 -0.664 39.493
34 M LYS 12 42.657 -3.949 49-616 103 N GLY 26 31.771 -1.349 40.492
35 CA LYS 12 43.104 -10.005 40.842 184 CA GLY 26 32.574 -1-606 3S.25B
86 CB LYS 12 43.215 11.337 49.763 IBS C GLY 26 33.706 -2.575 39.566
87 C LYS 12 42.154 -10.266 47.626 106 O GLY 26 33,949 -2.012 40.746
S8 a LYS 12 41,015 -3.748 47.650 107 M VAL 27 34.291 -3.199 38.51?
S9 M GLU 13 42,642 -10.962 46.578 108 CA VAL 27 30.472 -4.131 38.603
30 CA GLU 13 41.944 11.105 45.204 199 CB VAL 27 35.3S7 -5.431 37.7M i
91 ca GLU 13 42.913 -11.496 44.154 190 CG1 VAL 27 35 - 624......Γ -5.113 38.583
92 CG GLU 13 44.423 -11 . 252 44-513 191 CG 2 VA1, 27 34,217 j -5.539 36.810
93 CD GW 13 45.298 -11 .499 43 .254 192 C VAL 27 36.660 ί -3.55« 37,859
94 OE1 GLU 13 44.832 -12.311 42.366 293 O VAL 2? 36.496 -2.5β9 36,750
95 OE2 GLU 13 46.400 -10.845 43-153 194 M YAI, 28 37.854 -3.825 38.394
96 C C-LU 13 40.944 -12 .240 45.379 1S5 CA VAL 28 33.103 j -3-355 37.765
97 O GLU 13 41.284 -13.24S 45.915 S 196 CB UAL 28 40.242 t -3 -071 3S.747
98 X FRO 14 39.738 -12-122 44.780 j 197 CESI VAŁ 28 41.423 { -2 .525 37.956
PL 221 052 B1
193 1 CG2 VAL 28 39.730 2-03Ϊ 39-733
139 i C VAL 28 39.592 -4.316 36.740
200 C VAL 20 39.712 -5.4H9 36.962
201 N VAL 29 39.863 3.789 35.585
202 CA VAL 29 40.104 -4.037 34.425
203 CB VAL 29 36-905 4.349 33.476
204 CG1 VAL 29 39.260 -3.547 32-185
205 CG2 VAL 29 38.004 -5.561 33,349
206 C VAL 39 41. .565 -4.472 33.871
207 0 VAL 29 41.968 5.312 32.983
2oe u GLY 30 42.366 -3.560 34.460
209 CA GLY 30 43.636 -3.108 33.087
210 C GLY 3C 44 ,136 -1.753 34.299
211 a SLY 30 43.616 -1.056 36.138
212 N LYS .11 45-349 -1.380 33.743
213 CA LYS 31 45.976 - 0.092 34,061
214 CB LYS 31 47.131 0 - 225 33-080
225 CG LYS 31 40.168 1.447 33-422
i 216 C LYS 31 44-863 1.006 34.033
217 0 LYS 31 44 .297 1.337 32.972
23 8 N ASN 32 44.558 1.544 36.207
2X9 CA ASN 32 43,628 2.680 35.400
220 CB ASN 32 44.309 4.050 35,170
221 CG ASN 32 45.724 4.092 35-710
222 GDI ASM 32 46.639 4.573 35,061
223 NDJ ASM 32 45.911 3.568 36.861
224 C ASN 32 42.213 2.556 34.781
225 0 ASN 32 41.560 3.566 34 .435
226 K TOR 33 41.727 1.318 34 .739
227 CA TOR 33 40.632 0.977 33.862
223 CB TOR 33 41.109 0.244 32.568
229 OG1 TOR 33 41-957 1.115 31.813
230 CG2 TOR 33 39.3R7 -0.05? 31.613
231 C TOR. 33 39.616 0.162 34.592
232 0 TOR 33 39.371 -0.963 34.530
233 H JLB 34 38.442 0.746 34.795
234 CA ILE 14 37.250 0.107 35.473
235 CE ILE 34 36.752 0-989 36-644
236 CG1 ILE 34 37.752 0.984 37.796
237 CDI ηε 34 37.744 2.214 3 8 .596
238 CG2 ILE 34 35.433 0.534 37.186
239 C ILE 34 35.117 -0,369 34.519
240 O ILE 34 35.910 0.603 33.644
241 N YAL 35 35-370 -1.248 34.783
242 CA VAL 35 34-146 -1,540 34.045
243 CB VAL 35 34.209 -2-919 33.371
244 CG1 VAL 35 32.823 3.3 26 32.850
245 CG2 VAL 35 35.205 -2.S69 32.174
246 C VAL 33 32.904 -1.4D6 34.953
247 O VAL 35 32.895 -1.937 36.090
248 El TOR 36 31.855 -0.702 34.463
249 CA TOR 36 30,575 -0-540 35,227
250 ca TOR 36 3C . 683 0.576 36-273
251 GGl TOR 36 29 .530 0.534 27.123
252 C'52 TOR 36 30.369 I . 937 35.608
253 C TUR 36 29.375 -0.330 34.298
254 0 TOR 36 25.564 -0.476 33.128
256 N ASN 37 28.159 -0.040 34.902
256 CA ASN 37 27.041 0.337 33-953
257 Cfl ASN 37 25.746 0.265 34.775
256 CG ASN 37 2fi.381 1 .146 35-173
259 OO1 ASN 37 25.616 - 2,116 34.446
250 ND2 ASN 37 24.803 -1.275 36.323
261 C ASN 37 27.217 1.746 33.395
252 O ASN 37 27.370 2.5AC 34.012
253 H LYS 38 26.599 2.073 32.276
264 CA LYS 38 26.613 3.475 31.763
265 CB LYS 38 25.028 3-543 30,450
266 CG LYS 38 26.403 2.859 29.227
2 67 CD LYS 38 25.546 2.SS7 27.967
2-68 CB LYS 38 26.292 2.326 26.740
269 NZ LYS 25.435 2.203 26.503
270 C LYS 3S 26.067 4.557 32,781
271 O LYS 38 26.640 5.560 32,968
272 N HIS 39 24.991 4.240 33-448
273 CA HIS 39 24.339 5.175 34.366
274 CB HIS 39 22.873 4,794 34.663
275 CG HIS 39 22.691 2.527 35.465
276 ND1 HIS 39 22.366 2.316 34.861
277 CEi HIS 39 22.221 1,390 35.023
275 NB2 HIS 39 22 .427 1.959 37.003
279 CD2 ars 39 22.704 3.299 36.Bil
280 C HIS 39 25.199 5.364 35.634
2SJ O HIS 35 25 .365 6 .483 36-075
282 U ILE 40 25.776 4 .237 36.202
283 CA 1LR 40 26,763 4.413 37.307
284 CB ILE 40 27 .191 3.010 37.810
285 CG1 ILE 4C 2S.005 2.268 33.327
286 cni ILE 4C 25.106 3-072 39.310
287 CG2 ILB 40 23.213 3.103 38 ,896
23B C ILB 40 27.992 5.232 36.886
289 O ILB 40 20.555 5.966 37.647
290 w ALA 41 26 .435 5.120 35,669
291 CA ALA 41 29.676 5.765 35.333
292 ca ALA 41 3-0,347 4.997 34.252
2 93 c ALA 41 20.527 7.243 34.932
294 0 ALA 41 30.503 e .00? 35.003
295 H LYS 42 23 .313 7 .653 34.526
296 CA LYS 42 23.085 8.934 33.6Θ2
297 CB LYS 43 26.681 3 .9SS 33,239
293 C LYS 42 20.219 10.095 34 824
299 0 LYS 42 28.723 11.173 34.442
300 u SER 43 27.771 9.907 36.054
301 CA SER 43 27.039 10.999 36.694
302 CB SER 43 25,631 10.443 36.919
303 OG SER 43 25.7S6 9-261 37.742
304 C SER 43 27.641 11.438 33.053
305 O SER 43 23.662 11 -153 38,313
305 N ASN 44 26.637 12-095 33.966
307 CA ASN 44 25.838 13.4C2 33,590
308 CB ASN 44 25.315 13.033 39.959
309 C ASN 44 26.119 14.716 37.810
310 C ASN 44 25.139 15.472 37.565
311 N ASP 45 27.367 13.095 37.538
312 CA ASP 45 27.6SS 16.507 37.106
313 CE ASP 45 26-655 17.137 36-132
314 C ASP 45 27,952 17.510 38.260
315 O ASP 45 2B,567 19.544 38-009
316 N ILE 46 27.53S 17-216 39.502
317 CA ILE 46 27.£19 10.232 40.578
310 CB ILE 46 26.161 10.859 40.984
319 CG1 ILE 46 25.CEO 17.812 41.296
320 CG2 ILE 46 35.749 19,866 39.947
321 C ILB 46 23.421 18.124 41,895
322 O ILB 46 29.025 19.105 42,334
323 N phb 47 20.537 16.99« 42-572
324 CA ΡΉ3 47 29.275 15.752 42.290
325 CR PHB 47 29.371 14.530 42.554
326 CG PHB 47 27.244 14.877 43.502
327 CDI PHE 47 25-903 14.7-34 13.102
329 CE1 PHE 4 7 24,05? 15.152 47.924
329 CS PB2 47 25-165 15,752 45.190
330 CEL PHE 47 28.502 15-920 45.592
331 CD2 PHE 47 27.524 15.494 44.742
333 C PHD 47 30.594 15.379 41.456
323 O PHB 47 30.625 15.450 40.223
334 » LYS 45 31.636 15-613 42 259
335 CA LYS 48 33.021 15.107 41.586
336 CB LYS 48 34.023 15.364 43-020
337 C LYS 40 32 .843 13.632 41-653
338 O LYS 49 32.581 12.695 42.582
339 N ASN 49 32.942 13.189 40.413
340 CA ASM 49 32.692 11.755 40.123
341 CB ASN 49 32,847 11.562 33.614
312 CG ASN 49 32.332 10,183 3S .209
343 OLI ASN 43 31.971 9,313 39.049
344 NL2 ASN 49 32,266 9.973 36.904
34 5 C ASN 49 34.071 10.935 40,720
348 O ASN 49 35.153 10.931 40.150
347 N ARG 50 33.063 10.299 41.807
348 CA ARG 50 34.929 3.417 42.443
349 CB ARG 50 35.276 10.011 43.793
3S0 CG ARG 50 35,989 11.207 43 .833
351 CD ARG 50 36.181 11.456 45,263
352 NE ARG 50 37.543 12 .442 45.338
353 CS ARG 30 37.407 12.743 45.630
354 NH1 ARO 50 33.500 14.495 45.639
355 NH2 ARG so 36.222 14.305 45.943
366 C ARG 50 34.650 7-896 42.745
357 0 ARG 50 33-509 7 .4.82 43.054
359 N VAL 51 35.733 7-098 42.734
359 CA VAŁ 51 35.675 5.701 43.114
360 CB VAL 51 36.031 4.736 41.953
361 CGl VAL 51 35.281 5.037 40.716
362 CG2 VAL 51 37.487 4.933 41.599
363 C VAL 51 36,521 5.522 44.348
364 O VAL 51 37.422 6.306 44.523
36Ξ N SER 52 36.134 4.502 45.121
366 CA SER 52 36.826 4-063 46.321
367 CB SER 52 36.926 4.158 47.551
3 68 OG SER 52 36.539 3.677 48 . 718
369 C SER 52 37.168 2.634 46.034
370 O SER 52 36.360 1,814 45.800
371 N ALA 53 30.473 2-370 45.930
3 72 CA ALA 53 39.020 1.05? 45.694
373 CB ALA 53 4-0.521 1-158 4S.3C9
374 C ALA 53 38.810 0.101 46.866
375 0 ALA 53 39.216 0.374 : 48 024
376 N HIS 54 38.136 •1.005 i 46.574
377 CA HIS 54 37.007 -2.038 i 47.545
379 CB HIS 54 33,763 3.213 47.408
379 CG HIS 54 40.146 -2.927 ; 47.896
380 MDI HIS 54 41.223 2.314 47.047
381 CB1 HIS 54 42.316 -2.620 47.760
382 NE 2 HIS 54 41,983 -2.572 49.039
383 CD 2 HIS 54 40.638 -2.759 49.151
384 C HIS 54 37,604 -1.604 49.007
385 O HIS 54 36.096 -2.229 49.944
3S6 N HIS 55 36.793 •0.569 49.208
387 CA HIS 55 36.371 -0-219 50.577
38S CB HIS 55 35.460 1.022 50.592
369 CG HIS 5$ 35.261 1.583 51.965
330 ND1 HIS 55 34,443 0.994 52.899
391 CB1 HIS 55 34.473 1.681 54-023
392 NEL HIS 55 35.312 2.682 53.850
393 CD2 HIS 55 35.B15 2 .646 52.583
394 C HIS 55 35.660 -1.425 51.243
395 O HIS 55 34,620 -2.111 50.S17
PL 221 052 B1
3 95 Ν SER 56 36.007 -1-575 52.490
297 CA SER 56 35.407 -2 . 72G 53.311
398 CB SER 56 56 .134 -4.065 53.144
393 OG SES 56 37.448 -3 ,947 53.674
400 C SER. 56 35.535 -2.204 54 .744
401 0 SER 55 36.081 Ί.Ι45 54.953
402 H SER 57 33-028 -2.347 55.717
403 L‘A SER 57 34.812 -2-377 57.031
•404 CB SER 57 33,674 -2-972 $7.500
405 OG SER 57 33.690 4.369 S7.710
40G C SER 57 36,050 -2 .546 S? .931
107 0 SER 57 36 .423 -1.59® £& .617
408 tl LYS 58 36,663 3 .742 57-940
409 CA LYS 58 37.946 -3.993 £0,671
410 CB LYS 58 37,928 -5.355 59,405
411 C LYS 58 35.071 -3 .389 57 .59«
412 0 LYS 58 39-771 4.359 57.302
413 H GI.Y 59 35.209 -2-705 56.992
414 CA GLY 59 35.753 2 .601 55.627
415 C GLY 59 41.259 -2 .643 55.476
41& 0 GLY 59 41.859 -3.718 55.503
417 w LY£ €0 41.853 -1.457 55.341
413 CA LYS 60 43.250 1.255 55.CS4
419 CS LYS 60 44.239 -2.302 £5.709
420 c LYS 611 43.426 -1.186 53 -542
421 0 LYS 60 44.49Q -1.479 62-939
422 N GLY 61 42.344 -Θ .736 52.923
423 CA Gt.Y 63 42.435 -0.613 51.478
424 C GLY 61 42.0-44 0,600 50-£48
425 O GLY 61 43.076 0,237 50.0S9
425 N GLY 62 41.965 1-52$ 49,702
427 CA GLY 63 42.748 1.346 48.443
42 θ C GLY 62 43.062 2.682 47,874
429 0 GLY 62 43.093 2 .322 46.964
430 34 GLY 63 42.364 3.666 46 -43®
431 CA GLY £3 42.374 5.032 47.946
432 C GLY 63 41.035 5 .594 47,475
433 0 GLY 63 39,361 5.042 47.730
434 N ASM 64 41 .092 6.717 46.B33
435 CA ASN 64 39-917 7,354 46.294
436 CB ASM 64 .19.404 8 -435 47.135
437 CG ASM 64 38,506 8 ,(100 48.2 97
430 OBI ASH £4 37.870 8 .791 48.990
439 KO3 ASN 64 38.449 6.690 48 .479
440 C ASM £4 40.531 7.929 45.08B
441 0 ASM 64 41-619 8,516 45 .lSfi
442 K TYR 65 39.867 7-734 43.953
443 CA TYR 65 40.424 8,103 42-685
444 CB TYR 65 40.868 6,822 41.968
445 CG TYR 65 41.905 £.055 42 .791
446 CDI TYR 65 41 -51.7 5-125 4.3.769
447 CB1 TYR 65 42.500 4,435 44.561
443 CK TYR 65 43.902 4.S37 44,357
443 OK TYR £5 44.857 3.950 45,106
450 CE2 TYR S5 44.299 £.60? 43.390
451 CD2 TYR 65 43 .307 6.236 42-616
452 C TYR 65 39.443 S-997 41.910
4 53 O TYR 65 38.301 S.S64 41-713
454 t; ASP 56 39.B83 10.157 41-482
455 c* ASP 66 39.062 10.909 40.555
456 CB ASP 66 39.£35 12.282 40.359
457 CG ASP 66 39.409 13.226 41 .S45
458 oni ASP 66 40,366 13.928 42.993
459 0O2 ASP es 38.230 13-255 42 .011
460 C ASP 66 38.960 10.191 39.216
461 0 ASP 66 39-94S 9.685 38,72£
462 VAL 67 37.7€8 10.125 33.643
463 CA VAL 67 37,569 9.610 37.287
464 CG VAL 67 36,033 9-372 36-93B
465 CG1 VAŁ 67 35.773 9.222 35-545
465 CG2 VAL 67 35.438 8.190 37 .777
467 C VAL 67 38.134 10.665 36.235
468 O VAL 67 37.347 11.636 36.571
469 LYS SS 38.783 10.247 35.239
470 CA LYS £8 39.538 11.147 34.320
47.1 C’8 LYS 40.514 10.504 34,010
472 CG LYS SS 41.823 11.210 12.99B
473 CD LYS 63 43.228 10.736 33,073
474 CE LYS 63 43-333 9-294 32,684
475 »2 LYS 63 42.955 9-117 31.27S
476 C LYS 68 38 .759 11,648 33.037
477 O LYS 63 37.631 12 .109 33,011
479 ΟΧΤ LYS 66 39.085 IX .700 31.8S8
479 N ASP 69 39.11S 5.702 32.539
4&0 CA ASP 69 37-237 5.878 31.300
481 CB ASP 65 37.977 10.159 30.054
462 CG ASP SS 39.040 9.12Ś 29,781
463 OD1 ASP 69 38.698 8.078 39.198
464 OD2 ASP 65 40.219 9.329 30.170
465 c ASP 69 36.454 8.573 31.368
485 0 ASP £9 36,767 7.669 .32.159
487 M ILI 70 35,483 8.4S3 30.475
456 CA ILE 70 34.501 7.446 30.478
489 CB ILE 70 33,3.59 7.997 31.091
490 CG1 ILE 70 33.227 8.010 33.62'?
4 91 CDI ILE 70 32.414 9.201 3 3,2 94
492 CG2 ILE 7 0 31.93S 7.258 30.622
493 C ILE 70 34.343 7.172 29.994
494 O ILE 70 34,231 8.131 28.195
4 95 ΪΙ VAL 71 34.313 5 -BS3 2B.606
4 96 CA VAL 71 33.533 5.540 27.240
4 97 CB UAL 71 35.074 4.803 26.490
4 90 CG1 VAL 71 34.773 4,784 24.999
4 99 CG2 UAL 71 35 .483 5.441 26.793
500 C UAL 71 32.664 4,683 27.328
501 O UAL 71 32 -669 3,655 27.994
502 M GL.U 72 31 .582 5.090 26.697
503 CA □LU 72 30.375 4-347 26.718
504 CB □LU 72 29.1S4 5,254 25.567
505 CG □LU 72 28.978 6.34? 27.647
506 CD GLU 72 27.551 6.93 5 27.588
507 OBI GLU 72 25.97S 7.300 28.663
5oa OE2. OLU 72 26.935 7.001 26.457
509 C GLU 72 30.339 3.418 25-553
510 O GLU 72 30.716 3.78 6 24 .444
511 N TYR 73 29.049 2.207 25.765
512 CA TYR 7 3 29.710 1.275 24.642
513 CB TYR 73 22-268 0,121 25.114
514 CG TYR 73 29-193 -1.073 23.965
515 CDI TYR 73 27,843 -1,406 23-406
516 CE1 TYR 73 27,703 -2.299 22.432
517 cz TYR 73 28.857 -2.822 21.823
518 GB TYR 73 2B.744 -2.713 20.801
519 CE 2 TYR 73 30.124 -2-4G9 22.256
52 0 CD 2 TYR 73 30.239 1.632 23.223
521 C TYR 73 2B.70I 1.078 23-626
522 O TYR 73 27.672 2.403 24-062
523 N PRO 74 29.00S 1.848 22.293
524 CA PRO 74 28.065 2.432 21,231
525 CB PRO 74 20-784 2.296 19.990
526 CG PRO 74 30.211 2.102 20.316
527 CD PRO 74 30.190 1.396 21.579
520 C PRO 74 26.706 1. CSC 21.329
523 O PRO 74 25.666 2.137 21.512
510 ft GLY 75 26.639 0-372 21,059
531 CA GLY 75 25.342 -0.2B7 21-210
532 C GLY 75 24.458 -a. 067 22.453
'333 O GLY 75 24.559 0.92 5 23.Ł&1
S34 N LYS 76 23 .562 -1.024 22.690
535 CA LYS 76 22.550 -o.saj 23.715
536 CB LYS 76 21.310 -1.461 23.200
$37 CG LYS 76 21.042 -2.985 23 .300
538 CD LYS 76 19.565 -3.309 23.070
539 C LYS 76 22.910 1.466 25.124
540 a LYS 76 22.217 -1.208 26.105
S4ł N GLU 77 24.026 -2.196 25.194
542 CA GLU 77 24.436 -2.965 26 .365
543 CH GLU 77 25.610 -3.859 26 .022
54 4 CG GLU 77 25-3S8 5.094 25 .112
545 CD GLU 77 24-956 4.773 23.672
54 6 OE1 GLU 77 24.997 -3,610 23.302
547 GE 2 glu 77 24.515 -5,692 22,093
540 C GLU 77 34-876 -1.S51 27.394
549 O GLU 77 35.648 -1.039 27.071
5S0 X ASP 78 24.364 -2.0S6 28.627
551 Πια ASP 78 24.599 -1.099 29.691
552 CB ASP 78 23.526 -1,2S6 30.789
553 CS ASP 78 23 .486 -0-167 31-780
554 GDI ASP 78 24.240 0.835 51-570
555 0D2 ASP 7S 22.621 -0.261 32.599
55S C ASP 70 26.038 -1.333 30.19S
557 O ASP 78 26,244 -1.854 31.273
558 N LSU 79 27.020 -0.910 29.386
$59 CA LEU ?9 28.450 -1.090 29.679
560 CS LEU 79 2&.9S7 -2.304 28.903
5S1 CG LEU 79 30.4SS 2 .372 28.706
562 CDI LEU 79 30.985 -2.ea& 29.950
£63 CD2 LEU 79 30.847 -3 ,372 27.62$
564 C LSU 75 29-275 O. IBS 29.43.7
565 O LSU 79 29.176 0.759 29 .340
556 N ALA 80 30.073 0.633 30.405
567 CA AIA 80 .30,920 1.860 30.503
566 ca ALA 00 30,395 3.032 21.170
569 c ALA BO 32-278 1.423 30.S32
S70 O ALA 80 32.316 0.575 31,746
571 N ILE SI 33.339 1.594 30.268
572 CA ILE 81 34.642 1.916 30.016
573 CB ILE Bi 35.BJ.4 1.155 29.836
574 CG1 ILE 81 36.762 2. L87 29.333
575 CDI ILB ei 37,645 2.333 30.279
576 CG2 ILE BI 35.372 0 -123 23,749
577 C ILS 81 34.997 3.153 31433
578 O ILS 81 34,705 4.219 30.926
579 N UAL 82 35-591 3 -095 32,606
580 CA UAL 82 35.361 4.309 33.35B
561 CB UAL 82 33.374 4 .351 34,770
562 ecu VAL 83 3S.706 5 .573 35-511
583 CG 2 VAL 82 33 .767 4.300 34-645
584 C UAL 82 37.477 4.314 33.596
585 O UAL 82 38.056 3.32S 34.0S0
506 a HIS 83 38.115 &.403 33.195
587 CA. KIR 83 39.4S7 £.695 33.626
5B8 CB HIS B3 40 .235 6.241 32.453
509 CG KIS 83 40 .351 5.349 31.264
530 NC1 HI.S 83 39.673 5.716 30,06$
591 CE1 KIS S3 39.B45 4.75 7 29.179
592 WE2 HIS 83 40.529 : 3.7S8 29.759
533 CE2 HIS 83 40 .801 1 4.132 31.062
PL 221 052 B1
594 C HIS 33 33-608 6.622 34.822
595 0 HIS 83 38 .928 7.628 34.89?
. 556 K VAŁ B4 40-502 5.235 35.729
59? CA VAL 84 40.309 6.976 36.923
598 CK VAIz 84 40.343 6-023 3B.238
599 Cdi VAL 84 39-517 5.563 3B.613
GtJO CG 2 VAŁ 84 41.529 4.764 30.180
601 C VAŁ 84 42.242 7.721 36.727
602 c VAL 34 43.073 7.289 35.934
603 K HIS 65 42.419 8.879 17.384
604 CA HIS B5 43.753 9,457 37.64$
605 CB HIS 65 43.659 10.365 38-241
606 CG HIS 65 43.005 11.870 37,333.
50? ND1 HIS Θ5 43.694 12.535 36.333
608 CE1 HIS B5 42.868 13 .353 35.689
S09 ME 2 HIS 8S 41.672 13.264 36.251
510 CD2 HIS 85 41.728 32.334 37.275
611 C HIS 85 44-429 8.53G 33.639
512 O HIS 55 43.520 8-261 39,754
G13 M OLU 86 45.573 B-040 38.22?
614 CA GUI 96 46.200 €983 38.942
615 CB 3IU 86 47.465 6.563 33.101
£16 CG 01 LF 36 48 .429 5.641 38.765
61? cc OLU 36 49.470 S.1.49 17.795
616 OBI CŁU 36 50.013 4.037 37.990
619 OE2 GLU 36 49.717 5.675 16,624
€20 c GLU 36 46 .758 7-25« 40,361
€21 0 GŁU 36 46.924 6,303 41.145
622 H TOR 37 47,018 8.529 40-691
623 CA TOR 87 47,437 8.905 42.049
624 CB TOR 37 48 ,321 10,157 42.059
625 OGJ. THH 8? 49-607 9.861 41-522
626 CG2 THR 87 48.495 10-713 43,496
627 C twr 8? 46.LSB 9.282 42,726
62& 0 THR 87 45.450 10.078 42.241
629 N SER 83 45.928 8.695 43.859
630 CA SER BS 44.70? $.025 44.563
633 ca SER 83 44,435 7.932 45.615
632 OG SER 8B 44.897 3.319 46.390
533 C SER 88 44 .776 10.911 45.259
634 O ŚKR 88 45.683 11.196 45-049
535 w THR 83 43.773 10.673 46.066
6.3S CA TOR 39 43.617 11.353 45.897
63? CB THR 39 42.175 11.771 47.489
S3P 0(51 THR 89 41.234 11.90? 46.41$
53$ CG2 THR B9 41.931 12-830 45 .544
640 C THR. 89 44.691 11.790 48.014
«41 G THR 39 45.416 12.743 48.241
542 H GL 17 90 44.774 10.629 43.664
643 CA GLU 30 45-G02 10.302 49.75$
«44 CB GLU 90 45-384 S.873 50.270
«45 CG GL U 90 43.960 B -624 50.666
645 CD GLu 90 42.864 8.376 49.004
$4? 0£l GLU 90 43.171 7.909 48.687
¢46 0E2 GL7 90 41 .68? 8 .666 50-098
649 C GLU 90 47,163 10.338 4S-380
650 0 GLJ 90 4ft . 029 10.30? 50.263
651 M GLY 91 47-460 10-322 48,084
652 CA GLY 91. 48.846 10-275 47.627
653 C GLY 91 49,105 8-995 46.668
654 O GbY 91 50.093 8.910 46.150
655 LEU 92 48 .185 8.028 47.009
656 CA LEU 92 48.326 6.597 46.626
657 CB ŁEU 93 47.231 5-814 47.328
653 CG ŁEU 92 47 .440 5-247 48.715
659 CDI ŁEU 92 48.636 5.37S 49.434
660 CD2 ŁEU 32 46.120 5-333 49.530
661 C LEC 92 4S .259 6.245 45.124
662 O LJ£U 92 47.648 6.971 44.313
663 N Α3» 93 49.872 5-111 44.764
€64 CA ASN 93 43.923 4-694 43.35B
665 CB Α3» 93 50-340 4.24« 42,350
bib CG ASM 93 50.415 3.740 41.503
6G7 0D1 A3N 93 50.262 2.556 41,229
665 KD3 ASM 93 50.647 4.647 40.584
669 C ASM 93 47,864 3.620 43.046
670 O ASM 93 47-676 2.513 43.641
671 K PHE 94 46.948 3.955 42.331
672 CA PHD 94 45.891 3.031 41,780
6?3 CS PHE 94 45.224 3 .423 40.485
674 CG PHD 94 44.040 2 .550 40.118
675 CDI PHE 94 44.066 ł .763 30.953
676 CBS PH8 94 42-978 0.955 30.592
677 cz PHE 94 41.807 0,927 39.419
673 CS2 1 PHE 34 41.770 1,700 40.626
679 CD2 l £H£ 34 42.878 2 -510 40.950
690 C ! PHE 94 46-424 1,601 41-677
681 O PHE 94 45.932 0.679 42.363
632 M ASM Ϊ5 47.463 1 .429 40-845
683 CA ASM 95 47.847 0.063 40.360
684 CB ASM 95 48.592 0.142 39.047
585 03 ASM 95 47.710 C .662 37.982
686 GDI ASM 95 47.74? 1-842 37.54$
SB7 WD2 ASM 95 46.832 -0.183 37.501
G&0 C ASM 95 43 .448 -0,922 42.346
539 0 ASM 95 48 .420 -2.146 41.120
690 N LYS $6 43.922 •0.363 42.450
691 CA LYS 9E 49,513 -1.103 43.476
692 CB LYS 96 50.350 - 0.300 43.931
693 CG LYS $6 51.836 0 . C5S 42.831
594 CD LYS 96 53.182 0.575 43.464
695 CE LYS 96 54.482 0.316 42.584
6 96 !J2 LYS 96 54.726 -1.181 42 .449
69? c LYS 96 48.605 Ί.360 44 .604
698 O LYS $6 48-833 -2.047 45.625
69$ M ASM 97 47.375 -0.916 44.359
700 CA ASM 97 46.315 1.140 45.347
701 ca ASM $7 45.054 0.184 45.938
702 CG ASM $7 46.901 0.804 46.KS0
703 om ASN 9? 46.994 0 .440 48,020
704 MD2 ASM 97 47.S63 1.760 4S.341
705 C ASM $7 45-115 -1-96$ 44-925
706 O ASM $7 44.234 -2.243 45.763
70? ti YAL 98 45.107 -2 .433 43.681
708 CA VAL 98 44.006 -3,202 41.115
709 CB VAL 98 43.073 -2.331 42.149
710 CG1 VAL 98 42.435 -1.171 42.902
711 CG2 VAL 98 43.502 -i.as? 40.901
7.1.2 C VAL 93 44.576 -4.392 42.36$
713 O VAL $a 45.723 •4.35? 42.022
714 M SER 99 43-500 5-446 42.131
?15 CA SER y$ 44,179 -6 -423 41.09S
?26 CB SER s$ 44,210 -?.845 41.62$
71? OG SER $9 43.025 - a.is o 42.262
?1B C SER $9 43,31? • 5.316 3$.«25
71$ 0 SER 99 42.252 -5.696 33.830
?20 H tyr 100 43.832 6.667 38.734
721 CA TYK loo 43.132 -6.891 37.476
722 CB TYR 100 44.115 -6.777 36-360
723 CG TYR 100 44.962 36.474
724 CDI TYR 100 46.194 -5.526 35.636
725 CE1 TYR 100 47.011 -4.422 35.940
726 ca TYR l«0 46 .602 -3,312 36-669
727 OH TYR 100 47 .448 2,21$ 36,715
720 CR2 TYR 100 45 .371 -3-319 37-341
72$ CD2 TYR 100 44.566 -4.463 37-240
730 c TYR 100 42.42® -6.196 37.320
731 o TYR 1(10 4.3.027 -9.24? 37.471
7 52 h THR 101 41.147 -8.14$ 37.000
733 CA THR ΪΟ1 40.382 -9-372 36.934
734 CB THR 101 35.899 -9,135 37.353
73S OG1 THR. 101 18.564 •10.050 33 402
73« CG2 THR 101 37,957 $.345 36.168
737 C THR 101 40.495 -9.975 35.53«
73S O TOR 101 40.557 -9.22? 34.568
73$ « LYS 102 40,517 -11.314 35.442
740 CA ŁYS 102 40.727 • 12,020 34.163
741 CB ŁYS 102 41.665 -13.256 34.401
742 C ŁYS 102 39.351 -3.2.436 33 -624
743 0 ŁYS 102 38,466 -12.799 34.396
744 N PHS 10Λ 33-185 -12.411 32.307
745 CA PHE 103 37-934 -12.906 31.659
796 CB PHE 103 37.772 -12.403 30.209
74? CG PHE 103 37.591 -10.895 30.DSB
748 CDI PHE 103 38.33? -10-15$ 29,19?
749 CE1 PHE 3 03 38.186 -0.741 29-096
750 CZ PHE 103 37.293 •8.08« 29.839
751 CES PHE 303 36.554 -6.813 30.736
752 CD2 PHE 103 36.702 -10-209 30.«33
7S3 C PHK 103 37.720 -14-418 31.65?
754 O PHE 103 38.64? -15x240 31.399
755 M AŁA 3C4 36.460 -14-777 31-919
75S CA ALA. 104 35.318 -16,081 31.575
757 CB ALA 104 34 -Ξ15 -16,148 32.01$
756 C ALA 104 36.013 -lfi.399 30.073
75$ O ALA 104 3S.S57 -15.515 29.224
760 N ASP 105 36162 -17.673 29.758
761 CA ASP 105 36-12? -18.166 28.395
762 ca ASP 105 36 .69? -19.589 28 -416
763 CG ASP 10$ 37.190 -20.0S6 27.062
764 GDI ASP 105 38.27$ -20.66$ 37-064
765 OD2 ASP 105 36.503 -19.855 26.016
766 C ASP 105 34-646 -16.174 27.945
767 O ASP 105 34.317 -18.017 26.730
763 M GLY 106 33.774 -18.34$ 28,$28
7S9 CA GLY 106 32.338 -18.195 28-8U
770 C GLY 106 31.720 -18.785 30-091
771 O GLY 106 32 .407 -19.105 31-073.
772 N ALA 107 30.400 18,975 30.037
773 CA ALA 107 29.655 -19.623 31,094
774 CB ALA 107 29 .278 -18-596 32,218
775 C ALA 107 28.435 -20,230 30,413
7?6 0 ALA 107 2B .150 -19.963 29.231
777 M LYS 10S 27.792 -21,199 31.161
778 CA LrS 108 26 .714 -22.093 30.726
77$ CB 1YS 10S 27.1S8 -23.581 30.87$
?8B CG LYS 108 27.86$ -24 .193 2$.6$3
781 C LYS 108 25,500 -21-B94 31.655
7S2 O LYS 108 25.636 -21.77? 32.926
783 M VAL 109 24.306 21.910 31.071
7B4 CA VAL 10$ 23-132 -21-991 31.927
765 CB VAL 109 21,796 -22.289 31.161
736 CG1 VAL 109 20,619 -22.333 32.143
787 CG2 VAŁ 103 21-512 -21.212 30.041
?S8 C VAL 10$ 23.432 -23.059 32.97?
789 O VAL 109 24,101 -24.046 32 .G95
790 H ŁYS 310 22.951 -22.320 34 .190
791 CA ŁYS 110 23.200 -23.651 35.34$
PL 221 052 B1
792 CB LYS 110 22.892 -25.113 33.004
793 CG LYS 110 21.372 -35.443 35.158
794 CD LYS 110 20.970 -26.363 34.020
795 C LYS 110 24.S25 -23,497 36.130
7S6 0 LYS 3.10 24.644 >24.115 37-21S
79? N ASP 111 25 -513 -22.723 35.650
79$ CA ASP lii 26.794 -22.560 36.398
799 CB ASP Ϊ1Ϊ 27 .849 -21.811 25.597
800 CG ASP Ili 20 .459 -22.670 34 .500
801 O£>1 ASP...........' lii 28 .254 -23.390 34.516
S02 ÓC-l ASP 111 29.105 -22,119 33 .592
803 C ASP iii 26.562 -21-804 37-695
804 0 ASP 111 25.670 -20.956 27.734
805 M ARG 112 27.330 -22.llę 38.745
806 CA ARG 112 27.300 -21.263 39.980
807 CB ARG 112 27.674 -22.029 41.242
806 CG ARG 112 26.926 -23,375 41.424
809 CD ARG 112 25.717 -23,303 42.381
3X0 NE ARG 112 25.956 -22.414 43.543
Sil CS ARG 112 24.9Θ3 -21-752 44.153
812 NH1 ARG 112 23 .733 -21.832 43 .693
813 NH2 ARG 112 25.233 -20.965 45.182
814 C ARG 112 28 .233 -20.017 39.861
815 0 ARG 312 29.373 -20.090 39.353
SIS N ile 113 27 .737 -18,891 40.306
81? CA ILE 113 28.379 -17.629 4B.023
818 CB ILE 113 27 -613 • 16.799 38.897
819 cci IŁE 113 26 .078 -16.626 39.131
820 CDI ILE 113 25.639 -15.500 29.891
821 CG2 ILE 113 27 .774 -17.510 3? .565
822 C ILE 113 2S.326 -16.885 41.316
821 0 ILE 113 27.466 -17.164 42.147
824 N SER 114 29.236 -15,932 41.515
825 CA SER 114 20,995 -15,022 42.604
826 CB SER 114 29.907 -15.298 43.818
627 ΟΓΪ SER 114 31 .203 -16.194 43.507
828 C SER 114 29.030 -13.616 42.137
829 0 SER 114 29.645 -13.303 41.162
830 N VAL 115 20,309 -12,706 42.054
631 CA VAL 115 28.155 -11-359 42.683
832 CB VAL 115 26.693 -11,020 42-414
833 CGl VAL 115 26 .451 -9.535 42.209
834 CG2 VAL 115 26 .151 -11.860 41.242
835 C TAL 115 28 .002 -10.619 43.795
836 0 VAL 115 28.554 -10.959 44.934
837 M ILE lló 29.640 -9.631 43.544
836 CA ILE 116 30-319 -$-937 44-617
839 CB ILE 116 31-806 -9-321 44-635
840 CCI ILE 116 32.083 -10.846 44,732
641 CDi ILR 116 33.511 -11.252 44.472
842 CG2 ILE 11 o 32.722 -0.496 45.674
641 C ILE 116 30.068 -7.446 44.384
844 £> ILE 116 30.241 -6.921 43.273
645 N GLY 117 29-669 -6.735 45.420
846 CA GLY 117 29-571 -5-336 45-240
847 C GLY 1.17 29.039 -4.669 46.457
845 0 GLY 31? 29-266 -5.129 47.602
849 N TYR lis 20.213 -3.584 46.220
85C CA TYR lis 28 .016 -2.710 47.391
851 CB TYR na 28.797 -1.374 47.254
85 2 CG TYR na 30.276 1.551 47.440
653 CDI TYR lis 31.109 -1.798 46.365
854 CEI TYR 110 32.546 -5.947 46.540
855 cz TYR lis 33.070 -1.059 47.816
806 ON TYR 313 34.427 -1.982 40.033
657 CE2 TYR 118 32 .227 -1.63S 45.914
858 CGl TYR lis 30.839 -1.493 45.710
859 C TYR 110 26 .548 -2.625 47 .730
850 0 TYR 11$ 25.138 -1.238 47 .665
861 N PRO 119 25 .754 3.495 48 .045
352 CA PRO 119 24.327 3.521 48 .296
863 CS PRO 115 24 .176 -4.724 49.152
664 CG PRO 119 25.1X1 -5.681 40.575
865 CD PRO 319 25-291 -4.860 40.104
856 C PRO 119 23 .«ES 2.26S 4B .879
867 0 PRO 119 22 .761 -1.697 48 .231
868 N LYS 12C 24.103 -1.771 50.043
869 CA LYS 120 23.645 -0.380 50.327
870 CB LYS 320 22.445 -0.338 SI,311
071 CG LYS 120 21,054 -0.912 SG.775
B72 C LYS 120 24.809 0.675 50.510
673 0 LYS 120 25.763 0,624 49.757
874 N GLY 121 24.780 1 647 51-410
875 CA GLY 121 25.86S 2.608 SI .373
876 c GLY 121 25.491 3.894 52.223
877 0 GLY 121 24.875 4.850 51.747
87ft M THR 324 24.670 1-493 55.274
S79 CA THR 124 25.826 0.574 55 .609
630 CB THR 124 25.S73 -0.635 54.694
$31 OC1 THR 124 26 -902 -0-53$ 53-690
882 CG 2 TOR 124 21 .490 0.922 54,042
8S3 C TOR 124 27 .006 1,366 55 -357
834 0 TOR 124 27.340 2.323 54 .574
3S5 M LYS 125 2& .232 1.106 55.925
836 CA LYS 125 29.146 2.220 55.525
SB7 CB LYS ' 125 29.776 3,019 56.724
838 c LYS 125 39-086 1.669 54.355
3S9 0 LYS 12S 31-301 2,096 54.413
890 N TYR 126 29-481 1.337 53.258
991 CA TYR 126 30.170 0 .764 52.153
092 CB TYR 126 31,058 1.766 51.399
093 CG TYR. 12« 30,241 2 .775 50-627
094 CDI TYR. 126 29,655 2,445 49,405
095 CEI TYR 12« 20 .069 3.370 48,322
B96 CZ TYR 126 28.663 4.640 49.270
897 CK TYR 12« 27.884 5.590 4&.S36
898 CR2 TYR 126 29.255 4.906 50,400
899 CD2 TYR 126 30.014 4.055 51.156
900 C TYR 12« 30.861 0-545 52-308
901 O TYR 126 32,055 -0,744 52,314.
902 ti LYS 127 30 .064 -1.461 53-001
903 CA LYS 12? 30-S23 -2.760 53-29?
904 CK LYS 127 29.526 -3.367 54.270
905 CG LYS 12? 29.451 -2.693 55 .$53
906 CD LYS 127 28 .813 -3.674 56.665
907 CR LYS 127 29.574 -3.672 57.975
90 S MS LYS 12? 29,S7£ 2,340 58.710
909 C LYS 127 30,425 -3.543 52.001
910 O LYS 127 29-435 3-427 51-295
911 N MET 128 31.441 -4.350 51,708
912 CA PIET 128 31.446 -5.253 50.570
913 CB KET 128 32.869 -5.546 50.133
914 CG KET 128 33.022 6.008 4$.709
915 SD MET 120 34 ,750 -6,208 •46,212
916 CE KET 128 34.489 -7.911 47.985
917 C MET 123 30.712 •6.562 50.Θ78
910 C KET 128 30.967 -7.211 51.085
919 KI PHE 129 29.786 -6.943 SO.Olft
920 CA phs 129 29.082 -8.220 50.163
921 CB PHB 129 27.609 -7.999 50.380
922 CG PHE 129 27.322 -7.264 51,664
923 CDI PHE 129 27.363 -5.839 51.704
924 CEI me 129 27,062 -S.169 52,374
925 CZ PHE 129 2« .768 -5.852 54.029
926 CK2 PHE 129 26.729 -7.2SS 53,995
927 CD2 PHE 129 27.012 -7.940 52.818
92$ C PHD 129 29.291 -9.13S 49.021
929 C PHE 129 29-671 -S,750 47-955
930 N GLU 130 29.042 -10.385 49.260
931 CA GLD 130 29.187 -11,356 18,233
S22 CB GLU 130 30.437 -12.190 48.479
933 CG GŁU 130 20.591 -13.200 47,422
934 CD GLU 130 31.048 -14.020 47.494.
935 CEI GLU 130 32.105 -14,625 46,446
936 CE2 CŁU 130 32.561 -14,110 48.544
33? C GLD 130 27.$8$ -12.212 4$.233
93$ 0 GLy 130 27.464 -13-707 19-266
939 N SER 131 27.250 -12,341 47,075
940 CA SER 131 2& .961 13.041 16.909
941 CB SER 131 24.873 -12.043 46.491
942 CG SER 131 22.&9S -12.634 46,503
943 C SER 131 26.137 -14.116 45.362
944 O SER 131 2£ .74$ -13.860 44,32«
945 N THR 132 25 .658 • 15,329 16.154
946 CA THR 132 25 . H42 -16.477 45,247
947 CB THR 132 26.539 -17.673 45,&7?
945 CGl TOR 132 25.904 -17.020 47,239
949 CG2 TOR 132 28,080 -17.415 46,225
950 C THR 132 24.009 -16.944 14.949
951 c THR 132 23.405 -16.S44 45.002
952 N GLY 133 24 .630 -17.701 43.463
953 CA GLY 133 23.459 -18.125 12,732
954 C GLY 133 23.022 -18.755 41-400
355 0 GLY 133 24,99$ -19,093 41,154
956 K TOR 134 22.832 -IB,909 40-520
957 CA TOR 134 23.000 -19.754 39.325
95$ CB TOR 134 22,04$ 30.975 39-433
959 OG1 THR 134 22.071 21,410 40,792
960 CG2 THR 134 22.514 22,15 9 38,560
961 C THR 134 22.661 -18-961 38-121
962 O THR 134 21.900 -17-999 30-214
963 K ILE 135 23.21$ -19-324 36-9S9
964 CA ILE 135 22 -812 -1$ .701 35.711
965 CB ILE 135 23.959 -18.665 54.673
966 CGl ILE 135 25 .237 -17.902 35.296
967 CDI ILE 135 26.360 -17,634 34-271
960 C02 ILE 135 23.573 Ί7-983 33,393
969 C ILE 135 21.619 -19,483 35-157
970 C ILE 135 21.785 -20.641 34-7S3
371 N A SN 136 2G.42& - 18,861 35-179
972 CA ASM 136 19.141 -is,3$a 34,652
973 CB ASM 136 17 .955 -18,664 35,327
974 CG ASM 13« IB.013 -18,716 36-970
975 GDI ASM 136 17.745 -17.694 37-503
976 eW2 ASN 136 18,359 -19.898 37,404
3?7 c ASM 136 18.911 -19-220 33-140
970 0 ASM 136 18.105 -15.947 32,577
979 M HIS 137 19.545 -18,246 32.478
9&0 CA HIS 137 19.295 -17.955 31,062
S&l CB HIS 13? 17.95$ 17.204 30 - 912
902 CG HIS 137 17.561 -16-953 29 -4B5
983 MDI HIS 13? 16 . 787 -17.832 28.757
984 CEI HIS 137 16.632 -17.371 27.529
385 NE2 HIS 137 17.254 -16.209 27 ,433
986 CD2 HIS 137 17,860 -15.935 28,645
987 C HIS 137 20.439 -17.103 30-435
98$ O HIS 13? 20.870 16,073 31-070
989 N ILE 138 20.919 -17-510 29,237
PL 221 052 B1
990 j CA ILE 138 21,903 -16.752 28.459
991 J CB ILE 138 23-387 -17.431 28.474
992 j 031 ILE 138 24.016 - 17.456 29.882
993 j CDI ILE 138 25.026 -18 561 30-086
994 j CG2 ILE 138 24.398 16.764 27 .455
999 j C ILE 118 21.463 -16.553 26.398
996 3 0 ILE 138 21,268 -17.529 26.286
997 3 H SER 139 21 -309 -1S.32S 26.524
99 e i CA SER 139 21.171 -15.199 25.098
959 CB SER 139 19.725 -15-352 24,593
loco OG SER 139 18.982 -14.149 24-723
IOCI c SER 139 21-760 -13,949 -12.866 24.599 25.060
1002 0 SER 139 21.468
10C3 K GLY 140 22.670 -14-113 23.642
10(34 CA GLY 140 23-507 -13,020 23.142
1005 c GLY 140 24 .426 -12.464 24.205
100$ 0 GLY 140 25.215 13.181 24.779
10 G 7 K TUR 141 24.132 -11.210 24.541
1003 CA THR 141 24.tae -30.275 25.309
1009 ca THE 141 35.008 -9.069 24.319
1010 CGl THR 141 26.393 -8-730 24.073
1011 CG2 THE 141 24.163 -·> .940 24.577
1012 C THR 141 24.120 -10.105 26.654
1013 O thb 141 24.475 -9.316 27.533
1014 H PHE 142 23.C77 -10.946 26.813
inis CA PHE 14 2 22.090 -10.658 27.894
1016 ca PHE 142 20.645 -10.773 27.352
1017 CG PHE 142 19.356 lo.&ei 29-431
1ΟΧΛ CDI PHE 147. 19.064 -9.869 29.160
1019 CE1 PHE 142 18.048 -10.072 30.119
1020 CS PHE 142 17.557 -11.345 30.421
1021 CE 2 PHE 142 19.043 -12.465 29.696
1022 CD 2 PHE 142 19-021 -12.241 28.704
1020 C PHE 142 22 .249 -12.109 20.696
1024 O PHE 142 22.384 -13.196 28.145
1025 sr M3T 14 3 22.272 -11.531 30.016
1026 CA MET 343 22.124 -13.054 30.985
1027 CE MET 143 23.485 -13.517 31-559
1028 CG MET 143 24.326 -12.506 32,205
1029 SC MET 143 25,733 -13.242 33.087
1030 CE MET 143 26.627 -11.830 33.617
1031 C MET 143 21.136 -12.833 32.146
1032 O MET 143 20.934 -11.692 32.593
1031 M GLU 144 20.542 -13,335 32.646
1034 CA GUI 144 19.773 -13.862 33,899
1035 CB GLU 144 18.293 14.160 33.648
1036 CG GLU 144 17.370 -13.881 34.837
1017 CD GLU 144 15.991 -14.360 34.535
1038 OBI GLU 144 15,295 14,884 35.440
1039 OE2 GUI 144 15-622 -14.234 23.352
1040 C GLU 144 20.267 -14.877 34.981
1041 O OLU 144 20.600 -15.979 34.497
1042 łi PHE 145 20.270 -14.484 36.156
1043 CA PHE 145 20.903 ^-15.238 37.230
1044 c:b PHE 145 32-421 -14.953 37.329
1045 CG PHE 145 22.775 13-502 37.509
1046 CDI PHE 145 32.792 12.919 38,795
104? CEL PHE 145 23.163 -11.603 38,972
1043 CS PHE 145 23.523 -10.844 37.820
1049 CE2 PHE 145 23.495 -11.413 3S.R42
1050 CO2 PHE 145 23.194 -12.732 36.410
1051 C PHE 145 20.217 -14.370 38.497
1052 c PHE Ϊ45 19.5SO -13.793 38,553
1053 N ASP 146 20.350 -15.720 33.520
1054 CA ASP 146 19,452 -15.500 40.67Ϊ
ioss CK ASP 146 16 467 Ί6.655 40.799
1056 CG ASP 146 19,155 -17,677 41 119
1057 □Dl ASP 146 20.194 -17.712 41.723
1058 OD2 ASP 146 16.713 -18,975 40.742
1059 C ASP 146 20.C37 -15.167 42.073
1060 ASP 146 19.347 -15,301 43 .077
1061 N ALA 147 21.267 -14.699 42.126
1062 CA AIA 147 21.759 -14.186 43 .366
1063 CB ALA 147 23.313 -13.936 43.234
1064 C ALA 147 21.002 -12.933 43-947
1065 O ALA 147 20-725 -11,960 43.239
1066 w TYR 14S 20-645 -12.350 45.228
1067 CA TYR 148 20.133 -11.758 46.904
1068 CB TYR 148 20.33? -11.962 47.406
1069 CG TYR 148 19.463 -11.01S 48.236
1070 CDI TYR 148 20.020 9.925 46.988
1071 CB1 TYR 148 19.166 -3-059 49,756
1072 cz TYR 148 17.614 -3.306 49.728
1073 OH TYR 148 16-904 -8.523 50.418
1074 CE2 TYR 148 17.282 -1C-347 48,965
1075 CD2 TYR 148 18.090 ‘11.270 4B.238
1076 C TYR 148 20-904 -10.471 45.465
1077 0 TYR 148 22.093 -10.476 45-326
loifl K ALA 149 20.173 -9.371 45.211
107 9 CA ALA 149 20.784 -&.057 44.949
1080 CB ALA 149 21.220 -7.891 43,519
1031 C AIA 149 19-674 -6.950 45.386
1082 O ALA 149 18.701 -7.132 45.504
1083 N GUT 150 20.441 -5.7B8 45.652
1084 CA GU4 150 19.714 -4.627 46.108
1085 CB GUT 150 19.938 -4.515 47.507
1086 CG GLN 150 19.068 -5.391 48.385
1087 en GLH 150 19.346 -5.239 49.848
loaa OBI GIJJ 150 20-398 -5.720 50.325
1039 HE2 GL ti 150 19.414 -4.564 50.693
1050 C GLH 150 20.323 -3.405 45.392
1091 O GLS 150 21.373 -3.549 44.847
' 1092 K PRO 151 19.653 2.237 45.364
1093 CA PRO 151 20.217 -0.905 44.722
1094 CB PRO 251 19.337 0.14 0 45.301
: 1095 CG PRO 251 13 .011 -0.51« 45.268
1096 CD PRO 151 13.261 -1.969 45.765
1097 C PRO 151 21.752 0.663 44.665
1090 O PRO 151 22 .217 -0.106 43.629
1099 W GLY 152 22.570 -1.062 45 .632
1100 CA GLY 152 24.031 -0.9Q0 45.3.33
1101 c GLY 152 24.723 -1.793 44.292
1102 0 GLY 152 25.63B -1.51.3 43.877
1103 N ASH 153 24,034 -2.79E 43.7S6
1104 CA ASK 153 24.654 -3.841 42.934
1105 CB ASN 153 23.936 -5,175 43,275
1106 CG ASM 153 24 .451 -5.833 44.537
1105 GDI ASM 153 25.640 -6.320 44 .619
1103 ND2 ASK 153 23 .610 -6.009 45.534
1109 C ASM 153 24.810 -3.570 41.475
1110 0 ASM 153 25-488 -4.234 40,724
1111 N SER 154 24.158 -2.501 41.029
1112 CA SER 154 24.317 -2.052 39.635
1113 CB SER 154 23.790 - 0.S23 39.556
1114 OG SER 154 23.145 -0.463 38-378
1115 C SER 154 25.835 -2.072 39 .339
1116 0 SER 154 36.619 - 1.496 40.151
1117 N GLY 15 5 26.217 -2,74$ 3S.235
1118 CA GLY 155 27.586 -2-913 37,793
1119 c GLY 155 28 .483 -3,794 38.523
1120 0 GLY 155 29.64,8 - 3 · 883 38.205
1121 H SER 1S6 27.347 4.496 39.53(5
1122 CA SER. 136 28.592 -5.533 40.261
1123 CB SER 156 27.350 -5.231 41.268
1124 OG SSR. 156 27.491 5.417 42,371
1125 C S3R. 156 29.203 - 6 . &43 39.252
1126 O SER 156 28 .473 $.826 3fi.325
11?.? H PRO 15? 30-484 -7.04? 39.429
1128 CA PRO 157 31.108 -O-22& 38.729
1129 CB PRO 157 32,457 8,3 53 39.390
1130 CG PRO 157 32 .341 -7-612 40.676
1131 CD PRO 157 31.419 -6.4SS 4O.38S
1132 C PRO 157 30.385 -9.533 39.957
1133 O PRO 157 29.899 -9.773 40.037
1134 ΪΓ VAL 156 30.333 -1.0.38? 37.954
1135 CA VAL 158 29.63$ -11.682 33,077
1136 CB VAL 158 28.430 -11-903 37.0S9
113 7 cai VAL 158 37.923 •13.307 37.217
1133 CG2 VAL Χ5& 27.357 -10.885 37 297
113 9 C VAL 15& 30.907 -12.642 37 .722
1140 O VAL 158 31.369 -12.640 36 .559
1141 K LEU 159 31.12 9 -13 .457 38.729
1142 CA LEU 159 32.313 -14-28S 3E.694
13 43 C3 LEU 159 33.163 -13.95? 39-905
1144 CG LEU 139 33.683 -12.548 40.104
1145 CDI LEU 159 34.560 •12.460 41.373
1146 en 2 LEU 139 34.502 -12 .162 38.921
1145 C LEU 159 31-98 iJ ••15.767 38.679
1148 O LEU 159 31.149 -16.213 32.484
1149 N ASH 160 32.663 -16.551 37,833
1150 CA ASM 160 32.575 -18.007 38-024
1151 CB ASH 160 32.926 - 18.777 36.742
1152 CG ASH 160 34.380 -18.634 36.313
1153 OD1 ASH 160 34,722 -18.797 35. U6
1154 tiD2 ASH 160 35 277 -18.320 37.286
1155 C ASH 160 33.324 -18.536 39.183
1156 O ASH 160 33.899 -17 .775 40.041
1157 H SER 161 33.266 -19.840 39.538
1158 CA SER 161 34.041 -20.931 40.504
1159 CB S8R 161 33.61$ -22.040 40.498
1160 OG SSR 161 34.367 -22.538 39,255
1161 C SER 161 35.584 •20.210 40.592
1162 O SER 161 36.160 -29.9S5 41=693
1163 34 LYS 162 36.211 -20.178 39 381
11.64 CA LYS 162 37.627 -19.774 39.202
1165 CB LYS 162 38.189 -20,051 37,796
1166 CG LYS 162 37.980 -21-392 37.144
L1S7 CD LYS 162 33.917 -21-460 35.920
11S8 CE LYS 162 33.303 -22.324 34,614
1169 HZ LYS 262 37 .433 23.419 35-425
ll?D C LYS 162 37.906 -18.286 39.362
1171 O LYS 162 33-966 -17.547 38.894
1172 N HIS 163 35-979 -17.511 39.958
1173 CA HIS 16.3 37.040 -16.044 39.996
1174 CB HIS 163 37,999 -15.583 41 .G93
1175 CG HIS 163 37.741 -16.257 42.412
1176 MDI HIS 3 63 38 .734 -16.8B3 43.141
1177 CE1 HIS 163 36 .204 -17-403 44.2.11
1173 NS2 HIS 163 36.905 -17.152 44.230
1179 CD2 HIS 163 36 .539 -15.43« 43.102
lisa C HIS 163 37.335 15=311 33.702
ll&l O HIS 163 37.987 -14.303 33.733
I1&2 H GUI Ł64 36.859 -15.785 37 .553
1183 CA GUI 164 36.954 -14.963 36 .325
.1184 CB GUI 164 37-348 -15,850 35=172
1185 CG GLU 164 38.408 -16.867 35 .S35
1186 CD GLU 164 38-447 • 13.008 34=42?
1187 OBI GLU 164 37.416 -18.719 34.27B
PL 221 052 B1
118© CE2 □LU 164 39.499 -10,169 33.863
s i B 8 C OLU 3S4 35-596 -14,256 36.025
1190 0 OLU 164 34.570 -14.773 3S.492
1191 H VAL 165 35,514 -13,037 35.120
1192 CA VAL 165 34.403 -12,257 35.007
1193 CS VAL 165 34.514 -10-635 34-703
1194 CG 1 VAL 165 3.1.319 -9-648 35.765
1195 CG 2 VAŁ 165 35.789 “10,215 34.3C9
1196 C VAL 165 33.657 -12.831 33 -842
1197 0 VA1 165 34.I7Ł -12.894 32.741
1138 N ILE 166 32.379 -1.3.163. 34 .076
1399 CA ILE 166 31 -455 -13.523 32.969
1200 ca ILE 166 30.40$ -14 434 33.458
1201 CG1 ILE 166 31.036 -15.673 34-101
1202 CDI ILE 166 30.336 -16.019 35.379
1203 CG2 ILE 166 29.431 -14.739 32.308
1204 C ILE 166 30,736 -12.291 32,376
12 05 0 ILE 166 30.623 -12.197 31.170
1206 GLY 167 30.439 -11 344 33,257
12 07 CA GLY 167 29.531 -10.025 32.868
1203 C GLY 167 29.633 -9.176 34.074
1209 0 GLY 167 30.244 -9.385 35.106
1210 M ILE 168 2B .705 -8.206 33.964
1211 CA ILE 168 28.332 -7,302 35-058
1212 CB ILE 168 26.899 -5.852 34.689
1213 CG1 JLE 168 28.356 -£.200 33.629
1214 CDI ILE L6B 28.739 -3.768 33.365
1235 CG2 ILE 168 30.391 -5 .850 34.977
1216 C ILE 168 36,772 -7.252 35-311
1217 C ILE 168 36 .002 -7.2J5 34.322
121$ LSU 163 26.320 -7.149 36.576
1219 CA L5U 169 24.948 6.795 36.881
1320 CB LZD 169 24 .735 -£ .783 38.374
1221 CG LEU 169 23.223 -5.868 38.715
1222 CDI LEC 169 23.O4G -7-321 39.932
1223 CC 2 LEU 169 22.612 -5-481 39.068
1224 C LEU 169 24 .476 -5.460 36.269
1226 0 LEU 169 25.156 -4.483 36.394
1226 N TYR 17C 23 .360 -5.423 35.564
1227 CA TYR 170 22.804 -4.109 35.1S4
1229 CB TYR 170 22.903 -3 .800 33 .650
1229 CG TYR 170 21.634 -4.463 32.804
1230 CDI TYK 170 20.609 -3-859 32.554
1231 CE1 TYR 170 13.522 -4,507 31,735
1232 CZ TYR 170 19.966 -5.778 31 257
1233 OH TYR 170 1S.050 -6.505 30.536
1234 CE 2 TYR 170 21.210 -6.371 31.501
1235 CD2 TYR 170 22.130 -5.731 32.273
1236 C TYR 170 J 21.402 -3.712 35.754
1237 ϋ TYR 170 ! 21.124 -2.532 35.830
1238 M ALA 171 20.560 4 .663 36.118
1239 CA ALA 171 19.194 -4 -402 36-475
1240 CB ALA 171 18.328 -4.271 35,178
1241 C ALA 171 16.£90 -5.553 37.309
3242 0 ALA 171 19.145 -6.SB5 37,171
3243 N GLY 172 17,740 -S.257
1244 CA GLY 172 16-353 -6.263 38.915
1245 C GLY 172 15.475 -£.250 38.569
1246 0 GLY 172 L5.067 -5-584 37,677
1247 N SER. 173 14.662 -6.999 39.296
1248 CA SER 173 13.313 -7.14« 39 .032
1249 CS SER 173 12.516 -8.617 39.101
1350 OG SER 173 12.034 -9.007 37.772
1251 c SER 173 12.155 -6-437 39.894
1252 0 SER 173 11,3S9 7.121 40.534
1253 N GLY 174 12.015 “5-124 39.362
1254 CA GLY 174 11.157 -4.400 40.390
1255 Ć ' GLY 174 11.555 -4.694 42.367
1256 0 GLY 174 12.751 4.697 42.748
1257 N GLU 177 14.944 -4,906 46.813
1258 CA GLU 177 15 .539 -6,293 45.762
1259 CB GLU 177 15,391 -7.062 48.110
1260 CG GLU 177 14.005 -7-090 48 -758
1261 CD GLU 177 14.047 -7.698 50.132
1262 021 GLU 17 7 14.106 -fi.977 51.262
1263 CE2 GLU 177 14.047 -8.923 50.196
1261 C GLU 177 15.08S -7.354 45.600
1265 0 SLU 177 14.113 -6.825 44,989
1266 N SER 179 15,757 -B.225 45.31S
126 7 CA SER 173 15.573 -9.034 44.020
126 3 CB SER 179 15.852 fi . 13 2 42 803
1269 os SER 173 15.666 -8.756 41,563
1270 c SER 178 16.394 -10.295 43.643
127 3 0 SER 178 17.538 -20.294 43.935
1272 N GLU 179 15.718 -11.337 43 .564
1271 CA KLU 179 16.438 -12,594 43,192
1274 CS □1U 179 16.097 -13.722 44.Ϊ68
1275 CG SLU 179 16-213 -13.261 45.588
1276 CD GLU 179 15.564 14.319 46.546
1277 OE1 GLU 179 14.838 -13.926 47.396
127& OE2 GLU 179 16-007 -15.542 46.403
1279 C GLU 179 16.237 -13,047 41.721
1290 0 GLU 179 16.373 -14 .228 41.393
1281 W LYS 180 15.913 -12.082 40 .864
1292 CA LYS iao 15,9(39 -12.255 39.402
1283 CB LYS 180 14.497 -12-580 3fi . 928
3 284 CG LYS iao 14-299 -12.611 37.433
1285 CD LYS 180 12-772 -12,739 37.163
1286 CK LYS 180 12.409 “12.721 35-734
1287 NZ LYS 1&0 12.5&7 -14.163 35.366
1288 C LYS iao 1G.56G -11.009 38.732
12 89 0 LYS 180 15.944 -9,942 38.465
1290 w ASM 131 17-850 '11.16S 38.443
1291 CA ASM 181 18,714 -10.039 38.062
12 92 C3 A SU 182 19.799 -9,817 39.13S
1293 CG ASM 181 19.193 -9.583 40.505
1204 CDI ASM 1S1 18.463 -8.597 40-726
1295 ND2 ASM iai 19.405 -10.519 41.419
1205 C ASM 161 19.296 *10.318 3S.656
1237 0 ASM 161 19.477 11 489 76.243
1298 H PKS ia2 19-573 -9.235 35.939
1299 CA PHE 182 30.045 9.29S 34.559
1300 CB PJiE 182 19.091 -8-470 33 -6S6
1301 CG PHE 182 17.644 -8.886 33.639
1302 CDI PHE 102 16.691 *7.978 34.230
1303 CE1 ΡΗΞ 102 15.373 -8.355 34.446
1304 CZ PHE 132 14.909 -9.661 34.240
1305 CE2 PHE 102 15,919 -10,590 33.675
1 Ϊ06 CD2 PSS 102 1? .259 -10.192 33.657
1307 Ć ΡΗΞ 1S2 21.441 -3.706 34.542
1308 0 EH 3 182 21.774 -7.769 35.296
1309 H GLY 183 22.259 -9.227 33.6=7
1310 CA OLY 163 23.526 -8-523 33.426
1311 C GLY 183 23.924 8.714 31.901
1312 0 GLY 163 23.237 -9.435 31.171
1313 w UAL 184 24,956 -7.942 31.667
1314 CA VAL 184 25.67S -7.903 30.391
1315 ca VAL 184 26.507 -6.608 30.272
1316 CG3 VA1. 184 27.195 6.529 28,965
1317 CG 2 VAL 184 25.633 5.459 3(3.488
1319 c VAŁ. 184 26.604 -9.128 30.457
1319 0 VAL 184 27.516 -9.217 31.282
13 20 K TYR 195 26.201 -10.119 2S.63S
1321 CA TYR 195 27.153 -11.241 29.401
1322 ca TYR 185 2S.2&B -12-355 28.925
1323 CG TYR 185 27.064 13,567 23.577
1324 CD], TYR 185 27.329 -13.872 27,235
1325 CEL TYK 185 28.032 •15.001 26.081
1326 CS TYR 135 23-54.1 -15.842 27.87S
1327 OH TYR 1S5 29.247 -16.375 27.519
13 2 B CE2 TYR 105 23.332 -23.53S 29.223
1329 CD2 TYR 185 27-571 -14.405 29.575
1330 C TYR l&S 2S.304 -10,891 2B.363
1331 0 TYR 1&5 28.031 10-523 27.237
1332 N EHE 186 29.583 * 10.941 28-758
2333 CA PKE 186 30.687 -10.522 27.843
1334 CB PKE 186 31.945 -10.192 2R.S&3
1335 CG PSE 186 31,739 -9.017 29.529
1336 CDI PHE Ififi 32.609 -3.367 30.604
1337 CB1 PKE 166 32.475 -7.723 31.414
1336 CZ PBB 186 31.914 -6-792 31.136
1339 CS 2 PHE 166 30.674 -5.969 30.079
1340 CD2 P1IG 16G 30.604 -8.048 29.301
1341 C PHE 186 30.950 -11.608 26.848
1342 <3 PHE 1SG 31 .432 -12.687 27.229
1343 U THE. 187 30.630 11.321 25.601
1344 CA TUR 187 30-990 Ί2 .066 24 -42S
1345 CB THE. 187 30.011 -11.750 23.345
1346 OG1 THE. 137 30.061 -10-342 23.139
1347 CG2 THE. 137 36.621 -12.171 23.70S
1348 C THR 137 32 .340 *11.503 23.875
1349 0 THR 137 32.774 -IG.396 24,200
135G K PRO 338 33 .ooe -12.272 22.941
1351 CA PRO 138 34,263 -11.851 22,331
1352 CB PRO 188 34 .421 -12-857 21.190
1353 CG PRO 188 33.336 -14.304 21,902
1354 CD PRO .1,88 32.591 -13.630 22,469
1355 c PRO 18S 34 .319 -10.398 21.852
1356 0 PRO IBS 35.343 -9.708 22.072
1357 M GLM IBS 33 .243 -9.S43 21.193
l3Sft CA GLN 165 33 -122 -8.301 20.693
1359 1360 CB GLN 169 31.765 -3.500 20.090
CG GLN 1&9 31-677 -8.319 18.603
1361 GLN 189 30.515 7.327 10.211
1362 OKI GLN 189 29.327 -7 .667 1S-330
1363 NE2 GLN 183 30.333 -6.074 17.706
1364 C GLN 185 33.195 -7.476 21-822
1365 0 GLN 159 33.750 -6.416 21.633
13S6 X l.Rii 190 32.586 -7.727 22.985
13 67 CA LGU 190 32,430 6.715 24.021
13 SB CB LEU 190 31.293 “6-330 25.002
1359 CG LEU 190 29.675 -6 -735 24.417
1370 CDI LEU 190 28.643 -6.9S9 25.443
1371 CD2 LEU 190 29.729 *5.407 23.934
1372 C LEU 190 33.773 -6.762 24.730
1373 0 LEC 190 34.195 -5.726 25.237
13 74 N LYS 191 34.414 -7.962 24.746
2375 CA LYS 191 35.793 -3.077 25.305
1375 ca LYS 191 36.197 -9.511 25-599
2377 CG LYS 191 35.444 -10,090 26,732
1378 CO LYS 191 35-566 -11,511 27.030
2379 CE LYS 191 35.029 “32.616 2G.552
1380 M3 LYS 191 34.799 -13.551 27.675
1361 C LYS 191 36 .370 -7.306 24.520
1382 0 LYS 191 37,637 -6.578 25.066
1383 N CLU 192 36.340 -7.3&S 23 .229
1384 CA CŁU 192 37.731 -6-570 32,465
1385 CB GLU 192 37.458 6-892 21,041
PL 221 052 B1
1386 CG GLU 192 38.384 -6.221 20.150
1387 CD GLU 192 38.214 -6 .694 18.776
1338 OE1 GLU 192 37.036 -6.680 18.274
1389 OE2 GLU 192 39.264 -7.096 18.239
1390 c GLU 192 37.510 -5.047 22 .612
1391 ΰ GLU 192 38.493 -4-228 22.635
1392 N PHE 193 36.233 -4.655 22.639
1393 CA PHE 193 35.891 -3-360 23,142
1394 ca PHE 193 34.391 -3-192 23.254
1395 CG PHE 193 34.021 -1.824 23.693
1395 CDI PHE 193 34.015 -0-760 22.751
1397 CEI PHE 193 33.689 0.590 23.135
1398 CZ PHE 192 33.401 0.828 24.486
1399 CE 2 PHE 193 33.413 0.286 2S.481
1400 CD 2 PHE 193 33-722 -1,568 25.057
1401 C PHE 193 36.584 -2.926 24.475
1402 0 PHE 193 37.189 -1.838 24.575
1403 N ILE 194 36.438 -3.747 2S.S02
14 04 CA ILE 194 37.068 -3.442 26.772
14 05 CB ILE 194 36.677 -4.485 27.829
1406 CGl ILE 194 35.166 -4.369 28.170
1407 CDI ILE 194 34.545 -5.666 28.801
1408 CG2 ILE 194 37.564 4.329 29.055
1409 C ILE 194 38,600 3.443 26.588
1410 0 ILE 194 39.328 '2.607 27.101
1411 N GLN 195 39,095 -4.385 25.837
1412 CA GLN 195 40.486 -4.512 25.708
1413 ca GLN 195 40.824 -5.871 25.116
1414 CG GLN 195 42.127 -6.280 25.587
1415 CD GLN 195 42.091 -7,186 26.770
1416 OE1 GLN 195 41.357 -8,178 26,797
1417 NE 2 GLN 195 42.966 -6-313 27.731
1418 C GLN 195 41,105 -3,342 24,928
1419 0 GLN 195 42.169 -2.352 25.282
1420 N ASN 196 40.429 -2.866 23.899
1421 CA ASN 196 40.922 -1.693 23.195
1422 CB ASN 196 40.163 -1.509 21.904
1423 CG ASN 196 40.549 -2 .523 20.906
1424 om ASN 196 39.843 -2.732 19.923
1425 ND2 ASN 196 41.689 -3.179 21.132
1426 C ASN 196 40.892 -0.372 23.959
1427 G ASN 196 41-482 0.639 23.490
1428 N ASN 197 40.196 -0.363 25.098
1429 CA ASN 197 40.110 0.831 25.949
1430 CB ASN 197 38 .664 1.239 26-096
1431 CG ASN 197 38 .114 1.836 24.823
1432 GDI ASN 197 38-320 3.012 24 -568
1433 ND 2 ASN 197 37,409 1.045 24.023
1434 C ASN 197 40 .819 0.649 27,294
14 3 5 0 ASN 197 40-707 1.469 28.185
1436 N ILE 198 41.550 -0.459 27.4S3
1437 CA ILE 198 42.568 -0.485 28,530
1438 CB ILE 198 42.990 -1.887 28.873
1439 CGl ILE 198 41.771 -2.666 29.302
1440 CDI ILE 198 42.073 -4.115 29-729
1441 CG2 ILE 198 43.952 -1.895 30.049
1442 C ILE 198 43.794 0 .452 28.231
1443 0 ILE 198 44.343 0.438 27.114
1444 N GLU 199 44.084 1.367 29.154
1445 CA GLU 199 45 .465 1.753 29.530
1446 CB GLU 199 46.547 1.701 28-439
1447 CG GLU 199 47.828 1.047 28,959
1448 CD GLU 199 49.186 1.618 28,354
1449 OE1 GLU 199 43.192 2.039 27.167
1450 OE2 GLU 199 50.236 1,599 29.084
1451 C GLU 199 45.725 2,960 30.461
1452 O GLU 199 46.821 2,924 31.061
1453 N LYS 200 44.856 3,386 30.652
1454 CA LYS 200 45.177 4.952 31.804
1455 CB LYS 200 46.679 5.147 32.063
1456 C LYS 200 44.597 6.351 31.741
1457 0 LYS 200 44.106 6.601 30.642
1458 ΟΧΤ LYS 200 44.631 7.215 32.717
PL 221 052 B1
Wykaz sekwencji <110> BioCentrum Sp. z o.o.
Dubin, Grzegorz Potempa, Jan
Proteinaza SplA i peptydy przez nią rozpoznawane oraz ich zastosowania <210> 1 <211? 708 <212> DNA <213? Staphylococcuo aurcug <221> CDS <222> (1)..(705) <223> gen kodujący proteinazę SplA ze Staphylococcus aurems wraz z peptydem sygnalnym <221 > raat_peptide <222> {106},.(705) <400? 1
atg Met -35 aat Asn aaa aat gta atg gtt asa ggt tta act gct tta Leu act Thr att Ile -20 tta Leu 48
Lys Asn Val Met -30 val Lys Gly Leu Thr -25 Ala
aca tct ctt ggt ttt gct gaa aat att tct aat cag cct cat tca att 96
Thr Ser Leu Gly Phe Ala Glu Asn Ile Ser Αεη Gin Pro His Ser Ile
15 -10 -5
gcc aaa gca gaa aag aat gtc aaa gaa att acc gai gca act aag gaa 144
Ala Lys Ala Glu Lys Asn Val Lya Glu Ile Thr Asp Ala Thr Lys Glu
-1 1 5 10
cca tac aat tca gtg gta gca ttt gtg ggt ggt act ggt gta gtt gtt 192
Pro Tyr Asn Ser val val Ala Phe Val Gly Gly Thr Gly Val Val Val
15 20 25
ggt aaa aat aca atc gta act aac aaa cat atc gct aaa agt aat gat 240
Gly Lys Asn Thr Tle Val Thr Asn Lys His Ile Ala Lys Ser Asn Asp
30 35 40 45
att ttt aaa aat aga gta tca gca cat cat tcg agt aaa ggt aaa ggt Ξ38
Ile Phe Lys Asn Arg val Ser Ala His His Ser Ser Lye Gly Lys Gly
50 55 60
gga aac tac gac gtt aaa gac att gta gaa tat ccc gga aaa gaa 336
Gly Gly Asn Tyr Asp val· Lys Asp Ile Val Glu Tyr Pro Gly Lys Glu
65 70 75
gac ctt gcg ata gtt cat gtt cat gaa aca agt aca gaa ggt ttg aat 384
ASp Leu Ala ile vał His val His Glu Thr Ser Thr Glu Gly Leu Asn
80 8S 90
ttt aat a ag aac gtt agt tat aca aaa ttt gca gac gga gca aaa gtg 432
Phe Asn Lys Asn Val Ser Tyr Thr Lys Phe Ala Asp Gly Ala Lys Val
95 100 105
aaa gat aga att tct gtt att 33 h tat cca aag ggt gca caa aca aaa 480
Lys Asp Arg He Ser Val ile Gly Tyr Pro Lys siy Ala Gin Thr Lye
110 115 120 125
tat a aa atg ttt gaa tcg aca sga acg att aac cat atc agt gga acg 52B
Tyr Lys Mat Phe Glu Ser Thr Gly Thr Ile Asn His Ile Ser Gly Thr
130 135 140
ttt atg gaa ttt gat 3^3 tat gca caa cca ggt aat tca gga tct cct 576
Phe Met Glu Phe Asp Ala Tyr Ala Gin Pro Gly Asn Ser Gly Ser Pro
145 150 155
gta ttg aat tct aaa cat gaa ctg att ggt att tta tat gca ggt agt 624
vai Leu Asn ser Lys His Glu Leu Ile Gly Ile Leu Tyr Ala Gly Ser
160 165 170
gga aaa gat gaa tct gaa aag aat ttc ggt gtt tat ttc aca cca caa 672
Gly Lys Asp Glu Ser Glu Lys Asn Phe Gly Val Tyr Phe Thr Pro Gin
175 180 165
tta aaa gaa ttt att caa aat aat att gaa aaa taa 70S
Leu Lys Glu Phe Tle Gin Asn Asn Ile Glu Lys
190 195 200
<210> 2 <2ll> 240
PL 221 052 B1 <212> PRT <213 > Staphylococcus aureus <400> 2
Met -35 Asa Lys Asn Val Met val -30 Lys Gly Leu Thr -25 Ala Leu Thr Tle Leu -20
Thr Ser Leu Gly Phe Ala Glu Asn ile Ser Agn Gin Pro His Ser He
-15 -10 -5
Ala Lys Ala Glu Lys Asn Val Lys Glu Ile Thr Asp Ala Thr Lys Glu
-1 1 5 10
Pro Tyr Asn Ser Val Val Ala Phe Val Gly Gly Thr Gly Val Val Val
15 20 25
Gly Lys Asn Thr Tle Val Thr Asn Lys His Tle Ala Lys Ser Asn Asp
30 35 40 45
Ile Phe Lys Asn Arg val Ser Ala His His Ser Ser Lys Gly Lys Gly
50 55 60
Gly Gly Asn Tyr Asp Val Lys Asp Ile Val Glu Tyr Pro Gly Lys Glu
66 70 75
Asp Len Ala ile Val His Val His Glu Thr Ser Thr Glu Gly Leu Asn
80 85 30
Phe Asn Lys Asn Val Ser Tyr Thr Lys Phe Ala Asp Gly Ala Lys Val
95 100 105
Lys Asp Arg Ile Ser val ile Gly Tyr Pro Lys Gly Ala Gin Thr Lys
110 115 120 125
Tyr Lys Met Phe Glu Ser Thr Gly Thr Ile Asn His Ile Ser Gly Thr
130 135 140
Phe Met Glu Phe Asp Ala Tyr Ala Glu Pro Gly Aon Ser Gly Ser Pro
145 150 155
Val Leu Asn Ser Lys His Glu Leu ile Gly Tle Leu Tyr Ala Gly Ser
160 165 170
Gly Lys Asp Glu Ser Siu Lys Asn Phe Gly Val Tyr Phe Thr Pro Gin
175 130 185
Leu Lys Glu Phe ile Glu Asn AStl Ile Glu Lys
190 195 200
<210> 3 <2ll> 690 < 212 > DNA <213> artificial setpience <220>
<223> sekwencja kodująca wariant białka SplA z peptydem sygnalnym rozpoznawanym przez B. subtilis <220>
<221> CDS <222> il) , - {687} <220>
<221> raat_peptide <222> {88} - - (6871 <400> 3
atg Met aac atc aaa aag ttt gca aaa caa gca aca gta tta acc ttt Phe -15 act Thr 48
Asn ile Lys Lys -25 Phe Ala Lys Gin Ala -20 Thr Val Leu Thr
acc gca ctg ctg gca 99* ggc gca act caa gct ttt gcc gaa aag aat 9$
Thr Alu Leu Leu Ala Gly Gly Ala Thr Gin Ala Phe Ala Glu Ifys Asn
-10 -5 -1 1
gtc a&a gaa att acc gat gca act aag gaa cca tac aat tca gtg gta 144
Val Lys Glu Ile Thr Asp Ala Thr Lys Glu Pro Tyr Asn Ser Val Val
5 10 15
PL 221 052 B1
gca Ala 20 ttt Phe gtg ggt Val Gly ggt Gly act Thr 25 ggt Gly gta gtt Val Val gtt ggt Val Gly 30 aaa Lys aat Asn aca Thr atc Ile gta Val 35 192
act aac aaa cat atc gct aaa agt aat gat att ttt aaa aat aga gta 240
Thr Asn Lys His Ile Ala Lys Ser Asn Asp Ile Phe Lys Asn Arg Val
40 45 50
tca gca cat cat tcg agt aaa ggt aaa geje* gga gga aac tac gac gtt 238
Ser Ala His His Ser Ser Lys Gly Lys Gly Gly Gly Asn Tyr Asp Val
55 ¢0 65
aaa gac att gta gaa tat CCC gga aaa gaa gac ctt gcg ata gtt cat 336
Lys Asp Ile Val Glu Tyr Pro Gly Lys Glu Asp Leu Ala Ile Val His
70 75 80
gtt cat gaa aca agt aca gaa ggt ttg aat ttt aat aag aac gtt agt 384
Val His Glu Thr Ser Thr Glu Gly Leu Asn Phe Asn Lys Asn Val Ser
85 90 95
tat aca aaa ttt gca gac gga gca aaa gtg aaa gat aga att tct gtt 432
Tyr Thr Lys Phe Ala Asp Gly Ala Lys val Lys Asp Arg Ile Ser Val
100 105 110 115 atc ggt tat cca aag ggt gca caa aca aaa tat aaa atg ttt gaa tcg 460
Ile Gly Tyr Pro Lys Gly Ala Gin Thr Lys Tyr Lys Met Phe Glu Ser
120 125 130 aca gga aeg att aac cat atc agt gga acg ttt atg gaa ttt gat gcg 526
Thr Gly Thr Ile Asn His Ile Ser Gly Thr Phe Ket Glu Phe Asp Ala
135 140 145
tat Tyr gca Ala caa Gin 150 cca Pro ggt Gly aat Asn tca gga tct cct gta ttg aat tct Ser aaa Lys cat Hic 576
Ser Gly 155 Ser Pro Val Leu Asn 160
gaa ctg att ggt att tta tat gca ggt agt gga aaa gat 9aa tct gaa 624
Glu Leu Ile Gly Ile Leu Tyr Ala Gly Ser Gly Lys Asp Glu Ser Glu
165 170 175
aag aat ttc ggt gtt tat ttc aca cca caa tta aaa gaa ttt att caa 672
Lys Asn Phe Gly Val Tyr Phe Thr Pro Gin Leu Lys Glu Phe Ile Gin
1B0 185 190 195
aat aat att gaa aaa taa 690
Asn Asn Ile Glu Lys
200
<210> <211? <212> <213> 4 233 PRT a.rtif icial secfuence
<220>
<223? Synthetic Construct
<400s 4
Met Asn Ile Lys Lys -25 Phe Ala Lys Gin Ala -20 Thr Val Leu Thr Phe -15 Thr
Thr Ala Leu Leu -10 Ala Gly Gly Ala Thr -5 Gin Ala Phe Ala -I Glxi 1 Lys Asn
Val Lys 5 Glu Ile Thr Asp Ala 10 Thr Lys Glu Pro Tyr 15 Asn Ser Val Val
Ala 20 Phe Val Gly Gly Thr 25 Gly Val Val Val Gly 30 Lys Asn Thr ile Val 35
Thr Asn Lys His Ile 40 Ala Lys Ser Asn Asp 45 Ile Phe Lys Asn Arg 50 Val
Ser Ala His His 55 Ser Ser Lys Gly Lys 60 oiy Gly Gly Asn Tyr 65 Asp Val
Lys Asp Ile 70 Val Glu Tyr Pro Gly 7S Lys Glu ASp Leu Ala 30 Ile Val His
PL 221 052 B1
Val His 85 Glu Thr Ser Thr Glu 90 Gly Leu Asn Phe Asn 95 Lys Asn Val Ser
Tyr 100 Thr Lys Phe Ala Asp 105 Gly Ala Lys Val Lys 110 Asp Arg Ile Ser Val 115
Ile W Tyr Pro Lys 120 Gly Ala Gin Thr Lys 125 Tyr Lys Met Phe Glu 130 Ser
Thr Gly Thr Ile 135 Asn His Ile Ser Gly 140 Thr Phe Met Glu Phe 1-45 Asp Ala
Tyr Ala Gin 150 Pro Gly Asn Ser Gly 155 Ser Pro Val Leu Asn 160 Ser Lys His
Glu Leu 165 Ile Gly Ile Leu Tyr 170 Ala Gly Ser Gly Lys 175 Asp Glu Ser Glu
Lys 180 Asn Phe Gly Val Tyr 185 Phe Thr Pro Gin Leu 130 Lys Glu Phe Ile Gin 195
Asn Asn Ile Glu Lys 200 <2lO> 5 <211> 6S1 <212 > DWA <213> artificial sequence <223> sekwencja kodująca białko fuzujne zawierające dojrzałą sekwencje splA do której przyłączono metkę histydynową i sekwencję rozpoznawaną przez splA <221> CDS <222> iii = . (643) <400> 5
atg ggc agc agc Ser cat His cat His cat His -10 cat cat cac His agc Ser agc Ser -5 ggc Gly tat Tyr tta Leu tat Tyr 48
Met Gly -15 Ser His Kia
gaa aag aat gtc aaa gaa att acc gat gca act aag gaa cca tac aat 36
Glu Lys Asn Val Lys Glu Ile Thr Asp Ala Thr Lys Glu pro Tyr Asn
1 5 10 15
tca gtg gta gca ttt gtg ggt 93t act ggt gta gtt gtt ggt aa a aat 144
Ser Val Val Ala Phe Val Gly Gly Thr Gly Val Val Val Gly Lys Asn
20 25 30
aca atc gta act aac aaa cat atc gct aaa agt aat gat att ttt aaa 192
Thr Ile Val Thr Asn Lys His Ile Ala Lys Ser Asn Asp Ile Phe Lys
35 40 45
aat aga gta tca gca cat cat tcg agt aaa ggt aa a ggc gga gg* aac 240
Asn Arg Val Ser Ala His Kia Ser Ser Lys Gly Lys Gly Gly Gly Asn
50 55 60
tac gac gtt aaa gac at t gta gaa tat ccc gga aaa gaa gac ctt gcg 288
Tyr Asp Val Lys Asp Ile Val Glu Tyr Pro Gly Lys Glu Asp Leu Ala
65 70 75 80
ata gtt cat gtt cat gaa aca aca gaa ggt ttg aat ttt aat aag 336
Ile Val His Val His Glu Thr Ser Thr Glu Gly Leu Asn Phe Asn Lys
85 30 95
aac gtt agt tat aca aa a ttt gca gac gga gca aaa gtg aaa gat aga 384
Asn Val Ser Tyr Thr Lys Phe Ala Asp Gly Ala Lys Val Lys Asp Arg
100 105 110
att tcfc gtt. att ggt tat cca aag ggt caa aca aa a tat aaa atg 432
ile Ser val Ile Gly Tyr Pro Lys Gly Ala Gin Thr Lys Tyr Lys Met
115 120 125
ttt gaa tcg aca gga acg att aac cat atc agt gg* acg ttt atg gaa 430
Phe Glu Ser Thr Gly Thr Ile Asn His ile Ser Gly Thr Phe Met Glu
130 135 140
ttt gat gcg tat gca caa cca ggt aat tca 93* tct cct gta ttg aat 528
Phe Asp Ala Tyr Ala Gin Pro Gly Asn Ser Gly Ser Pro Val Leu Asn
145 Χ50 155 160
PL 221 052 B1
tct Ser aaa Lys cat His gaa Glu ctg Leu 165 att Ile 99t Gly Ile tta Leu tat Tyr 170 gca ggt agt Ser gga Gly aaa gat Lys Asp 175
Ala Gly
gaa tct gaa aag aat ttc ggt gtt tat ttc aca cca caa tta gaa
Glu Ser Glu Lys Asn Phe Gly Val Tyr Phe Thr Pro Gin Leu Lys Glu
180 185 190
ttt att caa aat aat att gaa aaa taa
Phe Ile Gin Asn Asn Ile Glu Lys
195 200
6
<211> 221
<2ΙΞ> PRT
<213 > j artiflcial sequen.ee
<223> Synthetie Construet
<400> S
Met Gly Ser Ser His His His His His His Ser Ser Gly Tyr Leu Tyr
-15 -10 -5
Glu Lys Asn Val Lys Glu Ile Thr Asp Ala Thr Lys Glu Pro Tyr Asn
1 S 10 15
Ser Val Val Ala Phe Val Gly Gly Thr Gly Val Val Val Gly Lys Asn
20 25 30
Thr Ile Val Thr Asn Lys His Ile Ala Lys Ser Asn Asp Ile Phe Lys
35 40 45
Asn Arg Val Ser Ala His His Ser Ser Lys Gly Lys Gly Gly Gly Asn
50 55 60
Tyr Asp Val Lys Asp Ile Val Glu Tyr Pro Gly Lys Glu Asp Leu Ala
65 70 75 80
Ile Val His Val His Glu Thr Ser Thr Glu Gly Leu Asn Phe Asn Lys
85 90 95
Aan Val Ser Tyr Thr Lys Phe Ala Asp Gly Ala Lys Val Lys Asp Arg
100 105 110
Ile Ser Val ile Gly Tyr Pro Lys Gly Ala Gin Thr Lys Tyr Lys Met
115 120 125
Phe Glu Ser Thr Gly Thr Ile Asn His Ile Ser Giy Thr Phe Met Glu
130 135 140
Phe Asp Ala Tyr Ala Gin Pro Gly Asn Ser Gly Ser Pro Val Leu Asn
145 150 155 160
Ser Lys His Glu Leu Ile Gly Ile Leu Tyr Ala Gly Ser Gly Lys Asp
165 170 175
Glu Ser Glu Lys Asn Phe Gly Val Tyr Phe Thr Pro Gin Leu Lys Glu
180 185 190
Phe Ile Gin Asn Asn Ile Glu Lys
195 200

Claims (14)

  1. Zastrzeżenia patentowe
    1. Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, znamienny tym, że posiada sekwencję wybraną spośród: Trp-Leu-Tyr, Trp-Leu-Tyr-Ser, Tyr-Glu-Tyr-Ala, Tyr-Glu-Tyr, Tyr-Met-Tyr, Tyr-Ala-Tyr-Ser, Tyr-Ala-Tyr, Tyr-Thr-Tyr-Ser, Tyr-Thr-Tyr, Tyr-Leu-Tyr-Gly, Tyr-Leu-Tyr, Tyr-Leu-Tyr-Ser, Phe-Leu-Tyr-Ser, Phe-Leu-Tyr, Val-Leu-Tyr-Thr, Val-Leu-Tyr, Trp-Leu-Ser-Thr, Trp-Leu-Ser, Trp-Met-Asn-Thr, Trp-Met-Asn, Trp-Trp-Tyr-Thr, Trp-Trp-Tyr, Tyr-Trp-Trp-Tyr, Tyr-Trp-Trp, Tyr-Trp-Met-Asn, Tyr-Trp-Met, Tyr-Trp-Leu-Ser, Tyr-Trp-Leu, Trp-Leu-Tyr.
    PL 221 052 B1
  2. 2. Białko rozpoznawane przez proteinazę SplA zawierające sekwencję aminokwasową polipeptydu jak określono w zastrz. 1.
  3. 3. Sekwencja nukleotydową kodująca polipeptyd jak określono w zastrz. 1.
  4. 4. Sekwencja nukleotydową kodująca białko jak określono w zastrz. 1.
  5. 5. Zastosowanie sekwencji polipeptydu jak określono w zastrz. 1, do wytwarzania białka rozpoznawanego przez proteinazę SplA.
  6. 6. Sposób otrzymywania dowolnego białka o znanej sekwencji aminokwasowej lub sekwencji kodującej, znamienny tym, że:
    a) dostarcza się białko fuzyjne posiadające sekwencję:
    Z1-Trp-Leu-Tyr-Z2, Z1-Trp-Leu-Tyr-Ser-Z2, Z1-Tyr-Glu-Tyr-Ala-Z2, Z1-Tyr-Glu-Tyr-Z2, Z1-Tyr-Met-Tyr-Z2, Z1-Tyr-Ala-Tyr-Ser-Z2, Z1-Tyr-Ala-Tyr-Z2, Z1-Tyr-Thr-Tyr-Ser-Z2, Z1-Tyr-Thr-Tyr-Z2, Z1-Tyr-Leu-Tyr-Gly-Z2, Z1-Tyr-Leu-Tyr-Z2, Z1-Tyr-Leu-Tyr-Ser-Z2, Z1-Phe-Leu-Tyr-Ser-Z2, Z1-Phe-Leu-Tyr-Z2, Z1-Val-Leu-Tyr-Thr-Z2, Z1-Val-Leu-Tyr-Z2, Z1-Trp-Leu-Ser-Thr-Z2, Z1-Trp-Leu-Ser-Z2, Z1-Trp-Met-Asn-Thr-Z2, Z1-Trp-Met-Asn-Z2, Z1-Trp-Trp-Tyr-Thr-Z2, Z1-Trp-Trp-Tyr-Z2, Z1-Tyr-Trp-Trp-Tyr-Z2, Z1-Tyr-Trp-Trp-Z2, Z1-Tyr-Trp-Met-Asn-Z2, Z1-Tyr-Trp-Met-Z2, Z1-Tyr-Trp-Leu-Ser-Z2, Z1-Tyr-Trp-Leu-Z2, Z1-Trp-Leu-Tyr-Z2, gdzie:
    Z1 i Z2 oznacza polipeptyd zawierający jeden lub więcej aminokwasów, przy czym jeden z nich oznacza polipeptyd zawierający pożądane białko a drugi polipeptyd zawierający polipeptyd znacznikowy,
    b) izoluje się białko fuzyjne, korzystnie techniką chromatograficzną stosując złoże posiadające powinowactwo do polipeptydu znacznikowego,
    c) prowadzi się reakcję hydrolizy białka fuzyjnego za pomocą proteinazy posiadającej aktywność enzymatyczną proteinazy SplA i korzystnie izoluje się pożądane białko.
  7. 7. Sposób według zastrz. 6, znamienny tym, że hydrolizę prowadzi się w temperaturze od 0°C do 45°C, w pH od 5,0 do 8,0.
  8. 8. Sposób według zastrz. 6, znamienny tym, że hydrolizę prowadzi się w buforze octanowym, cytrynianowym, mrówczanowym, MES, HEPES, PIPES, MOPS, Bis-Tris, fosforanowym lub Tris o stężeniu od 1 do 250 mM.
  9. 9. Sposób według zastrz. 6, znamienny tym, że hydrolizę prowadzi się w roztworze zawierającym od 0 do 500 mM NaCl.
  10. 10. Zastosowanie proteinazy SplA do specyficznej hydrolizy polipeptydu do produkcji białek zawierającego sekwencję aminokwasową Xaa1-Xaa2-Xaa3-Xaa4, gdzie:
    Xaa1 jest aminokwasem wybranym spośród: Trp, Tyr, Phe, Val, He, Leu,
    Xaa2 jest aminokwasem wybranym spośród: Leu, Glu, Met, Ala, Thr, Trp, He, Val, Ser, Tyr,
    Phe, Asp,
    Xaa3 jest aminokwasem wybranym spośród: Tyr, Phe, Trp, Leu, Asn, Gln, Ser, Met, He, Val,
    Thr,
    Xaa4 jest pominięty lub jest dowolnym aminokwasem, korzystnie wybranym spośród: Ser, Thr, Gly, Ala, Val, Asn, Asp, Gln, Glu, Tyr.
  11. 11. Zastosowanie według zastrz. 10, znamienne tym, że hydrolizowany polipeptyd posiada sekwencję aminokwasową zawierającą sekwencję wybraną spośród:
    Trp-Leu-Tyr, Trp-Leu-Tyr-Ser, Tyr-Glu-Tyr-Ala, Tyr-Glu-Tyr, Tyr-Met-Tyr, Tyr-Ala-Tyr-Ser, Tyr-Ala-Tyr, Tyr-Thr-Tyr-Ser, Tyr-Thr-Tyr, Tyr-Leu-Tyr-Gly, Tyr-Leu-Tyr, Tyr-Leu-Tyr-Ser, Phe-Leu-Tyr-Ser, Phe-Leu-Tyr, Val-Leu-Tyr-Thr, Val-Leu-Tyr, Trp-Leu-Ser-Thr, Trp-Leu-Ser, Trp-Met-Asn-Thr, Trp-Met-Asn, Trp-Trp-Tyr-Thr, Trp-Trp-Tyr, Tyr-Trp-Trp-Tyr, Tyr-Trp-Trp, Tyr-Trp-Met-Asn, Tyr-Trp-Met, Tyr-Trp-Leu-Ser, Tyr-Trp-Leu, Trp-Leu-Tyr.
  12. 12. Zastosowanie według zastrz. 10 albo 11, znamienne tym, że hydrolizę prowadzi się w temperaturze od 0°C do 45°C, w pH od 5,0 do 8,0.
  13. 13. Zastosowanie według zastrz. 12, znamienne tym, że hydrolizę prowadzi się w buforze octanowym, cytrynianowym, mrówczanowym, MES, HEPES, PIPES, MOPS, Bis-Tris, fosforanowym lub Tris o stężeniu od 1 do 250 mM.
  14. 14. Zastosowanie według zastrz. 12, znamienne tym, że hydrolizę prowadzi się w roztworze zawierającym od 0 do 500 mM NaCl.
PL382770A 2007-06-11 2007-06-28 Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA PL221052B1 (pl)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PL382770A PL221052B1 (pl) 2007-06-28 2007-06-28 Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA
PCT/PL2008/000042 WO2008153429A2 (en) 2007-06-11 2008-06-11 A protease from staphylococcus aureus, particularly spia or spib, peptides it recognises and their use

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PL382770A PL221052B1 (pl) 2007-06-28 2007-06-28 Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA

Publications (2)

Publication Number Publication Date
PL382770A1 PL382770A1 (pl) 2009-01-05
PL221052B1 true PL221052B1 (pl) 2016-02-29

Family

ID=42984958

Family Applications (1)

Application Number Title Priority Date Filing Date
PL382770A PL221052B1 (pl) 2007-06-11 2007-06-28 Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA

Country Status (1)

Country Link
PL (1) PL221052B1 (pl)

Also Published As

Publication number Publication date
PL382770A1 (pl) 2009-01-05

Similar Documents

Publication Publication Date Title
Lu et al. Crystal structure of enteropeptidase light chain complexed with an analog of the trypsinogen activation peptide
Feller et al. Enzymes from Cold‐Adapted Microorganisms—The Class C β‐lactamase from the Antarctic Psychrophile Psychrobacter Immobilis A5
Narinx et al. Subtilisin from psychrophilic antarctic bacteria: characterization and site-directed mutagenesis of residues possibly involved in the adaptation to cold.
EP0542931B1 (en) Serine protease variants having peptide ligase activity
Michalska et al. Crystal structure of plant asparaginase
WO2004067737A2 (en) Subtilases
US5629173A (en) Methods of use of serine protease variants having peptide ligase activity
Zdzalik et al. Biochemical and structural characterization of SplD protease from Staphylococcus aureus
Martin et al. New insights into the regulation of the blood clotting cascade derived from the X-ray crystal structure of bovine meizothrombin des F1 in complex with PPACK
AU708674B2 (en) Chimeric serine protiases
KR102309234B1 (ko) 세제에서의 개선된 효소 안정성을 갖는 프로테아제
WO2008153429A2 (en) A protease from staphylococcus aureus, particularly spia or spib, peptides it recognises and their use
Van den Berg et al. Solution structure of porcine pancreatic phospholipase A2.
Murakami et al. Intermolecular interactions and characterization of the novel factor Xa exosite involved in macromolecular recognition and inhibition: crystal structure of human Gla-domainless factor Xa complexed with the anticoagulant protein NAPc2 from the hematophagous nematode Ancylostoma caninum
Jin et al. Mutation of surface residues to promote crystallization of activated factor XI as a complex with benzamidine: an essential step for the iterative structure-based design of factor XI inhibitors
Almog et al. The 0.93 Å crystal structure of sphericase: a calcium-loaded serine protease from Bacillus sphaericus
Woodman et al. Homologous substitution of ACE C-domain regions with N-domain sequences: effect on processing, shedding, and catalytic properties
PL221052B1 (pl) Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplA, białko, (54) sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplA
Singh et al. Detection of native peptides as potent inhibitors of enzymes: Crystal structure of the complex formed between treated bovine α‐chymotrypsin and an autocatalytically produced fragment, Ile‐Val‐Asn‐Gly‐Glu‐Glu‐Ala‐Val‐Pro‐Gly‐Ser‐Trp‐Pro‐Trp, at 2.2 Å resolution
WO1994018329A2 (en) Serine protease variants having peptide ligase activity
Aÿ et al. Structure of a hybrid squash inhibitor in complex with porcine pancreatic elastase at 1.8 Å resolution
Arlaud et al. Structure, function and molecular genetics of human and murine C1r
KR0180103B1 (ko) 바실러스 서브틸리스 속 균주 유래의 혈전용해효소
PL214451B1 (pl) Polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB, białko sekwencja nukleotydowa kodująca polipeptyd i białko, zastosowanie sekwencji polipeptydu, sposób otrzymywania białka oraz zastosowanie proteinazy SplB
PL213994B1 (pl) Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB

Legal Events

Date Code Title Description
VOID Decisions declaring the decisions on the grant of the patent lapsed