PL213994B1

PL213994B1 - Mutant proteinazy SpIB i sposób otrzymywania mutanta proteinazy SpIB

Info

Publication number: PL213994B1
Application number: PL394914A
Authority: PL
Inventors: Grzegorz Dubin; Jan Potempa
Original assignee: Biocentrum Spolka Z Ograniczona Odpowiedzialnoscia; Univ Jagiellonski
Priority date: 2007-06-11
Filing date: 2007-06-11
Publication date: 2013-06-28
Also published as: PL394914A1

Description

Opis wynalazku

Wynalazek dotyczy mutanta proteinazy SplB i sposobu otrzymywania mutanta proteinazy SplB. Ujawniono metodę otrzymywania proteinazy SplB, jej zastosowania do specyficznej hydrolizy łańcucha polipeptydowego, sekwencji aminokwasowych przez nią rozpoznawanych oraz ich zastosowań.

Enzymy proteolityczne (proteinazy) o wysokiej specyficzności działania (rozpoznające i hydrolizujące jedynie wybrane wiązania peptydowe) są stosowane na szeroką skalę w laboratoriach i przemyśle biotechnologicznym do specyficznej hydrolizy polipeptydów (przede wszystkim następujące: enterokinaza, czynnik X, trombina, proteinaza TEV, proteinaza PreScission™ oraz o mniejszej specyficzności, ale też szeroko wykorzystywane jak V8 i trypsyna). W szczególności, lecz nie jedynie, stosuje się omawiane enzymy do usuwania tzw. metek fuzyjnych, fragmentów polipeptydów rekombinowanych użytecznych na pośrednich etapach analizy lub produkcji (służących np. do detekcji, oczyszczania) jednak niepożądanych w produkcie końcowym. W teorii wysoka specyficzność zastosowanego enzymu w połączeniu z wydajnie rozpoznawanym przez niego miejscem wprowadzonym pomiędzy „metką” a częścią polipeptydu stanowiącą ostatecznie pożądany produkt pozwala na precyzyjne usunięcie ,,metki” bez ryzyka degradacji pożądanego polipeptydu. Niestety brak całkowicie specyficznych enzymów proteolitycznych powoduje, że w wielu przypadkach rezultatem ich działania jest nie tylko pożądane odcięcie metki” fuzyjnej, ale także niespecyficzna degradacja interesującego polipeptydu, jeśli zawiera on miejsca podobne do sekwencji specyficznie rozpoznawanej przez enzym. Ponadto najpopularniejsze ze stosowanych obecnie enzymów nie są dostępne w postaci białek zrekombinowanych lub z uwagi na trudności w produkcji są w tej formie znacznie droższe od białek natywnych izolowanych z osocza krwi (trombina, czynnik X) lub jelit (enterokinaza). Zastosowanie białek natywnych stwarza jednak ryzyko zanieczyszczenia preparatów niepożądaną aktywnością innych enzymów lub patogenami. Wymienione czynniki stwarzają zapotrzebowanie na nowe enzymy, które będą mogły sprostać specyficznym zadaniom.

Szczególnie pożądane jest uzyskanie proteinaz o wąskiej specyficzności substratowej, które mogłyby znaleźć zastosowanie jako precyzyjne narzędzie biotechnologiczne (przykładowe opisy patentowe: US 4 543 329, US 5 013 653, US 6 906 176, US 7 189 540 ).

Sekwencja aminokwasowa proteinazy SplB pochodzącej ze Staphylococcus aureus jest znana i została opisana w publikacji J. Mol. Biol. (2006) 358, 270-279. W pracy tej ujawniono także mało wydajną, niewygodną, laboratoryjną metodę produkcji rekombinowanej proteinazy SplB poprzez ekspresję w E. coli oraz wykazano aktywność proteolityczną na kazeinie powyższego preparatu metodą zymografii. Nie była jednak poznana specyficzność substratowa tego enzymu ani wydajny sposób jego otrzymywania. Ponadto, znane jest wiele proteinaz serynowych chymotrypsynopodobnych (w przypadku podobieństw strukturalnych określenie chymotrypsynopodobny odnosi się do tej samej grupy proteinaz co określenie trypsynopodobny i są one tutaj stosowane zamiennie; jedynie w przypadku określania typów aktywności określenia te są rozdzielne jednak jako takie nie są używane w opisie), do których należy proteinaza SplB (MEROPS: S01.282). Podobieństwo sekwencji aminokwasowej do innych proteinaz z tej grupy pozwoliła zaliczyć proteinazę SplB do rodziny S1 wg ogólnie przyjętej klasyfikacji za bazą danych MEROPS (http ://me/O£>s.sanger.ac.uk/; Rawlings, N.D., Morton, F.R. & Barrett, A.J. (2006) MEROPS'. the peptidase database. Nucleic Acids Res 34, D270-D272). Zgodnie z powszechnym przeświadczeniem wyrażonym m.in. w wiodącej referencji z dziedziny enzymów proteolitycznych, bazie danych MEROPS uznaje się, że: „Wszystkie scharakteryzowane peptydazy należące do rodziny chymotrypsynopodobnych są endopeptydazami. Istnieją także liczne, nie będące peptydazami homologii, w których reszty katalityczne zostały zastąpione. Istnieją trzy główne typy aktywności: trypsynopodobny, w którym następuje odtrawienie substratu amidowego następującego po resztach Arg lub Lys w pozycji P1, chymotrypsynopodobny, w którym trawienie następuje za jednym z aminokwasów hydrofobowych w P1 i elastazopodobny, w którym trawienie następuje za resztą Ala w pozycji P1. Specyficzność substratowa rodziny S1 zależy jedynie od aminokwasu znajdującego się w pozycji P1. Większość peptydaz należących do tej rodziny podlega sekrecji i posiada N-końcowy sekrecyjny peptyd sygnałowy. Są one syntetyzowane w postaci prekursorów z dodatkową sekwencją na N-końcu, której usunięcie daje aktywną formę enzymu. Aktywacja nie zawsze wymaga usunięcia propeptydu. Jak pokazano w dalszej części niniejszego opisu ogólne wskazówki zawarte w stanie techniki mogą prowadzić jedynie do błędnych wniosków dotyczących specyficzności substratowej proteinazy SplB i uznania ją za enzym o nikłej przydatności przemysłowej.

PL 213 994 Β1

W świetle opisanego stanu techniki celem niniejszego wynalazku jest dostarczenie wysoce specyficznej proteinazy oraz sposobu jej otrzymywania oraz charakterystyki jej aktywności pozwalającej na jej przemysłowe wykorzystywanie.

Nieoczekiwanie twórcy tego wynalazku ustalili, że proteinaza SplB posiada dużo węższą niż oczekiwana specyficzność substratową. Bazując na tym odkryciu zaproponowano nowe specyficzne substraty dla proteinazy SplB oraz sposoby hydrolizy i/lub otrzymywania białek wykorzystujące takie peptydy (fragmenty sekwencji) oraz nowe zastosowania proteinazy SplB. Uzyskanie tych wyników było możliwe dzięki opracowaniu wydajnej metody produkcji proteinazy SplB, którą ujawniono w niniejszym opisie.

W opisie ujawniono polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB posiadający sekwencję aminokwasowąXaa1-Xaa2-Xaa3-Xaa4-Xaa5, gdzie:

Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly,

Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr,

Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,

Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,

Xaa5 jest pominięty lub jest dowolnym aminokwasem.

Ujawniony polipeptyd charakteryzuje się tym, że korzystnie posiada sekwencję wybraną spośród:

Trp-Glu-Leu-Gln-Gly,

Trp-Glu-Leu-GIn,

Trp-Glu-Leu-Thr,

Trp-Glu-Val-Gln,

Val-Glu-Leu-Gln,

Trp-GIn-Leu-Asp,

Trp-Val-Leu-Gln,

Phe-Glu-Val-Glu,

Gly-Arg-Gly-Val-Gly,

Gly-Arg-Gly-Val,

Val-Glu-lle-Asp.

Kolejno w niniejszym opisie ujawniono białko rozpoznawane przez proteinazę SplB posiadające sekwencję aminokwasową zawierającą zdefiniowany powyżej polipeptyd. Następnie ujawniono sekwencję nukleotydową kodującą ujawniony polipeptyd zdefiniowany powyżej oraz sekwencję nukleotydową kodującą ujawnione białko zdefiniowane powyżej.

Ujawniono również zastosowanie sekwencji polipeptydu zdefiniowanej powyżej lub jego pochodnej przy wytwarzaniu białka rozpoznawanego przez proteinazę SplB lub jej pochodną.

Ujawniono kolejno sposób otrzymywania pożądanego białka charakteryzujący się tym, że:

a) dostarcza się białko fuzyjne posiadające sekwencję Z1-Xaa1-Xaa2-Xaa3-Xaa4-Z2, gdzie: Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly, Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr, Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,

Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,

Z1 i Z2 oznacza polipeptyd zawierający jeden lub więcej aminokwasów, przy czym jeden z nich oznacza polipeptyd zawierający pożądane białko a drugi polipeptyd zawierający polipeptyd znacznikowy,

b) izoluje się białko fuzyjne, korzystnie techniką chromatograficzną stosując złoże posiadające powinowactwo do polipeptydu znacznikowego,

c) prowadzi się reakcję hydrolizy białka fuzyjnego za pomocą proteinazy posiadającej aktywność enzymatyczną proteinazy SplB, przy czym korzystnie izoluje się pożądane białko z mieszaniny reakcyjnej.

Dla celów niniejszego opisu jako polipeptyd zawierający polipeptyd znacznikowy, zwany też w niniejszym opisie metką lub polipeptydem znacznikowym, należy rozumieć sekwencję pozwalającą na izolowanie zawierającego ją polipeptydu, zwłaszcza techniką chromatografii powinowactwa. Specjalista będzie w stanie zaproponować opierając się na powszechnie dostępnej wiedzy szereg tego rodzaju sekwencji, które można wykorzystać do zaprojektowania układu do izolowania produkowanego białka w szczególności techniką chromatografii powinowactwa. Przykładowo, wprowadzenie sekwencji rozpoznawanej przez przeciwciało pozwala na izolowanie zawierającego ją białka za pomocą tego przeciwciała. Innym przykładem są sekwencje aminokwasowe posiadające powinowactwo do glutationu. Kolejnym przykładem są techniki opierające się na znanym zjawisku tworzenia kompleksów niektórych jonów metali z niektórymi

PL213 994B1 resztami aminokwasowymi. Najbardziej znanym przykładem takiego układu jest kompleksowanie jonów niklu przez pierścienie imidazolowe histydyn wprowadzonych do izolowanego łańcucha polipeptydowego. Wszystkie tego typu układy składające się ze znacznikowej sekwencji aminokwasowej i substancji, do której taka sekwencja posiada odpowiednio silne powinowactwo, pozwalają zaprojektować system oczyszczania białka zawierającego sekwencję znacznikową. Zwykle będzie to technika chromatografii powinowactwa na złożu zawierającym wspomnianą substancję.

W związku z powyższym, znacznikowa sekwencja aminokwasowa może zawierać sekwencję składającą się z sześciu kolejnych histydyn (His6).

Pożądane białko wchodzące w skład ujawnionego białka fuzyjnego wspominanego powyżej może być dowolnym znanym białkiem, dla którego znana jest sekwencja aminokwasowa lub sekwencja kodująca. Przykładowo, może to być białko lecznicze, którego produkcja pożądana jest ze względu na jego właściwości terapeutyczne. W oparciu o instrukcje ujawnione w niniejszym opisie oraz powszechnie dostępną wiedzę fachowiec będzie w stanie opracować sekwencję kodującą białko fuzyjne zawierającą sekwencję kodującą pożądane białko. Sekwencje aminokwasowe lub sekwencje kodujące znanych białek mogą być przykładowo pozyskane z bazy GenBank dostępnej w sieci internet pod adresem http://www.ncbi.nim.nih.gov/Genbank/index.html, w której zgromadzono sekwencje znanych genów oraz sekwencje aminokwasowe znanych białek. Aby zwiększyć poziom ekspresji białka fuzyjnego w układzie bakteryjnym można zastosować znane metody podnoszenia poziomu ekspresji w komórkach bakteryjnych, które obejmują stosowanie silnych promotorów, stosowanie sekwencji wzmacniających transkrypcję lub stosowanie kodonów preferowanych przez wybraną komórkę bakteryjną.

Ujawniony sposób charakteryzuje się tym, że, białko fuzyjne posiada, korzystnie, sekwencję wybraną spośród:

Z1 -T rp-Glu-Leu-Gln-Z2,

Z1 -T rp-Glu-Leu-Thr-Z2,

Z1-Trp-Glu-Val-Gln-Z2,

Z1 -Val-Glu-Leu-Gln-Z2,

Z1 -T rp-Gln-Leu-Asp-Z2,

Z1 -T rp-Val-Leu-Gln-Z2,

Z1-Phe-Glu-Val-Glu-Z2,

Z1 -Gly-Arg-Gly-Val-Gly-Z2,

Z1-Gly-Arg-Gly-Val-Z2, Z1-Val-Glu-lle-Asp-Z2.

W ujawnionym sposobie hydrolizę prowadzi się korzystnie w temperaturze od 0°C do 45°C, w pH od 6,0 do 9,0 lub w buforze fosforanowym, Bis-Tris, CAPS lub Tris o stężeniu od 1 do 250mM lub w roztworze zawierającym od 0 do 500mM NaCI.

Przedmiotem wynalazku jest mutant proteinazy SplB charakteryzujący się tym, że posiada sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.

Korzystnie, sekwencja sekrecyjna jest bakteryjną sekwencją sekrecyjną z Bacillus subtilis. Kolejnym przedmiotem wynalazku jest sekwencja nukleotydowa kodująca mutanta proteinazy SplB posiadającego sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.

Korzystnie sekwencja nukleotydową posiada sekwencję wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11.

Kolejnym przedmiotem wynalazku jest sposób otrzymywania mutanta proteinazy SplB, charakteryzujący się tym, że:

a) w komórkach gospodarza bakteryjnego prowadzi się ekspresję mutanta proteinazy SplB posiadającego sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12, korzystnie kodowanego przez sekwencję nukleotydową wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11, a następnie;

b) izoluje się pożądany enzym lub zawierającą go frakcję.

Korzystnie, gospodarzem bakteryjnym jest szczep Bacillus subtilis ekspresjonujący białko kodowane przez sekwencję nukleotydową przedstawioną jako SEQ ID No.: 3.

Korzystnie, w etapie b) oddziela się brzeczkę fermentacyjną od masy bakteryjnej poprzez wirowanie, białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysala się siarczanem

PL 213 994 Β1 amonu, oddziela się wysolone białka i rozpuszcza w niewielkiej ilości roztworu buforowego i dializuje się do buforu o pH około 5,5.

Korzystnie, w etapie b) dodatkowo oczyszcza się wyizolowane białko techniką chromatografii powinowactwa, chromatografii jonowymiennej i/lub sączenia molekularnego, a ostatecznie oczyszczony preparat zagęszcza się i ewentualnie poddaje krystalizacji.

W jednej z korzystnych realizacji sposobu produkcji aktywnej proteinazy SplB można wykorzystać zdolności katalityczne samego enzymu. W metodzie tej produkuje się enzym z N-terminalną metką fuzyjną wybraną korzystnie z bogatej puli opisanych metek lub nowym peptydem o własnościach pożądanych dla metki. Metkę taką może stanowić przykładowo, lecz nie jedynie metka histydynowa (tzw. ang. His-tag). Pomiędzy metkę fuzyjną a sekwencję proteinazy SplB wstawia się dogodnie sekwencję rozpoznawaną i przecinaną przez proteinazę SplB. Po wyprodukowaniu opisanego białka fuzyjnego izoluje się je wykorzystując właściwości metki, a następnie odcina się metkę przy pomocy katalitycznych ilości proteinazy SplB. Uwolniona od metki proteinaza SplB zwiększa pulę aktywnego enzymu przyspieszając zakończenie procesu odcinania. Odcinanie metki można prowadzić bezpośrednio na złożu stosowanym do izolacji białka fuzyjnego lub też po elucji, przy czym pierwsza metoda pozwala na jednoczesne oczyszczenie proteinazy od metki fuzyjnej, natomiast w drugim przypadku konieczne jest wprowadzenie dodatkowego stopnia oczyszczania.

W opisie ujawniono zastosowanie proteinazy SplB do specyficznej hydrolizy polipeptydu zawierającego sekwencję aminokwasowąXaa1-Xaa2-Xaa3-Xaa4, gdzie:

Xaa1 jest aminokwasem wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly, Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr, Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly, Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn.

Hydrolizowany polipeptyd może posiadać sekwencję aminokwasową zawierającą sekwencję wybraną spośród:

Trp-Glu-Leu-Gln-Gly,

Trp-Glu-Leu-GIn,

Trp-Glu-Leu-Thr,

Trp-Glu-Val-Gln,

Val-Glu-Leu-Gln,

Trp-GIn-Leu-Asp,

Trp-Val-Leu-Gln,

Phe-Glu-Val-Glu,

Gly-Arg-Gly-Val-Gly,

Gly-Arg-Gly-Val,

Val-Glu-lle-Asp.

Hydrolizę można prowadzić w temperaturze od 0°C do 45°C, w pH od 6,0 do 9,0. Hydrolizę prowadzi się również w buforze fosforanowym, Bis-Tris, CAPS lub Tris o stężeniu od 1 do 250mM lub w roztworze zawierającym od 0 do 500mM NaCI.

Ujawniono również proteinazę posiadającą aktywność proteinazy Sól posiadającą centrum aktywne tworzone przez triadę katalityczną His, Asp i Ser, przy czym RMSD atomów aminokwasów tworzących triadę katalityczną jest niewiększe niż 1,7A, korzystnie niewiększe niż 1,5A, w zestawieniu z His 39, Asp 77 i Ser 157 zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.

Korzystnie, ujawniona proteinaza charakteryzuje się tym, że RMSD węgli Ca łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych rdzenia cząsteczki (a więc nie uwzględniając pętli, innych elementów ruchomych, fragmentów eksponowanych na zewnątrz cząsteczki oraz jej słabo zdefiniowanych elementów wg sztuki) jest niewiększe niż 2A, korzystnie niewiększe niż 1,5A, w zestawieniu z odpowiadającymi im strukturalnie węglami Ca łańcucha głównego zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.

Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że dobrze zdefiniowana struktura drugorzędowa rdzenia cząsteczki zawiera fragmenty odpowiadające strukturalnie fragmentowi białka SplB wybranemu korzystnie spośród następujących sekwencji: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199.

PL213 994B1

Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że zawiera fragment tworzący α-helisę odpowiadający strukturalnie fragmentowi białka SplB wybranemu korzystnie spośród następujących sekwencji: Lys38 do Ser41, Lys196 do Glu200.

Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że zawiera fragmenty tworzące β-harmonijkę odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród następujących sekwencji: Val4 do Thr5, Val18 do Ala20, Thr25 do Val28, Thr33 do Thr36, Arg49 do Ala52, Ile63 do Asn71, Ser79 do Val83, Arg115 do Ile119, Tyr132 do Gly136, Ser145 do Tyr148, Val 161 do Leu162, Gly170 do Ser175, Ala185 do Val 188.

Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że posiada strukturę trzeciorzędową dla której RMSD węgli Ca łańcucha głównego jest niewiększe niż 2,2A, korzystnie niewiększe niż 1,8A, w zestawieniu z odpowiadającymi im węglami Ca łańcucha głównego zawartymi w proteinazie SplB o strukturze trzeciorzędowej określonej w tabeli 1.

Równie korzystnie, ujawniona proteinaza charakteryzuje się tym, że posiada następujące elementy strukturalne:

- w pozycji odpowiadającej Val28 w sekwencji SplB zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;

- w pozycji odpowiadającej Val29 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;

- w pozycji odpowiadającej Ile34 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;

- w pozycji odpowiadającej Leu35 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;

- w pozycji odpowiadającej Thr36 zawiera aminokwas wybrany spośród Ser, Thr;

- w pozycji odpowiadającej His39 zawiera His;

- w pozycji odpowiadającej Ile66 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;

- w pozycji odpowiadającej Ile69 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;

- w pozycji odpowiadającej Asp77 zawiera Asp;

- w pozycji odpowiadającej Val78 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;

- w pozycji odpowiadającej Val80 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;

- w pozycji odpowiadającej Ile81 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;

- w pozycji odpowiadającej Val118 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Ser, Thr;

- w pozycji odpowiadającej Gly120 zawiera Gly;

- w pozycji odpowiadającej Tyr121 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;

- w pozycji odpowiadającej Leu131 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala, Met;

- w pozycji odpowiadającej Gly155 zawiera Gly;

- w pozycji odpowiadającej Asn156 zawiera aminokwas wybrany spośród Asn, Gin, Asp, Glu;

- w pozycji odpowiadającej Ser157 zawiera Ser;

- w pozycji odpowiadającej Gly158 zawiera Gly;

- w pozycji odpowiadającej Ser159 zawiera aminokwas wybrany spośród Val, Ala, Ser, Thr, Gly;

- w pozycji odpowiadającej Pro160 zawiera Pro;

- w pozycji odpowiadającej Gly170 zawiera Gly;

- w pozycji odpowiadającej Ile171 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala;

- w pozycji odpowiadającej Phe197 zawiera aminokwas wybrany spośród Tyr, Phe, Trp;

- w pozycji odpowiadającej Ile198 zawiera aminokwas wybrany spośród Val, Leu, Ile, Ala.

Uszczegóławiając w opisie ujawniono polipeptyd wykazujący powinowactwo do centrum aktywnego proteinazy SplB posiadający sekwencję aminokwasowąXaa1-Xaa2-Xaa3, Xaa4-Xaa5, gdzie

Xaa1 jest aminokwasem z hydrofobowym łańcuchem bocznym lub aminokwasem z niewielkim łańcuchem bocznym, korzystnie wybranym spośród: Trp, Ala, Ile, Leu, Met, Phe, Tyr, Val, Ser, Thr lub Gly,

Xaa2 to kwas glutaminowy, glutamina, kwas asparaginowy, asparagina lub aminokwas z niewielkim łańcuchem bocznym lub arginina, korzystnie Xaa2 jest aminokwasem wybranym spośród Glu, Gin, Asp, Asn, Val, Leu, Ile, Gly, Arg, Ser lub Thr,

Xaa3 to aminokwas z niewielkim hydrofobowym łańcuchem bocznym albo aminokwas z niewielkim łańcuchem bocznym, korzystnie Xaa3 jest aminokwasem wybranym spośród Leu, Ile, Val, Thr, Ser lub Gly,

Xaa4 jest aminokwasem wybranym spośród: Gin, Glu, Thr, Ser, Asp lub Asn,

Xaa5 jest pominięty lub jest dowolnym aminokwasem.

W sekwencjach odpowiednie symbole oznaczają: A, Ala, alanina; V, Val, walina; L, Leu, leucyna; I, Ile, izoleucyna; P, Pro, prolina; F, Phe, fenyloalanina; W, Trp, tryptofan; M, Met, metionina; G,

PL 213 994 Β1

Gly, glicyna; S, Ser, seryna; T, Thr, treonina; C, Cys, cysteina; Y, Tyr, tyrozyna; N, Asn, asparagina; Q Gin, glutamina; D, Asp, kwas asparaginowy; E, Glu, kwas glutaminowy; K. Lys, lizyna; R, Arg, arginina; H, His, histydyna;

Xaa5 może być w przypadku proteinazy SplB pominięty lub być dowolnym aminokwasem gdyż nieoczekiwanie proteinaza SplB odróżnia się od innych proteinaz cechujących się wysoką specyficznością substratową, które wykazują zazwyczaj określoną specyficzność również wobec aminokwasu znajdującego się bezpośrednio za hydrolizowanym wiązaniem (na nowym N-końcu powstającym w wyniku hydrolizy wiązania peptydowego; tj. w miejscu PT zgodnie z systemem numeracji przyjętym w tym zgłoszeniu, a zaproponowanym przez: Schechter, I., and Berger, A. (1967) Blochem. Biophys. Res. Commun. 27,157-162). W przypadku proteinazy SplB preferencji takiej nie obserwujemy.

Cecha ta jest szczególnie korzystna, ponieważ pozwala na dowolne projektowanie N-końca uwalnianych produktów.

Kolejny aspekt ujawnienia dotyczy białek posiadających ustaloną aktywność proteinazy SplB dzięki zachowaniu przez te białka struktury trzeciorzędowej proteinazy SplB przedstawionej w tabeli 1.

Istnieje powszechnie stosowany parametr określający podobieństwo struktur trzeciorzędowych, który pozwala na zdefiniowanie grupy ujawnionych białek o pożądanych właściwościach. Parametr ten to RMS distance (deviation) (ang. root mean square distance (deviation)) określany także jako RMSD. Wartość parametru RMSD wylicza się porównując położenia odpowiadających sobie atomów po uprzednim nałożeniu na siebie porównywanych struktur w celu ich optymalnego dopasowania. Wartość parametru wyraża się w angstremach (A) i tak też przyjęto w dalszym tekście. Ogólnie, im niższa wartość parametru tym struktury bardziej podobne.

Zatem niniejszy opis ujawnia białka o wzmiankowanej aktywności proteolitycznej, których struktura trzeciorzędowa jest dostatecznie podobna do struktury proteinazy SplB. Rzeczone podobieństwo mierzymy wartością parametru RMSD dla istotnych komponentów strukturalnych proteinazy SplB w stosunku do odpowiadających im komponentów strukturalnych porównywanego białka. W szczególności ujawniono enzym, którego:

a) RMSD wszystkich atomów reszt triady katalitycznej (seryny, histydyny i kwasu asparaginowego) jest mniejsze lub równe 1,7A, korzystnie mniejsze lub równe 1,5A, przy czym korzystnie dodatkowo spełnia ona co najmniej jedno z następujących kryteriów:

b) RMSD odpowiadających strukturalnie węgli Ca łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych jest mniejsze lub równe 2,0A, korzystnie mniejsze lub równe 1,5A,

c) tak jak w (b) z tym ze dobrze zdefiniowane strukturalnie elementy cząsteczki obejmują fragmenty łańcucha polipeptydowego wybrane korzystnie spośród następujących fragmentów określonych wg numeracji SplB oraz odpowiadających im strukturalnie fragmentów porównywanej cząsteczki: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199;

d) RMSD atomów łańcucha głównego w obrębie dobrze zdefiniowanych struktur drugorzędowych jest mniejsze lub równe 2,2A, korzystnie mniejsze lub równe 1,8A;

e) tak jak w (d) z tym ze dobrze zdefiniowane strukturalnie elementy cząsteczki obejmują fragmenty łańcucha polipeptydowego wybrane korzystnie spośród następujących fragmentów określonych wg numeracji SplB oraz odpowiadających im strukturalnie fragmentów porównywanej cząsteczki: Val4 do Lys6, Thr16 do Ala20, Ala24 do Val29, Thr33 do Val40, lle50 do Ala52, Ile63 do Asn71, Val78 do Glu84, Arg115 do Ile119, Leu131 do Val138, Ser145 do Tyr148, Thr152 do Leu162, Gly170 do Ser175, Ala185 do Tyr189, Lys196 do Ala199;

f) Fragmenty odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród określonych poniżej tworzą β-harmonijkę: Val4 do Thr5, Val18 do Ala20, Thr25 do Val28, Thr33 do Thr36, Arg49 do Ala52, Ile63 do Asn71, Ser79 do Val83, Arg115 do Ile119, Tyr132 do Gly136, Ser145 do Tyr148, Val161 do Leu162, Gly 170 do Ser175, Ala185 do Val188

g) Fragmenty odpowiadające strukturalnie fragmentom białka SplB wybranym korzystnie spośród określonych poniżej tworzą α-helisę: Lys38 do Ser41, Lys196 do Glu200.

Analiza struktury trzeciorzędowej proteinazy SplB pozwoliła zlokalizować regiony oraz reszty szczególnie istotne w procesie rozpoznawania substratu i katalizy. Ujawniono zatem białka posiadające reszty odpowiadające następującym kluczowym resztom aminokwasowym w sekwencji proteinazy SplB:

PL213 994B1

a. ) reszty tzw. triady katalitycznej które w przypadku proteinazy SplB stanowią: S157, H39 i D77. Zamiana tych reszt skutkuje całkowitą utratą zdolności katalitycznych. Przykładowo, dla proteinazy SplB wykazano, że mutant S157—>A jest całkowicie pozbawiony aktywności proteolitycznej.

b. ) reszty odpowiedzialne za rozpoznanie substratu:

P1: przede wszystkim S175, H172, T152 do N156, A174

P2: przede wszystkim F173, H39 i D77

P3: przede wszystkim S175

P4: przede wszystkim F173 i Y186,

d.) reszta kwasu glutaminowego na N-końcu łańcucha polipeptydowego, która to reszta jest odpowiedzialna za stabilizację N-końca białka przez wiązania wodorowe a tym samym umożliwia wyrażanie pełnej aktywności proteolitycznej. Reszta ta może być ewentualnie zastąpiona resztą kwasu asparaginowego wykazującą podobne właściwości fizykochemiczne.

Ujawnione w pracy J. Mol. Biol. (2006) 358, 270-279 porównanie sekwencji aminokwasowych homologicznych białek gronkowcowych (proteinazy V8 oraz toksyn epidermolitycznych) i trypsyny wskazuje na ważne rejony w sekwencji białka niezbędne dla prawidłowego fałdowania i/lub zachowania funkcji (fig. 1): V28 do V40; D77 do 181; G120 do P122 oraz G155 do 1171. Ponadto widać wyraźnie konserwację pojedynczych reszt: 150; S134; 1146; V188 i 1198. Jednak dopiero rozwiązanie struktury trzeciorzędowej proteinazy SplB pozwala na stworzenie porównania sekwencji na podstawie porównania struktur - a więc porównania sekwencji odpowiadających sobie elementów strukturalnych (najpierw porównuje się struktury, a następnie tam gdzie są podobne zestawia się tylko sekwencje, nawet jeśli nie są one homologiczne w klasycznym rozumieniu). Rozwiązanie takie niesie ze sobą dużo więcej informacji niż zwykłe porównanie sekwencji gdyż wskazuje elementy ważne dla zachowania funkcji białka. Porównanie takie zostało przedstawione na fig. 2, gdzie odpowiednie fragmenty są zgrupowane na podstawie podobieństw strukturalnych. Takie podejście pozwala na ewidentne wyróżnienie regionów konserwatywnych istotnych dla funkcji białka. Zatem ujawnione białko powinno posiadać w miejscach odpowiadających następującym aminokwasom w sekwencji SplB następujące reszty:

Val28 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;

Val29 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;

Ile34 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;

Leu35 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;

Thr36 - optymalnie zawiera aminokwasy wybrane spośród Ser, Thr;

His39 - histydyna triady katalitycznej;

Ile66 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;

Ile69 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;

Asp77 - kwas asparaginowy triady katalitycznej;

Val78 - optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala;

Val80 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met;

Ile81 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met;

Val118 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Ser, Thr;

Gly120 - optymalnie Gly;

Tyr121 - optymalnie zawiera aminokwasy z dużym, hydrofobowym łańcuchem bocznym wybrane spośród Tyr, Phe, Trp;

Leu131 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala, Met

Gly155 - optymalnie Gly;

Asn156 - optymalnie zawiera aminokwasy wybrane spośród Asn, Gin, Asp, Glu;

Ser157 - seryna triady katalitycznej o której była mowa wcześniej, musi być Ser;

Gly158 - optymalnie Gly;

Ser159 - optymalnie zawiera aminokwasy wybrane spośród Val, Ala, Ser, Thr, Gly;

Pro160 - optymalnie Pro;

PL 213 994 Β1

Gly170 - optymalnie Gly;

Ile171 - optymalnie zawiera aminokwasy wybrane spośród Val, Leu, Ile, Ala;

Phe197 - optymalnie zawiera aminokwasy z dużym, hydrofobowym łańcuchem bocznym wybrane spośród Tyr, Phe, Trp;

Ile198 -optymalnie zawiera aminokwasy z niewielkim, hydrofobowym łańcuchem bocznym wybrane spośród Val, Leu, Ile, Ala.

Szczególną realizacjąjest białko posiadające strukturę proteinazy SplB określoną w tabeli 1.

Zgodnie z ujawnieniem proteinaza SplB rozpoznaje specyficzną sekwencję aminokwasową i hydrolizuje łańcuch polipeptydowy zaraz za lub w obrębie rozpoznawanej sekwencji. Z uwagi na długość rozpoznawanej sekwencji (cztery kolejne aminokwasy) liczba identycznych sekwencji w proteomie człowieka wynosi zaledwie kilkanaście, a więc enzym ten nadaje się m.in. do odcinania metek fuzyjnych przy produkcji pozostałych kilkudziesięciu tysięcy białek ludzkich. Ujawniono przede wszystkim sekwencje aminokwasowe łańcucha polipeptydowego specyficznie rozpoznawane lub specyficznie rozpoznawane i hydrolizowane przez proteinazę SplB, sekwencje nukleotydowe kodujące rzeczone sekwencje aminokwasowe (a więc pozwalające na produkcję polipeptydów je zawierających przy pomocy technologii białek rekombinowanych) oraz metodę specyficznej hydrolizy polipeptydów zawierających rzeczone sekwencje aminokwasowe przy pomocy proteinazy SplB. Ujawniono także samą proteinazę SplB jako enzym rozpoznający lub rozpoznający i hydrolizujący wybrane sekwencje aminokwasowe oraz sposoby produkcji proteinazy SplB w systemie rekombinowanym. Ponadto ujawniono syntetyczne substraty oparte na sekwencjach specyficznie rozpoznawanych i hydrolizowanych przez proteinazę SplB.

Podsumowując najważniejsze zalety prezentowanego wynalazku, należy uznać, że przedmiot wynalazku oraz szczególnie korzystne ujawnione aspekty mogą znaleźć zastosowanie w następujących procesach:

a) rozpoznanie specyficznej sekwencji aminokwasowej łańcucha polipeptydowego (w szczególności sekwencji białka rekombinowanego) i jego specyficzna hydroliza w ściśle określonym miejscu w obrębie lub w niewielkiej odległości od rozpoznawanej sekwencji,

b) wysoce wydajna produkcja proteinazy SplB.

Przedmioty wynalazku zostały zdefiniowane w zastrzeżeniach patentowych.

Dla lepszego zilustrowania istoty wynalazku i ujawnionych aspektów niniejszy opis wzbogacono o wykaz sekwencji i figury.

Sekwencja nr 1 (SEQ ID NO 1) prezentuje sekwencję kodującą proteinazę SplB ze Staphylococcus aureus wraz z jej natywnym peptydem sygnalnym.

Sekwencja nr 2 (SEQ ID NO 2) prezentuje sekwencję aminokwasową proteinazy SplB ze Staphylococcus aureus (dojrzałe białko: aminokwasy od 1 do 204) wraz z jej natywnym peptydem sygnalnym (aminokwasy od -36 do -1).

Sekwencja nr 3 (SEQ ID NO 3) prezentuje sekwencję kodującą wariant proteinazy SplB ze Staphylococcus aureus, w której sekwencję kodującą natywny peptyd sygnalny zastąpiono sekwencją kodującą peptyd sygnalny pochodzący z Bacillus subtilis.

Sekwencja nr 4 (SEQ ID NO 4) prezentuje sekwencję aminokwasową wariantu proteinazy SplB ze Staphylococcus aureus, w której sekwencję natywnego peptydu sygnalnego zastąpiono sekwencją peptydu sygnalnego pochodzącego z Bacillus subtilis (aminokwasy od -29 do -1).

Sekwencja nr 5 (SEQ ID NO 5) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję S157A natomiast sekwencja nr 6 (SEQ ID NO 6) prezentuje sekwencję aminokwasowątego wariantu.

Sekwencja nr 7 (SEQ ID NO 7) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję H39A natomiast sekwencja nr 8 (SEQ ID NO 8) prezentuje sekwencję aminokwasową tego wariantu.

Sekwencja nr 9 (SEQ ID NO 9) prezentuje sekwencję kodującą wariant proteinazy SplB z S. aureus z peptydem sygnalnym z B. subtilis zawierający substytucję D77A natomiast sekwencja nr 10 (SEQ ID NO 10) prezentuje sekwencję aminokwasową tego wariantu.

Sekwencja nr 11 (SEQ ID NO 11) prezentuje sekwencję kodującą białko fuzyjne zawierające sekwencję dojrzałej formy SplB z S. aureus, do której przyłączono metkę histydynową i sekwencję rozpoznawaną przez SplB natomiast sekwencja nr 12 (SEQ ID NO 12) prezentuje sekwencję aminokwasową tego białka.

PL213 994B1

Figura 1 zawiera porównanie sekwencji aminokwasowych blisko spokrewnionych proteinaz: proteinaza SplB, proteinaza SpIC, V8 (proteinaza V8 ze Staphylococcus aureus zwana inaczej glutamylendopeptydazą), ETA - toksyna epidermolityczna A ze Staphylococcus aureus oraz daleko spokrewnionego enzymu - trypsyny (modelowy enzym dla grupy proteinaz trypsynopodobnych). Podobieństwa sekwencji oznaczono odcieniami szarości - im ciemniejsze tym większe podobieństwo. Regiony o wyraźnej homologii sekwencji oraz pojedyncze konserwatywne reszty zaznaczono ramkami.

Figura 2 prezentuje porównanie sekwencji aminokwasowych blisko spokrewnionych proteinaz stworzone na podstawie znajomości ich struktur trzeciorzędowych oraz znajomości struktury trzeciorzędowej ustalonej dla proteinazy SplB; wskazano reszty szczególnie istotne dla zachowania struktury i aktywności proteinazy.

Poniższe przykłady zostały umieszczone jedynie w celu lepszego wyjaśnienia poszczególnych aspektów wynalazku i nie powinny być utożsamiane z całym jego zakresem, który zdefiniowano w załączonych zastrzeżeniach.

Przykład 1. Wstępna charakterystyka proteinazy SplB

Wyjściowym eksperymentem, umożliwiającym dalsze prace było wyznaczenie optimum pH i temperatur, dopuszczalnych stężeń soli i innych odczynników oraz stabilności enzymu. W tym celu należało opracować ilościową metodę oznaczania aktywności enzymu. Przeprowadzone liczne próby z syntetycznymi substratami niskocząsteczkowymi opisane w J. Mol. Biol. (2006) 358, 270-279 oraz kontynuowane również po opublikowaniu tej pracy dla większej liczby substratów nie pozwoliły jednak uzyskać lepszej charakterystyki proteinazy SplB. Enzym wykorzystany w tych eksperymentach otrzymano techniką opisaną w J. Mol. Biol. (2006) 358, 270-279. Wśród znanych substratów proteinaz trypsynopodobnych nie zidentyfikowano substratu trawionego nawet w minimalnym stopniu przez proteinazę SplB. Po długich poszukiwaniach ustalono, że FTC kazeina (kazeina znakowana barwnikiem fluorescencyjnym, umożliwiająca badanie hydrolizy metodą spektrofluorescencji) jest mało wydajnym substratem białkowym trawionym przez proteinazę SplB. W przypadku trawienia tego substratu konieczne było stosowanie nadmiaru molowego enzymu w stosunku do substratu oraz długich (rzędu godzin) czasów inkubacji. Przy jego użyciu udało się jednak określić wstępną charakterystykę aktywności proteinazy SplB jako: optimum pH na 8,25 (+/- 1,5 jednostki w dół i 1 jednostkę w górę), brak wyraźnej zależności aktywności od stężeń popularnych soli do 0,5M, brak wpływu środków redukujących do kilku mM, szeroką tolerancję temperaturową.

Na tej podstawie ustalono podstawowe parametry reakcji hydrolizy zalecane dla reakcji prowadzonej z wykorzystaniem proteinazy SplB. W efekcie, wszystkie kolejne eksperymenty prowadzono w temperaturze od 20°C do 37°C, w 10 do 10OmM buforze fosforanowym lub Tris przy wartości pH od 7,0 do 8,5 i stężeniu NaCI od 0 do 150mM. Ponadto ustalono, że enzym można przechowywać w stanie zamrożonym bez wyraźnej utraty aktywności, oraz kilkakrotnie zamrażać i rozmrażać a także liofilizować. Można go także przechowywać kilka miesięcy w temperaturze 4°C bez wyraźnej utraty aktywności. Wszystkie powyższe warunki stanowią dogodne formy przechowywania enzymu, co jest niezwykle istotne w codziennej praktyce.

Przykład 2. Wstępne próby ustalenia specyficzności substratowej proteinazy SplB

Trawienie β-kazeiny

Standardowo dla oznaczenia specyficzności substratowej proteinazy kontaktuje się ją z różnymi białkami, oznacza się miejsca hydrolizy i na podstawie odpowiedniej ilości prób metodami analizy statystycznej ustala się najbardziej optymalne miejsce cięcia. Takie standardowe postępowanie zastosowane zostało w pierwszym podejściu także dla proteinazy SplB, jednak nie przyniosło ono spodziewanych wyników. Wykazano, że szereg testowanych białek (lizozym białka jaja kury, inhibitor trypsyny z nasion soi, transferyna osocza ludzkiego, albumina osocza wołowego, owalbumina jaja kury, β-galaktozydaza E. coli, anhydraza węglanowa, alfa-2-makroglobulina osocza ludzkiego, cytochrom c, kozie przeciwciała IgG, RNAza, fibrynogen, mioglobina wieloryba, cała gama serpin ludzkich i mysich) nawet przy przedłużonej inkubacji z nadmiarem enzymu nie ulega proteolizie.

Wykrywalną aktywność białka SplB wykazano jedynie metodązymografii na β-kazeinie (J. Mol. Biol. (2006) 358, 270-279). Dalsze eksperymenty innymi metodami (kontaktowanie proteinazy i kazeiny w roztworze, analiza produktów proteolizy przy pomocy SDS-PAGE) potwierdziły ten fakt jednak wykazały też, że dla przeprowadzenia reakcji hydrolizy potrzeba zastosowania molowego nadmiaru enzymu i bardzo długich czasów inkubacji - kilkunastu godzin. Oznacza to, że enzym „bardzo niechętnie” hydrolizuje β-kazeinę (standardowo przy tego typu badaniach stosuje się katalityczne ilości enzymu - 100x i mniej niż substratu oraz krótkie czasy inkubacji - rzędu minut). Metodami spektrometrii

PL 213 994 Β1 masowej oraz chemicznego sekwencjonowania aminokwasowego udało się oznaczyć cztery miejsca cięcia w obrębie cząsteczki β-kazeiny (spacja oznacza miejsce cięcia):

EEQQQ FAQTQ FTESQ LPLLQ

TEDEL SLVYP SLTLT

SWMHQ

Na podstawie tej niewielkiej (a więc mało reprezentatywnej) grupy można by założyć, że zgodnie z wiedzą, iż w tego typu proteinazach specyficzność determinuje reszta w pozycji P1 proteinaza SplB potrzebuje reszty glutaminy (Q) w miejscu P1 substratu (wyróżnione tłustym drukiem). Założenie takie nie tłumaczy zupełnie dlaczego trawieniu nie ulegają inne białka zawierające bardzo wiele reszt glutaminy (Q) w szczególności sama β-kazeina która była trawiona jedynie na kilka fragmentów pomimo, że zawiera kilkanaście reszt Q. Ponadto założenie takie nie tłumaczy także, dlaczego proteinaza SplB jest tak mało wydajna.

Warto także zauważyć, że w pozostałych pozycjach sekwencji trawionych przez SplB w kazeinie, poza P1 ’, tj. P5 do P2 oraz P2’ do P5’ nie można ustalić żadnego wspólnego elementu czy charakterystycznego układu, który sugerowałby znaczenie tych pozycji dla specyficzności substratowej badanej proteinazy. Wydaje się jedynie, że w pozycji PT preferowane są reszty S lub T.

Trawienie substratów syntetycznych, denaturowanych białek i peptydów syntetycznych

W obliczu niepowodzenia eksperymentów opisanych powyżej przyjęto robocze założenie, że proteinaza SplB może trawić jedynie w specjalnych, eksponowanych rejonach białek, a z uwagi na ukrycie innych rejonów zawierających reszty Q wewnątrz struktury cząsteczki białek stosowanych jako substraty nie są one rozpoznawane i trawione. Dlatego przeanalizowano ponownie wybrane białka po uprzedniej denaturacji (karboksymetylowany lizozym, karboksymetylowany BPTI, apomioglobina i apocytochrom c w formie zdenaturowanej, po usunięciu cząsteczki hemu), oraz syntetyczny peptyd (KEGLTETTFEEDGVATGNHEYCVEV) i fluorescencyjne substraty syntetyczne charakteryzujące się brakiem struktur drugorzędowych (Abz-Glu-Ala-Leu-Gly-Thr-Ser-Pro-Arg-Lys(Dnp)-Asp-OH i Abz-GInGly-lle-Gly-Thr-Ser-Arg-Pro-Lys(Dnp)-Asp-OH). Ponadto zsyntetyzowano chemicznie i testowano peptydy odpowiadające regionom flankującym miejsce cięcia zidentyfikowane w cząsteczce kazeiny, mianowicie: FTESOSLTLT oraz EEQQQTEDEL.

We wszystkich przypadkach, pomimo stosowania także nadmiarów molowych proteinazy SplB oraz przedłużonych czasów inkubacji (do 72h) nie udało się wykazać hydrolizy badanych polipeptydów.

Wynik ten jest szczególnie zaskakujący w przypadku dwóch ostatnich peptydów o sekwencji identycznej do oznaczonych wcześniej miejsc cięcia.

Zatem, standardowa metoda oznaczania specyficzności substratowej opisana powyżej, w przypadku proteinazy SplB zupełnie zawiodła.

Potwierdzenie, że białko SplB jest proteinazą

W świetle powyższych wyników, w obliczu wykazanego trawienia cząsteczki β-kazeiny przy zastosowaniu nadmiaru enzymu i przedłużonego czasu inkubacji możliwym do zaakceptowania wytłumaczeniem było zanieczyszczenie badanego preparatu proteinazy SplB śladami innej aktywności proteolitycznej. Innymi słowy proteinaza SplB mogła być, tak jak blisko spokrewniona, homologiczna proteinaza SpIC, białkiem bez aktywności proteolitycznej (w pracy J. Mol. Biol. (2006) 358, 270-279 wykazano, brak aktywności proteolitycznej białka SpIC bardzo blisko spokrewnionego z proteinazą SplB) a przy stosowaniu jej nadmiaru drobne zanieczyszczenia stosowanego preparatu mogły ujawniać swoją aktywność.

Ewentualność taką wyeliminowano zamieniając katalityczną resztę seryny enzymu na resztę alaniny. W proteinazach trypsynopodobnych zamiana taka prowadzi zawsze do całkowitego zahamowania aktywności. Oczyszczony preparat muteiny proteinazy SplB (S157—>A) nie wykazywał zdolności hydrolizy β-kazeiny nawet przy trzykrotnym nadmiarze molowym i 72 godzinnej inkubacji. Eksperyment ten dowiódł roli reszty S157 w mechanizmie katalizy proteinazy SplB oraz potwierdził, że to właśnie ten enzym a nie zanieczyszczenia obecne w preparacie są odpowiedzialne za hydrolizę β-kazeiny.

Przykład 3. Nowa metoda otrzymywania proteinazy SplB

SEQ ID NO: 1 i 2 przedstawia odpowiednio sekwencję nukleotydową genu kodującego proteinazę SplB ze Staphylococcus aureus oraz odpowiadającą jej sekwencję aminokwasową. Numeracja nukleotydów rozpoczyna się od „a(1)” trójki startu translacji (atg) a kończy na ,,a(723)” trójki stopu translacji (taa). Łańcuch polipeptydowy proteinazy powstaje w procesie translacji w połączeniu z pep

PL213 994B1 tydem sygnalnym (numeracja reszt aminokwasowych od M(-36) do A(-1) który w procesie sekrecji jest odcinany przez proteinazę sygnalną. Powstaje wtedy aktywna zewnątrzkomórkowa forma proteinazy SplB, którą można wyizolować z pożywki hodowlanej (numeracja reszt aminokwasowych od E1 do K204). W dalszym opisie stosuje się numerację wprowadzoną na tych sekwencjach.

Sekwencje kodujące dojrzałą formę proteinazy SplB (E1 do K204) sklonowano do odpowiedniego plazmidu ekspresyjnego otrzymując plazmid umożliwiający produkcję zewnątrzkomórkową dojrzalej formy proteinazy SplB w bakteriach gramdodatnich. Sekwencję białka fuzyjnego składającego się z sygnałowej sekwencji sekrecyjnej specyficznej dla B. subtilis oraz dojrzałej formy proteinazy SplB, a także sekwencję nukleotydową kodującą to białko przedstawiono odpowiednio jako SEQ ID No. 3 i SEQ ID No. 4.

W celu uzyskania białka zrekombinowanego bakterie B. subtilis szczep WB800 transformowano plazmidem ekspresyjnym i prowadzono selekcję transformantów na płytkach zawierających kanamycynę (50pg/ml). Wyselekcjonowanymi klonami inokulowano niewielką ilość płynnej pożywki (TSB; Sigma) zawierającej antybiotyk selekcyjny i inkubowano w 37°C z intensywnym mieszaniem przez 8 do 10 h. Tak przygotowaną hodowlą startową inokulowano hodowlę właściwą (4-16L płynnej pożywki z antybiotykami) i inkubowano przy intensywnym mieszaniu w 37°C przez 13 do 16 godzin. Wszystkie dalsze etapy oczyszczania przeprowadzano w 4°C. Bakterie oddzielano od pożywki przez wirowanie przy przyspieszeniu 6000xg przez 30min. Białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysalano siarczanem amonu do 80% nasycenia (561 g/L w 4°C). Wysolone białka oddzielano od pożywki przez wirowanie (15000xg, 1 h), rozpuszczano w niewielkiej ilości 50 mM buforu octanowego pH 5,5 i dializowano przez noc do dużego nadmiaru tego samego buforu. Przedializowaną próbkę poddawano chromatografii jonowymiennej na złożu SP Sepharose FF (GE Healthcare) i zbierano frakcje zawierające największy szczyt białkowy wymywający się przy przewodnictwie buforu wynoszącym ok. 30 mS/cm. W razie wątpliwości frakcje testowano na obecność aktywności proteolitycznej metodą zymografii lub na obecność białka o odpowiedniej masie cząsteczkowej przy pomocy elektroforezy SDS-PAGE albo w inny dogodny sposób. Preparat dializowano do 50 mM buforu octanowego pH 4,8 i poddawano chromatografii jonowymiennej na złożu SOURCE 15S (GE Healthcare). Zbierano frakcje zawierające główny szczyt białkowy i poddawano sączeniu molekularnemu na złożu Superdex S75 w buforze PBS. Tak przygotowany, oczyszczony preparat zagęszczano, porcjowano i przechowywano zamrożony w -20°C.

Przykład 4. Ustalenie struktury trzeciorzędowej i specyficzności substratowej proteinazy SplB.

Metoda opisana w przykładzie 3 pozwoliła na wydajną produkcję badanego białka umożliwiając prowadzenie dalszej analizy jego struktury, a zwłaszcza uzyskanie krystalicznej postaci proteinazy SplB i ustalenie struktury trzeciorzędowej badanej proteinazy, co w efekcie przyczyniło się do określenia specyficzności substratowej proteinazy SplB.

Analiza struktury trzeciorzędowej proteinazy SplB

W celu wskazania na ewentualne determinanty strukturalne obserwowanej bardzo słabej kinetyki hydrolizy wiązań peptydowych oraz ewentualne wskazanie lepszych substratów, metodą krystalografii rentgenowskiej określono strukturę trzeciorzędową proteinazy SplB. Ustalone koordynaty poszczególnych atomów białka dojrzałej proteinazy SplB zgromadzono w tabeli 1. Analiza otrzymanego modelu strukturalnego wskazała, że proteinaza SplB wykazuje budowę charakterystyczną dla proteinaz rodziny S1 (trypsynopodobnych i chymotrypsynopodobnych) nie wykazując wyraźnych uwarunkowań w budowie triady katalitycznej dla obserwowanej słabej aktywności. Ponadto analiza wykazała dobrze wykształcone miejsce P1 zdolne do przyjęcia aminokwasów: D, E, Q lub N oraz charakterystyczną hydrofobową „łatę” na powierzchni białka w okolicy miejsca P3/P4 wskazującą na możliwość, że proteinaza SplB rozpoznaje poza resztą P1 także dalsze reszty substratu, a brak takiego rozpoznania (tj. odpowiedniego miejsca w badanych substratach) może warunkować obserwowaną we wcześniejszych eksperymentach słabą aktywność proteolityczną.

Kluczowe reszty aminokwasowe w sekwencji proteinazy SplB

Ze stanu techniki wiadomo, że kluczowymi resztami dla aktywności trypsynopodobnych proteinaz serynowych są reszty tzw. triady katalitycznej. W przypadku proteinazy SplB, uzyskana struktura trzeciorzędowa potwierdza, że są to: S157, H39 i D77. Zamiana tych reszt skutkuje całkowitą utratą zdolności katalitycznych. Odpowiednie sekwencje nukleotydowe i aminokwasowe takich mutantów przedstawione zostały jako SEQ ID No: 5-10. Stosując ujawnione sekwencje oraz metodę opisanąw przykładzie 3 można uzyskać białka odpowiednich mutantów i poddać je dalszej analizie. Przykładowo, potwierdzono eksperymentalnie, że mutant S157—>A jest całkowicie pozbawiony aktywności proteolitycznej.

PL 213 994 Β1

Na podstawie ustalonej struktury trzeciorzędowej proteinazy SplB oraz modelowania sposobu dokowania substratu m.in. na podstawie znajomości struktur kompleksów homologicznych białek z ich substratami i inhibitorami wynika, że reszty odpowiedzialne za rozpoznanie substratu to:

P1: przede wszystkim S175, H172, T152 do N156, A174

P2: przede wszystkim F173, H39 i D77

P3: przede wszystkim S175

P4: przede wszystkim F173 i Y186

Porównanie struktur trzeciorzędowych form w pełni aktywnej (identyczna z natywną) i słaboaktywnej (zawierająca dwa dodatkowe aminokwasy na N-końcu) proteinazy SplB wskazuje na rolę dokładnego umiejscowienia N-terminalu białka oraz początkowej reszty kwasu glutaminowego (E1).

Porównanie sekwencji aminokwasowych oraz struktur trzeciorzędowych homologicznych białek gronkowcowych (proteinazy V8 oraz toksyn epidermolitycznych) i trypsyny wskazuje na ważne rejony w sekwencji białka niezbędne dla prawidłowego fałdowania i/lub zachowania funkcji (patrz figura 1): V28 do V40; D77 do 181; G120 do P122 oraz G155 do 1171. Ponadto widać wyraźnie konserwację pojedynczych reszt: 150; S134; 1146; V188 i 1198.

Analiza bibliotek substratów syntetycznych

Bazując na wynikach analizy krystalograficznej, w dalszym etapie poszukiwania optymalnych substratów dla proteinazy SplB wykorzystano kombinatoryczną bibliotekę substratów syntetycznych zawierającą 104976 różnych substratów. Biblioteka zawiera substraty, w których na pozycjach P4 do P1 znajdują się wszystkie możliwe permutacje 18 aminokwasów (poza metioniną i cysteiną) a pozycję PT zajmuje 7-amido-4-fluorometylokumaryna, barwnik wykazujący fluorescencję po odcięciu przez proteinazę od części peptydowej, co pozwala na detekcję preferowanych substratów (szczegółowy opis Biol. Chem. (2004). 385:1093-1098). W pierwszym etapie badań skupiono się na ustaleniu preferowanej reszty w pozycji P1. Przegląd biblioteki proteinazą SplB pozwolił na ustalenie, że proteinaza SplB w pozycji P1 na 18 testowanych peptydów toleruje jedynie następujące aminokwasy: Asp, Asn, Gin (wynik zgodny z wynikami trawienia β-kazeiny oraz z przewidywaniami na podstawie analizy struktury proteinazy). Szybkość trawienia wyselekcjonowanych substratów była porównywalna z innymi proteinazami demonstrując, że proteinaza SplB wcale nie jest mało wydajna jak sugerowały wyniki wcześniejszych eksperymentów opisanych w stanie techniki i przykładach 1 i 2.

Stosowana biblioteka nie umożliwia odczytania wyników selekcji w pozycjach P2 do P4. Rozważając jednak odpowiedź na pytanie dlaczego proteinaza SplB nie trawi innych poza β-kazeiną białek, w których znajduje się cały szereg reszt Asp, Asn i Gin, na tym etapie prac stało się oczywiste, że trypsynopodobna proteinaza SplB posiada znacznie większą specyficzność substratową w porównaniu z jej bliskimi (proteinaza V8) i dalekimi (trypsyna, chymotrypsyna i wiele innych) homologami.

Analiza biblioteki kombinatorycznej CLiPS

Wysoka specyficzność substratowa zmusza do przesiania znacznie większej ilości substratów dla znalezienia tego właściwego i stąd konieczność zastosowania bardziej zaawansowanej metody CLiPS (opisanej w publikacji PNAS, (2006). 130: 7583-7588). Bardzo ogólnie, w uzyskanej tą techniką bibliotece jedno z białek zewnętrznej błony komórkowej bakterii jest tak skonstruowane syntetycznie, że zawiera wszystkie możliwe permutacje liniowej sekwencji kilku aminokwasów (każdy szczep bakterii należący do biblioteki zawiera białko o konkretnej sekwencji, ale inne niż pozostałe szczepy bakterie należące do biblioteki). Za sekwencją zmienną znajduje się sekwencja umożliwiająca detekcję fluorescencyjną. Pierwszy etap selekcji (cytometria przepływowa) wybiera komórki fluoryzujące (gdzie interesujące białko ulega ekspresji) następnie komórki te kontaktuje się z testowaną proteinazą i selekcjonuje się te, które nie fluoryzują, a więc te, dla których proteinaza odcięła część fluoryzującą. Następnie dla wyselekcjonowanych w ten sposób szczepów określa się sekwencję interesującego białka, a więc i sekwencje cięcia. Zastosowanie tej metody pozwala na przesianie 64 milionów substratów i uzyskanie informacji co do aminokwasów występujących w pozycjach P5 do PT, a nie tylko P1 (jak w technice opisanej powyżej). Wykorzystując tą metodę wyselekcjonowano następujące sekwencje rozpoznawane i cięte przez proteinazę SplB:

PL213 994B1

P4P₃P₂Pi * Pi'	szybkość cięcia
G WELQ*S	0,81
SWELQ*G	0,62
S WELT*G	0,62
S WELT* V	0,90
SWEVQ*E	0,84
VVELQ‘S	0,65
S WELQ* V	0,61
S WELQ‘S	0,86
S WELQ* E	0,82
SWELQ*M	0,75
E WELQ*S	0,58
S WELQ* A	0,53
SWQLD*A	0,57
SWVLQ*A	0,32
WELQ*	Sekwencja konsensusową

Wytłuszczoną czcionką zaznaczono aminokwasy odpowiadające dokładnie wyselekcjonowanej sekwencji konsensusowej, podkreślono aminokwasy dobiegające od sekwencji konsensusowej, gwiazdką oznaczono miejsce cięcia. Liczba po prawej stronie sekwencji jest miarą szybkości trawienia.

W świetle wcześniejszych eksperymentów i stanu techniki uzyskany wynik jest co najmniej nieoczywisty. Dotychczasowa wiedza o biochemii dziesiątek proteinaz trypsynopodobnych wskazuje prawie wyłącznie na miejsce P1 jako determinujące specyficzność substratową w tego typu białkach. Również wysoce homologiczna do proteinazy SplB - proteinaza V8 także ze Staphylococcus aureus wykazuje specyficzność jedynie dla reszty P1. Dlatego pierwotnie oczekiwano, zgodnie z ogólnym stanem wiedzy, że tak samo będzie w przypadku proteinazy SplB. Ponieważ proteinazy specyficzne tylko dla P1 nie są szczególnie specyficzne mierząc miarą metody CLiPS, metoda ta nie jest zalecana do określania specyficzności takich enzymów. Dopiero wiele niepowodzeń przy próbach przyrównania proteinazy SplB do wiedzy wynikającej ze stanu techniki skłoniło twórców do postawienia i przetestowania innej, mniej prawdopodobniej hipotezy dotyczącej specyficzności badanej proteinazy, która to hipoteza nieoczekiwanie okazała się prawdziwa.

Przykład 5. Wykorzystanie proteinazy SplB do specyficznej hydrolizy białek zawierających sekwencje aminokwasowe według wynalazku.

Trafność wyboru sekwencji konsensusowej oraz przydatność proteinazy SplB zostały potwierdzone w kolejnych eksperymentach. Wykorzystano plazmid umożliwiający ekspresję stafostatyny A jako białka fuzyjnego z GST odcinalnym przy pomocy trombiny (opisany w Mol. Microbiol (2003). 49: 1051-1066; zawierający sekwencję kodującą białko stafostatyna A, którą sklonowano techniką PCR z matrycy genomowego DNA S. aureus do plazmidu pGEX-5T w miejsca BamHI/Xhol uzyskując plazmid umożliwiający ekspresję białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A). Inkubacja białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A z proteinazą SplB, nawet przy przedłużonym czasie inkubacji z nadmiarem enzymu, nie prowadzi do widocznej w metodzie SDS-PAGE hydrolizy interesującego łańcucha polipeptydowego. Metodami inżynierii genetycznej (mutageneza punktowa) zamieniono w omówionym wyżej plazmidzie sekwencję nukleotydową kodującą miejsce cięcia dla trombiny (LVPR*G) na sekwencję konsensusową (WELQ*G) uzyskując plazmid umożliwiający ekspresję białka fuzyjnego GST-miejsce cięcia proteinazy SplB-stafostatyna A. Białko to wyprodukowano w bakteriach E. coli szczepu BL21 pLysS i oczyszczono wykorzystując powinowactwo białka fuzyjnego GST do immobilizowanego glutationu analogicznie jak opisano Mol Microbiol (2003). 49: 1051-1066 dla białka fuzyjnego GST-miejsce cięcia trombiny-stafostatyna A. Kontaktując tak przygotowane białko z proteinazą SplB wykazano bardzo szybką hydrolizę łańcucha polipeptydowego (w czasie rzędu kilkunastu minut przy stukrotnym nadmiarze molowym substratu nad proteinazą SplB). Oznacza to, że proteinaza SplB nie jest mało wydajnym katalitycznie enzymem jak sugerowały eksperymenty z trawieniem β-kazeiny. Przeciwnie, dowodzi to, że jest ona enzymem bardzo wydajnym katalitycznie ale jedynie w stosunku do substratów o prawidłowej sekwencji, która jest nieoczekiwanie znacznie bardziej rozbudowana w porównaniu ze znanymi proteinazami trypsynopodobnymi.

PL 213 994 Β1

Ponadto wyizolowano stafostatynę A uwolnioną z białka fuzyjnego przez trawienie proteinazą SplB i oznaczono metodą degradacji Edmana jej N-końcową sekwencję wykazując, że proteinaza SplB tnie specyficznie i precyzyjnie w obrębie rozpoznawanej sekwencji jedynie w określonym * miejscu (WELCTG).

Podobny wynik powinien przynieść eksperyment, w którym sekwencję rozpoznawaną przez proteinazę SplB wg opisu, zwłaszcza sekwencję konsensusową WELQG, umieszcza się pomiędzy „metką” histydynową (His-Tag), lub dowolną inną „metką” a dowolnym interesującym białkiem, lub między dowolnym interesującym białkiem a dowolną metką, by tak samo jak poprzednio uzyskać precyzyjne odcinanie metki od interesującego białka.

Przykład 6. Rola miejsca P1 ’ w rozpoznaniu substratu

Dla wielu specyficznych proteinaz dużą rolę w rozpoznaniu substratu grają nie tylko miejsca P ale także P’ a głównie PT (np. dla trombiny musi to być mały aminokwas (zwykle Gly)). Jest to dość niewygodne gdyż nie pozwala na dowolne kształtowanie N- końca białka po odcięciu metki. Z analizy substratów wyselekcjonowanych w metodzie CLiPS wynika, że w przypadku proteinazy SplB reszta ta nie ma większego znaczenia (na miejscu PT znajdujemy S, G, V, A ale też aminokwasy o dużym łańcuchu bocznym jak E lub M).

Podobny wynik powinien przynieść eksperyment, w którym w białku fuzyjnym GST- miejsce cięcia przez proteinazę SplB - stafostatyna A w pozycji PT umieszcza się różne aminokwasy (np. zamiana sekwencji WELQ*G na WELQ*Q, WELQ*N), by w sposób analogiczny do opisanego w przykładzie 5, potwierdzić brak wpływu wprowadzonej zamiany na szybkość hydrolizy wiązania.

W tym celu, do białka fuzyjnego GST-miejsce cięcia przez proteinazę SplB - stafostatyna A wprowadzono na pozycji PT następujące aminokwasy: E, K, N, Q, L, F, M. W efekcie uzyskano konstrukty zawierające w białku fuzyjnym opisanym w przykładzie 5 w miejsce sekwencji WELQ GS następujące fragmenty sekwencji:

WELQ ES

WELQ KS

WELQ NS

WELQ QS

WELQ LS

WELQ FS

WELQ MS

Wszystkie białka zrekombinowane otrzymane z tych konstruktów były cięte równie wydajnie przez proteinazę SplB potwierdzając brak wpływu miejsca PT na rozpoznawanie i hydrolizę substratu. Miejsce cięcia zaraz za rozpoznawaną sekwencją konsensusową (WELQ) potwierdzono w każdym przypadku przez sekwencjonowanie uwolnionego nowego N-końca białka metodą degradacji Edmana.

Tabela I. Koordynaty struktury trzeciorzędowej proteinazy SplB ze Staphylococcus aureus, oznaczenia: NA- numer porządkowy atomu, A - rodzaj atomu, AK- rodzaj aminokwasu, NAK - numer porządkowy aminokwasu w strukturze pierwszorzędowej, X, Y, Z - koordynaty atomu

PL213 994B1

ΝΑ	A	AK	NAK	X	Y	Z	NA	A	AK	NAK	X	Ϊ	Z
i	N	GLU	1	10.688	39.517	6.273	89	CA	ILE	12	23.045	38.511	29.008
2	CA	GLU	1	10.569	40.577	7.2Θ8	90	CP	TLE	12	21.702	39.218	29.455
3	CB	GLU	1	10.333	39.952	8.665	91	CG1	ILE	12	21.029	39.865	28.261
4	CG	GLU	i	9.837	40.901	9.754	92	CDI	ILE	12	19.625	4C.425	28.547
5	CD	GLU	1	9.251	40.165	10.946	93	CG2	ILE	12	21.983	40.226	30.542
6	OE1	GLU	1	3.374	39.289	10.757	94	C	ILE	12	22.717	37.420	28.001
7	OE2	GLU	1	9.667	40.471	12.083	95	O	ILE	12	22.994	37,538	26.795
8	C	GLU	1	11.858	41.360	7.274	96	N	PHE	13	22.123	36.351	28.496
9	0	GLU	1	12-925	40.827	6,940	97	CA	PHE	13	21.724	35.268	27.610
10	N	ASN	2	11.763	42.633	7.613	98	CR	PHE	13	21 .355	34.321	28.430
11	CA	ASN	2	12.949	43.448	7.819	99	CG	PHE	13	20.971	32.844	27.592
12	CB	ASN	2	13.143	44.442	6.674	100	CDI	PHE	13	19.632	32.556	27,322
13	CG	ASN	2	14.510	45.115	6.693	101	CE1	PHE	13	19.283	31.462	26,521
14	CDI	ASN	2	15.192	45.178	7.728	102	C2	PHE	13	20.251	30.646	25,987
15	ND2	ASN	2	14.926	45.631	5.526	103	CE2	PHE	13	21.614	30.923	26,241
16	c	ASN	2	12.789	44.141	9.162	104	CD2	PHE	13	21.958	32.029	27,048
17	0	ASN	2	12.416	45.328	9.242	105	C	PHE	13	20.542	35.792	26.787
18	N	ASN	3	13.033	43.376	10.222	106	O	PHE	13	19.660	36.488	27,352
19	CA	ASN	3	12.929	43.887	11.577	107	N	PRO	14	20.437	35.414	25,489
20	CB	ASN	3	11.732	43.269	12.308	108	CA	PRO	14	21.259	34.446	24,695
21	CG	ASN	3	11.568	43.811	13.722	109	CB	PRO	14	20.313	34.045	23.559
22	OD1	ASN	3	1] .626	44.991	13.985	110	CG	PRO	1.4	19.526	35.319	23.294
23	ND2	ASN	3	11.12B	42.953	14.637	111	CD	PRO	14	19.357	35.597	24.666
24	C	ASN	3	14.232	43.633	12.315	112	C	PRO	14	22.523	35.03S	24.111
25	0	ASN	3	14.395	42.625	12.997	113	O	PRO	14	23.323	34.295	23.506
2 6	N	VAL	4	15.154	44.569	12.147	114	N	TYR	15	22.736	36.339	24.304
27	CA	VAL	4	16.495	44.448	12.647	115	CA	TYR	15	23.S13	37.C51	23.597
28	CB	VAL	4	17.501	44.721	11.514	116	CB	TYR	15	23.613	38.555	23.694
29	CG1	VAL	4	18.926	44.579	12.001	117	CG	TYR	15	22.173	38.891	23.362
30	CG2	VAL	4	17.218	43.B10	10.339	118	CDI	TYR	15	21.688	38.763	22.058
31	C	VAL	4	16.553	45.484	13.730	119	CE1	TYR	15	20.350	39.033	21.753
32	0	VAL	4	16.344	46.660	13.50B	120	CS	TYR	15	19.497	39.423	22.773
33	N	THR	5	17.111	45.065	14.908	121	OH	TYR	15	18.188	39.684	22.470
34	CA	THR	5	17.231	45.982	16.043	122	CE2	TYR	15	19.947	39.551	24.082
35	CB	THR	5	16.038	45.834	17,033	123	CD2	TYR	15	21-284	39.273	24.370
36	091	THR	5	16.019	44.513	17.581	124	C	TYR	15	25.205	36.659	24.060
37	CG 2	THR	5	14.704	46.067	16.330	125	0	TYR	15	26.195	36.864	23.342
3B	C	THR	5	18.547	45.772	16.767	126	N	THR	16	25.2?:	35.112	25.270
39	O	THR	5	19.031	44.642	16.866	127	CA	THR	16	26.512	35.543	25.808
40	N	LYS	6	19.123	46.856	17.260	128	CB	THR	16	26.452	35.379	27.349
41	Cft	LYS	6	20.371	46.797	18.306	129	OG1	THR	16	25.250	34.677	27.717
42	CB	LYS	6	20.966	48.199	19.161	130	CG2	THR	16	26.478	36.779	27.980
43	CG	LYS	6	22.207	49.286	19.024	131	C	THR	16	26.973	34 .254	25.110
44	CD	LYS	6	22.759	49.707	18.992	132	O	THR	16	28.076	33.759	25.400
47	C	LYS	6	20.157	46.136	19.366	133	N	GLY	17	26.166	33.746	24.173
48	0	LYS	6	19.220	46.465	20.090	134	CA	GLY	17	26.599	32.636	23.303
49	N	VAL	7	21.038	45.202	19.711	135	c	GLY	17	27.200	33.085	21.980
50	CA	VAL	7	20.924	44.523	20.986	136	O	GLY	17	27.612	32.242	21.177
51	CB	VAL	7	21.754	43.195	21.045	137	N	VAL	1S	27.246	34.405	21.738
52	CG1	VAL	7	21.655	42.613	22.448	138	CA	VAL	19	27.700	34.908	20.465
53	CG2	VAL	7	21.196	42.170	20.048	139	CE	VAŁ	13	26.709	36.016	19.994
54	c	VAL	7	21.300	45.455	22.126	140	CCI	VAL	18	27.257	36.589	18,5B0
55	0	VAL	7	22.444	45.904	22.233	141	CG 2	VAL	18	25.341	35.415	19.687
56	N	LYS	8	20.319	45.738	22.983	142	C	VAL	IB	29.122	35.457	20.571
57	CA	LYS	8	20.528	46.643	24.119	143	O	VAL	18	29.542	36.050	21.599
58	CB	LYS	8	19.201	46.882	24.875	1 44	N	VAL	'.9	29.894	35.203	19.503
63	C	LYS	8	21.612	46.093	25.057	145	CA	VAL	19	31.254	35.703	19.397
64	O	LYS	8	22.62 9	46.755	25.305	146	CB	VAL	19	32.523	34.534	19.460
65	N	ASP	9	21.429	44.863	25.546	147	CG1	VAL	19	32.147	33.697	20.733
ο6	CA	ASP	9	22.397	44.307	26.498	149	CG 2	VAL	19	32.201	33.660	18.213
67	CB	ASP	9	21,740	44,015	27.844	149	C	VAL	19	31.455	36.120	18.050
68	CG	ASP	9	22.755	43,777	28.947	150	O	VAL	19	30.702	36.196	17.068
69	CDI	ASP	9	23.926	43.454	28.637	151	K	ALA	20	32.464	37.286	18.043
70	CD2	ASP	9	22.391	43.920	30.139	152	CA	ALA	20	32.792	38.120	16.685
71	c	ASP	9	23.048	43.037	25.940	153	CD	ALA	20	32.876	39.58B	'.7.315
72	0	ASP	9	22.404	42.015	25.800	154	C	ALA	20	34.128	37.741	16.245
73	N	THR	1C	24.327	43.136	25.629	155	O	ALA	20	35.153	37.687	16.904
74	CA	THR	10	25.040	42.046	24.939	156	N	PHE	21	34 .090	37.514	14.929
75	CB	THR	1 0	26.085	42.628	23.969	157	CA	EHE	21	35.281	37.599	14.075
76	OG1	THR	10	26.877	43.598	24.665	158	CB	EHE	21	35.088	36.631	12.911
77	CG2	THR	10	25.395	43.294	22.773	159	CG	PHE	21	34.989	35.193	13,339
78	C	THR	10	25.702	41.075	25.918	160	CDI	PHE	21	36.146	34.385	13.393
79	O	THR	10'	26.357	40.112	25.504	1 €1	CE1	PHE	21	36.047	33.035	13.801
80	N	ASN	11	25.513	41.333	27.218	162	cz	EHE	21	34 .784	32.506	14.130
81	CA	ASN	11	26.149	40.583	28.306	163	CE2	PHE	21	33.649	33.312	14.091
82	CB	ASN	11	26.927	41.530	29.238	164	CD2	PHE	21	33.760	34.651	13.668
86	C	ASN	11	25.149	39.726	29.088	165	c	PHE	21	35.394	39.055	13.562
87	O	ASN	11	25.394	39.312	30.241	166	O	EHE	21	34.553	39.887	13.907
88	N	ILE	12	24.021	39.431	28.456	167	N	LYS	22	36.410	39.359	12.733

PL 213 994 B1

A	AK	NAK	X	Y	Z	NA	A	AK	NAK	X	Y	Z
CA	LYS	22	36.596	40.704	12.116	251	N	ILE	34	33.306	26.826	19.163
CB	LYS	22	37.718	40.669	11.056	252	CA	ILE	34	32.368	27.717	18.459
C	LYS	22	35.322	41.294	11.5C2	253	CB	ILE	34	32.910	29.166	18.4 35
0	LYS	22	34.921	42.431	11.839	254	CG1	ILE	34	34.134	29.314	17.530
N	SER	23	34.666	40.535	10.623	255	CDI	TLE	34	34.5B1	30.783	17.235
CA	SER	23	33.413	41.017	10.031	256	CG2	ILE	34	33.212	29.759	19.311
CB	SER	23	33.696	41.760	8.729	257	C	TLE	34	32.068	27.161	17.358
OG	SER	23	34.054	40.822	7,740	258	C	TLE	34	32.816	26.300	16.543
C	SER	23	32.444	39.866	9.907	259	N	LEU	35	30.923	27.551	16.495
0	SER	23	31.776	39.770	3.769	260	CA	LEO	35	30.576	27.230	15.119
N	ALA	24	32.366	38.978	10.801	261	CB	LEU	35	29.186	26.583	15.051
CA	ALA	24	31.463	37,953	10.726	262	OG	LEU	35	28.954	25.460	14.090
CB	ALA	24	32.085	36.712	9.948	263	CDI	LEU	35	29.960	24.312,	14.419
C	ALA	24	31.154	37.435	12.172	264	CD2	LEU	35	27.527	24.985	14.255
0	ALA	24	31.710	38.007	13.127	265	C	LEU	35	30.567	28.513	14.304
N	THR	25	30.278	36.442	12.288	265	O	LEU	35	30.199	29.589	14.768
CA	THR	25	29.734	35.999	13.559	267	N	THR	36	31.024	28.417	13.055
CB	THR	25	23.196	36.155	13.529	2 63	CA	THR	36	30.840	29.566	12.134
OGl	THR	25	27.869	37.496	13.076	2 69	CB	THR	36	31.992	30.616	12.197
CG2	THR	25	27.561	35.922	14.929	270	OGl	THR	36	31.663	31.784	11.405
C	THR	25	30.112	34.523	13.777	271	CG 2	THR	36	33.356	30.000	11.694
0	THR	25	30.394	33.8C8	12.925	272	C	THR	36	30.719	28.942	10.740
N	GLY	26	30.074	34.062	15.028	273	O	THR	36	30.522	27.710	10.640
CA	GLY	26	29.965	32.620	15.269	274	N	ASN	37	30 .773	29.750	9.672
C	GLY	26	29.278	32.455	16.608	275	CA	ASN	37	30.744	29.156	8.314
0	GLY	26	28.869	33.445	17.219	276	CB	ASN	37	33.149	30.148	7.238
N	PHE	27	29.199	31.237	17.118	277	CG	ASN	37	28.740	30.615	7.617
CA	PHE	27	28.500	31.078	18.399	278	OD1	ASN	37	2Θ.41Ζ	31.794	7.373
CB	PHE	27	26.960	31.025	18.211	279	ND2	ASN	37	27.914	29.740	8.118
CG	PHE	27	26.472	29.939	17.310	280	C	ASN	37	32.150	28.849	7.808
CDI	PHE	27	26.108	28.697	17.824	281	0	ASN	3 J	33.112	29.512	8.220
CE1	PHE	27	25.644	27.720	17.015	282	N	LYS	38	32.263	27.881	6.870
CZ	PHE	27	25.519	27,938	15.626	283	CA	LYS	38	33.563	27.630	6.236
CE2	PHE	27	25.867	29.187	15.1C6	284	CB	LYS	38	33.476	26.501	5.216
CD2	PHE	2?	26.350	30.157	15.936	285	CG	LYS	36	33.184	25.163	5.809
C	PHE	27	28.983	29.849	19.128	286	CD	LYS	36	32.697	24 .253	4.713
0	PHE	27	29.545	28.944	18.512	297	CE	LYS	38	32.468	22.874	5.223
N	VAL	28	28.744	29.814	20.432	288	NZ	LYS	38	31.657	22.015	4.218
CA	VAL	28	29.341	28.760	21.282	2B9	C	LYS	38	34.041	28.869	5.532
CB	VAL	28	29.472	29.266	22.756	290	O	LYS	38	35.229	29.144	5.543
CG1	VAL	28	30.061	28.192	23.651	291	N	HIS	39	33.119	29.655	4.952
CG2	VAL	28	3C.362	30.506	22,807	292	CA	HIS	39	33.552	30.815	4.168
C	VAL	28	28.475	27.517	21.247	293	CB	HIS	39	32.458	31.299	3.193
0	VAL	28	27.270	27.598	21.431	294	CG	HIS	39	31.335	32.046	3.828
N	VAL	29	29.097	26.334	21.068	295	KDl	HIS	39	30.077	31.502	3.979
CA	VAL	29	28.313	25.092	21.066	296	CE1	HIS	39	29.279	32.413	4.517
CB	VAL	29	28.368	24.405	19.679	297	NE2	HIS	39	29.976	33.512	4.716
CG1	VAL	29	27.482	25.221	18.678	298	CD2	HIS	39	31.254	33.318	4.267
CG2	VAL	29	29.831	24.296	19.160	299	C	HIS	39	34.072	31.895	5.058
C	VAL	29	23.763	24.113	22.161	300	c	HIS	39	34.767	32.603	4.607
0	VAL	29	29.094	23.123	22.453	301	N	VAL	40	33.761	31.805	6.359
N	GLY	30	29.885	24.411	22.770	302	CA	VAL	40	34 . 416	32.647	7.358
CA	GLY	30	30.387	23.518	23.805	303	CB	VAL	40	33.502	32.875	8.592
C	GLY	30	31.656	24 .C18	24.411	30-1	CG1	VAL	40	34.228	33.641	9.746
0	GLY	30	32.107	25.123	24.129	305	CG2	VAL	40	32.257	33.586	8.143
N	LYS	31	32.306	23.147	25.185	306	c	VAL	40	35.776	32.096	7.799
CA	LYS	31	33.552	23.532	25.352	307	O	VAL	40	36.795	32.809	7.763
CB	LYS	31	34.118	22.312	26.593	308	6’	SER	41	35.807	3C.843	8.231
CG	LYS	31	35.392	22.633	27.358	309	CA	SER	41	37.044	30.291	8.823
CD	LYS	31	35.949	21.312	27.929	310	CB	SER	41	36.802	28.919	9.443
CE	LYS	31	37.189	21.599	28.747	311	OG	SER	41	36.231	28.010	8.527
NZ	LYS	31	37.531	20.378	29.569	312	C	SER	41	38.189	30.201	7.B06
C	LYS	31	34.596	24.013	24.852	313	O	SER	41	39.353	30.135	8.194
0	LYS	31	34.949	23.254	23.927	314	N	LYS	42	37.849	30.206	6.513
N	ASN	32	35.107	25-237	25.042	315	CA	LYS	42	39.910	30.108	5.531
CA	ASN	32	36.114	25.845	24.185	316	CB	LYS	42	38.333	29.867	4 . 117
CB	ASN	32	37.472	25.158	24.377	317	CG	LYS	42	37.6o4	31.042	3.506
CG	ASN	32	37.910	25.177	25.B24	318	CD	LYS	42	37.411	30.717	2.308
OD1	ASN	32	37.621	26.139	26.561	319	CE	LYS	42	36.334	31.603	1.422
ND2	ASN	32	38.544	24.109	26.255	320	NZ	LYS	42	36.729	33.035	1.463
C	ASN	32	35.797	25.818	22.705	321	c	LYS	42	39.837	31.309	5.517
0	ASN	32	36.730	25.901	21.895	322	0	LYS	42	40.996	31.226	5.083
N	THR	33	34.527	25.694	22.355	323	N	ASN	43	39.351	32.415	6.064
CA	THR	33	34.167	25.434	20.942	324	CA	ASN	43	40.163	33.613	6.256
CB	THR	33	33.800	23.964	20.738	325	CB	ASN	43	39.267	34.84C	6.091
OGl	THR	33	34.860	23.140	21.266	326	CG	ASN	43	38.699	34.922	4.700
CG2	THR	33	33.632	23.650	19.226	327	001	ASN	43	39.337	34 . 500	3.739
C	THR	33	33.049	26.295	20.372	323	ND2	ASN	43	37.464	35.440	4 . 588
0	THR	33	31.993	26.432	20.986	329	c	ASN	43	40.931	33.700	7.561

PL213 994B1

ΝΑ	A	AK	NAK	X	Y	Z	NA	A	AK	NAK	X	V	Z
330	0	ASN	43	41.640	34.685	7.800	409	CD2	HIS	53	29.900	39.050	26.624
331	Ν	TYR	44	40.766	32.680	8.403	410	C	HIS	53	30.503	40.410	23.375
332	CA	TYR	44	41.380	32.640	9.715	411	0	HIS	53	30.140	41.003	24.407
333	CB	TYR	44	40.282	32.499	10.799	412	N	PRO	54	31.208	41.014	22.392
334	CG	TYR	44	39.581	33.816	10,912	413	CA	PRO	54	31.604	42.425	22.535
335	CDI	TYR	44	40.054	34.799	11.782	414	CB	PRO	54	32.485	42.680	21.294
336	CE1	TYR	44	39.450	36.043	11.842	415	CG	PRO	54	31.968	41.691	20.246
337	CZ	TYR	44	38.381	36.321	11.010	416	CD	PRO	54	31.655	40.446	21.100
338	OH	TYR	44	37.781	37.580	11.082	417	C	PRO	54	30.382	43.355	22.502
339	CE2	TYR	44	37.896	35.369	10.144	418	0	PRO	54	29.368	43.046	21.832
340	CD2	TYR	44	38.500	34.124	10.093	419	N	ASN	55	30.493	44.460	23.249
341	C	TYR	44	42.385	31.519	9.786	420	CA	ASN	55	29.509	45.545	23.220
342	0	TYR	44	42.372	30.645	8.942	421	CB	ASN	55	29.217	46.031	24.642
343	N	LYS	45	43.222	31.545	10-815	425	C	ASN	55	30.063	46.689	22.356
344	CA	LYS	45	44.121	30.439	11.052	426	0	ASN	55	31.219	46.647	21.935
345	CB	LYS	45	45.518	30.800	10.531	427	N	SER	56	29.245	47.710	22.C35
346	CG	LYS	45	46.108	32.001	11.242	428	CA	SER	56	29.630	48.765	21.126
347	CD	LYS	45	47.533	32.302	10.745	429	CB	SER	56	28.466	49,744	20.890
348	CE	LYS	45	48.226	33.306	11.667	430	OG	SER	56	27,245	49.058	20.621
349	NZ	LYS	45	47.618	34.698	11.675	431	C	SER	56	30,897	49.547	21.530
350	C	1YS	45	44.212	30.222	12.557	432	0	SER	56	31.576	50.134	20.673
35;	0	LYS	45	43.819	31.077	13.346	433	N	ASP	57	31.218	49.544	22.827
352	N	VAL	46	44.742	29.069	12.932	434	CA	ASP	57	32.317	50.355	23.352
353	CA	VAL	46	45.187	28.823	14.308	435	CB	ASP	57	31,796	51.720	23.632
354	CB	VAL	46	45.883	27.426	14.411	439	C	ASP	57	33.095	49.647	24.469
355	CG1	VAL	46	46.455	27.200	15.766	440	0	ASP	57	32.705	49.693	25.656
356	CG2	VAL	46	44.904	26.320	14.070	441	N	LYS	58	34.173	48.973	24.058
357	C	VAL	46	46.117	29.974	14.748	442	CA	LYS	58	35.207	48.449	24.966
359	0	VAL	46	47.065	30.366	14.024	443	CB	LYS	58	35.63C	49.521	26.001
359	N	GLY	47	45.841	30.504	15.943	448	C	LYS	58	34.902	47.098	25.647
360	CA	GLY	47	46.545	31.646	16.469	449	0	LYS	58	35.796	46.248	25.732
361	C	GLY	47	45.863	32.989	16.291	450	N	GLY	59	33.667	46.883	26.113
362	0	GLY	47	46.262	33.964	16.930	451	CA	GLY	59	33.378	45.702	26.960
363	N	ASP	48	44.887	33.077	15.389	452	C	GLY	59	33.155	44.394	26.196
364	CA	ASP	48	44.088	34.307	15.275	453	0	GLY	59	32.487	44.404	25.149
365	CB	ASP	48	43.230	34.309	14.035	454	N	ASN	60	33.681	43.276	26.729
366	CG	ASP	48	44.028	34.571	12.783	455	CA	ASN	60	33.534	41.948	26.086
367	OD1	ASP	48	45.175	35.085	12.879	456	CB	ASN	60	34.532	41,846	24.904
368	OD2	ASP	48	43.498	34.235	11.718	457	CG	ASN	60	35.984	41.917	25.350
369	C	ASP	48	43.152	34.421	16,456	4 56	OD1	ASN	60	36.392	41.201	26,263
370	0	ASP	48	42.951	33,447	17.144	459	ND2	ASN	60	36.780	42.770	24,706
371	N	ARG	49	42.527	35.590	16.613	460	C	ASN	60	33.708	40.791	27.110
372	CA	ARG	49	41.737	35,848	17.809	461	O	ASN	60	34,027	41.045	28.263
373	CB	ARG	49	42.343	37.017	18.582	462	N	GLY	61	33.514	39.540	26.677
374	CG	ARG	49	43.592	36.533	19.290	463	CA	GLY	61	33.667	38.360	27.557
375	CD	ARG	49	44.783	37.415	19.028	464	C	GLY	61	35.061	37.740	27 .451
376	NE	ARG	49	46-003	36.865	19.623	465	O	GLY	61	35.315	36.643	27.924
377	CZ	ARG	49	46.839	37.540	20.411	466	N	GLY	62	35.964	38.484	26.842
378	NH1	ARG	49	46.616	38.618	20.717	467	CA	GLY	62	37.338	38.043	26.679
379	NH2	ARG	49	47,917	36,926	20.883	468	C	GLY	62	37.713	37.938	25.218
380	C	ARG	49	40,251	36.036	17.523	469	O	GLY	62	36.846	37 .365	24.335
381	0	ARG	49	39.848	36.404	16.409	470	N	ILE	63	39.019	37.886	24.995
382	N	ILE	50	39.424	35.681	18.503	471	CA	ILE	63	39.616	37.666	23.672
383	CA	ILE	50	37.985	36.000	18.452	472	CB	ILE	63	40,591	38.8C3	23.289
384	CB	ILE	50	37.060	34.752	18.196	473	CG1	ILE	63	39.807	40.115	23.141
385	CG1	ILE	50	37.132	33.663	19.296	474	CDI	ILE	63	40.666	41.323	22.959
386	CDI	ILE	50	36.338	33.925	20.613	475	CG2	ILE	63	41.272	38.474	21.965
387	CG2	ILE	50	37.447	34.048	16.894	476	C	ILE	63	40.339	36.334	23,746
388	C	ILE	50	37.635	36.694	19.760	477	O	ILE	63	41.083	36.C92	24.680
389	0	ILE	50	38.339	36.522	20.761	478	N	TYR	64	40.059	35.449	22.790
390	N	THR	51	36.557	37.473	19.743	479	CA	TYR	64	40.546	34,068	22.B17
391	CA	THR	51	36.133	38.234	20.926	480	CB	TYR	64	39.369	33.105	23.041
392	CB	THR	51	36.113	39.742	20.659	481	CG	TYR	64	38.678	33.439	24.340
393	OG1	THR	51	37.451	40.114	20.32.6	482	CDI	TYR	64	39.104	32.874	25.544
394	CG2	THR	51	35.766	40.479	21.965	483	CE1	TYR	64	38.489	33.207	26.740
395	C	THR	51	34.764	37.742	21.330	484	CZ	TYR	64	37.451	34,114	25.734
396	0	THR	51	33.894	37.598	20.506	485	OH	TYR	64	36.836	34.509	27.915
397	N	ALA	52	34.601	37.439	22.616	486	CE2	TYR	64	37.021	34.701	25.569
398	CA	ALA	52	33.336	36.903	23.087	487	CD2	TYR	64	37.620	34.358	24.365
399	CB	ALA	52	33.535	36.050	24.309	488	C	TYR	64	41.280	33.697	21.540
400	C	ALA	52	32.398	38.076	23.406	489	O	TYR	64	40.938	34.178	20.468
401	0	ALA	52	32.791	39.018	24.087	490	N	SER	65	42.279	32.832	21.690
402	N	HIS	53	31.180	37.969	22.900	491	CA	SER	65	43.130	32.365	20.575
403	CA	HIS	53	30.089	3S.950	23.146	492	CB	SER	65	44.504	31.982	21.184
404	CB	HIS	53	29.099	38.446	24.218	493	OG	SER	65	45.431	31.657	20.174
405	CG	HIS	53	29.686	38.203	25.588	494	C	SER	65	42.504	31.137	19.919
406	ND1	HIS	53	30.017	36.942	26.054	495	0	SER	65	42.039	30.202	20.607
407	CE1	HIS	53	30.444	37.036	27,304	496	N	ILE	66	42.453	31.088	18.583
408	NE2	HIS	53	30.381	38.302	27,671	497	CA	ILE	66	42.003	29.915	17.903

PL 213 994 B1

A	AK	NAK	X	Y		Z	NA	A	AK	NAK	X	Y	Z
CB	ILE	66	41.714	30.237	16	.411	577	Ó	LYS	75	2B .367	22.833	1.760
CG1	ILE	66	40.496	31.207	16	.327	578	N	GLU	76	27.526	21.421	3,284
CDI	ILE	66	40.191	31.666	14	.874	579	CA	GLU	76	27.055	22.480	4,189
CG 2	ILE	66	41.396	28.923	15	.662	580	CB	GLU	76	26.204	21.864	5.318
C	ILE	66	43.021	28.765	18	.024	581	CG	GLU	76	24.892	31 ,208	4,762
0	ILE	66	44.196	28.976	17	.758	582	CD	GLU	76	25.054	19.758	4.319
N	LYS	67	42.578	27.571	18	.424	583	OE1	GLU	76	26.192	19.216	4.324
CA	LYS	67	43.503	26.389	18	.506	584	OE2	GLU	76	24.005	19.173	3.967
CB	LYS	67	43.577	25.815	19	.948	585	Λ	GLU	76	23.145	23.372	4.735
CG	LYS	67	42.368	25-092	20	.370	596	0	GLU	76	29.257	22.909	5.068
CD	LYS	67	42,601	24.493	21	.754	597	N	ASP	77	27.832	24.670	4,831
CE	LYS	67	41.373	23.768	22	.323	586	CA	ASP	77	28.813	25.725	5.103
NZ	LYS	67	41.905	23.005	23	.560	599	CB	ASP	77	28.306	27.048	4.480
C	LYS	67	43.257	25.294	17	.494	590	CG	ASP	77	29.384	28.086	4.250
0	LYS	67	44.131	24.401	17	.257	591	OD1	ASP	77	30.521	27,925	4.763
M	LYS	68	42.088	25.280	16	. 878	592	OD2	ASP	77	29.112	29.101	3.582
CA	LYS	68	41.769	24.287	15	.868	593	C	ASP	77	28.989	25.853	6.647
CB	LYS	68	41.333	22.973	16	.525	594	O	ASP	7 7	20,567	26.839	7.261
CG	LYS	68	41.596	21.719	15	.698	595	N	VAL	78	29.616	24.840	7.251
CD	LYS	68	41.330	20.400	16	.474	596	CA	VAL	78	29.703	24.730	8,710
CE	LYS	68	41.533	19.209	15	.514	597	CB	VAL	78	28.817	23.564	9,223
NZ	LYS	68	41.215	17.878	16	.112	598	CG1	VAL	78	29.094	23.278	10.776
2	LYS	68	40.670	24.797	14	.994	599	CG2	VAL	78	27.344	23.967	6.992
0	LYS	€8	39.768	25.465	15	.487	600	C	VAL	78	31.141	24.423	9.07C
N	ILE	69	40.742	24,448	13	.702	601	C	VAL	78	31 .736	23.493	6.503
CA	ILE	69	39.675	24.748	12	.715	602	N	SER	79	31.706	25.184	10.003
CB	ILE	69	40.140	25.815	11	.653	603	CA	SER	79	33.070	24.944	10.454
CG1	ILE	69	40.541	27.110	12	.360	604	CB	SER	79	33.941	26.044	9,817
CDI	ILE	69	41.188	28.224	11	.503	605	CG	SER	79	35.276	25.966	10.239
CG2	ILE	69	39.067	26.038	10	.599	606	C	SER	79	33.117	24.973	11.983
C	ILE	69	39.348	23.433	12	.049	607	O	SER	79	32.500	25.852	12.585
0	ILE	69	40.252	22.748	11	.495	609	H	VAL	80	33.858	24.040	12.58Θ
N	ILE	70	38.088	23.031	12	.130	609	CA	VAL	30	34.044	24.010	14.064
CA	ILE	70	37.681	21.741	11	, 601	610	CB	VAL	BO	34.051	22.539	14.584
CB	ILE	70	37.272	20.726	12	. 689	611	CG1	VAL	80	34.466	22.489	16.035
CG1	TLE	70	38.328	20.598	13	.787	612	CG2	VAL	BO	32.665	21 .910	14.427
CDI	ILE	70	37.861	21.152	15	.071	613	C	VAL	BO	35.363	24.698	14.389
CG2	ILE	70	36.992	19.360	12	.081	614	O	VAL	80	36.389	24.406	13.775
C	ILE	70	36.477	21.963	10	.738	615	N	ILE	81	35.331	25,621	15.942
0	TLE	70	35.402	22.199	11	.250	616	CA	ILE	81	36.494	26.372	15.745
N	ASN	71	36.641	21.983	9.	423	617	CB	ILE	01	36.259	27.903	15.544
CA	ASN	71	35.499	22.025	8 .	513	618	CG1	ILE	81	35.722	28.206	14.145
CB	ASN	71	35.987	22.385	7.	099	619	CDI	ILE	81	36.676	27.853	13.094
CG	ASN	71	36.525	23.821	6.	991	620	CG2	ILE	81	37.525	28 . 681	15.00 7
OD1	ASN	71	36.554	24.583	7 .	961	621	C	ILE	81	36.693	26.153	17.243
ND2	ASN	71	36.939	24.196	5.	770	622	c	ILE	81	35.797	26.49C	IB.051
C	ASN	71	34.692	20.748	8 .	429	623	N	GLN	82	37.827	25.58C	17.626
U	ASN	71	35.265	19.632	8 .	437	624	CA	CtTiN	92	38.170	25.472	19.073
N	TYR	72	33.377	20.891	9.	302	625	CB	GLN	92	38.844	24.134	19.3Θ4
CA	TYR	72	32.469	19.760	B .	114	626	CG	GLN	82	38.051	22.928	18.981
CB	TYR	72	31.015	20.236	B .	218	627	CD	GLN	82	38.764	21.646	19.374
CG	TYR	72	29.993	19.149	7.	932	628	OEl	GLN	82	39.895	21.689	19.850
CDI	TYR	72	29.979	17.976	8.	686	629	NE2	GLN	82	38.136	20,515	19.120
CEl	TYR	72	29.038	16.971	B.	457	630	ς	CLN	82	39.097	26.598	19.412
CZ	TYR	72	28.114	17.112	7.	455	631	o	GLN	B2	39.9C2	27.013	18.562
OH	TYR	72	27.203	16.093	7.	235	632	K	VAL	83	39.0C4	27.082	20.659
CE2	TYR	72	28.087	18.261	6.	675	633	CA	VAL	83	39.842	28.144	21.172
CD2	TYR	72	29.030	19.290	6.	924	634	CB	VAL	83	39.021	29.425	21.551
C	TYR	72	32.680	19.126	6.	719	635	CG1	VAL	83	39.455	30.087	20.263
0	TYR	72	32.611	19.826	5.	729	636	CG2	VAL	83	37.951	29.084	22.61C
N	PRO	73	32.965	17.810	6.	657	637	C	VAL	83	40.617	27.654	22.399
CA	PRO	73	33.037	17.180	5.	341	638	O	VAL	83	40.176	26.722	23.070
CB	PRO	73	33.818	15.868	5 .	619	639	N	GLU	84	41.771	28.253	22.650
CG	PRO	73	34.387	16.043	7.	065	640	CA	GLU	84	42.471	28.040	23.921
CD	PRO	73	33.268	16.626	7.	722	641	CB	GLU	04	43.7B0	28.837	23.987
C	PRO	73	31.629	16.959	4.	776	642	CG	GLU	84	44.947	28.145	23.251
0	PRO	73	30.889	16.057	5.	190	643	CD	GLU	04	45.246	26.717	23.778
N	GLY	74	31.237	17.833	3 .	857	644	CEl	GLU	84	45.090	26.422	25.000
CA	GLY	74	29.910	17.767	3 .	26B	645	CE2	GLU	84	45.622	25.868	22.950
c	GLY	74	29.673	19.118	2.	611	646	c	GLU	81	11.544	28.435	25.056
0	GLY	74	30.491	20.025	2 .	764	647	0	GLU	84	40.893	29.491	24,993
N	LYS	75	28.574	19.252	1.	634	648	N	GLU	95	41.417	27.547	26.029
CA	ŁYS	75	28.286	20.514	1.	163	649	CA	GLU	95	40.569	27.766	27.210
CB	LYS	75	27.101	20.355	0.	175	6S0	CB	GLU	95	40.651	26.536	28.130
CG	LYS	75	25.766	20.104	0.	824	651	CG	GLU	35	39.573	26.486	29.232
CD	LYS	75	24.594	19.932	-0	.116	652	CD	GLU	35	39.283	25.087	29.780
CE	LYS	75	23.270	20.077	0.	652	653	OE1	GLU	35	39.476	24,053	29.086
NZ	LYS	75	22.050	19.684	-0	.133	654	OE2	GLU	B5	38.788	25.033	30.912
C	LYS	75	28.052	21.691	2.	098	6S5	C	GLU	85	40.928	29.032	27.987

PL213 994B1

ΝΑ	A	AK	NAK	X	Y	Z	NA	A	AK	NAK	X	Y	Z
656	0	GLU	85	40.033	29.712	28.541	735	O	PHE	95	40.075	32.535	30.170
657	Ν	ARG	86	42.222	29.351	28.034	736	N	ASN	96	38.944	31.938	32.024
658	CA	ARG	86	42.717	30.548	28.716	737	CA	ASN	96	38.388	30.743	31.386
659	CB	ARG	86	44.106	30.345	29.352	738	CB	ASN	96	37.901	29.741	32.432
660	CG	ARG	86	44.641	31.626	30-051	739	CG	ASN	96	37.748	28.353	31.870
661	CD	ARG	B6	46.065	31.476	30.632	740	ODl	ASN	96	36,998	28.131	30.929
662	NE	ARG	86	46.463	32.746	31.257	741	ND 2	ASN	96	38.445	27.401	32.454
663	CZ	ARG	86	46.162	33.093	32.513	742	c	ASN	96	37.260	31.071	30.427
664	NE1	ARG	86	45.478	32.264	33.296	743	0	ASN	96	36.230	31.614	30.830
665	NH2	ARG	86	46.546	34.267	32.995	744	N	PHE	97	37.446	30.701	29.160
666	C	ARG	86	42.737	31.742	27.781	745	CA	PHE	97	36.436	30.880	28.116
667	0	ARG	86	43.477	31.757	26.766	746	CB	PHE	97	36.835	29.997	26.906
668	N	ALA	87	41.915	32.750	28.123	747	CG	PHE	97	35.867	30.057	25.749
669	CA	ALA	87	41.866	34.012	27.371	748	CDI	PHE	97	35.813	31.184	24.915
670	CB	ALA	87	40.861	35.017	27.996	749	CEl	PHE	97	34.895	31.204	23.817
671	c	ALA	87	43.221	34.666	27.204	750	cz	PHE	97	34.077	30.109	23.576
672	0	ALA	S7	44.070	34.631	28.112	751	CE2	PHE	97	34.127	28.991	24.427
673	N	ILE	88	43.406	35.270	26.030	752	CD2	PHE	97	35.032	20.980	25.482
674	CA	ILE	88	44.512	36.184	25.791	753	C	PHE	97	35.081	30.439	28.596
675	CB	ILE	88	44.633	36.544	24.261	754	O	PHE	97	34.087	31.153	28.428
676	CG1	ILE	88	44.833	35.272	23.431	755	N	ASN	98	35.047	29.256	29,221
677	CDI	ILE	88	45.976	34.312	23.950	756	CA	ASN	98	33.797	28.620	29.557
678	CG2	ILE	88	45.743	37.582	23.992	757	CB	ASN	98	34.040	27.160	29.832
679	C	ILE	68	44.251	37.425	26.652	758	CG	ASN	98	34.743	26.504	28.662
680	O	ILE	88	45.148	37.919	27.342	759	ODl	ASN	98	34.188	26.453	27.546
681	N	GLU	89	43.014	37.916	26.612	760	ND2	ASN	98	35.996	26.119	28.868
682	CA	GLU	89	42.575	39.003	27.490	761	C	ASN	98	33.027	29.272	30.689
683	CB	GLU	89	42.258	40,261	26.695	7 62	O	ASN	98	31.840	28.995	30.863
684	CG	GLU	89	43.507	40.865	26.047	7 63	N	ASP	99	33.733	30.072	31.466
685	GD	GLU	89	43.225	42.087	25.211	7 64	CA	ASP	99	33.089	30.857	32.555
686	OSI	GLU	89	42.225	42.803	25.503	765	CB	ASP	99	34.121	31.186	33.616
687	OE2	GLU	89	44.018	42.331	24.262	766	CG	ASP	99	34.529	29.980	34.431
688	c	GLU	89	41.358	38.527	28.267	767	ODl	ASP	99	33.704	29.035	34.655
689	0	GLU	89	40.396	38.081	27.669	768	OD2	ASP	99	35.690	29.971	34.Θ79
690	N	ARG	90	41.433	38.584	29.598	769	c	ASP	99	32.475	32.136	32.006
691	CA	ARG	90	40.378	38.046	30.473	770	0	ASP	99	31.648	32.768	32.679
692	CB	ARG	90	40.702	38.115	31.967	771	N	ASN	100	32.877	32.530	30.709
693	CG	ARG	90	40.658	39.490	32.648	772	CA	ASN	100	32.458	33.820	30.232
694	CD	ARG	90	41.204	39.387	34.097	773	CB	ASN	100	33.656	34.538	29,629
695	NE	ARG	90	40.267	38.800	35.070	774	CG	ASN	100	34.508	35.176	30.653
696	CZ	ARG	90	40.597	38.086	36.166	775	ODl	ASN	100	34.178	36.245	31.178
697	NH1	ARG	90	39.640	37.642	36.988	776	ND2	ASN	100	35.644	34.547	30.943
69S	ΝΗΞ	ARG	90	41.862	37,787	36.457	777	c	ASN	100	31.378	33.720	29,171
699	c	ARG	90	39.023	38.694	30.257	778	0	ASN	100	30.838	34.738	28,762
700	0	ARG	90	38.914	39.845	29.789	779	N	VAL	101	31,090	32.509	28.697
701	N	GLY	91	37.983	37.930	30.547	780	CA	VAL	101	30.135	32.307	27.635
702	CA	GLY	91	36.635	38.474	30.570	781	CB	VAL	101	30.863	31.866	26.311
703	C	GLY	91	36.291	38.863	32.003	782	CG1	VAL	101	31.962	32.812	25.927
704	0	GLY	91	37.138	38,745	32.926	783	CG2	VAL	101	31.424	30.381	26.485
705	N	PRO	92	35.068	39.360	32.205	784	C	VAL	101	29.104	31.263	27.998
706	CA	PRO	92	34.661	39.755	33.564	785	O	VAL	101	29.296	30.471	28.953
707	Cd	PRO	92	33.282	40.419	33.344	786	N	THR	102	28.013	31.227	27.224
708	CG	PRO	92	33.349	40,885	31.940	787	CA	THR	102	26.924	30.307	27 , 444
709	CD	PRO	92	34.022	39.707	31.228	788	CB	THR	102	25.645	31.045	27.917
710	C	PRO	92	34.582	38.592	34.535	789	OGl	THR	102	25.304	32.054	26.945
711	O	PRO	92	34.621	38.810	35.760	790	CG2	THR	102	25.877	31.735	29.262
712	N	LYS	93	34.484	37.368	34.014	791	c	THR	102	26.614	29.600	26.123
713	CA	LYS	93	34.425	36.179	34.844	792	0	THR	102	26.143	30.233	25.195
714	CB	LYS	93	33.242	35.294	34.444	793	N	PRO	103	26.872	28.294	26.036
715	CG	LYS	93	31.881	35,983	34.587	794	CA	PRO	103	26.547	27.494	24.844
716	CD	LYS	93	30.743	34.991	34.310	795	CB	PRO	103	27.016	26.064	25.235
717	CE	LYS	93	30.572	33.989	35.450	796	CG	PRO	103	28.020	26.277	26.324
718	NZ	LYS	93	30.525	32.535	35.018	797	CD	PRO	103	27.528	27.495	27.092
719	C	LYS	93	35.766	35.407	34.788	798	C	PRO	103	25.046	27.440	24.560
720	0	LYS	93	35.824	34.225	35.098	799	O	PRO	103	24.232	27.489	25.505
721	N	GLY	&4	36.827	36.122	34.446	800	N	PHE	104	24.669	27,307	23.295
722	CA	GLY	94	38.175	35.601	34.534	801	CA	PHE	104	23.277	27.081	22.945
723	C	GLY	94	38.703	35.093	33.195	802	CB	PHE	104	22.998	27.633	21.536
724	0	GLY	94	38.155	35.398	32.145	803	CG	PHE	104	23.078	29.139	21.463
725	N	PHE	95	39.784	34.333	33.271	804	CDI	PHE	104	22.131	29,929	22.112
726	CA	PHE	95	40.474	33-849	32.078	805	CEl	PHE	104	22.222	31.333	22.058
727	CB	PHE	95	41.941	33.523	32.397	806	CZ	PHE	104	23.262	31.960	21.383
728	CG	PHE	95	42.804	34.727	32.401	807	CE2	PHE	1D4	24.208	31.192	20.757
729	CDI	PHE	95	43.291	35.235	31.204	808	CD2	PHE	104	24.110	29.768	20.816
730	CEl	PHE	95	44.080	36.400	31.173	809	C	PHE	104	22.863	25.618	23.017
731	CZ	PHE	95	44.365	37.063	32.352	Θ10	O	PHE	104	23.667	24.735	22.817
732	CE2	PHE	95	43.874	36.579	33.559	811	N	LYS	105	21.583	25.403	23.263
733	CD2	PHE	95	43.085	35.409	33.591	812	CA	LYS	105	20.941	24.106	23.229
734	C	PHE	95	39.805	32.709	31.354	813	CB	LYS	105	19.981	24.015	24.426

PL 213 994 Β1

NA	A	AK	NAK	X	Y	Z	698	CA	LYS 117 15.878	35.522	15.289
814	CG	LYS	105	18.987	22.837	24.458	699	CB	ŁYS 117 15.929	36.175	16.6Θ2
815	CD	LYS	105	17,790	23.152	25.344	900	CG	LYS 117 16.217	35.196	27.815
818	C	LYS	105	20-155	24.015	21.925	901	CD	LYS 117 15.916	35.800	19.208
819	0	LYS	105	19.518	24.994	21.501	902	CE	LYS 117 14.580	35.300	19.740
820	N	TYR	106	20.150	22.834	21.319	903	NZ	LYS 117 14.530	35.544	21.203
821	CA	TYR	106	19.346	22.613	20*121	904	U	LYS 117 17.262	35.114	14.842
822	CB	TYR	106	19.639	21.241	19.498	905	0	LYS 117 17.752	34.019	15.201
823	CG	TYR	106	21.025	21.069	18.931	906	N	VAL 118 17.868	36.004	14.067
824	CDI	TYR	106	21.525	21.922	17*942	907	CA	VAL 118 19.235	35.874	13.589
825	C21	TYR	106	22.822	21.743	17.403	908	CB	VAL 118 19.339	36*087	12.045
826	cz	TYR	106	23.584	23.683	17.840	909	CGl	VAL 118 20.792	35*799	11.555
827	OH	TYR	106	24.325	20.4ac	17.326	910	CG2	VAL 118 18.3C5	35.193	11*344
828	CE2	TYR	106	23.096	19.524	18.818	911	c	VAL 118 20.028	36.926	14.311
629	CD2	TYR	106	21.841	20,021	19.358	912	0	VA1. 118 19.752	38.136	14.179
630	C	TYR	106	17.871	22.629	20.438	913	N	ILE 119 21.001	36.481	15.106
831	c	TYR	106	17.433	21*995	21.409	914	CA	ILE 119 21.781	37.397	15.937
832	N	ALA	107	17.110	23.303	19.577	915	CB	ILE 119 21.754	36.982	17.453
833	CA	ALA	107	15.670	23*130	19.492	916	CG1	ILE 119 20.324	36.862	17.944
834	CB	ALA	107	15.092	24.112	10.468	917	CDI	ILE 119 20.186	35.972	19.208
835	C	ALA	107	15.300	21.685	19.120	918	CG2	ILE 119 22.613	37.924	18.310
836	0	ALA	107	16.093	20.963	16.498	919	C	ILE 119 23.233	37.444	15.467
837	N	ALA	108	14.095	21.261	19.497	920	0	TLE 119 23.887	36,408	15.363
838	CA	ALA	108	13.584	19.950	19.090	921	N	GI.Y 120 23.734	38.647	15.213
839	CB	ALA	103	12.249	19.684	19.733	922	CA	GLY 120 25.102	38.805	14 .742
840	C	ALA	109	13.455	19.B81	17.574	923	C	GLY 120 25.459	40.236	14.444
841	0	ALA	108	13.612	18.814	16.975	924	0	GLY 120 24.Θ46	41.165	14.986
842	N	GLY	109	13.186	21.023	16.961	925	N	TYR 121 26. 428	40.407	13.548
843	CA	GLY	109	13.022	21.102	15.519	926	CA	TYR 121 27.017	41.703	13.281
844	C	GLY	109	12,616	22.494	15.132	927	CB	TYR 121 28*494	41.642	13.62 9
845	0	GLY	109	12.702	23.432	15.921	928	CG	TYK 121 28*729	41.169	15.027
846	N	ALA	110	12.167	22.643	13.896	929	CDI	TYR 121 28.623	42.054	16.108
847	CA	ALA	110	11.661	23.928	13.459	930	CE1	TYR 121 28.830	41.633	17.418
84 8	CB	ALA	110	12.799	24.854	13.008	931	CZ	TYR 121 29.116	40.293	17.660
849	C	ALA	110	10.657	23.684	12.351	932	CH	TYR 121 29.261	39*895	18.959
850	0	ALA	110	10.773	22.715	11.624	933	CE2	TYR 121 29.211	39.392	16.619
951	N	LYS	111	9.658	24.556	12.250	934	CD2	TYR 121 29.011	39.821	15.298
852	CA	LYS	111	9.631	24.387	11.233	935	C	TYR 121 26.627	42.161	11.821
653	CB	LYS	111	7.388	23.659	11.8(P	936	0	TYR 121 27.760	42.C99	11.033
854	CG	LYS	111	6.526	24.519	12.735	937	K	PRO 122 25.615	42.587	11.449
858	C	LYS	111	8.303	25.731	10.585	938	CA	PRO 122 25.402	42.888	10.020
859	0	LYS	111	8.431	26.793	11-216	939	CB	PRC 122 23.881	43.001	9.903
860	tJ	ALA	112	7.954	25.663	9.297	940	CG	PRO 122 23.432	43,427	11.272
861	CA	ALA	112	7.393	26.783	8.546	94L	CD	PRO 122 21.387	42,763	12,243
862	CB	ALA	112	6.771	26.274	7.256	942	C	PRO 12 2 2 6.111	44,148	9.463
8 63	C	ALA	112	6.363	27.533	9.376	943	0	PRO 122 26.053	44.380	8*249
864	0	ALA	112	5.526	26.918	10.058	944	N	HTS 123 2 6.7 83	44.930	13.319
865	N	GLY	113	6.453	28.852	9.366	945	CA	HIS 123 27,455	46.185	9.909
B66	CA	GLY	113	5.519	29.675	10.149	946	CB	HIS 123 26. 616	47.3Θ3	10.345
867	C	GLY	113	6.086	30.209	11.446	947	CG	HIS 123 25.171	47.299	9.957
868	0	GLY	113	5.Θ41	31.357	11.809	948	KD1	HIS 123 24.151	47.3B6	10.880
869	N	GLU	114	6.876	29.401	12.159	949	CE1	HIS 123 22.986	47.290	10.260
870	CA	GLU	114	7.423	29.893	13.425	950	NE2	HIS 123 23.213	47.154	8.965
871	CB	GLU	114	e .022	28.748	14.262	961	CD2	HIS 123 24.572	47.160	8.748
872	CG	GLU	114	9.495	28.425	14.000	952	C	HIS 123 28.880	46.327	10.4S6
873	CD	GLU	114	9.979	27.343	14.932	953	0	HIS 123 29.033	46.460	11.715
874	OE1	GLU	114	9,640	26.155	14.592	954	N	PRO 12 4 2 9.927	46.348	9.639
875	OE2	GLU	114	10.430	27.683	16.037	955	CA	PRO 124 31.306	46.112	13.11S
876	c	GLU	114	8.391	31-051	13.231	956	CB	PRO 124 31.955	45.432	Θ.906
877	0	GLU	114	9.001	31.199	12.157	957	CG	PRO 124 31.245	46.082	7.69 0
878	N	ARG	115	8.494	31.908	14.248	958	CD	PRO 124 29.901	46.609	8.181
879	CA	ARG	115	9.347	33.094	14.179	959	C	PRO 124 32.135	47.351	10.503
880	CB	ARG	115	9.696	34.288	14.886	960	0	PRO 124 33.344	47.375	10.237
881	CG	ARG	115	7.450	34.815	14.145	961	N	TYR x25 31.501	48.335	11.143
982	CD	ARG	115	6.817	36.023	14.851	9 62	CA	TYR 125 32.085	49.672	11.400
883	NE	ARG	115	7.690	37.203	14.953	963	CB	TYR 125 31.018	50.580	12.037
884	cz	ARG	115	8.099	37.925	13.918	964	CG	TYR 125 29.973	49.824	12.827
885	NH1	ARG	115	7.744	37.579	12.687	971	C	TYR 125 33.426	49.756	12.180
886	KH2	ARG	115	8.886	33.975	14.107	972	0	TYR 125 34.074	48.736	12,440
887	C	ARG	115	10.743	32.833	14.760	973	N	LYS 126 33-829	50.989	12.523
883	0	ARG	115	10.374	32.237	15.325	974	CA	LYS 126 35.069	51.307	13.273
869	N	ILE	116	11.772	33.282	14*052	975	CB	LYS 126 34*767	51.671	14.740
890	CA	ILE	116	13.137	33.055	14.530	976	CG	LYS 126 33.652	52.710	14.944
891	CB	ILE	116	13.883	32*051	13.597	960	C	LYS 126 36,265	50.314	13-076
892	CG1	ILE	116	13.753	32.453	12.105	961	0	LYS 126 36.80-4	50.273	11.960
893	CDI	ILE	116	14.584	33.682	11.737	982	N	ASN 127 36.727	49.542	14.077
894	CG2	ILE	116	13.320	30.660	13.775	983	CA	ASN 127 36*367	49.613	15.497
B95	C	ILE	116	13.845	34.392	14*707	988	c	ASN 127 35.156	48.785	15.943
396	0	ILE	116	13.292	35.463	14.400	939	0	ASN 127 35.008	47.603	15.591
897	N	LYS	117	15.050	34.356	15.247	990	N	LYS 12B 34.316	49.450	16.741

213 994

A	AK	NAK	X	Y	Z	NA	A	AK	NAK	X	Y	Z
CA	LYS	129	33.058	48.947	17.324	1074	CG1	VAL	138	11.2C2	27.816	9.037
CB	LYS	129	32.048	bC.102	17.400	1075	CG 2	VAL	138	11*669	29.305	10.953
C	LYS	129	32.3B9	47.721	16.678	1076	C	VAL	138	9.7 6C	30.007	7*661
0	LYS	128	32.064	47.715	15.486	1077	O	VAL	138	8.534	29.850	7.777
N	TYR	129	32.213	46.678	17.484	1078	N	MET	139	10.399	29.94B	6.489
CA	TYR	129	31.340	45.566	17.135	1079	CA	MET	139	9.693	29.682	5.229
CB	TYR	129	31.BID	44.278	17.807	1080	03	MET	139	10.335	30.453	4,0?S
CG	TYR	129	33.169	43.756	17.400	1081	CG	MET	139	10,555	31.920	4.382
CDI	TYR	129	33.367	43.195	16.140	1002	SD	MET	13 9	9.036	32.905	4.502
CE1	TYR	129	34.600	42.698	15.755	1083	CS	MET	139	8.073	32.220	5.8C0
CZ	TYR	12 9	35.658	42.735	' 6.642-	1004	c	MET	139	9.613	28.216	4.902
OH	TYR	129	36.876	42.229	16.245	1085	0	MET	139	8.574	27.741	4.441
CE2	TYR	12 9	35.495	43.281	17.916	1086	N	SER	140	10.699	27.470	5.158
CD2	TYR	129	34.240	43.785	18.282	1097	CA	SER	140	10.716	26.030	4.940
C	TYR	129	29.974	45.918	17.704	1098	CB	SER	140	10.887	25.721	3.455
C	TYR	12 9	29.B56	46,215	18.894	1099	OG	SER	140	12.003	26.439	2.963
N	VAL	130	28.944	45.896	16.874	1090	C	SER	140	11.873	25.367	5.669
CA	VAL	130	27.606	46,192	17.342	1091	O	SER	140	12 .867	26.019	6.001
CB	VAL	130	27.049	47.522	16.732	1092	N	VAL	141	11.713	24.068	5.900
CG1	VAL	130	25.711	47.847	17.309	1093	CA	VAL	141	12.7B9	23.216	6.428
CG2	VAL	130	28.030	48.660	16.927	1094	CB	VAL	141	12.564	22.873	7.916
0	VAL	130	26.685	45.023	17.013	1095	CG1	VAL	141	13.592	21.816	8.396
0	VAL	130	26.436	44.704	15.845	1096	CG2	VAL	141	12.618	24.141	8.761
N	LEU	131	26.168	44.380	16.052	1097	C	VAL	141	12.857	21.949	5.594
CA	LEU	131	25.333	43.212	17.857	1098	O	VAL	141	11 .881	21,189	5.526
CB	LEU	131	25.33C	42.363	19.134	1099	N	GLU	142	13.998	21.714	4.960
CG	LEU	131	24.819	40.941	18.972	1100	CA	GLU	142	14.167	20.557	4.124
CDI	LEU	131	25.813	40.167	18.095	1101	CB	GLU	142	13.900	20.949	2.674
CD2	LEU	131	24.684	40.303	20.372	1102	CG	GLU	142	13.913	19.764	1.703
C	LEU	131	23.921	43.601	17.491	1106	C	GLU	142	15.595	20.026	4,293
0	LEU	131	23.338	44.497	18.121	1107	O	GLU	142	16.565	20.731	3.984
N	TYR	132	23.359	42.943	16.485	1108	N	GLY	143	15.712	18,814	4.826
CA	TYR	132	21.970	43.153	16.126	1109	CA	GLY	143	17.023	18.253	5.185
CB	TYR	132	21.834	43.698	14.694	1110	C	GLY	143	17.884	19.251	5.952
CG	TYR	132	22.235	45.145	14.560	1111	O	GLY	143	17.493	19.744	7.000
CDI	TYR	132	21.265	46.141	14.361	1112	M	SER	144	19.060	19.549	5.421
CE1	TYR	132	21.610	47.463	14.246	1113	CA	SER	144	19.933	20.450	6.103
CZ	TYR	132	22.943	47.909	14.269	1114	CB	SER	144	21.434	20.038	5.834
OH	TYR	132	23.300	49.130	14.155	1'. 15	OG	SER	144	21.732	20.215	4.451
CE2	TYR	132	23.927	46.848	14.466	1116	C	SER	144	19.740	21.919	5.742
CD2	TYR	132	23.559	45.520	14.588	1117	O	SER	144	20.564	22.778	6.026
C	TYR	132	21.209	41.873	16.221	1118	N	SER	145	18.606	22.214	5.101
0	TYR	132	21.808	40.794	16.225	1119	CA	SER	145	18.340	23.592	4.718
N	GL U	133	19.892	42.000	16.345	1120	CB	SER	145	18.037	23.721	3.213
CA	GL U	133	18.961	40.894	16.270	1121	CG	SER	145	17.777	25.103	2.951
CB	GLU	133	18.218	40.743	17.599	1122	C	SER	145	17.191	24.173	5.500
CG	GLU	133	17.224	39.610	17.642	1123	O	SER	145	16.106	23.618	5.496
CD	GLU	133	16.815	39.267	19.075	1124	N	ILE	146	17.443	25.292	6.169
OE1	GLU	133	17.673	39.351	19.981	1125	CA	ILE	146	16.363	26.067	6.789
OE2	GLU	133	15.633	38.897	19.284	1126	CR	ILE	146	16.432	26.142	8.374
c	GLU	133	17.981	41.167	15.139	1127	CG1	ILE	146	15.193	26.924	8.912
0	GLU	133	17.387	42.271	15.065	1128	CDI	ILE	146	15.025	26.913	10.472
N	SER	134	17.813	40.183	14.260	1129	CG2	ILE	146	17.746	26.788	8.854
CA	SER	134	16.905	49.303	13.102	1130	C	ILE	146	16.336	27.427	6.141
CB	SER	134	17.682	40.295	11.767	1131	O	ILE	146	17.375	28.118	6.017
OG	SER	134	16.783	40.127	10.678	1132	N	VAL	147	15.131	27.B06	5.702
C	SER	134	15.870	39.212	13.121	1133	CA	VAL	147	14.926	29.071	5.026
O	SER	134	16.215	33.025	13.207	1134	CB	VAL	147	14.337	28.846	3.588
N	THR	135	14.579	39.587	13.051	1135	CG1	VAL	147	14.176	3C.187	2.873
CA	THR	135	13.504	38.612	13.225	1136	CS2	VAL	147	15.248	27.910	2.767
CB	THR	135	12.513	39.042	14.334	1137	C	VAL	147	14,015	29.987	5.855
OG1	IHR	135	11.845	40.239	13.916	1138	O	VAL	147	13.019	29.541	6.380
CG2	THR	135	13.241	39.299	15.630	1139	N	TYR	148	14.390	31.250	5.979
C	THR	135	12.717	38.307	11.952	1140	CA	TYR	148	13.637	32.178	6.807
O	THR	135	12.720	39.095	10.997	1141	CB	TYR	148	14.198	32.227	8.248
N	GLY	136	12.071	37,151	11.928	1142	CC	TYR	143	15.717	32.119	8.302
CA	GLY	136	11.275	36.746	10.772	1143	CDI	TYR	148	16.526	33.249	8.243
C	GLY	136	10.772	35.335	1O.B00	1144	CE1	TYR	148	17,904	33.150	8.259
O	GLY	136	11.254	34.524	11.606	1145	CZ	TYR	148	18.487	31.392	8.357
N	PRO	137	9.804	35.005	9,915	1146	OH	TYR	148	19.850	31.775	8.355
CA	PRO	137	9.256	33.674	9.905	1147	CE2	TYR	148	17.732	3C.765	8.415
CB	PRO	137	7.911	33.845	9,180	1148	CD2	TYR	148	16.337	30.973	8.383
CG	PRO	137	8.131	34.944	8.277	1149	C	TYR	148	13.654	33.552	6.188
CD	PRO	137	9.178	35.854	8.885	1150	O	TYR	148	14.661	34.014	5.618
C	ERO	137	10.115	32.678	9.151	1151	N	SER	149	12.539	34.244	6.333
0	PRO	137	10.774	33.032	8.162	1152	CA	SER	149	12.504	35.599	5.819
N	VAL	133	10.093	31.439	9.634	1153	CB	SER	149	11.152	35.886	5.164
CA	VAL	138	10.627	30.285	8.900	1154	OG	SER	149	11.188	37.127	4.645
CB	VAI,	138	10.726	29.026	9.812	1155	C	SER	149	12.339	36.625	6.901

PL 213 994 Β1

NA	A	AK	NAK	X	Y	Z	NA	A	ΛΚ	NAR	X	Y	Z
1156	0	SER	149	11.955	37.251	7.498	1235	O	VAL	161	18.740	29.392	15.510
1157	N	ALA	150	14.130	36.815	7.123	1236	N	LEU	162	17.833	31.371	16.113
1158	CA	ALA	150	14.617	37.739	8.110	1237	CA	LEU	162	17.222	30.865	17.345
1159	CB	ALA	150	15.109	36.972	9.345	1238	CB	LEU	162	17.651	31.731	18.539
1160	C	ALA	150	15.755	38.487	7.456	1239	CG	LEU	162	19.122	31.862	18.951
1161	0	ALA	150	16.581	37.880	6.789	1240	CDI	LEU	162	19.254	32.588	20.288
1162	M	HIS	151	15.813	39.799	7.626	1241	CD2	LEU	162	19.841	30.505	19.026
1163	CA	HIS	151	16.847	40.568	6.957	1242	C	LEU	162	15.708	30.885	17.242
1164	CB	HIS	151	16.521	42.068	6.966	1243	O	LEU	162	15.147	31.746	16.533
1165	CG	HIS	151	17.523	42.890	6.224	1244	N	ASN	163	15.050	29.959	17.923
1166	ND1	HIS	151	17.444	43.104	4.862	1245	CA	ASN	163	13.573	30.031	18.032
1167	CE1	HIS	151	18.456	43.857	4.480	1246	CB	ASN	163	12.959	28.656	18.161
1168	NE2	HIS	151	19.196	44.130	5.541	1247	CG	ASN	163	13.286	27.966	19.490
1169	CD2	HIS	151	18.630	43.540	6.64 4	1248	OD1	ASN	163	13.723	28.611	20,438
1170	C	HIS	151	18.253	40.351	7.508	1249	ND2	ASN	163	13.059	26.645	19.556
1171	0	HIS	151	18.481	40.478	8.706	1250	C	ASN	163	13.123	30.988	19.141
1172	N	THR	152	19.197	40.C52	6.608	1251	0	ASN	163	13.945	31.699	19.721
1173	CA	THR	152	20.604	39.836	6.970	1252	N	SER	164	11.805	31.046	19.397
1174	CB	THR	152	20.963	38.321	6.935	1253	CA	SER	164	11.263	32,019	20.375
1175	051	THR	152	20.607	37.770	5.656	1254	CB	SER	164	9.766	32.066	20.325
117 6	CG2	THR	152	20.165	37.575	7.994	1255	OG	SER	164	9.249	30.768	20.363
1177	C	THR	152	21.575	40.574	6.056	1256	C	SER	164	11.760	31.729	21.799
1178	0	THR	152	21.224	40.997	4.926	1257	O	SER	164	11.821	32.631	22.644
1179	N	GLU	153	22.784	40.833	6.563	1258	N	ASN	165	12,142	30.481	22.043
neo	CA	GLU	153	23.890	41.345	5.780	1259	CA	ASN	165	12.711	30.123	23.318
1181	CB	GLU	153	24.333	42.703	6.306	126C	CB	ASN	165	12.139	28.801	23.812
1182	CG	GLU	153	23.265	43.830	6.178	1261	CG	ASN	165	12.441	28.589	25.281
1183	CD	GLU	153	22.814	44.137	4.740	1262	OD1	ASN	165	12.424	29.547	26.057
1184	OE1	GLU	153	23.563	43.838	3.779	1263	ND2	ASN	1 65	12.783	27.371	25.653
1185	OE2	GLU	153	21.696	44.700	4.573	1264	c	ASN	165	14.254	30.125	23.351
1186	C	GLU	153	25.063	40.353	5.827	1265	0	ASN	165	14.884	29.565	24.260
1187	0	GLU	153	24.998	39.358	6.545	1266	N	ASN	166	14.852	30.775	22.359
1180	N	SER	154	26.134	40.633	5.089	1267	CA	ASN	166	16.300	30.974	22.293
1189	CA	SER	154	27.242	39.681	4.990	1268	CB	ASN	166	16.821	31.814	23.482
1190	CB	SER	154	28.302	40.158	4.001	1269	CG	ASN	166	16.438	33.291	23.356
1191	OG	SER	154	29.000	41.261	4.517	12/0	OD1	ASN	166	16.334	33.815	22.246
1192	C	SER	154	27.873	39.367	6.356	1271	ND2	ASN	166	16.199	33.956	24.492
1193	0	SER	154	28.288	38.230	6.583	1272	C	ASN	1Ć6	17.076	29.676	22.137
1194	N	GLY	155	27.941	40.376	7.237	1273	O	ASN	166	18.220	29.603	22,548
1195	CA	GLY	155	28.390	40.207	8.618	1274	N	GLU	167	16.423	28.663	21,576
1196	C	GLY	155	27.626	39.171	9.442	1275	CA	GLU	167	17,071	27.397	21.263
1197	0	GLY	155	28.139	38.732	10.481	1276	CB	GLU	167	16.129	26.211	21.445
1198	N	ASN	1.56	26.416	38.805	9.020	1277	CG	GLU	167	15.478	26.204	22.842
1199	CA	ASN	156	25.636	37.752	9.696	1273	CD	GLU	167	14.256	25.339	22.941
1200	CB	ASN	156	24.146	37.786	9.333	1279	OE1	GLU	167	13.603	25.063	21.901
1201	CG	ASN	156	23.376	38.872	10.099	1280	OE2	GLU	167	13.936	24.935	24.080
1202	OD1	ASN	156	22.871	39.825	9.486	1281	C	GLU	1 67	17,531	27.458	19.816
1203	KD2	ASN	156	23.345	38.776	11.454	1282	O	GLU	167	16.913	28.136	18.963
1204	C	ASN	156	26.156	36.327	9.426	1283	N	LEU	168	18.622	26.749	19.538
1205	O	ASN	156	25.627	35.372	10.010	1284	CA	LEU	168	19.244	26.785	18.230
1206	N	SER	157	27.071	36.181	8.461	1285	CB	LEU	168	20.674	26.197	1Θ .403
1207	CA	SER	157	27.749	34.892	8.231	1286	OG	LEU	168	21.662	26.327	17.291
1208	CB	SER	157	29.046	35.134	7.467	1287	CDI	LEU	168	21.999	27.7B5	16.934
1209	OG	SER	157	28.723	35.358	6.083	12ΘΒ	CD2	LEU	168	22.903	25.546	17.775
1210	C	SER	157	28.089	34.311	9.594	1289	2	LEU	168	18.486	25.998	17.160
1211	O	SER	157	28.762	34.958	10.387	1290	0	LEU	168	18.188	24.792	17.339
1212	N	GLY	158	27.626	33.102	9.844	1291	N	VAL	169	18.148	26.672	16.055
1213	CA	GLY	158	27.97B	32.389	11.095	1292	CA	VAL	169	17.502	26.001	14.922
1214	C	GLY	158	27.033	32.675	12.246	1293	CB	VAL	169	16.092	26.546	14.53¹
1215	O	GLY	158	27.190	32.106	13.324	1294	CGl	VAL	169	15.096	26.348	15.717
1216	K	SER	159	26.003	33.517	12.028	1295	CG2	VAL	169	16.141	27.965	14.084
1217	CA	SER	159	25.011	33.799	13.089	1296	s	VAL	169	18.339	25.938	13.653
3 21B	CB	SER	159	24.045	34.924	12.638	1297	0	VAL	169	17.998	25.167	12.747
1219	OG	SER	159	24.76=	36.155	12.500	1298	N	GLY	170	19.366	26,749	13.561
1220	C	SER	159	24.168	32.600	13.538	1299	CA	GLY	170	20.295	26,641	12.427
1221	0	SER	159	23.716	31.826	12.738	1300	c	GLY	170	21.426	27.617	12.557
1222	N	PRO	160	23.891	32.487	14.866	1301	0	GLY	170	21.529	28.315	13.566
1223	CA	PRO	160	22.909	31.501	15.288	1302	N	ILE	171	22.346	27.610	11.574
122 4	CB	PRO	160	22.979	31.553	16.839	1303	CA	ILE	171	23.411	28.623	11.500
1225	CG	PRO	160	23.50C	33.009	17.143	1304	CB	ILE	171	24 . Θ54	28.023	11.647
1226	CD	PRO	160	24.42C	33.313	15.973	1305	CGl	ILE	171	25.938	29.079	11.407
1227	C	PRO	160	21.571	32.006	14.833	1306	CDI	ILE	171	27.370	28.574	11-711
1228	O	PRO	160	21.34C	33.229	14.841	1307	CG2	ILE	171	25.019	26.723	10.836
1229	N	VAL	161	20.713	31.067	14.484	1308	C	ILE	171	23.305	29.324	10.147
1230	CA	VAL	161	19.32C	31.310	14.211	1309	□	ILE	171	23.217	28.653	9.n«
1231	CB	VAL	161	18.935	30.688	12.892	1310	N	HIS	172	23.336	30.651	10 . 185
1232	CGl	VAL	161	17.425	30.917	12.599	1311	CA	HIS	172	23.134	31.457	8.976
1233	CG2	VAL	161	19.855	31.244	11.790	1312	CB	HIS	172	23.024	32.925	9.379
1234	C	VAL	161	18.601	30.598	15.344	1313	CG	HIS	172	22.829	33.843	8.209

PL213 994B1

ΝΑ	A	AK	NAK	X	Y	Z	NA	A	AK	NAK	X	Y	Z
1314	ND1	HIS	172	21.652	33.874	7.493	1397	N	TYR	186	19.229	31.994	4.258
1315	CE1	HIS	172	21.773	34.739	6.500	3 9B	CA	TYR	186	19.437	30.564	4.223
1316	NE2	HIS	172	22.988	35.260	6.541	1399	CB	TYR	186	20,055	30.119	2.866
1317	CD2	HIS	172	23.669	34.718	7.607	1400	CG	TYR	186	19.163	30.586	1.764
1318	C	HIS	172	24.331	31.291	Θ . 371	1401	CDI	TYR	186	19.430	31.788	1.128
1319	0	HIS	172	25.477	31.320	8.568	1402	CE1	TYR	186	18.549	32.286	0.147
1320	N	PHE	173	24.117	31.176	6.748	1403	CZ	TYR	186	17.4C3	31.599	-0.140
1321	CA	PHE	173	25.280	31.236	5.840	1404	OH	TYR	186	16.577	32.140	-1.101
1322	CB	PHE	173	25.783	23.820	5.453	1405	CE2	TYR	186	17.082	30.416	0.4S9
1323	CG	PHE	173	24.981	29.182	4.385	1406	CD2	TYR	186	17.967	29.924	1.4B4
1324	cm	PHE	173	25.431	29.228	3.056	1407	C	TYR	186	20.349	30.187	5.371
1325	CE1	PHE	173	24.657	28.684	2.045	1408	O	TYR	186	21.369	30.829	5.611
1326	cz	PHE	173	23.433	28.082	2.347	1409	N	GLY	187	19.926	29.168	6.094
1327	CE2	PHE	173	22.987	28.031	3.666	1410	CA	GLY	187	20.779	28.609	7.172
1328	CD2	PHE	173	23.761	28.583	4.665	1411	C	GLY	187	20.946	27.103	6.998
1329	C	PHE	173	25.124	32.151	4.578	1412	O	GLY	187	20.189	26.437	6.281
1330	O	PHE	173	26.124	32.620	4.019	1413	N	VAL	188	21.935	26.556	7.704
1331	N	ALA	174	23.892	32.4S2	4.206	1414	CA	VAL	188	22.100	25.091	7.793
1332	CA	ALA	174	23.675	33.243	S.948	1415	CB	VAL	188	23.574	24.705	7.963
1333	CB	ALA	174	23.694	32.283	1.751	1416	CG1	VAL	183	23.715	23.179	8.023
1334	C	ALA	174	22.359	34.016	2.942	1417	CG2	VAL	183	24.402	25.266	6.815
1335	0	ALA	174	21.404	33.626	3.590	1418	C	VAL	188	21.307	24.632	8.988
1336	N	SER	175	22.289	35.063	2.128	1419	O	VAL	1 B	21.470	25.160	10.071
1337	CA	SER	175	20.974	35.536	1.793	1420	N	TYR	189	20.437	23.603	8.760
1338	CB	SER	175	20.695	36.924	2.538	1421	CA	TYR	189	19.627	23.C75	9,815
1339	GG	SER	175	21.905	37.573	2.966	1422	CB	TYR	189	18.379	22.555	9,156
1340	c	SER	175	20.826	35.876	0.298	1423	CG	TYR	189	17.332	22.049	10.094
1341	0	SER	175	21.752	35.635	-0.478	1424	cm	TYR	189	16.522	22.942	10,Bil
1342	N	ASP	176	19.641	36.312	-0.097	1425	CE1	TYR	189	15.527	22.474	11.668
1343	CA	ASP	176	19.443	36.799	-1.448	1426	cz	TYR	189	15.334	21.115	11.796
1344	CB	ASP	176	18.048	36.413	-1.944	1427	OH	TYR	189	14 .328	20.627	12.607
1345	CG	ASP	176	17.087	34.894	-2.123	1428	CE2	TYR	189	16.118	20.205	11.0B0
1346	ODl	ASP	176	18.807	34.190	-2.399	1429	CD2	TYR	189	17.105	20.678	10.226
1347	OD2	ASP	176	16.764	34.399	-1.980	1430	c	ΤΪΕ	189	20.437	21.892	10.394
1348	C	ASP	176	19.634	38.297	-1.445	1431	0	TYR	189	21.094	21,197	9.664
1349	0	ASP	176	19.380	38.965	-0.449	1432	N	PHE	190	20.797	21.668	11.699
1350	N	VAL	177	20.157	38.839	-2.529	1433	CA	PHE	190	21.160	2C.674	12.319
1351	CA	VAL	177	20.052	40.286	-2.728	1434	C3	PHE	190	21.542	21.083	13.743
1352	CB	VAL	177	21.376	40.943	-3.134	1435	CG	PHE	190	22.365	22.356	13.785
1353	CG1	VAL	177	21.967	40.268	-4.379	1436	CDI	PHE	190	21.807	23.545	14.239
1354	CG2	VAL	177	21.141	42.447	-3.321	1437	CE1	PHE	190	22.559	24.706	14.261
1355	C	VAL	177	19.918	40.666	-3.692	1438	cz	PHE	190	23.869	24.711	13.812
1356	O	VAL	177	17.744	40.801	-3.282	14 39	CE2	PHE	190	24.429	23.537	13.337
1357	N	AS?	181	11.008	44.174	3.566	144C	CD?	PHE	190	23.674	22.377	13.316
1358	CA	ASP	181	11.761	43.230	2.730	1441	C	PHE	190	20.567	19.207	12.212
1363	C	ASP	181	11.331	41.773	2.954	1442	c	PHE	190	19.791	18.832	13.053
1364	0	ASP	181	11.519	41.213	4.047	1443	N	THR	191	20.944	18.617	11,140
1365	N	ASN	182	10.750	41.157	1.930	1444	CA	THR	191	20.490	17.258	10.B95
1366	CA	ASN	182	10.327	39.764	2.054	1445	CB	THR	191	20.752	16.848	9.457
1367	CB	ASN	182	8.831	39.611	1.754	1446	OG1	THR	191	22.198	16.965	9.231
1368	CG	ASN	182	7,950	39.849	3.011	1447	CG2	THR	191	20.014	17.714	8.459
1369	ODl	ASN	182	8.107	40.858	3.726	1448	C	THR	191	21.336	16.346	11.809
1370	ND2	ASN	182	7.074	36,900	3.297	1449	O	THR	191	22.366	16.763	12.323
1371	c	ASN	1B2	11.251	38.760	1.321	1450	N	PRO	192	20.823	15.115	12.031
1372	0	ASN	182	10.836	37.681	0.878	1451	CA	PRO	192	21.590	14.167	12.872
1373	N	ARG	183	12.521	39.140	1.245	1452	CB	PRO	192	20.846	12.830	12.656
1374	CA	ARG	183	13.560	3B.299	0.679	1453	CG	PRO	192	19.471	13.225	12.331
1375	CB	ARG	183	14.795	39.135	0.313	1454	CE	PRO	192	19.560	14 .519	11.550
1376	CG	ARG	183	15.655	39.641	1.474	1455	C	PRO	192	23.060	14 .C29	12.472
1377	CD	ARG	183	16.914	40.297	C . 942	1456	O	PRO	192	23.940	13.997	13.324
1378	NE	ARG	183	17,890	40.594	1.994	1457	N	GLU	193	23.327	13.944	11.172
1379	CZ	ARG	183	19.011	41.290'	1.807	1458	CA	GLU	193	24.674	13.789	10.676
1380	NH1	ARG	183	19.303	41.782	0.604	1459	CB	C-LU	193	24.610	13.584	9.145
1381	NH2	ARG	183	19.842	41 .514	2.820	1460	CG	GLU	193	25-935	13.348	8.487
1382	C	ARG	1B3	13.892	37.179	1.661	1461	CD	GLU	193	25.834	13.028	6.987
1383	0	ARG	183	13.674	37.312	2.872	1462	CE1	GLU	193	26.823	12.480	6.410
1384	N	ASN	184	14.397	36.0/1	1.130	1463	OE2	GLU	193	24-763	13.311	6.387
1385	CA	ASN	164	14.733	34.925	1.968	1464	C	GLU	193	25.559	14.988	11-050
1386	CB	ASN	184	14.219	33.634	1.328	1465	0	GLU	193	26.723	14.845	11.447
1387	CG	ASN	184	12.718	33.501	1.417	1466	N	ILE	194	25.007	16.196	10.928
1388	ODl	ASN	184	12.065	34.165	2.235	1467	CA	ILE	194	25.737	17.369	11,285
1389	ND2	ASN	184	12.155	32.634	0.593	1468	CB	ILE	194	25.178	18.663	10.651
1390	c	ASN	184	16.223	34.851	2.317	1469	CG1	ILE	194	25.213	18-553	9.108
1391	0	ASN	184	17.103	35.343	1.586	1470	CDI	ILE	194	24.346	19.662	8.390
1392	N	ALA	185	16.495	34.252	3.474	1471	CG2	ILE	194	25.957	19.845	11.092
1393	CA	ALA	185	17.863	33.995	3.916	1472	C	ILE	194	26.002	17.497	12.827
1394	CB	ALA	185	18.198	34.827	5.153	1473	O	ILE	194	27.085	17.816	13.334
1395	C	ALA	185	17.993	32.493	4.194	1474	N	LYS	195	24.969	Π .212	13,595
1396	O	ALA	185	16.984	31.780	4.323	1175	CA	LYS	195	25.097	17.144	15,056

PL 213 994 Β1

NA	A	AK	NAK	X	Y	Z	NA	A	AK	NAK	X	Y	Z
1476	CB	LYS	195	23.779	16.672	15.648	1517	CA	GLU	200	32.864	14.611	17.685
1477	CG	LYS	195	22.734	17.783	15.597	1518	CB	GLU	200	32.984	13.848	16.366
1478	CD	LYS	195	21.483	17.402	16.428	1519	CG	GLU	200	32.132	12.660	16.244
1479	CE	LYS	195	20.397	18.478	16.341	1520	CD	GLU	200	32.032	12.152	14.804
1480	NZ	LYS	195	19.188	17.946	17.115	1521	OE1	GLU	200	31.413	11.073	14.627
1481	C	LYS	195	26.185	16.217	15.541	1522	OE2	GLU	200	32.528	12.852	13-863
1482	0	LYS	195	26.924	16.543	16.459	1523	C	GLU	200	33.982	15.639	17.804
1483	N	LYS	196	26.239	15.038	14.951	1524	0	GLU	200	35.087	15.321	18.252
1484	CA	LYS	196	27.281	14.046	15.242	1525	N	ASN	201	33.688	16.903	17.483
1485	CB	LYS	196	27.032	12.778	14.434	1526	CA	ASN	201	34.714	17.900	17.377
1486	CG	LYS	196	28.078	11.668	14.671	1527	CB	ASN	201	34.726	19.421	15.943
1487	CD	LYS	196	27.969	10.638	13.546	1528	CG	ASN	201	35.313	17.430	15.015
1488	CE	LYS	196	26.505	10.198	13.407	1529	ODl	ASN	201	36.526	17.193	15.050
1489	NZ	LYS	196	25.958	10.253	12.014	1530	ND2	ASN	201	34.467	16.756	14.265
1490	c	LYS	196	28.681	14.583	14,989	1531	C	ASN	201	34.672	19.048	18.388
1491	0	LYS	196	29.556	14.481	15.845	1532	0	ASN	201	35.502	19.972	18.358
1492	N	PHE	197	28.903	15.184	13.815	1533	N	ILE	202	33.733	18.961	19.312
1493	CA	PHE	197	30.177	15.790	13.531	1534	CA	ILE	202	33.783	19.830	20.495
1494	CB	PHE	197	30.160	16.384	12.096	1535	CB	ILE	202	32.417	19.831	21.230
1495	CG	PHE	197	31.242	17.380	11.870	1536	CGl	ILE	202	31.464	20.780	20.486
1496	CDI	PHE	197	30.974	18.760	11.981	1537	CDI	ILE	202	30.012	20.508	20.697
1497	CE1	PHE	197	31.991	19.686	11.792	1538	CG2	ILE	202	32.559	20.334	22.693
1498	CZ	PHE	197	33.288	19.244	11.501	1539	C	ILE	202	34.976	19.440	21.405
1499	CE2	PHE	197	33.539	17.890	11.383	1540	0	ILE	202	35.248	18.232	21.606
1500	CD2	PHE	197	32.503	16.966	11.557	1541	N	ASP	203	35.705	20.433	21.918
1501	C	PHE	197	30.536	16.865	14.555	1542	CA	ASP	203	36.840	20.174	22.902
1502	0	PHE	197	31.656	16.937	15.033	1543	CB	ASP	203	37.550	21.468	23.221
1503	N	ILE	198	29.570	17.727	14.916	1544	CG	ASP	203	38.949	21.209	23.777
1504	CA	ILE	19B	29.854	18.745	15.880	1545	ODl	ASP	203	39.523	20.127	23.477
1505	CB	ILE	198	28.665	19.718	16.021	1546	OD 2	ASP	203	39.474	22.068	24.504
1506	CGl	ILE	198	28.511	20.491	14.715	1547	C	ASP	203	36.400	19.387	24.032
1507	CDI	ILE	198	27.152	21.285	14.651	1540	0	ASP	203	35.332	19.632	24.593
1508	CG2	ILE	198	28.924	20.695	17.181	1549	N	LYS	204	37.247	13.444	24.459
1509	C	ILE	198	30.220	18.107	17.228	1550	CA	LYS	204	36.866	17.556	25.556
1510	0	ILE	198	31.190	18.479	17.829	1551	CB	LYS	204	36.428	16.176	25.034
1511	N	ALA	199	29.488	17.093	17.627	1552	CG	LYS	204	35.002	16.097	24.529
1512	CA	ALA	199	29.763	16.450	18.925	1553	CD	LYS	204	34.783	14.864	23.684
1513	CB	ALA	199	28.649	15.466	19.288	1554	CE	LYS	204	33.638	14.997	22.643
1514	c	ALA	199	31.120	15.778	18.939	1555	NZ	LYS	204	34.161	15.549	21.407
1515	0	ALA	199	31.828	15.856	19.930	1556	C	LYS	204	37.990	17.387	26.553
1516	N	GLU	200	31.533	15.217	17.795	1557	0	LYS	204	39.177	17.448	26.148
							1558	ΟΧΤ	LYS	204	37.695	17.196	27.776

PL213 994B1

Wykaz sekwencji <110> BioCentrum Sp. z o.o.

Dubin, Grzegorz

Potempa, Jan

<120>	Proteinaza SplB i peptydy przez nią rozpoznawane oraz ich zastosowania
<130>	PK/0428/RW
<160	12
<170>	Patentln version 3.3
<210 <211> <212> <213>	1 723 DNA Staphylococcus aureus
<220> <221> <222> <223>	CDS (1)..(720) gen kodujący proteinazę SplB ZC peptydem sygnalnym	Staphylococcus aureus wraz z
<220 <221> <222>	mat peptide (109).. (720)
<400>	1

atg Met

aac Asn -35

aaa Lys

aac Asn

gta Val

gtc val

atc aag

agt Ser

tta Leu

gca Ala

gca Ala -25

tta Leu

aca Thr

att Ile

tta Leu

4&

ile -30

Lys

aca

tct

gta

aca

ggt

att

gga

aca

ttg

gtt

gag

gaa

gta

caa

96

Thr

Ser

Val

Thr

Gly

Ile

Gly

Thr

Leu

val

Glu

Val

Gin

-20

-15

0

-5

act

gcc

aaa

gca

gaa

aat

gtc

aca

aaa

gtt

aaa

gat

act

aat

att

144

Thr

Ala

Lys

Ala

Glu

Asn

Val

Thr

Lys

Val

Lys

Asp

Thr

Asn

lic

-1

1

5

10

ttt

cca

tat

act

ggt

gta

gtt

gct

ttt

aaa

agt

gca

ant

gga

ttt

qta

192

Phe

Pro

Tyr

Thr

Gly

val

Val

Ala

Phe

Lys

Ser

Ala

Thr

Gly

Phe

Val

15

20

25

gtt

gga

aag

aat

act

att

tta

aca

aat

aaa

cat

gtg

reg

aaa

aa Ł

tac

240

Val

Gly

Lys

Asn

Thr

ile

Leu

Thr

Asn

Lys

His

vai

Ser

Lys

Asn

Tyr

30

35

40

aaa

gtg

qgc

gat

cgt

att

act

gca

cat

cca

aat

agt

gat

aaa

ggt

aat

288

Lys

Val

Gly

Asp

Arg

Ile

Thr

Ala

Hi s

Pro

Asn

ser

Asp

Lys

Gly

Asn

45

5C

55

60

ggt

att

tat

tog

att

aaa

aag

att

aat

tat

cca

ggt

aaa

gaa

336

Gly

I le

Tyr

Ser

Ile

Lys

Ile

Asn

Tyr

Pro

Gly

Lys

Glu

65

70

75

gat

gta

tca

gtc

att

caa

gtt

gaa

gag

cgt

gca

ata

gaa

cgt

gga

cca

384

Asp

Val

Ser

Val

Ile

Gin

Val

Glu

Arg

Ala

ile

Glu

Arg

Gly

Pro

80

Θ5

90

aąa

ggc

ttt

aat

ttt

aat

gat

aat

gta

acg

cca

ttc

aaa

rat

gcg

gca

432

Lys

Gly

Phe

Asn.

Phe

Asn

Asp

Asn

Val

Thr

Pro

Phe

Lys

Tyr

Ala

95

100

105

ggg

gct

aaa

gct

ggt

gag

ega

att

aaa

gtg

att

ggt

tat

cca

cac

cca

4 80

Gly

Ala

Lys

Ala

Gly

Glu

Arg

I le

Lys

Val

Ile

Gly

Tyr

Pro

His

Pro

110

115

120

tac

aaa

aat

aaa

tat

gtt

tta

tal

gag

tca

act

ggc

cct

gtg

atg

tca

528

Tyr

Lys

Asn

Lys

Tyr

Val

Leu

Tyr

Glu

Ser

Thr

Gly

Pro

Val

Met

Ser

125

130

135

140

gta

gaa

ggt

ago

agt

att

gta

tat

tca

gcg

cat

ac t

gaa

age

qqa

aac

575

val

Glu

Gly

Ser

Ile

Val

Tyr

Ser

Ala

His

Thr

Glu

Ser

Gly

Asn

145

150

155

tct

gga

tca

cct

gta

zta

aac

age

aac

gaa

t.t a

gtt

ggt

att

aat

624

PL 213 994 Β1

672

Ser Gly

Ser

Pro Val 160

Leu Asn Ser

Asn 165

Asn

Glu

Leu

Val

Gly 170

Ile

His

ttt

gct

tct

gat

gta

aaa

aat

gat

aac

aga

aat

gca

tat

ggc

gtc

Phe

Ala

Ser

Asp

Val

Lys

Asn

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

val

175

100

185

tac

ttt

aca

cca

gaa

att

aaa

ttc

att

gca

gaa

aac

ata

gat

aaa

Tyr

Phe

Thr

Pro

Glu

Ile

Lys

T.ys

Phe

Tle

Ala

Glu

Asn

Tle

Asp

Lys

190 195 2C0

723 taa <210> 2 <211>240 <212> PRT <213> Staphylococcus aureus <400>2

Met Asn -35

Lys Asn

Val Val

Ile -30

Lys

ser Leu

Ala

Ala -25

Leu

Thr

ile

Leu

Thr

Ser

Val

Thr

Gly

Ile

Gly

Thr

Leu

Val

Glu

Val

Gin

-20

-15

-10

- 5

Thr

Ala

Lys

Ala

Glu

Asn

val

Thr

Lys

Val

Lys

Asp

Thr

Asn

Ile

-1

1

5

10

Phe

Pro

Tyr

Thr

Gly

Val

Ala

Phe

Lys

Ser

Ala

Thr

Gly

Phe

val

15

2Q

25

val

Gly

Lys

Asn

Thr

Ile

Leu

Thr

Asn

Lys

His

Val

Ser

Lys

Asn

Tyr

30

35

40

Lys

va.L

Gly

Asp

Arg

Ile

Thr

Ala

His

Pro

Asr.

Ser

Asp

Lys

Gly

Asn

45

50

55

60

Gly

Ile

Tyr

Ser

Ile

Lys

Ile

Asn

Tyr

Pro

Gly

Lys

Glu

65

70

75

Asp

val

Ser

Val

Ile

Gin

val

Glu

Arg

Ala

IL.e

Glu

Arg

Gly

Pro

80

95

90

Lys

Gly

Phe

Asn

Phe

Asn

Asp

Asn

Val

Thr

Pro

Phe

Lys

Tyr

Ala

95

100

105

Gly

Ala

Lys

Ala

Gly

Glu

Arg

Ile

Lys

Val

Ile

Gly

Jyt

Pro

His

Pro

110

115

120

Tyr

Lys

Asn

lys

Tyr

Val

Leu

Tyr

Glu

Ser

Thr

G1 y

Pro

vai

Met

Ser

125

130

135

1 40

Val

Glu

Gly

Ser

Ile

Val

Tyr

Ser

Ala

His

Thr

Glu

Ser

Gly

Λεη

145

150

155

Ser

Gly

Ser

Pro

Val

Leu

Asn

Ser

Asn

Glu

Leu

val

Gly

Ile

His

150

165

170

Phe

Ala

Ser

Asp

Val

Lys

Asn

ASp

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

Val

175

180

135

Tyr

Phe

Thr

Pro

Glu

Tle

Lys

Phe

Ile

Ala

Glu

Asn

Ile

Asp

Lys

190

195

200

<210>3 <211>702 <212> DNA <213> Artificial seąuence <220>

<223> sekwencją kodująca wariant białka SplB z peptydem sygnalnym subtilrs <220>

<221> CDS <222> (1)..(699) <220>

<221> rnat_peptide

723 z B.

PL213 994B1 <222> (88)..(699) <400> 3

atg aac atc

aaa Lys

aag ttt

gca Ala

aaa Lys

caa gca aca

gta Val

tta Leu

acc Thr

t.t.t Phe -15

act Thr

•18

Met

Asn

Tle

Lys -25

Phe

Gin

Ala Thr -20

acc

gca

ctg

gca

gga

ggc

gca

act

caa

gct

ttt

gcc

gaa

aat

96

Thr

Ala

Leu

Ala

Gly

Ala

Thr

Gin

Ala

Phe

Ala

Glu

Asn

-10

-5

-1

1

gtc

aca

aaa

gtt

aaa

gat

act

aat

att

ttt

cca

tat

act

ggt

gta

gtt

144

Val

Thr

Lys

Val

Lys

Asp

Thr

Asn

Ile

Phe

Pro

Tyr

Thr

Gly

val

Val

5

10

15

gct

ttt

aaa

agt

gca

act

gga

ttt

gta

gtt

gga

aag

aat

act

att

tta

192

Ala

Phe

Lys

Ser

Ala

Thr

Gly

Phe

Val

Gly

Lys

Asn

Thr

Ile

Leu

20

25

30

35

aca

aat

aaa

cat

gtg

tcg

aaa

aat

tac

aaa

gtg

ggc

gat

cgt

att

act

240

Thr

Asn

Lys

His

Val

Ser

Lys

Asn

Tyr

Lys

val

Gly

Asp

Arg

Tle

Thr

40

45

50

gca

cat

cca

aat

agt

gat

aaa

ggt

aat

ggt

att

tat

tcg

att.

aaa

28B

Ala

His

Er©

Asn

Ser

Asp

Lys

Gly

Asn

Gly

ile

Tyr

Ser

TLe

Lys

55

60

65

aag

att

aat

tat

cca

ggt

aaa

gaa

gat

gta

tca

gtc

att

caa

gtt

336

Lys

Ile

Asn

Tyr

Pro

Gly

Lys

Glu

Asp

vai

Ser

Val

Ile

Gin

Val

73

75

80

gaa

gag

cgt

gca

ata

gaa

cgt

gga

cca

aaa

ggc

ttt

aat

ttt

aat

gat

3S4

Glu

Arg

Ala

Ile

Glu

Arg

Gly

Pro

Lys

Gly

Phe

Asn

Phe

Asn

ńsp

85

90

95

aat

gta

acg

cca

ttc

aaa

tat

gcg

gca

ggg

gct

aaa

gct

ggt

gag

ega

432

Asr.

Val

Thr

Pro

Phe

Lys

Tyr

Ala

Gly

Ala

I.ys

Ala

Gly

Glu

Arg

100

105

110

115

att

aaa

gtc

att

ggt

tat

cca

cac

cca

tac

aaa

aat

aaa

tat

gtt

tta

Ile

Lys

Val

Ile

Gly

Tyr

Pro

His

Pro

Tyr

Lys

Asn

Lys

Tyr

Val

Leu

120

125

130

tai

gag

tca

act

ggc

cct

gtg

atg

tca

gta

qaa

ggt

agc

agt

att

gta

528

Tyr

Glu

Ser

Thr

Gly

Pro

val

Met

Ser

Val

Glu

Gly

Ser

lic

val

135

140

145

tat

rca

gcg

cat

act

gaa

agc

gga

aac

tct

gga

tca

cct

gta

tta

aac

0 7 6

Tyr

Ser

Ala

His

Thr

Glu

Ser

Gly

Asn

Ser

Gly

Ser

Pro

Val

Leu

Asn

150

155

160

ago

aac

aas

gaa

tta

gtt

ggt

att

cat

ttt

gct

tct

gat

gta

aaa

aat

621

Ser

Asn

G1U

Leu

Val

Gly

ile

His

Phe

Ala

Ser

ASp

tal

Lys

Asn

165

170

175

gat

aac

aga

a a t

gca

tat

ggc

gtc

tac

ttt

aca

cca

gaa

att

aaa

6 /2

ASp

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

Val

Tyr

Phe

Thr

Pro

Glu

Ile

Lys

180

185

190

195

aaa

ttc

att

gca

gaa

aac

ata

gat

aaa

taa

7C2

Lys

Phe

Ile

Ala

Glu

Asn

Ile

Asp

Lys

200

<210>	4
<211>	233
<212>	PRT
<213>	artificial seąuence
<220 <223>	synthetic Construct
<4C0>	4

Met

Asn

Ile

Lys

Lys -25

Phe

Ala

Lys

Gin

Ala -20

Thr

Val

Leu

Thr

Phe -15

Thr

Ala

Leu

Ala

Gly

Ala

Thr

Gin

Ala

Phe

Ala

Glu

Asn

-10

-5

-1

1

Val Thr Lys VaL Lys Asp Thr Asn T.Le Phe Pro Tyr Thr Gly Val Val

PL 213 994 Β1

10 15

Ala 20

Phe

Lys

Ser

Ala

tsw 35

Gly

Phe

Val

val

Gly 30

Łys

ASH

Thr

11*

leó 35

Thr

Asn

l>ys

His

Val

Ser

Łys

Asr.

Tyr

Lys

Val

Gly

AS?

Arg

Ile

Thr

40

45

50

Ala

His

Pro

Asn

Ser

»Sp

Lys

Gly

ASfj.

Gly

.i la

Tyr

Set

II®

I>ys

55

60

65

Lys

Ile

Asn

Tyr

Pro

Gly

Lys

GXu

Asp

Val

Ser

Val

Ile

&1ϊ)

vai

70

75

80

Glu

G1U

Arg

Ais

Ile

G.Ui

Arg

Gly

Lys

Gly

Phe

Asn

Phe

Aen

Asp

85

90

95

Asn

Val

Thr

PW

Phe

Lys

Tyr

Ala

Gry

Alą

hys

aia

Gly

Glu

•Arg

100

105

1.10

115

Ile

Łys

Val

XI c

Gly

Tyr

Pro

His

Pro

Tyr

Lys

Asr>

Łya

Tyr

Val

Łeu

120

125

130

Tyr

Gid

Ser

Thr

Cly

Pro

val

Met

Ser

val

Glu

Gly

Ser

ile

Val

135

140

145

Tyr

Ser

Al a

His

Thr

Glu

Ser

Gly

Asn

Ber.

Gly

Ser

Pro

Val

Leu

Asn

ISO

15S

150

Ser

Asn

Glu

Leu

Vai

Gly

Ile

His

Phe

Ala

S’ir

A$p

Vai

I-ys

Asr;

16S

100

3.75

Asp

Ases

Arę

Asn

Ais

Tyr

Giy

val

Tyr

Phe

Th s

Fr.fj

G1U

1 le

i.ys

180

185

.190

195

Łys

Phe

Ile

Ala

Giu

Asn

ile

Asp

Lys

200

<210 <211> <212> <213>	5 702 DBA Artificial sequence
<220>
<223>	sekwencja kodującą białko mutanta SplB S157A a p-sptydssi sygnalnym z B, subtilis
<220>
<221>	COS
<222>	iii -,<7021

<400> 5

atg aac

atc aaa

aag i<ys 25

ttt Phe

ęf;a «aa

caa Girs

gca Ala -20

aca Thr

gta Val

tt.a acc

ttt Phe -15

act Ths

iS

Met

Asn

ile

Lys

Ala

Lys

heu

Thr

acc

ęca

Ctę

erg

gca

ega

ęgc

gca

act

ca a

gct

rt.t

gcc

gaa

aat

ąat

96

Thr

Ala

Leu

Leu.

Ala

Gly

w

Ala

Thr.

Gin

Ala

Phe

Ala

Glu

Asn

Asii

-10

„ s

“1

gtc

a ca

a a a

ętt

a aa

gat

act

aat

att

ttt

cca

Lat

ac t

gęt

ęta

gtt

144

Val

Thr

hys

Val

Łys

Asp

Thr

A$n

Ile

Phe

Pro

Tyr

Th⁵'

Gly

Vai

Ve.I

c.

10

15

gct

ter

SeS

agt

ęca

act

gga

hit

gta

gtt

ęęa

asy

aat

act

att

tta

192

Ala

Piie

Lys

Ser

Ala

Thr.

Gly

Phe

val

Val

Gly

Ly»

Α5Π

Thr

Ile

Łeu

20

25

30

35

3C&

aat

11-3$

chi

ętę

tog

aaa

aat

tac

aaa

ętg

ęgc

gat

cęt

att

act.

240

Thr

Aso

Łys

Bis

Val

Ser

Lys

As π

Tyr

Lys

w.

Gly

Asp

Arg

Ile

Thr

40

45

55

gca

cat

cca

aat

aęt

gat

aaa

ęgt

aat

ggt

gęt

att

tat

tcę

at t

a aa

288

Α1ώ

His

Pro

Asa

3<*r

Aep

tys

Gly

Asa

Giy

Gly

Ile

Tyr

Ser

11 e

55

60

6$

8.ĆUJ

att

aat

tat

cca

ggt.

aa a

gria

gat

gta

tca

ętc

att

caa

gt.t

338

Lys

Ile

Asn

Tyr

Pro

Gly

Lys

Glu

Asp

Val

Ser

Val

Ile

Gin

Val

70

75

80

PL213 994B1 <210> 8 <211> 233 <21Ξ> PRT <213> artificial sequence <220>

<223> Synthetic Construct <400> 8

Met Asn Ile

Lys

Lys -25

Phe Ala

Lys

Gin Ala -20

Thr

Val

Leu

Thr

Phe -15

Thr

Ala

Leu

Ala

Gly

Ala

Thr

Gin

Ala

Phe

Ala

Glu

Asn

-10

-5

-1

1

val

Thr

Lys

val

Lys

Asp

Thr

Asn

Ile

Phe

Pro

Tyr

Thr

Gly

Val

5

10

15

Ala

Phe

Lys

Ser

Ala

Thr

Gly

Phe

Val

Gly

Lys

Asn

Thr

ile

Leu

20

25

30

35

Thr

Asn

Lys

Ala

Val

Ser

Lys

Asn

Tyr

Lys

Val

Gly

Asp

Arg

Ile

Thr

40

45

50

Ala

His

?EO

Asn

Ser

Asp

Lys

Gly

Asn

G1 y

Gly

ile

Tyr

Ser

Ile

Lys

55

60

65

Lys

Ile

He

Asn

Tyr

Pro

Gly

Lys

Glu

Asp

Val

Ser

Val

Ile

Gin

Vai

70

75

80

Glu

Arg

Ala

Ile

Glu

Arg

Gly

Pro

Lys

Gly

Phe

Asn

Phe

Asn

Asp

85

90

95

Asn

Val

Thr

Pro

Phe

Lys

Tyr

Ala

Gly

Ala

Lys

Ala

Gly

Glu

Arg

100

105

110

115

Ile

Lys

Val

Ile

Gly

Tyr

Pro

His

Pro

Tyr

Lys

Asn

Lys

Tyr

Val

Leu

120

125

13C

Tyr

Glu

Ser

Thr

Gly

Pro

val

Met

Ser

Val

Glu

Gly

Ser

ile

val

135

140

14 □

Tyr

Ser

Ala

His

Thr

Glu

Ser

Gly

Asn

Ser

Gly

Ser

Pro

Val

Leu

Asn

150

155

16C

Ser

Asn

Glu

Leu

Val

Gly

Ile

His

Phe

Ala

Ser

Asp

Val

Lys

Asn

165

170

175

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

val

Tyr

Phe

Thr

Pro

Glu

ile

Lys

180

185

190

195

Lys

Phe

Ile

Ala

Glu

Asn

Ile

Asp

Lys

200 <210> 9 <211> 02 <21Ξ> DNA <213> artificial sequence <220 <223> sekwencja kodująca białko mutanta SplB D77A z peptydem sygnalnym z B. subtilis <220 <221> COS <222> (1) . . (702)

<400

9 atc Ile

aaa Lys

aag Lys -25

ttt Phe

gca Ala

aaa Lys

caa Gin

gca Ala -20

aca Thr

gta Val

tta Leu

acc Thr

ttt Phe -15

act Thr

48

atg Met

aac Asn

acc

gca

ctg

gca

gga

ggc

gca

act

caa

get

ttt

qcc

gaa

aat

96

Thr

Ala

Leu

Ala

Gly

Ala

Thr

Gin

Ala

Phe

Ala

Glu

Asn

-10

-5

-1

1

gtc

aca

aaa

gtt

aaa

gat

act

aat

att

ttt

cca

tal

act

ggt

gta

gtu

144

val

Thr

Lys

Val

Lys

Asp

Thr

Asn

ile

Phe

Pro

Tyr

Thr

Gly

Val

PL 213 994 Β1

Asp Asp Asn Arg Asn Ala Tyr Gly Val Tyr Phe Thr Pro Glu Ile Lys

180 165 190 195

Lys Phe Ile Ala Glu Asn Ile ASp Lys

200

<210>	7
<211>	702
<212>	DNA
<2L3>	artificial secuence
<220>	sekwencja kodującą białko mutanta SplB Η39Ά z peptydem sygnalnym z B. subtills
<220> <221>	CDS
<222>	(1) .. (702)
<400>	7

atg aac

atc Ile

aaa Lys

aag Lys -25

ttt Phe

gca Al a

aaa Lys

caa Gin

gca aca gta

tta Leu

acc Thr

ttt Phe -15

act Thr

45

Met

Asn

Ala -20

Thr

Vai

acc

gca

c tg

ctg

gca

gga

ggc

gca

act

caa

gct

ttt

gcc

gaa

aat

96

Thr

Ala

Leu

Ala

Gly

Ala

Thr

Gin

Ala

Phe

Ala

Glu

Asn

-10

-5

-1

1

gtc

aca

aaa

gtt

aaa

gat

act

aat

att

ttt

cca

tat

act

ggt

gta

gtt

144

val

Thr

hys

Val

Lys

Asp

Thr

Asn

Ile

Phe

Pro

Tyr

Thr

GLy

val

Val

5

10

15

gct

ttt

aaa

agt

gca

act

gga

ttt

gta

gtt

gga

aag

aat

act

att

tta

192

Ala

Phe

Lys

Ser

Ala

Thr

Gly

Phe

val

Gly

Lys

Asn

Thr

Ile

Leu

20

25

30

35

aca

aat

a aa

gcg

gtg

tcg

aaa

aat

tac

aaa

Qtg

ggc

gat

cgt

att

act

240

Thr

Asn

Lys

Ala

Val

Ser

Lvs

Asn

Tyr

Lys

Val

Gly

Asp

Arg

ile

Thr

40

45

50

gca

cat

cca

aat

agt

gat

aaa

ggt

aat

ggt

att

lat

tcg

att

aaa

2 38

Ala

His

Pro

Asn

Ser

Asp

Lys

Gly

Asn

Gly

Ile

Tyr

5er

lic

Lys

55

60

65

aag

alt

att

aat

tat

cca

ggt

aaa

gaa

gat

gta

tca

gtc

att

caa

gtt

336

Lys

Ile

Asn

Tyr

Prc

Gly

Lys

G1U

Asp

Val

Ser

val

Ile

Gin

Val

70

75

50

gaa

gag

cgt

gca

ata

gaa

cgt

gga

cca

aaa

ggc

ttt

aat

ttt

aat

gat

384

Glu

Arg

Ala

ile

Glu

Arg

Gly

Pro

Lys

Gly

Phe

Asn

Phe

Asn

Asp

83

90

95

aat

gta

acg

cca

ttc

aaa

tat

gcg

gca

ggg

gct

aa a

gct

ggt

gag

ega

432

Asn

Val

Thr

Pro

Phe

Lys

Tyr

Ala

Gly

Ala

Lys

Ala

Gly

Glu

Arg

100

105

110

115

att

aaa

gtg

att

ggt

tat

cca

cac

cca

tac

aaa

aat

aaa

tat

gtt

tta

48C

ile

Lys

Val

Ile

Gly

Tyr

Pro

His

Pro

Tyr

Lys

Asn

Lys

Tyr

Vai

Leu

120

125

130

tat

tca

act

ggc

cct

gtg

atg

tca

gta

gaa

ggt

agc

agt

att

qta

528

Tyr

Glu

Ser

Thr

Gly

Pro

Val

Met

Ser

val

Glu

Gly

Ser

Tle

Val

135

140

145

tat

tca

gcg

cat

act

gaa

agc

gga

aac

tct

gga

tca

cct

gta

tta

aac

576

Tyr

ser

Ala

His

Thr

Glu

Ser

Gly

Asn

Ser

Gly

Ser

Pro

Val

Leu

Asn

150

155

160

agc

aac

gaa

tta

gtt

ggt

att

cat

ttt

gct

tct

gat

gta

aaa

aat

624

Ser

Asn

Glu

Leu

val

Gly

Ile

His

Phe

Ala

Ser

Asp

Val

Lys

Asn

155

170

175

gat

aac

aga

aat

gca

tat

ggc

gtc

tac

ttt

aca

cca

gaa

att

aaa

672

Asp

ASp

Asn

Arg

Asn

Ala

Tyr

Gly

Val

Tyr

Phe

Thr

FIC

Glu

Ile

Lys

180

165

190

195

aaa

ttc

att

gca

gaa

aac

ata

gat

aaa

Caa

702

Lys

Phe

Ile

Ala

Glu

Asn

ile

Asp

Lys

200

PL213 994B1 <210> 8

<211> <212> <213>	233 PRT artificial	seąuence
<220>
<223>	Synthetic	Construct
<4C0>	8

Met

Asn

Ile

Lys

Lys -25

Phe

Ala

Lys

Gin

A-l a -20

Thr

Val

Leu

Tlir

Phe -15

Thr

Ala

Leu

Ala

Gly

Ala

Thr

Gin

Ala

Phe

Ala

Glu

Asn

-10

-5

-1

¹

Va_

Thr

Lys

Val

Lys

Asp

Thr

Asn

Ile

Phe

Fro

Tyr

Thr

Gly

Val

5

10

15

Ala

Phe

Lys

Ser

Ala

Thr

Gly

Phe

Vdl

Gly

Lys

Asn

Thr

Ile

Leu

20

25

3C

35

Thr

Asn

Lys

Ala

Val

Ser

Lys

Asn

Tyr

Lys

Val

Gly

Asp

Arg

Ile

Thr

40

45

5 0

Ala

His

Pro

Asti

Ser

Asp

Lys

Gly

Asn

Gly

ile

Tyr

Ser

Ile

Lys

55

50

65

Lys

ile

Ile

Asn

Tyr

Pro

Gly

Lys

Glu

ASp

Val

Ser

Val

Ile

Gin.

Va 1

70

75

8 0

Glu

Arg

Ala

Ile

Glu

Arg

Gly

Pro

Lys

Gly

Phe

Asn

Phe

Asn

Asp

85

90

95

Asn

val

Thr

Pro

Phe

Lys

Tyr

Ala

Gly

Ala

Lys

Ala

Gly

Glu

Arg

100

105

110

l ) 5

Ile

Lys

Val

Ile

Gly

Tyr

Pro

His

Pro

Tyr

Lys

Asn

lys

yr

V=1

Leu

120

125

13 0

Tyr

Glu

Ser

Thr

Gly

Pro

Val

Met

Ser

Val

Glu

Gly

Scx

Ser

lic

Val

135

140

145

Tyr

Ser

Ala

His

Thr

Glu

Ser

Gly

Asn

Ser

Gly

Ser

Pro

Val

leu

Asn

150

15 5

160

Ser

Agn

Asn

Glu

Lcu

Val

Gly

Ile

His

Phe

Ala

Ser

Asp

Val

Lys

Asn

165

17C

175

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

Val

Tyr

Phe

Thr

Pro

Glu

Ile

Lys

180

1 35

190

195

l.ys

P?ie

Tle

Ala

Glu

Asn

Ile

ASP

Lys

200 <210> 9 <211> 702 <21Ξ> DNA <213> artificial sequer.ce <220>

<223> sekwencja kodująca białko mutanta Sp'R D77A z peptydem sygnalnym z 3. subtilis <220>

<221> CDS <222> (1)..{702)

<400> i

gca Ala - 2 0

aca Thr

gla Val

tta Leu

a cc Thr

ttt Phe -15

ar. 7. Thr

48

atg Me t

aac Asn

atc Ile

aaa Lys

aag Lys -25

ttt Ph e=

gca Al a

aaa Lys

caa Gin

acc

gca

ctg

gca

gga

ggc

gca

dC.

caa

get

ttt

gee

gaa

aat

96

Thr

Ala

Leu

Ala

Gly

Ala

Thr

Gin

Ala

Phe

Al a

Glu

Asn

-LC

-5

-1

1

gtc

ara

aa a

gt t

aaa

gat

act

a a t

at.r.

-.tr.

cca

rat

act

ggt

gta

git

144

Val

Thr

Lys

Val

Lys

Asp

Thr

Asn

Ile

Phe

Pro

Tyr

Thr

Gly

va1

val

PL 213 994 Β1

gct Ala 20

ttt aaa

agt Ser

gca Ala

act Thr 25

gga Gly

ttt Phe

gta Val

gtt Val

gga Gly 30

aag Lys

aat Asn

act. Thr

att Ile

tta Leu 35

192

Phe

Lys

aca

aat

ddd

cat

gtg

tcg

aaa

aat

tac

aaa

gtg

ggc

gat

cgt

att

act

240

Thr

Asn

Lys

His

val

Ser

Lys

Asn

Tyr

Lys

Val

Gly

Asp

Arg

Ile

Thr

40

45

50

gca

cat

cca

aat

agt

gat

aaa

ggu

aat

ggt

att

tat

tcg

att

aaa

288

Ala

His

Pro

Asn

Ser

Asp

Lys

Gly

Asn

Gly

Ile

Tyr

Ser

Ile

Lys

55

60

65

aag

att

aat

tat

cca

ggt

aaa

gaa

gcg

gta

tca

gtc

att

caa

gtt

336

Lys

Ile

Asn

Tyr

Pro

Gly

Lys

Glu

Ala

Val

Ser

val

Ile

Gin

Val

70

75

80

gaa

gag

cgt

gca

ata

gaa

cgt

gga

cca

aaa

ggc

ttt

aat

ttt

aat

gat

384

Glu

Arg

Ala

ile

C-lu

Arg

Gly

Pro

Lys

Gly

Phe

Asn

Phe

Asn

Asp

85

90

95

aat

gta

acg

cca

ttc

aaa

tat

gcg

gca

ggg

gct

aaa

gct

ggt

gag

ega

432

Asn

Val

Thr

Pro

Phe

LyS

Tyr

Ala

Gly

Ala

Lys

Ala

Gly

Glu

Arg

100

105

110

115

att

aaa

g tg

att

ggt

tat

cca

CBC

cca

tac

aaa

aat

aaa

tat

gtt

tta

480

ile

Lys

Val

Ile

Gly

Tyr

Pro

His

Pro

Tyr

Lys

Asn

Lys

Tyr

val

Leu

120

125

130

tat

gag

tca

act

ggc

cct

atg

cca

gta

gaa

gqt

agc

agt

att

gt.a

523

Tyr

Glu

Ser

Thr

Gly

Pro

val

Met

Ser

Val

Glu

Gly

Ser

Ile

Val

135

140

145

tat

tca

gcg

cat

act

gaa

agc

gga

aac

tct

gga

tca

cct

gta

tta

aac

576

Tyr

Ser

Ala

His

Thr

Glu

Ser

Gly

Asn

Ser

Gly

Ser

Pro

v_ai

Leu

Asn

150

155

160

agc

aac

gaa

tta

gtt

qgt

att

cat

ttt

gct

tct

gat

gta

aaa

aat

624

Ser

Asn

Glu

Leu

tal

Gly

Ile

His

Phe

Ala

Ser

Asp

Val

Lys

Asr.

165

170

175

gat

ga^

aac

aga

aat

gca

tat

ggc

ctc

tac

ttt

aca

cca

gaa

atu

aaa

672

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

vai

Tyr

Phe

Thr

Pro

Glu

Ile

Lys

180

155

190

195

aaa

ttc

att

gca

gaa

aac

ata

gat

aaa

taa

702

Lys

Phe

Ile

Ala

Glu

Asn

ile

Asp

T.ys

200 <210 10 <211> 233 <212> PRT <213> artificial sequen.ce <220>

<223> Synthetic Construct

<400 10

Lys

Gin

Ala -20

Thr

Val

Leu

Thr

Phe -15

Thr

Met Asn

Ile

Lys

Lys -25

Phe

Ala

Thr

Ala

Leu

Ala

Gly

Ala

Thr

C-ln

Ala

Phe

Ala

Glu

Asn

-10

-5

-1

1

Val

Thr

Lys

Val

Lys

Asp

Thr

Asn

Ile

Phe

pro

Tyr

Thr

Gly

Val

5

10

15

Ala

?he

Lys

Ser

Ala

Thr

Gly

Phe

vai

val

Gly

Lys

Asn

Thr

Ile

Leu

20

25

30

35

Thr

Asn

Lys

His

val

Ser

Lys

Asn

Tyr

Lys

Val

Gly

Asp

Arg

Ile

lhr

40

45

50

Ala

His

Pro

Asr.

Ser

Asp

Lys

Gly

Asn

Gly

Ile

Tyr

Ser

Ile

Lys

55

60

65

Lys Ile Ile Asn Tyr Pro Gly Lys Glu Ala Val Ser Val Ile Gin Val

75 80

PL213 994B1

Glu Glu Arg 85

Ala

Ile Gl.u

Arg Gly 90

Pro

Lys

Gly

Phe 95

Asn

Phe

Asn

Asp

Asn

Val

Thr

Pró

Phe

Lys

Tyr

Ala

Gly

Ala

Lys

Ala

Gly

Glu

Arg

100

105

110

115

lie

Lys

val

Ile

Gly

Tyr

Prc

His

Pro

Tyr

Lys

Asn

Lys

Tyr

Val

Leu

120

125

130

Tyr

Glu

Ser

Thr

Gly

Pro

val

Mer

Ser

Val

Glu

Gly

Ser

Ile

Val

135

140

145

Tyr

Ser

Ala

His

Thr

Glu

Ser

Gly

Asn

Ser

Gly

Ser

Pro

Val

Leu

Asn

150

155

160

Ser

Asn

Glu

Leu

Val

Gly

Ile

His

Phe

Ala

Ser

Asp

Val

Lys

Asn

165

170

175

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

val

Tyr

Phe

Thr

Pro

Glu

Ile

Lys

180

185

190

195

Lys

Phe

Ile

Ala

Glu

Asn

Ile

Asp

Lys

200 <210 11 <211> 663 <212> DNA <213> artificxal seguence <220 <223> sekwencja kodująca białko fuzujne zawierające dojrzałą sekwencję splB do której przyłączono metkę hiatydynewą i sekwencję rozpoznawaną przez splB <220>

<221> CDS <222> (1)..(663) <400 11

atg ggc

age age cat

cat His

cat His -10

cat His

cac His

age age

ggc tgg

gaa Glu

ctg Leu

46

Met

Gly

Ser -15

Ser

His

Ser

Gly -5

irp

cag

gaa

aat

gtc

a ca

aaa

gtt

aaa

gat

act

aat

att

ttt

cca

tat

96

Gir.

Glu

Asn

Val

Thr

Lys

Val

Lys

Asp

Thr

Asn

He

Phe

Pro

Tyr

-1

1

5

10

15

act

ggt

gta

gtt

get

ttt

aaa

agt

gca

act

gga

ttt

gta

gtt

gga

aag

144

Thr

Gly

Val

Alą

Phe

Lys

Ser

Ala

Thr

Gly

Phe

Val

Gly

Lys

20

25

30

aat

act

att

tta

ac:a

aat

ddd

cat

gtg

teg

aaa

aat

tac

aaa

gtg

ggr.

192

Asn

Thr

Ile

Leu

Thr

Asn

Lys

His

V<al

Ser

Lys

Asn

Tyr

Lys

Val

Gly

35

40

45

gat

cgt

ątr

act

gca

cat.

cca

aat

agt

gat

aaa

ggt

aat

ggt

att

240

Asp

Arg

Ile

Thr

Ala

His

Pro

Asn

Ser

Asp

Lys

Gly

Asn

Gly

Ile

50

55

60

tat

teg

att

aaa

aag

att

aat

tat

cca

ggt

aaa

gaa

gat

gta

tea

288

Tyr

Ser

Ile

Lys

Ile

Asn

Tyr

Pro

Gly

Lys

Glu

Asp

Val

Ser

65

70

75

gtc

att

caa

gtt

gaa

gag

cgt

gca

ata

gaa

cgt

gga

cca

aaa

ggc

ttt

336

Val

ile

Gir.

val

Glu

Arg

Ala

Ile

Glu

Arg

Gly

Pro

Lys

Gly

Phe

80

05

90

95

aat

ttt

aat

gat

aat

gta

acg

cca

ttc

aaa

tat

gcg

gca

ggg

get

aaa

384

Asn

Phe

Asn

Asp

Asn

Val

Thr

Pro

Phe

Lys

Tyr

Ala

G1 y

Ala

Lys

100

105

110

get

ggt

gag

ega

att

aaa

gtg

att

ggt

tat

cca

cac

cca

tac

aaa

aat

432

Ala

Gly

Glu

Arg

ile

Lys

Val

Ile

Gly

Tyr

Pro

His

Pro

Tyr

Lys

Asn

115

120

125

aaa

tat

gtt

tta

tat

gag

tea

act

ggc

cct

gtg

atg

lea

gta

gaa

ggt

<180

Lys

Tyr

Val

Leu

Tyr

Glu

Ser

Thr

Gly

Prc

Val

Met

Ser

Val

Glu

Gly

130

135

140

ago

agt

att

gta

tat

tea

gcg

cat

act

gaa

age

gga

aac

tet

gga

tea

528

PL 213 994 Β1

Ser

Ser 145

Ile

Val

Tyr

Ser

Ala 150

His

Thr

Glu

Ser

Gly 155

Asn

Ser

Gly

Ser

cct

gta

tta

aac

agc

aac

gaa

tta

gtt

ggt

att

cat

ttt

gct

tct

576

Pro

Val

Leu

Asn

Ser

Asn

Glu

Leu

vai

Gly

Ile

His

Phe

Ala

Ser

160

165

170

175

gat

gta

aaa

aat

gat

aac

aga

aat

gca

tat

ggc

gtc

tac

ttt

aca

624

Asp

Val

Lys

Asn

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

Val

Tyr

Phe

Thr

180

185

190

cca

gaa

att

aaa

ttc

att

gca

gaa

aac

ata

gat

aaa

663

Pro

Glu

Ile

Lys

Phe

Ile

Ala

Glu

Asn

Ile

Asp

Lys

195 200 <210> 12 <211> 221 <212> PRT <213> artifrcial seąuence <220>

<223> Synthetic Construct <400> 12

Met Gly

Ser -15

Ser

His His

His

His -10

His His

Ser

Gly Thr -5

Ala

Lys

Ala

Glu

Asn

Val

Thr

Lys

val

Lys

Asp

Thr

Asn

Ile

Phe

Pro

Tyr

-1

1

5

10

15

Thr

Gly

Val

Ala

Phe

T.ys

Ser

Ala

Thr

Gly

Phe

Val

Gly

Lys

20

25

30

Asn

Thr

Ile

Leu

Thr

Asn

Lys

His

Val

Ser

Lys

Asn

Tyr

Lys

Val

Gly

35

40

45

Asp

Arg

Ile

Thr

Ala

His

Pro

Asn

Ser

Asp

Lys

Gly

Asn

Gly

Ile

50

55

60

Tyr

Ser

Ile

Lys

Ile

Asn

Tyr

Pro

Gly

Lys

Glu

Asp

Val

Ser

65

70

75

Val

Ile

Gin

Val

Glu

Arg

Ala

Ile

Glu

Arg

Gly

Pro

Lys

Gly

Phe

80

85

90

95

Asn

Phe

Asn

Asp

Asn

Val

Thr

Pro

Phe

Lys

Tyr

Ala

Gly

Ala

Lys

100

105

110

Ala

Gly

Glu

Arg

Ile

Lys

Val

Ile

Gly

Tyr

Pro

His

Pro

Tyr

Lys

Asn

115

120

125

Lys

Tyr

val

Leu

Tyr

Glu

Ser

Thr

Gly

Pro

Val

Met

Ser

Val

Glu

Gly

130

135

140

Ser

Ile

Val

Tyr

Ser

Ala

His

Thr

Glu

Ser

Gly

Asn

Ser

Gly

Ser

145

150

155

Pro

Val

Leu

Asn

Ser

Asn

Glu

Leu

Val

Gly

He

His

Phe

Ala

Ser

160

165

170

175

Asp

Val

Lys

Asn

Asp

Asn

Arg

Asn

Ala

Tyr

Gly

Val

Tyr

Phe

Thr

180

185

190

Pro Glu Ile Lys Lys Phe Ile Ala Glu Asn Ile Asp Lys

195 200

PL213 994B1

Claims

1. Mutant proteinazy SplB, znamienny tym, że posiada sekwencję aminokwasową wybraną spośród: SEQ ID No.: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 lub SEQ ID NO: 12.

2. Mutant proteinazy według zastrz. 1, znamienny tym, że sekwencja sekrecyjna jest bakteryjną sekwencją sekrecyjną z Bacillus subtilis.

3. Sekwencja nukleotydowa kodująca mutanta proteinazy jak określono w zastrz. 1.

4. Sekwencja nukleotydowa według zastrz. 3, znamienna tym, że posiada sekwencję nukleotydową wybraną spośród: SEQ ID No.: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 lub SEQ ID NO: 11.

5. Sposób otrzymywania mutanta proteinazy SplB, znamienny tym, że:

a) w komórkach gospodarza bakteryjnego prowadzi się ekspresję białka jak określono w zastrz. 1, korzystnie kodowanego przez sekwencję nukleotydowąjak określono w zastrz. 3 albo 4, a następnie;

b) izoluje się pożądany enzym lub zawierającą go frakcję.

6. Sposób według zastrz. 5, znamienny tym, że gospodarzem bakteryjnym jest szczep Bacillus subtilis ekspresjonujący białko kodowane przez sekwencję nukleotydową przedstawioną jako SEQ ID No.: 3.

7. Sposób według zastrz. 5, znamienny tym, że w etapie b) oddziela się brzeczkę fermentacyjną od masy bakteryjnej poprzez wirowanie, białka sekrecyjne znajdujące się w pozbawionej bakterii pożywce wysala się siarczanem amonu, oddziela się wysolone białka i rozpuszcza w niewielkiej ilości roztworu buforowego i dializuje się do buforu o pH około 5,5.

8. Sposób według zastrz. 7, znamienny tym, że w etapie b) dodatkowo oczyszcza się wyizolowane białko techniką chromatografii powinowactwa, chromatografii jonowymiennej i/lub sączenia molekularnego, a ostatecznie oczyszczony preparat zagęszcza się i ewentualnie poddaje krystalizacji.