PL177635B1

PL177635B1 - Rekombinacyjny materiał genetyczny, plazmidy i mikroorganizmy zawierające ten rekombinacyjny materiał genetyczny oraz biotechnologiczny sposób syntezy biotyny

Info

Publication number: PL177635B1
Application number: PL93308301A
Authority: PL
Inventors: Olwen Birch; Johann Brass; Martin Fuhrmann; Nicholas Shaw
Original assignee: Lonza Ag
Priority date: 1992-10-02
Filing date: 1993-10-01
Publication date: 1999-12-31
Also published as: US6083712A; PL179166B1; FI117515B; ATE163198T1; EP0667909B1; JP3566287B2; CA2145400C; ES2112995T3; SK42095A3; JP3577075B2; HU219827B; FI951547A0; JP2004000283A; CZ285533B6; DE59308149D1; WO1994008023A3; CZ80995A3; EP0798384A1; WO1994008023A2; FI951547A

Abstract

1. Rekombinacyjny material genetyczny, stanowiacy fragment DNA zawierajacy geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równowazne genetyczne warianty i mutanty, zna- mienny tym, ze geny te ustawione sa w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz sa transkry bowane od wspólnego promotora. 10. Plazmid, znamienny tym, ze zawiera fragment DNA zawierajacy geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równowazne genetyczne warianty i mutanty cechujacy sie tym, ze we fragmencie DNA geny te ustawione sa w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz s a transkr y bowane od wspólnego promotora. 19. Plazmid pBO30A -15/9, taki jak zlozony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod nu- merami depozytu DSM 7246, DSM 7247 wzglednie DSM 8554 20. Plazmid pBO47, taki jak zlozony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozytu DSM 8555. 21. Mikroorganizm zawierajacy fragment DNA lub plazmid obejmujacy ten fragment DNA zawierajacy geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równowazne genetyczne warianty i mutanty, cechujacy sie tym, ze we fragmencie DNA geny te ustawione sa w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz s a transkrybowane od wspólnego promotora. 32. Mikroorganizmy E. coli XL1-Blue, E. coli BM4062 i E coli ED8767, kazdy z nich zawierajacy plazmid pBO30A-13/9, zlozone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak równiez ich genetyczne warianty i mutanty. 33. Mikroorganizm Agrobacterium/Rhizobium sp. HK4, zawierajacy plazmid pB047, zlozony pod numerem zglo- szenia DSM 8555, jak równiez jego genetyczne warianty i mutanty. 34. Biotechnologiczny sposób syntezy biotyny, w którym ulegajace przemianie materii zródlo wegla poddaje sie fermentacji do biotyny z zastosowaniem mikroorganizmu, znamienny tym, ze stosuje sie mikroorganizm zawiera- jacy fragment DNA lub plazmid obejmujacy ten fragment DNA zawierajacy geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równowazne genetyczne warianty i mutanty, cechujacy sie tym, ze we fragmencie DNA geny te ustawione sa w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz s a transkrybowane od wspólnego promotora. PL PL PL

Description

Niniejszy wynalazek dotyczy rekombinacyjnego materiału genetycznego dla ekspresji genów drogi metabolizmu biotyny enterobakterii, stanowiącego fragment DNA, wektorów i mikroorganizmów zawierających ten rekombinacyjny materiał genetyczny oraz biotechnologicznego sposobu wytwarzania biotyny przy użyciu tych mikroorganizmów'.

Biotyna (witamina H) jest ważną witaminą dla ludzi i zwierząt, której niedobór może przykładowo wywoływać łojotok, zapalenie skóry, brak apetytu i zmęczenie. Dlatego też biotyna jest przydatnym dodatkiem do żywności i paszy.

Wytwarzanie biotyny metodami syntetycznej chemii organicznej wymaga dużych nakładów i jest kosztowne. Z tego powodu coraz większe znaczenie mają sposoby biotechnologiczne, w których biotynę można zsyntetyzować z pomocą mikroorganizmów z tanich materiałów wyjściowych, takich jak glukoza.

Escherichia coli (E. coli) jest mikroorganizmem zdolnym do tego, by wychodząc z prostych źródeł węgla, takich jak gliceryna lub glukoza, zsyntetyzować biotynę (fig. 1). Geny odpowiedzialne za biosyntezę biotyny u E. coli, występują w operonie, który już sklonowano i który obejmuje pięć genów : bóoA, bioB, bioC, bioD oraz bioF (dalej określanych także jako geny bio) (Gupta i in., Gene 1:331-345; 1977). Geny te są przez obszar promotora-operatora, znajdujący się pomiędzy genami bioA i bioO, transkrybowane w dwóch różnych kierunkach. W odniesieniu do konwencjonalnej mapy genów, geny bioO, bioF, bioC oraz bioD znajdują się na prawo, a gen bioA - na lewo od obszaru promotor-operator. DNA na lewo od obszaru promotor-operator obejmuje w dół sekwencji od genu bioA, dalszy gen oznaczony jako ORFI (ORF - open reading frame, otwarta ramka odczytu), kodujący polipeptyd o 158 aminokwasach i transkrybowany wraz z genem bioA (Otsuka i in., J. Biol. Chem., 263:19577-19585; 1988). Funkcja tego genu dotąd jest nieznana. Inne szczepy rodziny enterobakterii, przykładowo z gatunku Salmonella lub Citrobacter, mają strukturę operonu biotyny analogiczną do E. coli (Shiuan i Campbell, Gene 67:203-211; 1988).

Znane są już biotechnologiczne sposoby wytwarzania biotyny, wykonywane za pomocą mikroorganizmów, transformowanych klonowanym operonem biotyny E. coli. Te sposoby realizuje się wychodząc z glukozy. EP-B-236 429 opisuje np. mikroorganizmy, transformowane operonem biotyny E. coli, przy czym organizmy gospodarza ulegają mutacji w swoim genie birAJbioR..

W EP-A-316 229 opisano mutanty E. coli, które wytwarzają mniej octanu i które również przetransformowano klonowanym operonem biotyny.

EP-A-449 724 ujawnia mikroorganizmy transformowane operonem biotyny, wykazujące dodatkowo mutacje, powodujące w następstwie mniejsze zużycie glukozy.

Z EP-A-266 240 znane jest ponadto klonowanie genu odpowiedzialnego za syntezę biotyny w Bacillus sphaericus oraz oparty na tym sposób wytwarzania biotyny. Metabolizm Oacillus sphaericus warunkuje, że ten sposób musi być realizowany wychodząc z kosztownego kwasu pimelinowego.

Wydajności, uzyskiwane według dotychczas znanych sposobów biotechnologicznych są jednak z gospodarczego punktu widzenia niezadowalające.

177 635

Celem wynalazku było zatem, dostarczenie biotechnologicznego sposobu wytwarzania biotyny, umożliwiającego wyższe wydajności biotyny i tym samym mającego większe znaczenie gospodarcze.

Zadanie to rozwiązano dzięki rekombinacyjnemu materiałowi genetycznemu dla ekspresji genów drogi metabolizmu biotyny enterobakterii, stanowiącemu fragment DNA, wektorom i mikroorganizmom zawierającym ten rekombinacyjny materiał genetyczny oraz biotechnologicznemu sposobowi wytwarzania biotyny przy użyciu tych mikroorganizmów, objętym obecnym wynalazkiem. W szczególności cel wynalazku osiągnięto przy zastosowaniu fragmentów DNA oraz wektorów, zawierających geny bioB, bioF, bioC, bioD oraz bioA lub ich funkcjonalnie równoważne genetyczne warianty i mutanty z eneterobakterii, przy czym te geny są zorganizowane w jednostkę transkrypcyjną.

Fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty według wynalazku cechuje się tym, że geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz sątranskrybowane od wspólnego promotora,

Fragment DNA według wynalazku zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter Korzystnie, fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli.

We fragmencie DNA według wynalazku, korzystnie jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.

Korzystnie również, we fragmencie DNA według wynalazku regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC

Alternatywnie, we fragmencie DNA według wynalazku, regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC

AAGCTTCTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC

Korzystnie, we fragmencie DNA według wynalazku odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).

Zgodnie z wynalazkiem we fragmencie DNA geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.

Wynalazek obejmuje również plazmid cechujący się tym, że zawiera omówiony wyżej fragment DNA według wynalazku.

Obecny wynalazek obejmuje w szczególności plazmid pBO30A-15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 i DSM 8554 oraz plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozyty DSM 8555.

Wynalazek obejmuje również mikroorganizm zawierający wyżej wskazany fragment DNA lub wyżej zdefiniowany plazmid według wynalazku.

Wynalazkiem objęte są: mikroorganizm zawierający plazmid pBO30A-15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 i DSM 8554, jak również mikroorganizm zawierający plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp.HK4 pod numerem depozytu DSM 8555.

Wynalazek obejmuje mikroorganizmy, E. coli XL1-Blue, E. coli BM4062 i, E. coli ED8767, każdy z nich zawierający plazmid pBO30A-13/9, złożone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak również ich genetyczne warianty i mutanty oraz mi177 635 kroorganizm Agrobacterium/Rhizobium sp. HK4, zawierający plazmid pBO47, złożony pod numerem zgłoszenia DSM 8555, jak również jego genetyczne warianty i mutanty.

Biotechnologiczny sposób syntezy biotyny, w którym ulegające przemianie materii źródło węgla poddaje się fermentacji do biotyny z zastosowaniem mikroorganizmu, według wynalazku polega na tym, że stosuje· się mikroorganizm zawierający fragment DNA lub plazmid obejmujący ten fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty, cechujący się tym, że we fragmencie DNA geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz sątranskrybowane od wspólnego promotora.

Korzystnie w sposobie według wynalazku jako mikroorganizm stosuje się mikroorganizm wybrany z grupy obejmującej E. coli XL1-Blue, E. coli BM4062 i E. coli ED8767, z których każdy zawiera plazmid pBO30A-I3/9, złożone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak również ich genetyczne warianty i mutanty, bądź mikroorganizm wybrany z grupy obejmującej Agrobacterium/Rhizobium sp. HK4, zawierający plazmid pBO47, złożony pod numerem zgłoszenia DSM 8555, jak również jego genetyczne warianty i mutanty.

Przez jednostkę transkrypcyjną rozumie się tu sekwencję DNA, w której geny są ustawione w kierunku transkrypcji i pod wspólną kontrolą transkrypcji są przepisywane w nieprzerwany transkrypt, przy czym sekwencja. DNA obok każdorazowych genów obejmuje także genetyczne elementy kontrolne wymagane dla ekspresji genu, takie jak promotory i miejsca wiązania rybosomów.

Przez „funkcjonalnie równoważne genetyczne warianty i mutanty” rozumie się geny, które pochodzą od genów dzikiego typu organizmów pierwotnych tzn. enterobakterii i cechują się zamianą zasad w ramach znanej degeneracji kodu genetycznego. Tego rodzaju zamiany zasad mogą być pochodzenia naturalnego lub mogą być wytworzone sztucznie, np. aby dopasować sekwencję genu do uprzywilejowanego zastosowania kodonu określonego mikroorganizmu, w którym powinna nastąpić ekspresja. Genetyczne warianty i mutanty obejmują ponadto delecje, inserty i substytucje zasad lub kodonu, które pozostawiają produkt genu o tego rodzaju zmienionej sekwencji przy zasadniczo nienaruszonej funkcji. Objęte są w szczególności sekwencje, które w zwykłych warunkach hybrydyzacji, tzn. w temperaturach między 55 i 66°C i przy 0,03 do 0,3 M zawartości soli, hybrydyzują z sekwencjami dzikiego typu, a także sekwencje, które wykazują w wysokim stopniu homologię, np. wyższą niż 70%.

Figura 1 przedstawia enzymy drogi metabolizmu biosyntezy biotyny.

Figura 2 przedstawia schemat budowy plazmidu pBO30.

Figura 3 przedstawia sekwencję plazmidu pBO30, pBO30A-9 oraz pBO30A-15 dla obszaru końca 3’ genu bioD oraz końca 5’ genu bioA (przerywane strzałki; kodon startowy bioA podkreślono, stop-kodon bioD zaznaczono kropkami) wraz z miejscami cięcia przez enzymy restrykcyjne związanymi z konstrukcją plazmidu oraz sekwencją Shine-Dalgarno (SD) genu bioA. Potencjalne struktuty „stem-loop” zaznaczono przerywanymi strzałkami.

Figura 4 przedstawia kroki zmiany sekwencji w górę sekwencji od genu bioB dla przypadku wyjścia z plazmidu pbioB::lacZ-2 dla konstrukcji ulepszonych miejsc wiązania rybosomów przy danych stosowanych miejscach cięcia enzymami restrykcyjnymi, każdorazowych sekwencjach Shine-Dalgarno (SD) oraz kodonie startowym bioB (Met). Przedstawiono sekwencje w górę sekwencji od genu bioB oraz końca 5’ genu bioB. Linie kreskowane oznaczają wstawiony oligonukleotyd 985E. Nukleotydy przekreślone powinny wedle teorii występować, nie ma ich jednak w plazmidzie pbioB:.lacZI985E oraz w wyprowadzonych z niego plazmidach pbioB::lacZl9 oraz bioB::lacZ/16, co powoduje w rezultacie utratę miejsca BamHI (BamHI). „fill-in”: uzupełnienie za pomocą polimerazy Klenowa.

Figura 5 przedstawia schemat budowy plazmidów pBO30A-15/9 oraz BO30A15/9AorfI.

Figura 6 przedstawia sekwencję DNA i aminokwasową genu kodującego w plazmidzie pBO30A-15/9 biosyntezę biotyny wraz z genetycznymi elementami kontrolnymi (SD: se8

177 635 kwencja Shine-Dalgarno). Aminokwasy przedstawione kursywą na końcu COOH genu bioD 15 przedstawiają substytucje w stosunku do sekwencji dzikiego typu genu bioD E. coli.

Figura 7 przedstawia schemat budowy plazmidu pBO74 B wychodząc z plazmidów pBO74-13 oraz pBO3; Strzałki podają położenie oraz orientację promotora tac oraz genu bio. Udział wektora plazmidów wytłuszczono. Linie przerywane przedstawiają zakres delecji genu bioB.

Na figurze 2 oraz 5 zastosowano następujące oznaczenia: A: Aatll; B: BamHI; Bg: BglII; C: Clal; E: EcoRA; H: HindIII; K: KpnI; N: Ncol; Nr: Nru:I; P: Pstl; S: Snol; Sa: Sali; Se: Ssel; Sp: SphI; Ss: SspI; oraz X: XbaI. „fill-in” uzupełnienie recesywnych końców 3’ za pomocą polimerazy Klenowa; mbn: usunięcie wystających końców 5’ - lub 3’ za pomocą nukleazy Phaseolus aureus (nukleaza mung bean); Bal31: progresywna delecja DNA egzonukleazą Bal31. Udział wektora plazmidów wytłuszczono. Za pomocą różnie zakreskowanych elementów oznaczono części plazmidów zastosowane każdorazowo w następującym po tym etapie klonowania. Strzałki podają położenie i orientację genów bio.

Aby skonstruować fragmenty DNA i wektory według niniejszego wynalazku, geny operonu biotyny najpierw celowo wyodrębnia się z chromosomu odpowiedniego mikroorganizmu, a następnie wzajemnie się łączy pod kontrolą elementów regulujących geny, takich jak promotory i miejsca wiązania rybosomów, tak by znalazły się one w jednej jednostce transkrypcyjnej. Materiałem wyjściowym do izolowania genów bio mogą być szczepy bakteryjne z rodziny enterobakterii, np. gatunku Escherichia, Salmonella lub Citrobacter. Celowo materiałem wyjściowym jest mikroorganizm gatunku Escherichia coli, który jest najlepiej scharakteryzowany.

Konstrukcja fragmentów DNA i wektorów według niniejszego wynalazku może nastąpić biorąc za punkt wyjścia np. bank genów odpowiedniego mikroorganizmu, takiego jak E. coli, z którego w znany sposób można wyodrębnić i klonować geny bio lub ich fragmenty przez hybrydyzację znaczonymi oligonukleotydami zawierającymi częściowe sekwencje genów bio. Następnie wyodrębnione i klonowane geny bio są przy pomocy znanych metod rekombinacji DNa pod kontrolą wspólnego promotora wzajemnie łączone, tak by utworzyły pojedyncząjednostkę transkrypcyjną. Celowo ustawia się geny bio w ten sposób, że gen bioA znajduje się w kierunku przeciwnym do genów bioB, bioF, bioC oraz bioD, które już są obecne w jednostce transkrypcyjnej w operonie dzikiego typu E. coli. Gen bioB koduje syntezę biotynową - kluczowy enzym całej drogi syntezy biotyny, ponieważ przemiana detiobiotyny w biotynę przy udziale syntezy biotynowej stanowi dotąd stadium określające szybkość pięcioetapowej drogi syntezy biotyny. Gen bioB jest zatem celowo pierwszym genem w obrębie jednostki transkrypcyjnej, ponieważ z powodu bliskości promotora może nastąpić optymalna ekspresja tego genu. (fig. 2, 4, 5 oraz 6).

Druga jednostka transkrypcyjna w operonie dzikiego typu biotyny E. coli, która zawiera gen bioA, obejmuje ponadto dalszy gen, ORFI, kodujący polipeptyd o 158 aminokwasach. Próby przeprowadzone z plazmidami ekspresyjnymi, w których nie było żadnego genu ORFI wykazują że gen ten w zwykłych warunkach fermentacji nie ma zasadniczego znaczenia dla biosyntezy biotyny. Nie można jednak wykluczyć, że wspomniany polipeptyd o dotychczas nieznanej funkcji w określonych warunkach także odgrywa pewną rolę w syntezie biotyny. Choć obecność genu ORFI we fragmentach DNA według niniejszego wynalazku również nie jest absolutnie niezbędna, jednostka transkrypcyjna z genami bio w celowej postaci wykonania zawiera dodatkowo także gen ORFI (fig. 2, 5 oraz 6).

We fragmentach DNA oraz wektorach według niniejszego wynalazku geny bio korzystnie nie znajdują się pod kontrolą naturalnego promotora biotyny E. coli. W znacznie większym stopniu geny bio dla polepszenia transkrypcji celowo są ustawione pod kontrolą silnego obcego promotora. Wybór promotora zależy od żądanych warunków ekspresji, np. od tego, czy pożądana jest ekspresja konstytutywna czy też indukowana, lub też od mikroorganizmu, w którym ma nastąpić ekspresja. Odpowiednimi promotorami są np. promotory P_L oraz P. fagu Lambda (por. Schauder i in., Gene 52:279-283; 1987), promotor pxylS plazmidu TOL Pseudomonas putida z sąsiednim genem regulatorem xylR (Franklin i in., J. Bacteriol. 15-4:676-685; 1983), promotor trc (Amann i in., Gene 69:301-315; 1988), promotor trp \ΊΊ 635 (Amann i in., Gene 25:167-178; 1983), promotor pdegQ z Bacillus subtilis, czynny w fazie stacjonarnej (Dahl i in., J. Bacteriol. 173: 1539-1547; 1991) oraz promotor lacUV5 (Amann i in., Gene 25:167-178; 1983). Jako promotor jest korzystnie wybrany promotor tac, hybryda z promotora trp i lacUV5 z E. coli, który można zastosować jako promotor konstytutywny lub indukowalny (Russell i Bennett, Gene 20:231-243; 1982).

Ponadto ustalono, że ekspresję genu bioA w wyżej opisanym korzystnym ustawieniu można jeszcze udoskonalić, gdy odległość między genami bioD i bioA jest możliwie najkrótsza, tzn. korzystnie jest mniejsza niż 50 bp (par zasad). Nieoczekiwanie stwierdzono, że ekspresja jest szczególnie wysoka, gdy sekwencja końca 3’ genu bioD, który koduje zakończenie COOh syntetazy detiobiotynowej (DTB), zawiera równocześnie miejsce wiązania rybosomów następującego po nim genu bioA. Korzystnie występuje równocześnie nakładanie się genów bioD i bioA. Tego rodzaju konstelację można osiągnąć, gdy podda się fuzji koniec 5’ genu bioA razem z ich miejscem wiązania rybosomów z genem bioD, tak że koniec 3’ jest podstawiony przez sekwencję z miejscem wiązania rybosomów w górę sekwencji od genu bioA i, w danym przypadku, końcem 5’ genu bioA (fig. 3 i 6; Seq ID nr: 1, 6 i 8-16). Efekt ten jest tym bardziej zaskakujący, że przy tego rodzaju fuzji zakończenie COOH syntetazy DTB można wymienić, bez utraty aktywności enzymu. Podobne nakładanie się występuje także w operonie biotyny dziekiego typu E. coli między rastrami odczytu genów bioB, bioF, bioC i bioD.

Ekspresję genu bioB można przez optymalizację miejsca wiązania rybosomów genu bioB jeszcze zwiększyć. Celowo wychodzi się tu z konstruktu, w którym gen bioB już znajduje się pod kontrolą silnego promotora, np. promotora tac. Optymalizacja miejsca wiązania rybosomów genu bioB, tzn. zmiana sekwencji Shine-Dalgarno i ich odległości od końca 5’ genu struktury, może nastąpić za pomocą zwykłych metod rekombinacji DNA. Wpływ określonego miejsca wiązania rybosomów na translację można określić w znany sposób, np. przez fuzję genu badanego z genem lacZ i następującą po tym próbę z chromogennym substratem 5-bromo-4-chloro-3-indolilo-P-D-galaktopiranozydem (X-Gal).

Fragmenty DNA obejmujące geny bio w jednostce transkrypcyjnej, można wbudować przy pomocy znanych technik rekombinacji DNA w wiele wektorów. W ten sposób otrzymano np. plazmidy pBO30A-15/9 (fig. 5 i 6, Seq ID nr: 1 i 6; przykład I.5.2) oraz pBO47 (przykład I.7). Plazmid pBO30A-15/9 złożono 28. 9. 1992 w Deutsche Sammlung fur Mikroorganismen und Zellkulturen GmbH, D-3300 Braunschweig, Mascheroderweg 1b, w E. coli XL1-Blue oraz E. coli BM4062 pod numerami zgłoszenia DSM 7246 względnie 7247, oraz

17. 9. 1993 w E. coli ED8767 pod numerem zgłoszenia DSM 8554. Plazmid pBO47 złożono 17.9. 1993 w Deutsche Sammlung fur Mikroorganismen und Zellkulturen GmbH, w Agrobacterium/Rhizobium sp HK4 pod numerem zgłoszenia DSM 8555.

Zależnie od rodzaju wybranych wektorów można poddać ekspresji geny dla enzymów drogi syntezy biotyny w różnych organizmach. Jako wektory nadają się zarówno wektory o specyficznym, jak też wektory o szerokim spektrum gospodarzy (ang. :”broad host range”). Przykładami wektorów o specyficznym spektrum gospodarzy np. dla E. coli są pBR322 (Bolivar i in., Gene 2:95-113; 1977), pUC18/19 (Yanisch-Perron i in., Gene 33:103-119; 1985), K18/19 (Pridmore, Gene 56:309-312; 1987) oraz pRA95 (można otrzymać z Nycomed Pharma AS, Hvidovre, Dania).

Jako wektory o „szerokim spektrum gospodarzy” można zastosować wszystkie wektory, które są odpowiednie dla bakterii Gram-ujemnych. Przykładami takich wektorów o „szerokim spektrum gospodarzy” są pRK290 (Ditta i in., Proc. Natl. Acad. Sci. USA 77:7347-7351: 1980), pKT240 (Bagdasarian i in., Gene 26:273-282; 1983), pochodne pRK290 jak pLAFRI (Long i in., Nature 298:485-488; 1982) oraz pRK290X (Alvarez-Morales i in., Nucl. Acid. Res. 14:4207-4227; 1986), pochodne pKT240, jak pMMB66EH (Furste i in., Gene 48: 119-131; 1986) lub pGSS33 (Sharpe, Gene 29:93-102; 1984).

Do wytwarzania szczepów produkcyjnych dla fermentacji, tzn. szczepów dla produkcji biotyny, należy fragment DNa według niniejszego wynalazku wstawić w żądane i odpowiednie dla ekspresji szczepy gospodarza. Mikroorganizmami odpowiednimi dla ekspresji genów bio, korzystnie szczepów o szerokim spektrum substratów, są np. enterobakterie, korzystnie

177 635 gatunku Escherichia lub mikroorganizmy gatunku Rhizobium, Agrobacterium, Rhizobium/Agrohacterium. Acinetobacter, Pseudomonas oraz Comamonas. Szczególnie korzystne są mikroorganizmy gatunku E. coli, Rbizobium/Agrobacterium s. HK4 (jak opisano w EP-B 158 194), Pseudomonas mendocina, Pseudomonas aeruginosa lub Acinelobacter calcoaceticus, Mikroorganizmy mogą zawierać fragment DNA według niniejszego wynalazku na cząsteczce wektora lub zintegrowany w swoim chromosomie. Wstawienie fragmentu DNA w mikroorganizmy może np. nastąpić przez transformację lub koniugację. Celowo transformuje się wybrane mikroorganizmy znanym sposobem wektorami, które zawierają fragmenty DNA według niniejszego wynalazku. Odpowiednimi szczepami produkcyjnymi są np.E.coli XL1-Blue, E. coli DM4062 i E. coli ED8767, każdorazowo zawierając plazmid pBO30A-15/9 (DSM 7246, DSM 7247 i DSM 8554) i Agrohacterium/Rhizobium sp. HK4 z plazmidem pBO47 (DSM 8555).

Wyodrębnienie transformowanych szczepów gospodarza następuje celowo z selektywnej pożywki, do której dodaje się antybiotyk, wobec którego szczepy gospodarza są odporne przez dzięki genowi markera znajdującemu się na wektorze lub fragmencie DNA.

Biotechnologiczne wytwarzanie biotyny następuje przy zastosowaniu mikroorganizmów, zawierających fragmenty DNA lub wektory według niniejszego wynalazku. Sposób wytwarzania biotyny realizuje się w zwykły sposób w kulturach wychodząc ze źródła węgla odpowiedniego jako podłoże wzrostu dla konkretnego mikroorganizmu, który ostatecznie ulega przemianie do biotyny. Jako źródło węgla odpowiednie są w szczególności proste cząsteczki cukru, np. glukoza lub gliceryna. Stosownie do tego można zastosować jako podłoże wzrostu środki występujące w handlu, jak np. Nutrient Yeast Broth (NYB: Nutrient Broth No. 2, Oxoid, 25 g/l; ekstrakt drożdżowy, Oxoid, 5 g/l) lub minimalne pożywki z gliceryną i glukozą.

Fermentacja tzn. wytwarzanie biotyny, przebiega korzystnie jako tzw. metoda „zasilanego wsadu” (ang.:”fed-batch”), tzn. w fermentacji wsadowej, do której dodaje się w sposób ciągły lub okresowo strumień objętościowy ze świeżymi składnikami, przy czym jednak nie odprowadza się żadnego roztworu z kulturami. W takiej metodzie jako „zasilanie” korzystnie stosuje się roztwór gliceryny z szybkością dopływu dopasowaną do danej ewolucji biomasy.

Fermentacja następuje w obrębie obszarów temperatury i pH odpowiednich fizjologicznie dla danych mikroorganizmów. Celowo wartość pH mieści się w zakresie od 6 do 8, a temperatura w zakresie od 20 do 45°C.

Poprzez zmianę składników w pożywce i dopasowanie warunków fermentacji do danego mikroorganizmu można w zwykły sposób wydajność biotyny jeszcze zwiększyć.

Niniejszy wynalazek zostanie objaśniony bliżej przez poniższe przykłady.

Ogólne metody:

Endonukleazy restrykcyjne zastosowano według danych producenta w ilości od 3 do 5 jednostek/pg DNA. Znaczenie i fosforylowanie linkerów DNA (uzyskanych z Boehringer Mannheim, RFN) dla wbudowywania miejsc cięcia enzymami restrykcyjnymi, i syntetycznych oligonukleotydów (uzyskanych z Microsynth, Windisch, CH), np. do zastosowania jako sondy dla hybrydyzacji DNA/DNA i jako „primer” dla reakcji sekwencjonowania, nastąpiły przy użyciu kinazy T4-polinukleotydowej (Boehringer Mannheim, RFN) według Sambrooka i in. (Molecular Cloning: A laboratory manual. 2nd edition, Cold Spring Harbour Laboratory, Cold Spring Harbour, NY; 11.31 i 5.68; 1989). Reakcje ligacji przeprowadzono przy użyciu ligazy T4-DNA według danych wytwórcy.

Sekwencjonowanie DNA przeprowadzono według metody przerwania łańcucha według Sangera i in. (Proc. Natl. Acad. Sci. USA 94:5463-5467; 1977). Wszystkie reakcje sekwencyjne przeprowadzono przy użyciu zestawu do sekwenazy z United States Biochemicals (Cleveland, OH, USA) według protokołu wytwórcy. Sekwenaza (wersja 2,0, polimeraza T7-DNA zmieniona za pomocą technik genetycznych) dała równomierne, dobrze czytelne sekwencje DNA o ponad 600 bp; Kompresje w obszarach DNA bogatych w GC można było łatwo rozwiązać, jeśli zamiast dGTP zastosowano nukleotyd dlTP. Jako matryce dla reakcji sekwencyjnej stosowano z reguły jednoniciowe postacie wektorów M13mp18/19 (YanischPerron i in., 1985, ibid.) lub pBluescript KS⁺/SK⁺ (ap^R lacZ'; można uzyskać z Stratagene,

177 635

La Jolla, CA), które wyodrębniono według (Methods Enzymol. 101:20-79: 1983). Dla sekwencjonowania dwuniciowego plazmidowego DNA, plazmidowe DNA oczyszczono za pomocą gradientów CsCl lub „Gene Clean” (BIO 101, La Jolla, CA). Jako nukleotyd znaczony radioaktywnie użyto a-[^3;,S]-dATP (NEN-Du Pont, NEG-034H). Rozdzielenie elektroforetyczne nastąpiło bądź przez typowe 4% względnie 6% żele bis/akrylamidowe z 7M mocznika oraz 1x buforem TBE (90 mM Tris, 90 mM kwasu bornego, 2,5 mM EDTA), lub przez żele z 5% HydroLink Long Ranger (AT Biochem, Malvern, PA, USA, via Chemie Brunschwig, Basel) z 7M mocznika i 1,2 x buforem TBE. Żele miały 550 mm długości i 0,2 mm grubości; elektroforeza nastąpiła w aparaturze makroforowej LKB z termostatem przy napięciu 2100 V i temperaturze 60°C. Następnie żele suszono na papierze 3 MM Whatmana i poddano autoradiografii przy użyciu filmu rentgenowskiego Fuji Rx lub Amersham Hyperfilm ()max.

Wyodrębnienie pozachromosomowego DNA wykonano bądź w małych ilościach według metody „szybkiego alkalicznego SDS” („Miniprep”) według Birnboima i Doly (Nucl. Acid. Res. 7:1513-1523; 1979), lub, dla wyodrębnienia większych ilości, przez odwirowywanie gradientów gęstości chlorku cezu według zmodyfikowanej metody Clewell i Helsinki (Proc. Natl. Acad. Sci. USA 42:1159-1166; 1969). Alternatywnie zastosowano pakiety QIAGEN Fa. DIAGEN, Dusseldorf (RFN).

Aby przekształcić E. coli plazmidem DNA, komórki uczyniono „kompetentnymi” według Cohen i in. (Proc. Natl. Acad. Sci. USA 69:2110-2114; 1972) w 50 mM CaC^. Przekształcenie DNA plazmidowego i selekcja klonów noszących plazmidy nastąpiła według Sambrooka i in., (1989; ibid. 1.82-1.84).

Przykład I. Klonowanie operona biotyny E . coli w pojedynczej jednostce transkrypcyjnej

I.1 Konstrukcja pBO1 oraz M13bioD

Dla klonowania genów bio wyodrębniono chromosomowe DNA z E. coli DSM 498 (K12 Typ dziki; Deutsche Sammlung far Mikroorganismen und Zellkulturen GmbH). Wyodrębnienie wykonano zasadniczo według Hahna i Hennecke (Mol. Gen. Genet. 193:46-52; 1984). Następnie 2 pg całkowitego DNA z E. coli DSM 498 przecięto enzymem restrykcyjnym PstI. Fragmenty DNA rozdzielono elektroforetycznie w horyzontalnym żelu agarozowym 0,7% w zwykły sposób (Sambrook i in., 1989, ibid.; 6.19 do 6.9) i przeniesiono na membrany „Gene Screen” (membrany nylonowe NEN-Du Pont) (Southern, J. Mol. Biol., 98:503-517; 1975). DNA utrwalono przez dwugodzinną inkubację w 80°C w piecu próżniowym na wususzonych filtrach. W celu identyfikacji fragmentów DNA operonem bio poddano jako sondę syntetyczny oligonukleotyd o długości 25 nukleotydów o sekwencji 5’-GGCTCACCGCCCACGCTGGACATTG-3’, odpowiadającej sekwencji z końca 5’ genu bioB (Otsuka, A. J., Dysertacja, University of California, San Diego, CA; 1978) hybrydyzacji z DNA związanym z filtrem. Następnie 40 pMoli tego oligonukleotydu z kinazą polinukleotydową T4 i ,y-[^j2P]-ATP (75pCi) znaczono na końcu. Hybrydyzację DNA związanego z radioaktywnie znaczoną sondą przeprowadzono według Sambrook i in., (1989, ibid., 9.52 -9.55). Następnie prehybrydyzowano DNA 2 godz. w 5x roztworze Denhardta (1x roztwór Denhardta: 0,02% albumina osocza krwi wołu, 0,02% Ficoll, 0,01% poliwinylopirolidon), 6x bufor SSC (1x SSC: 150 mM NaCl, 15 mM cytrynian sodowy, pH 7,2) oraz 150 pg/ml DnA ze spermy łososia, a następnie hybrydyzowano 18 godz. w 2x roztworze Denhardta, 6 x SSC , 0,5% SDS, 150 pg/ml dNa ze spermy łososia, 2 godz. przemywano i ostatecznie czterokrotnie przemyto każdorazowo 30 min. w 2x SSC, C.%() S^ITS. Temperatura podcaas wzzystkich etapów wyniosła 65°C. Znaczony oligonukleotyd hybrydyzował na tym „Southern blot” ' z fragmentem PstI o 5,4 kb.

Dla sklonowania tego fragmentu 5,4 kb PstI z operonem biotyny przecięto najpierw 50 pg całkowitego E. coli DSM 498 przy użyciu PstI i rozdzielono na żelu agarozowym 0,7% jak wyżej. Fragmenty o wielkości 4,5 kb do 6,5 kb wycięto z żelu i wyodrębniono przez elektrodializę w wężach do dializy. Około 0,6 pg tych fragmentów poddano ligacji z 0,6 pg wektora pHE3 przeciętego PstI (Hennecke i in., Gene 19:231-234; 1982). Wektor ten zawiera gen oporności na chloramfenikol (CmR, replikon ColE1 z pACYC184 (Chang i Cohen,

177 635

J. Bacteriol., 134:1141-1156; 1978) jak również gen pheS z E. coli syntetazy-tRNAfenyloalaninowej, charakteryzujący się miejscem Pstl.

0,2 ml „kompetentnych” komórek E. coli RR28 (Hennecke i in., 1982, ibid.,) w 50 mM CaCl₂ transformowano przy użyciu powyższego tworu ligacyjnego. E. coli RR28 ma w chromosomie mutowany gen pheS (pheS12) i dlatego jest oporny na p-fluorofenyloalaninę (pFphe) na podłożu wzrostu. Jeśli RR28 jest nośnikiem plazmidu pHE3 z genem dzikiego typu pheS, szczep jest wrażliwy na pFphe. Wstawienie fragmentów DNA w miejsce cięcia PstI pHE3 przerywa gen dzikiego typu pheS; stąd RR28 z rekombinowanym plazmidem jest oporny na pFphe (pFpheR. Transformowane komórki przełożono na pożywce minimalnej (7,1 g/l Na₂HPO₄, 13,6 g/l KH₂PO₄, 13,6 g/l KH₂PO₄, 0,014 g/l CaCl₂x2H₂O, 0,25 g/l MgSO₄, 1,58 g/l (NH4)₂sO4, 15 g/l agaru, 4 g/l glukozy, 0,005 g/l tiaminy, 0,05 g/l leucyny, 0,05 g/l proliny, 0,2 g/l D,L-p-fluorofenyloalaniny, 0,02 g/l chloramfenikolu; Hennecke i in., 1982, ibid.) i wyodrębniono około 2500 klonów pFphe^R CmR zawierających plazmid pHE3 (CmR z insertem w genie pheS (pFphe^R). 600 tych klonów replikowano na filtrze z nitrocelulozy, leżącym na płytkach z pożywką agarową (NA) (NA: zasada agarowa krwi (Oksoid). 40 g/l; ekstrakt drożdży (Oksoid), 5 g/l z 20 pg/ml Cm. Na filtry z wyrosłymi koloniami (3-5 mm średnicy) podziałano według procedury Grunsteina i Hognessa (Proc. Natl. Acad. Sci. USA 72:3961-3965; 1975), aby poddać komórki lizie i wiązać uwalniany DNA. Filtr z uległymi lizie i utrwalonymi komórkami E. coli poddano hybrydyzacji z wyżej opisanym oligonukleotydem bioB o 25 nukleotydach znaczonym ³²P. Hybrydyzacja nastąpiła według modyfikacji dla hybrydyzacji kolonii według Sambrooka i in., (1989, ibid., 11.00), tzn. prehybrydyzacja, hybrydyzacja i pierwsza operacja przemywania nastąpiły w 4x roztworze Denhardta, 6x SSC, 100 pg/ml DNA ze spermy łososia, po czym nastąpiło 6x przemywanie w 2x SSC. Temperatura wyniosła 65°C. 3 klony związały oligonukleotyd bioB; z jednego z tych klonów wyodrębniono plazmid pBO1 o fragmencie PstI (fig. 2) o 5,4 kb. Analizy restrykcyjne i porównanie z danymi publikowanymi (Szybalski, Szybalski, Gene 19:93-103; 1982) wykazały, że pBO1 zawierało wszystkie geny operonu biotyny z wyjątkiem bioD.

W celu klonowania genu bioD zastosowano sondę z częściami genów bioC oraz bioD, składającą się z fragmentu Sphl/Pstl z pBO1 o długości 520 bp. Fragment ten wyodrębniono z żelu agarozowego i 0,2 pg wyodrębnionego fragmentu znaczono radioaktywnie (Sambrook i in., 1989, ibid. 10.8) za pomocą translacji „Nick” polimerazz I DNA (Boehringer Mannheim, RFN; Holoenzym z E. coli; tą tzw. Polimerazę Kornberga zastosowano wraz z Dnazą I) oraz 25 pCi a-[³²P]-dATP (NEN-Du Pont, NEG-012H). Hybrydyzacja tej sondy na „Southern blot”, jak opisano powyżej, przy użyciu chromosomu fragmentu restrykcyjnego E. coli DSM 498 wytworzonego przez Sspl wykazała z jednej strony fragment Sspl o 1,6 kb znany z pBO1 z bioF i bioC, a z drugiej strony fragment Sspl o 1,1 kb z bioD i sekwencjach sąsiadującego genu uvrB (Sancar i in., Cell, 28; 523-520; 1982).

W celu klonowania fragmentu Sspl o 1,1 kb znów nałożono częściowy bank genów. 30 pg DNA E. coli DSM 498 poddano cięciu za pomocą Sspl i rozdzielono na żelu agarozowym 0,7%. Fragmenty o wielkości od 0,9 kb do 1,3 kb wycięto i wyodrębniono przez elektrodializę. 0,5 pg tych fragmentów poddano ligacji z 0,5 pg fagowektora M13mp19 ciętego Smal (Yanisch-Perron i in., 1985, ibid.). Przy użyciu tego tworu ligacyjnego nastąpiła transfekcja E. coli JM109 (Yanisch-PerrOn i in., 1985, ibid) według Messing (Methods Enzymol., 101:20-79; 1983). 150 klonów fagowych z insertem (fenotyp LacZ) wyodrębniono i namnożono w pożywce NYB. Po odwirowaniu komórek E. coli naniesiono fagi każdorazowo w 50 pl pozostałości przy użyciu aparatury Schleicher & Schuell „minifold I” jako „dot blot” na filtrze nitrocelulozowym (Schleicher & Schuell BA 85). W celu denaturacji fagów na filtry przez 5 min. podziałano buforem 0,1 M NaOH/1,5 M NaCl, a następnie zneutralizowano 0,5 M Tris-HCl, pH 7,5/2,5 M NaCl (5 min.). DNA utrwalono na filtrze przez inkubacje (2 godz.) w 80°C. Filtr, tak jak opisano (Sambrook et al., 1989, ibid., 9.52-9.55), zhybrydyzowano ze znaczonym radioaktywnie fragmentem SphI/PstI o 520 bp w 60°C. W ten sposób zidentyfikowano klon fagu M13bioD o wyżej opisanym fragmencie Sspl o 1,1 kb, zawierającym gen bioD (fig. 2).

177 635

1.2 Konstrukcja pBO2

Każdorazowo poddawano cięciu 0,5 pg plazmidu pBO1 i 0,5 pg fagu M13bioD enzymem restrykcyjnym SnoI und HindIII i poddano powtórnej ligacji. Po transformacji E. coli RR28 otrzymanym tworem ligacyjnym badano rekombinowane plazmidy za pomocą analizy restrykcyjnej. Wybrano plazmid pBO2 (fig. 2), w którym fragment SnoI/HindIII z pBO1 o około 1,5 kb, zawierający część genu bioD i niezasadnicze sekwencje wektora pHE3, jest zamieniony przez fragment SnoI/HindIII (0,95 kb) z M13bioD. Analiza wykazała, że plazmid pBO2 zawierał kompletny operon bio, tak jak E. coli, wraz z sekwencjami promotora uvrB (Sancar et al., Cell 28;523-530; 1982) w dół sekwencji od bioD.

1.3 Konstrukcja pBO3 i pBO6

Zaobserwowano, że E. coli RR28 z pBO2 na płytkach NA słabiej rośnie niż przy użyciu pBO1 i tworzy wyraźnie mniejsze kolonie. Powodem tego mogą być sekwencje uvrB w pBO2. W celu delecji tych sekwencji, 20 pg pBO2-DNA przecięto przy użyciu HindIII i umieszczono w 150 pl buforu Bal31 (600 mM NaCl, 12,5 mM MgC12, 12,5 mM CaC12, 1 mM EDTA, 20 mM Tris-HCl, pH 7,2). Następnie w celu stopniowego skracania liniowych plazmidów dodano Bal31 (z Alteromonas espejiani, Boehringer Mannheim, RFN). Po 3, 6, 9, 12 i 15 min. inkubacji w 30°C pobierano próbki każdorazowo 30 pl i reakcję Bal3\ zatrzymano przez dodanie każdorazowo 2 pl 0,5 M EGTA (kwasu etylenoglikolo-bis-(2-aminoetylo)czterooctowego, pH 7,5, a następnie ekstrakcję fenolem. Potem przeniesiono próbki do 40 pl bufora nukleazy (mung bean) z Phaseolus aureus (30 mM octanu sodowego, 50 mM NaCl, 1 mM ZnC12, 5°% gliceryny, pH 4,6) oraz podziałano nukleazą Ph^a^<^^olus aurreus (B<^oehring(er Mannheim, RFN) przez 10 min. w 37°C w celu usunięcia niesparowanych pojedynczych końców nici oraz wytworzenia końców „stępionych”.

Przy działaniu Bal31 usuwane są nie tylko sekwencje uvrB, lecz także zasadnicze sekwencje wektora pHE3. Zatem skrócone plazmidy pBO2 po działaniu nukleazą z Phaseolus aureus rozcięto EcoRI, aby usunąć część DNA wektora pHE3, skróconą przez Bal31. Następnie zregenerowano pierwotną sekwencję wektora przez ligację plazmidu pBO2, na który działano z fragmentem DNA (1,5 kb), który po cięciu BamHI, działaniu nukleazą z Phaseolus aureus oraz dalszym cięciu EcoRI wyodrębniono z pBO2 i który posiada uprzednio deletowane zasadnicze sekwencje wektora pHE3. Ponieważ wskutek tej ligacji zregenerowano w pełni oporność Cm, można rozpoznać nienaruszone plazmidy na podstawie ich właściwości:oporności przeciw Cm.

E. coli RR28 transformowano przy użyciu tworów ligacyjnych i przełożono na płytkach NA 20 pg/ml Cm. Zaobserwowano małe, powoli rosnące kolonie typowe dla przypadku BO2 oraz wielkie, normalnie rosnące kolonie. Liczba wielkich kolonii na próbkę pBO2 wzrastała wraz z trwaniem inkubacji Bal31.

Z 22 normalnie rosnących kolonii wyodrębniono plazmid DNA i zbadano za pomocą analizy restrykcyjnej i sekwencyjnej. W ten sposób otrzymano plazmidy pBO3 i pBO6, w których poddano delecji 330 bp względnie 410 bp obszaru uvrB, lecz które jednak wciąż zawierały gen bioD.

1.4 Klonowanie genów bio w jednostce transkrypcyjnej.

I.4.1. Konstrukcja pBO22: promotor tac przed bioB.

Dla wbudowania odpowiedniego promotora przed genem bioB należy usunąć niepożądany promotor dzikiego typu przed genami bioBFCD. Może to nastąpić przez cięcie za pomocą NcoI, wskutek czego równocześnie odsłania się kodon startowy genu bioB. W danym przypadku wybrano w charakterze promotora tac (Russell i Bennett, 1982, ibid.), ponieważ może on być zastosowany jako promotor konstytutywny lub indukowalny i wykazuje bardzo dobrą aktywność nie tylko w E. coli, ale również w wielu innych bakteriach Gram-ujemnych.

Fragment DNA z promotorem tac z końcami HindIII oraz BamHI uzyskano z Pharmacia-LKB (Uppsala, Szwecja) i wbudowano w plazmid pUC18 pocięty HindIII i BamHI (Yanisch-Perron i in., 1985, ibid.). W wyniku uzyskano plazmid pUC18/tac (fig. 2). 8 pg tego plazmidu cięto następnie BamHI, a dla wypełnienia recesywnych końców 3’ za pomocą polimerazy Klenowa (Polimeraza I DNA z E. coli; Boehringer Mannheim RFN) w buforze polimerazy Klenowa (20 mM Tris-HCl, pH 7,5, 10 mM MgCh, 6 mM β-merkaptoetanol) inkubowa14

177 635 no przy dodatku po 100 pM dATP, dGTP, dCTP i dTTP. Następnie wykonano drugie cięcie przy użyciu Aatll. W ten sposób, przy użyciu promotora tac, można było wyodrębnić fragment DNA o długości 0,55 kb..

Fragment 3,2 kb z genami bioB, bioF, bioC oraz końcem 5' genu bioD wyodrębniono z pBO1. Ponadto poddano cięciu 8 pg pBO1 za pomocą Ncol, a następnie dla wypełnienia recesywnych końców 3' poddano jak wyżej działaniu polimerazy Klenowa. Następnie wykonano drugie cięcie przy pomocy PstI, po czym nastąpiło wyodrębnienie żądanego fragmentu o 3,2 kb. Na koniec, 4 pg wektora pHE3 poddano cięciu przy użyciu Pstl oraz Aatll i wyodrębniono z pHE3 replikon P15A (Hennecke i in., 1982, ibid.).

Te trzy fragmenty poddano w równomolowych ilościach ligacji wystających i gładkich końców przy użyciu ligazy T4-DNA (Boehringer Mannheim, RFN), przy czym każdorazowo ligowano wystające końce PstI, przy pomocy PstI, AatII - przy pomocy AatII z gładkimi końcami BamHl i NcoI. Przy ligacji końca BamHl uzupełnionego za pomocą polimerazy Klenowa z poddanym również obróbce NcoI regeneruje się miejsca cięcia BamHl i NcoI. E. coli RR28 poddano transformacji przy użyciu uzyskanego tworu ligacyjnego i selekcjonowano na CmR DNA plazmidu transformowane przez, Cm^R zbadano za pomocą analizy restrykcyjnej. W ten sposób otrzymano plazmid pBO21 (fig. 2), w którym promotor tac znajduje się przed genem bioB. Wskutek delecji fragmentu Hindlll o 1,5 kb z pBO21, charakteryzującego się niezasadniczymi sekwencjami z wektorów plazmidów pHE3 i pUC18, otrzymano- ostatecznie pBO22 (fig. 2).

1.4.2. Konstrukcja pBO27 i pBO28.

pg pBO22 poddano cięciu za pomocą PstI, a wystający koniec PstI skrócono przez działanie nukleazą z Phaseolus aureus do gładkiego końca. Następnie poddano cięciu za pomocą Snol, i wyodrębniono otrzymany fragment DNA o 6,8 kb. Wyodrębniono fragment DNA o 0,76 kb z końcem 3' genu bioD z 5 pg pBO3 po restrykcji za pomocą Clal, dopełniono wystające końce Clal za pomocą polimerazy Klenowa i cięto przy użyciu Snol. Obydwa fragmenty DNA ligowano za pomocą ligazy T4-DNA, a następnie E. coli transformowano za pomocą tego tworu ligacyjnego. Po selekcji na chloramfenikolu otrzymano z transformantu Cm^R po analizie restrykcyjnej plazmid pBO27. Plazmid ten zawiera promotor tac wraz z genami bioB, bioF, bioC i kompletnym genem bioD w jednostce transkrypcyjnej (fig. 2).

W celu delecji miejsca cięcia BamHl w pBO27 poddano cięciu 5 pg pBO27 za pomocą BamHl, inkubowano za pomocą polimerazy Klenowa i nukleotydu dGTP jak opisano wyżej, a następnie poddano działaniu nukleazy z Phaseolus aureus. Po powtórnej ligacji tego Dna ligazą T4-DNA i transformacji E. coli DH5 (Hanahan, J. Mol. Biol. 166:557-580; 1983) otrzymano plazmid pBO28, w którym miejsce cięcia BamHl uległo delecji, podczas gdy miejsce cięcia Ncol zostało zachowane (fig. 2).

1.4.3. Konstrukcja M13bio18 oraz M13b/o 18/13

W celu usunięcia niepożądanego promotora dzikiego typu przed genem bioA najpierw wyodrębniono przez cięcie 5 pg pBO3 za pomocą Bglll oraz Kpnl fragment o 4,4 kb z genami bioB, bioF, bioA i ORFI. 0,5 pg tego fragmentu poddano ligacji z 0,5 pg wektora fagu M13mp18 ciętego za pomocą BamHl oraz Kpnl (Yanisch-Perron i in., 1985, ibid.). Po transformacji E. coli JM109 (Yanisch-Perron i in., 1985, ibid.) tym tworem ligacyjnym zidentyfikowano (według Messinga, 1983, ibid.) rekombinowane klony fagowe, które posiadały insert. Wyodrębniono dwuniciowe fagi DNA z takich klonów i zbadano za pomocą analizy restrykcyjnej. W ten sposób otrzymano fag M13bio18 z żądanym fragmentem o 4,4 kb (fig. 2).

pg dwuniciowego DNA fagu M13óio18 zlinearyzowano przez cięcie za pomocą Ncol, wprowadzono do 160 pl buforu Bal31 i następnie dodano Bal31 w celu usunięcia promotora bioA. Po 20, 40, 60, 80, 100 i 120 sekundach inkubacji w temperaturze pokojowej pobierano próbki po 25 pl i zatrzymano reakcję Bal31 przez dodanie 2 pl 0,5 M EGTA, pH

7,5 oraz ekstrakcję fenolem. Każde 3 próbki łączono i poddano cięciu za pomocą XbaI, aby usunąć geny bioB i bioF. Następnie poddano DNA działaniu polimerazy Klenowa jak wyżej, aby wystające końce 5' dopełnić do gładkich końców. Po takiej obróbce DNA poddano powtórnej ligacji, a E. coli JM109 poddano- transformacji ligowanym DNA. Z 24 klonów fagowych wyodrębniono jednoniciowy DNA (Messing, 1983, ibid.) a sekwencję DNA na końcu

177 635

5’ genu bioA zanalizowano według Sangera i in., (1977; ibid.). W ten sposób otrzymano klon fagu M13bio18/13, w którym promotor dzikiego typu przed genem bioA uległ delecji i w którym równocześnie wystęouje miejsce cięcia Sali 26 bp w górę sekwencji od genu bioA (fig. 2).

1.4.4. Konstrukcja M1 zbioDA

Aby umieścić geny bioD oraz bioA w jednostce transkrypcyjnej poddano cięciu 5 Lig plazmidu pBO6 za pomocą Sphi i Sali. Wyodrębniono otrzymany fragment DNA o długości 0,97 kb, zawierający gen bioD i 72 bp DNA w dół sekwencji od genu bioD aż do końca Sali. 2 pg M133^ziil8/1^ również p()ddano cięęiu zz pcjmocą Sphl i Sall. fragmenty DNA poddano ligacji ligaz^ą T4-DNA i za pomocą otrzymanego produktu transformowano JM109 E. coli. Z 24 rekombinowanych klonów wyodrębniono awuniciowe DNA fagu i scharakteryzowano za pomocą analizy restrykcyjnej. W ten sposób otrzymano klon M13bioDA, w którym geny bioD i bioA są oddalone o 98 bp (fig. 2).

1.4.5. Konstrukcja pBO30

Dla skonstruowania jednostki transkrypcyjnej z promotorem tac przed genami bio poddano cięciu 5 pg DNA M13óioDA za pomocą EcoRi, dla dopełnienia wystających końców EcoRi poddano działaniu polimerazy Klenowa, a następnie cięciu za pomocą Snoi. Wyodrębniono otrzymany fragment DNA o długości 2,6 kb ·z genami bioD, bioA i ORFI. 5 pg plazmidu pBO28 (fig. 2) poddano cięciu za pomocą Sali, podziałano nukleazą z Phaseolus aureus dla odłączenia wystających końców Sali, a następnie poddano cięciu za pomocą Snoi. Wyodrębniono fragment DNA o długości 6,7 kb z wektorem DNA, promotorem tac i genami bioBFC. Wyodrębniono fragmenty DNA poddano ligacji za pomocą ligazy T4-DNA i transformowano za pomocą tego tworu ligacyjnego biotyno-auksotropowy szczep E. coli SA291 (Campbell, J. Bacteriol. 112:830-839; 1972). Przez przełożenie na płytkach NA za pomocą 20 pg/ml Cm i 8 pg/ml awidyny wyselekcjonowano klony o kompletnym operonie biotyny w plazmidzie. Plazmidy z takich klonów zbadano za pomocą analizy restrykcyjnej. W ten sposób otrzymano plazmid pBO30, zawierający geny bioB, bioF, bioC, bioD i bioA oraz gen ORFI wraz z promotorem tac w jednostce transkrypcyjnej (fig. 2).

1.5. Koostitrucja plazmiddw o ulepszone cespresji geeów bio

I.5.1. Konstrukcja pBO30A-9 i pBO30A-15

W minikomórkach E. coli Ds410 (Dougan i Sheratt, Mol. Gen. Genek 353:353-360; 1977) z plazmidem pBO30 aminotransferaza DAPA kodowana przez gen bioA jest znacznie słabiej eCsprymowaóa niż inne enzymy dla syntezy biotyny. Przy próbie polepszenia ekspresji genu bioA skrócono odległość między genem bioD i genem bioA za pomocą egzonukleazy Bal3l, aby usunąć możliwe zakłócające sekwencje, takie jak „stem-loop”. Następnie 25 pg BO30 poddano cięciu za pomocą Sali i podziałano egzonukleazą Bal31 i polimerazą Klenowa, jak opisano wyżej. Przez ligację z syntetycznym olieonukleotydżm o sekwencji 5’-CGTCGACG-3’, linkerem Sali, zregenerowano miejsce cięcia Sali. Następnie DNA poddano cięciu za pomocą Sali i Snoi, i wyodrębniono fragmenty bioD o długości około 640 bp skróconych na końcu 3’. Fragmenty te poddano ligacji z fragmentem z pBO30 o 8,25 kb, wyodrębnionym po cięciu tego plazmidu za pomocą Sali i Snoi i zawierającym niezmieniony gen bioA.

Bidtynd-auksotrooowy szczep E. coli SA291 transformowano powyższym tworem ligacyjnym, aby następnie za pomocą 60 pg/ml Cm i 5 μ g/ml awidyny wyselekcjonować na płytkach NA klony z nienaruszonym genem bioD. Otrzymano 26 takich klonów, które zbadano za pomocą analizy restrykcyjnej. 8 spośród tych klonów o widocznym skróceniu obszaru w górę sekwencji od miejsca Sali scharakteryzowano dokładniej za pomocą analizy sekwencyjnej DNA. W pięciu z tych klonów były, jak tego oczekiwano, deletowane odcinki od 20 do 45 bp DNA między genem bioD i bioA. W minikomórkach E. coli klony te wywołały faktycznie zwiększoną ekspresję genu bioA o czynnik 2 w stosunku do pBO30. Przykładem plazmidu o ulepszonej ekspresji tego rodzaju jest otrzymany w ten sposób plazmid pBO30A-9 (fig. 3).

Nieoczekiwanie wyodrębniono trzy dalsze plazmidy, w których były deletowane odcinki od 70 do 90 bp DNA między genem bioD i genem bioA. Delecje sięgały także do genu struktury bioD.. Z tego wynikły: (i) każdorazowo zróżnicowany koniec cOoH syntetazy DTB bez dużej zmiany aktywności enzymu i (ii) nakładanie zmienionych genów bioD i rastru od16

177 635 czytu bioA. W ten sposób otrzymano np. plazmid pBO30A-15 z mutantem genu bioD - bioD15 (fig. 3, 5 i 6). W minikomórkach E. coli z BO30A-15 ekspresja bioA jest w porównaniu do BO30 zwiększona o czynnik 4. Sekwencja DNA obszaru bioA i wyprowadzone stąd sekwencje aminokwasów plazmidów pBO30, pBO30A-9 i pBO30A-15 przedstawiono na fig. 3 (Seq iD nr 9-16).

I.5.2. Konstnikcsa plazmidaw o ulepszonpm miej scu wiążarna rybosomów przed genem bioB

W celu polepszenia translacji genu bioB, którego ekspresja w pB030 jest wyraźnie słabsza niż np. genu bioD, zmodyfikowano sekwencję w górę sekwencji od genu bioB w pBO30, który obejmuje promotor tac i miejsce wiązania rybosomów, zawarte w klonowanym fragmencie promotora tac. Wstawiono tu syntetyczne, tzw. mieszane („mixed”) ^gonukleotydy ze zmennymi sekwencjami przed genem bioB. W celu prostego wyboru korzystnych miejsc wiązania rybosomów zastosowano próbny plazmid o translacyjnej fuzji genów bioB :: lacZ, pbioB z.lctcZ-2. poioB c -acZ-2 jeHw jzęeei wektoeai w ργοπκ^orce tam e smejs cem wiązania rybosomów i w końcu 5’ genu bioB identyczny z plazmidem pBO22 (fig. 2). W miejscu cięcia NruI o nukleotydzie 326 genu struktury bioB uległy delecji koniec 3’ genu bioB oraz pozostałe geny bio i wbudowano gen lacZ E. coli (Casadaban i in., Methods Enzymol. W0:293-308; 1983) w taki sposób, że bioB i lacZ poddano fuzji w poprawnym rastrze odczytu dla ekspresji proteiny fuzji bioB::lacZ oraz że zregenerowano miejsce cięcia NruI.

W plazmidzie pbioB:.lacZ-Z wstawiono w szeregu etapach oligonukleotyd 985E o sekwencji 5’CATGGAATCCTCCACTGATCAGTAC-3’ przed genem bioB (fig. 4). Następnie rozdzielono pbioB::lacZ za pomocą BamHI, a wystające końce BamHI dopełniono, jak opisano, za pomocą polimerazy Klenowa. W trakcie tych etapów widocznie niespecyficznie deίetkwrno resztę guaninową (G), czego następstwem była utrata miejsca cięcia BamHI w późniejszych plazmidach. Po wstawieniu linkera KpnI transformowano XL1-Blue E. coli (Bullock i in., Biotechniquet 5:376-379; 1987) za pomocą tworu ligacyjnego, i wyodrębniono plazmid bioB:.lacZ/KpnI Plazmid ten poddano częściowo cięciu za pomocą NcoI, a następnie cięciu za pomocą KpnI. Po ligacji z oligknuplekty0em 985E dopełniono drugą nić DnA za pomocą polimerazy Klenowa. Po transformacji XL1-Blue E. coli i selekcji na płytkach NA za pomocą 20 pg/ml Cm, 30 pg/ml X-Gal i 0,5 mM IPTG (izoropylotikgαlαPtozyd) wyodrębniono plazmid pbioB::lacZ/985E (fig. 4). Plazmid pbioB::lacZ/985E poddano dalszej modyfikacji, wycinając miejsce wiązania rybosomów przez restrykcję za pomocą KpnI oraz SpeI i zamieniając przez trzy różne oligonukleotydy, SD17, SD19 oraz SD>21 ffig , 4)) , Po iigajjl yyml kligonuPleotydrmi zamknięto lukę w drugiej nici przez inkubację polimerazy Klenowa. Komórki bakterii XL1-Blue E. coli transformowano za pomocą tego DNA i jak wyżej przełożono na płytkach NA za pomocą 20 pg/ml Cm, 30 pg/ml X-Gal i 0,5 mM IPTG. Wybrano 20 klonów o dobrej ekspresji proteiny fuzji bioB:.lacZ, które na tej pożywce utworzyły ciemnobiałe kolonie i zmierzono aktywność e-galaktozydazy tych klonów za pomocą próby enzymu według Millera (Experiments in Molecular Genetics, Cold Springs Harbor Laboratory, Cold Spring Harbor, N.Y., str. 352-355; 1972). Ponadto uprzednio wyhodowano szczepy E. coli z plazmidami bio::lacZ w pożywce płynnej aż do gęstości optycznej przy 600 nm (OD₆₀₀) około 0,5.

Najwyższą aktywność β-galaPtozy0αzy wykazały plazmidy pbioB::lacZ/985, pbioB:.lacZ/16 i pbioB::lacZ/9 (fig. 4), dla których aktywność e-galaktozydazy w porównaniu z pbioB::lacZ-a wzrosła o czynnik 2,1 3,4 względnie 5,9. Sekwencję DNA zoptymalizowanych miejsc wiązania rybosomów dla genów bioB w tych plazmidach określono według Sangera i in., (1997, ibid.,).

W celu wbudowania zoptymalizowanych miejsc wiązania rybosomów w jednostkę transkrypcyjną z genami bio poddano cięciu każdorazowo 5 pg plazmidów pbioB::lacZ/985E, pbioB::lacZH6 lub pbioB::lacZ/9 za pomocą ClaI i NruI i wyodrębniono fragment DNA o długości 550 bp z promotorem tac, każdorazowym miejscem cięcia rybosomów i końcem 5’ genu bioB. Równocześnie poddano cięciu 5 pg plazmidu pBO30AA(fig. 5) za pomocą ClaI i NruI i wyodrębniono fragment DNA o długości 7,7 kb. W pBO3OAA, wyprowadzonym z pBO30, uległ delecji fragment SalI/BamHI ze znaczną częścią genu bioA i zakłócającym

177 635 miejscem cięcia Nrul (fig. 5). Obydwa fragmenty poddano ligacji i wyodrębniono klony z rekombinowanymi plazmidami. W ten sposób otrzymano plazmidy pBO30AA/9, pBO30AA/16 oraz pBO30AA/985. Fig. 5 przedstawia taką konstrukcję na przykładzie pBO30AA/9 z miejscem wiązania rybosomów z pbioB::lacZ/9.

Po 2 pg plazmidów pBO30AA/9, pBO30AA/16 oraz pBO3O A/985E poddano cięciu za. pomocą Snol i Kpnl, przy czym Kpnl użyto w małej ilości, aby ciąć jedynie częściowo. Następnie wyodrębniono każdorazowo fragmenty DNA o długości 6,6 kb, zawierające wektor DNA, promotor tac, gen bioB z ulepszonym miejscem wiązania rybosomów i geny bioFC. Plazmid pBO30A-15 (4 pg) również poddano cięciu za pomocą Snol i Ncol i wyodrębniono fragment 2,8 kb z genami bioDA-ORFI. Wyodrębnione fragmenty poddano ligacji i RR28 E. coli poddano transformacji tą mieszanką ligacyjną. Rekombinowane plazmidy z kompletnym operonem biotyny zidentyfikowano przez analizę restrykcyjną. W ten sposób otrzymano plazmidy pBO30-15/9, pBO30A-15/16 oraz pBO30A-15/985E. Zawierały one wszystkie zoptymalizowany obszar bioDA z pBO30A-15 z odpowiadającymi zoptymalizowanymi miejscami wiązania rybosomów z plazmidów pbioB::lacZ/9, pbioB::lacZ/l6 względnie pbioB::lacZ/9S5E. Genetyczne elementy kontrolne tych plazmidów, mianowicie kombinacja z promotora tac i zoptymalizowanego miejsca wiązania rybosomów, które są bezpośrednio powiązane z genem bioB i oddziałują na jego skuteczną ekspresję, wykazują następujące sekwencje:

pBO30A-15/985E (Seq ID nr: 17)

5’-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC-3’ pBO30A-15/16 (Seq ID nr: 18)

5’-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC-3’ pBO30A-15/9 (Seq ID nr: 19)

5’-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC-3’

Figura 5 przedstawia konstrukcję plazmidów zawierających geny bioB, bioF, bioC, bioD i bioA wraz ze zoptymalizowanym miejscem wiązania rybosomu, na przykładzie konstrukcji pBO30A-15/9.

Zsekwencjonowano całą jednostkę transkrypcyjną genów bio w BO30A-15/9. Sekwencję i wyprowadzone z niej produkty genowe przedstawiono na fig. 6 (Seq ID nr: 1-8)

1.6. Konstrukcja pBO30A-15/9AorfI pg plazmipu pBO3 0ΔΑ/9 pAddano cięciu jakwyżej w pomocą Snol i Kpnl i wyodrębniono fragment DNA o długości 6,6 kb. 4 pg plazmidu pBO30A-15 poddano cięciu za pomocą Sspl. Przez ligację otrzymanego liniowego DNA z linkerem Kpnl o sekwencji 5’-CGGTACCG-3’ dodano w dół sekwencji od genu bioA nowe miejsce Kpnl. Po cięciu za pomocą Snol wyodrębniono fragment o 2,1 kb z genami bioDA. Wyodrębnione fragmenty DNA poddano ligacji i RR28 E. coli transformowano otrzymaną mieszanką ligacyjną. Rekombinowane plazmidy z genami bioBFCDA zidentyfikowano przez analizę restrykcyjną W ten sposób otrzymano BO30A-15/9 orfl z delecjągenu ORFI (fig. 5).

1.7. Konstrukcja plazmidu pBO47 pg plazmidu pBO30A-15/9 poddano cięciu enzymami restrykcyjnymi Xbal i EcoRl. Otrzymany fragment restrykcyjny o 5,8 kb z promotorem tac i operonem biotyny wyodrębniono, a następnie poddano ligacji z plazmidem pRK290X o „szerokim spektrum gospodarzy” (Alvarez-Murcles i in., Nucl. Acid. Res. 14, 4207-4227, 1986; zmodyfikowany przez delecję miejsca restrykcyjnego Xhol i dodanie miejsca Xbal w tej samej pozycji), który również poddano cięciu Xbal i EcoRl. S17-1 (Simon i in., Biotechnology 1:784-791; 1983) E. coli transformowano tworem ligacyjnym. Rekombinowane plazmidy scharakteryzowano przez analizę restrykcyjną; W ten sposób otrzymano plazmid pBO47, zawierający operon biotyny wcielolny w pRK290X.

Przez koniugację ze szczepem E. coli S17-1/pBO47 plazmid pBO47 przeniesniono do szczepów bakteryjnych Rhizobium/Agrobacterium sp. HK4, Pseudomonas mondocina, Pseu18

177 635 domonas aeruginosa PA01 (Holloway, J. Gen. Microbiol. 13:572-581; 1955) i Acinetobacter calcoaceticus DSM 588.

I. 8. Konstrukcja pBO74AB

Konstrukcji plazmidu pBO74AB z delecją genu bioB dokonano wychodząc z plazmidu pBO74-13 (fig. 7). Plazmid pBO74-13 składa się z równych elementów DNA, jak pBO30 (fig. 2). Następstwo w szeregu genów bio w obrębie plazmidu pBO74-13 jest jednak różne.

pg plazmidu pBO74-13 poddano cięciu za pomocą Smal. Po ekstrakcji fenolem/chloroformem DNA plazmidu poddano cięciu za pomocą SphI i wyodrębniono fragment o 6 kb zawierający DNA wektora, promotor tac, geny bioA-ORFI oraz bioCD. 18 pg plazmidu pBO3 (fig. 2) poddano cięciu za pomocą SspI i SphI i wyodrębniono fragment 1,66 kb z genem bioF i częścią genu bioC. Wyodrębnione fragmenty poddano wzajemnej ligacji i RR28 E. coli transformowano za pomocą otrzymanej . mieszanki ligacyjnej. Rekombinowane plazmidy zanalizowano za pomocą analizy restrykcyjnej. W ten sposób otrzymano plazmid pBO74AB, różniący się od plazmidu pBO74-13 delecją genu bioB (fig. 7).

Przykład II

Fermentacja biotynowa in vivo

II. I Fermentacja biotynowa in vivo ze szczepami produkcyjnymi Escherichia coli.

Komórki szczepu XL1-Blue E. coli z pBO30A-15/9 (DSM 7246) hodowano przy użyciu fermentatora MBR (20 1. w pożywce minimalne. z giiceiyną (3% giiu^cryup·· pazy zapoczątkowaniu kultury) metodą „fed batch”) przez 30 godz. w 37°C aż do gęstości optycznej przy 650 nm (OD₆5₀) 20. Obecność plazmidu pBO30A-15/9 potwierdzono przez dodanie chloramfenikolu (50 pg/ml) do wstępnej kultury (3 l pożywki minimalnej zaw. glicerynę) i w fazie fermentacji wsadowej. Zastosowanie innych źródeł węgla, takich jak glukoza lub bursztynian (0,4% na początku fazy fermentacji wsadowej) również wchodzi w rachubę. Aktywność metaboliczną komórek śledzono poprzez ich specyficzną szybkość pobierania tlenu. Produkcję biotyny podczas fermentacji obserwowano przez miareczkowanie biotyny w pożywce fermentatora próbą bio za pomocą Lactobacillus plantarum (E. DeMoll i W. Shive, Anal. Chem. 158:55-58, 1986). Źródło węgla, w tym przypadku 50% roztwór gliceryny w demineralizowanej wodzie, dostarczano ze zmienną szybkością dopływu, stosownie do ewolucji biomasy. Za podstawę dla szybkości zasilania przyjęto dla gliceryny empiryczną wartość 2 g gliceryny na 1 litr kultury dla wzrostu OD od 1 do 2.

Wartość pH fermentatora doprowadzono automatycznie do pH 7 za pomocą dopompowywania 40% H₃PO₄ względnie 25% NH₃. Wentylację regulowano przez nadmuchiwanie 10 -25 NL/min. powietrza i obracanie mieszadła z prędkością 300-70 obr./min. stosownie do danej ewolucji biomasy. Dążono do nasycenia tlenem między 15 a 40%. Zawartość tlenu i CO₃ w powietrzu wychodzącym mierzono paramagnetycznie względnie za pomocą podczerwieni. Temperaturę fermentatora ustalono na 37°C. W 37°C kultura rosła przy czasie podwajania 2,5 godz. do wartości OD650 20, a następnie osiągnęła stan stacjonarny.

Podczas fermentacji nagromadziło się wciągu 25 godz 35 mg/l D(+)-biotyny. U szczepów E. coli można osiągnąć znaczącą syntezę biotyny jedynie w kulturach rosnących.

Dalszymi odpowiednimi szczepami produkcyjnymi okazały się E. coli ED8767 (N. E. Murray i in., Mol. Gen. Genet. 150:53-61; 1975) z pBO30A-15/9 (DSM 8554) lub E. coli BM4062 (D. F. Barker i A. M. Campbell, J. Bacteriol. 143:789-800; 1980) z pBO30A-15/9 (DSM 7247).

W podobny sposób zbadano plazmidy pBO3, pBO30 i pBO30A-15/9AORFI i określono produktywność biotyny. Poniższa tabela 1 uwidacznia silne polepszenie produktywności biotyny szczepów z plazmidami pBO30, pBO30A-15/9 i pBO30A-15/9AORFI, posiadającymi geny bio w jednostce transkrypcyjnej, w porównaniu do E. coli S17-1 (Typ dziki, geny biotyny w chromosomie) i E. coli S17-1/pBO3 (geny biotyny na plazmidzie, jednak rozbieżna transkrypcja jak w operonie dzikiego typu). Badania wykazują ponadto, że brak genu ORFI nie ma żadnego wpływu na produktywność biotyny.

177 635

Tabela 1

Szczep	Produktywność biotyny pmoli/min x 10⁹ komórek
E. coli S17-1	0,01 -	0,02
E. coli S17—1/pBO3	0,02 -	0,04
E. coli BM 4062/pBO30	3,0 -	5,0
E. coli XL1 Blue/pBO30A-15/9	10,0 -	20,0
E. coli BM 4062/pBO30A-15/9ńORFI	10,0 -	20,0
Wsadowa minimalna pożywka glicer¹	ynowa (w demineralizowanej H2O)
Gliceryna	30	g/l
MgCl2 x 6H2O	0,8	g/l
CaCl 2	0,16	g/l
(NH4)2SO4	2,0	g/l
Elementy śladowe SLF^a)	1,0	ml/l
Fe-EDTA ^b	1,5	ml/l
PPG-2000	0,1	g/l
KH2PO4	1	g/l
K₂HPO4	1	g/l
Na₂HPO4	1	g/l
Tiamina	1	g/l
Chloramfenikol	50	mg/l
IPTG	0,5	mM
a) Roztwór elementów śladowych S	LF (w demineralizowanej H2O)
KOH	15	g/l
EDTA-Na₂ x 2H₂O	100	g/l
ZnSO4 x 7H₂O	9	g/l
MnCl₂ x 4H₂O	4	g/l
H3BO3	2,7	g/l
CoCl₂ x 6H₂O	1,8	g/l
CuCl₂ x 2H₂O	1,5	g/l
NiCl₂ x 6H₂O	0,18	g/l
Na2MoO4 x 2H2O	0,2	g/l
b) Roztwór Fe-EDTA (w demineralizowanej H2O)
EDTA Na₂ x 2H2O	50	g/l
FeSO4 x 7H2O	20	g/l
KOH	10	g/l

177 635

Uzupełnienia w postaci antybiotyków: (stężenia końcowe)

100 pg/ml ampicyliny (sól sodowa, Fluka) oraz 50 pg/ml chloramfenikolu (Fluka)

II.2. Fermentacja ϋοΙνηοχνΗ no vivo zv pomocą szczepu piOdukcojnego IlKoipl3O47 Agrobacterium/Rhizobium.

Komórki biotyno-auksotropowago Agrobacterium/Rhizobium sp. HK4 z plazmidem produkcji biotyny pBO47 (DSM 8555) hodowano w farmantatcrza MBR (2 l) w pożywce minimalnej (kwas L-glutaminowy/betaina) metodą „fed batch” w 30°C do uzyskania OD₆₅₀70. HK4/pBO47 charakteryzuje się godną odnotowania stabilną szybkością syntezy biotyny, także przy skrajnie wolnym wzroście („maintenanοa growth”). Dlatego w tym doświadczeniu dołączono po fazie ewolucji biomasy długą fazę utrzymywania (500 godz.) przy silnie zmniejszonym zasilaniu źródłem węgla.

Po fazie wzrostu wykładniczego i osiągnięciu OD650 12, dodano zasilanie w postaci glukozy i betainy (360 g/l glukozy + 103 g/l betainy rozpuszczone w demineralizowanaj wodzie); Dozowano powoli (1,5 ml/godz.), aby umożliwić długotrwały powolny wzrost względnie „maintenance growth”. Do osiągnięcia 150 godz. zasilano dodatkowo glukonianem Fe2⁺do stężenia końcowego 100 mg/l w fermentatorze. Do osiągnięcia odpowiednio 200, 360 i 550 godz. zasilano dodatkowo 10 ml roztworu soli i 1,36 ml standardowego roztworu witaminy.

Wartość pH fermenta-tora automatycznie doprowadzono do wartości 7 przez dopompowywanie 85% roztworu kwasu fosforowego względnie 3M ługu potasowego. Wentylację regulowano przez nadmuchiwanie 1-3 NL/min. powietrza i obracanie mieszadła z prędkością 300-1000 obr./min. stosownie do danej ewolucji biomasy, tak by zapewnić ilość tlenu 14 mg/l. Tercperattlrę fermenIatoca us^ttalono na 30°C. Kullura rco^la w fazie wznosu wykładniczego przy czasie podwajania 5,6 godz., w fazie z silnie ograniczonym zasilaniem przy czasie podwajania 300 godz., a następnie przeszła do „maintenance growth”.

Przy stracie fermantacji, po 200 godz. i po 415 godz. dodano do kultury kwas dwuamincpalargcnowy (DAPA; dwukrotnie do końcowego stężenia 200 pg/ml, w końcu do końcowego stężenia 100 pg/ml). HK4 jest sam biotyno-auksotropowy. Szczep był zdolny wytworzyć z poprzednika biotyny DAPA detiobiotynę, a tę ostatecznie przetworzyć z dużą wydajnością w D(+)-biotynę. Zgromadzono 110 mg/l D(+)-biotyny. Warte odnotowania jest przy tytm że syntezę tą w przeważającym stopniu wykonały komórki niarcsnąοe.

Minimalna pożywka kwas glutaminowy/betaina
W 1,25 l	demineralizowanej wody rozpuszczono względnie do niej dodano
31,25 g	soli jednosodowej kwasu L-glutaminowego x H₂O
12,5 g	betainy
0,2 g	CaCl2
1,0 g	MgCl2 x 6H,O
1,25 g	K₂SO4
1,25 ml	elementów śladowych SLF (przykład II.1)
1,87 ml	Fe-EDTA (przykład II.1)
0,25 ml	tetracykliny (10 mg/ml w 70% etanolu)
Roztwór soli
0,03 g	CaCl₂
0,16 g	MgCl2 x 6H₂O
0,2 g	K₂SO4
200 pl	SLF (przykład II.1)
300 pl	HCl stęż.

(rozpuszczono w 10 ml daminaralizcwanej H₂O)

Standardowy roztwór witaminy (w demineralizcwanaj HO) 10 mg/l chlorowodorek pirydoksalu mg/l ryboflawiny

177 635 mg/1 amidu kwasu nikotynowego 5 mg/1 chlorowodorku tiaminy 2 mg/1 biotyny mg/1 kwasu pantotenowego 5 mg/1 kwasu 4-aminobenzoesowego 2 mg/1 kwasu foliowego mg/1 witaminy B12

ZESTAWIENIE SEKWENCJI (1) INFORMACJA OGÓLNA:

(i) ZGŁASZAJĄCY:

(A) NAZWA: LONZA AG (B) ULICA: Muenchensteinerstrasse 38 (C) MIEJSCOWOŚĆ: Basel (E) KRAJ: Szwajcaria (F) KOD POCZTOWY: 4002 (ii) TYTUŁ ZGŁOSZENIA: Biotechnologiczny sposób wytwarzania biotyny (iii) LICZBA SEKWENCJI: 19 (iv) POSTAĆ CZYTANA PRZEZ KOMPUTER:

(A) NOŚNIK: Floppy disk (B) KOMPUTER: kompatybilny z IBM PC (C) SYSTEM OPERACYJNY: PC/DOS/MS-DOS (D) OPROGRAMOWANIE: Patentln Release 1.0, Version 1.25 (EPA) (vi) POPRZEDNIE DATY ZGŁOSZENIA:

(A) NUMER ZGŁOSZENIA: CH 3124/92 (B) DATA ZGŁOSZENIA: 02-10-1992 (vi) POPRZEDNIE DATY ZGŁOSZENIA:

(A) NUMER ZGŁOSZENIA: CH 2134/93 (B) DATA ZGŁOSZENIA: 15-07-1993 (2) INFORMACJA O SEQ ID Nr: 1:

(i) CHARAKTERYSTYKA SEKWENCJI:

(A) DłUGOŚĆ: 5872 par zasad (B) RODZAJ: Kwas nukleinowy (C) POSTAĆ NICI: Podwójna (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: DNS (genomowa) (iii) HIPOTETYCZNOŚĆ: NIE (iii) ANTYSENSOWNOŚĆ: Nie (vi) PIERWOTNE POCHODZENIE:

(A) ORGANIZM: Escherichia coli (B) SZCZEP: D5T1498 (vii) BEZPOŚREDNIE POCHODZENIE:

(B) KLON: p8O3O A-15/9 (ix) CECHY:

(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 117..1157 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /codon_start= 117 /product=„biotin synthase” /evidence=EXPERIMENTAL /gene= „bioB” /number= 1

177 635 (ix) CECHY:

(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 2295..3050 (D) POZOSTAŁE DANE: /codon_start= 2295 /function= „involved in pimeloyl-CoA synthesis” /product= „protein” /gene= „bioC” /number= 3 (ix) CECHY:

(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 3750..5039 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /codon_start= 3750 /EC number= 2.6.1.62 /product= „DAPA synthase” /evidence= EXPERIMENTAL /gene= „bioA” /number= 5 /standard_name= „S-Adenosyl-L-methionine:8-amino-7-oxononaoate aminotransf.’ (ix) CECHY:

(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 5098..5574 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /codon_start= 5098 /function= „unknown, involved in biotin synthesis” /product= „protein” /evidence= EXPERIMENTAL /gene= „ORFI” /number= 6 (ix) CECHY (A) NAZWA/KLUCZ: -10_signal (B) POŁOŻENIE: 45..49 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE:

/evidence= EXPERIMENTAL /standard_name= „promoter ptac” (ix) CECHY (A) NAZWA/KLUCZ: -35_signal (B) POŁOŻENIE: 23..28 (D) POZOSTAŁE DANE:

/standard name= „promoter ptac” (ix) CECHY (A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 105..119 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE:

/evidence= EXPERIMENTAL /standard name= „bioB RBS no.9” (ix) CECHY (A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 2284..2297 (D) PCO^^(O^'L/\ DANE:

/standard name= „bioC RBS’’ i (ix) CECHY (A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 3742..3752 (D) POZOSTAŁE DANE: //sandard name= „bioA RBS”

177 635 (ix) CECHY (A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 5088..5100 (D) POZOSTAŁE DANE: /standard name= „ORFI RBS” (ix) CECHY (A) NAZWA/KLUCZ: terminator (B) POŁOŻENIE: 5583..5644 (D) POZOSTAŁE DANE: /stcndcrC name= „rho-independent transcriptional terminator” (ix) CECHY (A) NAZWA/KLUCZ: stemjoop (B) POŁOŻENIE: 5583..5605 (ix) CECHY:

(A) NAZWA/KLUCZ: promotor (B) POŁOŻENIE: 1..96 (c) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /function= „promoter ptac” /evidence= EXPERIMENTAL (x) INFORMACJA DOT. OPUBLIKOWANIA:

(H) NUMER DOKUMENTU: WO 87/01391 B1 (I) DATA ZGŁOSZENIA: 26-08-1986 (J) DZIEŃ OPUBLIKOWANIA: 07-04-1993 (xi) OPIS SEKWENCJI SEQ ID Nr: 1:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

116

164

212

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC

ATG GCT Met Ala 1

CAC Hi £5

CCG AAg

CCA CCG Cro CAg 5

TGG Trp

ACC. TTr

TTG TCG CC GTC ACA GAA. TTA

TTT Phe

Leu

Ser 10

Gin Val

Thr

Glu

Leu 15

GAA

AAA

CCG

TTT

CCG

GGA

CTG

CCT

TTT

GAA

GCG

CAG

gtg

CAT

CGC

Glu

Lys

Pro

LLe

Ceu

Aap

Leu

Llu

Phe

Glu

Ala

Gin

Gln

Val

His

Arg

20

25

30

CAG CAT TTC GAT CCC CGT CAG GG^Gt CAG GTC AGC ACG TTG CTG TCG ATT

260

177 635

Gln His

Phe 35

Asp

Pro Arg

Gln

VaU 44

Gln Val

eer Thr

Leu 415

Leu eer

lle

AAG

ACC

Gd

TCT

CCG

GGA

CG.T

Cd

GAA

TTA

CCG

CAA

Ad

CCA

308

Lys

Thr

Gly

Ala

Cys

Pro

du

AAs

Cy-s

Cye

(Cr

CCS

Pro

Gln

Ser

Cer

50

55

60

CGC

TAC

A2AA

ACC

(GA

CTC

GGA

(GC

CGA»

Cd

TTG

(AT

dA

GTT

GGA

CCA

356

Arg

Tyr

Lys

Thr

Gly

Leu

Glu

Ala

CAC_^

(Arg

Lee

Glu

Val

du

dn

65

77

75

80

GTG

CTG

GACA

TCG

GCG

Cd

(AA

(^GZCA

(AA

CGC

GCA

(AA

TCG

ACG

Cd

CTC

404

Val

Leu

Glu

Ser

CAL a

(Arg

Lys

Ala

(Lys

(Aa

AA a

du

ser

Thr

GAg

CPh

85

90

95

TGT

ATG

GGC

GCG

CAG

Td

CAG

(AT

CCC

cca

CGA

CCG

dT

ATG

CCC

CT^A

452

Cys

Met

Gly

Ala

Τη?

Lys

(An

(Po

(Hi

du

«o

Asp

Met

Ρρό

CTr

100

105

110

CTG

GAA

CGA

ATC

GTC

CAG

cm

GTA

(AA

CGC

(ATC

Gf G CTG GAG GCG TGT

500

Leu

Glu

Val

Gin

Gly

Val

Cyy

(Aa

Lee

Gly

Leu

Glu

Ala

Cys

115

120

125

ATG

ACG

CTG

dC

ACG

TTG

AGT

(GA

TCT

CCA

GCG

GCA

CGC

CTC

GGG

(AA

548

Met

Thr

Leu

Gly

Thr

Leu

See

de

Cee

dn

Ala

du

Arg

Leu

AA a

«π

130

115

140

GCC

GGG

CTC

GAT

TAA

(AC

CCA

(AA

CC^^

LGA

CAC

TCG

CCG

GGA

ctt

596

Ala

Gly

Leu

Asp

C^r

(tyr

Asn

(^j.E(

Asn

Ceu

AAs

CTr

Ser

Pro

du

CPh

145

115

155

160

TAC

GGC

GAT

ATC

ACC

ACC.

CGC

(ACC?

CTA

CCG

CGA

CGC

CTC

GG.A

AAC

644

Tyr

Gly

Asn

Ile

Thr

(Arg

TTh

(Cr

Gln

de

Arg

Leu

AAs>

CTh

165

170

175

CTG

GAA

GkGA

gtc

CGC

dT

GCC

(GA

CAC

(AA

(GC

TGT

TCT

GGC

ATT

690

Leu

Glu

Lys

Val

(Arg

Asp

(A^a

Gly

Cle

Cys

Lvl

Cys

eer

Gly

Ile

180

185

190

177 635

GTG Val

GGC Gly

TTA GGC Leu Gly 195

GAA ACG Glu Thr

6 TA Val

AAA GAT CGC GCC GGA TTA TTG CTT TTA<

740

Lys 200

Asp

CArg

Ala Gly

Leu Leu 205

Tet

iGu

CTG

GCA

AAC

CTC

CCG

ACG

CCG

GGCT

agt

GTG

CCC

ATC

CAAC

ATG

CTC

799

Leu

Ala

Asn

Leu

Pro

Thr

Pro

Glu

Sse

Val

Pro

Ile

Asn

Met

ILU

210

215

220

GTG

AAG

GTG

GACA

GGC

ACG

CCG

CTTP

GCC

AGAT

AAC

GAT

GGA

CTC

ATC

g:c

836

Val

Lys

Val

Lys

Gly

Thr

Pro

Leu

Ala

Asp

Asn

Asp

AAp

Tal

ASJ)

ACu

225

230

235

240

TTT

GAT

TTT

ATT

CGC

ACC

ATT

GCG

GTC

GCG

CTG

ATC

ATG

TCA

acc

8884

Pht

Asp

Phe

Ile

Arg

Thr

Ile

Ala

Val

Ala

Arg

Ile

Met

Aet

Cpo

CTh

245

250

255

TCT

TAC

GTG

CGC

CTT

TCT

GCC

GGA

CGC

<GG

CAG

ATG

GAAC

AGA

TGC

acc

932

Ser

Tyr

Val

GAg

Leu

Ser

Ala

Gly

CCrg

GCu

Gln

Met

Ass

CGu

tCu

iTh

260

265

270

CAG

GCG

ATG

TGC

TTT

ATG

GCA

GGC

GCA

CAAC

TCG

ATT

TTC

CGT

TTC

990

Gln

Ala

Met

Cys

Phe

Met

Ala

Gly

Ala

Asn

Ser

Ile

PPh

CTy

CGu

ICS

275

280

228 5

AAA

CTG

ACC

ACG

CCG

AAT

CCG

GGCT

GGAA

GAT

AAA

GGAC

CTC

IGA

ATT

1028

Lys

Leu

Thr

Pro

Asn

Pro

Glu

Gili

Asp

Lys

GAs

Aeu

CGn

Aeu

290

295

300

TTC

CGC

AAA

CTG

GGG

CTA

AAT

CCG

CAG

CGAA

CCT

GCC

GTC

CTC

CCC

TTG

1076

Phe

Arg

Lys

Leu

Gly

Leu

Asn

Gin

GCu

Thr

Ala

Val

leu

AC u

TCu

305

310

315

320

GAT

AAC

GAJA

CAA

CAG

CAA

CGT

CTTT

AGAT

CCG

GCG

CTG

AST

AAC

CCG

TTC

1124

Asp

Asn

Glu

Gin

is-g

Leu

Glu

GCu

Ala

Leu

Met

CTi-

Cpo

Ass

325 330 335

ACC GAC GAA TAT TAC AAC GCG GCC GCA TTA TGAGCTGGCA GGAGAAAATC

1174

177 635

Thr Asp Glu Tyr Tyr Asn Ala Ala Ala Leu 340 345

AACGCGGCGC	TCGATGCGCG	GCGTGCTGCC	GATGCCCTGC	GTCGCCGTTA	TCCCGJTCGSCG
CAAGGAGCCG	GACGCTGGCT	GGTGGCGGAT	GATCGCCAGT	ATCTGTG.CTT	TTCCAGGTA.C
GATTATTTAG	GTTTAAGCCA	TCATCCGCAA	ATTATCCGTG	CCTGGCGCAA	agcggccgag
CAATTTGGCA	TCGGTAGCGG	CGGCTCCGGT	CACGTCAGCG	GTTATAGCGT	(GSTfGCTCAG
GCACTGGAAG	AAGAGCTGGC	CGAGTGGCTT	GGCTATTCGC	GtGJCACTCTT	(GTTATCTCT
GGTTTCGCCG	CTAATCAGGC	AGTTATTGCC	GCGATGATGG	CGCGAGACA	ccgtattgct
GCCGACCGGC	TTAGCCATGC	CTCATTGCTG	GAAGCTGCCA	GTTTJTGCCC	GTCGCCGCTT
CGCCGTTTTG	CTCATAACGA	TGTCACTCAT	TTGGCGCGAT	tgcttgcttc	CCCCTCTCCG
GGGCAGCAAA	TGGTGGTGAC	AGAAGGCGTG	TTCAGCATGG	ACCCTCGATAG	ttgzgccactg
GCGGAAATCC	AGCAGGTAAC	GCAACAGCAC	AATGGCTGGT	TGATCTTTCGA	TGATGCCCC
GGCACGGGCG	TTATCGGGGA	GCAGGGGCGC	GGCAGCTGCT	GGCTGCGCAAA	TG5TCTATTCCA
GAATTGCTGG	TAGTGACTTT	TGGCAAAGGA	TTTGGCGTCA	GCGCGG5CAGC	CG»TGCTTTGC
TCCAGTACGG	TGGCGGATTA	TCTGCTGCAA	TTCGCCCGCC	ACCTTATCTA	CAGCACCAGT
ATGCCGCCCG	CTCAGGCGCA	GGCATTACGT	GCGTCGCTGG	CCCGTCATTCG	CAGTGATGAG
GGTGATGCAC	GGCGCGAAAA	ACTGGCGGCA	CTCATTACGC	GTTTTCGTGC
GATTTGCCGT	TTACGCTTGC	TGATTCATGC	AGCGCCATCC	AGCCTTGAT	TGTCCGTTGAT
AACAGCCGTG	CGTTACAACT	GGCAGAAAAA	CTGCGTCAGC	AAGGCTGCTG	(GTTCACCG3CG
ATTCGCCCGC	CAACCGTACC	CGCTGGTACT	GCGCGACTGC	GCTTAACGCT	AACCGCTGCG

1233

12991

12591

1244

1247

1254

12591

1265

1274

1234

1294

1254

2014

2074

2134

94

2254

177 635

CATGAAATGC AGGATATCGA CCGTCTGCTG GAGGTGCTGC ATG GCA ACG GTT AAT 2309

Met Ala Thr Val Asn

5

AAA CAA

GCC ATT GCA GCG GCA TTT

TCT Gly

CGG GCA GCC

GCA CAC

TAT Tcy 20

GAG AAu

2235

Lys

Gln

AAa

I Il Ala Ala 10

Ala

Phe

Arg 15

Ala

His

CAA

CAT

GCA

GAA

CTA

CAG

CGC

CAG

AGT

GCT

GAC

GCC

TTA

CTG

<AA

ATG

22^5

Gln

His

AAa

Aap

Leu

Gln

Arg

Gln

See

Ala

Asp

Ala

Leu

Ala

Mee

25

33

35

CTT

CCA

CAG

CCG

AAA

TAC

ACC

CCC

GTA

CTG

GAC

GCG

GGT

TGT

CAA

ACT

2245

Leu

Pro

Gln

AAr

Ays

(Tyr

Thr

Hi i

Val

Leu

Asp

Ala

Gly

Cys

GAy

Aro

40

44

50

GGC

TGG

ATG

A«G

CGC

CAC

ATGG

CTC

GHA

CGT

CAC

GCG

CAG

GTG

ACC

AGC

2501.

Gly

Trp

Met

s ee

Arg

His

Tir?

lArg

GAu

Arg

His

Ala

Gln

Val

TTh

AA u

55

60

65

TTA

GAT

CTC

TTC

CCG

CGA

ATC

CTT

ggt

CAG

GCA

C<^C

GAG

AAG

GAI

AGC

2244

Leu

Asp

Leu

s ee

Pro

Met

Leu

vvi

Gln

Ala

Arg

Gln

Lys

AAfl

AAa

70

75

80

85

GCA

GAC

CAT

TTA

CTC

GCG

(GGA

CGAT

ATC

GAA

TCC

CTA

CCG

TTA

GAC

ACT

2259

Ala

Asp

His

Ttyy

Leu

Ala

Gly

Asp

Ul

Glu

Ser

Leu

Pro

Leu

AA u

TTh

90

95

100

GCG

ACG

TTC

GAA

ccc·

GCCA

ttc

AGC

AM

CTC

GCA

GTG

CAG

TTC

TTA

TCG

2264

Ala

Thr

Phe

AAp

Leu

Ala

Tjr?

Ser

Am

Leu

Ala

Val

Gln

Trp

CCS

GAu

105

111

115

AAT

TTA

TCC

ATC

ACA

CTC

ccac

GAG

CCG

TAT

CGG

GTC

GTG

CGC

CCC

2«.

2263

Asn

Leu

Ser

TTh

Ala

Leu

(Arg

GAu

Leu

Tyr

Arg

Val

Arg

Prr

ALS

120

112

130

GGC

GTG

GTC

GAC

TTT

ACC

ACG

CTC

GAC

AAG

AGA

TCG

CTA

ccc

GAA

CTC

2271

177 635

Gly

Val Vaa 135

Ala Phe Thr

Thr Leu Val Gln Gly Ser Leu Pro Glu Leu

140

145

CAT

CAG

GCG

TGG

CAG

GCG

GTG

GAC

GAG

CGT

CCG

CAT

GCT

CAT

CGC

TTT

2278

His

Gln

Ala

Trp

Gln

Ala

Val

Asp

Glu

A^rg

Pro

His

Ala

Asn

Arg

Phe

150

155

110

165

TTA

CCG

CCA

GAT

GAA

ATC

GAA

CAG

TCG

CTG

CAC

GGC

GTG

CAT

TAT

CAA

2233

Leu

Pro

Asp

Glu

Ile

Glu

Gln

Ser

Leu

Asn

Gly

Val

His

Tyr

Gln

170

175

180

CAT

ATT

CAG

CCC

ATC

ACG

CTG

T<GG

TTT

GAT

GCG

CTC

AGT

GCC

2285

His

Ile

Gln

Pro

Ile

Thr

Leu

Trp

Phe

AA3p

Asp

Ala

Leu

Ser

Ala

185

190

195

ATG

CGT

TCG

CTG

AAA

GGC

ATC

GOT

(GCC

ACG

CAT

CTT

CAT

GCA

GGG

CGC

2293

Met

Arg

Ser

Leu

Lys

Gly

Ile

Gly

Ala

Thr

His

Leu

His

Glu

Gly

Arg

200

205

210

GAC

CCG

CGA

ATA

TTA

ACG

CGT

TCG

CG

TTG

CG

CGA

TTG

CCA

CTG

GCC

2981

Asp

Pro

Arg

Ile

Leu

Thr

Arg

Ser

Gln

Leu

Gln

AArg

Leu

Gln

Leu

Ala

215

220

225

TGG

CCG

CAA

CAG

GGG

CGA

TAT

CCT

CTG

ACG

TAT

CAT

CTT

TTT

TTG

3329

Trp

Pro

Gln

Gly

Arg

Tyr

Pro

Leu

Tlu:

Tyr

His

Leu

Phe

Leu

230

235

240

245

GGA

GTG

ΑΊΓ

GCT

CGT

GAG

TAAACGTTAT TTTGCCACCG GAC^C^GA^A^A^AC

30 77

Gly

Val

11l

Ala

Arg

Glu

250

CGAAGTTTGT	CACCCTGTCG	CCGGTGTGC	CCTTTTACA	CCCGCCAAGG	CGCGGCTA	3137
CCGGACTTCC	GTTTATCCAC	CGG^G^G^G^^G^T^t^	TGGTACTGTA	CAGACCCCGG	CAGTTTTACG	3317
CAATAGCGAC	GCGCTGGCGT	TΑGAGCGC]Α	CGTAATCTG	CAGCTG5ATT	ACGCAACAGT	3357
AAATCCTTAC	ACCTTCTCAG	CACCCCCCG	GTCGCACACG	ATCAGCGCGC	ΑCGAGTGCAG	3317

177 635

TCGGATTATT TGTTTGATTA TGAGCGCCCC ATTACGCGCG CCTCACAC TAGCTGTCTG	3377
GGTGTTAGTG GTAGATGGTG GCGGCTGGTT TACGCCCGGTT TCTGACACTT TGTGTTTTGC	3437
CGATTGGGTA TGTGTGAAAC ACTtTCCCCCT GATACTCAAA GTTGAAGTGA ATCTGAAGTG	3497
TTTTTTTCTG GGGATGTTGA CT<TA<A<TCT ATACACAC GCCGGACTGA CTCTAACGGA	3557
TTCGGTGGCG AATGATGTTA CGCCTCCCTGϊ CTTCAGGTCAC GCTGATATA	3617
CACCCGGATG TTTCCCGGAG CGCGTCCCAA «AC'!^^ CCACTGTGAT (AATAGCCATA	3367
TAATGGGGCT TGGGATTTGT ATGTTAACTC CTCTTTTTCT GATGCGGTGA	3737
TACATGTCGA TT CTG CCC ACC GAT CC^T CCT (X^C CTT GAT CCA GCC CCT Met Thr TTr Acp Acp Glu Ala Chr Acp GCa CAg Cis 15 10	3785

TTC TGG CAC

CCC Phr

GAT ACA TCC ATG

ACC TCC

CCT CTG CCG GCT CAT GCG

3833

Ile

Trp

His 15

CTy

Thr

Ser

Met 20

Thr

Ser

Pho Leu

Pro 25

Val

CTy

Cpo

GTG

AGC

GCC

ggt

TGC

GAG

CTG

ATT

TTG

TCT

GAC

(AA

AGA

CCC

3881

Val

Ser

ACa

gGu

Gly

Cys

Glu

Leu

Ila

Llu

Ssr

Asp

GCa

(Arg

Ccrg

30

35

40

CTG

GTT

GAC

GGG

act;

TCG

TCC

*TA3

TAC

<a:g

GCG

ATC

CAC

(AA

GAC

CCT

3929

Leu

Val

Asp

GCa

GeU

Ser

Tir?

Tar?

Ala

Ila

His

GCa

CTy

Asn

45

50

55

60

CAC

CCG

CAG

CCT

CAT

GCG

ATG

(TCG

TCG

CA

ATT

GAT

GCC

ATG

TCG

3977

iis

hro

Gin

Llu

Am

Ala

Met

Lys

Ser

Gin

Ile

Asp

Ala

Met

Gsr

65

70

75

CAT

GTG

ATG

TTT

GGC

ggt

ATC

ACC

(AT

GCG

CCA

GCC

ATT

GAT

CTG

TTC

4025

iis

Val

Mele

Phr

g'u

Gly

Ile

Thr

His

Ala

Pho

Ala

Ila

gCu

Glu

CCS

177 635

CGC AAA CTG GTG GCG

ATC Met

ACG CCG Thh Pro 100

CCA CCG CTG GAG (TG GTT

ITT Phe

CCT LLU

4073

Arg

Lys

Leu 95

Val

Ala

dn

TPO

Leu

Glu

Cys 110)

Val

GCG

GAC

TCC

<GT

TCC

GTA

(GG

GTG

GGAA

GTG

<GG

ATG

(AAA

ATG

GCG

TTT

4121

Ala

Asp

Ser

Gly

Ser

Val

Ala

Val

Glu

Val

Ala

Met

Lys

Met

Ala

Llu

110

111

110

CAG

TAC

TGG

CjAA

GCC

TAAA

«G

GAA

GCG

Cd

TAG

CGT

. _TTT

CTG

ACC

TTT

4419

Gln

Tyr

Trp

Gin

(ALa

Lys

dy

Glu

Ala

(Arg

Gin

(Arg

Phe

Leu

Thr

pph

125

113

135

110

CGC

AAT

GGT

TAT

CAT

«G

GAT

ACC.

TTT

dG

GCG

. ATC

TCG

GTC

TGC

GGT

4417

Arg

Asn

Gly

His

Gly

Asp

Thr

PPh

d^y

Ala

Met

Ser

Val

Cys

Aas

145

150

1155

CCG

GAT

AAC

TCA

ATC

(CAC

AGT

CTG

T(G

(AA

<GG

TAC

CTG

CCA

GAA

AAC

4265

Pro

Asp

As U

Ser

Met

His

See

Leu

Τη?

Lys

Gly

Tyr

Leu

Pro

Glu

Aas

160

165

170

CTG

TTT

GCT

CCC

GCC

CCG

CCAA

AGC

CGC

ATC

GT

GdC

GAA

TH

GAT

GGA

4313

Leu

Phe

Ala

Pro

Ala

Pro

Gin

eer

JArg

Met

Asp

Gly

Glu

Τη?

Asp

GGu

175

180

115

CGC

GAT

ATG

gtg

(UC

TTT

<GC

CGC

CTG

ATG

GCG

CAT

CGT

CAT

GGA

43 61

Arg

Asp

Met

Val

Gly

Phe

Ala

Arg

Leu

Met

Ala

His

Arg

His

gGu

190

119

200

ATC

GCG

GTG

ATC

ATT

GAG

CCG

ATT

GTC

CAG

Gd

GCA

<GG

GGG

ATC

4409

Ile

Ala

Val

Ile

1ll

Glu

Pro

Ile

Val

Gin

Gly

Ala

Gly

MeU

205

210

215

220

CGC

ATG

TAC

CAT

GJAA

TTH

TTA

AAA

CGA

ATC

CGC

AAA

ATA

TGC

GAA

4457

Arg

Met

Tyr

Bis

Pro

Glu

Trp

Leu

Lys

Arg

Ile

Arg

Lys

Ile

Cys

AA£)

225

220

235

CGC

GAA

GGT

ATC

TTG

CTC

ATT

GCC

GAC

GAG

ATC

GCC

ACT

GGA

TTT

GGG

4505

177 635

Arg

Glu

Gly

Hu 340

Lee

uce

ICe aCt 1as 2395

Glu

Ile

Ala

Thr

Gly 250

Phe

Gly

CGT

ACC

GGG

TTT

CTG

ttt

gcc

TGT

GTT

CAT

GCA

GAA

ATC

GTG

CCC

CAT

4553

Arg

Thr

Gly

LLS

Leu

Phe

Ala

<^3

Glu

His

Ala

Glu

Ile

ATa

Cpo

CTJ^

355

230

265

ATT

TTG

TGC

CCT

(ATT

CTTC

GCC

TTA

ACC

GGC

<TTC

ACA

ATG

ACC

CCT

CGC

41502

Ile

Leu

Cys

Leu

Gly

Lys

Ala

Leu

Thr

Gly

Tiar

Met

Thh

Leu

Ceu

370

235

280

GCC

ACA

CTC

ATC

ACG

CGC

GAG

GTT

G<CC

GTT.

ACC

ATC

AGT

TTC

cat

CAT.

4649

Ala

Thr

Leu

TTh

Thr

Aog

Glu

Val

Ala

Glu

T]hr

Ile

Ser

Acs

Cll

Clu

335

290

295

300

GCC

GGT

TGC

TTT

ATG

CAT

<ggt

CCCT

ACT

TTT

ATG

(TTC

AAT

CCG

CTC

4697

Ala

Gly

Cys

PPe

Met

His

Gly

Pro

Thr

Phe

Met

Gly

Asn

Ppo

C>eu

CTa

305

320

3 25

TGC

GCG

GlA

GAC

CTC

GCC

AGC

CTG

<a:g

ATT

CTC

GAA

TCT

GAC

ThA

4745

Cys

Ala

AAa

ATl

Asn

Ala

Ser

Leu

Ala

Ile

Leu

Glu

Ser

Gll

Ces

Crr

330

333

330

CAG

CAT

CAG

GTG

GCG

GAT

ATT

GTAT

GTA

CAG

CTG

CGC

GAG

CCA

CCG

CTC

4793

Gln

vaa

Ala

Asp

Ile

Glu

Val

Gln

Leu

Arg

Glu

Gln

Ceu

CTu

335

330

345

CCC

GCC

CGT

GAT

CCC

GAA

ATG

GTT

GCC

GAT

GTG

CGC

GTA

CCG

cga

CTC

4342

Pro

Ala

Arr

AAp

Ala

Glu

Met

Val

Ala

Asp

Val

Arg

Val

Lee

Gll

CTu

350

335

360

ATT

GGC

GTG

στο;

GAA

ACC

ACT

CCT

CCG

GTG

AAT

ATG

GCG

CTC

CCT

4839

Ile

Gly

Val

val

Glu

Thr

His

Pro

Val

Asn

Met

Ala

Cese

Gln

365

370

3-75

380

AAT

TTC

TTT

gtg

CTC

CAG

(ATT

GTC

T<G5

ATC

C<GT

CCT

ttt

GGC

CTT

CCG

4937

Lys

Phe

val

Glu

Gln

Gly

Val

Trp

Ile

Arg

Pro

Phe

GTu

Lys

Leu

335

390

395

177 635

ATT TAC CTC ATG CCG CCC ΤΑΤ ATT ATT CTC CCG CCA CAG TTG CAG CGT 4985

Ile Tyr Leu Met Pro Pro Tyr Ile Ul Leu Pro Gln Gln Leu Gln CAg

400 40Ε» 410

CTG ACC GCA GCG GTT CAC CGC GCG GTA CAG GAT CGA ACA TTT TTT TGC 5(^^:3

Leu Thr Ala Ala Val Asn Arg Ala Val Gln Asp Glu Thr Phe Phe Cys

415 440 442

CAA TAACGAGAAG TCCGyGTGAG GGGTTCTTGC TCycyTTTCG GyACACAAGA 5086

Tln

430

AAGGCGCTTT C ATG AAA CTC ATC AGT AAC GAT CTT CGC GAT GGC GAT -CAA 5536

Met Lys Leu Ile Ser Asn Asp Leu Arg Asp Gly Asp Lys

	1	5
TTG	CCG	CAT	CGT	CAT	GTC	TFT	A^C	cgtc
Leu	Pro	His	JAg	HlS	val	Phe	Asn	Gly
	15					20
ATT	TCA	CCC»	OAT	CTG	GCG	TCC	GAT	CAT
Ile	Ser	Pro	His	Leu	Ala	Τη?	Asp	Asp
30					35
TTT	GTT	GTC	ACC	TGC	TAC	CAC	CCG	GAT
Phe	Val	Val	T1a	Cys	Tyr	Asp	Pro	Asp
				50
TGC	CAC	TGG	GTA	GTT	GTT	CAC	TTA	CCC
Trp	His	Τ-η?	Val	Val	Val	Asn	Leu	Pro
			65					70
CAA	GCT	TTT	GTC	TCT	ggt	CTG	GTA	GGA
Gln	Gly	Phe	Gly	Ser	Gly	Leu	Val	Ala
		80					85
ACG	CGT	ACC	GAC	TTT	GGT	AAA	ACC	CCTC

ATG GCT TAC	CGA CGCC CAT CAT	5184
Met	Gly	25	Asp Gly Asp	Asn
GTT	CCT	CCC»	CGA	ACG	CAA	AGT	5232
Val	Pro	Ala	Gly	Thr	Lys	Ser
	40					45
GCG	CCA	ACC	gt:	TCC	GTC	TGC	5280
Ala	Pro	Thr	Gly	Ser	Gly	Trp
55					60
GCT	GAT	ACC	ccc:	GTA	TTA	CCG	5328
Ala	Asp	Thr	CAg	Val	Leu	Pro
				77
ATG	CCA	GAC	CGCC	GTT	TTG	CAG	5376
Met	Pro	Asp	Gly	Val	Leu	Gln
			99
TAC	GAT	CG^C	GCA	GCA	CCG	CCG	5424

177 635

Thr Arg Thr Asp hhe Gly Lys Thr Gly Tyr Asp Gly Ala Ala hro hro 95 100 105

ACA TGG GCA ACC CAT CCA: TAG ATT TTT ACG GTT CTCC GCG CTT GAT ATT 5472

Lys Gly GCu CGhr iis (Arg Tyr Ila hhe Thr Val His Ala llu As]p lle

110 115 120 125

GAA GTT ACT? GAT GTT GAT GAA GGT GTT AGC ATG CAG CTG GTT GGG TTT 5520

Glu Arg Ile Asp Val A^s> Glu Gly Ala Ser Gly Ala Met wI Gly hhe

130 135 140

CAC TTT CAT CTT CCC TTC CTT CTCC CGC TCC TCG ATT CCT GGG GTG TTT 5568

Asn Val His Phh iis Sse Leu Ala Ser Ala Ser Ile Thr ACa Met hhe

145 150 155

CGT AACTCACTTT GGCCGATGGC TGTTTGCTΑT CTGGTATCCT TTAAAGTTCT 5621

Ser

TCATAATAAG TTTTTGTGTA TTTACATCCC CGTTTCTATC CCCGTAAGTAT GTAAAAGCAG 5681

GCTTGCACGG ATACATATTT CTAGACGATA GCCTGGATCG GATGATTCAA ACATTTTCAG 5741

CTTCTCTTCT GGCGTTGTCA TTCAATCTTA GCCTTAAGCC GAATGCCTGT AGCTCAACCC 5801

TGCTTGATGA ACGTTCTACT GATATGACCG CGGTTATTAA CGAAGCTGGA TTTCTGCAGG 5861

GATTGCAGTT C 5872 (2) INFORMACJA O SEQ ID Nr: 2:

(i) CHARAKTERYSTYKA SEKWENCJI:

(A) DŁUGOŚĆ: 346 Aminokwasów (B) TYP: Aminokwlsowy (D) topologia: liniowa (ii) RODZAJ CZĄSTECZKI: Proteina

177 635 (xi) OPie eEKWENCJlc SEQ lD Nr: 2:

Met Ala His Arg Ρρό

Arg

Top

Tho Leu Ser Gln Val Thr Glu Ler Phe

1

5

11

Glu

Lys

Pro

Leu

Asp

Lru

Leu

Phe

Glu

Ala

Gln

Val

His

Arg

00

5 T

33

Gln

His

Phe

AAs

Lrr

Ocg

AOa

VaG

GTn

VaU

ser

Thr

Leu

Ser

Ile

35

40

44

Lys

Tho

GUy

Ala

yys

Poo

Glu

Asp

Cys

Lys

Tyo

Cys

Poo

Gln

eeo

50

55

66

Arg

Tyo

LyS

Thr

Gly

Ler

Glu

Ala

Glu

GArg

Leu

Met

Glu

Val

Glu

Gln

65

77

17

80'

Val

Leu

Glu

eer

Ala

Arg

Lys

GUL a

Lys

Ala

Gly

Ser

Thr

GAg

Phe

85

90

Cys

Met

Gly

A AU

LlA

lep

Lgs

ASI

sro

His

Glu

Ar g

At p

Met

PrAg-Tyr

100

105

111

Leu

Glu

Gln

MmU

AaV

uTn

Gln

VaG

rys

A1u

Met

GTy

Leu

Glu

Ala

Cys

115

120

H0

Met

Tho

Leu

Gly

Tho

Leu

ero

Glu

ero

Gln

Ala

Gln

Agg

Ieu

Ala

Asn

130

113

HO

AUa

Gly

Leu

Asp

Trr

iyr

Asn

His

Asn

Leu

Asp

Thr

ser

Pro

Glu

Phr

145

110

115

160

Tyo

Gly

Asn

Ile

Thr

Arg

Thr

Tyr

Gln

Glu

Arg

Leu

Asp

Tho

165

170

117

Leu

GUu

Lys

Vaa

ArA

At p

Asp

GlA

a A e

Lys

Val

ey e

ser

Gly

Ile

180

185

110

177 635

Val Gly Ilu

Gly

Glu Thr Val Lys Asp Arg Ala Gly Leu Leu Leu

Gln

195

200

205

Leu

Ala

Am

Leu

Pro

Tło

Pro

Glu

eer

Val

Pro

iIu

Am

Met

Leu

210

221

220

Val

Lys

Val

Lys

Gly

Tłur

Poo

Leu

Al^a

Asp

Asn

Asp

Val

Asp

Ala

225

230

223

240

Phe

Asp

Phe

Ile

Arg

Tłur

Ile

Ala

Val

Ala

,?og

Ile

Met

Pro

Thr

245

2^0

255

eer

Tyr

wa

Arg

Leu

eer

Ala

Gly

AOg

Glu

Gln

Met

As n

Glu

Gln

Thr

260

265

270

Gln

Ala

Mee

Ays

Phe

Met

Ala

Gly

Ala

Asn

Ser

Ile

Phe

dyy

Gly

tyS

275

280

225

Lys

Leu

Ilu

Tło

Thr

Poo

Asn

Pro

Glu

Asp

Lys

Asp

Le^u

Gln

Leu

290

229

300

Phe

Arg

Lys

Leu

Gly

Leu

Asn

Pro

Gln

Thr

Ala

Val

Leu

Ala

Gly

305

310

311

330

Asp

Asn

GAu

Gln

Aog

Leu

Glu

Gln

Ala

Leu

Met

Tło

Pro

Asp

325

330

335

Thr

Asp

GAu

Tyr

Asn

Ala

Leu

340

345

(2) INFORMACJA O SEQ ID Nr: 3:

(i) CHARAKTERYSTYKA SEKWENCJI;

(A) DŁUGOŚĆ: 251 Aminokwasów (B) TYP: Aminokwasowy (D) TOPOLOGIA: liniowa

177 635 (ii) TYP CZĄSTECZKI: Proteina (xi) OPIS SEKWENCJI: SEQ ID Nr: 3:

Mtt

Ali

Tłh-

Val

Asn

Lys

Gln

Ala

Ile

GAla

iCLa

AC a

Phe

Gly

Arg

Ala

1

5

10

15

Ala

Ali

His

^r

Glu

Gln

HHs

Ala

Asp

Leu

Gln

CArg

Gln

ser

Ala

Asp

20

22

30

Ala

Ltu

Leu

Ala

Met

Leu

Pro

Gln

Arg

eys

Tyr

Thr

His

Val

Leu

Asp

35

40

44

Ala

Gly

Cys

Gly

Pro

Gly

Tt—»

Met

Ser

Arg

His

TT—

Arg

Glu

Arg

His

50

55

66

Ala

Gln

Val

Thr

Ala

Leu

GAjp

Ltu

Ser

Pro

Met

Leu

Val

Gln

Ala

65

70

75

80

Arg

Gln

Lys

Asp

Ala

Asp

His

Ty—

Leu

Ala

Gly

Asp

Ile

Glu

Ser

85

99

95

Leu

Pro

Leu

Ala

Tho

Ala

Thr

Pht

Asp

Leu

Ala

Trp

Suo

Asn

Ltu

Ala

100

115

110

Val

Gln

Top

Cys

Gly

Asn

Leu

Suo

Thr

Ala

Leu

Arg

Glu

etu

Tyr

Arg

115

110

112

Val

Vil

Arg

Pro

Lys

Gly

Vil

Val

Ala

Phe

Thr

Ltu

Val

Gln

Gly

130

135

140

Sto

Ltu

Pro

Glu

Leu

His

Gln

jma

Tipi

Gln

GAla

Val

Asp

Glu

A—g

Pro

145

150

155

1(50

His

Ala

Asn

Arg

Phe

Leu

Pro

Asp

Glu

Ile

Glu

Gln

Ser

Leu

Asn

165

110

117

177 635

iuy aal	His TTy Gin 180	iis	Bis	Ile Gin Pro Ile Thr Leu Trp Phe Asp
185	110
Asp Ala	Leu Seu (Ia	fet	Mug	SeA A(u	Su: Gly I(e lSs Ali Thu TUs
	195			200	205
Leu iis	Glu Gly ArA	A(p	Aso	Arp I(e	Leu Thr Mg Leu Gin Leu Gin
210			215		220
Arg Leu	Gin Leu Ala	Trp	poo	Gin Gin-	Gin Gly Arg Tyr Pro Leu Thr
225		230			235 220
Tyr iis	Leu PPh Leu	Gly	Val	Ile Ala	(Arg Glu
	245			250
(2) INFORMACJA O	SEQ ID	No: 4:
(i)	CHARAKTERYSTYKA	SEKWENCJI:
	(A) DŁUGOŚĆ: 429	aminokwasów
	(B) TYP: aminokwasowy
	(D) TOPOLOGIA:	: liniowa
(ii) TYP CZĄSTECZKI:	Pooteina
(xi) OPIS SEKWENCJI:	SEQ ID No: 4:
Met Thr	Thr Asp Asp	Leu	Ala	Phe Asp	lUn Arę: Hćslle Trp His Pro
1	5				10 15
Tyr Thr	ser (teU Thr	Ser	Poo	Leu Pro	Val Tyr Pro Val Val Se: da
	20			25	30
Alu Gly	Cys Glu Leu	Ile	Leu	Ser Asp	Gly Arg Arg Leu Val Asp Gly
	35			40	45
Met Suo	Se: Trp Trp	Ala	Ala	Ilu iis	Gly Tyr Asn His Pro Gln Leu

177 635

Asn 65

Ala

Ala Met

Lys

Ser 77

Gin

lle Asp AAa GmU Ser His val Met Phh

75

80

Gly

Ile

TGho

His

Ala

Pro

Ali

lle

Glu

cys

Arg

Lys

Leu

wi

85

90

99

Ala

Met

TłAh

Phr

Gin

Pro

Leu

GCu

CCS

Vil

Phh

Glu

GCa

Ges

Csu

Gly

100

115

110

Ser

Val

Ala

Vv1

Glu

Val

(Ala

Met

Lys

Met

ACa

Glu

Cer

Cep

Gln

115

110

115

Ala

Lys

Gly

Alu

Ala

Aog

Gin

Arg

Phe

Leu

Thp

Phh

(Arg

Asn

Gly

Ter

130

113

110

iis

Gly

Asp

Thr

Phe

Gly

Ala

Met

Ser

Wl

CCS

Asp

Pro

Asp

Asn

Ssu

145

150

115

116

Met

iis

Ser

Leu

τη?

Lys

Gly

Tyo

Leu

Ppo

Glu

Asn

Leu

Phe

Ala

PhO

165

117

Ala

hro

Gin

S su

Crg

Met

Asp

Giy

Glu

Top

«s

Glu

CA^CJ

A^s>

MmU

Gv1

180

185

190

Gly

Phe

ACa

Aao

Ge u

Met

Ala

His

Aog

Hi i

Gln

Gla

Ala

(Aa

Wl

195

200

205

lle

Ila

Glu

Pro

Ile

Val

Gin

Gly

Ala

Gly

MmU

Arg

Met

Tyr

Hii

210

215

222

Pro

Glu

tao

Leu

Lys

Aog

ile

Aog

Lys

Ila

Cys

Asp

Arg

Glu

Gly

Iln

225

230

22i^

224)

Leu

Ile

Ala

Asp

Glu

Ile

Ala

Thr

Gly

Phe

Gly

Arg

Thr

Gly

Lys

245

250

225

Leu

Phe

ACa

Ccs

Glu

His

Ala

Glu

Ile

Ala

Pro

Asp

Ila

Leu

Cys

Leu

260 265 270

177 635

Gly Lys AAa Leu

Thr

Gly

Thr Met Thr Leu Ser Ala Thr Leu

Thr

275

220

285

Thr

Arg

Glu

Val

ATa

AAu

ATr

AIa

Aeu

Acs

AGu

Glu

Ala

Gly

cys

PPr

290

295

330

Met

His

gA|

Pro

Thr

Phe

Met

Gly

Asn

Pro

Leu

Ala

Cys

Ala

ATl

305

310

315

332

Asn

Ala

See

Leu

Ala

Ile

Leu

Glu

Ser

Gly

Asp

Trp

Gln

Wl

325

333

335

Ala

Asp

Ilu

Glu

VaA

GAn

Vll

Atg

nAu

Gln

Leu

Ala

Pro

Ala

Arg

Arp

340

334

330

Ala

Glu

MmU

Val

Ala

Asp

Vil

Arg

Val

Leu

Gly

Ala

Ile

Gly

Val

344

330

365

Glu

Thr

His

Aro

Av1

AAs

AMt

ACa

ATl

Alu

Gln

Lys

Phe

wa

370

375

380

Glu

Gln

Gly

val

Top

Ile

Tog

Poo

Phe

Gly

Lys

Leu

Ilu

Tyo

Leu

MmU

385

390

395

440

Pro

Tyy

Ale

Ile

Leu

Poo

Gln

Leu

Gln

Arg

eeu

Tho

Ala

AT a

405

44.0

415

Val

Asn

AA—

Ala

VaT

lA n

Vi|

GlG

nhr

Phe

cyr

Aln

420 442 (2) INFORMACJA O eEQ ID Nr: 5 (i) ΗΤΚΤΚΤΕΈΚΥΤΤΥΚΆ EEiENEJCJI:

(A) DŁUGOŚĆ: 115 Mtmiokwasów (B) TYP: aminokwasowy (D) TOPOLOGIA: liniowa (ii) TYP CZĄeTECZKI: Proteina

177 635

	(xi) OPIS	SEKWENCJI:	SEQ ID Nr: 5:
Met	Lys Leu Ile	SerAsn Ass	Leu Arę Asp Gly Asp Lys Leu Pro His
1		5	10 11
Arg	Hss aal Phe	Asn Gly MmU	(li Tyr .Osp Gly Asp Asn Ile Ser Pro
	20		22 33
iis	Leu Ala Top	Asp Asp aal	Poo Ala lly Th: Lys Se: Phe aal aal
	35		40 45
Th:	Cys Ty: Asp	Poo Asp Ala	Poo Th: lly Suo Aly Trp Top iis Top
	50	55	60
aal	aal Val Asn	Leu Pro Ala	Asp TTu: TTog Val Leu Pro Gln Gly Phe
65		77	75 80
AUy	Se: Gly Leu	Val Ala JteU	(rp A( s ply (sI (eu Gln Tin: (Trg Tfar
		85	90 95
Asp	Phe Gly Lys	Thr Gly Tts	(sę oCyATu ATu (ro Pro Lys Gly UTa
	100		110 111
Thr	iis Arg Tyr	Ilu Phe Thr	aal iis Ala Leu Asp IUu Glu Tog Ile
	115		112 115
Asp	aal Asp ilu	Gly Ala Su:	Gly Ala Met aal lly Phu Asn aal iis
	130	113	114
Phe	iis Ser Leu	Ala Ser Ala	Se: Ile Th: Ala Met Phe Ser
145		150	115

(2) INFORMACJA O SEQ ID Nr: 6:

(i) CIUTRAKTERYSTYIKS SE1KWENCJI:

(A) DŁUGOŚĆ: 5872 par zasad (B) TYP? kwas nukleinowy

177 635 (C) POSTAĆ NICI: podwójni (D) GOPOeOGIA: liniowi (ii) GYP CZĄSTECZKI: DNS (genomowu) (iii) HIPOTETYCZNOŚĆ: NIE (vi) POCHODZENIE PIERWOTNE:

(A) ORGANIZM; Escherichii coli (B) SZCZEP: DSM493 (vii) BEZPOŚREDNIE POCHODZENIE:

(B) KLON: pBO30A25-9 (ix) CECHY:

(T) NAZWT/KLUCZ: CDS (B) POŁOŻENIE: 2254..3303 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /codon_start= 2154 /EC number= 2.321.47 /product= KTPT pynthlpe /evidence= EPEEIIMNCTLL· /gene= bioF /number= 2 /standard name= 8τ-£ϋΐη-—7-xxnnoinoatec sythisse (ix) CECHY:

(T) NTZWT/KLUCZ: CDS (B) POŁOŻENIE: 3043..3753 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DTNE: /codoy_stiot= 3434 /EC number= 2.2.2.3 /pooduct= TBC Sythhase SvviSoceeE PX^£^I^^I^Nh^T^eAL /gene= bioD /numbe^ 4 /standard nime= Dethiobiotin Synthise

177 635 (ix) cechy:

(A) NAZWA/KLUCZ: ΗΒε (B) POŁOŻENlE: 1141..1156 (D) POZOSTAŁE DANE: /standard name= bio F RBS (ix) CECHY:

(C) NCZWC/KLUCZ: RBS (B) POŁOŻENlE: 3030..3045 (D) POZOSTAŁE DANE: /standard name= bio D RBS (x) informacja dot. opublikowania:

(H) NUMER DOKUMENTU: WO 87/01301 B1 (l) DATA ZGŁOeZENlA: 06-08-1086 (J) DZlEŃ OPUBLlKOWANlA: 07-04-1003 (xi) OPlS SEKWENCJl: SEQ lD Nr: 6:

CAGTTCACTC	ΤΤΤΑΤΤΤΤΤΤ	tgtictgcac	ΤΤΑΑΤΤΑΤΤΊ	(ΤΤΤΊΤΑΤΑΑ	GTGTdAATT	60
ΊΤΊΑΊΤΙΊΑΤ	ΑΑΤΑΑΤΤΤΤΑ	ΟΑΤΑΤΑΙΙΑΑ	ταίιαττίιτ	(ΤΤΤΑΑΊΊΑΊ	CTAGTCATGG	120
ΤΤΤΑΤΤΙΤΤΤ	ΑΤ^Τ^ΑΤΑ	ttgtitccag	ιτταταίαατ	ATTTTlAAAA	CCGTTGCTGG	180
ατττίττίττ	ΤΊΑΑΙΤΙΤΑΊ	CAdllCACC	τιτταίταττ	ΑΤΙΑΤΤΤΤΤΙ	CAGlTGCAGG	2010
ΤΤΑΊΤΑΤΊΤΤ	ΊΤΤΊΤΤΊΑΤΤ	AAGACCCCAG	ICTTGCCCGl	AGATTCGCAA	ΤΑΑΤΟϋΟΟΟΤ	300
ΑΑΑΙΤΤΤΊΤΊ	ΤΤΑΤΑΑΑΑΤΤ	GdllCTlAG	ιττιαιτίιτ	LlCCGGAGlT	LAACAGGTGC	360
ΤΙΊΑΊΤΤΊΊΤ	ΊΤΊΤΑΑΑΊΤΊ	Α/ΑΑΑΧΤϊΐΙΤϊ	ίίαττιατιτ	τ:τττττίαατ	LGCGCGGCGT	420
GGAAGAATCC	ΤΤΑΤΙΑΑΤΊΤ	GATATGCCGT	τατττίίαατ	ΑΑΑΤΊΊΤΙΤΑ	LGGGTAAAAG	480
CGATGGGGCT	ΊΊΑΊΊΤΊΤΊΤ	ATGACGCTGT	ίιτατίττία	ατίααττττα	σοίΤ^σοσΤΤ	540
ΤΤΊΤΊΑΑΤΊΤ	CGlGCTlGAT	TACTACCACC	ΑίΤΑΑΤΤΤΊΊ	(τταττττιττ	LAGTTTTACG	600
ΊΤΑΑΤΑΤΤΑΤ	ΤΑΤΤΑΤΑΤΙΤ	ACTTATCAd	CACClTCTyA	(ΤΑΤΙΤΤΊΙΑ	GACGTGCGCG	660

177 635

AGTCCGTGCT CACCGTCGGG yCTTTCGGCT TTCTCTiGCTC AGT;CGGGACy GTAAACGCTC 720 tctccgtatt AGTGyτGCAA ctgtcaaacc ¢(::((^(3] GTGyccATCA 7 80

AyATGyTGTT TATTTTTTAA GTCACGCCGC TTGG]CyCCGG. CyCCGCCGCG GATGCCTGTG 840

CGTGTATTCT CCCCATTTCG GTCGCGCCGA GTGCGCCTTT 900

CTGCCGTACT CGΑGCCGΑTT AACGTACAGA CTCACG]]yC GCGCCTTATC GCAGGCGCAA 960

ACGCGATGTT CTACTGTTTC ACACGGCGCA CCCCGCTCCA Tyc:TCAGCA CCATACATCCC 1020

TGCAACTGTT CCGCACACTG GGGyGACAGC Οσ^^ΤΑ^ TCCCGTGCCKC CCyAGGGGAGA 1080

GCCACGTCTT (««(Τ»]: TGATGACCCC GGACACCGAC G]ACACTACC 1140

ACGCCTCAGC ATT ATT AGC TGG CAG GAG AAA ATC AAC GCG CCG CCT CTT 1189

Met Ser Trp Gln Glu Lys Ile Asn Ala Ala Leu AAp

10

GCG CGT CGT GCT GGC CTT GCC CTG CGT CGC CCT TTA CCC GCT GCG CCA 1237

Ala Arg Arg AAl AAa Aas Ala Leu CAg CAg CAg C^r Cro Cć^a. Ala Gln

20 25

GTA GCC GGA CGC TTG CCT GTG GCG GAT GAT CCC CAA TTA CCTC CAA TTT 1285

Gly Ala GTy Ato Tto Ceu Val Ala Asp Asp CAg Gln CTt Ceu Asn Phe

35 40

TCC AGT Α« GAT TTA TTA <GTT TTA ACC CAT CCT CCG CCA ATT ATC CGT 1030

Ser Sur AAn AAp Tyy Ceu Gly Leu Ser ΗΪ3 ΗΪ3 Pro Gln Ul CIi CAg

50 55 60

GCC TGC CAG CAG GGGC CCLC AG CCA TTT <TCC ATC CG3T AGC CGC CGCC TCC 1381

Ala Trp GTn G Tn GT! Ala Glu Glin Phe Gly Ul Gly Ssu GGi Gly Ser

70 75

GTT CAC GTC AGC GGT TAT AGC GTC TTG CAT CAG GCA CTG Τ^ GAG 1429

177 635

Gly His

Val

Ser 80

Gly

Tyr

Ser Val

Val His 85

Gln Ala Leu

Glu 90

Glu

CTG

GCC

GAG

TGG

CTT

GGC

TAT

TCG

CGG

GCA

CTG

TTT

ATC

TCT

GGT

1477

Leu

Ala

Glu

Trp

Leu

Gly

Tyr

Ser

Arg

Ala

Leu

Phe

Ile

Ser

Gly

95

100

105

TTC

GCC

GCT

AAT

CAG

GCA

GTT

ATT

GCC

GCG

ATG

GCG

AAA

GAG

GAC

1525

Phe

Ala

Asn

Gln

Ala

Val

Ile

Ala

Met

Ala

Lys

Glu

Asp

110

115

120

CGT

ATT

GCT

GCC

GAC

CGG

CTT

AGC

CAT

GCC

TCA

TTG

CTG

GAA

GCT

GCC

1573

Arg

Ile

Ala

Asp

Arg

Leu

Ser

His

Ala

Ser

Leu

Glu

Ala

125

130

135

140

AGT

TTA

AGC

CCG

TCG

CAG

CTT

CGC

CGT

TTT

GCT

CAT

AAC

GAT

GTC

ACT

1621

Ser

Leu

Ser

Pro

Ser

Gln

Leu

Arg

Phe

Ala

His

Asn

Asp

Val

Thr

145

150

155

CAT

TTG

GCG

CGA

TTG

CTT

GCT

TCC

ccc

TGT

CCG

GGG

CAG

CAA

ATG

GTG

1669

His

Leu

Ala

Arg

Leu

Ala

Ser

Pro

Cys

Pro

Gly

Gln

Met

Val

160

165

170

GTG

ACA

GAA

GGC

GTG

TTC

AGC

ATG

GAC

GGC

GAT

AGT

GCG

CCA

CTG

GCG

1717

Val

Thr

Glu

Gly

Val

Phe

Ser

Met

Asp

Gly

Asp

Ser

Ala

Pro

Leu

Ala

175

180

185

GAA

ATC

CAG

GTA

ACG

CAA

CAG

CAC

AAT

GGC

TGG

TTG

ATG

GTC

GAT

1765

Glu

Ile

Gln

Val

Thr

Gln

His

Asn

Gly

Trp

Leu

Met

Val

Asp

190

195

200

GAT

GCC

CAC

GGC

ACG

GGC

GTT

ATC

GGG

GAG

CAG

GGG

CGC

GGC

AGC

TGC

1813

Asp

Ala

His

Gly

Thr

Gly

Val

Ile

Gly

GlU

Gln

Gly

Arg

Gly

Ser

Cys

205

210

215

220

TGG

CTG

CAA

AAG

GTA

AAA

CCA

GAA

TTG

CTG

GTA

GTG

ACT

TTT

GGC

AAA

1861

Trp

Leu

Gln

Lys

Val

Lys

Pro

Glu

Leu

Val

Thr

Phe

Gly

Lys

225 230 235

177 635

GAA Gly

GAA Phe

GGC GTC ATC TTT GCA GCG GCG CTT TTC TCC

CTT CSU

ACG Thr 350

gtg Val

GCG Ala

19909

Gly Val 340

Seo Gly

Ala Ali

ail 345

Leu

Cys

SSU

GAG

CTG

CAT

TTC

GCC

CTC

CAC

CK]

TTC

TAT

CTT

TCC

AGT

ATG

1957

Tsp

Gyo

Leu

Gln

Phu

Ala

Tog

His

Leu

Ile

Thr

CSU

Tho

SSr

MeU

251

360

2(55

CCG

CCC

GTT

CAG

GCG

CAG

GCC

TGT

CGT

GCG

CCG

CTC

GCC

ATT

CCC

2005

ΡΟ-

Pro

ATl

Gln

Tla

Gln

Ala

Leu

Tog

Ala

Ser

ILU

Ala

Cal

Hu

Crg

370

275

280

ΤΑ]

GAG

<GTT

GAT

GCA

CCCT

CTC

GTT

TAG

CCG

GAC

CTC

ATT

ACG

2053

Ser

Asp

Glu

Gly

Asp

Ala

Arg

Tog

Glu

lls

Leu

AT u

ATu

Leu

iIn

CCh

335

390

395

330

CGG

Thr

CGT

GCC

TTA

GTA

CAG

GAG

ThA

CCG

TTC

ATC

CCT

GAT

TCA

2102

Aog

Phu

Ato

Ala

Gly

aal

Gln

Tsp

Leu

Pro

Phe

TAh-

Ceu

Ali

Asp

CSU

305

320

325

GAC

TGC

GCC

-ATC

CAG

CCT

TTG

TTT

GTC

<T3T

GAT

ATT

CTT

CGT

GCG

CTA

2149

Cys

Seo

ATl

He

Gln

Pro

Leu

Ile

aal

Gly

Asp

Acs

CSU

Tog

Ala

CLU

330

335

330

CTT

GAC

GAA

TTT

CTG

CGT

CAG

CTT

<G5C

TGC

TAG

CTC

ACG

GGG

ATT

2197

Aln

Leu

ATu

Glu

Lys

Leu

Arg

Gln

Gly

Cys

Tc-

Cal

Thr

Ala

CIu

335

340

345

CGC

CCG

CCA

ACC

GCA

CCC

(ACT

TTT

ACC

<TCG

CGA

CCA

CCC

CTA

ACG

CTA

2245

Aog

Poo

Pro

Thr

aal

Poo

Ala

Gly

Thr

Ala

Tog

Leu

cto

Leu

TTh

Ceu

350

355

3(60

TCC

GCT

GCG

CAT

GTT

ATC

C1TT

GAT

ACC

GAC

CGT

CCG

CCA

CAG

GTG

CCG

2293

Thr

Ala

ATu

His

Glu

Met

Gln

Asp

Ile

Asp

Tog

Leu

Ceu

Glu

Val

Ceu

365

370

375

333

CAG GAC TAC GAC TAATAAACAA GGGACGGCAG CAACATTTGA GCGGGCAGCG

3555

177 635 iis lly Asn Gly

385

GGTCTCCACG	ATCTACATCC ΑΤΜΌΤ^Κ lCCTGTAhl( CTGAGlCChT «ΑΚΤΑΓΑ	240 5
	ATAAACAGTC CTG1TTGh1( TGlClllhhC lTGAAGCTlA «ΑΤΑΠΑΚ	2465
CGCCTCTGGC	GGAATClTCA 15150101( ^Τ^^ΑΚ T^TCTCTC^C GCCAATGCCT	2525
GTTGA1ACAC	GCCATAATAA Α^ΚΤΑΑΜ ThTThCT1GC CGAAA1ATAC CGAATCCCTG	2585
CCTTTATCGA	CCGCGACGTT 1AhChT1CTC 11A1CTAhCC «ΚΑΚΚΑ TTGTTGCGAT	2645
AACCCATCCA	C1ΑCΑCCCC1 ΟσΜΑΤ^^ «CGATf^GlGC GCCCCATAG CGTGGTCGiG	2055
«TACCSClC	TAA'T1CA1AA ΜΑΜΤ^^ TAGh1CThCC AGGGGT1GCA 1GCGAT1GAC	2765
ΤΑΚΚ^Κ	ΜΊ^ΑΑ^Α 11«««« IC^SATG^dS TCGjTTCAGTC Α^ΙΑΤ^Α:	2825
ΚΚΑ^Α^	AACATCATAT CA1GCCTCCC G1Ch1h11hC TTTATTATTC Κ^Α^Α^	22885
ATGC1CTCGC	TAAAAGACAC CdidCCACT iCThChhATG AAGGGCGCGA CCCTC1AACA	2945
TTATG1C1TT	CGCATTTTCA GCGATAGCCC TTGGCCCGG1 CGCTACAACA GAAAC1ATAC	3005
CCCCCGAGGC	«««Μ «ΠΑΤΑΤη ΑΜΚ^ GTT AGT AAA CTT TAT TTT	3060

aal Suo Lys Arg Ty: Phu 1 5

GTC aal

ACC Th:

GGA ATC GAT ACC G7AA

GTG ATT JTAA ACT GTC GCC ATT TGT GiA

3108

Gly

TTh (3ρ 10

Thr

Glu

Val

lly 15

Ly^Et

Th: Val Ala ssu 20

Cys Ala

CTT

TTA

CJCA

GAC

(CCA

(TAG

GCA

TGC

TT.T

C1G

ACG

TCA

(Gi

(AT

JATA

3156

Luu

Gln

ATu

Ala

Lys

A1 a

Ala

lly

5Tt

Arg

Thr

Ala

Gly

Ty:

Lyy

25

30

35

CCA

ATC

GCC

TTC

(A3C

AGC

(ATA

(TAG

ACC

CCG

TAT

GAT

TTA

CGC

ATT

AGC

3204

177 635

Poo Van Ala Sep Gly 40

Sep Glu Lys 45

Tho

Poo Glu Gly 50

Leu Arg

Asn

Sep

GCC

GTT

CTC

GCG

TTA

CAG

CGC

cat:

a<a:

AGC

CTC

CCG

CTG

GAT

CAA

GCA

3252

Asp

Ala

Leu

Ala

Leu

Gln

Arg

Asn

Ssr

SSr

Glu

Gln

Glu

Ars

Ala

55

60

66

TO

ATT

TTA

(TCT

CCT

TAC

ACC

TTC

GCA

GCAC

ccc

ACT

TCG

CCG

CGA

ATC

GTC

3655

Cho

Van

Asn

Pro

'Ayr

Thr

Phe

Ala

Gla

Pro

TTr

Ssu

Ppo

Chs

Gln

Gla

75

80

88

CGT

GGT

CCTA

GAG

GGC

AGA

CCG

ATA

GCAC

TACA

TTG

GTA

ATC

GAG

GCC

CTAA

3348

Sep

Ala

Gln

Glu

Gly

Arg

Pro

Ile

Glu

Ser

Llu

Wl

MmU

Ssu

Ala

Gly

90

99

110

TTA

CGT

<CCG

CTT

GAA

CAA

CAG

GCT

GAC

T<TA

GTG

TTA

gtc

GCA

(AST

GCT

3396

Leu

Arg

Ala

Leu

Glu

Gln

Ala

Asp

Trp

wi

Glu

Wl

Gln

Gly

Ala

105

110

m

GGC

GGT

T<AA

ttt

ACG

CCG

CTT

TCT

GAC

ACT

TTC

ACT

TTT

GCA

GAT

SAGA

3444

Gly

Gir

Tapp

Phe

Thr

Pro

Leu

Ser

Asp

Thr

Phh

TGur

Chh

Ala

Asp

Cep

120

115

113

GTC

AGA

CAG

GAA

(CCA

CTG

CCG

GTG

ATA

CTG

GTA

GTT

GGT

gtg

CATC

CTC

3492

Val

Tho

Gln

Glu

Gln

Leu

Pro

Wl

Ile

Leu

Wl

Val

Gly

Wl

Lls

Leu

135

140

114

110

GGC

TGT

AAT

CAC

GCG

ATG

TTG

CCT

GCA

CCG

GTA

ATA

CCTK

CAC

GCC

3340

Gly

Cys

Iln

Asn

His

Ala

Met

Leu

Thr

<y.a

Gln

Wl

Ila

Gln

His

Ala

155

110

116

GGC

CTG

ACT

CTC

GCG

GGT

T<TA

GTG

GCG

CTCC

GAA

GATT

ACG

CCT

CCG

CTAA

3588

Gly

Leu

Thr

Leu

Ala

Gly

Trp

Wl

Ala

Asn

Asp

Wl

Thr

Pro

Gly

170

115

118

AAA

CGT

CCC

GCT

GAC

TAT

ATG

ACC

ACG

CTC

ACC

CGC

ATC

ATT

CCC

GCG

3636

Lys

Aog

His

Ala

Glu

Tyr

Met

Thr

Leu

Thr

CArg

Met

Ila

Pro

Ala

185 110 119

177 635

CCG CTT CTG GTG GAT ATC CCC TCTC CTT CCA GCA ACT CCA GCA TAT TCG 338^

Pro eeu Leu GT. Glu He Pro Trp Leu Ala Glu Asn Pro GTu Asn Ala

200 205 210

GCA ACC GGA AAA TAC ATA AAC CTT GCC TTC GTC TAC GCG TTA ACT CTA 3372

Ala Thr Gly Ley Tyr He Asn Leu Ala Phe Val Asp Ala Ssu Thr Leu

215 220 225 230 gtt yτy aca agt cga tta tgacaacgga cgatcttgcc ττyτAccAAC 2780

Tly Phu Thr Sur Arg Leu

235

GCCTTATCyG GCACCCATAC ACATCCATGA CCTCCCCTCT GCCGGTTTTy CCyTCAGGAT 33^0

GAGACGAAGG TTGC]AG:yG ATTT7GyCTG ACCTCATACT CCTTTTTGAC GGCAGTCTAC 3300

CCyGGTGGGC GGCGCTCCAC CGCTACAATC ACCCGCAGCT TCATGCCGCG ATAGACCTCC 339C>

AAATTGATGC CAAGTCGCAT GTGATGTATG GCCGTATCAC CCATCCGCCA GCCATTATAC 4(00

AGAGCCGCAT ACTTCTTGCG ATCACGACGA AACCGCTGGA GTGCCTTTTT CCTCTCTTTC H0O

CCGGTTCCGT ACAGGTCGAA GTCGCGATGA AAATCGAGTA CCAGTACTGT CAAATCAAAA 44.10

GAGAACCGCG CCAGCGTTTT CTGACCTTCC GyAATGGTTT TCATCGCCAT ACCCTTATCC 4420

CGATGTCGTT GTGCGATCCG GATAACTCAA TGCACAGTCT CTGGACAGGy TATCCTTCAA 4420

AAAACCTTTT TGCTCCCGCC CCGCAATGCC GyATGGATGG CGAATGGGAy GTTGCTCTTA 4430

TGGyGGGCyT TGCCCGCCTG ATGGCCGCGC ATCCTCATGA AATCGCCGCG GCTTTTATTA 433^0

AGyyGATTTT yCGCGGCGCA GGyGGGATGy GCAGGTACCA TCCGGAATGG TTAAAAACTA 4440

TCCGCAAAAT ATGCGATCCC GAACGTATCT TGCTGATTGC CGACCAGATC GTCATCATTT 4400 yyGTyCGTAC CGGGACACTG TTTGyCTGTG AACATGCAGA AATCGCGCCG GTCATTTyAG 4560

177 635

GGCTCGATAA	AAGCTTAACC	AACGACACAA	TAACCCTTTC	CGCCACACTC	ACCACGCGCG	4460
AGATTGCAGA	AACCATCAAT	AACAATAAAG	CCAATTGCTT	TATGCATATAA	CCCAACTTTTA	44^0
TAGGCAATCC	ACTAAGCTGC	ACAACAGCAA	ACAGCAGCCT	GGCGATTCTC	GAAATCCTAACG	4440
ACTGACAACA	ACAAATAACA	AATATTAAAG	TACAACTACG	CGAtAACCTT	łGACCCCCATCC	4400
ATAATACCAA	AATAATTAGC	AATATACGCG	TACTGGGAGC	CATTCTJCGTG	GTCGAAAACCA	4480
CTCATCCGAT	GAATATGACG	ACAGTAGCAA	AATTCTTTAT	CGAAAACAAAT	GTCTCAAATCC	4490
AACCTTTTAA	CAAACTGATT	TACCTGATAC	CACCCTATAT	TATTCTCCCG	AGAACAGTTGC	4490
AACGTCTAAC	CGCAGCGATT	AACCGCGCAA	TACAAAATAA	AACATTTTTTT	TGCCAAATCAAC	50^4»
GAGAAGTCCG	CGTAAGGATT	TCTAACTACA	CTTTCTACAA	acataaaaaa;	ACAGATTCATG	551^0
ACACTCATCA	ATAACAATCT	GGACGATAAC	AATAAATTAG	CGCATCGTCA	ATATCTTTłAAC	55^0
GACATAAATT	ACAATAACAA	TAATATTTCA	CCACATCTAA	CGTATAATGA	TGTTCCTGCG	5520
GAAACGAAAA	GTTTTATTGT	CACCTGCTAC	AACCCAAATA	CGCAGCCCCGA	CTCCCAACCTAA	5520
TGACACTGAA	TAATTATTAA	CTTACCCAGT	AATACCCGCG	TATTACCGCA	AAAAJTTTCAA	5530
TCTGATCTGA	TAGCAATACC	AGACGACGTT	TTACAAACAC	GTACTGACTT	TTA5TCAAAACC	5500
GAGTACAATG	GGGCAACACC	GCCGAAAAAC	AAACCTCATC	GCTACATTTT	TACCGTTCCAC	5540
ACGCTGAATA	TAGAACATAT	TAATGTCGAT	AAAAATACCA	GCAGCACGAT	CAATCCAAACTT	555 2)
AACGTTCATT	TCCACTCTCT	GACAAGCGCC	TCGATTACTG	CGAAATGTAT	TTTAATCACTC	5558
TACCAGATGA	CACAATAGCA	TCTAATATGA	CTTAAAGATA	ΤΤΤΤΑΑΑΑΑΓ	CTTTTTGTCT	55^0
TTTTACCTTC	CCGTTTCACT	CAAGTTAGTA	TAAAAAAACA	GGCGTTTGCG	GATTCATTTT	5570

177 635

TCTACTTTAT AGCCTGGAGT AACCTGTGAA CATATCTTCT ATTTCCCGTC TdCGCTdC

ΑΤΤΊΊΤΤΤΤΤ GGTGCGACGT TGACCGTTTG TATSTTCCCC CCGCCCGACC AACCTCCTTC

ΤΊΑΤΤΑΑΑΤΤ ΊΤΊΤΤΤΊΊΤΑ CTGAGCTTGA ATTCCTCCGG GCATGCAAGC TT (0) informacja o SEQ lD Nr: 7:

(i) CHARAKTERYSTYKA:

(A) DŁUGOŚĆ: 384 aminokwasy (B) TYP: iminokwasowy (D) TOrOLOGlA: liniowa (ii) TYP TZĄeTETZKl: protrina (xi) OPlS SEKWENCJl: SEQ lD Nr: 7:

5760

5800

5870

Mrt 1

Sro

Top

Glu (Glu 5

Lys

Ile Asn Ala Ala Leu Asp Ala Arg Arg Ala

10

15

AUi

Asp

AUa

Leu

(Arg

Arg

JArg

Tyo

Pro

Val

(ALa

Gln

Gly

Ala

Gly

(Arg

00

251

33

Trp

Ieu

Val

Ali

Asp

Ag-

Gln

Tyo

Iru

Asn

Phr

Sro

Asn

Asp

35

40

45

Tyo

Lru

Gly

Leu

ero

His

Poo

Gln

llr

lle

Arg

AUi

Top

Gln

50

55

60

Gly

Ali

Glu

Gln

Phr

Gly

lle

Gly

Seo

Gly

Sro

Gly

His

aiU

Seo

65

70

75

80

Gly

Tyo

Sro

Val

His

Gln

Ali

Leu

Glu

Lru

Ala

Glu

Trp

85

90

95

Lru

Gly

Tyo

Ser

(Arg

Ala

Leu

Phe

Ile

Ser

Gly

Phr

Ala

Asn

100

105

111

177 635

Gln Ala Val

Ile

Ala AUl Met Met Ala Lys Alu As^pi (sg Ile Ala

Ala

115

110

112

Asp

Arg

Leu

Ser

His

da

Ser

Leu

llu

Ala

Ser

Leu

Ser

Pro

130

113

140

Suo

Gln

Leu

Arg

Aog

Phe

da

His

Asn

Asp

VaU

Thr

His

Leu

Ala

Arg

150

155

160

Luu

Leu

Ala

Ser

Poo

Cys

Poo

Gly

Gln

lln

Met

Val

Thr

Glu

Gly

165

170

175

aal

Phe

Ser

Met

Asp

Gly

Asp

Ser

AT u

Pro

Leu

Ala

Glu

Ile

Gln

180

118

190

aau

Th:

Gln

lln

ΗΪ(

Asn

Gly

Topę

Llu

Met

Val

Asp

Ala

His

Gly

195

200

205

Tho

TUy

Val

Ile

Gly

ilu

Gln

lly

Aorg

lly

Seo

Cys

Trp

Leu

Gln

Lys

210

215

220

aau

Lys

Pro

Glu

Leu

Val

Tło

Phe

Gly

Lys

Gly

Phe

Gly

Val

225

230

235

240

Suo

lly

Ala

da

Val

Leu

Cys

Ser

Tho

Val

Ala

Asp

Leu

245

250

255

Gln

Phu

da

ASog

ΗΪ(

Leu

^U(

Tor

Ssu

Thr

Ser

Mut

Pro

Ala

Gln

260

226

270

Ala

lln

Ala

Luu

AOgg

da

Ser

Leu

Ala

Val

Ile

Tog

Ser

Asp

Glu

Gly

275

228

225

Asp

Ala

Mg

Arg

Glu

Lys

Leu

Ala

da

Luu

Ile

Thr

Arg

Phe

Arg

Ala

290

22^

300

Aly

Val

Gln

Asp

Luu

Pro

Phu

Thr

Luu

Ala

Asp

Ser

Cys

Ser

Ala

Ile

305

330

315

330

177 635

Gln Pro Leu

Ilu

Val Gly 325

Asp Asn Ssu Arg Ala Ltu Gln Leu Ala Glu

330

333

Lys

etu

Asg

Gln

Gly

Cyy

Trp

Val

Thr

Ala

Ile

AOgg

Pro

Thr

340

334

350

Val

Pro

Ais

Gly

Thr

AL a

CArg

etu

Arg

Lu u

Thr

Ltu

Thr

Ala

His

355

360

335

Glu

Mtt

Gln

Asp

Tle

Asp

<Crq

Ltu

Leu

Glu

Val

Leu

HHs

Gly

Asn

Gly

370

337

380

(2) INFORMACJA O SEQ ID Nr: 8:

(i) CHARAKTERYSTYKA SEKWENCJI:

(A) DŁUGOŚĆ: 236 aminokwasów (B) TYP: iminokwasowy (D) TOPOLOGIA: liniowi (ii) TYP CZĄSTECZKI: proteina (xi) OPIS SEKWENCJI: SEQ ID Nr: 8:

ViL Ser lys Arg Tyig PPe Val Thr Gly Thr Asp Thr Glu Val Gly Lys 15 11 11

Thr Val ACu Tsu Cys Ala Ltu Leu Gln Ala Ala Lys Ala ACa Gly Tyr 20 22 30

Arg Thr ACu AGu Tyr Lys Pro Val Ala Ser Gly Ser Glu Lyy Thr Pro 35 40 45

Glu Gly Leu Arg Asn Ser Asp Ala Leu Ala Leu Gln Arg Asn Ser Ser 50 55 60

Ltu Gln Leu Asp Tyr Ala Thr Val Asn Pro <iyr Tho Phe Ala Glu Pro 65 77 77

177 635

Thr

Ser

Pro

His

Ilt 85

Ilt

Str Ala Gln Glu Gly Ar9 Pro Ilt Glu

Str

90

915

Leu

Val

Met

Ser

Ala

Tly

Leu

Arg

Ala

Ltu

Glu

Gln

Ala

Asp

Trp

100

105

110

Val

Leu

Wl

Glu

Gly

GlLa

Gly

Trp

Phe

Thr

PrO

Leu

Ssu

Asp

Thr

115

120

115

Phe

Thr

PPe

Ala

Asp

Trp

Val

Thr

Gln

Glu

Gln

Leu

Pro

vaa

Ile

Leu

130

135

140

Val

GT.

Vai

LjT

LtU

Gly

Cys

Ile

Asn

His

Ala

Met

Leu

TłA

Ala

145

150

115

110

Gln

Val

iIu

Gln

Ηί-S

Ala

Gly

Leu

Thr

Leu

Ala

Gly

Tir?

Val

Ala

Asn

165

110

115

Asp

Val

Thr

Pro

Gly

Lys

Arg

His

Ala

Glu

Tyr

Met

Thr

Leu

180

185

190

Thr

Arg

MMt

Ile

Pro

Ala

Pro

Leu

Gly

guu

Ile

Pro

Typ

Leu

Ala

195

200

205

Glu

Asn

P^o

Glu

Asn

Ala

Thr

Gly

Lys

Tyr

Ile

Asn

Leu

Ala

Phe

210

215

220

Val

Asp

ACa

Ser

Thr

Ltu

Gyy

Phe

Thr

Ser

CAg

Ltu

225

230

225

(2) INFORMACJA O SEQ ID Nr: 9:

(i) CHARAKTERYSTYKA SEKWENCJI:

(A) DŁUGOŚĆc 14C psy zasad (B) TYP: kwas nukleinowy (C) TYP NICI: podwójna (D) TOPOLOGIA: liniowa

277 635 (ii) AYP CZĄSTECZKI: DNS ^^unomowu) (iii) HIPOGEhYCZNOŚĆ: NIE (iii) ANTYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:

(T) ORGANIZM: Escherichii coli (vii) BEZPOŚREDNIE POCHODZENIE:

(B) KLON: pBO30 (ix) CECHY:

(T) NTZWT/KLUCZ: CDS (B) POŁOŻENIE: 2..95 (D) POZOSGTŁE DANE: /paotiil /EC numbe^ 6.3.3.3 /pr-dIct= Dethiobiotin erntease /9unu= ” b i oD /genu^bi^ (ix) CECHY:

(T) NAZWT/KLUCZ: CDS (B) POŁOŻENIE: 2332.253 (D) POZOSGTŁE DANE: /pirtiil /codon start= 230 /EC numbe^ 3.6.2.63 /product= DAPA Srnteipu /gune= bioA /pseudo (ix) CECHY:

(T) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 222..433 (D) POZOSGTŁE DTNE: /standard namu= bioT RBS (ix) CECHY:

(T) NTZWT/KLUCZ: stum-l-p (B) POŁOŻENIE: 33..1

177 635 (x) informacja dot. OPUBLlKOWANlA:

(H) NUMER DOKUMENTU: WO 87/01301 B1 (l) DATA ZGŁOSZENlA: 06-08-1086 (J) DZlEŃ OPUBLlKOWANlA: 07-04-1003 (xi) OPlS SEKWENCJl: SEQ lD No: 0:

TAC ATA AAC CTT GCC TTG CTG TAGCCACCCT GTACCTGGTT ATACTTGCGAG Tyr llr Asn Leu Ali Lru Lru

5

CGAGATCGCG TCCTCGATTG ACTGCAACCT AACCCCCTAG AGCCGACTCT AGGGCTTACA

AGTCGATT ΑΤΊ ACA ACG GAC GAT CTT GCC TCT Mrt Thr Tho Asp Asp Iru Ali Phr

5 (0) lNFORMACJA O SEQ lD Nr: 10 (i) CHARAKTERYSTYKA (A) DŁUGOŚĆ: 8 aminokwasów (B) TYP: iminokwmowy (D) TOPOeOGlA: Uiniowa (ii) TYP CZĄSTECZKl: protrina (xi) OPlS SEKWENCJl: SEQ lD No: 10:

Tyr lle Asn Leu AUa Leu Lru 1 5 (0) lNFORMACJA O SEQ lD Nr: 11:

111

143 (i) CHARAKTERYSTYKA SEKWENCJl:

(A) DŁUGOŚĆ: 7 aminokwasów (B) TYP: aminokwasowy

177 635 (D) GOPOLOGIT: liniowi (ii) GYP CZĄSTECZKI: proteina (xi) OPIS SEKWENCJI: SEQ ID Nr: 22:

Met Tho Gho Tsp Tsp Leu Ala Phe 2 5 (3) INFORMACJA O SEQ ID Nr: 23 (i) CHARAKTERYSTYKA SEKWENCJI:

(T) DŁUGOŚĆ: 93 pary zisid (B) GYP: kwis nukleinowy (C) FORMT NICI: podwójna (D) GOPOLOGIT: liniowa (ii) AYP CZĄSTECZKI: DNS (genomowe^) (iii) HIPOGETYCZNOŚĆ: NIE (iii) TNCYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:

(T) ORGANIZM: Escherichii coli (vii) BEZPOŚREDNIE POCHODZENIE: (B) KLON: pBO30T-9 (ix) CECHY:

(T) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 4..94 (D) POZOSGTŁE DANE: /partiil /codon stirt= 2 /EC numbur= 6.3.5.3 /product= DGB eynthapu /gunu= bioD

177 635 (ix) CECHY:

(A) NAZWA/KLUCZ: CDS (B) hOŁOŻENlE: 75..93 (D) POZOSTAŁE DANE: /partial /codon starta 70 /ET number= 2.0.1.00 /ppoduct= DAPC Synthase /gunu= bioA (ix) CECHY:

(A) NAZWA/KLUCZ: RBS (B) POŁOŻENlE: 01..72 (D) POZOSTAŁE DANE: /standard namu= bio A RBS (x) Informacja DOT. OPUBLIKOWANIA (H) NUMER DOKUMENTU: WO 87/01301 B1 (I) DATA ZTŁOSZENlC: 20-00-1900 (J) dzień opublikowania: 07-04-19 93 (xi) OPIS SEKWENCJI: SEQ ID Nr: 12:

TAC ATA CCC CTT GCC TTT TTC TAGCCATTCT GTATTT<AATT CGTCGACTCT Tyr lle Asn Leu Ala Leu Llu

5

ATGTATTCCC AGTCGATT ATT ACA ACG GAC GAT CGA CGC TTT Met TCt Thr Asp Asp Leu Ala PUe

5 (2) INFORMACJA O SEQ ID Nr: 13 (i) CHARAKTERYSTYKA SEKWENCJI:

(A) DŁUGOŚĆ: 8 aminokwasów (B) TYP: aminokwlsowy (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: proteina

177 635 (xi) OPle SEKWENCJlc SEQ lD Nr: 13:

Tyo lle Asn Lru AUi Lru Lru 1 5 (0) lNFORMACJA O SEQ lD No: 14:

(i) CHARAKTERYSTYKA SEKWENCJl:

(A) DŁUGOŚĆ: 7 aminokwasów (B) TYP: aminokwanowy (D) TOrOLOGlA: liniowa (ii) TYP CZĄSTECZKl: proteina (xi) OPlS SEKWENCJl: SEQ lD No: 14:

Met Tho Thr Asp Asp Lru Ali Phe 1 5 (0) lNFORMACJA O SEQ lD No: 15:

(i) CHARAKTERYSTYKA SEKWENCJl:

(A) DŁUGOŚĆ: 77 par zasad (B) TYP: kwas nukleinowy (C) FORMA NlCl: podwójna (D) TOPOLOGlA: liniowa (ii) TYP CZĄSTECZKl: DIS (genomowr) (iii) HlPOTETYCZNOŚĆ: NlE (iii) AANTSENSOWNOŚĆ: LIl (vi) PIERWOTNE POCHODZENIE:

(A) ORGCIilZM: Ε^1ιπ^1ιΪ3 coli

177 635 (vii) BEZPOŚREDNIE POCHODZENIE:

(B) KLON: pBO30A-15 (ix) CECHY:

(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 1..57 (D) POZOSTAŁE DANE: /partiil /codon stio^ 1 /functSon=altered 3'-und /EC number= 6.3.3.3 /product= DTB Synthise” /genu= bioD (ix) CECHY:

(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 54..77 (D) POZOSTAŁE DANE: /partial /codon stiot= 54 /EC numbur= 2.6.1.60 /product= DAPA Synthase /gene= bioA (ix) CECHY:

(A) NAZWA/KIUCZ: RBS (B) POŁOŻENIE: 45..56 (D) POZOSTAŁE DANE: /standard nime= bioA RBS (x) INFORMACJA DOT. OPUBLIKOWANIA (H) NUUffiR CDOKUfflNTU: WO 17/7/013 B i (I) DATA TGTOSZENIA: 22-08-1186 (J) DZIEŃ OPUBLIKOWANIA: 07-04-1993 (xi) OPIS SEKWENCJI: SEQ ID No: 15:

TAC ATA AAC CTT ACC ATC ATT CTC CTC CCG ACT CTA <GCG TTT AGA AGT

Tyr Ile Asn Leu ACu CPh Tal Ass ASu T er Thr Leu Gly Phe Thr Ser

10 15

GT

177 635

CGT TGT TGACAACGAT CGTTGCGGCC TGC

Tog Leu (3) INFORMACJA O SEQ ID No: 26 (i) CHARAKTERYSTYKA SEKWENCJI:

(T) DŁUGOŚĆ: 23 iminokwasów (B) AYP: amin-kwip-wr (D) TOPOLOGIA: liniowi (ii) GYP CZĄSTECZKI: proteina (xi) OPIS SEKWENCJI: SEQ ID Nr: 26:

Gyo Ile Tsn Leu Tli Phe aal Asp Ala Ser Tho Leu Gly Phe Gho Ser 15 10 15

Aog Leu (3) INFORMACJA O SEQ ID Nr: 27:

(i) CHARAKTERYSTYKA SEKWENCJI:

(T) DŁUGOŚĆ: 431 par zisid (B) AYP: kwis nukleinowy (C) FORMT NICI: podwójna (D) GOPOLOGIT: liniowi (ii) GYP CZĄSTECZKI: DNS (gen-m-we) (iii) HIPOGETYCZNOŚĆ: NIE (iii) ANTYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:

(T) ORGANIZM: Eschu-ic^ii coli

177 635 (vii) bezpośrednie POCHODZENlE:

(B) KLON: pBO30A-15/085E (ix) CECHY:

(A) NAZWA/KLUCZ: -10_nSΑnal (B) POŁOŻENlE: 45..40 (D) POZOSTAŁE DANE: /standaod_naIne=^,,sromGtrr ptay (ix) CECHY:

(A) NAZWA/KLUCZ: poomotro (B) POŁOŻENlE: 1..06 (C) RODZAJ OZNACZENlA: eksperymentalny (D) POZOSTAŁE DANE: /funytŚGn=pgomotrg ptac /rvidrncr= EXPERlMENTAL (X) lNFORMACJA DOT. opublikowania (H) NUMER DOKUMENTU: WO 87/01301 B1 (l) DATA ZGŁOSZENlA: 06-08-1086 (J) DZlEŃ OPUBLlKOWANlA: 07-04-1003 (xi) OPlS SEKWENCJl: SEQ lD No: 17:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TCATCCCTCd CTCGTATAAT GTGTGlAACT

ΊΤΊΑΊΤΊΊΑΤ AACAATTTCA CACAGGAAAC AdATCCGTT CCTTAGGAGG TGACTAGTCA

TGGCT (0) lNFORMACJA o SEQ lD Nr: 18:

(i) CHARAKTERYSTYKA SEKWENCJl:

(A) DŁUGOŚĆ: 106 pao zasad (B) TYP: kwas nukleinowy (C) FORMA NlCl: podwójna (D) TOPOLOGlA: liniowa

120

125 (ii) TYP CZĄSTECZKl: DIS ^^enomowr)

277 635 (iii) HIPOTETYGZNOŚĆ: NIE (iii) ANCYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:

(T) ORGANIZM: Epceurichii coli (vii) BEZPOŚREDNIE POCHODZENIE: (B) KLON: pBO30T.-21/26 (ix) CECHY:

(T) NTZWT/KLUCZ: promotur (B) POŁOŻENIE: 4..96 (C) RODZTJ OZNACZENIA: eksperymentalny (D) POZOSTAŁE DTNE: /fIycti-o=pr-m-teo ptac /uviduncu= EXPERIMENAAL (ix) CECHY:

(T) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 231..233 (C) RODZTJ OZNACZENIA: eksperymentalny (D) POZOSTAŁE DANE: /uvidunce= EXPEReeENTAL /standard namu=bioB RBS no.26 (X) INFORMACJA DOG. OPUBLIKOWANIA (H) NUMER DOKUMENTU: WO 4/32392 B2 (I) DTTT ZGŁOSZENIA: 36-03-2936 (J) DZIEŃ OPUBLIKOWANIA: 07-05-2993 (xi) OPIS SEKWENCJI: SEQ ID Nr: 23:

AAGCCTAGTC CGCACGCCCC TACTGTCATT ΤΤΤΤΤεΑΤΟΑ:; CTCGTATAAT GTGTGGTTTT

GTATGCGGTT AACTTTTCCA CACTTATTAG A<^T^C^<^(G^T^A CCTAACKCAdS TTTACTAGTC

TTAGCG (50

120

126

177 635 (2) INFORMACJA O SEQ ID Nr: 19:

(i) CHARAKTERYSTYKA SEKWENCJI:

(A) DŁUGOŚĆ: 122 par zasad (B) TYP: kwas nukleinowy (C) FORMA NITl: podwójna (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: DNS (genomowe) (iii) HIPOTETYCZNOŚĆ: NIE (iii) ANTYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:

(A) ORGANIZM: Es^erich-ia coli (vii) BEZPOŚREDNIE POCHODZENIE:

(B) KLON: pBO65A—10/0 (ix) CECHY:

(A) NAZWA/KLUCZ: promoter (B) POŁOŻENIE: 5.o90 (C) RODZAJ OZNACZENIA: eksperymentalny (D) POZOSTAŁE DANE: /function=promotur ptac /evidence= EXPERieENTTL (ix) CECHY:

(A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE:

(C) RODZAJ OZNACZENIA: eksperymentalny (D) POZOSTAŁE DANE: /evidence= EXPERIMENTCy /standard name=bioB RBS no.9 (x) INFORMACJA DOT. OPUBLIKOWANIA (i) NUMER DOKUMENTU: WO 87/51305 B1 (I) DATA ZGŁOSZENIA: 20-08-5900 (J) DZIEŃ OPUBLIKOWANIA: 07-54-5093

177 635 (xi) OPIS SEKWENCJI: SEQ ID Nr: 19:

AAGCTTACTC CCCATCCCCC TGTTGACTAST CAACCA.CCGG CCCGTACSA.T GTGT<GAATTT

GCTAGCCTAC ΑΤΤΑΛ^^Α (GSCCAGGCAAC ΤΙΤΑ^Ι^Α CCCAA,.GGAGA ^JGC^^TCGI

CT

120

122

177 635

Fig. 2B

177 635 co co σ

Χ3

X <

ο <

υ

Ε* υ

υ ο

<

ε<

Eh

Ε* <

<

υ

Οφ

Εη υ

<

ο η

ϋ •Η

Εη

ΕΟ

Ο

Η

Ε*

Η <

Eh

Ο

Εη υ

η

Ε<

<

υ υ

Ο :

<:

Η:

Ο

Ε«

Η

Ο

O

CO σ

to

Ο co

Ο

G0

Ω_

C3J

Ο

U

O

F<

Eh u

υ <

Eh <

υ «c

Eh v

V tj (0

Ή <

□

0) i4

C

Ol <

u

Eh

Lf>

EEh E-> O U O Eh Ευ Eh < o u < o o o «c < υ u H < Eh E-> < O O Eh U < < o < E->

o o

o <

E<

O

Eh

U «C

O u

E->

o u X CU (0 r^-1

0)

o.

VI <

Od

0) <

u

X

Eh

U

X

Eh

Eh ω

ε( <

o jo i

I l

i

2.

EEh

Eh υ

u o

Eh

O

Eh <

O u

<

o o

u <

u

X cu r-l <

0)

O

CU <

cu

0) <

H

X

Eh tu

X

Eh §11

O

CO σ

to

Eh

O

U £h

O

U

E<

Eh

O

Eh

U

Eh

U <

O

U

Eh

O u

Eh

O o

Eh

Eh <

Eh

O

Eh

U

Eh

Eh <

U

U u«£:

EhCD

O

CO

O

CD

CL

O o

jo i

I

O	3
Eh	oi
Eh	U)
o	3
Eh	01
Eh	o
υ	to
u
o	<
Eh Eh	3 01	LQ
U	tj	'T
u	c 01	<
2	<	o
2	ai	co
Eh <	»-H W	O
O <	U >1	ω CL
in

LD

O jo i

Sal I Sali SD i----bioA-----5‘-tacataaaccttgccttcgtcgacgcgtcgactctagggtttacaagtcgattatgacaacggacgatcttgccttt-3'

TyrIleAsnLeuAlaPheValAspAlaSerThrLeuGlyPheThrSerArgLeu £1ETThrThrAspAspLeuAla Phe

177 635

Fig. 4A pbioB::lacZ-2 bioB - 0=

BamHI NcoI

5'-AGGAAACAGGATCCATGGCT 3 *-TCCTTTGTCCTAGGTACCGA

SD SD Met

BamHI

5'-AGGAAACAG 3' -TCCTTTGTCCTAG^

SD

GATCCATGGCT

GTACCGA

Met

Klenow fill-in * -AGGAAACAGgATjZ· 3'-TCCTTTGTCĆTAfif

SD SD

NcoI

GATCCATGGCT jCTAGjGTACCGA

Met

KpnI linker pbioB:;lacZ/KpnI (BamHI) Kpnl_BamHI NcoI 5' -AGGAAACAGGATifcGGTAĆĆGfeATCCATGGCT 3' -TCCTTTGTCCTAgjGCCATGGCĆTAGGTACCGA

SD SD Met | KpnI / NcoI (BamHI)

5' -AGGAAACAGGATJZCGGTAC CATGGCT

3'-TCCTTTGTCCTAgGC CGA

SD SD

Ligation with 985E (BamHI) ’ -AGGAAACAGGATJZCGGTAC CATGGCT ’ -TCCTTTGTCCTAgGC^TG7iAAfĆĆTĆĆACTGATC~AGTAŚCGA

SD SD ' “Mef

Klenow fill-in pbioB::lacZ/985E (BamHI) Kpnty SpeI ’ -AGGAAACAGGAT^CGGTACCTTAGGAGGTGĄCTAGńCATGGCT 3 ’ -TCCTTTGTCCTAgGCCATGGAATCĆTĆĆACTGATĆAGTACCGA SD

SD

Met

177 635

Fig. 4B bioB_c

Kpnl . Spel pbioB: : lacZ/985E 5 ’ - AGGAAACAGGATCGGTACCTTAGGAGGTGACTAGTCATGGCT 3 ' -TCCTTTGTCCTAGCCATGGAATCCTCCACTGATCAGTACCGA

SD SD SD Met

Kpnl / Spel

5'-AGGAAACAGGATCGGTAC 3'-TCCTTTGTCCTAGC

CTAGTCATGGCT

AGTACCGA

Met

Oligonucleotides

SD17

TT

3'-CATGGAATCCTCTGATC

SD19

TT TT

3' -CATGGAATCCTCAATGATC C

SD21

TT TTTT ' -CATGGAATCCTCAAAATGATC C C

Ligation Klenow fill-in pbioB::lacZ/16

Kpnl Spel

5' -AGGAAACAGGATCGGTACCTAAGGAGGTTTACTAGTCATGGCT 3' -TCCTTTGTCCTAGCCATGGATTCCTCCAAATGATCAGTACCGA

SD SD SD Met pbioB::iacZ/9

Kpnl Spel ’ -AGGAAAĆAGGATCGGTACCTAAGGAGACTAGTCATGGCT 3 ’ -TCCTTTCTCCTAGCCATGGATTCCTCTGATCAGTACCGA

SD SD SD Met

177 635

Fig. 6A

Hindlll Hindll

5'-AagctTactccccatccccctgttgacAattaatcatcggctcgtataatgtgtggaatt

-35 pfcas. -10 +i

KpnI Saul , Spel bioB 61 GTGAGCGGATAACAATTTCACACAGGAAACAGGATCGGTACCTAĄGGĄGACTAGTCATGG

SD METAla

121 CTCACCGCCCACGCTGGACATTGTCGCAAGTCACAGAATTATTTGAAAAACCGTTGCTGG

HisArgProArgTrpThrLeuSerGlnValThrGluLeuPheGluLysProLeuLeuAsp

181 ATCTGCTGTTTGAAGCGCAGCAGGTGCATCGCCAGCATTTCGATCCTCGTCAGGTGCAGG

LeuLeuPheGluAlaGlnGlnValHisArgGlnHisPheAspProArgGlnValGlnVal

241 TCAGCACGTTGCTGTCGATTAAGACCGGAGCTTGTCCGGAAGATTGCAAATACTGCCCGC

SerThrLeuLeuSerlleLysThrGlyAlaCysProGluAspCysLysTyrCysProGln

01 AAAGCTCGCGCTACAAAACCGGGCTGGAAGCCGAGCGGTTGATGGAAGTTGAACAGGTGC

SerSerArgTyrLysThrGlyLeuGluAlaGluArgLeuMETGluValGluGlnValLeu pssHII

361 TGGAGTCGGCGCGCAAAGCGAAAGCGGCAGGATCGACGCGCTTCTGTATGGGCGCGGCGT

GluSerAlaArgLysAlaLysAlaAlaGlySerThrArgPheCysMETGlyAlaAlaTrp

21 GGAAGAATCCCCACGAACGCGATATGCCGTACCTGGAACAAATGGTGCAGGGGGTAAAAG

LysAsnProHisGluArgAspMETProTyxLeuGluGlnMETValGlnGlyValLysAla

81 CGATGGGGCTGGAGGCGTGTATGACGCTGGGCACGTTGAGTGAATCTCAGGCGCAGCGCC

METGlyLeuGluAlaCysMETThrLeuGlyThrLeuSerGluSerGlnAlaGlnArgLeu

Nrul

541 tćgcgSacgccgggctggattactacaaccacaacctggacacctcgccggagttttacg

AlaAsnAlaGlyLeuAspTyrTyrAsnHisAsnLeuAspThrSerProGluPheTyrGly

01 GCAATATCATCACCACACGCACTTATCAGGAACGCCTCGATACGCTGGAAAAAGTGCGCG

AsnIleIleThrThrArgThrTyrGlnGluArgLeuAspThrLeuGluLysValArgAsp

61 ATGCCGGGATC AAAGTCTGTTCTGGCGGCATTGTGGGCTTAGGCG AAACGGTAA AAGATC

AlaGlyIleLysValCysSerGlyGlyIleValGlyLeuGlyGluThrValLysAspArg

21 gcgccggattattgctgcaactggcaaacctgccgacgccgccggaaagcgtgccaatca

AlaGlyLeuLeuLeuGlnLeuAlaAsnLeuProThrProProGluSerValProIleAsn

781 ACATGCTGGTGAAGGTGAAAGGCACGCCGCTTGCCGATAACG ATG ATGTCGATGCCTTTG

METLeuValLysValLysGlyThrProLeuĄlaAspAsnAspAspValAspAlaPheAsp

177 635

Fig. 6B (BspHI)

841 attttattcgcaccattgcggtcgcgcggatcatgStgccaacctcttacgtgcgccttt PheIleArgThxIleAlaValAlaArgIleMETMETProThrSerTyrValArgLeuSer

01 CTGCCGGACGCGAGCAGATGAACGAACAGACTCAGGCGATGTGCTTTATGGCAGGCGCAA

AlaGlyArgGluGlnMETAsnGluGlnThrGlnAlaMETCysPheMETAlaGlyAlaAsn

61 ACTCGATTTTCTACGGTTGCAAACTGCTGACCACGCCGAATCCGGAAGAAGATAAAGACC

SerllePheTyrGlyCysLysLeuLeuThrThrProAsnProGluGIuAspLysAspLeu

1021 TGCAACTGTTCCGCAAACTGGGGCTAAATCCGCAGCAAACTGCCGTGCTGGCAGGGGATA

GlnLeuPheArgLysLeuGlyLeuAsnProGlnGlnThrAlaValI»euAlaGlyAspAsn

Sspl

1081 acgaacaacagcaacgtcttgaacaggcgctgatgaccccggacaccgacćaatatAca

GluGlnGlnGlnArgLeuGluGlnAlaLeuMETThrProAspThrAspGluTyrTyrAsn bioF

1141 ĄCGCGGCAGCATTATGAGCTGGCAGGAGAAAATCAACGCGGCGCTCGATGCGCGGCGTGC SD METSerTrpGlnGluLysIleAsnAlaAlaLeuAspAlaArgArgAla

AlaAlaAlaLeu***

1201 TGCCGATGCCCTGCGTCGCCGTTATCCGGTGGCGCAAGGAGCCGGACGCTGGCTGGTGGC AlaAspAlaLeuArgArgArgTyrProValAlaGlnGlyAlaGlyArgTrpLeuValAla

1261 GGATGATCGCCAGTATCTGAACTTTTCCAGTAACGATTATTTAGGTTTAAGCCATC ATCC AspAspArgGlnTyrLeuAsnPheSerSerAsnAspTyrLeuGlyLeuSerHisHisPro

1321 GCAAATTATCCGTGCCTGGCAGCAGGGGGCGGAGCAATTTGGCATCGGTAGCGGCGGCTC GlnllelleArgAlaTrpGlnGlnGlyAlaGluGlnPheGlylleGlySerGlyGlySer

1381 CGGTCACGTCAGCGGTTATAGCGiTGGTGCATCAGGCACTGGAAGAAGAGCTGGCCGAGTG GlyHisValSerGlyTyrSerValValHisGlnAlaLeuGluGluGluLeuAlaGluTrp

1441 GCTTGGCTATTCGCGGGCACTGCTGTTTATCTCTGGTTTCGCCGCTAATCAGGCAGTTAT LeuGlyTyrSerArgAlaLeuLeuPheIleSerGlyPheAlaAlaAsnGlnAlaValIle

AvaII

1501 TGCCGCGATGATGGCGAAAGASGACĆfeTATTGCTGCCGACCGGCTTAGCCATGCCTC ATT AlaAlaMETMETAlaLysGluAspArglleAlaAlaAspArgLeuSerHisAlaSerLeu

1561 GCTGGAAGCTGCCAGTTTAAGCCCGTCGCAGCTTCGCCGTTTTGCTCATAACGATGTCAC LeuGluAlaAlaSerLeuSerProSerGlnLeuArgArgPheAlaHisAsnAspValThr

1621 TCATTTGGCGCGATTGCTTGCTTCCCCCTGTCCGGGGCAGCAAATGGTGGTGACAGAAGG HisLeuAlaArgLeuLeuAlaSerProCysProGlyGlnGlnMETValValThrGluGly

177 635

Fig. 6C

1681 CGTGTTCAGCATGGACGGCGATAGTGCGCCACTGGCGGAAATCCAGCAGGTAACGCAACA ValPheSerMETAspGłyAspSerAlaProLeuAlaGluIleGlnGlnValThrGlnGln

1741 GCACAATGGCTGGTTGATGGTCGATGATGCCCACGGCACGGGCGTTATCGGGGAGCAGGG HisAsnGlyTrpLeuMETValAspAspAlaHisGlyThrGlyValIleGlyGluGlnGly

PvuII

1801 GCGCGGSAGCTGĆTGGCTGCAAAAGGTAAAACCAGAATTGCTGGTAGTGACTTTTGGC AA ArgGlySerCysTrpLeuGlnLysValLysProGluLeuLeuValValThrPheGlyLys

1861 AGGATTTGGCGTCAGCGGGGCAGCGGTGCTTTGCTCCAGTACGGTGGCGGATTATCTGCT GlyPheGlyValSerGlyAlaAlaValLeuCysSerSerThrValAlaAspTyrLeuLeu

1921 GCAATTCGCCCGCCACCTTATCTACAGCACCAGTATGCCGCCCGCTCAGGCGCAGGCATT GlnPheAlaArgHi sLeulleTyrS erThrS erMETProPr oAlaGlnAl aGlnAl aLeu

1981 ACGTGCGTCGCTGGCGGTCATTCGCAGTGATGAGGGTGATGCACGGCGCGAAAAACTGGC ArgAlaSerLeuAlaValIleArgSerAspGluGlyAspAlaArgArgGluLysLeuAla

Wlul

2041 GGCACTCATTACGCGŻFTTTCGTGCCGGAGTACAGGATTTGCCGTTTACGCTTGCTGATTC AlaLeuIleThrArgPheArgAlaGlyyalGlnAspLeuProPheThrLeuAlaAspSer

2101 ATGCAGCGCCATCCAGCCATTGATTGTCGGTGATAACAGCCGTGCGTTACAACTGGCAGA CysSerAlaIleGlnProLeuIleValGlyAspAsnSerArgAlaLeuGlnLeuAlaGlu

2161 AAAACTGCGTCAGCAAGGCTGCTGGGTCACGGCGATTCGCCCGCCAACCGTACCCGCTGG LysLeuArgGlnGlnGlyCysTrpValThrAlaIleArgProProThrValProAlaGly

Fspl , EcoRV

2221 TACTGCGCGACTGCGCTTAACGCTAACCGĆTGCGCATG AAATGCAÓGATATĆGACCGTCT ThrAlaArgLeuArgLeuThrLeuThrAlaAlaHisGluMETGlnAspIleAspArgLeu bioC

2281 GCTGGAGGTGCTGCATGGCAACGGTTAATAAACAAGCCATTGCAGCGGCATTTGGTCGGG

SD METAlaThrValAsnLysGlnAlaIleAlaAlaAlaPheGlyArgAla

LeuGluValLeuHisGlyAsnGly******

Bglll

2341 CAGCCGCACACTATGAGC AACATGCSGATC?ACAGCGCC AGAGTGCTG ACGCCTTACTGG

AlaAlaHisTyrGluGlnHisAlaAspLeuGlnArgGlnSerAlaAspAlaLeuLeuAla (AvaII)

2401 CAATGCTTCCACAGCGTAAATACACCCACGTACTGGACGCGGGTTGTGG ACCTGGCTGGA

METLeuProGlnArgLysTyrThrHisValLeuAspAlaGlyCysGlyProGlyTrpMET

Bąlll

2461 tgagccgccactggcgggaacgtcacgcgcaggtgacggccttSgatcTctcgccgccaa

SerArgHisTrpArgGluArgHisAlaGlnValThrAlaLeuAspLeuSerProProMET

177 635

Fig. 6D

EcoRV

2521 TGCTTGTTCAGGCACGCCAGAAGGATGCCGCAGACCATTATCTGGCGGGAGATATCGAAT LeuValGXnAlaArgGlnLysAspAlaAlaAspHisTyrLeuAlaGlyAspIleGluSer

2581 CCCTGCCGTTAGCGACTGCGACGTTCGATCTTGCATGGAGCAATCTCGCAGTGCAGTGGT

LeuProLeuAXaThxAlaThrPheAspLeuAlaTrpSerAsnLe.uAlaValGlnTxpCys

2641 GCGGTAATTTATCCACGGCACTCCGCGAGCTGTATCGGGTGGTGCGCCCCAAAGGCGTGG GXyAsnLeuSexThrAlaLeuArgGluLeuTyrArgValValArgProLysGlyValVal

2701 TCGCGTTTACCACGCTGGTGCAGGGATCGTTACCCGAACTGCATCAGGCGTGGCAGGCGG

AXaPheThrThrI.euValGXnGlySerLeuProGluLeuHisGlnAlaTrpGlnAlaVal

SphI

2761 TGGACGAGCGTCCSĆATG&AATCGCTTTTTACCGCCAGATGAAATCGAACAGTCGCTGA

AspGluArgProHisAlaAsnArgPheLeuProProAspGluIleGluGlnSerLeuAsn

2821 ACGGCGTGCATTATCAACATCATATTCAGCCCATCACGCTGTGGTTTGATGATGCGCTCA

G2.yValHisTyxGlnHisHisIleGlnProIleThrLeuTrpPheAspAspAlaLeuSer

BspHI

2881 gtgccatgcgttcgctgaaaggcatcggtgccacgcatct5catgSagggcgcgacccgc AlaMETArgSerLeuLysGlylleGlyAlaThrHisLeuHisGluGlyArgAspProArg Sspl Mlul

2941 GAATATTAACGCGTTCGCAGTTGCAGCGATTGCAACTGGCCTGGCCGCAACAGCAGGGGC

IleLeuThrArgSerGlnLeuGlnArgLeuGlnLeuAlaTrpProGlnGlnGlnGlyArg

EcoRV bioD15

3001 SatatEctctgacgtatcatctttttttgggągtgattgctcgtgagtaaacgttatttt SD xMETSerLysArgTyrPhe

TyrProLeuThrTyrHisLeuPheLeuGlyValIXeAlaArgGlu***

Snol

3061 GTCACCGGAACGGATACCGAAGTGGGGAAAACTGTCGCCAGTI^TGCASrTTTACAAGCC ValThrGXyThxAspThxGluValGlyLysThrValAlaSerCysAlaLeuLeuGlnAla

3121 GCAAAGGCAGCAGGCTACCGGACGGCAGGTTATAAACCGGTCGCCTCTGGCAGCGAAAAG AlaLysAlaAlaGlyTyrArgThrAlaGlyTyrLysProValAlaSerGlySerGluLys

Pstl

3181 accccggaaggtttacgcaatagcgacgcgctggcgttacagcgcaacagcagc5t5ca<? ThrProGluGlyLeuArgAsnSerAspAlaLeuAlaLeuGlnArgAsnSerSerLeuGln

PvuII _

3241 ĆT^GATTACGCAACAGTAAATCCTTACACCTTCGCAGAACCCACTTCGCCGCACATCATC

LeuAspTyxAlaThrValAsnProTyrThrPheAlaGluProThrSerProHisIleIle

177 635

Fig. 6E

BssHII BssHII

3301 AGCGCGCkAGAGGGCAGACCGATAGAATCATTGGTAATGAGCGCCGGATTAĆGCGCGC^TT

S erAlaGlnGluGl yArgProIleGluSerLeuValMETS er AlaGl yL euAr g Al aLeu

3361 GAACAACAGGCTGACTGGGTGTTAGTGGAAGGTGCTGGCGGCTGGTTTACGCCGCTTTCT GluGlnGlnAlaAspTrpValLeuValGluGlyAlaGlyGlyTrpPheThrProLeuSer

3421 GACACTTTCACTTTTGCAGATTGGGTAACACAGGAACAACTGCCGGTGATACTGGTAGTT AspThr PheThrPhe AlaAspTrpValThr GlnGluGlnLeuProVal IleLeuVal Val

Hindll

3481 GGTGTGAAACTCGGCTGTATTAATCACGCGATGTTGACTGCACAGGTAATACAACACGCC GlyValLysLeuGlyCysIleAsnHisAlaMETLeuThrAlaGlnValIleGlnHisAla

3541 GGACTGACTCTGGCGGGTTGGGTGGCGAACGATGTTACGCCTCCGGGAAAACGTCACGCT GlyLeuThrLeuAlaGlyTrpVaJLAlaAsnAspValThrProProGlyLysArgHisAla

3601 GAATATATGACCACGCTCACCCGCATGATTCCCGCGCCGCTGCTGGGAGAGATCCCCTGG GluTy rMETThrThrLeuThr Ar gMETI 1 eProAlaProL euLeuGlyGlulleProTrp

Hindll

Sali

3661 CTTGCAGAAAATCCAGAAAATGCGGCAACCGGAAAGTACATAAACCTTGCCTTCGTCGAĆ’ LeuAlaGluAsnProGluAsnAlaAlaThrGlyLysTyrIleAsnLeuAlaPheValAsp

Hindll

Mlul Sali bioA

3721 GCGTCGAĆTCTAGGGTTTACAAGTCGATTATGACAACGGACGATCTTGCCTTTGACCAAC

SD METThrThrAspAspLeuAlaPheAspGlnArg Al_aSerT_hrL,euG_l_y_PheThrSer_ArgLeu***

3781 GCCATATCTGGCACCCATACACATCCATGACCTCCCCTCTGCCGGTTTATCCGGTGGTGA

HisIleTrpHisProTyrThrSerMETThrSerProLeuProValTyrProValValSer

Hindll

3841 GCGCCGAAGGTTGCG AGCTGATTTTGTCTGACGGCAGACGCCTGSiTGACGGTATGTCGT

AlaGluGlyCysGluLeuIleLeuSerAspGlyArgArgLeuValAspGlyMETSerSer

3901 CCTGGTGGGCGGCGATCCACGGCTACAATCACCCGCAGCTTAATGCGGCGATGAAGTCGC

TrpTrpAlaAlalleHisGlyTyrAsnHisProGlnLeuAsnAlaAlaMETLysSerGln

3961 AAATTGATGCCATGTCGCATGTGATGTTTGGCGGTATCACCCATGCGCC AGCCATTGAGC

IleAspAlaMETSerHisValMETPheGlyGlyIleThrHisAlaProAlaIleGluLeu

021 TGTGCCGCAAACTGGTGGCGATGACGCCGCAACCGCTGGAGTGCGTTTTTCTCGCGGACT

CysArgLysLeuValAlaMETThrProGlnProLeuGluCysValPheLeuAlaAspSer

Scal

4081 CCGGTTCCGTAGCGGTGGAAGTGGCGATGAAAATGGCGTTGĆAGTACTGGC AAGCCAA AG

GlySerValAlaValGluValAlaMETLysMETAlaLeuGlnTyrTrpGlnAlaLysGly

ΠΊ 635

Fig. 6F

BssHII

4141 gcgaa'gcgćg?cagcgttttctgaccttccgcaatggttatcatggcgatacctttggcg GluAlaArgGlnArgPheLeuThrPheArgAsnGlyTyrHisGlyAspThrPheGlyAla

4201 CGATGTCGGTGTGCGATCCGGATAACTCAATGCACAGTCTGTGGAAAGGCTACCTGCCAG

METSerValCysAspProAspAsnSerMETHisSerLeuTrpLysGlyTyrLeuProGlu

4261 AAAACCTGTTTGCTCCCGCCCCGCAAAGCCGCATGGATGGCGAATGGGATGAGCGCG ATA

AsnLeuPheAlaProAlaProGlnSerArgMETAspGlyGluTrpAspGluArgAspMET

BspHI

4321 tggtgggctttgcccgcctgatggcggcgcatc<&catga!aatcgcggcggtgatcattg ValGlyPheAlaArgLeuMETAlaAlaHisArgHisGluIleAlaAlaValIleIleGlu FśpI

4381 AGCCGATTGTCCAGGGCGCAGGCGGGATGCGcjirGTACCATCCGGAATGGTTAAAACGAA

PxoXleValGlnGlyAlaGlyGlyMETArgMETTyrHisProGluTrpLeuLysArgIle Pvul NruI

4441 TCCGCAAAATATGCGATCGCGAAGGTATCTTGCTGATTGCCGACGAGATCGCCACTGGAT

ArgLy s I leCy sAspAr gGluGly IleLeuLeuI leAlaAspGluI 1 eAl aThrGlyPhe

4501 TTGGTCGTACCGGGAAACTGTTTGCCTGTGAACATGCAGAAATCGCGCCGGACATTTTGT

GlyArgThrGlyLysLeuPheAlaCysGluHisAlaGluIleAlaProAspIleLeuCys

4561 GCCTCGGTAAAGCCTTAACCGGCGGCACAATG ACCCTTTCCGCCACACTCACCACGCGCG

LeuGlyLysAlaLeuThrGlyGlyThrMETThrLeuSerAlaThrLeuThrThrArgGlu

Nsil

4621 AGGTTGCAGAAACCATCAGTAACGGTG AAGCCGGTTGCTTTATGCATGGGCCAACTTTTA

ValAlaGluThrIleSerAsnGlyGluAlaGlyCysPheMETHisGlyProThrPheMET

4681 TGGGCAATCCGCTGGCCTGCGCGGCAGCAAACGCCAGCCTGGCGATTCTCGAATCTGGCG

GlyAsnProLeuAlaCysAlaAlaAlaAsnAlaSerLeuAlalleLeuGluSerGlyAsp

PvuII

4741 actggcagcaacaggtggcggatattgaagtacagćtScgcgagcaacttgcccccgccc

TrpGlnGlnGlnValAlaAspIleGluValGlnLeuArgGluGlnLeuAlaProAlaArg

4801 GTGATGCCGAAATGGTTGCCGATGTGCGCGTACTGGGGGCCATTGGCGTGGTCGAAACCA

AspAlaGluMETValAlaAspValArgValLeuGlyAlaIleGlyValValGluThrThr

BamHI

4861 CTCATCCGGTGAATATGGCGGCGCTGCAAAAATTCTTTGTCGAACAGGGTGTCT^GATCĆ

HisProValAsnMETAlaAlaLeuGlnLysPhePheValGluGlnGlyValTrpIleArg

4921 GGCCTTTTGGCAAACTGATTTACCTGATGCCGCCCTATATTATTCTCCCGCAACAGTTGC

ProPheGlyLysLeuIleTyrLeuMETProProTyrllelleLeuProGlnGlnLeuGln

177 635

Fig. 6G

Hindll Hpal

4981 AGCGTCTGACCGCAGCGGTTAACCGCGCGGTACAGGATGAAACATTTTTTTGCCAATAAC ArgLeuThrAlaAlaValAsnArgAlaValGlnAspGluThrPhePheCysGln***

BspHI

5041 GAGAAGTCCGCGTGAGGGTTTCTGGCTACACTTTCTGCAAACAAGAAAGGAGGGTfrCATĆ SD MET

ORFI

5101 fiAACTCATCAGTAACGATCTGCGCGATGGCGATAAATTGCCGCATCGTCATGTCTTTAAC LysLeuIleSerAsnAspLeuArgAspGlyAspLysLeuProHisArgHisValPheAsn

Sspl

5161 GGCATGGGTTACGATGGCGATAATATTTCACCGCATCTGGCGTGGGATG ATGTTCCTGCG GlyMETGlyTyrAspGlyAspAsnIleSerProHisLeuAlaTrpAspAspValProAla

5221 GGAACGAAAAGTTTTGTTGTCACCTGCTACGACCCGGATGCGCCAACCGGCTCCGGCTGG GlyThrLysSerPheValValThrCysTyrAspProAspAlaProThrGlySerGlyTrp

Hindll

Hpal

5281 TGGCACTGGGTAGTTSTTAASrTACCCGCTGATACCCGCGTATTACCGCAAGGGTTTGGC TrpHisTrpValValValAsnLeuProAlaAspThrArgValLeuProGlnGlyPheGly

Mlul

5341 TCTGGTCTGGTAGCAATGCCAGACGGCGTTTTGCAGACGCG?ACCGACTTTGGTAAAACC SerGlyLeuValAlaMETProAspGlyValLeuGlnThrArgThrAspPheGlyLysThr

5401 GGGTACGATGGCGCAGCACCGCCGAAAGGCGAAACTCATCGCTACATTTTTACCGTTCAC GlyTyrAspGlyAlaAlaProProLysGlyGluThrHisArgTyrIlePheThrValHis

5461 GCGCTGGATATAGAACGTATTGATGTCGATGAAGGTGCCAGCGGCGCGATGGTCGGGTTT AlaLeuAspIleGluArgIleAspValAspGluGlyAlaSerGlyAlaMETValGłyPhe

5521 AACGTTCATTTCCACTCTCTGGCAAGCGCCTCGATTACTGCGATGTTTAGTTAATCACTC AsnValHisPheHisSerLeuAlaSerAlaSerIleThrAlaMETPheSer***

5581 TGCCAGATGGCGCAATGCCATCTGGTATCACTTAAAGGTATTAAAAACAACTTTTTGTCT

5641 TTTTACCTTCCCGTTTCGCTCAAGTTAGTATAAAAAAGCAGGCTTCAACGG ATTCATTTT

5701 TCTATTTCATAGCCCGGAGCAACCTGTGAACACATTTTCAGTTTCCCGTCTGGCGCTGGC

5761 ATTGGCTTTTGGCGTGACGCTGACCGCCTGTAGCTCAACCCCGCCCGATCAACGTCCTTC

Kpnl SacI EcoRl Pstl SphI Hindlll 5821 TGATCAAACCGCGCCTGGTACĆGAGCTĆGAATTĆCTGCAĆGCATGĆAAGCTT'- 3 '

177 635

Fig. 7 pB03

SspI

SphI

1.66 kb fragment — Ό —

Nru I

Smal

SphI kb fragment — n —

Claims

Zastrzeżenia patentowe

1 .Rekombinacyjny materiał genetyczny, stanowiący fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty, znamienny tym, że geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz są transkrybowane od wspólnego promotora.
2. Fragment DNA według zastrz. 1, -znamienny tym, że zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter.
3. Fragment DNA według zastrz. 1 albo 2, znamienny tym, że zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli.
4. Fragment DNA według zastrz. 1, znamienny tym, że jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
5. Fragment DNA według zastrz. 1, znamienny tym, że regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC
6. Fragment DNA według zastrz. 1, znamienny tym, że regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
7. Fragment DNA według zastrz. 1, znamienny tym, że regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
8. Fragment DNA według zastrz. 1, znamienny tym, że odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
9. Fragment DNA według zastrz. 1, znamienny tym, że geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.
10. Plazmid, znamienny tym, że zawiera fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty cechujący się tym, że we fragmencie dNa geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz są transkrybowane od wspólnego promotora.
11. Plazmid według zastrz. 10, znamienny tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter.
12. Plazmid według zastrz. 10 albo 11, znamienny tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli.
13. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
14. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC

177 635
15. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
16. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
17. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
18. Plazmid według zastrz. 10, znamienny tym, ze we fragmencie DNA geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.
19. Plazmid pBO30A-15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 względnie DSM 8554.
20. Plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozytu DSM 8555.
21. Mikroorganizm zawierający fragment DNA lub plazmid obejmujący ten fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty, cechujący się tym, że we fragmencie DNA geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz są transkrybowane od wspólnego promotora.
22. Mikroorganizm według zastrz. 21, znamienny tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter.
23. Mikroorganizm według zastrz. 21 albo 22, znamienny tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli..
24. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
25. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC
26. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
27. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
28. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
29. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.

177 635
30. Mikroorganizm według zastrz. 21, znamienny tym, że zawiera plazmid pBO30A15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 względnie DSM 8554.
31. Mikroorganizm według zastrz. 21, znamienny tym, że zawiera plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozytu DSM 8555.
32. Mikroorganizmy E. coli XL1-Blue, E. coli BM4062 i E. coli ED8767, każdy z nich zawierający plazmid pBO30A-13/9, złożone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak również ich genetyczne warianty i mutanty.
33. Mikroorganizm Agrobacterium/Rhizobium sp. HK4, zawierający plazmid pBO47, złożony pod numerem zgłoszenia DSM 8555, jak również jego genetyczne warianty i mutanty.
34. Biotechnologiczny sposób syntezy biotyny, w którym ulegające przemianie materii źródło węgla poddaje się fermentacji do biotyny z zastosowaniem mikroorganizmu, znamienny tym, że stosuje się mikroorganizm zawierający fragment DNA lub plazmid obejmujący ten fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty, cechujący się tym, że we fragmencie DNA geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz sątranskrybowane od wspólnego promotora.
35. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter.
36. Sposób według zastrz. 34 albo 35, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli.
37. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
38. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC
39. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
40. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:

AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT

GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
41. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
42. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.
43. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że zawiera plazmid pBO30A-15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 względnie DSM 8554.
44. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że zawiera plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozytu DSM 8555.

177 635
45. Sposób według zastrz. 34, znamienny tym, że jako mikroorganizm stosuje się mikroorganizm wybrany z grupy obejmującej E. coli XL1-Blue, E. coli BM4062 i E. coli ED8767, z których każdy zawiera plazmid pBO30A-13/9, złożone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak również ich genetyczne warianty i mutanty.
46. Sposób według zastrz. 34, znamienny tym, że jako mikroorganizm stosuje się mikroorganizm wybrany z grupy obejmującej Agrobacterium/Rhizobium sp. HK4, zawierający plazmid pBO47, złożony pod numerem zgłoszenia DSM 8555, jak również jego genetyczne warianty i mutanty.