PL243940B1

PL243940B1 - Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy

Info

Publication number: PL243940B1
Application number: PL437909A
Authority: PL
Inventors: Marta SKWARECKA; Marta Skwarecka; Grzegorz ZIELIŃSKI; Grzegorz Zieliński; Kasjan SZEMIAKO; Kasjan Szemiako; Dawid NIDZWORSKI; Dawid Nidzworski; Sabina ŻOŁĘDOWSKA; Sabina Żołędowska
Original assignee: Inst Biotechnologii I Medycyny Molekularnej
Priority date: 2021-05-19
Filing date: 2021-05-19
Publication date: 2023-11-06
Also published as: WO2022245230A1; EP4341389A1; WO2022245230A9; PL437909A1

Abstract

Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSB oraz sposób jej klonowania. Ponadto przedmiotem wynalazku jest wyizolowany plazmid rekombinantowy, startery oraz zastosowanie polimerazy do powielania specyficznych sekwencji wirusa SARS CoV-2.

Description

Białka SSB - (ang. Single Stranded DNA Binding protein - białka wiążące się do jednoniciowego DNA) występują we wszystkich organizmach żywych. Biorą udział we wszystkich procesach, w których generowane są fragmenty jednoniciowego DNA, takich jak: replikacja, rekombinacja i naprawa DNA. Chronią jednoniciowe DNA (ssDNA) przed degradacją i jednocześnie współdziałają z innymi białkami w komórce. Znane są białka SSB-podobne, które są białkami syntetyzowanymi przez komórki ssaków, drożdży, archeonów i bakterii. W zależności od źródła, z którego pochodzą, białka te różnią się masą cząsteczkową, ilością podjednostek wchodzących w skład natywnej cząsteczki, wielkością miejsca wiązania.

Mechanizm wiązania się białka z ssDNA polega na upakowaniu (ang. stacking) aromaty cznych reszt aminokwasowych między zasady w łańcuchu oligonukleotydowym oraz oddziaływaniu dodatnio naładowanych reszt aminokwasowych ze szkieletem fosforanowym w cząsteczce ssDNA. Wiązanie to jest na tyle silne, że nie rozpada się pod wpływem niskich stężeń NaCl. Do rozpadu kompleksu ssDNA - SSB w komórce potrzebne jest wysokie stężenie soli zawierających Mg2+. Długość fragmentu ssDNA wiązanego przez SSB ulega skróceniu o 35%.

Mimo przynależności białka NeqSSB do rodziny białek SSB odbiega ono swoimi cechami od klasycznych białek SSB, stąd określane jest jako białko NeqSSB-podobne. Białko to pochodzi z hipertermofilnego archeona Nanoarchaeum equitans, który pasożytuje w craenarchaeonie Ignicoccus hospitalis. Optymalne warunki wzrostu tego mikroorganizmu wymagają ściśle beztlenowych warunków i temperatury 90°C. Co ciekawe Nanoarchaeum equitans posiada najmniejszy znany genom składający się z 490,885 par zasad. W przeciwieństwie do większości znanych organizmów o obniżonych genomach, posiada pełny zestaw enzymów biorących udział w replikacji, naprawie i rekombinacji DNA, w tym białko SSB.

Białko NeqSSB podobnie jak inne białka z tej rodziny posiada naturalną zdolność wiązania DNA. Składa się z 243 reszt aminokwasowych, a w swojej strukturze ma jedną domenę OB (fig. 1). Wykazuje biologiczną aktywność jako monomer, podobnie do niektórych wirusowych białek SSB. Badania wskazują na jego nietypowe dla innych białek SSB zdolności wiązania wszystkich form DNA (ssDNA, dsDNA) oraz mRNA bez strukturalnych preferencji. Za wiązanie z kwasami nukleotydowymi odpowiadają domeny białka NeqSSB I, II i III - za domeny najsilniej wiążące odpowiedzialna jest domena II i III. Ponadto białko charakteryzuje się wysoką termostabilnością. Czas półtrwania przy zachowaniu aktywności bi ologicznej wynosi 5 min w 100°C, natomiast temperatura topnienia to 100,2°C.

Polimeraza DNA to enzym, który odgrywa zasadniczą rolę w procesie replikacji i naprawie DNA. Znalazła ona zastosowanie w reakcji PCR (ang. Polymerase Chain Reaction), gdzie katalizuje proces syntezy DNA in vitro, odpowiadając za dołączanie kolejnych nukleotydów do końca 3’OH nici DNA. Oprócz właściwości polimeryzacyjnej może posiadać również zdolności do hydrolizy cząsteczek DNA dzięki obecności domeny egzonukleolitycznej. Pomimo tego, że polimerazy pełnią takie same funkcje tzn. są odpowiedzialne za syntezę nici DNA, to ich budowa i posiadane aktywności znacząco się różnią. Katalizują one mechanizm przyłączania kolejnych nukleotydów do końca 3’OH nici DNA. Budowa tych polimeraz zarówno u bakterii, archeonów jak i eukariotów wykazuje podobieństwo pod względem struktury i obecności 3 podstawowych subdomen palca, śródręcza i kciuka, którym przypisane są ściśle określone funkcje. Polimerazy DNA wykazują zróżnicowanie pod względem szybkości katalizy, procesywności, obecności lub braku współdziałających podjednostek białkowych, czy wykazywaniu aktywności nukleolitycznej. Ogólny podział polimeraz DNA klasyfikuje je do 7 różnych rodzin: A, B, C, D, X, Y i RT. Przedstawicieli polimerazy DNA bakteryjnych odnaleźć można w rodzinach A, B, C, X, Y, archenów B, D, X i Y, a polimerazy DNA eukariotyczne należą do rodzin A, B, X, Y i RT.

Podstawowym zadaniem polimerazy DNA jest dobudowywanie nukleotydów komplementarnych do końca 3’OH łańcucha DNA. W mechanizmie tym można zaobserwować kilka istotnych etapów. Pierwszy polega na przyłączeniu enzymu do matrycy DNA. Powstały kompleks DNA-DNA asocjuje odpowiednie dNTP (trifosforany deoksyrybonukeotydów) w wyniku ataku nukleofilowego końca 3’OH na atom fosforu nukleotydu. Ostatni etap prowadzi do powstania wiązania fosfodiestrowego i uwolnieniu pirofosforanu. Pierwszy etap, czyli związanie polimerazy z matrycą - starterem wymusza zmianę konformacji subdomeny kciuka i ścisłe dopasowanie się do cząsteczki DNA. Subdomena kciuka obraca się względem subdomeny śródręcza, a zakonserwowane reszty na szczycie kciuka wykonują przeciwległy skręt. W ten sposób polimeraza DNA oddziałuje z małym rowkiem DNA za pośrednictwem odpowiednio wygiętej subdomeny kciuka. Wszystko to sprawia, że 3 zasady w obrębie startera ulegają wygięciu i cząsteczka DNA znajduje się wystarczająco blisko miejsca aktywnego enzymu. Wzmocnienie wygięcia nici DNA umożliwione jest dzięki kolejnym interakcjom z polimerazą. Tym razem subdomena śródręcza determinuje rotację dwóch pierwszych zasad matrycy DNA o odpowiednio 900 i 1800, obracając w ten sposób zasady na zewnątrz helisy i tworząc konformację w kształcie litery S. Konformacja ta jest więc indukowana przez oddziaływanie DNA z subdomeną kciuka, śródręcza oraz interakcją matrycy z centrum aktywnym.

Najpowszechniej używaną polimerazą DNA pochodzenia bakteryjnego jest wyizolowana z Thermus aquaticus polimeraza Taq. Ten odkryty w 1976 roku enzym, który zrewolucjonizował oblicze biologii molekularnej, zbudowany jest z 832 reszt aminokwasowych o masie molekularnej 94 kDa . Warto zauważyć, że jego najwyższa aktywność osiągana jest w temperaturze od 72°C do 80°C. Polimeryzacja możliwa jest dzięki przyłączeniu DNA do centrum aktywnego enzymu, w którym najistotniejsze reszty aminokwasowe to Arg682, Lys785, Tyr766, Arg821, His811.

Polimeraza DNA Taq posiada trzy domeny: egzonukleolityczną 5’^3‘, nieaktywną egzonukleolityczną 3’^5’ oraz polimeryzacyjną 5’^3’. Delecja domeny egzonukleolitycznej np. u polimerazy DNA Taq, pozwala na uzyskanie funkcjonalnego białka, ale o częściowo zmienionych cechach w stosunku do enzymu natywnego. Pozbawiona aktywności 5’^3’ egzonukleazy polimeraza DNA TaqA289 (TaqStoffel, KlenTaq) charakteryzuje się zwiększoną termostabilnością, nieco zwiększonym zapotrzebowaniem na jony Mg2+, natomiast nowo zsyntetyzowana nić DNA obdarzona jest mniejszą liczbą błędów.

Badania polegające na otrzymaniu polimerazy DNA z delecją kolejnych reszt aminokwasowych z N-końca wykazały, że krytyczne dla zachowania optymalnej termostabilności i aktywności reszty aminokwasowe znajdują się w regionie od 303 do 335. Struktura krystalograficzna enzymu wykazuje, że reszty aminokwasowe z tego obszaru formują trzy β-kartki oddziałujące z pozostałą częścią enzymu.

Obecnie reakcje PCR wykazują bardzo szerokie zastosowanie w diagnostyce, biologii molekularnej czy inżynierii genetycznej. Ich efektywność jest nieodłącznie związana ze stosowaną polimerazą, której stawiane są coraz większe wymagania związane z amplifikacją problematycznych matryc DNA, dlatego konieczne jest poszukiwanie polimeraz DNA o nowych, przydatnych cechach lub ulepszanie już stosowanych. Przedstawione przez nas rozwiązanie jakim jest polimeraza Taq w fuzji z białkiem wiążącym DNA pozwoli na zwiększenie jej powinowactwa do matrycy DNA, a tym samym korzystnie wpłynie na pożądane w diagnostyce cechy tj. procesywność, wydajność, amplifikacja trudnych matryc bogatych w GC czy amplifikacja DNA z próbek klinicznych pozwalająca na znaczne przyspieszenie diagnoz y w przypadku wielu chorób bakteryjnych lub wirusowych oraz uwiarygodnienie otrzymanych wyników.

Celem wynalazku jest stworzenie nowej polimerazy TaqPol z białkiem NeqSSB, która będzie miała zastosowanie do powielania specyficznych sekwencji wirusa SARS CoV-2.

Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSB, wiążącym wszystkie rodzaje DNA i RNA. Modyfikacjom poddano trzy warianty polimerazy TaqPol-NeqSSB:

- TaqPol-NeqSSBFull - cała sekwencja aminokwasowa polimerazy DNA I Taq z całą sekwencją aminokwasową białka NeqSSB (SEQ. ID 1);

- TaqPol-NeqSSBII+III - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 2); - TaqPol-NeqSSBIII - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 3).

Wszystkie warianty polimerazy TaqPol połączono z białkiem NeqSSB na C-końcu polimerazy za pomocą 6-aminokwasowego linkera (SEQ. ID 4).

Przedmiotem wynalazku jest Polimeraza TaqPol-NeqSSB o SEQ. ID 1-3. Przedmiotem wynalazku jest również sposób klonowania polimerazy TaqPol-NeqSSB o SEQ. ID 1-3, którą otrzymuje się DNA insertu przeznaczonego do klonowania, które polega na przeprowadzeniu dwóch niezależnych reakcji PCR:

- w pierwszej reakcji amplifikacji otrzymuje się produkt o sekwencji nukleotydowej odpowiadającej sekwencji genu kodującego polimerazę DNA Taq z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu;

- drugi produkt zawiera sekwencję nukleotydową genu kodującego białko NeqSSB wiążąceg o DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu;

- matrycę do reakcji PCR stanowi wyizolowane genomowe DNA,

- otrzymane produkty w dwóch powyższych reakcjach rozdziela się w żelu agarozowym z bromkiem etydyny i poddaje się izolacji z żelu.

Sposób, gdzie produkty dwóch reakcji PCR służą, jako inserty w reakcji Gibsona, gdzie:

- Trawienie plazmidu pET30EKLIC

- w celu zlinearyzowania plazmidu pET30EKLIC poddaje się go trawieniu enzymem BamHI i NdeI (NEB), które tną w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA,

- reakcję trawienia DNA wektora prowadzi się przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu,

- potrawiony plazmid poddaje się rozdziałowi elektroforetycznemu i izoluje się;

- Reakcja składania genów

- reakcję Gibsona prowadzi się w termocyklerze w 50°C przez 60 min, gdzie mieszanina zawiera bufor, nukleotydy, enzymy, wodę jałową, insert I, Insert II, wektor,

- po reakcji mieszanina dodaje się do świeżo przygotowanych komórek kompetentnych E. coli TOP10,

- otrzymaną mieszaninę inkubuje się w lodzie przez 40 min, po tym czasie inkubacji przeprowadza się szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie, po szoku termicznym komórki poddaje się 60 min inkubacji w 37°C z dodatkiem 600 ml LB, po tym czasie komórki wiruje się (10 min, 1800 obr/min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny, płytki inkubowano przez ok. 16 h w 37°C.

Sposób, gdzie w celu uzyskania białka fuzyjnego Taq-NeqSSB, komórki E. coli BL RIL poddaje się transformacji z użyciem DNA plazmidu rekombinantowego pET30-TaqPol-NeqSSB i przeprowadza się produkcję pożądanych białek fuzyjnych, hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzi się przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodaje się IPTG do końcowego stężenia 0,1 mM; po indukcji hodowle prowadzi się jeszcze przez 5 h, po czym wiruje się (10 min, 5000 obr/min) i poddaje się oczyszczaniu metodą metalopowinowactwa; rezultaty produkcji białek analizuje się za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących.

Przedmiotem wynalazku jest również wyizolowany plazmid rekombinantowy, który obejmuje fragment nukleotydowej sekwencji białka kodujące polimerazę TaqPol-NeqSSB Full od 5076 do 8336 z plazmidu pET30EKLIC o SEQ. ID. 9, TaqPol-NeqSSBII+III od 5076 do 8159 z plazmidu pET30EKLIC o SEQ. ID. 10 oraz TaqPol-NeqSSBIII od 5076 do 7886 z plazmidu pET30EKLIC o SEQ. ID. 11.

Wyizolowany plazmid pET30-TaqPol-NeqSSB Full o sekwencji SEQ.ID. 9, plazmid pET30-TaqPol-NeqSSBII+III o sekwencji SEQ.ID. 10, plazmid pET30-TaqPol-NeqSSBIII o sekwencji SEQ.ID. 11.

Przedmiotem wynalazku są również startery do klonowania polimerazy TaqPol-NeqSSB

Full/II+III/III o sekwencjach SEQ.ID?12-23.

Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSBFull/II+III/III o SEQ. ID 1,2 i 3 do zastosowania do powielania specyficznych sekwencji wirusa SARS CoV-2.

Opis figur:

Fig. 1 - schematyczne przedstawienie białka NeqSSB z podstawową domeną OB

Fig. 2 - przedstawia schemat klonowania metodą Gibsona.

Fig. 3 - przedstawia rozdział elektroforetyczny przedstawiający wyniki oczyszczania polimerazy DNA TaqPol-NeqSSBFul (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) na kolumnie ze złożem His-Trap

M - Białkowy marker wielkości (14,4-116 kDa) o wielkości białek wzorcowych: 116; 66,2; 45; 35; 25; 18,4; 14,4 kDa;

- Lizat komórkowy E. coli BL RIL/pET30-TaqPol-NeqSSBFull/II+III/III po sonikacji i denaturacji białek gospodarza

- Frakcja niezwiązana z kolumną

- Frakcja po płukaniu buforem B (200 ml)

- Frakcja po elucji buforem C (30 ml)

Fig. 4 - przedstawia rozdział elektroforetyczny w 2% żelu agarozowym z bromkiem etydyny przedstawiający porównanie czułości polimerazy TaqPol-NeqSSBFull (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) w seryjnych 10-krotnych rozcieńczeniach matrycowego DNA

Fig. 5 - przedstawia wykres zależności fluorescencji barwnika SybrGreen w czasie prowadzenia reakcji RT qPCR z zastosowaniem polimerazy TaqPol-NeqSSBFull (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) w reakcji identyfikacji wirusa SARS-CoV-2 bezpośrednio z wymazu.

Opis sekwencji:

SEQ. ID 1 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBFull, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z białkiem NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.

SEQ.ID.2 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBII+III, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z domeną II i III białka NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.

SEQ.ID 3 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBIII, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z domeną III białka NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.

SEQ.ID. 4 - przedstawia sekwencję aminokwasową łącznika/linkera

SEQ.ID.5 - przedstawia sekwencję aminokwasową polimerazy TaqPol

SEQ.ID. 6 - przedstawia sekwencję aminokwasową białka NeqSSB.

SEQ.ID. 7 - przedstawia sekwencję aminokwasową II domeny białka NeqSSB

SEQ.ID. 8 - przedstawia sekwencję aminokwasową III domeny białka NeqSSB

SEQ.ID. 9 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSBFull

SEQ.ID. 10 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSB II+III

SEQ.ID. 11 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSBIII

SEQ.ID. 12-23 - przedstawia sekwencje starterów

Wynalazek ilustrują następujące przykłady wykonania, niestanowiące jego ograniczenia Przykład 1:

I. Gen kodujący polimerazę, wektor ekspresyjny, system ekspresyjny

a) Gen kodujący polimerazę: TaqPol-NeqSSBFull; TaqPol-NeqSSBII+III; TaqPol-NeqSSBIII

Sekwencję aminokwasową polimerazy TaqPol-NeqSSB Full//II+III/III (TaqPol-NeqSSBFull; TaqPol-NeqSSBII+III; TaqPol-NeqSSBIII) wydłużono o sekwencję domeny histydynowej niezbędnej do efektywnego oczyszczania polimerazy metodą metalopowinowactwa. Domena 6xHis przyłączona została na C-końcu polimerazy. Sekwencja nukleotydowa polimerazy (TaqPol-NeqSSBFull, TaqPol-NeqSSBII+III, TaqPol-NeqSSBIII) została przedstawiona na SEQ. ID 1-3.

Polimeraza TaqPol-NeqSSB, wiążącym wszystkie rodzaje DNA i RNA. Modyfikacjom poddano trzy warianty polimerazy TaqPol-NeqSSB: - TaqPol-NeqSSBFull - cała sekwencja aminokwasowa polimerazy DNA I Taq z całą sekwencją aminokwasową białka NeqSSB (SEQ. ID 1);

- TaqPol-NeqSSBII+III - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 2);

- TaqPol-NeqSSBIII - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 3).

b) Wektor ekspresyjny

Przy wyborze wektora do ekspresji enzymu kierowano się możliwością:

- selekcji antybiotykowej klonów

- przeprowadzenia klonowania i jego namnożenia w komórkach bakteryjnych

- obecność promotora umożliwiającego łatwy sposób kontroli i indukcji ekspresji

Wybrano wektor pET30EKLIC niosący gen oporności na kanamycynę, bakteryjne Ori replikacji oraz sekwencję promotora laktozowego T7 pozwalającą na indukcję ekspresji za pomocą IPTG. Wektor posiada miejsca rozpoznania dla enzymów restrykcyjnych BamHI i Ndel, które tną DNA plazmidowe w dwóch miejscach, dając dwa niekomplementarne lepkie końce niezbędne na etapie klonowania

c) System ekspresyjny

Do ekspresji termostabilnej polimerazy fuzyjnej Pwo-NeqSSB wybrano system prokariotyczny E. coli, który jest najczęściej stosowanym układem do nadprodukcji białek zarówno na skalę laboratoryjną jak i przemysłową. Wytypowano szczepy IP-Free dostępne przez firmę Promega: Escherichia coli BL21(DE3)pLysS.

PL 243940 Β1

d) Zaprojektowanie starterów SEQ.ID 12-23

Polimeraz fuzyjna składa się z dwóch białek, które kodowane są przez dwa niezależne geny. Wymuszało zastosowanie metody klonowania, która umożliwi wklonowanie kilku fragmentów DNA jednocześnie. Zastosowano metodę Gibsona, która wjednej reakcji umożliwia wygenerowanie lepkich końców (egzonukleaza 5’^3’), wydłużanie końców DNA (polimeraz DNA) oraz kowalencyjne połączenie dwóch końców DNA (ligaza DNA) kilku fragmentów jednocześnie. Zastosowano zestaw OverLap (firmy A&A Biotechnology). Schemat klonowania przedstawia fig 2.

Przykład 2:

II. Klonowanie polimerazy Taq-NeqSSB

a) Amplifikacja produktów przeznaczonych do klonowania

Otrzymanie DNA insertu przeznaczonego do klonowania polegało na przeprowadzeniu dwóch niezależnych reakcji PGR. Pierwsza z reakcji amplifikacji pozwoliła na otrzymanie produktu o sekwencji nukleotydowej odpowiadającej sekwencji polimerazy DNA z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu. Drugi produkt zawierał sekwencję nukleotydową białka wiążącego DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu. Matrycę do reakcji PCR stanowiło wyizolowane genomowe DNA. Otrzymane produkty w dwóch powyższych reakcjach rozdzielono w żelu agarozowym z bromkiem ety dyny i poddano izolacji z żelu z wykorzystaniem zestawu Gel-Out Concentrator (A&A Biotechnology). Produkty tych dwóch reakcji PCR posłużyły, jako inserty w reakcji Gibsona z wykorzystaniem zestawu OverLap Assembly mix (A&A Biotechnology).

b) Trawienie plazmidu pET30EKLIC

W celu zlinearyzowania plazmidu pET30EKLIC poddano go trawieniu enzymem BamHI i Ndel (NEB), który tnie w dwóch miejscach, zostawiając niekomplementarne do siebie końce DNA. Reakcja trawienia DNA wektora prowadzona była przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu zalecanych przez producenta.

Potrawiony plazmid poddano rozdziałowi elektroforetycznemu i wyizolowano zestawem Gel-Out Concentrator (A&A Biotechnology).

c) Reakcja składania genów

Reakcja Gibsona z wykorzystaniem zestawu OverLap Assembly mix prowadzona była w termocyklerze w 50°C przez 60 min. Skład mieszaniny znajduje się poniżej:

Składnik Ilość [ml]

Bufor 5^OverLap Assembly (A&A 4

Biotechnology)

Nuklcotydy [10 mM]2

Enzymy - OverLap ’ Assembly i W Λ 2

Biotechnology) ·

Woda jałowa3

Insert ! [I5:0ng/mlJ^-3

Insert II [150ng/ml]3 •- · ——* , , yj •'iiŁWgs

Wektor [150ng/ml] -3 Objętość końcowa20

Po reakcji mieszanina dodawana była do świeżo przygotowanych komórek kompetentnych E. coli TOP 10. d) Transformacja komórek kompetentnych

Mieszaninę po reakcji Gibsona dodano do 100 ml komórek kompetentnych E. coli TOP 10. Otrzymaną mieszaninę inkubowano w lodzie przez 40 min. Po tym czasie inkubacji przeprowadzono szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie. Po szoku termicznym komórki poddano 60 min inkubacji w 37°C z dodatkiem 600 ml LB. Po tym czasie komórki zwirowano (10 min, 1800 obr/min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny. Płytki inkubowano przez ok. 16 h w 37°C.

Przykład 3:

III. Ekspresja i oczyszczanie polimerazy TaqPol-Neq SSB

W celu uzyskania białka fuzyjnego TaqPol-NeqSSB, komórki E. coli BL RIL poddano transformacji z użyciem DNA plazmidu rekombinantowego pET30-TaqPol-NeqSSBFull/II+III/III i przeprowadzono produkcję pożądanych białek fuzyjnych. Hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzono przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodano IPTG do końcowego stężenia 0,1 mM. Po indukcji hodowle prowadzono jeszcze przez 4 h, po czym zwirowano (10 min, 5000 obr/min) i poddano oczyszczaniu metodą metalopowinowactwa. Rezultaty produkcji białek analizowano za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących (SDS-PAGE) (fig 3). Masa molekularna białka obliczona przy pomocy programu komputerowego Expasy wynosiła 118,2 kDa:

TaqPol-NeqSSBFull:

Ilość aminokwasów: 1080

Masa molekularna: 121987,88

Teoretyczna wartość pI: 6,55

TaqPol-NeqSSBII+III:

Ilość aminokwasów: 1021

Masa molekularna: 115179,84

Teoretyczna wartość pI: 6,37

TaqPol-NeqSSBIII:

Ilość aminokwasów: 930

Masa molekularna: 104933,93

Teoretyczna wartość pI: 6,34

Wyniki rozdziałów elektroforetycznych przedstawiających stopień oczyszczenia i stężenie białek po każdym etapie oczyszczania przedstawia fig. 3.

Przykład 4:

IV. Aktywność i zastosowanie polimerazy TaqPol-NeqSSB

1) Zastosowanie polimerazy w klasycznej reakcji PCR z detekcją w żelu agarozowym - target fragment plazmidowego DNA pUC19 o wielkości 1000 pz w różnym stężeniu matrycowego DNA, (fig.4).

2) Zastosowanie polimerazy w reakcji real-time RT-PCR - identyfikacja genu Orf lab, E oraz ludzkiego genu RP z wykorzystaniem różnych matryc RNA: totalnego RNA wirusa SARS-CoV-2 oraz bezpośrednio z wymazu zainfekowanego wirusem SARS-CoV-2. (fig.5).

Literatura:

[1] Vieille C, Burdette DS, Zeikus JG. Thermozymes. Biotechnol Annu Rev. 1996;2:1-83.

[2] Hamilton SC, Farchaus JW, Davis MC. DNA polymerases as engines for biotechnology. Bio- techniques. 2001;31(2):370-6, 378-80, 382-3.

[3] Chien A, Edgar DB, Trela JM. Deoxyribonucleic acid polymerase from the extreme thermophile

Thermus aquaticus. J Bacteriol. 1976; 127(3): 1550-7.

[4] Vainshtein I, Atrazhev a, Eom SH, Elliott JF, Wishart DS, Malcolm B. Peptide rescue of an N-terminal truncation of the Stoffel fragment of Taq DNA polymerase. Protein Sci. 1996;5(9): 1785-92.

[5] Barnes WM. The fidelity of Taq polymerase catalyzing PCR is improved by an N-terminal dele- tion. Gene. 1992;112(1):29-35.

[6] Rittie L, Perbal B. Enzymes used in molecular biology: a useful guide. J Cell Commun Signal.

2008;2(1-2):25-45.

[7] Olszewski M, Balsewicz J, Nowak M, Maciejewska N, Cyranka-Czaja A, Zalewska-Piątek B, et al.

Characterization of a Single-Stranded DNA-Binding-Like Protein from Nanoarchaeum equitans - Nucleic Acid Binding Protein with Broad Substrate Specificity. PLoS One. 2015; 10:e0126563.

PL 243940 Β1

SEQUENCE LISTING <110> Instytut Biotechnologii i Medycyny Molekularnej <120> Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy <130>

<150> P.437909 <151> 2021-05-19 <160> 26 <170> BiSSAP 1.3.6 <210> 1 <211> 1080 < 212> PRT < 213> Artificial Sequence <220>

< 223> fusion two protein < 400> 1

Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu 15 10 15

Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly

25 30

Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala

PL 243940 Β1

Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val

5560

Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly

70 7580

Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu

9095

Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu

100 105110

Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys

115 120125

Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp

130 135140

Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly

145 150 155160

Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro

165 170175

Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn

180 185190

Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu

195 200205

Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu

210 215220

Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys

225 230 235240

Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val

245 250255

Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe

260 265270

Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu

275

280

285

PL 243940 Β1

Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly

290 295300

Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp

305 310 315320

Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro

325 330335

Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu

340 345350

Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro

355 360365

Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn

370 375380

ThrThr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu

385 390 395400

Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu

405 410415

Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu

420 425430

Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly

435 440445

Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala

450 455460

Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His

465 470 475480

Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg VaI Leu Phe Asp

485 490495

Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu LysThr Gly Lys Arg

500 505510

Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile

515 520525

Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr

530

535

540

PL 243940 Β1

Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu

545 550 555560

His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser

565 570575

Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin

580 585590

Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu GlyTrp Leu Leu Val Ala

595 600605

Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly

610 615620

Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr

625 630 635640

Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro

645 650655

Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly

660 665670

Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu

675 680685

Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg

690 695700

Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val

705 710 715720

Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg

725 730735

Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro

740 745750

Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu

755 760765

Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His

770775

780

PL 243940 Β1

Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala

785 790 795800

Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro

805 810815

Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu

820 825830

Gly Ser Gly Gly Val Asp Asp Glu Glu Glu Leu Ile Gin Leu Ile Ile

835 840845

Glu Lys Thr Gly Lys Ser Arg Glu Glu Ile Glu Lys Met Val Glu Glu

850 855860

Lys Ile Lys Ala Phe Asn Asn Leu Ile Ser Arg Arg Gly Ala Leu Leu

865 870 875880

Leu Val Ala Lys Lys Leu Gly Val Leu Tyr Lys Asn Thr Pro Lys Glu

885 890895

Lys Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly

900 905910

Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe

915 920925

Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile

930 935940

Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile

945 950 955960

Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile

965 970975

Asp Ser Tyr Lys Ile Leu Glu Ser Asp Leu Glu Ile Lys Pro Gin Lys

980 985990

Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr

995 10001005

Gin Lys Gly Thr He Val Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg

1010 10151020

Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp Trp Glu Ile Gly His

1025

1030

1035

1040

PL 243940 Β1

Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys

1045 10501055

Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala Thr Leu Lys Asp Leu

1060 10651070

Lys Ala Phe Lys Gly Glu Ala Asp

10751080 <210> 2 <211>1021 < 212> PRT < 213> Artificial Sequence <220>

< 223> fusion two protein < 400> 2

Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu

1015

Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly

2530

Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala

4045

Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val

5560

Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly

70 7580

Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu

9095

Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu

100

105

110

PL 243940 Β1

Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys

115 120125

Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp

130 135140

Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly

145 150 155160

Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro

165 170175

Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn

180 185190

Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu

195 200205

Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu

210 215220

Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys

225 230 235240

Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val

245 250255

Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe

260 265270

Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu

275 280285

Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly

290 295300

Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp

305 310 315320

Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro

325 330335

Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu

340

345

350

PL 243940 Β1

Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro

355 360365

Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn

370 375380

Thr Thr Pro Glu Gly Val Ala Arg ArgTyr Gly Gly Glu Trp Thr Glu

385 390 395400

Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu

405 410415

Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu

420 425430

Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly

435 440445

Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala

450 455460

Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His

465 470 475480

Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp

485 490495

Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu LysThr Gly Lys Arg

500 505510

Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile

515 520525

Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr

530 535540

Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu

545 550 555560

His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser

565 570575

Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin

580 585590

Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala

595 600605

PL 243940 Β1

Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly

610 615620

Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr

625 630 635640

Glu Thr Ala SerTrp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro

645 650655

Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly

660 665670

Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu

675 680685

Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg

690 695700

Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val

705 710 715720

Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg

725 730735

Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro

740 745750

Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu

755 760765

Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His

770 775780

Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala

785 790 795800

Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro

805 810815

Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu

820 825830

Gly Ser Gly Gly Val Asp Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr

835

840

845

PL 243940 Β1

Val Lys Val Lys Gly Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr

850 855860

Ser Lys Gly Lys Phe Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr

865 870 875880

Ile Lys Ala Ile Ile Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr

885 890895

Val Ile Glu Ala Ile Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn

900 905910

Leu Glu Leu His Ile Asp Ser Tyr Lys He Leu Glu Ser Asp Leu Glu

915 920925

Ile Lys Pro Gin Lys Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr

930 935940

Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val Ser Lys Ala Ile Leu

945 950 955960

Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp

965 970975

Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn

980 985990

Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala

995 10001005

Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu Ala Asp

1010 10151020 < 210> 3 < 211> 930 < 212> PRT < 213> Artificial Sequence <220>

<223> fusion two protein

PL 243940 Β1 <400> 3

Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu

1015

Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly

2530

Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala

4045

Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val

5560

Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly

70 7580

Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu

9095

Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu

100 105110

Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys

115 120125

Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp

130 135140

Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly

145 150 155160

Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro

165 170175

Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn

180 185190

Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu

195 200205

Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu

210 215220

Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys

225

230

235

240

PL 243940 Β1

Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val

245 250255

Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe

260 265270

Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu

275 2S0285

Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly

290 295300

Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp

305 310 315320

Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro

325 330335

Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu

340 345350

Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro

355 360365

Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn

370 375380

Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu

385 390 395400

Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu

405 410415

Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu

420 425430

Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly

435 440445

Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala

450 455460

Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His

465

470

475

480

PL 243940 Β1

Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp

485 490495

Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg

500 505510

Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile

515 520525

Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr

530 535540

Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu

545 550 555560

His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser

565 570575

Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin

580 585590

Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala

595 600605

Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly

610 615620

Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr

625 630 635640

Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro

645 650655

Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly

660 665670

Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu

675 680685

Ala Gin Ala Phe Ile Glu ArgTyr Phe Gin Ser Phe Pro Lys Val Arg

690 695700

Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val

705 710 715720

Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg

725 730735

PL 243940 Β1

Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro

740 745750

Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu

755 760765

Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His

770 775780

Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala

785 790 795800

Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro

805 810815

Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu

820 825830

Gly Ser Gly Gly Val Asp Lys Pro Gin Lys Gin Glu Phe Val Gly Ile

835 840845

Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val

850 855860

Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr

865 870 875880

Phe Asn Asp Phe Asp Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly

885 890895

Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp

900 905910

Lys Val Glu Glu Ala Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu

915 920925

Ala Asp

930 <210> 4 <211>6 <212> PRT

PL 243940 Β1 < 213> Artificial Sequence <220>

< 223> Linker < 400> 4

Gly Ser Gly Gly Val Asp 1 5 <210>5 <211> 832 < 212> PRT < 213> Bacteria <prokaryote>

< 400> 5

Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu 15 1015

Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly

2530

Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala

4045

Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val

5560

Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly

70 7580

Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu

9095

Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu

100

105

110

PL 243940 Β1

Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys

115 120125

Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp

130 135140

Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly

145 150 155160

Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro

165 170175

Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn

180 185190

Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu

195 200205

Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu

210 215220

Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys

225 230 235240

Leu Ser Trp Asp Leu Ala Lys Val ArgThr Asp Leu Pro Leu Glu Val

245 250255

Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe

260 265270

Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu

275 280285

Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly

290 295300

Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp

305 310 315320

Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro

325 330335

Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu

340 345350

Ala Lys Asp Leu SerVal Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro

355 360365

PL 243940 Β1

Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn

370 375380

Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly GluTrp Thr Glu

385 390 395400

Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu

405 410415

Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu

420 425430

Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly

435 440445

Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala

450 455460

Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His

465 470 475480

Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp

485 490495

Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg

500 505510

Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile

515 520525

Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr

530 535540

Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu

545 550 555560

His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser

565 570575

Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin

580 585590

Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala

595

600

605

PL 243940 Β1

Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly

610 615620

Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr

625 630 635640

Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro

645 650655

Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly

660 665670

Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu

675 680685

Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg

690 695700

Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val

705 710 715720

Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg

725 730735

Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro

740 745750

Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu

755 760765

Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His

770 775780

Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala

785 790 795800

Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro

805 810815

Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu

820

825

830

PL 243940 Β1 <210> 6 <211> 243 <212> PRT <213> Bacteria <prokaryote>

<400> 6

Met Asp Glu Glu Glu Leu Ile Gin Leu Ile Ile Glu Lys Thr Gly Lys

1015

Ser Arg Glu Glu Ile Glu Lys Met Val Glu Glu Lys Ile Lys Ala Phe

2530

Asn Asn Leu Ile Ser Arg Arg Gly Ala Leu Leu Leu Val Ala Lys Lys

4045

Leu Gly Val Leu Tyr Lys Asn Thr Pro Lys Glu Lys Lys Ile Gly Glu

5560

Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly Lys Ile Leu Lys Ser

70 7580

Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe Gin Pro Ile Ile Leu

9095

Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile Trp Asn Thr Asp Lys

100 105110

Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile Gly Lys Thr Lys Ile

115 120125

Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile Asp Ser Tyr Lys Ile

130 135140

Leu Glu Ser Asp Leu Glu Ile Lys Pro Gin Lys Gin Glu Phe Val Gly

145 150 155160

Ile Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile

165 170175

Val Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg Glu Leu Pro Val Val

180

185

190

PL 243940 Β1

Tyr Phe Asn Asp Phe Asp Trp Glu Ile Gly His Ile Tyr Lys Val Tyr

195 200205

Gly Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala

210 215220

Asp Lys Val Glu Glu Ala Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly

225 230 235240

Glu Ala Asp <210> 7 <211> 92 <212> PRT <213> Bacteria <prokaryote>

<400> 7

Met Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly

1015

Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe

2530

Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile

4045

Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile

5560

Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile

70 7580

Asp Ser Tyr Lys Ile Leu Glu Ser Asp Leu Glu Ile

8590 <210> 8 <211> 93

PL 243940 Β1 <212> PRT <213> Bacteria <prokaryote>

<400> 8

Met Lys Pro Gin Lys Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr

1015

Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val Ser Lys Ala Ile Leu

2530

Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp

4045

Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn

5560

Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala

70 7580

Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu Ala Asp

8590 <210> 9 < 211> 8539 < 212> DNA < 213> Artificial Sequence <220>

< 223> Fusion of two diffrent gene < 400> 9 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

PL 243940 Β1 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960

PL 243940 Β1 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920

PL 243940 Β1 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820

PL 243940 Β1 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780

PL 243940 Β1 atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680

PL 243940 Β1 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640

PL 243940 Β1 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgrtc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540

PL 243940 Β1 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500

PL 243940 Β1 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgatg atgaagagga actaatacaa ctaataatag 7620 aaaaaactgg caaatctcga gaggaaatag aaaaaatggt ggaagaaaaa attaaagctt 7680 ttaacaattt aatatctcgt aggggggctt tactattagt agcaaaaaaa cttggtgttt 7740 tgtataaaaa cactccgaaa gagaaaaaaa ttggcgaatt agaaagctgg gaatatgtaa 7800 aagtaaaggg caaaattctc aaatcttttg gattaattag ttattcgaaa gggaaattcc 7860 aacctattat tttaggagac gaaaccggta ctattaaagc tattatttgg aataccgata 7920 aagaattacc tgaaaacact gtaatagaag ctattgggaa aaccaaaatt aataagaaaa 7980 ctggcaattt agaattacat atagacagtt ataaaatttt agaaagcgat ttagagataa 8040 aaccccaaaa gcaagaattt gttgggattt gcatagttaa atatccaaaa aaacaaaccc 8100 aaaaaggcac aatagtatcg aaagcaattt taactagctt agatagggaa ttgcctgtag 8160 tatatttcaa cgattttgat tgggaaatag gccatatata taaagtatat ggaaagctta 8220 agaaaaacat aaaaactggt aaaatagaat ttttcgctga caaagttgag gaagcaacat 8280 taaaagatct aaaagctttt aaaggagagg ccgatcacca ccaccaccac cactaaggat 8340 ccgaattcga gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac 8400

PL 243940 Β1 tgagatccgg ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag 8460 caataactag cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa 8520 ggaggaacta tatccggat 8539 <210> 10 <211> 8362 < 212> DNA < 213> ArtificiaI Sequence <220>

< 223> Fusion of two diffrent gene < 400> 10 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

PL 243940 Β1 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380

PL 243940 Β1 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280

PL 243940 Β1 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240

PL 243940 Β1 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccacta c cgagatgtcc gcacca acgc gcagcccgga ctcggta atg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140

PL 243940 Β1 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100

PL 243940 Β1 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000

PL 243940 Β1 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgctc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960

PL 243940 Β1 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgata aaattggcga attagaaagc tgggaatatg 7620 taaaagtaaa gggcaaaatt ctcaaatctt ttggattaat tagttattcg aaagggaaat 7680 tccaacctat tattttagga gacgaaaccg gtactattaa agctattatt tggaataccg 7740 ataaagaatt acctgaaaac actgtaatag aagctattgg gaaaaccaaa attaataaga 7800 aaactggcaa tttagaatta catatagaca gttataaaat tttagaaagc gatttagaga 7860

PL 243940 Β1 taaaacccca aaagcaagaa tttgttggga tttgcatagt taaatatcca aaaaaacaaa 7920 cccaaaaagg cacaatagta tcgaaagcaa ttttaactag cttagatagg gaattgcctg 7980 tagtatattt caacgatttt gattgggaaa taggccatat atataaagta tatggaaagc 8040 ttaagaaaaa cataaaaact ggtaaaatag aatttttcgc tgacaaagtt gaggaagcaa 8100 cattaaaaga tctaaaagct tttaaaggag aggccgatca ccaccaccac caccactaag 8160 gatccgaatt cgagctccgt cgacaagctt gcggccgcac tcgagcacca ccaccaccac 8220 cactgagatc cggctgctaa caaagcccga aaggaagctg agttggctgc tgccaccgct 8280 gagcaataac tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg 8340 aaaggaggaa ctatatccgg at 8362 <210> 11 <211> 8089 < 212> DNA < 213> Artificial Sequence <220>

< 223> Fusion of two diffrent gene <400> 11

PL 243940 Β1 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaa ata c gcgatcgctg ttaaa aggac 960

PL 243940 Β1 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860

PL 243940 Β1 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820

PL 243940 Β1 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720

PL 243940 Β1 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccacta c cgagatgtcc gcacca a cgc gcagcccgga ctcggta atg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680

PL 243940 Β1 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagca a c cgca cctgtg 49 20 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580

PL 243940 Β1 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgctc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540

PL 243940 Β1 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440

PL 243940 Β1 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgata aaccccaaaa gcaagaattt gttgggattt 7620 gcatagttaa atatccaaaa aaacaaaccc aaaaaggcac aatagtatcg aaagcaattt 7680 taactagctt agatagggaa ttgcctgtag tatatttcaa cgattttgat tgggaaatag 7740 gccatatata taaagtatat ggaaagctta agaaaaacat aaaaactggt aaaatagaat 7800 ttttcgctga caaagttgag gaagcaacat taaaagatct aaaagctttt aaaggagagg 7860 ccgatcacca ccaccaccac cactaaggat ccgaattcga gctccgtcga caagcttgcg 7920 gccgcactcg agcaccacca ccaccaccac tgagatccgg ctgctaacaa agcccgaaag 7980 gaagctgagt tggctgctgc caccgctgag caataactag cataacccct tggggcctct 8040 aaacgggtct tgaggggttt tttgctgaaa ggaggaacta tatccggat 8089 <210> 12 <211> 48 <212> DNA <213> ArtificiaI Sequence

PL 243940 Β1 <220>

<223> Oligonukleotide <400> 12 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 <210> 13 <211>41 <212> DNA <213> Artificial Sequence <22D>

<223> Oligonukleotide <400> 13 tcatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 14 <211> 51 < 212> DNA < 213> Artificial Sequence <220>

< 223> Oligonukleotide < 400> 14 agggcagcgg tggcgttgat gatgaagagg aactaataca actaataata g

PL 243940 Β1 <210> 15 <211> 80 < 212> DNA < 213> Artificial Sequence <220>

< 223> Oligonukleotide < 400> 15 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta aaagctttta 80 <210> 16 <211> 48 < 212> DNA < 213> Artificial Sequence <220>

<223> Oligonukleotide <400> 16 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 <210> 17

PL 243940 Β1 <211> 41 <212> DNA <213> Artificial Sequence <22O>

<223> Oligonukleotide <400> 17 tcatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 18 <211> 51 <212> DNA <213> Artificial Sequence <22O>

<223> Oligonukleotide <400> 18 agggcagcgg tggcgttgat gatgaagagg aactaataca actaataata g <210> 19 <211> 80 <212> DNA <213> Artificial Sequence

PL 243940 Β1 <220>

<223> Oligonukleotide <400> 19 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta aaagctttta <210> 20 <211> 48 < 212> DNA < 213> Artificial Sequence <220>

<223> Oligonukleotide <400> 20 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 < 210> 21 <211>41 < 212> DNA < 213> Artificial Sequence <220>

<223> Oligonukleotide

PL 243940 Β1 <400> 21 ttatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 22 <211> 45 <212> DNA <213> Artificial Sequence <220>

<223> Oligonukleotide <400> 22 agggcagcgg tggcgttgat aaaccccaaa agcaagaatt tgttg 45 <210> 23 <211> 70 < 212> DNA < 213> Artificial Sequence <220>

< 223> Oligonukleotide < 400> 23 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta

Claims

1. Polimeraza TaqPol-NeqSSB o SEQ. ID 1-3.

2. Sposób klonowania polimerazy TaqPol-NeqSSB o SEQ.ID 1-3 znamienny tym, że otrzymuje się DNA insertu przeznaczonego do klonowania, które polega na przeprowadzeniu dwóch niezależnych reakcji PCR:

- drugi produkt zawiera sekwencję nukleotydową genu kodującego białko NeqSSB wiążącego DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu;

- matrycę do reakcji PCR stanowi wyizolowane genomowe DNA,

3. Sposób według zastrz. 2, znamienny tym, że produkty dwóch reakcji PCR służą, jako inserty w reakcji Gibsona, gdzie:

- następuje trawienie plazmidu pET30EKLIC

- w celu zlinearyzowania plazmidu pET30EKLIC poddaje się go trawieniu enzymem BamHI i Ndel (NEB), które tną w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA,

- Reakcja składania genów;

- po reakcji mieszaninę dodaje się do świeżo przygotowanych komórek kompetentnych E. coli TOP10,

4. Sposób według zastrz. 3, znamienny tym, że w celu uzyskania białka fuzyjnego TaqPol-NeqSSB, komórki E. coli BL RIL. poddaje się transformacji z użyciem DNA plazmidu rekombinantowego pET30-Pwo-NeqSSB i przeprowadza się produkcję pożądanych białek fuzyjnych, hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzi się przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodaje się IPTG do końcowego stężenia 0,1 mM; po indukcji hodowle prowadzi się jeszcze przez 5 h, po czym wiruje się (10 min, 5000 obr/min) i poddaje się oczyszczaniu metodą metalopowinowactwa; rezultaty produkcji białek analizuje się za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących.

5. Wyizolowany plazmid rekombinantowy znamienny tym, że obejmuje fragment nukleotydowej sekwencji białka kodujące polimerazę TaqPol-NeqSSBFull/II+III/III od 5076 do 8336 z plazmidu pET30EKLIC o SeQ. ID. 9, 5076 do 8159 z plazmidu pET30EKLIC o SEQ. ID. 10 oraz od 5076 do 7886 z plazmidu pET30EKLIC o SEQ. ID. 11.

6. Wyizolowany plazmid pET30-TaqPol-NeqSSBFull/II+III/III o sekwencji SEQ.ID.9-11.

7. Startery do klonowania polimerazy TaqPol-NeqSSBFull/II+III/III o sekwencjach SEQ.ID. 12-23.

8. Polimeraza TaqPol-NeqSSBFull/II+III/III o SEQ. ID 1-3 do zastosowania do powielania specyficznych sekwencji wirusa SARS CoV-2.