PL243940B1 - Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy - Google Patents

Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy Download PDF

Info

Publication number
PL243940B1
PL243940B1 PL437909A PL43790921A PL243940B1 PL 243940 B1 PL243940 B1 PL 243940B1 PL 437909 A PL437909 A PL 437909A PL 43790921 A PL43790921 A PL 43790921A PL 243940 B1 PL243940 B1 PL 243940B1
Authority
PL
Poland
Prior art keywords
leu
glu
ala
lys
arg
Prior art date
Application number
PL437909A
Other languages
English (en)
Other versions
PL437909A1 (pl
Inventor
Marta SKWARECKA
Marta Skwarecka
Grzegorz ZIELIŃSKI
Grzegorz Zieliński
Kasjan SZEMIAKO
Kasjan Szemiako
Dawid NIDZWORSKI
Dawid Nidzworski
Sabina ŻOŁĘDOWSKA
Sabina Żołędowska
Original Assignee
Inst Biotechnologii I Medycyny Molekularnej
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inst Biotechnologii I Medycyny Molekularnej filed Critical Inst Biotechnologii I Medycyny Molekularnej
Priority to PL437909A priority Critical patent/PL243940B1/pl
Priority to PCT/PL2022/000031 priority patent/WO2022245230A1/en
Priority to EP22736399.1A priority patent/EP4341389A1/en
Publication of PL437909A1 publication Critical patent/PL437909A1/pl
Publication of PL243940B1 publication Critical patent/PL243940B1/pl

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSB oraz sposób jej klonowania. Ponadto przedmiotem wynalazku jest wyizolowany plazmid rekombinantowy, startery oraz zastosowanie polimerazy do powielania specyficznych sekwencji wirusa SARS CoV-2.

Description

Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSB oraz sposób jej klonowania. Ponadto przedmiotem wynalazku jest wyizolowany plazmid rekombinantowy, startery oraz zastosowanie polimerazy do powielania specyficznych sekwencji wirusa SARS CoV-2.
Białka SSB - (ang. Single Stranded DNA Binding protein - białka wiążące się do jednoniciowego DNA) występują we wszystkich organizmach żywych. Biorą udział we wszystkich procesach, w których generowane są fragmenty jednoniciowego DNA, takich jak: replikacja, rekombinacja i naprawa DNA. Chronią jednoniciowe DNA (ssDNA) przed degradacją i jednocześnie współdziałają z innymi białkami w komórce. Znane są białka SSB-podobne, które są białkami syntetyzowanymi przez komórki ssaków, drożdży, archeonów i bakterii. W zależności od źródła, z którego pochodzą, białka te różnią się masą cząsteczkową, ilością podjednostek wchodzących w skład natywnej cząsteczki, wielkością miejsca wiązania.
Mechanizm wiązania się białka z ssDNA polega na upakowaniu (ang. stacking) aromaty cznych reszt aminokwasowych między zasady w łańcuchu oligonukleotydowym oraz oddziaływaniu dodatnio naładowanych reszt aminokwasowych ze szkieletem fosforanowym w cząsteczce ssDNA. Wiązanie to jest na tyle silne, że nie rozpada się pod wpływem niskich stężeń NaCl. Do rozpadu kompleksu ssDNA - SSB w komórce potrzebne jest wysokie stężenie soli zawierających Mg2+. Długość fragmentu ssDNA wiązanego przez SSB ulega skróceniu o 35%.
Mimo przynależności białka NeqSSB do rodziny białek SSB odbiega ono swoimi cechami od klasycznych białek SSB, stąd określane jest jako białko NeqSSB-podobne. Białko to pochodzi z hipertermofilnego archeona Nanoarchaeum equitans, który pasożytuje w craenarchaeonie Ignicoccus hospitalis. Optymalne warunki wzrostu tego mikroorganizmu wymagają ściśle beztlenowych warunków i temperatury 90°C. Co ciekawe Nanoarchaeum equitans posiada najmniejszy znany genom składający się z 490,885 par zasad. W przeciwieństwie do większości znanych organizmów o obniżonych genomach, posiada pełny zestaw enzymów biorących udział w replikacji, naprawie i rekombinacji DNA, w tym białko SSB.
Białko NeqSSB podobnie jak inne białka z tej rodziny posiada naturalną zdolność wiązania DNA. Składa się z 243 reszt aminokwasowych, a w swojej strukturze ma jedną domenę OB (fig. 1). Wykazuje biologiczną aktywność jako monomer, podobnie do niektórych wirusowych białek SSB. Badania wskazują na jego nietypowe dla innych białek SSB zdolności wiązania wszystkich form DNA (ssDNA, dsDNA) oraz mRNA bez strukturalnych preferencji. Za wiązanie z kwasami nukleotydowymi odpowiadają domeny białka NeqSSB I, II i III - za domeny najsilniej wiążące odpowiedzialna jest domena II i III. Ponadto białko charakteryzuje się wysoką termostabilnością. Czas półtrwania przy zachowaniu aktywności bi ologicznej wynosi 5 min w 100°C, natomiast temperatura topnienia to 100,2°C.
Polimeraza DNA to enzym, który odgrywa zasadniczą rolę w procesie replikacji i naprawie DNA. Znalazła ona zastosowanie w reakcji PCR (ang. Polymerase Chain Reaction), gdzie katalizuje proces syntezy DNA in vitro, odpowiadając za dołączanie kolejnych nukleotydów do końca 3’OH nici DNA. Oprócz właściwości polimeryzacyjnej może posiadać również zdolności do hydrolizy cząsteczek DNA dzięki obecności domeny egzonukleolitycznej. Pomimo tego, że polimerazy pełnią takie same funkcje tzn. są odpowiedzialne za syntezę nici DNA, to ich budowa i posiadane aktywności znacząco się różnią. Katalizują one mechanizm przyłączania kolejnych nukleotydów do końca 3’OH nici DNA. Budowa tych polimeraz zarówno u bakterii, archeonów jak i eukariotów wykazuje podobieństwo pod względem struktury i obecności 3 podstawowych subdomen palca, śródręcza i kciuka, którym przypisane są ściśle określone funkcje. Polimerazy DNA wykazują zróżnicowanie pod względem szybkości katalizy, procesywności, obecności lub braku współdziałających podjednostek białkowych, czy wykazywaniu aktywności nukleolitycznej. Ogólny podział polimeraz DNA klasyfikuje je do 7 różnych rodzin: A, B, C, D, X, Y i RT. Przedstawicieli polimerazy DNA bakteryjnych odnaleźć można w rodzinach A, B, C, X, Y, archenów B, D, X i Y, a polimerazy DNA eukariotyczne należą do rodzin A, B, X, Y i RT.
Podstawowym zadaniem polimerazy DNA jest dobudowywanie nukleotydów komplementarnych do końca 3’OH łańcucha DNA. W mechanizmie tym można zaobserwować kilka istotnych etapów. Pierwszy polega na przyłączeniu enzymu do matrycy DNA. Powstały kompleks DNA-DNA asocjuje odpowiednie dNTP (trifosforany deoksyrybonukeotydów) w wyniku ataku nukleofilowego końca 3’OH na atom fosforu nukleotydu. Ostatni etap prowadzi do powstania wiązania fosfodiestrowego i uwolnieniu pirofosforanu. Pierwszy etap, czyli związanie polimerazy z matrycą - starterem wymusza zmianę konformacji subdomeny kciuka i ścisłe dopasowanie się do cząsteczki DNA. Subdomena kciuka obraca się względem subdomeny śródręcza, a zakonserwowane reszty na szczycie kciuka wykonują przeciwległy skręt. W ten sposób polimeraza DNA oddziałuje z małym rowkiem DNA za pośrednictwem odpowiednio wygiętej subdomeny kciuka. Wszystko to sprawia, że 3 zasady w obrębie startera ulegają wygięciu i cząsteczka DNA znajduje się wystarczająco blisko miejsca aktywnego enzymu. Wzmocnienie wygięcia nici DNA umożliwione jest dzięki kolejnym interakcjom z polimerazą. Tym razem subdomena śródręcza determinuje rotację dwóch pierwszych zasad matrycy DNA o odpowiednio 900 i 1800, obracając w ten sposób zasady na zewnątrz helisy i tworząc konformację w kształcie litery S. Konformacja ta jest więc indukowana przez oddziaływanie DNA z subdomeną kciuka, śródręcza oraz interakcją matrycy z centrum aktywnym.
Najpowszechniej używaną polimerazą DNA pochodzenia bakteryjnego jest wyizolowana z Thermus aquaticus polimeraza Taq. Ten odkryty w 1976 roku enzym, który zrewolucjonizował oblicze biologii molekularnej, zbudowany jest z 832 reszt aminokwasowych o masie molekularnej 94 kDa . Warto zauważyć, że jego najwyższa aktywność osiągana jest w temperaturze od 72°C do 80°C. Polimeryzacja możliwa jest dzięki przyłączeniu DNA do centrum aktywnego enzymu, w którym najistotniejsze reszty aminokwasowe to Arg682, Lys785, Tyr766, Arg821, His811.
Polimeraza DNA Taq posiada trzy domeny: egzonukleolityczną 5’^3‘, nieaktywną egzonukleolityczną 3’^5’ oraz polimeryzacyjną 5’^3’. Delecja domeny egzonukleolitycznej np. u polimerazy DNA Taq, pozwala na uzyskanie funkcjonalnego białka, ale o częściowo zmienionych cechach w stosunku do enzymu natywnego. Pozbawiona aktywności 5’^3’ egzonukleazy polimeraza DNA TaqA289 (TaqStoffel, KlenTaq) charakteryzuje się zwiększoną termostabilnością, nieco zwiększonym zapotrzebowaniem na jony Mg2+, natomiast nowo zsyntetyzowana nić DNA obdarzona jest mniejszą liczbą błędów.
Badania polegające na otrzymaniu polimerazy DNA z delecją kolejnych reszt aminokwasowych z N-końca wykazały, że krytyczne dla zachowania optymalnej termostabilności i aktywności reszty aminokwasowe znajdują się w regionie od 303 do 335. Struktura krystalograficzna enzymu wykazuje, że reszty aminokwasowe z tego obszaru formują trzy β-kartki oddziałujące z pozostałą częścią enzymu.
Obecnie reakcje PCR wykazują bardzo szerokie zastosowanie w diagnostyce, biologii molekularnej czy inżynierii genetycznej. Ich efektywność jest nieodłącznie związana ze stosowaną polimerazą, której stawiane są coraz większe wymagania związane z amplifikacją problematycznych matryc DNA, dlatego konieczne jest poszukiwanie polimeraz DNA o nowych, przydatnych cechach lub ulepszanie już stosowanych. Przedstawione przez nas rozwiązanie jakim jest polimeraza Taq w fuzji z białkiem wiążącym DNA pozwoli na zwiększenie jej powinowactwa do matrycy DNA, a tym samym korzystnie wpłynie na pożądane w diagnostyce cechy tj. procesywność, wydajność, amplifikacja trudnych matryc bogatych w GC czy amplifikacja DNA z próbek klinicznych pozwalająca na znaczne przyspieszenie diagnoz y w przypadku wielu chorób bakteryjnych lub wirusowych oraz uwiarygodnienie otrzymanych wyników.
Celem wynalazku jest stworzenie nowej polimerazy TaqPol z białkiem NeqSSB, która będzie miała zastosowanie do powielania specyficznych sekwencji wirusa SARS CoV-2.
Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSB, wiążącym wszystkie rodzaje DNA i RNA. Modyfikacjom poddano trzy warianty polimerazy TaqPol-NeqSSB:
- TaqPol-NeqSSBFull - cała sekwencja aminokwasowa polimerazy DNA I Taq z całą sekwencją aminokwasową białka NeqSSB (SEQ. ID 1);
- TaqPol-NeqSSBII+III - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 2); - TaqPol-NeqSSBIII - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 3).
Wszystkie warianty polimerazy TaqPol połączono z białkiem NeqSSB na C-końcu polimerazy za pomocą 6-aminokwasowego linkera (SEQ. ID 4).
Przedmiotem wynalazku jest Polimeraza TaqPol-NeqSSB o SEQ. ID 1-3. Przedmiotem wynalazku jest również sposób klonowania polimerazy TaqPol-NeqSSB o SEQ. ID 1-3, którą otrzymuje się DNA insertu przeznaczonego do klonowania, które polega na przeprowadzeniu dwóch niezależnych reakcji PCR:
- w pierwszej reakcji amplifikacji otrzymuje się produkt o sekwencji nukleotydowej odpowiadającej sekwencji genu kodującego polimerazę DNA Taq z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu;
- drugi produkt zawiera sekwencję nukleotydową genu kodującego białko NeqSSB wiążąceg o DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu;
- matrycę do reakcji PCR stanowi wyizolowane genomowe DNA,
- otrzymane produkty w dwóch powyższych reakcjach rozdziela się w żelu agarozowym z bromkiem etydyny i poddaje się izolacji z żelu.
Sposób, gdzie produkty dwóch reakcji PCR służą, jako inserty w reakcji Gibsona, gdzie:
- Trawienie plazmidu pET30EKLIC
- w celu zlinearyzowania plazmidu pET30EKLIC poddaje się go trawieniu enzymem BamHI i NdeI (NEB), które tną w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA,
- reakcję trawienia DNA wektora prowadzi się przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu,
- potrawiony plazmid poddaje się rozdziałowi elektroforetycznemu i izoluje się;
- Reakcja składania genów
- reakcję Gibsona prowadzi się w termocyklerze w 50°C przez 60 min, gdzie mieszanina zawiera bufor, nukleotydy, enzymy, wodę jałową, insert I, Insert II, wektor,
- po reakcji mieszanina dodaje się do świeżo przygotowanych komórek kompetentnych E. coli TOP10,
- otrzymaną mieszaninę inkubuje się w lodzie przez 40 min, po tym czasie inkubacji przeprowadza się szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie, po szoku termicznym komórki poddaje się 60 min inkubacji w 37°C z dodatkiem 600 ml LB, po tym czasie komórki wiruje się (10 min, 1800 obr/min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny, płytki inkubowano przez ok. 16 h w 37°C.
Sposób, gdzie w celu uzyskania białka fuzyjnego Taq-NeqSSB, komórki E. coli BL RIL poddaje się transformacji z użyciem DNA plazmidu rekombinantowego pET30-TaqPol-NeqSSB i przeprowadza się produkcję pożądanych białek fuzyjnych, hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzi się przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodaje się IPTG do końcowego stężenia 0,1 mM; po indukcji hodowle prowadzi się jeszcze przez 5 h, po czym wiruje się (10 min, 5000 obr/min) i poddaje się oczyszczaniu metodą metalopowinowactwa; rezultaty produkcji białek analizuje się za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących.
Przedmiotem wynalazku jest również wyizolowany plazmid rekombinantowy, który obejmuje fragment nukleotydowej sekwencji białka kodujące polimerazę TaqPol-NeqSSB Full od 5076 do 8336 z plazmidu pET30EKLIC o SEQ. ID. 9, TaqPol-NeqSSBII+III od 5076 do 8159 z plazmidu pET30EKLIC o SEQ. ID. 10 oraz TaqPol-NeqSSBIII od 5076 do 7886 z plazmidu pET30EKLIC o SEQ. ID. 11.
Wyizolowany plazmid pET30-TaqPol-NeqSSB Full o sekwencji SEQ.ID. 9, plazmid pET30-TaqPol-NeqSSBII+III o sekwencji SEQ.ID. 10, plazmid pET30-TaqPol-NeqSSBIII o sekwencji SEQ.ID. 11.
Przedmiotem wynalazku są również startery do klonowania polimerazy TaqPol-NeqSSB
Full/II+III/III o sekwencjach SEQ.ID?12-23.
Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSBFull/II+III/III o SEQ. ID 1,2 i 3 do zastosowania do powielania specyficznych sekwencji wirusa SARS CoV-2.
Opis figur:
Fig. 1 - schematyczne przedstawienie białka NeqSSB z podstawową domeną OB
Fig. 2 - przedstawia schemat klonowania metodą Gibsona.
Fig. 3 - przedstawia rozdział elektroforetyczny przedstawiający wyniki oczyszczania polimerazy DNA TaqPol-NeqSSBFul (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) na kolumnie ze złożem His-Trap
M - Białkowy marker wielkości (14,4-116 kDa) o wielkości białek wzorcowych: 116; 66,2; 45; 35; 25; 18,4; 14,4 kDa;
- Lizat komórkowy E. coli BL RIL/pET30-TaqPol-NeqSSBFull/II+III/III po sonikacji i denaturacji białek gospodarza
- Frakcja niezwiązana z kolumną
- Frakcja po płukaniu buforem B (200 ml)
- Frakcja po elucji buforem C (30 ml)
Fig. 4 - przedstawia rozdział elektroforetyczny w 2% żelu agarozowym z bromkiem etydyny przedstawiający porównanie czułości polimerazy TaqPol-NeqSSBFull (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) w seryjnych 10-krotnych rozcieńczeniach matrycowego DNA
Fig. 5 - przedstawia wykres zależności fluorescencji barwnika SybrGreen w czasie prowadzenia reakcji RT qPCR z zastosowaniem polimerazy TaqPol-NeqSSBFull (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) w reakcji identyfikacji wirusa SARS-CoV-2 bezpośrednio z wymazu.
Opis sekwencji:
SEQ. ID 1 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBFull, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z białkiem NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.
SEQ.ID.2 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBII+III, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z domeną II i III białka NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.
SEQ.ID 3 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBIII, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z domeną III białka NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.
SEQ.ID. 4 - przedstawia sekwencję aminokwasową łącznika/linkera
SEQ.ID.5 - przedstawia sekwencję aminokwasową polimerazy TaqPol
SEQ.ID. 6 - przedstawia sekwencję aminokwasową białka NeqSSB.
SEQ.ID. 7 - przedstawia sekwencję aminokwasową II domeny białka NeqSSB
SEQ.ID. 8 - przedstawia sekwencję aminokwasową III domeny białka NeqSSB
SEQ.ID. 9 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSBFull
SEQ.ID. 10 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSB II+III
SEQ.ID. 11 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSBIII
SEQ.ID. 12-23 - przedstawia sekwencje starterów
Wynalazek ilustrują następujące przykłady wykonania, niestanowiące jego ograniczenia Przykład 1:
I. Gen kodujący polimerazę, wektor ekspresyjny, system ekspresyjny
a) Gen kodujący polimerazę: TaqPol-NeqSSBFull; TaqPol-NeqSSBII+III; TaqPol-NeqSSBIII
Sekwencję aminokwasową polimerazy TaqPol-NeqSSB Full//II+III/III (TaqPol-NeqSSBFull; TaqPol-NeqSSBII+III; TaqPol-NeqSSBIII) wydłużono o sekwencję domeny histydynowej niezbędnej do efektywnego oczyszczania polimerazy metodą metalopowinowactwa. Domena 6xHis przyłączona została na C-końcu polimerazy. Sekwencja nukleotydowa polimerazy (TaqPol-NeqSSBFull, TaqPol-NeqSSBII+III, TaqPol-NeqSSBIII) została przedstawiona na SEQ. ID 1-3.
Polimeraza TaqPol-NeqSSB, wiążącym wszystkie rodzaje DNA i RNA. Modyfikacjom poddano trzy warianty polimerazy TaqPol-NeqSSB: - TaqPol-NeqSSBFull - cała sekwencja aminokwasowa polimerazy DNA I Taq z całą sekwencją aminokwasową białka NeqSSB (SEQ. ID 1);
- TaqPol-NeqSSBII+III - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 2);
- TaqPol-NeqSSBIII - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 3).
Wszystkie warianty polimerazy TaqPol połączono z białkiem NeqSSB na C-końcu polimerazy za pomocą 6-aminokwasowego linkera (SEQ. ID 4).
b) Wektor ekspresyjny
Przy wyborze wektora do ekspresji enzymu kierowano się możliwością:
- selekcji antybiotykowej klonów
- przeprowadzenia klonowania i jego namnożenia w komórkach bakteryjnych
- obecność promotora umożliwiającego łatwy sposób kontroli i indukcji ekspresji
Wybrano wektor pET30EKLIC niosący gen oporności na kanamycynę, bakteryjne Ori replikacji oraz sekwencję promotora laktozowego T7 pozwalającą na indukcję ekspresji za pomocą IPTG. Wektor posiada miejsca rozpoznania dla enzymów restrykcyjnych BamHI i Ndel, które tną DNA plazmidowe w dwóch miejscach, dając dwa niekomplementarne lepkie końce niezbędne na etapie klonowania
c) System ekspresyjny
Do ekspresji termostabilnej polimerazy fuzyjnej Pwo-NeqSSB wybrano system prokariotyczny E. coli, który jest najczęściej stosowanym układem do nadprodukcji białek zarówno na skalę laboratoryjną jak i przemysłową. Wytypowano szczepy IP-Free dostępne przez firmę Promega: Escherichia coli BL21(DE3)pLysS.
PL 243940 Β1
d) Zaprojektowanie starterów SEQ.ID 12-23
Polimeraz fuzyjna składa się z dwóch białek, które kodowane są przez dwa niezależne geny. Wymuszało zastosowanie metody klonowania, która umożliwi wklonowanie kilku fragmentów DNA jednocześnie. Zastosowano metodę Gibsona, która wjednej reakcji umożliwia wygenerowanie lepkich końców (egzonukleaza 5’^3’), wydłużanie końców DNA (polimeraz DNA) oraz kowalencyjne połączenie dwóch końców DNA (ligaza DNA) kilku fragmentów jednocześnie. Zastosowano zestaw OverLap (firmy A&A Biotechnology). Schemat klonowania przedstawia fig 2.
Przykład 2:
II. Klonowanie polimerazy Taq-NeqSSB
a) Amplifikacja produktów przeznaczonych do klonowania
Otrzymanie DNA insertu przeznaczonego do klonowania polegało na przeprowadzeniu dwóch niezależnych reakcji PGR. Pierwsza z reakcji amplifikacji pozwoliła na otrzymanie produktu o sekwencji nukleotydowej odpowiadającej sekwencji polimerazy DNA z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu. Drugi produkt zawierał sekwencję nukleotydową białka wiążącego DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu. Matrycę do reakcji PCR stanowiło wyizolowane genomowe DNA. Otrzymane produkty w dwóch powyższych reakcjach rozdzielono w żelu agarozowym z bromkiem ety dyny i poddano izolacji z żelu z wykorzystaniem zestawu Gel-Out Concentrator (A&A Biotechnology). Produkty tych dwóch reakcji PCR posłużyły, jako inserty w reakcji Gibsona z wykorzystaniem zestawu OverLap Assembly mix (A&A Biotechnology).
b) Trawienie plazmidu pET30EKLIC
W celu zlinearyzowania plazmidu pET30EKLIC poddano go trawieniu enzymem BamHI i Ndel (NEB), który tnie w dwóch miejscach, zostawiając niekomplementarne do siebie końce DNA. Reakcja trawienia DNA wektora prowadzona była przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu zalecanych przez producenta.
Potrawiony plazmid poddano rozdziałowi elektroforetycznemu i wyizolowano zestawem Gel-Out Concentrator (A&A Biotechnology).
c) Reakcja składania genów
Reakcja Gibsona z wykorzystaniem zestawu OverLap Assembly mix prowadzona była w termocyklerze w 50°C przez 60 min. Skład mieszaniny znajduje się poniżej:
Składnik Ilość [ml]
Bufor 5^OverLap Assembly (A&A 4
Biotechnology)
Nuklcotydy [10 mM]2
Enzymy - OverLap ’ Assembly i W Λ 2
Biotechnology) ·
Woda jałowa3
Insert ! [I5:0ng/mlJ^-3
Insert II [150ng/ml]3 •- · ——* , , yj •'iiŁWgs
Wektor [150ng/ml] -3 Objętość końcowa20
Po reakcji mieszanina dodawana była do świeżo przygotowanych komórek kompetentnych E. coli TOP 10. d) Transformacja komórek kompetentnych
Mieszaninę po reakcji Gibsona dodano do 100 ml komórek kompetentnych E. coli TOP 10. Otrzymaną mieszaninę inkubowano w lodzie przez 40 min. Po tym czasie inkubacji przeprowadzono szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie. Po szoku termicznym komórki poddano 60 min inkubacji w 37°C z dodatkiem 600 ml LB. Po tym czasie komórki zwirowano (10 min, 1800 obr/min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny. Płytki inkubowano przez ok. 16 h w 37°C.
Przykład 3:
III. Ekspresja i oczyszczanie polimerazy TaqPol-Neq SSB
W celu uzyskania białka fuzyjnego TaqPol-NeqSSB, komórki E. coli BL RIL poddano transformacji z użyciem DNA plazmidu rekombinantowego pET30-TaqPol-NeqSSBFull/II+III/III i przeprowadzono produkcję pożądanych białek fuzyjnych. Hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzono przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodano IPTG do końcowego stężenia 0,1 mM. Po indukcji hodowle prowadzono jeszcze przez 4 h, po czym zwirowano (10 min, 5000 obr/min) i poddano oczyszczaniu metodą metalopowinowactwa. Rezultaty produkcji białek analizowano za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących (SDS-PAGE) (fig 3). Masa molekularna białka obliczona przy pomocy programu komputerowego Expasy wynosiła 118,2 kDa:
TaqPol-NeqSSBFull:
Ilość aminokwasów: 1080
Masa molekularna: 121987,88
Teoretyczna wartość pI: 6,55
TaqPol-NeqSSBII+III:
Ilość aminokwasów: 1021
Masa molekularna: 115179,84
Teoretyczna wartość pI: 6,37
TaqPol-NeqSSBIII:
Ilość aminokwasów: 930
Masa molekularna: 104933,93
Teoretyczna wartość pI: 6,34
Wyniki rozdziałów elektroforetycznych przedstawiających stopień oczyszczenia i stężenie białek po każdym etapie oczyszczania przedstawia fig. 3.
Przykład 4:
IV. Aktywność i zastosowanie polimerazy TaqPol-NeqSSB
1) Zastosowanie polimerazy w klasycznej reakcji PCR z detekcją w żelu agarozowym - target fragment plazmidowego DNA pUC19 o wielkości 1000 pz w różnym stężeniu matrycowego DNA, (fig.4).
2) Zastosowanie polimerazy w reakcji real-time RT-PCR - identyfikacja genu Orf lab, E oraz ludzkiego genu RP z wykorzystaniem różnych matryc RNA: totalnego RNA wirusa SARS-CoV-2 oraz bezpośrednio z wymazu zainfekowanego wirusem SARS-CoV-2. (fig.5).
Literatura:
[1] Vieille C, Burdette DS, Zeikus JG. Thermozymes. Biotechnol Annu Rev. 1996;2:1-83.
[2] Hamilton SC, Farchaus JW, Davis MC. DNA polymerases as engines for biotechnology. Bio- techniques. 2001;31(2):370-6, 378-80, 382-3.
[3] Chien A, Edgar DB, Trela JM. Deoxyribonucleic acid polymerase from the extreme thermophile
Thermus aquaticus. J Bacteriol. 1976; 127(3): 1550-7.
[4] Vainshtein I, Atrazhev a, Eom SH, Elliott JF, Wishart DS, Malcolm B. Peptide rescue of an N-terminal truncation of the Stoffel fragment of Taq DNA polymerase. Protein Sci. 1996;5(9): 1785-92.
[5] Barnes WM. The fidelity of Taq polymerase catalyzing PCR is improved by an N-terminal dele- tion. Gene. 1992;112(1):29-35.
[6] Rittie L, Perbal B. Enzymes used in molecular biology: a useful guide. J Cell Commun Signal.
2008;2(1-2):25-45.
[7] Olszewski M, Balsewicz J, Nowak M, Maciejewska N, Cyranka-Czaja A, Zalewska-Piątek B, et al.
Characterization of a Single-Stranded DNA-Binding-Like Protein from Nanoarchaeum equitans - Nucleic Acid Binding Protein with Broad Substrate Specificity. PLoS One. 2015; 10:e0126563.
PL 243940 Β1
SEQUENCE LISTING <110> Instytut Biotechnologii i Medycyny Molekularnej <120> Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy <130>
<150> P.437909 <151> 2021-05-19 <160> 26 <170> BiSSAP 1.3.6 <210> 1 <211> 1080 < 212> PRT < 213> Artificial Sequence <220>
< 223> fusion two protein < 400> 1
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu 15 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala
PL 243940 Β1
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
5560
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
70 7580
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu
9095
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135140
Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly
145 150 155160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170175
Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275
280
285
PL 243940 Β1
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375380
ThrThr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475480
Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg VaI Leu Phe Asp
485 490495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu LysThr Gly Lys Arg
500 505510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520525
Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530
535
540
PL 243940 Β1
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555560
His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570575
Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin
580 585590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu GlyTrp Leu Leu Val Ala
595 600605
Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615620
Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr
625 630 635640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665670
Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu
675 680685
Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg
690 695700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745750
Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His
770775
780
PL 243940 Β1
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825830
Gly Ser Gly Gly Val Asp Asp Glu Glu Glu Leu Ile Gin Leu Ile Ile
835 840845
Glu Lys Thr Gly Lys Ser Arg Glu Glu Ile Glu Lys Met Val Glu Glu
850 855860
Lys Ile Lys Ala Phe Asn Asn Leu Ile Ser Arg Arg Gly Ala Leu Leu
865 870 875880
Leu Val Ala Lys Lys Leu Gly Val Leu Tyr Lys Asn Thr Pro Lys Glu
885 890895
Lys Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly
900 905910
Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe
915 920925
Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile
930 935940
Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile
945 950 955960
Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile
965 970975
Asp Ser Tyr Lys Ile Leu Glu Ser Asp Leu Glu Ile Lys Pro Gin Lys
980 985990
Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr
995 10001005
Gin Lys Gly Thr He Val Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg
1010 10151020
Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp Trp Glu Ile Gly His
1025
1030
1035
1040
PL 243940 Β1
Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys
1045 10501055
Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala Thr Leu Lys Asp Leu
1060 10651070
Lys Ala Phe Lys Gly Glu Ala Asp
10751080 <210> 2 <211>1021 < 212> PRT < 213> Artificial Sequence <220>
< 223> fusion two protein < 400> 2
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1015
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
2530
Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala
4045
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
5560
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
70 7580
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu
9095
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100
105
110
PL 243940 Β1
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135140
Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly
145 150 155160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170175
Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340
345
350
PL 243940 Β1
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375380
Thr Thr Pro Glu Gly Val Ala Arg ArgTyr Gly Gly Glu Trp Thr Glu
385 390 395400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475480
Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp
485 490495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu LysThr Gly Lys Arg
500 505510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520525
Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555560
His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570575
Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin
580 585590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600605
PL 243940 Β1
Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615620
Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr
625 630 635640
Glu Thr Ala SerTrp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665670
Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu
675 680685
Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg
690 695700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745750
Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His
770 775780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825830
Gly Ser Gly Gly Val Asp Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr
835
840
845
PL 243940 Β1
Val Lys Val Lys Gly Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr
850 855860
Ser Lys Gly Lys Phe Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr
865 870 875880
Ile Lys Ala Ile Ile Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr
885 890895
Val Ile Glu Ala Ile Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn
900 905910
Leu Glu Leu His Ile Asp Ser Tyr Lys He Leu Glu Ser Asp Leu Glu
915 920925
Ile Lys Pro Gin Lys Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr
930 935940
Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val Ser Lys Ala Ile Leu
945 950 955960
Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp
965 970975
Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn
980 985990
Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala
995 10001005
Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu Ala Asp
1010 10151020 < 210> 3 < 211> 930 < 212> PRT < 213> Artificial Sequence <220>
<223> fusion two protein
PL 243940 Β1 <400> 3
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1015
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
2530
Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala
4045
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
5560
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
70 7580
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu
9095
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135140
Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly
145 150 155160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170175
Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225
230
235
240
PL 243940 Β1
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 2S0285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465
470
475
480
PL 243940 Β1
Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp
485 490495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520525
Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555560
His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570575
Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin
580 585590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600605
Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615620
Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr
625 630 635640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665670
Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu
675 680685
Ala Gin Ala Phe Ile Glu ArgTyr Phe Gin Ser Phe Pro Lys Val Arg
690 695700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730735
PL 243940 Β1
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745750
Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His
770 775780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825830
Gly Ser Gly Gly Val Asp Lys Pro Gin Lys Gin Glu Phe Val Gly Ile
835 840845
Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val
850 855860
Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr
865 870 875880
Phe Asn Asp Phe Asp Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly
885 890895
Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp
900 905910
Lys Val Glu Glu Ala Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu
915 920925
Ala Asp
930 <210> 4 <211>6 <212> PRT
PL 243940 Β1 < 213> Artificial Sequence <220>
< 223> Linker < 400> 4
Gly Ser Gly Gly Val Asp 1 5 <210>5 <211> 832 < 212> PRT < 213> Bacteria <prokaryote>
< 400> 5
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu 15 1015
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
2530
Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala
4045
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
5560
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
70 7580
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu
9095
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100
105
110
PL 243940 Β1
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135140
Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly
145 150 155160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170175
Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235240
Leu Ser Trp Asp Leu Ala Lys Val ArgThr Asp Leu Pro Leu Glu Val
245 250255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345350
Ala Lys Asp Leu SerVal Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360365
PL 243940 Β1
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly GluTrp Thr Glu
385 390 395400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475480
Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp
485 490495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520525
Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555560
His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570575
Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin
580 585590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595
600
605
PL 243940 Β1
Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615620
Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr
625 630 635640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665670
Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu
675 680685
Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg
690 695700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745750
Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His
770 775780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820
825
830
PL 243940 Β1 <210> 6 <211> 243 <212> PRT <213> Bacteria <prokaryote>
<400> 6
Met Asp Glu Glu Glu Leu Ile Gin Leu Ile Ile Glu Lys Thr Gly Lys
1015
Ser Arg Glu Glu Ile Glu Lys Met Val Glu Glu Lys Ile Lys Ala Phe
2530
Asn Asn Leu Ile Ser Arg Arg Gly Ala Leu Leu Leu Val Ala Lys Lys
4045
Leu Gly Val Leu Tyr Lys Asn Thr Pro Lys Glu Lys Lys Ile Gly Glu
5560
Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly Lys Ile Leu Lys Ser
70 7580
Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe Gin Pro Ile Ile Leu
9095
Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile Trp Asn Thr Asp Lys
100 105110
Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile Gly Lys Thr Lys Ile
115 120125
Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile Asp Ser Tyr Lys Ile
130 135140
Leu Glu Ser Asp Leu Glu Ile Lys Pro Gin Lys Gin Glu Phe Val Gly
145 150 155160
Ile Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile
165 170175
Val Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg Glu Leu Pro Val Val
180
185
190
PL 243940 Β1
Tyr Phe Asn Asp Phe Asp Trp Glu Ile Gly His Ile Tyr Lys Val Tyr
195 200205
Gly Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala
210 215220
Asp Lys Val Glu Glu Ala Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly
225 230 235240
Glu Ala Asp <210> 7 <211> 92 <212> PRT <213> Bacteria <prokaryote>
<400> 7
Met Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly
1015
Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe
2530
Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile
4045
Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile
5560
Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile
70 7580
Asp Ser Tyr Lys Ile Leu Glu Ser Asp Leu Glu Ile
8590 <210> 8 <211> 93
PL 243940 Β1 <212> PRT <213> Bacteria <prokaryote>
<400> 8
Met Lys Pro Gin Lys Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr
1015
Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val Ser Lys Ala Ile Leu
2530
Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp
4045
Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn
5560
Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala
70 7580
Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu Ala Asp
8590 <210> 9 < 211> 8539 < 212> DNA < 213> Artificial Sequence <220>
< 223> Fusion of two diffrent gene < 400> 9 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
PL 243940 Β1 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
PL 243940 Β1 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
PL 243940 Β1 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
PL 243940 Β1 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
PL 243940 Β1 atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
PL 243940 Β1 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640
PL 243940 Β1 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgrtc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540
PL 243940 Β1 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500
PL 243940 Β1 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgatg atgaagagga actaatacaa ctaataatag 7620 aaaaaactgg caaatctcga gaggaaatag aaaaaatggt ggaagaaaaa attaaagctt 7680 ttaacaattt aatatctcgt aggggggctt tactattagt agcaaaaaaa cttggtgttt 7740 tgtataaaaa cactccgaaa gagaaaaaaa ttggcgaatt agaaagctgg gaatatgtaa 7800 aagtaaaggg caaaattctc aaatcttttg gattaattag ttattcgaaa gggaaattcc 7860 aacctattat tttaggagac gaaaccggta ctattaaagc tattatttgg aataccgata 7920 aagaattacc tgaaaacact gtaatagaag ctattgggaa aaccaaaatt aataagaaaa 7980 ctggcaattt agaattacat atagacagtt ataaaatttt agaaagcgat ttagagataa 8040 aaccccaaaa gcaagaattt gttgggattt gcatagttaa atatccaaaa aaacaaaccc 8100 aaaaaggcac aatagtatcg aaagcaattt taactagctt agatagggaa ttgcctgtag 8160 tatatttcaa cgattttgat tgggaaatag gccatatata taaagtatat ggaaagctta 8220 agaaaaacat aaaaactggt aaaatagaat ttttcgctga caaagttgag gaagcaacat 8280 taaaagatct aaaagctttt aaaggagagg ccgatcacca ccaccaccac cactaaggat 8340 ccgaattcga gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac 8400
PL 243940 Β1 tgagatccgg ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag 8460 caataactag cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa 8520 ggaggaacta tatccggat 8539 <210> 10 <211> 8362 < 212> DNA < 213> ArtificiaI Sequence <220>
< 223> Fusion of two diffrent gene < 400> 10 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
PL 243940 Β1 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
PL 243940 Β1 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
PL 243940 Β1 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
PL 243940 Β1 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccacta c cgagatgtcc gcacca acgc gcagcccgga ctcggta atg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
PL 243940 Β1 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100
PL 243940 Β1 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000
PL 243940 Β1 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgctc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960
PL 243940 Β1 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgata aaattggcga attagaaagc tgggaatatg 7620 taaaagtaaa gggcaaaatt ctcaaatctt ttggattaat tagttattcg aaagggaaat 7680 tccaacctat tattttagga gacgaaaccg gtactattaa agctattatt tggaataccg 7740 ataaagaatt acctgaaaac actgtaatag aagctattgg gaaaaccaaa attaataaga 7800 aaactggcaa tttagaatta catatagaca gttataaaat tttagaaagc gatttagaga 7860
PL 243940 Β1 taaaacccca aaagcaagaa tttgttggga tttgcatagt taaatatcca aaaaaacaaa 7920 cccaaaaagg cacaatagta tcgaaagcaa ttttaactag cttagatagg gaattgcctg 7980 tagtatattt caacgatttt gattgggaaa taggccatat atataaagta tatggaaagc 8040 ttaagaaaaa cataaaaact ggtaaaatag aatttttcgc tgacaaagtt gaggaagcaa 8100 cattaaaaga tctaaaagct tttaaaggag aggccgatca ccaccaccac caccactaag 8160 gatccgaatt cgagctccgt cgacaagctt gcggccgcac tcgagcacca ccaccaccac 8220 cactgagatc cggctgctaa caaagcccga aaggaagctg agttggctgc tgccaccgct 8280 gagcaataac tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg 8340 aaaggaggaa ctatatccgg at 8362 <210> 11 <211> 8089 < 212> DNA < 213> Artificial Sequence <220>
< 223> Fusion of two diffrent gene <400> 11
PL 243940 Β1 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaa ata c gcgatcgctg ttaaa aggac 960
PL 243940 Β1 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
PL 243940 Β1 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
PL 243940 Β1 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
PL 243940 Β1 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccacta c cgagatgtcc gcacca a cgc gcagcccgga ctcggta atg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
PL 243940 Β1 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagca a c cgca cctgtg 49 20 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580
PL 243940 Β1 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgctc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540
PL 243940 Β1 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440
PL 243940 Β1 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgata aaccccaaaa gcaagaattt gttgggattt 7620 gcatagttaa atatccaaaa aaacaaaccc aaaaaggcac aatagtatcg aaagcaattt 7680 taactagctt agatagggaa ttgcctgtag tatatttcaa cgattttgat tgggaaatag 7740 gccatatata taaagtatat ggaaagctta agaaaaacat aaaaactggt aaaatagaat 7800 ttttcgctga caaagttgag gaagcaacat taaaagatct aaaagctttt aaaggagagg 7860 ccgatcacca ccaccaccac cactaaggat ccgaattcga gctccgtcga caagcttgcg 7920 gccgcactcg agcaccacca ccaccaccac tgagatccgg ctgctaacaa agcccgaaag 7980 gaagctgagt tggctgctgc caccgctgag caataactag cataacccct tggggcctct 8040 aaacgggtct tgaggggttt tttgctgaaa ggaggaacta tatccggat 8089 <210> 12 <211> 48 <212> DNA <213> ArtificiaI Sequence
PL 243940 Β1 <220>
<223> Oligonukleotide <400> 12 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 <210> 13 <211>41 <212> DNA <213> Artificial Sequence <22D>
<223> Oligonukleotide <400> 13 tcatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 14 <211> 51 < 212> DNA < 213> Artificial Sequence <220>
< 223> Oligonukleotide < 400> 14 agggcagcgg tggcgttgat gatgaagagg aactaataca actaataata g
PL 243940 Β1 <210> 15 <211> 80 < 212> DNA < 213> Artificial Sequence <220>
< 223> Oligonukleotide < 400> 15 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta aaagctttta 80 <210> 16 <211> 48 < 212> DNA < 213> Artificial Sequence <220>
<223> Oligonukleotide <400> 16 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 <210> 17
PL 243940 Β1 <211> 41 <212> DNA <213> Artificial Sequence <22O>
<223> Oligonukleotide <400> 17 tcatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 18 <211> 51 <212> DNA <213> Artificial Sequence <22O>
<223> Oligonukleotide <400> 18 agggcagcgg tggcgttgat gatgaagagg aactaataca actaataata g <210> 19 <211> 80 <212> DNA <213> Artificial Sequence
PL 243940 Β1 <220>
<223> Oligonukleotide <400> 19 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta aaagctttta <210> 20 <211> 48 < 212> DNA < 213> Artificial Sequence <220>
<223> Oligonukleotide <400> 20 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 < 210> 21 <211>41 < 212> DNA < 213> Artificial Sequence <220>
<223> Oligonukleotide
PL 243940 Β1 <400> 21 ttatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 22 <211> 45 <212> DNA <213> Artificial Sequence <220>
<223> Oligonukleotide <400> 22 agggcagcgg tggcgttgat aaaccccaaa agcaagaatt tgttg 45 <210> 23 <211> 70 < 212> DNA < 213> Artificial Sequence <220>
< 223> Oligonukleotide < 400> 23 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta

Claims (8)

1. Polimeraza TaqPol-NeqSSB o SEQ. ID 1-3.
2. Sposób klonowania polimerazy TaqPol-NeqSSB o SEQ.ID 1-3 znamienny tym, że otrzymuje się DNA insertu przeznaczonego do klonowania, które polega na przeprowadzeniu dwóch niezależnych reakcji PCR:
- w pierwszej reakcji amplifikacji otrzymuje się produkt o sekwencji nukleotydowej odpowiadającej sekwencji genu kodującego polimerazę DNA Taq z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu;
- drugi produkt zawiera sekwencję nukleotydową genu kodującego białko NeqSSB wiążącego DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu;
- matrycę do reakcji PCR stanowi wyizolowane genomowe DNA,
- otrzymane produkty w dwóch powyższych reakcjach rozdziela się w żelu agarozowym z bromkiem etydyny i poddaje się izolacji z żelu.
3. Sposób według zastrz. 2, znamienny tym, że produkty dwóch reakcji PCR służą, jako inserty w reakcji Gibsona, gdzie:
- następuje trawienie plazmidu pET30EKLIC
- w celu zlinearyzowania plazmidu pET30EKLIC poddaje się go trawieniu enzymem BamHI i Ndel (NEB), które tną w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA,
- reakcję trawienia DNA wektora prowadzi się przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu,
- potrawiony plazmid poddaje się rozdziałowi elektroforetycznemu i izoluje się;
- Reakcja składania genów;
- reakcję Gibsona prowadzi się w termocyklerze w 50°C przez 60 min, gdzie mieszanina zawiera bufor, nukleotydy, enzymy, wodę jałową, insert I, Insert II, wektor,
- po reakcji mieszaninę dodaje się do świeżo przygotowanych komórek kompetentnych E. coli TOP10,
- otrzymaną mieszaninę inkubuje się w lodzie przez 40 min, po tym czasie inkubacji przeprowadza się szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie, po szoku termicznym komórki poddaje się 60 min inkubacji w 37°C z dodatkiem 600 ml LB, po tym czasie komórki wiruje się (10 min, 1800 obr/min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny, płytki inkubowano przez ok. 16 h w 37°C.
4. Sposób według zastrz. 3, znamienny tym, że w celu uzyskania białka fuzyjnego TaqPol-NeqSSB, komórki E. coli BL RIL. poddaje się transformacji z użyciem DNA plazmidu rekombinantowego pET30-Pwo-NeqSSB i przeprowadza się produkcję pożądanych białek fuzyjnych, hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzi się przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodaje się IPTG do końcowego stężenia 0,1 mM; po indukcji hodowle prowadzi się jeszcze przez 5 h, po czym wiruje się (10 min, 5000 obr/min) i poddaje się oczyszczaniu metodą metalopowinowactwa; rezultaty produkcji białek analizuje się za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących.
5. Wyizolowany plazmid rekombinantowy znamienny tym, że obejmuje fragment nukleotydowej sekwencji białka kodujące polimerazę TaqPol-NeqSSBFull/II+III/III od 5076 do 8336 z plazmidu pET30EKLIC o SeQ. ID. 9, 5076 do 8159 z plazmidu pET30EKLIC o SEQ. ID. 10 oraz od 5076 do 7886 z plazmidu pET30EKLIC o SEQ. ID. 11.
6. Wyizolowany plazmid pET30-TaqPol-NeqSSBFull/II+III/III o sekwencji SEQ.ID.9-11.
7. Startery do klonowania polimerazy TaqPol-NeqSSBFull/II+III/III o sekwencjach SEQ.ID. 12-23.
8. Polimeraza TaqPol-NeqSSBFull/II+III/III o SEQ. ID 1-3 do zastosowania do powielania specyficznych sekwencji wirusa SARS CoV-2.
PL437909A 2021-05-19 2021-05-19 Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy PL243940B1 (pl)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PL437909A PL243940B1 (pl) 2021-05-19 2021-05-19 Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy
PCT/PL2022/000031 WO2022245230A1 (en) 2021-05-19 2022-05-18 Taq-neqssb polymerase, the method of its obtaining, recombinant plasmid, primers, and application of the polymerase.
EP22736399.1A EP4341389A1 (en) 2021-05-19 2022-05-18 Taq-neqssb polymerase, the method of its obtaining, recombinant plasmid, primers, and application of the polymerase

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PL437909A PL243940B1 (pl) 2021-05-19 2021-05-19 Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy

Publications (2)

Publication Number Publication Date
PL437909A1 PL437909A1 (pl) 2022-11-21
PL243940B1 true PL243940B1 (pl) 2023-11-06

Family

ID=82361283

Family Applications (1)

Application Number Title Priority Date Filing Date
PL437909A PL243940B1 (pl) 2021-05-19 2021-05-19 Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy

Country Status (3)

Country Link
EP (1) EP4341389A1 (pl)
PL (1) PL243940B1 (pl)
WO (1) WO2022245230A1 (pl)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070059713A1 (en) * 2005-09-09 2007-03-15 Lee Jun E SSB-DNA polymerase fusion proteins
PL426093A1 (pl) * 2018-06-27 2020-01-02 Instytut Biotechnologii I Medycyny Molekularnej Fuzyjna polimeraza kwasu jednołańcuchowego DNA Bst, cząsteczka kwasu nukleinowego kodująca fuzyjną polimerazę DNA NeqSSB-Bst, sposób jej otrzymywania oraz zastosowanie
WO2020185702A2 (en) * 2019-03-13 2020-09-17 Abclonal Science, Inc. Mutant taq polymerase for faster amplification

Also Published As

Publication number Publication date
WO2022245230A1 (en) 2022-11-24
EP4341389A1 (en) 2024-03-27
WO2022245230A9 (en) 2024-02-15
PL437909A1 (pl) 2022-11-21

Similar Documents

Publication Publication Date Title
CN113388538B (zh) 重组酵母、构建方法和其在制备酪醇及衍生物中的应用
CN111454978B (zh) 用于特异性吸附重金属铅的表面展示工程菌及构建方法和应用
CN111304232B (zh) 基于膜表面融合表达策略纯化蛋白的方法及其应用
US20030143685A1 (en) Efficient protein expression system
CN111850007B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36864及应用
CN111848758B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白突变体及应用
CN113151214B (zh) 一种具有脂肪酶活性的蛋白PnlipA及其基因和应用
CN114774452B (zh) 一种用于吸附溶液汞离子的工程大肠杆菌构建方法及应用
CN113322243B (zh) 蛋白质ugt236及其编码基因与应用
CN112481282B (zh) 一种特异性识别黄原胶侧链的碳水化合物结合模块cbm6b蛋白质及应用
CN115216485A (zh) 耐阿米卡星的重组质粒pET28a(+)-rmtB及其应用
CN114875004B (zh) 一种高立体选择性r转酮酶突变体及其编码基因和应用
PL243940B1 (pl) Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy
CN111848757B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36862及应用
KR20060098528A (ko) 대장균 발현 시스템을 이용한 인간 단백질 타이로신 탈인산화 효소의 발현 및 정제방법
KR20180010642A (ko) 돼지 설사병 백신용 섬모 및 독소를 대량 생산하는 형질전환 대장균 및 이에 의해 생산되는 섬모 및 독소를 항원으로 포함하는 돼지 설사병 예방용 백신 조성물
CN113337491B (zh) 一种提高角蛋白酶耐高温稳定性的结构域及其应用
PL241698B1 (pl) Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy
CN113122561B (zh) 膜蛋白SohB的表达载体及其表达纯化方法
CN113122558B (zh) 膜蛋白AmpG的表达载体及其表达纯化方法
CN113755460B (zh) 一种用于制备二氢槲皮素的黄酮还原酶
CN114591985B (zh) 一种突变果胶裂解酶及应用
CN111850006B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36865及应用
KR20230137996A (ko) 고 입체 선택성 r트랜스케톨라제 돌연변이체와 그 코딩 유전자 및 응용
CN113122559A (zh) 膜蛋白SecF的表达载体及其表达纯化方法