PL228024B1 - Expression vector set - Google Patents

Expression vector set

Info

Publication number
PL228024B1
PL228024B1 PL414704A PL41470415A PL228024B1 PL 228024 B1 PL228024 B1 PL 228024B1 PL 414704 A PL414704 A PL 414704A PL 41470415 A PL41470415 A PL 41470415A PL 228024 B1 PL228024 B1 PL 228024B1
Authority
PL
Poland
Prior art keywords
sequence
expression
vectors
protein
recombinant protein
Prior art date
Application number
PL414704A
Other languages
Polish (pl)
Other versions
PL414704A1 (en
Inventor
Krzysztof Stawujak
Bogusław Lupa
Justyna Steć-Niemczyk
-Niemczyk Justyna Stec
Original Assignee
Biocentrum Społka Z Ograniczoną Odpowiedzialnością
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biocentrum Społka Z Ograniczoną Odpowiedzialnością filed Critical Biocentrum Społka Z Ograniczoną Odpowiedzialnością
Priority to PL414704A priority Critical patent/PL228024B1/en
Publication of PL414704A1 publication Critical patent/PL414704A1/en
Publication of PL228024B1 publication Critical patent/PL228024B1/en

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Description

Przedmiotem wynalazku jest cząsteczka kwasu nukleinowego kodująca region promotorowy lub region linkerowy, zestaw wektorów ekspresyjnych oraz sposób produkcji białek rekombinowanych przy pomocy wektorów ekspresyjnych, pozwalający na łatwą optymalizację ekspresji białek rekombinowanych.The invention relates to a nucleic acid molecule encoding a promoter or linker region, a set of expression vectors, and a method of producing recombinant proteins with the aid of expression vectors, allowing for easy optimization of the expression of recombinant proteins.

Opisano cząsteczki kwasu nukleinowego wykorzystywane w produkcji białek rekombinowanych, w szczególności zaś kodujące regiony promotorowe służące regulacji ekspresji białek rekombinowanych, region polilinkerowy wykorzystywany w klasycznym klonowaniu w wektorach plazmidowych, zawierający specyficzne sekwencje rozpoznawane przez enzymy restrykcyjne oraz regiony linkerowe wykorzystywane w modułowej syntezie wektorów ekspresyjnych. Niniejszy wynalazek ujawnia także wektory ekspresyjne, zawierające opisywane cząsteczki kwasu nukleinowego, komórki bakteryjne zawierające wspominane wektory ekspresyjne, sposób wytwarzania wektorów ekspresyjnych w oparciu o opisywane cząsteczki, sposób prowadzenia testów ekspresji z wykorzystaniem opisywanych wektorów, sposób oznaczania białka rekombinowanego wyprodukowanego przy pomocy opisywanych wektorów, w tym zwłaszcza przy pomocy znaczników fluorescencyjnych lub sposób uwalniania białka rekombinowanego wykorzystujący dowolny enzym rozpoznający ujawnioną sekwencję.Nucleic acid molecules used in the production of recombinant proteins are described, in particular those encoding promoter regions for the regulation of recombinant protein expression, a polylinker region used in classical cloning in plasmid vectors, containing specific sequences recognized by restriction enzymes and linker regions used in the modular synthesis of expression vectors. The present invention also discloses expression vectors containing the described nucleic acid molecules, bacterial cells containing said expression vectors, a method of producing expression vectors based on the described molecules, a method of performing expression assays using the described vectors, a method of determining a recombinant protein produced with the described vectors, including, in particular, by means of fluorescent labels or a method of releasing a recombinant protein using any enzyme recognizing the disclosed sequence.

Stan technikiState of the art

W chwili obecnej białka rekombinowane znajdują szerokie zastosowanie w różnych dziedzinach nauki, przemysłu biotechnologicznego i farmacji. Wśród bardziej istotnych wymienić można badania podstawowe zmierzające do poznania struktury i właściwości białek oraz badania określające możliwe interakcje z cząsteczkami chemicznymi, co ma kluczowe znaczenie w procesie opracowywania nowych leków. Białka rekombinowane znajdują także zastosowanie, jako tzw. biofarmaceutyki, przykładem czego są hormony, interferony, interlueukiny lub czynniki hematopoetyczne (1). Mając na uwadze stale rosnący potencjał branży life-science należy spodziewać się coraz większego zapotrzebowania na preparaty białkowe o wysokiej jakości. Pomimo istnienia bardziej zaawansowanych technicznie metod, produkcja białek w skali laboratoryjnej zwykle przeprowadzana jest w systemie prokariotyc znym, zwłaszcza w Gram-ujemnych bakteriach Escherichia coli. System ten jest powszechnie uważany za najszybszy, najłatwiejszy i najbardziej korzystny pod względem ekonomicznym (2). Co za tym idzie produkcja białek rekombinowanych w tych bakteriach jest powszechnie stosowana na potrzeby wczesnych etapów analizy, niewymagających uwzględnienia profilu glikozylacji oraz na potrzeby produkcji w małej skali (3).At present, recombinant proteins are widely used in various fields of science, biotechnology and pharmacy. The more important ones include basic research aimed at understanding the structure and properties of proteins, and research determining possible interactions with chemical molecules, which is crucial in the process of developing new drugs. Recombinant proteins are also used as so-called biopharmaceuticals, such as hormones, interferons, interlueukins or hematopoietic factors (1). Considering the constantly growing potential of the life-science industry, one should expect an increasing demand for high-quality protein preparations. Despite the existence of more technically advanced methods, laboratory scale protein production is usually carried out in a prokaryotic system, especially in Escherichia coli Gram-negative bacteria. This system is widely regarded as the fastest, easiest and most economically advantageous (2). Consequently, the production of recombinant proteins in these bacteria is commonly used for the early stages of analysis, which do not require taking into account the glycosylation profile, and for small-scale production (3).

Bakterie E. coli charakteryzują się dynamicznym wzrostem, w odpowiednio dobranych warunkach podziały komórkowe następują co 20 minut. Oznacza to, że do osiągnięcia stacjonarnej fazy hodowli wystarcza czas rzędu kilku lub kilkunastu godzin. Szybka produkcja biomasy pozwala zdecydowanie skrócić czas produkcji białek rekombinowanych (4). Dodatkową zaletą E. coli jest szybka i wydajna procedura transformacji pozwalająca na wprowadzenie pożądanego konstruktu genetycznego do komórki bakteryjnej (5).E. coli bacteria are characterized by a dynamic growth, in properly selected conditions, cell division takes place every 20 minutes. This means that a few or a dozen or so hours is sufficient to reach the stationary phase of breeding. Rapid production of biomass allows to significantly shorten the production time of recombinant proteins (4). An additional advantage of E. coli is the fast and efficient transformation procedure that allows the introduction of the desired genetic construct into the bacterial cell (5).

Zasadniczą wadą procesu produkcji białek rekombinowanych w E. coli jest jego chimeryczny charakter. Wydajność i jakość produkcji zależy od warunków hodowli, kontekstu genetycznego a przede wszystkim od charakteru produkowanego białka. Czynniki takie jak skład pożywek, temperatura, warunki napowietrzania, czas trwania kultury bakteryjnej lub warunki indukcji ekspresji białek mają istotne znaczenie w tym procesie. Z kolei wydajność i efektywność podyktowana czynnikami genetycznymi zależy od genotypu bakterii i właściwościami wektora ekspresyjnego. Obecnie na rynku dostępnych jest kilkanaście różnych szczepów bakterii E. coli, wśród tych dedykowanych produkcji białek rekombinowanych wymienić można szczepy DH10B, TOP10 lub BL21. Obok genotypu bakterii istotną rolę odgrywa dobór elementów genetycznych wykorzystanych w wektorze ekspresyjnym.The main disadvantage of the recombinant protein production process in E. coli is its chimeric nature. The efficiency and quality of production depends on the breeding conditions, the genetic context and, above all, the nature of the produced protein. Factors such as the composition of the media, the temperature, the aeration conditions, the duration of the bacterial culture or the conditions for the induction of protein expression are important in this process. In turn, the efficiency and effectiveness dictated by genetic factors depends on the genotype of the bacteria and the properties of the expression vector. Currently, there are over a dozen different strains of E. coli bacteria available on the market, among those dedicated to the production of recombinant proteins, the DH10B, TOP10 or BL21 strains can be mentioned. In addition to the genotype of bacteria, an important role is played by the selection of genetic elements used in the expression vector.

W przypadku E. coli transformacja genetyczna przeprowadzana jest za pomocą plazmidów, będących krótkimi, niezależnymi od głównego chromosomu bakteryjnego, cząsteczkami DNA zdolnymi do autonomicznej replikacji. W warunkach laboratoryjnych do produkcji białek rekombinowanych wykorzystywane są zmodyfikowane plazmidy zawierające miejsce inicjacji replikacji, gen odporności na wybrany antybiotyk, region promotorowy często zawierający także metki fuzyjne oraz miejsca rozpoznawane przez proteazy. Ze względów technicznych dodawany jest także polilinker zawierający miejsca rozpoznawane przez enzymy restrykcyjne, co ułatwia procedurę klonowania molekularnego.In the case of E. coli, genetic transformation is carried out using plasmids, which are short, autonomous replication-capable DNA molecules, independent of the main bacterial chromosome. Under laboratory conditions, the production of recombinant proteins uses modified plasmids containing an origin of replication, a gene for resistance to a selected antibiotic, a promoter region often also containing fusion tags, and protease recognition sites. For technical reasons, a polylinker containing restriction enzyme recognition sites is also added, which facilitates the molecular cloning procedure.

Miejsca inicjacji replikacji są odpowiedzialne za utrzymanie odpowiedniej liczby kopii plazmidu w komórce bakteryjnej. Z jednej strony wysoka liczba kopii plazmidu sprzyja nadprodukcji białkaOrigin of replication is responsible for maintaining the appropriate number of plasmid copies in the bacterial cell. On the one hand, the high number of plasmid copies promotes protein overproduction

PL 228 024 B1 rekombinowanego, z drugiej strony może prowadzić do obciążenia metabolizmu komórki, co z kolei przekłada się negatywnie na wydajność produkcji. Dostępne na rynku plazmidy zawierają kilka typów miejsc inicjacji replikacji, jedno z nich pMBI obecne w powszechnie wykorzystywanej serii wektorów pET zapewnia od 15 do 60 kopii plazmidu w komórce (6). Zmodyfikowana wersja regionu pMBI obecna w wektorach serii pUC zwiększa liczbę kopii plazmidu do 500-700 na komórkę (7). Obok nich dostępne są miejsca inicjacji replikacji występujące w środowisku naturalnym jak ma to miejsce w wektorach pQE (Qiagen). Jeśli istnieje konieczność, by w komórce znajdowały się dwa plazmidy możliwe jest wykorzystanie miejsca p15A obecnego w wektorach pacy i pad zapewniając liczbę kopii 10-15 (8, 9).Recombinant production, on the other hand, can lead to a strain on the metabolism of the cell, which in turn has a negative impact on the production efficiency. Commercially available plasmids contain several types of origins of replication, one of which pMBI present in the commonly used series of pET vectors provides from 15 to 60 copies of the plasmid in the cell (6). The modified version of the pMBI region present in the pUC series vectors increases the plasmid copy number to 500-700 per cell (7). Apart from them, there are also sites of origin of replication occurring in the natural environment, as is the case in pQE vectors (Qiagen). If there is a need for two plasmids in the cell, it is possible to use the p15A site present in the trowel and pad vectors providing a copy number of 10-15 (8, 9).

Ze względu na konieczność przeprowadzenia selekcji w wektorach ekspresyjnych stosuje się moduły zapewniające oporność na antybiotyki. Najczęściej stosowane markery selekcyjne zapewni ając odporność na ampicylinę, chloramfenikol, kanamycynę i tetracykli nę najczęściej stosowane markery selekcyjne wykorzystywane w plazmidach ekspresyjnych.Due to the necessity to perform selection in the expression vectors, modules ensuring resistance to antibiotics are used. The most commonly used selection markers providing resistance to ampicillin, chloramphenicol, kanamycin and tetracycline. The most commonly used selection markers used in expression plasmids.

W wektorach ekspresyjnych powszechnie wykorzystuje się dwa rodzaje promotorów, czyli sekwencji rozpoznawanych przez polimerazy RNA, enzymy konieczne do przeprowadzenia transkrypcji. Innymi słowy ich działanie ma kluczowe znaczenie w wydajnej ekspresji białka. Promotory konstytutywne warunkujące stałą ekspresję białka w komórkach bakteryjnych. W przeciwieństwie do nich promotory indukowalne będące drugą grupą są powszechnie używane w systemach do heterologicznej produkcji białek rekombinowanych. Ich cechą charakterystyczną jest niski poziom ekspresji w waru nkach braku indukcji oraz wysoki poziom ekspresji w obecności induktora. W ich przypadku konieczne jest dołączenie elementów zapewniających regulację ekspresji. Jest to szczególnie potrzebne, gdy produkowane białka mają toksyczny wpływ na komórki bakteryjne. Powszechnie stosowanym rozwiązaniem zapewniającym kontrolę ekspresji jest wykorzystanie elementów operonu laktozowego. Ekspresja danego białka znajdującego się pod kontrolą represora operonu laktozowego wymuszana jest przez dodatek induktora IPTG (lzopropylo-3-D-1-thiogalaktopyranozyd), cząsteczki chemicznej przypominającej laktozę.Two types of promoters are commonly used in expression vectors, i.e. sequences recognized by RNA polymerases, enzymes necessary for transcription. In other words, their action is crucial for the efficient expression of a protein. Constitutive promoters conditioning the constant expression of proteins in bacterial cells. In contrast, the second group inducible promoters are commonly used in systems for heterologous production of recombinant proteins. Their characteristic feature is a low level of expression in the conditions of no induction and a high level of expression in the presence of an inducer. In their case, it is necessary to include elements that regulate expression. This is especially needed when the proteins produced have a toxic effect on bacterial cells. A commonly used expression control solution is the use of lactose operon elements. Expression of a given protein under the control of the lactose operon repressor is forced by the addition of an IPTG inducer (isopropyl-3-D-1-thiogalactopyranoside), a chemical molecule resembling lactose.

Suboptymalne działanie promotora powoduje niską wydajność procesu produkcji białek, jednocześnie zbyt silne działanie może spowolnić metabolizm lub być przyczyną problemów z poprawnym fałdowaniem i rozpuszczalnością białka. Do promotorów obecnych w dostępnych komercyjnie należą indukowalne fagowe promotory T5 i T7 (10, 11), syntetyczny promotor Trc (12), bakteryjny promotor lac lub jego zmodyfikowana wersja lacUV5 (13, 14).Suboptimal activity of the promoter causes low efficiency of the protein production process, at the same time too strong activity may slow down the metabolism or cause problems with proper folding and protein solubility. The promoters present in the commercially available include the inducible phage T5 and T7 promoters (10, 11), the synthetic Trc promoter (12), the bacterial lac promoter or its modified version of lacUV5 (13, 14).

Obok składników regulatorowych ważne jest uwzględnienie elementów poprawiających rozpuszczalność produkowanych białek, ich późniejszą detekcję i oczyszczanie białka na drodze chrom atografii powinowactwa. Realizowane jest to poprzez dodatek metek fuzyjnych, czyli cząsteczek białka lub peptydów umiejscowionych na C lub N końcu białka rekombinowanego. Jednymi z najczęściej stosowanych metek fuzyjnych w celach oczyszczania są metka polihistydynowa oraz transferaza gl utationowa (ang. Glutathione S-transferase). Metka polihistydynowa pozwala na szybkie oczyszczenie białka metodą powinowactwa na złożu niklowym (15). Transferaza glutationowa będąca białkiem o długości 223 aminokwasów i masie cząsteczkowej 26 kDa jest wykorzystywana do oczyszczania białek na podstawie powinowactwa do glutationu (16). Inne stosowane metki fuzyjne to polipeptydy poliargininowe lub FLAG a także niewielkie białka jak białka wiążące maltozę, ang. maltose binding protein (17) dodatkowo zapobiegające pojawianiu się ciałek inkluzyjnych.In addition to regulatory components, it is important to take into account the elements improving the solubility of the produced proteins, their subsequent detection and purification of the protein by chromium affinity atography. This is done by adding fusion tags, i.e. protein molecules or peptides located at the C or N terminus of the recombinant protein. One of the most commonly used fusion tags for purification purposes are the poly-histidine tag and the glutathione S-transferase. The poly-histidine tag allows for quick purification of the protein by the affinity method on a nickel bed (15). Glutathione transferase, which is a protein with a length of 223 amino acids and a molecular weight of 26 kDa, is used to purify proteins on the basis of glutathione affinity (16). Other used fusion tags are polyarginine or FLAG polypeptides as well as small proteins such as maltose binding proteins (17) which additionally prevent the appearance of inclusion bodies.

Podczas etapu oczyszczania metki fuzyjne mogą zostać odcięte przy wykorzystaniu proteaz (18), w takim przypadku cząsteczka metki fuzyjnej musi być oddzielona od docelowego białka przez krótką sekwencję aminokwasów rozpoznawanych przez proteazy takie jak TEV, trombina, czynnik Xa lub proteazę Clean-Cut.During the purification step, the fusion tags may be cleaved using proteases (18), in which case the fusion tag molecule must be separated from the target protein by a short sequence of amino acids recognized by proteases such as TEV, thrombin, factor Xa or Clean-Cut protease.

Dodatkowo metody ekspresji rekombinowanego białka w E. coli, można podzielić na trzy rodzaje. Pierwszy z nich polega na produkcji rekombinowanego białka w postaci rozpuszczalnej w cytoplazmie komórek E. coli. Drugi polega na ekspresji białek w formie nierozpuszczalnej w postaci ciałek inkluzyjnych. Możliwa jest też produkcja białek do przestrzeni periplazmatycznej. Produkcja białka w przestrzeni periplazmatycznej wymaga uwzględniania odpowiedniej sekwencji sygnalnej.Additionally, the methods of expressing recombinant protein in E. coli can be divided into three types. The first one involves the production of recombinant protein in a form soluble in the cytoplasm of E. coli cells. The second is the expression of proteins in an insoluble form in the form of inclusion bodies. It is also possible to produce proteins into the periplasmic space. Protein production in the periplasmic space requires taking into account the appropriate signal sequence.

Ponieważ ekspresja białka transformowanych E. coli zależy od wielu czynników konieczne jest ustalenie optymalnych warunków hodowli pozwalających na maksymalizację wydajności produkcji. Ze względu na swoją złożoność proces produkcji białek rekombinowanych powinien być poprzedzony testami ekspresji, mającymi na celu dobór takich warunków kultury bakteryjnej, by ekspresja białka była możliwie najwyższa. Zakładając, że w testach ekspresji brane są pod uwagę dwa różne czasySince expression of transformed E. coli protein depends on many factors, it is imperative to establish optimal culture conditions to maximize production efficiency. Due to its complexity, the production process of recombinant proteins should be preceded by expression tests aimed at selecting such conditions of bacterial culture that the protein expression is as high as possible. Assuming that two different times are considered in the expression tests

PL 228 024 B1 hodowli, dwie różne temperatury, cztery media hodowlane i dwa różne stężenia induktora konieczne jest porównanie 32 warunków hodowli. O ile dobór takich warunków jest możliwy do przeprowadzenia o tyle optymalizacja kontekstu genetycznego jest procesem zdecydowanie bardziej skomplikowanym a przez to często zaniedbywanym. Standardowe testy ekspresji polegają na określeniu poziomu białka rekombinowanego we frakcji rozpuszczalnej i w frakcji nierozpuszczalnej za pomocą elektroforezy SDS-PAGE. Obecność białka może być także określona za pomocą przeciwciał rozpoznających metki fuzyjne jak western-blot lub za pomocą immunoenzymatycznego testu ELISA.With the culture, two different temperatures, four culture media and two different inducer concentrations, it is necessary to compare 32 culture conditions. While the selection of such conditions is feasible, the optimization of the genetic context is a much more complicated process and thus often neglected. Standard expression assays are based on the determination of the level of recombinant protein in the soluble fraction and in the insoluble fraction by SDS-PAGE electrophoresis. The presence of the protein can also be determined by means of antibodies that recognize the fusion tags like western blots or by enzyme immunoassay ELISA.

Dostępne systemy ekspresyjne dedykowane E. coli składają się zazwyczaj z wektora ekspresyjnego wraz z niezbędnymi elementami koniecznymi do przeprowadzenia klonowania molekularnego. W skład takich zestawów wchodzi często ligaza, bufor reakcyjny, odczynniki do przeprowadzenia kontroli pozytywnej, startery, bakterie kompetentne i pożywki do transformacji. Wśród produktów dostępnych na rynku wymienić można zestawy pozwalające na odczyt w trzech ramkach odczytu jak FLAG-Shift Expression Vectors (Sigma-Aldrich). Alternatywnie dostępne są zestawy pozwalające na otrzymanie rekombinowanej cząsteczki wektora ekspresyjnego w oparciu o system klonowania niezależny od ligazy (ang. ligase independent cloning). Przykładem takiego systemu jest aLICator Ligation Independent Cloning and Expression System oferowany przez Thermo Scientific. W literaturze fachowej dostępne są także liczne procedury umożliwiające otrzymanie rekombinowanej cząsteczki wektora ekspresyjnego bez konieczności użycia ligazy (19-23). Część z nich oferowana jest w postaci zestawów komercyjnych jak EZ Cloning (GenScript).The available expression systems dedicated to E. coli usually consist of an expression vector with the necessary elements necessary to perform molecular cloning. Such kits often include ligase, reaction buffer, positive control reagents, primers, competent bacteria and transformation media. The products available on the market include three-frame reading sets such as FLAG-Shift Expression Vectors (Sigma-Aldrich). Alternatively, kits are available to obtain a recombinant expression vector molecule based on a ligase independent cloning system. An example of such a system is aLICator Ligation Independent Cloning and Expression System offered by Thermo Scientific. A number of procedures are also available in the literature to enable the preparation of a recombinant expression vector molecule without the use of a ligase (19-23). Some of them are offered in the form of commercial kits such as EZ Cloning (GenScript).

Celem wynalazku jest umożliwienie uzyskiwania w pojedynczej metodzie klonowania konstruktów genetyczne zapewniających zróżnicowane warunki genetyczne dla produkcji białek rekombinowanych, pozwalających dzięki temu na łatwą optymalizację warunków ekspresji. Nieoczekiwanie tak określony cel wynalazku został osiągnięty w niniejszym wynalazku.The object of the invention is to enable the achievement of genetic constructs in a single cloning method that ensure different genetic conditions for the production of recombinant proteins, and thus allow for an easy optimization of the expression conditions. Surprisingly, the object of the invention thus defined has been achieved in the present invention.

Istota wynalazkuThe essence of the invention

Przedmiotem wynalazku jest cząsteczka kwasu nukleinowego kodująca region promotorowy określony sekwencją wybraną spośród sekwencji nr 1-3;The invention relates to a nucleic acid molecule which codes for a promoter region determined by a sequence selected from Sequence No. 1-3;

Kolejnym przedmiotem wynalazku jest cząsteczka kwasu nukleinowego kodująca region linkerowy określony sekwencją wybraną spośród sekwencji nr 4-12, korzystnie region polilinkerowy posiadający sekwencję nr 4.Another object of the invention is a nucleic acid molecule encoding a linker region determined by a sequence selected from the sequence No. 4-12, preferably a polylinker region having the sequence No. 4.

Przedmiotem wynalazku jest zestaw wektorów ekspresyjnych charakteryzujący się tym, że składa się z różnych wektorów ekspresyjnych, przy czym każdy z wektorów zawiera:The subject of the invention is a set of expression vectors characterized in that it consists of various expression vectors, each of the vectors comprising:

- połączone funkcjonalnie region promotorowy określony sekwencją wybraną spośród sekwencji nr od 1 do 3 oraz region linkerowy określony sekwencją wybraną spośród sekwencji nr 4 do 12,- an operably linked promoter region defined by a sequence selected from sequences No. 1 to 3 and a linker region determined by a sequence selected from sequences No. 4 to 12,

- region inicjacji replikacji określony sekwencją wybraną spośród sekwencji nr od 13 do 15, przy czym wektory wchodzące w skład zestawu obejmują wszystkie kombinacje wspomnianych wariantów regionu promotorowego z wspomnianymi wariantami regionu inicjacji replikacji.- a replication origin region defined by a sequence selected from sequences Nos. 13 to 15, the vectors comprising the set comprising all combinations of said promoter region variants with said replication origin variants.

Korzystnie, wektor ekspresyjny zawiera ponadto sekwencję kwasu nukleinowego kodującą cząsteczkę reporterową, korzystnie białko zielonej fluorescencji lub białko różowej fluorescencji.Preferably, the expression vector further comprises a nucleic acid sequence encoding a reporter molecule, preferably a green fluorescent protein or a pink fluorescent protein.

Korzystnie, wektor ekspresyjny jest cząsteczką liniową.Preferably, the expression vector is a linear molecule.

Korzystnie, wektor ekspresyjny koduje region odpowiadający aminokwasom WELQ rozpoznawanym przez proteazę Clean-Cut;Preferably, the expression vector encodes a region corresponding to the WELQ amino acids recognized by the Clean-Cut protease;

Korzystnie, poniżej sekwencji odpowiadającej aminokwasom WELQ znajduje się miejsce inicjacji transkrypcji.Preferably, the transcription initiation site is located downstream of the sequence corresponding to the amino acids of WELQ.

Korzystnie, powyżej sekwencji WELQ znajduje się sekwencja odpowiadająca aminokwasom MIHHHHHH.Preferably, there is a sequence corresponding to the amino acids MIHHHHHH upstream of the WELQ sequence.

Korzystnie, zestaw według wynalazku zawiera wektory o sekwencjach nr od 16 do 24. Korzystnie, zestaw według wynalazku zawiera wektory o sekwencjach nr od 25 do 33.Preferably, the kit according to the invention comprises vectors with sequence Nos. 16 to 24. Preferably, the kit according to the invention comprises vectors with sequences Nos. 25 to 33.

Kolejnym przedmiotem wynalazku jest sposób produkcji białek rekombinowanych charakteryzujący się tym, że komórki E.coli transformuje się zestawem wektorów ekspresyjnych według wynalazku zdefiniowanym powyżej, zawierających sekwencję kodującą białko rekombinowane, prowadzi się próbną hodowlę uzyskanych transformantów w ustalonych warunkach hodowli, określa się poziom ekspresji uzyskiwanej dla różnych transformantów, a następnie prowadzi się ostateczną hodowlę produkcyjną szczepu transformanta dającego najwyższy poziom ekspresji i izoluje się białko rekombinantowe z brzeczki hodowlanej.Another object of the invention is a method of producing recombinant proteins, characterized in that E. coli cells are transformed with a set of expression vectors according to the invention as defined above, containing a sequence coding for a recombinant protein, the obtained transformants are cultured under predetermined culture conditions, and the expression level obtained for different transformants, and then the final production culture of the transformant strain giving the highest expression level is run and the recombinant protein is isolated from the culture broth.

PL 228 024 B1PL 228 024 B1

Korzystnie, do uwalniania białka rekombinowanego wykorzystywana jest proteaza Clean-Cut.Preferably, a Clean-Cut protease is used to release the recombinant protein.

Korzystnie, do procesu odcinania metki fuzyjnej i uwalniania N-końca białka rekombinowanego oraz/lub procesu dowolnego kształtowania N-końca białka rekombinowanego wykorzystywana jest proteaza Clean-Cut.Preferably, a Clean-Cut protease is used in the process of cleaving the fusion tag and releasing the N-terminus of the recombinant protein and / or the process of arbitrarily shaping the N-terminus of the recombinant protein.

Szczegółowy opis wynalazkuDetailed Description of the Invention

W skład opisywanego systemu wchodzi szereg nowatorskich wektorów ekspresyjnych zawierających unikalne sekwencje nukleotydowe odpowiadające regionom promotorowym (sekwencje: 1-3), polilinker (sekwencja: 4), linkerom służącym do łączenia fragmentów modułów DNA (sekwencja: 5-12) oraz miejsca rozpoznawanym przez proteazę Clean-Cut odpowiadającą aminokwasom WELQ. Zgłaszane wektory dostępne w dwóch konformacjach, kolistej zawierającej polilinker oraz liniowej zakończonej 15 bp linkerami, w piśmiennictwie anglojęzycznym określanymi jako tzw. overhangs.The described system includes a number of innovative expression vectors containing unique nucleotide sequences corresponding to the promoter regions (sequences: 1-3), polylinker (sequence: 4), linkers for joining fragments of DNA modules (sequence: 5-12) and sites recognized by the protease Clean-Cut, which corresponds to the WELQ amino acids. Reported vectors available in two conformations, circular containing a polylinker and linear ended with 15 bp linkers, in the English literature referred to as the so-called overhangs.

Plazmidy pBCM dostępne w formie kolistej przeznaczone są do klasycznego klonowania molekularnego wykorzystującego enzymy restrykcyjne i ligazę. W takim przypadku docelowy fragment DNA włączany jest do wektora pomiędzy miejsca restrykcyjne zawarte w polilinkerze. Formy liniowe nazywane inaczej otwartymi wektorami ekspresyjnymi dedykowane są do klonowania niezależnego od ligazy. W przeciwieństwie do form kolistych nie zawierają polilinkera, jego miejsce zajmowane jest przez docelowy fragment DNA zawierający 15 nukleotydowe regiony linkerowe odpowiadające końcom otwartego wektora. Moduły linkerowe zaprojektowano tak, by pozwalały na łączenie docelowego insertu z cząsteczką wektora na zasadzie, druga wersja dedykowana jest metodzie LIC (ang. ligation independent cloning) przeprowadzanej przy użyciu polimerazy DNA faga T4.The pBCM plasmids available in circular form are intended for classical molecular cloning using restriction enzymes and ligase. In this case, the target DNA fragment is inserted into the vector between the restriction sites contained in the polylinker. Linear forms, otherwise known as open expression vectors, are dedicated to ligase-independent cloning. Unlike the circular forms, they do not contain a polylinker, its site is taken by a target DNA fragment containing 15 nucleotide linker regions corresponding to the ends of the open vector. The linker modules were designed to allow the target insert to be joined with the vector molecule, the second version is dedicated to the LIC (ligation independent cloning) method carried out with the use of T4 phage DNA polymerase.

Na Figurze 1 przedstawiona została schematyczna reprezentacja polilinkera z zaznaczeniem miejsc restrykcyjnych wraz z pozycją miejsca rozpoznawanego przez proteazę Clean-Cut. Wektory zostały opracowane w wersji minimalistycznej. Oznacza to, że pomiędzy modułami niezbędnymi do poprawnego działania wektora i do klonowania nie zawiera dodatkowych sekwencji. Jedynym wyją tkiem są 15 nukleotydowe sekwencje linkerowe wykorzystane w syntezie wektorów. Moduły zawarte w wektorach to:Figure 1 shows a schematic representation of the polylinker highlighting the restriction sites along with the position of the Clean-Cut protease recognition site. The vectors were developed in a minimalist version. This means that there are no additional sequences between the modules necessary for the correct operation of the vector and for cloning. The only exception is the 15-nucleotide linker sequences used in the synthesis of the vectors. The modules contained in vectors are:

• Moduł odporności na antybiotyk pozwalający na selekcję transformantów. Występuje w dwóch wersjach zapewniających odporność na ampicylinę i kanamycynę.• Antibiotic resistance module allowing the selection of transformants. It comes in two versions to provide resistance to ampicillin and kanamycin.

• Moduł syntezy represora operonu laktozowego występujący w każdym wektorze.• A repressor synthesis module of the lactose operon present in each vector.

• Moduł inicjacji replikacji występuje w trzech wersjach zapewniających liczbę kopii plazmidu na poziomie od 10 do 15, od 15 do 50 oraz 500 do 700 kopii plazmidu na komórkę.• The replication initiation module comes in three versions with a plasmid copy number of 10 to 15, 15 to 50 and 500 to 700 plasmid copies per cell.

• Moduł promotorowy występuje w trzech wersjach odpowiadających zmodyfikowanym promotorom BCMT5, BCMT7 i BCMTrc.• The promoter module has three versions corresponding to the modified BCMT5, BCMT7 and BCMTrc promoters.

• Moduł polilinkerowy występuje tylko w wektorach przeznaczonych do klasycznego klonowania przy użyciu enzymów restrykcyjnych i ligazy.• The polylinker module is present only in vectors intended for classical cloning using restriction enzymes and ligase.

Wektory dostępne są jako mieszanina zawierająca równo-molowe stosunki dziewięciu wektorów różniących się kombinacją miejsc inicjacji replikacji (3x) i regionów promotorowych (3x). Moduły o dpowiedzialne za zapewnienie odporności na antybiotyk i produkcję represora operonu laktozowego są obecne w każdej cząsteczce wektora. Dzięki temu w pojedynczej metodzie klonowania mogą powstać konstrukty genetyczne zapewniające zróżnicowane warunki genetyczne dla produkcji białek rekomb inowanych. Dzięki temu podczas procesu transformacji do komórki bakteryjnej mogą trafić plazmidy różniące się typem miejsca inicjacji replikacji i siłą promotora. Alternatywnie dostępna jest mieszanina modułów, która w trakcie procedury klonowania niezależnego od ligacji utworzy serię wektorów ekspresyjnych. W takim doświadczeniu kluczową role odgrywają regiony linkerowe odpowiedzialne za utworzenie kompletnej cząsteczki wektora. Wykorzystanie modułów określane jest mianem podejścia kombinatorycznego.Vectors are available as a mixture containing equimolar ratios of nine vectors differing in the combination of origins of replication (3x) and promoter regions (3x). Modules responsible for antibiotic resistance and lactose operon repressor production are present in each vector molecule. As a result, in a single cloning method, genetic constructs can be created that provide different genetic conditions for the production of recombined proteins. Thanks to this, during the transformation process, plasmids that differ in the type of the origin of replication and the strength of the promoter can enter the bacterial cell. Alternatively, a mixture of modules is available that will form a series of expression vectors during the ligation-independent cloning procedure. In such an experiment, the linker regions responsible for the formation of the complete vector molecule play a key role. The use of modules is known as the combinatorial approach.

Dodatkowo wektory pBCM występują w wersjach zawierających transferazę glutationową (GST) lub białko zielonej fluorescencji (GFP) zawartą w module promotorowym. Elementy te usytuowane są powyżej docelowego białka i oddzielone miejscem rozpoznawanym przez proteazę Clean-Cut. Dzięki temu powstające białko rekombinowane będzie mogło zostać uwolnione przez proteazę Clean-Cut od znajdujących się na jego N końcu białka transferazy glutationowej lub białka zielonej fluorescencji.Additionally, pBCM vectors are available in versions containing glutathione transferase (GST) or green fluorescent protein (GFP) contained in the promoter module. These elements are located above the target protein and separated by a Clean-Cut protease recognition site. Thanks to this, the resulting recombinant protein can be released by the Clean-Cut protease from the glutathione transferase protein or green fluorescence protein located at its N terminus.

W przypadku serii wektorów zawierających białko zielonej fluorescencji testy ekspresji będą przeprowadzone poprzez pomiar fluorescencji przy długości fali wzbudzenia i długości fali emisji właściwej dla białka GFP dla kultury bakterii E. coli. W systemie pBCM białka rekombinowane są produ6For a series of vectors containing the green fluorescence protein, expression tests will be performed by measuring the fluorescence at the excitation wavelength and emission wavelength specific to the GFP protein of the E. coli culture. Recombinant proteins are produced in the pBCM system

PL 228 024 Β1 kowane z dołączonym białkiem zielonej fluorescencji, z tego względu poziom fluorescencji bezpośrednio odpowiada poziomowi białka rekombinowanego w kulturze.PL 228 024 Β1 is linked with an attached green fluorescent protein, therefore the level of fluorescence directly corresponds to the level of recombinant protein in culture.

W przypadku serii wektorów zawierających transferazę glutationową testy ekspresji powinny zostać przeprowadzone przy pomocy analizy elektroforegramów SDS-PAGE frakcji rozpuszczalnej lub nierozpuszczalnej otrzymanej dla kultury E. coli lub dalej poprzez analizę western-blot z przeciwciałami specyficznymi do transferazy glutationowej.For a series of vectors containing glutathione transferase, expression tests should be performed by SDS-PAGE electrophoregram analysis of the soluble or insoluble fraction obtained for E. coli culture or further by western blot analysis with glutathione transferase specific antibodies.

Ujawniono cząsteczki kwasu nukleinowego określone sekwencjami nr 1-3, odpowiadające regionom promotorowym.The nucleic acid molecules represented by the sequences Nos. 1-3, corresponding to the promoter regions, are disclosed.

Korzystnie, gdy ekspresja docelowego białka jest powiązana funkcjonalnie z regionami promotorowym i.Preferably, expression of the target protein is operably linked to the promoter regions and.

Korzystnie, gdy regiony promotorowe zapewniają stabilną lub przejściową ekspresję.Preferably, the promoter regions provide for stable or transient expression.

Ponadto ujawniona została cząsteczka kwasu nukleinowego określona sekwencją nr 4, odpowiadającą regionowi polilinkerowemu.In addition, a nucleic acid molecule with sequence No. 4, corresponding to a polylinker region, is disclosed.

Korzystnie, gdy wykorzystywana jest w klonowaniu z użyciem enzymów restrykcyjnych i ligazy.Preferably it is used in restriction enzyme and ligase cloning.

Szczególną realizację wynalazku stanowią cząsteczki kwasu nukleinowego określone sekwencjami nr 5-12, odpowiadające regionom linkerowym.A particular embodiment of the invention are the nucleic acid molecules defined by the sequences Nos. 5-12, corresponding to the linker regions.

Korzystnie, gdy wykorzystywane są w klonowaniu z użyciem metod niezależnych od ligazy.Preferably they are used in cloning using ligase independent methods.

Korzystnie, gdy wykorzystywane są do syntezy cząsteczki wektora w podejściu kombinatorycznym.Preferably, they are used for the synthesis of vector molecules in a combinatorial approach.

Korzystnie, gdy zawierają miejsce rozpoznawane przez proteazę Clean-Cut.Preferably they contain a Clean-Cut protease recognition site.

Korzystnie, gdy sekwencja kodująca docelowe białko jest połączona funkcjonalnie.Preferably, the target protein coding sequence is operably linked.

Korzystnie, gdy w procedurze klonowania wykorzystywana jest polimeraza DNA faga T4.Preferably, T4 DNA polymerase is used in the cloning procedure.

Kolejną realizację wynalazku stanowi cząsteczka kwasu nukleinowego odpowiadająca aminokwasom WELQ rozpoznawanym przez proteazę Clean-Cut.Another embodiment of the invention is a nucleic acid molecule corresponding to the WELQ amino acids recognized by the Clean-Cut protease.

Korzystnie, gdy powyżej nukleotydów odpowiadającym aminokwasom WELQ znajduje się gen kodujący transferazę glutationową.Preferably, the gene encoding glutathione transferase is present above the nucleotides corresponding to the amino acids of WELQ.

Korzystnie, gdy grupę białek lub peptydów znajdujących się powyżej stanowią te pozwalające na oczyszczanie produktu ekspresji na drodze chromatografii powinowactwa.Preferably, the upstream group of proteins or peptides are those allowing the purification of the expression product by affinity chromatography.

Korzystnie, gdy powyżej nukleotydów odpowiadającym aminokwasom WELQ znajduje się gen kodujący białko zielonej fluorescencji GFP.Preferably, the gene encoding the GFP green fluorescent protein is located above the nucleotides corresponding to the WELQ amino acids.

Korzystnie, gdy grupę białek fluorescencyjnych stanowią także białka CFP, RFP lub YFP.Preferably, the group of fluorescent proteins also comprises CFP, RFP or YFP proteins.

Korzystnie, gdy powyżej nukleotydów odpowiadającym aminokwasom WELQ znajduje się miejsce inicjacji transkrypcji.Preferably, the transcription initiation site is located above the nucleotides corresponding to the amino acids of WELQ.

Korzystnie, gdy pomiędzy miejscem inicjacji transkrypcji a nukleotydom odpowiadającym aminokwasom WELQ znajdują się nukleotydy kodujące izoleucynę.Preferably, there are nucleotides encoding isoleucine between the transcription initiation site and the nucleotides corresponding to the amino acids of WELQ.

Przykładowe wektory według wynalazku, przedstawione w załączonym wykazie sekwencji, zostały wymienione w tabeli poniżej.Exemplary vectors of the invention, shown in the accompanying sequence listing, are listed in the table below.

wektor vector promotor promoter tag fuzyjny fusion tag liczba kopii number of copies marker marker nr sekw sequence no pBCMIML pBCMIML T5 T5 HIS HIS -500 -500 AMP AMP 16 16 pBCM2ML pBCM2ML T7 T7 HIS HIS -500 -500 AMR AMR 17 17 pBCM3ML pBCM3ML TRC TRC HIS HIS -500 -500 AMP AMP 18 18 pBCM4ML pBCM4ML T5 T5 HIS HIS -20-30 -20-30 AMP AMP 19 19 pBCMSML pBCMSML T7 T7 HIS HIS -20-30 -20-30 AMP AMP 20 twenty pBCMBML pBCMBML TRC TRC HIS HIS -20-30 -20-30 AMP AMP 21 21 pBCM7ML pBCM7ML T5 T5 HIS HIS -10 -10 AMP AMP 22 22 pBCMSML pBCMSML T7 T7 HIS HIS -10 -10 AMP AMP 23 23 pBCM9ML pBCM9ML TRC TRC HIS HIS -10 -10 AMP AMP 24 24 pBCMIMLG pBCMIMLG T5 T5 HIS/GST HIS / GST -500 -500 AMP AMP 25 25 pBCM2MLG pBCM2MLG T7 T7 HIS/GST HIS / GST -500 -500 AMP AMP 26 26 pBCM3MLG pBCM3MLG TRC TRC HIS/GST HIS / GST -500 -500 AMP AMP 27 27 PBCM4MLG PBCM4MLG T5 T5 HIS/GST HIS / GST -20-30 -20-30 AMP AMP 28 28 pBCM5MLG pBCM5MLG T7 T7 HIS/GST HIS / GST -20-30 -20-30 AMP AMP 29 29 PBCM6MLG PBCM6MLG TRC TRC HIS/GST HIS / GST -20-30 -20-30 AMP AMP 30 thirty pBCM7MLG pBCM7MLG T5 T5 HIS/GST HIS / GST -10 -10 AMP AMP 31 31 pBCM3MLG pBCM3MLG T7 T7 HIS/GST HIS / GST -10 -10 AMP AMP 32 32 pBCM9MLG pBCM9MLG TRC TRC HIS/GST HIS / GST -10 -10 AMP AMP 33 33

PL 228 024 B1PL 228 024 B1

Kolejną realizację wynalazku stanowi komórka bakteryjna zawierająca wektor plazmidowy określony powyżej.Another embodiment of the invention is a bacterial cell containing the plasmid vector as defined above.

Kolejną realizację wynalazku stanowi sposób otrzymywania białka rekombinowanego w bakteriach E. coli charakteryzujący się tym, że do komórki bakterii - gospodarza, wprowadza się materiał genetyczny stanowiący wektor plazmidowy określony powyżej.A further embodiment of the invention is a method for obtaining a recombinant protein in E. coli bacteria, characterized in that the genetic material constituting the plasmid vector as defined above is introduced into the host bacterial cell.

Kolejną realizację wynalazku stanowi zastosowanie cząsteczek kwasu nukleinowego określonych powyżej do konstrukcji wektora, który zapewnia produkcję białka rekombinowanego w komórce bakterii E. coli.A further embodiment of the invention is the use of the nucleic acid molecules defined above for the construction of a vector which ensures the production of a recombinant protein in an E. coli bacterial cell.

Korzystnie, gdy otrzymane białko rekombinowane będące białkiem fuzyjnym lub niefuzyjnym wykazuje zwiększoną wydajność produkcji.Preferably, the obtained recombinant protein, which is a fusion or non-fusion protein, shows increased production efficiency.

Kolejną realizację wynalazku stanowi sposób określenia stężenia białka rekombinowanego obecnego w komórkach bakterii oparty na pomiarze fluorescencji.Another embodiment of the invention is a method for determining the concentration of recombinant protein present in bacterial cells based on the measurement of fluorescence.

Korzystnie, gdy do określenia wykorzystywane jest białko zielonej fluorescencji.Preferably, a green fluorescent protein is used for determination.

Kolejną realizację wynalazku stanowi sposób wyboru klonu bakterii E. coli zawierającej opisany powyżej wektor plazmidowy, do produkcji białek rekombinowanych oparty na wynikach pomiarów fluorescencji lub innych testach ekspresji.Another embodiment of the invention is a method for selecting an E. coli bacterial clone containing the plasmid vector described above for the production of recombinant proteins based on the results of fluorescence measurements or other expression assays.

Kolejną realizację wynalazku stanowi sposób uwalniania białka rekombinowanego przy pomocy proteazy Clean-Cut.Another embodiment of the invention is a method of releasing the recombinant protein using the Clean-Cut protease.

Korzystnie, gdy proteaza Clean-Cut jest wykorzystywana do dowolnego kształtowania N-końca białka rekombinowanego.Preferably, Clean-Cut protease is used for any N-terminus shaping of the recombinant protein.

W celu lepszego wyjaśnienia istoty wynalazku został on również zilustrowany poniższymi przykładami, które nie powinny być jednak utożsamiane z pełnym zakresem wynalazku.In order to better explain the essence of the invention, it is also illustrated by the following examples, which, however, should not be equated with the full scope of the invention.

Przedstawione przykłady prezentują sposób produkcji ludzkiej dehydrogenazy alkoholowej (ADH1; M 12963.1) przy pomocy systemu wektorów ekspresyjnych pBCM. Dehydrogenaza alkoholowa jest białkiem wybranym dla przedstawienia działania wynalazku.The presented examples demonstrate the production of human alcohol dehydrogenase (ADH1; M 12963.1) using the pBCM expression vector system. Alcohol dehydrogenase is a protein selected to demonstrate the effects of the invention.

P r z y k ł a d IP r z k ł a d I

Przygotowanie konstruktów ADH1:pBCM przy użyciu enzymów restrykcyjnych i ligazyPreparation of ADH1: pBCM constructs using restriction enzymes and ligase

Do amplifikacji genu kodującego dehydrogenazę alkoholową (ADH1) metodą PCR użyto plazmidowego DNA zawierającego pożądaną sekwencję dostarczonego przez firmę GenScript. Startery zaprojektowano tak by pozwoliły na powielenie sekwencji genu oraz wprowadziły miejsca cięcia dla enzymów restrykcyjnych BamHI i XhoI:Plasmid DNA containing the desired sequence provided by GenScript was used to amplify the gene encoding the alcohol dehydrogenase (ADH1) by PCR. The primers were designed to allow for the duplication of the gene sequence and to introduce cleavage sites for the restriction enzymes BamHI and XhoI:

• ADH1F: CTCGGATCCGATGCACTTGAGCAGG • ADH1R: GGGCTCGAGAAGAAGGAAGGTTTATTGGC• ADH1F: CTCGGATCCGATGCACTTGAGCAGG • ADH1R: GGGCTCGAGAAGAAGGAAGGTTTATTGGC

Przygotowano reakcję PCR o składzie 1x KOD Hot Start Master Mix (Merck Millipore), 6 pM mieszaniny starterów, 20 ng plazmidowego DNA. Reakcja przebiegała według następującego profilu termicznego: 95°C - 2 min.; 35x(95°C - 20 sek.; 62°C - 10 sek.; 70°C - 25 sek.). Produkty reakcji PCR rozdzielono w żelu agarozowym w celu weryfikacji poprawnego przebiegu reakcji. Po pozytywnej weryfikacji reakcję PCR oczyszczono na kolumnach ze złożem krzemionkowym DNA Sequencing Clean-up Kit (Zymo Research) zgodnie z procedurą producenta. Następnie produkty reakcji PCR poddano trawieniu restrykcyjnemu przy użyciu enzymów BamHI, XhoI i DpnI (New England Biolabs) w temperaturze 37°C przez 60 minut, bufory reakcyjne dobrano według instrukcji producenta. Po zakończonym trawieniu reakcje ponownie oczyszczono na kolumnach ze złożem krzemionkowym i poddano analizie w żelu agarozowym.A PCR reaction was prepared with the composition 1x KOD Hot Start Master Mix (Merck Millipore), 6 µM of primer mix, 20 ng of plasmid DNA. The reaction had the following thermal profile: 95 ° C - 2 min .; 35x (95 ° C - 20 sec; 62 ° C - 10 sec; 70 ° C - 25 sec). The products of the PCR reaction were separated on an agarose gel in order to verify the correct course of the reaction. After positive verification, the PCR reaction was purified on DNA Sequencing Clean-up Kit silica columns (Zymo Research) according to the manufacturer's procedure. Subsequently, the PCR reaction products were subjected to restriction digestion with the enzymes BamHI, XhoI and DpnI (New England Biolabs) at 37 ° C for 60 minutes, the reaction buffers selected according to the manufacturer's instructions. After digestion, the reactions were re-purified on silica columns and analyzed on an agarose gel.

W międzyczasie mieszaninę wektorów pBCM poddano trawieniu wykorzystując do tego enzymy BamHI, XhoI i Hindlll (New England Biolabs) w temperaturze 37°C przez 60 minut, bufory reakcyjne dobrano według instrukcji producenta. Po zakończonym trawieniu reakcje ponownie oczyszczono na kolumnach ze złożem krzemionkowym i poddano analizie w żelu agarozowym. Reakcje ligacji przeprowadzono z wykorzystaniem mieszaniny insertu ADH1 i wektorów pBCM w stosunku molowym 3:1. Reakcja została przeprowadzona przy pomocy zestawu Quick Ligation (New Engalnd Biolabs) zgo dnie z instrukcją producenta. Mieszaninę ligacyjną wykorzystano do transformacji bakterii E. coli szczep BL21 (New England Biolabs) wykorzystując do tego metodę szoku cieplnego. Bakterie wysiano na podłoże agarowe, zawierające odpowiedni antybiotyk i inkubowano przez noc w temperaturze 37°C.Meanwhile, the pBCM vector mixture was digested with enzymes BamHI, XhoI and HindIII (New England Biolabs) at 37 ° C for 60 minutes, the reaction buffers selected according to the manufacturer's instructions. After digestion, the reactions were re-purified on silica columns and analyzed on an agarose gel. Ligation reactions were performed with a mixture of the ADH1 insert and pBCM vectors in a 3: 1 molar ratio. The reaction was performed using the Quick Ligation kit (New Engalnd Biolabs) according to the manufacturer's instructions. The ligation mixture was used to transform E. coli strain BL21 (New England Biolabs) bacteria using the heat shock method. The bacteria were plated on an agar medium containing the appropriate antibiotic and incubated overnight at 37 ° C.

Kolejnym krokiem była izolacja plazmidowego DNA z uzyskanych kolonii bakteryjnych namnożonych uprzednio w całonocnej hodowli. Izolacja została przeprowadzona przy pomocy zestawu Plasmid DNA purification (Zymo Research) zgodnie z protokołem producenta. Otrzymane plazmidy zostały poddane analizie w żelu agarozowym, stężenie DNA określono spektrofotometrycznie poprzezThe next step was the isolation of plasmid DNA from the obtained bacterial colonies previously grown in an overnight culture. Isolation was performed with the Plasmid DNA purification kit (Zymo Research) according to the manufacturer's protocol. The obtained plasmids were analyzed on an agarose gel, the DNA concentration was determined spectrophotometrically by

PL 228 024 B1 pomiar absorbancji przy długości fali 260 i 280 nm. Następnie otrzymane klony zostały poddane s ekwencjonowaniu DNA z użyciem dideoksypochodnych nukleotydów.Measure the absorbance at 260 and 280 nm. Then, the obtained clones were subjected to DNA sequencing with the use of dideoxy-derived nucleotides.

P r z y k ł a d IIP r z x l a d II

Przygotowanie konstruktów ADH1:pBCM przy pomocy metod niezależnych od ligazyPreparation of ADH1: pBCM constructs by ligase independent methods

Do amplifikacji genu kodującego dehydrogenazę alkoholową (ADH1) metodą PCR użyto plazmidowego DNA zawierającego pożądaną sekwencję dostarczonego przez firmę GenScript. Startery zaprojektowano tak by pozwoliły na powielenie sekwencji genu oraz wprowadziły 15 nukleotydowe sekwencje linkerowe.Plasmid DNA containing the desired sequence provided by GenScript was used to amplify the gene encoding the alcohol dehydrogenase (ADH1) by PCR. The primers were designed to allow for the amplification of the gene sequence and to introduce the 15 nucleotide linker sequences.

ADH1F: TGGGAACTGCAGATGGATGCACTTGAGCAGGADH1F: TGGGAACTGCAGATGGATGCACTTGAGCAGG

ADH1 R: TCGGGGAAATTTCCCAAGAAGGAAGGTTTATTGGCADH1 R: TCGGGGAAATTTCCCAAGAAGGAAGGTTTATTGGC

Przygotowano reakcję PCR o składzie 1x KOD Hot Start Master Mix (Merck Millipore), 6 μM mieszaniny starterów, 20 ng plazmidowego DNA. Reakcja przebiegała według następującego profilu termicznego: 95°C - 2 min.; 35x(95°C - 20 sek.; 62°C - 10 sek.; 70°C - 25 sek.). Produkty reakcji PCR rozdzielono w żelu agarozowym w celu weryfikacji poprawnego przebiegu reakcji. Następnie produkty reakcji PCR poddano trawieniu restrykcyjnemu przy użyciu enzymów DpnI (New England Biolabs) w temperaturze 37°C przez 60 minut, enzym dodano bezpośrednio do mieszaniny reakcyjnej PCR.A PCR reaction was prepared with the composition 1x KOD Hot Start Master Mix (Merck Millipore), 6 µM of primer mix, 20 ng of plasmid DNA. The reaction had the following thermal profile: 95 ° C - 2 min .; 35x (95 ° C - 20 sec; 62 ° C - 10 sec; 70 ° C - 25 sec). The products of the PCR reaction were separated on an agarose gel in order to verify the correct course of the reaction. Then the PCR reaction products were subjected to restriction digestion with DpnI enzymes (New England Biolabs) at 37 ° C for 60 minutes, the enzyme was added directly to the PCR reaction mixture.

Mieszaninę do transformacji metodą PIPE (20) przygotowano poprzez zmieszanie równych objętości mieszaniny reakcji PCR i roztworu otwartych wektorów ekspresyjnych pBCM, mieszaninę inkubowano w temperaturze pokojowej przez 30 minut. Następnie wykorzystano ją do transformacji bakterii E. coli szczep BL21 (New England Biolabs) wykorzystując do tego metodę szoku cieplnego. Bakterie wysiano na podłoże agarowe zawierające odpowiedni antybiotyk i inkubowano przez noc w temperaturze 37°C.The PIPE transformation mixture (20) was prepared by mixing equal volumes of the PCR reaction mixture and the pBCM open expression vector solution, the mixture was incubated at room temperature for 30 minutes. Then it was used to transform E. coli strain BL21 (New England Biolabs) bacteria using the heat shock method. The bacteria were plated on an agar medium containing the appropriate antibiotic and incubated overnight at 37 ° C.

Kolejnym krokiem była izolacja plazmidowego DNA z uzyskanych kolonii bakteryjnych namnożonych uprzednio w całonocnej hodowli. Izolacja została przeprowadzona przy pomocy zestawu Plasmid DNA purification (Zymo Research) zgodnie z protokołem producenta.The next step was the isolation of plasmid DNA from the obtained bacterial colonies previously grown in an overnight culture. Isolation was performed with the Plasmid DNA purification kit (Zymo Research) according to the manufacturer's protocol.

Otrzymane plazmidy zostały poddane analizie w żelu agarozowym, stężenie DNA określono spektrofotometrycznie poprzez pomiar absorbancji przy długości fali 260 i 280 nm. Następnie otrzymane klony zostały poddane sekwencjonowaniu z użyciem dideoksypochodnych nukleotydów.The obtained plasmids were analyzed on an agarose gel, the DNA concentration was determined spectrophotometrically by measuring the absorbance at 260 and 280 nm. Then, the obtained clones were sequenced using dideoxy-derivative nucleotides.

P r z y k ł a d IIIP r x l a d III

Testy ekspresji oparte na fluorescencji GFPExpression assays based on GFP fluorescence

Przedmiotem testów ekspresji są kolonie bakterii E. coli otrzymane w wyniku klonowania z użyciem systemu pBCM. Analizie poddane są kolonie charakteryzujące się zieloną fluorescencją na podłożu hodowlanym LB zawierającym 1 mM IPTG. Podstawą testów ekspresji jest założenie, że białko rekombinowane i białko zielonej fluorescencji produkowane są jako białko fuzyjne, zatem poziom fluorescencji jest zależny od poziomu białka rekombinowanego. Dodatkowo poszczególne kolonie mogą różnić się pomiędzy sobą wektorami wymuszającymi ekspresję białek rekombinowanych. Dostępne są następujące warianty testów ekspresji:The subject of expression tests are E. coli bacterial colonies obtained by cloning with the pBCM system. Green fluorescent colonies on LB culture medium containing 1 mM IPTG are analyzed. The basis of the expression assays is the assumption that recombinant protein and green fluorescent protein are produced as a fusion protein, so the level of fluorescence is dependent on the level of the recombinant protein. In addition, individual colonies may differ from one another by vectors that force the expression of recombinant proteins. The following expression assay variants are available:

1. Analizowane kolonie są zawieszane w 100 μl pożywki hodowlanej LB zawierającej odpowiedni antybiotyk i 1 mM IPTG w 96-dołkowej płytce titracyjnej. Następnie próbki są inkubowane w temperaturze 37°C z wytrząsaniem 200 rpm przez 1 godzinę. Po okresie inkubacji przeprowadzany jest pomiar gęstości optycznej przy długości fali 600 nm oraz pomiar fluorescencji przy długości fali właściwej dla białka zielonej fluorescencji. Wyniki pomiaru fluorescencji są normalizowane względem wartości gęstości optycznej. W międzyczasie przeprowadzane są testy PCR pozwalające zweryfikować, czy dane klony zawierają pożądany insert. Dalsze etapy produkcji białka rekombinowanego przeprowadzane są na próbie lub próbach dających najkorzystniejsze wyniki w znormalizowanym pomiarze fluorescencji.1. Analyzed colonies are resuspended in 100 μl of LB culture medium containing the appropriate antibiotic and 1 mM IPTG in a 96-well titer plate. The samples are then incubated at 37 ° C with 200 rpm shaking for 1 hour. After the incubation period, an optical density measurement is performed at a wavelength of 600 nm and a fluorescence measurement at a wavelength specific to the green fluorescence protein. The results of the fluorescence measurement are normalized to the optical density value. Meanwhile, PCR tests are performed to verify that the clones contain the desired insert. The further steps in recombinant protein production are carried out on the sample or trials giving the most favorable results in standardized fluorescence measurement.

2. Analizowane kolonie są zawieszane w 100 μl pożywki hodowlanej LB, zawierającej odpowiedni antybiotyk i analizowane pod kątem obecności pożądanego insertu przy pomocy metody PCR. Pozytywnie zweryfikowane kolonie są zawieszane w 2 ml podłoża hodowlanego i inkubowane w 12-dołkowej płytce titracyjnej w 37°C przy wytrząsaniu 200 rpm do osiągnięcia gęstości optycznej przy długości fali 600 nm rzędu 0,6-0,8. Po osiągnięciu tej wartości dodawany jest induktor IPTG w stężeniu ustalonym przez osobę przeprowadzającą doświadczenie (np. 1 mM IPTG). Odczyt fluorescencji i gęstości optycznej następuje po 6-12 godzinach po indukcji. Wyniki pomiaru fluorescencji2. Analyzed colonies are resuspended in 100 μl of LB culture medium containing the appropriate antibiotic and analyzed for the presence of the desired insert using the PCR method. Positively verified colonies are resuspended in 2 ml of culture medium and incubated in a 12-well titer plate at 37 ° C with 200 rpm shaking until an optical density at 600 nm of 0.6-0.8 is reached. Upon reaching this value, the IPTG inducer is added at a concentration determined by the experimenter (e.g. 1 mM IPTG). Reading of fluorescence and optical density is 6-12 hours after induction. Fluorescence measurement results

PL 228 024 B1 są normalizowane względem wartości gęstości optycznej. Dalsze etapy produkcji białka rekombinowanego przeprowadzane są na próbie lub próbach dających najkorzystniejsze wyniki w znormalizowanym pomiarze fluorescencji.PL 228 024 B1 are normalized to the optical density values. The further steps in recombinant protein production are carried out on the sample or trials giving the most favorable results in standardized fluorescence measurement.

LiteraturaLiterature

1. S. Mitragotri, P. A. Burke, R. Langer, Overcoming the challenges in administering biopharmaceuticals: formulation and delivery strategies. Nat. Rev. Drug Discov. 13, 655-672 (2014).1. S. Mitragotri, P. A. Burke, R. Langer, Overcoming the challenges in administering biopharmaceuticals: formulation and delivery strategies. Nat. Rev. Drug Discov. 13, 655-672 (2014).

2. G. L. Rosano, E. A. Ceccarelli, Recombinant protein expression in Escherichia coli: advances and challenges. Front. Microbiol. 5 (2014), doi:10.3389/fmicb.2014.00172.2. G. L. Rosano, E. A. Ceccarelli, Recombinant protein expression in Escherichia coli: advances and challenges. Front. Microbiol. 5 (2014), doi: 10.3389 / fmicb.2014.00172.

3. S. Sahdev, S. K. Khattar, K. S. Saini, Production of active eukaryotic proteins through bacterial expression systems: a review of the existing biotechnology strategies. Mol. Cell. Biochem. 307, 249-264 (2008).3. S. Sahdev, S. K. Khattar, K. S. Saini, Production of active eukaryotic proteins through bacterial expression systems: a review of the existing biotechnology strategies. Moth. Cell. Biochem. 307, 249-264 (2008).

4. G. Sezonov, D. Joseleau-Petit, R. D'Ari, Escherichia coli Physiology in Luria-Bertani Broth. J. Bacteriol. 189, 8746-8749 (2007).4. G. Sezonov, D. Joseleau-Petit, R. D'Ari, Escherichia coli Physiology in Luria-Bertani Broth. J. Bacteriol. 189, 8746-8749 (2007).

5. S. N. Cohen, A. C. Y. Chang, L. Hsu, Nonchromosomal Antibiotic Resistance in Bacteria: Genetic Transformation of Escherichia coli by R-Factor DNA. Proc. Natl. Acad. Sci. 69, 2110— 2114 (1972).5. S. N. Cohen, A. C. Y. Chang, L. Hsu, Nonchromosomal Antibiotic Resistance in Bacteria: Genetic Transformation of Escherichia coli by R-Factor DNA. Proc. Natl. Acad. Sci. 69, 2110-2114 (1972).

6. F. Bolivar et al., Construction and characterization of new cloning vehicles. II. A multipurpose cloning system. Gene. 2, 95-113 (1977).6. F. Bolivar et al., Construction and characterization of new cloning vehicles. II. A multipurpose cloning system. Gene. 2, 95-113 (1977).

7. N. P. Minton, Improved plasmid vectors for the isolation of translational lac gene fusions. Gene. 31,269-273 (1984).7. N. P. Minton, Improved plasmid vectors for the isolation of translational lac gene fusions. Gene. 31, 269-273 (1984).

8. A. C. Chang, S. N. Cohen, Construction and characterization of amplifiable multicopy DNA cloning vehicles derived from the P15A cryptic miniplasmid. J. Bacteriol. 134, 1141 -1156 (1978).8. A. C. Chang, S. N. Cohen, Construction and characterization of amplifiable multicopy DNA cloning vehicles derived from the P15A cryptic miniplasmid. J. Bacteriol. 134, 1141-1156 (1978).

9. L. M. Guzman, D. Belin, M. J. Carson, J. Beckwith, Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter. J. Bacteriol. 177, 4121-4130 (1995).9. L. M. Guzman, D. Belin, M. J. Carson, J. Beckwith, Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter. J. Bacteriol. 177,4121-4130 (1995).

10. R. Gentz, H. Bujard, Promoters recognized by Escherichia coli RNA polymerase selected by function: highly efficient promoters from bacteriophage T5. J. Bacteriol. 164, 70-77 (1985).10. R. Gentz, H. Bujard, Promoters recognized by Escherichia coli RNA polymerase selected by function: highly efficient promoters from bacteriophage T5. J. Bacteriol. 164, 70-77 (1985).

11. F. W. Studier, B. A. Moffatt, Use of bacteriophage T7 RNA polymerase to direct selective high-level expression of cloned genes. J. Mol. Biol. 189, 113-130 (1986).11. F. W. Studier, B. A. Moffatt, Use of bacteriophage T7 RNA polymerase to direct selective high-level expression of cloned genes. J. Mol. Biol. 189, 113-130 (1986).

12. J. Brosius, M. Erfle, J. Storella, Spacing of the -10 and -35 regions in the tac promoter. Effect on its in vivo activity. J. Biol. Chem. 260, 3539-3541 (1985).12. J. Brosius, M. Erfle, J. Storella, Spacing of the -10 and -35 regions in the tac promoter. Effect on its in vivo activity. J. Biol. Chem. 260, 3539-3541 (1985).

13. B. Gronenborn, Overproduction of phage Lambda repressor under control of the lac promotor of Escherichia coli. Mol Gen. Genet. MGG. 148, 243-250 (1976).13. B. Gronenborn, Overproduction of phage Lambda repressor under control of the lac promotor of Escherichia coli. Mol Gen. Genet. MGG. 148, 243-250 (1976).

14. B. L. Wanner, R. Kodaira, F. C. Neidhardt, Physiological regulation of a decontrolled lac operon. J. Bacteriol. 130, 212-222 (1977).14. B. L. Wanner, R. Kodaira, F. C. Neidhardt, Physiological regulation of a decontrolled lac operon. J. Bacteriol. 130, 212-222 (1977).

15. K. Terpe, Overview of tag protein fusions: from molecular and biochemical fundamentalste commercial systems. Appl. Microbiol. Biotechnol. 60, 523-533 (2003).15. K. Terpe, Overview of tag protein fusions: from molecular and biochemical fundamentalste commercial systems. Appl. Microbiol. Biotechnol. 60, 523-533 (2003).

16. D. B. Smith, K. S. Johnson, Single-step purification of polypeptides expressed in Escherichia coli as fusions with glutathione S-transferase. Gene. 67, 31 -40 (1988).16. D. B. Smith, K. S. Johnson, Single-step purification of polypeptides expressed in Escherichia coli as fusions with glutathione S-transferase. Gene. 67, 31-40 (1988).

17. R. B. Kapust, D. S. Waugh, Escherichia coli maltose-binding protein is uncommonly effective at promoting the solubility of polypeptides to which it is fused. Protein Sci. Publ. Protein Soc. 8, 1668-1674 (1999).17. R. B. Kapust, D. S. Waugh, Escherichia coli maltose-binding protein is uncommonly effective at promoting the solubility of polypeptides to which it is fused. Protein Sci. Publ. Protein Soc. 8, 1668-1674 (1999).

18. D. S. Waugh, An overview of enzymatic reagents for the removal of affinity tags. Protein Expr. Purif. 80, 283-293 (2011).18. D. S. Waugh, An overview of enzymatic reagents for the removal of affinity tags. Protein Expr. Purif. 80, 283-293 (2011).

19. W. H. Eschenfeldt, L. Stols, C. S. Millard, A. Joachimiak, M. I. Donnelly, A Family of LIC Vectors for High-Throughput Cloning and Purification of Proteins. Methods Mol. Biol. Clifton NJ. 498, 105-115 (2009).19. W. H. Eschenfeldt, L. Stols, C. S. Millard, A. Joachimiak, M. I. Donnelly, A Family of LIC Vectors for High-Throughput Cloning and Purification of Proteins. Methods Mol. Biol. Clifton NJ. 498, 105-115 (2009).

20. H. E. Klock, S. A. Lesley, in High Throughput Protein Expression and Purification, S. A. Doyle, Ed. (Humana Press, 2009; http://link.springer.com/protocol/10.1007/978-1-59745-196-3_6), Methods in Molecular Biology, pp. 91 -103.20. H. E. Klock, S. A. Lesley, in High Throughput Protein Expression and Purification, S. A. Doyle, Ed. (Humana Press, 2009; http://link.springer.com/protocol/10.1007/978-1-59745-196-3_6), Methods in Molecular Biology, pp. 91 -103.

PL 228 024 B1PL 228 024 B1

21. A. Matsumoto, T. Q. Itoh, Self-assembly cloning: a rapid construction method for recombinant molecules from multiple fragments. Bio Techniques. 51, 55-56 (2011).21. A. Matsumoto, T. Q. Itoh, Self-assembly cloning: a rapid construction method for recombinant molecules from multiple fragments. Bio Techniques. 51, 55-56 (2011).

22. J. Quan, J. Tian, Circular Polymerase Extension Cloning of Complex Gene Libraries and Pathways. PLoS ONE. 4, e6441 (2009).22. J. Quan, J. Tian, Circular Polymerase Extension Cloning of Complex Gene Libraries and Pathways. PLoS ONE. 4, e6441 (2009).

23. Y. Zhang, U. Werling, W. Edelmann, SLiCE: a novel bacterial cell extract-based DNA cloning method. Nucleic Acids Res. 40, e55-e55 (2012).23. Y. Zhang, U. Werling, W. Edelmann, SLiCE: a novel bacterial cell extract-based DNA cloning method. Nucleic Acids Res. 40, e55-e55 (2012).

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt SEQUENCE LISTING <110> Selvita S.A.SEQLTXT.txt SEQUENCE LISTING <110> Selvita S.A.

<120> Zestaw wektorów ekspresyjnych <130> PK./3420/RW <160> 33 <17O> Patentin version 3.5 <2l0> 1 <211> 147 <212> DNA <213> artificial <22O><120> Expression vector set <130> PK./3420/RW <160> 33 <17O> Patentin version 3.5 <2l0> 1 <211> 147 <212> DNA <213> artificial <22O>

<223> promotor BCMTS <400> 1<223> BCMTS promoter <400> 1

ctggagatcc tgataaaatc ctggagatcc tgataaaatc atgaaaaatt atgaaaaatt tatttgcttt tatttgcttt gtgagcggat gtgagcggat aacaattata aacaattata 60 60 atatgtggaa ttgtgagcgc atatgtggaa ttgtgagcgc tcacaattcc tcacaattcc acataaggag acataaggag gtaaaaaaat gtaaaaaaat gatacatcat gatacatcat 120 120 catcatcatc attgggaact catcatcatc attgggaact gcagatg gcagatg 147 147 <210> 2 <211> 120 <212> DNA <213> artificial <210> 2 <211> 120 <212> DNA <213> artificial <22O> <223> promotor BCMT7 <22O> <223> BCMT7 promoter <400> 2 ctggagatcc tgatataata <400> 2 ctggagatcc tgatataata cgactcacta cgactcacta taggggtgtg taggggtgtg gaattgtgag gaattgtgag cgctcacaat cgctcacaat 60 60 tccacataag gaggtaaaaa tccacataag gaggtaaaaa aatgatacat aatgatacat catcatcatc catcatcatc atcattggga atcattggga actgcagatg actgcagatg 120 120 <210> 3 <211> 143 <212> DNA <213> artificial <210> 3 <211> 143 <212> DNA <213> artificial <220> <223> promotor BCMTrc <220> <223> BCMTrc promoter <400> 3 ctggagatcc tgataattct <400> 3 ctggagatcc tgataattct gaaatgagct gaaatgagct gttgacaatt gttgacaatt aatcatccgg aatcatccgg ctcgtataat ctcgtataat 60 60 gtggaattgt gagcgctcac gtggaattgt gagcgctcac aattccacat aattccacat aaggaggtaa aaggaggtaa aaaaatgata aaaaatgata catcatcatc catcatcatc 120 120 atcatcattg ggaactgcag atcatcattg ggaactgcag atg atg 143 143 <210> 4 <211> 163 <212> DNA <213> artificial <210> 4 <211> 163 <212> DNA <213> artificial <220> <223> Polilinker <220> <223> polylinker <400> 4 tgggaactgc agatgaattc <400> 4 tgggaactgc agatgaattc gagctcggat gagctcggat ccaagatctt ccaagatctt ctagacatat ctagacatat gatcgataag gatcgataag 60 60

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt cttgatatcg gtaccaccat ggtcgacctc gagcccgggg ctagcataac cccttggggc 120 ctctaaacgg gtcttgaggg gttttttggg gaaatttccc ega 163SEQLTXT.txt cttgatatcg gtaccaccat ggtcgacctc gagcccgggg ctagcataac cccttggggc 120 ctctaaacgg gtcttgaggg gttttttggg gaaatttccc ega 163

<210> <210> 5 5 <211> <211> 15 15 <212> <212> DNA GOUT <213> <213> arti fi ci al arti fi ci al <220> <220> <223> <223> OKI OH OKI OH <400> <400> 5 5 gggaaatttc cccga gggaaatttc cccga <210> <210> 6 6 <211> <211> 15 15 <212> <212> DNA GOUT <213> <213> arti fi ci al arti fi ci al <220> <220> <223> <223> Prom OH OH ferry <400> <400> 6 6 ctggagatcc tgata ctggagatcc tgata <210> <210> 7 7 <211> <211> 15 15 <212> <212> DNA GOUT <213> <213> arti fi ciał arti fi bodies <220> <220> <223> <223> RES OH RES OH <400> <400> 7 7 tttgegatag gtaaa tttgegatag gtaaa <210> <210> 8 8 <211> <211> 15 15 <212> <212> DNA GOUT <213> <213> artifi ciał artifi of bodies <220> <220> <223> <223> Res oh Res oh <400> <400> 8 8 tgggaactgc agatg tgggaactgc agatg <210> <210> 9 9 <211> <211> 18 18 <212> <212> DNA GOUT <213> <213> arti fi ciał arti fi bodies <220> <220> <223> <223> Expr OH LIC Expr OH LIC <400> <400> 9 9 aggaccaagc aageagat aggaccaagc aageagat

<210> 10 <211> 18<210> 10 <211> 18

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt <212> DNA <213> artificial <22 0>SEQLTXT.txt <212> DNA <213> artificial <22 0>

<223> Ori OH LIC <400> 10 ctgcttctct ggtgctta 18 <210> 11 <211> 18 <212> DNA <213> artificial <220><223> Ori OH LIC <400> 10 ctgcttctct ggtgctta 18 <210> 11 <211> 18 <212> DNA <213> artificial <220>

<223> Prom OH LIC <400> 11 ttgcttgtcc tgtgcgta 18 <210> 12 <211> 18 <212> DNA <213> artificial <220><223> Prom OH LIC <400> 11 ttgcttgtcc tgtgcgta 18 <210> 12 <211> 18 <212> DNA <213> artificial <220>

<223> Res oh lic <400> 12 gaacggcaag agcacaat 18 <210> 13 <211> 819 <212> DNA <213> artificial <22O><223> Res oh lic <400> 12 gaacggcaag agcacaat 18 <210> 13 <211> 819 <212> DNA <213> artificial <22O>

<223> puc ori <400> 13 gggaaatttc cccgactcat gaccaaaatc ccttaacgtg agttacgcgc gcgtcgttcc 60 actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 120 gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 180 atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 240 atactgttct tctagtgtag ccgtagttag cccaccactt caagaactct gtagcaccgc 300 ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 360 gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 420 cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 480 tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 540 cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 600 ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 660 gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 720 tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 780<223> pUC ori <400> 13 gggaaatttc cccgactcat gaccaaaatc ccttaacgtg agttacgcgc gcgtcgttcc 60 actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 120 gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 180 atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 240 atactgttct tctagtgtag ccgtagttag cccaccactt caagaactct gtagcaccgc 300 ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 360 gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 420 cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 480 tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 540 cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 600 ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 660 gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 720 tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 780

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt ataaccgtat taccgccttt gagtgagctg ataccgctc 819 <210> 14 <211> 620 <212> DNA <213> artificial <220>SEQLTXT.txt ataaccgtat taccgccttt gagtgagctg ataccgctc 819 <210> 14 <211> 620 <212> DNA <213> artificial <220>

<223> pMBl on’ <400> 14 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 60 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 120 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 180 agttaggcca ccacttcaag aactctgtag caccgcctac ataccrcgct ctgctaatcc 240 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 300 gatagttacc ggataaggcg cagcggtcgg getgaacggg gggttcgtgc acacagccca 360 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 420 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 480 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 540 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 600 ggaaaaacgc cagcaacgcg 620 <210> 15 <211> 837 <212> DNA <213> artificial <22O><223> PMBL on '<400> 14 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 60 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 120 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 180 agttaggcca ccacttcaag aactctgtag caccgcctac ataccrcgct ctgctaatcc 240 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 300 gatagttacc ggataaggcg cagcggtcgg getgaacggg gggttcgtgc acacagccca 360 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 420 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 480 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 540 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 600 ggaaaaacgc cagcaacgcg 620 <210> 15 <211> 837 <212> DNA <213> artificial < 22O>

<223> pl5A ori <400> 15 ttaataagat gatcttcttg agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac 60 gaaaaaaccg ccttgcaggg cggtttttcg aaggttctct gagctaccaa ctctttgaac 120 cgaggtaact ggcttggagg agcgcagtca ccaaaacttg tcctttcagt ttagccttaa 180 ccggcgcatg acttcaagac taactcctct aaatcaatta ccagtggctg ctgccagtgg 240 tgcttttgca tgtctttccg ggttggactc aagacgatag ttaccggata aggcgcagcg 300 gtcggactga acggggggtt cgtgcataca gtccagcttg gagcgaactg cctacccgga 360 actgagtgtc aggcgtggaa tgagacaaac gcggccataa cagcggaatg acaccggtaa 420 accgaaaggc aggaacagga gagcgcacga gggagccgcc agggggaaac gcctggtatc 480 tttatagtcc tgtcgggttt cgccaccact gatttgagcg tcagatttcg tgatgcttgt 540 caggggggcg gagectatgg aaaaacggct ttgccgcggc cctctcactt ccctgttaag 600 tatcttcctg gcatcttcca ggaaatctcc gccccgttcg taagccattt ccgctcgccg 660 cagtcgaacg accgagcgta gcgagtcagt gagcgaggaa gcggaatata tcctgtatca 720<223> pl5A ori <400> 15 ttaataagat gatcttcttg agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac 60 gaaaaaaccg ccttgcaggg cggtttttcg aaggttctct gagctaccaa ctctttgaac 120 cgaggtaact ggcttggagg agcgcagtca ccaaaacttg tcctttcagt ttagccttaa 180 ccggcgcatg acttcaagac taactcctct aaatcaatta ccagtggctg ctgccagtgg 240 tgcttttgca tgtctttccg ggttggactc aagacgatag ttaccggata aggcgcagcg 300 gtcggactga acggggggtt cgtgcataca gtccagcttg gagcgaactg cctacccgga 360 actgagtgtc aggcgtggaa tgagacaaac gcggccataa cagcggaatg acaccggtaa 420 accgaaaggc aggaacagga gagcgcacga gggagccgcc agggggaaac gcctggtatc 480 tttatagtcc tgtcgggttt cgccaccact gatttgagcg tcagatttcg tgatgcttgt 540 caggggggcg gagectatgg aaaaacggct ttgccgcggc cctctcactt ccctgttaag 600 tatcttcctg gcatcttcca ggaaatctcc gccccgttcg taagccattt ccgctcgccg 660 cagtcgaacg accgagcgta gcgagtcagt gagcgaggaa gcggaatata tcctgtatca 720

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt eatattctgc tgacgcaccg gtgcagcctt ttttctcctg ccacatgaag cacttcactg 780 acaccctcat cagtgccaac atagtaagcc agtatacact ccgctagcgc tgaggtc 837 <21O> 15 <211> 3320 <212> DNA <213> artificial <22O>SEQLTXT.txt eatattctgc tgacgcaccg gtgcagcctt ttttctcctg ccacatgaag cacttcactg 780 acaccctcat cagtgccaac atagtaagcc agtatacact ccgctagcgc tgaggtc 837 <21O> <220> <211> artificial> DNA <211> <211>

<223> pBCMlML <400> 16<223> pBCMlML <400> 16

ctggagatcc ctggagatcc tgataaaatc tgataaaatc atgaaaaatt atgaaaaatt tatttgcttt tatttgcttt gtgagcggat gtgagcggat aacaattata aacaattata 60 60 atatgtggaa atatgtggaa ttgtgagcgc ttgtgagcgc tcacaattcc tcacaattcc acataaggag acataaggag gtaaaaaaat gtaaaaaaat gtggaattgt gtggaattgt 120 120 gagcgctcac gagcgctcac aattccacat aattccacat aaggaggtaa aaggaggtaa aaaaatgata aaaaatgata catcatcatc catcatcatc atcatcattg atcatcattg 180 180 ggaactgcag ggaactgcag atgaattcga atgaattcga gctcggatcc gctcggatcc aagatcttct aagatcttct agacatatga agacatatga tcgataagct tcgataagct 240 240 tgatatcggt tgatatcggt accaccatgg accaccatgg tcgacctcga tcgacctcga gcccggggct gcccggggct agcataaccc agcataaccc cttggggcct cttggggcct 300 300 ctaaacgggt ctaaacgggt cttgaggggt cttgaggggt tttttgggga tttttgggga aatttccccg aatttccccg agggaaattt agggaaattt ccccgactca ccccgactca 360 360 tgaccaaaat tgaccaaaat cccttaacgt cccttaacgt gagttacgcg gagttacgcg cgcgtcgttc cgcgtcgttc cactgagcgt cactgagcgt cagaccccgt cagaccccgt 420 420 agaaaagatc agaaaagatc aaaggatctt aaaggatctt cttgagatcc cttgagatcc tttttttctg tttttttctg cgcgtaatct cgcgtaatct gctgcttgca gctgcttgca 480 480 aacaaaaaaa aacaaaaaaa ccaccgctac ccaccgctac cagcggtggt cagcggtggt ttgtttgccg ttgtttgccg gatcaagagc gatcaagagc taccaactct taccaactct 540 540 ttttccgaag ttttccgaag gtaactggct gtaactggct tcagcagagc tcagcagagc gcagatacca gcagatacca aatactgttc aatactgttc ttctagtgta ttctagtgta 600 600 gccgtagtta gccgtagtta gcccaccact gcccaccact tcaagaactc tcaagaactc tgtagcaccg tgtagcaccg cctacatacc cctacatacc tcgctctgct tcgctctgct 660 660 aatcctgtta aatcctgtta ccagtggctg ccagtggctg ctgccagtgg ctgccagtgg cgataagtcg cgataagtcg tgtcttaccg tgtcttaccg ggttggactc ggttggactc 720 720 aagacgatag aagacgatag ttaccggata ttaccggata aggcgcagcg aggcgcagcg gtcgggctga gtcgggctga acggggggtt acggggggtt cgtgcacaca cgtgcacaca 780 780 gcccagcttg gcccagcttg gagcgaacga gagcgaacga cctacaccga cctacaccga actgagatac actgagatac ctacagcgtg ctacagcgtg agctatgaga agctatgaga 840 840 aagcgccacg aagcgccacg cttcccgaag cttcccgaag ggagaaaggc ggagaaaggc ggacaggtat ggacaggtat ccggtaagcg ccggtaagcg gcagggtcgg gcagggtcgg 900 900 aacaggagag aacaggagag cgcacgaggg cgcacgaggg agcttccagg agcttccagg gggaaacgcc gggaaacgcc tggtatcttt tggtatcttt atagtcctgt atagtcctgt 960 960 cgggtttcgc cgggtttcgc cacctctgac cacctctgac ttgagcgtcg ttgagcgtcg atttttgtga atttttgtga tgctcgtcag tgctcgtcag gggggcggag gggggcggag 1020 1020 cctatggaaa cctatggaaa aacgccagca aacgccagca acgcggcctt acgcggcctt tttacggttc tttacggttc ctggcctttt ctggcctttt gctggccttt gctggccttt 1080 1080 tgctcacatg tgctcacatg ttctttcctg ttctttcctg cgttatcccc cgttatcccc tgattctgtg tgattctgtg gataaccgta gataaccgta ttaccgcctt ttaccgcctt 1140 1140 tgagtgagct tgagtgagct gataccgctc gataccgctc tttgcgatag tttgcgatag gtaaaggcgc gtaaaggcgc gccatcgaat gccatcgaat ggcgcaaaac ggcgcaaaac 1200 1200 ctttcgcggt ctttcgcggt atggcatgat atggcatgat agcgcccgga agcgcccgga agagagtcaa agagagtcaa ttcagggtgg ttcagggtgg tgaatggtgg tgaatggtgg 1260 1260 tgaatgtgaa tgaatgtgaa accagtaacg accagtaacg ttatacgatg ttatacgatg tcgcagagta tcgcagta tgccggtgtc tgccggtgtc tcttatcaga tcttatcaga 1320 1320 ccgtttcccg ccgtttcccg cgtggtgaac cgtggtgaac caggccagcc caggccagcc acgtttctgc acgtttctgc gaaaacgcgg gaaaacgcgg gaaaaagtgg gaaaaagtgg 1380 1380 aagcggcgat aagcggcgat ggcggagctg ggcggagctg aattacattc aattacattc ccaaccgcgt ccaaccgcgt ggcacaacaa ggcacaacaa ctggcgggca ctggcgggca 1440 1440 aacagtcgtt aacagtcgtt gctgattggc gctgattggc gttgccacct gttgccacct ccagtctggc ccagtctggc cctgcacgcg cctgcacgcg ccgtcgcaaa ccgtcgcaaa 1500 1500 ttgtcgcggc ttgtcgcggc gattaaatct gattaaatct cgcgccgatc cgcgccgatc aactgggtgc aactgggtgc cagcgtggtg cagcgtggtg gtgtcgatgg gtgtcgatgg 1560 1560 tagaacgaag tagaacgaag cggcgtcgaa cggcgtcgaa gcctgtaaag gcctgtaaag cggcggtgca cggcggtgca caatcttctc caatcttctc gcgcaacgcg gcgcaacgcg 1620 1620

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

tcagtgggct tcagtgggct gatcattaac gatcattaac tatccgctgg tatccgctgg atgaccagga atgaccagga tgccattgct tgccattgct gtggaagctg gtggaagctg 1680 1680 cctgcactaa cctgcactaa tgttccggcg tgttccggcg ttatttcttg ttatttcttg atgtctctga atgtctctga ccagacaccc ccagacaccc atcaacagta atcaacagta 1740 1740 ttattttctc ttattttctc ccatgaagac ccatgaagac ggtacgcgac ggtacgcgac tgggcgtgga tgggcgtgga gcatctggtc gcatctggtc gcattgggtc gcattgggtc 1800 1800 accagcaaat accagcaaat cgcgctgtta cgcgctgtta gcgggcccat gcgggcccat taagttctgt taagttctgt ctcggcgcgt ctcggcgcgt ctgcgtctgg ctgcgtctgg 1860 1860 ctggctggca ctggctggca taaatatctc taaatatctc actcgcaatc actcgcaatc aaattcagcc aaattcagcc gatagcggaa gatagcggaa cgggaaggcg cgggaaggcg 1920 1920 actggagtgc actggagtgc catgtccggt catgtccggt tttcaacaaa tttcaacaaa ccatgcaaat ccatgcaaat gctgaatgag gctgaatgag ggcatcgttc ggcatcgttc 1980 1980 ccactgcgat ccactgcgat gctggttgcc gctggttgcc aacgatcaga aacgatcaga tggcgctggg tggcgctggg cgcaatgcgc cgcaatgcgc gccattaccg gccattaccg 2040 2040 agtccgggct agtccgggct gcgcgttggt gcgcgttggt gcggatatct gcggatatct cggtagtggg cggtagtggg atacgacgat atacgacgat accgaagaca accgaagaca 2100 2100 gctcatgtta gctcatgtta tatcccgccg tatcccgccg tcaaccacca tcaaccacca tcaaacagga tcaaacagga ttttcgcctg ttttcgcctg ctggggcaaa ctggggcaaa 2160 2160 ccagcgtgga ccagcgtgga ccgcttgctg ccgcttgctg caactctctc caactctctc agggccaggc agggccaggc ggtgaagggc ggtgaagggc aatcagctgt aatcagctgt 2220 2220 tgcccgtctc tgcccgtctc actggtgaaa actggtgaaa agaaaaacca agaaaaacca ccctggcgcc ccctggcgcc caatacgcaa caatacgcaa accgcctctc accgcctctc 2280 2280 cccgcgcgtt cccgcgcgtt ggccgattca ggccgattca ttaatgcagc ttaatgcagc tggcacgaca tggcacgaca ggtttcccga ggtttcccga ctggaaagcg ctggaaagcg 2340 2340 ggcagtgagc ggcagtgagc gcaactttgc gcaactttgc gataggtaaa gataggtaaa tttttctaaa tttttctaaa tacattcaaa tacattcaaa tatgtatccg tatgtatccg 2400 2400 ctcatgagac ctcatgagac aataaccctg aataaccctg ataaatgctt ataaatgctt caataatatt caataatatt gaaaaaggaa gaaaaaggaa gagtatgagt gagtatgagt 2460 2460 attcaacatt attcaacatt tccgtgtcgc tccgtgtcgc ccttattccc ccttattccc ttttttgcgg ttttttgcgg cattttgcct cattttgcct tcctgttttt tcctgttttt 2520 2520 gctcacccag gctcacccag aaacgctggt aaacgctggt gaaagtaaaa gaaagtaaaa gatgctgaag gatgctgaag atcagttggg atcagttggg tgcacgagtg tgcacgagtg 2580 2580 ggttacatcg ggttacatcg aactggatct aactggatct caacagcggt caacagcggt aagatccttg aagatccttg agagttttcg agagttttcg ccccgaagaa ccccgaagaa 2640 2640 cgttttccaa cgttttccaa tgatgagcac tgatgagcac ttttaaagtt ttttaaagtt ctgctatgtg ctgctatgtg gcgcggtatt gcgcggtatt atcccgtatt atcccgtatt 2700 2700 gacgccgggc gacgccgggc aagagcaact aagagcaact cggrcgccgc cggrcgccgc atacactatt atacactatt ctcagaatga ctcagaatga cttggttgag cttggttgag 2760 2760 tactcaccag tactcaccag tcacagaaaa tcacagaaaa gcatcttacg gcatcttacg gatggcatga gatggcatga cagtaagaga cagtaagaga attatgcagt attatgcagt 2820 2820 gctgccataa gctgccataa ccatgagtga ccatgagtga taacactgcg taacactgcg gccaacttac gccaacttac ttctgacaac ttctgacaac gatcggagga gatcggagga 2880 2880 ccgaaggagc ccgaaggagc taaccgcttt taaccgcttt tttgcacaac tttgcacaac atgggggatc atgggggatc atgtaactcg atgtaactcg ccttgatcgt ccttgatcgt 2940 2940 tgggaaccgg tgggaaccgg agctgaatga agctgaatga agccatacca agccatacca aacgacgagc aacgacgagc gtgacaccac gtgacaccac gatgcctgta gatgcctgta 3000 3000 gcaatggcaa gcaatggcaa caacgttgcg caacgttgcg caaactatta caaactatta actggcgaac actggcgaac tacttactct tacttactct agcttcccgg agcttcccgg 3060 3060 caacaattaa caacaattaa tagactggat tagactggat ggaggcggat ggaggcggat aaagttgcag aaagttgcag gaccacttct gaccacttct gcgctcggcc gcgctcggcc 3120 3120 cttccggctg cttccggctg gctggtttat gctggtttat tgctgataaa tgctgataaa tctggagccg tctggagccg gtgagcgtgg gtgagcgtgg gtctcgcggt gtctcgcggt 3180 3180 atcattgcag atcattgcag cactggggcc cactggggcc agatggtaag agatggtaag ccctcccgta ccctcccgta tcgtagttat tcgtagttat ctacacgacg ctacacgacg 3240 3240 gggagtcagg gggagtcagg caactatgga caactatgga tgaacgaaat tgaacgaaat agacagatcg agacagatcg ctgagatagg ctgagatagg tgcctcactg tgcctcactg 3300 3300 attaagcatt attaagcatt ggtaactgtc ggtaactgtc 3320 3320

<2lO> 17 <211> 3293 <212> DNA <213> artificial <22O><210> 17 <211> 3293 <212> DNA <213> artificial <22O>

<223> PBCM2ML<223> PBCM2ML

PL 228 024 Β1PL 228 024 Β1

5EQLTXT.txt5EQLTXT.txt

<400> 17 <400> 17 ctggagatcc ctggagatcc tgatataata tgatataata cgactcacta cgactcacta taggggtgtg taggggtgtg gaattgtgag gaattgtgag cgctcacaar cgctcacaar 60 60 tccacataag tccacataag gaggtaaaaa gaggtaaaaa aatgtggaat aatgtggaat tgtgagcgct tgtgagcgct cacaattcca cacaattcca cataaggagg cataaggagg 120 120 taaaaaaatg taaaaaaatg atacatcatc atacatcatc atcatcatca atcatcatca ttgggaactg ttgggaactg cagatgaatt cagatgaatt cgagctcgga cgagctcgga ISO ISO tccaagatct tccaagatct tctagacata tctagacata tgatcgataa tgatcgataa gcttgatatc gcttgatatc ggtaccacca ggtaccacca tggtcgacct tggtcgacct 240 240 cgagcccggg cgagcccggg gctagcataa gctagcataa ccccttgggg ccccttgggg cctctaaacg cctctaaacg ggtcttgagg ggtcttgagg ggttttttgg ggttttttgg 300 300 ggaaatttcc ggaaatttcc ccgagggaaa ccgagggaaa tttccccgac tttccccgac tcatgaccaa tcatgaccaa aatcccttaa aatcccttaa cgtgagttac cgtgagttac 360 360 gcgcgcgtcg gcgcgcgtcg ttccactgag ttccactgag cgtcagaccc cgtcagaccc cgtagaaaag cgtagaaaag atcaaaggat atcaaaggat cttcttgaga cttcttgaga 420 420 tccttttttt tccttttttt ctgcgcgtaa ctgcgcgtaa tctgctgctt tctgctgctt gcaaacaaaa gcaaacaaaa aaaccaccgc aaaccaccgc taccagcggt taccagcggt 480 480 ggtttgtttg ggtttgtttg ccggatcaag ccggatcaag agctaccaac agctaccaac tctttttccg tctttttccg aaggtaactg aaggtaactg gcttcagcag gcttcagcag 540 540 agcgcagata agcgcagata ccaaatactg ccaaatactg ttcttctagt ttcttctagt gtagccgtag gtagccgtag ttagcccacc ttagcccacc acttcaagaa acttcaagaa 600 600 ctctgtagca ctctgtagca ccgcctacat ccgcctacat acctcgctct acctcgctct gctaatcctg gctaatcctg ttaccagtgg ttaccagtgg ctgctgccag ctgctgccag 660 660 tggcgataag tggcgataag tcgtgtctta tcgtgtctta ccgggttgga ccgggttgga ctcaagacga ctcaagacga tagttacegg tagttacegg ataaggcgca ataaggcgca 720 720 gcggtcgggc gcggtcgggc tgaacggggg tgaacggggg gttcgtgcac gttcgtgcac acagcccagc acagcccagc ttggagcgaa ttggagcgaa cgacctacac cgacctacac 780 780 cgaactgaga cgaactgaga tacctacagc tacctacagc gtgagctatg gtgagctatg agaaagcgcc agaaagcgcc acgcttcccg acgcttcccg aagggagaaa aagggagaaa 840 840 ggcggacagg ggcggacagg tatccggtaa tatccggtaa gcggcagggt gcggcagggt cggaacagga cggaacagga gagcgcacga gagcgcacga gggagcttcc gggagcttcc 900 900 agggggaaac agggggaaac gcctggtatc gcctggtatc tttatagtcc tttatagtcc tgtcgggttt tgtcgggttt cgccacctct cgccacctct gacttgagcg gacttgagcg 960 960 tcgatttttg tcgatttttg tgatgctcgt tgatgctcgt caggggggcg caggggggcg gagcctatgg gagcctatgg aaaaacgcca aaaaacgcca gcaacgcggc gcaacgcggc 1020 1020 ctttttacgg ctttttacgg ttcctggcct ttcctggcct tttgctggcc tttgctggcc ttttgctcac ttttgctcac atgttctttc atgttctttc ctgcgttatc ctgcgttatc 1080 1080 ccctgattct ccctgattct gtggataacc gtggataacc gtattaccgc gtattaccgc ctttgagtga ctttgagtga gctgataccg gctgataccg ctctttgcga ctctttgcga 1140 1140 taggtaaagg taggtaaagg cgcgccatcg cgcgccatcg aatggcgcaa aatggcgcaa aacctttcgc aacctttcgc ggtatggcat ggtatggcat gatagcgccc gatagcgccc 1200 1200 ggaagagagt ggaagagagt caattcaggg caattcaggg tggtgaatgg tggtgaatgg tggtgaatgt tggtgaatgt gaaaccagta gaaaccagta acgttatacg acgttatacg 1260 1260 atgtcgcaga atgtcgcaga gtatgccggt gtatgccggt gtctcttatc gtctcttatc agaecgtttc agaecgtttc ccgcgtggtg ccgcgtggtg aaccaggcca aaccaggcca 1320 1320 gccacgtttc gccacgtttc tgcgaaaacg tgcgaaaacg cgggaaaaag cgggaaaaag tggaagcggc tggaagcggc gatggcggag gatggcggag ctgaattaca ctgaattaca 1380 1380 ttcccaaccg ttcccaaccg cgtggcacaa cgtggcacaa caactggcgg caactggcgg gcaaacagtc gcaaacagtc gttgctgatt gttgctgatt ggcgttgcca ggcgttgcca 1440 1440 cctccagtct cctccagtct ggccctgcac ggccctgcac gcgccgtcgc gcgccgtcgc aaattgtcgc aaattgtcgc ggcgattaaa ggcgattaaa tcrcgcgccg tcrcgcgccg 1500 1500 atcaactggg atcaactggg tgccagcgtg tgccagcgtg gtggtgtcga gtggtgtcga tggtagaacg tggtagaacg aagcggcgtc aagcggcgtc gaagcctgta gaagcctgta 1560 1560 aagcggcggt aagcggcggt gcacaatctt gcacaatctt ctcgcgcaac ctcgcgcaac gcgtcagtgg gcgtcagtgg gctgatcatr gctgatcatr aactatccgc aactatccgc 1620 1620 tggatgacca tggatgacca ggatgccatt ggatgccatt gctgtggaag gctgtggaag ctgcctgcac ctgcctgcac taatgttccg taatgttccg gcgttatttc gcgttatttc 1680 1680 ttgatgtctc ttgatgtctc tgaccagaca tgaccagaca cccatcaaca cccatcaaca gtattatttt gtattatttt ctcccatgaa ctcccatgaa gacggtacgc gacggtacgc 1740 1740 gactgggcgt gactgggcgt ggagcatctg ggagcatctg gtcgcattgg gtcgcattgg gtcaccagca gtcaccagca aatcgcgctg aatcgcgctg ttagcgggcc ttagcgggcc 1800 1800 cattaagttc cattaagttc tgtctcggcg tgtctcggcg cgtctgcgtc cgtctgcgtc tggctggctg tggctggctg gcataaatat gcataaatat ctcactcgca ctcactcgca 1860 1860 atcaaattca atcaaattca gccgatagcg gccgatagcg gaacgggaag gaacgggaag gcgactggag gcgactggag tgccatgtcc tgccatgtcc ggttttcaac ggttttcaac 1920 1920 aaaccatgca aaaccatgca aatgctgaat aatgctgaat gagggcatcg gagggcatcg ttcccactgc ttcccactgc gatgctggtt gatgctggtt gccaacgatc gccaacgatc 1980 1980 agatggcgct agatggcgct gggcgcaatg gggcgcaatg cgcgccatta cgcgccatta ccgagtccgg ccgagtccgg gctgcgcgtt gctgcgcgtt ggtgcggata ggtgcggata 2040 2040

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

tctcggtagt tctcggtagt gggatacgac gggatacgac gataccgaag gataccgaag acagctcatg acagctcatg ttatatcccg ttatatcccg ccgtcaacca ccgtcaacca 2100 2100 ccatcaaaca ccatcaaaca ggattttcgc ggattttcgc ctgctggggc ctgctggggc aaaccagcgt aaaccagcgt ggaccgcttg ggaccgcttg ctgcaactct ctgcaactct 2160 2160 ctcagggcca ctcagggcca ggcggtgaag ggcggtgaag ggcaatcagc ggcaatcagc tgttgcccgt tgttgcccgt ctcactggtg ctcactggtg aaaagaaaaa aaaagaaaaa 2220 2220 ccaccctggc ccaccctggc gcccaatacg gcccaatacg caaaccgcct caaaccgcct ctccccgcgc ctccccgcgc gttggccgat gttggccgat tcattaatgc tcattaatgc 2280 2280 agctggcacg agctggcacg acaggtttcc acaggtttcc cgactggaaa cgactggaaa gcgggcagtg gcgggcagtg agcgcaactt agcgcaactt tgcgataggt tgcgataggt 2340 2340 aaatttttct aaatttttct aaatacattc aaatacattc aaatatgtat aaatatgtat ccgctcatga ccgctcatga gacaataacc gacaataacc ctgataaatg ctgataaatg 2400 2400 cttcaataat cttcaataat attgaaaaag attgaaaaag gaagagtatg gaagagtatg agtattcaac agtattcaac atttccgtgt atttccgtgt cgcccttatt cgcccttatt 2460 2460 cccttttttg cccttttttg cggcattttg cggcattttg ccttcctgtt ccttcctgtt tttgctcacc tttgctcacc cagaaacgct cagaaacgct ggtgaaagta ggtgaaagta 2520 2520 aaagatgctg aaagatgctg aagatcagtt aagatcagtt gggtgcacga gggtgcacga gtgggttaca gtgggttaca tcgaactgga tcgaactgga tctcaacagc tctcaacagc 2580 2580 ggtaagatcc ggtaagatcc ttgagagttt ttgagagttt tcgccccgaa tcgccccgaa gaacgttttc gaacgttttc caatgatgag caatgatgag cacttttaaa cacttttaaa 2640 2640 gttctgctat gttctgctat gtggcgcggt gtggcgcggt attatcccgt attatcccgt attgacgccg attgacgccg ggcaagagca ggcaagagca actcggtcgc actcggtcgc 2700 2700 cgcatacact cgcatacact attctcagaa attctcagaa tgacttggtt tgacttggtt gagtactcac gagtactcac cagtcacaga cagtcacaga aaagcatctt aaagcatctt 2760 2760 acggatggca acggatggca tgacagtaag tgacagtaag agaattatgc agaattatgc agtgctgcca agtgctgcca taaccatgag taaccatgag tgataacact tgataacact 2820 2820 gcggccaact gcggccaact tacttctgac tacttctgac aacgatcgga aacgatcgga ggaccgaagg ggaccgaagg agctaaccgc agctaaccgc ttttttgcac ttttttgcac 2880 2880 aacatggggg aacatggggg atcatgtaac atcatgtaac tcgccttgat tcgccttgat cgttgggaac cgttgggaac cggagctgaa cggagctgaa tgaagccata tgaagccata 2940 2940 ccaaacgacg ccaaacgacg agcgtgacac agcgtgacac cacgatgcct cacgatgcct gtagcaatgg gtagcaatgg caacaacgtt caacaacgtt gcgcaaacta gcgcaaacta 3000 3000 ttaactggcg ttaactggcg aactacttac aactacttac tctagcttcc tctagcttcc cggcaacaat cggcaacaat taatagactg taatagactg gatggaggcg gatggaggcg 3060 3060 gataaagttg gataaagttg caggaccact caggaccact tctgcgctcg tctgcgctcg gcccttccgg gcccttccgg ctggctggtt ctggctggtt tattgctgat tattgctgat 3120 3120 aaatctggag aaatctggag ccggtgagcg ccggtgagcg tgggtctcgc tgggtctcgc ggtatcattg ggtatcattg cagcactggg cagcactggg gccagatggt gccagatggt 3180 3180 aagccctccc aagccctccc gtatcgtagt gtatcgtagt tatctacacg tatctacacg acggggagtc acggggagtc aggcaactat aggcaactat ggatgaacga ggatgaacga 3240 3240 aatagacaga aatagacaga tcgctgagat tcgctgagat aggtgcctca aggtgcctca ctgattaagc ctgattaagc attggtaact attggtaact gtc gtc 3293 3293

<210> 13 <211> 3316 <212> DNA <213> artificial <220><210> 13 <211> 3316 <212> DNA <213> artificial <220>

<223> pBCM3ML <400> 18 ctggagatcc tgataattct gaaatgagct gttgacaatt aatcatccgg ctcgtataat 60 gtggaattgt gagcgctcac aattccacat aaggaggtaa aaaaatgtgg aattgtgagc 120 gctcacaatt ccacataagg aggtaaaaaa atgatacatc atcatcatca tcattgggaa 180 ctgcagatga attcgagctc ggatccaaga tcttctagac atatgatcga taagcttgat 240 atcggtacca ccatggtcga cctcgagccc ggggctagca taaccccttg gggcctctaa 300 acgggtcttg aggggttttt tggggaaatt tccccgaggg aaatttcccc gactcatgac 360 caaaatccct taacgtgagt tacgcgcgcg tcgttccact gagcgtcaga ccccgtagaa 420 aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 480<223> pBCM3ML <400> 18 ctggagatcc tgataattct gaaatgagct gttgacaatt aatcatccgg ctcgtataat 60 gtggaattgt gagcgctcac aattccacat aaggaggtaa aaaaatgtgg aattgtgagc 120 gctcacaatt ccacataagg aggtaaaaaa atgatacatc atcatcatca tcattgggaa 180 ctgcagatga attcgagctc ggatccaaga tcttctagac atatgatcga taagcttgat 240 atcggtacca ccatggtcga cctcgagccc ggggctagca taaccccttg gggcctctaa 300 acgggtcttg aggggttttt tggggaaatt tccccgaggg aaatttcccc gactcatgac 360 caaaatccct taacgtgagt tacgcgcgcg tcgttccact gagcgtcaga ccccgtagaa 420 aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 480

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

aaaaaaccac aaaaaaccac cgctaccagc cgctaccagc ggtggtttgt ggtggtttgt ttgccggatc ttgccggatc aagagctacc aagagctacc aactcttttt aactcttttt 540 540 ccgaaggtaa ccgaaggtaa ctggcttcag ctggcttcag cagagcgcag cagagcgcag ataccaaata ataccaaata ctgttcttct ctgttcttct agtgtagccg agtgtagccg 600 600 tagttagccc tagttagccc accacttcaa accacttcaa gaactctgta gaactctgta gcaccgccta gcaccgccta catacctcgc catacctcgc tctgctaatc tctgctaatc 660 660 ctgttaccag ctgttaccag tggctgctgc tggctgctgc cagtggcgat cagtggcgat aagtcgtgtc aagtcgtgtc ttaccgggtt ttaccgggtt ggactcaaga ggactcaaga 720 720 cgatagttac cgatagttac cggataaggc cggataaggc gcagcggtcg gcagcggtcg ggctgaacgg ggctgaacgg ggggttcgtg ggggttcgtg cacacagccc cacacagccc 780 780 agcttggagc agcttggagc gaacgaccta gaacgaccta caccgaactg caccgaactg agatacctac agatacctac agcgtgagct agcgtgagct atgagaaagc atgagaaagc 840 840 gccacgcttc gccacgcttc ccgaagggag ccgaagggag aaaggcggac aaaggcggac aggtatccgg aggtatccgg taagcggcag taagcggcag ggtcggaaca ggtcggaaca 900 900 ggagagcgca ggagagcgca cgagggagct cgagggagct tccaggggga tccaggggga aacgcctggt aacgcctggt atctttatag atctttatag tcctgtcggg tcctgtcggg 960 960 tttcgccacc tttcgccacc tctgacttga tctgacttga gcgtcgattt gcgtcgattt ttgtgatgct ttgtgatgct cgtcaggggg cgtcaggggg gcggagccta gcggagccta 1020 1020 tggaaaaacg tggaaaaacg ccagcaacgc ccagcaacgc ggccttttta ggccttttta cggttcctgg cggttcctgg ccttttgctg ccttttgctg gccttttgct gccttttgct 1080 1080 cacatgttct cacatgttct ttcctgcgtt ttcctgcgtt atcccctgat atcccctgat tctgtggata tctgtggata accgtattac accgtattac cgcctttgag cgcctttgag 1140 1140 tgagctgata tgagctgata ccgctctttg ccgctctttg cgataggtaa cgataggtaa aggcgcgcca aggcgcgcca tcgaatggcg tcgaatggcg caaaaccttt caaaaccttt 1200 1200 cgcggtatgg cgcggtatgg catgatagcg catgatagcg cccggaagag cccggaagag agtcaattca agtcaattca gggtggtgaa gggtggtgaa tggtggtgaa tggtggtgaa 1260 1260 tgtgaaacca tgtgaaacca gtaacgttat gtaacgttat acgatgtcgc acgatgtcgc agagtatgcc agagtatgcc ggtgtctctt ggtgtctctt atcagaccgt atcagaccgt 1320 1320 ttcccgcgtg ttcccgcgtg gtgaaccagg gtgaaccagg ccagccacgt ccagccacgt ttctgcgaaa ttctgcgaaa acgcgggaaa acgcgggaaa aagtggaagc aagtggaagc 1380 1380 ggcgatggcg ggcgatggcg gagctgaatt gagctgaatt acattcccaa acattcccaa ccgcgtggca ccgcgtggca caacaactgg caacaactgg cgggcaaaca cgggcaaaca 1440 1440 gtcgttgctg gtcgttgctg attggcgttg attggcgttg ccacctccag ccacctccag tctggccctg tctggccctg cacgcgccgt cacgcgccgt cgcaaattgt cgcaaattgt 1500 1500 cgcggcgatt cgcggcgatt aaatctcgcg aaatctcgcg ccgatcaact ccgatcaact gggtgccagc gggtgccagc gtggtggtgt gtggtggtgt cgatggtaga cgatggtaga 1560 1560 acgaagcggc acgaagcggc gtcgaagcct gtcgaagcct gtaaagcggc gtaaagcggc ggtgcacaat ggtgcacaat cttctcgcgc cttctcgcgc aacgcgtcag aacgcgtcag 1620 1620 tgggctgatc tgggctgatc attaactatc attaactatc cgctggatga cgctggatga ccaggatgcc ccaggatgcc attgctgtgg attgctgtgg aagctgcctg aagctgcctg 1680 1680 cactaatgtt cactaatgtt ccggcgttat ccggcgttat ttcttgatgt ttcttgatgt ctctgaccag ctctgaccag acacccatca acacccatca acagtattat acagtattat 1740 1740 tttctcccat tttctcccat gaagacggta gaagacggta cgcgactggg cgcgactggg cgtggagcat cgtggagcat ctggtcgcat ctggtcgcat tgggtcacca tgggtcacca 1800 1800 gcaaatcgcg gcaaatcgcg ctgttagcgg ctgttagcgg gcccattaag gcccattaag ttctgtctcg ttctgtctcg gcgcgrctgc gcgcgrctgc gtctggctgg gtctggctgg 1860 1860 ctggcataaa ctggcataaa tatctcactc tatctcactc gcaatcaaat gcaatcaaat tcagccgata tcagccgata gcggaacggg gcggaacggg aaggcgactg aaggcgactg 1920 1920 gagtgccatg gagtgccatg tccggttttc tccggttttc aacaaaccat aacaaaccat gcaaatgctg gcaaatgctg aatgagggca aatgagggca tcgttcccac tcgttcccac 1980 1980 tgcgatgctg tgcgatgctg gttgccaacg gttgccaacg atcagatggc atcagatggc gctgggcgca gctgggcgca atgcgcgcca atgcgcgcca ttaccgagtc ttaccgagtc 2040 2040 cgggctgcgc cgggctgcgc gttggtgcgg gttggtgcgg atatctcggt atatctcggt agtgggatac agtgggatac gacgataccg gacgataccg aagacagctc aagacagctc 2100 2100 atgttatatc atgttatatc ccgccgtcaa ccgccgtcaa ccaccatcaa ccaccatcaa acaggatttt acaggatttt cgcctgctgg cgcctgctgg ggcaaaccag ggcaaaccag 2160 2160 cgtggaccgc cgtggaccgc ttgctgcaac ttgctgcaac tctctcaggg tctctcaggg ccaggcggtg ccaggcggtg aagggcaatc aagggcaatc agctgttgcc agctgttgcc 2220 2220 cgtctcactg cgtctcactg gtgaaaagaa gtgaaaagaa aaaccaccct aaaccaccct ggcgcccaat ggcgcccaat acgcaaaccg acgcaaaccg cctctccccg cctctccccg 2280 2280 cgcgttggcc cgcgttggcc gattcattaa gattcattaa tgcagctggc tgcagctggc acgacaggtt acgacaggtt tcccgactgg tcccgactgg aaagcgggca aaagcgggca 2340 2340 gtgagcgcaa gtgagcgcaa ctttgcgata ctttgcgata ggtaaatttt ggtaaatttt tctaaataca tctaaataca ttcaaatatg ttcaaatatg tatccgctca tatccgctca 2400 2400 tgagacaata tgagacaata accctgataa accctgataa atgcttcaat atgcttcaat aatattgaaa aatattgaaa aaggaagagt aaggaagagt atgagtattc atgagtattc 2460 2460 aacatttccg aacatttccg tgtcgccctt tgtcgccctt attccctttt attccctttt ttgcggcatt ttgcggcatt ttgccttcct ttgccttcct gtttttgctc gtttttgctc 2520 2520

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt acceagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 2580 acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 2640 ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 2700 ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 2760 caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 2820 ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 2880 aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 2940 aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 3000 tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 3060 aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 3120 cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 3180 ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 3240 gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 3300 agcattggta actgtc 3316 <210> 19 <211> 3121 <212> DMA <213> artificial <220>SEQLTXT.txt acceagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 2580 acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 2640 ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 2700 ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 2760 caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 2820 ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 2880 aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 2940 aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 3000 tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 3060 aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 3120 cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 3180 ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 3240 gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 3300 agcattggta actgtc 3316 <210> 19 <211> 3121 <212> DMA <213> artifi body <220>

<223> pBCM4ML <400> 19 ctggagatcc tgataaaatc atgaaaaatt tatttgcttt gtgagcggat aacaattata 60 atatgtggaa ttgtgagcgc tcacaattcc acataaggag gtaaaaaaat gtggaattgt 120 gagcgctcac aattccacat aaggaggtaa aaaaatgata catcatcatc atcatcattg 180 ggaactgcag atgaattcga gctcggatcc aagatcttct agacatatga tcgataagct 240 tgatatcggt accaccatgg tcgacctcga gcccggggct agcataaccc cttggggcct 300 ctaaacgggt cttgaggggt tttttgggga aatttccccg aagatcaaag gatcttcttg 360 agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 420 ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 480 cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 540 gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 600 cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga egatagttac cggataaggc 660 gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 720 caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 780 aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 840 tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 900<223> pBCM4ML <400> 19 ctggagatcc tgataaaatc atgaaaaatt tatttgcttt gtgagcggat aacaattata 60 atatgtggaa ttgtgagcgc tcacaattcc acataaggag gtaaaaaaat gtggaattgt 120 gagcgctcac aattccacat aaggaggtaa aaaaatgata catcatcatc atcatcattg 180 ggaactgcag atgaattcga gctcggatcc aagatcttct agacatatga tcgataagct 240 tgatatcggt accaccatgg tcgacctcga gcccggggct agcataaccc cttggggcct 300 ctaaacgggt cttgaggggt tttttgggga aatttccccg aagatcaaag gatcttcttg 360 agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 420 ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 480 cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 540 gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 600 cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga egatagttac cggataaggc 660 gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 720 caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 780 aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 84 0 tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 900

PL 228 024 Β1PL 228 024 Β1

5EQLTXT.txt5EQLTXT.txt

gcgtcgartt gcgtcgartt ttgtgatgct ttgtgatgct cgtcaggggg cgtcaggggg gcggagccta gcggagccta tggaaaaacg tggaaaaacg CCagcaacgc CCagcaacgc 960 960 gtttgcgata gtttgcgata ggtaaaggcg ggtaaaggcg cgccatcgaa cgccatcgaa tggcgcaaaa tggcgcaaaa cctttcgcgg cctttcgcgg tatggcatga tatggcatga 1020 1020 tagcgcccgg tagcgcccgg aagagagtca aagagagtca attcagggtg attcagggtg gtgaatggtg gtgaatggtg gtgaatgtga gtgaatgtga aaccagtaac aaccagtaac 1080 1080 gttatacgat gttatacgat gtcgcagagt gtcgcagagt atgccggtgt atgccggtgt ctcttatcag ctcttatcag accgtttCCC accgtttCCC gcgtggtgaa gcgtggtgaa 1140 1140 ccaggccagc ccaggccagc cacgtttctg cacgtttctg cgaaaacgcg cgaaaacgcg ggaaaaagtg ggaaaaagtg gaagcggcga gaagcggcga tggcggagct tggcggagct 1200 1200 gaattacatt gaattacatt cccaaccgcg cccaaccgcg tggcacaaca tggcacaaca actggcgggc actggcgggc aaacagtcgt aaacagtcgt tgctgattgg tgctgattgg 1260 1260 cgttgccacc cgttgccacc tccagtctgg tccagtctgg ccctgcacgc ccctgcacgc gccgtcgcaa gccgtcgcaa attgtcgcgg attgtcgcgg cgattaaatc cgattaaatc 1320 1320 tcgcgccgat tcgcgccgat caactgggtg caactgggtg ccagcgtggt ccagcgtggt ggtgtcgatg ggtgtcgatg gtagaacgaa gtagaacgaa gcggcgtcga gcggcgtcga 1380 1380 agcctgtaaa agcctgtaaa gcggcggtgc gcggcggtgc acaatcttct acaatcttct cgcgcaacgc cgcgcaacgc gtcagtgggc gtcagtgggc tgatcattaa tgatcattaa 1440 1440 ctatccgctg ctatccgctg gatgaccagg gatgaccagg atgccattgc atgccattgc tgtggaagct tgtggaagct gCCtgcacta gCCtgcacta atgttccggc atgttccggc 1500 1500 gttatttctt gttatttctt gatgtctctg gatgtctctg accagacacc accagacacc catcaacagt catcaacagt attattttct attattttct cccatgaaga cccatgaaga 1560 1560 cggtacgcga cggtacgcga ctgggcgtgg ctgggcgtgg agcatctggt agcatctggt cgcattgggt cgcattgggt caccagcaaa caccagcaaa tcgcgctgtt tcgcgctgtt 1620 1620 agcgggccca agcgggccca ttaagttctg ttaagttctg tctcggcgcg tctcggcgcg tctgcgtctg tctgcgtctg gctggctggc gctggctggc ataaatatct ataaatatct 1680 1680 cactcgcaat cactcgcaat caaattcagc caaattcagc cgatagcgga cgatagcgga acgggaaggc acgggaaggc gactggagtg gactggagtg ccatgtctgg ccatgtctgg 1740 1740 ttttcaacaa ttttcaacaa accatgcaaa accatgcaaa tgctgaatga tgctgaatga gggcatcgtt gggcatcgtt cccactgcga cccactgcga tgctggttgc tgctggttgc 1800 1800 caacgatcag caacgatcag atggcgctgg atggcgctgg gcgcaatgcg gcgcaatgcg cgccattacc cgccattacc gagtccgggc gagtccgggc tgcgcgttgg tgcgcgttgg 1860 1860 tgcggatatc tgcggatatc tcggtagtgg tcggtagtgg garacgacga garacgacga taccgaagac taccgaagac agctcatgtt agctcatgtt atatcccgcc atatcccgcc 1920 1920 gtcaaccacc gtcaaccacc atcaaacagg atcaaacagg attttcgcct attttcgcct gctggggcaa gctggggcaa accagcgtgg accagcgtgg accgcttgct accgcttgct 1980 1980 gcaactctct gcaactctct cagggccagg cagggccagg cggtgaaggg cggtgaaggg caatcagctg caatcagctg ttgcccgtct ttgcccgtct cactggtgaa cactggtgaa 2040 2040 aagaaaaacc aagaaaaacc accctggcgc accctggcgc ccaatacgca ccaatacgca aaccgcctct aaccgcctct ccccgcgcgt ccccgcgcgt tggccgattc tggccgattc 2100 2100 artaatgcag artaatgcag ctggcacgac ctggcacgac aggtttcccg aggtttcccg actggaaagc actggaaagc gggcagtgag gggcagtgag cgcaactttg cgcaactttg 2160 2160 cgataggtaa cgataggtaa atttttctaa atttttctaa atacattcaa atacattcaa atatgtatcc atatgtatcc gctcatgaga gctcatgaga caataaccct caataaccct 2220 2220 gataaatgct gataaatgct tcaataatat tcaataatat tgaaaaagga tgaaaaagga agagtatgag agagtatgag tattcaacat tattcaacat ttccgtgtcg ttccgtgtcg 2280 2280 cccttattcc cccttattcc cttttttgcg cttttttgcg gcattttgcc gcattttgcc ttcctgtttt ttcctgtttt tgctcaccca tgctcaccca gaaacgctgg gaaacgctgg 2340 2340 tgaaagtaaa tgaaagtaaa agatgctgaa agatgctgaa gatcagttgg gatcagttgg gtgcacgagt gtgcacgagt gggttacatc gggttacatc gaactggatc gaactggatc 2400 2400 tcaacagcgg tcaacagcgg taagatcctt taagatcctt gagagttttc gagagttttc gccccgaaga gccccgaaga acgttttcca acgttttcca atgatgagca atgatgagca 2460 2460 cttttaaagt cttttaaagt tctgctatgt tctgctatgt ggcgcggtat ggcgcggtat tatcccgtat tatcccgtat tgacgccggg tgacgccggg caagagcaac caagagcaac 2520 2520 tcggtcgccg tcggtcgccg catacactat catacactat tctcagaatg tctcagaatg acttggttga acttggttga gtactcacca gtactcacca gtcacagaaa gtcacagaaa 2580 2580 agcatcttac agcatcttac ggatggcatg ggatggcatg acagtaagag acagtaagag aattatgcag aattatgcag tgctgccata tgctgccata accatgagtg accatgagtg 2640 2640 ataacactgc ataacactgc ggccaactta ggccaactta cttctgacaa cttctgacaa cgatcggagg cgatcggagg accgaaggag accgaaggag ctaaccgctt ctaaccgctt 2700 2700 ttttgcacaa ttttgcacaa catgggggat catgggggat catgtaactc catgtaactc gccttgatcg gccttgatcg ttgggaaccg ttgggaaccg gagctgaatg gagctgaatg 2760 2760 aagccatacc aagccatacc aaacgacgag aaacgacgag cgtgacacca cgtgacacca cgatgcctgt cgatgcctgt agcaatggca agcaatggca acaacgttgc acaacgttgc 2820 2820 gcaaactatt gcaaactatt aactggcgaa aactggcgaa ctacttactc ctacttactc tagcttcccg tagcttcccg gcaacaatta gcaacaatta atagactgga atagactgga 2880 2880 tggaggcgga tggaggcgga taaagttgca taaagttgca ggaccacttc ggaccacttc tgcgctcggc tgcgctcggc ccttccggct ccttccggct ggctggttta ggctggttta 2940 2940

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

ttgctgataa ttgctgataa atctggagcc atctggagcc ggtgagcgtg ggtgagcgtg ggtctcgcgg ggtctcgcgg tatcattgca tatcattgca gcactggggc gcactggggc 3000 3000 cagatggtaa cagatggtaa gccctcccgt gccctcccgt atcgtagtta atcgtagtta tctacacgac tctacacgac ggggagtcag ggggagtcag gcaactatgg gcaactatgg 3060 3060 atgaacgaaa atgaacgaaa tagacagatc tagacagatc gctgagatag gctgagatag gtgcctcact gtgcctcact gattaagcat gattaagcat tggtaactgt tggtaactgt 3120 3120 c c 3121 3121 <210> 20 <211> 3094 <212> DNA <213> artificial <210> 20 <211> 3094 <212> DNA <213> artificial <220> <223> pBCMSML <220> <223> pBCMSML <400> 20 ctggagatcc <400> 20 ctggagatcc tgatataata tgatataata cgactcacta cgactcacta taggggtgtg taggggtgtg gaattgtgag gaattgtgag cgctcacaat cgctcacaat 60 60 tccacataag tccacataag gaggtaaaaa gaggtaaaaa aatgtggaat aatgtggaat tgtgagcgct tgtgagcgct cacaattcca cacaattcca cataaggagg cataaggagg 120 120 taaaaaaatg taaaaaaatg atacatcatc atacatcatc atcatcatca atcatcatca ttgggaactg ttgggaactg cagatgaatt cagatgaatt cgagctcgga cgagctcgga 180 180 tccaagatct tccaagatct tctagacata tctagacata tgatcgataa tgatcgataa gcttgatatc gcttgatatc ggtaccacca ggtaccacca tggtcgacct tggtcgacct 240 240 cgagcccggg cgagcccggg gctagcataa gctagcataa ccccttgggg ccccttgggg cctctaaacg cctctaaacg ggtcttgagg ggtcttgagg ggttttttgg ggttttttgg 300 300 ggaaatttcc ggaaatttcc ccgaagatca ccgaagatca aaggatcttc aaggatcttc ttgagatcct ttgagatcct ttttttctgc ttttttctgc gcgtaatctg gcgtaatctg 360 360 ctgcttgcaa ctgcttgcaa acaaaaaaac acaaaaaaac caccgctacc caccgctacc agcggtggtt agcggtggtt tgtttgccgg tgtttgccgg atcaagagct atcaagagct 420 420 accaactctt accaactctt tttccgaagg tttccgaagg taactggctt taactggctt cagcagagcg cagcagagcg cagataccaa cagataccaa atactgtcct atactgtcct 480 480 tctagtgtag tctagtgtag ccgtagttag ccgtagttag gccaccactt gccaccactt caagaactct caagaactct gtagcaccgc gtagcaccgc ctacatacct ctacatacct 540 540 cgctctgcta cgctctgcta atcctgttac atcctgttac cagtggctgc cagtggctgc tgccagtggc tgccagtggc gataagtcgr gataagtcgr gtcttaccgg gtcttaccgg 600 600 gttggactca gttggactca agacgatagt agacgatagt taccggataa taccggataa ggcgcagcgg ggcgcagcgg tcgggctgaa tcgggctgaa cggggggttc cggggggttc 660 660 gtgcacacag gtgcacacag cccagcttgg cccagcttgg agcgaacgac agcgaacgac ctacaccgaa ctacaccgaa ctgagatacc ctgagatacc tacagcgtga tacagcgtga 720 720 gctatgagaa gctatgagaa agcgccacgc agcgccacgc ttcccgaagg ttcccgaagg gagaaaggcg gagaaaggcg gacaggtatc gacaggtatc cggtaagcgg cggtaagcgg 780 780 cagggtcgga cagggtcgga acaggagagc acaggagagc gcacgaggga gcacgaggga gcttccaggg gcttccaggg ggaaacgcct ggaaacgcct ggtatcttta ggtatcttta 840 840 tagtcctgtc tagtcctgtc gggtttcgcc gggtttcgcc acctctgact acctctgact tgagcgtcga tgagcgtcga tttttgtgat tttttgtgat gctcgtcagg gctcgtcagg 900 900 ggggcggagc ggggcggagc ctatggaaaa ctatggaaaa acgccagcaa acgccagcaa cgcgtttgcg cgcgtttgcg ataggtaaag ataggtaaag gcgcgccatc gcgcgccatc 960 960 gaatggcgca gaatggcgca aaacctttcg aaacctttcg cggtatggca cggtatggca tgatagcgcc tgatagcgcc cggaagagag cggaagagag tcaattcagg tcaattcagg 1020 1020 gtggtgaatg gtggtgaatg gtggtgaatg gtggtgaatg tgaaaccagt tgaaaccagt aacgttatac aacgttatac gatgtcgcag gatgtcgcag agtatgccgg agtatgccgg 1080 1080 tgtctcttat tgtctcttat cagaccgttt cagaccgttt cccgcgtggt cccgcgtggt gaaccaggcc gaaccaggcc agccacgttt agccacgttt ctgcgaaaac ctgcgaaaac 1140 1140 gcgggaaaaa gcgggaaaaa gtggaagcgg gtggaagcgg cgatggcgga cgatggcgga gctgaattac gctgaattac attcccaacc attcccaacc gcgtggcaca gcgtggcaca 1200 1200 acaactggcg acaactggcg ggcaaacagt ggcaaacagt cgttgctgat cgttgctgat tggcgttgcc tggcgttgcc acctccagtc acctccagtc tggccctgca tggccctgca 1260 1260 cgcgccgtcg cgcgccgtcg caaattgtcg caaattgtcg cggcgattaa cggcgattaa atctcgcgcc atctcgcgcc gatcaactgg gatcaactgg gtgccagcgt gtgccagcgt 1320 1320 ggtggtgtcg ggtggtgtcg atggtagaac atggtagaac gaagcggcgt gaagcggcgt cgaagcctgt cgaagcctgt aaagcggcgg aaagcggcgg tgcacaatct tgcacaatct 1380 1380 tctcgcgcaa tctcgcgcaa cgcgtcagtg cgcgtcagtg ggctgatcat ggctgatcat taactatccg taactatccg ctggatgacc ctggatgacc aggatgccat aggatgccat 1440 1440 tgctgtggaa tgctgtggaa gctgcctgca gctgcctgca ctaatgttcc ctaatgttcc ggcgttattt ggcgttattt cttgatgtct cttgatgtct ctgaccagac ctgaccagac 1500 1500

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

acccatcaac acccatcaac agtattattt agtattattt tctcccatga tctcccatga agacggtacg agacggtacg cgactgggcg cgactgggcg tggagcatct tggagcatct 1560 1560 ggtcgcattg ggtcgcattg ggtcaccagc ggtcaccagc aaatcgcgct aaatcgcgct gttagcgggc gttagcgggc ccattaagtt ccattaagtt ctgtctcggc ctgtctcggc 1620 1620 gcgtctgcgt gcgtctgcgt ctggctggct ctggctggct ggcataaata ggcataaata tctcactcgc tctcactcgc aatcaaattc aatcaaattc agccgatagc agccgatagc 1680 1680 ggaacgggaa ggaacgggaa ggcgactgga ggcgactgga gtgccatgtc gtgccatgtc cggttttcaa cggttttcaa caaaccatgc caaaccatgc aaatgcrgaa aaatgcrgaa 1740 1740 tgagggcatc tgagggcatc gttcccactg gttcccactg cgatgctggt cgatgctggt tgccaacgat tgccaacgat cagatggcgc cagatggcgc tgggcgcaat tgggcgcaat 1800 1800 gcgcgccatt gcgcgccatt accgagtccg accgagtccg ggctgcgcgt ggctgcgcgt tggtgcggat tggtgcggat atctcggtag atctcggtag tgggatacga tgggatacga 1860 1860 cgataccgaa cgataccgaa gacagctcat gacagctcat gttatatccc gttatatccc gccgtcaacc gccgtcaacc accatcaaac accatcaaac aggattttcg aggattttcg 1920 1920 cctgctgggg cctgctgggg caaaccagcg caaaccagcg tggaccgctt tggaccgctt gctgcaactc gctgcaactc tctcagggcc tctcagggcc aggcggtgaa aggcggtgaa 1980 1980 gggcaatcag gggcaatcag Ctgttgcccg Ctgttgcccg tctcactggt tctcactggt gaaaagaaaa gaaaagaaaa accaccctgg accaccctgg cgcccaatac cgcccaatac 2040 2040 gcaaaccgcc gcaaaccgcc tctccccgcg tctccccgcg cgttggccga cgttggccga ttcattaatg ttcattaatg cagctggcac cagctggcac gacaggtttc gacaggtttc 2100 2100 ccgactggaa ccgactggaa agcgggcagt agcgggcagt gagcgcaact gagcgcaact ttgcgatagg ttgcgatagg taaatttttc taaatttttc taaatacatt taaatacatt 2160 2160 caaatatgta caaatatgta tccgctcatg tccgctcatg agacaataac agacaataac cctgataaat cctgataaat gcttcaataa gcttcaataa tattgaaaaa tattgaaaaa 2220 2220 ggaagagtat ggaagagtat gagtattcaa gagtattcaa catttccgtg catttccgtg tcgcccttat tcgcccttat tccctttttt tccctttttt gcggcarttt gcggcarttt 2280 2280 gccttcctgt gccttcctgt ttttgctcac ttttgctcac ccagaaacgc ccagaaacgc tggtgaaagt tggtgaaagt aaaagatgct aaaagatgct gaagatcagt gaagatcagt 2340 2340 tgggtgcacg tgggtgcacg agtgggttac agtgggttac atcgaactgg atcgaactgg atctcaacag atctcaacag cggtaagatc cggtaagatc cttgagagtt cttgagagtt 2400 2400 ttcgccccga ttcgccccga agaacgtttt agaacgtttt ccaatgatga ccaatgatga gcacttttaa gcacttttaa agttctgcta agttctgcta tgtggcgcgg tgtggcgcgg 2460 2460 tattatcccg tattatcccg tattgacgcc tattgacgcc gggcaagagc gggcaagagc aactcggtcg aactcggtcg ccgcatacac ccgcatacac tattctcaga tattctcaga 2520 2520 atgacttggt atgacttggt tgagtactca tgagtactca ccagtcacag ccagtcacag aaaagcatct aaaagcatct tacggatggc tacggatggc atgacagtaa atgacagtaa 2580 2580 gagaattatg gagaattatg cagtgctgcc cagtgctgcc ataaccatga ataaccatga gtgataacac gtgataacac tgcggccaac tgcggccaac ttacttctga ttacttctga 2640 2640 caacgatcgg caacgatcgg aggaccgaag aggaccgaag gagctaaccg gagctaaccg cttttttgca cttttttgca caacatgggg caacatgggg gatcatgtaa gatcatgtaa 2700 2700 ctcgccttga ctcgccttga tcgttgggaa tcgttgggaa ccggagctga ccggagctga atgaagccat atgaagccat accaaacgac accaaacgac gagcgtgaca gagcgtgaca 2760 2760 ccacgatgcc ccacgatgcc tgtagcaatg tgtagcaatg gcaacaacgt gcaacaacgt tgcgcaaact tgcgcaaact attaactggc attaactggc gaactactta gaactactta 2820 2820 ctctagcttc ctctagcttc ccggcaacaa ccggcaacaa ttaatagact ttaatagact ggatggaggc ggatggaggc ggataaagtt ggataaagtt gcaggaccac gcaggaccac 2880 2880 ttctgcgctc ttctgcgctc ggcccttccg ggcccttccg gctggctggt gctggctggt ttattgctga ttattgctga taaatctgga taaatctgga gccggtgagc gccggtgagc 2940 2940 gtgggtctcg gtgggtctcg cggtatcatt cggtatcatt gcagcactgg gcagcactgg ggccagatgg ggccagatgg taagccctcc taagccctcc cgtatcgtag cgtatcgtag 3000 3000 ttatctacac ttatctacac gacggggagt gacggggagt caggcaacta caggcaacta tggatgaacg tggatgaacg aaatagacag aaatagacag atcgctgaga atcgctgaga 3060 3060 taggtgcctc taggtgcctc actgattaag actgattaag cattggtaac cattggtaac tgtc tgtc 3094 3094

<210> 21 <211> 3117 <212> DNA <213> artificial <220><210> 21 <211> 3117 <212> DNA <213> artificial <220>

<22 3> pBCMfiML <400> 21 ctggagatcc tgataattct gaaatgagct gttgacaatt aatcatccgg ctcgtataat 60 gtggaattgt gagcgctcac aattccacat aaggaggtaa aaaaatgtgg aattgtgagc 120<22 3> pBCMfiML <400> 21 ctggagatcc tgataattct gaaatgagct gttgacaatt aatcatccgg ctcgtataat 60 gtggaattgt gagcgctcac aattccacat aaggaggtaa aaaaatgtgg aattgtgagc 120

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

gctcacaatt gctcacaatt ccacataagg ccacataagg aggtaaaaaa aggtaaaaaa atgatacatc atgatacatc atcatcatca atcatcatca tcattgggaa tcattgggaa 180 180 ctgcagatga ctgcagatga attcgagctc attcgagctc ggatccaaga ggatccaaga tcttctagac tcttctagac atatgatcga atatgatcga taagcttgat taagcttgat 240 240 atcggtacca atcggtacca ccatggtcga ccatggtcga cctcgagccc cctcgagccc ggggctagca ggggctagca taaccccttg taaccccttg gggcctctaa gggcctaa 300 300 acgggtcttg acgggtcttg aggggttttt aggggttttt tggggaaatt tggggaaatt tccccgaaga tccccgaaga tcaaaggatc tcaaaggatc ttcttgagat ttcttgagat 360 360 ccttrttttc ccttrttttc tgcgcgtaat tgcgcgtaat ctgctgcttg ctgctgcttg caaacaaaaa caaacaaaaa aaccaccgct aaccaccgct accagcggtg accagcggtg 420 420 gtttgtttgc gtttgtttgc cggatcaaga cggatcaaga gctaccaact gctaccaact ctttttccga ctttttccga aggtaactgg aggtaactgg cttcagcaga cttcagcaga 480 480 gcgcagatac gcgcagatac caaatactgt caaatactgt ccttctagtg ccttctagtg tagccgtagt tagccgtagt taggccacca taggccacca cttcaagaac cttcaagaac 540 540 tctgtagcac tctgtagcac cgcctacata cgcctacata cctcgctctg cctcgctctg ctaatcctgt ctaatcctgt taccagtggc taccagtggc tgctgccagt tgctgccagt 600 600 ggcgataagt ggcgataagt cgtgtcttac cgtgtcttac cgggttggac cgggttggac tcaagacgat tcaagacgat agttaccgga agttaccgga taaggcgcag taaggcgcag 660 660 cggtcgggct cggtcgggct gaacgggggg gaacgggggg ttcgtgcaca ttcgtgcaca cagcccagct cagcccagct tggagcgaac tggagcgaac gacctacacc gacctacacc 720 720 gaactgagat gaactgagat acctacagcg acctacagcg tgagctatga tgagctatga gaaagcgcca gaaagcgcca cgcttcccga cgcttcccga agggagaaag agggagaaag 7S0 7S0 gcggacaggt gcggacaggt atccggtaag atccggtaag cggcagggtc cggcagggtc ggaacaggag ggaacaggag agcgcacgag agcgcacgag ggagcttcca ggagcttcca 840 840 gggggaaacg gggggaaacg cctggtatct cctggtatct ttatagtcct ttatagtcct gtcgggtttc gtcgggtttc gccacctctg gccacctctg acttgagcgt acttgagcgt 900 900 cgatttttgt cgatttttgt gatgctcgtc gatgctcgtc aggggggcgg aggggggcgg agcctatgga agcctatgga aaaacgccag aaaacgccag caacgcgttt caacgcgttt 960 960 gcgataggta gcgataggta aaggcgcgcc aaggcgcgcc atcgaatggc atcgaatggc gcaaaacctt gcaaaacctt tcgcggtatg tcgcggtatg gcatgatagc gcatgatagc 1020 1020 gcccggaaga gcccggaaga gagtcaattc gagtcaattc agggtggtga agggtggtga atggtggtga atggtggtga atgtgaaacc atgtgaaacc agtaacgtta agtaacgtta 1080 1080 tacgatgtcg tacgatgtcg cagagtatgc cagagtatgc cggtgtctct cggtgtctct tatcagaccg tatcagaccg tttcccgcgt tttcccgcgt ggtgaaccag ggtgaaccag 1140 1140 gccagccacg gccagccacg tttctgcgaa tttctgcgaa aacgcgggaa aacgcgggaa aaagtggaag aaagtggaag cggcgatggc cggcgatggc ggagctgaat ggagctgaat 1200 1200 tacattccca tacattccca accgcgtggc accgcgtggc acaacaactg acaacaactg gcgggcaaac gcgggcaaac agtcgttgct agtcgttgct gattggcgtt gattggcgtt 1260 1260 gccacctcca gccacctcca gtctggccct gtctggccct gcacgcgccg gcacgcgccg tcgcaaattg tcgcaaattg tcgcggcgat tcgcggcgat taaatctcgc taaatctcgc 1320 1320 gccgatcaac gccgatcaac tgggtgccag tgggtgccag cgtggtggtg cgtggtggtg tcgatggtag tcgatggtag aacgaagcgg aacgaagcgg cgtcgaagcc cgtcgaagcc 1380 1380 tgtaaagcgg tgtaaagcgg cggtgcacaa cggtgcacaa tCttCtcgcg tCttCtcgcg caacgcgtca caacgcgtca gtgggctgat gtgggctgat cattaactat cattaactat 1440 1440 ccgctggatg ccgctggatg accaggatgc accaggatgc cattgctgtg cattgctgtg gaagctgcct gaagctgcct gcactaatgt gcactaatgt tccggcgtta tccggcgtta 1500 1500 tttcttgatg tttcttgatg tctctgacca tctctgacca gacacccatc gacacccatc aacagtatta aacagtatta ttttctccca ttttctccca tgaagacggt tgaagacggt 1560 1560 acgcgactgg acgcgactgg gcgtggagca gcgtggagca tctggtcgca tctggtcgca ttgggtcacc ttgggtcacc agcaaatcgc agcaaatcgc gctgttagcg gctgttagcg 1620 1620 ggcccattaa ggcccattaa gttctgtctc gttctgtctc ggcgcgtctg ggcgcgtctg cgtctggctg cgtctggctg gctggcataa gctggcataa atatctcact atatctcact 1680 1680 cgcaatcaaa cgcaatcaaa ttcagccgat ttcagccgat agcggaacgg agcggaacgg gaaggcgact gaaggcgact ggagtgccat ggagtgccat gtccggtttt gtccggtttt 1740 1740 caacaaacca caacaaacca tgcaaatgct tgcaaatgct gaatgagggc gaatgagggc atcgttccca atcgttccca ctgcgatgct ctgcgatgct ggttgccaac ggttgccaac 1800 1800 gatcagatgg gatcagatgg cgctgggcgc cgctgggcgc aatgcgcgcc aatgcgcgcc attaccgagt attaccgagt ccgggctgcg ccgggctgcg cgttggtgcg cgttggtgcg 1860 1860 gatatctcgg gatatctcgg tagtgggata tagtgggata cgacgatacc cgacgatacc gaagacagct gaagacagct catgttatat catgttatat cccgccgtca cccgccgtca 1920 1920 accaccatca accaccatca aacaggattt aacaggattt tcgcctgctg tcgcctgctg gggcaaacca gggcaaacca gcgtggaccg gcgtggaccg cttgctgcaa cttgctgcaa 1980 1980 ctctctcagg ctctctcagg gccaggcggt gccaggcggt gaagggcaat gaagggcaat cagctgttgc cagctgttgc ccgtctcact ccgtctcact ggtgaaaaga ggtgaaaaga 2040 2040 aaaaccaccc aaaaccaccc tggcgcccaa tggcgcccaa tacgcaaacc tacgcaaacc gcctctcccc gcctctcccc gcgcgttggc gcgcgttggc cgattcatta cgattcatta 2100 2100 atgcagctgg atgcagctgg cacgacaggt cacgacaggt ttcccgactg ttcccgactg gaaagcgggc gaaagcgggc agtgagcgca agtgagcgca actttgcgat actttgcgat 2160 2160

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

aggtaaattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aggtaaattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 2220 2220 aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct 2280 2280 tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa 2340 2340 agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa 2400 2400 cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt 2460 2460 taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg 2520 2520 tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca 2580 2580 tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa 2640 2640 cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt 2700 2700 gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc 2760 2760 cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa 2820 2820 actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga 2880 2880 ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc 2940 2940 tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga 3000 3000 tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga 3060 3060 acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtc acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtc 3117 3117

<210> 22 <211> 3338 <212> DNA <213> artifi ciał <220><210> 22 <211> 3338 <212> DNA <213> artificals <220>

<223> pBCM7ML <400> 22 ctggagatcc tgataaaatc atgaaaaatt tatttgcttt gtgagcggat aacaattata 60 atatgtggaa ttgtgagcgc tcacaattcc acataaggag gtaaaaaaat gtggaattgt 120 gagcgctcac aattccacat aaggaggtaa aaaaatgata catcatcatc atcatcattg 180 ggaactgcag atgaattcga gctcggatcc aagatcttct agacatatga tcgataagct 240 tgatatcggt accaccatgg tcgacctcga gcccggggct agcataaccc cttggggcct 300 ctaaacgggt cttgaggggt tttttgggga aatttccccg attaataaga tgatcttctt 360 gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc gccttgcagg 420 gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac tggcttggag 480 gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat gacttcaaga 540 ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc atgtctttcc 600 gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg aacggggggt 660 tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt caggcgtgga 720 atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg caggaacagg 780<223> pBCM7ML <400> 22 ctggagatcc tgataaaatc atgaaaaatt tatttgcttt gtgagcggat aacaattata 60 atatgtggaa ttgtgagcgc tcacaattcc acataaggag gtaaaaaaat gtggaattgt 120 gagcgctcac aattccacat aaggaggtaa aaaaatgata catcatcatc atcatcattg 180 ggaactgcag atgaattcga gctcggatcc aagatcttct agacatatga tcgataagct 240 tgatatcggt accaccatgg tcgacctcga gcccggggct agcataaccc cttggggcct 300 ctaaacgggt cttgaggggt tttttgggga aatttccccg attaataaga tgatcttctt 360 gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc gccttgcagg 420 gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac tggcttggag 480 gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat gacttcaaga 540 ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc atgtctttcc 600 gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg aacggggggt 660 tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt caggcgtgga 720 atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg caggaacagg 780

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

agagcgcacg agagcgcacg agggagccgc agggagccgc cagggggaaa cagggggaaa cgcctggtat cgcctggtat ctttatagtc ctttatagtc ctgtcgggtt ctgtcgggtt 840 840 tcgccaccac tcgccaccac tgatttgagc tgatttgagc gtcagatttc gtcagatttc gtgatgcttg gtgatgcttg tcaggggggc tcaggggggc ggagcctatg ggagcctatg 900 900 gaaaaacggc gaaaaacggc tttgccgcgg tttgccgcgg ccctctcact ccctctcact tccctgttaa tccctgttaa gtatcttcct gtatcttcct ggcatcttcc ggcatcttcc 960 960 aggaaatctc aggaaatctc Cgccccgttc Cgccccgttc gtaagccatt gtaagccatt tccgctcgcc tccgctcgcc gcagtcgaac gcagtcgaac gaccgagcgt gaccgagcgt 1020 1020 agcgagtcag agcgagtcag tgagcgagga tgagcgagga agcggaatat agcggaatat atcctgtatc atcctgtatc acatattctg acatattctg ctgacgcacc ctgacgcacc 1080 1080 ggtgcagcct ggtgcagcct tttttctcct tttttctcct gccacatgaa gccacatgaa gcacttcact gcacttcact gacaccctca gacaccctca tcagtgccaa tcagtgccaa 1140 1140 catagtaagc catagtaagc cagtatacac cagtatacac tccgctagcg tccgctagcg ctgaggtctt ctgaggtctt tgcgataggt tgcgataggt aaaggcgcgc aaaggcgcgc 1200 1200 catcgaatgg catcgaatgg cgcaaaacct cgcaaaacct ttcgcggtat ttcgcggtat ggcatgatag ggcatgatag cgcccggaag cgcccggaag agagtcaatt agagtcaatt 1260 1260 cagggtggtg cagggtggtg aatggtggtg aatggtggtg aatgtgaaac aatgtgaaac cagtaacgtt cagtaacgtt atacgatgtc atacgatgtc gcagagtatg gcagagtatg 1320 1320 ccggtgtctc ccggtgtctc ttatcagacc ttatcagacc gtttcccgcg gtttcccgcg tggtgaacca tggtgaacca ggccagccac ggccagccac gtttctgcga gtttctgcga 1380 1380 aaacgcggga aaacgcggga aaaagtggaa aaaagtggaa gcggcgatgg gcggcgatgg cggagctgaa cggagctgaa ttacattccc ttacattccc aaccgcgtgg aaccgcgtgg 1440 1440 cacaacaact cacaacact ggcgggcaaa ggcgggcaaa cagtcgttgc cagtcgttgc tgattggcgt tgattggcgt tgccacctcc tgccacctcc agtctggccc agtctggccc 1500 1500 tgcacgcgcc tgcacgcgcc gtcgcaaatt gtcgcaaatt gtcgcggcga gtcgcggcga ttaaatctcg ttaaatctcg cgccgatcaa cgccgatcaa ctgggtgcca ctgggtgcca 1560 1560 gcgtggtggt gcgtggtggt gtcgatggta gtcgatggta gaacgaagcg gaacgaagcg gcgtcgaagc gcgtcgaagc ctgtaaagcg ctgtaaagcg gcggtgcaca gcggtgcaca 1620 1620 atcttctcgc atcttctcgc gcaacgcgtc gcaacgcgtc agtgggctga agtgggctga tcattaacta tcattaacta tccgctggat tccgctggat gaccaggatg gaccaggatg 1680 1680 ccattgctgt ccattgctgt ggaagctgcc ggaagctgcc tgcactaatg tgcactaatg ttccggcgtt ttccggcgtt atttcttgat atttcttgat gtctctgacc gtctctgacc 1740 1740 agacacccat agacacccat caacagtatt caacagtatt attttctccc attttctccc atgaagacgg atgaagacgg tacgcgactg tacgcgactg ggcgtggagc ggcgtggagc 1800 1800 atctggtcgc atctggtcgc attgggtcac attgggtcac cagcaaatcg cagcaaatcg cgctgttagc cgctgttagc gggcccatta gggcccatta agttctgtct agttctgtct 1860 1860 cggcgcgtct cggcgcgtct gcgtctggct gcgtctggct ggctggcata ggctggcata aatatctcac aatatctcac tcgcaatcaa tcgcaatcaa attcagccga attcagccga 1920 1920 tagcggaacg tagcggaacg ggaaggcgac ggaaggcgac tggagtgcca tggagtgcca tgtccggttt tgtccggttt tcaacaaacc tcaacaaacc atgcaaatgc atgcaaatgc 1980 1980 tgaatgaggg tgaatgaggg carcgttccc carcgttccc actgcgatgc actgcgatgc tggttgccaa tggttgccaa cgatcagatg cgatcagatg gcgctgggcg gcgctgggcg 2040 2040 caatgcgcgc caatgcgcgc cattaccgag cattaccgag tccgggctgc tccgggctgc gcgttggtgc gcgttggtgc ggatatctcg ggatatctcg gtagtgggat gtagtgggat 2100 2100 acgacgatac acgacgatac cgaagacagc cgaagacagc tcatgttata tcatgttata tcccgccgtc tcccgccgtc aaccaccatc aaccaccatc aaacaggatt aaacaggatt 2160 2160 ttcgcctget ttcgcctget ggggcaaacc ggggcaaacc agcgtggacc agcgtggacc gcttgctgca gcttgctgca actctctcag actctctcag ggccaggcgg ggccaggcgg 2220 2220 tgaagggcaa tgaagggcaa tcagctgttg tcagctgttg cccgtctcac cccgtctcac tggtgaaaag tggtgaaaag aaaaaccacc aaaaaccacc ctggcgccca ctggcgccca 2280 2280 atacgcaaac atacgcaaac cgcctctccc cgcctctccc cgcgcgttgg cgcgcgttgg ccgattcatt ccgattcatt aatgcagctg aatgcagctg gcacgacagg gcacgacagg 2340 2340 tttcccgact tttcccgact ggaaagcggg ggaaagcggg cagtgagcgc cagtgagcgc aactttgcga aactttgcga taggtaaatt taggtaaatt tttctaaata tttctaaata 2400 2400 cattcaaata cattcaaata tgtatccgct tgtatccgct catgagacaa catgagacaa taaccctgat taaccctgat aaatgcttca aaatgcttca ataatattga ataatattga 2460 2460 aaaaggaaga aaaaggaaga gtatgagtat gtatgagtat tcaacatttc tcaacatttc cgtgtcgccc cgtgtcgccc ttattccctt ttattccctt ttttgcggca ttttgcggca 2520 2520 ttttgccttc ttttgccttc ctgtttttgc ctgtttttgc tcacccagaa tcacccagaa acgctggtga acgctggtga aagtaaaaga aagtaaaaga tgctgaagat tgctgaagat 2580 2580 cagttgggtg cagttgggtg cacgagtggg cacgagtggg ttacatcgaa ttacatcgaa ctggatctca ctggatctca acagcggtaa acagcggtaa gatccttgag gatccttgag 2640 2640 agttttcgcc agttttcgcc ccgaagaacg ccgaagaacg ttttccaatg ttttccaatg atgagcactt atgagcactt ttaaagttct ttaaagttct gctatgtggc gctatgtggc 2700 2700 gcggtattat gcggtattat cccgtattga cccgtattga cgccgggcaa cgccgggcaa gagcaactcg gagcaactcg gtcgccgcat gtcgccgcat acactattct acactattct 2760 2760 cagaatgact cagaatgact tggttgagta tggttgagta ctcaccagtc ctcaccagtc acagaaaagc acagaaaagc atcttacgga atcttacgga tggcatgaca tggcatgaca 2820 2820

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 2880 ctgacaacga tcggaggacc gaaggagcta accgcrtttt tgcacaacat gggggatcat 2940 gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 3000 gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 3060 ettactetag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 3120 ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 3180 gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 3240 gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 3300 gagataggtg cctcactgat taagcattgg taactgtc 3338 <210> 23 <211> 3311 <2I2> DNA <213> artificial <220>SEQLTXT.txt gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 2880 ctgacaacga tcggaggacc gaaggagcta accgcrtttt tgcacaacat gggggatcat 2940 gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 3000 gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 3060 ettactetag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 3120 ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 3180 gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 3240 gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 3300 gagataggtg cctcactgat taagcattgg taactgtc 3338 <210> 23 <211> 3311 <2I2> <220>> artificial

<223> pBCM8ML <4Q0> 23<223> pBCM8ML <4Q0> 23

ctggagatcc ctggagatcc tgatataata tgatataata cgactcacta cgactcacta taggggtgtg taggggtgtg gaattgtgag gaattgtgag cgctcacaat cgctcacaat 60 60 tccacataag tccacataag gaggtaaaaa gaggtaaaaa aatgtggaat aatgtggaat tgtgagcgct tgtgagcgct cacaattcca cacaattcca cataaggagg cataaggagg 120 120 taaaaaaatg taaaaaaatg atacatcatc atacatcatc atcatcatca atcatcatca ttgggaactg ttgggaactg cagatgaatt cagatgaatt cgagctcgga cgagctcgga 180 180 tccaagatct tccaagatct tctagacata tctagacata tgatcgataa tgatcgataa gcttgatatc gcttgatatc ggtaccacca ggtaccacca tggtcgacct tggtcgacct 240 240 cgagcccggg cgagcccggg gctagcataa gctagcataa ccccttgggg ccccttgggg cctctaaacg cctctaaacg ggtcttgagg ggtcttgagg ggttttttgg ggttttttgg 300 300 ggaaatttcc ggaaatttcc ccgattaata ccgattaata agatgatctt agatgatctt cttgagatcg cttgagatcg ttttggtctg ttttggtctg cgcgtaatct cgcgtaatct 360 360 cttgctctga cttgctctga aaacgaaaaa aaacgaaaaa accgccttgc accgccttgc agggcggttt agggcggttt ttcgaaggtt ttcgaaggtt ctctgagcta ctctgagcta 420 420 ccaactcttt ccaactcttt gaaccgaggt gaaccgaggt aactggcttg aactggcttg gaggagcgca gaggagcgca gtcaccaaaa gtcaccaaaa cttgtccttt cttgtccttt 480 480 cagtttagcc cagtttagcc ttaaccggcg ttaaccggcg catgacttca catgacttca agactaactc agactaactc ctctaaatca ctctaaatca attaccagtg attaccagtg 540 540 gctgctgcca gctgctgcca gtggtgcttt gtggtgcttt tgcatgtctt tgcatgtctt tccgggttgg tccgggttgg actcaagacg actcaagacg atagttaccg atagttaccg 600 600 gataaggcgc gataaggcgc agcggtcgga agcggtcgga ctgaaegggg ctgaaegggg ggttcgtgca ggttcgtgca tacagtccag tacagtccag cttggagcga cttggagcga 660 660 actgcctacc actgcctacc cggaactgag cggaactgag tgtcaggcgt tgtcaggcgt ggaatgagac ggaatgagac aaacgcggcc aaacgcggcc ataacagcgg ataacagcgg 720 720 aatgacaccg aatgacaccg gtaaaccgaa gtaaaccgaa aggcaggaac aggcaggaac aggagagcgc aggagagcgc acgagggagc acgagggagc cgccaggggg cgccaggggg 780 780 aaacgcctgg aaacgcctgg tatctttata tatctttata gtcctgtcgg gtcctgtcgg grttcgccac grttcgccac cactgatttg cactgatttg agcgtcagat agcgtcagat 840 840 ttcgtgatgc ttcgtgatgc ttgtcagggg ttgtcagggg ggcggagcct ggcggagcct atggaaaaac atggaaaaac ggctttgccg ggctttgccg cggccctctc cggccctctc 900 900 acttccctgt acttccctgt taagtatctt taagtatctt cetggcatct cetggcatct tccaggaaat tccaggaaat ctccgccccg ctccgccccg ttcgtaagcc ttcgtaagcc 960 960 atttccgctc atttccgctc gccgcagtcg gccgcagtcg aacgaccgag aacgaccgag cgtagcgagt cgtagcgagt cagtgagcga cagtgagcga ggaagcggaa ggaagcggaa 1020 1020 tatatcctgt tatatcctgt atcacatatt atcacatatt ctgctgacgc ctgctgacgc accggtgcag accggtgcag ccttttttct ccttttttct cctgccacat cctgccacat 1080 1080 gaagcacttc gaagcacttc actgacaccc actgacaccc tcatcagtgc tcatcagtgc caacatagta caacatagta agccagtata agccagtata cactccgcta cactccgcta 1140 1140 gcgctgaggt gcgctgaggt ctttgcgata ctttgcgata ggtaaaggcg ggtaaaggcg cgccatcgaa cgccatcgaa tggcgcaaaa tggcgcaaaa cctttcgcgg cctttcgcgg 1200 1200

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

tatggcatga tatggcatga tagcgcccgg tagcgcccgg aagagagtca aagagagtca attcagggtg attcagggtg gtgaatggtg gtgaatggtg gtgaatgtga gtgaatgtga 1260 1260 aaccagtaac aaccagtaac gttatacgat gttatacgat gtcgcagagt gtcgcagagt atgccggtgt atgccggtgt ctcttatcag ctcttatcag accgtttccc accgtttccc 1320 1320 gcgtggtgaa gcgtggtgaa ccaggccagc ccaggccagc cacgtttctg cacgtttctg cgaaaacgcg cgaaaacgcg ggaaaaagtg ggaaaaagtg gaagcggcga gaagcggcga 1380 1380 tggcggagct tggcggagct gaattacatt gaattacatt cccaaccgcg cccaaccgcg tggcacaaca tggcacaaca actggcgggc actggcgggc aaacagtcgt aaacagtcgt 1440 1440 tgctgattgg tgctgattgg cgttgccacc cgttgccacc tccagtctgg tccagtctgg ccctgcacgc ccctgcacgc gccgtcgcaa gccgtcgcaa attgtcgcgg attgtcgcgg 1500 1500 cgattaaatc cgattaaatc tcgcgccgat tcgcgccgat caactgggtg caactgggtg ccagcgtggt ccagcgtggt ggtgtcgatg ggtgtcgatg gtagaacgaa gtagaacgaa 1560 1560 gcggcgtcga gcggcgtcga agcctgtaaa agcctgtaaa gcggcggtgc gcggcggtgc acaatcttct acaatcttct cgcgcaacgc cgcgcaacgc gtcagtgggc gtcagtgggc 1620 1620 tgatcattaa tgatcattaa ctatccgctg ctatccgctg gatgaccagg gatgaccagg atgccattgc atgccattgc tgtggaagct tgtggaagct gcctgcacta gcctgcacta 1680 1680 atgttccggc atgttccggc gttatttctt gttatttctt gatgtctctg gatgtctctg accagacacc accagacacc catcaacagt catcaacagt attattttct attattttct 1740 1740 cccatgaaga cccatgaaga cggtacgcga cggtacgcga ctgggcgtgg ctgggcgtgg agcatctggt agcatctggt cgcattgggt cgcattgggt caccagcaaa caccagcaaa 1800 1800 tcgcgctgtt tcgcgctgtt agcgggccca agcgggccca ttaagttctg ttaagttctg tctcggcgcg tctcggcgcg tctgcgtctg tctgcgtctg gctggctggc gctggctggc 1860 1860 ataaatatct ataaatatct cactcgcaat cactcgcaat caaattcagc caaattcagc cgatagcgga cgatagcgga acgggaaggc acgggaaggc gactggagtg gactggagtg 1920 1920 ccatgtccgg ccatgtccgg ttttcaacaa ttttcaacaa accatgcaaa accatgcaaa tgctgaatga tgctgaatga gggcatcgtt gggcatcgtt cccactgcga cccactgcga 1980 1980 tgctggttgc tgctggttgc caacgatcag caacgatcag atggcgctgg atggcgctgg gcgcaatgcg gcgcaatgcg cgccattacc cgccattacc gagtccgggc gagtccgggc 2040 2040 tgcgcgttgg tgcgcgttgg tgcggatatc tgcggatatc tcggtagtgg tcggtagtgg gatacgacga gatacgacga taccgaagac taccgaagac agctcatgtt agctcatgtt 2100 2100 atatcccgcc atatcccgcc gtcaaccacc gtcaaccacc atcaaacagg atcaaacagg attttcgcct attttcgcct gctggggcaa gctggggcaa accagcgtgg accagcgtgg 2160 2160 accgcttgct accgcttgct gcaactctct gcaactctct cagggccagg cagggccagg cggtgaaggg cggtgaaggg caatcagctg caatcagctg ttgcccgtct ttgcccgtct 2220 2220 cactggtgaa cactggtgaa aagaaaaacc aagaaaaacc accctggcgc accctggcgc ccaatacgca ccaatacgca aaccgcctct aaccgcctct ccccgcgcgt ccccgcgcgt 2280 2280 tggccgattc tggccgattc attaatgcag attaatgcag ctggcacgac ctggcacgac aggtttcccg aggtttcccg actggaaagc actggaaagc gggcagtgag gggcagtgag 2340 2340 cgcaactttg cgcaactttg cgataggtaa cgataggtaa atttttctaa atttttctaa atacattcaa atacattcaa atatgtatcc atatgtatcc gctcatgaga gctcatgaga 2400 2400 caataaccct caataaccct gataaatgct gataaatgct tcaataatat tcaataatat tgaaaaagga tgaaaaagga agagtatgag agagtatgag tattcaacat tattcaacat 2460 2460 ttccgtgtcg ttccgtgtcg cccttattcc cccttattcc cttttttgcg cttttttgcg gcattttgcc gcattttgcc ttcctgtttt ttcctgtttt tgctcaccca tgctcaccca 2520 2520 gaaacgctgg gaaacgctgg tgaaagtaaa tgaaagtaaa agatgctgaa agatgctgaa gatcagttgg gatcagttgg gtgcacgagt gtgcacgagt gggttacatc gggttacatc 2580 2580 gaactggatc gaactggatc tcaacagcgg tcaacagcgg taagatcctt taagatcctt gagagttttc gagagttttc gccccgaaga gccccgaaga acgttttcca acgttttcca 2640 2640 atgargagca atgargagca cttttaaagt cttttaaagt tctgctatgt tctgctatgt ggcgcggtat ggcgcggtat tatcccgtat tatcccgtat tgacgccggg tgacgccggg 2700 2700 caagagcaac caagagcaac tcggtcgccg tcggtcgccg Catacactat Catacactat tctcagaatg tctcagaatg acttggttga acttggttga gtactcacca gtactcacca 2760 2760 gtcacagaaa gtcacagaaa agcatcttac agcatcttac ggatggcatg ggatggcatg acagtaagag acagtaagag aattatgcag aattatgcag tgctgccata tgctgccata 2820 2820 accatgagtg accatgagtg ataacactgc ataacactgc ggccaactta ggccaactta cttctgacaa cttctgacaa cgatcggagg cgatcggagg accgaaggag accgaaggag 2880 2880 ctaaccgctt ctaaccgctt ttttgcacaa ttttgcacaa catgggggat catgggggat catgtaactc catgtaactc gccttgatcg gccttgatcg ttgggaaccg ttgggaaccg 2940 2940 gagctgaatg gagctgaatg aagccatacc aagccatacc aaacgacgag aaacgacgag cgtgacacca cgtgacacca cgatgcctgt cgatgcctgt agcaatggca agcaatggca 3000 3000 acaacgttgc acaacgttgc gcaaactatt gcaaactatt aactggcgaa aactggcgaa ctacttactc ctacttactc tagcttcccg tagcttcccg gcaacaatta gcaacaatta 3060 3060 atagactgga atagactgga tggaggcgga tggaggcgga taaagttgca taaagttgca ggaccacttc ggaccacttc tgcgctcggc tgcgctcggc ccttccggct ccttccggct 3120 3120 ggctggttta ggctggttta ttgctgataa ttgctgataa atctggagcc atctggagcc ggtgagcgtg ggtgagcgtg ggtctcgcgg ggtctcgcgg tatcattgca tatcattgca 3180 3180 gcactggggc gcactggggc cagatggtaa cagatggtaa gccctcccgt gccctcccgt atcgtagtta atcgtagtta tctacacgac tctacacgac ggggagtcag ggggagtcag 3240 3240

PL 228 024 Β1PL 228 024 Β1

5EQLTXT.txt gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 3300 tggtaactgt c 3311 <210> 24 <211> 3334 <212> DNA <213> artificial <220>5EQLTXT.txt gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 3300 tggtaactgt c 3311 <210> 24 <211> 3334 <212> DNA <213> artificial <220>

<223> PBCM9ML <400> 24<223> PBCM9ML <400> 24

ctggagatcc ctggagatcc tgataattct tgataattct gaaatgagct gaaatgagct gttgacaatt gttgacaatt aatcatccgg aatcatccgg ctcgtataat ctcgtataat 60 60 gtggaattgt gtggaattgt gagcgctcac gagcgctcac aattccacat aattccacat aaggaggtaa aaggaggtaa aaaaatgtgg aaaaatgtgg aattgtgagc aattgtgagc 120 120 gctcacaatt gctcacaatt ccacataagg ccacataagg aggtaaaaaa aggtaaaaaa atgatacatc atgatacatc atcatcatca atcatcatca tcattgggaa tcattgggaa 180 180 ctgcagatga ctgcagatga attcgagetc attcgagetc ggatccaaga ggatccaaga tcttctagac tcttctagac atatgatcga atatgatcga taagcttgat taagcttgat 240 240 atcggtacca atcggtacca ccatggtcga ccatggtcga cctcgagccc cctcgagccc ggggctagca ggggctagca taaccccttg taaccccttg gggcctctaa gggcctaa 300 300 acgggtcttg acgggtcttg aggggttttt aggggttttt tggggaaatt tggggaaatt tccccgatta tccccgatta ataagatgat ataagatgat cttcttgaga cttcttgaga 360 360 tcgttttggt tcgttttggt ctgcgcgtaa ctgcgcgtaa tctcttgctc tctcttgctc tgaaaacgaa tgaaaacgaa aaaaccgcct aaaaccgcct tgcagggcgg tgcagggcgg 420 420 tttttcgaag tttttcgaag gttctctgag gttctctgag ctaccaactc ctaccaactc tttgaaccga tttgaaccga ggtaactggc ggtaactggc ttggaggagc ttggaggagc 480 480 gcagtcacca gcagtcacca aaacttgtcc aaacttgtcc tttcagttta tttcagttta gccttaaccg gccttaaccg gcgcatgact gcgcatgact tcaagactaa tcaagactaa 540 540 ctcctctaaa ctcctaaa tcaattacca tcaattacca gtggctgctg gtggctgctg ccagtggtgc ccagtggtgc ttttgcatgt ttttgcatgt ctttccgggt ctttccgggt 600 600 tggactcaag tggactcaag acgatagtta acgatagtta ccggataagg ccggataagg cgcagcggtc cgcagcggtc ggactgaacg ggactgaacg gggggttcgt gggggttcgt 660 660 gcatacagtc gcatacagtc cagcttggag cagcttggag cgaactgcct cgaactgcct acccggaact acccggaact gagtgtcagg gagtgtcagg cgtggaatga cgtggaatga 720 720 gacaaacgcg gacaaacgcg gccataacag gccataacag cggaatgaca cggaatgaca ccggtaaacc ccggtaaacc gaaaggcagg gaaaggcagg aacaggagag aacaggagag 780 780 cgcacgaggg cgcacgaggg agccgccagg agccgccagg gggaaacgcc gggaaacgcc tggtatcttt tggtatcttt atagtcctgt atagtcctgt cgggtttcgc cgggtttcgc 840 840 eaccactgat eaccactgat ttgagcgtca ttgagcgtca gatttcgtga gatttcgtga tgcttgtcag tgcttgtcag gggggcggag gggggcggag cctatggaaa cctatggaaa 900 900 aacggctttg aacggctttg ccgcggccct ccgcggccct ctcacttccc ctcacttccc tgttaagtat tgttaagtat cttcctggca cttcctggca tcttccagga tcttccagga 960 960 aatctccgcc aatctccgcc ccgttcgtaa ccgttcgtaa gccatttccg gccatttccg ctcgccgcag ctcgccgcag tcgaacgacc tcgaacgacc gagcgtagcg gagcgtagcg 1020 1020 agtcagtgag agtcagtgag cgaggaagcg cgaggaagcg gaatatatcc gaatatatcc tgtatcacat tgtatcacat attctgctga attctgctga cgcaccggtg cgcaccggtg 1080 1080 cagccttttt cagccttttt tctcctgcca tctcctgcca catgaagcac catgaagcac ttcactgaca ttcactgaca ccctcatcag ccctcatcag tgccaacata tgccaacata 1140 1140 gtaagccagt gtaagccagt atacactccg atacactccg ctagcgctga ctagcgctga ggtctttgcg ggtctttgcg ataggtaaag ataggtaaag gcgcgccatc gcgcgccatc 1200 1200 gaatggcgca gaatggcgca aaacctttcg aaacctttcg cggtatggca cggtatggca tgatagcgcc tgatagcgcc cggaagagag cggaagagag tcaattcagg tcaattcagg 1260 1260 gtggtgaatg gtggtgaatg gtggtgaatg gtggtgaatg tgaaaccagt tgaaaccagt aacgttatac aacgttatac gatgtcgcag gatgtcgcag agtatgccgg agtatgccgg 1320 1320 tgtctcttat tgtctcttat cagaccgttt cagaccgttt cccgcgtggt cccgcgtggt gaaccaggcc gaaccaggcc agccacgttt agccacgttt ctgcgaaaac ctgcgaaaac 1380 1380 gcgggaaaaa gcgggaaaaa gtggaagcgg gtggaagcgg cgatggcgga cgatggcgga gctgaattac gctgaattac attcccaacc attcccaacc gcgtggcaca gcgtggcaca 1440 1440 acaactggcg acaactggcg ggcaaacagt ggcaaacagt cgttgctgat cgttgctgat tggcgttgcc tggcgttgcc acctccagtc acctccagtc tggccctgca tggccctgca 1500 1500 cgcgccgtcg cgcgccgtcg caaattgtcg caaattgtcg cggcgattaa cggcgattaa atctcgcgcc atctcgcgcc gatcaactgg gatcaactgg gtgccagcgt gtgccagcgt 1560 1560 ggtggtgtcg ggtggtgtcg atggtagaac atggtagaac gaagcggcgt gaagcggcgt cgaagcctgt cgaagcctgt aaagcggcgg aaagcggcgg tgcacaatct tgcacaatct 1620 1620

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

tctcgcgcaa tctcgcgcaa cgcgtcagtg cgcgtcagtg ggctgatcat ggctgatcat taactatccg taactatccg ctggatgacc ctggatgacc aggatgccat aggatgccat 1680 1680 tgctgtggaa tgctgtggaa gctgcctgca gctgcctgca ctaatgttcc ctaatgttcc ggcgttattt ggcgttattt cttgatgtct cttgatgtct ctgaccagac ctgaccagac 1740 1740 acccatcaac acccatcaac agtattattt agtattattt tctcccatga tctcccatga agacggtacg agacggtacg cgactgggcg cgactgggcg tggagcatct tggagcatct 1800 1800 ggtcgcattg ggtcgcattg ggtcaccagc ggtcaccagc aaatcgcgct aaatcgcgct gttagcgggc gttagcgggc ccattaagtt ccattaagtt ctgtctcggc ctgtctcggc 1860 1860 gcgtctgcgt gcgtctgcgt ctggctggct ctggctggct ggcataaata ggcataaata tctcactcgc tctcactcgc aatcaaattc aatcaaattc agccgatagc agccgatagc 1920 1920 ggaacgggaa ggaacgggaa ggcgactgga ggcgactgga gtgccatgtc gtgccatgtc cggttttcaa cggttttcaa caaaccatgc caaaccatgc aaatgctgaa aaatgctgaa 1980 1980 tgagggcatc tgagggcatc gttcccactg gttcccactg cgatgctggt cgatgctggt tgccaacgat tgccaacgat cagatggcgc cagatggcgc tgggcgcaat tgggcgcaat 2040 2040 gcgcgccatt gcgcgccatt accgagtccg accgagtccg ggctgcgcgt ggctgcgcgt tggtgcggat tggtgcggat atctcggtag atctcggtag tgggatacga tgggatacga 2100 2100 cgataccgaa cgataccgaa gacagctcat gacagctcat gttatatccc gttatatccc gccgtcaacc gccgtcaacc accatcaaac accatcaaac aggattttcg aggattttcg 2160 2160 cctgctgggg cctgctgggg caaaccagcg caaaccagcg tggaccgctt tggaccgctt gctgcaactc gctgcaactc tctcagggcc tctcagggcc aggcggtgaa aggcggtgaa 2220 2220 gggcaatcag gggcaatcag ctgttgcccg ctgttgcccg tctcactggt tctcactggt gaaaagaaaa gaaaagaaaa accaccctgg accaccctgg cgcccaatac cgcccaatac 2280 2280 gcaaaccgcc gcaaaccgcc tctccccgcg tctccccgcg cgttggccga cgttggccga ttcattaatg ttcattaatg cagctggcac cagctggcac gacaggtttc gacaggtttc 2340 2340 ccgactggaa ccgactggaa agcgggcagt agcgggcagt gagcgcaact gagcgcaact ttgcgatagg ttgcgatagg taaatttttc taaatttttc taaatacatt taaatacatt 2400 2400 caaatatgta caaatatgta tccgctcatg tccgctcatg agacaataac agacaataac cctgataaat cctgataaat gcttcaataa gcttcaataa tattgaaaaa tattgaaaaa 2460 2460 ggaagagtat ggaagagtat gagtattcaa gagtattcaa catttccgtg catttccgtg tcgcccttat tcgcccttat tccctttttt tccctttttt gcggcatttt gcggcatttt 2520 2520 gccttcctgt gccttcctgt ttttgctcac ttttgctcac ccagaaacgc ccagaaacgc tggtgaaagt tggtgaaagt aaaagatgct aaaagatgct gaagatcagt gaagatcagt 2580 2580 tgggtgcacg tgggtgcacg agtgggttac agtgggttac atcgaactgg atcgaactgg atctcaacag atctcaacag cggtaagatc cggtaagatc cttgagagtt cttgagagtt 2640 2640 ttcgccccga ttcgccccga agaacgtttt agaacgtttt ccaatgatga ccaatgatga gcacttttaa gcacttttaa agttctgcta agttctgcta tgtggcgcgg tgtggcgcgg 2700 2700 tattatcccg tattatcccg tattgacgcc tattgacgcc gggcaagagc gggcaagagc aactcggtcg aactcggtcg ccgcatacac ccgcatacac tattctcaga tattctcaga 2760 2760 atgacttggt atgacttggt tgagtactca tgagtactca ccagtcacag ccagtcacag aaaagcatct aaaagcatct tacggatggc tacggatggc atgacagtaa atgacagtaa 2820 2820 gagaattatg gagaattatg cagtgctgcc cagtgctgcc ataaccatga ataaccatga gtgataacac gtgataacac tgcggccaac tgcggccaac ttacttctga ttacttctga 2880 2880 caacgatcgg caacgatcgg aggaccgaag aggaccgaag gagctaaccg gagctaaccg cttttttgca cttttttgca caacatgggg caacatgggg gatcatgtaa gatcatgtaa 2940 2940 ctcgccttga ctcgccttga tcgttgggaa tcgttgggaa ccggagctga ccggagctga atgaagccat atgaagccat accaaacgac accaaacgac gagcgtgaca gagcgtgaca 3000 3000 ccacgatgcc ccacgatgcc tgtagcaatg tgtagcaatg gcaacaacgt gcaacaacgt tgcgcaaact tgcgcaaact attaactggc attaactggc gaactactta gaactactta 3060 3060 ctctagcttc ctctagcttc ccggcaacaa ccggcaacaa ttaatagact ttaatagact ggatggaggc ggatggaggc ggataaagtt ggataaagtt gcaggaccac gcaggaccac 3120 3120 ttctgcgctc ttctgcgctc ggcccttccg ggcccttccg gctggctggt gctggctggt ttattgctga ttattgctga taaatctgga taaatctgga gccggtgagc gccggtgagc 3180 3180 gtgggtctcg gtgggtctcg cggtatcatt cggtatcatt gcagcactgg gcagcactgg ggccagatgg ggccagatgg taagccctcc taagccctcc cgtategtag cgtategtag 3240 3240 ttatctacac ttatctacac gacggggagt gacggggagt caggcaacta caggcaacta tggatgaacg tggatgaacg aaatagacag aaatagacag atcgctgaga atcgctgaga 3300 3300 taggtgcctc taggtgcctc actgattaag actgattaag cattggtaac cattggtaac tgtc tgtc 3334 3334

<210> 25 <211> 4034 <212> DNA <213> artificial <220><210> 25 <211> 4034 <212> DNA <213> artificial <220>

<223> pBCMlMLG<223> pBCMlMLG

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.tXtSEQLTXT.tXt

<400> 25 <400> 25 ctggagatcc ctggagatcc tgataaaatc tgataaaatc atgaaaaatt atgaaaaatt tatttgcttt tatttgcttt gtgagcggat gtgagcggat aacaattata aacaattata 60 60 atatgtggaa atatgtggaa ttgtgagcgc ttgtgagcgc tcacaartcc tcacaartcc acataaggag acataaggag gtaaaaaaat gtaaaaaaat gtggaattgt gtggaattgt 120 120 gagcgctcac gagcgctcac aattccacat aattccacat aaggaggtaa aaggaggtaa aaaaatgata aaaaatgata catcarcatc catcarcatc atcatcatat atcatcatat ISO ISO gtcccctata gtcccctata ctaggttatt ctaggttatt ggaaaattaa ggaaaattaa gggccttgtg gggccttgtg caacccactc caacccactc gacttctttt gacttctttt 240 240 ggaatatctt ggaatatctt gaagaaaaat gaagaaaaat atgaagagca atgaagagca tttgtatgag tttgtatgag cgcgatgaag cgcgatgaag gtgataaatg gtgataaatg 300 300 gcgaaacaaa gcgaaacaaa aagtttgaat aagtttgaat tgggtttgga tgggtttgga gtttcccaat gtttcccaat cttccttatt cttccttatt atattgatgg atattgatgg 360 360 tgatgttaaa tgatgttaaa ttaacacagt ttaacacagt ctatggccat ctatggccat catacgttat catacgttat atagctgaca atagctgaca agcacaacat agcacaacat 420 420 gttgggtggt gttgggtggt tgtccaaaag tgtccaaaag agcgtgcaga agcgtgcaga gatttcaatg gatttcaatg cttgaaggag cttgaaggag cggttttgga cggttttgga 480 480 tattagatac tattagatac ggtgtttcga ggtgtttcga gaattgcata gaattgcata tagtaaagac tagtaaagac tttgaaactc tttgaaactc tcaaagttga tcaaagttga 540 540 ttttcttagc ttttcttagc aagctaccrg aagctaccrg aaatgctgaa aaatgctgaa aatgttcgaa aatgttcgaa gatcgtttat gatcgtttat gtcataaaac gtcataaaac 600 600 atatttaaat atatttaaat ggtgatcatg ggtgatcatg taacccatcc taacccatcc tgacttcatg tgacttcatg ttgtatgacg ttgtatgacg ctcttgatgt ctcttgatgt 660 660 tgttttatac tgttttatac atggacccaa atggacccaa tgtgcctgga tgtgcctgga tgcgttccca tgcgttccca aaattagttt aaattagttt gttttaaaaa gttttaaaaa 720 720 acgtattgaa acgtattgaa gctatcccac gctatcccac aaattgataa aaattgataa gtacttgaaa gtacttgaaa tccagcaagt tccagcaagt atatagcatg atatagcatg 780 780 gcctttgcag gcctttgcag ggctggcaag ggctggcaag ccacgtttgg ccacgtttgg tggtggcgac tggtggcgac catcctccaa catcctccaa aatcggatct aatcggatct 840 840 ggttccgcgt ggttccgcgt ggatccccag ggatccccag gaattcccgg gaattcccgg gtcgactcga gtcgactcga gcggccgcat gcggccgcat cgtgggaact cgtgggaact 900 900 gcagatgaat gcagatgaat tcgagctcgg tcgagctcgg atccaagatc atccaagatc ttctagacat ttctagacat atgatcgata atgatcgata agcttgatat agcttgatat 960 960 cggtaccacc cggtaccacc atggtcgacc atggtcgacc tcgagcccgg tcgagcccgg ggctagcata ggctagcata accccttggg accccttggg gcctctaaac gcctctaaac 1020 1020 gggtcttgag gggtcttgag gggttttttg gggttttttg gggaaatttc gggaaatttc cccgagggaa cccgagggaa atttccccga atttccccga ctcatgacca ctcatgacca 1080 1080 aaatccctta aaatccctta acgtgagtta acgtgagtta cgcgcgcgtc cgcgcgcgtc gttccactga gttccactga gcgtcagacc gcgtcagacc ccgtagaaaa ccgtagaaaa 1140 1140 gatcaaagga gatcaaagga tcttcttgag tcttcttgag atcctttttt atcctttttt tctgcgcgta tctgcgcgta atctgctgct atctgctgct tgcaaacaaa tgcaaacaaa 1200 1200 aaaaccaccg aaaaccaccg ctaccagcgg ctaccagcgg tggtttgttt tggtttgttt gccggatcaa gccggatcaa gagctaccaa gagctaccaa ctctttttcc ctctttttcc 1260 1260 gaaggtaact gaaggtaact ggcttcagca ggcttcagca gagcgcagat gagcgcagat accaaatact accaaatact gttcttctag gttcttctag tgtagccgta tgtagccgta 1320 1320 gttagcccac gttagcccac cacttcaaga cacttcaaga actctgtagc actctgtagc accgcctaca accgcctaca tacctcgctc tacctcgctc tgctaatcct tgctaatcct 1380 1380 gttaccagtg gttaccagtg gctgctgcca gctgctgcca gtggcgataa gtggcgataa gtcgtgtctt gtcgtgtctt accgggttgg accgggttgg actcaagacg actcaagacg 1440 1440 atagttaccg atagttaccg gataaggcgc gataaggcgc agcggtcggg agcggtcggg ctgaacgggg ctgaacgggg ggttcgtgca ggttcgtgca cacagcccag cacagcccag 1500 1500 cttggagcga cttggagcga acgacctaca acgacctaca ccgaactgag ccgaactgag atacctacag atacctacag cgtgagctat cgtgagctat gagaaagcgc gagaaagcgc 1560 1560 cacgcttccc cacgcttccc gaagggagaa gaagggagaa aggcggacag aggcggacag gtatccggta gtatccggta agcggcaggg agcggcaggg tcggaacagg tcggaacagg 1620 1620 agagcgcacg agagcgcacg agggagcttc agggagcttc cagggggaaa cagggggaaa cgcctggtat cgcctggtat ctttatagtc ctttatagtc ctgtcgggtt ctgtcgggtt 1680 1680 tcgccacctc tcgccacctc tgacttgagc tgacttgagc gtcgattttt gtcgattttt gtgatgctcg gtgatgctcg tcaggggggc tcaggggggc ggagcctatg ggagcctatg 1740 1740 gaaaaacgcc gaaaaacgcc agcaacgcgg agcaacgcgg cctttttacg cctttttacg gttcctggcc gttcctggcc ttttgctggc ttttgctggc cttttgctca cttttgctca 1800 1800 catgttcttt catgttcttt cctgcgttat cctgcgttat cccctgattc cccctgattc tgtggataac tgtggataac cgtattaccg cgtattaccg cctttgagtg cctttgagtg 1860 1860 agctgatacc agctgatacc gctctttgcg gctctttgcg ataggtaaag ataggtaaag gcgcgccatc gcgcgccatc gaatggcgca gaatggcgca aaacctttcg aaacctttcg 1920 1920 cggtatggca cggtatggca tgatagcgcc tgatagcgcc cggaagagag cggaagagag tcaattcagg tcaattcagg gtggtgaatg gtggtgaatg gtggtgaatg gtggtgaatg 1980 1980 tgaaaccagt tgaaaccagt aacgttatac aacgttatac gatgtcgcag gatgtcgcag agtatgccgg agtatgccgg tgtctcttat tgtctcttat cagaccgttt cagaccgttt 2040 2040

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

cccgcgtggt cccgcgtggt gaaccaggcc gaaccaggcc agccacgttt agccacgttt ctgcgaaaac ctgcgaaaac gcgggaaaaa gcgggaaaaa gtggaagcgg gtggaagcgg 2100 2100 cgatggcgga cgatggcgga gctgaattac gctgaattac attcccaacc attcccaacc gcgtggcaca gcgtggcaca acaactggcg acaactggcg ggcaaacagt ggcaaacagt 2160 2160 cgttgctgat cgttgctgat tggcgttgcc tggcgttgcc acctccagtc acctccagtc tggccctgca tggccctgca cgcgccgtcg cgcgccgtcg caaattgtcg caaattgtcg 2220 2220 cggcgattaa cggcgattaa atctcgcgcc atctcgcgcc gatcaactgg gatcaactgg gtgccagcgt gtgccagcgt ggtggtgtcg ggtggtgtcg atggtagaac atggtagaac 2280 2280 gaagcggcgt gaagcggcgt cgaagcctgt cgaagcctgt aaagcggcgg aaagcggcgg tgcacaatct tgcacaatct tctcgcgcaa tctcgcgcaa cgcgtcagtg cgcgtcagtg 2340 2340 ggctgatcat ggctgatcat taactatccg taactatccg ctggatgacc ctggatgacc aggatgccat aggatgccat tgctgtggaa tgctgtggaa gctgcctgca gctgcctgca 2400 2400 ctaatgttcc ctaatgttcc ggcgttattt ggcgttattt cttgatgtct cttgatgtct ctgaccagac ctgaccagac acccatcaac acccatcaac agtattattt agtattattt 2460 2460 tctcccatga tctcccatga agacggtacg agacggtacg cgactgggcg cgactgggcg tggagcatct tggagcatct ggtcgcattg ggtcgcattg ggtcaccagc ggtcaccagc 2520 2520 aaatcgcgct aaatcgcgct gttagcgggc gttagcgggc ccattaagtt ccattaagtt ctgtctcggc ctgtctcggc gcgtctgcgt gcgtctgcgt ctggctggct ctggctggct 2580 2580 ggcataaata ggcataaata tctcactcgc tctcactcgc aatcaaattc aatcaaattc agccgatagc agccgatagc ggaacgggaa ggaacgggaa ggcgactgga ggcgactgga 2640 2640 gtgccatgtc gtgccatgtc cggttttcaa cggttttcaa caaaccatgc caaaccatgc aaatgctgaa aaatgctgaa tgagggcatc tgagggcatc gttcccactg gttcccactg 2700 2700 cgatgctggt cgatgctggt tgccaacgat tgccaacgat cagatggcgc cagatggcgc tgggcgcaat tgggcgcaat gcgcgccatt gcgcgccatt accgagtccg accgagtccg 2760 2760 ggctgcgcgt ggctgcgcgt tggtgcggat tggtgcggat atctcggtag atctcggtag tgggatacga tgggatacga cgataccgaa cgataccgaa gacagctcat gacagctcat 2820 2820 gttatatccc gttatatccc gccgtcaacc gccgtcaacc accatcaaac accatcaaac aggattttcg aggattttcg cctgctgggg cctgctgggg caaaccagcg caaaccagcg 2880 2880 tggaccgctt tggaccgctt gctgcaactc gctgcaactc tctcagggcc tctcagggcc aggcggtgaa aggcggtgaa gggcaatcag gggcaatcag ctgttgcccg ctgttgcccg 2940 2940 tctcactggt tctcactggt gaaaagaaaa gaaaagaaaa accaccctgg accaccctgg cgcccaatac cgcccaatac gcaaaccgcc gcaaaccgcc tctccccgcg tctccccgcg 3000 3000 cgttggccga cgttggccga ttcattaatg ttcattaatg cagctggcac cagctggcac gacaggtttc gacaggtttc ccgactggaa ccgactggaa agcgggcagt agcgggcagt 3060 3060 gagcgcaact gagcgcaact trgcgatagg trgcgatagg taaatttttc taaatttttc taaatacatt taaatacatt caaatatgta caaatatgta tccgctcatg tccgctcatg 3120 3120 agacaataac agacaataac cctgataaat cctgataaat gcttcaataa gcttcaataa tattgaaaaa tattgaaaaa ggaagagtat ggaagagtat gagtattcaa gagtattcaa 3180 3180 catttccgtg catttccgtg tcgcccttat tcgcccttat tccctttttt tccctttttt gcggcatttt gcggcatttt gccttcctgt gccttcctgt ttttgctcac ttttgctcac 3240 3240 ccagaaacgc ccagaaacgc tggtgaaagt tggtgaaagt aaaagatgct aaaagatgct gaagatcagt gaagatcagt tgggtgcacg tgggtgcacg agtgggttac agtgggttac 3300 3300 atcgaactgg atcgaactgg atctcaacag atctcaacag cggtaagatc cggtaagatc cttgagagtt cttgagagtt ttcgccccga ttcgccccga agaacgtttt agaacgtttt 3360 3360 ccaatgatga ccaatgatga gcacttttaa gcacttttaa agttctgcta agttctgcta tgtggcgcgg tgtggcgcgg tattatcccg tattatcccg tattgacgcc tattgacgcc 3420 3420 gggcaagagc gggcaagagc aactcggtcg aactcggtcg ccgcatacac ccgcatacac tattctcaga tattctcaga atgacttggt atgacttggt tgagtactca tgagtactca 3480 3480 ccagtcacag ccagtcacag aaaagcatct aaaagcatct tacggatggc tacggatggc atgacagtaa atgacagtaa gagaattatg gagaattatg cagtgctgcc cagtgctgcc 3540 3540 ataaccatga ataaccatga gtgataacac gtgataacac tgcggccaac tgcggccaac ttacttctga ttacttctga caacgatcgg caacgatcgg aggaccgaag aggaccgaag 3600 3600 gagctaaccg gagctaaccg cttttttgca cttttttgca caacatgggg caacatgggg gatcatgtaa gatcatgtaa ctcgccttga ctcgccttga tcgttgggaa tcgttgggaa 3660 3660 ccggagctga ccggagctga atgaagccat atgaagccat accaaacgac accaaacgac gagcgtgaca gagcgtgaca ccacgatgcc ccacgatgcc tgtagcaatg tgtagcaatg 3720 3720 gcaacaacgt gcaacaacgt tgcgcaaact tgcgcaaact attaactggc attaactggc gaactactta gaactactta ctctagcttc ctctagcttc ccggcaacaa ccggcaacaa 3750 3750 ttaatagact ttaatagact ggatggaggc ggatggaggc ggataaagtt ggataaagtt gcaggaccac gcaggaccac ttctgcgctc ttctgcgctc ggcccttccg ggcccttccg 3840 3840 gctggctggt gctggctggt ttattgctga ttattgctga taaatctgga taaatctgga gccggtgagc gccggtgagc gtgggtctcg gtgggtctcg cggtatcatt cggtatcatt 3900 3900 gcagcactgg gcagcactgg ggccagatgg ggccagatgg taagccctcc taagccctcc cgtatcgtag cgtatcgtag ttatctacac ttatctacac gacggggagt gacggggagt 3960 3960 caggcaacta caggcaacta tggatgaacg tggatgaacg aaatagacag aaatagacag atcgctgaga atcgctgaga taggtgcctc taggtgcctc actgattaag actgattaag 4020 4020

cattggtaac tgtccattggtaac tgtc

40344034

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.tXt <210> 26 <211> 4007 <212> DNA <213> artificial <220>SEQLTXT.tXt <210> 26 <211> 4007 <212> DNA <213> artificial <220>

<223> pBCM2MLG <400> 26<223> pBCM2MLG <400> 26

ctggagatcc ctggagatcc tgatataata tgatataata cgactcacta cgactcacta taggggtgtg taggggtgtg gaattgtgag gaattgtgag cgctcacaat cgctcacaat 60 60 tccacataag tccacataag gaggtaaaaa gaggtaaaaa aatgtggaat aatgtggaat tgtgagcgct tgtgagcgct cacaattcca cacaattcca cataaggagg cataaggagg 120 120 taaaaaaatg taaaaaaatg atacatcatc atacatcatc atcatcatca atcatcatca tatgtcccct tatgtcccct atactaggtt atactaggtt attggaaaat attggaaaat 180 180 taagggcctt taagggcctt gtgcaaccca gtgcaaccca ctcgacttct ctcgacttct tttggaatat tttggaatat cttgaagaaa cttgaagaaa aatatgaaga aatatgaaga 240 240 gcatttgtat gcatttgtat gagcgcgatg gagcgcgatg aaggtgataa aaggtgataa atggcgaaac atggcgaaac aaaaagtttg aaaaagtttg aattgggttt aattgggttt 300 300 ggagtttccc ggagtttccc aatcttcctt aatcttcctt attatattga attatattga tggtgatgtt tggtgatgtt aaattaacac aaattaacac agtctatggc agtctatggc 360 360 catcatacgt catcatacgt tatatagctg tatatagctg acaagcacaa acaagcacaa catgttgggt catgttgggt ggttgtccaa ggttgtccaa aagagcgtgc aagagcgtgc 420 420 agagatttca agagatttca atgcttgaag atgcttgaag gagcggtttt gagcggtttt ggatattaga ggatattaga tacggtgttt tacggtgttt cgagaattgc cgagaattgc 480 480 atatagtaaa atatagtaaa gactttgaaa gactttgaaa ctctcaaagt ctctcaaagt tgattttctt tgattttctt agcaagctac agcaagctac ctgaaatgct ctgaaatgct 540 540 gaaaatgttc gaaaatgttc gaagatcgtt gaagatcgtt tatgtcataa tatgtcataa aacatattta aacatattta aatggtgatc aatggtgatc atgtaaccca atgtaaccca 600 600 tcctgacttc tcctgacttc atgttgtatg atgttgtatg acgctcttga acgctcttga tgttgtttta tgttgtttta tacatggacc tacatggacc caatgtgcct caatgtgcct 660 660 ggatgcgttc ggatgcgttc ccaaaattag ccaaaattag tttgttttaa tttgttttaa aaaacgtatt aaaacgtatt gaagctatcc gaagctatcc cacaaattga cacaaattga 720 720 taagtacttg taagtacttg aaatccagca aaatccagca agtatatagc agtatatagc atggcctttg atggcctttg cagggctggc cagggctggc aagccacgtt aagccacgtt 780 780 tggtggtggc tggtggtggc gaccatcctc gaccatcctc caaaatcgga caaaatcgga tctggttccg tctggttccg cgtggatccc cgtggatccc cz ci a ci L L cz part ci a ci L L part 840 840 cgggtcgact cgggtcgact cgagcggccg cgagcggccg catcgtggga catcgtggga actgcagatg actgcagatg aattcgagct aattcgagct cggatccaag cggatccaag 900 900 atcttctaga atcttctaga catatgatcg catatgatcg ataagcttga ataagcttga tatcggtacc tatcggtacc accatggtcg accatggtcg acctcgagcc acctcgagcc 960 960 cggggctagc cggggctagc ataacccctt ataacccctt ggggcctcta ggggccta aacgggtctt aacgggtctt gaggggtttt gaggggtttt ttggggaaat ttggggaaat 1020 1020 ttccccgagg ttccccgagg gaaatttccc gaaatttccc cgactcatga cgactcatga ccaaaatccc ccaaaatccc ttaacgtgag ttaacgtgag ttacgcgcgc ttacgcgcgc 1080 1080 gtcgttccac gtcgttccac tgagcgtcag tgagcgtcag accccgtaga accccgtaga aaagatcaaa aaagatcaaa ggatcttctt ggatcttctt gagatccttt gagatccttt 1140 1140 ttttctgcgc ttttctgcgc gtaatctgct gtaatctgct gcttgcaaac gcttgcaaac aaaaaaacca aaaaaaacca ccgctaccag ccgctaccag cggtggtttg cggtggtttg 1200 1200 tttgccggat tttgccggat caagagctac caagagctac caactctttt caactctttt tccgaaggta tccgaaggta actggcttca actggcttca gcagagcgca gcagagcgca 1260 1260 gataccaaat gataccaaat actgttcttc actgttcttc tagtgtagcc tagtgtagcc gtagttagcc gtagttagcc caccacttca caccacttca agaactctgt agaactctgt 1320 1320 agcaccgcct agcaccgcct acatacctcg acatacctcg ctctgctaat ctctgctaat cctgttacca cctgttacca gtggctgctg gtggctgctg ccagtggcga ccagtggcga 1380 1380 taagtcgtgt taagtcgtgt cttaccgggt cttaccgggt tggactcaag tggactcaag acgatagtta acgatagtta ccggataagg ccggataagg cgcagcggtc cgcagcggtc 1440 1440 gggctgaacg gggctgaacg gggggttcgt gggggttcgt gcacacagcc gcacacagcc cagcttggag cagcttggag cgaacgacct cgaacgacct acaccgaact acaccgaact 1500 1500 gagataccta gagataccta cagcgtgagc cagcgtgagc tatgagaaag tatgagaaag cgccacgctt cgccacgctt cccgaaggga cccgaaggga gaaaggcgga gaaaggcgga 1560 1560 caggtatccg caggtatccg gtaagcggca gtaagcggca gggtcggaac gggtcggaac aggagagcgc aggagagcgc acgagggagc acgagggagc ttccaggggg ttccaggggg 1620 1620 aaacgcctgg aaacgcctgg tatctttata tatctttata gtcctgtcgg gtcctgtcgg gtttcgccac gtttcgccac ctctgacttg ctctgacttg agcgtcgatt agcgtcgatt 1680 1680 tttgtgatgc tttgtgatgc tcgtcagggg tcgtcagggg ggcggagcct ggcggagcct atggaaaaac atggaaaaac gccagcaacg gccagcaacg cggccttttt cggccttttt 1740 1740

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

acggttcctg acggttcctg gccttttgct gccttttgct ggccttttgc ggccttttgc tcacatgttc tcacatgttc tttcctgcgt tttcctgcgt tatcccctga tatcccctga 1800 1800 ttctgtggat ttctgtggat aaccgtatta aaccgtatta ccgcctttga ccgcctttga gtgagctgat gtgagctgat accgctcttt accgctcttt gcgataggta gcgataggta 1860 1860 aaggcgcgcc aaggcgcgcc atcgaatggc atcgaatggc gcaaaacctt gcaaaacctt tcgcggtatg tcgcggtatg gcatgatagc gcatgatagc gcccggaaga gcccggaaga 1920 1920 gagtcaattc gagtcaattc agggtggtga agggtggtga atggtggtga atggtggtga atgtgaaacc atgtgaaacc agtaacgtta agtaacgtta tacgatgtcg tacgatgtcg 1980 1980 cagagtatgc cagagtatgc cggtgtctct cggtgtctct tatcagaccg tatcagaccg tttcccgcgt tttcccgcgt ggtgaaccag ggtgaaccag gccagccacg gccagccacg 2040 2040 tttctgcgaa tttctgcgaa aacgcgggaa aacgcgggaa aaagtggaag aaagtggaag cggcgatggc cggcgatggc ggagctgaat ggagctgaat tacattccca tacattccca 2100 2100 accgcgtggc accgcgtggc acaacaactg acaacaactg gcgggcaaac gcgggcaaac agtcgttgct agtcgttgct gattggcgtt gattggcgtt gccacctcca gccacctcca 2160 2160 gtctggccct gtctggccct gcacgcgccg gcacgcgccg tcgcaaattg tcgcaaattg tcgcggcgat tcgcggcgat taaatctcgc taaatctcgc gccgatcaac gccgatcaac 2220 2220 tgggtgccag tgggtgccag cgtggtggtg cgtggtggtg tcgatggtag tcgatggtag aacgaagcgg aacgaagcgg cgtcgaagcc cgtcgaagcc tgtaaagcgg tgtaaagcgg 2280 2280 cggtgcacaa cggtgcacaa tcttctcgcg tcttctcgcg caacgcgtca caacgcgtca gtgggctgat gtgggctgat cattaactat cattaactat ccgctggatg ccgctggatg 2340 2340 accaggatgc accaggatgc cattgctgtg cattgctgtg gaagctgcct gaagctgcct gcactaatgt gcactaatgt tccggcgtta tccggcgtta tttcttgatg tttcttgatg 2400 2400 tctctgacca tctctgacca gacacccatc gacacccatc aacagtatta aacagtatta ttttctccca ttttctccca tgaagacggt tgaagacggt acgcgactgg acgcgactgg 2460 2460 gcgtggagca gcgtggagca tctggtcgca tctggtcgca ttgggtcacc ttgggtcacc agcaaatcgc agcaaatcgc gctgttagcg gctgttagcg ggcccattaa ggcccattaa 2520 2520 gttctgtctc gttctgtctc ggcgcgtctg ggcgcgtctg cgtctggctg cgtctggctg gctggcataa gctggcataa atatctcact atatctcact cgcaatcaaa cgcaatcaaa 2580 2580 ttcagccgat ttcagccgat agcggaacgg agcggaacgg gaaggcgact gaaggcgact ggagtgccat ggagtgccat gtccggtttt gtccggtttt caacaaacca caacaaacca 2640 2640 tgcaaatgct tgcaaatgct gaatgagggc gaatgagggc atcgttccca atcgttccca ctgcgatgct ctgcgatgct ggttgccaac ggttgccaac gatcagatgg gatcagatgg 2700 2700 cgctgggcgc cgctgggcgc aatgcgcgcc aatgcgcgcc attaccgagt attaccgagt ccgggctgcg ccgggctgcg cgttggtgcg cgttggtgcg gatatctcgg gatatctcgg 2760 2760 tagtgggata tagtgggata cgacgatacc cgacgatacc gaagacagct gaagacagct catgttatat catgttatat cccgccgtca cccgccgtca accaccatca accaccatca 2820 2820 aacaggattt aacaggattt tcgcctgctg tcgcctgctg gggcaaacca gggcaaacca gcgtggaccg gcgtggaccg cttgctgcaa cttgctgcaa ctctctcagg ctctctcagg 2880 2880 gccaggcggt gccaggcggt gaagggcaat gaagggcaat cagctgttgc cagctgttgc ccgtctcact ccgtctcact ggtgaaaaga ggtgaaaaga aaaaccaccc aaaaccaccc 2940 2940 tggcgcccaa tggcgcccaa tacgcaaacc tacgcaaacc gcctctcccc gcctctcccc gcgcgttggc gcgcgttggc cgattcatta cgattcatta atgcagctgg atgcagctgg 3000 3000 cacgacaggt cacgacaggt ttcccgactg ttcccgactg gaaagcgggc gaaagcgggc agtgagcgca agtgagcgca actttgcgat actttgcgat aggtaaattt aggtaaattt 3060 3060 ttctaaatac ttctaaatac attcaaatat attcaaatat gtatccgctc gtatccgctc atgagacaat atgagacaat aaccctgata aaccctgata aatgcttcaa aatgcttcaa 3120 3120 taatattgaa taatattgaa aaaggaagag aaaggaagag tatgagtatt tatgagtatt caacatttcc caacatttcc gtgtcgccct gtgtcgccct tattcccttt tattcccttt 3180 3180 tttgcggcat tttgcggcat tttgccttcc tttgccttcc tgtttttgct tgtttttgct cacccagaaa cacccagaaa cgctggtgaa cgctggtgaa agtaaaagat agtaaaagat 3240 3240 gctgaagatc gctgaagatc agttgggtgc agttgggtgc acgagtgggt acgagtgggt tacatcgaac tacatcgaac tggatctcaa tggatctcaa cagcggtaag cagcggtaag 3300 3300 atccttgaga atccttgaga gttttcgccc gttttcgccc cgaagaacgt cgaagaacgt tttccaatga tttccaatga tgagcacttt tgagcacttt taaagttctg taaagttctg 3360 3360 ctatgtggcg ctatgtggcg cggtattatc cggtattatc ccgtattgac ccgtattgac gccgggcaag gccgggcaag agcaactcgg agcaactcgg tcgccgcata tcgccgcata 3420 3420 cactattctc cactattctc agaatgactt agaatgactt ggttgagtac ggttgagtac tcaccagtca tcaccagtca cagaaaagca cagaaaagca tcttacggat tcttacggat 3480 3480 ggcatgacag ggcatgacag taagagaatt taagagaatt atgcagtgct atgcagtgct gccataacca gccataacca tgagtgataa tgagtgataa cactgcggcc cactgcggcc 3540 3540 aacttacttc aacttacttc tgacaacgat tgacaacgat cggaggaccg cggaggaccg aaggagctaa aaggagctaa ccgctttttt ccgctttttt gcacaacatg gcacaacatg 3600 3600 ggggatcatg ggggatcatg taactcgcct taactcgcct tgatcgttgg tgatcgttgg gaaccggagc gaaccggagc tgaatgaagc tgaatgaagc cataccaaac cataccaaac 3660 3660 gacgagcgtg gacgagcgtg acaccacgat acaccacgat gcctgtagca gcctgtagca atggcaacaa atggcaacaa cgttgcgcaa cgttgcgcaa actattaact actattaact 3720 3720 ggcgaactac ggcgaactac ttactctagc ttactctagc ttcccggcaa ttcccggcaa caattaatag caattaatag actggatgga actggatgga ggcggataaa ggcggataaa 3780 3780

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct 3840 ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc 3900 tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga 3960 cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtc 4007 <210> 27 <211> 4030SEQLTXT.txt gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct 3840 ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc 3900 tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga 3960 cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtc 4007 <210> 27 <211> 4030

<212> DNA <213> artifi ciał <212> DNA <213> artificals <220> <223> pBCM3MLG <220> <223> pBCM3MLG <400> 27 ctggagatcc <400> 27 ctggagatcc tgataattct tgataattct gaaatgagct gaaatgagct gttgacaatt gttgacaatt aatcatccgg aatcatccgg ctcgtataat ctcgtataat 60 60 gtggaattgt gtggaattgt gagcgctcac gagcgctcac aattccacat aattccacat aaggaggtaa aaggaggtaa aaaaatgtgg aaaaatgtgg aattgtgagc aattgtgagc 120 120 gctcacaatt gctcacaatt ccacataagg ccacataagg aggtaaaaaa aggtaaaaaa atgatacatc atgatacatc atcatcatca atcatcatca tcatatgtcc tcatatgtcc 180 180 cctatactag cctatactag gttattggaa gttattggaa aattaagggc aattaagggc cttgtgcaac cttgtgcaac ccactcgact ccactcgact tcttttggaa tcttttggaa 240 240 tatcttgaag tatcttgaag aaaaatatga aaaaatatga agagcatttg agagcatttg tatgagcgcg tatgagcgcg atgaaggtga atgaaggtga taaatggcga taaatggcga 300 300 aacaaaaagt aacaaaaagt ttgaattggg ttgaattggg tttggagttt tttggagttt cccaatcttc cccaatcttc cttattatat cttattatat tgatggtgat tgatggtgat 360 360 gttaaattaa gttaaattaa cacagtctat cacagtctat ggccatcata ggccatcata cgttatatag cgttatatag ctgacaagca ctgacaagca caacatgttg caacatgttg 420 420 ggtggttgtc ggtggttgtc caaaagagcg caaaagagcg tgcagagatt tgcagagatt tcaatgcttg tcaatgcttg aaggagcggt aaggagcggt tttggatatt tttggatatt 480 480 agatacggtg agatacggtg tttcgagaat tttcgagaat tgcatatagt tgcatatagt aaagactttg aaagactttg aaactctcaa aaactctcaa agttgatttt agttgatttt 540 540 cttagcaagc cttagcaagc tacctgaaat tacctgaaat gctgaaaatg gctgaaaatg ttcgaagatc ttcgaagatc gtttatgtca gtttatgtca taaaacatat taaaacatat 600 600 ttaaatggtg ttaaatggtg atcatgtaac atcatgtaac ccatcctgac ccatcctgac ttcatgttgt ttcatgttgt atgacgctct atgacgctct tgatgttgtt tgatgttgtt 660 660 ttatacatgg ttatacatgg acccaatgtg acccaatgtg cctggatgcg cctggatgcg ttcccaaaat ttcccaaaat tagtttgttt tagtttgttt taaaaaacgt taaaaaacgt 720 720 attgaagcta attgaagcta tcccacaaat tcccacaaat tgataagtac tgataagtac ttgaaatcca ttgaaatcca gcaagtatat gcaagtatat agcatggcct agcatggcct 780 780 ttgcagggct ttgcagggct ggcaagccac ggcaagccac gtttggtggt gtttggtggt ggcgaccatc ggcgaccatc ctccaaaatc ctccaaaatc ggatctggtt ggatctggtt 840 840 ccgcgtggat ccgcgtggat ccccaggaat ccccaggaat tcccgggtcg tcccgggtcg actcgagcgg actcgagcgg ccgcatcgtg ccgcatcgtg ggaactgcag ggaactgcag 900 900 atgaattcga atgaattcga gctcggatcc gctcggatcc aagatcttct aagatcttct agacatatga agacatatga tcgataagct tcgataagct tgatatcggt tgatatcggt 960 960 accaccatgg accaccatgg tcgacctcga tcgacctcga gcccggggct gcccggggct agcataaccc agcataaccc cttggggcct cttggggcct ctaaacgggt ctaaacgggt 1020 1020 cttgaggggt cttgaggggt tttttgggga tttttgggga aatttccccg aatttccccg agggaaattt agggaaattt ccccgactca ccccgactca tgaccaaaat tgaccaaaat 1080 1080 cccttaacgt cccttaacgt gagttacgcg gagttacgcg cgcgtcgttc cgcgtcgttc cactgagcgt cactgagcgt cagaccccgt cagaccccgt agaaaagatc agaaaagatc 1140 1140 aaaggatctt aaaggatctt cttgagatcc cttgagatcc tttttttctg tttttttctg cgcgtaatct cgcgtaatct gctgcttgca gctgcttgca aacaaaaaaa aacaaaaaaa 1200 1200 ccaccgctac ccaccgctac cagcggtggt cagcggtggt ttgtttgccg ttgtttgccg gatcaagagc gatcaagagc taccaactct taccaactct ttttccgaag ttttccgaag 1260 1260 gtaactggct gtaactggct tcagcagagc tcagcagagc gcagatacca gcagatacca aatactgttc aatactgttc ttctagtgta ttctagtgta gccgtagtta gccgtagtta 1320 1320 gcccaccact gcccaccact tcaagaactc tcaagaactc tgtagcaccg tgtagcaccg cctacatacc cctacatacc tcgctctgct tcgctctgct aatcctgtta aatcctgtta 1380 1380 ccagtggctg ccagtggctg ctgccagtgg ctgccagtgg cgataagtcg cgataagtcg tgtcttaccg tgtcttaccg ggttggactc ggttggactc aagacgatag aagacgatag 1440 1440 ttaccggata ttaccggata aggcgcagcg aggcgcagcg gtcgggctga gtcgggctga acggggggtt acggggggtt cgtgcacaca cgtgcacaca gcccagcttg gcccagcttg 1500 1500

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

gagcgaacga gagcgaacga cctacaccga cctacaccga actgagatac actgagatac ctacagcgtg ctacagcgtg agctatgaga agctatgaga aagcgccacg aagcgccacg 1560 1560 cttcccgaag cttcccgaag ggagaaaggc ggagaaaggc ggacaggtat ggacaggtat ccggtaagcg ccggtaagcg gcagggtcgg gcagggtcgg aacaggagag aacaggagag 1620 1620 cgcacgaggg cgcacgaggg agcttccagg agcttccagg gggaaacgcc gggaaacgcc tggtatcttt tggtatcttt atagtcctgt atagtcctgt cgggtttcgc cgggtttcgc 1680 1680 cacctctgac cacctctgac ttgagcgtcg ttgagcgtcg atttttgtga atttttgtga tgctcgtcag tgctcgtcag gggggcggag gggggcggag cctatggaaa cctatggaaa 1740 1740 aacgccagca aacgccagca acgcggcctt acgcggcctt tttacggttc tttacggttc ctggcctttt ctggcctttt gctggccttt gctggccttt tgctcacatg tgctcacatg 1800 1800 ttctttcctg ttctttcctg cgttatcccc cgttatcccc tgattctgtg tgattctgtg gataaccgta gataaccgta ttaccgcctt ttaccgcctt tgagtgagct tgagtgagct 1860 1860 gataccgctc gataccgctc tttgcgatag tttgcgatag gtaaaggcgc gtaaaggcgc gccatcgaat gccatcgaat ggcgcaaaac ggcgcaaaac ctttcgcggt ctttcgcggt 1920 1920 atggcatgat atggcatgat agcgcccgga agcgcccgga agagagtcaa agagagtcaa ttcagggtgg ttcagggtgg tgaatggtgg tgaatggtgg tgaatgtgaa tgaatgtgaa 1980 1980 accagtaacg accagtaacg ttatacgatg ttatacgatg tcgcagagta tcgcagta tgccggtgtc tgccggtgtc tcttatcaga tcttatcaga ccgtttcccg ccgtttcccg 2040 2040 cgtggtgaac cgtggtgaac caggccagcc caggccagcc acgtttctgc acgtttctgc gaaaacgcgg gaaaacgcgg gaaaaagtgg gaaaaagtgg aagcggcgat aagcggcgat 2100 2100 ggcggagctg ggcggagctg aattacattc aattacattc ccaaccgcgt ccaaccgcgt ggcacaacaa ggcacaacaa ctggcgggca ctggcgggca aacagtcgtt aacagtcgtt 2160 2160 gctgattggc gctgattggc gttgccacct gttgccacct ccagtctggc ccagtctggc cctgcacgcg cctgcacgcg ccgtcgcaaa ccgtcgcaaa ttgtcgcggc ttgtcgcggc 2220 2220 gattaaatct gattaaatct cgcgccgatc cgcgccgatc aactgggtgc aactgggtgc cagcgtggtg cagcgtggtg gtgtcgatgg gtgtcgatgg tagaacgaag tagaacgaag 2280 2280 cggcgtcgaa cggcgtcgaa gcctgtaaag gcctgtaaag cggcggtgca cggcggtgca caatcttctc caatcttctc gcgcaacgcg gcgcaacgcg tcagtgggct tcagtgggct 2340 2340 gatcattaac gatcattaac tatccgctgg tatccgctgg atgaccagga atgaccagga tgccattgct tgccattgct gtggaagctg gtggaagctg cctgcactaa cctgcactaa 2400 2400 tgttccggcg tgttccggcg ttatttcttg ttatttcttg atgtctctga atgtctctga ccagacaccc ccagacaccc atcaacagta atcaacagta ttattttctc ttattttctc 2460 2460 ccatgaagac ccatgaagac ggtacgcgac ggtacgcgac tgggcgtgga tgggcgtgga gcatctggtc gcatctggtc gcattgggtc gcattgggtc accagcaaat accagcaaat 2520 2520 cgcgctgtta cgcgctgtta gcgggcccat gcgggcccat taagttctgt taagttctgt ctcggcgcgt ctcggcgcgt ctgcgtctgg ctgcgtctgg ctggctggca ctggctggca 2580 2580 taaatatctc taaatatctc actcgcaatc actcgcaatc aaattcagcc aaattcagcc gatagcggaa gatagcggaa cgggaaggcg cgggaaggcg actggagtgc actggagtgc 2640 2640 catgtccggt catgtccggt tttcaacaaa tttcaacaaa ccatgcaaat ccatgcaaat gctgaatgag gctgaatgag ggcatcgttc ggcatcgttc ccactgcgat ccactgcgat 2700 2700 gctggttgcc gctggttgcc aacgatcaga aacgatcaga tggcgctggg tggcgctggg cgcaatgcgc cgcaatgcgc gccattaccg gccattaccg agtccgggct agtccgggct 2760 2760 gcgcgttggt gcgcgttggt gcggatatct gcggatatct cggtagtggg cggtagtggg atacgacgat atacgacgat accgaagaca accgaagaca gctcatgtta gctcatgtta 2820 2820 tatcccgccg tatcccgccg tcaaccacca tcaaccacca tcaaacagga tcaaacagga ttttcgcctg ttttcgcctg ctggggcaaa ctggggcaaa ccagcgtgga ccagcgtgga 2880 2880 ccgcttgctg ccgcttgctg caactctctc caactctctc agggccaggc agggccaggc ggtgaagggc ggtgaagggc aatcagctgt aatcagctgt tgcccgtctc tgcccgtctc 2940 2940 actggtgaaa actggtgaaa agaaaaacca agaaaaacca ccctggcgcc ccctggcgcc caatacgcaa caatacgcaa accgcctctc accgcctctc cccgcgcgtt cccgcgcgtt 3000 3000 ggccgattca ggccgattca ttaatgcagc ttaatgcagc tggcacgaca tggcacgaca ggtttcccga ggtttcccga ctggaaagcg ctggaaagcg ggcagtgagc ggcagtgagc 3060 3060 gcaactttgc gcaactttgc gataggtaaa gataggtaaa tttttctaaa tttttctaaa tacattcaaa tacattcaaa tatgtatccg tatgtatccg ctcatgagac ctcatgagac 3120 3120 aataaccctg aataaccctg ataaatgctt ataaatgctt caataatatt caataatatt gaaaaaggaa gaaaaaggaa gagtatgagt gagtatgagt attcaacatt attcaacatt 3180 3180 tccgtgtcgc tccgtgtcgc ccttattccc ccttattccc ttttttgcgg ttttttgcgg cattttgcct cattttgcct tcctgttttt tcctgttttt gctcacccag gctcacccag 3240 3240 aaacgctggt aaacgctggt gaaagtaaaa gaaagtaaaa gatgctgaag gatgctgaag atcagttggg atcagttggg tgcacgagtg tgcacgagtg ggttacatcg ggttacatcg 3300 3300 aactggatct aactggatct caacagcggt caacagcggt aagatccttg aagatccttg agagttttcg agagttttcg ccccgaagaa ccccgaagaa cgttttccaa cgttttccaa 3360 3360 tgatgagcac tgatgagcac ttttaaagtt ttttaaagtt ctgctatgtg ctgctatgtg gcgcggtatt gcgcggtatt atcccgtatt atcccgtatt gacgccgggc gacgccgggc 3420 3420 aagagcaact aagagcaact cggtcgccgc cggtcgccgc atacactatt atacactatt ctcagaatga ctcagaatga cttggttgag cttggttgag tactcaccag tactcaccag 3480 3480 tcacagaaaa tcacagaaaa gcatcttacg gcatcttacg gatggcatga gatggcatga cagtaagaga cagtaagaga attatgcagt attatgcagt gctgccataa gctgccataa 3540 3540

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc 3600 taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg 3660 agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa 3720 caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg caacaattaa 3780 tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg 3840 gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag 3900 cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg 3960 caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt 4020 ggtaactgtc 4030 <210> 28 <211> 3835 <212> DNA <213> artificial <22O>SEQLTXT.txt ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc 3600 taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg 3660 agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa 3720 caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg caacaattaa 3780 tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg 3840 gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag 3900 cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg 3960 caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt 4020 ggtaactgtc 4030 <210> 28 <211> 3835 <212> DNA <213> artificial <22O>

<223> pBCM4MLG <400> 28 ctggagatcc tgataaaatc atgaaaaatt tatttgcttt gtgagcggat aacaattata 60 atatgtggaa ttgtgagcgc tcacaattcc acataaggag gtaaaaaaat gtggaattgt 120 gagcgctcac aattccacat aaggaggtaa aaaaatgata catcatcatc atcatcatat 180 gtcccctata ctaggttatt ggaaaattaa gggccttgtg caacccactc gacttctttt 240 ggaatatctt gaagaaaaat atgaagagca tttgtatgag cgcgatgaag gtgataaatg 300 gcgaaacaaa aagtttgaat tgggtttgga gtttcccaat cttccttatt atattgatgg 360 tgatgttaaa ttaacacagt ctatggccat catacgttat atagctgaca agcacaacat 420 gttgggtggt tgtccaaaag agcgtgcaga gatttcaatg cttgaaggag cggttttgga 480 tattagatac ggtgtttcga gaattgcata tagtaaagac tttgaaactc tcaaagttga 540 ttttcttagc aagctacctg aaatgctgaa aatgttcgaa gatcgtttat gtcataaaac 600 atatttaaat ggtgatcatg taacccatcc tgacttcatg ttgtatgacg ctcttgatgt 660 tgttttatac atggacccaa tgtgcctgga tgcgttccca aaattagttt gttttaaaaa 720 acgtattgaa gctatcccac aaattgataa gtacttgaaa tccagcaagt atatagcatg 780 gcctttgcag ggctggcaag ccacgtttgg tggtggcgac catcctccaa aatcggatct 840 ggttccgcgt ggatccccag gaattcccgg gtcgactcga gcggccgcat cgtgggaact 900 gcagatgaat tcgagctcgg atccaagatc ttctagacat atgatcgata agcttgatat 960 cggtaccacc atggtcgacc tcgagcccgg ggctagcata accccttggg gcctctaaac 1020 gggtcttgag gggttttttg gggaaatttc cccgaagatc aaaggatctt cttgagatcc 1080 tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 1140 ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 1200<223> pBCM4MLG <400> 28 ctggagatcc tgataaaatc atgaaaaatt tatttgcttt gtgagcggat aacaattata 60 atatgtggaa ttgtgagcgc tcacaattcc acataaggag gtaaaaaaat gtggaattgt 120 gagcgctcac aattccacat aaggaggtaa aaaaatgata catcatcatc atcatcatat 180 gtcccctata ctaggttatt ggaaaattaa gggccttgtg caacccactc gacttctttt 240 ggaatatctt gaagaaaaat atgaagagca tttgtatgag cgcgatgaag gtgataaatg 300 gcgaaacaaa aagtttgaat tgggtttgga gtttcccaat cttccttatt atattgatgg 360 tgatgttaaa ttaacacagt ctatggccat catacgttat atagctgaca agcacaacat 420 gttgggtggt tgtccaaaag agcgtgcaga gatttcaatg cttgaaggag cggttttgga 480 tattagatac ggtgtttcga gaattgcata tagtaaagac tttgaaactc tcaaagttga 540 ttttcttagc aagctacctg aaatgctgaa aatgttcgaa gatcgtttat gtcataaaac 600 atatttaaat ggtgatcatg taacccatcc tgacttcatg ttgtatgacg ctcttgatgt 660 tgttttatac atggacccaa tgtgcctgga tgcgttccca aaattagttt gttttaaaaa 720 acgtattgaa gctatcccac aaattgataa gtacttgaaa tccagcaagt atatagcatg 780 gcctttgcag ggctggcaag ccacgtttgg tggtggcgac catcctccaa aatcggatct 8 40 ggttccgcgt ggatccccag gaattcccgg gtcgactcga gcggccgcat cgtgggaact 900 gcagatgaat tcgagctcgg atccaagatc ttctagacat atgatcgata agcttgatat 960 cggtaccacc atggtcgacc tcgagcccgg ggctagcata accccttggg gcctctaaac 1020 gggtcttgag gggttttttg gggaaatttc cccgaagatc aaaggatctt cttgagatcc 1080 tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 1140 ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 1200

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

gcagatacca aatactgtcc ttctagtgta gccgtagtta gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact ggccaccact tcaagaactc tcaagaactc 1260 1260 tgtagcaccg tgtagcaccg cctacatacc cctacatacc tcgctctgct tcgctctgct aatcctgtta aatcctgtta ccagtggctg ccagtggctg ctgccagtgg ctgccagtgg 1320 1320 cgataagtcg cgataagtcg tgtcttaccg tgtcttaccg ggttgaactc ggttgaactc aagacgatag aagacgatag ttaccggata ttaccggata aggcgcagcg aggcgcagcg 1380 1380 gtcgggctga gtcgggctga acggggggtt acggggggtt cgtgcacaca cgtgcacaca gcccagcttg gcccagcttg gagcgaacga gagcgaacga cctacaccga cctacaccga 1440 1440 actgagatac actgagatac ctacagcgtg ctacagcgtg agctatgaga agctatgaga aagcgccacg aagcgccacg cttcccgaag cttcccgaag ggagaaaggc ggagaaaggc 1500 1500 ggacaggtat ggacaggtat ccggtaagcg ccggtaagcg gcagggtcgg gcagggtcgg aacaggagag aacaggagag cgcacgaggg cgcacgaggg agcttccagg agcttccagg 1560 1560 gggaaacgcc gggaaacgcc tggtatcttt tggtatcttt atagtcctgt atagtcctgt cgggtttcgc cgggtttcgc cacctctgac cacctctgac ttgagcgtcg ttgagcgtcg 1620 1620 atttttgtga atttttgtga tgctcgtcag tgctcgtcag gggggcggag gggggcggag cctatggaaa cctatggaaa aacgccagca aacgccagca acgcgtttgc acgcgtttgc 1680 1680 gataggtaaa gataggtaaa ggcgcgccat ggcgcgccat cgaatggcgc cgaatggcgc aaaacctttc aaaacctttc gcggtatggc gcggtatggc atgatagcgc atgatagcgc 1740 1740 ccggaagaga ccggaagaga gtcaattcag gtcaattcag ggtggtgaat ggtggtgaat ggtggtgaat ggtggtgaat gtgaaaccag gtgaaaccag taacgttata taacgttata 1800 1800 cgatgtcgca cgatgtcgca gagtatgccg gagtatgccg gtgtctctta gtgtctctta tcagaccgtt tcagaccgtt tcccgcgtgg tcccgcgtgg tgaaccaggc tgaaccaggc 1860 1860 cagccacgtt cagccacgtt trtgcgaaaa trtgcgaaaa cgcgggaaaa cgcgggaaaa agtggaagcg agtggaagcg gcgatggcgg gcgatggcgg agctgaatta agctgaatta 1920 1920 cattcccaac cattcccaac cgcgtggcac cgcgtggcac aacaactggc aacaactggc gggcaaacag gggcaaacag tcgttgctga tcgttgctga ttggcgttgc ttggcgttgc 1980 1980 cacctccagt cacctccagt ctggccctgc ctggccctgc acgcgccgtc acgcgccgtc gcaaattgtc gcaaattgtc gcggcgatta gcggcgatta aatctcgcgc aatctcgcgc 2040 2040 cgatcaactg cgatcaactg ggtgccagcg ggtgccagcg tggtggtgtc tggtggtgtc gatggtagaa gatggtagaa cgaagcggcg cgaagcggcg tcgaagcctg tcgaagcctg 2100 2100 taaagcggcg taaagcggcg gtgcacaatc gtgcacaatc ttctcgcgca ttctcgcgca acgcgtcagt acgcgtcagt gggctgatca gggctgatca ttaactatcc ttaactatcc 2160 2160 gctggatgac gctggatgac caggatgcca caggatgcca ttgctgtgga ttgctgtgga agctgcctgc agctgcctgc actaatgttc actaatgttc cggcgttatt cggcgttatt 2220 2220 tcttgatgtc tcttgatgtc tctgaccaga tctgaccaga cacccatcaa cacccatcaa cagtattatt cagtattatt ttctcccatg ttctcccatg aagacggtac aagacggtac 2280 2280 gcgactgggc gcgactgggc gtggagcatc gtggagcatc tggtcgcatt tggtcgcatt gggtcaccag gggtcaccag caaatcgcgc caaatcgcgc tgttagcggg tgttagcggg 2340 2340 cccattaagt cccattaagt tctgtctcgg tctgtctcgg cgcgtctgcg cgcgtctgcg tctggctggc tctggctggc tggcataaat tggcataaat atctcactcg atctcactcg 2400 2400 caatcaaatt caatcaaatt cagccgatag cagccgatag cggaacggga cggaacggga aggcgactgg aggcgactgg agtgccatgt agtgccatgt ccggttttca ccggttttca 2460 2460 acaaaccatg acaaaccatg caaatgctga caaatgctga atgagggcat atgagggcat cgttcccact cgttcccact gcgatgctgg gcgatgctgg ttgccaacga ttgccaacga 2520 2520 tcagatggcg tcagatggcg ctgggcgcaa ctgggcgcaa tgcgcgccat tgcgcgccat taccgagtcc taccgagtcc gggctgcgcg gggctgcgcg ttggtgcgga ttggtgcgga 2580 2580 tatctcggta tatctcggta gtgggatacg gtgggatacg acgataccga acgataccga agacagctca agacagctca tgttatatcc tgttatatcc cgccgtcaac cgccgtcaac 2640 2640 caccatcaaa caccatcaaa caggattttc caggattttc gcctgctggg gcctgctggg gcaaaccagc gcaaaccagc gtggaccgct gtggaccgct tgctgcaact tgctgcaact 2700 2700 ctctcagggc ctctcagggc caggcggtga caggcggtga agggcaatca agggcaatca gctgttgccc gctgttgccc gtctcaetgg gtctcaetgg tgaaaagaaa tgaaaagaaa 2760 2760 aaccaccctg aaccaccctg gcgcccaata gcgcccaata cgcaaaccgc cgcaaaccgc ctctccccgc ctctccccgc gcgttggccg gcgttggccg attcattaat attcattaat 2820 2820 gcagctggca gcagctggca cgacaggttt cgacaggttt cccgactgga cccgactgga aagcgggcag aagcgggcag tgagcgcaac tgagcgcaac tttgcgatag tttgcgatag 2880 2880 gtaaattttt gtaaattttt ctaaatacat ctaaatacat tcaaatatgt tcaaatatgt atccgctcat atccgctcat gagacaataa gagacaataa ccctgataaa ccctgataaa 2940 2940 tgcttcaata tgcttcaata atattgaaaa atattgaaaa aggaagagta aggaagagta tgagtattca tgagtattca acatttccgt acatttccgt gtcgccctta gtcgccctta 3000 3000 ttcccttttt ttcccttttt tgcggcattt tgcggcattt tgccttcctg tgccttcctg tttttgctca tttttgctca cccagaaacg cccagaaacg ctggtgaaag ctggtgaaag 3060 3060 taaaagatgc taaaagatgc tgaagatcag tgaagatcag ttgggtgcac ttgggtgcac gagtgggtta gagtgggtta catcgaactg catcgaactg gatctcaaca gatctcaaca 3120 3120 gcggtaagat gcggtaagat ccttgagagt ccttgagagt tttcgccccg tttcgccccg aagaacgttt aagaacgttt tccaatgatg tccaatgatg agcactttta agcactttta 3180 3180 aagttctgct aagttctgct atgtggcgcg atgtggcgcg gtattatccc gtattatccc gtattgacgc gtattgacgc cgggcaagag cgggcaagag caactcggtc caactcggtc 3240 3240

PL 228 024 Β1PL 228 024 Β1

5EQLTXT.txt5EQLTXT.txt

gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc 3300 3300 ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca 3360 3360 ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc 3420 3420 acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca 3480 3480 taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac 3540 3540 tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg 3600 3600 cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg 3660 3660 ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg 3720 3720 gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac 3780 3780 gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtc gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtc 3835 3835

<210> 29 <211> 3808 <212> DNA <213> artificial <220><210> 29 <211> 3808 <212> DNA <213> artificial <220>

<223> PBCM5MLG <400> 29<223> PBCM5MLG <400> 29

ctggagatcc ctggagatcc tgatataata cgactcacta taggggtgtg gaattgtgag cgctcacaat tgatataata cgactcacta taggggtgtg gaattgtgag cgctcacaat 60 60 tecacataag tecacataag gaggtaaaaa aatgtggaat tgtgagcgct cacaattcca cataaggagg gaggtaaaaa aatgtggaat tgtgagcgct cacaattcca cataaggagg 120 120 taaaaaaatg taaaaaaatg atacatcatc atcatcatca tatgtcccct atactaggtt attggaaaat atacatcatc atcatcatca tatgtcccct atactaggtt attggaaaat 180 180 taagggcctt taagggcctt gtgcaaccca ctcgacttct tttggaatat cttgaagaaa aatatgaaga gtgcaaccca ctcgacttct tttggaatat cttgaagaaa aatatgaaga 240 240 gcatttgtat gcatttgtat gagcgcgatg aaggtgataa atggcgaaac aaaaagtttg aattgggttt gagcgcgatg aaggtgataa atggcgaaac aaaaagtttg aattgggttt 300 300 ggagtttccc ggagtttccc aatcttcctt attatattga tggtgatgtt aaattaacac agtctatggc aatcttcctt attatattga tggtgatgtt aaattaacac agtctatggc 360 360 catcatacgt catcatacgt tatatagctg acaagcacaa catgttgggt ggttgtccaa aagagcgtgc tatatagctg acaagcacaa catgttgggt ggttgtccaa aagagcgtgc 420 420 agagatttca agagatttca atgcttgaag gagcggtttt ggatattaga tacggtgttt cgagaattgc atgcttgaag gagcggtttt ggatattaga tacggtgttt cgagaattgc 480 480 atatagtaaa atatagtaaa gactttgaaa ctctcaaagt tgattttctt agcaagctac ctgaaatgct gactttgaaa ctctcaaagt tgattttctt agcaagctac ctgaaatgct 540 540 gaaaatgttc gaaaatgttc gaagatcgtt tatgtcataa aacatattta aatggtgatc atgtaaccca gaagatcgtt tatgtcataa aacatattta aatggtgatc atgtaaccca 600 600 tcctgacttc tcctgacttc atgttgtatg acgctcttga tgttgtttta tacatggacc caatgtgcct atgttgtatg acgctcttga tgttgtttta tacatggacc caatgtgcct 660 660 ggatgcgttc ggatgcgttc ccaaaattag tttgttttaa aaaacgtatt gaagctatcc cacaaattga ccaaaattag tttgttttaa aaaacgtatt gaagctatcc cacaaattga 720 720 taagtacttg taagtacttg aaatccagca agtatatagc atggcctttg cagggctggc aagccacgtt aaatccagca agtatatagc atggcctttg cagggctggc aagccacgtt 780 780 tggtggtggc tggtggtggc gaccatcctc caaaatcgga tctggttccg cgtggatccc caggaattcc gaccatcctc caaaatcgga tctggttccg cgtggatccc caggaattcc 840 840 cgggtcgact cgggtcgact cgagcggccg catcgtggga actgcagatg aattcgagct cggatccaag cgagcggccg catcgtggga actgcagatg aattcgagct cggatccaag 900 900 atcttctaga atcttctaga catatgatcg ataagcttga tatcggtacc accatggtcg acctcgagcc catatgatcg ataagcttga tatcggtacc accatggtcg acctcgagcc 960 960 cggggctagc cggggctagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttggggaaat ataacccctt ggggcctcta aacgggtctt gaggggtttt ttggggaaat 1020 1020 ttccccgaag ttccccgaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 1080 1080 gcaaacaaaa gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 1140 1140

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

tctttttccg tctttttccg aaggtaactg aaggtaactg gcttcagcag gcttcagcag agcgcagata agcgcagata ccaaatactg ccaaatactg tccttctagt tccttctagt 1200 1200 gtagccgtag gtagccgtag ttaggccacc ttaggccacc acttcaagaa acttcaagaa ctctgtagca ctctgtagca ccgcctacat ccgcctacat acctcgctct acctcgctct 1260 1260 gctaatcctg gctaatcctg ttaccagtgg ttaccagtgg ctgctgccag ctgctgccag tggcgataag tggcgataag tcgtgtctta tcgtgtctta ccgggttgga ccgggttgga 1320 1320 ctcaagacga ctcaagacga tagttacegg tagttacegg ataaggcgca ataaggcgca gcggtcgggc gcggtcgggc tgaacggggg tgaacggggg gttcgtgcac gttcgtgcac 1380 1380 acagcccagc acagcccagc ttggagcgaa ttggagcgaa cgacctacac cgacctacac cgaactgaga cgaactgaga tacctacagc tacctacagc gtgagctatg gtgagctatg 1440 1440 agaaagcgcc agaaagcgcc acgcttcccg acgcttcccg aagggagaaa aagggagaaa ggcggacagg ggcggacagg tatccggtaa tatccggtaa gcggcagggt gcggcagggt 1500 1500 cggaacagga cggaacagga gagcgcacga gagcgcacga gggagcttcc gggagcttcc agggggaaac agggggaaac gcctggtatc gcctggtatc tttatagtcc tttatagtcc 1560 1560 tgtcgggttt tgtcgggttt cgccacctct cgccacctct gacttgagcg gacttgagcg tcgatttttg tcgatttttg tgatgctcgt tgatgctcgt caggggggcg caggggggcg 1620 1620 gagcctatgg gagcctatgg aaaaacgcca aaaaacgcca gcaacgcgtt gcaacgcgtt tgcgataggt tgcgataggt aaaggcgcgc aaaggcgcgc catcgaatgg catcgaatgg 1680 1680 cgeaaaacct cgeaaaacct ttcgcggtat ttcgcggtat ggeatgatag ggeatgatag cgcccggaag cgcccggaag agagtcaatt agagtcaatt cagggtggtg cagggtggtg 1740 1740 aatggtggtg aatggtggtg aatgtgaaac aatgtgaaac cagtaacgtt cagtaacgtt ataegatgtc ataegatgtc gcagagtatg gcagagtatg ccggtgtctc ccggtgtctc 1800 1800 ttatcagacc ttatcagacc gtttcccgcg gtttcccgcg tggtgaacca tggtgaacca ggccagccac ggccagccac gtttctgcga gtttctgcga aaacgcggga aaacgcggga 1860 1860 aaaagtggaa aaaagtggaa gcggcgatgg gcggcgatgg cggagctgaa cggagctgaa ttacattccc ttacattccc aaccgcgtgg aaccgcgtgg cacaacaact cacaacact 1920 1920 ggcgggcaaa ggcgggcaaa cagtcgttgc cagtcgttgc tgattggcgt tgattggcgt tgccacctcc tgccacctcc agtctggccc agtctggccc tgcacgcgcc tgcacgcgcc 1980 1980 gtcgcaaatt gtcgcaaatt gtegeggega gtegeggega ttaaatctcg ttaaatctcg cgccgatcaa cgccgatcaa ctgggtgcca ctgggtgcca gcgtggtggt gcgtggtggt 2040 2040 gtcgatggta gtcgatggta gaacgaagcg gaacgaagcg gcgtcgaagc gcgtcgaagc ctgtaaagcg ctgtaaagcg gcggtgcaca gcggtgcaca atcttctcgc atcttctcgc 2100 2100 gcaacgcgtc gcaacgcgtc agtgggctga agtgggctga tcattaacta tcattaacta tccgctggat tccgctggat gaccaggatg gaccaggatg ccattgctgt ccattgctgt 2160 2160 ggaagctgcc ggaagctgcc tgcactaatg tgcactaatg ttccggcgtt ttccggcgtt atttettgat atttettgat gtctctgacc gtctctgacc agacacccat agacacccat 2220 2220 caacagtatt caacagtatt attttctccc attttctccc atgaagacgg atgaagacgg tacgcgactg tacgcgactg ggcgtggagc ggcgtggagc atctggtcgc atctggtcgc 2280 2280 attgggtcac attgggtcac cagcaaatcg cagcaaatcg cgctgttagc cgctgttagc gggcccatta gggcccatta agttctgtct agttctgtct cggcgcgtct cggcgcgtct 2340 2340 gcgtctggct gcgtctggct ggctggcata ggctggcata aatatctcac aatatctcac tcgcaatcaa tcgcaatcaa atteageega atteageega tagcggaacg tagcggaacg 2400 2400 ggaaggcgac ggaaggcgac tggagtgcca tggagtgcca tgtccggttt tgtccggttt tcaacaaacc tcaacaaacc atgcaaatgc atgcaaatgc tgaatgaggg tgaatgaggg 2460 2460 catcgttccc catcgttccc actgcgatgc actgcgatgc tggttgccaa tggttgccaa egateagatg egateagatg gcgctgggcg gcgctgggcg caatgcgcgc caatgcgcgc 2520 2520 cattaccgag cattaccgag tccgggctgc tccgggctgc gcgttggtgc gcgttggtgc ggatateteg ggatateteg gtagtgggat gtagtgggat acgacgatac acgacgatac 2580 2580 cgaagacagc cgaagacagc teatgttata teatgttata tcccgccgtc tcccgccgtc aaccaccatc aaccaccatc aaacaggatt aaacaggatt ttcgcctgct ttcgcctgct 2640 2640 ggggcaaacc ggggcaaacc agcgtggacc agcgtggacc gettgetgea gettgetge actctctcag actctctcag ggccaggcgg ggccaggcgg tgaagggcaa tgaagggcaa 2700 2700 tcagctgttg tcagctgttg cccgtctcac cccgtctcac tggtgaaaag tggtgaaaag aaaaaccacc aaaaaccacc ctggcgccca ctggcgccca atacgcaaac atacgcaaac 2760 2760 cgcctctccc cgcctctccc cgcgcgttgg cgcgcgttgg ccgattcatt ccgattcatt aatgcagctg aatgcagctg gcacgacagg gcacgacagg tttcccgact tttcccgact 2820 2820 ggaaagcggg ggaaagcggg cagtgagcgc cagtgagcgc aactttgcga aactttgcga taggtaaatt taggtaaatt tttctaaata tttctaaata cattcaaata cattcaaata 2880 2880 tgtatccgct tgtatccgct catgagacaa catgagacaa taaccctgat taaccctgat aaatgcttca aaatgcttca ataatattga ataatattga aaaaggaaga aaaaggaaga 2940 2940 gtatgagtat gtatgagtat tcaacatttc tcaacatttc cgtgtcgccc cgtgtcgccc ttattccctt ttattccctt ttttgcggca ttttgcggca ttttgccttc ttttgccttc 3000 3000 ctgtttttgc ctgtttttgc tcacccagaa tcacccagaa acgctggtga acgctggtga aagtaaaaga aagtaaaaga tgctgaagat tgctgaagat cagttgggtg cagttgggtg 3060 3060 cacgagtggg cacgagtggg ttacatcgaa ttacatcgaa ctggatctca ctggatctca acagcggtaa acagcggtaa gatccttgag gatccttgag agttttcgcc agttttcgcc 3120 3120 ccgaagaacg ccgaagaacg ttttccaatg ttttccaatg atgagcactt atgagcactt ttaaagttct ttaaagttct gctatgtggc gctatgtggc gcggtattat gcggtattat 3180 3180

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txt cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 3240 tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 3300 tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 3360 tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 3420 ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 3480 tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 3540 cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 3600 gctcggccct tccggctggc tggtttattg ctgataaate tggagccggt gagcgtgggt 3660 ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct 3720 acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg 3780 cctcactgat taagcattgg taactgtc 3808 <210> 30 <211> 3831 <212> DNA <213> arfificial <220>SEQLTXT.txt cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 3240 tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 3300 tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 3360 tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 3420 ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 3480 tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 3540 cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 3600 gctcggccct tccggctggc tggtttattg ctgataaate tggagccggt gagcgtgggt 3660 ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct 3720 acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg 3780 cctcactgat taagcattgg taactgtc 3808 <210> 30 <211> 3831 <212> DNA <213> arfificial <220>

<223> pBCM6MLG <400> 30<223> pBCM6MLG <400> 30

ctggagatcc ctggagatcc tgataattct tgataattct gaaatgagct gaaatgagct gttgacaatt gttgacaatt aatcatccgg aatcatccgg ctcgtataat ctcgtataat 60 60 gtggaattgt gtggaattgt gagcgctcac gagcgctcac aattccacat aattccacat aaggaggtaa aaggaggtaa aaaaatgtgg aaaaatgtgg aattgtgagc aattgtgagc 120 120 gctcacaatt gctcacaatt ccacataagg ccacataagg aggtaaaaaa aggtaaaaaa atgatacatc atgatacatc atcatcatca atcatcatca tcatatgtcc tcatatgtcc 180 180 cctatactag cctatactag gttattggaa gttattggaa aattaagggc aattaagggc cttgtgcaac cttgtgcaac ccactcgact ccactcgact tcttttggaa tcttttggaa 240 240 tatcttgaag tatcttgaag aaaaatatga aaaaatatga agagcatttg agagcatttg tatgagcgcg tatgagcgcg atgaaggtga atgaaggtga taaatggcga taaatggcga 300 300 aacaaaaagt aacaaaaagt ttgaattggg ttgaattggg tttggagttt tttggagttt cccaatcttc cccaatcttc cttattatat cttattatat tgatggtgat tgatggtgat 360 360 gttaaattaa gttaaattaa cacagtctat cacagtctat ggccatcata ggccatcata cgttatatag cgttatatag ctgacaagca ctgacaagca caacatgttg caacatgttg 420 420 ggtggttgtc ggtggttgtc caaaagagcg caaaagagcg tgcagagatt tgcagagatt tcaatgcttg tcaatgcttg aaggagcggt aaggagcggt tttggatatt tttggatatt 480 480 agatacggtg agatacggtg tttcgagaat tttcgagaat tgcatatagt tgcatatagt aaagactttg aaagactttg aaactctcaa aaactctcaa agttgatttt agttgatttt 540 540 cttagcaagc cttagcaagc tacctgaaat tacctgaaat gctgaaaatg gctgaaaatg ttcgaagatc ttcgaagatc gtttatgtca gtttatgtca taaaacatat taaaacatat 600 600 ttaaatggtg ttaaatggtg atcatgtaac atcatgtaac ccatcctgac ccatcctgac ttcatgttgt ttcatgttgt atgacgctct atgacgctct tgatgttgtt tgatgttgtt 660 660 ttatacatgg ttatacatgg acccaatgtg acccaatgtg cctggatgcg cctggatgcg ttcceaaaat ttcceaaaat tagtttgttt tagtttgttt taaaaaacgt taaaaaacgt 720 720 attgaagcta attgaagcta tcccacaaat tcccacaaat tgataagtac tgataagtac ttgaaatcca ttgaaatcca gcaagtatat gcaagtatat agcatggcct agcatggcct 780 780 ttgcagggct ttgcagggct ggcaagccac ggcaagccac gtttggtggt gtttggtggt ggcgaccatc ggcgaccatc ctccaaaatc ctccaaaatc ggatctggtt ggatctggtt 840 840 ccgcgtggat ccgcgtggat ccccaggaat ccccaggaat tcccgggtcg tcccgggtcg actcgagcgg actcgagcgg ccgcatcgtg ccgcatcgtg ggaactgcag ggaactgcag 900 900 atgaattcga atgaattcga gctcggatcc gctcggatcc aagatcttct aagatcttct agacatatga agacatatga tcgataagct tcgataagct tgatatcggt tgatatcggt 960 960 accaccatgg accaccatgg tcgacctcga tcgacctcga gcccggggct gcccggggct agcataaccc agcataaccc cttggggcct cttggggcct ctaaacgggt ctaaacgggt 1020 1020 cttgaggggt cttgaggggt tttttgggga tttttgggga aatttccccg aatttccccg aagatcaaag aagatcaaag gatcttcttg gatcttcttg agatcctttt agatcctttt 1080 1080

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

tttctgcgcg tttctgcgcg taatctgctg taatctgctg cttgcaaaca cttgcaaaca aaaaaaccac aaaaaaccac cgctaccagc cgctaccagc ggtggtttgt ggtggtttgt 1140 1140 ttgccggatc ttgccggatc aagagctacc aagagctacc aactcttttt aactcttttt ccgaaggtaa ccgaaggtaa ctggcttcag ctggcttcag cagagcgcag cagagcgcag 1200 1200 ataccaaata ataccaaata ctgtccttct ctgtccttct agtgtagccg agtgtagccg tagttaggcc tagttaggcc accacttcaa accacttcaa gaactctgta gaactctgta 1260 1260 gcaccgccta gcaccgccta catacctcgc catacctcgc tctgctaatc tctgctaatc ctgttaccag ctgttaccag tggctgctgc tggctgctgc cagtggcgat cagtggcgat 1320 1320 aagtcgtgtc aagtcgtgtc ttaccgggtt ttaccgggtt ggactcaaga ggactcaaga cgatagttac cgatagttac cggataaggc cggataaggc gcagcggtcg gcagcggtcg 1380 1380 ggctgaacgg ggctgaacgg ggggttcgtg ggggttcgtg cacacagccc cacacagccc agcttggagc agcttggagc gaacgaccta gaacgaccta caccgaactg caccgaactg 1440 1440 agatacctac agatacctac agcgtgagct agcgtgagct atgagaaagc atgagaaagc gccacgcttc gccacgcttc ccgaagggag ccgaagggag aaaggcggac aaaggcggac 1500 1500 aggtatccgg aggtatccgg taagcggcag taagcggcag ggtcggaaca ggtcggaaca ggagagcgca ggagagcgca cgagggagct cgagggagct tccaggggga tccaggggga 1560 1560 aacgcctggt aacgcctggt atctttatag atctttatag tcctgtcggg tcctgtcggg tttcgccacc tttcgccacc tctgacttga tctgacttga gcgtcgattt gcgtcgattt 1620 1620 ttgtgatgct ttgtgatgct cgtcaggggg cgtcaggggg gcggagccta gcggagccta tggaaaaacg tggaaaaacg ccagcaacgc ccagcaacgc gtttgcgata gtttgcgata 1680 1680 ggtaaaggcg ggtaaaggcg cgccatcgaa cgccatcgaa tggcgcaaaa tggcgcaaaa cctttcgcgg cctttcgcgg tatggcatga tatggcatga tagcgcccgg tagcgcccgg 1740 1740 aagagagtca aagagagtca attcagggtg attcagggtg gtgaatggtg gtgaatggtg gtgaatgtga gtgaatgtga aaccagtaac aaccagtaac gttatacgat gttatacgat 1800 1800 gtcgcagagt gtcgcagagt atgccggtgt atgccggtgt ctcttatcag ctcttatcag accgtttccc accgtttccc gcgtggtgaa gcgtggtgaa ccaggccagc ccaggccagc 1860 1860 cacgtttctg cacgtttctg cgaaaacgcg cgaaaacgcg ggaaaaagtg ggaaaaagtg gaagcggcga gaagcggcga tggcggagct tggcggagct gaattacatt gaattacatt 1920 1920 cccaaccgcg cccaaccgcg tggcacaaca tggcacaaca actggcgggc actggcgggc aaacagtcgt aaacagtcgt tgctgattgg tgctgattgg cgttgccacc cgttgccacc 1980 1980 tccagtctgg tccagtctgg ccctgcacgc ccctgcacgc gccgtcgcaa gccgtcgcaa attgtcgcgg attgtcgcgg cgattaaatc cgattaaatc tcgcgccgat tcgcgccgat 2040 2040 caactgggtg caactgggtg ccagcgtggt ccagcgtggt ggtgtcgatg ggtgtcgatg gtagaacgaa gtagaacgaa gcggcgtcga gcggcgtcga agcctgtaaa agcctgtaaa 2100 2100 gcggcggtgc gcggcggtgc acaatcttct acaatcttct cgcgcaacgc cgcgcaacgc gtcagtgggc gtcagtgggc tgatcattaa tgatcattaa ctatccgctg ctatccgctg 2160 2160 gatgaccagg gatgaccagg atgccattgc atgccattgc tgtggaagct tgtggaagct gcctgcacta gcctgcacta atgttccggc atgttccggc gttatttctt gttatttctt 2220 2220 gatgtctctg gatgtctctg accagacacc accagacacc catcaacagt catcaacagt attattttct attattttct cccatgaaga cccatgaaga cggtacgcga cggtacgcga 2280 2280 ctgggcgtgg ctgggcgtgg agcatctggt agcatctggt cgcattgggt cgcattgggt caccagcaaa caccagcaaa tcgcgctgtt tcgcgctgtt agcgggccca agcgggccca 2340 2340 ttaagttctg ttaagttctg tctcggcgcg tctcggcgcg tctgcgtctg tctgcgtctg g ct g g ct g g c g ct g g ct g g c ataaatatct ataaatatct cactcgcaat cactcgcaat 2400 2400 caaattcagc caaattcagc cgatagcgga cgatagcgga acgggaaggc acgggaaggc gactggagtg gactggagtg ccatgtccgg ccatgtccgg ttttcaacaa ttttcaacaa 2460 2460 accatgcaaa accatgcaaa tgctgaatga tgctgaatga gggcatcgtt gggcatcgtt cccactgcga cccactgcga tgctggttgc tgctggttgc caacgatcag caacgatcag 2520 2520 atggcgctgg atggcgctgg gcgcaatgcg gcgcaatgcg cgccattacc cgccattacc gagtccgggc gagtccgggc tgcgcgttgg tgcgcgttgg tgcggatatc tgcggatatc 2580 2580 tcggtagtgg tcggtagtgg gatacgacga gatacgacga taccgaagac taccgaagac agctcatgtt agctcatgtt atatcccgcc atatcccgcc gtcaaccacc gtcaaccacc 2640 2640 atcaaacagg atcaaacagg attttcgcct attttcgcct gctggggcaa gctggggcaa accagcgtgg accagcgtgg accgcttgct accgcttgct gcaactctct gcaactctct 2700 2700 cagggccagg cagggccagg cggtgaaggg cggtgaaggg caatcagctg caatcagctg ttgcccgtct ttgcccgtct cactggtgaa cactggtgaa aagaaaaacc aagaaaaacc 2760 2760 accctggcgc accctggcgc ccaatacgca ccaatacgca aaccgcctct aaccgcctct ccccgcgcgt ccccgcgcgt tggccgattc tggccgattc attaatgcag attaatgcag 2820 2820 ctggcacgac ctggcacgac aggtttcccg aggtttcccg actggaaagc actggaaagc gggcagtgag gggcagtgag cgcaactttg cgcaactttg cgataggtaa cgataggtaa 2880 2880 atttttctaa atttttctaa atacattcaa atacattcaa atatgtatcc atatgtatcc gctcatgaga gctcatgaga caataaccct caataaccct gataaatgct gataaatgct 2940 2940 tcaataatat tcaataatat tgaaaaagga tgaaaaagga agagtatgag agagtatgag tattcaacat tattcaacat ttccgtgtcg ttccgtgtcg cccttattcc cccttattcc 3000 3000 cttttttgcg cttttttgcg gcattttgcc gcattttgcc ttcctgtttt ttcctgtttt tgctcaccca tgctcaccca gaaacgctgg gaaacgctgg tgaaagtaaa tgaaagtaaa 3060 3060 agatgctgaa agatgctgaa gatcagttgg gatcagttgg gtgcacgagt gtgcacgagt gggttacatc gggttacatc gaactggatc gaactggatc tcaacagcgg tcaacagcgg 3120 3120

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.tXtSEQLTXT.tXt

taagatcctt taagatcctt gagagttttc gagagttttc gccccgaaga gccccgaaga acgttttcca acgttttcca atgatgagca atgatgagca cttttaaagt cttttaaagt 3180 3180 tctgctatgt tctgctatgt ggcgcggtat ggcgcggtat tatcccgtat tatcccgtat tgacgccggg tgacgccggg caagagcaac caagagcaac tcggtcgccg tcggtcgccg 3240 3240 catacactat catacactat tctcagaatg tctcagaatg acttggttga acttggttga gtactcacca gtactcacca gtcacagaaa gtcacagaaa agcatcttac agcatcttac 3300 3300 ggatggcatg ggatggcatg acagtaagag acagtaagag aattatgcag aattatgcag tgctgccata tgctgccata accatgagtg accatgagtg ataacactgc ataacactgc 3360 3360 ggccaactta ggccaactta cttctgacaa cttctgacaa cgatcggagg cgatcggagg accgaaggag accgaaggag ctaaccgctt ctaaccgctt ttttgcacaa ttttgcacaa 3420 3420 catgggggat catgggggat catgtaactc catgtaactc gccttgatcg gccttgatcg ttgggaaccg ttgggaaccg gagctgaatg gagctgaatg aagccatacc aagccatacc 3480 3480 aaacgacgag aaacgacgag cgtgacacca cgtgacacca cgatgcctgt cgatgcctgt agcaatggca agcaatggca acaacgttgc acaacgttgc gcaaactatt gcaaactatt 3540 3540 aactggcgaa aactggcgaa ctacttactc ctacttactc tagcttcccg tagcttcccg gcaacaatta gcaacaatta atagactgga atagactgga tggaggcgga tggaggcgga 3600 3600 taaagttgca taaagttgca ggaccacttc ggaccacttc tgcgctcggc tgcgctcggc ccttccggct ccttccggct ggctggttta ggctggttta ttgctgataa ttgctgataa 3660 3660 atctggagcc atctggagcc ggtgagcgtg ggtgagcgtg ggtctcgcgg ggtctcgcgg tatcattgca tatcattgca gcactggggc gcactggggc cagatggtaa cagatggtaa 3720 3720 gccctcccgt gccctcccgt atcgtagtta atcgtagtta tctacacgac tctacacgac ggggagtcag ggggagtcag gcaactatgg gcaactatgg atgaacgaaa atgaacgaaa 3780 3780 tagacagatc tagacagatc gctgagatag gctgagatag gtgcctcact gtgcctcact gattaagcat gattaagcat tggtaactgt tggtaactgt c c 3831 3831

<210> 31 <211> 4052 <212> DNA <213> artificial <220><210> 31 <211> 4052 <212> DNA <213> artificial <220>

<223> pBCM7MLG <400> 31<223> pBCM7MLG <400> 31

ctggagatcc ctggagatcc tgataaaatc tgataaaatc atgaaaaatt atgaaaaatt tatttgcttt tatttgcttt gtgagcggat gtgagcggat aacaattata aacaattata 60 60 atatgtggaa atatgtggaa ttgtgagcgc ttgtgagcgc tcacaattcc tcacaattcc acataaggag acataaggag gtaaaaaaat gtaaaaaaat gtggaattgt gtggaattgt 120 120 gagcgctcac gagcgctcac aattccacat aattccacat aaggaggtaa aaggaggtaa aaaaatgata aaaaatgata catcatcatc catcatcatc atcatcatat atcatcatat 180 180 gtcccctata gtcccctata ctaggttatt ctaggttatt ggaaaattaa ggaaaattaa gggccttgtg gggccttgtg caacccactc caacccactc gacttctttt gacttctttt 240 240 ggaatatctt ggaatatctt gaagaaaaat gaagaaaaat atgaagagca atgaagagca tttgtatgag tttgtatgag cgcgatgaag cgcgatgaag gtgataaatg gtgataaatg 300 300 gcgaaacaaa gcgaaacaaa aagtttgaat aagtttgaat tgggtttgga tgggtttgga gtttcccaat gtttcccaat cttccttatt cttccttatt atattgatgg atattgatgg 360 360 tgatgttaaa tgatgttaaa ttaacacagt ttaacacagt ctatggccat ctatggccat catacgttat catacgttat atagctgaca atagctgaca agcacaacat agcacaacat 420 420 gttgggtggt gttgggtggt tgtccaaaag tgtccaaaag agcgtgcaga agcgtgcaga gatttcaatg gatttcaatg cttgaaggag cttgaaggag cggttttgga cggttttgga 480 480 tattagatac tattagatac ggtgtttcga ggtgtttcga gaattgcata gaattgcata tagtaaagac tagtaaagac tttgaaactc tttgaaactc tcaaagttga tcaaagttga 540 540 ttttcttagc ttttcttagc aagctacctg aagctacctg aaatgctgaa aaatgctgaa aatgttcgaa aatgttcgaa gatcgtttat gatcgtttat gtcataaaac gtcataaaac 600 600 atatttaaat atatttaaat ggtgatcatg ggtgatcatg taacccatcc taacccatcc tgacttcatg tgacttcatg ttgtatgacg ttgtatgacg ctcttgatgt ctcttgatgt 660 660 tgttttatac tgttttatac atggacccaa atggacccaa tgtgcctgga tgtgcctgga tgcgttccca tgcgttccca aaattagttt aaattagttt gttttaaaaa gttttaaaaa 720 720 acgtattgaa acgtattgaa gctatcccac gctatcccac aaattgataa aaattgataa gtacttgaaa gtacttgaaa tccagcaagt tccagcaagt atatagcatg atatagcatg 780 780 gcctttgcag gcctttgcag ggctggcaag ggctggcaag ccacgtttgg ccacgtttgg tggtggcgac tggtggcgac catcctccaa catcctccaa aatcggatct aatcggatct 840 840 ggttccgcgt ggttccgcgt ggatccccag ggatccccag gaattcccgg gaattcccgg gtcgactcga gtcgactcga gcggccgcat gcggccgcat cgtgggaact cgtgggaact 900 900 gcagatgaat gcagatgaat tcgagctcgg tcgagctcgg atccaagatc atccaagatc ttctagacat ttctagacat atgatcgata atgatcgata agcttgatat agcttgatat 960 960 cggtaccacc cggtaccacc atggtcgacc atggtcgacc tcgagcccgg tcgagcccgg ggctagcata ggctagcata accccttggg accccttggg gcctctaaac gcctctaaac 1020 1020

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

gggtcttgag gggtcttgag gggttttttg gggttttttg gggaaatttc gggaaatttc cccgattaat cccgattaat aagatgatct aagatgatct tcttgagatc tcttgagatc 1080 1080 gttttggtct gttttggtct gcgcgtaatc gcgcgtaatc tcttgctctg tcttgctctg aaaacgaaaa aaaacgaaaa aaccgccttg aaccgccttg cagggcggtt cagggcggtt 1140 1140 tttcgaaggt tttcgaaggt tctctgagct tctctgagct accaactctt accaactctt tgaaccgagg tgaaccgagg taactggctt taactggctt ggaggagcgc ggaggagcgc 1200 1200 agtcaccaaa agtcaccaaa acttgtcctt acttgtcctt tcagtttagc tcagtttagc cttaaccggc cttaaccggc gcatgacttc gcatgacttc aagactaact aagactaact 1260 1260 cctctaaatc cctctaaatc aattaccagt aattaccagt ggctgctgcc ggctgctgcc agtggtgctt agtggtgctt ttgcatgtct ttgcatgtct ttccgggttg ttccgggttg 1320 1320 gactcaagac gactcaagac gatagttacc gatagttacc ggataaggcg ggataaggcg cagcggtcgg cagcggtcgg actgaacggg actgaacggg gggttcgtgc gggttcgtgc 1380 1380 atacagtcca atacagtcca gcttggagcg gcttggagcg aactgcctac aactgcctac ccggaactga ccggaactga gtgtcaggcg gtgtcaggcg tggaatgaga tggaatgaga 1440 1440 caaacgcggc caaacgcggc cataacagcg cataacagcg gaatgacacc gaatgacacc ggtaaaccga ggtaaaccga aaggcaggaa aaggcaggaa caggagagcg caggagagcg 1500 1500 cacgagggag cacgagggag ccgccagggg ccgccagggg gaaacgcctg gaaacgcctg gtatctttat gtatctttat agtcctgtcg agtcctgtcg ggtttcgcca ggtttcgcca 1560 1560 ccactgattt ccactgattt gagcgtcaga gagcgtcaga tttcgtgatg tttcgtgatg cttgtcaggg cttgtcaggg gggcggagcc gggcggagcc tatggaaaaa tatggaaaaa 1620 1620 cggctttgcc cggctttgcc gcggccctct gcggccctct cacttccctg cacttccctg ttaagtatct ttaagtatct tcctggcatc tcctggcatc ttccaggaaa ttccaggaaa 1680 1680 tctccgcccc tctccgcccc gttcgtaagc gttcgtaagc catttccgct catttccgct cgccgcagtc cgccgcagtc gaacgaccga gaacgaccga gcgtagcgag gcgtagcgag 1740 1740 tcagtgagcg tcagtgagcg aggaagcgga aggaagcgga atatatcctg atatatcctg tatcacatat tatcacatat tctgctgacg tctgctgacg caccggtgca caccggtgca 1800 1800 gccttttttc gccttttttc tcctgccaca tcctgccaca tgaagcactt tgaagcactt cactgacacc cactgacacc ctcatcagtg ctcatcagtg ccaacatagt ccaacatagt 1860 1860 aagccagtat aagccagtat acactccgct acactccgct agcgctgagg agcgctgagg tctttgcgat tctttgcgat aggtaaaggc aggtaaaggc gcgccatcga gcgccatcga 1920 1920 atggcgcaaa atggcgcaaa acctttcgcg acctttcgcg gtatggcatg gtatggcatg atagcgcccg atagcgcccg gaagagagtc gaagagagtc aattcagggt aattcagggt 1980 1980 ggtgaatggt ggtgaatggt ggtgaatgtg ggtgaatgtg aaaccagtaa aaaccagtaa cgttatacga cgttatacga tgtcgcagag tgtcgcagag tatgccggtg tatgccggtg 2040 2040 tctcttatca tctcttatca gaccgtttcc gaccgtttcc cgcgtggtga cgcgtggtga accaggccag accaggccag ccacgtttct ccacgtttct gcgaaaacgc gcgaaaacgc 2100 2100 gggaaaaagt gggaaaaagt ggaagcggcg ggaagcggcg atggcggagc atggcggagc tgaattacat tgaattacat tcccaaccgc tcccaaccgc gtggcacaac gtggcacaac 2160 2160 aactggcggg aactggcggg caaacagtcg caaacagtcg ttgctgattg ttgctgattg gcgttgccac gcgttgccac ctccagtctg ctccagtctg gccctgcacg gccctgcacg 2220 2220 cgccgtcgca cgccgtcgca aattgtcgcg aattgtcgcg gcgattaaat gcgattaaat ctcgcgccga ctcgcgccga tcaactgggt tcaactgggt gccagcgtgg gccagcgtgg 2280 2280 tggtgtcgat tggtgtcgat ggtagaacga ggtagaacga agcggcgtcg agcggcgtcg aagcctgtaa aagcctgtaa agcggcggtg agcggcggtg cacaatcttc cacaatcttc 2340 2340 tcgcgcaacg tcgcgcaacg cgtcagtggg cgtcagtggg ctgatcatta ctgatcatta actatccgct actatccgct ggatgaccag ggatgaccag gatgccattg gatgccattg 2400 2400 ctgtggaagc ctgtggaagc tgcctgcact tgcctgcact aatgttccgg aatgttccgg cgttatttct cgttatttct tgatgtctct tgatgtctct gaccagacac gaccagacac 2460 2460 ccatcaacag ccatcaacag tattattttc tattattttc tcccatgaag tcccatgaag acggtacgcg acggtacgcg actgggcgtg actgggcgtg gagcatctgg gagcatctgg 2520 2520 tcgcattggg tcgcattggg tcaccagcaa tcaccagcaa atcgcgctgt atcgcgctgt tagcgggccc tagcgggccc attaagttct attaagttct gtctcggcgc gtctcggcgc 2580 2580 gtctgcgtct gtctgcgtct ggctggctgg ggctggctgg cataaatatc cataaatatc tcactcgcaa tcactcgcaa tcaaattcag tcaaattcag ccgatagcgg ccgatagcgg 2640 2640 aacgggaagg aacgggaagg cgactggagt cgactggagt gccatgtccg gccatgtccg gttttcaaca gttttcaaca aaccatgcaa aaccatgcaa atgctgaatg atgctgaatg 2700 2700 agggcatcgt agggcatcgt tcccactgcg tcccactgcg atgctggttg atgctggttg ccaacgatca ccaacgatca gatggcgctg gatggcgctg ggcgcaatgc ggcgcaatgc 2760 2760 gcgccattac gcgccattac cgagtccggg cgagtccggg ctgcgcgttg ctgcgcgttg gtgcggatat gtgcggatat ctcggtagtg ctcggtagtg ggatacgacg ggatacgacg 2820 2820 ataccgaaga ataccgaaga cagctcatgt cagctcatgt tatatcccgc tatatcccgc cgtcaaccac cgtcaaccac catcaaacag catcaaacag gattttcgcc gattttcgcc 2880 2880 tgctggggca tgctggggca aaccagcgtg aaccagcgtg gaccgcttgc gaccgcttgc tgCaactctc tgCaactctc tcagggccag tcagggccag gcggtgaagg gcggtgaagg 2940 2940 gcaatcagct gcaatcagct gttgcccgtc gttgcccgtc tcactggtga tcactggtga aaagaaaaac aaagaaaaac caccctggcg caccctggcg cccaatacgc cccaatacgc 3000 3000 aaaccgcctc aaaccgcctc tccccgcgcg tccccgcgcg ttggccgatt ttggccgatt cattaatgca cattaatgca gctggcacga gctggcacga caggtttccc caggtttccc 3060 3060

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

gactggaaag gactggaaag cgggcagtga cgggcagtga gcgcaacttt gcgcaacttt gcgataggta gcgataggta aatttttcta aatttttcta aatacattca aatacattca 3120 3120 aatatgtatc aatatgtatc cgctcatgag cgctcatgag acaataaccc acaataaccc tgataaatgc tgataaatgc ttcaataata ttcaataata ttgaaaaagg ttgaaaaagg 3180 3180 aagagtatga aagagtatga gtattcaaca gtattcaaca tttccgtgtc tttccgtgtc gcccttattc gcccttattc ccttttttgc ccttttttgc ggcattttgc ggcattttgc 3240 3240 cttcctgttt cttcctgttt ttgctcaccc ttgctcaccc agaaacgctg agaaacgctg gtgaaagtaa gtgaaagtaa aagatgctga aagatgctga agatcagttg agatcagttg 3300 3300 ggtgcacgag ggtgcacgag tgggttacat tgggttacat cgaactggat cgaactggat ctcaacagcg ctcaacagcg gtaagatcct gtaagatcct tgagagtttt tgagagtttt 3360 3360 cgccccgaag cgccccgaag aacgttttcc aacgttttcc aatgatgagc aatgatgagc acttttaaag acttttaaag ttctgctatg ttctgctatg tggcgcggta tggcgcggta 3420 3420 ttatcccgta ttatcccgta ttgacgccgg ttgacgccgg gcaagagcaa gcaagagcaa ctcggtcgcc ctcggtcgcc gcatacacta gcatacacta ttctcagaat ttctcagaat 3480 3480 gacttggttg gacttggttg agtactcacc agtactcacc agtcacagaa agtcacagaa aagcatctta aagcatctta cggatggcat cggatggcat gacagtaaga gacagtaaga 3 540 3 540 gaattatgca gaattatgca gtgctgccat gtgctgccat aaccatgagt aaccatgagt gataacactg gataacactg cggccaactt cggccaactt acttctgaca acttctgaca 3600 3600 acgatcggag acgatcggag gaccgaagga gaccgaagga gctaaccgct gctaaccgct tttttgcaca tttttgcaca acatggggga acatggggga tcatgtaact tcatgtaact 3660 3660 cgccttgatc cgccttgatc gttgggaacc gttgggaacc ggagctgaat ggagctgaat gaagccatac gaagccatac caaacgacga caaacgacga gcgtgacacc gcgtgacacc 3720 3720 acgatgcctg acgatgcctg tagcaatggc tagcaatggc aacaacgttg aacaacgttg cgcaaactat cgcaaactat taactggcga taactggcga actacttact actacttact 3780 3780 ctagcttccc ctagcttccc ggcaacaatt ggcaacaatt aatagactgg aatagactgg atggaggcgg atggaggcgg ataaagttgc ataaagttgc aggaccactt aggaccactt 3840 3840 ctgcgctcgg ctgcgctcgg cccttccggc cccttccggc tggctggttt tggctggttt attgctgata attgctgata aatctggagc aatctggagc cggtgagcgt cggtgagcgt 3900 3900 gggtctcgcg gggtctcgcg gtatcattgc gtatcattgc agcactgggg agcactgggg ccagatggta ccagatggta agccctcccg agccctcccg tatcgtagtt tatcgtagtt 3960 3960 atctacacga atctacacga cggggagtca cggggagtca ggcaactatg ggcaactatg gatgaacgaa gatgaacgaa atagacagat atagacagat cgctgagata cgctgagata 4020 4020 ggtgcctcac ggtgcctcac tgattaagca tgattaagca ttggtaactg ttggtaactg tc tc 4052 4052

<210> 32 <211> 4025 <212> DNA <213> artifi ciał <220><210> 32 <211> 4025 <212> DNA <213> artificals <220>

<223> pBCM8MLG <400> 32 ctggagatcc tgatataata cgactcacta taggggtgtg gaattgtgag cgctcacaat 60 tccacataag gaggtaaaaa aatgtggaat tgtgagcgct cacaattcca cataaggagg 120 taaaaaaatg atacatcatc atcatcatca tatgtcccct atactaggtt attggaaaat 180 taagggcctt gtgcaaccca ctcgacttct tttggaatat cttgaagaaa aatatgaaga 240 gcatttgtat gagcgcgatg aaggtgataa atggcgaaac aaaaagtttg aattgggttt 300 ggagtttccc aatcttcctt attatattga tggtgatgtt aaattaacac agtctatggc 360 catcatacgt tatatagctg acaagcacaa catgttgggt ggttgtccaa aagagcgtgc 420 agagatttca atgcttgaag gagcggtttt ggatattaga tacggtgttt cgagaattgc 480 atatagtaaa gactttgaaa ctctcaaagt tgatcttctt agcaagctac ctgaaatgct 540 gaaaatgttc gaagatcgtt tatgtcataa aacatattta aatggtgatc atgtaaccca 600 tcctgacttc atgttgtatg acgctcttga tgttgtttta tacatggacc caatgtgcct 660 ggatgcgttc ccaaaattag tttgttttaa aaaacgtatt gaagctatcc cacaaattga 720<223> pBCM8MLG <400> 32 ctggagatcc tgatataata cgactcacta taggggtgtg gaattgtgag cgctcacaat 60 tccacataag gaggtaaaaa aatgtggaat tgtgagcgct cacaattcca cataaggagg 120 taaaaaaatg atacatcatc atcatcatca tatgtcccct atactaggtt attggaaaat 180 taagggcctt gtgcaaccca ctcgacttct tttggaatat cttgaagaaa aatatgaaga 240 gcatttgtat gagcgcgatg aaggtgataa atggcgaaac aaaaagtttg aattgggttt 300 ggagtttccc aatcttcctt attatattga tggtgatgtt aaattaacac agtctatggc 360 catcatacgt tatatagctg acaagcacaa catgttgggt ggttgtccaa aagagcgtgc 420 agagatttca atgcttgaag gagcggtttt ggatattaga tacggtgttt cgagaattgc 480 atatagtaaa gactttgaaa ctctcaaagt tgatcttctt agcaagctac ctgaaatgct 540 gaaaatgttc gaagatcgtt tatgtcataa aacatattta aatggtgatc atgtaaccca 600 tcctgacttc atgttgtatg acgctcttga tgttgtttta tacatggacc caatgtgcct 660 ggatgcgttc ccaaaattag tttgttttaa aaaacgtatt gaagctatcc cacaaattga 720

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

taagtacttg taagtacttg aaatccagca aaatccagca agtatatagc agtatatagc atggcctttg atggcctttg cagggctggc cagggctggc aagccacgtt aagccacgtt 780 780 tggtggtggc tggtggtggc gaccatcctc gaccatcctc caaaatcgga caaaatcgga tctggttccg tctggttccg cgtggatccc cgtggatccc caggaattcc caggaattcc 840 840 cgggtcgact cgggtcgact cgagcggccg cgagcggccg catcgtggga catcgtggga actgcagatg actgcagatg aattcgagct aattcgagct cggatccaag cggatccaag 900 900 atcttctaga atcttctaga catatgatcg catatgatcg ataagcttga ataagcttga tatcggtacc tatcggtacc accatggtcg accatggtcg acctcgagcc acctcgagcc 960 960 cggggctagc cggggctagc ataacccctt ataacccctt ggggcctcta ggggccta aacgggtctt aacgggtctt gaggggtttt gaggggtttt ttggggaaat ttggggaaat 1020 1020 ttccccgatt ttccccgatt aataagatga aataagatga tcttcttgag tcttcttgag atcgttttgg atcgttttgg tctgcgcgta tctgcgcgta atctcttgct atctcttgct 1080 1080 ctgaaaacga ctgaaaacga aaaaaccgcc aaaaaccgcc ttgcagggcg ttgcagggcg gtttttcgaa gtttttcgaa ggttctctga ggttctctga gctaccaact gctaccaact 1140 1140 ctttgaaccg ctttgaaccg aggtaactgg aggtaactgg cttggaggag cttggaggag cgcagtcacc cgcagtcacc aaaacttgtc aaaacttgtc ctttcagttt ctttcagttt 1200 1200 agccttaacc agccttaacc ggcgcatgac ggcgcatgac ttcaagacta ttcaagacta actcctctaa actcctctaa atcaattacc atcaattacc agtggctgct agtggctgct 1260 1260 gccagtggtg gccagtggtg cttttgcatg cttttgcatg tctttccggg tctttccggg ttggactcaa ttggactcaa gacgatagtt gacgatagtt accggataag accggataag 1320 1320 gcgcagcggt gcgcagcggt cggactgaac cggactgaac ggggggttcg ggggggttcg tgcatacagt tgcatacagt ccagcttgga ccagcttgga gcgaactgcc gcgaactgcc 1380 1380 tacccggaac tacccggaac tgagtgtcag tgagtgtcag gcgtggaatg gcgtggaatg agacaaacgc agacaaacgc ggecataaca ggecataaca gcggaatgac gcggaatgac 1440 1440 accggtaaac accggtaaac cgaaaggcag cgaaaggcag gaacaggaga gaacaggaga gcgcacgagg gcgcacgagg gagccgccag gagccgccag ggggaaacgc ggggaaacgc 1500 1500 ctggtatctt ctggtatctt tatagtcctg tatagtcctg tcgggtttcg tcgggtttcg ccaccactga ccaccactga tttgagcgtc tttgagcgtc agatttcgtg agatttcgtg 1560 1560 atgcttgtca atgcttgtca gagggscgga gagggscgga gcctatggaa gcctatggaa aaacggcttt aaacggcttt gccgcggccc gccgcggccc tctcacttcc tctcacttcc 1620 1620 ctgttaagta ctgttaagta tcttcctggc tcttcctggc atcttccagg atcttccagg aaatctccgc aaatctccgc cccgttcgta cccgttcgta agccatttcc agccatttcc 1680 1680 gctcgccgca gctcgccgca gtcgaacgac gtcgaacgac cgagcgtagc cgagcgtagc gagtcagtga gagtcagtga gcgaggaagc gcgaggaagc ggaatatatc ggaatatatc 1740 1740 ctgtatcaca ctgtatcaca tattctgctg tattctgctg acgcaccggt acgcaccggt gcagcctttt gcagcctttt ttctcctgcc ttctcctgcc acatgaagca acatgaagca 1800 1800 cttcactgac cttcactgac accctcatca accctcatca gtgccaacat gtgccaacat agtaagccag agtaagccag tatacactcc tatacactcc gctagcgctg gctagcgctg 1860 1860 aggtctttgc aggtctttgc gataggtaaa gataggtaaa ggcgcgccat ggcgcgccat cgaatggcgc cgaatggcgc aaaacctttc aaaacctttc gcggtatggc gcggtatggc 1920 1920 atgatagcgc atgatagcgc ccggaagaga ccggaagaga gtcaattcag gtcaattcag ggtggtgaat ggtggtgaat ggtggtgaat ggtggtgaat gtgaaaccag gtgaaaccag 1980 1980 taacgttata taacgttata cgatgtcgca cgatgtcgca gagtatgccg gagtatgccg gtgtctctta gtgtctctta tcagaccgtt tcagaccgtt tcccgcgtgg tcccgcgtgg 2040 2040 tgaaccaggc tgaaccaggc cagccacgtt cagccacgtt tctgcgaaaa tctgcgaaaa cgcgggaaaa cgcgggaaaa agtggaagcg agtggaagcg gcgatggcgg gcgatggcgg 2100 2100 agctgaatta agctgaatta cattcccaac cattcccaac cgcgtggcac cgcgtggcac aacaactggc aacaactggc gggcaaacag gggcaaacag tcgttgctga tcgttgctga 2160 2160 ttggcgttgc ttggcgttgc cacctccagt cacctccagt ctggccctgc ctggccctgc acgcgccgtc acgcgccgtc gcaaattgtc gcaaattgtc gcggcgatta gcggcgatta 2220 2220 aatctcgcgc aatctcgcgc cgatcaactg cgatcaactg ggtgccagcg ggtgccagcg tggtggtgtc tggtggtgtc gatggtagaa gatggtagaa cgaagcggcg cgaagcggcg 2280 2280 tcgaagcctg tcgaagcctg taaagcggcg taaagcggcg gtgcacaatc gtgcacaatc ttctcgcgca ttctcgcgca acgcgtcagt acgcgtcagt gggctgatca gggctgatca 2340 2340 ttaactatcc ttaactatcc gctggatgac gctggatgac caggatgcca caggatgcca ttgctgtgga ttgctgtgga agctgcctgc agctgcctgc actaatgttc actaatgttc 2400 2400 cggcgttatt cggcgttatt tcttgatgtc tcttgatgtc tctgaccaga tctgaccaga cacccatcaa cacccatcaa cagtattatt cagtattatt ttctcccatg ttctcccatg 2460 2460 aagacggtac aagacggtac gcgactgggc gcgactgggc gtggagcatc gtggagcatc tggtcgcatt tggtcgcatt gggtcaccag gggtcaccag caaatcgcgc caaatcgcgc 2520 2520 tgttagcggg tgttagcggg cccattaagt cccattaagt tctgtctcgg tctgtctcgg cgcgtctgcg cgcgtctgcg tctggctggc tctggctggc tggcataaat tggcataaat 2580 2580 atctcactcg atctcactcg caatcaaatt caatcaaatt cagccgatag cagccgatag cggaacggga cggaacggga aggcgactgg aggcgactgg agtgccatgt agtgccatgt 2640 2640 ccggttttca ccggttttca acaaaccatg acaaaccatg caaatgctga caaatgctga atgagggcat atgagggcat cgttcccact cgttcccact gcgatgctgg gcgatgctgg 2700 2700 ttgccaacga ttgccaacga tcagatggcg tcagatggcg ctgggcgcaa ctgggcgcaa tgcgcgccat tgcgcgccat taccgagtcc taccgagtcc gggctgcgcg gggctgcgcg 2760 2760

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

ttggtgcgga tatctcggta gtgggatacg acgataccga agacagctca tgttatatcc ttggtgcgga tatctcggta gtgggatacg acgataccga agacagctca tgttatatcc 2820 2820 cgccgtcaac caccatcaaa caggattttc gcctgctggg gcaaaccagc gtggaccgct cgccgtcaac caccatcaaa caggattttc gcctgctggg gcaaaccagc gtggaccgct 2880 2880 tgctgcaact ctctcagggc caggcggtga agggcaatca gctgttgccc gtctcactgg tgctgcaact ctctcagggc caggcggtga agggcaatca gctgttgccc gtctcactgg 2940 2940 tgaaaagaaa aaccaccctg gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg tgaaaagaaa aaccaccctg gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 3000 3000 attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 3060 3060 tttgcgatag gtaaattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa tttgcgatag gtaaattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 3120 3120 ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 3180 3180 gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 3240 3240 ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 3300 3300 gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 3360 3360 agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 3420 3420 caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 3480 3480 gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 3540 3540 agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 3600 3600 gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 3660 3660 aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 3720 3720 ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 3780 3780 tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 3840 3840 tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 3900 3900 gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 3960 3960 atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 4020 4020

ctgtc 4025 <210> 33 <211> 4048 <212> DNA <213> artificial <220>ctgtc 4025 <210> 33 <211> 4048 <212> DNA <213> artificial <220>

<223> pBCM9MLG <400> 33 ctggagatcc tgataattct gaaatgagct gttgacaatt aatcatccgg ctcgtataat 60 gtggaattgt gagcgctcac aattccacat aaggaggtaa aaaaatgtgg aattgtgagc 120 gctcacaatt ccacataagg aggtaaaaaa atgatacatc atcatcatca tcatatgtcc 180 cctatactag gttattggaa aattaagggc cttgtgcaac ccactcgact tcttttggaa 240 tatcttgaag aaaaatatga agagcatttg tatgagcgcg atgaaggtga taaatggcga 300 aacaaaaagt ttgaattggg tttggagttt cccaatcttc cttattatat tgatggtgat 360 gttaaattaa cacagtctat ggccatcata cgttatatag ctgacaagca caacatgttg 420<223> pBCM9MLG <400> 33 ctggagatcc tgataattct gaaatgagct gttgacaatt aatcatccgg ctcgtataat 60 gtggaattgt gagcgctcac aattccacat aaggaggtaa aaaaatgtgg aattgtgagc 120 gctcacaatt ccacataagg aggtaaaaaa atgatacatc atcatcatca tcatatgtcc 180 cctatactag gttattggaa aattaagggc cttgtgcaac ccactcgact tcttttggaa 240 tatcttgaag aaaaatatga agagcatttg tatgagcgcg atgaaggtga taaatggcga 300 aacaaaaagt ttgaattggg tttggagttt cccaatcttc cttattatat tgatggtgat 360 gttaaattaa cacagtctat ggccatcata cgttatatag ctgacaagca caacatgttg 420

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.tXtSEQLTXT.tXt

ggtggttgtc ggtggttgtc caaaagagcg caaaagagcg tgcagagatt tgcagagatt tcaatgcttg tcaatgcttg aaggagcggt aaggagcggt tttggatatt tttggatatt 480 480 agatacggtg agatacggtg tttcgagaat tttcgagaat tgcatatagt tgcatatagt aaagactttg aaagactttg aaactctcaa aaactctcaa agttgatttt agttgatttt 540 540 cttagcaagc cttagcaagc tacctgaaat tacctgaaat gctgaaaatg gctgaaaatg ttcgaagatc ttcgaagatc gtttatgtca gtttatgtca taaaacatat taaaacatat SOO SOO ttaaatggtg ttaaatggtg atcatgtaac atcatgtaac ccatcctgac ccatcctgac ttcatgttgt ttcatgttgt atgacgctct atgacgctct tgatgttgtt tgatgttgtt 660 660 ttatacatgg ttatacatgg acccaatgtg acccaatgtg cctggatgcg cctggatgcg ttcccaaaat ttcccaaaat tagtttgttt tagtttgttt taaaaaacgt taaaaaacgt 720 720 attgaagcta attgaagcta tcccacaaat tcccacaaat tgataagtac tgataagtac ttgaaatcca ttgaaatcca gcaagtatat gcaagtatat agcatggcct agcatggcct 780 780 ttgcagggct ttgcagggct ggcaagccac ggcaagccac gtttggtggt gtttggtggt ggcgaccatc ggcgaccatc ctccaaaatc ctccaaaatc ggatctggtt ggatctggtt 840 840 ccgcgtggat ccgcgtggat ccccaggaat ccccaggaat tcccgggtcg tcccgggtcg actcgagcgg actcgagcgg ccgcatcgtg ccgcatcgtg ggaactgcag ggaactgcag 900 900 atgaattcga atgaattcga gctcggatcc gctcggatcc aagatcttct aagatcttct agacatatga agacatatga tcgataagct tcgataagct tgatatcggt tgatatcggt 960 960 accaccatgg accaccatgg tcgacctcga tcgacctcga gcccggggct gcccggggct agcataaccc agcataaccc cttggggcct cttggggcct ctaaacgggt ctaaacgggt 1020 1020 Cttgaggggt Cttgaggggt tttttgggga tttttgggga aatttccccg aatttccccg attaataaga attaataaga tgatcttctt tgatcttctt gagatcgttt gagatcgttt 1080 1080 tggtctgcgc tggtctgcgc gtaatctctt gtaatctctt gctctgaaaa gctctgaaaa cgaaaaaacc cgaaaaaacc gccttgcagg gccttgcagg gcggtttttc gcggtttttc 1140 1140 gaaggttctc gaaggttctc tgagctacca tgagctacca actctttgaa actctttgaa ccgaggtaac ccgaggtaac tggcttggag tggcttggag gagcgcagtc gagcgcagtc 1200 1200 accaaaactt accaaaactt gtcctttcag gtcctttcag tttagcctta tttagcctta accggcgcat accggcgcat gacttcaaga gacttcaaga ctaactcctc ctaactcctc 1260 1260 taaatcaatt taaatcaatt accagtggct accagtggct gctgccagtg gctgccagtg gtgcttttgc gtgcttttgc atgtctttcc atgtctttcc gggttggact gggttggact 1320 1320 caagacgata caagacgata gttaccggat gttaccggat aaggcgcagc aaggcgcagc ggtcggactg ggtcggactg aacggggggt aacggggggt tcgtgcatac tcgtgcatac 1380 1380 agtccagctt agtccagctt ggagcgaact ggagcgaact gcctacccgg gcctacccgg aactgagtgt aactgagtgt caggcgtgga caggcgtgga atgagacaaa atgagacaaa 1440 1440 cgcggccata cgcggccata acagcggaat acagcggaat gacaccggta gacaccggta aaccgaaagg aaccgaaagg caggaacagg caggaacagg agagcgcacg agagcgcacg 1500 1500 agggagccgc agggagccgc cagggggaaa cagggggaaa cgcctggtat cgcctggtat ctttatagtc ctttatagtc ctgtcgggtt ctgtcgggtt tcgccaccac tcgccaccac 1560 1560 tgatttgagc tgatttgagc gtcagatttc gtcagatttc gtgatgcttg gtgatgcttg tcaggggggc tcaggggggc ggagcctatg ggagcctatg gaaaaacggc gaaaaacggc 1620 1620 tttgccgcgg tttgccgcgg ccctctcact ccctctcact tccctgttaa tccctgttaa gtatcttcct gtatcttcct ggcatcttcc ggcatcttcc aggaaatctc aggaaatctc 1680 1680 cgccccgttc cgccccgttc gtaagccatt gtaagccatt tccgctcgcc tccgctcgcc gcagtcgaac gcagtcgaac gaccgagcgt gaccgagcgt agcgagtcag agcgagtcag 1740 1740 tgagcgagga tgagcgagga agcggaatat agcggaatat atcctgtatc atcctgtatc acatattctg acatattctg ctgacgcacc ctgacgcacc ggtgcagcct ggtgcagcct 1800 1800 tttttctcct tttttctcct gccacatgaa gccacatgaa gcacttcact gcacttcact gacaccctca gacaccctca tcagtgccaa tcagtgccaa catagtaagc catagtaagc 1860 1860 cagtatacac cagtatacac tccgctagcg tccgctagcg ctgaggtctt ctgaggtctt tgcgataggt tgcgataggt aaaggcgcgc aaaggcgcgc catcgaatgg catcgaatgg 1920 1920 cgcaaaacct cgcaaaacct ttcgcggtat ttcgcggtat ggcatgatag ggcatgatag cgcccggaag cgcccggaag agagtcaatt agagtcaatt cagggtggtg cagggtggtg 1980 1980 aatggtggtg aatggtggtg aatgtgaaac aatgtgaaac cagtaacgtt cagtaacgtt atacgatgtc atacgatgtc gcagagtatg gcagagtatg ccggtgtctc ccggtgtctc 2040 2040 ttatcagacc ttatcagacc gtttcccgcg gtttcccgcg tggtgaacca tggtgaacca ggccagccac ggccagccac gtttctgcga gtttctgcga aaacgcggga aaacgcggga 2100 2100 aaaagtggaa aaaagtggaa gcggcgatgg gcggcgatgg cggagctgaa cggagctgaa ttacattccc ttacattccc aaccgcgtgg aaccgcgtgg cacaacaact cacaacact 2160 2160 ggcgggcaaa ggcgggcaaa cagtcgttgc cagtcgttgc tgattggcgt tgattggcgt tgccacctcc tgccacctcc agtctggccc agtctggccc tgcacgcgcc tgcacgcgcc 2220 2220 gtcgcaaatt gtcgcaaatt gtcgcggcga gtcgcggcga ttaaatctcg ttaaatctcg cgccgatcaa cgccgatcaa ctgggtgcca ctgggtgcca gcgtggtggt gcgtggtggt 2280 2280 gtcgatggta gtcgatggta gaacgaagcg gaacgaagcg gcgtcgaagc gcgtcgaagc ctgtaaagcg ctgtaaagcg gcggtgcaca gcggtgcaca atcttctcgc atcttctcgc 2340 2340 gcaacgcgtc gcaacgcgtc agtgggctga agtgggctga tcattaacta tcattaacta tccgctggat tccgctggat gaccaggatg gaccaggatg ccattgctgt ccattgctgt 2400 2400 ggaagctgcc ggaagctgcc tgcactaatg tgcactaatg ttccggcgtt ttccggcgtt atttcttgat atttcttgat gtctctgacc gtctctgacc agacacccat agacacccat 2460 2460

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

caacagtatt caacagtatt attttctccc attttctccc atgaagacgg atgaagacgg tacgcgactg tacgcgactg ggcgtggagc ggcgtggagc atctggtcgc atctggtcgc 2520 2520 attgggtcac attgggtcac cagcaaatcg cagcaaatcg cgctgttagc cgctgttagc gggcccatta gggcccatta agttctgtct agttctgtct cggcgcgtct cggcgcgtct 2580 2580 gcgtctggct gcgtctggct ggctggcata ggctggcata aatatetcac aatatetcac tcgcaatcaa tcgcaatcaa attcagccga attcagccga tagcggaacg tagcggaacg 2640 2640 ggaaggcgac ggaaggcgac tggagtgcca tggagtgcca tgtccggttt tgtccggttt tcaacaaacc tcaacaaacc atgcaaatgc atgcaaatgc tgaatgaggg tgaatgaggg 2700 2700 catcgttccc catcgttccc actgcgatgc actgcgatgc tggttgccaa tggttgccaa cgatcagatg cgatcagatg gcgctgggcg gcgctgggcg caatgcgcgc caatgcgcgc 2760 2760 cattaccgag cattaccgag tccgggctgc tccgggctgc gcgttggtgc gcgttggtgc ggatatctcg ggatatctcg gtagtgggat gtagtgggat acgacgatac acgacgatac 2820 2820 cgaagacagc cgaagacagc tcatgttata tcatgttata tcccgccgtc tcccgccgtc aaccaccatc aaccaccatc aaacaggatt aaacaggatt ttcgcctgct ttcgcctgct 2880 2880 ggggcaaacc ggggcaaacc agcgtggacc agcgtggacc gcttgctgca gcttgctgca actctctcag actctctcag ggccaggcgg ggccaggcgg tgaagggcaa tgaagggcaa 2940 2940 tcagctgttg tcagctgttg cccgtctcac cccgtctcac tggtgaaaag tggtgaaaag aaaaaccacc aaaaaccacc ctggcgccca ctggcgccca atacgcaaac atacgcaaac 3000 3000 Cgcctctccc Cgcctctccc cgcgcgttgg cgcgcgttgg ccgattcatt ccgattcatt aatgcagctg aatgcagctg gcacgacagg gcacgacagg tttcccgact tttcccgact 3060 3060 ggaaagcggg ggaaagcggg cagtgagcgc cagtgagcgc aactttgcga aactttgcga taggtaaatt taggtaaatt tttctaaata tttctaaata cattcaaata cattcaaata 3120 3120 tgtatccgct tgtatccgct catgagacaa catgagacaa taaccctgat taaccctgat aaatgcttca aaatgcttca ataatattga ataatattga aaaaggaaga aaaaggaaga 3180 3180 gtatgagtat gtatgagtat tcaacatttc tcaacatttc cgtgtcgccc cgtgtcgccc ttattccctt ttattccctt ttttgcggca ttttgcggca ttttgccttc ttttgccttc 3240 3240 ctgtttttgc ctgtttttgc tcacccagaa tcacccagaa acgctggtga acgctggtga aagtaaaaga aagtaaaaga tgctgaagat tgctgaagat cagttgggtg cagttgggtg 3300 3300 cacgagtggg cacgagtggg ttacatcgaa ttacatcgaa ctggatctca ctggatctca acagcggtaa acagcggtaa gatccttgag gatccttgag agttttcgcc agttttcgcc 3360 3360 ccgaagaacg ccgaagaacg ttttccaatg ttttccaatg atgagcactt atgagcactt ttaaagttct ttaaagttct gctatgtggc gctatgtggc gcggtattat gcggtattat 3420 3420 cccgtattga cccgtattga cgccgggcaa cgccgggcaa gagcaactcg gagcaactcg gtcgccgcat gtcgccgcat acactattct acactattct cagaatgact cagaatgact 3480 3480 tggttgagta tggttgagta ctcaccagtc ctcaccagtc acagaaaagc acagaaaagc atcttacgga atcttacgga tggcatgaca tggcatgaca gtaagagaat gtaagagaat 3540 3540 tatgcagtgc tatgcagtgc tgccataacc tgccataacc atgagtgata atgagtgata acactgcggc acactgcggc caacttactt caacttactt ctgacaacga ctgacaacga 3600 3600 tcggaggacc tcggaggacc gaaggagcta gaaggagcta accgcttttt accgcttttt tg cacaacat tg cacaacat gggggatcat gggggatcat gtaactcgcc gtaactcgcc 3660 3660 ttgatcgttg ttgatcgttg ggaaccggag ggaaccggag ctgaatgaag ctgaatgaag ccataccaaa ccataccaaa cgacgagcgt cgacgagcgt gacaccacga gacaccacga 3720 3720 tgcctgtagc tgcctgtagc aatggcaaca aatggcaaca acgttgcgca acgttgcgca aactattaac aactattaac tggcgaacta tggcgaacta cttactctag cttactctag 3780 3780 cttcccggca cttcccggca acaattaata acaattaata gactggatgg gactggatgg aggcggataa aggcggataa agttgcagga agttgcagga ccacttctgc ccacttctgc 3840 3840 gctcggccct gctcggccct tccggctggc tccggctggc tggtttattg tggtttattg ctgataaatc ctgataaatc tggagccggt tggagccggt gagcgtgggt gagcgtgggt 3900 3900 ctcgcggtat ctcgcggtat cattgcagca cattgcagca ctggggccag ctggggccag atggtaagcc atggtaagcc ctcccgtatc ctcccgtatc gtagttatct gtagttatct 3960 3960 acacgacggg acacgacggg gagtcaggca gagtcaggca actatggatg actatggatg aacgaaatag aacgaaatag acagatcgct acagatcgct gagataggtg gagataggtg 4020 4020

cctcactgat taagcattgg taactgtccctcactgat taagcattgg taactgtc

40484048

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.tXtSEQLTXT.tXt

ggtggttgtc ggtggttgtc caaaagagcg caaaagagcg tgcagagatt tgcagagatt tcaatgcttg tcaatgcttg aaggagcggt aaggagcggt tttggatatt tttggatatt 480 480 agatacggtg agatacggtg tttcgagaat tttcgagaat tgcatatagt tgcatatagt aaagactttg aaagactttg aaactctcaa aaactctcaa agttgatttt agttgatttt 540 540 cttagcaagc cttagcaagc tacctgaaat tacctgaaat gctgaaaatg gctgaaaatg ttcgaagatc ttcgaagatc gtttatgtca gtttatgtca taaaacatat taaaacatat 600 600 ttaaatggtg ttaaatggtg atcatgtaac atcatgtaac ccatcctgac ccatcctgac rtcatgttgt rtcatgttgt atgacgctct atgacgctct tgatgttgtt tgatgttgtt 660 660 ttatacatgg ttatacatgg acccaatgtg acccaatgtg cctggatgcg cctggatgcg ttcccaaaat ttcccaaaat tagtttgttt tagtttgttt taaaaaacgt taaaaaacgt 720 720 attgaagcta attgaagcta tcccacaaat tcccacaaat tgataagtac tgataagtac ttgaaatcca ttgaaatcca gcaagtatat gcaagtatat agcatggcct agcatggcct 780 780 ttgcagggct ttgcagggct ggcaagccac ggcaagccac gtttggtggt gtttggtggt ggcgaccatc ggcgaccatc ctccaaaatc ctccaaaatc ggatctggtt ggatctggtt 840 840 ccgcgtggat ccgcgtggat ccccaggaat ccccaggaat tcccgggtcg tcccgggtcg actcgagcgg actcgagcgg ccgcatcgtg ccgcatcgtg ggaactgcag ggaactgcag 900 900 atgaattcga atgaattcga gctcggatcc gctcggatcc aagatcttct aagatcttct agacatatga agacatatga tcgataagct tcgataagct tgatatcggt tgatatcggt 960 960 accaccatgg accaccatgg tcgacctcga tcgacctcga gcccggggct gcccggggct agcataaccc agcataaccc cttggggcct cttggggcct ctaaacgggt ctaaacgggt 1020 1020 cttgaggggt cttgaggggt tttttgggga tttttgggga aatttccccg aatttccccg attaataaga attaataaga tgatcttctt tgatcttctt gagatcgttt gagatcgttt 1080 1080 tggtctgcgc tggtctgcgc gtaatctctt gtaatctctt gctctgaaaa gctctgaaaa cgaaaaaacc cgaaaaaacc gccttgcagg gccttgcagg gcggtttttc gcggtttttc 1140 1140 gaaggttctc gaaggttctc tgagctacca tgagctacca actctttgaa actctttgaa ccgaggtaac ccgaggtaac tggcttggag tggcttggag gagcgcagtc gagcgcagtc 1200 1200 accaaaactt accaaaactt gtcctttcag gtcctttcag tttagcctta tttagcctta accggcgcat accggcgcat gacttcaaga gacttcaaga ctaactcctc ctaactcctc 1260 1260 taaatcaatt taaatcaatt accagtggct accagtggct gctgccagtg gctgccagtg gtgcttttgc gtgcttttgc atgtctttcc atgtctttcc gggttggact gggttggact 1320 1320 caagacgata caagacgata gttaccggat gttaccggat aaggcgcagc aaggcgcagc ggtcggactg ggtcggactg aacggggggt aacggggggt tcgtgcatac tcgtgcatac 1380 1380 agtccagctt agtccagctt ggagcgaact ggagcgaact gcctacccgg gcctacccgg aactgagtgt aactgagtgt caggcgtgga caggcgtgga atgagacaaa atgagacaaa 1440 1440 cgcggccata cgcggccata acagcggaat acagcggaat gacaccggta gacaccggta aaccgaaagg aaccgaaagg caggaacagg caggaacagg agagcgcacg agagcgcacg 1500 1500 agggagccgc agggagccgc cagggggaaa cagggggaaa cgcctggtat cgcctggtat ctttatagtc ctttatagtc ctgtcgggtt ctgtcgggtt tcgccaccac tcgccaccac 1560 1560 tgatttgagc tgatttgagc gtcagatttc gtcagatttc gtgatgcttg gtgatgcttg tcaggggggc tcaggggggc ggagcctatg ggagcctatg gaaaaacggc gaaaaacggc 1620 1620 tttgccgcgg tttgccgcgg ccctctcact ccctctcact tccctgttaa tccctgttaa gtatcttcct gtatcttcct ggcatcttcc ggcatcttcc aggaaatctc aggaaatctc 1680 1680 cgccccgttc cgccccgttc gtaagccatt gtaagccatt tccgctcgcc tccgctcgcc gcagtcgaac gcagtcgaac gaccgagcgt gaccgagcgt agcgagtcag agcgagtcag 1740 1740 tgagcgagga tgagcgagga agcggaatat agcggaatat atcctgtatc atcctgtatc acatattctg acatattctg ctgacgcacc ctgacgcacc ggtgcagcct ggtgcagcct 1800 1800 tttttctcct tttttctcct gccacatgaa gccacatgaa gcacttcact gcacttcact gacaccctca gacaccctca tcagtgccaa tcagtgccaa catagtaagc catagtaagc 1860 1860 cagtatacac cagtatacac tccgctagcg tccgctagcg ctgaggtctt ctgaggtctt tgcgataggt tgcgataggt aaaggcgcgc aaaggcgcgc catcgaatgg catcgaatgg 1920 1920 cgcaaaacct cgcaaaacct ttcgcggtat ttcgcggtat ggcatgatag ggcatgatag cgcccggaag cgcccggaag agagtcaatt agagtcaatt cagggtggtg cagggtggtg 1980 1980 aatggtggtg aatggtggtg aatgtgaaac aatgtgaaac cagtaacgtt cagtaacgtt atacgatgtc atacgatgtc gcagagtatg gcagagtatg ccggtgtctc ccggtgtctc 2040 2040 ttatcagacc ttatcagacc gtttcccgcg gtttcccgcg tggtgaacca tggtgaacca ggccagccac ggccagccac gtttctgcga gtttctgcga aaacgcggga aaacgcggga 2100 2100 aaaagtggaa aaaagtggaa gcggcgatgg gcggcgatgg cggagctgaa cggagctgaa ttacattccc ttacattccc aaccgcgtgg aaccgcgtgg cacaacaact cacaacact 2160 2160 ggcgggcaaa ggcgggcaaa cagtcgttgc cagtcgttgc tgattggcgt tgattggcgt tgccacctcc tgccacctcc agtctggccc agtctggccc tgcacgcgcc tgcacgcgcc 2220 2220 gtcgcaaatt gtcgcaaatt gtcgcggcga gtcgcggcga ttaaatctcg ttaaatctcg cgccgatcaa cgccgatcaa ctgggtgcca ctgggtgcca gcgtggtggt gcgtggtggt 2280 2280 gtcgatggta gtcgatggta gaacgaagcg gaacgaagcg gcgtcgaagc gcgtcgaagc ctgtaaagcg ctgtaaagcg gcggtgcaca gcggtgcaca atcttctcgc atcttctcgc 2340 2340 gcaacgcgtc gcaacgcgtc agtgggctga agtgggctga tcattaacta tcattaacta tccgctggat tccgctggat gaccaggatg gaccaggatg ccattgctgt ccattgctgt 2400 2400 ggaagctgcc ggaagctgcc tgcactaatg tgcactaatg ttccggcgtt ttccggcgtt atttcttgat atttcttgat gtctctgacc gtctctgacc agacacccat agacacccat 2460 2460

PL 228 024 Β1PL 228 024 Β1

SEQLTXT.txtSEQLTXT.txt

caacagtatt caacagtatt attttctccc attttctccc atgaagacgg atgaagacgg tacgcgactg tacgcgactg ggcgtggagc ggcgtggagc atetggtcgc atetggtcgc 2520 2520 attgggtcac attgggtcac cagcaaatcg cagcaaatcg cgctgttagc cgctgttagc gggcccatta gggcccatta agttctgtct agttctgtct cggcgcgtct cggcgcgtct 2580 2580 gcgtctggct gcgtctggct ggctggcata ggctggcata aatatctcac aatatctcac tcgcaatcaa tcgcaatcaa attcagccga attcagccga tagcggaacg tagcggaacg 2640 2640 ggaaggcgac ggaaggcgac tggagtgcca tggagtgcca tgtccggttt tgtccggttt tcaacaaacc tcaacaaacc atgcaaatgc atgcaaatgc tgaatgaggg tgaatgaggg 2700 2700 catcgttccc catcgttccc actgcgatgc actgcgatgc tggttgccaa tggttgccaa cgatcagatg cgatcagatg gcgctgggcg gcgctgggcg caatgcgcgc caatgcgcgc 2760 2760 cattaccgag cattaccgag tccgggctgc tccgggctgc gcgttggtgc gcgttggtgc ggatatctcg ggatatctcg gtagtgggat gtagtgggat acgacgatac acgacgatac 2820 2820 cgaagacagc cgaagacagc tcatgttata tcatgttata tcccgccgtc tcccgccgtc aaccaccatc aaccaccatc aaacaggatt aaacaggatt ttcgcctgct ttcgcctgct 2880 2880 ggggcaaacc ggggcaaacc agcgtggacc agcgtggacc gcttgctgca gcttgctgca actctctcag actctctcag ggccaggcgg ggccaggcgg tgaagggcaa tgaagggcaa 2940 2940 tcagctgttg tcagctgttg cccgtctcac cccgtctcac tggtgaaaag tggtgaaaag aaaaaccacc aaaaaccacc ctggcgccca ctggcgccca atacgcaaac atacgcaaac 3000 3000 cgcctctccc cgcctctccc cgcgcgttgg cgcgcgttgg ccgattcatt ccgattcatt aatgcagctg aatgcagctg gcacgacagg gcacgacagg tttcccgact tttcccgact 3060 3060 ggaaagcggg ggaaagcggg cagtgagcgc cagtgagcgc aactttgcga aactttgcga taggtaaatt taggtaaatt tttctaaata tttctaaata cattcaaata cattcaaata 3120 3120 tgtatccgct tgtatccgct catgagacaa catgagacaa taaccctgat taaccctgat aaatgcttca aaatgcttca ataatattga ataatattga aaaaggaaga aaaaggaaga 3180 3180 gtatgagtat gtatgagtat tcaacatttc tcaacatttc cgtgtcgccc cgtgtcgccc ttattccctt ttattccctt ttttgcggca ttttgcggca ttttgccttc ttttgccttc 3240 3240 ctgtttttgc ctgtttttgc tcacccagaa tcacccagaa acgctggtga acgctggtga aagtaaaaga aagtaaaaga tgctgaagat tgctgaagat cagttgggtg cagttgggtg 3300 3300 cacgagtggg cacgagtggg ttacatcgaa ttacatcgaa ctggatctca ctggatctca acagcggtaa acagcggtaa gatccttgag gatccttgag agttttcgcc agttttcgcc 3360 3360 ccgaagaacg ccgaagaacg ttttccaatg ttttccaatg atgagcactt atgagcactt ttaaagttct ttaaagttct gctatgtggc gctatgtggc gcggtattat gcggtattat 3420 3420 cccgtattga cccgtattga cgccgggcaa cgccgggcaa gagcaactcg gagcaactcg gtcgccgcat gtcgccgcat acactattct acactattct cagaatgact cagaatgact 3480 3480 tggttgagta tggttgagta ctcaccagtc ctcaccagtc acagaaaagc acagaaaagc atcttacgga atcttacgga tggcatgaca tggcatgaca gtaagagaat gtaagagaat 3540 3540 tatgcagtgc tatgcagtgc tgccataacc tgccataacc atgagtgata atgagtgata acactgcggc acactgcggc caacttactt caacttactt ctgacaacga ctgacaacga 3600 3600 tcggaggacc tcggaggacc gaaggagcta gaaggagcta accgcttttt accgcttttt tgcacaacat tgcacaacat gggggatcat gggggatcat gtaactcgcc gtaactcgcc 3660 3660 ttgatcgttg ttgatcgttg ggaaccggag ggaaccggag ctgaatgaag ctgaatgaag ccataccaaa ccataccaaa cgacgagcgt cgacgagcgt gacaccacga gacaccacga 3720 3720 tgcctgtagc tgcctgtagc aatggcaaca aatggcaaca acgttgcgca acgttgcgca aactattaac aactattaac tggcgaacta tggcgaacta cttactctag cttactctag 3780 3780 cttcccggca cttcccggca acaattaata acaattaata gactggatgg gactggatgg aggcggataa aggcggataa agttgcagga agttgcagga ccacttctgc ccacttctgc 3840 3840 gctcggccct gctcggccct tccggctggc tccggctggc tggtttattg tggtttattg ctgataaatc ctgataaatc tggagccggt tggagccggt gagcgtgggt gagcgtgggt 3900 3900 ctcgcggtat ctcgcggtat cattgcagca cattgcagca ctggggccag ctggggccag atggtaagcc atggtaagcc ctcccgtatc ctcccgtatc gtagttatct gtagttatct 3960 3960 acacgacggg acacgacggg gagtcaggca gagtcaggca actatggatg actatggatg aacgaaatag aacgaaatag acagatcgct acagatcgct gagataggtg gagataggtg 4020 4020

cctcactgat taagcattgg taactgtccctcactgat taagcattgg taactgtc

Claims (13)

1. Cząsteczka kwasu nukleinowego kodująca region promotorowy określony sekwencją wybraną spośród sekwencji nr 1-3;1. Nucleic acid molecule encoding a promoter region determined by a sequence selected from sequences No. 1-3; 2. Cząsteczka kwasu nukleinowego kodująca region linkerowy określony sekwencją wybraną spośród sekwencji nr 4-12, korzystnie region polilinkerowy posiadający sekwencję nr 4.2. A nucleic acid molecule encoding a linker region defined by a sequence selected from sequence No. 4-12, preferably a polylinker region having the sequence No. 4. 3. Zestaw wektorów ekspresyjnych, znamienny tym, że składa się z różnych wektorów ekspresyjnych, przy czym każdy z wektorów zawiera:3. An expression vector set comprising different expression vectors, each vector comprising: - połączone funkcjonalnie region promotorowy określony sekwencją wybraną spośród sekwencji nr od 1 do 3 oraz region linkerowy określony sekwencją wybraną spośród sekwencji nr od 4 do 12,- an operably linked promoter region defined by a sequence selected from among sequences Nos. 1 to 3 and a linker region defined by a sequence selected from sequences Nos. 4 to 12, - region inicjacji replikacji określony sekwencją wybraną spośród sekwencji nr od 13 do 15, przy czym wektory wchodzące w skład zestawu obejmują wszystkie kombinacje wspomnianych wariantów regionu promotorowego z wspomnianymi wariantami regionu inicjacji replikacji.- a replication origin region defined by a sequence selected from sequences Nos. 13 to 15, the vectors comprising the set comprising all combinations of said promoter region variants with said replication origin variants. 4. Zestaw według zastrz. 3, znamienny tym, że wektor ekspresyjny zawiera ponadto sekwencję kwasu nukleinowego kodującą cząsteczkę reporterową, korzystnie białko zielonej fluorescencji lub białko różowej fluorescencji.4. The kit according to p. The method of claim 3, characterized in that the expression vector further comprises a nucleic acid sequence encoding a reporter molecule, preferably a green fluorescent protein or a pink fluorescent protein. 5. Zestaw według zastrz. 3, znamienny tym, że wektor ekspresyjny jest cząsteczką liniową.5. The kit according to p. The method of claim 3, wherein the expression vector is a linear molecule. 6. Zestaw według zastrz. 3, znamienny tym, że wektor ekspresyjny koduje region odpowiadający aminokwasom WELQ rozpoznawanym przez proteazę Clean-Cut;6. The kit according to p. 3. The method of claim 3, wherein the expression vector encodes a region corresponding to WELQ amino acids recognized by Clean-Cut protease; 7. Zestaw według zastrz.6, znamienny tym, że poniżej sekwencji odpowiadającej aminokwasom WELQ znajduje się miejsce inicjacji transkrypcji.The kit according to claim 6, characterized in that the transcription initiation site is located downstream of the sequence corresponding to the WELQ amino acids. 8. Zestaw według zastrz. 6, znamienny tym, że powyżej sekwencji WELQ znajduje się sekwencja odpowiadająca aminokwasom MIHHHHHH.8. The kit according to p. The method of claim 6, characterized in that there is a sequence corresponding to the amino acids MIHHHHHH upstream of the WELQ sequence. 9. Zestaw według zastrz. 6, znamienny tym, że zawiera wektory o sekwencjach nr 16 do 24.9. The kit according to p. 6. The method according to claim 6, characterized in that it comprises vectors with sequences No. 16 to 24. 10. Zestaw według zastrz. 6, znamienny tym, że zawiera wektory o sekwencjach nr 25 do 33.10. The kit according to p. 6. The method according to claim 6, characterized in that it comprises vectors of sequence Nos. 25 to 33. 11. Sposób produkcji białek rekombinowanych, znamienny tym, że komórki E.coli transformuje się zestawem wektorów ekspresyjnych określonym w zastrz. od 3 do 10 zawierających sekwencję kodującą białko rekombinowane, prowadzi się próbną hodowlę uzyskanych transformantów w ustalonych warunkach hodowli, określa się poziom ekspresji uzyskiwanej dla różnych transformantów, a następnie prowadzi się ostateczną hodowlę produkcyjną szczepu transformanta dającego najwyższy poziom ekspresji i izoluje się białko rekombinantowe z brzeczki hodowlanej.11. A method of producing recombinant proteins, characterized in that E. coli cells are transformed with the set of expression vectors as defined in claim 1. from 3 to 10 containing the recombinant protein coding sequence, the obtained transformants are cultured under established culture conditions, the expression level obtained for the various transformants is determined, then the final production culture of the transformant strain giving the highest expression level is carried out and the recombinant protein is isolated from the broth breeding. 12. Sposób według zastrzeżenia 11, znamienny tym, że do uwalniania białka rekombinowanego wykorzystywana jest proteaza Clean-Cut.12. The method according to claim 11, characterized in that Clean-Cut protease is used to release the recombinant protein. 13. Sposób według zastrzeżeń 11-12, znamienny tym, że do procesu odcinania metki fuzyjnej i uwalniania N-końca białka rekombinowanego oraz/lub procesu dowolnego kształtowania N-końca białka rekombinowanego wykorzystywana jest proteaza Clean-Cut.13. Method according to claims 11-12, characterized in that a Clean-Cut protease is used for the process of cleaving the fusion tag and releasing the N-terminus of the recombinant protein and / or the process of arbitrary shaping the N-terminus of the recombinant protein.
PL414704A 2015-11-06 2015-11-06 Expression vector set PL228024B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PL414704A PL228024B1 (en) 2015-11-06 2015-11-06 Expression vector set

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PL414704A PL228024B1 (en) 2015-11-06 2015-11-06 Expression vector set

Publications (2)

Publication Number Publication Date
PL414704A1 PL414704A1 (en) 2017-05-08
PL228024B1 true PL228024B1 (en) 2018-02-28

Family

ID=58643853

Family Applications (1)

Application Number Title Priority Date Filing Date
PL414704A PL228024B1 (en) 2015-11-06 2015-11-06 Expression vector set

Country Status (1)

Country Link
PL (1) PL228024B1 (en)

Also Published As

Publication number Publication date
PL414704A1 (en) 2017-05-08

Similar Documents

Publication Publication Date Title
KR102729768B1 (en) Transgenic selection methods and compositions
DK2768848T3 (en) METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
AU2019375975B2 (en) Artificial expression constructs for selectively modulating gene expression in excitatory cortical neurons
AU2016232146B2 (en) Optimized liver-specific expression systems for FVIII and FIX
KR102683284B1 (en) Combination of a bactericide and a lysosomal alkalinizing agent for the treatment of bacterial infections
AU2017323629B9 (en) PD-1 homing endonuclease variants, compositions, and methods of use
KR101982360B1 (en) Method for the generation of compact tale-nucleases and uses thereof
US20250135031A1 (en) Single-vector gene construct comprising insulin and glucokinase genes
KR20210149060A (en) RNA-induced DNA integration using TN7-like transposons
CN112912112B (en) Liver-specific nucleic acid regulatory elements and methods and uses thereof
CN107849583B (en) Means and methods for controlling cell proliferation using cell division loci
CN116323942A (en) Compositions for genome editing and methods of use thereof
CN101835798A (en) Methods and compositions for targeting proteins of interest to host cell envelopes
US20030059870A1 (en) Recombinant bacterial strains for the production of natural nucleosides and modified analogues thereof
KR102292446B1 (en) Marker composition for transformed organism, transformed organism and method for transformation
KR20220142502A (en) Muscle-specific nucleic acid regulatory elements and methods and uses thereof
CN107988259B (en) SmartBac baculovirus expression system and its application
PL228024B1 (en) Expression vector set
RU2781083C2 (en) Options, compositions, and methods for use of homing-endonuclease pd-1
CA2974235C (en) Single-vector gene construct comprising insulin and glucokinase genes
HK40082332A (en) Tools and methods for using cell division loci to control proliferation of cells
TW202403048A (en) Therapeutic adeno-associated virus using codon optimized nucleic acid encoding alpha-glucosidase (gaa) for treating pompe disease, with signal peptide modifications
HK40082332B (en) Tools and methods for using cell division loci to control proliferation of cells
KR20260017006A (en) Tools and methods for using cell division loci to control proliferation of cells