PL190073B1 - Fusion-type his-proinsuline protein, dna sequence, exparession vectors and a method of manufacturing human proinsuline in a from of fusion-type his-proinsuline protein - Google Patents

Fusion-type his-proinsuline protein, dna sequence, exparession vectors and a method of manufacturing human proinsuline in a from of fusion-type his-proinsuline protein

Info

Publication number
PL190073B1
PL190073B1 PL98326333A PL32633398A PL190073B1 PL 190073 B1 PL190073 B1 PL 190073B1 PL 98326333 A PL98326333 A PL 98326333A PL 32633398 A PL32633398 A PL 32633398A PL 190073 B1 PL190073 B1 PL 190073B1
Authority
PL
Poland
Prior art keywords
dna
formula
proinsulin
expression vector
symbol
Prior art date
Application number
PL98326333A
Other languages
Polish (pl)
Other versions
PL326333A1 (en
Inventor
Sławomir Dąbrowski
Józef Kur
Original Assignee
Dabrowski Slawomir
Kur Jozef
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dabrowski Slawomir, Kur Jozef filed Critical Dabrowski Slawomir
Priority to PL98326333A priority Critical patent/PL190073B1/en
Publication of PL326333A1 publication Critical patent/PL326333A1/en
Publication of PL190073B1 publication Critical patent/PL190073B1/en

Links

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

1. Fusion protein of His-proinsuline with formula 1. Formula 1. IMAGE> Sequence information, LENGTH: 129 amino acids, TYPE: amino-acidic, TOPOLOGY: linear, MOLECULE TYPE: protein.

Description

Przedmiotem wynalazku jest fuzyjne białko His-proinsuliny, sekwencja DNA, wektory ekspresyjne oraz sposób wytwarzania ludzkiej proinsuliny w postaci fuzyjnego białka Hisproinsuliny.The invention relates to a His-proinsulin fusion protein, a DNA sequence, expression vectors, and a method of producing human proinsulin in the form of a Hisproinsulin fusion protein.

W obecnym stanie techniki znane są dwa sposoby otrzymywania ludzkiej proinsuliny z użyciem technik rekombinacji DNA.Two methods are known in the art to obtain human proinsulin using recombinant DNA techniques.

Pierwszy znany sposób polega na tym, że każdy z genów kodujących insulinę (gen kodujący łańcuch A i gen kodujący łańcuch B) zostaje sklonowany i jest produkowany w dwóch oddzielnych układach ekspresyjnych. Otrzymane peptydy następnie miesza się i formuje się z nich aktywną insulinę (Goeddel et al., (1979) Proc. Natl. Acad. Sci. U.S.A. 76: 106-110; Chance et al., (1981) Diabetes Care, 4:149-154).The first known method is that each of the genes encoding insulin (the gene encoding the A chain and the gene encoding the B chain) is cloned and produced in two separate expression systems. The resulting peptides are then mixed and formed into active insulin (Goeddel et al., (1979) Proc. Natl. Acad. Sci. USA 76: 106-110; Chance et al., (1981) Diabetes Care, 4: 149 -154).

Drugi znany sposób polega na zastosowaniu genów kodujących łańcuch A i B przedzielonych genem pochodzącym z plazmidu. W efekcie produkowana w bakteriach fuzyjna proinsulina jest analogiem białka produkowanego w ludzkiej trzustce (William i wsp. (1982) Science, 215:687-689; Frank i wsp. (1981) w: Peptide, Proceedings of the Seventh American Peptide Symposium, Rich, D. H. i Gross, E. (edytorzy), Pierce Chemical Co., Rockford, III., str. 729-738). Sposób ten jest stosunkowo dobry i użyteczny, ponieważ uzyskanie proinsuliny w jednym etapie fermentacji nie nastręcza wielu problemów, a uzyskaną proinsulinę można łatwiej przekształcić w aktywną biologicznie formę insuliny. Wydajność ekspresji wewnątrzkomórkowej dla znanych białek m. in. proinsuliny jest odwrotnie proporcjonalna do długości genu kodującego białko.The second known method is to use the genes encoding the A and B chain separated by a gene derived from a plasmid. As a result, the fusion proinsulin produced in bacteria is an analog of a protein produced in the human pancreas (William et al. (1982) Science, 215: 687-689; Frank et al. (1981) in: Peptide, Proceedings of the Seventh American Peptide Symposium, Rich , DH and Gross, E. (editors), Pierce Chemical Co., Rockford, III., Pp. 729-738). This method is relatively good and useful because obtaining proinsulin in one fermentation step does not pose many problems, and the obtained proinsulin can be more easily converted into a biologically active form of insulin. The efficiency of intracellular expression for known proteins, incl. proinsulin is inversely proportional to the length of the gene encoding the protein.

W ostatniej dekadzie grupy badawcze zastosowały różne peptydy fuzyjne wpływające na ekspresję genu proinsuliny. Jednym z przykładów może być zastosowanie fragmentu genu beta-galaktozydazy (Guo i wsp. (1984) Gene 9:251-255; Yoon i wsp. (1988) w: Recombinant DNA Techniąues, J. W. Yoon (edytor), KOSCO Inc. Seoul, str. 93-115), lub zamiana go na jeszcze krótszy peptyd fuzyjny (Sung i wsp. (1986) Proc:. Natl. Acad. Sci. U.S.A. 83:561-565). Dodatkowo uzyskano pozytywne rezultaty z uzyskaniem stabilnej ekspresji proinsuliny poprzez kombinację klonowania kilku genów proinsuliny wraz z miejscem wiązania dla rybosomów pod wspólny promotor z jednoczesnym zastosowaniem szczepów komórkowychIn the last decade, research groups have used various fusion peptides influencing the expression of the proinsulin gene. One example would be the use of a fragment of the beta-galactosidase gene (Guo et al. (1984) Gene 9: 251-255; Yoon et al. (1988) in Recombinant DNA Techniques, JW Yoon (editor), KOSCO Inc. Seoul, pp. 93-115), or replacing it with an even shorter fusion peptide (Sung et al. (1986) Proc: Natl. Acad. Sci. USA 83: 561-565). Additionally, positive results were obtained with stable expression of proinsulin by combining the cloning of several proinsulin genes with a ribosome binding site under a common promoter with the simultaneous use of cell strains

E. coli pozbawionych aktywności proteolitycznej w celu zapobieżenia wewnątrz-komórkowej degradacji proinsuliny. W rezultacie tych badań do dzisiaj wykonuje się małe ulepszenia systemów ekspresji, ale wciąż istnieją pewne ograniczenia jak na przykład problem zmniejszenia wielkości peptydu fuzyjnego, długi czas ekspresji, problemy związane z uzyskaniem poprawnie strukturalnej proinsuliny in vitro, niska wydajność.E. coli lacking proteolytic activity to prevent intracellular degradation of proinsulin. As a result of these studies, small improvements to the expression systems are still made today, but there are still some limitations, such as the problem of reducing the size of the fusion peptide, long expression time, problems with obtaining a properly structured proinsulin in vitro, low yield.

Wynalazek stanowi fuzyjne białko His-proinsuliny o wzorze 1, które może być łatwo przetransformowane in vitro do ludzkiej proinsuliny i insuliny, oraz sekwencja DNA kodująca fuzyjne białko His-proinsuliny o wzorze 2.The invention provides a His-proinsulin fusion protein of formula 1, which can be easily transformed in vitro into human proinsulin and insulin, and a DNA sequence encoding a His-proinsulin fusion protein of formula 2.

Wynalazkiem jest również wektor ekspresyjny posiadający wklonowane DNA z fragmentem kodującym 43 aminokwasowy peptyd liderowy połączony z genem proinsuliny ludzkiej pod regulacyjną kontrolą silnego promotora bakteriofaga T7 z miejscem regulatorowym dla represora Lacl, z miejscem wiązania rybosomów rbs z bakteriofaga T7, z kodonem „stop” zmienionym z naturalnego kodonu UGA na sztucznie wprowadzony UAA, z genem oporności na kanamycynę, z origin ColEl, z origin faga fl, z genem kodującym represor Lacl - o wzorze 3 i o symbolu pAp2.13.1.The invention also provides an expression vector having cloned DNA with a fragment encoding the 43 amino acid leader peptide linked to the human proinsulin gene under the regulatory control of the strong T7 bacteriophage promoter with a Lacl repressor regulatory site, with the rbs ribosome binding site of bacteriophage T7, with the "stop" codon changed from of the natural UGA codon on the artificially introduced UAA, with the kanamycin resistance gene, from origin ColEl, from phage origin fl, with the gene encoding the LacI repressor - formula 3 and symbol pAp2.13.1.

Inna odmiana wektora ekspresyjnego stanowiąca także wynalazek zawierający wklonowane DNA ze zdublowanym fragmentem kodującym 43 aminokwasowy peptyd liderowy połączony z genem proinsuliny ludzkiej pod regulacyjną kontrolą silnego promotora bakteriofaga T7 z miejscem regulatorowym dla represora Lacl, z miejscem wiązania rybosomów rbs z bakteriofaga T7, z kodonem „stop” zmienionym z naturalnego kodonu UGA na sztucznie wprowadzony UAA, z genem oporności na kanamycynę, z origin ColEl, z origin faga fl, z genem kodującym represor Lacl - o wzorze 4 i o symbolu pAp2.13.2x.Another variant of the expression vector, also comprising the cloned DNA with a duplicate encoding the 43 amino acid leader peptide fused to the human proinsulin gene under the regulatory control of the strong T7 bacteriophage promoter with a Lacl repressor regulatory site, with the T7 rbs ribosome binding site, with the "stop codon" "Changed from the natural UGA codon to the artificially introduced UAA, with the kanamycin resistance gene, from origin ColEl, from phage origin fl, with the gene encoding the Lacl repressor - formula 4 and symbol pAp2.13.2x.

W obu odmianach wektora ekspresyjnego zastosowany został jako peptyd fuzyjny fragment zawierający 43 aminokwasy w tym domenę 6 kolejnych histydyn wykorzystywanych do bardzo efektywnej metody oczyszczania w chromatografii metalo-powinowactwowej (Porath i wsp. (1975) Nature 258: 598-599) oraz sekwencję aminokwasową silnie rozpoznawaną i ciętą przez enterokinazę i trypsynę AspAspApsAspLys, pozwalającą na łatwe usunięcieIn both variants of the expression vector, a fragment containing 43 amino acids, including the domain of 6 consecutive histidines, was used as a fusion peptide, used for a very effective method of purification in metal-affinity chromatography (Porath et al. (1975) Nature 258: 598-599) and the amino acid sequence strongly recognized and cleaved by enterokinase and trypsin AspAspApsAspLys, allowing for easy removal

190 073 peptydu fuzyjnego w oczyszczonym białku i przekształcenie go w ludzką proinsulinę i insulinę. Dzięki zastosowaniu w wektorach ekspresyjnych bardzo efektywnego promotora bakteriofaga T7 wraz z miejscem wiązania rybosomów faga T7 (T7 rbs), maksimum ekspresji proinsuliny uzyskiwane jest w ciągu 3 godzin po indukcji ekspresji za pomocą izo-propylotio-galaktozydu (IPTG) lub laktozy, która jest kontrolowana przez represor Lacl, blokujący promotor do momentu indukcji.190 073 of the fusion peptide in the purified protein and its conversion to human proinsulin and insulin. Due to the use of a very efficient promoter of bacteriophage T7 in expression vectors together with the ribosome binding site of phage T7 (T7 rbs), the maximum expression of proinsulin is obtained within 3 hours after induction of expression with iso-propylthio-galactoside (IPTG) or lactose, which is controlled by the Lacl repressor, blocking the promoter until induction.

Ponadto dla wektora ekspresyjnego pAp.2.13.2x, gdzie zdublowano gen kodujący proinsulinę wraz dwoma układami promotorowymi, uzyskiwana jest około 50% wyższa ekspresja w stosunku do wektora ekspresyjnego z jednym genem (wektor ekspresyjny pAp2.13.1).Moreover, for the expression vector pAp.2.13.2x, where the proinsulin gene has been duplicated together with two promoter systems, about 50% higher expression is obtained compared to the expression vector with one gene (pAp2.13.1 expression vector).

W wyniku transformacji wektorem ekspresyjnym o wzorze 3 i o symbolu pAp2.13.1 komórek bakterii Escherichia coli zawierających gen kodujący polimerazę RNA faga T7 otrzymany został nieznany dotychczas szczep bakterii Escherichia coli BL21(DE3) pAp2.13.1, zaś w przypadku transformacji wektorem o wzorze 4 i o symbolu pAp2.13.2x komórek bakterii Escherichia coli zawierających gen kodujący polimerazę RNA faga T7 otrzymany został nieznany dotychczas szczep bakterii Escherichia coli BL21(DE3) pAp2.13.2x.As a result of transformation with the expression vector of formula 3 and the symbol pAp2.13.1 of Escherichia coli bacterial cells containing the gene coding for T7 phage RNA polymerase, a previously unknown strain of Escherichia coli BL21 (DE3) pAp2.13.1 was obtained, and in the case of transformation with the vector of formula 4 and the symbol pAp2.13.2x of Escherichia coli bacterial cells containing the gene coding for T7 phage RNA polymerase, a previously unknown strain of Escherichia coli BL21 (DE3) pAp2.13.2x was obtained.

Sposób wytwarzania ludzkiej proinsuliny w postaci fuzyjnego białka His-proinsuliny 0 wzorze 1 charakteryzuje się według wynalazku tym, że uzyskuje się fragment DNA kodujący ludzką proinsulinę wraz z sekwencją aminokwasową AspAspAspAspLys oraz z kodonem zdegenerowanym UAa sygnału „stop” dla procesu translacji poprzez amplifikację DNA i klonuje się do plazmidu DNA pET30LIC (Novagen, Wielka Brytania). Plazmid DNA Pet30LIC (Novagen, Wielka Brytania) posiada silny promotor faga T7 z miejscem regulatorowym dla represora Lacl, z miejscem wiązania rybosomów rbs z faga T7, z silnym terminatorem faga T7 oraz genem oporności na kanamycynę, genem kodującym represor Lacl, oraz origin faga fl i origin ColEl.The method of producing human proinsulin in the form of a His-proinsulin fusion protein of formula 1 is characterized according to the invention in that a DNA fragment encoding human proinsulin is obtained together with the amino acid sequence AspAspAspAspLys and with the degenerate codon UAa of the "stop" signal for translation by DNA amplification and cloned to the pET30LIC DNA plasmid (Novagen, UK). The Pet30LIC DNA plasmid (Novagen, UK) has a strong T7 phage promoter with a regulatory site for the Lacl repressor, with a T7 rbs ribosomal binding site, with a strong T7 terminator, and a kanamycin resistance gene, a gene encoding the Lacl repressor, and phage origin fl and origin ColEl.

Po klonowaniu otrzymuje się wektor ekspresyjny o wzorze 3 i o symbolu pAp2.13.1. Następnie stosuje się transformację tym wektorem ekspresyjnym komórek Escherichia coli i prowadzi się hodowlę komórek na znanych podłożach stałych i płynnych, przy czym hodowlę prowadzi się z komórkami posiadającymi gen kodujący polimerazę RNA faga T7, a następnie izoluje się fuzyjne białko ludzkiej proinsuliny z bakterii po ekspresji znanymi sposobami.After cloning, the expression vector of formula 3 and the symbol pAp2.13.1 is obtained. Subsequently, the transformation of Escherichia coli cells with this expression vector is performed, and the cells are cultured in known solid and liquid media, with cells having the gene encoding the T7 phage RNA polymerase, and then the human proinsulin fusion protein is isolated from bacteria after expression with known ways.

Inna odmiana sposobu według wynalazku charakteryzuje się tym, że uzyskuje się z wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1 fragment DNA kodujący ludzką proinsulinę wraz z domeną sześciu kolejnych histydyn oraz sekwencją aminokwasową AspAspAspAspLys oraz z kodonem zdegenerowanym UAA sygnału „stop” dla procesu translacji oraz z silnym promotorem faga T7 wraz z miejscem regulatorowym dla represora Lacl, z miejscem wiązania rybosomów rbs z faga T7, silnym terminatorem faga T7 poprzez amplifikację DNA i klonuje się do wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1 w celu zdublowania systemu ekspresyjnego i uzyskuje się wektor ekspresyjny o wzorze 4 i o symbolu pAp2.13.2x.Another variant of the method according to the invention is characterized in that a DNA fragment encoding human proinsulin is obtained from the expression vector of the formula pAp2.13.1 together with the domain of six consecutive histidines and the amino acid sequence AspAspAspAspLys and with the degenerate codon of the UAA signal "stop" for the translation process and with a strong T7 phage promoter along with a regulatory site for the Lacl repressor, with the rbs ribosome binding site of T7, a strong T7 terminator by DNA amplification and cloned into an expression vector of formula 3 and symbol pAp2.13.1 to duplicate the expression system and an expression vector of formula 4 and the symbol pAp2.13.2x is obtained.

Następnie stosuje się transformację wektorem ekspresyjnym komórek Escherichia coli i prowadzi się hodowlę komórek na znanych podłożach stałych i płyirnych, przy czym hco^kow^ lę prowadzi się z komórkami posiadającymi gen kodujący polimerazę RNA faga T7, a następnie izoluje się fuzyjne białko Hit-prointuliny o wzorze 1 z bakterii po ekspresji znanymi sposobami. Otrzymane w ten sposób fuzyjne białko His-proinsuliny po przecięciu enterokinazą jest przekształcone w postać ludzkiej proinsuliny, a po przecięciu trypsyną i karboksypeptydazą B w postać ludzkiej insuliny.Subsequently, transformation with an expression vector of Escherichia coli cells is performed, and the cells are cultured on known solid and liquid media, with cells having the gene encoding T7 RNA polymerase, and then isolating the Hit-prointulin fusion protein with formula 1 from bacteria after expression by known methods. The His-proinsulin fusion protein obtained in this way is converted into the form of human proinsulin after cleavage with enterokinase, and after cleavage with trypsin and carboxypeptidase B into the form of human insulin.

Sposób według wynalazku pozwala na otrzymanie ludzkiej proinsuliny o wysokiej jakości, w sposób nie nastręczający większych trudności technologicznych i jest możliwy do zastosowania w dużej skali.The method according to the invention makes it possible to obtain human proinsulin of high quality, in a way that does not pose major technological difficulties and is possible to apply on a large scale.

Wynalazek przedstawiony jest bliżej na rysunku na którym: fig. 1 przedstawia schemat klonowania ludzkiej proinsuliny do wektora pET30-LIC oraz mapę wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.E fig· 2 przedstawia sekwencję promotorową wraz z wklonowanym genem proinsuliny w uzyskanym wektorze ekspresyjnym o wzorze 3 i o symbolu pAp2.13.1, fig. 3 przedstawia mapę wektora ekspresyjnego o wzorze 4 i o symboluThe invention is presented in more detail in the drawing in which: Fig. 1 shows the scheme of cloning human proinsulin into the pET30-LIC vector and the map of the expression vector of formula 3 and the symbol pAp2.13.E Fig. 2 shows the promoter sequence together with the cloned proinsulin gene in the obtained vector 3 and the symbol pAp2.13.1, Fig. 3 shows the map of the expression vector of formula 4 and symbol

190 073 pAp2.13.2x ze zdublowaną sekwencją promotora wraz z genem kodującym fuzyjne białko His-proinsulinę, a fig. 4. przedstawia fotografię opisaną w przykładzie 6 i 7.190,073 pAp2.13.2x with duplicate promoter sequence together with the gene encoding the His-proinsulin fusion protein, and Figure 4 shows the photograph described in Examples 6 and 7.

Wynalazek ilustrują poniższe przykładyThe following examples illustrate the invention

Przykład 1.Example 1.

Otrzymywanie sekwencji DNA kodującej fuzyjne białko His-proinsuliny.Obtaining a DNA sequence encoding a His-proinsulin fusion protein.

W celu amplifikacji DNA kodującego ludzką proinsulinę oraz wykluczenia intronu syntetyzuje się następujące startery (oligonukleotydy) do reakcji amplifikacji DNA:In order to amplify the DNA encoding human proinsulin and to exclude the intron, the following primers (oligonucleotides) are synthesized for the DNA amplification reaction:

Dla eksonu 1:For exon 1:

starter insE1: 5'CGAATTCGGTACCGATGACGACGACAAGTTTGTGAACCAACA CCTGTGCGGC 3' starter ins11: 5’CTGCCCCACCTGCAGGTCCTCTGCCTCCCGG 3'.starter insE1: 5'CGAATTCGGTACCGATGACGACGACAAGTTTGTGAACCAACA CCTGTGCGGC 3 'starter ins11: 5'CTGCCCCACCTGCAGGTCCTCTGCCTCCCGG 3'.

Dla eksonu 2:For exon 2:

starter insE2: 5'GCGAAGCTTCGTTTAGTTGCAGTAGTTCTCCAG 3'; starter insl2: 5'GACCTGCAGGTGGGGCAGGTGGAGCTGGG 3'.insE2 primer: 5'GCGAAGCTTCGTTTAGTTGCAGTAGTTCTCCAG 3 '; insl2 primer: 5'GACCTGCAGGTGGGGCAGGTGGAGCTGGG 3 '.

Reakcję amplifikacji DNA eksonu 1 insuliny wykonuje się zużyciem starterów insEl (0,2 pM) i insl1 (0,2 pM) na DNA ludzkim (0,2 pg) w buforze zawierającym: 50 mM KC1, 10 mM Tris-HCl pH 8.8, 2 mM MgCB, 0,1% Triton X-100, 250 pM każdego z nukleotydów (dNTP) oraz 2 U Shark2 DNA polimerazy produkowanej przez DNA-Gdańsk II s.c., Polska. Reakcję przeprowadza się w termocyklerze w następujących warunkach temperaturowoczasowych: 94°C - 1 min, 63°C - 1 min, 72°C - 1 min; 30 cykli. W wyniku reakcji amplifikacji uzyskuje się fragment DNA o wielkości 151 par zasad (około 1 pg).The DNA exon 1 amplification reaction of insulin is performed using the primers insEl (0.2 µM) and insl1 (0.2 µM) on human DNA (0.2 µg) in a buffer containing: 50 mM KC1, 10 mM Tris-HCl pH 8.8, 2 mM MgCB, 0.1% Triton X-100, 250 pM of each nucleotide (dNTP) and 2 U Shark2 DNA polymerase produced by DNA-Gdańsk II sc, Poland. The reaction is carried out in a thermocycler under the following temperature-time conditions: 94 ° C - 1 min, 63 ° C - 1 min, 72 ° C - 1 min; 30 cycles. The amplification reaction yields a DNA fragment of 151 base pairs (approximately 1 µg).

Podobnie przeprowadza się reakcję w celu amplifikacji DNA eksonu 2, z użyciem starterów insE2 i insl2, w następujących warunkach temperaturowo czasowych: 94°C - 1 min, 68°C - 1 min, 72°C - 1 min; 30 cykli. W wyniku reakcji amplifikacji uzyskuje się fragment DNA o wielkości 168 par zasad (około 1 pg).Similarly, the reaction to amplify exon 2 DNA is performed with the primers insE2 and ins12 under the following temperature time conditions: 94 ° C - 1 min, 68 ° C - 1 min, 72 ° C - 1 min; 30 cycles. The amplification reaction yields a DNA fragment of 168 bp (approximately 1 pg).

Oba zamplifikowane fragmenty DNA łączy się i hybrydyzuje, dzięki wprowadzonym na starterach insll i insl2 sekwencjom komplementarnym, w buforze: 50 mM KC1, 10 mM TrisHCl pH 8.8, 2 mM MgCB, 0,1% Triton X-100, 250 mM każdego z nukleotydów (dNTP) oraz 2 U Shark2 DNA polimerazy produkowanej przez DNA-Gdańsk II s.c., Polska. Reakcję połączenia fragmentów DNA przeprowadza się w następujących warunkach temperaturowo czasowych: 94°C - 1 min, 57°C - 1 min, 72°C - 1 min; 10 cykli. W wyniku połączenia eksonów 1 i 2 uzyskuje się ffagment DNA o wielkości 301 par zasad o stężeniu 0,3 pg, który oczyszcza się z żelu agarozowego, a następnie tnie enzymami restrykcyjnymi KpnI (2 U) i HindIII (2 U) w temperaturze 37°C przez 1 godzinę w buforze: 33 mM Tris-CHjCOOH pH 7,9, 10 mM (CH3COOhMg, 66 mM CH3COOK.Both amplified DNA fragments are combined and hybridized, thanks to the complementary sequences introduced on the insII and insl2 primers, in the buffer: 50 mM KC1, 10 mM TrisHCl pH 8.8, 2 mM MgCB, 0.1% Triton X-100, 250 mM of each nucleotide (dNTP) and 2 U Shark2 DNA polymerase produced by DNA-Gdańsk II sc, Poland. The reaction of combining DNA fragments is carried out under the following temperature-time conditions: 94 ° C - 1 min, 57 ° C - 1 min, 72 ° C - 1 min; 10 cycles. As a result of combining exons 1 and 2, a DNA fragment of 301 bp with a concentration of 0.3 pg is obtained, which is purified from an agarose gel and then cut with the restriction enzymes KpnI (2 U) and HindIII (2 U) at 37 ° C for 1 hour in buffer: 33 mM Tris-CHjCOOH pH 7.9, 10 mM (CH 3 COOhMg, 66 mM CH3COOK.

W rezultacie otrzymuje się DNA o sekwencji kodującej fuzyjne białko His-proinsuliny o wzorze 2.As a result, DNA having the coding sequence for the His-proinsulin fusion protein of formula 2 is obtained.

Przykład 2.Example 2.

Otrzymanie wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1.Obtaining the expression vector of formula 3 and symbol pAp2.13.1.

Schemat uzyskania wektora ilustruje fig. 1. W celu uzyskania wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1 przeprowadza się reakcję ligacji przeciętego DNA plazmidu pET50LlC (0,2 pg) enzymami restrykcyjnymi Kpnl i HindIII z DNA fragmentu kodującego ludzką proinsulinę otrzymaną według przykładu 1 (0,2 pg), w temperaturze 20°C, przez 1 godzinę z użyciem 2 U ligazy DNA faga T4, stosując bufor: 40 mM Tris-HCl pH 7.8, 10 mM MgClz, 10 mM DTT, 0,5 mM ATP. Następnie mieszaninę ligacyjną transformuje się do komórek Escherichia coli DH5a i wysiewa na podłoże LA z 34 pg/ml kanamycyny. Uzyskane kolonie bakteryjne zawierające wektory ekspresyjne przesiewa się na podłoże płynne (LB z 34 pg/ml kanamycyny) i hoduje się w celu izolacji DNA plazmidowego. W wyniku izolacji uzyskuje się DNA wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1, który zawiera wklonowany gen kodujący ludzką proinsulinę, co potwierdza się poprzez analizę restrykcyjną i sekwencjonowanie metodą Sangera. Dokładne miejsce klonowania wraz z sekwencją promotorową faga T7 ilustruje fig. 2.The scheme of obtaining the vector is illustrated in Fig. 1. In order to obtain the expression vector of formula 3 and the symbol pAp2.13.1, the ligation reaction of the cut pET50LlC plasmid DNA (0.2 pg) is carried out with the restriction enzymes Kpnl and HindIII from the DNA of the fragment coding human proinsulin obtained according to example 1 (0.2 µg), at 20 ° C, for 1 hour with 2 U of T4 DNA ligase using buffer: 40 mM Tris-HCl pH 7.8, 10 mM MgCl 2, 10 mM DTT, 0.5 mM ATP. The ligation mixture is then transformed into Escherichia coli DH5a cells and plated onto LA medium with 34pg / ml kanamycin. The resulting bacterial colonies containing the expression vectors are screened on a liquid medium (LB with 34 pg / ml kanamycin) and grown to isolate plasmid DNA. The isolation yielded DNA of the expression vector of formula III and the symbol pAp2.13.1, which contains the cloned gene encoding human proinsulin, which was confirmed by restriction analysis and Sanger sequencing. The exact cloning site along with the T7 phage promoter sequence is shown in Fig. 2.

190 073190 073

Przykład 3.Example 3.

Otrzymanie wektora ekspresyjnego o wzorze 4 i o symbolu pAp2.13.2x..Obtaining the expression vector of formula 4 and symbol pAp2.13.2x ..

W celu uzyskania DNA zawierającego gen kodujący fuzyjne białko His-proinsuliny wraz z układem promotorowym, amplifikuje się DNa zużyciem startera PET1 (5'-ATCCGGATATAGTTCCTCCTTTCA) (0,2 pM) i PET2 (5'-CCGG CGTAGAGGATCGAGAT) (0,2 pM) na matrycy DNA wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1 (0,2 ng) w buforze: 50 mM KC1, 10 mM Tris-HCl pH 8.8, 2 mM MgCh, 0,1% Triton X-100, 250 pM każdego z nukleotydów (dNTP) oraz 2 U polimerazy DNA Delta2 produkowanej przez firmę DNA-Gdańsk II s.c., Polska. W wyniku reakcji amplifikacji uzyskuje się fragment DNA o wielkości 699 par zasad, który następnie oczyszcza się poprzez ekstrakcję fenolową i precypitację.To obtain DNA containing the gene encoding the His-proinsulin fusion protein along with the promoter system, DNa is amplified using the primer PET1 (5'-ATCCGGATATAGTTCCTCCTTTCA) (0.2 pM) and PET2 (5'-CCGG CGTAGAGGATCGAGAT) (0.2 pM) on the DNA template of the expression vector of formula 3 and symbol pAp2.13.1 (0.2 ng) in buffer: 50 mM KC1, 10 mM Tris-HCl pH 8.8, 2 mM MgCl 2, 0.1% Triton X-100, 250 pM each from nucleotides (dNTP) and 2 U of DNA polymerase Delta2 produced by DNA-Gdańsk II sc, Poland. The amplification reaction yields a DNA fragment of 699 bp, which is then purified by phenol extraction and precipitation.

Otrzymany fragment DNA (0,5 pg) fosforyluje się z użyciem 10 U kinazy polinukleotydowej DNA faga T4 w buforze: 50mM Tris-HCl pH 8.0, 10 mM MgCh, 5 mM DTT, 0,1 mM spermidyny, 0,1 mM EDTA i 20 pM ATP. Enzym inaktywuje się termicznie w 70°C przez 15 min. Jako wektor do klonowania wykorzystuje się wektor ekspresyjny 0 wzorze 3 i o symbolu pAp2.13.1 (1 pg), który przecina się enzymem Bgll, w 37°C, w buforze: 50 mM Tris-HCl pH 7,5, 10 mM MgCl2, 100 mM NaCl. Lepkie końce przeciętego wektora usuwa się z użyciem polimerazy DNA Delta2 produkowanej przez firmę DNA-Gdańsk II s.c., Polska, dzięki aktywności 3'-5' egzonukleazy zawartej w tej polimerazie, w tych samych warunkach buforowych, w temp. 70°C, przez 5 min. Następnie, uzyskane DNA wektora defosforyluje się z użyciem alkalicznej fosfatazy cielęcej (CIAP, 2 U), w 37°C, przez 30 min, w tym samym buforze. Tak przygotowany wektor oczyszcza się poprzez ekstrakcję fenolową i precypitację.The obtained DNA fragment (0.5 pg) is phosphorylated using 10 U of T4 phage DNA polynucleotide kinase in the buffer: 50mM Tris-HCl pH 8.0, 10mM MgCl2, 5mM DTT, 0.1mM spermidine, 0.1mM EDTA and 20 pM ATP. The enzyme is heat inactivated at 70 ° C for 15 min. The cloning vector used is the expression vector of formula 3 and the symbol pAp2.13.1 (1 pg), which is cleaved with the enzyme Bgll, at 37 ° C, in buffer: 50 mM Tris-HCl pH 7.5, 10 mM MgCl2, 100 mM NaCl. The sticky ends of the cut vector are removed with the DNA polymerase Delta2 produced by DNA-Gdańsk II sc, Poland, thanks to the activity of the 3'-5 'exonuclease contained in this polymerase, under the same buffer conditions, at 70 ° C, for 5 min. The resulting vector DNA is then dephosphorylated with calf alkaline phosphatase (CIAP, 2 U) at 37 ° C for 30 min in the same buffer. The vector prepared in this way is purified by phenol extraction and precipitation.

W celu uzyskania wektora ekspresyjnego o wzorze 4 i o symbolu pAp2.13.2x przeprowadza się ligację (na tępo) uzyskanego DNA wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1 (0,2 pg) z DNA kodującym ludzką proinsulinę wraz z układem promotorowym (0,2 pg) z użyciem 2 U ligazy DNA faga T4, w temperaturze 20°C, przez 4 godziny, w buforze: 40 mM Tris-HCl pH 7.8, 10 mM MgCk, 10 mM DTT, 0,5 mM ATP. Następnie mieszaninę ligacyjną transformuje się do komórek Escherichia coli DH5a i wysiewa na podłoże LA z 34 pg\ml kanamycyny. Uzyskane kolonie bakteryjne zawierające plazmidy rekombinantowe przesiewa się na podłoże płynne (LB z 34 (μ g/ml kanamycyny) i hoduje się w celu izolacji DNA plazmidowego. W wyniku izolacji uzyskuje się DNA wektora ekspresyjnego o wzorze 4 i o symbolu pAp2.13.2x., który zawiera wklonowany zdublowany gen kodujący ludzką proinsulinę wraz z promotorami (fig. 4), co potwierdza się poprzez analizę restrykcyjną i sekwencjonowanie metodą Sangera.In order to obtain an expression vector of formula 4 and the symbol pAp2.13.2x, the obtained expression vector DNA of formula 3 and the symbol pAp2.13.1 (0.2 pg) is bluntly ligated with DNA encoding human proinsulin together with a promoter system (0 , 2 µg) with 2 U phage T4 DNA ligase at 20 ° C for 4 hours in buffer: 40 mM Tris-HCl pH 7.8, 10 mM MgCl 4, 10 mM DTT, 0.5 mM ATP. The ligation mixture is then transformed into Escherichia coli DH5a cells and plated onto LA medium with 34 µg µl of kanamycin. The obtained bacterial colonies containing the recombinant plasmids are screened on a liquid medium (LB with 34 (μg / ml kanamycin) and grown in order to isolate plasmid DNA. As a result of isolation, DNA of the expression vector of formula 4 and symbol pAp2.13.2x is obtained. which contains the cloned duplicate gene encoding human proinsulin together with the promoters (Figure 4), as confirmed by restriction analysis and Sanger sequencing.

Przykład 4.Example 4.

Otrzymanie szczepu transformanta Escherichia coli BL21(DE3) pAp2.13.1.Obtaining the transformant Escherichia coli BL21 (DE3) pAp2.13.1 strain.

W celu uzyskania szczepu transformanta Escherichia coli BL21(DE3) pAp2.13.1 wykonuje się transformację wektorem ekspresyjnym o wzorze 3 i o symbolu pAp2.13.1 szczepu bakterii Escherichia coli BL21(DE3) i wysiewa na podłoże stałe LA zawierające 34 pg/ml kanamycyny.To obtain the transformant strain of Escherichia coli BL21 (DE3) pAp2.13.1, transformation is performed with the expression vector of formula 3 and symbol pAp2.13.1 of the Escherichia coli BL21 (DE3) bacterial strain and plated on LA solid medium containing 34 pg / ml kanamycin.

Przykład 5.Example 5.

Otrzymanie szczepu transformanta Escherichia coli BL21(DE3) pAp2.13.2x.Obtaining the transformant Escherichia coli BL21 (DE3) pAp2.13.2x strain.

W celu uzyskania szczepu transformanta Escherichia coli BL21(DE3) pAp2.13.2x wykonuje się transformację wektorem ekspresyjnym o wzorze 4 i o symbolu pAp2.13.2x szczepu bakterii Escherichia coli BL21(DE3) i wysiewa na podłoże stałe LA zawierające 34 pg/ml kanamycyny.To obtain the transformant strain of Escherichia coli BL21 (DE3) pAp2.13.2x, transformation is performed with the expression vector of formula 4 and the symbol pAp2.13.2x of the Escherichia coli BL21 (DE3) bacterial strain and plated on LA solid medium containing 34 µg / ml kanamycin.

Przykład 6.Example 6.

Otrzymanie fuzyjnego białka His-proinsuliny.Obtaining the His-proinsulin fusion protein.

Uzyskuje się sekwencję DNA kodującą fuzyjne białko His-proinsulinę o wzorze 2 według przykładu 1. Następnie otrzymuje się wektor ekspresyjny o wzorze 3 i o symbolu pAp2.13.1 zgodnie z przykładem 2.The DNA sequence encoding the His-proinsulin fusion protein of formula 2 according to example 1 is obtained. Then the expression vector of formula 3 and with the symbol pAp2.13.1 according to example 2 is prepared.

Uzyskuje się szczep Escherichia coli BL21(DE3) pAp2.13.1 według sposobu przedstawionego w przykładzie 4. Szczep hoduje się w temp. 37°C na pożywce płynnej 2xYT zawierającej 34 pg/ml kanamycyny. Do hodowli dodaje się izopropylo-tio-galaktozydu (IPTG) doThe Escherichia coli BL21 (DE3) pAp2.13.1 strain is obtained according to the method described in Example 4. The strain is grown at 37 ° C in 2xYT liquid medium containing 34 µg / ml kanamycin. Isopropyl thio-galactoside (IPTG) is added to the culture

190 073 końcowego stężenia 0,5 mM lub laktozy do końcowego stężenia 1% przy gęstości optycznej hodowli O.D.(,6(0=06, i kontynuuje się hodowlę przez kolejne 3 godziny. W celu określenia ilości produkowanego białka wykonuje się elektroforezę w 15% żelu poliakrylamidowym w warunkach denaturujących i porównuje się intensywność uzyskanego prążka białka fuzyjnego indukowanego IPTG (ścieżka nr 2) i laktozą (ścieżka nr 3) z wzorcem (ścieżka nr 1). Jako wzorzec stosuje się 0,5 pg lizozymu jaja kurzego o masie cząsteczkowej 14,000 Da. Otrzymane wyniki przedstawia fig. 4, z której wynika, że nadekspresja fuzyjnego białka His-proinsuliny o wzorze 1 wynosi około 25%, co daje około 170 mg białka fuzyjnego na litr hodowli.190,073 final concentration of 0.5 mM or lactose to a final concentration of 1% at the optical density of the culture OD (.6 (0 = 06, and the cultivation is continued for another 3 hours. 15% gel electrophoresis is performed to determine the amount of protein produced) polyacrylamide under denaturing conditions and the intensity of the resultant IPTG-induced fusion protein band (lane # 2) and lactose (lane # 3) is compared to the standard (lane # 1) 0.5 pg hen egg lysozyme with a molecular weight of 14,000 Da is used as a reference The results obtained are shown in Fig. 4, which shows that the His-proinsulin fusion protein of formula 1 is overexpressed about 25%, which is about 170 mg of fusion protein per liter of culture.

Przykład 7.Example 7.

Otrzymanie fuzyjnego białka His-proinsulinyObtaining the His-proinsulin fusion protein

Uzyskuje się wektor ekspresyjny o wzorze 4 i o symbolu pAp2.13.2x zgodnie z przykładem 3.The expression vector of formula 4 i with the symbol pAp2.13.2x is obtained according to example 3.

Uzyskuje się szczep Escherichia coli BL21(DE3) pAp2.13.2x według sposobu przedstawionego w przykładzie 5. Szczep hoduje się w temp. 37°C na pożywce płynnej 2xYT zawierającej 34 pg/ml kanamycyny. Do hodowli dodaje się izopropylo-tio-galaktozydu (IPTG) do końcowego stężenia 0.5 mM lub laktozy do końcowego stężenia 1% przy gęstości optycznej hodowli O.D.660=0,6, i kontynuuje się hodowlę przez kolejne 3 godziny. W celu określenia ilości produkowanego białka wykonuje się elektroforezę w 15% żelu poliakrylamidowym w warunkach denaturujących i porównuje się intensywność uzyskanego prążka białka fuzyjnego indukowanego IPTG (ścieżka nr 3) i laktozą (ścieżka nr 4) z wzorcem (ścieżka nr I). Jako wzorzec stosuje się 0,5 pg lizozymu jaja kurzego o masie cząsteczkowej 14,000 Da. Otrzymane wyniki przedstawia fig. 4, z której wynika, że nadekspresja fuzyjnego białka Hisproinsuliny o wzorze 1 wynosi około 35%, co daje około 240 mg białka fuzyjnego na litr hodowli.The Escherichia coli BL21 (DE3) pAp2.13.2x strain is obtained according to the method described in Example 5. The strain is cultivated at 37 ° C in 2xYT liquid medium containing 34 µg / ml kanamycin. Isopropyl thio-galactoside (IPTG) is added to the culture to a final concentration of 0.5 mM or lactose to a final concentration of 1% with an OD 6 of 60 = 0.6, and cultivation is continued for another 3 hours. To quantify the amount of protein produced, electrophoresis is performed on a 15% polyacrylamide gel under denaturing conditions and the intensity of the resultant IPTG-induced fusion protein band (lane # 3) and lactose (lane # 4) is compared to a standard (lane # 1). 0.5 µg of hen egg lysozyme with a molecular weight of 14,000 Da is used as a standard. The results obtained are shown in Figure 4, which shows that the overexpression of the Hisproinsulin fusion protein of formula 1 is about 35%, which is about 240 mg of the fusion protein per liter of culture.

190 073190 073

Wzór 1. Formula 1. Met Underworld His His His His His His His His His His His His Ser Cheese Ser Cheese Gly Gly Leu Leu Val Val Pro Pro Arg Arg Gly Gly Ser Cheese Gly Gly Met Underworld Lys Lys Glu Glu 10 10 20 twenty Thr Thr Ala Ala Ala Ala Ala Ala Lys Lys Phe Phe Glu Glu Arg Arg Gln Main His His Met Underworld Asp Asp Ser Cheese Pro Pro Asp Asp Leu Leu Gly Gly Thr Thr Asp Asp Asp Asp 30 thirty 40 40 A3p A3p Asp Asp Lys Lys Phe Phe Val Val Asn Asn Gln Main His His Leu Leu Cys Cys Gly Gly Ser Cheese His His Leu Leu Val Val Glu Glu Ala Ala Leu Leu Tyr Tyr Leu Leu 50 50 60 60 Val Val Cys Cys Gly Gly Glu Glu Arg Arg Gly Gly Phe Phe Phe Phe Tyr Tyr Thr Thr Pro Pro Lys Lys Thr Thr Arg Arg Arg Arg Glu Glu Ala Ala Glu Glu Asp Asp Leu Leu 70 70 80 80 Gln Main Vdl Vdl Gly Gly Gln Main Val Val Glu Glu Leu Leu Gly Gly Gly Gly Gly Gly Pro Pro Gly Gly Ala Ala Gly Gly Ser Cheese Leu Leu Gln Main Pro Pro Leu Leu Ala Ala 90 90 100 100 Leu Leu Glu Glu Gly Gly Ser Cheese Leu Leu Gln Main Lys Lys Arg Arg Gly Gly Ile How much Val Val Glu Glu Gln Main Cys Cys Cys Cys Thr Thr Ser Cheese Ile How much Cys Cys Ser Cheese 110 110 120 120 Leu Leu Tyr Tyr Gln Main Leu Leu Glu Glu Asn Asn Tyr Tyr Cys Cys Asn Asn

Informacja o sekwencji DŁUGOŚĆ: 129 aminokwasów TYP: aminokwasowa TOPOLOGIA: liniowa RODZAJ CZĄSTECZKI: białkoSequence information LENGTH: 129 amino acids TYPE: amino acid TOPOLOGY: linear TYPE OF PARTICLE: protein

190 073190 073

Wzór 2.Formula 2.

CGAATTCGGT ACCGATGACG ACGACAAGTT TGTGAACCAA CACCTGTGCG GCTCACACCT GluPheGly ThrAspAsp AspAspLys PheValAsnGln HisLeuCys GlySerHlsCGAATTCGGT ACCGATGACG ACGACAAGTT TGTGAACCAA CACCTGTGCG GCTCACACCT GluPheGly ThrAspAsp AspAspLys PheValAsnGln HisLeuCys GlySerHls

GGTGGAAGCT CTCTACCTAG TGTGCGGGGA ACGAGGCTTC TTCTACACAC CCAAGACCGG LeuValGluAla LeuTyrLeu ValCysGly GluArgGlyPhe PheTyrThr ProLysThrGGTGGAAGCT CTCTACCTAG TGTGCGGGGA ACGAGGCTTC TTCTACACAC CCAAGACCGG LeuValGluAla LeuTyrLeu ValCysGly GluArgGlyPhe PheTyrThr ProLysThr

121 CCGGGAGGCA GAGGACCTGC AGGTGGGGCA GGTGGAGCTG GGCGGGGGGC CTGGTGCAGG ArgArgGluAla GluAspLeu GlnValGly GlnValGluLeu GlyGlyGly ProGłyAla121 CCGGGAGGCA GAGGACCTGC AGGTGGGGCA GGTGGAGCTG GGCGGGGGGC CTGGTGCAGG ArgArgGluAla GluAspLeu GlnValGly GlnValGluLeu GlyGlyGly ProGłyAla

181 CAGCCTGCAG CCCTTGGCCC TGGAGGGGTC CCTGCAGAAG CGTGGCATTG TGGAACAATG GlySerLeuGln ProLeuAla LeuGluGly SerLeuGlnLys ArgGlylle ValGluGln181 CAGCCTGCAG CCCTTGGCCC TGGAGGGGTC CCTGCAGAAG CGTGGCATTG TGGAACAATG GlySerLeuGln ProLeuAla LeuGluGly SerLeuGlnLys ArgGlylle ValGluGln

241 CTGTACCAGC ATCTGCTCCC TCTACCAGCT GC-AGAACTAC TGCAACTAAA CGAAGCTTCG CysCysThrSer IleCysSer LeuTyrGln LeuGluAsnTyr CysAsnSTOP241 CTGTACCAGC ATCTGCTCCC TCTACCAGCT GC-AGAACTAC TGCAACTAAA CGAAGCTTCG CysCysThrSer IleCysSer LeuTyrGln LeuGluAsnTyr CysAsnSTOP

301 C301 C

Informacja o sekwencji: DŁUGOŚĆ: 301 nukleotydów TYP: kwas nukleinowy TOPOLOGIA: liniowa RODZAJ CZĄSTECZKI: DNASequence information: LENGTH: 301 nucleotides TYPE: nucleic acid TOPOLOGY: linear TYPE OF PARTICLE: DNA

190 073 symbol pAp2.13.1.190 073 symbol pAp2.13.1.

CGATGACGAC GACAAGTTTG CTACCTAGTG TGCGGGGAACCGATGACGAC GACAAGTTTG CTACCTAGTG TGCGGGGAAC

GGACCTGCAG GTGGGGCAGG CTTGGCCCTG GAGGGGTCCC CTGCTCCCTC TACCAGCTGG GCACCACCAC CACCACCACTGGACCTGCAG GTGGGGCAGG CTTGGCCCTG GAGGGGTCCC CTGCTCCCTC TACCAGCTGG GCACCACCAC CACCACCACT

GGCTGCTGCC ACCGCTGAGCGGCTGCTGCC ACCGCTGAGC

GAGGGGTTTT TTGCTGAAAGGAGGGGTTTT TTGCTGAAAG

AGCGGCGCAT TAAGCGCGGCAGCGGCGCAT TAAGCGCGGC

AGCGCCCTAG CGCCCGCTCCAGCGCCCTAG CGCCCGCTCC

TTTCCCCGTC AAGCTCTAAATTTCCCCGTC AAGCTCTAAA

CACCTCGACC CCAAAAAACTCACCTCGACC CCAAAAAACT

TAGACGGTTT TTCGCCCTTTTAGACGGTTT TTCGCCCTTT

CAAACTGGAA CAACACTCAACAAACTGGAA CAACACTCAA

CCGATTTCGG CCTATTGGTTCCGATTTCGG CCTATTGGTT

AACAAAATAT TAACGTTTACAACAAAATAT TAACGTTTAC

CCTATTTGTT TATTTTTCTACCTATTTGTT TATTTTTCTA

GAAAAACTCA TCGAGCATCAGAAAAACTCA TCGAGCATCA

ATATTTTTGA AAAAGCCGTTATATTTTTGA AAAAGCCGTT

GATGGCAAGA TCCTGGTATCGATGGCAAGA TCCTGGTATC

TAATTTCCCC TCGTCAAAAATAATTTCCCC TCGTCAAAAA

ATCCGGTGAG AATGGCAAAAATCCGGTGAG AATGGCAAAA

ATTACGCTCG TCATCAAAATATTACGCTCG TCATCAAAAT

CTGAGCGAGA CGAAATACGCCTGAGCGAGA CGAAATACGC

CAACCGGCGC AGGAACACTGCAACCGGCGC AGGAACACTG

TTCTAATACC TGGAATGCTGTTCTAATACC TGGAATGCTG

AGGAGTACGG ATAAAATGCTAGGAGTACGG ATAAAATGCT

TCTGACCATC TCATCTGTAA CTCTGGCGCA TCGGGCTTCC ATCGCGAGCC CATTTATACC AGAGCAAGAC GTTTCCCGTTTCTGACCATC TCATCTGTAA CTCTGGCGCA TCGGGCTTCC ATCGCGAGCC CATTTATACC AGAGCAAGAC GTTTCCCGTT

AGCAGACAGT TTTATTGTTCAGCAGACAGT TTTATTGTTC

CGTCAGACCC CGTAGAAAAGCGTCAGACCC CGTAGAAAAG

TCTGCTGCTT GCAAACAAAA AGCTACCAAC TCTTTTTCCGTCTGCTGCTT GCAAACAAAA AGCTACCAAC TCTTTTTCCG

TCCTTCTAGT GTAGCCGTAGTCCTTCTAGT GTAGCCGTAG

ACCTCGCTCT GCTAATCCTG CCGGGTTGGA CTCAAGACGA GTTCGTGCAC ACAGCCCAGC GTGAGCTATG AGAAAGCGCC GCGGCAGGGT CGGAACAGGA TTTATAGTCC TGTCGGGTTTACCTCGCTCT GCTAATCCTG CCGGGTTGGA CTCAAGACGA GTTCGTGCAC ACAGCCCAGC GTGAGCTATG AGAAAGCGCC GCGGCAGGGT CGGAACAGGA TTTATAGTCC TGTCGGGTTT

TGAACCAACA CCTGTGCGGC GAGGCTTCTT CTACACACCC TGGAGCTGGG CGGGGGCCCT TGCAGAAGCG tggcattgtg AGAACTACTG CAACTAAACG GAGATCCGGC TGCTAACAAATGAACCAACA CCTGTGCGGC GAGGCTTCTT CTACACACCC TGGAGCTGGG CGGGGGCCCT TGCAGAAGCG tggcattgtg AGAACTACTG CAACTAAACG GAGATCCGGC TGCTAACAAA

AATAACTAGC ATAACCCCTTAATAACTAGC ATAACCCCTT

GAGGAACTAT ATCCGGATTGGAGGAACTAT ATCCGGATTG

GGGTGTGGTG GTTACGCGCA TTTCGCTTTC TTCCCTTCCTGGGTGTGGTG GTTACGCGCA TTTCGCTTTC TTCCCTTCCT

TCGGGGGCTC CCTTTAGGGTTCGGGGGCTC CCTTTAGGGT

TGATTAGGGT GATGGTTCACTGATTAGGGT GATGGTTCAC

GACGTTGGAG TCCACGTTCT CCCTĄTCTCG GTCTATTCTT AAAAAATGAG CTGATTTAACGACGTTGGAG TCCACGTTCT CCCTĄ TCTCG GTCTATTCTT AAAAAATGAG CTGATTTAAC

AATTTCAGGT GGCACTTTTCAATTTCAGGT GGCACTTTTC

AATACATTCA AATATGTATCAATACATTCA AATATGTATC

AATGAAACTG CAATTTATTCAATGAAACTG CAATTTATTC

TCTGTAATGA AGGAGAAAACTCTGTAATGA AGGAGAAAAC

GGTCTGCGAT TCCGACTCGTGGTCTGCGAT TCCGACTCGT

TAAGGTTATC AAGTGAGAAATAAGGTTATC AAGTGAGAAA

GTTTATGCAT TTCTTTCCAGGTTTATGCAT TTCTTTCCAG

CACTCGCATC AACCAAACCGCACTCGCATC AACCAAACCG

GATCGCTGTT AAAAGGACAAGATCGCTGTT AAAAGGACAA

CCAGCGCATC AACAATATTTCCAGCGCATC AACAATATTT

TTTTCCCGGG GATCGCAGTGTTTTCCCGGG GATCGCAGTG

TGATGGTCGG AAGAGGCATA CATCATTGGC AACGCTACCT CATACAATCG ATAGATTGTC CATATAAATC AGCATCCATGTGATGGTCGG AAGAGGCATA CATCATTGGC AACGCTACCT CATACAATCG ATAGATTGTC CATATAAATC AGCATCCATG

GAATATGGCT CATAACACCCGAATATGGCT CATAACACCC

ATGACCAAAA TCCCTTAACG ATCAAAGGAT CTTCTTGAGAATGACCAAAA TCCCTTAACG ATCAAAGGAT CTTCTTGAGA

AAACCACCGC TACCAGCGGT AAGGTAACTG GCTTCAGCAG TTAGGCCACC ACTTCAAGAAAAACCACCGC TACCAGCGGT AAGGTAACTG GCTTCAGCAG TTAGGCCACC ACTTCAAGAA

TTACCAGTGG CTGCTGCCAG TAGTTACCGG ATAAGGCGCATTACCAGTGG CTGCTGCCAG TAGTTACCGG ATAAGGCGCA

TTGGAGCGAA CGACCTACACTTGGAGCGAA CGACCTACAC

ACGCTTCCCG AAGGGAGAAAACGCTTCCCG AAGGGAGAAA

GAGCGCACGA GGGAGCTTCCGAGCGCACGA GGGAGCTTCC

CGCCACCTCT GACTTGAGCGCGCCACCTCT GACTTGAGCG

TCACACCTGG TGGAAGCTCT AAGACCCGCC GGGAGGCAGATCACACCTGG TGGAAGCTCT AAGACCCGCC GGGAGGCAGA

GGTGCAGGCA GCCTGCAGCC GAACAATGCT GTACCAGCATGGTGCAGGCA GCCTGCAGCC GAACAATGCT GTACCAGCAT

AAGCTTGCGG CCGCACTCGA GCCCGAAAGG AAGCTGAGTT GGGGCCTCTA AACGGGTCTT GCGAATGGGA CGCGCCCTGT GCGTGACCGC TACACTTGCC TTCTCGCCAC GTTCGCCGGC TCCGATTTAG TGCTTTACGGAAGCTTGCGG CCGCACTCGA GCCCGAAAGG AAGCTGAGTT GGGGCCTCTA AACGGGTCTT GCGAATGGGA CGCGCCCTGT GCGTGACCGC TACACTTGCC TTCTCGCCAC GTTCGCCGGC TCCGATTACT TGG

GTAGTGGGCC ATCGCCCTGAGTAGTGGGCC ATCGCCCTGA

TTAATAGTGG ACTCTTGTTC TTGATTTATA AGGGATTTTGTTAATAGTGG ACTCTTGTTC TTGATTTATA AGGGATTTTG

AAAAATTTAA CGCGAATTTTAAAAATTTAA CGCGAATTTT

GGGGAAATGT GCGCGGAACCGGGGAAATGT GCGCGGAACC

CGCTCATGAA TTAATTCTTACGCTCATGAA TTAATTCTTA

ATATCAGGAT TATCAATACCATATCAGGAT TATCAATACC

TCACCGAGGC AGTTCCATAGTCACCGAGGC AGTTCCATAG

CCAACATCAA TACAACCTATCCAACATCAA TACAACCTAT

TCACCATGAG TGACGACTGATCACCATGAG TGACGACTGA

ACTTGTTCAA CAGGCCAGCCACTTGTTCAA CAGGCCAGCC

TTATTCATTC GTGATTGCGC TTACAAACAG GAATCGAATGTTATTCATTC GTGATTGCGC TTACAAACAG GAATCGAATG

TCACCTGAAT CAGGATATTCTCACCTGAAT CAGGATATTC

GTGAGTAACC ATGCATCATCGTGAGTAACC ATGCATCATC

AATTCCGTCA GCCAGTTTAG TTGCCATGTT TCAGAAACAA GCACCTGATT GCCCGACATT TTGGAATTTA ATCGCGGCCT CTTGTATTAC TGTTTATGTA TGAGTTTTCG TTCCACTGAG TCCTTTTTTT CTGCGCGTAA GGTTTGTTTG CCGGATCAAG AGCGCAGATA CCAAATACTG CTCTGTAGCA CCGCCTACAT TGGCGATAAG TCGTGTCTTA GCGGTCGGGC TGAACGGGGG CGAACTGAGA tacctacagc GGCGGACAGG TATCCGGTAA AGGGGGAAAC GCCTGGTATC TCGATTTTTG TGATGCTCGTAATTCCGTCA GCCAGTTTAG TTGCCATGTT TCAGAAACAA GCACCTGATT GCCCGACATT TTGGAATTTA ATCGCGGCCT CTTGTATTAC TGTTTATGTA TGAGTTTTCG TTCCACTGAG TCCTTTTTTT CTGCGCGTAA GGTTTGTTTG CCGGATCAAG AGCGCAGATA CCAAATACTG CTCTGTAGCA CCGCCTACAT TGGCGATAAG TCGTGTCTTA GCGGTCGGGC TGAACGGGGG CGAACTGAGA tacctacagc GGCGGACAGG TATCCGGTAA AGGGGGAAAC GCCTGGTATC TCGATTTTTG TGATGCTCGT

CAGGGGGGCG GAGCCTATGG AAAAACGCCA GCAACGCGGC CTTTTTACGG TTCCTGGCCTCAGGGGGGCG GAGCCTATGG AAAAACGCCA GCAACGCGGC CTTTTTACGG TTCCTGGCCT

190 073190 073

TTTGCTGGCC TTTGCTGGCC TTTTGCTCAC ATGTTCTTTC CTGCGTTATC CCCTGATTCT GTGGATAACC TTTTGCTCAC ATGTTCTTTC CTGCGTTATC CCCTGATTCT GTGGATAACC GTATTACCGC GTATTACCGC CTTTGAGTGA GCTGATACCG CTCGCCGCAG CCGAACGACC GAGCGCAGCG CTTTGAGTGA GCTGATACCG CTCGCCGCAG CCGAACGACC GAGCGCAGCG AGTCAGTGAG AGTCAGTGAG CGAGGAAGCG GAAGAGCGCC TGATGCGGTA TTTTCTCCTT ACGCATCTGT CGAGGAAGCG GAAGAGCGCC TGATGCGGTA TTTTCTCCTT ACGCATCTGT

GCGGTATTTC ACACCGCATA TATGGTGCAC TCTCAGTACA ATCTGCTCTG ATGCCGCATAGCGGTATTTC ACACCGCATA TATGGTGCAC TCTCAGTACA ATCTGCTCTG ATGCCGCATA

GTTAAGCCAG GTTAAGCCAG TATACACTCC GCTATCGCTA CGTGACTGGG TCATGGCTGC GCCCCGACAC TATACACTCC GCTATCGCTA CGTGACTGGG TCATGGCTGC GCCCCGACAC CCGCCAACAC CCGCCAACAC CCGCTGACGC GCCCTGACGG GCTTGTCTGC TCCCGGCATC CGCTTACAGA CCGCTGACGC GCCCTGACGG GCTTGTCTGC TCCCGGCATC CGCTTACAGA CAAGCTGTGA CAAGCTGTGA CCGTCTCCGG GAGCTGCATG TGTCAGAGGT TTTCACCGTC ATCACCGAAA CCGTCTCCGG GAGCTGCATG TGTCAGAGGT TTTCACCGTC ATCACCGAAA CGCGCGAGGC CGCGCGAGGC AGCTGCGGTA AAGCTCATCA GCGTGGTCGT GAAGCGATTC ACAGATGTCT AGCTGCGGTA AAGCTCATCA GCGTGGTCGT GAAGCGATTC ACAGATGTCT gcctgttcat gcctgttcat CCGCGTCCAG CTCGTTGAGT TTCTCCAGAA GCGTTAATGT CTGGCTTCTG CCGCGTCCAG CTCGTTGAGT TTCTCCAGAA GCGTTAATGT CTGGCTTCTG ATAAAGCGGG ATAAAGCGGG CCATGTTAAG GGCGGTTTTT TCCTGTTTGG TCACTGATGC CTCCGTGTAA CCATGTTAAG GGCGGTTTTT TCCTGTTTGG TCACTGATGC CTCCGTGTAA GGGGGATTTC GGGGGATTTC TGTTCATGGG GGTAATGATA CCGATGAAAC GAGAGAGGAT GCTCACGATA TGTTCATGGG GGTAATGATA CCGATGAAAC GAGAGAGGAT GCTCACGATA CGGGTTACTG CGGGTTACTG ATGATGAACA TGCCCGGTTA CTGGAACGTT GTGAGGGTAA ACAACTGGCG ATGATGAACA TGCCCGGTTA CTGGAACGTT GTGAGGGTAA ACAACTGGCG GTATGGATGC GTATGGATGC GGCGGGACCA GAGAAAAATC ACTCAGGGTC AATGCCAGCG CTTCGTTAAT GGCGGGACCA GAGAAAAATC ACTCAGGGTC AATGCCAGCG CTTCGTTAAT ACAGATGTAG ACAGATGTAG GTGTTCCACA GGGTAGCCAG CAGCATCCTG CGATGCAGAT CCGGAACATA GTGTTCCACA GGGTAGCCAG CAGCATCCTG CGATGCAGAT CCGGAACATA ATGGTGCAGG ATGGTGCAGG GCGCTGACTT CCGCGTTTCC AGACTTTACG AAACACGGAA ACCGAAGACC GCGCTGACTT CCGCGTTTCC AGACTTTACG AAACACGGAA ACCGAAGACC ATTCATGTTG ATTCATGTTG TTGCTCAGGT CGCAGACGTT TTGCAGCAGC AGTCGCTTCA CGTTCGCTCG TTGCTCAGGT CGCAGACGTT TTGCAGCAGC AGTCGCTTCA CGTTCGCTCG CGTATCGGTG CGTATCGGTG ATTCATTCTG CTAACCAGTA AGGCAACCCC GCCAGCCTAG CCGGGTCCTC ATTCATTCTG CTAACCAGTA AGGCAACCCC GCCAGCCTAG CCGGGTCCTC

AACGACAGGA GCACGATCAT GCGCACCCGT GGGGCCGCCA TGCCGGCGAT AATGGCCTGC TTCTCGCCGA AACGTTTGGT GGCGGGACCA GTGACGAAGG CTTGAGCGAG GGCGTGCAAGAACGACAGGA GCACGATCAT GCGCACCCGT GGGGCCGCCA TGCCGGCGAT AATGGCCTGC TTCTCGCCGA AACGTTTGGT GGCGGGACCA GTGACGAAGG CTTGAGCGAG GGCGTGCAAG

ATTCCGAATA ATTCCGAATA CCGCAAGCGA CAGGCCGATC ATCGTCGCGC TCCAGCGAAA GCGGTCCTCG CCGCAAGCGA CAGGCCGATC ATCGTCGCGC TCCAGCGAAA GCGGTCCTCG CCGAAAATGA CCGAAAATGA CCCAGAGCGC TGCCGGCACC TGTCCTACGA GTTGCATGAT AAAGAAGACA CCCAGAGCGC TGCCGGCACC TGTCCTACGA GTTGCATGAT AAAGAAGACA GTCATAAGTG GTCATAAGTG CGGCGACGAT AGTCATGCCC CGCGCCCACC GGAAGGAGCT GACTGGGTTG CGGCGACGAT AGTCATGCCC CGCGCCCACC GGAAGGAGCT GACTGGGTTG AAGGCTCTCA AAGGCTCTCA AGGGCATCGG TCGAGATCCC GGTGCCTAAT GAGTGAGCTA ACTTACATTA AGGGCATCGG TCGAGATCCC GGTGCCTAAT GAGTGAGCTA ACTTACATTA ATTGCGTTGC ATTGCGTTGC GCTCACTGCC CGCTTTCCAG TCGGGAAACC TGTCGTGCCA GCTGCATTAA GCTCACTGCC CGCTTTCCAG TCGGGAAACC TGTCGTGCCA GCTGCATTAA TGAATCGGCC TGAATCGGCC AACGCGCGGG GAGAGGCGGT TTGCGTATTG GGCGCCAGGG TGGTTTTTCT AACGCGCGGG GAGAGGCGGT TTGCGTATTG GGCGCCAGGG TGGTTTTTCT TTTCACCAGT TTTCACCAGT GAGACGGGCA ACAGCTGATT GCCCTTCACC GCCTGGCCCT GAGAGAGTTG GAGACGGGCA ACAGCTGATT GCCCTTCACC GCCTGGCCCT GAGAGAGTTG CAGCAAGCGG CAGCAAGCGG TCCACGCTGG TTTGCCCCAG CAGGCGAAAA TCCTGTTTGA TGGTGGTTAA TCCACGCTGG TTTGCCCCAG CAGGCGAAAA TCCTGTTTGA TGGTGGTTAA

CGGCGGGATA TAACATGAGC TGTCTTCGGT ATCGTCGTAT CCCACTACCG AGATGTCCGCCGGCGGGATA TAACATGAGC TGTCTTCGGT ATCGTCGTAT CCCACTACCG AGATGTCCGC

ACCAACGCGC ACCAACGCGC AGCCCGGACT CGGTAATGGC GCGCATTGCG CCCAGCGCCA TCTGATCGTT AGCCCGGACT CGGTAATGGC GCGCATTGCG CCCAGCGCCA TCTGATCGTT GGCAACCAGC GGCAACCAGC ATCGCAGTGG GAACGATGCC CTCATTCAGC ATTTGCATGG TTTGTTGAAA ATCGCAGTGG GAACGATGCC CTCATTCAGC ATTTGCATGG TTTGTTGAAA ACCGGACATG ACCGGACATG GCACTCCAGT CGCCTTCCCG TTCCGCTATC GGCTGAATTT GATTGCGAGT GCACTCCAGT CGCCTTCCCG TTCCGCTATC GGCTGAATTT GATTGCGAGT GAGATATTTA GAGATATTTA TGCCAGCCAG CCAGACGCAG ACGCGCCGAG ACAGAACTTA ATGGGCCCGC TGCCAGCCAG CCAGACGCAG ACGCGCCGAG ACAGAACTTA ATGGGCCCGC

TAACAGCGCG ATTTGCTGGT GACCCAATGC GACCAGATGC TCCACGCCCA GTCGCGTACC GTCTTCATGG GAGAAAATAA TACTGTTGAT GGGTGTCTGG TCAGAGACAT CAAGAAATAA CGCCGGAACA TTAGTGCAGG CAGCTTCCAC AGCAATGGCA TCCTGGTCAT CCAGCGGATA GTTAATGATC AGCCCACTGA CGCGTTGCGC GAGAAGATTG TGCACCGCCG CTTTACAGGC TTCGACGCCG CTTCGTTCTA CCATCGACAC CACCACGCTG GCACCCAGTT GATCGGCGCGTAACAGCGCG ATTTGCTGGT GACCCAATGC GACCAGATGC TCCACGCCCA GTCGCGTACC GTCTTCATGG GAGAAAATAA TACTGTTGAT GGGTGTCTGG TCAGAGACAT CAAGAAATAA CGCCGGAACA TTAGTGCAGG CAGCTTCCAC AGCAATGGCA TCCTGGTCAT CCAGCGGATA GTTAATGATC AGCCCACTGA CGCGTTGCGC GAGAAGATTG TGCACCGCCG CTTTACAGGC TTCGACGCCG CTTCGTTCTA CCATCGACAC CACCACGCTG GCACCCAGTT GATCGGCGCG

AGATTTAATC GCCGCGACAA TTTGCGACGG CGCGTGCAGG GCCAGACTGG AGGTGGCAAC GCCAATCAGC AACGACTGTT TGCCCGCCAG TTGTTGTGCC ACGCGGTTGG GAATGTAATT CAGCTCCGCC ATCGCCGCTT CCACTTTTTC CCGCGTTTTC GCAGAAACGT GGCTGGCCTGAGATTTAATC GCCGCGACAA TTTGCGACGG CGCGTGCAGG GCCAGACTGG AGGTGGCAAC GCCAATCAGC AACGACTGTT TGCCCGCCAG TTGTTGTGCC ACGCGGTTGG GAATGTAATT CAGCCCTGTCT CCGCTCTGTGTCG CCGACTGTCGTCGTCGTCGTGTC

GTTCACCACG GTTCACCACG CGGGAAACGG tctgataaga gacaccggca tactctgcga catcgtataa CGGGAAACGG tctgataaga gacaccggca tactctgcga catcgtataa CGTTACTGGT CGTTACTGGT TTCACATTCA CCACCCTGAA TTGACTCTCT TCCGGGCGCT ATCATGCCAT TTCACATTCA CCACCCTGAA TTGACTCTCT TCCGGGCGCT ATCATGCCAT ACCGCGAAAG ACCGCGAAAG GTTTTGCGCC ATTCGATGGT GTCCGGGATC TCGACGCTCT CCCTTATGCG GTTTTGCGCC ATTCGATGGT GTCCGGGATC TCGACGCTCT CCCTTATGCG ACTCCTGCAT ACTCCTGCAT TAGGAAGCAG CCCAGTAGTA GGTTGAGGCC GTTGAGCACC GCCGCCGCAA TAGGAAGCAG CCCAGTAGTA GGTTGAGGCC GTTGAGCACC GCCGCCGCAA

GGAATGGTGC ATGCAAGGAG ATGGCGCCCA ACAGTCCCCC GGCCACGGGG CCTGCCACCAGGAATGGTGC ATGCAAGGAG ATGGCGCCCA ACAGTCCCCC GGCCACGGGG CCTGCCACCA

190 073190 073

5281 5281 TACCCACGCC TACCCACGCC GAAACAAGCG GAAACAAGCG CTCATGAGCC CTCATGAGCC CGAAGTGGCG CGAAGTGGCG AGCCCGATCT AGCCCGATCT TCCCCATCGG TCCCCATCGG 5341 5341 TGATGTCGGC TGATGTCGGC GATATAGGCG GATATAGGCG CCAGCAACCG CCAGCAACCG CACCTGTGGC CACCTGTGGC GCCGGTGATG GCCGGTGATG CCGGCCACGA CCGGCCACGA 5401 5401 TGCGTCCGGC TGCGTCCGGC GTAGAGGATC GTAGAGGATC GAGATCGATC GAGATCGATC TCGATCCCGC TCGATCCCGC GAAATTAATA GAAATTAATA CGACTCACTA CGACTCACTA 5461 5461 TAGGGGAATT TAGGGGAATT GTGAGCGGAT GTGAGCGGAT AACAATTCCC AACAATTCCC CTCTAGAAAT CTCTAGAAAT AATTTTGTTT AATTTTGTTT AACTTTAAGA AACTTTAAGA 5521 5521 AGGAGATATA AGGAGATATA CATATGCACC CATATGCACC ATCATCATCA ATCATCATCA TCATTCTTCT TCATTCTTCT GGTCTGGTGC GGTCTGGTGC CACGCGGTTC CACGCGGTTC 5581 5581 TGGTATGAAA TGGTATGAAA GAAACCGCTG GAAACCGCTG CTGCTAAATT CTGCTAAATT CGAACGCCAG CGAACGCCAG CACATGGACA CACATGGACA GCCCAGATCT GCCCAGATCT 5641 5641 GGGTAC GGGTAC

Informacja o sekwencji: DŁUGOŚĆ: 5646 nukleotydów TYP: kwas nukleinowy TOPOLOGIA: plazmid ILOŚĆ NICI: jedna RODZAJ CZĄSTECZKI: DNASequence information: LENGTH: 5646 nucleotides TYPE: nucleic acid TOPOLOGY: plasmid NUMBER OF THREADS: one TYPE OF PARTICLE: DNA

190 073 symbol pAp2.13.2x.190 073 symbol pAp2.13.2x.

CGATGACGAC GACAAGTTTG CTACCTAGTG TGCGGGGAAC GGACCTGCAG GTGGGGCAGG CTTGGCCCTG GAGGGGTCCC CTGCTCCCTC TACCAGCTGG GCACCACCAC CACCACCACT GGCTGCTGCC ACCGCTGAGC GAGGGGTTTT TTGCTGAAAG AGCGGCGCAT TAAGCGCGGC AGCGCCCTAG CGCCCGCTCC TTTCCCCGTC AAGCTCTAAA CACCTCGACC CCAAAAAACT TAGACGGTTT TTCGCCCTTT CAAACTGGAA CAACACTCAA CCGATTTCGG CCTATTGGTT AACAAAATAT TAACGTTTAC CCTATTTGTT TATTTTTCTA GAAAAACTCA TCGAGCATCA ATATTTTTGA AAAAGCCGTT GATGGCAAGA TCCTGGTATC TAATTTCCCC TCGTCAAAAA ATCCGGTGAG AATGGCAAAA ATTACGCTCG TCATCAAAAT CTGAGCGAGA CGAAATACGC CAACCGGCGC AGGAACACTG TTCTAATACC TGGAATGCTG AGGAGTACGG ATAAAATGCT TCTGACCATC TCATCTGTAA CTCTGGCGCA TCGGGCTTCC ATCGCGAGCC CATTTATACC AGAGCAAGAC GTTTCCCGTT AGCAGACAGT TTTATTGTTC CGTCAGACCC CGTAGAAAAG TCTGCTGCTT GCAAACAAAA AGCTACCAAC TCTTTTTCCG TCCTTCTAGT GTAGCCGTAG ACCTCGCTCT GCTAATCCTG CCGGGTTGGA CTCAAGACGA GTTCGTGCAC ACAGCCCAGC GTGAGCTATG AGAAAGCGCC GCGGCAGGGT CGGAACAGGA TTTATAGTCC TGTCGGGTTT CAGGGGGGCG GAGCCTATGG TTTGCTGGCC TTTTGCTCAC GTATTACCGC CTTTGAGTGACGATGACGAC GACAAGTTTG CTACCTAGTG TGCGGGGAAC GGACCTGCAG GTGGGGCAGG CTTGGCCCTG GAGGGGTCCC CTGCTCCCTC TACCAGCTGG GCACCACCAC CACCACCACT GGCTGCTGCC ACCGCTGAGC GAGGGGTTTT TTGCTGAAAG AGCGGCGCAT TAAGCGCGGC AGCGCCCTAG CGCCCGCTCC TTTCCCCGTC AAGCTCTAAA CACCTCGACC CCAAAAAACT TAGACGGTTT TTCGCCCTTT CAAACTGGAA CAACACTCAA CCGATTTCGG CCTATTGGTT AACAAAATAT TAACGTTTAC CCTATTTGTT TATTTTTCTA GAAAAACTCA TCGAGCATCA ATATTTTTGA AAAAGCCGTT GATGGCAAGA TCCTGGTATC TAATTTCCCC TCGTCAAAAA ATCCGGTGAG AATGGCAAAA ATTACGCTCG TCATCAAAAT CTGAGCGAGA CGAAATACGC CAACCGGCGC AGGAACACTG TTCTAATACC TGGAATGCTG AGGAGTACGG ATAAAATGCT TCTGACCATC TCATCTGTAA CTCTGGCGCA TCGGGCTTCC ATCGCGAGCC CATTTATACC AGAGCAAGAC GTTTCCCGTT AGCAGACAGT TTTATTGTTC CGTCAGACCC CGTAGAAAAG TCTGCTGCTT GCAAACAAAA AGCTACCAAC TCTTTTTCCG TCCTTCTAGT GTAGCCGTAG ACCTCGCTCT GCTAATCCTG CCGGGTTGGA CTCAAGACGA GTTCGTGCAC ACAGCCCAGC GTGAGCTATG AGAAAGCGCC GCGGCAGGGT CGGAACAGGA TTTATAGTCC TGTCGGGTTT CAGGGGGGCG GAGCCTATGG TTTGCTGGCC TTTTGCTCAC GTATTACCGC CTTTGAGTGA

TGAACCAACA CCTGTGCGGC GAGGCTTCTT CTACACACCC TGGAGCTGGG CGGGGGCCCT TGCAGAAGCG TGGCATTGTG AGAACTACTG CAACTAAACGTGAACCAACA CCTGTGCGGC GAGGCTTCTT CTACACACCC TGGAGCTGGG CGGGGGCCCT TGCAGAAGCG TGGCATTGTG AGAACTACTG CAACTAAACG

GAGATCCGGC TGCTAACAAA AATAACTAGC ATAACCCCTTGAGATCCGGC TGCTAACAAA AATAACTAGC ATAACCCCTT

GAGGAACTAT ATCCGGATTGGAGGAACTAT ATCCGGATTG

GGGTGTGGTG GTTACGCGCA TTTCGCTTTC TTCCCTTCCTGGGTGTGGTG GTTACGCGCA TTTCGCTTTC TTCCCTTCCT

TCGGGGGCTC CCTTTAGGGT TGATTAGGGT GATGGTTCAC GACGTTGGAG TCCACGTTCT CCCTATCTCG GTCTATTCTT AAAAAATGAG CTGATTTAAC AATTTCAGGT GGCACTTTTC AATACATTCA AATATGTATC AATGAAACTG CAATTTATTC TCTGTAATGA AGGAGAAAACTCGGGGGCTC CCTTTAGGGT TGATTAGGGT GATGGTTCAC GACGTTGGAG TCCACGTTCT CCCTATCTCG GTCTATTCTT AAAAAATGAG CTGATTTAAC AATTTCAGGT GGCACTTTTC AATACATTCATC AATTATGATAGAC AATTATGAAT TCGATAATTGAATTCA

GGTCTGCGAT TCCGACTCGT TAAGGTTATC AAGTGAGAAA GTTTATGCAT TTCTTTCCAG CACTCGCATC AACCAAACCG GATCGCTGTT AAAAGGACAA CCAGCGCATC AACAATATTT TTTTCCCGGG GATCGCAGTG TGATGGTCGG AAGAGGCATAGGTCTGCGAT TCCGACTCGT TAAGGTTATC AAGTGAGAAA GTTTATGCAT TTCTTTCCAG CACTCGCATC AACCAAACCG GATCGCTGTT AAAAGGACAA CCAGCGCATC AACAATATTT TTTTCCCGGTCG GATCATATTT TTTTCCCAGCGCGGAT

CATCATTGGC AACGCTACCT CATACAATCG ATAGATTGTC CATATAAATC AGCATCCATG GAATATGGCT CATAACACCC ATGACCAAAA TCCCTTAACG ATCAAAGGAT CTTCTTGAGA AAACCACCGC TACCAGCGGT AAGGTAACTG GCTTCAGCAG TTAGGCCACC ACTTCAAGAA TTACCAGTGG CTGCTGCCAG TAGTTACCGG ATAAGGCGCA TTGGAGCGAA CGACCTACAC ACGCTTCCCG AAGGGAGAAA GAGCGCACGA GGGAGCTTCC CGCCACCTCT GACTTGAGCG AAAAACGCCA GCAACGCGGC ATGTTCTTTC CTGCGTTATC GCTGATACCG CTCGCCGCAGCATCATTGGC AACGCTACCT CATACAATCG ATAGATTGTC CATATAAATC AGCATCCATG GAATATGGCT CATAACACCC ATGACCAAAA TCCCTTAACG ATCAAAGGAT CTTCTTGAGA AAACCACCGC TACCAGCGGT AAGGTAACTG GCTTCAGCAG TTAGGCCACC ACTTCAAGAA TTACCAGTGG CTGCTGCCAG TAGTTACCGG ATAAGGCGCA TTGGAGCGAA CGACCTACAC ACGCTTCCCG AAGGGAGAAA GAGCGCACGA GGGAGCTTCC CGCCACCTCT GACTTGAGCG AAAAACGCCA GCAACGCGGC ATGTTCTTTC CTGCGTTATC GCTGATACCG CTCGCCGCAG

TCACACCTGG TGGAAGCTCTTCACACCTGG TGGAAGCTCT

AAGACCCGCC GGGAGGCAGA GGTGCAGGCA GCCTGCAGCC GAACAATGCT GTACCAGCATAAGACCCGCC GGGAGGCAGA GGTGCAGGCA GCCTGCAGCC GAACAATGCT GTACCAGCAT

AAGCTTGCGG CCGCACTCGAAAGCTTGCGG CCGCACTCGA

GCCCGAAAGG AAGCTGAGTT GGGGCCTCTA AACGGGTCTT GCGAATGGGA CGCGCCCTGT GCGTGACCGC TACACTTGCC TTCTCGCCAC GTTCGCCGGCGCCCGAAAGG AAGCTGAGTT GGGGCCTCTA AACGGGTCTT GCGAATGGGA CGCGCCCTGT GCGTGACCGC TACACTTGCC TTCTCGCCAC GTTCGCCGGC

TCCGATTTAG TGCTTTACGG GTAGTGGGCC ATCGCCCTGATCCGATTTAG TGCTTTACGG GTAGTGGGCC ATCGCCCTGA

TTAATAGTGG ACTCTTGTTC TTGATTTATA AGGGATTTTG AAAAATTTAA CGCGAATTTT GGGGAAATGT GCGCGGAACC CGCTCATGAA TTAATTCTTA ATATCAGGAT TATCAATACC TCACCGAGGC AGTTCCATAGTTAATAGTGG ACTCTTGTTC TTGATTTATA AGGGATTTTG AAAAATTTAA CGCGAATTTT GGGGAAATGT GCGCGGAACC CGCTCATGAA TTAATTCTTA ATATCAGGAT TATCAATACC TCACCGAGGC AGTTCCATAG

CCAACATCAA TACAACCTAT TCACCATGAG TGACGACTGA ACTTGTTCAA CAGGCCAGCC TTATTCATTC GTGATTGCGCCCAACATCAA TACAACCTAT TCACCATGAG TGACGACTGA ACTTGTTCAA CAGGCCAGCC TTATTCATTC GTGATTGCGC

TTACAAACAG GAATCGAATGTTACAAACAG GAATCGAATG

TCACCTGAAT CAGGATATTC GTGAGTAACC ATGCATCATC AATTCCGTCA GCCAGTTTAG TTGCCATGTT TCAGAAACAA GCACCTGATT GCCCGACATT TTGGAATTTA ATCGCGGCCT CTTGTATTAC TGTTTATGTA TGAGTTTTCG TTCCACTGAG TCCTTTTTTT CTGCGCGTAA GGTTTGTTTG CCGGATCAAG AGCGCAGATA CCAAATACTG CTCTGTAGCA CCGCCTACAT TGGCGATAAG TCGTGTCTTA GCGGTCGGGC TGAACGGGGG CGAACTGAGA TACCTACAGC GGCGGACAGG TATCCGGTAA AGGGGGAAAC GCCTGGTATC TCGATTTTTG TGATGCTCGT CTTTTTACGG TTCCTGGCCT CCCTGATTCT GTGGATAACC CCGAACGACC GAGCGCAGCGTCACCTGAAT CAGGATATTC GTGAGTAACC ATGCATCATC AATTCCGTCA GCCAGTTTAG TTGCCATGTT TCAGAAACAA GCACCTGATT GCCCGACATT TTGGAATTTA ATCGCGGCCT CTTGTATTAC TGTTTATGTA TGAGTTTTCG TTCCACTGAG TCCTTTTTTT CTGCGCGTAA GGTTTGTTTG CCGGATCAAG AGCGCAGATA CCAAATACTG CTCTGTAGCA CCGCCTACAT TGGCGATAAG TCGTGTCTTA GCGGTCGGGC TGAACGGGGG CGAACTGAGA TACCTACAGC GGCGGACAGG TATCCGGTAA AGGGGGAAAC GCCTGGTATC TCGATTTTTG TGATGCTCGT CTTTTTACGG TTCCTGGCCT CCCTGATTCT GTGGATAACC CCGAACGACC GAGCGCAGCG

190 073190 073

AGTCAGTGAG CGAGGAAGCG GAAGAGCGCC GCGGTATTTC ACACCGCATA TATGGTGCACAGTCAGTGAG CGAGGAAGCG GAAGAGCGCC GCGGTATTTC ACACCGCATA TATGGTGCAC

GTTAAGCCAG TATACACTCC GCTATCGCTAGTTAAGCCAG TATACACTCC GCTATCGCTA

CCGCCAACAC CCGCTGACGC GCCCTGACGG CAAGCTGTGA CCGTCTCCGG GAGCTGCATG CGCGCGAGGC AGCTGCGGTA AAGCTCATCA GCCTGTTCAT CCGCGTCCAG CTCGTTGAGTCCGCCAACAC CCGCTGACGC GCCCTGACGG CAAGCTGTGA CCGTCTCCGG GAGCTGCATG CGCGCGAGGC AGCTGCGGTA AAGCTCATCA GCCTGTTCAT CCGCGTCCAG CTCGTTGAGT

ATAAAGCGGG CCATGTTAAG GGCGGTTTTT GGGGGATTTC TGTTCATGGG GGTAATGATA CGGGTTACTG ATGATGAACA TGCCCGGTTAATAAAGCGGG CCATGTTAAG GGCGGTTTTT GGGGGATTTC TGTTCATGGG GGTAATGATA CGGGTTACTG ATGATGAACA TGCCCGGTTA

GTATGGATGC GGCGGGACCA GAGAAAAATCGTATGGATGC GGCGGGACCA GAGAAAAATC

ACAGATGTAG GTGTTCCACA GGGTAGCCAGACAGATGTAG GTGTTCCACA GGGTAGCCAG

ATGGTGCAGG GCGCTGACTT CCGCGTTTCCATGGTGCAGG GCGCTGACTT CCGCGTTTCC

ATTCATGTTG TTGCTCAGGT CGCAGACGTT CGTATCGGTG ATTCATTCTG CTAACCAGTA AACGACAGGA GCACGATCAT GCGCĄCCCGT TTCAGCAAAA AACCCCTCAA GACCCGTTTA TCAGCGGTGG CAGCAGCCAA CTCAGCTTCC TGGTGGTGGT GGTGGTGCTC GAGTGCGGCC AGCTGGTAGA GGGAGCAGAT GCTGGTACAGATTCATGTTG TTGCTCAGGT CGCAGACGTT CGTATCGGTG ATTCATTCTG CTAACCAGTA AACGACAGGA GCACGATCAT GCGCĄCCCGT TTCAGCAAAA AACCCCTCAA GACCCGTTTA TCAGCGGTGG CAGCAGCCAA CTCAGCTTCC TGGTGGTGGT GGTGGTGCTC GAGTGCGGCC AGCTGGTAGA GGGAGCAGAT GCTGGTACAG

GACCCCTCCA GGGCCAAGGG CTGCAGGCTG TGCCCCACCT GCAGGTCCTC TGCCTCCCGG TCCCCGCACA CTAGGTAGAG AGCTTCCACCGACCCCTCCA GGGCCAAGGG CTGCAGGCTG TGCCCCACCT GCAGGTCCTC TGCCTCCCGG TCCCCGCACA CTAGGTAGAG AGCTTCCACC

AACTTGTCGT CGTCATCGGT ACCCAGATCT GCAGCAGCGG TTTCTTTCAT ACCAGAACCG TGATGGTGCA TATGTATATC TCCTTCTTAA TGTTATCCGC TCACAATTCC CCTATAGTGA TCTCGATCCT CTACGCCGGC GGCGATAATGAACTTGTCGT CGTCATCGGT ACCCAGATCT GCAGCAGCGG TTTCTTTCAT ACCAGAACCG TGATGGTGCA TATGTATATC TCCTTCTTAA TGTTATCCGC TCACAATTCC CCTATAGTGA TCTCGATCCT CTACGCCGGATG GGCGATACCT CTACGCCGGATG

GGACCAGTGA CGAAGGCTTG AGCGAGGGCG CCGATCATCG TCGCGCTCCA GCGAAAGCGGGGACCAGTGA CGAAGGCTTG AGCGAGGGCG CCGATCATCG TCGCGCTCCA GCGAAAGCGG

GGCACCTGTC CTACGAGTTG CATGATAAAG ATGCCCCGCG CCCACCGGAA GGAGCTGACT GATCCCGGTG CCTAATGAGT GAGCTAACTTGGCACCTGTC CTACGAGTTG CATGATAAAG ATGCCCCGCG CCCACCGGAA GGAGCTGACT GATCCCGGTG CCTAATGAGT GAGCTAACTT

TTCCAGTCGG GAAACCTGTC GTGCCAGCTG GGCGGTTTGC GTATTGGGCG CCAGGGTGGT CTGATTGCCC TTCACCGCCT GGCCCTGAGA CCCCAGCAGG CGAAAATCCT GTTTGATGGT TTCGGTATCG TCGTATCCCA CTACCGAGAT AATGGCGCGC ATTGCGCCCA GCGCCATCTG GATGCCCTCA TTCAGCATTT GCATGGTTTG TTCCCGTTCC GCTATCGGCT GAATTTGATTTTCCAGTCGG GAAACCTGTC GTGCCAGCTG GGCGGTTTGC GTATTGGGCG CCAGGGTGGT CTGATTGCCC TTCACCGCCT GGCCCTGAGA CCCCAGCAGG CGAAAATCCT GTTTGATGGT TTCGGTATCG TCGTATCCCA CTACCGAGAT AATGGCGCGC ATTGCGCCCA GCGCCATCTG GATGCCCTCA TTCAGCATTT GCATGGTTTG TTCCCGTTCC GCTATCGGCT GAATTTGATT

ACGCAGACGC GCCGAGACAG AACTTAATGG' CAATGCGACC AGATGCTCCA CGCCCAGTCG GTTGATGGGT GTCTGGTCAG AGACATCAAGACGCAGACGC GCCGAGACAG AACTTAATGG 'CAATGCGACC AGATGCTCCA CGCCCAGTCG GTTGATGGGT GTCTGGTCAG AGACATCAAG

TTCCACAGCA ATGGCATCCT GGTCATCCAGTTCCACAGCA ATGGCATCCT GGTCATCCAG

TGATGCGGTA TTTTCTCCTT ACGCATCTGT TCTCAGTACA ATCTGCTCTG ATGCCGCATA CGTGACTGGG TCATGGCTGC GCCCCGACAC GCTTGTCTGC TCCCGGCATC CGCTTACAGA TGTCAGAGGT TTTCACCGTC ATCACCGAAA GCGTGGTCGT GAAGCGATTC ACAGATGTCT TTCTCCAGAA GCGTTAATGT CTGGCTTCTG TCCTGTTTGG TCACTGATGC CTCCGTGTAA CCGATGAAAC GAGAGAGGAT GCTCACGATA CTGGAACGTT GTGAGGGTAA ACAACTGGCG ACTCAGGGTC AATGCCAGCG CTTCGTTAAT CAGCATCCTG CGATGCAGAT CCGGAACATA AGACTTTACG AAACACGGAA ACCGAAGACCTGATGCGGTA TTTTCTCCTT ACGCATCTGT TCTCAGTACA ATCTGCTCTG ATGCCGCATA CGTGACTGGG TCATGGCTGC GCCCCGACAC GCTTGTCTGC TCCCGGCATC CGCTTACAGA TGTCAGAGGT TTTCACCGTC ATCACCGAAA GCGTGGTCGT GAAGCGATTC ACAGATGTCT TTCTCCAGAA GCGTTAATGT CTGGCTTCTG TCCTGTTTGG TCACTGATGC CTCCGTGTAA CCGATGAAAC GAGAGAGGAT GCTCACGATA CTGGAACGTT GTGAGGGTAA ACAACTGGCG ACTCAGGGTC AATGCCAGCG CTTCGTTAAT CAGCATCCTG CGATGCAGAT CCGGAACATA AGACTTTACG AAACACGGAA ACCGAAGACC

TTGCAGCAGC AGTCGCTTCA CGTTCGCTCGTTGCAGCAGC AGTCGCTTCA CGTTCGCTCG

AGGCAACCCC GCCAGCCTAG CCGGGTCCTC GGGGCCGCCA ATCCGGATAT AGTTCCTCCT GAGGCCCCAA GGGGTTATGC TAGTTATTGC TTTCGGGCTT TGTTAGCAGC CGGATCTCAG GCAAGCTTCG TTTAGTTGCA GTAGTTCTCCAGGCAACCCC GCCAGCCTAG CCGGGTCCTC GGGGCCGCCA ATCCGGATAT AGTTCCTCCT GAGGCCCCAA GGGGTTATGC TAGTTATTGC TTTCGGGCTT TGTTAGCAGC CGGATCTCAG GCAAGCTTCG GTTAGTTCG

CATTGTTCCA CAATGCCACG CTTCTGCAGG CCTGCACCAG GGCCCCCGCC CAGCTCCACCCATTGTTCCA CAATGCCACG CTTCTGCAGG CCTGCACCAG GGCCCCCGCC CAGCTCCACC

CGGGTCTTGG GTGTGTAGAA GAAGCCTCGT AGGTGTGAGC CGCACAGGTG TTGGTTCACA GGGCTGTCCA TGTGCTGGCG TTCGAATTTA CGTGGCACCA GACCAGAAGA ATGATGATGA AGTTAAACAA AATTATTTCT AGAGGGGAAT GTCGTATTAA TTTCGCGGGA TCGAGATCGA GCCTGCTTCT CGCCGAAACG TTTGGTGGCG TGCAAGATTC CGAATACCGC AAGCGACAGG TCCTCGCCGA AAATGACCCA GAGCGCTGCC AAGACAGTCA TAAGTGCGGC GACGATAGTC GGGTTGAAGG CTCTCAAGGG CATCGGTCGA ACATTAATTG CGTTGCGCTC ACTGCCCGCT CATTAATGAA TCGGCCAACG CGCGGGGAGA TTTTCTTTTC ACCAGTGAGA CGGGCAACAG GAGTTGCAGC AAGCGGTCCA CGCTGGTTTG GGTTAACGGC GGGATATAAC ATGAGCTGTC GTCCGCACCA ACGCGCAGCC CGGACTCGGT ATCGTTGGCA ACCAGCATCG CAGTGGGAAC TTGAAAACCG GACATGGCAC TCCAGTCGCC GCGAGTGAGA TATTTATGCC AGCCAGCCAG GCCCGCTAAC AGCGCGATTT GCTGGTGACC CGTACCGTCT TCATGGGAGA AAATAATACT AAATAACGCC GGAACATTAG TGCAGGCAGC CGGATAGTTA ATGATCAGCC CACTGACGCGCGGGTCTTGG GTGTGTAGAA GAAGCCTCGT AGGTGTGAGC CGCACAGGTG TTGGTTCACA GGGCTGTCCA TGTGCTGGCG TTCGAATTTA CGTGGCACCA GACCAGAAGA ATGATGATGA AGTTAAACAA AATTATTTCT AGAGGGGAAT GTCGTATTAA TTTCGCGGGA TCGAGATCGA GCCTGCTTCT CGCCGAAACG TTTGGTGGCG TGCAAGATTC CGAATACCGC AAGCGACAGG TCCTCGCCGA AAATGACCCA GAGCGCTGCC AAGACAGTCA TAAGTGCGGC GACGATAGTC GGGTTGAAGG CTCTCAAGGG CATCGGTCGA ACATTAATTG CGTTGCGCTC ACTGCCCGCT CATTAATGAA TCGGCCAACG CGCGGGGAGA TTTTCTTTTC ACCAGTGAGA CGGGCAACAG GAGTTGCAGC AAGCGGTCCA CGCTGGTTTG GGTTAACGGC GGGATATAAC ATGAGCTGTC GTCCGCACCA ACGCGCAGCC CGGACTCGGT ATCGTTGGCA ACCAGCATCG CAGTGGGAAC TTGAAAACCG GACATGGCAC TCCAGTCGCC GCGAGTGAGA TATTTATGCC AGCCAGCCAG GCCCGCTAAC AGCGCGATTT GCTGGTGACCGCGATTT GCTGGTGACCGATCGATGATAACCAGTGCGATGACAGACGATCGATGACAGACGATCGATACCAGACCTGGATGACGATTAGCGATACCAGATCTGGATGACGATGATCGATGACA

190 073190 073

5401 5401 TTGCGCGAGA AGATTGTGCA CCGCCGCTTT TTGCGCGAGA AGATTGTGCA CCGCCGCTTT ACAGGCTTCG ACAGGCTTCG ACGCCGCTTC ACGCCGCTTC GTTCTACCAT GTTCTACCAT 5461 5461 CGACACCACC ACGCTGGCAC CCAGTTGATC CGACACCACC ACGCTGGCAC CCAGTTGATC GGCGCGAGAT GGCGCGAGAT TTAATCGCCG TTAATCGCCG CGACAATTTG CGACAATTTG 5521 5521 CGACGGCGCG TGCAGGGCCA GACTGGAGGT CGACGGCGCG TGCAGGGCCA GACTGGAGGT GGCAACGCCA GGCAACGCCA ATCAGCAACG ATCAGCAACG ACTGTTTGCC ACTGTTTGCC 5581 5581 CGCCAGTTGT TGTGCCACGC GGTTGGGAAT CGCCAGTTGT TGTGCCACGC GGTTGGGAAT GTAATTCAGC GTAATTCAGC TCCGCCATCG TCCGCCATCG CCGCTTCCAC CCGCTTCCAC 5641 5641 TTTTTCCCGC GTTTTCGCAG AAACGTGGCT TTTTTCCCGC GTTTTCGCAG AAACGTGGCT GGCCTGGTTC GGCCTGGTTC ACCACGCGGG ACCACGCGGG AAACGGTCTG AAACGGTCTG 5701 5701 ATAAGAGACA CCGGCATACT CTGCGACATC ATAAGAGACA CCGGCATACT CTGCGACATC GTATAACGTT GTATAACGTT ACTGGTTTCA ACTGGTTTCA CATTCACCAC CATTCACCAC 5761 5761 CCTGAATTGA CTCTCTTCCG GGCGCTATCA CCTGAATTGA CTCTCTTCCG GGCGCTATCA TGCCATACCG TGCCATACCG CGAAAGGTTT CGAAAGGTTT TGCGCCATTC TGCGCCATTC 5821 5821 GATGGTGTCC GGGATCTCGA CGCTCTCCCT GATGGTGTCC GGGATCTCGA CGCTCTCCCT TATGCGACTC TATGCGACTC CTGCATTAGG CTGCATTAGG AAGCAGCCCA AAGCAGCCCA 5881 5881 GTAGTAGGTT GAGGCCGTTG AGCACCGCCG GTAGTAGGTT GAGGCCGTTG AGCACCGCCG CCGCAAGGAA CCGCAAGGAA TGGTGCATGC TGGTGCATGC AAGGAGATGG AAGGAGATGG 5941 5941 CGCCCAACAG TCCCCCGGCC ACGGGGCCTG CGCCCAACAG TCCCCCGGCC ACGGGGCCTG CCACCATACC CCACCATACC CACGCCGAAA CACGCCGAAA CAAGCGCTCA CAAGCGCTCA 6001 6001 TGAGCCCGAA GTGGCGAGCC CGATCTTCCC TGAGCCCGAA GTGGCGAGCC CGATCTTCCC CATCGGTGAT CATCGGTGAT GTCGGCGATA GTCGGCGATA TAGGCGCCAG TAGGCGCCAG 6061 6061 CAACCGCACC TGTGGCGCCG GTGATGCCGG CAACCGCACC TGTGGCGCCG GTGATGCCGG CCACGATGCG CCACGATGCG TCCGGCGTAG TCCGGCGTAG AGGATCGAGA AGGATCGAGA 6121 6121 TCGATCTCGA TCCCGCGAAA TTAATACGAC TCGATCTCGA TCCCGCGAAA TTAATACGAC TCACTATAGG TCACTATAGG GGAATTGTGA GGAATTGTGA GCGGATAACA GCGGATAACA 6181 6181 ATTCCCCTCT AGAAATAATT TTGTTTAACT ATTCCCCTCT AGAAATAATT TTGTTTAACT TTAAGAAGGA TTAAGAAGGA GATATACATA GATATACATA TGCACCATCA TGCACCATCA 624 1 624 1 TCATCATCAT TCTTCTGGTC TGGTGCCACG TCATCATCAT TCTTCTGGTC TGGTGCCACG CGGTTCTGGT CGGTTCTGGT ATGAAAGAAA ATGAAAGAAA CCGCTGCTGC CCGCTGCTGC 6301 6301 TAAATTCGAA CGCCAGCACA TGGACAGCCC AGATCTGGGT AC TAAATTCGAA CGCCAGCACA TGGACAGCCC AGATCTGGGT AC

Informacja o sekwencji: DŁUGOŚĆ: 6342 nukleotydów TYP: kwas nukleinowy TOPOLOGIA: plazmid ILOŚĆ NICI: jedna RODZAJ CZĄSTECZKI: DNASequence information: LENGTH: 6342 nucleotides TYPE: nucleic acid TOPOLOGY: plasmid NUMBER OF THREADS: one TYPE OF PARTICLE: DNA

190 073190 073

Amplifikacja DNA genu proinsuliny z wyłączeniem intronuDNA amplification of the proinsulin gene excluding the intron

Kpnl i HindlllKpnl and Hindlll

AspAspAspAspLys AspAspAspAspLys Ludzka proinsulina Human proinsulin UAA UAA I Trawienie enzymami i restrykcyjnymi Kpnl 1 Hindlll I Digestion with KpnI 1 HindIII restriction enzymes AspAspAspAspLys AspAspAspAspLys Ludzka proinsulina Human proinsulin UAA =i UAA = i

HindlllHindlll

190 073190 073

TCCGGCGTAG AGGATCGAGA TCGATCTCGA _lac operator_TCCGGCGTAG AGGATCGAGA TCGATCTCGA _lac operator_

GGAATTGTGA GCGGATAACA ATTCCCCTCT _ Start_6XHia_GGAATTGTGA GCGGATAACA ATTCCCCTCT _ Start_6XHia_

GATATACATA TGCACCATCA TCATCATCATGATATACATA TGCACCATCA TCATCATCAT

MetHisHis HisHi3HisHis _T7 Promotor ->MetHisHis HisHi3HisHis _T7 Promoter ->

TCCCGCGAAA TTAATACGAC TCACTATAGG rbsTCCCGCGAAA TTAATACGAC TCACTATAGG rbs

AGAAATAATT TTGTTTAACT TTAAGAAGGAAGAAATAATT TTGTTTAACT TTAAGAAGGA

ATGAAAGAAA CCGCTGCTGC TAAATTCGAA MetLysGlu ThrAlaAla AlalysPheGluATGAAAGAAA CCGCTGCTGC TAAATTCGAA MetLysGlu ThrAlaAla AlalysPheGlu

TCTTCTGGTC TGGTGCCACG CGGTTCTGGT SerSerGly LeuValPro ArgGlySerGlyTCTTCTGGTC TGGTGCCACG CGGTTCTGGT SerSerGly LeuValPro ArgGlySerGly

KpnIKpnI

CGCCAGCACA TGGACAGCCC AGATCTGGGT ArgGlnHis MetAspSer ProAspLeuGly __ 5' koniec proinsulina ludzka koniec 3' StopCGCCAGCACA TGGACAGCCC AGATCTGGGT ArgGlnHis MetAspSer ProAspLeuGly __ 5 'end human proinsulin end 3' Stop

ACCGACGACG ACGACAAGTT TGTGAACCAAC AC--- 231 pa---TACTGCAACTAAACCGACGACG ACGACAAGTT TGTGAACCAAC AC --- 231 pa --- TACTGCAACTAA

ThrAspAsp AspAspLys PheValAsnGln His--- 77 AA ---TyrCysAsnThrAspAsp AspAspLys PheValAsnGln His --- 77 AA --- TyrCysAsn

HindlllHindlll

ACGAAGCTTG CGGCCGCACT CGAGCACCAC CACCACCACC ACTGAGATCC GGCTGCTAACACGAAGCTTG CGGCCGCACT CGAGCACCAC CACCACCACC ACTGAGATCC GGCTGCTAAC

AAAGCCCGAA AGGAAGCTGA GTTGGCTGCT GCCACCGCTG AGCAATAACT AGCATAACCC _T7 terminator_AAAGCCCGAA AGGAAGCTGA GTTGGCTGCT GCCACCGCTG AGCAATAACT AGCATAACCC _T7 terminator_

CTTGGGGCCT CTAAACGGGT CTTGAGGGGT TTTTTGCTGA AAGGAGGAAC TATATCCGGACTTGGGGCCT CTAAACGGGT CTTGAGGGGT TTTTTGCTGA AAGGAGGAAC TATATCCGGA

Fig. 2Fig. 2

190 073190 073

6338 Kpnl 6331 Bglll6338 Kpnl 6331 Bglll

6227Ndel6227 Ndel

6188Xbal6188Xbal

5189 Apal5189 Apal

4892 Hincll4892 Hincll

5925Sphl5925Sphl

Sspl 906Sspl 906

Sspl 1474 Smali 525Sspl 1474 Smali 525

4248 Xbal 4209Ndel 4105 Bglll 4098 Kpnl 3969 Pstl 3940Apal 3921 Pstl 3894 Pstl 3813Hindlll4248 Xbal 4209Ndel 4105 Bglll 4098 Kpnl 3969 Pstl 3940Apal 3921 Pstl 3894 Pstl 3813Hindlll

Psfl 125Psfl 125

Apal 154 Psfl 173 Pstl 200Apal 154 Psfl 173 Pstl 200

Hindlll 281Hindlll 281

Fig. 3.Fig. 3.

3 43 4

Fig. 4.Fig. 4.

Departament Wydawnictw UP RP. Nakład 50 egz. Cena 4,00 zł.Publishing Department of the UP RP. Mintage 50 copies. Price PLN 4.00.

Claims (6)

Zastrzeżenia patentowePatent claims 1. Fuzyjne białko His-proinsuliny o wzorze 1.1. His-proinsulin fusion protein of Formula 1. 2. Sekwencja DNA kodująca fuzyjne białko His-proinsuliny o wzorze 2.2. DNA sequence encoding the His-proinsulin fusion protein of Formula 2. 3. Wektor ekspresyjny zawierający wklonowane DNA z fragmentem kodującym 43 aminokwasowy peptyd liderowy połączony z genem proinsuliny ludzkiej pod regulacyjną kontrolą silnego promotora bakteriofaga T7 z miejscem regulatorowym dla represora Lacl, z miejscem wiązania rybosomów rbs z bakteriofaga T7, z kodonem „stop” zmienionym z naturalnego kodonu UGA na sztucznie wprowadzony UAA, z genem oporności na kanamycynę, z origin ColEl, z origin faga fl, z genem kodującym represor Lacl, o wzorze 3 i o symbolu pAp2.13.1.3. An expression vector containing cloned DNA with a fragment coding for the 43 amino acid leader peptide fused to the human proinsulin gene under the regulatory control of the strong T7 bacteriophage promoter with a regulatory site for the Lacl repressor, with the rbs ribosome binding site of the T7 bacteriophage, with the "stop" codon changed from natural UGA codon on the artificially introduced UAA, with the kanamycin resistance gene, from origin ColEl, from phage origin fl, with the gene encoding the LacI repressor, of the formula 3 and the symbol pAp2.13.1. 4. Wektor ekspresyjny zawierający wklonowane DNA ze zdublowanym fragmentem kodującym 43 aminokwasowy peptyd liderowy połączony z genem proinsuliny ludzkiej pod regulacyjną kontrolą silnego promotora bakteriofaga T7 z miejscem regulatorowym dla represora Lacl, z miejscem wiązania rybosomów rbs z bakteriofaga T7, z kodonem „stop” zmienionym z naturalnego kodonu UGA na sztucznie wprowadzony UAA, z genem oporności na kanamycynę, z origin ColEl, z origin faga fl, z genem kodującym represor Lacl, o wzorze 4 i o symbolu pAp2.13.2x.4. An expression vector containing cloned DNA with a duplicate encoding a 43 amino acid leader peptide fused to the human proinsulin gene under the regulatory control of the strong T7 bacteriophage promoter with a Lacl repressor regulatory site, with the rbs ribosome binding site of bacteriophage T7, with the "stop" codon changed from of the natural UGA codon on the artificially introduced UAA, with the kanamycin resistance gene, from origin ColEl, from phage origin fl, with the gene encoding the LacI repressor, of the formula 4 and the symbol pAp2.13.2x. 5. Sposób wytwarzania ludzkiej proinsuliny w postaci białka fuzyjnego polegający na klonowaniu DNA genu kodującego proinsulinę do wektora ekspresyjnego i ekspresji w bakterii Escherichia coli, znamienny tym, że uzyskuje się fragment DNA kodujący ludzką proinsulinę wraz z sekwencją aminokwasową AspAspAspAspLys oraz z kodonem zdegenerowanym UAA sygnału „stop” dla procesu translacji poprzez amplifikację DNA i klonuje się do plazmidu DNA pET30LIC (Novagen, UK), po czym stosuje się transformację wektorem ekspresyjnym o wzorze 3 i o symbolu pAp2.13.1 komórek Escherichia coli i prowadzi się hodowlę komórek na znanych podłożach stałych i płynnych, przy czym hodowlę prowadzi się z komórkami posiadającymi gen kodujący polimerazę RNA faga T7, a następnie izoluje się fuzyjne białko ludzkiej His-proinsuliny o wzorze 1 z bakterii po ekspresji znanymi sposobami.5. A method of producing human proinsulin in the form of a fusion protein by cloning the DNA of the gene encoding proinsulin into an expression vector and expression in Escherichia coli bacteria, characterized by obtaining a DNA fragment encoding human proinsulin together with the AspAspAspAspLys amino acid sequence and the degenerate codon of the signal UAA " stop "for the translation process by DNA amplification and cloned into the pET30LIC DNA plasmid (Novagen, UK), followed by transformation with the expression vector of formula 3 and symbol pAp2.13.1 of Escherichia coli cells and cultivation of cells on known solid and liquid media , wherein the cultivation is carried out with cells having the gene encoding the T7 phage RNA polymerase, and then the human His-proinsulin fusion protein of formula 1 is isolated from the bacteria after expression by known methods. 6. Sposób wytwarzania ludzkiej proinsuliny w postaci fuzyjnego białka His-proinsuliny polegający na klonowaniu DNA genu kodującego proinsulinę do wektora ekspresyjnego i ekspresji w bakterii Escherichia coli, znamienny tym, że uzyskuje się z wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1 fragment DNA kodujący ludzką proinsulinę wraz z domeną sześciu kolejnych histydyn oraz sekwencją aminokwasową AspAspAspAspLys oraz z kodonem zdegenerowanym UAA sygnału „stop” dla procesu translacji oraz z silnym promotorem faga T7 wraz z miejscem regulatorowym dla represora Lacl, z miejscem wiązania rybosomów rbs z faga T7, silnym terminatorem faga T7 poprzez amplifikację DNA i klonuje się do wektora ekspresyjnego o wzorze 3 i o symbolu pAp2.13.1 w celu zdublowania systemu ekspresyjnego, po czym stosuje się transformację wektorem ekspresyjnym o wzorze 4 i o symbolu pAp2.13.2x komórek Escherichia coli i prowadzi się hodowlę komórek na znanych podłożach stałych i płynnych, przy czym hodowlę, prowadzi się z komórkami posiadającymi gen kodujący polimerazę RNA faga T7, a następnie izoluje się fuzyjne białko His-proinsuliny o wzorze 1 z bakterii po ekspresji znanymi sposobami.6. A method for the production of human proinsulin in the form of a His-proinsulin fusion protein by cloning the DNA of the gene encoding proinsulin into an expression vector and expression in Escherichia coli bacteria, characterized in that the expression vector of formula 3 and the symbol pAp2.13.1 is obtained from a DNA fragment encoding human proinsulin with the domain of six consecutive histidines and the amino acid sequence of AspAspAspAspLys and with the degenerate codon of the UAA "stop" signal for the translation process and with a strong T7 phage promoter with a regulatory site for the Lacl repressor, with a T7 rbs ribosome binding site, a strong phage terminator T7 by DNA amplification and cloned into an expression vector of formula 3 and the symbol pAp2.13.1 to duplicate the expression system, followed by transformation with the expression vector of formula 4 and the symbol pAp2.13.2x Escherichia coli cells and culturing the cells on known solid and liquid substrates, the culture, prov is adjuvanted with cells carrying the gene encoding phage T7 RNA polymerase, and then the His-proinsulin fusion protein of formula 1 is isolated from the bacteria after expression by known methods. 190 073190 073
PL98326333A 1998-05-15 1998-05-15 Fusion-type his-proinsuline protein, dna sequence, exparession vectors and a method of manufacturing human proinsuline in a from of fusion-type his-proinsuline protein PL190073B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PL98326333A PL190073B1 (en) 1998-05-15 1998-05-15 Fusion-type his-proinsuline protein, dna sequence, exparession vectors and a method of manufacturing human proinsuline in a from of fusion-type his-proinsuline protein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PL98326333A PL190073B1 (en) 1998-05-15 1998-05-15 Fusion-type his-proinsuline protein, dna sequence, exparession vectors and a method of manufacturing human proinsuline in a from of fusion-type his-proinsuline protein

Publications (2)

Publication Number Publication Date
PL326333A1 PL326333A1 (en) 1999-11-22
PL190073B1 true PL190073B1 (en) 2005-10-31

Family

ID=20072161

Family Applications (1)

Application Number Title Priority Date Filing Date
PL98326333A PL190073B1 (en) 1998-05-15 1998-05-15 Fusion-type his-proinsuline protein, dna sequence, exparession vectors and a method of manufacturing human proinsuline in a from of fusion-type his-proinsuline protein

Country Status (1)

Country Link
PL (1) PL190073B1 (en)

Also Published As

Publication number Publication date
PL326333A1 (en) 1999-11-22

Similar Documents

Publication Publication Date Title
Zavitz et al. ATPase-deficient mutants of the Escherichia coli DNA replication protein PriA are capable of catalyzing the assembly of active primosomes.
US5914237A (en) Kinase receptor activation assay
US7517970B2 (en) Nucleic acids encoding kinase and phosphatase enzymes, expression vectors and cells containing same
CN113201536B (en) Polynucleotide with promoter activity and application thereof in producing amino acid
KR20240012383A (en) Improved biotechnological method for producing guanidino acetic acid (GAA) by inactivation of amino acid exporters
CN113308482B (en) Tetrahydropyrimidine synthetic gene cluster from Yunnan tengcong and application thereof
CN114672447B (en) Bacterial strain with self-flocculation capability and preparation method and application thereof
CN110184292B (en) Method for improving yeast cell surface display functional Infliximab Fab fragment by utilizing molecular chaperone
CN113265414B (en) Construction method for converting high-yield bacterial strain of fengycin by using glucose
PL190073B1 (en) Fusion-type his-proinsuline protein, dna sequence, exparession vectors and a method of manufacturing human proinsuline in a from of fusion-type his-proinsuline protein
Ferguson et al. Isolation and analysis of an Abelson murine leukemia virus-encoded tyrosine-specific kinase produced in Escherichia coli.
CN114990080B (en) Lysine mutant thermostable nucleic acid ligase
US20030157084A1 (en) Methods for preparing purified prostaglandin E synthase
CN116987693A (en) Optimized CRISPR/SpCas12f1 system, engineering guide RNA and application thereof
CN110923220B (en) Enzyme composition, method for preparing enzyme composition and application
CN109872774B (en) YESS-based method for analyzing protein interaction in prokaryote
KR20200083488A (en) Enantioselective enzyme sulfoxide of chiral aryl sulfide
KR102282778B1 (en) Recombinant microorganisms and methods of use thereof
CN112442475B (en) L-glutamic acid production strain and construction method and application thereof
CN115161294B (en) Newcastle disease vaccine strain, construction method thereof, poultry immune recognition method and application
Scheinberg et al. A brain membrane protein similar to the rat src gene product.
RU2816486C2 (en) Chimeric enzyme mgl-s3 - methionine-gamma-lyase fused with s3 domain of vgf protein from vaccinia virus, method for producing mgl-s3 and anticancer preparation based on this enzyme
WO1995002055A1 (en) Novel protein inhibitors of serine proteinases (e.g. furin) derived from turkey ovomucoid third domain
KR20220149587A (en) Biocatalysts as core components of enzyme-catalyzed redox systems for biocatalytic reduction of cystine
CN107828813A (en) The recombination expression and purification process of a kind of anti-tumor active protein from Pholiota nameko