SK5742001A3 - Construction of production strains for producing substituted phenols by specifically inactivating genes of the eugenol and ferulic acid catabolism - Google Patents

Construction of production strains for producing substituted phenols by specifically inactivating genes of the eugenol and ferulic acid catabolism Download PDF

Info

Publication number
SK5742001A3
SK5742001A3 SK574-2001A SK5742001A SK5742001A3 SK 5742001 A3 SK5742001 A3 SK 5742001A3 SK 5742001 A SK5742001 A SK 5742001A SK 5742001 A3 SK5742001 A3 SK 5742001A3
Authority
SK
Slovakia
Prior art keywords
ala
leu
gly
asp
glu
Prior art date
Application number
SK574-2001A
Other languages
English (en)
Inventor
Jurgen Rabenhorst
Alexander Steinbuchel
Horst Priefert
Jorg Overhage
Original Assignee
Haarmann & Reimer Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haarmann & Reimer Gmbh filed Critical Haarmann & Reimer Gmbh
Publication of SK5742001A3 publication Critical patent/SK5742001A3/sk

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0083Miscellaneous (1.14.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01016Acetyl-CoA C-acyltransferase (2.3.1.16)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Description

Predkladaný vynález sa týka konštrukcie produkčných kmeňov a spôsobu prípravy substituovaných metoxyfenolov, predovšetkým vanilínu.
Doterajší stav techniky
DE-A 4 227 076 (spôsob prípravy substituovaných metoxyfenolov, a mikroorganizmu vhodného na tento účel) popisuje prípravu substituovaných metoxyfenolov použitím nového kmeňa Pseudomonas sp. Východiskovým materiálom v tomto prípade je eugenol a produktmi sú kyselina ferulová, kyselina vanilová, koniferylalkohol a koniferylaldehyd.
V roku 1995 publikoval Rosazza a kol. (Biocatalytic transformation of ferulic acid: an abundant aromatic natural product; J. Ind. Microbiol. 15:457471) rozsiahly prehľad biotransformácií uskutočniteľných na kyseline ferulovej.
V EP-A 0 845 532 boli popísané gény a enzýmy z Pseudomonas sp. pre syntézu koniferylalkoholu, koniferylaldehydu, kyseliny ferulovej, vanilínu a kyseliny vanilovej.
Inštitúte of Food Research, Norwich, Veľká Británia, popísal vWO
97/35999 enzýmy na premenu kyseliny ŕrans-ferulovej na ester ŕrans-feruloylSCoA a postupne na vanilín, a tiež gén na hydrolýzu uvedeného esteru. V roku
1998 bol obsah patentu uverejnený vo forme vedeckých publikácií (Gasson a kol 1998. Metabolism of ferulic acid to vanillin. Metabolizmus kyseliny ferulovej
31700 h • · ·· ·· ·· ·· • · · · · · · • · · · · ··· • ··· · · · · · • · · · · · ···· ·· ·· ·· na vanilín. J. Biol. Chem. 273:4163-4170; Narbad and Gasson 1998. Metabolism of ferulic acid via vanillin using a novel CoA-dependent pathway in a newly isolated strain of Pseudomonas fluorescens. Microbiology 144:1397 1405).
DE-A 195 32 317 popisuje použitie Amycolatopsis sp. vo fermentačnom získavaní vanilínu z kyseliny ferulovej vo vysokých výťažkoch.
Známe procesy majú tú nevýhodu, že buď dosahujú len veľmi nízke výťažky vanilínu, alebo používajú drahé východiskové zlúčeniny. Zatiaľčo posledne uvedený spôsob (DE-A 195 32 317) dosahuje vysoké výťažky, použitie Pseudomonas sp. HR199 a Amycolatopsis sp. HR167 na biotransformáciu eugenolu na vanilín vyžaduje fermentáciu, ktorá sa uskutočňuje vo dvoch krokoch, čo vedie k podstatnému zdraženiu a je časovo náročné.
Podstata vynálezu
Predmetom predkladaného vynálezu je preto konštruovanie organizmov ktoré sú schopné premieňať pomerne lacnú surovinu eugenol na vanilín jednostupňovým procesom.
Tento cieľ je dosiahnutý konštruovaním produkčných kmeňov jednobunkových alebo mnohobunkových organizmov, pričom tieto kmene sú charakterizované tým, že enzýmy zúčastňujúce sa katabolizmu eugenolu a/alebo kyseliny ferulovej sú inaktivované, takže dochádza k akumulácii medziproduktov koniferylalkoholu, koniferylaldehydu, kyseliny ferulovej, vanilínu a/alebo kyseliny vanilovej.
Produkčný kmeň môže byť jednobunkový alebo mnohobunkový. Preto sa vynález môže vzťahovať na mikroorganizmy, rastliny, alebo živočíchy. Okrem toho môžu byť použité aj extrakty získané z produkčných kmeňov. Podľa
31700 h • · • t • · • ··· • · • ····· ·· ··· · • ······· ···· ·· ·· ·· ·· · vynálezu sa uprednostňuje použitie jednobunkových organizmov, čo môžu byť mikroorganizmy alebo rastlinné či živočíšne bunky. Podľa vynálezu sa zvlášť uprednostňuje použitie vláknitých húb a baktérií. Najviac uprednostňované je použitie baktérií. Z baktérií, ktoré môžu byť predovšetkým použité po pozmenení ich katabolizmu eugenolu a/alebo kyseliny ferulovej, sú to druhy z rodov Rhodococcus, Pseudomonas a Escherichia.
V najjednoduchšom prípade sa na izoláciu organizmov použiteľných podľa vynálezu môžu použiť známe, bežne používané mikrobiologické metódy. V tom prípade sa enzýmová aktivita bielkovín zúčastňujúcich sa katabolických premien eugenolu a/alebo kyseliny ferulovej môže pozmeniť použitím enzýmových inhibítorov. okrem toho sa enzýmová aktivita bielkovín zúčastňujúcich sa katabolizmu eugenolu a/alebo kyseliny ferulovej môže pozmeniť mutáciou génov ktoré kódujú tieto bielkoviny. Tieto mutácie sa môžu vytvárať náhodne klasickými metódami, napríklad použitím ultrafialového žiarenia alebo látok spôsobujúcich mutácie.
Na izoláciu nových organizmov sú tiež použiteľné metódy rekombinantnej DNA ako sú delécie, inzercie a/alebo zámeny nukleotidov. Gény organizmov tak môžu byť napríklad inaktivované použitím iných elementov DNA (Ω elementy). Tiež môžu byť použité vhodné vektory na náhradu intaktných génov génovými štruktúrami ktoré sú pozmenené alebo inaktivované. V tomto prípade gény ktoré majú byť inaktivované a DNA elementy ktoré sú použité na inaktiváciu môžu byť získané klasickými klonovacími technikami alebo pomocou reťazových polymerázových reakcií (PCR).
31700 h
Napríklad podľa jedného z možných uskutočnení vynálezu môžu byť katabolizmus eugenolu a katabolizmus kyseliny ferulovej pozmenené inzerciou
Ω elementov do príslušných génov, alebo deléciami uskutočnenými na týchto génoch. V tomto prípade sa na inaktiváciu funkcií génov, ktoré kódujú dehydrogenázy, syntetázy, hydratázy-aldolázy, tiolázy, alebo demetylázy môžu • · · • · ·· ·· ·· ·· • · · · · · · • · · · · ··· • ····· ·· • · · · · ···· ·· ·· ·· použiť už spomínané metódy rekombinantej DNA takže produkcia kľúčových enzýmov je potom blokovaná. Prednostne ide o gény, ktoré kódujú koniferylalkoholdehydrogenázy, koniferylaldehyddehydrogenázy, feruloyl-CoAsyntetázy, enoyl-CoA-hydratázy-aldolázy, beta-ketotiolázy, vanilíndehydrogenázy alebo demetylázy kyseliny vanilovej. Osobitne sa uprednostňujú gény ktoré kódujú sekvencie aminokyselín špecifikované v EP-A 0845532 a/alebo sekvencie nukleotidov ktoré kódujú ich alelické variácie.
Predmet vynálezu sa podľa toho vzťahuje aj na génové štruktúry pre prípravu transformovaných organizmov a mutantov.
Prednostne sa využijú génové štruktúry v ktorých sú na izoláciu týchto organizmov a mutantov inaktivované sekvencie nukleotidov kódujúce dehydrogenázy, syntetázy, hydratázy-aldolázy, tiolázy alebo demetylázy. Predovšetkým sa uprednostňujú génové štruktúry v ktorých sú inaktivované sekvencie nukleotidov kódujúce koniferylalkoholdehydrogenázy, koniferylaldehyddehydrogenázy, feruloyl-CoA-syntetázy, enoyl-CoA-hydratázyaldolázy, beta-tiolázy, vanilíndehydrogenázy, alebo demetylázy kyseliny vanilovej. Osobitne sa uprednostňujú génové štruktúry ktoré majú štruktúru uvedenú na obrázkoch 1a až 1r a majú sekvencie nukleotidov opísané na obrázkoch 2a až 2r a/alebo sekvencie nukleotidov kódujúce ich alelické varianty. V tomto zmysle sa zvlášť uprednostňujú sekvencie nukleotidov 1 až 18.
Vynález zahrňuje tiež časti sekvencií uvedených génových štruktúr rovnako ako ich funkčné ekvivalenty. Pod pojmom funkčné ekvivalenty sa rozumejú tie deriváty DNA v ktorých boli zamenené jednotlivé nukleobázy (kolísavé zámeny - wobble exchanges) bez toho že by sa funkcia zmenila. Takisto sa môžu na bielkovinovej úrovni zameniť aminokyseliny bez toho, aby došlo k zmene funkcie.
31700 h ·· ·· • · · · • · · • · · · ···· ·· ·· • · • · · • · • · · ·· • · · • · ··· • · · · · ·· ··
Jedna alebo viac DNA sekvencií môže byť vložená pred a/alebo za génovými štruktúrami. Klonovaním génových štruktúr je možné získať plazmidy alebo vektory vhodné na transformácie a/alebo transfekciu organizmu a/alebo pre prenos do organizmu.
Vynález sa okrem toho vzťahuje na plazmidy a/alebo vektory na prípravu organizmov a mutantov ktoré sú transformované v súlade s vynálezom. Tieto organizmy a mutanty následne prechovávajú génové štruktúry ktoré boli popísané. Tento vynález sa preto vzťahuje aj na organizmy ktoré prechovávajú spomínané plazmidy a/alebo vektory.
Povaha plazmidov a/alebo vektorov závisí od toho na aký účel majú byť tieto použité. Napríklad na to aby bolo možné nahradiť intaktné gény katabolizmu eugenolu a/alebo kyseliny ferulovej v pseudomonádach génmi ktoré boli inaktivované omega elementárni sú potrebné vektory, ktoré na jednej strane môžu byť prenesené do pseudomonád (konjugatívne prenosné plazmidy) ale ktoré na strane druhej nemôžu byť v týchto organizmoch replikované a sú teda v pseudomonádach nestabilné (takzvané sebevražedné plazmidy). Segmenty DNA prenesené do pseudomonád pomocou takéhoto plazmidového systému sa vgenóme bakteriálnej bunky udržia len vtom prípade že sa doň integrujú homologickou rekombináciou.
Popísané génové štruktúry, vektory a plazmidy sa môžu použiť na prípravu rôznych transformovaných organizmov alebo mutantov. Uvedené génové štruktúry sa môžu využiť na nahradenie intaktných sekvencií nukleových kyselín pozmenenými a/alebo inaktivovanými génovými štruktúrami. V bunkách, ktoré možno získať transformáciou alebo transfekciou alebo konjugáciou je pomocou homologickej rekombinácie intaktný gén nahradený pozmenenou a/alebo inaktivovanou génovou štruktúrou, následkom čoho výsledné bunky obsahujú vo svojom genóme len zmenenú a/alebo inaktivovanú génovú štruktúru. Týmto spôsobom môžu byť v súlade s vynálezom zmenené a/alebo inaktivované gény tak, že relevantné organizmy sú schopné produkovať
31700 h ·· ·· ·· ·· ·· ··· · · · ·· • · · · · ··· · · • ····· · e ··· · • ······« ··· ·· ·· ·· ·· koniferylalkohol, koniferylaldehyd, kyselinu ferulovú, vanilín a/alebo kyselinu vanilovú.
Mutanty kmeňa Pseudomonas sp. HR199 (DSM 7063), ktorý bol detailne popísaný v DE-A 4 227 076 a EP-A 0845532, sú príkladmi produkčných kmeňov ktoré boli skonštruované týmto spôsobom podľa predmetu vynálezu, s príslušnými génovými štruktúrami vyplývajúcimi okrem iného z obrázkov 1a až 1 r, v kombinácii s obrázkami 2a až 2r.
1. Pseudomonas sp. HR199ca/ÄQKm, ktorá obsahuje QKm-inaktivovaný gén calA namiesto intaktného génu calA kódujúceho koniferylalkoholdehydrogenázu (Obr. 1a; Obr. 2a).
2. Pseudomonas sp. HR199ca/AQGm, ktorá obsahuje QGm-inaktivovaný gén calA namiesto intaktného génu calA kódujúceho koniferylalkoholdehydrogenázu (Obr. 1b; Obr. 2b).
3. Pseudomonas sp. HR199ca/AA, ktorá obsahuje deléciou inaktivovaný gén calA namiesto intaktného génu calA kódujúceho koniferylalkoholdehydrogenázu (Obr. 1c; Obr. 2c).
4. Pseudomonas sp. HR199ca/SQKm, ktorá obsahuje QKm-inaktivovaný gén calB namiesto intaktného génu calB kódujúceho koniferylaidehyddehydrogenázu (Obr. 1d; Obr. 2d).
5. Pseudomonas sp. HR199ca/fíQGm, ktorá obsahuje QGm-inaktivovaný gén calB namiesto intaktného génu calB kódujúceho koniferylaidehyddehydrogenázu (Obr. 1e; Obr. 2e).
6. Pseudomonas sp. HR199ca/SA, ktorá obsahuje deléciou inaktivovaný gén calB namiesto intaktného génu calB kódujúceho koniferylaidehyddehydrogenázu (Obr. 1f; Obr. 2f).
7. Pseudomonas sp. HR199fcsQKm, ktorá obsahuje QKm-inaktivovaný gén fcs namiesto intaktného génu fcs kódujúceho feruloyl-CoA-syntetázu (Obr. 1g; Obr. 2g).
31700 h
·· ·· ·· ·· · ·
• · • · ··
• · ···
e • ·
··· · ·· • · ·· ·· • ·
8. Pseudomonas sp. HR199fcsOGm, ktorá obsahuje QGm-inaktivovaný gén fcs namiesto intaktného génu fcs kódujúceho feruloyl-CoA-syntetázu (Obr. 1h; Obr. 2h).
9. Pseudomonas sp. HR199fcsA, ktorá obsahuje deléciou inaktivovaný gén fcs namiesto intaktného génu fcs kódujúceho koniferylalkoholdehydrogenázu (Obr. 1i; Obr. 2i).
10. Pseudomonas sp. HR199echQKm, ktorá obsahuje QKm-inaktivovaný gén ech namiesto intaktného génu ech kódujúceho enoyl-CoAhydratázu-aldolázu (Obr. 1j; Obr. 2j).
11. Pseudomonas sp. HR199echQGm, ktorá obsahuje QGm-inaktivovaný gén ech namiesto intaktného génu ech kódujúceho enoyl-CoAhydratázu-aldolázu (Obr. 1k; Obr. 2k).
12. Pseudomonas sp. HR199ec/7A, ktorá obsahuje deléciou inaktivovaný gén ech namiesto intaktného génu ech kódujúceho enoyl-CoAhydratázu-aldolázu (Obr. 11; Obr. 21).
13. Pseudomonas sp. HR199aaíQKm, ktorá obsahuje QKm-inaktivovaný gén aat namiesto intaktného génu aat kódujúceho beta-ketotiolázu (Obr. 1m; Obr. 2m).
14. Pseudomonas sp. HR199aaťQGm, ktorá obsahuje QGm-inaktivovaný gén aat namiesto intaktného génu aat kódujúceho beta-ketotiolázu (Obr. 1 n; Obr. 2n).
15. Pseudomonas sp. HR199aaŕA, ktorá obsahuje deléciou inaktivovaný gén aat namiesto intaktného génu aat kódujúceho beta-ketotiolázu (Obr. 1o; Obr. 2o).
16. Pseudomonas sp. HR199vdhQKm, ktorá obsahuje QKm-inaktivovaný gén vdh namiesto intaktného génu vdh kódujúceho vanilíndehydrogenázu (Obr. 1 p; Obr. 2p).
17. Pseudomonas sp. HR199vd/7QGm, ktorá obsahuje QGm-inaktivovaný gén vdh namiesto intaktného génu vdh kódujúceho vanilíndehydrogenázu (Obr. 1 p; Obr. 2p).
31700 h ·· ·· ··
9999
99 ··· · · • · ·· • · · • · ···
18. Pseudomonas sp. HR199vdbA, ktorá obsahuje deléciou inaktivovaný gén vdh namiesto intaktného génu vdh kódujúceho vanilíndehydrogenázu (Obr. 1 r; Obr. 2r).
19. Pseudomonas sp. HR199vdúBQKm, ktorá obsahuje QKm-inaktivovaný gén vdhB namiesto intaktného génu vdhB kódujúceho vanilíndehydrogenázu II.
20. Pseudomonas sp. HR199vdhBQGm, ktorá obsahuje QGm-inaktivovaný gén vdhB namiesto intaktného génu vdhB kódujúceho vanilíndehydrogenázu II.
21. Pseudomonas sp. HR199vd/?BA, ktorá obsahuje deléciou inaktivovaný gén vdhB namiesto intaktného génu vdhB kódujúceho vanilíndehydrogenázu II.
22. Pseudomonas sp. HR199addQKm, ktorá obsahuje QKm-inaktivovaný gén adh namiesto intaktného génu adh kódujúceho alkoholdehydrogenázu.
23. Pseudomonas sp. HR199ad/7QGm, ktorá obsahuje QGm-inaktivovaný gén adh namiesto intaktného génu adh kódujúceho alkoholdehydrogenázu.
24. Pseudomonas sp. HR199addA, ktorá obsahuje deléciou inaktivovaný gén adh namiesto intaktného génu adh kódujúceho alkoholdehydrogenázu.
25. Pseudomonas sp. HR199vanAQKm, ktorá obsahuje QKm-inaktivovaný gén vanA namiesto intaktného génu vanA kódujúceho a-podjednotku demetylázy kyseliny vanilovej
26. Pseudomonas sp. HR199vanAQGm, ktorá obsahuje QGm-inaktivovaný gén vanA namiesto intaktného génu vanA kódujúceho a-podjednotku demetylázy kyseliny vanilovej
27. Pseudomonas sp. HR199vanÄA, ktorá obsahuje deléciou inaktivovaný gén vanA namiesto intaktného génu vanA kódujúceho a-podjednotku demetylázy kyseliny vanilovej
31700 h • · • · • · • 9 • ··· ·· ··
28. Pseudomonas sp. HR199vanfíOKm, ktorá obsahuje OKm-inaktivovaný gén vanB namiesto intaktného génu vanB kódujúceho β-podjednotku demetylázy kyseliny vanilovej
29. Pseudomonas sp. HR199vanfiQGm, ktorá obsahuje QGm-inaktivovaný gén vanB namiesto intaktného génu vanB kódujúceho β-podjednotku demetylázy kyseliny vanilovej
30. Pseudomonas sp. HR199vanSA, ktorá obsahuje deléciou inaktivovaný gén vanB namiesto intaktného génu vanB kódujúceho β-podjednotku demetylázy kyseliny vanilovej
Vynález sa naviac vzťahuje aj na proces biotechnologickej prípravy organických látok. Predovšetkým sa proces môže použiť na prípravu alkoholov, aldehydov a organických kyselín, z nich prednostne koniferylalkoholu, koniferylaldehydu, kyseliny ferulovej, vanilínu a kyseliny vanilovej.
Horepopísané organizmy boli použité v tomto novom procese. Obzvlášť preferované organizmy zahrňujú baktérie, predovšetkým druhy z rodu Pseudomonas. Presnejšie, horeuvedené druhy rodu Pseudomonas môžu byť prednostne použité v nasledovných procesoch:
1. Pseudomonas sp. HR199ca/AQKm, Pseudomonas sp. HR199ca/AQGm a Pseudomonas sp. HR199ca/AA na prípravu koniferylalkoholu z eugenolu
2. Pseudomonas sp. HR199ca/BQKm, Pseudomonas sp. HR199ca/BQGm a Pseudomonas sp. HR199ca/SA na prípravu koniferylaldehydu z eugenolu alebo koniferylalkoholu
3. Pseudomonas sp. HR199fcsQKm, Pseudomonas sp. HR199fcsQGm, Pseudomonas sp. HR199fcsA, Pseudomonas sp. HR199echQKm, Pseudomonas sp. HR199echQGm a Pseudomonas sp. HR199echA na
31700 h • · • · • · • ··· • · ···· ·· • · · · · ·· ·· ·· · prípravu kyseliny feruiovej zeugenolu alebo koniferylalkoholu alebo koniferylaldehydu.
4. Pseudomonas sp. HR199vdhQKm, Pseudomonas sp. HR199vdhQGm,
Pseudomonas sp. HR199vdríA, Pseudomonas sp. HR199vdríQGmvdhBQKm, Pseudomonas sp.
HR199vd/7QKmvd/7fínGm, Pseudomonas sp. HR199vdríAvdríBQGm a Pseudomonas sp. HR199vd/7AvdríBQKm na prípravu vanilínu z eugenolu alebo koniferylalkoholu alebo koniferylaldehydu alebo kyseliny feruiovej
5. Pseudomonas sp. HR199vanADKm, Pseudomonas sp. HR199vanAQGm, Pseudomonas sp. HR199vanAA, Pseudomonas sp. HR199vanfínKm, Pseudomonas sp. HR199vanSDGm a Pseudomonas sp. HR199vanfíA na prípravu kyseliny vanilovej zeugenolu alebo koniferylalkoholu, alebo koniferylaldehydu alebo kyseliny feruiovej alebo vanilínu
Preferovaným substrátom je eugenol. Tiež však možno pridať ďalšie substráty alebo dokonca nahradiť eugenol iným substrátom.
Vhodnými živnými médiami pre organizmy využívané podľa vynálezu sú syntetické, semisyntetické alebo komplexné kultivačné médiá. Tieto média môžu obsahovať uhlíkaté a dusíkaté látky, anorganické soli, tam kde je potrebné stopové prvky, a vitamíny.
Vhodnými uhlíkatými látkami môžu byť sacharidy, uhľovodíky alebo bežné organické zlúčeniny. Príkladmi prednostne použitých látok sú cukry, alkoholy alebo cukorné alkoholy, organické kyseliny alebo komplexné zmesi.
31700 h ·· ·· ·· ·· • · · • · ··· • · · ·· • · • · · · • · · • · · · • · ···· ·· ·· ·
Cukrom je prednostne glukóza. Použitými organickými kyselinami môžu byť prednostne kyselina citrónová a kyselina octová. Príkladom komplexných zmesí sú sladový extrakt, kvasničný extrakt, kazeín alebo kazeínový hydrolyzát.
Anorganickými zlúčeninami sú vhodné dusíkaté substráty. Ich príkladom sú dusičnany a amóniové soli. Tiež sa môžu použiť organické zdroje dusíka. Tieto zahrnujú kvasničný extrakt, sójový šrot, kazeín, kazeínový hydrolyzát a kukuričný výluh.
Príkladmi anorganických solí ktoré možno použiť sú sírany, dusičnany, chloridy, uhličitany a fosforečnany. Kovmi ktoré tieto soli obsahujú sú prednostne sodík, draslík, horčík, mangán, vápnik, zinok a železo.
Teplota kultivácie je prednostne v rozsahu od 5 do 100 °C. Predovšetkým sa uprednostňuje rozsah od 15 do 60 °C, najviac sa uprednostňuje rozsah od 22 do 37°C.
pH média je prednostne od 2 do 12. Predovšetkým sa uprednostňuje rozsah pH od 4 do 8.
Na tento nový proces sa môže v zásade použiť hocijaký fermentor s ktorým vie skúsená osoba pracovať. Uprednostňujú sa všetky zariadenia vhodné pre submerzné procesy. To znamená že podľa vynálezu možno použiť nádoby vybavené mechanickým miešacím zariadením alebo nádoby bez neho. Príkladmi nádob bez miešacieho zariadenia sú trepačkové zariadenia, prebublávané kolónové reaktory alebo reaktory s recirkuláciou. Prístroje s miešacím zariadením prednostne zahrnujú všetky známe prístroje vybavené miešadlami každého možného typu.
Tento nový proces sa môže uskutočňovať kontinuálne alebo vsádzkovo.
Doba fermentácie potrebná na dosiahnutie maximálneho množstva produktu
31700 h • ··· · · závisí na špecifickej povahe použitého organizmu. V zásade sú však doby fermentácie medzi 2 až 200 hodinami.
Predmet vynálezu je bližšie vysvetlený s odvolaním na príklady nasledovne:
Mutanty kmeňa Pseudomonas sp. HR199 (DSM 7063) utilizujúce eugenol boli cielene generované špecifickou inaktiváciou génov katabolizmu eugenolu vložením omega elementov alebo deléciami. Použitými omega elementárni boli segmenty DNA ktoré kódovali rezistencie na antibiotiká kanamycín (ΩΚπί) a gentamycín (Gm). Tieto gény pre rezistenciu boli izolované štandardnými metódami zTn5 a plazmidu pBB1MCS-5. Gény calA, calB, fcs, ech, aat, vdh, adh, vdhB, vanA a vanB, ktoré kódujú koniferylalkoholdehydrogenázu, koniferylaldehyddehydrogenázu, feruloyl-CoAsyntetázu, enoyl-CoA-hydratázu-aldolázu, beta-ketotiolázu, vanilíndehydrogenázu, alkoholdehydrogenázu, vanilíndehydrogenázu II a demetylázu kyseliny vanilovej, boli izolované štandardnými metódami zgenomickej DNA kmeňa Pseudomonas sp. HR199 a klonované do pBluescript SK'. Štiepením vhodnými reštrikčnými endonukleázami boli segmenty DNA z týchto génov odstránené (delécia) alebo nahradené Ω elementárni (inzercia), čím sa prískušné gény inaktivovalí. Gény mutované týmto spôsobom boli potom reklonované do konjugatívne prenosných vektorov a postupne zavedené do kmeňa Pseudomonas sp. HR199. Vhodnou selekciou sa získali transkonjuganty v ktorých boli príslušné funkčné gény pôvodného kmeňa nahradené zavedenými inaktivovanými génmi. Inzerčné a delečné mutanty získané týmto spôsobom obsahovali len príslušné inaktivované gény. Tento postup sa použil tak na získanie mutantov ktoré majú len jeden defektný gén ako aj na získanie viacnásobných mutantov, ktoré mali týmto spôsobom inaktivovaných niekoľko génov.Tieto mutanty sa použili na biotransformáciu:
a) eugenolu na koniferylalkohol, koniferylaldehyd, kyselinu ferulovú, vanilín a/alebo kyselinu vanilovú;
31700 h
9 9 • · • · · · · · · • · · · e ··· • ····· e · • · · · e ···· ·· ·· ··
b) koniferylalkoholu na koniferylaldehyd, kyselinu ferulovú, vanilín a/alebo kyselinu vanilovú;
c) koniferylaldehydu na kyselinu ferulovú, vanilín a/alebo kyselinu vanilovú;
d) kyseliny ferulovej na vanilín a/alebo kyselinu vanilovú;
e) vanilínu na kyselinu vanilovú.
Materiály a metódy
Podmienky na kultiváciu baktérií.
Kmene Escherichia coli boli propagované pri 37 °C v minerálnom médiu Luria-Bertani (LB) alebo M9 (J. Sambrook, E. F. Fritsch and T. Maniatis. 1989. Molecular cloning: a laboratory manual. Molekulárne klonovanie: laboratórny manuál. 2nd Edition., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York). Kmene Pseudomonas sp. boli propagované pri 30 °C v Živnom Médiu (ŽM, 0,8%, hm./obj.) alebo v minerálnom médiu (MM) (H. G. Schlegel, et al. 1961. Árch. Mikrobiol. 38:209-222) alebo v HR minerálnom médiu (HR-MM) (J. Rabenhorst, 1996. Appl. Microbiol. Biotechnol. 46:470-474). Kyselina ferulová, vanilín, kyselina vanilová a kyselina protokatechová boli rozpustené v dimetylsulfoxide a pridali sa do príslušného média v takom množstve, aby výsledná koncentrácia bola 0,1% (hm./obj.). Eugenol sa pridával priamo do média na výslednú koncentráciu 0,1% (obj./hm.) alebo sa naniesol na filtračný papier (kruhový filter 595, Schleicher & Schueil, Dassel, Nemecko) vo viečkach MM agarových platní. Pri propagácii transkonjugantov a mutantov Pseudomonas sp. sa používali tetracyklín v konečnej koncentrácii 25 pg/ml, kanamycín v konečnej koncentrácii 100 gg/ml a gentamycín v konečnej koncentrácii 7,5 pg/ml.
Kvalitatívna a kvantitatívna detekcia metabolických medziproduktov v s u per na taňte kultivačného média.
Supernatanty kultivačných médiií boli analyzované vysokoúčinnou kvapalinovou chromatografiou (Knauer HPLC) buď priamo alebo po zriedení s
31700 h • · • · • · · • · • · · · • · · ··· dvakrát destilovanou H2O. Chromatografia sa vykonávala na kolóne Nucleosil 100 C18 (7 gm, 250 x 4 mm). Ako rozpúšťadlo sa použila zmes 0,1% (obj./obj.) kyseliny mravčej a acetonitrilu. Priebeh použitého gradientu na elúciu látok bol následovný:
00:00 - 06:30 -> 26% acetonitrilu
06:30 - 08:00 -> 100% acetonitrilu
08:00 -12:00 -> 100% acetonitrilu
12:00 -13:00 -> 26% acetonitrilu
13:00 - 18:00 -> 26% acetonitrilu
Čistenie vanilíndehydrogenázy II.
Purifikácia sa uskutočňovala pri 4 °C.
Hrubý extrakt
Bunky Pseudomonas sp. HR199 propagované na eugenole sa premyli v 10 mM tlmivom roztoku fosforečnanu sodného, pH 6,0, resuspendovali sa v tom istom tlmivom roztoku a rozbili sa dvojitým prepustením cez Frenchov lis (Amicon, Silver Spring, Maryland, USA) za tlaku 1000 psi. Bunkový homogenát sa podrobil uitracentrifugácii (1hod., 100 000 x g, 4 °C), čím sa získala rozpustná frakcia hrubého extraktu vo forme supematantu.
Aniónovýmenná chromatografia na DEAE Sephacel-e.
Rozpustná frakcia hrubého extraktu sa cez noc dialyzovala oproti 10 mM tlmivému roztoku fosforečnanu sodného, pH 6,0. Dialyzát sa naniesol na kolónu z DEAE -Sephacel (2,6 cm x 35 cm, objem kolóny 186 ml) stabilizovanú v 10 mM tlmivom roztoku fosforečnanu sodného, pH 6,0, s prietokom 0,8 ml/min. Kolóna bola premytá dvoma objemami kolóny 10 mM tlmivého fosforečnanového roztoku, pH 6,0. Vanilíndehydrogenáza II (VDH II) bola eluovaná lineárnym soľným gradientom od 0 do 400 mM NaCl v 10 mM tlmivom roztoku fosforečnanu sodného, pH 6,0 (750 ml), pričom sa odoberali frakcie o
31700 h ·· ·· ·· ·· ·· ···· ··· 9 9 9 • · · · 9 ··· · · · ··· ·· ·· ··· · ···· ·· ·· ·· ·· · objeme 10 ml. Podiely s vysokou aktivitou VDH II sa spojili do spoločnej DEAE frakcie.
Stanovenie aktivity vanilíndehydrogenázy
Aktivita VDH sa stanovila pri 30 °C použitím optického enzýmového testu. Reakčná zmes o objeme 1 ml obsahovala 0,1 mmol fosforečnanu sodného (pH 7,1), 0,125 μιτιοΙ vanilínu, 0,5 μιτιοΙ NAD, 1,2 μιτιοΙ pyrohroznanu sodného, laktát dehydrogenázu (1U, z prasačieho srdca), a roztok enzýmu. Oxidácia vanilínu sa sledovala pri vlnovej dĺžke λ = 340 nm (evaniiin = 11.6 ατι2/μΐτ)οΙ). Aktivita enzýmu bola vyjadrená v jednotkách (U), pričom 1 U zodpovedá množstvu enzýmu ktoré premení 1 μπιοΙ vanilínu za minútu. Koncentrácie bielkovín vo vzorkách boli stanovované metódou Lowryho a kol. (O. H. Lowry, N. J. Rosebrough, A. L. Farr and R. J. Randall. 1951. J. Biol. Chem. 193:265-275).
Stanovenie aktivity koniferylalkoholdehydrogenázy.
Aktivita koniferylalkoholdehydrogenázy bola stanovovaná pri 30 °C optickým enzýmovým testom podľa Jaegra a kol. (E. L. Jaeger, Eggeling and H. Sahm. 1981. Current Microbiology. 6:333-336). Reakčná zmes o objeme 1 ml obsahovala 0,2 mmol tris/HCI (pH 9,0), 0,4 μιτιοΙ koniferyl alkoholu, 2 μΓηοΙ NAD, 0,1 mmol semikarbazidu a roztok enzýmu. Redukcia NAD sa sledovala pri λ = 340 nm (ε = 6,3 ατι2/μηιοΙ). Aktivita enzýmu bola vyjadrená v jednotkách (U), pričom 1 U zodpovedá množstvu enzýmu ktoré premení 1 μιτιοΙ substrátu za minútu. Koncentrácie bielkovín vo vzorkách boli stanovované metódou Lowryho a kol. (O. H. Lowry, N. J. Rosebrough, A. L. Farr and R. J. Randall. 1951. J. Biol. Chem. 193:265-275).
Stanovenie aktivity koniferylaldehyddehydrogenázy.
Aktivita koniferylaldehyddehydrogenázy bola stanovená pri 30 °C optickým enzýmovým testom. Reakčná zmes o objeme 1 ml obsahovala 0,1 mmol tris/HCI (pH 8,8), 0,08 μιτιοΙ koniferyl aldehydu, 2,7 μητο! NAD a roztok
31700 h • · ·· ·· ·· ·· ···· ··· ··· • · · · · ··· · · • ··· · · ·· ··· · ···· ·· ·· ·· ·· enzýmu. Oxidácia koniferylaldehydu na kyselinu ferulovú sa sledovala pri λ = 400 nm (ε = 34 cm2/pmol). Aktivita enzýmu bola vyjadrená v jednotkách (U), pričom 1 U zodpovedá množstvu enzýmu ktoré premení 1 μηηοΙ substrátu za minútu. Koncentrácie bielkovín vo vzorkách boli stanovované metódou Lowryho a kol. (O. H. Lowry, N. J. Rosebrough, A. L. Farr and R. J. Randall. 1951. J. Biol. Chem. 193:265-275).
Stanovenie aktivity feruloyl-CoA-syntetázy (tiokinázy kyseliny ferulovej).
Aktivita feruloyl-CoA-syntetázy bola stanovená pri 30 °C modifikáciou optického enzýmového testu podľa Zenka a kol. (Zenk et al. 1980. Anál. Biochem. 101:182-187). Reakčná zmes o objeme 1 ml obsahovala 0,09 mmol fosforečnanu draselného (pH 7,0), 2,1 pmol MgCb, 0,7 μιτιοΙ kyseliny ferulovej, 2 pmol ATP, 0,4 μπιοΙ koenzýmu A a roztok enzýmu. Tvorba esteru CoA z kyseliny ferulovej sa sledovala pri λ = 345 nm (ε = 10 cm2/pmol). Aktivita enzýmu bola vyjadrená v jednotkách (U), pričom 1 U zodpovedá množstvu enzýmu ktoré premení 1 μιτιοΙ substrátu za minútu. Koncentrácie bielkovín vo vzorkách boli stanovované metódou Lowryho a kol. (O. H. Lowry, N. J. Rosebrough, A. L. Farr and R. J. Randall. 1951. J. Biol. Chem. 193:265-275).
Elektroforetické metódy
Extrakty obsahujúce bielkoviny sa frakcionovali za natívnych podmienok v 7,4% (hm./obj.) polyakrylamidových géloch metódou podľa Stegermanna a kol. (Stegermann et al. 1973. Z. Naturforsch. 28c:722-732) a za denaturačných podmienok v 11,5% (hm./obj.) polyakrylamidových géloch metódou podľa Laemmli (Laemmli, U. K. 1970. Náture (London) 227:680-685). Nešpecifické farbenie proteínov sa vykonávalo pomocou Serva Blue R. Pre špecifické farbenie koniferylalkoholdehydrogenázy, koniferylaldehyddehydrogenázy a vanilíndehydrogenázy boli gély počas 20 min. prepufrované v 100 mM tlmivom roztoku fosforečnanu draselného (pH 7,0) a postupne inkubované pri 30 °C v tom istom tlmivom roztoku do ktorého bolo pridaných 0,08% (hm./obj.) NAD,
31700 h • · ·· ·· ·· ·· • · · · · · · • · · · · ··· • ··· · · · · · • · · · · · ···· ·· ·· ·· • · · • 9
9 · • · ·· ·
0,04% (hm./obj.) p-nitro blue tetrazolium chloridu, 0,003% (hm./obj.) fenazín metosulfátu a 1 mM príslušného substrátu až do zviditeľnenia farebných pásov.
Prenos bielkovín z polyakrylamidových gélov na PVDF membrány.
Bielkoviny boli prenesené z SDS-polyakrylamidových gélov na PVDF membrány (Waters-Millipore, Bedford, Mass. USA) s použitím zariadenia Semidry Fastblot (B32/33, Biometra, Gôttingen, Nemecko) podľa inštrukcií výrobcu.
Určenie N-terminálnych sekvencii aminokyselín.
N-terminálne aminokyseliny boli určené pomocou Protein Peptide Sequencer (Type 477 A, Applied Biosystems, Foster City, USA) a PTH analyzérom podľa inštrukcií výrobcu.
Izolácia a spracovanie DNA
Genomická DNA bola izolovaná metódou podľa Marmura (J. Marmur, 1961. J. Mol. Biol. 3:208-218). Iné DNA z plazmidov a/alebo reštrikčné fragmenty DNA boli izolované a analyzované štandardnými metódami (J. E. Sambrook, F Fritsch a T. Maniatis. 1989. Molecular cloning: a laboratory manual. 2nd Edition., Cold Spring Harbor Laboratoury Press, Cold Spring Harbor, New York).
Prenosy DNA.
Kompetentné bunky Escherichia coli boli pripravené a transformované metódou podľa Hanahana (D. Hanahan, J. Mol. Biol. 166:557-580). Konjugatívny prenos plazmidov medzi kmeňmi Escherichia coli S17-1 prechovávajúcimi plazmidy (donor) a kmeňmi Pseudomonas sp. (recipient) sa uskutočnil na agarových platniach so živným médiom podľa metódy Friedricha a kol. (B. Friedrich et al. 1981. J. Bacteriol.. 147:198-205), alebo „minikomplementačnou metódou,, na agarových platniach s minerálnym médiom obsahujúcich 0,5% (hm./obj.) glukonátu ako zdroja uhlíka a 25 pg tetracyklínu/ml alebo 100 μ9 kanamycínu/ml. V tomto prípade sa bunky
31700 h ·· ·· ·· • · · · • · · • ··· • · ···· ·· ·· ·· • · · · · · • · ··· · · • · ·· ··· · • · · · · · ·· ·· ·· · recipientu naniesli čiarkovaním v jednom smere ako inokulačná čiara. Po piatich minútach sa aplikovali kmene donoru ako inokulačné čiary, pričom križovali inokulačnú čiaru recipienta. Po 48 hodinovej inkubácii pri 30 °C rástli priamo na miestach prekríženia inokulačných čiar transkonjuganty, zatiaľčo ani kmeň donora ani kmeň recipienta neboli schopné rásť.
Hybridizačné experimenty
Reštrikčné fragmenty DNA boli elektroforeticky frakcionované v 0,8% (hm./obj.) agarózovom géli v tlmivom roztoku 50 mM tris- 50 mM kyselina boritá- 1,25 mM EDTA (pH 8,25) (J. E. Sambrook, F. Fritch, and T. Maniatis. 1989, Molecular cloning: a laboratory manual. Molekulárne klonovanie: laboratórny manuál. 2nd Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York.). Prenos denaturovanmej DNA z gélu na kladne nabitú nylonovú membránu (veľkosť pórov: 0,45 mm, Pall Filtrationtechnik, Dreieich, Nemecko), postupná hybridizácia s biotinylovanými alebo digoxigenínom značenými DNA vzorkami a príprava týchto vzoriek DNA boli uskutočnené štandardnými metódami (J. E. Sambrook, F. Fritch, and T. Maniatis. 1989, Molecular cloning: a laboratory manual. 2nd Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York.).
Sekvenovanie DNA
Sekvencie nukleotidov boli určené „nerádioaktívne,, metódou dideoxy konca podľa Sangera a kol. (Sanger et al. 1977. Proc. Natl. Acad. Sci USA 74:5463-5467) s použitím „LI-COR,, DNA sekvencéra Model 4000L (LI-COR Inc., Biotechnology Division, Lincoln NE, USA) a použitím „súpravy na cyklické sekvenovanie termosekvenázou s fluorescenčné značeným primérom so 7deaza-dGTP„ (Amersham Life Science, Amersham International plc., Little Chalfont, Buckinghamshire, England), vždy podľa inštrukcií výrobcu.
Na sekvenovanie „stratégiou skákajúceho priméru,, podľa Straussa a kol.
(E. C. Strauss et al. 1986. Anál. Biochem. 154:353-360) sa použili syntetické oiigonukleotidy.
31700 h ·· • · · • · • · · • · ·· · ·· ·· ·· • · · · • · · • ··· • I ···· ·· ·· • · · • · ··· • · · · · • · · · ·· ··
Chemikálie, biochemikálie a enzýmy.
Reštrikčné enzýmy, DNA iigáza T4, lambda DNA a enzýmy a substráty pre optické enzýmové testy pochádzali od C.F. Boehringer & Sôhne (Mannheim, Nemecko), alebo z GIBCO/BRL (Eggenstei, Nemecko). [γ-32Ρ]ΑΤΡ pochádzalo od Amersham/Buchler (Braunschweig, Nemecko). Oligonukleotidy boli od MWG-Biotech GmbH (Ebersberg, Nemecko). Agaróza typ NA bola od Pharmacia-LKB (Uppsala, Švédsko). Všetky ostatné chemikálie boli od Haarmann & Reimer (Holzminden, Nemecko), E. Merck AG (Darmstadt, Nemecko), Fluka Chemie (Buchs, Švajčiarsko), Serva Feinbiochemica (Heidelberg, Nemecko) alebo Sigma Chemie (Deisenhofen, Nemecko).
Príklady uskutočnenia vynálezu
Príklad 1
Konštrukcia omega elementov ktoré sprostredkúvajú rezistencie voči kanamycínu (Ω Km) alebo gentamycínu (QGm).
Na konštrukciu elementu ΩΚιτι bol v preparatívnom merítku izolovaný fragment 2099 bp Sg/I z Transposons Tn5 (E. A. Auierswald, G. Ludwig and H. Schuller. 1981. Cold Sprin Harb. Symp. Quant. Biol. 45:107-113; E. Beck, G. Ludwig, E. A. Auerswald, B. Reiss and H. Schaller. 1982. Genes 19:327-336; P. Mazodier, P. Cossart, E. Giraud and F. Gasser. 1985. Nucleic Acids Res. 13:195-205). Tento fragment bol skrátený na približne 990 bp použitím nukleázy Bal 31. Tento fragment, ktorý teraz obsahoval len gén pre rezistenciu voči kanamycínu (kódujúci aminoglykozid-3'-O-fosfotranferázu) bol potom ligovaný do rezu Smal pSKsym DNA (derivát pBluescript SK obsahujúci symetricky konštruované viacnásobné miesto pre klonovanie [Sa/I, H/ndlII, EcoRI, HindlW, Sa/I]). Z výsledného plazmidu bolo možné reizolovať ΩΚιτι
31700 h
·· ·· ·· ·· • · · · · · · • · · · · ··· • ··· · · · · « e • · · · · · ···· ·· ·· ·· element ako Smal fragment, EcoRI fragment, HindlH fragment alebo Sa/I fragment.
Na konštrukciu elementu QGm, bol v preparatívnom merítku izolovaný fragment Eael veľkosti 983 bp z plazmidu pBR1MCS-5 (M. E. Kovach, P. H. Elzer, D. S. Hill, G. T. Robertson, M. A. Farris, R. M. Roop and K. M. Peterson. 1995. Genes 166:175-176) a štiepený nukleázou z bôbu (postupujúca hydrolýza koncov molekúl jednovláknovej DNA). Tento fragment, ktorý teraz obsahoval len gén pre rezistenciu voči gentamycínu (kódujúci gentamycín-3acetyltransferázu) bol potom ligovaný do pSKsym DNA (pozri vyššie) štiepenej so Smal. Z takto pripraveného plazmidu bolo možné reizolovať QGm element ako Smal fragment, EcoRI fragment, Hind\\\ fragment alebo Sa/I fragment.
Príklad 2
Klonovanie génov z Pseudomonas sp. HR199 (DSM7063) s cieľom inaktivovať ich vložením Ω elementov alebo deléciou.
Každý z génov fcs, ech, vdh a aat bol osobitne klonovaný z kmeňov E. coli S17-1 a to DSM 10439 a DSM 10440 s použitím plazmidov pE207 a pE5-1 (pozri EP-A 0845532). Z týchto plazmidov boli dané fragmenty izolované v preparatívnom merítku a spracované nasledovne:
Pre klonovanie génu fcs boli fragmenty 2350 bp Sa/l/EcoRI z plazmidu pE207 a 3700 bp EcoRI/Sa/l z plazmidu pE5-1 klonované spolu v pBluescript SK' tým spôsobom, že tieto dva fragmenty sa spojili svojimi EcoRI koncami. Z výsledného hybridného plazmidu bol izolovaný v preparatívnom merítku fragment 6050 bp Sa/I a skrátený na približne 2480 bp pomocou nukleázy Bal
31. Na konce fragmentu boli postupne ligované linkery Psti a po štiepení s Psfí bol fragment klonovaný do pBluescript SK' (pSKfcs). Po transformácii E. coli XL1 blue sa získali klony s génmi fcs, ktoré vykazovali aktivitu FCS 0,2U/mg bielkovín.
31700 h ·· ·· ·· • · ·
·· ·· • · · · • · · • ··· · • · ···· ··
Na klonovanie génu ech bol izolovaný fragment 3800 bp H/ndlll/EcoRI z plazmidu pE207 v preparativnom merítku a skrátený na približne 1470 bp nukleázou Bal 31. Na konce fragmentu boli potom ligované linkery EcoRI a po štiepení s EcoRI bol fragment klonovaný do pBluescript SK' (pSKech).
Na klonovanie génu vdh bol v preparativnom merítku izolovaný fragment 2350 bp Sa/l/EcoRI z plazmidu pE207. Po klonovaní do pBluescript SK' bol fragment skrátený na jednom konci o cca 1530 bp systémom exonukleáza III/ bobová nukleáza. Na koniec fragmentu bol ligovaný linker EcoRI a po štiepení s EcoRI bol fragment klonovaný do pBluescript SK' (pSKvdh). Transformáciou E. coli XL1 blue sa získali klony s génmi VDH, ktoré vykazovali aktivitu VDH 0,01 U/mg bielkovín.
Na klonovanie génu aat bol v preparativnom merítku izolovaný fragment 3700 bp EcoRI/Sa/l z plazmidu pE5-1 a skrátený na cca 1590 bp nukleázou Bal 31. Na konce fragmentu boli potom pripútané linkery EcoRI a po hydrolýze s EcoRI bol fragment klonovaný do pBluescript SK' (pSKaaŕ).
Príklad 3
Inaktivácia vyššie popísaných génov vložením Ω elementov alebo vystrihnutím oblastí so základnými zložkami z týchto génov.
Plazmid pSKŕcs, ktorý obsahoval gén fcs, bol štiepený pomocou BssHII, čím došlo k excízii fragmentu o veľkosti 1200 bp z génu fcs. Následnou religáciou sa získal delečný derivát génu fcs (fcsN) (pozri obr. 1i a 2i) v klonovanej forme v pBluescript SK' (pSKfcsA). Po excízii spomínaného fragmentu boli naviac namiesto neho naligované omega elementy QKm a OGm. Tak boli vytvorené Ω-inaktivované deriváty génu fcs (fcsQKm, pozri Obr. 1g a 2g) a (fcsQGm, pozri Obr. 1h a 2h) v klonovanej forme v pBluescript SK' (pSKfcsOKm a pSKfcsOGm). V extraktoch takto získaných klonov E. coli,
31700 h ··
·· ·· ·· ·· • · · · · · · • · · · · ··· • ··· · · · 9 9 9 • · · · · · ···· ·· ·· «· ktorých hybridné plazmidy mali gény fcs inaktivované deléciou alebo vložením Ω elementov, nebola detekovaná žiadna aktivita FCS.
Plazmid pSKech, ktorý niesol gén ech, bol hydrolyzovaný pomocou Λ/rul, čím sa z génu ech vyštiepili dva fragmenty, 53 bp a 430 bp. Po religácii sa získal delečný derivát génu ech (echá, pozri obr. 11 a 21) v klonovanej forme v pBluescriptSK' (pSKec/ιΔ). Okrem toho po vyštiepení fragmentov boli namiesto nich do génu ligované omega elementy ΩΚγπ a QGm. Tak sa získali Ωinaktivované deriváty génu ech (echQKm a echQGm) v klonovanej forme v pBluescript SK' (pSKec^Km a pSKec^Gm).
Plazmid pSKvd/7 ktorý obsahoval gén vdh bol hydrolyzovaný s físsHII, čím bol z génu vdh vyštiepený fragment 210 bp. Po religácii sa získal delečný derivát génu vdh (vdhA, pozri obr. 1o a 2o) v klonovanej forme v pBluescript SK- (pSKvc/ΛΔ). Naviac po vyštiepení uvedeného fragmentu boli namiesto neho do génu ligované omega elementy ΩΚγπ a ΩΘιτι. Tak sa získali Ω-inaktivované deriváty génu vdh (vdhQKm a vdM^Gm) v klonovanej forme v pBluescript SK' (pSKvd^Km, pozri obr. 1m a 2m) a (pSKvd^Gm, pozri obr. 1n a 2n). V hrubých extraktoch takto získaných klonov E. coli, ktorých hybridné plazmidy obsahovali gén vdh inaktivovaný deléciou alebo vložením Ω elementov, nebola detekovaná žiadna aktivita VDH.
Plazmid pSKaaf, ktorý obsahoval gén aat, bol hydrolyzovaný s SssHII, čím bol z génu aat vyštiepený fragment 59 bp. Po religácii sa získal derivát génu aat (aat&, pozri obr. 1r a 2r) v klonovanej forme v pBluescript SK' (pskaaŕA). Naviac, po vyštiepení uvedeného fragmentu boli namiesto neho do génu ligované omega elementy ΩΚγπ a Ωβιτι. Tak sa získali Ω-inaktivované deriváty génu aat (aaftlKm, pozri obr. 1p a 2p) a (aaŕQGm, pozri obr. 1q a 2q) v klonovanej forme v pBluescript SK' (pSKaatoKm a pSKaaffiGm).
31700 h
Príklad 4
Subklonovanie génov inaktivovaných pomocou Ω elementov do konjugatívne prenosného „sebevražedného plazmidu,, pSUP202.
Na to, aby sa dali nahradiť intaktné gény v Pseudomonas sp. HR199 génmi inaktivovanými Ω-elementom, je potrebný vektor, ktorý na jednej strane môže byť prenesený do pseudomonád (konjugatívne prenosné plazmidy), ale ktorý sa na strane druhej nemôže v týchto baktériách replikovať a je teda v pseudomonádach nestabilný („sebevražedný plazmid,,). Segmenty DNA ktoré sú takýmto plazmidovým systémom prenesené do pseudomonád sa v nich uchovajú len ak sú do genómu bakteriálnej bunky integrované homologickou rekombináciou (Rec A-dependentná rekombinácia). V našom prípade bol použitý „sebevražedný plazmid,, pSUP202 (Šimon et al. 1983. In: A. Puhler. Molecular genetics of the bacteria-plant interaction. Springer Verlag, Berlín, New York, pp. 98-106).
Po štiepení s Psŕl sa inaktivované gény /οδΩΚπι a /οβΩΘιτι izolovali z plazmidov pSKfcsfíKm a pSKfcsQGm a ligovali do DNA z pSUP202 štiepenej sPsŕl. Ligačné zmesi sa preniesli do E. coli S17-1. Selekcia prebehla na LB médiu obsahujúcom tetracyklín a tiež buď kanamycín alebo gentamycín. Získali sa tak transformanty rezistentné voči kanamycínu, ktorých hybridný plazmid (pSUPft^Km) obsahoval inaktivovaný gén fcsQKm. Príslušný hybridný plazmid (pSUPft^Gm) transformantov rezistentných voči gentamycínu obsahoval inaktivovaný gén ft^Gm.
Po štiepení s EcoRI boli z plazmidov pSKecbQKm a pSKec^Gm izolované inaktivované gény ec/iQKm a echQGm a ligované do DNA z pSUP202 štiepenej s EcoRI. Ligačné zmesi boli transformované do E. coli S17-1. Selekcia prebehla na LB médiu obsahujúcom tetracyklín a tiež buď kanamycín alebo gentamycín. Získali sa tak transformanty rezistentné voči kanamycínu, ktorých hybridný plazmid (pSUPec^Km) obsahoval inaktivovaný
31700 h • · • · • · • ··· • · ··· gén echQKm. Príslušný hybridný plazmid (pSUPecbQGm) transformantov rezistentných voči gentamycínu obsahoval inaktivovaný gén echQGm.
Po štiepení pomocou EcoRI boli z plazmidov pSKvďhQKm a pSKvdňQGm izolované inaktivované gény vc/ňQKm a vdhQGm a ligované do DNA z pSUP202 štiepenej s EcoRI. Ligačné zmesi boli transformované do E. coli S17-1. Selekcia prebehla na LB médiu obsahujúcom tetracyklín a tiež buď kanamycín alebo gentamycín. Získali sa tak transformanty rezistentné voči kanamycínu, ktorých hybridný plazmid (pSUPvdňQKm) obsahoval inaktivovaný gén νάΛΩΚιτι. Príslušný hybridný plazmid (pSUPvdhQGm) transformantov rezistentných voči gentamycínu obsahoval inaktivovaný gén vdhQGm.
Po štiepení pomocou EcoRI boli z plazmidov pSKaaŕQKm a pSKaaíQGm izolované inaktivované gény aaŕQKm a aaŕQGm a ligované do DNA z pSUP202 štiepenej s EcoRI. Ligačné zmesi boli transformované do E. coli S17-1. Selekcia prebehla na LB médiu obsahujúcom tetracyklín a tiež buď kanamycín alebo gentamycín. Získali sa tak transformanty rezistentné voči kanamycínu, ktorých hybridný plazmid (pSUPaaŕQKm) obsahoval inaktivovaný gén aaíQKm. Príslušný hybridný plazmid (pSUPaa/QGm) transformantov rezistentných voči gentamycínu obsahoval inaktivovaný gén aafQGm.
Príklad 5
Subklonovanie delečne-inaktivovaných génov do konjugatívne prenosného „sebevražedného plazmidu,, pHE55, ktorý obsahuje „systém selekcie sacB„.
Aby sa dali nahradiť intaktné gény v Pseudomonas sp. HR199 delečneinaktivovanými génmi, je potrebný vektor, ktorý má vlastnosti už popísané v prípade pSUP202. Keďže na rozdiel od génov inaktivovaných Ω-elementami v prípade delečne inaktivovaných génov neexistuje žiadna možnosť selekcie (žiadna rezistencia voči antibiotikám) pre úspešné nahradenie génov
31700 h • · · · • · · • ··· • · ···· ·· • · · • · ··· • * · · ·· ·· v Pseudomonas sp. HR199, musel sa použiť iný systém. V „systéme selekcie sacB„ je nahrádzajúci, delečne inaktivovaný gén klonovaný do plazmidu obsahujúceho gén sacB spolu s génom rezistencie voči antibiotiku. Pri konjugatívnom prenose tohto hybridného plazmidu do pseudomonád je plazmid zaradený homologickou rekombináciou v tom mieste genómu, kde sa nachádza intaktný gén (prvý crossover). Takto vznikne „heterogenotický“ kmeň, ktorý obsahuje aj intaktný aj delečne inaktivovaný gén, pričom sú tieto od seba oddelené s DNA pHE55. Tieto kmene vykazujú rezistenciu kódovanú vektorom a zároveň majú aktívny gén sacB. Zámerom potom je odstrániť z genómu DNA pHE55 aj s intaktným génom pomocou druhej homologickej rekombinácie (druhý crossover). Takouto rekombináciou vznikne kmeň, ktorý má len inaktivovaný gén, a z genómu tohto kmeňa bola odstránená tak rezistencia kódovaná pHE55 ako aj gén sacB. Ak sa kmene nanesú na médium obsahujúce sacharózu, rast kmeňov ktoré prejavujú gén sacB je inhibovaný, keďže genetický produkt premieňa sacharózu na polymér, ktorý sa ukladá v periplazme buniek. Rast tých buniek, ktoré vďaka uvedenej druhej rekombinácii už nenesú gén sacB, nie je inhibovaný. Aby bolo fenotypicky možné rozlíšiť zaradenie delečne-inaktivovaného génu, tento gén sa nezamieňa za intaktný gén; namiesto toho sa použije kmeň, v ktorom je gén ktorý má byť nahradený, označený vložením Ω elementom. Ak je zámena úspešná, výsledný kmeň stratí antibiotickú rezistenciu zakódovanú v Ω elemente.
Po štiepení s Pst\ bol inaktivovaný gén fcsA izolovaný z plazmidu pSKfcsA a ligovaný do DNA pHE55 štiepenej s Pst\. Ligačná zmes bola transformovaná do E. coli S17-1. Selekcia sa vykonala na LB médiu obsahujúcom tetracyklín. Získali sa tak transformanty rezistentné voči tetracyklínu, ktorých hybridný plazmid (pHEfcsA) obsahoval inaktivovaný gén fcsA.
31700 h • · • · • · • ··· • · ···· ··
Po štiepení s EcoRI sa z plazmidu pSKechA izoloval inaktivovaný gén echá a hydrolyzoval sa bobovou nukleázou (tvorba tupých koncov). Fragment bol ligovaný do DNA pHE55 štiepenej s SamHI a spracovanej bobovou nukleázou. Ligačná zmes bola transformovaná do E. coli S17-1. Selekcia sa uskutočnila na LB médiu obsahujúcom tetracyklín. Získali sa tak transformanty rezistentné na tetracyklín, ktorých plazmid (pHEechA) obsahoval inaktivovaný gén echá.
Po štiepení s EcoRI sa z plazmidu pSKvdhA izoloval inaktivovaný gén vdhk a spracoval pomocou bobovou nukleázou. Fragment sa ligoval do DNA pHE55 štiepenej s SamHI a spracovanej bobovou nukleázou. Ligačná zmes bola transformovaná do E. coli S17-1. Selekcia prebehla na médiu LB obsahujúcom tetracyklín. Získali sa tak transformanty rezistentné na tetracyklín, ktorých plazmid (pHEvdhA) obsahoval inaktivovaný gén vdhk.
Po štiepení s EcoRI sa z plazmidu pSKaaŕA izoloval inaktivovaný gén aaŕA a spracoval pomocou bobovej nukleázy. Fragment sa ligoval do DNA pHE55 štiepenej s SamHI a ošetrenej s bobovou nukleázou. Ligačná zmes bola transformovaná do E. coli S17-1. Selekcia prebehla na médiu LB obsahujúcom tetracyklín. Získali sa tak transformanty rezistentné na tetracyklín, ktorých plazmid (pHEaaŕA) obsahoval inaktivovaný gén aaŕA.
Príklad 6
Generovanie kmeňov Pseudomonas sp. HR199 v ktorých boli gény pre katabolizmus eugenolu špecificky inaktivované inzerciou Ω-elementu.
Kmeň Pseudomonas sp. HR199 sa využil ako recipient v konjugačných experimentoch v ktorých ako donory boli použité kmene E. coli S17-1 prechovávajúce doleuvedené hybridné plazmidy z pSUP202. Transkonjuganty boli selektované na minerálnom médiu obsahujúcom glukonát a antibiotikum prislúchajúce k patričnému Ω elementu. Na základe rezistencie voči tetracyklínu
31700 h • · · · · · · ··· • · · · · ··· · · • ··· · · ·· ··· · • t · · · · ·· ···· ·· ·· ·· ·· · kódovanej pSUP202 bolo možné rozlišovať „homogenotické“ (nahradenie intaktného génu génom inaktivovaným inzerciou Ω elementu pomocou dvojitého crossoveru) a „heterogenotické“ (integrácia hybridného plazmidu do genómu jednoduchým crossoverom) transkonjuganty.
Mutanty Pseudomonas sp. HR199 fcsQKm a Pseudomonas sp. HR199 ΖόδΩΘηη sa získali konjugovaním Pseudomonas sp. HR199 buď s E. coli S17-1 (pSUPft^Km) alebo s E. coli S17-1 (pSUPft^Gm). Náhrada intaktného génu fcs génmi inaktivovanými s ΩΚγπ a OGm (/όδΩΚιτι alebo ft^Gm) bola potvrdená sekvenovaním DNA.
Mutanty Pseudomonas sp. HR199 echQKm a Pseudomonas sp. HR199 echQGm sa získali konjugovaním Pseudomonas sp. HR199 buď s E. coli S17-1 (pSUPecŕtoKm) alebo s E. coli 17-1 (pSUPechQGm). Náhrada intaktného génu ech génmi inaktivovanými s ΩΚγπ a ΩΟηη (ecriQKm alebo echQGm) bola potvrdená sekvenovaním DNA.
Mutanty Pseudomonas sp. HR199 vdhQKm a Pseudomonas sp. HR199 vdhQGm sa získali po konjugovaní Pseudomonas sp. HR199 buď s E. coli S171 (pSUPvd^Km) alebo s E. coli 17-1 (pSUPvcWGm). Náhrada intaktného génu vdh génmi inaktivovanými s ΩΚγπ a Ωθιη (vdhQKm alebo vdhQGm) bola potvrdená sekvenovaním DNA.
Mutanty Pseudomonas sp. HR199 aaíQKm a Pseudomonas sp. HR199 aaK^Gm sa získali konjugovaním Pseudomonas sp. HR199 buď s E. coli S17-1 (pSUPaaKIKm) alebo s E. coli 17-1 (pSUPaaK7Gm). Náhrada intaktného génu aat génmi inaktivovanými s ΩΚγπ (aaíQKm) a ΩΟγπ (aaKlGm) bola potvrdená sekvenovaním DNA.
Mutant Pseudomonas sp. HR199 ft^KmvďW2Gm sa získal konjugovaním Pseudomonas sp. HR199fcsQKm s E. coli S17-1
31700 h • · • · • · • ··· • · (pSUPvdhQGm). Náhrada intaktného génu vdh génom inaktivovaným s QGm (vddQGm) bola potvrdená sekvenovaním DNA.
Mutant Pseudomonas sp. HR199 vddQKmaa/QGm sa získal konjugovaním Pseudomonas sp. HR199vdôQKm s E. coli S17-1 (pSUPaaŕQGm). Náhrada intaktného génu aat génom inaktivovaným s QGm (aa/QGm) bola potvrdená sekvenovaním DNA.
Mutant Pseudomonas sp. HR199 vddQKmecôQGm sa získal konjugovaním Pseudomonas sp. HR199vd/7QKm s E. coli S17-1 (pSUPecdQGm). Náhrada intaktného génu ech génom inaktivovaným s QGm (ecôQGm) bola potvrdená sekvenovaním DNA.
Príklad 7
Generovanie mutantov kmeňa Pseudomonas sp. HR199 v ktorých boli gény pre katabolizmus eugenolu špecificky inaktivované vystrihnutím oblastí so základnými zložkami z týchto génov.
Kmene Pseudomonas sp. HR199 fcsQKm, Pseudomonas sp. HR199 ecdQKm, Pseudomonas sp. HR199 vddQKm, Pseudomonas sp. HR199 aafQKm, sa využili ako recipienti v konjugačných experimentoch v ktorých ako donory boli použité kmene E. coli S17-1 prechovávajúce doleuvedené hybridné plazmidy z pHE55. „Heterogenotické“ transkonjuganty boli selektované na minerálnom médiu obsahujúcom glukonát a antibiotikum prislúchajúce k patričnému Q elementu a tiež tetracyklín (rezistencia kódovaná s pHE55). Po nanesení na minerálnu pôdu obsahujúcu sacharózu sa získali transkonjuganty v ktorých bola DNA vektora odstránená druhou rekombináciou (druhý crossover). Nanesením na minerálnu pôdu bez antibiotika alebo obsahujúcu antibiotikum zodpovedajúce príslušnému Q elementu bolo možné identifikovať mutanty v ktorých bol gén inaktivovaný Q elementom nahradený delečne inaktivovaným génom (bez rezistencie voči antibiotiku).
31700 h • · · • ··· · • · · · · ··· · · ··
Konjugáciou Pseudomonas sp. HR199 fcsQKm s E. coli S17-1 (pHEfcsA) sa získal mutant Pseudomonas sp. HR199 fcsA. Náhrada génu inaktivovaného s QKm (fcsQKm) delečne inaktivovaným génom (fcsA) bola potvrdená sekvenovaním DNA.
Konjugáciou Pseudomonas sp. HR199 echQKm s E. coli S17-1 (pHEecňA) sa získal mutant Pseudomonas sp. HR199 echk. Náhrada génu inaktivovaného s QKm (ec/?QKm) delečne inaktivovaným génom (echA) bola potvrdená sekvenovaním DNA.
Konjugáciou Pseudomonas sp. HR199 vdňQKm s E. coli S17-1 (pHEvdňA) sa získal mutant Pseudomonas sp. HR199 vdhh. Náhrada génu inaktivovaného s QKm (vdhQKm) delečne inaktivovaným génom (vdňA) bola potvrdená sekvenovaním DNA.
Konjugáciou Pseudomonas sp. HR199 aaŕQKm s E. coli S17-1 (pHEaaŕA) sa získal mutant Pseudomonas sp. HR199 aaŕA. Náhrada génu inaktivovaného s QKm (aaŕQKm) delečne inaktivovaným génom (aaŕA) bola potvrdená sekvenovaním DNA.
Príklad 8
Biotransformácia eugenolu na vanilín mutantom Pseudomonas sp. HR199 vdríQKm.
Kmeň Pseudomonas sp. HR199 vd/jQKm bol propagovaný v 50 ml HRMM obsahujúceho 6mM eugenolu kým sa nedosiahla optická denzita približne OD600nm=0,6. Po 17 h bolo možné v supernatante kultivačnej zmesi stanoviť 2,9 mM vanilínu, 1,4 mM kyseliny feruiovej a 0,4 mM kyseliny vanilovej.
31700 h • · · • B · • ·
B ··· • · • · B B B B ··
B··· ·· ·· ·· ··
Príklad 9
Biotransformácia eugenolu na kyselinu ferulovú mutantom Pseudomonas sp. HR199 vdhQGmaaťQKm.
Kmeň Pseudomonas sp. HR199 vdňQGmaaíQKm bol propagovaný v 50 ml HR-MM obsahujúceho 6mM eugenolu kým sa nedosiahla optická denzita približne OD600nm=0,6. Po 18 h bolo v supernatante kultivačnej zmesi možné stanoviť 1,9 mM vanilínu, 2,4 mM kyseliny ferulovej a 0,6 mM kyseliny vanilovej.
Príklad 10
Biotransformácia eugenolu na koniferylalkohol mutantom Pseudomonas sp. HR199 vdftQGmaaťQKm.
Kmeň Pseudomonas sp. HR199 vdňQGmaa/QKm bol propagovaný v 50 ml HR-MM obsahujúceho 6mM eugenolu kým sa nedosiahla optická denzita približne OD600nm=0,4. Po 15 h bolo možné stanoviť v supernatante kultivačnej zmesi 1,7 mM koniferylalkoholu, 1,4 mM vanilínu, 1,4 mM kyseliny ferulovej a 0,2 mM kyseliny vanilovej.
Príklad 11
Fermentačná produkcia prírodného vanilínu z eugenolu v 10 I fermentore mutantom Pseudomonas sp. HR199 vdbQKm.
Produkčný fermentor bol inokulovaný 100 ml 24 hodín starej kultúry propagovanej pri 32 °C na trepačkovom inkubátore (120 rpm) v médiu, ktoré bolo upravené na pH 7,0 a ktoré pozostávalo z 12,5 g glycerolu/1,10 g kvasničného extraktu/l a 0,37 g kyseliny octovej/l. Fermentor obsahoval 9,9 I média nasledovného zloženia: 1,5 g kvasničného extraktu/l, 1,6 g KH2PO4/I, 0,2 g NaCI/l, 0,2 g MgSO4/l. pH bolo nastavené na pH 7,0 roztokom hydroxidu sodného. Po sterilizácii boli do média pridané 4g eugenolu. Teplota bola 32 °C,
31700 h ·· • · · · • · * • ··· • · ···· ·· ·· • · · • · ··· • · ·· ·· ·· ·· ·· · aerácia 3 Nl/min a rýchlosť miešadla 600 ot./min. pH bolo udržiavané na pH 6,5 roztokom hydroxidu sodného.
Po 4 hodinách od inokulácie bolo zahájené kontinuálne dávkovanie eugenolu tak, že keď bola fermentácia po 65 hodinách ukončená, celkový prídavok bol 255 g eugenolu. Počas fermentácie bolo tiež pridaných 40 g kvasničného extraktu. Na konci fermentácie bola koncentrácia eugenolu 0,2 g/1. Obsah vanilínu bol 2,6 g/1, tiež bola prítomná kyselina ferulová 3,4 g/1.
Vanilín získaný týmto spôsobom možno izolovať známymi fyzikálnymi metódami ako je chromatografia, destilácia a/alebo extrakcia a môže byť použitý na prípravu prírodných ochucovadiel.
Popis obrázkov na výkresoch
OBR. 1a až 1 r:
Génové štruktúry pre izolácie organizmov a mutantov calA*\ Časť inaktivovaného génu pre koniferylalkoholdehydrogenázu calB*: Časť inaktivovaného génu pre koniferylaldehyddehydrogenázu fcs*: Časť inaktivovaného génu pre feruloyl-CoA-syntetázu ech*: Časť inaktivovaného génu pre enoyl-CoA-hydratázu-aldolázu vdh*: Časť inaktivovaného génu pre vanilíndehydrogenázu aaf: Časť inaktivovaného génu pre beta-ketotiolázu
Zatiaľčo pre konštrukciu boli použité body pre hydrolýzu reštrikčnými enzýmami značené vo výsledných produktoch sú nefunkčné.
OBR. 2a: Sekvencia nukleotidov pre štruktúru génu ca/ΑΩΚηΊ
OBR. 2b: Sekvencia nukleotidov pre štruktúru génu ca/AQGm
OBR. 2c: Sekvencia nukleotidov pre štruktúru génu ca/ΑΔ
31700 h • · • · • · ·· · • ·· · ·· • · · · • · ··· · · • · ·· ··· · • · · · · ·
OBR. 1d: Sekvencia nukleotidov pre štruktúru génu ca/8QKm
OBR. 1e: Sekvencia nukleotidov pre štruktúru génu ca/BOGm
OBR. 1f: Sekvencia nukleotidov pre štruktúru génu ca/ΒΔ
OBR. 1g: Sekvencia nukleotidov pre štruktúru génu fcsOKm
OBR. 1h: Sekvencia nukleotidov pre štruktúru génu fcsOGm
OBR. 1 i: Sekvencia nukleotidov pre štruktúru génu fcsA
OBR. 1j: Sekvencia nukleotidov pre štruktúru génu ecftQKm
OBR. 2k: Sekvencia nukleotidov pre štruktúru génu ecftQGm
OBR. 2I: Sekvencia nukleotidov pre štruktúru génu ech&
OBR. 2m: Sekvencia nukleotidov pre štruktúru génu vdríQKm
OBR. 2n: Sekvencia nukleotidov pre štruktúru génu vďhOGm
OBR. 2o: Sekvencia nukleotidov pre štruktúru génu vdhb
OBR. 2p: Sekvencia nukleotidov pre štruktúru génu aa/ΩΚπι
OBR. 2q: Sekvencia nukleotidov pre štruktúru génu aaŕOGm
OBR. 2r: Sekvencia nukleotidov pre štruktúru génu aaŕA
31700 h • · • ·
JJ • · · · · · • · · ··· · · φ
···· · ·· ·· ··

Claims (16)

1. Transformovaný a/alebo mutagenizovaný jednobunkový alebo mnohobunkový organizmus vyznačujúci sa tým, že enzýmy pre katabolizmus eugenolu a/alebo kyseliny ferulovej sú inaktivované takže sa akumulujú medziprodukty koniferylalkohol, koniferylaldehyd, kyselina ferulová, vanilín a/alebo kyselina vanilová
2. Organizmus podľa nároku 1 vyznačujúci sa tým, že katabolizmus eugenolu a/alebo kyseliny ferulovej je pozmenený vložením Ω elementov, alebo deléciou na príslušných génoch.
3. Organizmus podľa nároku 1 alebo 2 vyznačujúci sa tým, že jeden alebo viaceré gény kódujúci/e enzýmy koniferylalkoholdehydrogenázy, koniferylaldehyddehydrogenázy, feruloyl-CoA-syntetázy, enoyl-CoAhydratázy-aldolazy, beta-ketotiolázy, vanilíndehydrogenázy alebo demetylázy kyseliny vanilovej je/sú zmenený/é a/alebo inaktivovaný/é.
4. Organizmus podľa jedného z nárokov 1 až 3 vyznačujúci sa tým, že je jednobunkový, prednostne mikroorganizmus alebo rastlinná alebo živočíšna bunka.
5. Organizmus podľa jedného z nárokov 1 až 4 vyznačujúci sa tým, že je to baktéria, prednostne z rodu Pseudomonas
6. Štruktúry génov v ktorých sú sekvencie nukleotidov kódujúce enzýmy koniferylalkoholdehydrogenázy, koniferylaldehyddehydrogenázy, feruloylCoA-syntetázy, enoyl-CoA-hydratázy-aldolázy, beta-ketotiolázy, vanilíndehydrogenázy alebo demetylázy kyseliny vanilovej, alebo dva alebo viaceré z týchto enzýmov pozmenené a/alebo inaktivované.
31700 h ·· ·· ·· ·· ·· • · · · · · · ··· • · · · · ··· · · • ··· ·· ·· ··· · ···· ·· ·· ·· ·· ·
7. Štruktúry génov majúce sekvencie znázornené na obrázkoch 1a až 1 r.
8. Štruktúry génov majúce sekvencie znázornené na obrázkoch 2a až 2r.
9. Vektory ktoré obsahujú prinajmenšom jednu génovú štruktúru podľa jedného z nárokov 6 až 8.
10. Transformovaný organizmus podľa jedného z nárokov 1 až 5, vyznačujúci sa tým, že prechováva prinajmenšom jeden vektor podľa nároku 9.
11. Organizmus podľa s jedného z nárokov 1 až 5, vyznačujúci sa tým, že obsahuje aspoň jednu génovú štruktúru podľa jedného z nárokov 6 až 8 integrovanú do genómu namiesto príslušného intaktného génu.
12. Spôsob biotechnologickej prípravy organických zlúčenín, predovšetkým alkoholov, aldehydov, a organických kyselín, vyznačujúci sa tým, že sa použije niektorý organizmus podľa jedného z nárokov 1 až 5 alebo 10 až 11.
13. Spôsob prípravy organizmov uvedených v jednom z nárokov 1 až 5 vyznačujúci sa tým, že katabolizmus eugenolu a/alebo kyseliny ferulovej sa dosiahne známymi mikrobiologickými kultivačnými metódami.
14. Spôsob prípravy organizmu podľa niektorého z nárokov 1 až 5 alebo 10 až 11, vyznačujúci sa tým, že zmena v katabolizme eugenolu a/aiebo kyseliny ferulovej, a/alebo inaktivácia príslušných génov sa dosiahne metódami rekombinantnej DNA.
31700 h ·· • · • · ·· ·· ·· ·· • · · · · · · é · · · · ··· • ··· · · · · • · · · · ···· ·· ·· ··
15. Použitie organizmov podľa jedného z nárokov 1 až 5 alebo 10 až 11 na prípravu koniferylalkoholu, koniferylaldehydu, kyseliny ferulovej, vanilínu a/alebo kyseliny vanilovej.
16. Použitie génových štruktúr podľa jedného z nárokov 6 až 8 alebo vektora podľa nároku 9 na prípravu transformovaných a/alebo mutagenizovaných organizmov.
31700 h ·· ·· • · • ··· • · « • · β ·· ·· ···· ·· ·· ··· · ·
-Ι-
Sekvencie CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 420 AAAGAGCATG Met 1 CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA Gin Leu Thr Asn Lys Lys Ile Val Val Thr Gly 5 10 GTG TCC TCC Val Ser Ser 15 472
GGT Gly ATC GGT GCC GAA ACT GCC CGC Thr Ala Arg GTT CTG CGC TCT CAC GGC GCC Ala 30 ACA Thr 520 íle Gly Ala Glu 20 Val Leu Arg Ser 25 His Gly GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568 Val Ile Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 35 40 45 GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GAT AAG GCC ATC GGG 616 Val Gin Ala Asp Leu Ser His Pro Glu Gly íle Asp Lys Ala íle
ΞΟ 55 60 62
ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC 676
AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT 736
GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC 7SO
Met Ile Glu Gin Aso Gly Leu His
1 5
GCA GGT Ala Gly TCT Ser CCG GCC GCT TGG GTG Ala Trp Val 15 GAG AGG CTA TTC GGC TAT GAC TGG 838 Pro Ala Glu Arg Leu Phe 20 Gly Tyr Asp Trp 10 GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA 886 Ala Gin Gin Thr Ile Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser 25 30 35 40 GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC 934 Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala 45 50 55 CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG 982 Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr
60 65 70
-2·· ·· ·· • · · · « · • · · · · • ··· · · · • · · é ···· ·· ·· ·· ·· • · t ··· « · • · · • · · ·
ACG Thr GGC Gly GTT CCT TGC Cys GCA Ala GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA 1030 Val 75 Pro Ala Val Leu 80 Asp Val Val Thr 85 Glu Ala Gly AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA 1078 Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser 90 95 100 TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG 1126 Ser His Leu Ala Pro Ala Glu Lys Val Ser íle Met Ala Asp Ala Met 105 110 115 120 CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA 1174 Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His. Gin 125 130 135 GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT 1222 Ala Lys His Arg íle Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu 140 145 150 GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC 1270 Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala 155 160 165 GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC 1318 Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu 170 175 180 GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT 1366 Val Val Thr His Gly Asp Ala Cys Leu Pro Asn íle Met Val Glu Asn 185 190 195 200 GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC 1414 Gly Arg Phe Ser Gly Phe íle Asp Cys Gly Arg Leu Gly Val Ala Asp 205 210 215 CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT 1462 Arg Tyr Gin Asp íle Ala Leu Ala Thr Arg Asp íle Ala Glu Glu Leu 220 225 230 GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT 1510 Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly íle Ala Ala 235 240 245 CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC 1558 Pro Asp Ser Gin Arg íle Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 250 255 260 264
TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCTG GCC GCG GTG 1613
Ala Ala Val 225
ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT 1661 íle Ala Phe Met Cys Ala Glu Glu Ser Arg Trp íle Asn Gly íle Asn
230 235 240 ·· ·· ·· ·· ·· • · · · · · · • · · · · ··· • ··· · · · · · · • · · · · · ···· ·· ·· ·· ··
-3ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 1710 íle Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val
245 250 255
GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 1770
GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 1830
GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 1890
GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 1950
CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 2010
CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 2070
ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 2130
TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 2164
FIG. 2a:
-4• · · · · t·· · · • ··· ·· ·· ··· · • ······· ···· ·· ·· ·· ··
CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60
GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120
GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180
CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 240
AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300
GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360
TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 420
AAAGAGCATG CAACTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG ŤCC TCC 472
Met Gin Leu Thr Asn Lys Lys íle Val Val Thr Gly Val Ser Ser
15 10 15
GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520
Gly íle Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr
20 25 30
GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568
Val íle Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe
35 40 45
GTT CAG GCT GAC CTG AGC CAT CCT GAGGGGAGAG GCGGTTTGCG TATTGGGCGC 622
Val Gin Ala Asp Leu Ser His Pro
50 55
ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG 682
GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG 742
CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT 802
CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA 862
CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT 922
TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT 982
TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG 1033
Met Leu Arg Ser Ser Asn Asp Val Thr Gin
15 10
CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC 1081
Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly Ser Ser Met Gly íle
15 20 25
ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT 1129 íle Arg Thr Cys Arg Leu Gly Pro Asp Gin Val Lys Ser Met Arg Ala
30 35 40
GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC 1177
Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser
45 50 55 ·· • · · • · ···· ··
-5·· • · · • · ··· • · · · • · · · ·· ··
CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG 1225 Gin His Gin 60 Pro Asp Ser Asp 65 Tyr Leu Gly Asn Leu 70 Leu Arg Ser Lys ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT 1273 Thr Phe íle Ala Leu Ala Ala Phe Asp Gin Glu Ala Val Val Gly Ala 75 80 85 90 CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC 1321 Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin Pro Arg Ser Glu íle 95 100 105 TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT 1369 Tyr íle Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gin Gly íle 110 115 120 GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT 1417 Ala Thr Ala Leu íle Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly 125 130 135 GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG 1465 Ala Tyr Val íle Tyr Val Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val 140 145 150 GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT 1513 Ala Leu Tyr Thr Lys Leu Gly íle Arg Glu Glu Val Met His Phe Asp 155 160 165 170 ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCT 1567 íle Asp Pro Ser Thr Ala Thr
175 177
G ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT 1616 íle Ala Phe Met Cys Ala Glu Glu Ser Arg Trp íle Asn Gly íle Asn
228 230 235 240
ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 1665 íle Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val
245 250 255
GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 1725
GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 1785
GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 1845
GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 1905
CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 1965
CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 2025
ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 2085
TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 2119
FIG. 2b:
• · • ··· • · ( • · ····
B·· ··
CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 420 AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC. GGA GTG TCC TCC 472 Met Gin Leu Thr Asn Lys Lys íle Val Val Thr Gly Val Ser Ser 15 10 15
GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 Gly íle Gly Ala Glu 20 Thr Ala Arg Val Leu 25 Arg Ser His Gly Ala Thr 30 GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568 Val íle Gly Val 35 Asp Arg Asn Met Pro 40 Ser Leu Thr Leu Asp Ala Phe 45 GTT Val CAG Gin GCT Ala 50 GAC Asp CTG Leu AGC Ser CAT His CCT Pro 55 GAA Glu GGC Gly ATC íle 58 GATC AAC GGC ΑΤΑ AAT Asn Gly íle Asn 240 617 ATT íle CCA Pro GTG Val GAC Asp GGA Gly GGT Gly TTG Leu GCA Ala TCG Ser ACC Thr TAC Tyr GTG Val TAA GTTCGTGGAC 666
245 250 255
GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 726
GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 786
GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 846
GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 906
CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 966
CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 1026
ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 1086
TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 1120
FIG. 2c:
• · ··
-7·· ·· • · · · · a · • · · a a aaa • ··· a a a a a • · a a a a ···· ·· aa aa
GAATTCCGCG
GGTAGGGTCT
TGCGTTTGCC
TATCGCCCGG
TTTTCTTGGC
GCTTCGCTTC
TTCTATCAGC
CATGCTTGTT
GCGATGAACC
GGGCCGCTTT
GCCTGAACCT
GCATCGAGAT
CGAAAGTCAT
TCGTTGACAT
GCTGAGGTCA
GGTGTTAGCC
AGGGCAGAGG
GGATTTTTCC
120
180
TTAACTCGCG TAAGCATTCT GTCATTTTTT
GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG
CGATTAAGAT AATTAAAATA AGGAAACCGC
CTCCAGCTCA AGGGCAATTT TTGGGCTATT
TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 240
CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300
ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360
GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420
AGAATAACAA
TTGACTCCTC
AGGAGGTCAG
CG ATG AGC
ATT CTT
GGT TTG AAT
Met 1 Ser Ile Leu Gly 5 Leu Asn GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG Gly Ala Pro 10 Val Gly Ala Glu Gin 15 Leu Gly Ser Ala Leu 20 Asp Arg Met AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG Lys Lys 25 Ala His Leu Glu Gin 30 Gly Pro Ala Asn Leu 35 Glu Leu Arg Leu AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA Ser 40 Arg Leu Asp Arg Ala 45 íle Ala Met Leu Leu 50 Glu Asn Arg Glu Ala 55 ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA Ile Ala Asp Ala Val 60 Ser Ala Asp Phe Gly 65 Asn Arg Ser Arg Glu 70 Gin ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC Thr Leu Leu Cys 75 Asp íle Ala Gly Ser 80 Val Ala Ser Leu Lys 85 Asp Ser CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG Arg Glu His 90 Val Ala Lys Trp Met 95 Glu Pro Glu His His 100 Lys Ala Met TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT Phe Pro 105 Gly Ala Glu Ala Arg 110 Val Glu Phe Gin Pro 115 Leu Gly Val Val GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG Gly 120 Val Ile Ser Pro Trp 125 Asn Phe Pro íle Val 130 Leu Ala Phe Gly Pro 135 CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC Leu Ala Gly íle Phe 140 Ala Ala Gly Asn Arg 145 Ala Met Leu Lys Pro 150 Ser GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT Glu Leu Thr Pro 155 Arg Thr Ser Ala Leu 160 Leu Ala Glu Leu Ile 165 Ala Arg
473
521
569
617
665
713
761
809
857
905
953 • · ···
-8• ··· · · • · · • · · · · ·
TAC TTC GAT Tyr Phe Asp GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 1001 Glu Thr Glu Leu Thr Thr 175 Val Leu Gly Asp 180 Ala Glu Val 170 GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 1049 Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu íle Phe Thr Gly 185 190 195 GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 Gly Thr Ala Val Ala Lys His Ile Met Arg Ala Ala Ala Asp Asn Leu 200 205 210 215 GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 1145 Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val íle Val Ser 220 225 230 - CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 235 240 245 ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG CTG 1241 Thr Phe Asn Ala Gly Gin Ile Cys Leu Ala Pro Asp Tyr Val Leu Leu 250 255 260
CCG GAA GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT 1297
Pro Glu
265
TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 1357
GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA 1412
Met Ile Glu Gin
GAT Asp 5 GGA TTG CAC GCA Gly Leu His Ala GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC 1460 Gly Ser 10 Pro Ala Ala Trp 15 Val Glu Arg Leu Phe 20 GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG 1508 Gly Tyr Asp Trp Ala Gin Gin Thr Ile Gly Cys Ser Asp Ala Ala Val 25 30 35 TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC 1556 Phe Arg Leu Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp 40 45 50 CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG 1604 Leu Ser Gly Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser 55 60 65 TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC 1652 Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val 70 75 80
• · • · • ·
-9··· ·· » ·· • · · • · I • · «
ACT Thr 85 GAA GCG GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG 1700 Glu Ala Gly Arg Asp 90 Trp Leu Leu Leu Gly 95 Glu Val Pro Gly Gin 100 GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG 1748 Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser íle Met 105 110 115 GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA 1796 Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro 120 125 130 TTC GAC CAC CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG 1844 Phe Asp Hls Gin Ala Lys His Arg íle Glu Arg Ala Arg Thr Arg Met 135 140 145 GAA GCC GGT CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG 1892 Glu Ala Gly Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly 150 155 160 CTC GCG CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC 1940 Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 165 170 175 180 GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC 1988 Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn íle 185 190 195 ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG 2036 Met Val Glu Asn Gly Arg Phe Ser Gly Phe íle Asp Cys Gly Arg Leu 200 205 210 GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT 2084 Gly Val Ala Asp Arg Tyr Gin Asp íle Ala Leu Ala Thr Arg Asp íle 215 220 225 GCT GAA GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC 2132 Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr
230 235 240
GGT ATC GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT 2180
Gly íle Ala Ala Pro Asp Ser Gin Arg íle Ala Phe Tyr Arg Leu Leu
245 250 255 260
GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 2235
Asp Glu Phe Phe
264
CGC CAT GCC AAG CCT GTT CTC GTG CAA AGT CCT GTG GGT GAG TCG AAC 2283 His 444 Ala Lys 445 Pro Val Leu Val Gin 450 Ser Pro Val Gly Glu 455 Ser Asn TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 2331 Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala íle His Gly Leu Leu Ser 460 465 470
·· • ·
- 10GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 2385 Val Leu Leu Ser Thr Glu Cys 475 480 481
GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 2445 TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 2505 ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 2565 CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 2625 CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 2685 ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 2745 TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 2805 CCAACCTTGA GGAATTC 2822
FIG. 2d:
·· • · • · · · · · ···· ·· ·· ··
GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 240 GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 CGATTAAGAT AATTAAAATA AGGAAACCGC atggtttctt ATGTGAATTT GTCTGGCATA 360 CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420 AGAATAACAA TTGACTCCTC AGGAGGTCAG CG ATG AGC Met Ser ATT CTT GGT TTG AAT íle Leu Gly Leu Asn 473
1 5
GGT GCC CCG GTC GGA Gly GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG 521 Gly Ala Pro Val Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 10 15 20 AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG 569 Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 25 30 35 AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA 617 Ser Arg Leu Asp Arg Ala íle Ala Met Leu Leu Glu Asn Arg Glu Ala 40 45 50 55 ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA 665 íle Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 60 65 70 ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 Thr Leu Leu Cys Asp íle Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 75 80 85 CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 761 Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 90 95 100 TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 809 Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 105 110 115 GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 857 Gly Val íle Ser Pro Trp Asn Phe Pro íle Val Leu Ala Phe Gly Pro 120 125 130 135 CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC 905 Leu Ala Gly íle Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 140 145 150 GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT 953 Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu íle Ala Arg
155 160 165
-12·· ·· • · · • · · ·· · ···« ·· ·· » · · • ··· • · β • · « • · ··
TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT Tyr Phe Asp 170 Glu Thr Glu Leu Thr 175 Thr Val Leu Gly Asp 180 Ala GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC Gly Ala 185 Leu Phe Ser Ala Gin 190 Pro Phe Asp His Leu 195 íle Phe GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT Gly 200 Thr Ala Val Ala Lys 205 His íle Met Arg Ala 210 Ala Ala Asp GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC Val Pro Val Thr Leu 220 Glu Leu Gly Gly Lys 225 Ser Pro Val íle CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG Arg Ser Ala Asp 235 Met Ala Asp Val Ala 240 Gin Arg Val Leu Thr 245 ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG Thr Phe Asn 250 Ala Gly Gin íle Cys 255 Leu Ala Pro Asp Tyr 260 Val
GAA GTC Glu Val
ACC GGC Thr Gly
AAC CTA Asn Leu
215
GTT TCC Val Ser 230
GTG AAA Val Lys
CTG GGG Leu 262
1001
1049
1097
1145
1193
1241
GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT 1301 GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC 1361 CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA 1421 CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC 1481 TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT 1541 TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA 1601 GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC Met Leu Arg 1656
AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA 1704 Ser Ser Asn Asp Val 5 Thr Gin 10 Gin Gly Ser Arg Pro Lys 15 Thr Lys Leu GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC 1752 Gly Gly Ser Ser Met Gly íle íle Arg Thr Cys Arg Leu Gly Pro Asp 20 25 30 35 CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC 1800 Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe 40 45 50 GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC 1848 Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu 55 60 65 GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC 1896 Gly Asn Leu Leu Arg Ser Lys Thr Phe íle Ala Leu Ala Ala Phe Asp 70 75 80 CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT 1944
·· ·· • · · • · ··· • · · · • · · · ·· ·· ·· • · · • · • · · • · ·· · ·· ·· • · · · • · · • · · · · • · ···· ··
Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe 85 90 95 GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC 1992 Glu Gin Pro Arg Ser Glu íle Tyr Ile Tyr Asp Leu Ala Val Ser Gly 100 105 110 115 GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG 2040 Glu His Arg Arg Gin Gly íle Ala Thr Ala Leu íle Asn Leu Leu Lys 120 125 130 CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT 2088 His Glu Ala Asn Ala Leu Gly Ala Tyr Val íle Tyr Val Gin Ala Asp 135 140 145 TAC GGT GAC GAŤ CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA 'CGG 2136 Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly Ile Arg 150 155 160 GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA 2184 Glu Glu Val Met His Phe Asp íle Asp Pro Ser Thr Ala Thr 165 170 175 177
TTCGTTCAAG CCGAGATCGG CTTCCCTG CAA AGT CCT GTG GGT GAG TCG AAC 2236
Gin Ser Pro Val Gly Glu Ser Asn 451 455
TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 2284 Leu Ala Met 460 Arg Ala Pro Tyr 465 Gly Glu Ala íle His Gly Leu Leu Ser 470 GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 2338 Val Leu Leu Ser Thr Glu Cys 475 480 481
GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 2398 TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 2458 ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 2518 CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 2578 CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 2638 ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 2698 TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 2758 CCAACCTTGA GGAATTC 2775
FIG. 2e:
·· • · · · • · · • ··· · ···· ·· ·· ·· ··· • · · • · ·· ··
- 14GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60
GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120
TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180
TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 240
GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG
CGATTAAGAT AATTAAAATA AGGAAACCGC
CTCCAGCTCA AGGGCAATTT TTGGGCTATT
CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300
ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360
GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420
AGAATAACAA
TTGACTCCTC
AGGAGGTCAG
CG ATG ÁGC
ATT CTT GGT
TTG
AAT
Met 1 Ser íle Leu Gly 5 Leu Asn GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG Gly Ala Pro 10 Val Gly Ala Glu Gin 15 Leu Gly Ser Ala Leu 20 Asp Arg Met AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG Lys Lys 25 Ala His Leu Glu Gin 30 Gly Pro Ala Asn Leu 35 Glu Leu Arg Leu AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA Ser 40 Arg Leu Asp Arg Ala 45 íle Ala Met Leu Leu 50 Glu Asn Arg Glu Ala 55 ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA Ile Ala Asp Ala Val 60 Ser Ala Asp Phe Gly 65 Asn Arg Ser Arg Glu 70 Gin ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC Thr Leu Leu Cys 75 Asp íle Ala Gly Ser 80 Val Ala Ser Leu Lys 85 Asp Ser CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG Arg Glu His 90 Val Ala Lys Trp Met 95 Glu Pro Glu His His 100 Lys Ala Met TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT Phe Pro 105 Gly Ala Glu Ala Arg 110 Val Glu Phe Gin Pro 115 Leu Gly Val Val GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG Gly 120 Val Ile Ser Pro Trp 125 Asn Phe Pro íle Val 130 Leu Ala Phe Gly Pro 135 CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC Leu Ala Gly Ile Phe 140 Ala Ala Gly Asn Arg 145 Ala Met Leu Lys Pro 150 Ser GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT Glu Leu Thr Pro 155 Arg Thr Ser Ala Leu 160 Leu Ala Glu Leu íle 165 Ala Arg
473
521
569
617
665
713
761
809
857
905
953
-15·· ·Φ • · · · • · · • ·· · • · ···· ·· ·· ·· ·· • · · · · · • · ··· · · • · · · · · · • · · · · · ·· ·· ·· ·
TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 1001 Tyr Phe Asp 170 Glu Thr Glu Leu Thr 175 Thr Val Leu Gly Asp Ala Glu Val 180 GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 1049 Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu íle Phe Thr Gly 185 190 195 GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 Gly Thr Ala Val Ala Lys His íle Met Arg Ala Ala Ala Asp Asn Leu 200 205 210 215 GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 1145 Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val íle Val Ser 220 225 230 CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 235 240 245 ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CC GTG GGT GAG TCG AAC 1240 Thr Phe Asn Ala Gly Gin íle Cys Leu Ala Val Gly Glu Ser Asn 250 255 257 454 455 TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 1288 Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala íle His Gly Leu Leu Ser 460 465 470 GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 1342 Val Leu Leu Ser Thr Glu Cys 475 480 481
GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 1402 TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 1462 ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 1522 CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 1582 CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 1642 ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 1702 TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 1762 CCAACCTTGA GGAATTC 1779
FIG. 2f:
·· • · ··· ···· ··
-16• ··· • · · • · · ··
CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356
Met Arg Ser Leu Glu 1 5
GCG Ala CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG 404 Leu Leu Pro Phe 10 Pro Gly Arg íle Leu 15 Glu Arg Leu Glu His 20 Trp GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 452 Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 25 30 35 GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 Gly Glu Trp Arg Arg íle Ser Tyr Ala Glu Met Phe His Asn Val Arg 40 45 50 GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 548 Ala íle Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 55 60 65 CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 Leu Leu íle Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 70 75 80 85 GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 644 Gly Ala Met Tyr Ala Gly íle Pro Tyr Cys Pro Val Ser Pro Ala Tyr 90 95 100 TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His íle Val Gly Leu 105 110 115 CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG 740 Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin 120 125 130 132
ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC 800
AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT 860
GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC 914
Met íle Glu Gin Asp Gly Leu His
1 5
GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG 962
Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp
10 15 20
BB
BB • B
-17BB BB
B · · · • · · • BBB B • β ···· BB • B
B ·
B B
B ·
BB
B
BBB • · BB
B
B
B
B
GCA Ala 25 CAA CAG ACA ATC GGC Thr íle Gly 30 TGC Cys TCT GAT GCC GCC GTG TTC CGG CTG TCA 1010 Gin Gin Ser Asp Ala Ala 35 Val Phe Arg Leu Ser 40 GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC 1058 Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala 45 50 55 CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG 1106 Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr 60 65 70 ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA 1154 Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly 75 80 85 AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA 1202 Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser 90 95 100 TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG 1250 Ser His Leu Ala Pro Ala Glu Lys Val Ser íle Met Ala Asp Ala Met 105 110 115 120 CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA 1298 Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin 125 130 135 GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT 1346 Ala Lys His Arg íle Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu 140 145 150 GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC 1394 Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala 155 160 165 GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC 1442 Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu 170 175 180 GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT 1490 Val Val Thr His Gly Asp Ala Cys Leu Pro Asn íle Met Val Glu Asn 185 190 195 200 GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC 1538 Gly Arg Phe Ser Gly Phe íle Asp Cys Gly Arg Leu Gly Val Ala Asp 205 210 215 CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT 1586 Arg Tyr Gin Asp íle Ala Leu Ala Thr Arg Asp íle Ala Glu Glu Leu 220 225 230 GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT 1634 Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly íle Ala Ala 235 240 245
·· • · • · · • · • · · • *
-18·· ·· • · · · • · · • ··· · • · • •·· ·· • · • · • · • · ·· ·· ··· • · • ·
CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC 1682
Pro Asp Ser Gin Arg íle Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe
250 255 260 264
TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCCT GTT TTG CAA 1737
Val Leu Gin 563 565
TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC 1785 Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly Glu Asp Gin Ser 570 575 580 ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC 1832 Met Leu Arg Asp Glu Ala Thr Leu
585 589
TCGGCGTTTT CCGACACTGC GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG 1892
GGTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG 1952
ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA 2012
GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG 2072
TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG 2132
GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG CTGCAG 2188
FIG. 2g:
·· ·· • · · · • · · • ··· • · ···· ··
-19·· ·· • · · • · ··· • · · · « • · · · ·· ·· ·· • · · • · •: i ·· ·
CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356
Met Arg Ser Leu Glu 1 5
GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT His 20 TGG Trp 404 Ala Leu Leu Pro Phe 10 Pro Gly Arg íle Leu 15 Glu Arg Leu Glu GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 452 Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 25 30 35 GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 Gly Glu Trp Arg Arg íle Ser Tyr Ala Glu Met Phe His Asn Val Arg 40 45 50 GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 548 Ala íle Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 55 60 65 CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 Leu Leu íle Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 70 75 80 85 GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 644 Gly Ala Met Tyr Ala Gly íle Pro Tyr Cys Pro Val Ser Pro Ala Tyr 90 95 100 TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His íle Val Gly Leu 105 110 115 CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG 740 Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin 120 125 130 132
GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT 800 GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC 860 CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA 920 CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC 980 TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT 1040 TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA 1100
·· • ·
-20GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC 1155
Met Leu Arg
AGC Ser AGC Ser 5 AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA 1203 Asn Asp Val Thr Gin 10 Gin Gly Ser Arg Pro 15 Lys Thr Lys Leu GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC 1251 Gly Gly Ser Ser Met Gly íle íle Arg Thr Cys Arg Leu Gly Pro Asp 20 25 30 35 CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC 1299 Gin Val Lys Ser Met Arg Ala. Ala Leu Asp Leu Phe Gly Arg Glu Phe 40 45 50 GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC 1347 Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu 55 60 65 GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC 1395 Gly Asn Leu Leu Arg Ser Lys Thr Phe íle Ala Leu Ala Ala Phe Asp 70 75 80 CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT 1443 Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe 85 90 95 GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC 1491 Glu Gin Pro Arg Ser Glu íle Tyr íle Tyr Asp Leu Ala Val Ser Gly 100 105 110 115 GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG 1539 Glu His Arg Arg Gin Gly íle Ala Thr Ala Leu íle Asn Leu Leu Lys 120 125 130 CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT 1587 His Glu Ala Asn Ala Leu Gly Ala Tyr Val íle Tyr Val Gin Ala Asp 135 140 145 TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG 1635 Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly íle Arg 150 155 160 GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA 1683 Glu Glu Val Met His Phe Asp íle Asp Pro Ser Thr Ala Thr 165 170 175 177
TTCGTTCAAG CCGAGATCGG CTTCCCCT GTT TTG CAA TGG CGG TCG'GCG AAA 1735
Val Leu Gin Trp Arg Ser Ala Lys 563 565 570
GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC ATG CTG CGT GAC GAG 1783
Val Asp Ala Leu Tyr Arg Gly Glu Asp Gin Sér Met Leu Arg Asp Glu
575 580 585 ·· ·· • · · • · • · ··· • · ·· ·· • · · · • · · • ··· · • · ···· ·· • · • · • · • · ··
-21GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 1835
Ala Thr Leu
589
GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 1895 GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 1955 ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 2015 GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 2075 GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 2135 AGGCGCTGAT CACGTGCTGT GTGTCGCGGG CTGCAG 2171
FIG. 2h:
·· • ·
-22·· ·· ·· • · · · ··· · • · · · · ··· · • ····· ·· ··· • · · · · · ·· ···· ·· ·· II e
CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356
Met Arg Ser Leu Glu 1 5
GCG Ala CTT Leu CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG 404 Leu Pro Phe 10 Pro Gly Arg Ile Leu Glu 15 Arg Leu Glu His Trp 20 GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 452 Ala Lys Thr Arg 25 Pro Glu Gin Thr Cys 30 Val Ala Ala Arg Ala Ala Asn 35 GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 Gly Glu Trp 40 Arg Arg íle Ser Tyr 45 Ala Glu Met Phe His 50 Asn Val Arg GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 548 Ala Ile 55 Ala Gin Ser Leu Leu 60 Pro Tyr Gly Leu Ser 65 Ala Glu Arg Pro CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 Leu 70 Leu Ile Val Ser Gly Asn 75 Asp Leu Glu His 80 Leu Gin Leu Ala Phe85 GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 644 Gly Ala Met Tyr Ala 90 Gly íle Pro Tyr Cys Pro 95 Val Ser Pro Ala Tyr 100 TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 Ser Leu Leu Ser 105 Gin Asp Leu Ala Lys 110 Leu Arg His Ile Val Gly Leu 115 CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG CGC 740 Leu Gin Pro 120 Gly Leu Val Phe Ala 125 Ala Asp Ala Ala Pro 130 Phe Gin Arg 133 GCT GTT TTG CAA TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT 788 Ala 562 Val Leu Gin 565 Trp Arg Ser Ala Lys 570 Val Asp Ala Leu Tyr Arg Gly 575 GAA Glu GAT Asp CAA Gin TCC Ser ATG Met CTG CGT Leu Arg GAC Asp GAG Glu GCC ACA Ala Thr CTG Leu TGA GTTGGTCAGG 837
580 585 589
GGGGGCTTAC TCGGCGTTTT CCGACACTGC GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT 897
TGATTGCGGG GGTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGTCGCTCG 957 ··· · ·
CGAAGTTCTG ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC 1017 TATGGCTCAA GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG 1077 TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT 1137 GCTTCGGCAG GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG 1197 CTGCAG 1203
FIG. 2i:
·· ·· • · · · · • ··· · · • · · · · · • · · · * ·· ·· ·
-24·· ·· · · · · · • · · · • ··· « · • · · ···· ·· ·
GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC
GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG
GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG
AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC
GGTAACTGAT
AGAATCATGC
AAAAATAGTT
ACAGCACTGG
120
180
240
GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 290
Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys
1 5 10 GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 Val Glu 15 Glu Gly íle Ala Trp Val Thr Leu Asn 20 25 Arg Pro Glu Lys Arg 30 AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 386 Asn Ala Met Ser Pro 35 Thr Leu Asn Arg Glu Met 40 Val Glu Val Leu Glu 45 GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 434 Val Leu Glu Gin Asp 50 Ala Asp Ala Arg Val Leu 55 Val Leu Thr Gly Ala 60 GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 482 Gly Glu Ser Trp Thr 65 Ala Gly Met Asp Leu Lys 70 Glu Tyr Phe Arg Glu 75 ACC GAT Thr Asp 80 GCT GGC CCC Ala Gly Pro GAA ATT CTG CAA GAG AAG Glu íle Leu Gin Glu Lys 85 ATT CGT CGGGGACAGC 531 íle Arg 90 91 AAGCGAACCG GAATTGCCAG CTGGGGCGCC CTCTGGTAAG GTTGGGAAGC CCTGCAAAGT 591 AAACTGGATG GCTTTCTTGC CGCCAAGGAT CTGATGGCGC AGGGGATCAA GATCTGATCA 651 AGAGACAGGA TGAGGATCGT TTCGC ATG ATT GAA CAA Met íle Glu Gin 1 GAT GGA TTG CAC GCA 703 Asp Gly Leu His Ala 5 GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG GCA 751 Gly Ser 10 Pro Ala Ala Trp Val Glu Arg Leu Phe 15 20 Gly Tyr Asp Trp Ala 25 CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA GCG 799 Gin Gin Thr íle Gly 30 Cys Ser Asp Ala Ala Val 35 Phe Arg Leu Ser Ala 40 CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC CTG 847 Gin Gly Arg Pro Val 45 Leu Phe Val Lys Thr Asp 50 Leu Ser Gly Ala Leu 55 AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG ACG 895 Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr Thr
60 65 70
GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA AGG 943 Gly Val 75 Pro Cys Ala Ala Val 80 Leu Asp Val Val Thr Glu 85 Ala Gly Arg GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA TCT 991 Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser Ser 90 95 100 105 CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG CGG 1039 His Leu Ala Pro Ala Glu Lys Val Ser íle Met Ala Asp Ala Met Arg 110 115 120 CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA GCG 1087 Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin Ala 125 130 135 AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT GTC 1135 Lys His Arg íle Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu Val 140 145 150 GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC GAA 1183 Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala Glu 155 160 165 CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC GTC 1231 Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu Val 170 175 180 185 GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT GGC 1279 Val Thr His Gly Asp Ala Cys Leu Pro Asn íle Met Val Glu Asn Gly 190 195 200 CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC CGC 1327 Arg Phe Ser Gly Phe íle Asp Cys Gly Arg Leu Gly Val Ala Asp Arg 205 210 215 TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT GGC 1375 Tyr Gin Asp íle Ala Leu Ala Thr Arg Asp íle Ala Glu Glu Leu Gly 220 225 230 GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT CCC 1423 Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly íle Ala Ala Pro 235 240 245 GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC TGA 1471 Asp Ser Gin Arg íle Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 250 255 260 264
GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC CC GAG CAG GGC ATG 1525
Glu Gin Gly Met 255
AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG ACC TAC 1573
Lys Gin Phe Leu Asp Glu Lys Ser íle Lys Pro Gly Leu Gin Thr Tyr
260 265 270 ·· ·· ·· • · · · * · • · · · · • ··· · · · • · · · • ··· ·· a · • · · · • •t « • · a a a • · · ·· ·· a
-26AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA TAATGACAAT 1632 Lys Arg 275 276
AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA 1692 TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC 1752 GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT 1812 GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT 1872 CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC 1932 TGGTATGGGT TTAACGTTTA CCTGGČGGCG GGCATGTTGC GGGGAATTC 1981
FIG. 2 j :
···
-27GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60
GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120
GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180
AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 240
GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 290
Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys
15 10
GTT Val 15 GAA GAA GGT ATC Glu Glu Gly íle GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 Ala Trp 20 Val Thr Leu Asn 25 Arg Pro Glu Lys Arg 30 AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 386 Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 35 40 45 GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 434 Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 50 55 60 GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 482 Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 65 70 75 ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGGAGAG 531 Thr Asp Ala Gly Pro Glu íle Leu Gin Glu Lys íle Arg 80 85 90 91
GCGGTTTGCG TATTGGGCGC ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA 591 CATGGAAGCC ATCACAAACG GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT 651 CGCCTTGCGT ATAATATTTG CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC 711 CCAGTTGACA TAAGCCTGTT CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG 771 CAACTGGTCC AGAACCTTGA CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT 831 GGCTTGTTAT GACTGTTTTT TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG 891 TTACGCCGTG GGTCGATGTT TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC 947
Met Leu Arg Ser Ser
AAC Asn GAT Asp GTT Val ACG CAG Thr Gin 10 CAG Gin GGC AGT CGC CCT 1 AAA ACA AAG TTA 5 GGT GGC 995 Gly Ser Arg Pro 15 Lys Thr Lys Leu Gly 20 Gly TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC 1043 Ser Ser Met Gly íle íle Arg Thr Cys Arg Leu Gly Pro Asp Gin Val 25 30 35
·· ·· • · • · φ
ΦΦ·
-28φφφφ ·· • Φ·· φ φ φ
9 9 φ
Φ ΦΦ
AAA Lys TCC ATG CGG GCT GCT Ala CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC 1091 Ser Met 40 Arg Ala Leu Asp 45 Leu Phe Gly Arg Glu 50 Phe Gly Asp GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC 1139 Val Ala 55 Thr Tyr Ser Gin His 60 Gin Pro Asp Ser Asp Tyr 65 Leu Gly Asn TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA 1187 Leu 70 Leu Arg Ser Lys Thr 75 Phe íle Ala Leu Ala 80 Ala Phe Asp Gin Glu 85 GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG 1235 Ala Val Val Gly Ala 90 Leu Ala Ala Tyr Val 95 Leu Pro Arg Phe Glu Gin 100 CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC 1283 Pro Arg Ser Glu íle 105 Tyr íle Tyr Asp 110 Leu Ala Val Ser Gly Glu His 115 CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG 1331 Arg Arg Gin 120 Gly íle Ala Thr Ala 125 Leu íle Asn Leu Leu 130 Lys His Glu GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT 1379 Ala Asn 135 Ala Leu Gly Ala Tyr 140 Val íle Tyr Val Gin Ala 145 Asp Tyr Gly GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA 1427 Asp 150 Asp Pro Ala Val Ala 155 Leu Tyr Thr Lys Leu 160 Gly íle Arg Glu Glu 165 GTG Val ATG Met CAC His TTT GAT Phe Asp 170 ATC íle GAC Asp CCA Pro AGT Ser ACC Thr 175 GCC Ala ACC TAA Thr 177 CAATTCGTTC 1476
AAGCCGAGAT CGGCTTCCCC GAG CAG GGC ATG AAG CAG TTC CTT GAC GAG 1526
Glu Gin Gly Met Lys Gin Phe Leu Asp Glu 255 260
AAA AGC ATC AAG CCG GGC TTG CAG ACC TAC AAG CGC TGA TAAATGCGCC 1575
Lys Ser íle Lys Pro Gly Leu Gin Thr Tyr Lys Arg 265 270 275 276
GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA TAATGACAAT AATGAGGAGT GCCCAATGTT 1635 TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA TCTGATGAGC GCACCTTCGA 1695 GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA 1755 TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT GAATGGGCGG CGCTTGCTCC 1815 GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT CTAGAGGACC GTTCTTCCGA 1875
-29GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC TGGTATGGGT TTAACGTTTA 1935
CCTGGCGGCG GGCATGTTGC GGGGAATTC 1964
FIG. 2k:
·· ·· • · · · • · · • ··· • · • · * · · · ··
9 9
-30• · • · • · • · ··
999 i : ··
GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60
GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120
GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180
AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 240
GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 290
Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys
15 10
GTT GAA Val Glu 15 GAA Glu GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 Gly íle Ala 20 Trp Val Thr Leu Asn 25 Arg Pro Glu Lys Arg 30 AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 386 Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 35 40 45 GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 434 Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 50 55 60 GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 482 Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 65 70 75 ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGC GAG CAG 530 Thr Asp Ala Gly Pro Glu íle Leu Gin Glu Lys íle Arg Arg Glu Gin 80 85 90 92 255 GGC ATG AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG 578 Gly Met Lys Gin Phe Leu Asp Glu Lys Ser íle Lys Pro Gly Leu Gin 260 265 270
ACC TAC AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA 633
Thr Tyr Lys Arg
275 276
TAATGACAAT AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC 693 TTGTTCAGCA TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT 753 ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC 813 TGCGTTTCCT GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC 873 GGCGGATCTT CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC 933 AGCGGGAAAC TGGTATGGGT TTAACGTTTA CCTGGCGGCG GGCATGTTGC GGGGAATTC 992
FIG. 21:
-31GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55
Met Phe His Val Pro Leu Leu
1 5 ·· ·· ·· ··
ATT GGT GGT AAG íle Gly Gly Lys CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 Pro Cys Ser Ala 15 Ser Asp Glu Arg Thr 20 Phe Glu Arg 10 CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 25 30 35 TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 40 45 50 55 GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 247 Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 60 65 70 GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 295 Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 75 80 85 AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 343 Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 90 95 100 GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 391 Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin íle Gin 105 110 115 GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 439 Gly Asp Val íle Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 120 125 130 135 CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 487 Arg Gin Pro Cys Gly Val Val Leu Gly íle Ala Pro Trp Asn Ala Pro 140 145 150 GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 Val íle Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 155 160 165 ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 583 Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 170 175 180 ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 Ile Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 185 190 195 GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 679 Val íle Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 200 205 210 215
·· a
.2.
-32·· a· • · · · • · 1 • ··· · • · ···· ·· t· aa • a a · · • · ··· · a • · · a a a a • a a a a a ·· aa aa
ATT Ile GCA AAT CCT GCG Pro Ala 220 GTA Val CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 Ala Asn Arg Arg Val Asn Phe 225 Thr Gly Ser Thr His 230 GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 775 Val Gly Arg Ile Ile Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 235 240 245 GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 250 255 260 GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 265 270 275 - CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 Gin Gly Gin íle Cys Met Ser Thr Glu Arg Leu íle Val Thr Ala Val 280 285 290 295 GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 300 305 310 GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu íle Asp 315 320 325 GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GGG 1063 Ala Asn Ala Gly Gin Arg Ile Gin Val Leu Val Asp Asp Ala Leu 330 335 340 342
GACAGCAAGC GAACCGGAAT TGCCAGCTGG
CAAAGTAAAC TGGATGGCTT TCTTGCCGCC
TGATCAAGAG ACAGGATGAG GATCGTTTCG
GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG 1123
AAGGATCTGA TGGCGCAGGG GATCAAGATC 1183
C ATG ATT GAA CAA GAT GGA TTG 1235
Met Zle Glu Gin Asp Gly Leu
1 5
CAC His GCA GGT TCT CCG GCC Ala Gly Ser Pro Ala 10 GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC 1283 Ala Trp 15 Val Glu Arg Leu Phe 20 Gly Tyr Asp TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG 1331 Trp Ala Gin Gin Thr Ile Gly Cys Ser Asp Ala Ala Val Phe Arg Leu 25 30 35 TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT 1379 Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly 40 45 50 55 GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC 1427 Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala
60 65 70
-33·· ·· ·· »· • · · · · · · • · · · · ··· • ··· · · · · · • · · · · · ···· ·· ·· ·· ·· • · · • · • ·
ACG ACG GGC GTT CCT TGC Cys GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG 1475 Thr Thr Gly Val 75 Pro Ala Ala Val 80 Leu Asp Val Val Thr 85 Glu Ala GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG 1523 Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu 90 95 100 TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA 1571 Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser íle Met Ala Asp Ala 105 110 115 ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC 1619 Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His 120 125 130 135 CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT 1667 Gin Ala Lys His Arg íle Glu Arg Ala Arg Thr Arg Met Glu Ala Gly 140 145 150 CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA 1715 Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro 155 160 165 GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT 1763 Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp 170 175 180 CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA 1811 Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn Ile Met Val Glu 185 190 195 AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG 1859 Asn Gly Arg Phe Ser Gly Phe íle Asp Cys Gly Arg Leu Gly Val Ala 200 205 210 215 GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG 1907 Asp Arg Tyr Gin Asp íle Ala Leu Ala Thr Arg Asp íle Ala Glu Glu 220 225 230 CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC 1955 Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly Ile Ala 235 240 245 GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC 2003 Ala Pro Asp Ser Gin Arg Ile Ala Phe Tyr Arg Leu Leu Asp Glu Phe
250 255 260
TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC CG GCC CAG 2057
Phe Ala Gin
264 421
CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT GTG CAT GAC 2105
Arg Val Asp Ser Gly Ile Cys His íle Asn Gly Pro Thr Val His Asp
425 430 435 ··
-34·· • · · · • · · • ··· · • · ···· ·· ·· »· • · · • · ··· • · · · • · · · ·· ··
GAG GCT CAG Glu Ala Gin ATG Met CCA TTC Pro Phe GGT GGG Gly Gly 445 GTG Val AAG TCC AGC GGC TAC GGC AGC 2153 Lys Ser Ser 450 Gly Tyr Gly Ser 440 TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG CGC TGG CTG 2201 Phe Gly Ser Arg Ala Ser íle Glu His Phe Thr Gin Leu Arg Trp Leu 455 460 465 470 ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA ATCGATCTTC 2247 Thr íle Gin Asn Gly Pro Arg His Tyr Pro íle
475 480 481 GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA CTTGATAAAA 2307 ACAGAGCTGT -TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG 2367 AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCATGCTC TGCTCAGCCA 2427 CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA CGCTGGAGGT 2487 ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT TC 2539
FIG. 2m:
·· ·· ·· • ·
-35GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55
Met Phe His Val Pro Leu Leu
1 5 ·· • · · · • · · * ··· · • · ···· ·· ·· • · · • · ··· • · · · • · · · ·· ·· ··
ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 lle Gly Gly 10 Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 15 20 CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 25 30 35 TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 40 45 50 55 - GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 247 Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 60 65 70 GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 295 Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 75 80 85 AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 343 Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 90 95 100 GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 391 Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin íle Gin 105 110 115 GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 439 Gly Asp Val íle Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 120 125 130 135 CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 487 Arg Gin Pro Cys Gly Val Val Leu Gly íle Ala Pro Trp Asn Ala Pro 140 145 150 GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 Val íle Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 155 160 165 ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 583 Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 170 175 180 ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 lle Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 185 190 195 GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 679 Val íle Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 200 205 210 215
·· • · · • · • · · • · ·· ·
-36·· ·· • · · · • · · • ··· · • · ···· ·· ·· ·· • · · • · ··· • · · · • · · · ·· ··
ATT íle GCA AAT CCT GCG Pro Ala 220 GTA Val CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 Ala Asn Arg Arg Val Asn Phe 225 Thr Gly Ser Thr His 230 GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 775 Val Gly Arg íle íle Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 235 240 245 GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 250 255 260 GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 265 270 275 CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 Gin Gly Gin íle Cys Met Ser Thr Glu Arg Leu íle Val Thr Ala Val 280 285 290 295 GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 300 305 310 GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu íle Asp 315 320 325 GCC AAT GCA GGT CAA CGC ATC CAG GTGGGGAGAG GCGGTTTGCG TATTGGGCGC 1069 Ala Asn Ala Gly Gin Arg íle Gin 330 335
ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG 1129
GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG 1189
CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT 1249
CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA 1309
CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT 1369
TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT 1429
TGATGTTATG GAGCAGCAAC G ATG Met TTA CGC AGC Ser AGC Ser 5 AAC GAT GTT ACG CAG 1480 Leu Arg Asn Asp Val Thr Gin 10 1 CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC 1528 Gin Gly Ser Arg Pro Lys Thr 15 Lys Leu Gly 20 Gly Ser Ser Met Gly íle 25 ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT 1576 íle Arg Thr Cys Arg Leu Gly 30 Pro Asp 35 Gin Val Lys Ser Met 40 Arg Ala
-37·· ·· • · · ·
9 9 9 • ··· · • · ···· ·· ·· ·· ·« • · · · · · • · ··· « t • 9 9 9 9 9 9
9 9 9 9 9 9
99 99 99 9
GCT CTT GAT CTT TTC GGT Gly CGT Arg GAG TTC GGA GAC GTA GCC ACC TAC TCC Tyr Ser 1624 Ala Leu Asp Leu 45 Phe Glu Phe 50 Gly Asp Val Ala 55 Thr CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG 1672 Gin His 60 Gin Pro Asp Ser Asp 65 Tyr Leu Gly Asn Leu 70 Leu Arg Ser Lys ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT 1720 Thr 75 Phe íle Ala Leu Ala 80 Ala Phe Asp Gin Glu 85 Ala Val Val Gly Ala 90 CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC 1768 Leu Ala Ala Tyr Val 95 Leu Pro Arg Phe Glu Gin 100 Pro Arg Ser Glu íle 105 TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT 1816 Tyr íle Tyr Asp 110 Leu Ala Val Ser Gly 115 Glu His Arg Arg Gin 120 Gly íle GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT 1864 Ala Thr Ala Leu 125 íle Asn Leu Leu Lys 130 His Glu Ala Asn 135 Ala Leu Gly GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG 1912 Ala Tyr 140 Val íle Tyr Val Gin 145 Ala Asp Tyr Gly Asp 150 Asp Pro Ala Val GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT 1960 Ala 155 Leu Tyr Thr Lys Leu 160 Gly íle Arg Glu Glu 165 Val Met His Phe Asp 170 ATC íle GAC Asp CCA AGT Pro Ser ACC Thr GCC Ala ACC Thr TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA 2014
175 177
A TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT 2063
Leu Ala Gin Arg Val Asp Ser Gly íle Cys His íle Asn Gly Pro Thr
420 425 430 435
GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC 2111 Val His Asp Glu Ala 440 Gin Met Pro Phe Gly Gly Val Lys Ser Ser Gly 445 450 TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG 2159 Tyr Gly Ser Phe Gly Ser Arg Ala Ser íle Glu His Phe Thr Gin Leu 455 460 465 CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA 2204 Arg Trp Leu Thr íle Gin Asn Gly Pro Arg His Tyr Pro íle 470 475 480 481
ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA 2264
CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT 2324 ·· ·· ’ · · · • · · • ··· • · >··· ·· ·· • · • ··· • · · • · · > ··
CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCATGCTC 2384 TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA 2444 CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT 2504 TC 2506 FIG. 2n:
·· ··
-39GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55
Met Phe His Val Pro Leu Leu
1 5
ATT GGT íle Gly GGT Gly 10 AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 Lys Pro Cys Ser Ala 15 Ser Asp Glu Arg Thr 20 Phe Glu Arg CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 25 30 35 TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 40 45 50 55 GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 247 Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 60 65 70 GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 295 Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 75 80 85 AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 343 Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 90 95 100 GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 391 Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin íle Gin 105 110 115 GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 439 Gly Asp Val íle Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 120 125 130 135 CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 487 Arg Gin Pro Cys Gly Val Val Leu Gly íle Ala Pro Trp Asn Ala Pro 140 145 150 GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 Val íle Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 155 160 165 ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 583 Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 170 175 180 ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 íle Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 185 190 195 GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 679 Val íle Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 200 205 210 215
··
-40• · · · · · • · · · · • ··· · · · • · · · ···· ·· ·· ·» ·· • · · · ··· · · • · · · · • · · · ·· ·· ·
ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 íle Ala Asn Pro Ala 220 Val Arg Arg Val Asn Phe 225 Thr Gly Ser Thr His 230 GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 775 Val Gly Arg íle íle 235 Gly Glu Leu Ser 240 Ala Arg His Leu Lys 245 Pro Ala GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 Val Leu Glu Leu Gly 250 Gly Lys Ala 255 Pro Phe Leu Val Leu Asp 260 Asp Ala GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 Asp Leu 265 Asp Ala Ala Val Glu 270 Ala Ala Ala Phe Gly Ala Tyr 275 Phe Asn CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 Gin 280 Gly Gin íle Cys Met 285 Ser Thr Glu Arg Leu 290 íle Val Thr Ala Val 295 GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 Ala Asp Ala Phe Val 300 Glu Lys Leu Ala Arg Lys 305 Val Ala Thr Leu Arg 310 GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 Ala Gly Asp Pro Asn 315 Asp Pro Gin Ser 320 Val Leu Gly Ser Leu 325 íle Asp GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GCA 1063 Ala Asn Ala Gly Gin 330 Arg íle Gin 335 Val Leu Val Asp Asp Ala 340 Leu Ala AAA Lys GGC Gly 345 GCG CAATGGAA TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT Ala Leu Ala Gin Arg Val Asp Ser Gly íle Cys His 346 420 425 430 1113 ATC AAT GGA CCG ACT GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG 1161 íle Asn Gly Pro Thr 435 Val His Asp Glu Ala Gin 440 Met Pro Phe Gly Gly 445 GTG AAG TCC AGC GGC TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG 1209 Val Lys Ser Ser Gly 450 Tyr Gly Ser Phe 455 Gly Ser Arg Ala Ser 460 íle Glu CAC TTT ACC CAG CTG CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC 1257 His Phe Thr Gin Leu 465 Arg Trp Leu 470 Thr íle Gin Asn Gly Pro 475 Arg His TAT Tyr CCA Pro 480 ATC TAA ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT íle 481 1309
CGCCTCATTT CAATCTCTAA CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA 1369
AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA 1429 ·· • · · • · • t · • · ·· · ·· ·· • · · · • · · • ·· · · • · ···· ·· ·· • · • ··· • · · • · · ··
CCGCAGGCAT CATCATGCTC TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT 1489 CCGGTTGAGG TTACGCAAGA CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT 1549 CTTCCCTTCC CGGGTGGAAT TC 1571
FIG. 2o:
·· • · ·· ··
-42·· • · • · ··· ·· • · ···· • · • e ·· ··· • · • · ·· • · · • · • · • · ·· ·
GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60
GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112
Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser
15 10
GAC Asp ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 Thr Ala 15 Leu Val Ala Ala Val 20 Arg Thr Pro Trp íle 25 Asp Cys Gly GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 Gly Ala 30 Leu Ser Leu Val Ser 35 Pro íle Asp Leu Gly 40 Val Lys Val Ala CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC 256 Arg 45 Glu Val Leu Met Arg 50 Ala Ser Leu Glu Pro 55 Gin Met Val Asp Ser 60 GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 304 Val Leu Ala Gly Ser 65 Met Ala Gin Ala Ser 70 Phe Asp Ala Tyr Leu 75 Leu CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 Pro Arg His íle 80 Gly Leu Tyr Ser Gly 85 Val Pro Lys Ser Val 90 Pro Ala TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG 400 Leu Gly Val 95 Gin Arg íle Cys Gly 100 Thr Gly Phe Glu Leu 105 Leu Arg Gin GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 448 Ala Gly 110 Glu Gin íle Ser Gin 115 Gly Ala Asp His Val 120 Leu Cys Val Ala GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 496 Ala 125 Glu Ser Met Ser Arg 130 Asn Pro íle Ala Ser 135 Tyr Thr His Arg Gly 140 GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 544 Gly Phe Arg Leu Gly 145 Ala Pro Val Glu Phe 150 Lys Asp Phe Leu Trp 155 Glu GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 592 Ala Leu Phe Asp 160 Pro Ala Pro Gly Leu 165 Asp Met íle Ala Thr 170 Ala Glu
AAC CTG GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT 648
Asn Leu
174
TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 708
GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA 763
Met íle Glu Gin · ·· • · • · · · • · · · • · · • ··· • · ···· ·· • · ··· • · ··
GAT GGA Asp Gly 5 TTG Leu CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC 811 His Ala Gly 10 Ser Pro Ala Ala Trp Val Glu Arg Leu Phe 15 20 GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG 859 Gly Tyr Asp Trp Ala Gin Gin Thr íle Gly Cys Ser Asp Ala Ala Val 25 30 35 TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC 907 Phe Arg Leu Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp 40 45 50 CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG 955 Leu Ser Gly Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser 55 60 65 TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC 1003 Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val 70 75 80 ACT GAA GCG GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG 1051 Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin 85 90 95 100 GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG 1099 Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser íle Met 105 110 115 GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA 1147 Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro 120 125 130 TTC GAC CAC CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG 1195 Phe Asp His Gin Ala Lys His Arg íle Glu Arg Ala Arg Thr Arg Met 135 140 145 GAA GCC GGT CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG 1243 Glu Ala Gly Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly 150 155 160 CTC GCG CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC 1291 Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 165 170 175 180 GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC 1339 Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn íle 185 190 195 ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG 1387 Met Val Glu Asn Gly Arg Phe Ser Gly Phe íle Asp Cys Gly Arg Leu 200 205 210 GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT 1435 Gly Val Ala Asp Arg Tyr Gin Asp íle Ala Leu Ala Thr Arg Asp íle 215 220 225
• · ·· ·· ···· ··
GCT GAA GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC Ala Glu Glu 230 Leu Gly Gly Glu 235 Trp Ala Asp Arg Phe Leu Val Leu 240 Tyr GGT ATC GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT Gly íle Ala Ala Pro Asp Ser Gin Arg íle Ala Phe Tyr Arg Leu Leu 245 250 255 260
GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 1586
Asp Glu Phe Phe
264
CA TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG ATC GTG GCT 1633
Leu Arg Ala Gin Glu Glu Lys Trp íle Asp Gin Glu íle Val Ala 197 200 -205 210
GTT ACG GAT GAA CAG TTC Gin Phe GAT TTA GAG GGC TAC AAC AGT CGA GCA ATT 1681 Val Thr Asp Glu 215 Asp Leu Glu 220 Gly Tyr Asn Ser Arg Ala 225 íle GAA CTG CCT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC ATC CGC GGC 1729 Glu Leu Pro Arg Lys Ala Lys Leu Leu íle Val Thr Val íle Arg Gly 230 235 240 CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT CAT TCT GGC 1777 Leu Ala Val Phe Glu Ala Leu Ser Arg Leu Lys Pro Val His Ser Gly 245 250 255 GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC GGC GCC GCG 1825 Gly Val Gin Thr Ala Gly Asn Ser Cys Ala Val Val Asp Gly Ala Ala 260 265 270 275 GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG GTC TTG GCT 1873 Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gin Pro Val Leu Ala 280 285 290 AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG CAT ATG GGG 1921 Arg íle Leu Ala Thr Ser Val Val Gly íle Glu Pro Glu His Met Gly 295 300 305 CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT AGT GAT CTT 1969 Leu Gly Pro Ala Pro Ala íle Arg Leu Leu Leu Ala Arg Ser Asp Leu 310 315 320 AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG CAG GCC GCC 2017 Ser Leu Arg Asp íle Asp Leu Phe Glu íle Asn Glu Ala Gin Ala Ala 325 330 335 CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC TCA AAA CTT 2065 Gin Val Leu Ala Val Gin His Glu Leu Gly íle Glu His Ser Lys Leu 340 345 350 355 AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT GCC GCG ACC 2113 Asn íle Trp Gly Gly Ala íle Ala Leu Gly His Pro Leu Ala Ala Thr
360 365 370 • · ··· • · • · · · · ·
-45• · · · · · · • · · e · · ·· ·· ·· ·
GGA Gly TTG Leu CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA GCT AAT AAC 2161 Arg Leu Cys Met 375 Thr Leu Ala 380 His Gin Leu Gin Ala Asn Asn 385 TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA CAG GGG ATG 2209 Phe Arg Tyr Gly íle Ala Ser Ala Cys íle Gly Gly Gly Gin Gly Met 390 395 400 GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT GCA CGA AGT 2257 Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser Ala Arg Ser 405 410 415 TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA CGGGCATCTC 2306 Ser Met íle Asn Arg Val Asp His Tyr Pro Leu Ser 420 425 430 431
CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA 2366 GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT 2426 AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT 2486 TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC 2526
FIG. 2p:
• · ·· • · • ·
-46·· ·· • · · · • · · • ··· • · ···· ·· • · • · • · • ·
GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60
GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112
Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser
15 10
GAC Asp ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG Gly 160 Thr Ala 15 Leu Val Ala Ala Val Arg 20 Thr Pro Trp íle 25 Asp Cys GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 Gly Ala Leu Ser Leu Val Ser Pro íle Asp Leu Gly Val Lys Val Ala 30 35 40 CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC . 256 Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 45 50 55 60 GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 304 Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 65 70 75 CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 Pro Arg His íle Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 80 85 90 TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG 400 Leu Gly Val Gin Arg íle Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 95 100 105 GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 448 Ala Gly Glu Gin íle Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 110 115 120 GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 496 Ala Glu Ser Met Ser Arg Asn Pro íle Ala Ser Tyr Thr His Arg Gly 125 130 135 140 GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 544 Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 145 150 155 GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 592 Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met íle Ala Thr Ala Glu
160 165 170
ÄAC CTG GGGGAGAGGC GGTTTGCGTA TTGGGCGCAT GCATAAAAAC TGTTGTAATT 648
Asn Leu
174
CATTAAGCAT TCTGCCGACA TGGAAGCCAT CACAAACGGC ATGATGAACC TGAATCGCCA 708
GCGGCATCAG CACCTTGTCG CCTTGCGTAT AATATTTGCC CATGGACGCA CACCGTGGAA 768
ACGGATGAAG GCACGAACCC AGTTGACATA AGCCTGTTCG GTTCGTAAAC TGTAATGCAA 828
GTAGCGTATG CGCTCACGCA ACTGGTCCAG AACCTTGACC GAACGCAGCG GTGGTAACGG 888
-47·· ·· • · · • · · • · · · ·· ·· ·· • · · · · · • · ··· · · • · · · · · · • · · · · · ·· ·· ·· ·
CGCAGTGGCG GTTTTCATGG CTTGTTATGA CTGTTTTTTT GTACAGTCTA TGCCTCGGGC 948
ATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTTTG ATGTTATGGA GCAGCAACG 1007
ATG TTA CGC AGC Ser AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA 1055 Met Leu 1 Arg Ser 5 Asn Asp Val Thr Gin 10 Gin Gly Ser Arg Pro Lys 15 ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC 1103 Thr Lys Leu Gly Gly Ser Ser Met Gly Ile íle Arg Thr Cys Arg Leu 20 25 30 GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT 1151 Gly Pro Asp Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly 35 40 45 CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC 1199 Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser 50 55 60 GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT 1247 Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys Thr Phe Ile Ala Leu Ala 65 70 75 80 GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG 1295 Ala Phe Asp Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu 85 90 95 CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA 1343 Pro Arg Phe Glu Gin Pro Arg Ser Glu íle Tyr íle Tyr Asp Leu Ala 100 105 110 GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT 1391 Val Ser Gly Glu His Arg Arg Gin Gly Ile Ala Thr Ala Leu íle Asn 115 120 125 CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG 1439 Leu Leu Lys His Glu Ala Asn Ala Leu Gly Ala Tyr Val Ile Tyr Val 130 135 140 CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG 1487 Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu 145 150 155 160 GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC 1535 Gly íle Arg Glu Glu Val Met His Phe Asp Ile Asp Pro Ser Thr Ala
165 170 175
AAA TGG ATT GAC CAA GAG ATC GTG GCT GTT ACG GAT Lys Trp Ile Asp Gin Glu íle Val Ala Val Thr Asp 205 210
ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA TTG AGG GCG CAA GAG GAG 1589 Thr Leu Arg Ala Gin Glu Glu
177 197 200
GAA CAG TTC GAT 1637
Glu Gin Phe Asp 215
-48·· ·· • · · · • · · • ··· · • · ···· ·· · ··
B · ·
I · ···
B · · ·
B · · · ·· ··
TTA GAG GGC TAC AAC AGT CGA GCA ATT GAA CTG CCT CGG AAG GCA AAA Lys 1685 Leu Glu 220 Gly Tyr Asn Ser Arg 225 Ala íle Glu Leu Pro 230 Arg Lys Ala TTG TTG ATC GTG ACA GTC ATC CGC GGC CTA GCA GTC TTT GAA GCC CTT 1733 Leu Leu íle Val Thr Val íle Arg Gly Leu Ala Val Phe Glu Ala Leu 235 240 245 250 TCC CGA TTG AAG CCT GTT CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC 1781 Ser Arg Leu Lys Pro Val His Ser Gly Gly Val Gin Thr Ala Gly Asn 255 260 265 AGC TGT GCC GTA GTG GAC GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG 1829 Ser Cys Ala Val Val Asp Gly Ala Ala Ala Ala Leu Val Ala Arg Glu 270 275 280 TCG TCT GCG ACA CAG CCG GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA 1877 Ser Ser Ala Thr Gin Pro Val Leu Ala Arg íle Leu Ala Thr Ser Val 285 290 295 GTC GGG ATC GAG CCC GAG CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT 1925 Val Gly íle Glu Pro Glu His Met Gly Leu Gly Pro Ala Pro Ala íle 300 305 310 CGC CTG CTG CTT GCG CGT AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC 1973 Arg Leu Leu Leu Ala Arg Ser Asp Leu Ser Leu Arg Asp íle Asp Leu 315 320 325 330 TTT GAG ATA AAC GAG GCG CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT 2021 Phe Glu íle Asn Glu Ala Gin Ala Ala Gin Val Leu Ala Val Gin His 335 340 345 GAA TTG GGT ATT GAG CAC TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT 2069 Glu Leu Gly íle Glu His Ser Lys Leu Asn íle Trp Gly Gly Ala íle 350 355 360 GCA CTT GGA CAC CCG CTT GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC 2117 Ala Leu Gly His Pro Leu Ala Ala Thr Gly Leu Arg Leu Cys Met Thr 365 370 375 CTC GCT CAC CAA TTG CAA GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG 2165 Leu Ala His Gin Leu Gin Ala Asn Asn Phe Arg Tyr Gly íle Ala Ser 380 385 390 GCA TGC ATT GGT GGG GGA CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC 2213 Ala Cys íle Gly Gly Gly Gin Gly Met Ala Val Leu Leu Glu Asn Pro 395 400 405 410 CAC TTC GGT TCG TCC TCT GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC 2261 His Phe Gly Ser Ser Ser Ala Arg Ser Ser Met íle Asn Arg Val Asp
415 420 425
CAC TAT CCA CTG AGC TAA CGGGCATCTC CTTTGTTGCT TTGAGGTGGC His Tyr Pro Leu Ser
430 431
2309 ·· ·· ·· ·· ·· ···· ··· ··· • · · · · ··· · · • ··· ·· · · ··· · • · ···· e · ···· ·· ·· ·· ·· ·
GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA GAAGGAACAG GGAACÄTGAT 2369 TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT AAACTTGCCC TTGCCTTCGC 2429 ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT TTCTACAGTG TACATACCTT 2489 GTCAGGGTTG GTGGGAATTC 2509 FIG. 2q:
-50·· ·· ·· ·· ·· ···· ··· ··· • t e · · ··· · · • ··· · · ·· ··· · • · · · · · ·· ···· ·· ·· ·· ·· ·
GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60
GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112
Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser
15 10
GAC Asp ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG Cys Gly 160 Thr Ala 15 Leu Val Ala Ala Val Arg 20 Thr Pro Trp íle 25 Asp GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 Gly Ala Leu Ser Leu Val Ser Pro íle Asp Leu Gly Val Lys Val Ala 30 35 40 CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC 256 Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 45 50 55 60 GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 304 Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 65 70 75 CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 Pro Arg His íle Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 80 85 90 TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG 400 Leu Gly Val Gin Arg Ile Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 95 100 105 GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 448 Ala Gly Glu Gin íle Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 110 115 120 GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 496 Ala Glu Ser Met Ser Arg Asn Pro íle Ala Ser Tyr Thr His Arg Gly 125 130 135 140 GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 544 Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 145 150 155 GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 592 Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met íle Ala Thr Ala Glu
160 165 170
AAC CTG GCG CGC A TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG 641
Asn Leu Ala Arg Leu Arg Ala Gin Glu Glu Lys Trp Ile Asp Gin Glu
175 176 197 200 205 '
ATC íle GTG GCT GTT Val Ala Val 210 ACG GAT GAA CAG TTC GAT TTA GAG GGC TAC AAC AGT 689 Thr Asp Glu 215 Gin Phe Asp Leu Glu 220 Gly Tyr Asn Ser CGA GCA ATT GAA CTG CCT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC 737 Arg Ala íle Glu Leu Pro Arg Lys Ala Lys Leu Leu íle Val Thr Val 225 230 235 240
·· ·· • ·
-51 ·· ·· • · · · • · · • ··· • · ···· ·· • · · • · · · · • · · · · • · · · ·· ··
ATC íle CGC GGC CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT 785 Arg Gly Leu Ala 245 Val Phe Glu Ala Leu 250 Ser Arg Leu Lys Pro 255 Val CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC 833 His Ser Gly Gly Val Gin Thr Ala Gly Asn Ser Cys Ala Val Val Asp 260 265 270 GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG 881 Gly Ala Ala Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gin Pro 275 280 285 GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG 929 Val Leu Ala Arg íle Leu Ala Thr Ser Val Val Gly íle Glu Pro Glu 290 295 300 CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT 977 His Met Gly Leu Gly Pro Ala Pro Ala íle Arg Leu Leu Leu Ala Arg 305 310 315 320 AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG 1025 Ser Asp Leu Ser Leu Arg Asp íle Asp Leu Phe Glu íle Asn Glu Ala 325 330 335 CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC 1073 Gin Ala Ala Gin Val Leu Ala Val Gin His Glu Leu Gly íle Glu His 340 345 350 TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT 1121 Ser Lys Leu Asn íle Trp Gly Gly Ala íle Ala Leu Gly His Pro Leu 355 360 365 GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA 1169 Ala Ala Thr Gly Leu Arg Leu Cys Met Thr Leu Ala His Gin Leu Gin 370 375 380 GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA 1217 Ala Asn Asn Phe Arg Tyr Gly íle Ala Ser Ala Cys íle Gly Gly Gly 385 390 395 400 CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT 1265 Gin Gly Met Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser 405 410 415 GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA 1313 Ala Arg Ser Ser Met íle Asn Arg Val Asp His Tyr Pro Leu Ser 420 425 430 431
CGGGCATCTC CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA 1373 AAAACAAGAA GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG 1433 AGTCCAGGCT AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC 1493 CGGCACGGGT TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC 1543
FIG. 2r:
·· ·· • · · · • · · • ··· • · ···· ·· ·· ·· • · · • · ··· • · · · · • · · · ·· ·· • · · < · • · • · ·· ·
-52··
Sekvencía 1
CTGCAGCCAG GGCTGAÄAAG GAGGGATTCA GGCTCCAATT GCTCGATGGC GCCGCGATTG GCTAGGGAGA TAAATTTGCT GGCCATGGTG CATTCTGCAT CATGAAATTC ATGAAATCAT AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCATGGAAAT GGCATGAGCT TTGCTGGATA TGGAAGCACG ATTCCTCGCC CGGTAGAGCG AAAGAGCATG CAACTGACCA ACAAGAAAAT TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CATGCCGAGC CTGACTCTGG ATGCTTTCGT CGATAAGGCC ATCGGGACAG CAAGCGAACC GGTTGGGAAG CCCTGCAAAG 7ÄAACTGGAT CAGGGGATCA AGATCTGATC AAGAGACAGG TGGATTGCAC GCAGGTTCTC CGGCCGCTTG ACAACAGACÄ ATCGGCTGCT CTGATGCCGC 007707777? GTCAAGACCG ACCTGTCCGG GCGGCTA7CG TGGCTGGCCA CGACGGGCG7 TGAAGCGGGA AGGGACTGGC TGCTATTGGG 7CACCTTGCT CCTGCCGAGA AAGTATCCAT GCTTGATCCG GCTACCTGCC CATTCGACCA TACTCGGATG GAAGCCGGTC TTGTCGATCA CGCGCCAGCC GAACTGTTCG CCAGGCTCAA CGTGACCCA7 GGCGATGCCT GCTTGCCGAA ATTCATCGAC TGTGGCCGGC TGGGTGTGGC CCGTGATATT GCTGAAGAGC TTGGCGGCGA TATCGCCGCT CCCGATTCGC AGCGCATCGC AGCGGGACTC TGGGGTTCGA AATGACCGAC TCA7GTG7GC TGAGGAGTCA CGTTGGATCA TGGCATCGAC CTACGTGTAA GTTCGTGGAC AGCAGCTGAA AGCAGCTTTG GTTTTGA7CG TAAATAATAA AGGATTCTTG TGAAGCTTTA GGAATGATAT GAAAGCAAGT AGATCAGTCT CCATTTA7GC AGCGCTGCCA ATGTCAGCTG CGGATTGGAC GGTGCGTTGG GGACAACACC GAGCAAGACT CAAGTCTGAC AAATGCGCCG GTCAGGGTGA TCGTAACTTT GACCGGGGGC GCAG
GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 CACTTTTCGG GGGGTGGGTG CACGGGATTG 240 GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 GTAACCGCGA CATTCAGGAC CGTAAAAAGG 420 CGTCGTCACC GGAGTGTCCT CCGGTATCGG 480 CGGCGCCACA GTGATTGGCG TAGATCGCAA 540 TCAGGCTGAC CTGAGCCATC CTGAAGGCAT 600 GGAATTGCCA GCTGGGGCGC CCTCTGGTAA 660 GGCTTTCTTG CCGCCAAGGA TCTGATGGCG 720 ATGAGGATCG TTTCGCATGA TTGAACAAGA 780 GGTGGAGAGG CTATTCGGCT ATGACTGGGC 840 CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC 900 TGCCCTGAAT GAACTGCAGG ACGAGGCAGC 960 TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 1020 CGAAGTGCCG GGGCAGGATC TCCTGTCATC 1080 CATGGCTGAT GCAATGCGGC GGCTGCATAC 1140 CCAAGCGAAA CATCGCATCG AGCGAGCACG 1200 GGATGATCTG GACGAAGAGC ATCAGGGGCT 1260 GGCGCGCATG CCCGACGGCG AGGATCTCGT 1320 TATCATGGTG GAAAATGGCC GCTTTTCTGG 1380 GGACCGCTAT CAGGACATAG CGTTGGCTAC 1440 ATGGGCTGAC CGCTTCCTCG TGCTTTACGG 1500 CTTCTA7CGC CTTCTTGACG AGTTCTTCTG 1560 CAAGCGACGC CCTGGCCGCG GTGATTGCAT 1620 ACGGCA7AAA TATTCCAGTG GACGGAGGTT 1680 GCCCTTTGCA CGCGCACTAT ATCTCTATGC 1740 GAGGTAGCGG GCGGAAAGGT GCAGAATGTC 1800 GTTGTCCGTÄ AACGAAAATA AAAATAAAGA 1860 GCACTTTCAA AATAGCTACC CTGGCAGGCG 1920 CAAACTCGAT GCAGCTGGAT GTAGGTAGCT 1980 CTCAAGTATA GCCTTGCCTC TCGCCTGAAT 2040 ACTGTCAATG GTTATATCCG GATATTCAAA 2100 TTGGTATCCA ATCGTCTCGA TATTCTGGCT 2160
2164 • · ·· • ·
-53• · • · ··· · • · • · · · · · • · ··· · · • · · · · · · • * · · · · · ·· ·· · e ·
Sekyencia 2
CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 420 AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG 480 TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 540 CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAGGGGAG 600 AGGCGGTTTG CGTATTGGGC GCATGCATAA AAACTGTTGT AATTCATTAA GCATTCTGCC 660 GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA TCAGCACCTT 720 GTCGCCTTGC GTATAATATT TGCCCATGGA CGCACACCGT GGAAACGGAT GAAGGCACGA 780 ACCCAGTTGA CATAAGCCTG TTCGGTTCGT AAACTGTAAT GCAAGTAGCG TATGCGCTCA 840 CGCAACTGGT CCAGAACCTT GACCGAACGC AGCGGTGGTA ACGGCGCAGT GGCGGTTTTC 900 ATGGCTTGTT ATGACTGTTT TTTTGTACAG TCTATGCCTC GGGCATCCAA GCAGCAAGCG 960 CGTTACGCCG TGGGTCGATG TTTGATGTTA TGGAGCAGCA ACGATGTTAC GCAGCAGCAA 1020 CGATGTTACG CAGCAGGGCA GTCGCCCTAA AACAAAGTTA GGTGGCTCAA GTATGGGCAT 1080 CATTCGCACA TGTAGGCTCG GCCCTGACCA AGTCAAATCC ATGCGGGCTG CTCTTGATCT 1140 TTTCGGTCGT GAGTTCGGAG ACGTAGCCAC CTACTCCCAA CATCAGCCGG ACTCCGATTA 1200 CCTCGGGAAC TTGCTCCGTA GTAÄGACATT CATCGCGCTT GCTGCCTTCG ACCAAGAAGC 1260 GGTTGTTGGC GCTCTCGCGG CTTACGTTCT GCCCAGGTTT GAGCAGCCGC GTAGTGAGAT 1320 CTATATCTAT GATCTCGCAG TCTCCGGCGA GCACCGGAGG CAGGGCATTG CCACCGCGCT 1380 CATCAATCTC CTCAAGCATG AGGCCAACGC GCTTGGTGCT TATGTGATCT AC3TGCAAGC 1440 AGATTACGGT GACGATCCCG CAGTGGCTCT CTATACAAAG TTGGGCATAC GGGAAGAAGT 1500 GATGCACTTT GATATCGACC CAAGTACCGC CACCTAACAA TTCGTTCAAG CCGAGATCGG 1560 CTTCCCTGAT TGCATTCATG TGTGCTGAGG AGTCACGTTG GATCAACGGC ATAAATATTC 1620 CAGTGGACGG AGGTTTGGCA TCGACCTACG TGTAAGTTCG TGGACGCCCT TTGCACGCGC 1680 ACTATATCTC TATGCAGCAG CTGAAAGCAG CTTTGGTTTT GATCGGAGGT AGCGGGCGGA 1740 AAGGTGCAGA ATGTCTAAAT AATAAAGGAT TCTTGTGAAG CTTTAGTTGT CCGTAAACGA 1800 AAATAAAAAT AAAGAGGAAT GATATGAAAG CAAGTAGATC AGTCTGCACT TTCAAAATAG 1860 CTACCCTGGC AGGCGCCATT TATGCAGCGC TGCCAATGTC AGCTGCAAAC TCGATGCAGC 1920 TGGATGTAGG TAGCTCGGAT TGGACGGTGC GTTGGGGACA ACACCCTCAA GTATAGCCTT 1980 GCCTCTCGCC TGAATGAGCA AGACTCAAGT CTGACAAATG CGCCGACTGT CAATGGTTAT 2040 ATCCGGATAT TCAAAGTCAG GGTGATCGTA ACTTTGACCG GGGGCTTGGT ATCCAATCGT 2100 CTCGATATTC TGGCTGCAG 2119 • · • · · • · • · ··
-54• · • · ··· · ·· • · · • · • · • · ·· ·
Sekvencie 3
CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GGCTCCAATT GCTCGATGGC GCCGCGATTG GCTAGGGAGA TAAATTTGCT GGCCATGGTG CATTCTGCAT CATGAAATTC ATGAAATCAT AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCATGGAAAT GGCATGAGCT TTGCTGGATA TGGAAGCACG ATTCCTCGCC CGGTAGAGCG AAAGAGCATG CAACTGACCA ACAAGAAAAT TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CATGCCGAGC CTGACTCTGG ATGCTTTCGT CGATCAACGG CATAAATATT CCAGTGGACG GTGGACGCCC TTTGCACGCG CACTATATCT TGATCGGAGG TAGCGGGCGG AAAGGTGCAG GCTTTAGTTG TCCGTAAACG AAAATAAAAA CAGTCTGCAC TTTCAAAATA GCTACCCTGG CAGCTGCAAA CTCGATGCAG CTGGATGTAG AACACCCTCA AGTATAGCCT TGCCTCTCGC GCGCCGACTG TCAATGGTTA TATCCGGATA GGGGGCTTGG TATCCAATCG TCTCGATATT
GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 CACTTTTCGG GGGGTGGGTG CACGGGATTG 240 GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 GTAACCGCGA CATTCAGGAC CGTAAAAAGG 420 CGTCGTCACC GGAGTGTCCT CCGGTATCGG 480 CGGCGCCACA GTGATTGGCG TAGATCGCAA 540 TCAGGCTGAC CTGAGCCATC CTGAAGGCAT 600 GAGGTTTGGC ATCGACCTAC GTGTAAGTTC 660 CTATGCAGCA GCTGAAAGCA GCTTTGGTTT 720 AATGTCTAAA TAÄTAÄAGGA TTCTTGTGAA 780 TAAAGAGGAA TGATATGAAA GCAAGTAGAT 840 CAGGCGCCAT TTATGCAGCG CTGCCAATGT 900 GTAGCTCGGA TTGGACGGTG CGTTGGGGAC 960 CTGAATGAGC AAGACTCAAG TCTGACAAAT 1020 TTCAAAGTCA GGGTGATCGT AACTTTGACC 1080 CTGGCTGCAG 1120 ·· • ·
-55·· ·· • · · · • · · • · · · · • * ···· ·· ··· • · · • · • ·
Sekvencia 4
GAATTCCGCG TATCGCCCGG TTCTATCAGC GGTAGGGTCT TTTTCTTGGC CATGCTTGTT TGCGTTTGCC GCTTCGCTTC GCGATGAACC TTAACTCGCG TAAGCATTCT GTCATTTTTT GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CGATTAAGAT AATTAAAATA AGGAAACCGC CTCCAGCTCA AGGGCAATTT TTGGGCTATT AGAATAACAA TTGACTCCTC AGGAGGTCAG CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC AGGGGCCTGC AAACTTGGAG CTGCGTCTGA TGGAAAATCG TGAAGCAATT GCCGACGCGG AGCAAACACT GCTTTGCGAC ATTGCTGGCT ACGTGGCCAA ATGGATGGAG CCCGAACATC GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG TACTGGCCTT TGGGCCGCTG GCCGGCATAT CGTCCGAGCT TACCCCGCGG ACTTCTGCCC ATGAAACTGA GCTGACTACA GTGCTGGGCG AGCCTTTCGA TCATCTGATC TTCACCGGCG CCGCGGCGGA TAACCTAGTG CCCGTTACCC TTTCCCGCAG TGCAGATATG GCGGACGTTG ATGCCGGGCA AATCTGTCTG GCACCGGACT AACCGGAATT GCCAGCTGGG GCGCCCTCTG GGATGGCTTT CTTGCCGCCA AGGATCTGAT CAGGATGAGG ATCGTTTCGC ATGATTGAAC CTTGGGTGGA GAGGCTATTC GGCTATGACT CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC CCGGTGCCCT GAATGAACTG CAGGACGAGG GCGTTCCTTG CGCAGCTGTG CTCGACGTTG TGGGCGAAGT GCCGGGGCAG GATCTCCTGT CCATCATGGC TGATGCAATG CGGCGGCTGC ACCACCAAGC GAAACATCGC ATCGAGCGAG ATCAGGATGA TCTGGACGAA GAGCATCAGG TCAAGGCGCG CATGCCCGAC GGCGAGGATC CGAATATCAT GGTGGAAAAT GGCCGCTTTT TGGCGGACCG CTATCAGGAC ATAGCGTTGG GCGAATGGGC TGACCGCTTC CTCGTGCTTT
GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 240 CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420 CGATGAGCAT TCTTGGTTTG AATGGTGCCC 480 TTGATCGCAT GAAGAAGGCG CACCTGGAGC 540 GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC 780 GGGTCATTAG TCCCTGGAAC TTCCCTATCG 840 TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 TGGAATTGGG TGGCAAATCG CCGGTGATCG 1140 CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 ATGTGCTGCT GCCGGAAGGG ACAGCAAGCG 1260 GTAAGGTTGG GAAGCCCTGC AAAGTAAACT 1320 GGCGCAGGGG ATCAAGATCT GATCAAGAGA 1380 AAGATGGATT GCACGCAGGT TCTCCGGCCG 1440 GGGCACAACA GACAATCGGC TGCTCTGATG 1500 GCCCGGTTCT TTTTGTCAAG ACCGACCTGT 1560 CAGCGCGGCT ATCGTGGCTG GCCACGACGG 1620 TCACTGAAGC GGGAAGGGAC TGGCTGCTAT 1680 CATCTCACCT TGCTCCTGCC GAGAAAGTAT 1740 ATACGCTTGA TCCGGCTACC TGCCCATTCG 1800 CACGTACTCG GATGGAAGCC GGTCTTGTCG 1860 GGCTCGCGCC AGCCGAACTG TTCGCCAGGC 1920 TCGTCGTGAC CCATGGCGAT GCCTGCTTGC 1980 CTGGATTCAT CGACTGTGGC CGGCTGGGTG 2040 CTACCCGTGA TATTGCTGAA GAGCTTGGCG 2100 ACGGTATCGC CGCTCCCGAT TCGCAGCGCA 2160 ··· · • · • ··· • · · · · ·· ·· ·· ·
-56TCGCCTTCTA TCGCCTTCTT GACGAGTTCT TCTGAGCGGG ACTCTGGGGT TCGAAATGAC 2220 CGACCAAGCG ACGCCCGCCA TGCCAAGCCT GTTCTCGTGC AAAGTCCTGT GGGTGAGTCG 2280 AACTTGGCGA TGCGCGCACC CTACGGAGAA GCGATCCACG GACTGCTCTC TGTCCTCCTT 2340 TCAACGGAGT GTTAGAACCG TTGGTAGTGG TTTTGGACGG GCCCAGGAGC ATGCGCTTCT 2400 GGGCCCGTTT CTTGAGTATT CATTGGATAG TCACGCGTGG TAGCTTCGAG CCTGCACAGC 2460 TGATGAGCAC CCTGGAAGGC GCGCTGTACG CGGACGACTG GGTTCATCTT CGCCATTCAT 2520 GACGGAACTC CGTTCCCCAG TACCGCGATG ACTATTTTGC CTCTTCCGAT GTCCGATTCC 2580 ACGCCGCCTG ACGCTAAGCG GGGGCGGGGG CGCCCGCATC CCAGCCCAGA CAGCAACAAA 2640 TGAGTAGGCT CTTGGATGCC GCGGCGGCTG AGATTGGTAA CGGCAATTTC GTCAATGTGA 2700 CGATGGATTC GATTGCCCGT GCTGCCGGCG TCTCAAAAAA AACGCTGTAC GTCTTGGTGG 2760 CGAGCAAGGA AGAACTCATT TCCCGGTTAG TGGCTCGAGA CATGTCCAAC CTTGAGGAAT 2820 TC 2822 • · ···
-57···· ·· • · '··
Sekvencia 5
GAATTCCGCG TATCGCCCGG TTCTATCAGC GGTAGGGTCT TTTTCTTGGC CATGCTTGTT TGCGTTTGCC GCTTCGCTTC GCGATGAACC TTAACTCGCG TAAGCATTCT GTCATTTTTT GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CGATTAAGAT AATTAAAATA AGGAAACCGC CTCCAGCTCA AGGGCAATTT TTGGGCTATT AGAATAACAA TTGACTCCTC AGGAGGTCAG CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC AGGGGCCTGC AAACTTGGAG CTGCGTCTGA TGGAÄAATCG TGAAGCAATT GCCGACGCGG AGCAAACACT GCTTTGCGAC ATTGCTGGCT ACGTGGCCAA ATGGATGGAG CCCGAACATC GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG TACTGGCCTT TGGGCCGCTG GCCGGCATAT CGTCCGAGCT TACCCCGCGG ACTTCTGCCC ATGAAACTGA GCTGACTACA GTGCTGGGCG AGCCTTTCGA TCATCTGATC TTCACCGGCG CCGCGGCGGA TAACCTAGTG CCCGTTACCC TTTCCCGCAG TGCAGATATG GCGGACGTTG ATGCCGGGCA AATCTGTCTG GCACCGGACT GGGCGCATGC ATAAAAACTG TTGTAATTCA CAAACGGCAT GATGAACCTG AATCGCCAGC TATTTGCCCA TGGACGCACA CCGTGGAAAC CCTGTTCGGT TCGTAAACTG TAATGCAAGT CCTTGACCGA ACGCAGCGGT GGTAACGGCG GTTTTTTTGT ACAGTCTATG CCTCGGGCAT GATGTTTGAT GTTATGGAGC AGCAACGATG GGCAGTCGCC CTAAAACAAA GTTAGGTGGC CTCGGCCCTG ACCAAGTCAA ATCCATGCGG GGAGACGTAG CCACCTACTC CCAACATCAG CGTAGTAAGA CATTCATCGC GCTTGCTGCC GCGGCTTACG TTCTGCCCAG GTTTGAGCAG GCAGTCTCCG GCGAGCACCG GAGGCAGGGC CATGAGGCCA ACGCGCTTGG TGCTTATGTG CCCGCAGTGG CTCTCTATAC AAAGTTGGGC
GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 240 CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420 CGATGAGCAT TCTTGGTTTG AATGGTGCCC 480 TTGATCGCAT GAAGAAGGCG CACCTGGAGC 540 GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC 780 GGGTCATTAG TCCCTGGAAC TTCCCTATCG 840 TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 TGGAATTGGG TGGCAAATCG CCGGTGATCG 1140 CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 ATGTGCTGGG GGAGAGGCGG TTTGCGTATT 1260 TTAAGCATTC TGCCGACATG GAAGCCATCA 1320 GGCATCAGCA CCTTGTCGCC TTGCGTATAA 1380 GGATGAAGGC ACGAACCCAG TTGACATAAG 1440 AGCGTATGCG CTCACGCAAC TGGTCCAGAA 1500 CAGTGGCGGT TTTCATGGCT TGTTATGACT 1560 CCAAGCAGCA AGCGCGTTAC GCCGTGGGTC 1620 TTACGCAGCA GCAACGATGT TACGCAGCAG 1680 TCAAGTATGG GCATCATTCG CACATGTAGG 1740 GCTGCTCTTG ATCTTTTCGG TCGTGAGTTC 1800 CCGGACTCCG ATTACCTCGG GAACTTGCTC 1860 TTCGACCAAG AAGCGGTTGT TGGCGCTCTC 1920 CCGCGTAGTG AGATCTATAT CTATGATCTC 1980 ATTGCCACCG CGCTCATCAA TCTCCTCAAG 2040 ATCTACGTGC AAGCAGATTA CGGTGACGAT 2100 ATACGGGAAG AAGTGATGCA CTTTGATATC 2160
• · ·· ·· • · · · • · · • ··· • · ···· ·· ·· ·· • · • ··· • · « ·· ··
-58GACCCAAGTA CCGCCACCTA ACAATTCGTT CAAGCCGAGA TCGGCTTCCC TGCAAAGTCC 2220 TGTGGGTGAG TCGAACTTGG CGATGCGCGC ACCCTACGGA GAAGCGATCC ACGGACTGCT 2280 CTCTGTCCTC CTTTCAACGG AGTGTTAGAA CCGTTGGTAG TGGTTTTGGA CGGGCCCAGG 2340 AGCATGCGCT TCTGGGCCCG TTTCTTGAGT ATTCATTGGA TAGTCACGCG TGGTAGCTTC 2400 GAGCCTGCAC AGCTGATGAG CACCCTGGAA GGCGCGCTGT ACGCGGACGA CTGGGTTCAT 2460 CTTCGCCATT CATGACGGAA CTCCGTTCCC CAGTACCGCG ATGACTATTT TGCCTCTTCC 2520 GATGTCCGAT TCCACGCCGC CTGACGCTAA GCGGGGGCGG GGGCGCCCGC ATCCCAGCCC 2580 AGACAGCAAC AAATGAGTAG GCTCTTGGAT GCCGCGGCGG CTGAGATTGG TAACGGCAAT 2640 TTCGTCAATG TGACGATGGA TTCGATTGCC CGTGCTGCCG GCGTCTCAAA AAAAACGCTG 2700 TACGTCTTGG TGGCGAGCAA GGAAGAACTC ATTTCCCGGT TAGTGGCTCG AGACATGTCC 2760 AACCTTGAGG AATTC 2775 ·· ·· • · • · · • · • · • · ·· ·
-59···· ··· ·· ··· • fl ··
Sekvencia 6
GAATTCCGCG TATCGCCCGG TTCTATCAGC GGTAGGGTCT TTTTCTTGGC CATGCTTGTT TGCGTTTGCC GCTTCGCTTC GCGATGAACC TTAACTCGCG TAAGCATTCT GTCATTTTTT GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CGATTAAGAT AATTAAAATA AGGAAACCGC CTCCAGCTCA AGGGCAATTT TTGGGCTATT AGAATAACAA TTGACTCCTC AGGAGGTCAG CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC AGGGGCCTGC AAACTTGGAG CTGCGTCTGA TGGAAAATCG TGAAGCAATT GCCGACGCGG AGCAAACACT GCTTTGCGAC ATTGCTGGCT ACGTGGCCAA ATGGATGGAG CCCGAACATC GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG TACTGGCCTT TGGGCCGCTG GCCGGCATAT CGTCCGAGCT TACCCCGCGG ACTTCTGCCC ATGAAACTGA GCTGACTACA GTGCTGGGCG AGCCTTTCGA TCATCTGATC TTCACCGGCG CCGCGGCGGA TAACCTAGTG CCCGTTACCC TTTCCCGCAG TGCAGATATG GCGGACGTTG ATGCCGGGCA AATCTGTCTG GCACCGTGGG CGGAGAAGCG ATCCACGGAC TGCTCTCTGT GTAGTGGTTT TGGÄCGGGCC CAGGAGCATG TGGATAGTCA CGCGTGGTAG CTTCGAGCCT CTGTACGCGG ACGACTGGGT TCATCTTCGC CGCGATGACT ATTTTGCCTC TTCCGATGTC GCGGGGGCGC CCGCATCCCA GCCCAGACAG GCGGCTGAGA TTGGTAACGG CAATTTCGTC GCCGGCGTCT CAAAAAAAAC GCTGTACGTC CGGTTAGTGG CTCGAGACAT GTCCAACCTT
GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 240 CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420 CGATGAGCAT TCTTGGTTTG AATGGTGCCC 480 TTGATCGCAT GAAGAAGGCG CACCTGGAGC 540 GTAGGCTGGA TCGTGCGATT GCÄATGCTTC 600 TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC 780 GGGTCATTAG TCCCTGGAAC TTCCCTATCG 840 TCGCAGCAGG TAATCGCGCC A7GCTCAAGC 900 TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 TGGAATTGGG TGGCAAATCG CCGGTGATCG 1140 CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 TGAGTCGAAC TTGGCGATGC GCGCACCCTA 1260 CCTCCTTTCA ACGGAGTGTT AGAACCGTTG 1320 CGCTTCTGGG CCCGTTTCTT GAGTATTCAT 1380 GCACAGCTGA TGAGCACCCT GGAAGGCGCG 1440 CATTCATGAC GGAACTCCGT TCCCCAGTAC 1500 CGATTCCACG CCGCCTGACG CTAAGCGGGG 1560 CAACAAATGA GTAGGCTCTT GGATGCCGCG 1620 AATGTGACGA TGGATTCGAT TGCCCGTGCT 1680 TTGGTGGCGA GCAAGGAAGA ACTCATTTCC 1740 GAGGAATTC 1779 ·· ···· ·· • · ····
Sekvencia 7
CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 420 AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 480 AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 540 AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 ATGCAGCACC TTTCCAGGGG ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG 780 GTAAGGTTGG GAAGCCCTGC AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT 840 GGCGCAGGGG ATCAAGATCT GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATGATTGAAC 900 AAGATGGATT GCACGCAGGT TCTCCGGCCG CTTGGGTGGA GAGGCTATTC GGCTATGACT 960 GGGCACAACA GACAATCGGC TGCTCTGATG CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC 1020 GCCCGGTTCT TTTTGTCAAG ACCGACCTGT CCGGTGCCCT GAATGAACTG CAGGACGAGG 1080 CAGCGCGGCT ATCGTGGCTG GCCACGACGG GCGTTCCTTG CGCAGCTGTG CTCGACGTTG 1140 TCACTGAAGC GGGAAGGGAC TGGCTGCTAT TGGGCGAAGT GCCGGGGCAG GATCTCCTGT 1200 CATCTCACCT TGCTCCTGCC GAGAAAGTAT CCATCATGGC TGATGCAATG CGGCGGCTGC 1260 ATACGCTTGA TCCGGCTACC TGCCCATTCG ACCACCAAGC GAAACATCGC ATCGAGCGAG 1320 CACGTACTCG GATGGAAGCC GGTCTTGTCG ATCAGGATGA TCTGGACGAA GAGCATCAGG 1380 GGCTCGCGCC AGCCGAACTG TTCGCCAGGC TCAAGGCGCG CATGCCCGAC GGCGAGGATC 1440 TCGTCGTGAC CCATGGCGAT GCCTGCTTGC CGAATATCAT GGTGGAAAAT GGCCGCTTTT 1500 CTGGATTCAT CGACTGTGGC CGGCTGGGTG TGGCGGACCG CTATCAGGAC ATAGCGTTGG 1560 CTACCCGTGA TATTGCTGAA GAGCTTGGCG GCGAATGGGC TGACCGCTTC CTCGTGCTTT 1620 ACGGTATCGC CGCTCCCGAT TCGCAGCGCA TCGCCTTCTA TCGCCTTCTT GACGAGTTCT 1680 TCTGAGCGGG ACTCTGGGGT TCGAAATGAC CGACCAAGCG ACGCCCCTGT TTTGCAATGG 1740 CGGTCGGCGA AAGTTGATGC GCTGTATCGT GGTGAAGATC AATCCATGCT GCGTGACGAG 1800 GCCACACTGT GAGTTGGTCA GGGGGGGCTT ACTCGGCGTT TTCCGACACT GCGTTGGTTG 1860 CGGCAGTGCG CACCCCCTGG ATTGATTGCG GGGGTGCCCT GTCGCTGGTG TCGCCTATCG 1920 ACTTAGGGGT AAAGGTCGCT CGCGAAGTTC TGATGCGTGC GTCGCTTGAA CCACAAATGG 1980 TCGATAGCGT ACTCGCAGGC TCTATGGCTC AAGCAAGCTT TGATGCTTAC CTGCTCCCGC 2040 GGCACATTGG CTTGTACAGC GGTGTTCCCA AGTCGGTTCC GGCCTTGGGG GTGCAGCGCA 2100 TTTGCGGCAC AGGCTTCGAA CTGCTTCGGC AGGCCGGCGA GCAGATTTCC CAAGGCGCTG 2160 ATCACGTGCT GTGTGTCGCG GGCTGCAG 2188 ·· ·· • · · • · • ·· ···· ··
-61 ·· ·· ·· • · · · · · • · ··· · · ·· ·· ··· · • · · · · · ·· ·· ·· ·
Sekvencia 8
CTGCAGCCGA GCATCGATTG AGCACTTTAC CCCGCGGCAC TATCCAATCT AAATCGATCT CTCGCCTCAT TTCAATCTCT AACTTGATAA CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AACCGCAGGC ATCATCATGC TCTGCTCAGC CTCCGGTTGA GGTTACGCAA GACGCTGGAG TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC AACAAACCTG CGTTGCTGCC AGGGCGGCAA AAATGTTCCA CAACGTCCGC GCCATCGCAC ÄGCGTCCGCT GCTTATCGTC TCTGGAAATG CTATGTATGC GGGCATTCCC TATTGCCCGG ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC ATGCAGCACC TTTCCAGGGG GAGAGGCGGT TGTAATTCAT TAAGCATTCT GCCGACATGG ATCGCCAGCG GCATCAGCAC CTTGTCGCCT CGTGGAAÄCG GATGAAGGCA CGAACCCAGT AATGCAAGTA GCGTATGCGC TCACGCAACT GTAACGGCGC AGTGGCGGTT TTCATGGCTT CTCGGGCATC CAAGCAGCAA GCGCGTTACG GCAACGATGT TACGCAGCAG CAACGATGTT TTAGGTGGCT CAAGTATGGG CATCATTCGC TCCATGCGGG CTGCTCTTGA TCTTTTCGGT CAACATCAGC CGGACTCCGA TTACCTCGGG CTTGCTGCCT TCGACCAAGA AGCGGTTGTT TTTGAGCAGC CGCGTAGTGA GATCTATATC AGGCAGGGCA TTGCCACCGC GCTCATCAAT GCTTATGTGA TCTACGTGCA AGCAGATTAC AAGTTGGGCA TACGGGAAGA AGTGATGCAC CAATTCGTTC AAGCCGAGAT CGGCTTCCCC TGCGCTGTAT CGTGGTGAAG ATCAATCCAT TCAGGGGGGG CTTACTCGGC GTTTTCCGAC TGGATTGATT GCGGGGGTGC CCTGTCGCTG GCTCGCGAAG TTCTGATGCG TGCGTCGCTT GGCTCTATGG CTCAAGCAAG CTTTGATGCT AGCGGTGTTC CCAAGTCGGT TCCGGCCTTG GAACTGCTTC GGCAGGCCGG CGAGCAGATT GCGGGCTGCA G
CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 AGAGTACAGT GAACGCCGAG TCCACATTGC 240 CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 gtctcgagca TTGGGCTAAG ACCCGTCCAG 420 ATGGGGAATG GCGTCGTATC AGCTACGCGG 480 AGAGCTTGCT TCCTTACGGA CTATCGGCAG 540 ACCTGGAACA TCTTCÄGCTG GCATTTGGGG 600 TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 TTGCGTATTG GGCGCATGCA TAAAAACTGT 780 AAGCCATCAC AAACGGCATG ATGAACCTGA 840 TGCGTATAAT ATTTGCCCAT GGACGCACAC 900 TGACATAAGC CTG7TCGGTT CGTAAACTGT 960 GGTCCAGAAC CTTGACCGAA CGCAGCGGTG 1020 GTTATGACTG TTTTTTTGTA CAGTCTATGC 1080 CCGTGGGTCG ATGTTTGATG TTATGGAGCA 1140 ACGCAGCAGG GCAGTCGCCC TAAAACAAAG 1200 ACATGTAGGC TCGGCCCTGA CCAAGTCAAA 1260 CGTGAGTTCG GAGACGTAGC CACCTACTCC 1320 AÄCTTGCTCC GTAGTAAGAC ATTCATCGCG 1380 GGCGCTCTCG CGGCTTACGT TCTGCCCAGG 1440 TATGÄTCTCG CAGTCTCCGG CGAGCACCGG 1500 CTCCTCAAGC ATGAGGCCAA CGCGCTTGGT 1560 GGTGACGATC CCGCAGTGGC TCTCTATACA 1620 T7TGATATCG ACCCAAGTAC CGCCACCTAA 1680 TGTTTTGCAA TGGCGGTCGG CGAAAGTTGA 1740 GCTGCG7GAC GAGGCCACAC TGTGAGTTGG 1800 ACTGCGTTGG TTGCGGCAGT GCGCACCCCC 1860 GTGTCGCCTA TCGACTTAGG GGTAAAGGTC 1920 GAACCACAAA TGGTCGATAG CGTACTCGCA 1980 TACCTGCTCC CGCGGCACAT TGGCTTGTAC 2040 GGGGTGCAGC GCATTTGCGG CACAGGCTTC 2100 TCCCAAGGCG CTGATCACGT GCTGTGTGTC 2160
2171 ·· • · · • · ··· • · · · • · · · ·· ·· ·· • · · • · • · · • · ·· ·
-62• · • · · · • · · • ··· · • · ···· ·· ·· ··
Sekvencia 9
CTGCAGCCGA GCATCGATTG AGCACTTTAC CCCGCGGCAC TATCCAATCT AAATCGATCT CTCGCCTCAT TTCAATCTCT AACTTGATAA CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AACCGCAGGC ATCATCATGC TCTGCTCAGC CTCCGGTTGA GGTTACGCAA GACGCTGGAG TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC AACAAACCTG CGTTGCTGCC AGGGCGGCAA AAATGTTCCA CAACGTCCGC GCCATCGCAC AGCGTCCGCT GCTTATCGTC TCTGGAAATG CTATGTATGC GGGCATTCCC TATTGCCCGG ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC ATGCAGCACC TTTCCAGCGC GCTGTTTTGC ATCGTGGTGA AGATCAATCC ATGCTGCGTG GGCTTACTCG GCGTTTTCCG ACACTGCGTT TTGCGGGGGT GCCCTGTCGC TGGTGTCGCC AGTTCTGATG CGTGCGTCGC TTGAACCACA GGCTCAAGCA AGCTTTGATG CTTACCTGCT TCCCAAGTCG GTTCCGGCCT TGGGGGTGCA TCGGCAGGCC GGCGAGCAGA TTTCCCAAGG CAG
CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 AGAGTACAGT GAACGCCGAG TCCACATTGC 240 CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 420 ATGGGGAATG GCGTCGTATC AGCTACGCGG 480 AGAGCTTGCT TCCTTACGGA CTATCGGCAG 540 ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 AATGGCGGTC GGCGAAAGTT GATGCGCTGT 780 ACGAGGCCAC ACTGTGAGTT GGTCAGGGGG 840 GGTTGCGGCA GTGCGCACCC CCTGGATTGA 900 TATCGACTTA GGGGTAAAGG TCGCTCGCGA 960 AATGGTCGAT AGCGTACTCG CAGGCTCTAT 1020 CCCGCGGCAC ATTGGCTTGT ACAGCGGTGT 1080 GCGCATTTGC GGCACAGGCT TCGAACTGCT 1140 CGCTGATCAC GTGCTGTGTG TCGCGGGCTG 1200
1203 ·· • · • · · • · • · · • · • · ·
-63· ·· • · · · • · · • ··· · • · ···· ·· ·· • · · • · ··· • · · · • · · · r· ··
Sekvencie 10
GAATTCCCCT GGCGACGAAA GGGCGGCAGG GCTTGCGTTA ATCGTTAACC GTTTGAAATT GGGTACGCCT TTCCGTGCGC TTTGATCTGC AATTGACAGA ACTATAGGTT CGCAGTAGCT GGTGCACGAT GAATAGCTAC GATGGCCGTT GTATCGCTTG GGTCACGCTG AACCGCCCGG ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TTCTGACTGG TGCAGGCGAA TCCTGGACCG AGACCGATGC TGGCCCCGAA ATTCTGCAAG GGAATTGCCA GCTGGGGCGC CCTCTGGTAA GGCTTTCTTG CCGCCAAGGA TCTGATGGCG ATGAGGATCG TTTCGCATGA TTGAACAAGA GGTGGAGAGG CTATTCGGCT ATGACTGGGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC TGCCCTGAAT GAACTGCAGG ACGAGGCAGC TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC CGAAGTGCCG GGGCAGGATC TCCTGTCATC CATGGCTGAT GCAATGCGGC GGCTGCATAC CCAAGCGAAA CATCGCATCG AGCGAGCACG GGATGATCTG GACGAAGAGC ATCAGGGGCT GGCGCGCATG CCCGACGGCG AGGATCTCGT TATCATGGTG GAAAATGGCC GCTTTTCTGG GGACCGCTAT CAGGACATAG CGTTGGCTAC ÄTGGGCTGAC CGCTTCCTCG TGCTTTACGG CTTCTATCGC CTTCTTGACG AGTTCTTCTG CAAGCGACGC CCCGAGCAGG GCATGAAGCA CTTGCAGACC TACAAGCGCT GATAAATGCG AATAATGACA ATAATGAGGA GTGCCCAATG CCTTGTTCAG CATCTGATGA GCGCACCTTC GTATCGCGCG TCGCTGCTGC CAGTTTGGAA GCTGCGTTTC CTGAATGGGC GGCGCTTGCT GCGGCGGATC TTCTAGAGGA CCGTTCTTCC GCAGCGGGAA ACTGGTATGG GTTTAACGTT C
CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 TTTGCTCACC CACCAAATCC ACAGCACTGG 240 GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 420 CGGGCATGGA CCTGAAGGAG TATTTCCGCG 480 AGAAGATTCG TCGGGGACAG CAAGCGAACC 540 GGTTGGGAAG CCCTGCAAAG TAAACTGGAT 600 CAGGGGATCA AGATCTGATC AAGAGACAGG 660 TGGATTGCAC GCAGGTTCTC CGGCCGCTTG 720 ACAACAGACA ATCGGCTGCT CTGATGCCGC 780 GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 840 GCGGCTATCG TGGCTGGCCA CGACGGGCGT 900 TGAAGCGGGA AGGGACTGGC TGCTATTGGG 960 TCACCTTGCT CCTGCCGAGA AAGTATCCAT 1020 GCTTGATCCG GCTACCTGCC CATTCGACCA 1080 TACTCGGATG GAAGCCGGTC TTGTCGATCA 1140 CGCGCCAGCC GAACTGTTCG CCAGGCTCAA 1200 CGTGACCCAT GGCGATGCCT GCTTGCCGAA 1260 ATTCATCGAC TGTGGCCGGC TGGGTGTGGC 1320 CCGTGATATT GCTGAAGAGC TTGGCGGCGA 1380 TATCGCCGCT CCCGATTCGC AGCGCATCGC 1440 AGCGGGACTC TGGGGTTCGA AATGACCGAC 1500 GTTCCTTGAC GAGAAAAGCA TCAAGCCGGG 1560 CCGGGGCCCT CGCTGCGCCC CCGGCCTTCC 1620 TTTCACGTGC CCCTGCTTAT TGGTGGTAAG 1680 GAGCGTCGTA GCCCGCTGAC CGGAGAAGTG 1740 GATGCGGACG CCGCAGTGGC CGCTGCACAG 1800 CCGAGCGAAC GCCGTGCCCG ACTGCTGCGA 1860 GAGTTCACCG CCGCAGCGAG TGAAACTGGC 1920 TACCTGGCGG CGGGCATGTT GCGGGGAATT 1980
1981
-64Sekvencia 11
GAATTCCCCT GGCGACGAAA GGGCGGCAGG GCTTGCGTTA ATCGTTAACC GTTTGAAATT GGGTACGCCT TTCCGTGCGC TTTGATCTGC AATTGACAGA ACTATAGGTT CGCAGTAGCT GGTGCACGAT GAATAGCTAC GATGGCCGTT GTATCGCTTG GGTCACGCTG AACCGCCCGG ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TTCTGACTGG TGCAGGCGAA TCCTGGACCG AGACCGATGC TGGCCCCGAA ATTCTGCAAG GTATTGGGCG CATGCATAAA AACTGTTGTA CATCACAAAC GGCATGATGA ACCTGAATCG TATAATATTT GCCCATGGAC GCACACCGTG ATAAGCCTGT TCGGTTCGTA AACTGTAATG CAGAACCTTG ACCGAACGCA GCGGTGGTAA TGACTGTTTT TTTGTACAGT CTATGCCTCG GGGTCGATGT TTGATGTTAT GGAGCAGCAA AGCAGGGCAG TCGCCCTAAA ACAAAGTTAG GTAGGCTCGG CCCTGACCAA GTCAAATCCA AGTTCGGAGA CGTAGCCACC TACTCCCAAC TGCTCCGTAG TAAGACATTC ATCGCGCTTG CTCTCGCGGC TTACGTTCTG CCCAGGTTTG ATCTCGCAGT CTCCGGCGAG CACCGGAGGC TCAAGCATGA GGCCAACGCG CTTGGTGCTT ACGATCCCGC AGTGGCTCTC TATACAAAGT ATATCGACCC AAGTACCGCC ACCTAACAAT AGGGCATGAA GCAGTTCCTT GACGAGAAAÄ GCTGATAAAT GCGCCGGGGC CCTCGCTGCG GGAGTGCCCA ATGTTTCACG TGCCCCTGCT TGAGCGCACC TTCGAGCGTC GTAGCCCGCT TGCCAGTTTG GAAGATGCGG ACGCCGCAGT GGCGGCGCTT GCTCCGAGCG AACGCCGTGC GGACCGTTCT TCCGAGTTCA CCGCCGCAGC TGGGTTTAAC GTTTACCTGG CGGCGGGCAT
CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 CCTTGCCÄAA TTTCGGCGAG AGAATCATGC 120 GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 TTTGCTCACC CACCAAATCC ACAGCACTGG 240 GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 420 CGGGCATGGA CCTGAAGGAG TATTTCCGCG 480 AGAAGATTCG TCGGGGGAGA GGCGGTTTGC 540 ATTCATTAAG CATTCTGCCG ACATGGAAGC 600 CCAGCGGCAT CAGCACCTTG TCGCCTTGCG 660 GAAACGGATG AAGGCACGAA CCCAGTTGAC 720 CAAGTAGCGT ATGCGCTCAC GCAACTGGTC 780 CGGCGCAGTG GCGGTTTTCA TGGCTTGTTA 840 GGCATCCAAG CAGCAAGCGC GTTACGCCGT 900 CGATGTTÄCG CAGCAGCAAC GA7GTTACGC 960 GTGGCTCAAG TATGGGCATC ATTCGCACAT 1020 TGCGGGCTGC TCTTGATCTT TTCGGTCGTG 1080 ATCAGCCGGA CTCCGATTAC CTCGGGAACT 1140 CTGCCTTCGA CCAAGAAGCG GTTGTTGGCG 1200 AGCAGCCGCG TAGTGAGATC TATATCTATG 1260 AGGGCATTGC CACCGCGCTC ATCAATCTCC 1320 ATGTGATCTA CGTGCAAGCA GATTACGGTG 1380 TGGGCATACG GGAAGAAGTG ATGCACTTTG 1440 TCGTTCAAGC CGAGATCGGC TTCCCCGAGC 1500 GCATCAAGCC GGGCTTGCAG ACCTACAAGC 1560 CCCCCGGCCT TCCAATAATG ACAATAATGA 1620 TATTGGTGGT AAGCCTTGTT CAGCATCTGA 1680 GACCGGAGAA GTGGTATCGC GCGTCGCTGC 1740 GGCCGCTGCA CAGGCTGCGT TTCCTGAATG 1800 CCGACTGCTG CGAGCGGCGG ATCTTCTAGA 1860 GAGTGAAACT GGCGCAGCGG GAAACTGGTA 1920 GTTGCGGGGA ATTC 1964 ·· ·· ·· ·· • · • · · • · ··· • · ·
-65·· ·· ·· · . Sekvencia 12
GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 240 GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 420 TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 480 AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGCGAGCAG GGCATGAAGC 540 AGTTCCTTGA CGAGAAAAGC ATCAAGCCGG GCTTGCAGAC CTACAAGCGC TGATAAATGC 600 GCCGGGGCCC TCGCTGCGCC CCCGGCCTTC CAATAATGAC AATAATGAGG AGTGCCCAAT 660 GTTTCACGTG CCCCTGCTTA TTGGTGGTAA GCCTTGTTCA GCATCTGATG AGCGCACCTT 720 CGAGCGTCGT AGCCCGCTGA CCGGAGAAGT GGTATCGCGC GTCGCTGCTG CCAGTTTGGA 780 AGATGCGGAC GCCGCAGTGG CCGCTGCACA GGCTGCGTTT CCTGAATGGG CGGCGCTTGC 840 TCCGAGCGAA CGCCGTGCCC GACTGCTGCG AGCGGCGGAT CTTCTAGAGG ACCGTTCTTC 900 CGAGTTCACC GCCGCAGCGA GTGAAACTGG CGCAGCGGGA AACTGGTATG GGTTTAACGT 960 TTACCTGGCG GCGGGCATGT TGCGGGGAAT TC 992 ·· ··
-66··· • · ·· ·· • · · • · ··· • · · · • · · · • · ··
Sekvencia 13
GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 » AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180
TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 240 GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 * AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360
GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 420 TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 480 TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 540 GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 780 GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 840 CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAÄ 1020 TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GGGGACAGCA AGCGAACCGG 1080 AATTGCCAGC TGGGGCGCCC TCTGGTAAGG TTGGGAAGCC CTGCAAAGTA AACTGGATGG 1140 CTTTCTTGCC GCCAAGGATC TGATGGCGCA GGGGATCAAG ATCTGATCAA GAGACAGGAT 1200 GAGGATCGTT TCGCATGATT GAACAAGATG GATTGCACGC AGGTTCTCCG GCCGCTTGGG 1260 TGGAGAGGCT ATTCGGCTAT GACTGGGCAC AACAGACAAT CGGCTGCTCT GATGCCGCCG 1320 TGTTCCGGCT GTCAGCGCAG GGGCGCCCGG TTCTTTTTGT CAAGACCGAC CTGTCCGGTG 1380 CCCTGAATGA ACTGCAGGAC GAGGCAGCGC GGCTATCGTG GCTGGCCACG ACGGGCGTTC 1440 CTTGCGCAGC TGTGCTCGAC GTTGTCACTG AAGCGGGAAG GGACTGGCTG CTATTGGGCG 1500 AAGTGCCGGG GCAGGATCTC CTGTCATCTC ACCTTGCTCC TGCCGAGAAA GTATCCATCA 1560 TGGCTGATGC AATGCGGCGG CTGCATACGC TTGATCCGGC TACCTGCCCA TTCGACCACC 1620 AAGCGAAACA TCGCATCGAG CGAGCACGTA CTCGGATGGA AGCCGGTCTT GTCGATCAGG 1680 ATGATCTGGA CGAAGAGCAT CAGGGGCTCG CGCCAGCCGA ACTGTTCGCC AGGCTCAAGG 1740 CGCGCATGCC CGACGGCGAG GATCTCGTCG TGACCCATGG CGATGCCTGC TTGCCGAATA 1800 TCATGGTGGA AAATGGCCGC TTTTCTGGAT TCATCGACTG TGGCCGGCTG GGTGTGGCGG 1860 ACCGCTATCA GGACATAGCG TTGGCTACCC GTGATATTGC TGAAGAGCTT GGCGGCGAAT 1920 GGGCTGACCG CTTCCTCGTG CTTTACGGTA TCGCCGCTCC CGATTCGCAG CGCATCGCCT 1980 TCTATCGCCT TCTTGACGAG TTCTTCTGAG CGGGACTCTG GGGTTCGAAA TGACCGACCA 2040 AGCGACGCCC GGCCCAGCGC GTCGATTCGG GCATTTGCCA TATCAATGGA CCGACTGTGC 2100 ATGACGAGGC TCAGATGCCA TTCGGTGGGG TGAAGTCCAG CGGCTACGGC AGCTTCGGCA 2160 ·· ·· • · · · • · · • ··· • · ···· ·· ·· ·· • · · • · ··· • · · · • · · · ·· ··
-67GTCGAGCATC GATTGAGCAC TTTACCCAGC TGCGCTGGCT GACCATTCAG AATGGCCCGC 2220 GGCACTATCC AATCTAAATC GATCTTCGGG CGCCGCGGGC ATCATGCCCG CGGCGCTCGC 2280 CTCATTTCAA TCTCTAACTT GATAAAAACA GAGCTGTTCT CCGGTCTTGG TGGATCAAGG 2340 CCAGTCGCGG AGAGTCTCGA AGAGGAGAGT ACAGTGAACG CCGAGTCCAC ATTGCAACCG 2400 CAGGCATCAT CATGCTCTGC TCAGCCACGC TACCGCAGTG TGTCGATTGG TCATCCTCCG 2460 GTTGAGGTTA CGCAAGACGC TGGAGGTATT GTCCGGATGC GTTCTCTCGA GGCGCTTCTT 2520 CCCTTCCCGG GTGGAATTC 2539 • · • · · • · ·
-68• · · • · ··· • · · · · • · · · · ·· ··
Sekvencia 14
GAATTCCAAT AATGACAATA ATGAGGAGTG TGGTAAGCCT TGTTCAGCAT CTGATGAGCG AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTGCGAGCG GCGGATCTTC TAGAGGACCG • AACTGGCGCA GCGGGAAACT GGTATGGGTT
GGAAGCCGCG GCCATGACCA CACAGATTCA TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGCTCCGGTA ATCCTTGGCG TACGGGCTGT GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGCGGTGGTG GAGCGACTGA TTGCAAATCC GACCCACGTT GGACGGATCA TTGGTGAGCT GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCTGATTGTG ACAGCAGTCG CAGACGCCTT ACTGCGTGCT GGCGATCCTA ATGATCCGCA TGCAGGTCAA CGCATCCAGG TGGGGAGAGG CTGTTGTAAT TCATTAAGCA TTCTGCCGAC CTGAATCGCC AGCGGCATCA GCACCTTGTC ACACCGTGGA AACGGATGAA GGCACGAACC CTGTAATGCA AGTAGCGTAT GCGCTCACGC GGTGGTAACG GCGCAGTGGC GGTTTTCATG ATGCCTCGGG CATCCAAGCA GCAAGCGCGT AGCAGCAACG ATGTTACGCA GCAGCAACGA AAAGTTAGGT GGCTCAAGTA TGGGCATCA? CAAATCCATG CGGGCTGCTC TTGATCTTTT CTCCCAACAT CAGCCGGACT CCGATTACCT CGCGCTTGCT GCCTTCGACC AAGAAGCGGT CAGGTTTGAG CAGCCGCGTA GTGAGATCTA CCGGAGGCAG GGCATTGCCA CCGCGCTCAT TGGTGCTTAT GTGATCTACG TGCAAGCAGA TACAAAGTTG GGCATACGGG AAGAAGTGAT CTAACAATTC GTTCAAGCCG AGATCGGCTT TTTGCCATAT CAATGGACCG ACTGTGCATG AGTCCAGCGG CTACGGCAGC TTCGGCÄGTC
CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 GCTTGCTCCG AGCGAACGCC GTGCCCGACT 240 TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 420 TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 480 TGCGATGCCG TTGGCATGCG GCAATACCGT 540 TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 780 CTTGGACGAT GCCGACCTCG ATGCGGCGGT 840 TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 ATCGGTCTTG GGTTCGTTGA TTGATGCCAÄ 1020 CGGTTTGCGT ATTGGGCGCA TGCATAAAAA 1080 ATGGAAGCCA TCACAAACGG CATGATGAAC 1140 GCCTTGCGTA TAATATTTGC CCATGGACGC 1200 CAGTTGACAT AAGCCTGTTC GGTTCGTAAA 1260 AACTGGTCCA GAACCTTGAC CGAACGCAGC 1320 GCTTGTTATG ACTGTTTTTT TGTACAGTCT 1380 TACGCCGTGG GTCGATGTTT GATGTTATGG 1440 TGTTACGCAG CAGGGCAGTC GCCCTAAAAC 1500 TCGCACATGT AGGCTCGGCC CTGACCAAGT 1560 CGGTCGTGAG TTCGGAGACG TAGCCACCTA 1620 CGGGAACTTG CTCCGTAGTA AGACATTCAT 1680 TGTTGGCGCT CTCGCGGCTT ACGTTCTGCC 1740 TATCTATGAT CTCGCAGTCT CCGGCGAGCA 1800 CAATCTCCTC AAGCATGAGG CCAACGCGCT 1860 TTACGGTGAC GATCCCGCAG TGGCTCTCTA 1920 GCACTTTGAT ATCGACCCAA G7ACCGCCAC 1980 CCCAATTGGC CCAGCGCGTC GATTCGGGCA 2040 ACGAGGCTCA GATGCCATTC GGTGGGGTGA 2100 GAGCATCGAT TGAGCACTTT ACCCAGCTGC 2160
I ·· • · • · • · · · • · · • ··· • · ··· · ·· ·· ·· • · · • · ··· • · · · · • · · · ·· ··
-69GCTGGCTGAC CATTCAGAAT GGCCCGCGGC ACTATCCAAT CTAAATCGAT CTTCGGGCGC 2220 CGCGGGCATC ATGCCCGCGG CGCTCGCCTC ATTTCAATCT CTAACTTGAT AAAAACAGAG 2280 CTGTTCTCCG GTCTTGGTGG ATCAAGGCCA GTCGCGGAGA GTCTCGAAGA GGAGAGTACA 2340 GTGAACGCCG AGTCCACATT GCAACCGCAG GCATCATCAT GCTCTGCTCA GCCACGCTAC 2400 CGCAGTGTGT CGATTGGTCA TCCTCCGGTT GAGGTTACGC AAGACGCTGG AGGTATTGTC 2460 CGGATGCGTT CTCTCGAGGC GCTTCTTCCC TTCCCGGGTG GAATTC 2506 • · • · • · • ·
-70··· · · ···· • · • · • ··· • · « • · « ·· ··
Sekvencia 15
GAATTCCAAT AATGACAATA ATGAGGAGTG TGGTAAGCCT TGTTCAGCAT CTGATGAGCG AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTGCGAGCG GCGGATCTTC TAGAGGACCG AACTGGCGCA GCGGGAAACT GGTATGGGTT GGAAGCCGCG GCCATGACCA CACAGATTCA TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGCTCCGGTA ATCCTTGGCG TACGGGCTGT GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGCGGTGGTG GAGCGACTGA TTGCAAATCC GACCCACGTT GGACGGATCA TTGGTGAGCT GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCTGATTGTG ACAGCAGTCG CAGACGCCTT ACTGCGTGCT GGCGATCCTA ATGATCCGCA TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TTGGCCCAGC GCGTCGATTC GGGCATTTGC GCTCAGATGC CATTCGGTGG GGTGAAGTCC TCGATTGAGC ACTTTACCCA GCTGCGCTGG CCAATCTAAA TCGATCTTCG GGCGCCGCGG AATCTCTAAC TTGATAAAAA CAGAGCTGTT GGAGAGTCTC GAAGAGGAGA GTACAGTGAA ATCATGCTCT GCTCAGCCAC GCTACCGCAG TACGCAAGAC GCTGGAGGTA TTGTCCGGAT GGGTGGAATT C
CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 GCTTGCTCCG AGCGAACGCC GTGCCCGACT 240 TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 420 TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 480 TGCGATGCCG TTGGCATGCG GCAATACCGT 540 TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 780 CTTGGACGAT GCCGACCTCG ATGCGGCGGT 840 TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 TGATGCGCTC GCAAAAGGCG CGCAATGGAÄ 1080 CATATCAATG GACCGACTGT GCATGACGAG 1140 AGCGGCTACG GCAGCTTCGG CAGTCGAGCA 1200 CTGACCATTC AGAATGGCCC GCGGCACTAT 1260 GCATCATGCC CGCGGCGCTC GCCTCATTTC 1320 CTCCGGTCTT GGTGGATCAA GGCCAGTCGC 1380 CGCCGAGTCC ACATTGCAAC CGCAGGCATC 1440 TGTGTCGATT GGTCATCCTC CGGTTGAGGT 1500 GCGTTCTCTC GAGGCGCTTC TTCCCTTCCC 1560
1571
I
-71 ·· ·· • · · · • · · • ··· · • · ···· ·· ·· ·· • · · • · ··· • · · · • · · · ·· ··
Sekvencia 16
GAATTCCGCG GTCGGCGAAA GTTGATGCGC GTGACGAGGC CACACTGTGA GTTGGTCAGG GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT GCCTATCGAC TTAGGGGTAA AGGTCGCTCG ACAAATGGTC GATAGCGTAC TCGCAGGCTC GCTCCCGCGG CACATTGGCT TGTACAGCGG GCAGCGCATT TGCGGCACAG GCTTCGAACT AGGCGCTGAT CACGTGCTGT GTGTCGCGGC GTATACACAC CGGGGCGGGT TCCGCCTCGG GGAGGCATTG TTTGATCCTG CTCCAGGACT GACAGCAAGC GAACCGGAAT TGCCAGCTGG CAAAGTAAAC TGGATGGCTT TCTTGCCGCC TGATCAAGAG ACAGGATGAG GATCGTTTCG TTCTCCGGCC GCTTGGGTGG AGAGGCTATT CTGCTCTGAT GCCGCCGTGT TCCGGCTGTC GACCGACCTG TCCGGTGCCC TGAATGAACT GGCCACGACG GGCGTTCCTT GCGCAGCTGT CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA CGAGAAAGTA TCCATCATGG CTGATGCAAT CTGCCCATTC GACCACCAAG CGAAACATCG CGGTCTTGTC GATCAGGATG ATCTGGACGA GTTCGCCAGG CTCAAGGCGC GCATGCCCGA TGCCTGCTTG CCGAÄTATCA TGGTGGAAAA CCGGCTGGGT GTGGCGGACC GCTATCAGGA AGAGCTTGGC GGCGAATGGG CTGACCGCTT TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TTCGAAATGA CCGACCAAGC GACGCCCATT AGAGATCGTG GCTGTTACGG ATGAACAGTT TGAACTGCCT CGGAAGGCAA AATTGTTGAT TGAAGCCCTT TCCCGATTGA AGCCTGTTCA CTGTGCCGTA GTGGACGGCG CCGCGGCGGC GCCGGTCTTG GCTAGGATAC TGGCTACCTC GCTCGGCCCT GCGCCCGCGA TTCGCCTGCT TATCGACCTC TTTGAGATAA ACGAGGCGCA ATTGGGTATT GAGCACTCAA AACTTAATAT GCTTGCCGCG ACCGGATTGC GTCTCTGCAT
TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 240 TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 420 AGAGTCCATG TCGCGTAACC CCATCGCGTC 480 TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 540 CGACATGATC GCTACCGCAG AAAACCTGGG 600 GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG 660 AAGGATCTGA TGGCGCAGGG GATCAAGATC 720 CATGATTGAA CAAGATGGAT TGCACGCAGG 780 CGGCTATGAC TGGGCACAAC AGACAATCGG 840 AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA 900 GCAGGACGAG GCAGCGCGGC TATCGTGGCT 960 GCTCGACGTT GTCACTGAAG CGGGAAGGGA 1020 GGATCTCCTG TCATCTCACC TTGCTCCTGC 1080 GCGGCGGCTG CATACGCTTG ATCCGGCTAC 1140 CATCGAGCGA GCACGTACTC GGATGGAAGC 1200 AGAGCATCAG GGGCTCGCGC CAGCCGAACT 1260 CGGCGAGGAT CTCGTCGTGA CCCATGGCGA 1320 TGGCCGCTTT TCTGGATTCA TCGACTGTGG 1380 CATAGCGTTG GCTACCCGTG ATATTGCTGA 1440 CCTCGTGCTT TACGGTATCG CCGCTCCCGA 1500 TGACGAGTTC TTCTGAGCGG GACTCTGGGG 1560 GAGGGCGCAA GAGGAGAAAT GGATTGACCA 1620 CGATTTAGAG GGCTACAACA GTCGAGCAAT 1680 CGTGACAGTC ATCCGCGGCC TAGCAGTCTT 1740 TTCTGGCGGG GTGCAGACTG CGGGCAACAG 1800 TTTGGTGGCT CGAGAGTCGT CTGCGACACA 1860 CGTAGTCGGG ATCGAGCCCG AGCATATGGG 1920 GCTTGCGCGT AGTGATCTTA GTTTGAGGGA 1980 GGCCGCCCAA GTTCTAGCGG TACAGCATGA 2040 TTGGGGCGGG GCCATTGCAC TTGGACACCC 2100 GACCCTCGCT CACCAATTGC AAGCTAATAA 2160 • · • · ···· ·· • · • · ··· · ·· ·· ·· • · • · ··· • · · · · • · · · ·· ··
-72CTTTCGATAT
AGAGAATCCC
CTATCCACTG
TCGAAAATCT
TGGCAGAAAG
TCGGGCTGAT
GAATTC
GGAATTGCCT CGGCATGCAT TGGTGGGGGA CAGGGGATGG CGGTTCTTTT 2220 CACTTCGGTT CGTCCTCTGC ACGAAGTTCG ATGATTAACA GAGTTGACCA 2280 AGCTAACGGG CATCTCCTTT GTTGCTTTGA GGTGGCGCAC GAAGGAGGGC 2340 CTGCTAAAAA CAAGAAGAAG GAACAGGGAA CATGATTAGT TTCGCTCGTA 2400 TTTAGGAGTC CAGGCTAAAC TTGCCCTTGC CTTCGCACTC GTATTATGTG 2460 TGTTACCGGC ACGGGTTTCT ACAGTGTACA TACCTTGTCA GGGTTGGTGG 2520
2526 ··
-73·· • · · · • · · • ··· • · ···· ·· ·· ·· ·· • · · · · · • · ··· · · • · · · · · · • · · · · · ·· ·· ·· ·
Sekvencie 17
GAATTCCGCG GTCGGCGAAA GTTGATGCGC GTGACGAGGC CACACTGTGA GTTGGTCAGG GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT GCCTATCGAC TTAGGGGTAA AGGTCGCTCG ACAAATGGTC GATAGCGTAC TCGCAGGCTC GCTCCCGCGG CACATTGGCT TGTACAGCGG GCAGCGCATT TGCGGCACAG GCTTCGAACT AGGCGCTGAT CACGTGCTGT GTGTCGCGGC GTATACACAC CGGGGCGGGT TCCGCCTCGG GGAGGCATTG TTTGATCCTG CTCCAGGACT GGAGAGGCGG TTTGCGTATT GGGCGCATGC TGCCGACATG GAAGCCATCA CAAACGGCAT CCTTGTCGCC TTGCGTATAA TATTTGCCCA ACGAACCCAG TTGACATAAG CCTGTTCGGT CTCACGCAAC TGGTCCAGAA CCTTGACCGA TTTCATGGCT TGTTATGACT GTTTTTTTGT AGCGCGTTAC GCCGTGGGTC GATGTTTGAT GCAACGATGT TACGCAGCAG GGCAGTCGCC GCATCATTCG CACATGTAGG CTCGGCCCTG ATCTTTTCGG TCGTGAGTTC GGAGACGTAG ATTACCTCGG GAACTTGCTC CGTAGTAAGA AAGCGGTTGT TGGCGCTCTC GCGGCTTACG AGATCTATAT CTATGATCTC GCAGTCTCCG CGCTCATCAA TCTCCTCAAG CATGAGGCCA AAGCAGATTA CGGTGACGAT CCCGCAGTGG AAGTGATGCA CTTTGATATC GACCCAAGTA TCGGCTTCCC ATTGAGGGCG CAAGAGGAGA CGGATGAACA GTTCGATTTA GAGGGCTACA CAAAATTGTT GATCGTGACA GTCATCCGCG TGAAGCCTGT TCATTCTGGC GGGGTGCAGA GCGCCGCGGC GGCTTTGGTG GCTCGAGAGT TACTGGCTAC CTCCGTAGTC GGGATCGAGC CGATTCGCCT GCTGCTTGCG CGTAGTGATC TAAACGAGGC GCAGGCCGCC CAAGTTCTAG CAAAACTTAA TATTTGGGGC GGGGCCATTG TGCGTCTCTG CATGACCCTC GCTCACCAAT
TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 240 TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 420 AGAGTCCATG TCGCGTAACC CCATCGCGTC 480 TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 540 CGACATGATC GCTACCGCAG AAAACCTGGG 600 ATAAAAACTG TTGTAATTCA TTAAGCATTC 660 GATGAACCTG AATCGCCAGC GGCATCAGCA 720 TGGACGCACA CCGTGGAAAC GGATGAAGGC 780 TCGTAAACTG TAATGCAAGT AGCGTATGCG 840 ACGCAGCGGT GGTAACGGCG CAGTGGCGGT 900 ACAGTCTATG CCTCGGGCAT CCAAGCAGCA 960 GTTATGGAGC AGCAACGATG TTACGCAGCA 1020 CTAAAACAAA GTTAGGTGGC TCAAGTATGG 1080 ACCAAGTCAA ATCCATGCGG GCTGCTCTTG 1140 CCACCTACTC CCAACATCAG CCGGACTCCG 1200 CATTCATCGC GCTTGCTGCC TTCGACCAAG 1260 TTCTGCCCAG GTTTGAGCAG CCGCGTAGTG 1320 GCGAGCACCG GAGGCAGGGC ATTGCCACCG 1380 ACGCGCTTGG TGCTTATGTG ATCTACGTGC 1440 CTCTCTATAC AAAGTTGGGC ATACGGGAAG 1500 CCGCCACCTA ACAATTCGTT CAAGCCGAGA 1560 AATGGATTGA CCAAGAGATC GTGGCTGTTA 1620 ACAGTCGAGC AATTGAACTG CCTCGGAAGG 1680 GCCTAGCAGT CTTTGAAGCC CTTTCCCGAT 1740 CTGCGGGCAA CAGCTGTGCC GTAGTGGACG 1800 CGTCTGCGAC ACAGCCGGTC TTGGCTAGGA 1860 CCGAGCATAT GGGGCTCGGC CCTGCGCCCG 1920 TTAGTTTGAG GGATATCGAC CTCTTTGAGA 1980 CGGTACAGCA TGAATTGGGT ATTGAGCACT 2040 CACTTGGACA CCCGCTTGCC GCGACCGGAT 2100 TGCAAGCTAA TAACTTTCGA TATGGAATTG 2160
·· • · ···· ··
-74··
CCTCGGCATG CATTGGTGGG GGACAGGGGA TGGCGGTTCT TTTAGAGAAT CCCCACTTCG 2220 GTTCGTCCTC TGCACGAAGT TCGATGATTA ACAGAGTTGA CCACTATCCA CTGAGCTAAC 2280 GGGCATCTCC TTTGTTGCTT TGAGGTGGCG CACGAAGGAG GGCTCGAAAA TCTCTGCTAA 2340 AAACAAGAAG AAGGAACAGG GAACATGATT AGTTTCGCTC GTATGGCAGA AAGTTTAGGA 2400 GTCCAGGCTA AACTTGCCCT TGCCTTCGCA CTCGTATTAT GTGTCGGGCT GATTGTTACC 2460 GGCACGGGTT TCTACAGTGT ACATACCTTG TCAGGGTTGG TGGGAATTC 2509
I ·· ·· • · ·
I · ·
-75• · · · • ··· · · • · · ···· ·· ·· • » • ··· • · · • · · ··
Sekvencia 18
GAATTCCGCG GTCGGCGAAA GTTGATGCGC GTGACGAGGC CACACTGTGA GTTGGTCAGG • GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT
GCCTATCGAC TTAGGGGTAA AGGTCGCTCG ACAAATGGTC GATAGCGTAC TCGCAGGCTC » GCTCCCGCGG CACATTGGCT TGTACAGCGG
GCAGCGCATT TGCGGCACAG GCTTCGAACT AGGCGCTGAT CACGTGCTGT GTGTCGCGGC GTATACACAC CGGGGCGGGT TCCGCCTCGG GGAGGCATTG TTTGATCCTG CTCCAGGACT GCGCATTGAG GGCGCAAGAG GAGAAATGGA AACAGTTCGA TTTAGAGGGC TACAACAGTC TGTTGATCGT GACAGTCATC CGCGGCCTAG CTGTTCATTC TGGCGGGGTG CAGACTGCGG CGGCGGCTTT GGTGGCTCGA GAGTCGTCTG CTACCTCCGT AGTCGGGATC GAGCCCGAGC GCCTGCTGCT TGCGCGTAGT GATCTTAGTT AGGCGCAGGC CGCCCAAGTT CTAGCGGTAC TTAATATTTG GGGCGGGGCC ATTGCACTTG TCTGCATGAC CCTCGCTCAC CAATTGCAAG CATGCATTGG TGGGGGACAG GGGATGGCGG CCTCTGCACG AAGTTCGATG ATTAACAGAG CTCCTTTGTT GCTTTGAGGT GGCGCACGAA GAAGAAGGAA CAGGGAACAT GATTAGTTTC GCTAAACTTG CCCTTGCCTT CGCACTCGTA GGTTTCTACA GTGTACATAC CTTGTCAGGG
TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 240 TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 420 AGAGTCCATG TCGCGTAACC CCATCGCGTC 480 TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 540 CGACATGATC GCTACCGCAG AAAACCTGGC 600 TTGACCAAGA GATCGTGGCT GTTACGGATG 660 GAGCAATTGA ACTGCCTCGG AAGGCAAAAT 720 CAGTCTTTGA AGCCCTTTCC CGATTGAAGC 780 GCAACAGCTG TGCCGTAGTG GACGGCGCCG 840 CGACACAGCC GGTCTTGGCT AGGATACTGG 900 ATATGGGGCT CGGCCCTGCG CCCGCGATTC 960 TGAGGGATAT CGACCTCTTT GAGATAAACG 1020 AGCATGAATT GGGTATTGAG CACTCAAAAC 1080 GACACCCGCT TGCCGCGACC GGATTGCGTC 1140 CTAATAACTT TCGATATGGA ATTGCCTCGG 1200 TTCTTTTAGA GAATCCCCAC TTCGGTTCGT 1260 TTGACCACTA TCCACTGAGC TAACGGGCAT 1320 GGAGGGCTCG AAAATCTCTG CTAAAAACAA 1380 GCTCGTATGG CAGAAAGTTT AGGAGTCCAG 1440 TTATGTGTCG GGCTGATTGT TACCGGCACG 1500 TTGGTGGGAÄ TTC 1543
I
1/3 ·· ·· • · · · • · « • ··· • · ···· ·· ·· ·· ·· • · · · · · • · ··· · · • · · · · · • · · · · · ·· ·· ·· · ca/ÄQKm
Obr. 1a ca/ÄQGm
Obr. 1b ca/ΑΔ
Obr. 1c ca/SQKm
Obr. 1d ca/SQGm
Obr. 1e calBň
Psn
BMTBal 31
Delécia 539 bp
ScoRI
SoAl'/Bal 31 SmaV ýj'-CnKm-Elémen:;·.
SmaV BcAI7Bal3i
V, ecoRi
EeoRI
SoJlITBal 31 Smal
Smal* ΒσΛΓ/Bal 31
BcoRI fcoRI Bgllľ/Bal 31 fcoRI
Delécia 586 bp
Obr. 1f ·· ·· • · · • · ··· • · · · • · · · ·· ··
2/3 ·· ·· • · · · • · · • ··· • · ···· ·· ·· • · · • · • · · • · ·· · fcsQKm
Obr. 1g fcsQGm
Obr. 1h tesá
Obr. 1i ecóQKm
Obr. 1j ecríQGm
Obr. 1k echá o—un· c^jai' 'inkm-Elemenl
Delécia 1290 bp
HcoRI
NnA' Smáľ O
SmäT NnA' O s-TOKm-Element ecoRi
EccRl
NnA'Smaľ
Smáľ NnA'
EeoRl NnA EedK
EccfU
Delécia 483 bp
Obr. 11 ··
3/3
Smal* SssHII· *;.?*ΓΛΚπϊ-εΐβπΐβπΐ*--':-j ||||p ·· ·· • · · · • · · • ··· · • · ···· ·· ·· ·· • · · • · ··· • · · · · • · · · · ·· ·· vďĎQKm
Obr. 1m r
vd/jQGm
Obr. 1n vdhň
Obr. 1o aa/QKm
Obr. 1p aaíQGm
Obr. 1q
t. aatA
SssHII'Smaľ £coRI
Delécia 210 bp £csRi
SssHIľS/nal· _
Smal· SssHII
Sí>'-ÍÍKn»-’Éiemefs £coRl
SssHirSmaľ V
Smaľ SssHII· £cpRI £coRI SssHII £«πι
Delécia 59 bp
Obr. 1r
SK574-2001A 1998-10-31 1999-10-20 Construction of production strains for producing substituted phenols by specifically inactivating genes of the eugenol and ferulic acid catabolism SK5742001A3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19850242A DE19850242A1 (de) 1998-10-31 1998-10-31 Konstruktion von Produktionsstämmen für die Herstellung von substituierten Phenolen durch gezielte Inaktivierung von Genen des Eugenol- und Ferulasäure-Katabolismus
PCT/EP1999/007952 WO2000026355A2 (de) 1998-10-31 1999-10-20 Konstruktion von produktionsstämmen für die herstellung von substituierten phenolen durch gezielte inaktivierungen von genen des eugenol- und ferulasäure-katabolismus

Publications (1)

Publication Number Publication Date
SK5742001A3 true SK5742001A3 (en) 2001-12-03

Family

ID=7886266

Family Applications (1)

Application Number Title Priority Date Filing Date
SK574-2001A SK5742001A3 (en) 1998-10-31 1999-10-20 Construction of production strains for producing substituted phenols by specifically inactivating genes of the eugenol and ferulic acid catabolism

Country Status (14)

Country Link
EP (1) EP1124947A2 (sk)
JP (1) JP2003533166A (sk)
KR (1) KR20020022045A (sk)
CN (1) CN1325444A (sk)
AU (1) AU761093B2 (sk)
BR (1) BR9914930A (sk)
CA (1) CA2348962A1 (sk)
DE (1) DE19850242A1 (sk)
HK (1) HK1041902A1 (sk)
HU (1) HUP0104772A3 (sk)
IL (1) IL142272A0 (sk)
PL (1) PL348647A1 (sk)
SK (1) SK5742001A3 (sk)
WO (1) WO2000026355A2 (sk)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100830691B1 (ko) * 2006-11-21 2008-05-20 광주과학기술원 이소유제놀과 유제놀로부터 천연바닐린과 바닐린 산으로 생전환하는 신규 미생물
WO2012172108A1 (en) 2011-06-17 2012-12-20 Symrise Ag Microorganisms and methods for producing substituted phenols
JP6509215B2 (ja) 2013-07-22 2019-05-08 ビーエーエスエフ ソシエタス・ヨーロピアBasf Se フェルラ酸からのバニリンの迅速かつ高収率な製造のためのシュードモナス・プチダkt2440の遺伝子操作
CN103805640B (zh) * 2014-01-26 2016-04-06 东华大学 一种利用细菌氧化松伯醛制备阿魏酸的方法
EP3000888B1 (en) * 2014-09-29 2018-12-05 Symrise AG Process for converting ferulic acid into vanillin
FR3041655B1 (fr) * 2015-09-29 2017-11-24 Lesaffre & Cie Nouvelles souches bacteriennes pour la production de vanilline
CN111019995B (zh) 2019-12-31 2021-04-27 厦门欧米克生物科技有限公司 一种以丁香酚为底物发酵生成香兰素的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05227980A (ja) * 1992-02-21 1993-09-07 Takasago Internatl Corp 発酵法によるバニリンおよびその関連化合物の製造法
DE4227076A1 (de) * 1992-08-17 1994-02-24 Haarmann & Reimer Gmbh Verfahren zur Herstellung substituierter Methoxyphenole und dafür geeignete Mikroorganismen
GB9606187D0 (en) * 1996-03-23 1996-05-29 Inst Of Food Research Production of vanillin
DE19649655A1 (de) * 1996-11-29 1998-06-04 Haarmann & Reimer Gmbh Syntheseenzyme für die Herstellung von Coniferylalkohol, Coniferylaldehyd, Ferulasäure, Vanillin und Vanillinsäure und deren Verwendung

Also Published As

Publication number Publication date
PL348647A1 (en) 2002-06-03
WO2000026355A3 (de) 2000-11-09
AU1041300A (en) 2000-05-22
BR9914930A (pt) 2001-07-10
HUP0104772A3 (en) 2003-10-28
IL142272A0 (en) 2002-03-10
KR20020022045A (ko) 2002-03-23
HK1041902A1 (zh) 2002-07-26
HUP0104772A2 (hu) 2002-03-28
CN1325444A (zh) 2001-12-05
AU761093B2 (en) 2003-05-29
EP1124947A2 (de) 2001-08-22
WO2000026355A2 (de) 2000-05-11
JP2003533166A (ja) 2003-11-11
CA2348962A1 (en) 2000-05-11
DE19850242A1 (de) 2000-05-04

Similar Documents

Publication Publication Date Title
JP4763017B2 (ja) 遺伝子発現のための多重プロモーターおよびその使用
Bron et al. Protein secretion and possible roles for multiple signal peptidases for precursor processing in bacilli
EP1094111B1 (de) Coryneforme Bakterien mit einer Deletion der Phosphoenolpyruvat-Carboxykinase und ihre Verwendung
US5470719A (en) Modified OmpA signal sequence for enhanced secretion of polypeptides
DE19539952A1 (de) Verfahren zur Herstellung von O-Acetylserin, L-Cystein und L-Cystein-verwandten Produkten
US11278610B2 (en) Glycosylation method
RU2000117837A (ru) Продуцирующие l-лизин коринебактерии и способ получения l-лизина
KR101739128B1 (ko) 재조합 crm197의 고 수준 발현
WO1988009819A2 (en) C. glutamicum threonine biosynthetic pathway
SK5742001A3 (en) Construction of production strains for producing substituted phenols by specifically inactivating genes of the eugenol and ferulic acid catabolism
AU753879B2 (en) Industrial method for producing heterologous proteins in E.coli and strains useful for said method
JPH0838184A (ja) ロドコッカス属細菌由来カナマイシン耐性遺伝子
US20240271084A1 (en) Microorganism strain and method for antibiotic-free plasmid-based fermentation
CN116710471A (zh) 具有减少的细胞运动的突变的宿主细胞
EP3599282B1 (en) Method for the fermentative production of l-lysine
US20040101837A1 (en) Nucleotide sequences coding for proteins involved in the biosynthesis of L-serine, an improved method for the microbial production of L-serine and a genetically modified microorganism suitable therefor
CN113166787A (zh) 使用具有完全或部分缺失的whiB4基因的物种谷氨酸棒杆菌的L-赖氨酸分泌细菌发酵生产L-赖氨酸的方法
CN111471631A (zh) 发酵产生l-赖氨酸的方法
JP2516777B2 (ja) カルボン酸エステルを不斉加水分解する酵素の遺伝子を有する組換え体プラスミド、それにより形質転換された微生物および該微生物による光学活性カルボン酸の製造法
EP3594355A1 (en) Method for the fermentative production of l-lysine
EP1555320B1 (en) Expression system derived from the lipase regulation cascade of Pseudomonas alcaligenes
US20230407361A1 (en) Inducible cell lysis system
MXPA01004338A (en) Construction of production strains for producing substituted phenols by specifically inactivating genes of the eugenol and ferulic acid catabolism
RU2819270C1 (ru) Микроорганизм для продуцирования L-аминокислоты, обладающий повышенной активностью цитохрома С, и способ получения L-аминокислоты с его использованием
WO2000008170A1 (fr) Gene participant a la production d&#39;acide homoglutamique, et utilisation associee