FI107053B

FI107053B - Gene cleavage associated with nogalamycin biosynthesis and its use in the production of hybrid antibiotics

Info

Publication number: FI107053B
Application number: FI982295A
Authority: FI
Inventors: Juha Hakala; Kristiina Ylihonko; Kaisa Palmu; Sirke Torkkell
Original assignee: Galilaeus Oy
Priority date: 1998-10-23
Filing date: 1998-10-23
Publication date: 2001-05-31
Also published as: WO2000024775A1; FI982295A0; FI982295A; JP2002528068A; EP1123310A1; WO2000024775A9

Description

107053107053

Nogalamysiinin biosynteesiin liittyvä geeniryhmittymä ja sen käyttö hybridianti-bioottien tuotossaGene clustering associated with nogalamycin biosynthesis and its use in the production of hybrid antibiotics

Keksinnön ala 5 Tämä keksintö koskee nogalamysiinin biosynteesiin liittyvää, Streptomyces nogalate-rista peräisin olevaa geeniryhmittymää ja sen sisältämien geenien käyttöä uusien hybridiantibioottien valmistamiseksi lääkeaineiden seulontaa varten.FIELD OF THE INVENTION The present invention relates to a gene cluster related to nogalamycin biosynthesis derived from Streptomyces nogalator and the use of genes contained therein for the preparation of novel hybrid antibiotics for drug screening.

10 Keksinnön taustaBackground of the Invention

Antrasykliinit ovat kasvainten vastaisia antibiootteja, joita tuottaa pääasiassa Strepto-mycesA&yi. Antrasykliineistä daunomysiiniperhe on kaupallisesti kaikkein tärkein, koska lähes kaikki niistä suunnilleen kymmenestä antrasykliinistä, jotka ovat nykyään 15 kliinisessä käytössä tai sytotoksisille lääkkeille tehtävissä loppuvaiheen kliinisissä kokeissa, kuuluvat tähän perheeseen. Huolimatta antrasykliinien pitkästä historiasta, noin kolme vuosikymmentä, niiden biosynteesitutkimukset ovat edelleen meneillään, ja on edelleen olemassa kiinnostusta löytää uusia molekyylejä kemoterapeuttisten aineiden kehittämiseksi syövän hoitoon. Geenitekniikkaa käytetään nykyisin etsittäessä 20 uusia molekyylejä lääkeaineseulontaa varten. Antrasykliinibiosynteesin geenien kloonaaminen helpottaa hybridiantrasykliinien tuottoa, samoin kuin niiden käyttöä kombinatorisessa biosynteesissä uusien molekyylien luomiseksi.Anthracyclines are anti-tumor antibiotics produced mainly by Strepto-mycesA & yi. Of the anthracyclines, the daunomycin family is the most important commercially, since almost all of the approximately 10 anthracyclines currently in clinical use or in end-stage clinical trials on cytotoxic drugs belong to this family. Despite the long history of anthracyclines for about three decades, their biosynthesis studies are still ongoing, and there is still interest in finding new molecules for the development of chemotherapeutic agents for the treatment of cancer. Gene technology is currently being used to search for 20 new molecules for drug screening. Cloning of genes for anthracycline biosynthesis facilitates the production of hybrid anthracyclines as well as their use in combinatorial biosynthesis to generate new molecules.

• r• r

Nogalamysiini, jonka Bhuyan and Dietz ensimmäisinä kuvasivat vuonna 1965, on 25 Streptomyces nogalaterin tuottama antrasykliiniantibiootti. Tämä yhdiste on erittäin aktiivinen kasvainsoluja vastaan, mutta toisaalta sen toksiset ominaisuudet ovat estäneet sen etenemisen kliinisiin kokeisiin (Bhuyan ja Smith, 1975). Menogariili (7- O-metyylinogaroli) on nogalamysiinin puolisynteettinen johdannainen, ja sen arvoa syövän hoidossa on tutkittu (esim. Yoshida et ai, 1996), kiinnostusta esiintyy tällä 30 hetkellä pääasiassa Japanissa. Rakenteeltaan nogalamysiini (Kuva 1) eroaa useimmista muista antrasykliineistä, kuten esimerkiksi daunomysiiniperheestä, kahden huomionarvoisen piirteen suhteen: (i) Sen stereokemia asemassa 9 on päinvastainen ja (ii) sen 107053 2 sokeriosa, nogalamiini, on kiinnittynyt 1-asemaan tyypillisellä glykosidisidoksella ja lisäksi 2-hiileen C-C-sidoksella. Wiley et ai. esittivät nogalamysiinin rakenneselvityk-sen v. 1977. Edelleen Wiley et ai julkaisivat vuonna 1978 nogalamysiinin biosynteet-tisiä tutkimuksia, joissa esitettiin tietoa sen rakenneosista: Aglykoniosa on rakentunut 5 kymmenestä asetaatista; neutraalisokeri, nogaloosi, on peräisin glukoosista; ja kummankin sokerin, nogalamiinin ja nogaloosin metyyliryhmät ovat muuttuneet me-tioniinista. Wiley ei ratkaissut selkeästi nogalamiinin alkuperää, mutta todennäköisimmin nogalamiini on myös peräisin glukoosista.Nogalamycin, first described by Bhuyan and Dietz in 1965, is an anthracycline antibiotic produced by 25 Streptomyces nogalateri. This compound is highly active against tumor cells, but on the other hand its toxic properties have prevented it from progressing into clinical trials (Bhuyan and Smith, 1975). Menogaryl (7-O-methylnogarol) is a semisynthetic derivative of nogalamycin, and its value in cancer treatment has been studied (e.g., Yoshida et al., 1996), currently of interest mainly in Japan. The structure of nogalamycin (Figure 1) differs from most other anthracyclines, such as the daunomycin family, in two important aspects: (i) its stereochemistry at position 9 is reversed and (ii) its 107053 2 sugar moiety, nogalamine, is attached at position 1 with a typical glycosidic bond carbon with a CC bond. Wiley et al. further presented a study on the structure of nogalamycin in 1977. Further, in 1978, Wiley et al. published biosynthetic studies of nogalamycin, which provided information on its constituents: the Aglycon moiety is composed of 5 of the ten acetates; neutral sugar, Nogalose, derived from glucose; and the methyl groups of both sugars, nogalamine and nogalose have been changed from methionine. Wiley did not clearly determine the origin of the Nogalamine, but most probably the Nogalamine is also derived from glucose.

10 Antrasykliinien biosynteesigeenien molekulaarinen kloonaus on helpottanut molekyyligenetiikan tutkimuksia, antaen työkaluja rakenteiden rationaalisiin muunnoksiin, samalla kun on saatu aikaan yllättäviä yhdistelmiä muiden antibioottien kanssa. Suurin mielenkiinto on kohdistunut daunomysiinin biosynteesigeeneihin, kuten on raportoitu useissa julkaisuissa (Lomovskaya et ai., 1998; Rajgarhia ja Strohl, 1997 ja siinä 15 esitetyt viitteet). Samoin on kloonattu joitakin aklasinomysiinin biosynteesigeenejä S. galilaeuksesta (Fujii ja Ebizuka, 1997) ja rodomysiinin biosynteesigeenejä S. purpurascensista (Niemi et ai, 1994). Olemme kloonanneet nogalamysiinin biosyn-teesigeenit, ja käyttäneet kyseisiä geenejä menestyksellisesti hybridiantrasykliinien tuotossa. Useimmat geenit liittyvät polyketidireittiin, ja ne ovat vastuussa trisyklisen 20 välituotteen muodostumisesta, ja niistä on raportoitu julkaisuissa Ylihonko et ai., . 1996a ja b, sekä Torkkell et ai., 1997. Huolimatta molekulaarisessa kloonauksessa saavutetuista edistysaskeleista, antrasykliineistä havaittu glukoosin biosynteettinen reitti sokereiksi on yhä pääasiassa hypoteettinen.Molecular cloning of anthracycline biosynthetic genes has facilitated molecular genetics studies, providing tools for rational structural alterations while providing surprising combinations with other antibiotics. Of particular interest has been the daunomycin biosynthetic genes as reported in several publications (Lomovskaya et al., 1998; Rajgarhia and Strohl, 1997 and references cited therein). Similarly, some aclasinomycin biosynthesis genes from S. galilae (Fujii and Ebizuka, 1997) and rhodomycin biosynthesis genes from S. purpurascens (Niemi et al, 1994) have been cloned. We have cloned the biosynthesis genes of nogalamycin and have used these genes successfully in the production of hybrid anthracyclines. Most genes are related to the polyketide pathway and are responsible for the formation of the tricyclic intermediate and have been reported in Ylihonko et al.,. 1996a and b, and Torkkell et al., 1997. Despite advances in molecular cloning, the glucose biosynthetic pathway observed for anthracyclines is still mainly hypothetical.

25 Mitä tulee deoksiheksoosireitin geeneihin, Madduri et ai. (1998) ovat raportoineet, : että eräs avermektiinin biosynteesiryhmittymästä peräisin oleva geeni aiheutti hybridiantrasykliinien tuoton, kun se erääseen S. peucetiuksen mutanttiin siirrettäessä muutti sokeritähteen. Saatu tuote oli epirubisiini, kaupallisesti tärkeä antrasykliini. Tässä tapauksessa daunosamiiniosassa olevalla hydroksiryhmällä oli päinvastainen 30 stereokemia, minkä sai aikaan avermektiinin biosynteesigeeni. S. galilaeusta on käytetty isäntänä hybridiantrasykliinien valmistamiseksi käyttäen S. purpurascensin 3 107053 rodomysiinireitistä peräisin olevia geenejä (Niemi et ai., 1994), ja S. nogalaterin nogalamysiinin biosynteesiryhmittymästä peräisin olevia geenejä (Ylihonko et ai., 1996a). Nogalamysiinireitin geenejä käytettiin generoimaan hybridiantrasykliinien tuottoa S. steffisburgensisissa, joka tuottaa tyypillisesti steffimysiiniä (Kunnari et ai., 5 1997). Aikaisemmin aktinorodiinin biosynteesigeenejä on ilmennetty S. galilaeukses- sa, mikä johti aloesaponariinin tuotantoon (Strohl et ai., 1991). Näissä hybridiyhdis-teissä aglykonitähde oli muuntunut.25 Regarding genes in the deoxyhexose pathway, Madduri et al. (1998) reported that a gene from the avermectin biosynthetic cluster caused the production of hybrid anthracyclines when it altered the sugar residue upon transfer to a mutant of S. peucetius. The product obtained was epirubicin, a commercially important anthracycline. In this case, the hydroxy group on the daunosamine moiety had the opposite stereochemistry provided by the avermectin biosynthetic gene. S. galilaeus has been used as a host for the preparation of hybrid anthracyclines using genes derived from the S. purpurascens 3,107053 rhodomycin pathway (Niemi et al., 1994), and genes from the S. nogalaterin nogalamycin biosynthesis cluster (Ylihonko et al., 1996a). The genes of the nogalamycin pathway were used to generate the production of hybrid anthracyclines in S. steffisburgensis, which typically produces steffimycin (Kunnari et al., 5 1997). Previously, actinorodine biosynthetic genes have been expressed in S. galilaeus, leading to aloesaponarin production (Strohl et al., 1991). In these hybrid compounds, the aglycon residue had been modified.

Keksinnön yhteenveto 10 Tämä keksintö koskee Streptomyces nogalaterin geeniryhmittymää, jossa suurin osa geeneistä on peräisin nogalamiinin ja nogaloosin deoksiheksoosireitistä. Kun mainitun alueen sisältämä DNA-jakso ilmennetään S. galilaeuksessa, joka tuottaa aklasino-mysiinejä, saadaan hybridiantrasykliinejä, joissa aglykoniosa on peräisin S. galilaeuk-15 s estä, kun taas sokeriosa ei ole luonteenomainen S. nogalaterille eikä myöskään S.SUMMARY OF THE INVENTION This invention relates to a gene cluster of Streptomyces nogalateri, where most of the genes are derived from the deoxyhexose pathway of nogalamine and nogalose. Expression of the DNA sequence contained in said region in S. galilaeus, which produces aclasino mycins, results in hybrid anthracyclines in which the aglycon moiety is derived from S. galilaeuk-15 s, while the sugar moiety is neither characteristic of S. nogalater nor S.

galilaeukselle. Kun mainittuun ryhmittymään sisältyvä, nogalamysiinin syklaasia koodaava geeni edelleen viedään sopivaan plasmidikonstruktioon, saadaan nogala-mysinoni, joka on nogalamysiinin aglykoni. Koska nogalamysiinin stereokemia eroaa useimmista muista antrasykliineistä, tätä geeniä käyttämällä on mahdollista valmistaa 20 antrasykliinimolekyylien C-9-stereoisomeereja.Galilaeus. Further introduction of the gene encoding nogalamycin cyclase into said cluster into a suitable plasmid construct yields nogalamycinone, which is the aglycon of nogalamycin. Because the stereochemistry of nogalamycin differs from most other anthracyclines, it is possible to produce C-9 stereoisomers of anthracycline molecules using this gene.

• *• *

Keksinnön yksityiskohtainen kuvaus Tässä keksinnössä käytetyt koemenetelmät ovat alalla tavanomaisia. Sellaiset teknii-25 kat, joita ei tässä ole kuvattu yksityiskohtaisesti, on kuvattu käsikirjoissa Hopwood et - ai., "Genetic manipulation of Streptomyces: a laboratory manual" The John InnesDETAILED DESCRIPTION OF THE INVENTION The test methods used in the present invention are conventional in the art. Techniques not specifically described herein are described in Hopwood et al., "Genetic Manipulation of Streptomyces: A Laboratory Manual" by The John Innes

Foundation, Norwich (1985) ja Sambrook et al. (1989) "Molecular cloning: a laboratory manual". Tässä viitattujen julkaisujen, patenttien ja patenttihakemusten täydelliset tiedot on annettu viitejulkaisulistassa.Foundation, Norwich (1985) and Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual. The full details of the publications, patents and patent applications cited herein are provided in the list of references.

30 107053 4 Tämä keksintö koskee erityisesti nogalamysiinin biosynteesiin liittyvää geeniryhmit-tymää (5«o5-klusteri), jonka avulla voidaan tuottaa hybridiantibiootteja, joiden sokeri-osa on muunnettu. Aivan erityisesti keksintö koskee nogalamiinin/nogaloosin biosynteesiin liittyvien geenien käyttöä sokeriosastaan muunnettujen hybridiantibioottien 5 tuottamiseksi. Keksintö koskee myös keksinnön mukaiseen geeniryhmittymään sisältyvän spesifisen syklaasigeenin käyttöä tyypillisten antrasykliinien C-9-stereo-isomeerien valmistamiseksi.This invention relates in particular to a gene cluster (5 to 5 clusters) involved in the biosynthesis of nogalamycin, which is capable of producing hybrid antibiotics with a modified sugar moiety. More particularly, the invention relates to the use of genes related to nogalamine / nogalose biosynthesis for the production of hybrid antibiotics modified from the sugar moiety. The invention also relates to the use of a specific cyclase gene contained in a gene cluster according to the invention for the preparation of C-9 stereoisomers of typical anthracyclines.

Tämän keksinnön mukainen geeniryhmittymä on kytkeytynyt aikaisemmin raportoi-10 tuihin nogalamysiinin biosynteesiin liittyviin ryhmittymiin. Tämän keksinnön lähtökohta oli nogalamysiinikromoforiin liittyvä geeniryhmittymä (kansainvälinen patenttihakemus WO 96/10581). Tämän jälkeen löysimme joitakin nogalamysiinin biosynteesin deoksiheksoosireittiin liittyviä geenejä (Torkkell et ai., 1997), ja osaa mainitut geenit sisältävästä fragmentista käytettiin kloonattaessa tämän keksinnön mukaisia 15 geenejä.The gene cluster of the present invention is linked to previously reported clusters of nogalamycin biosynthesis. The starting point for this invention was a gene cluster related to nogalamycin chromophore (International Patent Application WO 96/10581). Subsequently, we found some genes associated with the deoxyhexose pathway in nogalamycin biosynthesis (Torkkell et al., 1997), and part of the fragment containing the said genes was used to clone the genes of this invention.

Nogalamysiinin biosynteesiin liittyvät geenit voidaan eristää Sire/tfo/nym-lajeista, erityisesti S. nogalaterista, joka tuottaa nogalamysiiniä. Voidaan myös käyttää sellaisia lajeja, jotka tuottavat nogalamysiinin kaltaisia antrasykliinejä, esim. S.The genes involved in nogalamycin biosynthesis can be isolated from Sire / tfo / nym species, particularly S. nogalater, which produces nogalamycin. Species that produce nogalamycin-like anthracyclines, e.g., S., may also be used.

20 violaceochromogenesiä, joka tuottaa arugomysiiniä (Kawai et ai., 1987), tai S. avi-, diniita, joka tuottaa avidinorubisiinia (Aoki et ai., 1991).20 violaceochromogenesis that produce arugomycin (Kawai et al., 1987), or S. avi, diniit, which produces avidinorubicin (Aoki et al., 1991).

Genomikirjaston valmistuksessa käytetään nogalamysiinin biosynteesiin liittyvät geenit sisältävän Streptomyces-kannan genomista DNA:ta. Kloonaukseen sopivat geeni-25 fragmentit voidaan saada millä tahansa tiheästi katkaisevalla restriktioentsyymillä.The genomic library is prepared using genomic DNA of a Streptomyces strain containing genes related to nogalamycin biosynthesis. Gene fragments suitable for cloning can be obtained by any of the densely cleaving restriction enzymes.

Tyypillisesti käytetään &zw3AI:tä. Eristetyt fragmentit voitaisiin viedä ligoimalla mihin tahansa Escherichia coli -vektoriin, kuten plasmidiin, fagemidiin, faagiin tai kosmidiin. Kosmidivektori on suositeltava, koska sen avulla voidaan kloonata suuria DNA-fragmentteja. Tähän tarkoitukseen on sopiva sellainen kosmidivektori kuin 30 pFD666 (ATCC n:o 77286), koska sen avulla voidaan kloonata noin 40 kb fragmentteja. Kloonaamiseen voidaan käyttää pFD666:n fiamHI-kohtaa, jolla saadaan kohesii- 107053 5 viset päät Sa«3AI-fragmentteihin. Kaupallisesti saatavissa olevia kittejä voidaan käyttää DNA:n pakkaamiseksi faagipartikkeleihin. Erilaisia E. coli -kantoja voidaan käyttää pakatulla DNA: 11a infektoimiseen. Sopiva E. coli -kanta on esimerkiksi XLIBlue MRF’, josta puuttuu useita restriktiosysteemeitä.Typically & zw3AI is used. Isolated fragments could be introduced by ligation into any Escherichia coli vector, such as a plasmid, phagemid, phage or cosmid. The cosmid vector is recommended because it can be used to clone large DNA fragments. A cosmid vector such as 30 pFD666 (ATCC No. 77286) is suitable for this purpose since it can clone fragments of about 40 kb. The fiamHI site of pFD666 can be used for cloning, which yields the cohesive ends of 107053 to Sa3AI fragments. Commercially available kits can be used to package DNA into phage particles. Various E. coli strains can be used to infect packaged DNA. A suitable E. coli strain is, for example, XLIBlue MRF ', which lacks several restriction systems.

55

Kun E. colia käytetään isäntäkantana genomikirjastoa varten, hybridisaatio on edullinen seulontastrategia. Hybridisaatiokoettimena voidaan käyttää mitä tahansa tunnettua nogalamysiinin geeniryhmittymästä peräisin olevaa fragmenttia, mutta suositeltava on lyhyt, noin 1 kb fragmentti, joka on peräisin aikaisemmin kloonatun 10 biosynteettisen alueen toisesta päästä. Genomikirjastoa varten saadut pesäkkeet siirretään suodatinhybridisaatiota varten membraaneille, edullisesti nailonmembraa-neille. Koska genomisen DNA-fragmentin keskimääräinen koko on 40 kb, 2300 pesäkettä antoi 99,99 % :n todennäköisyyden laajennetun nogalamysiinibiosynteesi-alueen löytämiseksi. Mitä tahansa hybridisaatiomenetelmää voidaan käyttää, mutta 15 erityisen käyttökelpoinen on DIG-järjestelmä (Boehringer Mannheim GmbH, Saksa). Koska koetin on homologinen hybridisoidulle DNA:lie, on edullista suorittaa hybri-disaation rajoittavat pesut 70 °C:ssa alhaisessa suolakonsentraatiossa Boehringer Mannheimin käsikirjan "DIG System User's Guide for Filter Hybridization" mukaisesti. Todennäköisesti ainakin 80% :n homologia tarvitaan, jotta DNA sitoutuu 20 koettimeen pesussa käytetyissä olosuhteissa.When E. coli is used as a host strain for a genomic library, hybridization is a preferred screening strategy. Any known fragment derived from the nogalamycin gene cluster can be used as the hybridization probe, but a short fragment of about 1 kb from the other end of the previously cloned biosynthetic region is preferred. The colonies obtained for the genomic library are transferred to membranes, preferably nylon membranes, for filter hybridization. Because the average size of the genomic DNA fragment is 40 kb, 2300 colonies gave a 99.99% probability of finding an expanded region of nogalamycin biosynthesis. Any hybridization method can be used, but the DIG system (Boehringer Mannheim GmbH, Germany) is particularly useful. Because the probe is homologous to the hybridized DNA, it is preferable to perform hybridization limiting washes at 70 ° C at low salt concentration according to Boehringer Mannheim's "DIG System User's Guide for Filter Hybridization". Probably at least 80% homology is required for DNA binding to 20 probes under the washing conditions.

Kun käytettiin tätä menettelytapaa, seitsemän kloonia noin 5000:sta antoi positiivisen signaalin, ja ne otettiin erilleen DNA:n eristämistä varten. Positiiviset kloonit voidaan katkaista sopivilla restriktioentsyymeillä DNA-fragmenttien fysikaalisen kytkentäkar-25 tan osoittamiseksi. Kloonaukseen käytetty kosmidi oli kuljetinkosmidi, joka replikoi-tuu sekä E. colissa että Streptomyces-\&)eissdi. Rekombinanttikosmidien siirtäminen S. lividans TK24:ään, joka on tyypillinen Streptomycesin kloonauksessa käytetty laboratoriokanta, johti kuitenkin deleetioihin, ja tämä lähestymistapa hylättiin. Sen sijaan käytimme ekspressiotutkimuksissa mieluummin plasmidia pIJ486, joka on 30 voimakkaasti kopioituva Äre/tfomyces-plasmidi. Tähän tarkoitukseen voidaan kuiten- 107053 6 kin käyttää mitä tahansa plasmidia, joka kykenee stabiilisti replikoituinaan Streptomy-cesissä.Using this procedure, seven of the approximately 5,000 clones gave a positive signal and were isolated for DNA isolation. Positive clones can be cleaved with appropriate restriction enzymes to demonstrate the physical linkage of DNA fragments. The cosmid used for cloning was a transporter cosmid which replicates in both E. coli and Streptomyces - > eissdi. However, transfer of recombinant cosmids to S. lividans TK24, a typical laboratory strain used in cloning of Streptomyces, led to deletions and this approach was rejected. Instead, we used plasmid pIJ486, which is a highly transcriptional Äre / tfomyces plasmid, for expression studies. However, any plasmid capable of stably replicating in Streptomyces can be used for this purpose.

Yhdestä kloonista vietiin erikseen kaksi £g/II-fragmenttia pIJ486-vektoreihin, ja kaksi 5 saatua plasmidia siirrettiin ensisijaiseen isäntään, S. lividans TK24:ään. Saadut rekom-binanttiplasmidit (pSY42 ja pSY43), jotka sisälsivät 10 kb ja vastaavasti 7kb fragmentin S. nogalaterin genomisesta DNA:sta, eristettiin ensisijaisesta isännästä ja vietiin edelleen muihin StreptomycesA^ioMn protoplastitransformaatiolla. Rekombinantti-plasmidi, joka sisälsi 10 kb fragmentin, sai aikaan hybridiantrasykliinien tuoton S.From one clone, two γ g / II fragments were separately introduced into pIJ486 vectors, and two of the resulting plasmids were transferred to the primary host, S. lividans TK24. The resulting recombinant plasmids (pSY42 and pSY43) containing the 10 kb and 7kb fragments of S. nogalater genomic DNA, respectively, were isolated from the primary host and further introduced into other StreptomycesA110M protoplast transformations. A recombinant plasmid containing the 10 kb fragment induced production of hybrid anthracyclines by S.

10 galilaeus -mutanttikannassa H039, joka luontaisesti tuottaa aklavinoni-rodinoosi- rodinoosi-rodinoosia. Transformaatiossa käytettiin muutamia muita S. galilaeus -kantoja (H075, H026, H063), joiden deoksiheksoosireitti oli mutatoitu aklasinomysiinin sokereiden muuttamiseksi, ja saatiin uusia hybridiyhdisteitä. Koska nogalamysiinin rakenne on lähes ainutlaatuinen antrasykliinien joukossa, plasmidit voitiin siirtää 15 muihin antrasykliinejä tuottaviin kantoihin, kuten S. peucetiukseen, joka tuottaa daunomysiiniä, ja S. purpurascensiin, joka tuottaa rodomysiinejä, luonteenomaisten antibioottien rakenteiden muuttamiseksi.10 galilaeus mutant strain H039, which naturally produces aclavinone-rhodinose-rhodinosis-rhodinosis. A few other S. galilaeus strains (H075, H026, H063) whose deoxyhexose pathway had been mutated to alter aclasinomycin sugars were used for transformation and new hybrid compounds were obtained. Because the structure of nogalamycin is almost unique among anthracyclines, plasmids could be transferred to other anthracycline-producing strains, such as S. peucetius, which produces daunomycin, and S. purpurascens, which produces rhodomycins, to alter the structures of the characteristic antibiotics.

Koska kloonattu ryhmittymä oli liittynyt aiemmin tunnettuun nogalamysiinin biosyn-20 teesialueeseen, sen kyky aikaansaada muutos sokeriosassa osoitti, että läsnä saattaa olla deoksiheksoos heitin geenejä. Sekvensointi on kuitenkin välttämätöntä geenien toiminnan määrittämiseksi kloonatussa ryhmittymässä. 10 kb ja 7 kb DNA-fragmentit vietiin edelleen plasmidiin pSLl 190 alakloonausta varten. Sellaisia sekvensointistrate-gioita kuin esim. DNA-fragmentin asteittaista deletointia, fragmenttien satunnaista 25 kloonausta tai sekvensointia spesifisillä alukkeilla voidaan käyttää, mutta sekvensointia ; varten suosittelemme alakloonien valmistusta tunnetuista restriktiokohdista. ABIBecause the cloned cluster was linked to a previously known region of nogalamycin biosynthesis, its ability to effect a change in the sugar moiety indicated that deoxyhexose-throwing genes may be present. However, sequencing is necessary to determine the function of genes in a cloned cluster. The 10 kb and 7 kb DNA fragments were further introduced into pSL1 190 for subcloning. Sequencing strategies such as gradual deletion of a DNA fragment, random cloning of fragments, or sequencing with specific primers can be used, but sequencing; for this purpose, we recommend making subclones from known restriction sites. ABI

PRISM -järjestelmällä (Perkin-Elmer) sekvensointia varten on mahdollista saada 500 -700 emästä yhtä reaktiota kohti, mikä tarkoittaa, että sekvensointia varten tarvitaan , noin 1 kb:n kokoisia fragmentteja, joissa on päällekkäin meneviä emäksiä: Tätä 30 tarkoitusta varten konstruoitiin 27 alakloonia.With the PRISM system (Perkin-Elmer), 500 to 700 bases per reaction can be obtained for sequencing, which means that approximately 1 kb of overlapping bases are required for sequencing: 27 subclones were constructed for this purpose. .

107053 7107053 7

Kun sekvensoitiin viereiset J3g/II-fragmentit, jotka koostuivat noin 16000 emäsparista, saatiin 15 täydellistä ORF:ia. Sekvenssianalyysi voidaan tehdä millä tahansa tietokonepohjaisella ohjelmalla, kuten GCG-pakkauksella (Madison, Wisconsin, USA).Sequencing of adjacent J3g / II fragments consisting of about 16,000 base pairs yielded 15 complete ORFs. Sequence analysis can be performed using any computer-based program such as GCG (Madison, Wisconsin, USA).

Tämän keksinnön mukaisesti otaksutut, kirjastoissa saatavilla olevien sekvenssien 5 homologian perusteella päätellyt geenifunktiot ovat aminotransferaasi (snogT), ei täydellinen 1. dTDP-glukoosisyntetaasi (snogi) 2. aminometyylitransferaasi (snogA) 3. polyketidisyklaasi (s/zoaM) 10 4. deoksiheksoosireitin geeni, tuntematon (snogN) 5. hydroksylaasi, (snoaG) 6. dTDP-4-dehydroramnoosireduktaasi (snogC) 7. dTDP-glukoosi-4,6-dehydrataasi (snogK) 8. NAME-syklaasi (snoaL) 15 9. tuntematon (jtzöK) 10. glykosyylitransferaasi, GTF (snogD) 11. tuntematon (snoW) 12. glykosyylitransferaasi, GTF (swogE) 13. tuntematon (snoL) 20 14. tuntematon (snoO) 15. C-7 ketoreduktaasi (s«oaF) tuntematon (snoN), ei täydellinenGene functions implied by the homology of sequences available in libraries according to the present invention are aminotransferase (snogT), not complete 1. dTDP-glucose synthetase (snog) 2. aminomethyltransferase (snogA) 3. polyketide dicyclase (s / zoaM) 10 4. deoxyhex unknown (snogN) 5. hydroxylase, (snoaG) 6. dTDP-4-dehydroramnose reductase (snogC) 7. dTDP-glucose-4,6-dehydratase (snogK) 8. NAME-cyclase (snoaL) 15 9. unknown (jtzöK) 10. glycosyltransferase, GTF (snogD) 11. unknown (snoW) 12. glycosyltransferase, GTF (swogE) 13. unknown (snoL) 20. 14. unknown (snoO) 15. C-7 ketoreductase (s? OF) unknown (snoN) , not perfect

Geenien nimet: g tarkoittaa, että geeni osallistui glykosidiosan biosynteesiin, mm.Gene names: g means that the gene was involved in the biosynthesis of the glycosidic moiety, e.g.

25 glykosyylitransferaasit, kun taas a tarkoittaa, että geeniä tarvitaan aglykoniosan muodostamisessa.25 glycosyltransferases, whereas a means that the gene is required for the formation of the aglycone moiety.

««

Ottaen huomioon kuvassa 3 esitetyn, nogalamysUnille ehdotetun biosynteesireitin kykenemme identifioiduilla geeneillä, mm. snoaL:lla, joka vastaa aglykoniosan 30 neljännen renkaan syklisoitumisesta, saamaan aikaan useita muutoksia antibioottien rakenteisiin, ja samalla määräämään antrasyklinonin stereokemian, ja geeneillä, jotka 107053 8 vaikuttavat nogalamiinin ja nogaloosin muodostumiseen (snogJ, snogK, snogN, snogC, snogA), ja lisäksi geeneillä, jotka vastaavat sokeritähteiden kiinnittämisestä aglykoniosaan (snogD ja snogE).Given the biosynthetic pathway suggested for nogalamysUn in Figure 3, our ability to identify genes, e.g. snoaL, which is responsible for the cyclization of the fourth ring of the aglycon moiety, to effect multiple alterations in the structures of the antibiotics, while defining the anthracyclinone stereochemistry, and with the genes involved in the production of nogalamine and nogalose (snogJ, snogK, snogN, snog, genes responsible for attaching sugar residues to the aglycone moiety (snogD and snogE).

5 Nämä geenit voitiin erikseen viedä vektoriin käyttämällä sopivia restriktiokohtia, tai monistamalla geenejä PCR:llä. Fragmentit voivat sisältää sisäisen promoottorin, tai promoottori voidaan kloonata erikseen. On edullista käyttää vektoria, jossa on promoottori, joka saa aikaan geenien ekspression Streptomyces-kannassa. Plasmidi pIJE486 sisältää erytromysiiniresistenssigeenin promoottorin ermE, mikä mahdollistaa 10 oikeassa orientaatiossa liitettyjen geenien konstitutiivisen ilmentymisen. Erityistä huomiota on kiinnitetty geeniin, joka koodaa alifaattisen renkaan syklaasia, mutta mikä tahansa mainitun-ryhmittymän geeni voidaan ilmentää Streptomyces-isännissä. Mainittu syklaasi muuntaa auramysinonin C9:n stereokemiaa TK24-kannassa, jos se viedään plasmidiin, jossa on muita auramysinonin biosynteesigeenejä, lukuunottamatta 15 antrasykliinien tyypillisestä stereokemiasta vastaavaa syklaasia.These genes could be introduced separately into the vector using appropriate restriction sites, or amplified by PCR. The fragments may contain an internal promoter, or the promoter may be cloned separately. It is preferable to use a vector containing a promoter that causes gene expression in the Streptomyces strain. Plasmid pIJE486 contains the ermE promoter of the erythromycin resistance gene, which allows constitutive expression of 10 genes linked in the correct orientation. Particular attention has been paid to the gene encoding aliphatic ring cyclase, but any gene of said cluster can be expressed in Streptomyces hosts. Said cyclase will convert the stereochemistry of auramycinone C9 in the TK24 strain if introduced into a plasmid carrying other auramycinone biosynthetic genes, except for the cyclase corresponding to the typical stereochemistry of anthracyclines.

Rekombinanttiplasmidit sisältäviä Streptomyces-kantoja., erityisesti S. galilaeusta, kasvatetaan alustoissa, joissa syntyy antibiootteja. Hybridiyhdisteet uutetaan orgaanisilla liuottimilla viljelyalustasta, ja yhdisteet erotetaan ja puhdistetaan käyttäen 20 kromatografiatekniikoita.Strains of Streptomyces containing recombinant plasmids, especially S. galilaeus, are grown in media that produce antibiotics. The hybrid compounds are extracted with organic solvents from the culture medium and the compounds are separated and purified using chromatographic techniques.

Tämän keksinnön mukaisesti S. galilaeus H039, jossa on plasmidi pSY42, ja jolle annettiin nimi H039/pSY42, tuottaa aklavinoni-4’-epi-2-deoksifukoosia El-alustassa, jota on täydennetty tiostreptonilla, jotta saataisiin aikaan valintapaine plasmidin 25 sisältäville kannoille.In accordance with the present invention, S. galilaeus H039 bearing the plasmid pSY42, designated H039 / pSY42, produces aclavinone-4'-epi-2-deoxifucose in E1 medium supplemented with thiostrepton to exert selection pressure on plasmid-containing strains.

S. lividans TK24, jossa on plasmidi pSY15c, joka sisältää nogalamysiinikromoforin geenit ja syklaasin (snoaL) ja ketoreduktaasin (s/zoaF) geenit, kasvatettiin El-alustas-sa, jota oli täydennetty tiostreptonilla. Syntyi yhdiste 9-epi-auramysinoni, ja tätä 30 rakennetta kutsutaan nyt nogalamysinoniksi. Mikä tahansa keksinnön mukainen DNA-fragmentti, joka on alakloonattu nogalamysiinibiosynteesin 17 kb alueelta, voidaan 107D53 9 liittää vektoriin, joka replikoituu Streptomycesissä, ja tuotteet voidaan tuottaa fermen- toimalla plasmidin sisältäviä kantoja.S. lividans TK24 harboring plasmid pSY15c containing the genes of nogalamycin chromophore and the genes for cyclase (snoaL) and ketoreductase (s / zoaF) was grown in E1 medium supplemented with thiostrepton. The compound 9-epi-auramycinone was formed and this structure is now called nogalamycinone. Any DNA fragment of the invention subcloned within the 17 kb region of nogalamycin biosynthesis can be inserted into a vector that replicates in Streptomyces, and the products can be produced by fermentation of plasmid-containing strains.

Piirustusten lyhyt kuvaus 5Brief Description of the Drawings

Kuva 1 esittää nogalamysiinin, daunomysiinin ja aklasinomysiinin rakenteet.Figure 1 shows the structures of nogalamycin, daunomycin and aclasinomycin.

Kuva 2 on kaavio nogalamysiinin biosynteesiin liittyvästä geeniryhmittymästä (Sno5).Figure 2 is a diagram of a gene cluster (Sno5) associated with nogalamycin biosynthesis.

1010

Kuva 3 kuvaa nogalamysiinin ehdotettua biosynteesireittiä.Figure 3 illustrates a proposed biosynthetic pathway for nogalamycin.

Kuva 4 esittää plasmidin pSY15c kaavion. Mustalla esitetyt geenit snozL (aL) ja snoaF (aF) liitetään plasmidiin pSY15, jolloin saadaan pSY15c. aL tarkoit-Figure 4 shows a diagram of plasmid pSY15c. The black genes snozL (aL) and snoaF (aF) are inserted into pSY15 to give pSY15c. aL means-

15 taa syklaasia snoaL ja aF tarkoittaa C-7-ketoreduktaasia snoaF. pSY15 (WO15 cycloase snoaL and aF represent C-7 ketoreductase snoaF. pSY15 (WO

96/10581) saa aikaan nogalamysiinibiosynteesin trisyklisen välituotteen syntymisen S. lividansissa. Lyhenteet ai, a2 ja a3 viittaavat minimaalisen PKS:n geeneihin sno&l, snoa2 ja vastaavasti snoa3. rA on aktivaattorin snorA-geeni, aB on oksigenaasin snoaB-geeni, aC on metylaasin snoaC- 20 geeni, aD on polyketidi-ketoreduktaasin snoaD-geeni ja aE on aromataasin • - snoaE-geeni. gF (snogF-geeni) ja gG (snogG-geeni), jotka liittyvät deoksi- heksoosireittiin, eivät ole toiminnallisia tässä rakenteessa, aph on aminogly-kosidifosfotransferaasigeeni ja tsr on tiostreptoniresistenssigeeni.96/10581) results in the formation of a tricyclic intermediate of nogalamycin biosynthesis in S. lividans. The abbreviations a1, a2 and a3 refer to the minimal PKS genes sno & l, snoa2 and snoa3, respectively. rA is the activator snorA gene, aB is the oxygenase snoaB gene, aC is the methylase snoaC gene, aD is the polyketide-ketoreductase snoaD gene, and aE is the aromatase • snoaE gene. gF (snogF gene) and gG (snogG gene) associated with the deoxyhexose pathway are not functional in this construct, aph is an aminoglycoside phosphotransferase gene and tsr is a thiostrepton resistance gene.

25 Seuraavassa esitetään esimerkkejä, jotka edelleen kuvaavat keksintöä.The following are examples which further illustrate the invention.

««

KOKEELLINEN OSAEXPERIMENTAL PART

Käytetyt materiaalit 30 Käytetyt restriktioentsyymit hankittiin Promegalta (Madison, Wisconsin, USA) taiMaterials Used 30 The restriction enzymes used were purchased from Promega (Madison, Wisconsin, USA) or

Boehringer Mannheimilta (Saksa), ja alkalinen fosfataasi Boehringer Mannheimilta, ja 10 107C53 niitä käytettiin valmistajien ohjeiden mukaisesti. Proteinaasi K hankittiin Promegalta * ja lysotsyymi Sigmalta (St. Louis, USA). Hybridisaatiossa käytetyt Hybond™-N-nailonmembraanit hankittiin Amershamilta (Buckinghamshire, Englanti), DIG DNA-leimauspakkaus ja DIG Luminesenssin mittauspakkaus Boehringer Mannheimilta.Boehringer Mannheim (Germany), and alkaline phosphatase from Boehringer Mannheim, and were used according to the manufacturers' instructions. Proteinase K was obtained from Promega * and lysozyme from Sigma (St. Louis, USA). Hybond ™ N-Nylon Membranes used for hybridization were purchased from Amersham (Buckinghamshire, England), DIG DNA Stamping Kit and DIG Luminescence Measurement Kit from Boehringer Mannheim.

5 Qiagenilta (Hilden, Saksa) hankittua Qiaquick Gel Extraction -pakkausta käytettiin DNA: n eristämiseksi agaroosista.5 Qiaquick Gel Extraction kits from Qiagen (Hilden, Germany) were used to isolate the DNA from the agarose.

Bakteerikannat ja niiden käyttöBacterial strains and their use

Escherichia coli XL1 Blue MRF’-kantaa käytettiin kloonaukseen.Escherichia coli XL1 Blue MRF' strain was used for cloning.

10 Streptomyces nogalater ATCC 27451; nogalamysiinin biosynteesiin liittyvä geeniryh-mittymä kloonattiin tästä kannasta.10 Streptomyces nogalater ATCC 27451; The gene cluster associated with nogalamycin biosynthesis was cloned from this strain.

Kloonattujen geenien ilmentämiseksi käytetyt isäntäkannat olivat:The host strains used to express the cloned genes were:

Streptomyces lividans TK24, jota käytettiin myös ensisijaisena isäntänä E. colissa monistetun DNA:n kloonaamiseksi.Streptomyces lividans TK24, which was also used as the primary host for the cloning of the amplified DNA in E. coli.

15 Streptomyces galilaeus H039, joka tuottaa aklavinoni-rodinoosi-rodinoosi-rodinoosia. Streptomyces galilaeus H026, joka tuottaa aklasinomysiini N:ää, ACMN, (aklavinoni-rodosamiini-2-deoksifukoosi-rodinoosi).15 Streptomyces galilaeus H039, which produces aclavinone-rhodinosis-rhodinosis-rhodinosis. Streptomyces galilaeus H026, which produces aclasinomycin N, ACMN (aclavinone-rhodosamine-2-deoxifucose-rhodinosis).

Streptomyces galilaeus H063, joka tuottaa aklavinonia.Streptomyces galilaeus H063, which produces aclavinone.

Streptomyces galilaeus H075, joka tuottaa aklavinoni-rodosamiini-2-deoksifukoosi-2-20 deoksifukoosia.Streptomyces galilaeus H075, which produces aclavinone-rhodosamine-2-deoxifucose-2-20 deoxifucose.

cc

Mutanttien H039 ja H026 yksityiskohtainen kuvaus on esitetty artikkelissa Ylihonko et ai. (1994) ja mutantin H075 FI-patenttihakemuksessa n:o 981062 (Ylihonko et ai, 1998). H063:a ei ole kuvattu kirjallisuudessa, mutta se saatiin S. galilaeuksen NTG- 25 mutagenoinnilla, ja se valittiin isäntäkannaksi hybridiyhdisteiden tuotannossa, koska i" siihen kerääntyy aklavinonia, jossa ei ole sokeritähteitä.A detailed description of mutants H039 and H026 is given in Ylihonko et al. (1994) and mutant H075 in FI patent application No. 981062 (Ylihonko et al., 1998). H063 has not been described in the literature, but was obtained by NTG-25 mutagenesis of S. galilaeus and was selected as the host strain for the production of hybrid compounds because it accumulates no sugar residues.

»*»*

Plasmidit E. coli - Streptomyces sukkulakosmidia pFD666 (ATCC 77286) käytettiin kro-30 mosomaalisen DNA:n kloonaamiseksi. E. coli -kloonausvektoreita pSLl 190 (Pharmacia) ja pUC19 käytettiin alakloonien valmistamiseksi.Plasmids E. coli - Streptomyces shuttle cosmid pFD666 (ATCC 77286) was used to clone Kro-30 mosomal DNA. E. coli cloning vectors pSL1 190 (Pharmacia) and pUC19 were used to prepare subclones.

107053 11 pIJ486 on monikopioplasmidivektori, joka saatiin prof. Sir David Hopwoodilta, John Innes Centre, UK (Ward et al., 1986).107053 11 pIJ486 is a multi-copy plasmid vector obtained by prof. Sir David Hopwood, John Innes Center, UK (Ward et al., 1986).

pIJE486 on vektori, joka sisältää ermE-geenin pIJ486:n polylinkkerissä (Bibb et ai., 5 1985).pIJE486 is a vector containing the ermE gene in the polylinker of pIJ486 (Bibb et al., 1985).

pSY15 on pIJ486:een perustuva plasmidikonstrukti, jossa nogalamysiinibiosynteesin polyketidireitin geenit kloonattiin (Ylihonko et ai., 1996a).pSY15 is a pIJ486-based plasmid construct in which genes for the polyketide pathway in nogalamycin biosynthesis were cloned (Ylihonko et al., 1996a).

10 Ravintoalustat ja liuokset S. nogalaterin viljelemiseksi kokonais-DNA:n eristämistä varten käytettiin TSB-alustaa. Lysotsyymiliuosta (0,3 M sakkaroosia, 25 mM Tris, pH 8 ja 25 mM EDTA pH 8) käytettiin kokonais-DNA:n eristämiseksi. TE-puskuri (10 mM Tris, pH 8,0 ja ImM EDTA) käytettiin DNA: n liuottamiseksi.Media and solutions TSB medium was used to grow S. nogalateri for total DNA isolation. A solution of lysozyme (0.3 M sucrose, 25 mM Tris, pH 8 and 25 mM EDTA pH 8) was used to isolate total DNA. TE buffer (10 mM Tris, pH 8.0 and ImM EDTA) was used to dissolve the DNA.

15 TRYPTONI-SOIJALIEMI (TSB)15 TRYPTON SOYA SOYA (TSB)

Litraa kohti: 30 g Oxoidin tryptoni-soijaliemijauhetta.Per liter: 30 g Oxoid tryptone soybean powder.

ISP4 20 Bacto-ISP-alusta 4, Difco; 37 g/1.ISP4 Bacto ISP Medium 4, Difco; 37 g / l.

El Litraa kohti vesijohtovettä: glukoosia 20 g liukoista tärkkelystä 20 g 25 Farmamedia 5 g hiivauutetta 2,5 g Κ2ΗΡ04·3Η20 1,3 g - .· MgSO4*7H20 1 gPer liter of tap water: Glucose 20 g Soluble starch 20 g 25 Pharmamedia 5 g Yeast extract 2.5 g Κ2ΗΡ04 · 3Η20 1.3 g -. · MgSO4 * 7H20 1 g

NaCl 3 g 30 CaC03 3 g pH säädettiin 7,4:ään ennen autoklavointia 107053 12NaCl 3g 30 CaCO 3 3g was adjusted to pH 7.4 before autoclaving 10705312

Yleiset menetelmät NMR-arvot kerättiin JEOL JNM-GX 400 -spektrometrillä ympäröivässä lämpötilassa. lH ja 13C-NMR-näytteiden sisäisinä referensseinä käytettiin TMS:ää.General Methods NMR values were collected on a JEOL JNM-GX 400 spectrometer at ambient temperature. TMS was used as the internal reference for 1H and 13C NMR samples.

5 Antrasykliinimetaboliitit detektoitiin HPLCrllä (LaChrom, Merck Hitachi, pumppu L-7100, detektori L-7400 ja integraattori D-7500) käyttäen LiChroCART RP-18 kolonnia (4,6x250mm). Liikkuvana faasina käytettiin asetonitriiii:kaiiumvetyfosfaatti-puskuria (60 mM, pH 3,0 säädetty sitruunahapolla). Yhdisteiden erottamiseksi käytettiin gradienttisysteemiä lähtien 65%:isesta ja päätyen 30%:iseen kaliumdivety-10 fosfaattipuskuriin. Virtausnopeus oli 1 ml/min ja detektio suoritettiin 430 nm:ssä.Anthracycline metabolites were detected by HPLC (LaChrom, Merck Hitachi, L-7100 pump, L-7400 detector and D-7500 integrator) using a LiChroCART RP-18 column (4.6 x 250 mm). Acetonitrile: potassium hydrogen phosphate buffer (60 mM, pH 3.0 adjusted with citric acid) was used as mobile phase. A gradient system from 65% to 30% potassium dihydrogen-10 phosphate buffer was used to separate the compounds. The flow rate was 1 ml / min and detection was performed at 430 nm.

Plasmidit sisältävien viljelmien ylläpitämiseksi käytettiin ISP4-maljoja, jotka oli täydennetty tiostreptonilla (50 £/g/ml).ISP4 plates supplemented with thiostrepton (50 µg / g) were used to maintain plasmid containing cultures.

15 Esimerkki 1. Nogalamysiinin biosynteesiin liittyvän geeniryhmittymän kloonaaminen 1.1 Kosmidikirjasto15 Example 1. Cloning of a gene cluster related to nogalamycin biosynthesis 1.1 Cosmid library

Kokonais-DNA:n eristämiseksi Streptomyces nogalateria (ATCC 27451) kasvatettiin 20 kolme päivää 50 mlrssa TSB-alustaa, joka oli täydennetty 0,5 %:illa glysiiniä. Solut otettiin talteen sentrifiigoimalla 15 min 3900 x g:ssä 12 ml Falcon-putkissa, ja soluja säilytettiin -20 °C:ssa. 12 ml:n näytteestä saatuja soluja käytettiin DNA:n eristämiseksi. Solujen päälle lisättiin 5 ml lysotsyymiliuosta, joka sisälsi lysotsyymiä 5 mg/ml, ja inkuboitiin 20 min 37 °C:ssa. Soluille lisättiin 500 μ\ 10%:ista SDS:ää, 25 joka sisälsi 0,7 mg of proteinaasi K:ta, ja inkuboitiin 80 min 62 °C:ssa, lisättiin toiset . 500 μ\ 10%:ista SDS:ää, joka sisälsi 0,7 mg proteinaasi K:ta, ja inkubointia jatkettiin 60 min. Näyte jäähdytettiin jäiden päällä ja lisättiin 600 μΐ 3M NaAc:ta, pH 5,8, ja seosta uutettiin tasapainotetulla fenolilla (Sigma). Faasit erotettiin sentrifugoimalla 1400 x g 10 min. DNA saostettiin vesifaasista yhtä suurella tilavuudella isopropanolia 30 ja kerättiin lasisauvalla, ja pestiin kastamalla 70%:iseen etanoliin, ilmakuivattiin ja liuotettiin 500 /iltaan TE-puskuria.To isolate total DNA, Streptomyces nogalateria (ATCC 27451) was grown for 20 days in 50 ml of TSB supplemented with 0.5% glycine. Cells were harvested by centrifugation for 15 min at 3900 x g in 12 ml Falcon tubes and stored at -20 ° C. Cells obtained from a 12 ml sample were used to isolate the DNA. 5 ml of lysozyme solution containing 5 mg / ml lysozyme was added to the cells and incubated for 20 min at 37 ° C. To the cells were added 500 μl of 10% SDS containing 0.7 mg of proteinase K and incubated for 80 min at 62 ° C, others were added. 500 µl of 10% SDS containing 0.7 mg proteinase K and incubation was continued for 60 min. The sample was cooled on ice and 600 μΐ 3M NaAc, pH 5.8 was added and the mixture was extracted with balanced phenol (Sigma). The phases were separated by centrifugation at 1400 x g for 10 min. The DNA was precipitated from the aqueous phase with an equal volume of isopropanol 30 and collected on a glass rod, and washed by dipping in 70% ethanol, air-dried and dissolved in 500 µl TE buffer.

107053 13107053 13

Kromosomaalinen DNA pilkottiin osittain &ut3AI:llä. DNA-fragmentit erotettiin agaroosigeelielektroforeesilla, ja 30 - 50 kb fragmentit leikattiin 0,3%:isesta alhaisessa lämpötilassa geeliytyvästä SeaPlaque®-agaroosista. DNA-vyöhykkeet eristettiin geelistä kuumentamalla 65 °C:seen, uuttamalla yhtä suurella tilavuudella tasapaino-5 tettua fenolia, ja faasit erotettiin sentrifugoimalla 15 min 2500 x g. Fenolifaasi uutettiin TE-puskurilla, sentrifugoitiin ja vesifaasit yhdistettiin. DNA saostettiin lisäämällä 0,1 tilavuutta NaAcrtä, pH 5,8 ja 2 tilavuutta etanolia -20 °C:ssa 30 min, sentrifugoitiin 30 min 15 000 rpm Sorvali RC5C -sentrifuugilla käyttäen SS-34 roottoria, jossa oli adapterit 10 ml:n putkille. Pelletti ilmakuivattiin ja liuotettiin 20 10 jukaan TE-puskuria. Eristetyt fragmentit liitettiin pFD666-kosmidivektoriin, joka oli katkaistu BamHItllä ja defosforyloitiin. DNA pakattiin faagipartikkeleihin ja infektoi-tiin E. coliin käyttäen Gigapack® III XL Packing Extract Kit -pakkausta valmistajan ohjeiden mukaisesti.The chromosomal DNA was partially digested with & ut3AI. The DNA fragments were separated by agarose gel electrophoresis, and the 30-50 kb fragments were cut from 0.3% low temperature gelatinized SeaPlaque® agarose. The DNA bands were isolated from the gel by heating to 65 ° C, extracting an equal volume of equilibrated phenol, and the phases were separated by centrifugation for 15 min at 2500 x g. The phenol phase was extracted with TE buffer, centrifuged and the aqueous phases combined. The DNA was precipitated by adding 0.1 volumes of NaAcc, pH 5.8 and 2 volumes of ethanol at -20 ° C for 30 min, centrifuged for 30 min at 15,000 rpm on a Sorvali RC5C centrifuge using an SS-34 rotor fitted with 10 ml tubes . The pellet was air dried and dissolved in 20 µl of TE buffer. The isolated fragments were ligated into the pFD666 cosmid vector which had been digested with BamHI and dephosphorylated. The DNA was packaged in phage particles and infected with E. coli using the Gigapack® III XL Packing Extract Kit according to the manufacturer's instructions.

15 1.2 Kloonien identifiointi hybridisaatiolla15 1.2 Identification of Clones by Hybridization

Infektoituja soluja kasvatettiin LB-maljoilla, jotka sisälsivät 50 y^g/ml kanamysiiniä ja siirrettiin Hybond™-N-nailonmembraaneille (Amersham). Membraanit käsiteltiin Boehringer Mannheimin käsikirjassa "The DIG System User’s Guide for Filter Hybridization" kuvattujen menetelmien mukaisesti. Nogalamysiinin laajennetun 20 geeniryhmittymän sisältämien pesäkkeiden seulontaan käytetty koetin oli 1,07 kb ' " 5ad-fragmentti aikaisemmin kuvatusta ryhmittymästä (Torkkell et ai, 1997).Infected cells were grown on LB plates containing 50 µg / ml kanamycin and transferred to Hybond ™ -N-nylon membranes (Amersham). The membranes were processed according to the methods described in Boehringer Mannheim's "The DIG System User's Guide to Filter Hybridization". The probe used to screen colonies containing the expanded 20 gene clusters of nogalamycin was a 1.07 kb '5ad fragment of the cluster described previously (Torkkell et al., 1997).

Koettimen sisältävä plasmidi katkaistiin SacLllä, ja fragmentti erotettiin vektorista agaroosigeelielektroforeesilla ja eristettiin geelistä käyttäen Qiaquick Gel Extraction Kit -pakkausta (Qiagen). Koetin leimattiin digoksigeniinillä käyttäen lyhyen oligo-25 nukleotidialukkeen leimaussysteemiä Boehringer Mannheimin käsikirjan "The DIG System User’s Guide for Filter Hybridization" mukaisesti. 5000 pesäkettä seulottiin hybridisoimalla 70 °C:ssa käyttäen kuvattua koetinta. Positiiviset pesäkkeet detek-toitiin käyttäen DIG Luminescent Detection Kit -pakkausta (Boehringer Mannheim). Seitsemän pesäkettä antoi positiivisen signaalin. Positiivisista klooneista saadut 30 kosmidit eristettiin 5 ml viljelmästä alkalisella lysointimenetelmällä. Restriktioanalyysi osoitti, että kloonatut fragmentit olivat osittain päällekkäisiä vastaten ainakin 60 kb:n 107053 14 fragmentit olivat osittain päällekkäisiä vastaten ainakin 60 kb:n jatkuvaa DNA:ta. Saaduille positiivisille klooneille annettiin nimet pFDShol - pFD5>io7.The probe-containing plasmid was digested with Sac I, and the fragment was separated from the vector by agarose gel electrophoresis and isolated from the gel using the Qiaquick Gel Extraction Kit (Qiagen). The probe was labeled with digoxigenin using a short oligo-25 nucleotide primer labeling system according to Boehringer Mannheim's "The DIG System User's Guide to Filter Hybridization". 5000 colonies were screened by hybridization at 70 ° C using the probe described. Positive colonies were detected using the DIG Luminescent Detection Kit (Boehringer Mannheim). Seven colonies gave a positive signal. 30 cosmids from positive clones were isolated from the culture by 5 ml by alkaline lysis method. Restriction analysis showed that the cloned fragments overlapped corresponding to at least 60 kb of 107053 14 fragments were overlap corresponding to at least 60 kb of continuous DNA. The resulting positive clones were named pFDShol - pFD5> 10.

1.3 Fragmenttien alakloonaaminen sekvensointia varten 5 Klooni n:o 5, nimeltään pFDiSWo5, katkaistiin 2?g/II:lla, ja alakloonausta varten kaksi fragmenttia, noin 10 kb ja 7 kb, eristettiin ja liitettiin pSL1190:aan, katkaistiin Bgl-II: 11a ja defosforyloitiin. Saaduille plasmideille annettiin nimet pSn42 ja vastaavasti pSn43. Nämä kaksi fragmenttia kattavat DNA-alueen, joka on välittömästi kiinni aikaisemmin karakterisoidussa nogalamysiinin biosynteesiryhmittymän alueessa.1.3 Subcloning of Fragments for Sequencing 5 Clone # 5, called pFDiSWo5, was cleaved with 2 µg / II, and for sub-cloning, two fragments, about 10 kb and 7 kb, were isolated and ligated into pSL1190, cleaved with Bgl-II. and dephosphorylated. The resulting plasmids were named pSn42 and pSn43, respectively. These two fragments cover a region of DNA immediately adjacent to the previously characterized region of the nogalamycin biosynthetic moiety.

10 Plasmideihin pSn42 ja pSn43 kloonatun koko 17 kb:n alueen nukleotidisekvenssin määrittämiseksi käytettiin sopivia restriktiokohtia, jotta fragmentit saatiin ala-kloonatuiksi vektoriin pUC19 tai pSL1190, jolloin pSn42:n insertistä saatiin 16 alakloonia ja pSn43:n insertistä 11 alakloonia.Appropriate restriction sites were used to determine the entire 17 kb nucleotide sequence of the cloned plasmids pSn42 and pSn43 to subclone the fragments into vector pUC19 or pSL1190, yielding 16 subclones from pSn42 insert and 11 subclones from pSn43 insert.

15 E. coli XL1 Blue MRF’ -soluja viljeltiin yli yön 37 °C:ssa 5 mlrssa LB-alustaa, jota oli täydennetty 50 /ag/ml ampisilliinia. Plasmidien eristämiseksi sekvenssireaktioita varten käytettiin Promegan Wizard Plus Minipreps DNA-puhdistuspakkausta tai Biometran silica spin plasmid miniprep -pakkausta (Biomedizinische Analytik Gmbh) valmistajien ohjeiden mukaisesti.15 E. coli XL1 Blue MRF 'cells were cultured overnight at 37 ° C in 5 ml LB medium supplemented with 50 µg / ml ampicillin. Promegan Wizard Plus Minipreps DNA purification kit or Biometran silica spin Plasmid miniprep kit (Biomedizinische Analytik Gmbh) was used to isolate plasmids for sequence reactions according to the manufacturers' instructions.

20 • r DNA-sekvensointi suoritettiin käyttäen automaattista ABI DNA-sekvenaattoria (Perkin-Elmer) valmistajan ohjeiden mukaisesti.20 r DNA sequencing was performed using an ABI automated DNA sequencer (Perkin-Elmer) according to the manufacturer's instructions.

1.4 Sekvenssianalyysi ja geenien päätellyt funktiot 25 Sekvenssianalyysit suoritettiin käyttäen GCG-sekvenssianalyysiohjelmapakkausta (Versio 8; Genetics Computer Group, Madison, Wisconsin, USA). Käännöstaulukko muunnettiin siten, että se hyväksyi myös GTG:n aloituskodoniksi. Kodonikäyttö analysoitiin käyttäen julkaistuja tietoja (Wright ja Bibb 1992).1.4 Sequence Analysis and Gene Inferred Functions Sequence analyzes were performed using the GCG Sequence Analysis Software Kit (Version 8; Genetics Computer Group, Madison, Wisconsin, USA). The translation table was converted to accept GTG as the start codon. Codon usage was analyzed using published data (Wright and Bibb 1992).

30 CODONPREFERENCE-ohjelman mukaan sekvensoitu DNA-fragmentti sisälsi 15 täydellistä avointa lukukehystä (open reading frames, ORFs), ja kahden muun ORF:n 15 107053 5’-pään keksinnön mukaisen fragmentin molemmissa päissä. Geenien funktiot pääteltiin vertaamalla emässekvensseistään transloituja aminohapposekvenssejä tietopankeissa oleviin tunnettujen proteiinien sekvensseihin. Tulokset on esitetty Taulukossa 1. Annetut asemat viittaavat oheen liitettyyn sekvenssilistaan. Peptidien 5 aminohapposekvenssit on annettu sekvensseissä SEQ ID NO:2 - SEQ ID NO: 18.The DNA fragment sequenced according to the CODONPREFERENCE program contained 15 complete open reading frames (ORFs), and two other 10,107,053 5'-ends of the ORF of the invention at both ends. The functions of the genes were deduced by comparing the amino acid sequences translated from their base sequences with those of known proteins in the databases. The results are shown in Table 1. The positions given refer to the attached sequence list. The amino acid sequences of the peptides 5 are given in SEQ ID NO: 2 to SEQ ID NO: 18.

« 107053 16«107053 16th

Taulukko 1__^Table 1 __ ^

Geeni Asema Aminohapot Päätelty funktio Huom.Gene Position Amino Acids Inferred Function Note.

___(SEQ ID NO)___ snogl -1027 >342 (2) aminotransferaasi 5'-pää __kömpi____ snogJ__1192-2073 293 (3)__dTDP-glukoosisyntetaasi__ snogA 2106-2822 238 (4) aminometyylitransferaasi __kömpi____ s/zoaM 2826-3800 324 (5) polyketidisyklaasi __kömpi____ s/zogN 3799-5025 408 (6) <7«rQ-homologia (Otten et ____ai, 1995), tuntematon__ snoaG 5088-6356 422 (7)__hydroksylaasi__ snogC 6334-7209 291 (8) dTDP-4-dehydroramnoosi- __kömpi___reduktaasi__ snogK 7245-8297 350 (9) dTDP-glukoosi-4,6-dehydra- __kömpi___taasi__ snoaL 8537-8941 134 (10) NAME-syklaasi (nogaloni- ____hapon metyyliesteri)__ snoK__8992-9699 235 (11)__tuntematon__ snogD 9745-10917 390 (12) glykosyylitransferaasi __kömpi____ snoW__11057-11884 275 (13)__tuntematon__ * ; snogE__11928-*__>424 (14)__glykosyylitransferaasi__ snob 13335-13754 139 (15) tuntematon __kömpi____ snoO 13974-14441 155 (16) homologinen mtmX: n mitra- ____mysiiniryhmittymän kanssa__ snoaF 14532-15377 281 (17) aklaviketonin ketoreduktaa- sin kanssa analoginen C-7- ____ketoreduktaasi__ STioN__15450-__> 190 (18)__tuntematon__5'-pää *, noin 100 bp nukleotidisekvenssi, ei tunnettu 107053 17 1.5 Ekspressiokloonaus 10 kb:n Bg/II-fragmentti pFD5no5:sta kloonattiin plasmidiin pIJ486 ja saadulle plasmidille annettiin nimi pSY42. Vastaavasti 7 kb:n 5g/II-fragmentti pFDSno5:sta kloonattiin plasmidiin pIJE486, ja saatiin plasmidi pSY43. Plasmidi pSY42 liitettiin S.___ (SEQ ID NO) ___ snogl -1027> 342 (2) 5'-end of aminotransferase __ more ____ snogJ__1192-2073 293 (3) __ dTDP-glucose synthetase__ snogA 2106-2822 238 (4) aminomethyltransferase __ more 28 5 5 38 38 M z 5 38 38 M ) polyketide dicyclase __ more ____ s / zogN 3799-5025 408 (6) <7 «rQ homology (Otten et al., 1995), unknown__ snoaG 5088-6356 422 (7) __ hydroxylase__ snogC 6334-7209 291 (8) dTDPam-4-deh - __more ___ reductase__ snogK 7245-8297 350 (9) dTDP-glucose-4,6-dehydra __ more ___ again__ snoaL 8537-8941 134 (10) NAME-Cyclase (nogalone-h-acid methyl ester) __ snoK__8992-9699 235 (979-9699 235 on 10917 390 (12) glycosyltransferase __more ____ snoW__11057-11884 275 (13) __ unknown__ *; snogE__11928 - * __> 424 (14) __ glycosyltransferase__ Snob 13335-13754 139 (15) unknown __basic ____ snoO 13974-14441 155 (16) homologous to mtmX with the mitral ____ mycine clone__ snoaF 14532-15377 281 (17) C-7- ____etreductase__ STioN__15450 -__> 190 (18) __ unknown__5 'end *, about 100 bp nucleotide sequence, unknown 107053 17 1.5 Expression Cloning A 10 kb Bg / II fragment of pFD5no5 was cloned into plasmid pIJ486 and obtained pSY42. Similarly, the 7 kb 5g / II fragment of pFDSno5 was cloned into pIJE486 and plasmid pSY43 was obtained. Plasmid pSY42 was ligated into S.

5 .. lividans-kaataan TK24 protoplastitransformaatiolla, eristettiin siitä ja liitettiin edelleen S. galilaeus-mutzattiw H039, ja kun sitä oli monistettu H039:ssa, se siirrettiin muihin S. galilaeus-mutsaitteihm, joiden aklasinomysiineille luonteenomaisten sokereiden deoksiheksoosireitti oli katkaistu (H075, H026, ja H063). El-alustaa käytettiin antra-sykliinin tuottoon, ja tuotteet uutettiin viljelmästä tolueeni:metanolillä (1:1) pHrssa 7.5 .. lividans was cut by TK24 protoplast transformation, isolated from it and further linked to S. galilaeus mutzattiw H039 and, when amplified in H039, was transferred to other S. galilaeus mutants whose acacinomycins were characterized by a deoxyhexose , and H063). E1 medium was used for the production of anthracycline and the products were extracted from the culture with toluene: methanol (1: 1) at pH 7.

10 Antrasykliinimetaboliitit analysoitiin HPLC:llä. pSY42:n sisältämien mutanttien H039, H026, H063 ja H075 tuotteet olivat erilaisia kuin sellaisten mutanttien, joissa plasmidia ei ollut.The anthracycline metabolites were analyzed by HPLC. The products of mutants H039, H026, H063 and H075 contained in pSY42 were different from those of the mutants lacking the plasmid.

Sekvenssianalyysin mukaan pSY42 sisälsi syklaasin, jolle annettiin nimi NAMEC 15 (nogalonic acid methyl ester cyclase, nogalonihappometyyliesterisyklaasi), ja pSY43:sta identifioitiin ketoreduktaasigeeni. Valmistettiin ekspressiokonstruktiot, jotka sisälsivät kaikki geenit, jotka tarvitaan nogalamysiiniaglykonin muodostamiseksi. 1,4 kb 5amHI-5acI-fragmentti pSY42:sta (joka sisältää NAMEC:in) ja 1,1 kb Mlul-Kpnl-fragmtntti pSY43:sta, jossa on C-7-ketoryhmän ketoreduktaasigeeni, 20 liitettiin pSY15:een, joka oli linearisoitu SacEllä, plasmidin pSY15c muodostamiseksi . (Kuva 4). Plasmidi pSY15c liitettiin S. lividans TK24:ään, ja kantaa TK24/pSY15c viljeltiin El-alustassa, jota oli täydennetty tiostreptonilla. Syntyi aglykoniyhdiste, ja tätä rakennetta kutsutaan nyt nogalamysmoniksi.By sequence analysis, pSY42 contained a cyclase, termed NAMEC 15 (nogalonic acid methyl ester cyclase), and a ketoreductase gene was identified from pSY43. Expression constructs containing all the genes needed to form the nogalamycin glycone were made. A 1.4 kb 5 amHI-5acI fragment from pSY42 (containing NAMEC) and a 1.1 kb MluI-Kpn1 fragment from pSY43 carrying the C-7 keto group ketoreductase gene were inserted into pSY15 linearized with SacE to form plasmid pSY15c. (Figure 4). Plasmid pSY15c was ligated to S. lividans TK24, and strain TK24 / pSY15c was cultured in E1 medium supplemented with thiostrepton. An aglycone compound was born, and this structure is now called nogalamysmon.

25 Esimerkki 2. s«o5-ryhmittymän tuottamat yhdisteet • · 2.1 H039/pSY42:sta ja TK24/pSY15c:stä peräisin olevien tuotteiden tuottaminen ja puhdistus25 Example 2. Compounds produced by s «o5 group • · 2.1 Production and purification of products derived from H039 / pSY42 and TK24 / pSY15c

Ymppiviljelmä, 180 ml plasmidia sisältävän kannan H039/pSY42 tai TK24/pSY15c 30 El-viljelmää saatiin viljelemällä kantaa kolmessa 250 ml Erlenmeyer-pullossa, jotka sisälsivät 60 ml El-alustaa, jota oli täydennetty tiostreptonilla (5 Mg/ml), neljän 107053 18 päivän ajan 30 °C:ssa, 330 rpm. Yhdistetyt viljelyliemet (180 ml) käytettiin siirrosta-maan 13 1 El-alustaa fermentorissa (Biostat E). Fermentoinnin annettiin olla käynnissä seitsemän päivää 28 °C:ssa (330 rpm, ilmastus: 450 1/min).An inoculum culture of 180 ml of the E1 culture of strain H039 / pSY42 or TK24 / pSY15c containing the plasmid was obtained by culturing the strain in three 250 ml Erlenmeyer flasks containing 60 ml of E1 medium supplemented with thiostreptone (5 Mg / ml). for 30 days at 30 ° C, 330 rpm. The combined culture broths (180 mL) were used to inoculate 13 L of El medium in a fermenter (Biostat E). The fermentation was allowed to proceed for seven days at 28 ° C (330 rpm, aeration: 450 rpm).

5 Solut otettiin talteen sentrifugoimalla. Bakteerisolujen rikkomiseksi ja kerääntyneiden antrasykliinimetaboliittien uuttamiseksi käytettiin 2,6 1 metanolia. Antrasykliinimeta-boliitit uutettiin käyttäen 2 1 dikloorimetaania pH:ssa 6. Orgaaninen kerros haihdutettiin kuiviin. Viskoosi jäännös flash-kromatografoitiin polyamidipylvään (11) läpi käyttäen eluenttina vesi:metanolia 1:9-0:10. Yhdisteitä sisältävät yhdistetyt fraktiot 10 puhdistettiin edelleen Merck-Hitachi HPLC-laitteella käyttäen preparatiivista käänteis-faasipylvästä (LichroCART RP-18, 5 μτα) käyttäen liikkuvana faasina asetonitriili: 1 % AcOH -seosta vedessä (1:1). Kun asetonitriili haihdutettiin, saatiin puhtaita tuotteita keltaisina tyhjiössä kuivattuina jauheina.Cells were harvested by centrifugation. 2.6 L methanol was used to disrupt the bacterial cells and extract the accumulated anthracycline metabolites. The anthracycline metabolites were extracted with 2 L dichloromethane at pH 6. The organic layer was evaporated to dryness. The viscous residue was flash chromatographed on a polyamide column (11) using water: methanol 1: 9-0: 10 as eluent. The combined fractions containing the compounds were further purified by Merck-Hitachi HPLC using a preparative reverse phase column (LichroCART RP-18, 5 μτα) using acetonitrile: 1% AcOH in water (1: 1) as mobile phase. Evaporation of the acetonitrile gave pure products as yellow vacuum dried powders.

15 2.2 H039/pSY42:sta ja TK24/pSY15c:sta saatujen tuotteiden rakenteen määritys NMR-analyysi suoritettiin NON-, BMC-, NOE-, DEPT- ja HMBC-tekniikoilla.2.2 Determination of Structure of Products Derived from H039 / pSY42 and TK24 / pSY15c NMR analysis was performed using NON, BMC, NOE, DEPT and HMBC techniques.

Protonit määritettiin käyttäen NOESY- ja 2D pTOCSY -tekniikoita ja hiilet käyttäen DEPT- ja HMBC-tekniikoita.Protons were determined using NOESY and 2D pTOCSY techniques and carbons were determined using DEPT and HMBC techniques.

20 Määritettynä taulukoissa 2 ja 3 esitettyjen tietojen perusteella saadut rakenteet olivat H039/pSY42:n viljelmästä aklavinoni4’-epi-2-deoksifukoosi ja TK24/pSY15c:n viljelmästä 9-epi-auramysinoni (=nogalamysinoni). Yhdisteiden kemialliset rakenteet on esitetty alla kaavoilla I ja vastaavasti II.Determined from the data shown in Tables 2 and 3, the constructs obtained were aclavinone 4'-epi-2-deoxifucose from H039 / pSY42 culture and 9-epi-auramycinone (= nogalamycinone) from TK24 / pSY15c culture. The chemical structures of the compounds are shown below in formulas I and II, respectively.

25 O COOCH3 OH 0 0H 9 30 ^25 O COOCH3 OH 0 0H 9 30 ^

Me^TT^JWe ^ TT ^ J

HOHO

OHOH

107055 19 O COOCH3 5 ΟΜΟ^λ m107055 19 O COOCH3 5 ΟΜΟ ^ λ m

OH O OH OHOH O OH OH

1010

Talletetut mikro-organismitDeposited microorganisms

Seuraavat mikro-organismit talletettiin Budapestin sopimuksen mukaisesti talletuslaitokseen Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ), 15 Mascheroder Weg lb, D-38124 Braunschweig, Saksa.The following microorganisms were deposited with the Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ), 15 Mascheroder Weg lb, D-38124 Braunschweig, Germany, in accordance with the Budapest Treaty.

Mikro-organismi Talletus numero Talletuspäivä S. lividans TK24/pSY42, 20 jossa on plasmidi pSY42 DSM 12451 14. lokakuuta 1998 « S. lividans TK24/pSY43, jossa on plasmidi pSY43 DSM 12452 14. lokakuuta 1998 107053 20Microorganism Deposit Number Deposit Date S. lividans TK24 / pSY42 with plasmid pSY42 DSM 12451 October 14, 1998 «S. lividans TK24 / pSY43 with plasmid pSY43 DSM 12452 October 14, 1998 107053 20

Taulukko 2. Yhdisteen aklaYinom-4’-epi-2-deoksifukoosi ‘H- ja 13C-siirtymät (Kaava I)Table 2. The 'H' and '13 C' Transitions of the Compound aklaYinom-4'-epi-2-Deoxifucose (Formula I)

~Kohta *H 13C~ Item * H 13C

1 7,74, 1H, dd, 7,5, 1,3 120,1 2 7,68, 1H, dd, 8,4,7,5 137,3 3 7,27, 1H, dd, 8,3, 1,3 124,6 4 - 161,9 4-OH 11,70, 1H, s 4a - 115,4 5 - 192,3 5a - 114,4 6 - 162,4 6-OH 12,46, 1H, s 6a - 130,9 7 5,18, 1H, dd, 4,3,3,1 71,3 8A 2,51, 1H, dd, 15,0,4,3 33,9 8B 2,32, 1H, dd, 15,0, 3,1 9 - 72,1 9-OH 4,58, 1H, s 10 4,02, 1H, s 56,9 10a - 142,4 11 7,40, 1H, s 120,8 11a - 133,1 12 - 180,7 12a - 132,6 13A 1,73, 1H, dq, 14,2,7,4 32,0 13B 1,51, 1H, dq, 14,2, 7,4 . - 14 1,10,3H, t, 7,4 6,7 15 - 171,1 16 3,69,3H, s 52,5 Γ 5,41, 1H, d, 3,5 101,7 2'a 1,75, 1H, ddd, 12,8, 11,2, 3,4 37,7 2'e 2,19, 1H, dd, 12,8, 5,3 3' 3,71, 1H, ddd, 12,0, 9,0, 5,3 69,0 4' 3,14, 1H, dd, 9,1, 9,0 78,1 5' 3,88, 1H, dq, 9,1,6,2 68,8 6' 1,36, 3H, d, 6,2 17,6 107053 211 7.74, 1H, dd, 7.5, 1.3 120.1 2 7.68, 1H, dd, 8.4,7.5 137.3 3 7.27, 1H, dd, 8.3 , 1,3,124.6 4 - 161.9 4-OH 11.70, 1H, s 4a - 115.4 5 - 192.3 5a - 114.4 6 - 162.4 6-OH 12.46, 1H , s 6a - 130.9 7 5.18, 1H, dd, 4.3.3.1 71.3 8A 2.51, 1H, dd, 15.0.4.3 33.9 8B 2.32, 1H, dd, 15.0, 3.1 9 - 72.1 9-OH 4.58, 1H, s 10 4.02, 1H, s 56.9 10a - 142.4 11 7.40, 1H, s 120.8 11a - 133.1 12 - 180.7 12a - 132.6 13A 1.73, 1H, dq, 14.2.7.4 32.0 13B 1.51, 1H, dq, 14.2, 7.4. - 14 1.10.3H, t, 7.4 6.7 15 - 171.1 16 3.69.3H, s 52.5 Γ 5.41, 1H, d, 3.5 101.7 2'a 1.75, 1H, ddd, 12.8, 11.2, 3.4 37.7 2'e 2.19, 1H, dd, 12.8, 5.3 3 '3.71, 1H, ddd, 12.0, 9.0, 5.3 69.0 4 '3.14, 1H, dd, 9.1, 9.0 78.1 5' 3.88, 1H, dq, 9.1.6, 2 68.8 6 '1.36, 3H, d, 6.2 17.6 107053 21

Taulukko 3. Yhdisteen 9-epi-auramysinoni Ή- ja 13C-siirtymät (Kaava Π).Table 3. Compounds of 9-epi-auramycinone Ή and 13C transitions (Formula Π).

Kohta *H 13CItem * H 13C

1 7,76, 1H, dd, 7,5, 1,2 119,8 2 7,67, 1H, dd, 8,3,7,5 137,4 3 7,28, 1H, dd, 8,3, 1,2 124,8 4 - 162,5 4-OH 11,86, 1H, s 4a - 115,6 5 - 192,7 5a - 114,6 6 - 160,9 6-OH 12,76, 1H, s 6a - 134,1 7 5,40, 1H, t, 7,0 64,0 8A 2,66, 1H, dd, 13,9,7,0 40,9 8B 1,89, 1H, dd, 13,9, 7,1 9 - 70,5 9-OH 3,49, 1H, brs 10 3,93, 1H, d, 0,8 56,0 10a - 142,1 11 7,51, 1H, d, 0,8 120,1 11a - 133,3 12 - 180,9 12a - 132,1 13 1,44,3H, s 28,7 14 - 173,0 15 3,90, 3H, s 52,6 107053 221 7.76, 1H, dd, 7.5, 1.2 119.8 2 7.67, 1H, dd, 8.3, 7.5, 137.4 3 7.28, 1H, dd, 8.3 , 1.2 124.8 4 - 162.5 4-OH 11.86, 1H, s 4a - 115.6 5 - 192.7 5a - 114.6 6 - 160.9 6-OH 12.76, 1H , s 6a - 134.1 7 5.40, 1H, t, 7.0 64.0 8A 2.66, 1H, dd, 13.9,7.0 40.9 8B 1.89, 1H, dd, 13.9, 7.1 9 - 70.5 9-OH 3.49, 1H, brs 10. 3.93, 1H, d, 0.8 56.0 10a - 142.1 11 7.51, 1H, d , 0.8 120.1 11a - 133.3 12 - 180.9 12a - 132.1 13 1.44.3H, s 28.7 14 - 173.0 15 3.90, 3H, s 52.6 107053 22

Viitejulkaisutreference Publications

Aoki, M., Shirai, H., Nakayama, N., Itezono, Y., Mori, Mitsuko, Satoh, T., Ohishima, S., Watanabe, J. ja Yokose, K. 1991. Structural studies on avidinoru-bicin, a novel anthracycline with platelet aggregation inhibitory activity.Aoki, M., Shirai, H., Nakayama, N., Itezono, Y., Mori, Mitsuko, Satoh, T., Ohishima, S., Watanabe, J. and Yokose, K. 1991. Structural studies on avidinoru- bicin, a novel anthracycline with platelet aggregation inhibitory activity.

J. Antibiot. 44: 635-645.J. Antibiot. 44: 635-645.

Bibb, M.J., Janssen, G.R. ja Ward, J.M. 1985. Cloning and analysis of the promoter region of the erythromycin resistance gene (ErmE) of Streptomyces erythra-eus. Gene 38: 215-226.Bibb, M.J., Janssen, G.R. and Ward, J.M. 1985. Cloning and analysis of the promoter region of the erythromycin resistance gene (ErmE) of Streptomyces erythra-eus. Gene 38: 215-226.

Bhuyan, B.K. ja Dietz, A. 1965. Fermentation, taxonomic and biological studies of nogalamycin. Antimicrob. Ag. Chemother. 1965: 836-844.Bhuyan, B.K. and Dietz, A. 1965. Fermentation, Taxonomic and Biological Studies of nogalamycin. Antimicrob. Ag. Chemother. 1965: 836-844.

Bhuyan, B.K. ja Smith C.G. 1975. In: Antineoplastic and immunosuppressive agents, part II, pp. 623-632. Sartorell, A.C., and Johns, D.G. (eds), Springer-Verlag, Berlin.Bhuyan, B.K. and Smith, C.G. 1975. In: Antineoplastic and immunosuppressive agents, part II, p. 623-632. Sartorell, A.C., and Johns, D.G. (eds), Springer-Verlag, Berlin.

Fujii, I. ja Ebizuka, Y. 1997. Anthracycline biosynthesis in Streptomyces galilaeus. Chem. Rev. 97: 7: 2511-2523.Fujii, I. and Ebizuka, Y. 1997. Anthracycline biosynthesis in Streptomyces galilaeus. Chem. Rev. 97: 7: 2511-2523.

Kawai, H., Hayakawa, Y., Nakagawa, M., Furihata, K., Shimazu, A., Seto, H. ja Otake, N. 1987. Arugomycin, a new anthracycline antibiotic I. Taxonomy, fermentation, isolation and physico-chemical properties. J. Antibiot. 19: 1266-1271.Kawai, H., Hayakawa, Y., Nakagawa, M., Furihata, K., Shimazu, A., Seto, H. and Otake, N. 1987. Arugomycin, a new anthracycline antibiotic I. Taxonomy, fermentation, isolation and physico-chemical properties. J. Antibiot. 19: 1266-1271.

Kunnari, T., Tiukkanen, J., Hautala, A., Hakala, J., Ylihonko, K. ja Mäntsälä, P. 1997. Isolation and characterization of 8-demethoxy steffimycins and generation of 2,8-demethoxy steffimycins in Streptomyces steffisburgensis by the nogalamycin biosynthesis genes. J. Antibiot. 50: 496-501.Kunnari, T., Tiukkanen, J., Hautala, A., Hakala, J., Ylihonko, K. and Mäntsälä, P. 1997. Isolation and characterization of 8-demethoxy steffimycins and generation of 2,8-demethoxy steffimycins in Streptomyces steffisburgensis by the nogalamycin biosynthesis genes. J. Antibiot. 50: 496-501.

. Lomovskaya, N., Doi-Katayama, Y., Filippini, S., Nastro, C., Fonstein, L.,. Lomovskaya, N., Doi-Katayama, Y., Filippini, S., Nastro, C., Fonstein, L.,

Gallo, M., Colombo, A.L. ja Hutchinson, C.R. 1998. The Streptomyces peucetius dpsYand dnrX genes govern early and late steps of daunorubicin and doxorubicin biosynthesis. J. Bacteriol. 180: 9: 2379-2386.Gallo, M., Colombo, A.L. and Hutchinson, C.R. 1998. The early and late steps of daunorubicin and doxorubicin biosynthesis in Streptomyces peucetius dpsYand dnrX genes. J. Bacteriol. 180: 9: 2379-2386.

Madduri, K., Kennedy, J., Rivola,G., Inventi-Solari, A., Filippini, S., Zanuso, G., Colombo, A.L., Gewain, K.M., Occi, J.L., MacNeil, D.J. ja Hutchinson, : - C.R. 1998. Production of antitumor drug epirubicin (4’-epidoxorubicin) and its precursor by a genetically engineered strain of S. peucetius. Nature Biotech. 16: 69- 74.Madduri, K., Kennedy, J., Rivola, G., Inventi-Solari, A., Filippini, S., Zanuso, G., Colombo, A.L., Gewain, K.M., Occi, J.L., MacNeil, D.J. and Hutchinson, - C.R. 1998. Production of the antitumor drug Epirubicin (4'-epidoxorubicin) and its precursor by a genetically engineered strain of S. peucetius. Nature Biotech. 16: 69-74.

Niemi, J., Ylihonko, K., Hakala, J., Kopio, A., Pärssinen, R. ja Mäntsälä, P.Niemi, J., Ylihonko, K., Hakala, J., Kopio, A., Pärssinen, R. and Mäntsälä, P.

1994. Hybrid anthracycline antibiotics: production of new anthracyclines by cloned genes from Streptomyces purpurascens in Streptomyces galilaeus. Microbiol. 140: 1351-1358.1994. Hybrid anthracycline Antibiotics: production of new anthracyclines by cloned genes from Streptomyces purpurascens in Streptomyces galilaeus. Microbiol. 140: 1351-1358.

23 10705523 107055

Otten, S.L., Liu, X., Ferguson, J. ja Hutchinson C.R. 1995. Cloning and characterization of the Streptomyces peucetius dnrQS genes encoding a daunosamine biosyntesis enzyme and a glycosyl transferase involved in daunorubicin biosynthesis.Otten, S.L., Liu, X., Ferguson, J. and Hutchinson C.R. 1995. Cloning and characterization of the genes encoding a Streptomyces peucetius dnrQS gene for a daunosamine biosynthesis and a glycosyl transferase involved in daunorubicin biosynthesis.

J. Bacteriol. 177: 6688-6692.J. Bacteriol. 177: 6688-6692.

Rajgarhia, V.B. ja Strohl, W.R. 1997. Minimal Streptomyces sp. strain C5 daunorubicin polyketide biosynthesis genes required for aklanonic acid biosynthesis.Rajgarhia, V.B. and Strohl, W.R. 1997. Minimal Streptomyces sp. strain C5 daunorubicin polyketide biosynthesis genes required for aklanonic acid biosynthesis.

J. Bacteriol. 179: 8: 2690-2696.J. Bacteriol. 179: 8: 2690-2696.

Strohl, W.R., Bartel, P.L., Li, Y., Connors, N.C. ja Woodman, R.H. 1991. Expression of polyketide biosynthesis and regulatory genes in heterologous strepto-mycetes. J. Ind. Microbiol. 7: 3: 163-174.Strohl, W.R., Bartel, P.L., Li, Y., Connors, N.C. and Woodman, R.H. 1991. Expression of polyketide biosynthesis and regulatory genes in heterologous streptomyces. J. Ind. Microbiol. 7: 3: 163-174.

TorkkeU, S., Ylihonko, K., Hakala, J., Skurnik, M. ja Mäntsälä, P. 1997. Characterization of Streptomyces nogalater genes encoding enzymes involved in glycosylation steps in nogalamycin biosynthesis. Mol. Gen. Genet. 256: 203-209.TorkkeU, S., Ylihonko, K., Hakala, J., Skurnik, M. and Mäntsälä, P. 1997. Characterization of Streptomyces nogalater gene encoding enzymes involved in glycosylation steps in nogalamycin biosynthesis. Mol. Gen. Genet. 256: 203-209.

Ward, J.M., Janssen, G.R., Kieser, T., Bibb, M.J., Buttner, M.J. ja Bibb, M.J. 1986. Construction and characterization of a series of multicopy promoter-probe plasmid vectors for Streptomyces using the aminoglycoside phosphotransferase from Tn5 as indicator. Mol. Gen. Genet. 203: 468-478.Ward, J.M., Janssen, G.R., Kieser, T., Bibb, M.J., Buttner, M.J. and Bibb, M.J. 1986. Construction and characterization of a series of multicopy promoter-probe Plasmid vectors for Streptomyces using the aminoglycoside phosphotransferase from Tn5 as indicator. Mol. Gen. Genet. 203: 468-478.

Wiley, P.F., Kelly, R.B., Caron, E.L., Wiley, V.H., Johnson, J.H., MacKellar, F.A. ja Mizsak, S.A. 1977. Structure of nogalamycin. J. Am. Chem. Soc. 99: 542-549.Wiley, P.F., Kelly, R.B., Caron, E.L., Wiley, V.H., Johnson, J.H., MacKellar, F.A. and Mizsak, S.A. 1977. Structure of nogalamycin. J. Am. Chem. Soc. 99: 542-549.

Wiley, P.F., Elrod, D.W. ja Marshall, V.P. 1978. Biosynthesis of the anthracycli-ne antibiotics nogalamycin and steffimycin. B. J. Org. Chem. 43: 3457-3461.Wiley, P.F., Elrod, D.W. and Marshall, V.P. 1978. Biosynthesis of anthracycline-ne Antibiotics nogalamycin and steffimycin. B. J. Org. Chem. 43: 3457-3461.

Wright, F. ja Bibb, MJ. 1992. Codon usage in the G+C -rich Streptomyces . . genome. Gene 113: 55-65.Wright, F. and Bibb, MJ. 1992. Codon usage in the G + C -rich Streptomyces. . genome. Gene 113: 55-65.

Ylihonko, K., Hakala, J., Niemi, J., Lundell, J. ja Mäntsälä, P. 1994. Isolation and characterization of aclacinomycin A-non-producing Streptomyces galilaeus (ATCC 31615) mutants. Microbiol. 140: 1359-1365.Ylihonko, K., Hakala, J., Niemi, J., Lundell, J. and Mäntsälä, P. 1994. Isolation and characterization of aclacinomycin A-non-producing Streptomyces galilaeus (ATCC 31615) Mutant. Microbiol. 140: 1359-1365.

Ylihonko, K., Hakala, J. ja Mäntsälä, P. 1995. Process for producing anthracycli-. nes and intermediates thereof. WO 96/10581.Ylihonko, K., Hakala, J. and Mäntsälä, P. 1995. Process for producing anthracyclic. nes and intermediates number. WO 96/10581.

Ylihonko, K., Hakala, J., Kunnari, T. ja Mäntsälä, P. 1996a. Production of hybrid anthracycline antibiotics by heterologous expression of Streptomyces nogalater nogalamycin biosynthesis genes. Microbiol. 142: 1965-1972.Ylihonko, K., Hakala, J., Kunnari, T. and Mäntsälä, P. 1996a. Production of hybrid anthracycline Antibiotics by heterologous expression of Streptomyces nogalater nogalamycin biosynthesis genes. Microbiol. 142: 1965-1972.

107053 24107053 24

Ylihonko, K., Tiukkanen, J., Jussila, S., Cong, L. ja Mäntsälä, P. 1996b. A gene cluster involved in nogalamycin biosynthesis from Streptomyces nogalater: sequence analysis and complementation of early-block mutations in the anthracycline pathway. Mol. Gen. Genet. 251: 113-120.Ylihonko, K., Tiukkanen, J., Jussila, S., Cong, L. and Mäntsälä, P. 1996b. A gene cluster involved in nogalamycin biosynthesis from Streptomyces nogalater: sequence analysis and complementation of early-block mutations in the anthracycline pathway. Mol. Gen. Genet. 251: 113-120.

Ylihonko, K., Hakala, J. ja Kunnari, T. 1998. Hybrid anthracyclines from genetically engineered Streptomyces galilaeus strains. No. 981062.Ylihonko, K., Hakala, J. and Kunnari, T. 1998. Hybrid anthracyclines from genetically engineered Streptomyces galilaeus strains. Well. 981,062.

Yoshida, M., Fujioka, A., Nakano, K., Yuasa, C., Toko, T., Takeda, S. ja Unemi, N. 1996. Activity of menogaril against various malignant lymphoma cell lines and a human lymphoma xenograft in mice. Anticancer Res. 16: 2875-2879.Yoshida, M., Fujioka, A., Nakano, K., Yuasa, C., Toko, T., Takeda, S. and Unemi, N. 1996. Activity of menogaril against various malignant lymphoma cell lines and human lymphoma xenograft. in mice. Anticancer Res. 16: 2875-2879.

4 25 1070534 25 107053

SEKVENSSILISTASequence Listing

(1) YLEISET TIEDOT: (i) HAKIJA: (A) NIMI: Galilaeus Oy (B) KATU: Kairiskulmantie 10 (C) KAUPUNKI: Piispanristi (E) MAA: Finland (F) POSTINUMERO: FIN-20760 (ii) KEKSINNÖN NMITYS: Nogalamysiinin bisynteesiin liittyvä geeni-ryhmittymä ja sen käyttö hybridiantibioottien tuotossa (iii) SEKVENSSIEN LUKUMÄÄRÄ: 18 (iv) TIETOKONEMUOTO: (A) TYYPPI: Disketti (B) TIETOKONE: IBM PC-yhteensopiva(1) GENERAL INFORMATION: (i) APPLICANT: (A) NAME: Galilaeus Oy (B) STREET: Kairiskulmantie 10 (C) CITY: Piispanristi (E) COUNTRY: Finland (F) POSTAL NUMBER: FIN-20760 (ii) INVENTION OF THE INVENTION : Gene Grouping on Nogalamycin Bisynthesis and Its Use in the Production of Hybrid Antibiotics (iii) NUMBER OF SEQUENCES: 18 (iv) COMPUTER FORMAT: (A) TYPE: Diskette (B) COMPUTER: IBM PC Compatible

(C) KÄYTTÖJÄRJESTELMÄ: PC-DOS/MS-DOS(C) OPERATING SYSTEM: PC-DOS / MS-DOS

(D) OHJELMA: Patentin #1.0, Versio #1.25 (EPO) (2) SEQ ID NO: 1:N TIEDOT: (i) SEKVENSSIN OMINAISUUDET: (A) PITUUS: 16020 emäsparia (B) TYYPPI: nukleiinihappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: DNA (genominen) (vi) ALKUPERÄ: (B) KANTA: Streptomyces nogalater ATCC 27451 (ix) PIIRRE: • (A) NIMITYS: CDS (= koodaava sekvenssi) (B) SIJAINTI: komplementaarinen (1..1027) (D) MUUT TIEDOT: /funktio= "aminotransferaasi" /geeni= "snogl" (ix) PIIRRE:(D) PROGRAM: Patent # 1.0, Version # 1.25 (EPO) (2) SEQ ID NO: 1 DETAILS: (i) SEQUENCE FEATURES: (A) LENGTH: 16020 base pairs (B) TYPE: Nucleic Acid (C) SURFACE : single-stranded (D) TOPOLOGY: linear (ii) MOLECYL-TYPE: DNA (genomic) (vi) ORIGIN: (B) STRAIN: Streptomyces nogalater ATCC 27451 (ix) FEATURE: • (A) DESCRIPTION: CDS (= coding sequence) (B) ) LOCATION: Complementary (1..1027) (D) OTHER INFORMATION: / function = "aminotransferase" / gene = "snogl" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 1192..2073 ! (D) MUUT TIEDOT: /funktio= "dTDP-glukoosisyntetaasi" /geeni= "snogJ" (ix) PIIRRE:(B) LOCATION: 1192..2073! (D) OTHER INFORMATION: / function = "dTDP-glucose synthetase" / gene = "snogJ" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: komplementaarinen (2106..2822) * (D) MUUT TIEDOT: /funktio» "aminometyylitransferaasi" /geeni» "snogA" • 107053 26 (ix) PIIRRE:(B) LOCATION: Complementary (2106..2822) * (D) OTHER INFORMATION: / Function »" aminomethyltransferase "/ gene» "snogA" • 107053 26 (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: komplementaarinen (2826..3800) (D) MUUT TIEDOT: /funktio= "polyketidisyklaasi" /geeni= "snoaM" (ix) PIIRRE:(B) LOCATION: Complementary (2826..3800) (D) OTHER INFORMATION: / function = "polyketide dicyclase" / gene = "snoaM" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 3799..5025 (D) MUUT TIEDOT: /funktio= "tuntematon" /geeni= "snogN" (ix) PIIRRE:(B) LOCATION: 3799..5025 (D) OTHER INFORMATION: / function = "unknown" / gene = "snogN" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 5088..6356 (D) MUUT TIEDOT: /funktio= "hydroksylaasi" /geeni= "snoaG" (ix) PIIRRE:(B) LOCATION: 5088..6356 (D) OTHER INFORMATION: / function = "hydroxylase" / gene = "snoaG" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: komplementaarinen (6334..7209) (D) MUUT TIEDOT: /funktio= "dTDP-4-dehydroramnoosireduktaasi" /geeni= "snogC" (ix) PIIRRE:(B) LOCATION: Complementary (6334.7209) (D) OTHER INFORMATION: / function = "dTDP-4-dehydro-rhamnose reductase" / gene = "snogC" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: komplementaarinen (7245..8297) (D) MUUT TIEDOT: /funktio= "dTDP-glukoosi-4,6-dehydrataasi" /geeni= "snogK" (ix) PIIRRE:(B) LOCATION: complementary (7245..8297) (D) OTHER INFORMATION: / function = "dTDP-glucose-4,6-dehydratase" / gene = "snogK" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 8537..8941 (D) MUUT TIEDOT: /funktio= "NAME-syklaasi" /geeni= "snoaL" (ix) PIIRRE:(B) LOCATION: 8537..8941 (D) OTHER INFORMATION: / function = "NAME-cyclase" / gene = "snoaL" (ix) FEATURE:

’ (A) NIMITYS: CDS'(A) DESIGNATION: CDS

(B) SIJAINTI: 8992..9699 (D) MUUT TIEDOT: /funktio® "tuntematon" /geeni= "snoK" (ix) PIIRRE:(B) LOCATION: 8992..9699 (D) OTHER INFORMATION: / function® "unknown" / gene = "snoK" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: komplementaarinen (9745..10917) . (D) MUUT TIEDOT: /funktio= "glykosyylitransferääsi" /geeni= "snogD" (ix) PIIRRE:(B) LOCATION: Complementary (9745..10917). (D) OTHER INFORMATION: / function = "your glycosyltransferase" / gene = "snogD" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 11057..11884 (D) MUUT TIEDOT: /funktio= "tuntematon" /geeni= "snoW" 107053 27 (ix) PIIRRE:(B) LOCATION: 11057..11884 (D) OTHER INFORMATION: / function = "unknown" / gene = "snoW" 107053 27 (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 11928..13200 (D) MUUT TIEDOT: /funktio= "glykosyylitransferääsi" /geeni= "snogE" (ix) PIIRRE:(B) LOCATION: 11928..13200 (D) OTHER INFORMATION: / function = "your glycosyltransferase" / gene = "snogE" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: komplementaarinen (13335..13754) (D) MUUT TIEDOT: /funktio= "tuntematon" /geeni= "snoL" (ix) PIIRRE:(B) LOCATION: Complementary (13335..13754) (D) OTHER INFORMATION: / function = "unknown" / gene = "snoL" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 13974..14441 (D) MUUT TIEDOT: /funktio» "homologinen mitramysiiniryhmittymän jntmX:lle" /geeni= "snoO" (ix) PIIRRE:(B) LOCATION: 13974..14441 (D) OTHER INFORMATION: / function »" homologous to the jntmX of the mitramycin moiety "/ gene =" snoO "(ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 14532..15377 (D) MUUT TIEDOT: /funktio= "C-7-ketoreduktaasi" /geeni= "snoaF" (ix) PIIRRE:(B) LOCATION: 14532..15377 (D) OTHER INFORMATION: / function = "C-7 ketoreductase" / gene = "snoaF" (ix) FEATURE:

(A) NIMITYS: CDS(A) DESIGNATION: CDS

(B) SIJAINTI: 15450..16020 (D) MUUT TIEDOT: /funktio» "tuntematon" /geeni» "snoN" (ix) PIIRRE: (A) NIMITYS: sekalainen piirre (B) SIJAINTI: 3799..3800 (D) MUUT TIEDOT: /huom.» "geenien snoaM ja snogN päällekkäin menevä sekvenssi" . (ix) PIIRRE: (A) NIMITYS: sekalainen piirre (B) SIJAINTI: 6334..6356 (D) MUUT TIEDOT: /huom.= "geenien snoaG and snogC päällekkäin menevä sekvenssi" (ix) PIIRRE: (A) NIMITYS: sekalainen piirre . (B) SIJAINTI: 13201..13300 * (D) MUUT TIEDOT: /huom.» "tuntematon alue" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 1: AGATCTCGTC CGCCAGTGCC TCGGTGACCG GCAACGAGCC CTTGGCGTAG CCGAGATGGG 60 AGAAACCGGT CATGGTGTGC ACGGGCCAGG GATAACTGAT GTTGAGGGCG ATGTCGTAGG 120 • - 28 107053 AGGCGCGCAG GGCCTCCAGC ACCGCGTCCC GTCGCGGATG GCGCACCACG TACACGTAGT 180 AGACGTGCTC GTTGCCCTGC GCGGTCCTCG GCAGCAGCAG CCCCGTGTCC GCCAGGCCCT 240 CCTCATAGCG GCGTGCCACC GCCCGGCGGG CCTCGATGTA GGACGGCAAC CGGGACAGCT 300 TGCGCCGCAG GATCTCTGCC TGTACTTCGT CCAGCCGGCT GTTGTGCCCG GGGGTTTCGA 360 CGACGTAGTA GCGGCTCTCC ATGCCGTAGT AGCGCAGCCG CCGCAGCCGG TCCGCCACCC 420 GCTCGTCGTC GGTGAGCACC GCGCCGCCGT CCCCGTACGC GCCCAGCACC TTGGTCGGGT 480 AGAAGGAGAA CGCGGCCGCG TCACCGGTCG AGCCGGCGAG TCGGCCGTGC CGGCGCGCCC 540 CGTGCGCCTG CGCGCAGTCC TCCAGGATCA CCAGGTTGTG CCGGGCGGCC AGATCGCGCA 600 GCGGTGCCAT GTCCACGCAC TGCCCGTAGA GGTGGACCGG CAGCAGACAC CGGGTGCGTG 660 GCGTGAGGAC GGCCTCCACC TGGGACGTGT CCATCAGGTA GTCCTCCTCG CGCACGTCCA 720 CGAAGACGGG CGTGGCACCG GCCGAGTCGA TCGCGACGAC CGTGGGCGCG GCGGTGTTGG 780 ACACGGTGAC GACCTCGTCG CCGGGCCCGA CACCCAAGGC CTGTAACCCC AGCTTGACGG 840 CGTTGGTCCC GTTGTCGACG CCGACGGCAT GTCCGACGCC CTGGAATGAG GCGAACTCGG 900 ACTCGAAGCC GCGCACGCTC TCACCGAGGA CGAGCCGGCC GGAGCGGAAC ACCGTCTCCA 960 CGGCATCGTG GATGTCCTCG CGTTCCAGCT CGTATTCCGG CAGATAGTCC CACACGTGTA 1020 CGGTCATCGA GCCCCTCCGG GATTCTCCCT GCGAAAAGTC ACCACTCTAC GACAACGTTC 1080 ACCACTCGCT TTTTCCTCAA CGTCCGCTTG AGACGGCCCG GCCTGCTGTG GCCCGGGGAA 1140 AGGTGCGGTC GTTATCATCG ACTCCGTCTT CTCATTCGGA GGTTGTTCAG GGTGAAGGGA 1200 ATCATTCTCG CCGGGGGTAC GGGGAGCAGG CTCCACCCGA CGACTCTCGC GGTGTCCAAG 1260 · CAGCTTCTCC CCGTCGGGGA CAAGCCGATG ATCTACTACC CGCTCTCCGT GCTGATGCTG 1320 GCCGGCGTCA CGGACATCCT CATCATCAGC ACACCGCACG AACTCCCCCG AATGCGCCGT 1380 CTGTTCGGCG ACGGCGCACA GCTCGGACTC CGCCTGGCCT ACGCCGAGCA GGAGAAACCC 1440 AGGGGTATCG CCGAGGCGTT CCTGATCGGT GCCGACCACG TGGGAAGCGA TGCCGTTGCG 1500 !! CTGGCGCTGG GCGACAACAT ATTCCACGGG AGTTCTTTTC AGGGGGTGCT GCGCAAGGAA 1560 GCCGAGGAAT TGGACGGGTG TGTCCTGTTC GGTTATCCGG TCAAGGATCC CCAGCGTTAT 1620 GGAGTCGGCG AGGCGAACGC GTCCGGGCGG CTCGTCTCCA TCGAGGAGAA ACCGGTACGC 1680 CCCCGCTCCA ACCGGGCCAT CACCGGACTC TATTTCTACG ACAACGAGGT GGTGGACATC 1740 GCCCGGCGGC TGCGCCCCTC CGCCCGCGGC GAACTCGAAA TCACCGACAT CAACCGTACC 1800 • < 107053 29 TACATGGAAC GAGGCCGGGC CCGGCTCGTG GACCTGGGCC GGGGATTCGC CTGGCTCGAC 1860 ACCGGCACAC CCGAGTCACT CCTGCAGGCC TCGCAGTACG TGTCCGCCCT GGAGGAACGC 1920 CAGGGCATCA GGATCGCCTG CATCGAGGAG GTGGCCCTCC GCATGGGCTT CATCAACGCC 1980 CAGGCCTGCT ACGAACTGGG CGCGCGCCTG TCCGGCTCCG GCTACGGGCA GTACGTGATG 2040 GCCATCGCGG AGGAGTGCAC GGGGCGGGTG TGAGCGGCCG TGCCGGGTGG GCGAACGGCC 2100 CGGCCTTACC CGGCCCCGCG CACCCCGACG AACAACCCCC GGCCGGTCAG CCCGTCGTCC 2160 AGGAACTCGG CCGGGCAGCC CGCGTCCTCG AACGCGGCGA GGTACTCCTC CCTGGTGAAC 2220 AGGGTGAGCA GGTCGATCTC CGTGAACTCG CGTATCCCGG TGGCCTCGCC GACCAGGAAC 2280 CGCACCTCCA TGCGGGTCCT GCGGCCCTGC CTGGTGGAGT GGGACACCCG GGCCACGGTC 2340 CGGCCCTCAC CGCGTGCCAG GTCCCCGGCG ACGTAGCCCT CCAGGAACCG CTCGGGGAAC 2400 CACCAGGGCT CCACCACGAG CACGCCGCCC GGCACCAGGT GCGCGGCCAT CGTGCGCACC 2460 GCCGCCCGCA TGTCCGCGAC GGTCTCCAGA TACCCGATGG AGCAGAACAG GCAGACCACG 2520 GCGTCGAAAC GCCCGCTCAG GGCGAAGTCG CGCATGTCCC CGGGCCGCAC CGGCACCCCC 2580 GGCAGCCGCC GTTCGGCCAG GGCCCGCATC TCGTCCGACA GCTCCAGGCC CTCCGTGTGC 2640 GCGAACAGCC CGCGGAAGGC CTCCAGATGG GCGCCGGTGC CGCAGGCGAC GTCGAGCAGC 2700 GAACGCGCCC CGGGCCGACG GGACCTGATC TCCGCGGTGA CCCGTTCGGC CTCGTCCGCC 2760 CAGCTCTTTC CCCGGCTGCG GTAGACCATC TCGTACACGT CCGCCAGTTC CCGGCCGTAC 2820 ACGCGTCAGT CCTCGTCCAC CAGGGCGACC GCCCGGGTCC ACCCGGCGCC GGCGCCGGCG 2880 ACCTTGACCG GGAAGCAGCA GACGCGGAAC CCGAAGGAGA CCGGCAGGCG GTCGAGGTTC 2940 < GCCAGCCGCT CGATCTGGCA GTACTCCCGC TCCCGGCCCA CCACGTGCGC GGGCCACAGC 3000 ACCGATCGGT CGCCGGTCGC GCGGTACCGG TCGATGATGT GGCCGAAGGG CGCGTCCAGG 3060 CTGAAGGCAT CGGTCCCGAT CACCCGGACC CCGTGGTCGA GAAGCATCCG TACCGCGGGC 3120 CCGTCGAGAC CGGCGAAGTC CGTGAAGTAG CGCGGGGTGC CCGCGTGCCG CTGGGCACCG 3180 *! GTGTGCAGCA GCACGATGTC CCCGGGCCGC AACGCGCACC CGGTCCGGGC CAGTTCCTTC 3240 TCCAGGCGCG CGGCGCTCAC GGTGCCCGTC GGAGCGTCGG TGAGGTCCAG CACCACCCCG 3300 CGCCCGAAGA ACCACTCCAG CGGCATCTGG TCGATGTGGC GGGGGACGCC GTCCCCGTAC 3360 AGCGCGCGCG AACCATAGTG CGACGGCGCG TCGACGTGCG TGCCGGTGTG CGTGGTCAGC 3420 . . GTGATCCTGT CCAGTGACAG GAACTCGCCG TCCGGCAGTT CGTCCGGAGA GAACTCGACA 3480 30 107053 CCGAAGTGCT CGCGCATCTC CGCGCACATG TGTTCCGCGC CCTGCCGGGG CGTGAGGACG 3540 TCGTGCACCA CCGGGTCGGG CTCGTACTGT GAGGAATCCA CCGGTGACGA AAGGTCGATG 3600 AGCCGCACGC GCACCTCCGG GTTCGTAGAC GGGCTCGGCT GACGCAGCGC GGGTACGACG 3660 CTGACACGCC CCTCTTGACG TGGCCTGGAA GCTGGTTCGA CGGGCGGGCA CCGCACGCGA 3720 CGGCCGGCGC CGCACCGGCG CCGTCCCGGC CGAGCGGGAA TCCAGGGAGG GTATAGCGGC 3780 GCGCCCCACG CTGCCGTCAT GGTGATGAAA CTGACGGACA GCGAGCTGGG GCGTGCGCTG 3840 CTCTCGCTGC GTGGTTACCA GTGGCTCCGC GGCATCCACC ACGATCCCTA CGCCCTGCTG 3900 CTGCGCGCCG AGAGCGACGA TCCGGCGCAG CTCGGCCGGC TGCTGCGTGA ACGCGGCCGG 3960 CTCCACCGCA GCGACACCGG CACCTGGGTC ACCGCGGACC ATGCGACGGC CTCCCGGCTG 4020 CTCGCCGACC CGCGCTTCGT GCTGCGCCGC CCGCCGGCCG GGCCCGCCAC CGGCACCGGG 4080 GACGTCATGC CGTGGGAAGA GGCCACGCTG AGCGACCTGC TGCCCCTCGA CGAGGCGCGC 4140 CTGACGACCG ACCGGGCACG GTGCCGCCGG CTCGGCGCGA CCGCCGCGCG GATCGCGGCG 4200 GACGGTCCCG TCGCGACGCG ACTCGCGGAC CTGGCCGGGG CCCGAGCCGA ACAGGTGCGC 4260 TCAACGGGCC ACTTCGACCT CAGGGCCGAC TACGCCCTCC CGTACGCGGT CGAGCCGGCC 4320 TGCGCGCTGC TCGGCCTGCC GGCCGGGCAG TGTTCCCTCT TCGGCGCCTT 'CTCCCCGGCC 4380 GTCCTGCTCG ACGCGACGGT CGTACCGCCC CGCCTTCCGG AGGCGCGCGC CCTGATCGCC 4440 TCCACGGCGG AACTGACCGC CCTCTGGCCG CGGCTGGCCC CGAGCCTGTC GAAGACCGTC 4500 CCGGAGGACG AAGCGCCGGA CCTCTTCCTG CTGACGGCCG TGTTACTCGT ACCGGCCGTC 4560 GTCCACCTGG TCTGCGAGGC GGTCGCCGCC CTGTCGCACG ACCCCGGGCA GGCCGGGCTG 4620 CTCAGGGACG ACCCGGTACT CGCCGCACCG GCGGTCGAGG AGACGCTGCG CCACGCACCG 4680 CCCGCCCGTC TGTTCACCCT CCACGCGACC GGACCGGAGC GCGTCGCGGA CGTCGACCTC 4740 CCCGCGGGCG CCGAGGTCGC CGTCGTCGTG GCGGCGGCGC ACCGCGATCC CTCCTGGTGC 4800 CCGGACCCCG ACCGCTTCGA CCTCACCAGG AACGAGCGGC ATCTGGCACT GCCGCCGGAT 4860 **; CTGCCGCTGG GGGCGCTCGC CCCGCTGCTG CGCGTCTGCG CGACCGCGGC CGTCGCGGCC 4920 CTCGCGGCCG GACTCCTCCC GCTGCGGGCC GTCGGCCCGC CCGTACGACG GCTGCGTGCC 4980 CCGGTCACCC GGTCCGTGCT GCGCTTCCCC GTCGCCCCGT GCTGAGCAGC CCCTCCTCAC 5040 GTCATCCCCG GCCCGCCTTC CCCCGCCCGC AACGGAAGGG ACTCTCCATG GACAACCGCG 5100 AGACCGTACG ACCGGTGAGC GTCTGCCGGG TCTGCGGCGG CAACGACTGG CAGGACGTCG 5160 « 107053 31 TGGACTTCGG TGACGTTCCC CTCGCCAACG GCTTCCTGTC CCCGGCCGAC TCCTACGAGA 5220 ACGAGCGCCG CTACCCGCTG GGCGTCCTGT CCTGCCGCGC CTGCCGGCTG ATGAGCCTGA 5280 CCCACGTGGT CGACCCCGAG GTGCTGTACC GCGACTACGC CTACACCACC CCCGACTCCG 5340 AAATGATCAC CCAGCACATG CGGCACATCA CCGCGCTGTG CCGCACCCGT TTCGAGCTTC 5400 CCCCGGACÄG CCTCGTCGTG GAGCTGGGCA GCAATACCGG CCGTCAGCTC ATGGCCTTCC 5460 GCGAAGCGGG GATGCGCACC CTGGGCGTGG ACCCCGCGCG CAACCTCACG GACGTCGCCC 5520 GGCGCAACGG CATCGAGACC TTCCCCGACT TCTTCTCCCA CGACGTGGCC CGCACCATCC 5580 GGCGCGACCA CGGGCAGGCG CGGCTCGTGC TGGGACGGCA TGTCTTCGCC CACATCGACG 5640 ACGTGTCGGA CATCGCGGCC GGCGTACGCG AACTCCTGTC TCCCGACGGG GTGTTCGCGA 5700 TCGAGGTGCC GTACGTTCTG GACCTGCTGG AGAAGGTCGC GTTCGACACC ATCTACCACG 5760 AGCACTTGTC GTACTTCACC ATGCGGTCCT TCGTCACCCT CTTCGCGCGC CACGGGCTGC 5820 GGGTGCTCGA CGTGGAGCGG TTCGGCGTGC ACGGCGGATC GGTCCTCGTC TTCGTGGGCC 5880 ACGAGGACGG CCCCTGGCCC GAACGTCCCT CCGTCCCCGA ACTGCTGCGC GTGGAACGGC 5940 AGCGGGGCCT CTACGACGAC GCCACCTACC GCACGTTCGC GCAGCGGATC GAGCGGGTGC 6000 GCACCGAACT GCCGGAACTG CTGCGCTCCC TCGTGGCCCA GGGCAAGCGC ATCGTCGGCT 6060 ACGGTGCTCC GGCCAAGGGC AACACCATCC TCACGGTGTG CGGGCTCGGC CTGAAGGAGC 6120 TGGAATACTG CACCGACACC ACCGAGCTGA AGCAGGGCAG GGTGCTGCCC GGCACCCACA 6180 TACCGGTGCA CGCTCCCGAG CACGCCAAGG AACACATCCC CGACTACTAC CTGTTGCTCG 6240 CCTGGAACTA CGCCACGGAG ATCCTCGACA AGGAGACGGC CTTCCGGGAC AACGGCGGCC 6300 GGTTGATCGT GCCCATCCCC CGCCCGTCGA TCCTCACGTC CCCGTCAGGT TCCTGAGGCG 6360 CCCGCCGGGC AGCAGCTGAC GCATCGCCTC GCGCAGGGCT GCACGCCAGT CGCGGGGCGG 6420 TGCGACGCCG ACCAGCCGCC AGCGGTCGTG CCCGAGCACC GTGCACGCCG GCCGGGGCGC 6480 CGGGCCCGGC CGGTCGGCCG TCGCCACCGG GCGCACCCGT TCCGGGTCCG CGCCCGCCAG 6540 ! CCGGAACACC TCCCGGGCCA GCTCGTACCA GGTGGCCGCC CCGGCGTTGG TGGCGTGGAA 6600 GATCCCGCGC GCCCGGTCTG GCGGCGTGCG GGCCAGCGTC ACCAGCAGCC GGGCCACGTC 6660 ACCGGCCCAC GTCGGCTGCC CCCACTGGTC GTTGACGACG TCGACATGGC CGTCGTCCGG 6720 GGCACGCTCC AGCATCGTGC GCACGAAGCT GCGGCCCTGC CCGCCGTAGA GCCACGCCGT 6780 ; GCGCACCACG GTGCCCGTAT CCGGCAGCAG CGACAGCACG GCCCGTTCCC CGGCCAGTTT 6840 107053 32 GCTGCGGCCG TACACCGTGC GCGGGCCCGG AGCGTCCGAC TCGCCGTAAG GGCTGCGGGT 6900 GTCGCCCGGG AAGACGTAGT CGGTCGAGAC GTGGATCAGC CGTACGCCGT GGCGCGCACA 6960 GCGGCGGGCC AGCAGCCGGG GCCCGCCGCC GTTGACGCGC ATCGCCTCCG CCCACCGCGA 7020 CTCGGCGCCG TCCACGTCCG TGAAGGCGGC GCAGTTGACC ACCACCCGCG GCCGGTGCGC 7080 GGCGAACGCG GCGTCCACCG CCCGCCCGTC GGTGATGTCC AGCGCGCGCC GCCCGAGTAC 7140 CACCGCCTCG GCGGCGGGCC GGCTCCTGCC GGTCTCCGCC AGGGCCGCGG TCAGGTGCCG 7200 GGCGAGCATG CCTTCTCCTC CGGTGACCAG CACGCGCATC CCGCTCACCG GACCCCGGGG 7260 ACGACGGTGG ACGTACCGCC CGGCGCCGTG ACTCCCCGCT TGAGCGGCTC CCACCAGGAC 7320 CGGTTCTCGC GGTACCACTG GACCGTCGAG CGCAGCCCCG AGGAGAACTC CCGCGCCGGA 7380 CGGTAGCCCA GTTCCTCACG GGCCCTGCCC CAGTCCAGGC TGTAACGCAG GTCGTGCCCC 7440 TTGCGGTCGG GCACGTGCCG GACGCTGCTC CAGTCCGCCC CGCACAGCTC CAGCAACATA 7500 CCCACCAGCT CCCGGTTGGA GAGCTCCCGG CCGCCGCCGA TGTGGTACAC ACCGCCGGGC 7560 CGGCCCGCGG TGCGCACCAG GTCCACGCCC CGGCAGTGGT CCTCCACGTG CAGCCACTCC 7620 CGCACGTTCC GCCCGTCCCC GTACAGCGGC ACCGGCAGCC CGTCCAACAA GTTGGTGACG 7680 AAGCGCGGGA TGAGCTTCTC CGGGTGCTGA CGCGGGCCGT AGTTGTTGGA ACAGCGGGTC 7740 ACCCGCACGT CCAGGCCGTG CGTGCGGTGG CAGGCGAACG CCATCAGGTC GGCCGACGCC 7800 TTGGAGGCGG CGTACGGGGA GTTGGGGCTC AGCGGGTGCT CCTCCGGCCA GGAACCGGAC 7860 GCGATGGAGC CGTAGACCTC GTCCGTGGAC ACCAGGACGA AGGGCTCCAC GCCGTGGCGC 7920 . . AGCGCGGCGT CCAGCAGCCG CTGGGTGCCG ACGACGTTGG TCAGCACGAA GTCGTCGGCC 7980 • > < GCGCGGATGG ACCGGTCGAC GTGCGACTCC GCGGCGAAGT GGACGACCTG GTCGCTGTGT 8040 GCCATCAGCT CGTCGACCAG CTCGGCGTCG AGGATGTCGC CCCGCACGAA GCGCAGCCGG 8100 TCACCGCGTA CCGCGTCCAG GTTCGTGAGG TTGCCCGCGT ACGTCAGTTT GTCGAGGACG 8160 GTGACGCGTA CCGCCGGGGC CCCCGCTCCG GGGGCCCGGT TCTCCAGCAG CATGCGCACA 8220 1 TAGGCCGAGC CGATGAAACC GACCGCGCCG GTGACCAGGA TGTTCACGTC CGTCGTCGCG 8280 GAGGTGTGCG ACGCCATGGG TTCCCTCCAT CCGTCGGGTG CCGTGGGGCG GAGTGCGCCC 8340 CCTCGACCCA GCGTCGGGGG CGGCCGTGGA GGAGCGGTTG AGCTTCGGCG CAGCGGCGGC 8400 TCGACCGGCG GCGGCCGGCG TCGCCGGACT CCAACGGTTC TCGACGGAAC GACCAACGGC 8460 ; CCTGGCGAGA CTGCCCGGAC AGCCCGGCCG AGAGAGGGAG GACCCGTTGA GCCGTCAGAC 8520 107053 33 AGAGATCGTC CGCCGGATGG TGAGCGCCTT CAACACCGGC AGGACCGACG ACGTGGACGA 8580 GTACATCCAC CCCGACTACC TCAATCCGGC CACCTTGGAA CACGGCATCC ACACCGGGCC 8640 CAAGGCGTTC GCCCAGCTGG TCGGCTGGGT GCGGGCGACG TTCTCCGAGG AAGCCCGCCT 8700 GGAGGAGGTG CGGATCGAGG AGCGCGGCCC GTGGGTCAAG GCCTACCTCG TGCTCTACGG 8760 CCGCGACGTC GGCCGGCTTG TCGGTATGCC GCCCACCGAC CGGCGCTTCT CCGGTGAACA 8820 GGTGCACCTG ATGCGCATCG TCGACGGGAA GATCCGCGAC CACCGGGACT GGCCCGACTT 8880 CCAGGGGACG CTGCGCCAGC TCGGCGACCC GTGGCCCGAC GACGAGGGCT GGCGTCCGTG 8940 ACCGTCCCTG AAACCGCACC CGACGAGACA TCAGACCAGG AAGGATGGCT CATGCCGGAT 9000 CCCGGCGGCC CGACCACGGC CGAGAACCTG TCGAAGGAGG CTGTCCGCTT CTACCGCGAG 9060 CAGGGTTACG TGCACATCCC GCGCGTCCTG TCGGAGACGG AGGTGACCGC CTTCCGGGCC 9120 GCCTGTGAGG AGGTCCTGGA GAAGGAGGGC CGCGAGATCT CCGGCATCGC CCTGCGGCTG 9180 GCCGGCGCGC CCCTGCGGGT CTACAGCAGC GACATCCTGG TCAAGGAGCC CAAGCGCACC 9240 CTGCCCACCC TGGTCCACGA CGACGAGACG GGACTGCCGC TGAACGAGCT GAGTGCCACG 9300 CTGACGGCCT GGATCGCGCT GACGGACGTA CCCGTCGAAC GCGGCTGCAT GAGCTACGTG 9360 CCGGGCTCCC ATCTCAGGGC CCGCGAGGAC CGGCAGGAGC ACATGACCAG CTTCGCCGAG 9420 TTCCGGGACC TCGCGGACGT GTGGCCCGAT TACCCGTGGC AGCCGCGCGT CGCCGTGCCC 9480 GTCCGCGCCG GAGACGTCGT GTTCCACCAT TGCCGTACCG TCCACATGGC CGAAGCCAAC 9540 ACCAGCGACT CGGTCCGCAT GGCGCATGGC GTCGTCTACA TGGACGCGGA CGCCACCTAC 9600 CGGCCGGGCG TCCAGGACGG CCACCTGTCC CGCCTGTCGC CGGGAGATCC ACTCGAAGGC 9660 GAGCTGTTCC CCCTGGTCAC GGCAGGCACA CGGCAGTGAG GTCCGCCGTT CCCGGCGGTC 9720 GCGGGACCGC CGGGGACGGC ACCGTCAGCC GGCCAGCGCC ACGAGCTTGG CGGCCGTCTC 9780 GGCCGGCGGC GGCATCTCGC TCATCTCCTG CCGCACCCGC AGGGCCGCCT CCCGCAACCC 9840 CGCGTCGTCC AGCAGCCGTC GGCACTGCTC GGCACCCAGC GATCCCGCCT CGGCATCGAA 9900 II CCCGATGCCC AGCCCGGTCA GCACATCGCG GTTGGTGTCC TGGTAGGAGC CGTGCGGGAT 9960 GACGCACTGC GGGACGCCGG CGGCCAGGGC CGTCAGCAGT GTGCCGCTGC CCCCGTGATG 10020 GATGATCGCG TCGCACGTCT CCAGCAGCGC GCCCAGCGGA ATCCACTCCA CCACCGGTAC 10080 GTTCGCGGGC AGTTCACCGA GCAGGGCCAG GTCGCCGCCG CCCAGGGTCA GCACGAACTC 10140 , . CGCGTCCACG TCCGCCACTT CGGAGAACAG CGGGGCCAGC TTGGCGATGC CGCCCGACAG 10200 • · 107053 34 CGCGTCGATG GAGCCCAGCG TCACCGCGAT ACGCCGCCGG CCGGCCGCGG GCGGCAGCCA 10260 GTCCGGCAGC ACCGCTCCGC CGTTGTAGGG GACGTACCGC ATCGGCCÄGG CACCCGGGGA 10320 GCGCCGGTCC TCCGGCAGCA GCGCCTCCAC GCTCGGCGGT GTCGTCGTCA GCCGCACGGA 10380 ACCGGTCGGC TCGCCGGTGA CGCCGTGGCG CTCGTAGTCC TTGGACATCG CCCGCCGGAT 10440 GAGCGCGCCG AGCCCCGGCT CGCTGTCCGC GGGACCCAGC GGCAGCTCTA CGCACGGCAG 10500 TTGCAGCGCT GCCGCCGTCA GCGGGCCCGC GCCCTGTGTC GGAGTGTGCA CGACGAGGTC 10560 GGGCCGCCAG CTCCGCGCCG TCCGCAGCGC CCCGTCGACG GCCACCGCCG ATACCCGGGC 10620 GAACATCTCG GCGAAGAAGC CCTCGCCCAG CCCCTCGGAG TGCATCGGGT CGGTGACGTC 10680 GGTGTCGTCG GGCACGAACA GCTTCGCGTA GTTCACGCCG GGCGACACGT CCACGGCGCA 10740 GAGCCCGGCC TCCGCGACGG CGCGGATGTC GCCCCCCGTG GCGTAGCGGA CCTCGTGGCC 10800 GAGAGCGCGC AGCGCCTGTG CCAGCGGCAC CGTCGGCAGG ATGTGGCTGA GCCCGGGTGA 10860 AGTGATGAAC AACGCACGCA TGATGCCCCC TGTTCGACAT GAACCTGGAA CACGCATCCT 10920 GACGGCGCCT TCTGTTGCTC CGGTCGACGC CCGGTCGACA GGCCCTCGTA CAGCCCGCCG 10980 GGGGCCGGTC CGGCCACGAC GCAGGCTCCA GCGGACGTCG ACGGCGGGGA CGCAGCGTGG 11040 TCGCCGGGAG GCATCGATGA CAGTATTGGT AACCGGAGCC ACAGGAAACG TCGGCCGGCA 11100 CGTCGTCACC GGGCTACTGG CCGCCGGCCG CCGGGTGCGG GCGCTGACCC GCACACCCGA 11160 CCGGTCCGGC CTGCCCGGCG GCGCGGAGAT CACAGGCGGC GACCTGACCC GCCCGGAGAC 11220 CTACGAGCGG ATGCTGGACG GTGTCGAAGC CGTCTACCTG TTCCCCGTCC CGGAGACCGC 11280 CGCGGCGTTC GCCGGGGCCG CGCGACGGGC CGGTGTCCGG CGGATCGTGG TGCTCTCCTC 11340 GGACTCCGTC ACCGACGGCA CCGACACCGG AGGACACCGG CGCGTGGAAC TGGCCGTGGA 11400 GGACACGGGG CTCGAGTGGA CCCATGTGCG CCCCGGCGAG TTCGCGCTCA ACAAGGTCAC 11460 CCTGTGGGCG CCGTCGATCC GCGCGGAGGG CGTCGTCCGG TCCGCGTATC CGGACGCCCG 11520 GGTGGCCCCG GTGCACGAGG CCGACGTCGC GGCCGTCGCG GTGACCGCGC TGCTGAAGGA 11580 !! GGGGCACGCC GGCCGCGCCT ACAGCGTGAC CGGACCGCAG GCCCTCACCC AGCGCGAACA 11640 GGTCCGCGCG GTAGGGGAGG GGCTCGGCCG GTCCCTCGCC TTCGTCGAGG TGACCCCCGG 11700 GCAGGCGCGG GCCGACCTGA CCGCCCAGGG GCTGCCCGCG CCCATCGCCG ACTACGTCCT 11760 CGCCTTCCAA GCCGGGTGGA CCGAGCGGCC CGCCCCCGCC CGGCCGACCG TGCGGGAGGT 11820 CACCGGCCGG CCCGCCCGCA CGCTCGCCCA GTGGGCCGCC GACCACCGAG CGGACTTCCG 11880 35 107053 GTGACCGGAG ACCGCGTCCA CCGCGCCACG ACAGAAAGGC GACGCCCGTG CGCGTACTGC 11940 TGACGTCCTT CGCCATGGAC GCCCACTTCT GCACCGCCGT GCCGCTGGCG TGGGCACTGC 12000 GGTCGGCCGG GCACGAGGTA CGGGTGGCCG GCCAGCCCGC GCTCACCTCC ACCATCACGG 12060 GAGCCGGCCT GACCGCCGTG CCGGTCGGCC GCGACCACAC GCACGGCAGC CTCCTGGGCC 12120 GGGTCGGCAG CGACATCCTC GCCCTGCACG ACGAGGCGGA CTACCTGGAG GCCCGTCACG 12180 ACGCCCTGGG CTTCGAGTTC CTCAAAGGGC ACAACACGGT GATGTCCGCG TTGTTCTACT 12240 CGCAGATCAA CAACGACTCG ATGGTCGACG ACCTGGTGGA CTTCGCCCGT CACTGGCGGC 12300 CCGACCTGGT CGTCTGGGAG CCGTTCACCT TCGCGGGCGC CGTGGCCGCG CGGGCCTCGG 12360 GCGCCGCCCA CGCCCGCCTG CTGTCCTTCC CCGACCTGTT CCTCAGCACG CGCCGCCTCT 12420 TCCTGGAGCG CATGGCGCGC CAGGAGCCCG AGCATCACGA CGACACACTC GCCGAATGGC 12480 TCGACTGGAC CCTTGGCCGG CACGGCCACT CCTTCGACGA GGAGATCGTC ACGGGGCAGT 12540 GGTCCATCGA CCAGACCCCC GCCCCCGTGC GGCTCGACGC CGGCGGTCCC ACCGTGCCGA 12600 TGCGGTACGT CCCCTACAGC GGACTGGTGC CCACAGTGGT GCCCGACTGG CTGCGCAGGC 12660 CGCCCGAGCG GCCACGGGTC CTGGTCACCC TCGGCATCAC CTCACGGCGG GTGAAGTCCT 12720 TCCTCGCCGT CTCCGTGGAC GACCTTTTCG AGGCCGTGGC CGGGCTCGGC GTCGAGGTGG 12780 TCGCCACCCT CGACGCCGAC CAGCGGGAGC TGCTGGGGCG CGTGCCGGAC CACTTCCGCA 12840 TCGTCGAGCA CGTGCCGCTG GACGCCGTTC TGCCGACCTG CTCGGCGATC GTCCACCACG 12900 GCGGAGCCGG CACCTGGTCG ACGGCCGCCG TGTACGGGGT GCCGCAGGTC TCCCTGGGCT 12960 CGATGTGGGA CCACTTCTAC CGGGCCCGTC GCCTGGAGGA ACTCGGGGCG GGGCTGCGGC 13020 • ' < TGCCCTCCGG CGAGCTGACT GCCGAGGGGC TGCGCACCCG GCTGGAGAGG GTGCTCGGCG 13080 AGCCCTCCTT CGGCACCGCC GCGCAGGCGC TGAGCGACAC CATCGCGGCG GAACCCAGCC 13140 CCAGCGAGGT CGTGCCGGTC CTGGAGGAGC TGACCGGACG GCACCGTCCC GGCACCCGGG 13200 NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN 13260 “ NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN CCGTCCGGGC CCCTCGCCGG 13320 TGAGGGAGCC CGGATCACAG TCCGTCCGGC ACCACGCCCA GGTCCCGGAA CAGCGGGGAG 13380 AAGTTGAAGA CGTCCCAGTG CTCCACGACC TTGCCGGCTT CGGAGAAGCG CAGCTCCTCC 13440 AAGTAGGTCC AGCGGACCTT GCGGCCGGTG GGGGCGATGC CCATGAACAC GCCCTGGTGC 13500 GTGGCCGAGC AGGTGATCCG CAGCATCACG CGGTCGCCCT CGCCCACGAT GCTCCGCACG 13560 • · 107053 36 TCCAGACGAA GGTCCGGGAA GGCCTCCACC GCGCTGTTCA TACGCCGTAC GACCTCCTCG 13620 GCGCTCACCG GTTTGTCCTC GTCGTCGTAG TGGACGACGT CGGGTGCCCA GTGCGCGACC 13680 ACCCCGGAGA CGTCCCACCG GTTCCATGCG GCCACCATCT CCAGGCAGCG TTCCTTGTTC 13740 GCGGTCGTTG ACATGTCGAC TCCTTGAAGG CCCGGGACTA CTGGTCACGC GCCAGCCTTC 13800 CAACCCGCCC CGGAAAAGCG GTGCACGACC GCTGGAGCCC GCACCGGAAC CTGCGCGGCG 13860 GAGCTGAACG GGGTTTCGAG CCGTTCACCA AGGACCTGCC GCAGCCTGTT ACGGCACACC 13920 CTGACGCCTC GCTCCGCGCG GGACGCGCCC GCCGGGAGGA AGGACÄCACC ACCATGTCGG 13980 TACGCACCGA TCAGACGGCG GCACCGGAAG ACCGAGCGGC GGCCACGGAT CCCGGGTTCG 14040 GGCACCTGTA CGCGCAGGTG CAGCAGTTCT ACGCCCGGCA GATGCAGCTC CTCGACTCCG 14100 GCGCGGCCGA GGAGTGGGCC GCCACCTTCA CCGAGGACGG CACGTTCGCC CGGCCCTCCT 14160 CGCCGGAACC GGCACGCGGQ CACGCCGAAC TGGCCGCCGG CGCCCGCGCC GCCGCCGAAC 14220 GCCTCGCCGC CGAGGGCCTT TCGCACCGGC ACGTCATCGG CATGACCGCG GTACGCCGGG 14280 AACCCGACGG CAGCGTGTTC GTACGCAGCT ACGCCCAGGT CTTCGCCACC CGCCGCGGGG 14340 AAGCTCCCCG GCTGCATCTG ATCTGCGTCT GCGAGGACGT GCTCGTGCGG GAGGGGCCGG 14400 GGCTGAAGGT GCGGGAACGG GTTGTCACGC ACGACGCGTG AGGGCGGTCG ACCCGCCGGC 14460 CGAGCCGCAC CTCTGCCACC CCCTCGGCAC GCCAGCCGGC GTCGAGTCCG CTGCGAGAGG 14520 GCGCACTTAG CGTGCGAGCC ATGACTGACT CGACAGGTCC CCGCCCGGTG CCCGCCATGT 14580 CACCCGCCCC CAGCCCCACG CCTTCCCCCG GCCCCGCCCC CGGGAGCGAA CCCGCGCCGC 14640 TCGCCGTGAT CGTCACCGGC GGCGGTTCGG GTATCGGCCG GGCCACCGCC CGCGCCTTCG 14700 « CCGCTCAGGG TGCGAAGGTG CTCGTCGTCG GCCGTACCGA GGACGCGCTC GCGCAGACCG 14760 CCGAGGGCTG TGCGGACATG CGTGTGCTCG TCGCCGACGT GGCCTCGCCC GACGGGCCGC 14820 AGGCGGTCGT CAACGCCGCC CTGCGGGAGT TCGGGAGGAT CGACGTCCTG GTCAACAACG 14880 CTGCCGTGGC GGGCATGGAG ACCCTGCAGA CCGTCGACCG GGACGCCGTG GCACGGCAGT 14940 • < ,·· TCGGCACCAA TCTGACGGCT CCCCTCTTCC TCGTCCAGTC CGCACTCGGC GCGCTGGAGA 15000 AGTCGCGCGG CATCGTCGTC AACGTGGGGA CCGCCGCGAC CCTGGGCCTG CGCGCCGCCC 15060 CGACCGGCGC GCTGTACGGG GCGAGCAAGG TGGCCCTCGA CTACCTGACC CGGACCTGGG 15120 CCGTCGAACT GGCCCCCCGG GGCATCCGTG TCGTCGGCGT GGCACCCGGG GTGATCGACA 15180 . CGGGCATCGG CGTCCGCATG GGCATGACCC CGGAGGGCTA CCGGGAGTTC CTGACCGGCA 15240 • · 107053 37 TGGGCGGCAG GGTGCCCGTG GGCCGGGTCG GCCGTCCGGA GGACGTGGCC TGGTGGATCG 15300 TCCAGCTCGC CCGCCCGGAG GCCGGCTACG CGACGGGCAT GGTCGTCCCC GTCGACGGCG 15360 GGCTGTCGCT GGTCTGACCG GACAAGGAAG GAAATACCGC AGGAAGGAAG TACCGCAGCA 15420 AGGAAATACC GCAGGAAGGA GATATCGCCG TGCAGGAAAC CGAACCCGGC GTCCCCGCGG 15480 ACCTGCCCGC CGAGAGCGAC CCTGCCGCCC TGGAGCGCCT CGCCGCACGG TACCGGCGGG 15540 ACGGCTACGT CCACGTCCCC GGCGTCCTCG ACGCCGGGGA GGTCGCCGAA TACCTGGCCG 15600 AGGCCCGTCG GCTCCTCGCC CACGAGGAGT CCGTGCGCTG GGGCTCCGGC GCCGGCACCG 15660 TCATGGACTA CGTCGCCGAC GCCCAGCTCG GCAGCGACAC GATGCGCCGC CTTGCCACCC 15720 ACCCGCGCAT CGCCGCCCTC GCCGAGTACC TGGCCGGCTC GCCCCTGAGG CTGTTCAAGC 15780 TGGAGGTGCT GCTCAAGGAG AACAAGGAGA AGGACGCCTC GGTCCCCACC GCCCCGCACC 15840 ACGATGCGTT CGCCTTCCCG. TTCTCCACCG CCGGCACCGC CCTGACGGCG. TGGGTCGCGC 15900 TGGTCGACGT CCCGGTGGAA CGCGGCTGCA TGACCTTCGT CCCCGGATCA CACCTGCTGC 15960 CGGATCCCGA TACCGGCGAC GAGCCGTGGG CCGGGGCCTT CACCCGGCCG GGAGAGATCT 16020(B) LOCATION: 15450..16020 (D) OTHER INFORMATION: / function »" unknown "/ gene» "snoN" (ix) FEATURE: (A) NAME: miscellaneous feature (B) LOCATION: 3799..3800 (D) ) OTHER INFORMATION: / Note » "the overlapping sequence of the snoaM and snogN genes". (ix) FEATURE: (A) DESCRIPTION: Miscellaneous Feature (B) LOCATION: 6334..6356 (D) OTHER INFORMATION: /note.= "Overlapping sequence of genes snoaG and snogC" (ix) FEATURE: (A) NAME: mixed feature. (B) LOCATION: 13201..13300 * (D) OTHER INFORMATION: / Note » 'Unknown region "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1: AGATCTCGTC CGCCAGTGCC TCGGTGACCG GCAACGAGCC CTTGGCGTAG CCGAGATGGG 60 AGAAACCGGT CATGGTGTGC ACGGGCCAGG GATAACTGAT GTTGAGGGCG ATGTCGTAGG 120 • - 28 107 053 AGGCGCGCAG GGCCTCCAGC ACCGCGTCCC GTCGCGGATG GCGCACCACG TACACGTAGT 180 AGACGTGCTC GTTGCCCTGC GCGGTCCTCG GCAGCAGCAG CCCCGTGTCC GCCAGGCCCT 240 CCTCATAGCG GCGTGCCACC GCCCGGCGGG CCTCGATGTA GGACGGCAAC CGGGACAGCT 300 TGCGCCGCAG GATCTCTGCC TGTACTTCGT CCAGCCGGCT GTTGTGCCCG GGGGTTTCGA 360 CGACGTAGTA GCGGCTCTCC ATGCCGTAGT AGCGCAGCCG CCGCAGCCGG TCCGCCACCC 420 GCTCGTCGTC GGTGAGCACC GCGCCGCCGT CCCCGTACGC GCCCAGCACC TTGGTCGGGT 480 AGAAGGAGAA CGCGGCCGCG TCACCGGTCG AGCCGGCGAG TCGGCCGTGC CGGCGCGCCC 540 CGTGCGCCTG CGCGCAGTCC TCCAGGATCA CCAGGTTGTG CCGGGCGGCC AGATCGCGCA 600 GCGGTGCCAT GTCCACGCAC TGCCCGTAGA GGTGGACCGG CAGCAGACAC CGGGTGCGTG 660 GCGTGAGGAC GGCCTCCACC TGGGACGTGT CCATCAGGTA GTCCTCCTCG CGCACGTCCA 720 CGAAGACGGG CGTGGCACCG GCCGAGTCGA TCGCGACGAC CGTGGGCGCG GCGGTGTTGG 780 ACACGGTGAC GACCTCGT CG CCGGGCCCGA CACCCAAGGC CTGTAACCCC AGCTTGACGG 840 CGTTGGTCCC GTTGTCGACG CCGACGGCAT GTCCGACGCC CTGGAATGAG GCGAACTCGG 900 ACTCGAAGCC GCGCACGCTC TCACCGAGGA CGAGCCGGCC GGAGCGGAAC ACCGTCTCCA 960 CGGCATCGTG GATGTCCTCG CGTTCCAGCT CGTATTCCGG CAGATAGTCC CACACGTGTA 1020 CGGTCATCGA GCCCCTCCGG GATTCTCCCT GCGAAAAGTC ACCACTCTAC GACAACGTTC 1080 ACCACTCGCT TTTTCCTCAA CGTCCGCTTG AGACGGCCCG GCCTGCTGTG GCCCGGGGAA 1140 AGGTGCGGTC GTTATCATCG ACTCCGTCTT CTCATTCGGA GGTTGTTCAG GGTGAAGGGA 1200 ATCATTCTCG CCGGGGGTAC GGGGAGCAGG CTCCACCCGA CGACTCTCGC GGTGTCCAAG 1260 · CAGCTTCTCC CCGTCGGGGA CAAGCCGATG ATCTACTACC CGCTCTCCGT GCTGATGCTG 1320 GCCGGCGTCA CGGACATCCT CATCATCAGC ACACCGCACG AACTCCCCCG AATGCGCCGT 1380 CTGTTCGGCG ACGGCGCACA GCTCGGACTC CGCCTGGCCT ACGCCGAGCA GGAGAAACCC 1440 AGGGGTATCG CCGAGGCGTT CCTGATCGGT GCCGACCACG TGGGAAGCGA TGCCGTTGCG 1500 !! CTGGCGCTGG GCGACAACAT ATTCCACGGG AGTTCTTTTC AGGGGGTGCT GCGCAAGGAA 1560 GCCGAGGAAT TGGACGGGTG TGTCCTGTTC GGTTATCCGG TCAAGGATCC CCAGCGTTAT 1620 GGAGTCGGCG AGGCGAACGC GTCCGGGCGG CTCGTCTCCA TCGAGGAGAA ACCGGTACGC 1680 CCCCGCTCCA ACCGGGCCAT CACCGGACTC TATTTCTACG ACAACGAGGT GGTGGACATC 1740 GCCCGGCGGC TGCGCCCCTC CGCCCGCGGC GAACTCGAAA TCACCGACAT CAACCGTACC 1800 • <107053 29 TACATGGAAC GAGGCCGGGC CCGGCTCGTG GACCTGGGCC GGGGATTCGC CTGGCTCGAC 1860 ACCGGCACAC CCGAGTCACT CCTGCAGGCC TCGCAGTACG TGTCCGCCCT GGAGGAACGC 1920 CAGGGCATCA GGATCGCCTG CATCGAGGAG GTGGCCCTCC GCATGGGCTT CATCAACGCC 1980 CAGGCCTGCT ACGAACTGGG CGCGCGCCTG TCCGGCTCCG GCTACGGGCA GTACGTGATG 2040 GCCATCGCGG AGGAGTGCAC GGGGCGGGTG TGAGCGGCCG TGCCGGGTGG GCGAACGGCC 2100 CGGCCTTACC CGGCCCCGCG CACCCCGACG AACAACCCCC GGCCGGTCAG CCCGTCGTCC 2160 AGGAACTCGG CCGGGCAGCC CGCGTCCTCG AACGCGGCGA GGTACTCCTC CCTGGTGAAC 2220 AGGGTGAGCA GGTCGATCTC CGTGAACTCG CGTATCCCGG TGGCCTCGCC GACCAGGAAC 2280 CGCACCTCCA TGCGGGTCCT GCGGCCCTGC CTGGTGGAGT GGGACACCCG GGCCAC GGTC 2340 CGGCCCTCAC CGCGTGCCAG GTCCCCGGCG ACGTAGCCCT CCAGGAACCG CTCGGGGAAC 2400 CACCAGGGCT CCACCACGAG CACGCCGCCC GGCACCAGGT GCGCGGCCAT CGTGCGCACC 2460 GCCGCCCGCA TGTCCGCGAC GGTCTCCAGA TACCCGATGG AGCAGAACAG GCAGACCACG 2520 GCGTCGAAAC GCCCGCTCAG GGCGAAGTCG CGCATGTCCC CGGGCCGCAC CGGCACCCCC 2580 GGCAGCCGCC GTTCGGCCAG GGCCCGCATC TCGTCCGACA GCTCCAGGCC CTCCGTGTGC 2640 GCGAACAGCC CGCGGAAGGC CTCCAGATGG GCGCCGGTGC CGCAGGCGAC GTCGAGCAGC 2700 GAACGCGCCC CGGGCCGACG GGACCTGATC TCCGCGGTGA CCCGTTCGGC CTCGTCCGCC 2760 CAGCTCTTTC CCCGGCTGCG GTAGACCATC TCGTACACGT CCGCCAGTTC CCGGCCGTAC 2820 ACGCGTCAGT CCTCGTCCAC CAGGGCGACC GCCCGGGTCC ACCCGGCGCC GGCGCCGGCG 2880 ACCTTGACCG GGAAGCAGCA GACGCGGAAC CCGAAGGAGA CCGGCAGGCG GTCGAGGTTC 2940 <GCCAGCCGCT CGATCTGGCA GTACTCCCGC TCCCGGCCCA CCACGTGCGC GGGCCACAGC 3000 ACCGATCGGT CGCCGGTCGC GCGGTACCGG TCGATGATGT GGCCGAAGGG CGCGTCCAGG 3060 CTGAAGGCAT CGGTCCCGAT CACCCGGACC CCGTGGTCGA GAAGCATCCG TACCGCGGGC 3120 CCGTCGAGAC CGGCGAAGTC CGTGAAGTAG CGCGGGGTGC CCGCGTGCCG CTGGGCACCG 3180 *! GTGTGCAGCA GCACGATGTC CCCGGGCCGC AACGCGCACC CGGTCCGGGC CAGTTCCTTC 3240 TCCAGGCGCG CGGCGCTCAC GGTGCCCGTC GGAGCGTCGG TGAGGTCCAG CACCACCCCG 3300 CGCCCGAAGA ACCACTCCAG CGGCATCTGG TCGATGTGGC GGGGGACGCC GTCCCCGTAC 3360 AGCGCGCGCG AACCATAGTG CGACGGCGCG TCGACGTGCG TGCCGGTGTG CGTGGTCAGC 3420. . GTGATCCTGT CCAGTGACAG GAACTCGCCG TCCGGCAGTT CGTCCGGAGA GAACTCGACA 3480 30 107053 CCGAAGTGCT CGCGCATCTC CGCGCACATG TGTTCCGCGC CCTGCCGGGG CGTGAGGACG 3540 TCGTGCACCA CCGGGTCGGG CTCGTACTGT GAGGAATCCA CCGGTGACGA AAGGTCGATG 3600 AGCCGCACGC GCACCTCCGG GTTCGTAGAC GGGCTCGGCT GACGCAGCGC GGGTACGACG 3660 CTGACACGCC CCTCTTGACG TGGCCTGGAA GCTGGTTCGA CGGGCGGGCA CCGCACGCGA 3720 CGGCCGGCGC CGCACCGGCG CCGTCCCGGC CGAGCGGGAA TCCAGGGAGG GTATAGCGGC 3780 GCGCCCCACG CTGCCGTCAT GGTGATGAAA CTGACGGACA GCGAGCTGGG GCGTGCGCTG 3840 CTCTCGCTGC GTGGTTACCA GTGGCTCCGC GGCATCCACC ACGATCCCTA CGCCCTGCTG 3900 CTGCGCGCCG AGAGCGACGA TCCGGCGCAG CTCGGCCGGC TGCTGCGTGA ACGCGGCCGG 3960 CTCCACCGCA GCGACACCGG CACCTGGGTC ACCGCGGACC ATGCGACGGC CTCCCGGCTG 4020 CTCGCCGACC CGCGCTTCGT GCTGCGCCGC CCGCCGGCCG GGCCCGCCAC CGGCACCGGG 4080 GACGTCATGC CGTGGGAAGA GGCCACGCTG AGCGACCTGC TGCCCCTCGA CGAGGCGCGC 4140 CTGACGACCG ACCGGGCACG GTGCCGCCGG CTCGGCGCGA CCGCCGCGCG GATCGCGGCG 4200 GACGGTCCCG TCGCGACGCG ACTCGCGGAC CTGGCCGGGG CCCGAGCCGA ACAGGTGCGC 4 260 TCAACGGGCC ACTTCGACCT CAGGGCCGAC TACGCCCTCC CGTACGCGGT CGAGCCGGCC 4320 TGCGCGCTGC TCGGCCTGCC GGCCGGGCAG TGTTCCCTCT TCGGCGCCTT 'CTCCCCGGCC 4380 GTCCTGCTCG ACGCGACGGT CGTACCGCCC CGCCTTCCGG AGGCGCGCGC CCTGATCGCC 4440 TCCACGGCGG AACTGACCGC CCTCTGGCCG CGGCTGGCCC CGAGCCTGTC GAAGACCGTC 4500 CCGGAGGACG AAGCGCCGGA CCTCTTCCTG CTGACGGCCG TGTTACTCGT ACCGGCCGTC 4560 GTCCACCTGG TCTGCGAGGC GGTCGCCGCC CTGTCGCACG ACCCCGGGCA GGCCGGGCTG 4620 CTCAGGGACG ACCCGGTACT CGCCGCACCG GCGGTCGAGG AGACGCTGCG CCACGCACCG 4680 CCCGCCCGTC TGTTCACCCT CCACGCGACC GGACCGGAGC GCGTCGCGGA CGTCGACCTC 4740 CCCGCGGGCG CCGAGGTCGC CGTCGTCGTG GCGGCGGGGCCGGGCGCGCGCGCGCGCGCGC CTGCCGCTGG GGGCGCTCGC CCCGCTGCTG CGCGTCTGCG CGACCGCGGC CGTCGCGGCC 4920 CTCGCGGCCG GACTCCTCCC GCTGCGGGCC GTCGGCCCGC CCGTACGACG GCTGCGTGCC 4980 CCGGTCACCC GGTCCGTGCT GCGCTTCCCC GTCGCCCCGT GCTGAGCAGC CCCTCCTCAC 5040 GTCATCCCCG GCCCGCCTTC CCCCGCCCGC AACGGAAGGG ACTCTCCATG GACAACCGCG 5100 AGACCGTACG ACCGGTGAGC GTCTGCCGGG TCTGCGGCGG CAACGACTGG CAGGACGTCG 5160 «107 053 31 TGGACTTCGG TGACGTTCCC CTCGCCAACG GCTTCCTGTC CCCGGCCGAC TCCTACGAGA 5220 ACGAGCGCCG CTACCCGCTG GGCGTCCTGT CCTGCCGCGC CTGCCGGCTG ATGAGCCTGA 5280 CCCACGTGGT CGACCCCGAG GTGCTGTACC GCGACTACGC CTACACCACC CCCGACTCCG 5340 AAATGATCAC CCAGCACATG CGGCACATCA CCGCGCTGTG CCGCACCCGT TTCGAGCTTC 5400 CCCCGGACÄG CCTCGTCGTG GAGCTGGGCA GCAATACCGG CCGTCAGCTC ATGGCCTTCC 5460 GCGAAGCGGG GATGCGCACC CTGGGCGTGG ACCCCGCGCG CAACCTCACG GACGTCGCCC 5520 GGCGCAACGG CATCGAGACC TTCCCCGACT TCTTCTCCCA CGACGTGGCC CGCACCATCC 5580 GGCGCGACCA CGGGCAGGCG CGGCTCGTGC TGGGACGGCA TGTCTTCGCC CACATCGACG 5640 ACGTGTCGGA CATCGCGGCC GGCGTACGCG AACTCCTGTC TCCCGACGGG GTGTTCGC GA 5700 TCGAGGTGCC GTACGTTCTG GACCTGCTGG AGAAGGTCGC GTTCGACACC ATCTACCACG 5760 AGCACTTGTC GTACTTCACC ATGCGGTCCT TCGTCACCCT CTTCGCGCGC CACGGGCTGC 5820 GGGTGCTCGA CGTGGAGCGG TTCGGCGTGC ACGGCGGATC GGTCCTCGTC TTCGTGGGCC 5880 ACGAGGACGG CCCCTGGCCC GAACGTCCCT CCGTCCCCGA ACTGCTGCGC GTGGAACGGC 5940 AGCGGGGCCT CTACGACGAC GCCACCTACC GCACGTTCGC GCAGCGGATC GAGCGGGTGC 6000 GCACCGAACT GCCGGAACTG CTGCGCTCCC TCGTGGCCCA GGGCAAGCGC ATCGTCGGCT 6060 ACGGTGCTCC GGCCAAGGGC AACACCATCC TCACGGTGTG CGGGCTCGGC CTGAAGGAGC 6120 TGGAATACTG CACCGACACC ACCGAGCTGA AGCAGGGCAG GGTGCTGCCC GGCACCCACA 6180 TACCGGTGCA CGCTCCCGAG CACGCCAAGG AACACATCCC CGACTACTAC CTGTTGCTCG 6240 CCTGGAACTA CGCCACGGAG ATCCTCGACA AGGAGACGGC CTTCCGGGAC AACGGCGGCC 6300 GGTTGATCGT GCCCATCCCC CGCCCGTCGA TCCTCACGTC CCCGTCAGGT TCCTGAGGCG 6360 CCCGCCGGGC AGCAGCTGAC GCATCGCCTC GCGCAGGGCT GCACGCCAGT CGCGGGGCGG 6420 TGCGACGCCG ACCAGCCGCC AGCGGTCGTG CCCGAGCACC GTGCACGCCG GCCGGGGCGC 6480 CGGGCCCGGC CGGTCGGCCG TCGCCACCGG GCGCACCCGT TCCGGGTCCG CGCCCGCCAG 654 0! CCGGAACACC TCCCGGGCCA GCTCGTACCA GGTGGCCGCC CCGGCGTTGG TGGCGTGGAA 6600 GATCCCGCGC GCCCGGTCTG GCGGCGTGCG GGCCAGCGTC ACCAGCAGCC GGGCCACGTC 6660 ACCGGCCCAC GTCGGCTGCC CCCACTGGTC GTTGACGACG TCGACATGGC CGTCGTCCGG 6720 GGCACGCTCC AGCATCGTGC GCACGAAGCT GCGGCCCTGC CCGCCGTAGA GCCACGCCGT 6780; GCGCACCACG GTGCCCGTAT CCGGCAGCAG CGACAGCACG GCCCGTTCCC CGGCCAGTTT 6840 107053 32 GCTGCGGCCG TACACCGTGC GCGGGCCCGG AGCGTCCGAC TCGCCGTAAG GGCTGCGGGT 6900 GTCGCCCGGG AAGACGTAGT CGGTCGAGAC GTGGATCAGC CGTACGCCGT GGCGCGCACA 6960 GCGGCGGGCC AGCAGCCGGG GCCCGCCGCC GTTGACGCGC ATCGCCTCCG CCCACCGCGA 7020 CTCGGCGCCG TCCACGTCCG TGAAGGCGGC GCAGTTGACC ACCACCCGCG GCCGGTGCGC 7080 GGCGAACGCG GCGTCCACCG CCCGCCCGTC GGTGATGTCC AGCGCGCGCC GCCCGAGTAC 7140 CACCGCCTCG GCGGCGGGCC GGCTCCTGCC GGTCTCCGCC AGGGCCGCGG TCAGGTGCCG 7200 GGCGAGCATG CCTTCTCCTC CGGTGACCAG CACGCGCATC CCGCTCACCG GACCCCGGGG 7260 ACGACGGTGG ACGTACCGCC CGGCGCCGTG ACTCCCCGCT TGAGCGGCTC CCACCAGGAC 7320 CGGTTCTCGC GGTACCACTG GACCGTCGAG CGCAGCCCCG AGGAGAACTC CCGCGCCGGA 7380 CGGTAGCCCA GTTCCTCACG GGCCCTGCCC CAGTCCAGGC TGTAACGCAG GTCGTGCCCC 7440 TTGCGGTCGG GCACGTGCCG GACGCTGCTC CAGTCCGCCC CGCACAGCTC CAGCAACATA 7500 CCCACCAGCT CCCGGTTGGA GAGCTCCCGG CCGCCGCCGA TGTGGTACAC ACCGCCGGGC 7560 CGGCCCGCGG TGCGCACCAG GTCCACGCCC CGGCAGTGGT CCTCCACGTG CAGCCACTCC 7 620 CGCACGTTCC GCCCGTCCCC GTACAGCGGC ACCGGCAGCC CGTCCAACAA GTTGGTGACG 7680 AAGCGCGGGA TGAGCTTCTC CGGGTGCTGA CGCGGGCCGT AGTTGTTGGA ACAGCGGGTC 7740 ACCCGCACGT CCAGGCCGTG CGTGCGGTGG CAGGCGAACG CCATCAGGTC GGCCGACGCC 7800 TTGGAGGCGG CGTACGGGGA GTTGGGGCTC AGCGGGTGCT CCTCCGGCCA GGAACCGGAC 7860 GCGATGGAGC CGTAGACCTC GTCCGTGGAC ACCAGGACGA AGGGCTCCAC GCCGTGGCGC 7920. . AGCGCGGCGT CCAGCAGCCG CTGGGTGCCG ACGACGTTGG TCAGCACGAA GTCGTCGGCC 7980 •> <GCGCGGATGG ACCGGTCGAC GTGCGACTCC GCGGCGAAGT GGACGACCTG GTCGCTGTGT 8040 GCCATCAGCT CGTCGACCAG CTCGGCGTCG AGGATGTCGC CCCGCACGAA GCGCAGCCGG 8100 TCACCGCGTA CCGCGTCCAG GTTCGTGAGG TTGCCCGCGT ACGTCAGTTT GTCGAGGACG 8160 GTGACGCGTA CCGCCGGGGC CCCCGCTCCG GGGGCCCGGT TCTCCAGCAG CATGCGCACA 8220 1 TAGGCCGAGC CGATGAAACC GACCGCGCCG GTGACCAGGA TGTTCACGTC CGTCGTCGCG 8280 GAGGTGTGCG ACGCCATGGG TTCCCTCCAT CCGTCGGGTG CCGTGGGGCG GAGTGCGCCC 8340 CCTCGACCCA GCGTCGGGGG CGGCCGTGGA GGAGCGGTTG AGCTTCGGCG CAGCGGCGGC 8400 TCGACCGGCG GCGGCCGGCG TCGCCGGACT CCAACGGGA CCTGGCGAGA CTGCCCGGAC AGCCCGGCCG AGAGAGGGAG GACCCGTTGA GCCGTCAGAC 8520 107053 33 AGAGATCGTC CGCCGGATGG TGAGCGCCTT CAACACCGGC AGGACCGACG ACGTGGACGA 8580 GTACATCCAC CCCGACTACC TCAATCCGGC CACCTTGGAA CACGGCATCC ACACCGGGCC 8640 CAAGGCGTTC GCCCAGCTGG TCGGCTGGGT GCGGGCGACG TTCTCCGAGG AAGCCCGCCT 8700 GGAGGAGGTG CGGATCGAGG AGCGCGGCCC GTGGGTCAAG GCCTACCTCG TGCTCTACGG 8760 CCGCGACGTC GGCCGGCTTG TCGGTATGCC GCCCACCGAC CGGCGCTTCT CCGGTGAACA 8820 GGTGCACCTG ATGCGCATCG TCGACGGGAA GATCCGCGAC CACCGGGACT GGCCCGACTT 8880 CCAGGGGACG CTGCGCCAGC TCGGCGACCC GTGGCCCGAC GACGAGGGCT GGCGTCCGTG 8940 ACCGTCCCTG AAACCGCACC CGACGAGACA TCAGACCAGG AAGGATGGCT CATGCCGGAT 9000 CCCGGCGGCC CGACCACGGC CGAGAACCTG TCGAAGGAGG CTGTCCGCTT CTACCGCGAG 9060 CAGGGTTACG TGCACATCCC GCGCGTCCTG TCGGAGACGG AGGTGACCGC CTTCCGGGCC 9120 GCCTGTGAGG AGGTCCTGGA GAAGGAGGGC CGCGAGATCT CCGGCATCGC CCTGCGGCTG 9180 GCCGGCGCGC CCCTGCGGGT CTACAGCAGC GACATCCTGG TCAAGGAGCC CAAGCGCACC 9240 CTGCCCACCC TGGTCCACGA CGACGAGACG GGACTGCCGC TGAACGAGCT GAGTGCCACG 9 300 CTGACGGCCT GGATCGCGCT GACGGACGTA CCCGTCGAAC GCGGCTGCAT GAGCTACGTG 9360 CCGGGCTCCC ATCTCAGGGC CCGCGAGGAC CGGCAGGAGC ACATGACCAG CTTCGCCGAG 9420 TTCCGGGACC TCGCGGACGT GTGGCCCGAT TACCCGTGGC AGCCGCGCGT CGCCGTGCCC 9480 GTCCGCGCCG GAGACGTCGT GTTCCACCAT TGCCGTACCG TCCACATGGC CGAAGCCAAC 9540 ACCAGCGACT CGGTCCGCAT GGCGCATGGC GTCGTCTACA TGGACGCGGA CGCCACCTAC 9600 CGGCCGGGCG TCCAGGACGG CCACCTGTCC CGCCTGTCGC CGGGAGATCC ACTCGAAGGC 9660 GAGCTGTTCC CCCTGGTCAC GGCAGGCACA CGGCAGTGAG GTCCGCCGTT CCCGGCGGTC 9720 GCGGGACCGC CGGGGACGGC ACCGTCAGCC GGCCAGCGCC ACGAGCTTGG CGGCCGTCTC 9780 GGCCGGCGGC GGCATCTCGC TCATCTCCTG CCGCACCCGC AGGGCCGCCT CCCGCAACCC 9840 CGCGTCGTCC AGCAGCCGTC GGCACTGCTC GGCACCCAGC GATCCCGCCT CGGCATCGAA 9900 II CCCGATGCCC AGCCCGGTCA GCACATCGCG GTTGGTGTCC TGGTAGGAGC CGTGCGGGAT 9960 GACGCACTGC GGGACGCCGG CGGCCAGGGC CGTCAGCAGT GTGCCGCTGC CCCCGTGATG 10020 GATGATCGCG TCGCACGTCT CCAGCAGCGC GCCCAGCGGA ATCCACTCCA CCACCGGTAC 10080 GTTCGCGGGC AGTTCACCGA GCAGGGCCAG GTCGCCGCCG CCCAGGGTCA GCACGAACTC 10 140,. CGCGTCCACG TCCGCCACTT CGGAGAACAG CGGGGCCAGC TTGGCGATGC CGCCCGACAG 10200 • · 107053 34 CGCGTCGATG GAGCCCAGCG TCACCGCGAT ACGCCGCCGG CCGGCCGCGG GCGGCAGCCA 10260 GTCCGGCAGC ACCGCTCCGC CGTTGTAGGG GACGTACCGC ATCGGCCÄGG CACCCGGGGA 10320 GCGCCGGTCC TCCGGCAGCA GCGCCTCCAC GCTCGGCGGT GTCGTCGTCA GCCGCACGGA 10380 ACCGGTCGGC TCGCCGGTGA CGCCGTGGCG CTCGTAGTCC TTGGACATCG CCCGCCGGAT 10440 GAGCGCGCCG AGCCCCGGCT CGCTGTCCGC GGGACCCAGC GGCAGCTCTA CGCACGGCAG 10500 TTGCAGCGCT GCCGCCGTCA GCGGGCCCGC GCCCTGTGTC GGAGTGTGCA CGACGAGGTC 10560 GGGCCGCCAG CTCCGCGCCG TCCGCAGCGC CCCGTCGACG GCCACCGCCG ATACCCGGGC 10620 GAACATCTCG GCGAAGAAGC CCTCGCCCAG CCCCTCGGAG TGCATCGGGT CGGTGACGTC 10680 GGTGTCGTCG GGCACGAACA GCTTCGCGTA GTTCACGCCG GGCGACACGT CCACGGCGCA 10740 GAGCCCGGCC TCCGCGACGG CGCGGATGTC GCCCCCCGTG GCGTAGCGGA CCTCGTGGCC 10800 GAGAGCGCGC AGCGCCTGTG CCAGCGGCAC CGTCGGCAGG ATGTGGCTGA GCCCGGGTGA 10860 AGTGATGAAC AACGCACGCA TGATGCCCCC TGTTCGACAT GAACCTGGAA CACGCATCCT 10920 GACGGCGCCT TCTGTTGCTC CGGTCGACGC CCGGTCGACA GG CCCTCGTA CAGCCCGCCG 10980 GGGGCCGGTC CGGCCACGAC GCAGGCTCCA GCGGACGTCG ACGGCGGGGA CGCAGCGTGG 11040 TCGCCGGGAG GCATCGATGA CAGTATTGGT AACCGGAGCC ACAGGAAACG TCGGCCGGCA 11100 CGTCGTCACC GGGCTACTGG CCGCCGGCCG CCGGGTGCGG GCGCTGACCC GCACACCCGA 11160 CCGGTCCGGC CTGCCCGGCG GCGCGGAGAT CACAGGCGGC GACCTGACCC GCCCGGAGAC 11220 CTACGAGCGG ATGCTGGACG GTGTCGAAGC CGTCTACCTG TTCCCCGTCC CGGAGACCGC 11280 CGCGGCGTTC GCCGGGGCCG CGCGACGGGC CGGTGTCCGG CGGATCGTGG TGCTCTCCTC 11340 GGACTCCGTC ACCGACGGCA CCGACACCGG AGGACACCGG CGCGTGGAAC TGGCCGTGGA 11400 GGACACGGGG CTCGAGTGGA CCCATGTGCG CCCCGGCGAG TTCGCGCTCA ACAAGGTCAC 11460 CCTGTGGGCG CCGTCGATCC GCGCGGAGGG CGTCGTCCGG TCCGCGTATC CGGACGCCCG 11520 GGTGGCCCCG GTGCACGAGG CCGACGTCGC GGCCGTCGCG GTGACCGCGC TGCTGAAGGA 11580 !! GGGGCACGCC GGCCGCGCCT ACAGCGTGAC CGGACCGCAG GCCCTCACCC AGCGCGAACA 11640 GGTCCGCGCG GTAGGGGAGG GGCTCGGCCG GTCCCTCGCC TTCGTCGAGG TGACCCCCGG 11700 GCAGGCGCGG GCCGACCTGA CCGCCCAGGG GCTGCCCGCG CCCATCGCCG ACTACGTCCT 11760 CGCCTTCCAA GCCGGGTGGA CCGAGCGGCC CGCCCCCGCC CGGCCGACCG TGCGGGAGGT 11820 CACCGGCCGG CCCGCCCGCA CGCTCGCCCA GTGGGCCGCC GACCACCGAG CGGACTTCCG 11880 35 107 053 GTGACCGGAG ACCGCGTCCA CCGCGCCACG ACAGAAAGGC GACGCCCGTG CGCGTACTGC 11940 TGACGTCCTT CGCCATGGAC GCCCACTTCT GCACCGCCGT GCCGCTGGCG TGGGCACTGC 12000 GGTCGGCCGG GCACGAGGTA CGGGTGGCCG GCCAGCCCGC GCTCACCTCC ACCATCACGG 12060 GAGCCGGCCT GACCGCCGTG CCGGTCGGCC GCGACCACAC GCACGGCAGC CTCCTGGGCC 12120 GGGTCGGCAG CGACATCCTC GCCCTGCACG ACGAGGCGGA CTACCTGGAG GCCCGTCACG 12180 ACGCCCTGGG CTTCGAGTTC CTCAAAGGGC ACAACACGGT GATGTCCGCG TTGTTCTACT 12240 CGCAGATCAA CAACGACTCG ATGGTCGACG ACCTGGTGGA CTTCGCCCGT CACTGGCGGC 12300 CCGACCTGGT CGTCTGGGAG CCGTTCACCT TCGCGGGCGC CGTGGCCGCG CGGGCCTCGG 12360 GCGCCGCCCA CGCCCGCCTG CTGTCCTTCC CCGACCTGTT CCTCAGCACG CGCCGCCTCT 12420 TCCTGGAGCG CATGGCGCGC CAGGAGCCCG AGCATCACGA CGACACACTC GCCGAATGGC 12480 TCGACTGGAC CCTTGGCCGG CACGGCCACT CCTTCGACGA GGAGATCGTC ACGGGGCAGT 12540 GGTCCATCGA CCAGACCCCC GCCCCCGTGC GGCTCGACGC CGGCGGTCCC ACCGTGCCGA 12600 TGCGGTACGT CCCCTACAGC GGACTGGTGC CCACAGTGGT GCCCGACTGG CTGCGCAGGC 12660 CGCCCGAGCG GCCACGGGTC CTGGTCACCC TCGGCATCAC CTCACGGCGG GTGAAGTCCT 12720 TCCTCGCCGT CTCCGTGGAC GACCTTTTCG AGGCCGTGGC CGGGCTCGGC GTCGAGGTGG 12780 TCGCCACCCT CGACGCCGAC CAGCGGGAGC TGCTGGGGCG CGTGCCGGAC CACTTCCGCA 12840 TCGTCGAGCA CGTGCCGCTG GACGCCGTTC TGCCGACCTG CTCGGCGATC GTCCACCACG 12900 GCGGAGCCGG CACCTGGTCG ACGGCCGCCG TGTACGGGGT GCCGCAGGTC TCCCTGGGCT 12960 CGATGTGGGA CCACTTCTAC CGGGCCCGTC GCCTGGAGGA ACTCGGGGCG GGGCTGCGGC 13020 • '<TGCCCTCCGG CGAGCTGACT GCCGAGGGGC TGCGCACCCG GCTGGAGAGG GTGCTCGGCG 13080 AGCCCTCCTT CGGCACCGCC GCGCAGGCGC TGAGCGACAC CATCGCGGCG GAACCCAGCC 13140 CCAGCGAGGT CGTGCCGGTC CTGGAGGAGC TGACCGGACG GCACCGTCCC GGCACCCGGG 13200 NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNN NNNNN NNNNNNNNNN NNNNNNNNNN 13260 "NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN CCGTCCGGGC CCCTCGCCGG 13320 TGAGGGAGCC CGGATCACAG TCCGTCCGGC ACCACGCCCA GGTCCCGGAA CAGCGGGGAG 13380 AAGTTGAAGA CGTCCCAGTG CTCCACGACC TTGCCGGCTT CGGAGAAGCG CAGCTCCTCC 13440 AAGTAGGTCC AGCGGACCTT GCGGCCGGTG GGGGCGATGC CCATGAACAC GCCCTGGTGC 13500 GTGGCCGAGC AGGTGATCCG CAGCATCACG CGGTCGCCCT CGCCCACGAT GCTCCGCACG 13560 • · 107053 36 TCCAGACGAA GGTCCGGGAA GGCCTCCACC GCGCTGTTCA TACGCCGTAC GACCTCCTCG 13620 GCGCTCACCG GTTTGTCCTC GTCGTCGTAG TGGACGACGT CGGGTGCCCA GTGCGCGACC 13680 ACCCCGGAGA CGTCCCACCG GTTCCATGCG GCCACCATCT CCAGGCAGCG TTCCTTGTTC 13740 GCGGTCGTTG ACATGTCGAC TCCTTGAAGG CCCGGGACTA CTGGTCACGC GCCAGCCTTC 13800 CAACCCGCCC CGGAAAAGCG GTGCACGACC GCTGGAGCCC GCACCGGAAC CTGCGCGGCG 13860 GAGCTGAACG GGGTTTCGAG CCGTTCACCA AGGACCTGCC GCAGCCTGTT ACGGCACACC 13920 CTGACGCCTC GCTCCGCGCG GGACGCGCCC GCCGGGAGGA AGGACÄCACC ACCATGTCGG 13980 TACGCACCGA TCAGACGGCG GCACCGGAAG ACCGAGCGGC GGCCACGGAT CCCGGGTTCG 14040 GGCACCTG TA CGCGCAGGTG CAGCAGTTCT ACGCCCGGCA GATGCAGCTC CTCGACTCCG 14100 GCGCGGCCGA GGAGTGGGCC GCCACCTTCA CCGAGGACGG CACGTTCGCC CGGCCCTCCT 14160 CGCCGGAACC GGCACGCGGQ CACGCCGAAC TGGCCGCCGG CGCCCGCGCC GCCGCCGAAC 14220 GCCTCGCCGC CGAGGGCCTT TCGCACCGGC ACGTCATCGG CATGACCGCG GTACGCCGGG 14280 AACCCGACGG CAGCGTGTTC GTACGCAGCT ACGCCCAGGT CTTCGCCACC CGCCGCGGGG 14340 AAGCTCCCCG GCTGCATCTG ATCTGCGTCT GCGAGGACGT GCTCGTGCGG GAGGGGCCGG 14400 GGCTGAAGGT GCGGGAACGG GTTGTCACGC ACGACGCGTG AGGGCGGTCG ACCCGCCGGC 14460 CGAGCCGCAC CTCTGCCACC CCCTCGGCAC GCCAGCCGGC GTCGAGTCCG CTGCGAGAGG 14520 GCGCACTTAG CGTGCGAGCC ATGACTGACT CGACAGGTCC CCGCCCGGTG CCCGCCATGT 14580 CACCCGCCCC CAGCCCCACG CCTTCCCCCG GCCCCGCCCC CGGGAGCGAA CCCGCGCCGC 14640 TCGCCGTGAT CGTCACCGGC GGCGGTTCGG GTATCGGCCG GGCCACCGCC CGCGCCTTCG 14700 «CCGCTCAGGG TGCGAAGGTG CTCGTCGTCG GCCGTACCGA GGACGCGCTC GCGCAGACCG 14760 CCGAGGGCTG TGCGGACATG CGTGTGCTCG TCGCCGACGT GGCCTCGCCC GACGGGCCGC 14820 AGGCGGTCGT CAACGCCGCC CTGCGGGAGT TCGGGAGGAT CGACGTCCTG GTCAACAACG 148 80 CTGCCGTGGC GGGCATGGAG ACCCTGCAGA CCGTCGACCG GGACGCCGTG GCACGGCAGT 14940 • <, ·· TCGGCACCAA TCTGACGGCT CCCCTCTTCC TCGTCCAGTC CGCACTCGGC GCGCTGGAGA 15000 AGTCGCGCGG CATCGTCGTC AACGTGGGGA CCGCCGCGAC CCTGGGCCTG CGCGCCGCCC 15060 CGACCGGCGC GCTGTACGGG GCGAGCAAGG TGGCCCTCGA CTACCTGACC CGGACCTGGG 15120 CCGTCGAACT GGCCCCCCGG GGCATCCGTG TCGTCGGCGT GGCACCCGGG GTGATCGACA 15180. CGGGCATCGG CGTCCGCATG GGCATGACCC CGGAGGGCTA CCGGGAGTTC CTGACCGGCA 15240 • · 107053 37 TGGGCGGCAG GGTGCCCGTG GGCCGGGTCG GCCGTCCGGA GGACGTGGCC TGGTGGATCG 15300 TCCAGCTCGC CCGCCCGGAG GCCGGCTACG CGACGGGCAT GGTCGTCCCC GTCGACGGCG 15360 GGCTGTCGCT GGTCTGACCG GACAAGGAAG GAAATACCGC AGGAAGGAAG TACCGCAGCA 15420 AGGAAATACC GCAGGAAGGA GATATCGCCG TGCAGGAAAC CGAACCCGGC GTCCCCGCGG 15480 ACCTGCCCGC CGAGAGCGAC CCTGCCGCCC TGGAGCGCCT CGCCGCACGG TACCGGCGGG 15540 ACGGCTACGT CCACGTCCCC GGCGTCCTCG ACGCCGGGGA GGTCGCCGAA TACCTGGCCG 15600 AGGCCCGTCG GCTCCTCGCC CACGAGGAGT CCGTGCGCTG GGGCTCCGGC GCCGGCACCG 15660 TCATGGACTA CGTCGCCGAC GCCCAGCTCG GCAGCGACAC GATGCGCCGC CTTGCCACCC 15720 ACCCGCGCAT CGCCGCCCTC GCCGAGTACC TGGCCGGCTC GCCCCTGAGG CTGTTCAAGC 15780 TGGAGGTGCT GCTCAAGGAG AACAAGGAGA AGGACGCCTC GGTCCCCACC GCCCCGCACC 15840 ACGATGCGTT CGCCTTCCCG. TTCTCCACCG CCGGCACCGC CCTGACGGCG. TGGGTCGCGC 15900 TGGTCGACGT CCCGGTGGAA CGCGGCTGCA TGACCTTCGT CCCCGGATCA CACCTGCTGC 15960 CGGATCCCGA TACCGGCGAC GAGCCGTGGG CCGGGGCCTT CACCCG

(2) SEQ ID NO: 2:N TIEDOT(2) DETAILS OF SEQ ID NO: 2

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 342 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "sriogI:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 2:(i) SEQUENCE DETAILS: (A) LENGTH: 342 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL TYPE: peptide (D) OTHER DETAILS: / note.= n Translation Product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2:

Met Thr Vai His Vai Trp Asp Tyr Leu Pro Glu Tyr Glu Leu Glu Arg 15 10 15Met Thr Is His Vai Trp Asp Tyr Leu Pro Glu Tyr Glu Leu Glu Arg 15 10 15

Glu Asp Ile His Asp Ala Vai Glu Thr Vai Phe Arg Ser Gly Arg Leu ; 20 25 30 • « • (Glu Asp Ile His Asp Ala Vai Glu Thr Vai Phe Arg Ser Gly Arg Leu; 20 25 30 • «• (

Vai Leu Gly Glu Ser Vai Arg Gly Phe Glu Ser Glu Phe Ala Ser Phe 35 40 45Will Leu Gly Glu Ser Will Arg Gly Phe Glu Ser Glu Phe Ala Ser Phe 35 40 45

Gin Gly Vai Gly His Ala Vai Gly Vai Asp Asn Gly Thr Asn Ala Vai 50 55 60Gin Gly Vai Gly His Bottom Gly Or Asp Asn Gly Thr Asn Bottom 50 55 60

Lys Leu Gly Leu Gin Ala Leu Gly Vai Gly Pro Gly Asp Glu Vai Vai ; - 65 70 75 80 ♦ 107053 38Lys Leu Gly Leu Gin Ala Leu Gly Vai Gly Pro Gly Asp Glu Vai Vai; - 65 70 75 80 ♦ 107053 38

Thr Vai Ser Asn Thr Ala Ala Pro Thr Vai Val Ala lie Asp Ser Ala 85 90 95Thr Vai Ser Asn Thr Ala Ala Pro Thr Vai Val Ala lie Asp Ser Ala 85 90 95

Gly Ala Thr Pro Val Phe Val Asp Val Arg Glu Glu Asp Tyr Leu Met 100 105 110Gly Ala Thr Pro Val Phe Val Asp Val Arg Glu Glu Asp Tyr Leu Met 100 105 110

Asp Thr Ser Gin Val Glu Ala Val Leu Thr Pro Arg Thr Arg Cys Leu 115 120 125Asp Thr Ser Gin Val Glu Ala Val Leu Thr Pro Arg Thr Arg Cys Leu 115 120 125

Leu Pro Val His Leu Tyr Gly Gin Cys Val Asp Met Ala Pro Leu Arg 130 135 140Leu Pro Val His Leu Tyr Gly Gin Cys Val Asp Met Ala Pro Leu Arg 130 135 140

Asp Leu Ala Ala Arg His Asn Leu Val lie Leu Glu Asp Cys Ala Gin 145 150 155 160Asp Leu Ala Area Arg His Asn Leu Val lie Leu Glu Asp Cys Ala Gin 145 150 155 160

Ala His Gly Ala Arg Arg His Gly Arg Leu Ala Gly Ser Thr Gly Asp 165 170 . 175Ala His Gly Ala Arg Arg His Gly Arg Leu Ala Gly Ser Thr Gly Asp 165 170. 175

Ala Ala Ala Phe Ser Phe Tyr Pro Thr Lys Val Leu Gly Ala Tyr Gly 180 185 190Ala Ala Ala Phe Ser Phe Tyr Pro Thr Lys Val Leu Gly Ala Tyr Gly 180 185 190

Asp Gly Gly Ala Val Leu Thr Asp Asp Glu Arg Val Ala Asp Arg Leu 195 200 205Asp Gly Gly Ala Val Leu Thr Asp Asp Glu Arg Val Ala Asp Arg Leu 195 200 205

Arg Arg Leu Arg Tyr Tyr Gly Met Glu Ser Arg Tyr Tyr Val Val Glu 210 215 220Arg Arg Leu Arg Tyr Tyr Gly Met Glu Ser Arg Tyr Tyr Val Val Glu 210 215 220

Thr Pro Gly His Asn Ser Arg Leu Asp Glu Vai Gin Ala Glu He Leu 225 230 235 240Thr Pro Gly His Asn Ser Arg Leu Asp Glu Or Gin Lower Glu He Leu 225 230 235 240

Arg Arg Lys Leu Ser Arg Leu Pro Ser Tyr He Glu Ala Arg Arg Ala 245 250 255Arg Arg Lys Leu Ser Arg Leu Pro Ser Tyr He Glu Ala Arg Arg Ala 245 250 255

Val Ala Arg Arg Tyr Glu Glu Gly Leu Ala Asp Thr Gly Leu Leu Leu 260 265 270 , Pro Arg Thr Ala Gin Gly Asn Glu His Val Tyr Tyr Val Tyr Val Val ' 275 280 285Val Ala Arg Arg Tyr Glu Glu Gly Leu Ala Asp Thr Gly Leu Leu Leu 260 265 270, Pro Arg Thr Ala Gin Gly Asn Glu His Val Tyr Tyr Val Val Val '275 280 285

Arg His Pro Arg Arg Asp Ala Val Leu Glu Ala Leu Arg Ala Ser Tyr 290 295 300Arg His Pro Arg Arg Asp Ala Val Leu Glu Ala Leu Arg Ala Ser Tyr 290 295 300

Asp He Ala Leu Asn He Ser Tyr Pro Trp Pro Val His Thr Met Thr 305 310 315 320 , Gly Phe Ser His Leu Gly Tyr Ala Lys Gly Ser Leu Pro Val Thr Glu 325 330 335Asp He Ala Leu Asn He Ser Tyr Pro Trp Pro Val His Thr Met Thr 305 310 315 320, Gly Phe Ser His Leu Gly Tyr Ala Lys Gly Ser Leu Pro Val Thr Glu 325 330 335

Ala Leu Ala Asp Glu He 340Ala Leu Ala Asp Glu He 340

(2) SEQ ID NO: 3:N TIEDOT(2) DETAILS OF SEQ ID NO: 3

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 293 aminohappoa 107053 39 (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi <D) MUUT TIEDOT: /huom.= "snogJ:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 3:(i) SEQUENCE DETAILS: (A) LENGTH: 293 amino acids 107053 39 (B) TYPE: amino acid (C) SURFACE: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL-TYPE: peptide <D) OTHER INFORMATION: /h. snogJ Translation Product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3:

Vai Lys Gly Ile Ile Leu Ala Gly Gly Thr Gly Ser Arg Leu His Pro 15 10 15Vai Lys Gly Ile Ile Leu Lower Gly Gly Thr Gly Ser Arg Leu His Pro 15 10 15

Thr Thr Leu Ala Vai Ser Lys Gin Leu Leu Pro Vai Gly Asp Lys Pro 20 25 30Thr Thr Leu Lower Or Ser Lys Gin Leu Leu Pro Or Gly Asp Lys Pro 20 25 30

Met Ile Tyr Tyr Pro Leu Ser Vai Leu Met Leu Ala Gly Vai Thr Asp 35 40 45Met Ile Tyr Tyr Pro Leu Ser Vai Leu Met Leu Ala Gly Vai Thr Asp 35 40 45

Ile Leu Ile Ile Ser Thr Pro His Glu Leu Pro Arg Met Arg Arg Leu 50 55 60Ile Leu Ile Ile Ser Thr Pro His Glu Leu Pro Arg Met Arg Arg Leu 50 55 60

Phe Gly Asp Gly Ala Gin Leu Gly Leu Arg Leu Ala Tyr Ala Glu Gin 65 70 75 80Phe Gly Asp Gly Ala Gin Leu Gly Leu Arg Leu Ala Tyr Ala Glu Gin 65 70 75 80

Glu Lys Pro Arg Gly Ile Ala Glu Ala Phe Leu Ile Gly Ala Asp His 85 90 95Glu Lys Pro Arg Gly Ile Ala Glu Ala Phe Leu Ile Gly Ala Asp His 85 90 95

Vai Gly Ser Asp Ala Vai Ala Leu Ala Leu Gly Asp Asn Ile Phe His 100 105 110Vai Gly Ser Asp Ala Vai Ala Leu Ala Leu Gly Asp Asn Ile Phe His 100 105 110

Gly Ser Ser Phe Gin Gly Vai Leu Arg Lys Glu Ala Glu Glu Leu Asp 115 120 125Gly Ser Ser Phe Gin Gly Vai Leu Arg Lys Glu Ala Glu Glu Leu Asp 115 120 125

Gly Cys Vai Leu Phe Gly Tyr Pro Vai Lys Asp Pro Gin Arg Tyr Gly 130 135 140Gly Cys Vai Leu Phe Gly Tyr Pro Vai Lys Asp Pro Gin Arg Tyr Gly 130 135 140

Vai Gly Glu Ala Asn Ala Ser Gly Arg Leu Vai Ser Ile Glu Glu Lys 145 150 155 160Vai Gly Glu Ala Asn Ala Ser Gly Arg Leu Vai Ser Ile Glu Glu Lys 145 150 155 160

Pro Vai Arg Pro Arg Ser Asn Arg Ala Ile Thr Gly Leu Tyr Phe Tyr 165 170 175Pro Vai Arg Pro Arg Ser Asn Arg Ala Ile Thr Gly Leu Tyr Phe Tyr 165 170 175

Asp Asn Glu Vai Vai Asp Ile Ala Arg Arg Leu Arg Pro Ser Ala Arg 180 185 190 . Gly Glu Leu Glu Ile Thr Asp Ile Asn Arg Thr Tyr Met Glu Arg Gly 195 200 205Asp Asn Glu Are Do Asp Ile Ala Arg Arg Leu Arg Pro Ser Ala Arg 180 185 190. Gly Glu Leu Glu Ile Thr Asp Ile Asn Arg Thr Tyr Met Glu Arg Gly 195 200 205

Arg Ala Arg Leu Vai Asp Leu Gly Arg Gly Phe Ala Trp Leu Asp Thr 210 215 220Arg Ala Arg Leu Is Asp Leu Gly Arg Gly Phe Ala Trp Leu Asp Thr 210 215 220

Gly Thr Pro Glu Ser Leu Leu Gin Ala Ser Gin Tyr Vai Ser Ala Leu 225 230 235 240 107053 40Gly Thr Pro Glu Ser Leu Leu Gin Ala Ser Gin Tyr Vai Ser Ala Leu 225 230 235 240 107053 40

Glu Glu Arg Gin Gly Ile Arg Ile Ala Cys Ile Glu Glu Val Ala Leu 245 250 255Glu Glu Arg Gin Gly Ile Arg Ile Ala Cys Ile Glu Glu Val Ala Leu 245 250 255

Arg Met Gly Phe lie Asn Ala Gin Ala Cys Tyr Glu Leu Gly Ala Arg 260 265 270Arg Met Gly Phe lie Asn Alla Gin Alla Cys Tyr Glu Leu Gly Alla Arg 260 265 270

Leu Ser Gly Ser Gly Tyr Gly Gin Tyr Val Met Ala lie Ala Glu Glu 275 280 285Leu Ser Gly Ser Gly Tyr Gly Gin Tyr Val Met Ala lie Ala Glu Glu 275 280 285

Cys Thr Gly Arg Val 290Cys Thr Gly Arg Val 290

(2) SEQ ID NO: 4:N TIEDOT(2) DETAILS OF SEQ ID NO: 4

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 238 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogA:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 4:(i) SEQUENCE DETAILS: (A) LENGTH: 238 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL TYPE: peptide (D) OTHER DETAILS: / note.= n Translation Product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4:

Vai Tyr Gly Arg Glu Leu Ala Asp Vai Tyr Glu Met Vai Tyr Arg Ser 15 10 15Vai Tyr Gly Arg Glu Leu Ala Asp Vai Tyr Glu Met Vai Tyr Arg Ser 15 10 15

Arg Gly Lys Ser Trp Ala Asp Glu Ala Glu Arg Vai Thr Ala Glu Ile 20 25 30Arg Gly Lys Ser Trp Ala Asp Glu Ala Glu Arg Or Thr Ala Glu Ile 20 25 30

Arg Ser Arg Arg Pro Gly Ala Arg Ser Leu Leu Asp Vai Ala Cys Gly 35 40 45Arg Ser Arg Arg Pro Gly Ala Arg Ser Leu Leu Asp Vai Ala Cys Gly 35 40 45

Thr Gly Ala His Leu Glu Ala Phe Arg Gly Leu Phe Ala His Thr Glu 50 55 60Thr Gly Ala His Leu Glu Ala Phe Arg Gly Leu Phe Ala His Thr Glu 50 55 60

Gly Leu Glu Leu Ser Asp Glu Met Arg Ala Leu Ala Glu Arg Arg Leu 65 70 75 80Gly Leu Glu Leu Ser Asp Glu Met Arg Ala Leu Ala Glu Arg Arg Leu 65 70 75 80

Pro Gly Vai Pro Vai Arg Pro Gly Asp Met Arg Asp Phe Ala Leu Ser 85 90 95Pro Gly Vai Pro Vai Arg Pro Gly Asp Met Arg Asp Phe Ala Leu Ser 85 90 95

Gly Arg Phe Asp Ala Vai Vai Cys Leu Phe Cys Ser Ile Gly Tyr Leu .. 100 105 110 • «Gly Arg Phe Asp Ala Vai Vai Cys Leu Phe Cys Ser Ile Gly Tyr Leu .. 100 105 110 • «

Glu Thr Vai Ala Asp Met Arg Ala Ala Vai Arg Thr Met Ala Ala His 115 120 125Glu Thr Is Area Asp Met Arg Area Area Ar Ar Thr Met Area Area His 115 120 125

Leu Vai Pro Gly Gly Vai Leu Vai Vai Glu Pro Trp Trp Phe Pro Glu 130 135 140Leu Vai Pro Gly Gly Or Leu Vai Pro Glu Pro Trp Trp Phe Pro Glu 130 135 140

Arg Phe Leu Glu Gly Tyr Vai Ala Gly Asp Leu Ala Arg Gly Glu Gly 145 150 155 160 107053 41Arg Phe Leu Glu Gly Tyr Vai Ala Gly Asp Leu Ala Arg Gly Glu Gly 145 150 155 160 107053 41

Arg Thr Vai Ala Arg Vai Ser His Ser Thr Arg Gin Gly Arg Arg Thr 165 170 175Arg Thr Vai Area Arg Vai Ser His Ser Thr Arg Gin Gly Arg Arg Thr 165 170 175

Arg Met Glu Val Arg Phe Leu Vai Gly Glu Ala Thr Gly He Arg Glu 180 185 190Arg Met Glu Val Arg Phe Leu Vai Gly Glu Ala Thr Gly He Arg Glu 180 185 190

Phe Thr Glu He Asp Leu Leu Thr Leu Phe Thr Arg Glu Glu Tyr Leu 195 200 205Phe Thr Glu He Asp Leu Leu Thr Leu Phe Thr Arg Glu Glu Tyr Leu 195 200 205

Ala Ala Phe Glu Asp Ala Gly Cys Pro Ala Glu Phe Leu Asp Asp Gly 210 215 220Ala Ala Phe Glu Asp Ala Gly Cys Pro Ala Glu Phe Leu Asp Asp Gly 210 215 220

Leu Thr Gly Arg Gly Leu Phe Val Gly Val Arg Gly Ala Gly 225 230 235Leu Thr Gly Arg Gly Leu Phe Val Gly Val Arg Gly Ala Gly 225 230 235

(2) SEQ ID NO: 5:N TIEDOT(2) DETAILS OF SEQ ID NO: 5

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 324 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoaM:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 5:(i) SEQUENCE DETAILS: (A) LENGTH: 324 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL-TYPE: peptide (D) OTHER DETAILS: / Note: = n Translation Product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5:

Met Thr Ala Ala Trp Gly Ala Pro Leu Tyr Pro Pro Trp He Pro Ala 1 5 10 15Met Thr Ala Ala Trp Gly Ala Pro Leu Tyr Pro Pro Trp He Pro Ala 1 5 10 15

Arg Pro Gly Arg Arg Arg Cys Gly Ala Gly Arg Arg Vai Arg Cys Pro 20 25 30Arg Pro Gly Arg Arg Arg Cys Gly Area Gly Arg Arg Arg Cys Pro 20 25 30

Pro Vai Glu Pro Ala Ser Arg Pro Arg Gin Glu Gly Arg Vai Ser Vai 35 40 45Pro Vai Glu Pro Ala Ser Arg Pro Arg Gin Glu Gly Arg Vai Ser Vai 35 40 45

Vai Pro Ala Leu Arg Gin Pro Ser Pro Ser Thr Asn Pro Glu Vai Arg 50 55 60Vai Pro Ala Leu Arg Gin Pro Ser Pro Ser Thr Asn Pro Glu Vai Arg 50 55 60

Vai Arg Leu He Asp Leu Ser Ser Pro Vai Asp Ser Ser Gin Tyr Glu 65 70 75 80Vai Arg Leu He Asp Leu Ser Ser Pro Or Asp Ser Ser Gin Tyr Glu 65 70 75 80

Pro Asp Pro Vai Vai His Asp Vai Leu Thr Pro Arg Gin Gly Ala Glu 85 90 95 *Pro Asp Pro Or Do His Asp Or Leu Thr Pro Arg Gin Gly Lower Glu 85 90 95 *

His Met Cys Ala Glu Met Arg Glu His Phe Gly Vai Glu Phe Ser Pro 100 105 110His Met Cys Ala Glu Met Arg Glu His Phe Gly Vai Glu Phe Ser Pro 100 105 110

Asp Glu Leu Pro Asp Gly Glu Phe Leu Ser Leu Asp Arg He Thr Leu 115 120 125Asp Glu Leu Pro Asp Gly Glu Phe Leu Ser Leu Asp Arg He Thr Leu 115 120 125

Thr Thr His Thr Gly Thr His Vai Asp Ala Pro Ser His Tyr Gly Ser 130 135 140 107053 42Thr Thr His Thr Gly Thr His Vai Asp Ala Pro Ser His Tyr Gly Ser 130 135 140 107053 42

Arg Ala Leu Tyr Gly Asp Gly Val Pro Arg His He Asp Gin Met Pro 145 150 155 160Arg Ala Leu Tyr Gly Asp Gly Val Pro Arg His He Asp Gin Met Pro 145 150 155 160

Leu Glu Trp Phe Phe Gly Arg Gly Val Val Leu Asp Leu Thr Asp Ala 165 170 175Leu Glu Trp Phe Phe Gly Arg Gly Val Val Leu Asp Leu Thr Asp Area 165 170 175

Pro Thr Gly Thr Val Ser Ala Ala Arg Leu Glu Lys Glu Leu Ala Arg 180 185 190Pro Thr Gly Thr Val Ser Ala Ala Arg Leu Glu Lys Glu Leu Ala Arg 180 185 190

Thr Gly Cys Ala Leu Arg Pro Gly Asp He Val Leu Leu His Thr Gly 195 200 205Thr Gly Cys Ala Leu Arg Pro Gly Asp He Val Leu Leu His Thr Gly 195 200 205

Ala Gin Arg His Ala Gly Thr Pro Arg Tyr Phe Thr Asp Phe Ala Gly 210 215 220Ala Gin Arg His Ala Gly Thr Pro Arg Tyr Phe Thr Asp Phe Ala Gly 210 215 220

Leu Asp Gly Pro Ala Val Arg Met Leu Leu Asp His Gly Val Arg Val 225 230 235 240Leu Asp Gly Pro Area Val Arg Met Leu Leu Asp His Gly Val Arg Val 225 230 235 240

He Gly Thr Asp Ala Phe Ser Leu Asp Ala Pro Phe Gly His He He 245 250 255He Gly Thr Asp Ala Phe Ser Leu Asp Ala Pro Phe Gly His He He 245 250 255

Asp Arg Tyr Arg Ala Thr Gly Asp Arg Ser Val Leu Trp Pro Ala His 260 265 270Asp Arg Tyr Arg Ala Thr Gly Asp Arg Ser Val Leu Trp Pro Ala His 260 265 270

Val Val Gly Arg Glu Arg Glu Tyr Cys Gin He Glu Arg Leu Ala Asn 275 280 285Val Val Gly Arg Glu Arg Glu Tyr Cys Gin He Glu Arg Leu Ala Asn 275 280 285

Leu Asp Arg Leu Pro Val Ser Phe Gly Phe Arg Val Cys Cys Phe Pro 290 295 300Leu Asp Arg Leu Pro Val Ser Phe Gly Phe Arg Val Cys Cys Phe Pro 290 295 300

Val Lys Val Ala Gly Ala Gly Ala Gly Trp Thr Arg Ala Val Ala Leu 305 310 315 320Val Lys Val Ala Gly Ala Gly Ala Gly Trp Thr Arg Ala Val Ala Leu 305 310 315 320

Val Asp Glu AspVal Asp Glu Asp

(2) SEQ ID NO: 6:N TIEDOT(2) DETAILS OF SEQ ID NO: 6

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 408 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogN:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 6:(i) SEQUENCE DATA: (A) LENGTH: 408 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL TYPE: peptide (D) OTHER INFORMATION: /Note.= n Translation Product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6:

Met Vai Met Lys Leu Thr Asp Ser Glu Leu Gly Arg Ala Leu Leu Ser 15 10 15Met Or Met Lys Leu Thr Asp Ser Glu Leu Gly Arg Lower Leu Leu Ser 15 10 15

Leu Arg Gly Tyr Gin Trp Leu Arg Gly He His His Asp Pro Tyr Ala 20 25 30 107053 43Leu Arg Gly Tyr Gin Trp Leu Arg Gly He His His Asp Pro Tyr Ala 20 25 30 107053 43

Leu Leu Leu Arg Ala Glu Ser Asp Asp Pro Ala Gin Leu Gly Arg Leu 35 40 45Leu Leu Leu Arg Area Glu Ser Asp Asp Pro Area Gin Leu Gly Arg Leu 35 40 45

Leu Arg Glu Arg Gly Arg Leu His Arg Ser Asp Thr Gly Thr Trp Val 50 55 60Leu Arg Glu Arg Gly Arg Leu Arg Ser Asp Thr Gly Thr Trp Val 50 55 60

Thr Ala Asp His Ala Thr Ala Ser Arg Leu Leu Ala Asp Pro Arg Phe 65 70 75 80Thr Ala Asp His Ala Thr Ala Ser Arg Leu Leu Ala Asp Pro Arg Phe 65 70 75 80

Val Leu Arg Arg Pro Pro Ala Gly Pro Ala Thr Gly Thr Gly Asp Val 85 90 95Val Leu Arg Arg Pro Pro Area Gly Pro Area Thr Gly Thr Gly Asp Val 85 90 95

Met Pro Trp Glu Glu Ala Thr Leu Ser Asp Leu Leu Pro Leu Asp Glu 100 105 110Met Pro Trp Glu Glu Ala Thr Leu Ser Asp Leu Leu Pro Leu Asp Glu 100 105 110

Ala Arg Leu Thr Thr Asp Arg Ala Arg Cys Arg Arg Leu Gly Ala Thr 115 120 125Ala Arg Leu Thr Thr Asp Arg Ala Arg Cys Arg Arg Leu Gly Ala Thr 115 120 125

Ala Ala Arg lie Ala Ala Asp Gly Pro Val Ala Thr Arg Leu Ala Asp 130 135 140Area Area Arg lie Area Area Asp Gly Pro Val Thla Arg Leu Area Asp 130 135 140

Leu Ala Gly Ala Arg Ala Glu Gin Val Arg Ser Thr Gly His Phe Asp 145 150 155 160Leu Ala Gly Ala Arg Ala Glu Gin Val Arg Ser Thr Gly His Phe Asp 145 150 155 160

Leu Arg Ala Asp Tyr Ala Leu Pro Tyr Ala Val Glu Pro Ala Cys Ala 165 170 175Leu Arg Ala Asp Tyr Ala Leu Pro Tyr Ala Val Glu Pro Ala Cys Ala 165 170 175

Leu Leu Gly Leu Pro Ala Gly Gin Cys Ser Leu Phe Gly Ala Phe Ser 180 185 190Leu Leu Gly Leu Pro Alla Gly Gin Cys Ser Leu Phe Gly Alla Phe Ser 180 185 190

Pro Ala Val Leu Leu Asp Ala Thr Val Val Pro Pro Arg Leu Pro Glu 195 200 205Pro Ala Val Leu Leu Asp Ala Thr Val Val Pro Pro Arg Leu Pro Glu 195 200 205

Ala Arg Ala Leu lie Ala Ser Thr Ala Glu Leu Thr Ala Leu Trp Pro 210 215 220Ala Arg Ala Leu lie Ala Ser Thr Ala Glu Leu Thr Ala Leu Trp Pro 210 215 220

Arg Leu Ala Pro Ser Leu Ser Lys Thr Val Pro Glu Asp Glu Ala Pro • 225 230 235 240Arg Leu Ala Pro Ser Leu Ser Lys Thr Val Pro Glu Asp Glu Ala Pro • 225 230 235 240

Asp Leu Phe Leu Leu Thr Ala Val Leu Leu Val Pro Ala Val Val His 245 250 255Asp Leu Phe Leu Leu Thr Ala Val Leu Leu Val Pro Ala Val Val His 245 250 255

Leu Val Cys Glu Ala Val Ala Ala Leu Ser His Asp Pro Gly Gin Ala 260 265 270Leu Val Cys Glu Ala Val Ala Ala Leu Ser His Asp Pro Gly Gin Ala 260 265 270

Gly Leu Leu Arg Asp Asp Pro Val Leu Ala Ala Pro Ala Val Glu Glu 275 280 285Gly Leu Leu Arg Asp Asp Pro Val Leu Area Ala Pro Area Val Glu Glu 275 280 285

Thr Leu Arg His Ala Pro Pro Ala Arg Leu Phe Thr Leu His Ala Thr 290 295 300Thr Leu Arg His Ala Pro Pro Ala Arg Leu Phe Thr Leu His Ala Thr 290 295 300

Gly Pro Glu Arg Val Ala Asp Val Asp Leu Pro Ala Gly Ala Glu Val 305 310 315 320 107055 44Gly Pro Glu Arg Val Ala Asp Val Asp Leu Pro Ala Gly Ala Glu Val 305 310 315 320 107055 44

Ala Vai Vai Vai Ala Ala Ala His Arg Asp Pro Ser Trp Cys Pro Asp 325 330 335Area Or Do Or Area Lower Area His Arg Asp Pro Ser Trp Cys Pro Asp 325 330 335

Pro Asp Arg Phe Asp Leu Thr Arg Asn Glu Arg His Leu Ala Leu Pro 340 345 350Pro Asp Arg Phe Asp Leu Thr Arg Asn Glu Arg His Leu Ala Leu Pro 340 345 350

Pro Asp Leu Pro Leu Gly Ala Leu Ala Pro Leu Leu Arg Vai Cys Ala 355 360 365Pro Asp Leu Pro Leu Gly Lower Leu Lower Pro Leu Leu Arg Vai Cys Lower 355 360 365

Thr Ala Ala Vai Ala Ala Leu Ala Ala Gly Leu Leu Pro Leu Arg Ala 370 375 380Thr Area Area Do Area Area Leu Area Area Gly Leu Leu Pro Leu Arg Area 370 375 380

Vai Gly Pro Pro Vai Arg Arg Leu Arg Ala Pro Vai Thr Arg Ser Vai 385 390 395 400Vai Gly Pro Pro Or Arg Arg Leu Arg Ala Pro Or Thr Arg Ser Vai 385 390 395 400

Leu Arg Phe Pro Vai Ala Pro Cys 405Leu Arg Phe Pro Vai Ala Pro Cys 405

(2) SEQ ID NO: 7:N TIEDOT(2) DETAILS OF SEQ ID NO: 7

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 422 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoaG:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 7:(i) SEQUENCE DETAILS: (A) LENGTH: 422 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL-TYPE: peptide (D) OTHER DETAILS: / note.= n translation product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7:

Met Asp Asn Arg Glu Thr Vai Arg Pro Vai Ser Vai Cys Arg Vai Cys 15 10 15Met Asp Asn Arg Glu Thr Or Arg Pro Or Ser Or Cys Arg Or Cys 15 10 15

Gly Gly Asn Asp Trp Gin Asp Vai Vai Asp Phe Gly Asp Vai Pro Leu 20 25 30Gly Gly Asn Asp Trp Gin Asp Or Or Asp Phe Gly Asp Or Pro Leu 20 25 30

Ala Asn Gly Phe Leu Ser Pro Ala Asp Ser Tyr Glu Asn Glu Arg Arg 35 40 45Ala Asn Gly Phe Leu Ser Pro Ala Asp Ser Tyr Glu Asn Glu Arg Arg 35 40 45

Tyr Pro Leu Gly Vai Leu Ser Cys Arg Ala Cys Arg Leu Met Ser Leu 50 55 60Tyr Pro Leu Gly Or Leu Ser Cys Arg Lower Cys Arg Leu Met Ser Leu 50 55 60

Thr His Vai Vai Asp Pro Glu Vai Leu Tyr Arg Asp Tyr Ala Tyr Thr 65 70 75 80 • Thr Pro Asp Ser Glu Met Ile Thr Gin His Met Arg His Ile Thr Ala 85 90 95Thr His Vai Or Asp Pro Glu Or Leu Tyr Arg Asp Tyr Ala Tyr Thr 65 70 75 80 • Thr Pro Asp Ser Glu Met Ile Thr Gin His Met Arg His Ile Thr Ala 85 90 95

Leu Cys Arg Thr Arg Phe Glu Leu Pro Pro Asp Ser Leu Vai Vai Glu 100 105 110Leu Cys Arg Thr Arg Phe Glu Leu Pro Pro Asp Ser Leu Or Vai Glu 100 105 110

Leu Gly Ser Asn Thr Gly Arg Gin Leu Met Ala Phe Arg Glu Ala Gly 115 120 125 107055 45Leu Gly Ser Asn Thr Gly Arg Gin Leu Met Ala Phe Arg Glu Ala Gly 115 120 125 107055 45

Met Arg Thr Leu Gly Val Asp Pro Ala Arg Asn Leu Thr Asp Val Ala 130 135 140Met Arg Thr Leu Gly Val Asp Pro Area Arg Asn Leu Thr Asp Val Area 130 135 140

Arg Arg Asn Gly lie Glu Thr Phe Pro Asp Phe Phe Ser His Asp Val 145 150 155 160Arg Arg Asn Gly lie Glu Thr Phe Pro Asp Phe Phe Ser His Asp Val 145 150 155 160

Ala Arg Thr lie Arg Arg Asp His Gly Gin Ala Arg Leu Val Leu Gly 165 170 175Ala Arg Thr lie Arg Asp His Gly Gin Ala Arg Leu Val Leu Gly 165 170 175

Arg His Val Phe Ala His lie Asp Asp Val Ser Asp lie Ala Ala Gly 180 185 190Arg His Val Phe Ala His lie Asp Asp Val Ser Asp lie Ala Ala Gly 180 185 190

Val Arg Glu Leu Leu Ser Pro Asp Gly Val Phe Ala lie Glu Val Pro 195 200 205Val Arg Glu Leu Leu Ser Pro Asp Gly Val Phe Ala lie Glu Val Pro 195 200 205

Tyr Val Leu Asp Leu Leu Glu Lys Val Ala Phe Asp Thr lie Tyr His 210 215 220Tyr Val Leu Asp Leu Leu Glu Lys Val Ala Phe Asp Thr lie Tyr His 210 215 220

Glu His Leu Ser Tyr Phe Thr Met Arg Ser Phe Val Thr Leu Phe Ala 225 230 235 240Glu His Leu Ser Tyr Phe Thr Met Arg Ser Phe Val Thr Leu Phe Ala 225 230 235 240

Arg His Gly Leu Arg Val Leu Asp Val Glu Arg Phe Gly Val His Gly 245 250 255Arg His Gly Leu Arg Val Leu Asp Val Glu Arg Phe Gly Val His Gly 245 250 255

Gly Ser Val Leu Val Phe Val Gly His Glu Asp Gly Pro Trp Pro Glu 260 265 270Gly Ser Val Leu Val Phe Val Gly His Glu Asp Gly Pro Trp Pro Glu 260 265 270

Arg Pro Ser Val Pro Glu Leu Leu Arg Val Glu Arg Gin Arg Gly Leu 275 280 285Arg Pro Ser Val Pro Glu Leu Leu Arg Val Glu Arg Gin Arg Gly Leu 275 280 285

Tyr Asp Asp Ala Thr Tyr Arg Thr Phe Ala Gin Arg He Glu Arg Val 290 295 300Tyr Asp Asp Ala Thr Tyr Arg Thr Phe Ala Gin Arg He Glu Arg Val 290 295 300

Arg Thr Glu Leu Pro Glu Leu Leu Arg Ser Leu Val Ala Gin Gly Lys 305 310 315 320 . Arg He Val Gly Tyr Gly Ala Pro Ala Lys Gly Asn Thr He Leu Thr • 325 330 335Arg Thr Glu Leu Pro Glu Leu Leu Arg Ser Leu Val Ala Gin Gly Lys 305 310 315 320. Arg He Val Gly Tyr Gly Ala Pro Ala Lys Gly Asn Thr He Leu Thr • 325 330 335

Val Cys Gly Leu Gly Leu Lys Glu Leu Glu Tyr Cys Thr Asp Thr Thr 340 345 350Val Cys Gly Leu Gly Leu Lys Glu Leu Glu Tyr Cys Thr Asp Thr Thr 340 345 350

Glu Leu Lys Gin Gly Arg Val Leu Pro Gly Thr His He Pro Val His 355 360 365 i Ala Pro Glu His Ala Lys Glu His He Pro Asp Tyr Tyr Leu Leu Leu 370 375 380Glu Leu Lys Gin Gly Arg Val Leu Pro Gly Thr His He Pro Val His 355 360 365 i Ala Pro Glu His Ala Lys Glu His He Pro Asp Tyr Tyr Leu Leu Leu 370 375 380

Ala Trp Asn Tyr Ala Thr Glu He Leu Asp Lys Glu Thr Ala Phe Arg 385 390 395 400Ala Trp Asn Tyr Ala Thr Glu He Leu Asp Lys Glu Thr Ala Phe Arg 385 390 395 400

Asp Asn Gly Gly Arg Phe He Val Pro He Pro Arg Pro Ser He Leu 405 410 415 107053 46Asp Asn Gly Gly Arg Phe He Val Pro He Pro Arg Pro Ser He Leu 405 410 415 107053 46

Thr Ser Pro Ser Gly Ser 420Thr Ser Pro Ser Gly Ser 420

(2) SEQ ID NO: 8:N TIEDOT(2) DETAILS OF SEQ ID NO: 8

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 291 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= ”snogC:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 8:(i) SEQUENCE DETAILS: (A) LENGTH: 291 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL-TYPE: peptide (D) OTHER DETAILS: / note.= n translation product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8:

Met Leu Ala Arg His Leu Thr Ala Ala Leu Ala Glu Thr Gly Arg Ser 15 10 15Met Leu Ala Arg His Leu Thr Ala Leu Ala Glu Thr Gly Arg Ser 15 10 15

Arg Pro Ala Ala Glu Ala Vai Vai Leu Gly Arg Arg Ala Leu Asp Ile 20 25 30Arg Pro Area Ala Glu Area Ala Is Leu Gly Arg Arla Ala Leu Asp Ile 20 25 30

Thr Asp Gly Arg Ala Vai Asp Ala Ala Phe Ala Ala His Arg Pro Arg 35 40 45Thr Asp Gly Arg Ala Is Asp Ala Ala Phe Ala Ala His Arg Pro Arg 35 40 45

Vai Vai Vai Asn Cys Ala Ala Phe Thr Asp Vai Asp Gly Ala Glu Ser 50 55 60Or Or Or Asn Cys Lower Area Phe Thr Asp Or Asp Gly Lower Glu Ser 50 55 60

Arg Trp Ala Glu Ala Met Arg Vai Asn Gly Gly Gly Pro Arg Leu Leu 65 70 75 80Arg Trp Ala Glu Ala Met Arg Vai Asn Gly Gly Gly Pro Arg Leu Leu 65 70 75 80

Ala Arg Arg Cys Ala Arg His Gly Vai Arg Leu Ile His Vai Ser Thr 85 90 95Ala Arg Arg Cys Ala Arg His Gly Vai Arg Leu Ile His Vai Ser Thr 85 90 95

Asp Tyr Vai Phe Pro Gly Asp Thr Arg Ser Pro Tyr Gly Glu Ser Asp . 100 105 110Asp Tyr Vai Phe Pro Gly Asp Thr Arg Ser Pro Tyr Gly Glu Ser Asp. 100 105 110

Ala Pro Gly Pro Arg Thr Vai Tyr Gly Arg Ser Lys Leu Ala Gly Glu 115 120 125Ala Pro Gly Pro Arg Thr Vai Tyr Gly Arg Ser Lys Leu Ala Gly Glu 115 120 125

Arg Ala Vai Leu Ser Leu Leu Pro Asp Thr Gly Thr Vai Vai Arg Thr 130 135 140Arg Area Or Leu Ser Leu Leu Pro Asp Thr Gly Thr Or Arg Thr 130 135 140

Ala Trp Leu Tyr Gly Gly Gin Gly Arg Ser Phe Vai Arg Thr Met Leu 145 150 155 160Ala Trp Leu Tyr Gly Gly Gin Gly Arg Ser Phe Vai Arg Thr Met Leu 145 150 155 160

Glu Arg Ala Pro Asp Asp Gly His Vai Asp Vai Vai Asn Asp Gin Trp 165 170 175Glu Arg Area Pro Asp Asp Gly His Or Asp Or Or Asn Asp Gin Trp 165 170 175

Gly Gin Pro Thr Trp Ala Gly Asp Vai Ala Arg Leu Leu Vai Thr Leu 180 185 190Gly Gin Pro Thr Trp Area Gly Asp Vai Area Arg Leu Leu Vai Thr Leu 180 185 190

Ala Arg Thr Pro Pro Asp Arg Ala Arg Gly Ile Phe His Ala Thr Asn 195 200 205 107053 47Ala Arg Thr Pro Pro Asp Arg Ala Arg Gly Ile Phe His Ala Thr Asn 195 200 205 107053 47

Ala Gly Ala Ala Thr Trp Tyr Glu Leu Ala Arg Glu Vai Phe Arg Leu 210 215 220Ala Gly Ala Ala Thr Trp Tyr Glu Leu Ala Arg Glu Vai Phe Arg Leu 210 215 220

Ala Gly Ala Asp Pro Glu Arg Vai Arg Pro Vai Ala Thr Ala Asp Arg 225 230 235 240Ala Gly Ala Asp Pro Glu Arg Or Ar Pro Pro Ala Thr Ala Asp Arg 225 230 235 240

Pro Gly Pro Ala Pro Arg Pro Ala Cys Thr Vai Leu Gly His Asp Arg 245 250 255Pro Gly Pro Ala Pro Arg Pro Ala Cys Thr Vai Leu Gly His Asp Arg 245 250 255

Trp Arg Leu Vai Gly Vai Ala Pro Pro Arg Asp Trp Arg Ala Ala Leu 260 265 270Trp Arg Leu Do Gly Or Area Pro Pro Arg Asp Trp Arg Leo Area Leu 260 265 270

Arg Glu Ala Met Arg Gin Leu Leu Pro Gly Gly Arg Leu Arg Asn Leu 275 280 285Arg Glu Ala Met Arg Gin Leu Leu Pro Gly Gly Arg Leu Arg Asn Leu 275 280 285

Thr Gly Thr 290Thr Gly Thr 290

(2) SEQ ID NO: 9:N TIEDOT(2) DETAILS OF SEQ ID NO: 9

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 350 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogK:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 9:(i) SEQUENCE DETAILS: (A) LENGTH: 350 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL-TYPE: peptide (D) OTHER DETAILS: / note.= "snog. n translation product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9:

Met Ala Ser His Thr Ser Ala Thr Thr Asp Vai Asn Ile Leu Vai Thr 1 5 10 15Met Ala Ser His Thr Ser Ala Thr Asp Vai Asn Ile Leu Vai Thr 1 5 10 15

Gly Ala Vai Gly Phe Ile Gly Ser Ala Tyr Vai Arg Met Leu Leu Glu . 20 25 30Gly Ala Vai Gly Phe Ile Gly Ser Ala Tyr Vai Arg Met Leu Leu Glu. 20 25 30

Asn Arg Ala Pro Gly Ala Gly Ala Pro Ala Vai Arg Vai Thr Vai Leu 35 40 45Asn Arg Area Pro Gly Area Gly Area Pro Area Area Arg Area Thr Vai Leu 35 40 45

Asp Lys Leu Thr Tyr Ala Gly Asn Leu Thr Asn Leu Asp Ala Vai Arg 50 55 60Asp Lys Leu Thr Tyr Ala Gly Asn Leu Thr Asn Leu Asp Ala Vai Arg 55 55 60

Gly Asp Arg Leu Arg Phe Vai Arg Gly Asp Ile Leu Asp Ala Glu Leu . 65 70 75 80Gly Asp Arg Leu Arg Phe Vai Arg Gly Asp Ile Leu Asp Ala Glu Leu. 65 70 75 80

Vai Asp Glu Leu Met Ala His Ser Asp Gin Vai Vai His Phe Ala Ala 85 90 95Vai Asp Glu Leu Met Ala His Ser Asp Gin Vai As His Phe Ala Ala 85 90 95

Glu Ser His Vai Asp Arg Ser Ile Arg Ala Ala Asp Asp Phe Vai Leu 100 105 110Glu Ser His Vai Asp Arg Ser Ile Arg Lower Area Asp Asp Phe Vai Leu 100 105 110

Thr Asn Vai Vai Gly Thr Gin Arg Leu Leu Asp Ala Ala Leu Arg His 115 120 125 107053 48Thr Asn Vai Or Gly Thr Gin Arg Leu Leu Asp Ala Lower Leu Arg His 115 120 125 107053 48

Gly Vai Glu Pro Phe Val Leu Vai Ser Thr Asp Glu Val Tyr Gly Ser 130 135 140 lie Ala Ser Gly Ser Trp Pro Glu Glu His Pro Leu Ser Pro Asn Ser 145 150 155 160Gly Vai Glu Pro Phe Val Leu Vai Ser Thr Asp Glu Val Tyr Gly Ser 130 135 140 lie Ala Ser Gly Ser Trp Pro Glu Glu His Pro Leu Ser Pro Asn Ser 145 150 155 160

Pro'Tyr Ala Ala Ser Lys Ala Ser Ala Asp Leu Met Ala Phe Ala Cys 165 170 175Pro'Tyr Ala Ala Ser Lys Ala Ser Ala Asp Leu Met Ala Phe Ala Cys 165 170 175

His Arg Thr His Gly Leu Asp Val Arg Val Thr Arg Cys Ser Asn Asn 180 185 190His Arg Thr His Gly Leu Asp Val Arg Val Thr Arg Cys Ser Asn Asn 180 185 190

Tyr Gly Pro Arg Gin His Pro Glu Lys Leu lie Pro Arg Phe Val Thr 195 200 205Tyr Gly Pro Arg Gin His Pro Glu Lys Leu lie Pro Arg Phe Val Thr 195 200 205

Asn Leu Leu Asp Gly Leu Pro Val Pro Leu Tyr Gly Asp Gly Arg Asn 210 215 220Asn Leu Leu Asp Gly Leu Pro Val Pro Leu Tyr Gly Asp Gly Arg Asn 210 215 220

Val Arg Glu Trp Leu His Val Glu Asp His Cys Arg Gly Val Asp Leu 225 230 235 240Val Arg Glu Trp Leu His Val Glu Asp His Cys Arg Gly Val Asp Leu 225 230 235 240

Val Arg Thr Ala Gly Arg Pro Gly Gly Val Tyr His He Gly Gly Gly 245 250 255Val Arg Thr Ala Gly Arg Pro Gly Gly Val Tyr His He Gly Gly Gly 245 250 255

Arg Glu Leu Ser Asn Arg Glu Leu Val Gly Met Leu Leu Glu Leu Cys 260 265 270Arg Glu Leu Ser Asn Arg Glu Leu Val Gly Met Leu Leu Glu Leu Cys 260 265 270

Gly Ala Asp Trp Ser Ser Val Arg His Val Pro Asp Arg Lys Gly His 275 280 285Gly Ala Asp Trp Ser Ser Val Arg His Val Pro Asp Arg Lys Gly His 275 280 285

Asp Leu Arg Tyr Ser Leu Asp Trp Gly Arg Ala Arg Glu Glu Leu Gly 290 295 300Asp Leu Arg Tyr Ser Leu Asp Trp Gly Arg Ala Arg Glu Glu Leu Gly 290 295 300

Tyr Arg Pro Ala Arg Glu Phe Ser Ser Gly Leu Arg Ser Thr Val Gin 305 310 315 320 -, -- Trp Tyr Arg Glu Asn Arg Ser Trp Trp Glu Pro Leu Lys Arg Gly Val 325 330 335Tyr Arg Pro Ala Arg Glu Phe Ser Ser Gly Leu Arg Ser Thr Val Gin 305 310 315 320 -, - Trp Tyr Arg Glu Asn Arg Ser Trp Trp Glu Pro Leu Lys Arg Gly Val 325 330 335

Thr Ala Pro Gly Gly Thr Ser Thr Val Val Pro Gly Val Arg 340 345 350Thr Ala Pro Gly Gly Thr Ser Thr Val Val Pro Gly Val Arg 340 345 350

(2) SEQ ID NO: 10:N TIEDOT(2) DETAILS OF SEQ ID NO: 10

(i) SEKVENSSIN TIEDOT: ] ' (A) PITUUS: 134 aminohappoa V. (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoaL:n translaatiotuote" 107053 49 (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 10:(i) SEQUENCE DETAILS:] '(A) LENGTH: 134 amino acids V. (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL TYPE: peptide (D) OTHER INFORMATION: / Note. = "snoaL Translation Product" 107053 49 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10:

Met Vai Ser Ala Phe Asn Thr Gly Arg Thr Asp Asp Val Asp Glu Tyr 15 10 15 lie His Pro Asp iyr Leu Asn Pro Ala Thr Leu Glu His Gly lie His 20 25 30Met Vai Ser Ala Phe Asn Thr Gly Arg Thr Asp Asp Val Asp Glu Tyr 15 10 15 lie His Pro Asp iyr Leu Asn Pro Ala Thr Leu Glu His Gly lie His 20 25 30

Thr Gly Pro Lys Ala Phe Ala Gin Leu Val Gly Trp Val Arg Ala Thr 35 40 45Thr Gly Pro Lys Ala Phe Ala Gin Leu Val Gly Trp Val Arg Ala Thr 35 40 45

Phe Ser Glu Glu Ala Arg Leu Glu Glu Val Arg lie Glu Glu Arg Gly 50 55 60Phe Ser Glu Glu Ala Arg Leu Glu Glu Val Arg lie Glu Glu Arg Gly 50 55 60

Pro Trp Val Lys Ala Tyr Leu Val Leu Tyr Gly Arg His Val Gly Arg 65 70 75 80Pro Trp Val Lys Lower Tyr Leu Val Leu Tyr Gly Arg His Val Gly Arg 65 70 75 80

Leu Val Gly Met Pro Pro Thr Asp Arg Arg Phe Ser Gly Glu Gin Val 85 90 95Leu Val Gly Met Pro Pro Thr Asp Arg Arg Phe Ser Gly Glu Gin Val 85 90 95

His Leu Met Arg lie Val Asp Gly Lys lie Arg Asp His Arg Asp Trp 100 105 110His Leu Met Arg lie Val Asp Gly Lys lie Arg Asp His Arg Asp Trp 100 105 110

Pro Asp Phe Gin Gly Thr Leu Arg Gin Leu Gly Asp Pro Trp Pro Asp 115 120 125Pro Asp Phe Gin Gly Thr Leu Arg Gin Leu Gly Asp Pro Trp Pro Asp 115 120 125

Asp Glu Gly Trp Arg Pro 130Asp Glu Gly Trp Arg Pro 130

(2) SEQ ID NO: 11:N TIEDOT(2) DETAILS OF SEQ ID NO: 11

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 235 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen *:(ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoKm translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 11:(i) SEQUENCE DETAILS: (A) LENGTH: 235 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear * :( ii) MOLECYL TYPE: peptide (D) OTHER INFORMATION: / Note.` snoKm Translation Product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11:

Met Pro Asp Pro Gly Gly Pro Thr Thr Ala Glu Asn Leu Ser Lys Glu 15 10 15 : Ala Vai Arg Phe Tyr Arg Glu Gin Gly Tyr Vai His Ile Pro Arg Vai 20 25 30Met Pro Asp Pro Gly Gly Pro Thr Thr Ala Glu Asn Leu Ser Lys Glu 15 10 15: Ala Vai Arg Phe Tyr Arg Glu Gin Gly Tyr Vai His Ile Pro Arg Vai 20 25 30

Leu Ser Glu Thr Glu Vai Thr Ala Phe Arg Ala Ala Cys Glu Glu Vai 35 40 45Leu Ser Glu Thr Glu Vai Thr Ala Phe Arg Ala Ala Cys Glu Glu Vai 35 40 45

Leu Glu Lys Glu Gly Arg Glu Ile Ser Gly Ile Ala Leu Arg Leu Ala 50 55 60 107053 50Leu Glu Lys Glu Gly Arg Glu Ile Ser Gly Ile Ala Leu Arg Leu Ala 50 55 60 107053 50

Gly Ala Pro Leu Arg Val Tyr Ser Ser Asp lie Leu Val Lys Glu Pro 65 70 75 80Gly Ala Pro Leu Arg Val Tyr Ser Ser Asp lie Leu Val Lys Glu Pro 65 70 75 80

Lys Arg Thr Leu Pro Thr Leu Val His Asp Asp Glu Thr Gly Leu Pro 85 90 95Lys Arg Thr Leu Pro Thr Leu Val His Asp Asp Glu Thr Gly Leu Pro 85 90 95

Leu Asn Glu Leu Ser Ala Thr Leu Thr Ala Trp lie Ala Leu Thr Asp 100 105 110Leu Asn Glu Leu Ser Ala Thr Leu Thr Ala Trp lie Ala Leu Thr Asp 100 105 110

Val Pro Val Glu Arg Gly Cys Met Ser Tyr Val Pro Gly Ser His Leu 115 120 125Val Pro Val Glu Arg Gly Cys Met Ser Tyr Val Pro Gly Ser His Leu 115 120 125

Arg Ala Arg Glu Asp Arg Gin Glu His Met Thr Ser Phe Ala Glu Phe 130 135 140Arg Ala Arg Glu Asp Arg Gin Glu His Met Thr Ser Phe Ala Glu Phe 130 135 140

Arg Asp Leu Ala Asp Val Trp Pro Asp Tyr Pro Trp Gin Pro Arg Val 145 150 155 160Arg Asp Leu Area Asp Val Trp Pro Asp Tyr Pro Trp Gin Pro Arg Val 145 150 155 160

Ala Val Pro Val Arg Ala Gly Asp Val Val Phe His His Cys Arg Thr 165 170 175Ala Val Pro Val Arg Ala Gly Asp Val Val Phe His His Cys Arg Thr 165 170 175

Val His Met Ala Glu Ala Asn Thr Ser Asp Ser Val Arg Met Ala His 180 185 190Val His Met Ala Glu Ala Asn Thr Ser Asp Ser Val Arg Met Ala His 180 185 190

Gly Val Val Tyr Met Asp Ala Asp Ala Thr Tyr Arg Pro Gly Val Gin 195 200 205Gly Val Val Tyr Met Asp Ala Asp Ala Thr Tyr Arg Pro Gly Val Gin 195 200 205

Asp Gly His Leu Ser Arg Leu Ser Pro Gly Asp Pro Leu Glu Gly Glu 210 215 220Asp Gly His Leu Ser Arg Leu Ser Pro Gly Asp Pro Leu Glu Gly Glu 210 215 220

Leu Phe Pro Leu Val Thr Ala Gly Thr Arg Gin 225 230 235Leu Phe Pro Leu Val Thr Ala Gly Thr Arg Gin 225 230 235

(2) SEQ ID NO: 12:N TIEDOT(2) DETAILS OF SEQ ID NO: 12

(i) SEKVENSSIN TIEDOT: t (A) PITUUS: 390 aminohappoa • (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogD:n translaatiotuote" . (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 12: • .(i) SEQUENCE DETAILS: (A) LENGTH: 390 amino acids • (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL TYPE: peptide (D) OTHER DETAILS: / Note.` snogD translation product ". (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12: •.

Met Arg Vai Pro Gly Ser Cys Arg Thr Gly Gly Ile Met Arg Ala Leu 15 10 15Met Arg Vai Pro Gly Ser Cys Arg Thr Gly Gly Ile Met Arg Ala Leu 15 10 15

Phe Ile Thr Ser Pro Gly Leu Ser His Ile Leu Pro Thr Vai Pro Leu 20 25 30Phe Ile Thr Ser Pro Gly Leu Ser His Ile Leu Pro Thr Vai Pro Leu 20 25 30

Ala Gin Ala Leu Arg Ala Leu Gly His Glu Vai Arg Tyr Ala Thr Gly 35 40 45 107053 51Ala Gin Ala Leu Arg Ala Leu Gly His Glu Vai Arg Tyr Ala Thr Gly 35 40 45 107053 51

Gly Asp Ile Arg Ala Vai Ala Glu Ala Gly Leu Cys Ala Vai Asp Vai 50 55 60Gly Asp Ile Arg Area Or Area Glu Area Gly Leu Cys Area Or Asp Vai 50 55 60

Ser Pro Gly Vai Asn Tyr Ala Lys Leu Phe Vai Pro Asp Asp Thr Asp 65 70 75 80Ser Pro Gly Vai Asn Tyr Ala Lys Leu Phe Vai Pro Asp Thp Asp Thr Asp 65 70 75 80

Vai Thr Asp Pro Met His Ser Glu Gly Leu Gly Glu Gly Phe Phe Ala 85 90 95Vai Thr Asp Pro Met His Ser Glu Gly Leu Gly Glu Gly Phe Phe Ala 85 90 95

Glu Met Phe Ala Arg Vai Ser Ala Vai Ala Vai Asp Gly Ala Leu Arg 100 105 110Glu Met Phe Ala Arg Or Ser Ala Or Ala Or Asp Gly Ala Leu Arg 100 105 110

Thr Ala Arg Ser Trp Arg Pro Asp Leu Vai Vai His Thr Pro Thr Gin 115 120 125Thr Ala Arg Ser Trp Arg Pro Asp Leu Or Is His Thr Pro Thr Gin 115 120 125

Gly Ala Gly Pro Leu Thr Ala Ala Ala Leu Gin Leu Pro Cys Vai Glu 130 135 140Gly Ala Gly Pro Leu Thr Ala Ala Leu Gin Leu Pro Cys Vai Glu 130 135 140

Leu Pro Leu Gly Pro Ala Asp Ser Glu Pro Gly Leu Gly Ala Leu Ile 145 150 155 160Leu Pro Leu Gly Pro Ala Asp Ser Glu Pro Gly Leu Gly Ala Leu Ile 145 150 155 160

Arg Arg Ala Met Ser Lys Asp Tyr Glu Arg His Gly Vai Thr Gly Glu 165 170 175Arg Arg Ala Met Ser Lys Asp Tyr Glu Arg His Gly Vai Thr Gly Glu 165 170 175

Pro Thr Gly Ser Vai Arg Leu Thr Thr Thr Pro Pro Ser Vai Glu Ala 180 185 190Pro Thr Gly Ser Vai Arg Leu Thr Thr Thr Pro Pro Ser Vai Glu Ala 180 185 190

Leu Leu Pro Glu Asp Arg Arg Ser Pro Gly Ala Trp Pro Met Arg Tyr 195 200 205Leu Leu Pro Glu Asp Arg Arg Ser Pro Gly Ala Trp Pro Met Arg Tyr 195 200 205

Vai Pro Tyr Asn Gly Gly Ala Vai Leu Pro Asp Trp Leu Pro Pro Ala 210 215 220Vai Pro Tyr Asn Gly Gly Lower Vai Leu Pro Asp Trp Leu Pro Pro Lower 210 215 220

Ala Gly Arg Arg Arg Ile Ala Vai Thr Leu Gly Ser Ile Asp Ala Leu 225 230 235 240Ala Gly Arg Arg Arg Ile Ala Vai Thr Leu Gly Ser Ile Asp Ala Leu 225 230 235 240

Ser Gly Gly Ile Ala Lys Leu Ala Pro Leu Phe Ser Glu Vai Ala Asp ' 245 250 255Ser Gly Gly Ile Ala Lys Leu Ala Pro Leu Phe Ser Glu Vai Ala Asp '245 250 255

Vai Asp Ala Glu Phe Vai Leu Thr Leu Gly Gly Gly Asp Leu Ala Leu 260 265 270Vai Asp Ala Glu Phe Vai Leu Thr Leu Gly Gly Gly Asp Leu Ala Leu 260 265 270

Leu Gly Glu Leu Pro Ala Asn Vai Pro Vai Vai Glu Trp Ile Pro Leu 275 280 285Leu Gly Glu Leu Pro Area Asn Or Pro Or Glu Trp Ile Pro Leu 275 280 285

Gly Ala Leu Leu Glu Thr Cys Asp Ala Ile Ile His His Gly Gly Ser 290 295 300Gly Ala Leu Leu Glu Thr Cys Asp Ale Ile Ile His His Gly Gly Ser 290 295 300

Gly Thr Leu Leu Thr Ala Leu Ala Ala Gly Vai Pro Gin Cys Vai Ile 305 310 315 320Gly Thr Leu Leu Thr Ala Leu Ala Ala Gly Vai Pro Gin Cys Vai Ile 305 310 315 320

Pro His Gly Ser Tyr Gin Asp Thr Asn Arg Asp Vai Leu Thr Gly Leu 325 330 335 « « 107053 52Pro His Gly Ser Tyr Gin Asp Thr Asn Arg Asp Vai Leu Thr Gly Leu 325 330 335 «« 107053 52

Gly Ile Gly Phe Asp Ala Glu Ala Gly Ser Leu Gly Ala Glu Gin Cys 340 345 350Gly Ile Gly Phe Asp Ala Glu Ala Gly Ser Leu Gly Ala Glu Gin Cys 340 345 350

Arg Arg Leu Leu Asp Asp Ala Gly Leu Arg Glu Ala Ala Leu Arg val 355 360 365Arg Arg Leu Leu Asp Asp Ala Gly Leu Arg Glu Ala Leu Arg h 355 360 365

Arg Gin Glu Met Ser Glu Met Pro Pro Pro Ala Glu Thr Ala Ala Lys 370 375 380Arg Gin Glu Met Ser Glu Met Pro Pro Pro Ala Glu Thr Ala Ala Lys 370 375 380

Leu Val Ala Leu Ala Gly 385 390Leu Val Ala Leu Ala Gly 385 390

(2) SEQ ID NO: 13:N TIEDOT(2) DETAILS OF SEQ ID NO: 13

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 275 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoW:n translaatiotuote" <xi) SEKVENSSIN KUVAUS: SEQ ID NO: 13:(i) SEQUENCE DETAILS: (A) LENGTH: 275 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL TYPE: peptide (D) OTHER DETAILS: / note.= "s. n Translation Product "<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13:

Met Thr Vai Leu Vai Thr Gly Ala Thr Gly Asn Vai Gly Arg His Vai 15 10 15Met Thr Vai Leu Vai Thr Gly Lower Thr Gly Asn Vai Gly Arg His Vai 15 10 15

Vai Thr Gly Leu Leu Ala Ala Gly Arg Arg Vai Arg Ala Leu Thr Arg 20 25 30Will Thr Gly Leu Leu Area Gly Arg Arg Will Thr Gla Leu Thr Arg 20 25 30

Thr Pro Asp Arg Ser Gly Leu Pro Gly Gly Ala Glu Ile Thr Gly Gly 35 40 45Thr Pro Asp Arg Ser Gly Leu Pro Gly Gly Ala Glu Ile Thr Gly Gly 35 40 45

Asp Leu Thr Arg Pro Glu Thr Tyr Glu Arg Met Leu Asp Gly Vai Glu 50 55 60Asp Leu Thr Arg Pro Glu Thr Tyr Glu Arg Met Leu Asp Gly Vai Glu 50 55 60

Ala Vai Tyr Leu Phe Pro Vai Pro Glu Thr Ala Ala Ala Phe Ala Gly 65 70 75 80Ala Vai Tyr Leu Phe Pro Vai Pro Glu Thr Ala Ala Phe Ala Gly 65 70 75 80

Ala Ala Arg Arg Ala Gly Vai Arg Arg Ile Vai Vai Leu Ser Ser Asp 85 90 95Area Area Arg Arg Area Gly Is Arg Arg Ile Or Is Leu Ser Ser Asp 85 90 95

Ser Vai Thr Asp Gly Thr Asp Thr Gly Gly His Arg Arg Vai Glu Leu 100 105 110Ser Vai Thr Asp Gly Thr Asp Thr Gly Gly His Arg Arg Vai Glu Leu 100 105 110

Ala Vai Glu Asp Thr Gly Leu Glu Trp Thr His Vai Arg Pro Gly Glu 115 120 125Ala Vai Glu Asp Thr Gly Leu Glu Trp Thr His Vai Arg Pro Gly Glu 115 120 125

Phe Ala Leu Asn Lys Vai Thr Leu Trp Ala Pro Ser Ile Arg Ala Glu 130 135 140Phe Ala Leu Asn Lys Vai Thr Leu Trp Ala Pro Ser Ile Arg Ala Glu 130 135 140

Gly Vai Vai Arg Ser Ala Tyr Pro Asp Ala Arg Vai Ala Pro Vai His . 145 150 155 160 107053 53Gly Does Or Ar Ser Ser Ala Tyr Pro Asp Arg Or Ar Pro Pro His. 145 150 155 160 107053 53

Glu Ala Asp Vai Ala Ala Vai Ala Vai Thr Ala Leu Leu Lys Glu Gly 165 170 175Glu Ala Asp Vai Ala Ala Ala Ala A Thr Ala Leu Leu Lys Glu Gly 165 170 175

His Ala Gly Arg Ala Tyr Ser Vai Thr Gly Pro Gin Ala Leu Thr Gin 180 185 190His Ala Gly Arg Ala Tyr Ser Vai Thr Gly Pro Gin Ala Leu Thr Gin 180 185 190

Arg Glu Gin Vai Arg Ala Vai Gly Glu Gly Leu Gly Arg Ser Leu Ala 195 200 205Arg Glu Gin Ar Arg Area Ar Gly Glu Gly Leu Gly Arg Ser Leu Area 195 200 205

Phe Vai Glu Vai Thr Pro Gly Gin Ala Arg Ala Asp Leu Thr Ala Gin 210 215 220Phe Vai Glu Vai Thr Pro Gly Gin Ala Arg Ala Asp Leu Thr Ala Gin 210 215 220

Gly Leu Pro Ala Pro Ile Ala Asp Tyr Vai Leu Ala Phe Gin Ala Gly 225 230 235 240Gly Leu Pro Ala Pro Ile Ala Asp Tyr Vai Leu Ala Phe Gin Ala Gly 225 230 235 240

Trp Thr Glu Arg Pro Ala Pro Ala Arg Pro Thr Vai Arg Glu Vai Thr 245 250 255Trp Thr Glu Arg Pro Area Pro Area Arg Pro Thr Do Arg Glu Ar Thr 245 250 255

Gly Arg Pro Ala Arg Thr Leu Ala Gin Trp Ala Ala Asp His Arg Ala 260 265 270Gly Arg Pro Area Arg Thr Leu Area Gin Trp Area Area Asp His Arg Area 260 265 270

Asp Phe Arg 275Asp Phe Arg 275

(2) SEQ ID NO: 14:N TIEDOT(2) DETAILS OF SEQ ID NO: 14

(i) SEKVENSSIN TIEDOT: (A) PITUUS: over 424 aminohappoa (B) tyyppi: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen <ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogE:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 14: • t(i) SEQUENCE DETAILS: (A) LENGTH: over 424 amino acids (B) type: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear <ii) MOLECYL TYPE: peptide (D) OTHER DETAILS: / note.= "snogE "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14: • t

Vai Arg Vai Leu Leu Thr Ser Phe Ala Met Asp Ala His Phe Cys Thr 15 10 15Vai Ar Vai Leu Leu Thr Ser Phe Lower Met Asp Lower His Phe Cys Thr 15 10 15

Ala Vai Pro Leu Ala Trp Ala Leu Arg Ser Ala Gly His Glu Vai Arg 20 25 30Ala Vai Pro Leu Ala Trp Ala Leu Arg Ser Ala Gly His Glu Vai Arg 20 25 30

Vai Ala Gly Gin Pro Ala Leu Thr Ser Thr Ile Thr Gly Ala Gly Leu 35 40 45Will Ala Gly Gin Pro Ala Leu Thr Ser Thr Ile Thr Gly Ala Gly Leu 35 40 45

Thr Ala Vai Pro Vai Gly Arg Asp His Thr His Gly Ser Leu Leu Gly 50 55 60Thr Lower Or Pro Or Gly Arg Asp His Thr His Gly Ser Leu Leu Gly 50 55 60

Arg Vai Gly Ser Asp Ile Leu Ala Leu His Asp Glu Ala Asp Tyr Leu ' 65 70 75 80Arg Vai Gly Ser Asp Ile Leu Ala Leu His Asp Glu Ala Asp Tyr Leu '65 70 75 80

Glu Ala Arg His Asp Ala Leu Gly Phe Glu Phe Leu Lys Gly His Asn : 85 90 95Glu Ala Arg His Asp Ala Leu Gly Phe Glu Phe Leu Lys Gly His Asn: 85 90 95

10705S10705S

5454

Thr Vai Met Ser Ala Leu Phe Tyr Ser Gin lie Asn Asn Asp Ser Met 100 105 110Thr Vai Met Ser Ala Leu Phe Tyr Ser Gin lie Asn Asn Asp Ser Met 100 105 110

Val Asp Asp Leu Val Asp Phe Ala Arg His Trp Arg Pro Asp Leu Val 115 120 125Val Asp Asp Leu Val Asp Phe Area Arg His Trp Arg Pro Asp Leu Val 115 120 125

Val Trp Glu Pro Phe Thr Phe Ala Gly Ala Val Ala Ala Arg Ala Ser 130 135 140Val Trp Glu Pro Phe Thr Phe Ala Gly Ala Val Ala Ala Arg Ala Ser 130 135 140

Gly Ala Ala His Ala Arg Leu Leu Ser Phe Pro Asp Leu Phe Leu Ser 145 150 155 160Gly Ala Ala His Ala Arg Leu Leu Ser Phe Pro Asp Leu Phe Leu Ser 145 150 155 160

Thr Arg Arg Leu Phe Leu Glu Arg Met Ala Arg Gin Glu Pro Glu His 165 170 175Thr Arg Arg Leu Phe Leu Glu Arg Met Ala Arg Gin Glu Pro Glu His 165 170 175

His Asp Asp Thr Leu Ala Glu Trp Leu Asp Trp Thr Leu Gly Arg His 180 185 190His Asp Asp Thr Leu Area Glu Trp Leu Asp Trp Thr Leu Gly Arg His 180 185 190

Gly His Ser Phe Asp Glu Glu lie Val Thr Gly Gin Trp Ser lie Asp 195 200 205Gly His Ser Phe Asp Glu Glu lie Val Thr Gly Gin Trp Ser lie Asp 195 200 205

Gin Thr Pro Ala Pro Val Arg Leu Asp Ala Gly Gly Pro Thr Val Pro 210 215 220Gin Thr Pro Lower Pro Val Arg Leu Asp Lower Gly Gly Pro Thr Val Pro 210 215 220

Met Arg Tyr Val Pro Tyr Ser Gly Leu Val Pro Thr Val Val Pro Asp 225 230 235 240Met Arg Tyr Val Pro Tyr Ser Gly Leu Val Pro Thr Val Val Pro Asp 225 230 235 240

Trp Leu Arg Arg Pro Pro Glu Arg Pro Arg Val Leu Val Thr Leu Gly 245 250 255 lie Thr Ser Arg Arg Val Lys Ser Phe Leu Ala Val Ser Val Asp Asp 260 265 270Trp Leu Arg Arg Pro Pro Glu Arg Pro Arg Val Leu Val Thr Leu Gly 245 250 255 lie Thr Ser Arg Arg Val Lys Ser Phe Leu Ala Val Ser Val Asp Asp 260 265 270

Leu Phe Glu Ala Val Ala Gly Leu Gly Val Glu Val Val Ala Thr Leu 275 280 285Leu Phe Glu Ala Val Ala Gly Leu Gly Val Glu Val Ala Thr Leu 275 280 285

Asp Ala Asp Gin Arg Glu Leu Leu Gly Arg Val Pro Asp His Phe Arg 290 295 300 lie Val Glu His Val Pro Leu Asp Ala Val Leu Pro Thr Cys Ser Ala 305 310 315 320 lie Val His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Ala Val Tyr 325 330 335Asp Ala Asp Gin Arg Glu Leu Gly Arg Val Pro Asp His Phe Arg 290 295 300 lie Val Glu His Val Pro Leu Asp Ala Val Leu Pro Thr Cys Ser Ala 305 310 315 320 lie Val His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Ala Val Tyr 325 330 335

Gly Val Pro Gin Val Ser Leu Gly Ser Met Trp Asp His Phe Tyr Arg . 340 345 350Gly Val Pro Gin Val Ser Leu Gly Ser Met Trp Asp His Phe Tyr Arg. 340 345 350

Ala Arg Arg Leu Glu Glu Leu Gly Ala Gly Leu Arg Leu Pro Ser Gly 355 360 365Ala Arg Arg Leu Glu Glu Leu Gly Ala Gly Leu Arg Leu Pro Ser Gly 355 360 365

Glu Leu Thr Ala Glu Gly Leu Arg Thr Arg Leu Glu Arg Val Leu Gly 370 375 380 55 10705όGlu Leu Thr Area Glu Gly Leu Arg Thr Arg Glu Arg Val Leu Gly 370 375 380 55 10705ό

Glu Pro Ser Phe Gly Thr Ala Ala Gin Ala Leu Ser Asp Thr lie Ala 385 390 395 400Glu Pro Ser Phe Gly Thr Ala Ala Gin Ala Leu Ser Asp Thr lie Ala 385 390 395 400

Ala Glu Pro Ser Pro Ser Glu Vai Val Pro Val Leu Glu Glu Leu Thr 405 410 415Ala Glu Pro Ser Pro Ser Glu Or Val Pro Val Leu Glu Glu Leu Thr 405 410 415

Gly Arg His Arg Pro Gly Thr Arg 420Gly Arg His Arg Pro Gly Thr Arg 420

(2) SEQ ID NO: 15:N TIEDOT(2) DETAILS OF SEQ ID NO: 15

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 139 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoL:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 15:(i) SEQUENCE DETAILS: (A) LENGTH: 139 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL-TYPE: peptide (D) OTHER DETAILS: / note.= n translation product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15:

Met Ser Thr Thr Ala Asn Lys Glu Arg Cys Leu Glu Met Vai Ala Ala 15 10 15Met Ser Thr Thr Ala Asn Lys Glu Arg Cys Leu Glu Met Vai Ala Ala 15 10 15

Trp Asn Arg Trp Asp Vai Ser Gly Vai Vai Ala His Trp Ala Pro Asp 20 25 30Trp Asn Arg Trp Asp Or Ser Gly Or Or His Trp Asla Pro Asp 20 25 30

Vai Vai His Tyr Asp Asp Glu Asp Lys Pro Vai Ser Ala Glu Glu Vai 35 40 45Vai Or His Tyr Asp Asp Glu Asp Lys Pro Vai Ser Ala Glu Glu Vai 35 40 45

Vai Arg Arg Met Asn Ser Ala Vai Glu Ala Phe Pro Asp Leu Arg Leu 50 55 60Vai Arg Arg Met Asn Ser Ala Vai Glu Ala Phe Pro Asp Leu Arg Leu 50 55 60

Asp Vai Arg Ser Ile Vai Gly Glu Gly Asp Arg Vai Met Leu Arg Ile 65 70 75 80Asp Arg Ser Ile Or Gly Glu Gly Asp Arg Or Met Leu Arg Ile 65 70 75 80

Thr Cys Ser Ala Thr His Gin Gly Vai Phe Met Gly Ile Ala Pro Thr 85 90 95Thr Cys Ser Ala Thr His Gin Gly Vai Phe Met Gly Ile Ala Pro Thr 85 90 95

Gly Arg Lys Vai Arg Trp Thr Tyr Leu Glu Glu Leu Arg Phe Ser Glu 100 105 110Gly Arg Lys Or Arg Trp Thr Tyr Leu Glu Glu Leu Arg Phe Ser Glu 100 105 110

Ala Gly Lys Vai Vai Glu His Trp Asp Vai Phe Asn Phe Ser Pro Leu 115 120 125Ala Gly Lys Or Or Glu His Trp Asp Or Phe Asn Phe Ser Pro Leu 115 120 125

Phe Arg Asp Leu Gly Vai Vai Pro Asp Gly Leu 130 ' 135Phe Arg Asp Leu Gly Vai Vai Pro Asp Gly Leu 130 '135

(2) SEQ ID NO: 16:N TIEDOT(2) DETAILS OF SEQ ID NO: 16

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 155 aminohappoa . (B) TYYPPI: aminohappo 107053 56 (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MOOT TIEDOT: /huom.= "snoO:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 16:(i) SEQUENCE INFORMATION: (A) LENGTH: 155 amino acids. (B) TYPE: amino acid 107053 56 (C) DRAINAGE: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL-TYPE: peptide (D) MOOD DETAILS: / Note: "snoO Translation Product" (xi) SEQ ID NO: NO: 16:

Met Ser Val Arg Thr Asp Gin Thr Ala Ala Pro Glu Asp Arg Ala Ala 15 10 15Met Ser Val Arg Thr Asp Gin Thr Area Ala Pro Glu Asp Arg Area Ala 15 10 15

Ala Thr Asp Pro Gly Phe Gly His Leu Tyr Ala Gin Val Gin Gin Phe 20 25 30Ala Thr Asp Pro Gly Phe Gly His Leu Tyr Ala Gin Val Gin Gin Phe 20 25 30

Tyr Ala Arg Gin Met Gin Leu Leu Asp Ser Gly Ala Ala Glu Glu Trp 35 40 45Tyr Ala Arg Gin Met Gin Leu Leu Asp Ser Gly Ala Ala Glu Glu Trp 35 40 45

Ala Ala Thr Phe Thr Glu Asp Gly Thr Phe Ala Arg Pro Ser Ser Pro 50 55 60Ala Ala Thr Phe Thr Glu Asp Gly Thr Phe Ala Arg Pro Ser Ser Pro 50 55 60

Glu Pro Ala Arg Gly His Ala Glu Leu Ala Ala Gly Ala Arg Ala Ala 65 70 75 80Glu Pro Area Arg Gly His Area Area Glu Leu Area Area Gly Area Area Area 65 70 75 80

Ala Glu Arg Leu Ala Ala Glu Gly Leu Ser His Arg His Val lie Gly 85 90 95Ala Glu Arg Leu Ala Ala Glu Gly Leu Ser His Arg His Val lie Gly 85 90 95

Met Thr Ala Val Arg Arg Glu Pro Asp Gly Ser Val Phe Val Arg Ser 100 105 110Met Thr Ala Val Arg Arg Glu Pro Asp Gly Ser Val Phe Val Arg Ser 100 105 110

Tyr Ala Gin Val Phe Ala Thr Arg Arg Gly Glu Ala Pro Arg Leu His 115 120 125Tyr Ala Gin Val Phe Ala Thr Arg Arg Gly Glu Ala Pro Arg Leu His 115 120 125

Leu lie Cys Val Cys Glu Asp Val Leu Val Arg Glu Gly Pro Gly Leu 130 135 140Leu lie Cys Val Cys Glu Asp Val Leu Val Arg Glu Gly Pro Gly Leu 130 135 140

Lys Val Arg Glu Arg Val Val Thr His Asp Ala .Lys Val Arg Glu Arg Val Val Thr His Asp Ala.

; ' 145 150 155; '145 150 155

(2) SEQ ID NO: 17:N TIEDOT(2) DETAILS OF SEQ ID NO: 17

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 281 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoaF:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 17:(i) SEQUENCE DETAILS: (A) LENGTH: 281 amino acids (B) TYPE: amino acid (C) DURABILITY: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL TYPE: peptide (D) OTHER DETAILS: / Note: = n translation product "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 17:

Vai Arg Ala Met Thr Asp Ser Thr Gly Pro Arg Pro Vai Pro Ala Met : 1 5 10 15 « 107053 57Vai Arg Lower Met Thr Asp Ser Thr Gly Pro Arg Pro Vai Pro Lower Met: 1 5 10 15 «107053 57

Ser Pro Ala Pro Ser Pro Thr Pro Ser Pro Gly Pro Ala Pro Gly Ser 20 25 30Ser Pro Ala Pro Ser Pro Thr Pro Ser Pro Gly Pro Ala Pro Gly Ser 20 25 30

Glu Pro Ala Pro Leu Ala Vai Ile Val Thr Gly Gly Gly Ser Gly lie 35 40 45Glu Pro Ala Pro Leu Ala Vai Ile Val Thr Gly Gly Gly Ser Gly lie 35 40 45

Gly Arg Ala Thr Ala Arg Ala Phe Ala Ala Gin Gly Ala Lys Val Leu 50 55 60Gly Arg Ala Thr Ala Arg Ala Phe Ala Ala Gin Gly Ala Lys Val Leu 50 55 60

Val Val Gly Arg Thr Glu Asp Ala Leu Ala Gin Thr Ala Glu Gly Cys 65 70 75 80Val Val Gly Arg Thr Glu Asp Ala Leu Ala Gin Thr Ala Glu Gly Cys 65 70 75 80

Ala Asp Met Arg Val Leu Val Ala Asp Val Ala Ser Pro Asp Gly Pro 85 90 95Ala Asp Met Arg Val Leu Val Ala Asp Val Ala Ser Pro Asp Gly Pro 85 90 95

Gin Ala Val Val Asn Ala Ala Leu Arg Glu Phe Gly Arg lie Asp Val 100 105 110Gin Ala Val Val Asn Ala Ala Leu Arg Glu Phe Gly Arg lie Asp Val 100 105 110

Leu Val Asn Asn Ala Ala Val Ala Gly Met Glu Thr Leu Gin Thr Val 115 120 125Leu Val Asn Asn Ala Ala Val Ala Gly Met Glu Thr Leu Gin Thr Val 115 120 125

Asp Arg Asp Ala Val Ala Arg Gin Phe Gly Thr Asn Leu Thr Ala Pro 130 135 140Asp Arg Asp Ala Val Ala Arg Gin Phe Gly Thr Asn Leu Thr Ala Pro 130 135 140

Leu Phe Leu Val Gin Ser Ala Leu Gly Ala Leu Glu Lys Ser Arg Gly 145 150 155 160 lie Val Val Asn Val Gly Thr Ala Ala Thr Leu Gly Leu Arg Ala Ala 165 170 175Leu Phe Leu Val Gin Ser Ala Leu Gly Ala Leu Glu Lys Ser Arg Gly 145 150 155 160 lie Val Val Asn Val Gly Thr Ala Thr Leu Gly Leu Arg Ala Ala 165 170 175

Pro Thr Gly Ala Leu Tyr Gly Ala Ser Lys Val Ala Leu Asp Tyr Leu 180 185 190Pro Thr Gly Ala Leu Tyr Gly Ala Ser Lys Val Ala Leu Asp Tyr Leu 180 185 190

Thr Arg Thr Trp Ala Val Glu Leu Ala Pro Arg Gly lie Arg Val Val 195 200 205Thr Arg Thr Trp Ala Val Glu Leu Ala Pro Arg Gly lie Arg Val Val 195 200 205

Gly Val Ala Pro Gly Val lie Asp Thr Gly lie Gly Val Arg Met Gly i : - - 210 215 220Gly Val Ala Pro Gly Val Lie Asp Thr Gly Lie Gly Val Arg Met Gly i: - - 210 215 220

Met Thr Pro Glu Gly Tyr Arg Glu Phe Leu Thr Gly Met Gly Gly Arg 225 230 235 240Met Thr Pro Glu Gly Tyr Arg Glu Phe Leu Thr Gly Met Gly Gly Arg 225 230 235 240

Val Pro Val Gly Arg Val Gly Arg Pro Glu Asp Val Ala Trp Trp lie 245 250 255Val Pro Val Gly Arg Val Gly Arg Pro Glu Asp Val Ala Trp Trp lie 245 250 255

Val Gin Leu Ala Arg Pro Glu Ala Gly Tyr Ala Thr Gly Met Val Val 260 265 270Val Gin Leu Ala Arg Pro Glu Ala Gly Tyr Ala Thr Gly Met Val Val 260 265 270

Pro Val Asp Gly Gly Leu Ser Leu Val 275 280Pro Val Asp Gly Gly Leu Ser Leu Val 275 280

(2) SEQ ID NO: 18:N TIEDOT(2) DETAILS OF SEQ ID NO: 18

(i) SEKVENSSIN TIEDOT: , (A) PITUUS: 190 aminohappoa 107053 58 (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoN:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 18:(i) SEQUENCE DETAILS:, (A) LENGTH: 190 amino acids 107053 58 (B) TYPE: amino acid (C) SURFACE: single-stranded (D) TOPOLOGY: linear (ii) MOLECYL TYPE: peptide (D) OTHER INFORMATION: /h. "snoN Translation Product" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 18:

Vai Gin Glu Thr Glu Pro Gly Vai Pro Ala Asp Leu Pro Ala Glu Ser 15 10 15Is Gin Glu Thr Glu Pro Gly Is Pro Ala Asp Leu Pro Ala Glu Ser 15 10 15

Asp Pro Ala Ala Leu Glu Arg Leu Ala Ala Arg Tyr Arg Arg Asp Gly 20 25 30Asp Pro Area Area Leu Glu Arg Leu Area Area Arg Tyr Arg Arg Asp Gly 20 25 30

Tyr Vai His Vai Pro Gly Vai Leu Asp Ala Gly Glu Vai Ala Glu Tyr 35 40 45Tyr Vai His Vai Pro Gly Vai Leu Asp Ala Gly Glu Vai Ala Glu Tyr 35 40 45

Leu Ala Glu Ala Arg Arg Leu Leu Ala His Glu Glu Ser Vai Arg Trp 50 55 60Leu Ala Glu Ala Arg Arg Leu Leu Ala His Glu Glu Ser Vai Arg Trp 50 55 60

Gly Ser Gly Ala Gly Thr Vai Met Asp Tyr Vai Ala Asp Ala Gin Leu 65 70 75 80Gly Ser Gly Lower Gly Thr Or Met Asp Tyr Or Lower Asp Lower Gin Leu 65 70 75 80

Gly Ser Asp Thr Met Arg Arg Leu Ala Thr His Pro Arg Ile Ala Ala 85 90 95Gly Ser Asp Thr Met Arg Leu Ala Thr His Pro Arg Ile Ala Ala 85 90 95

Leu Ala Glu Tyr Leu Ala Gly Ser Pro Leu Arg Leu Phe Lys Leu Glu 100 105 110Leu Ala Glu Tyr Leu Ala Gly Ser Pro Leu Arg Leu Phe Lys Leu Glu 100 105 110

Vai Leu Leu Lys Glu Asn Lys Glu Lys Asp Ala Ser Vai Pro Thr Ala 115 120 125Vai Leu Leu Lys Glu Asn Lys Glu Lys Asp Ala Ser Vai Pro Thr Ala 115 120 125

Pro His His Asp Ala Phe Ala Phe Pro Phe Ser Thr Ala Gly Thr Ala 130 135 140 • - Leu Thr Ala Trp Vai Ala Leu Vai Asp Vai Pro Vai Glu Arg Gly Cys 145 150 155 160Pro His His Asp Ala Phe Ala Phe Pro Phe Ser Thr Ala Gly Thr Ala 130 135 140 • - Leu Thr Ala Trp Or Ala Leu Or Asp Vai Pro Or Glu Arg Gly Cys 145 150 155 160

Met Thr Phe Vai Pro Gly Ser His Leu Leu Pro Asp Pro Asp Thr Gly 165 170 175Met Thr Phe Vai Pro Gly Ser His Leu Leu Pro Asp Pro Asp Thr Gly 165 170 175

Asp Glu Pro Trp Ala Gly Ala Phe Thr Arg Pro Gly Glu Ile 180 185 190Asp Glu Pro Trp Ala Gly Ala Phe Thr Arg Pro Gly Glu Ile 180 185 190

Claims

107053

1. Isolerat and Renat DNA fragment, som e en gengruppering, som e för sig account for anthracycline biosynthesis bacterial Streptomyces nogaloter, germinating in succession or lOkb and 7kb BgUl fragment, s. Somal en angivet. 2.

An isolated purified DNA fragment, which is a gene cluster related to the anthracycline biosynthetic pathway of Streptomyces nogalater contained in the sequenced 10kb and 7kb Bglil fragments of the S. nogalaterin genome as shown in Figure 2.

The DNA fragment enligt patent kravet 1, som innehäller en nucleotide sequence angiven i SEQ ID NO: 1 eller en sequence, som har endinstone up to 80% homologue med avseende this sequence.

The DNA fragment of claim 1, comprising the nucleotide sequence set forth in SEQ ID NO: 1 or a sequence having at least 80% homology to said sequence. 10

3. Hybrid DNA, the native fragment of this invention is a fragment of the plasmid som replicase of the Streptomyces. 107053

A recombinant DNA containing a DNA fragment according to claim 1 or 2, cloned in a Streptomyces replicable plasmid.

4. The hybrid DNA enligt 3, the plasmid pSY15c, the plasmid pSY42 and the 1.1 kb A / M-K / wI fragment of ur plasmids pSY43 and the 1.1 kb A / M-K / wI fragment of ur plasmids pSY43.

The recombinant DNA of claim 3, which is a plasmid pSY15c, which contains a 1.4 kb SarnHI-AkcI fragment from pSY42 and a 1.1 kb MluI-Kpn1 fragment from pSY43.

Plasmiden pSY42, som deponerats to S. lividans-atammen TK24 / pSY42 med deponeringsnumret DSM 12451.

5. Plasmid pSY42 deposited with S. lividans strain TK24 / pSY42 under accession number DSM 12451. 20

6. Plasmiden pSY43, som deponerates to S. lividans-stammen TK24 / pSY43 med deponeringsnumret DSM 12452. 10

Plasmid pSY43 deposited in S. lividans strain TK24 / pSY43 under accession number DSM 12452.

7. Förfarande for att ffamställa hybridföreningar, kännetecknat därav, att that the DNA fragment enligt patentkravet 1 eller 2 transformeras in i en Streptomyces, den erhällna hybridstammen odlas och de bildade föreningarna isoleras. 8. Förfarande enligt patent kravet 7, callus dnav, att Streptomyces galilaeus.

A process for the preparation of hybrid compounds, characterized in that the DNA fragment according to claim 1 or 2 is transferred to a host in the heptoreptomyces, the resulting recombinant strain is cultured and the resulting compounds are isolated.

The method according to claim 7, characterized in that the Streptomyces host is a Streptomyces galilaeus host. 30, 107055

9. Förfarande enligt patent kravet 8, callus dnav, att Streptomyces galilaeus strain H026, H039, H063 eller H075, mite and mutant strain 20 av S. galilaeus ATCC 31615. • «'· 1« 1 · *

Method according to claim 8, characterized in that the host Streptomyces galilaeus is one of the strains H026, H039, H063 or H075 which are mutant strains of S. galilaeus ATCC 31615.

10 OH O OH It was

10. Förfarande enligt patentkravet 8, kännetecknat därav, att man producerar en anthracycline, som har feljande formel I 25. cooch3 in 0 011 9 (I>

30 Me- ^ 7 ~ ° / ηο ^ η X oh 107053

10. A process according to claim 8, characterized in that an anthracycline having the following formula IO COOCH3 Ah 0 0H <? (I) Me-7 ~ 7 OH 15

11. Förfarande enligt patentkravet 8, kännetecknat därav, att man producerar en anthracycline, series har over form II 5 O CÖOCIlj (P)

The process according to claim 8, characterized in that anthracyclinone of the following formula II is produced

20. COOCH3 .. Il ATm · OH O OH ÖH 25 107053

12. Förfarande för att framställa hybridföreningar, kännetecknat därav, att man 15 transformerar ätminstone an av genererna snogi, snogA, snoaM, snogN, snoaG, snogC, snogK, snoah, snoK., SnogD, snoW, snogE, snoL, snoL, snoL. oaF in i en Strepto-myces, the generic bovine gene fragment DNA ligand 1 eller 2, odlar den erhällna hybridstammen och isolerar de bildade föreningarna. 13. Förfarande enligt patentkravet 12, kännetecknat därav, att man transformerar in i ... Streptomyces-svden snoäL, som kodar för NAME-cycles. • «• i

A method for producing hybrid compounds, characterized by transferring at least one of the genes snog], snogA, snoaM, snogN, snoaG, snogC, snogK, snoaL, snoK, snogO, snoW, snogE, snoL, snoO and inoaF Streptomyces gene, are derived from the DNA fragment of claim 1 or 2, culturing the resulting recombinant strain and isolating the resulting compounds.

A method according to claim 12, characterized in that snoaL encoding NAME cyclase is introduced into the Streptomyces host.

14. Förfarande enligt patent kravet 12, kännetecknat därav, att man transformerar in i Streptomyces-arginine sngD och snogE, som codar för 25 glycosyltransferaser.

14. The method of claim 12, wherein at least one of the genes snogL and snogE encoding glycosyltransferases is introduced into the host Streptomyces.

Method according to claim 12, characterized in that at least one of the genes snogJ, snogN, snogC, snogK and snogK, which affect the production of nogalamine and nogalose, is introduced into the host Streptomyces-15.

15. Förfarande enligt patent kravet 12, kännetecknat därav, att man transformerar in i streptomyces-arginine åminstone en av genererna snogi, snogN, snogC, snogK och snogA, som inverkar Pä bildning av nogalamin och nogalos. 30 • r «