FI107053B

FI107053B - Nogalamysiinin biosynteesiin liittyvä geeniryhmittymä ja sen käyttö hybridiantibioottien tuotossa

Info

Publication number: FI107053B
Application number: FI982295A
Authority: FI
Inventors: Juha Hakala; Kristiina Ylihonko; Kaisa Palmu; Sirke Torkkell
Original assignee: Galilaeus Oy
Priority date: 1998-10-23
Filing date: 1998-10-23
Publication date: 2001-05-31
Also published as: FI982295A; WO2000024775A1; EP1123310A1; JP2002528068A; WO2000024775A9; FI982295A0

Description

107053

Nogalamysiinin biosynteesiin liittyvä geeniryhmittymä ja sen käyttö hybridianti-bioottien tuotossa

Keksinnön ala 5 Tämä keksintö koskee nogalamysiinin biosynteesiin liittyvää, Streptomyces nogalate-rista peräisin olevaa geeniryhmittymää ja sen sisältämien geenien käyttöä uusien hybridiantibioottien valmistamiseksi lääkeaineiden seulontaa varten.

10 Keksinnön tausta

Antrasykliinit ovat kasvainten vastaisia antibiootteja, joita tuottaa pääasiassa Strepto-mycesA&yi. Antrasykliineistä daunomysiiniperhe on kaupallisesti kaikkein tärkein, koska lähes kaikki niistä suunnilleen kymmenestä antrasykliinistä, jotka ovat nykyään 15 kliinisessä käytössä tai sytotoksisille lääkkeille tehtävissä loppuvaiheen kliinisissä kokeissa, kuuluvat tähän perheeseen. Huolimatta antrasykliinien pitkästä historiasta, noin kolme vuosikymmentä, niiden biosynteesitutkimukset ovat edelleen meneillään, ja on edelleen olemassa kiinnostusta löytää uusia molekyylejä kemoterapeuttisten aineiden kehittämiseksi syövän hoitoon. Geenitekniikkaa käytetään nykyisin etsittäessä 20 uusia molekyylejä lääkeaineseulontaa varten. Antrasykliinibiosynteesin geenien kloonaaminen helpottaa hybridiantrasykliinien tuottoa, samoin kuin niiden käyttöä kombinatorisessa biosynteesissä uusien molekyylien luomiseksi.

• r

Nogalamysiini, jonka Bhuyan and Dietz ensimmäisinä kuvasivat vuonna 1965, on 25 Streptomyces nogalaterin tuottama antrasykliiniantibiootti. Tämä yhdiste on erittäin aktiivinen kasvainsoluja vastaan, mutta toisaalta sen toksiset ominaisuudet ovat estäneet sen etenemisen kliinisiin kokeisiin (Bhuyan ja Smith, 1975). Menogariili (7- O-metyylinogaroli) on nogalamysiinin puolisynteettinen johdannainen, ja sen arvoa syövän hoidossa on tutkittu (esim. Yoshida et ai, 1996), kiinnostusta esiintyy tällä 30 hetkellä pääasiassa Japanissa. Rakenteeltaan nogalamysiini (Kuva 1) eroaa useimmista muista antrasykliineistä, kuten esimerkiksi daunomysiiniperheestä, kahden huomionarvoisen piirteen suhteen: (i) Sen stereokemia asemassa 9 on päinvastainen ja (ii) sen 107053 2 sokeriosa, nogalamiini, on kiinnittynyt 1-asemaan tyypillisellä glykosidisidoksella ja lisäksi 2-hiileen C-C-sidoksella. Wiley et ai. esittivät nogalamysiinin rakenneselvityk-sen v. 1977. Edelleen Wiley et ai julkaisivat vuonna 1978 nogalamysiinin biosynteet-tisiä tutkimuksia, joissa esitettiin tietoa sen rakenneosista: Aglykoniosa on rakentunut 5 kymmenestä asetaatista; neutraalisokeri, nogaloosi, on peräisin glukoosista; ja kummankin sokerin, nogalamiinin ja nogaloosin metyyliryhmät ovat muuttuneet me-tioniinista. Wiley ei ratkaissut selkeästi nogalamiinin alkuperää, mutta todennäköisimmin nogalamiini on myös peräisin glukoosista.

10 Antrasykliinien biosynteesigeenien molekulaarinen kloonaus on helpottanut molekyyligenetiikan tutkimuksia, antaen työkaluja rakenteiden rationaalisiin muunnoksiin, samalla kun on saatu aikaan yllättäviä yhdistelmiä muiden antibioottien kanssa. Suurin mielenkiinto on kohdistunut daunomysiinin biosynteesigeeneihin, kuten on raportoitu useissa julkaisuissa (Lomovskaya et ai., 1998; Rajgarhia ja Strohl, 1997 ja siinä 15 esitetyt viitteet). Samoin on kloonattu joitakin aklasinomysiinin biosynteesigeenejä S. galilaeuksesta (Fujii ja Ebizuka, 1997) ja rodomysiinin biosynteesigeenejä S. purpurascensista (Niemi et ai, 1994). Olemme kloonanneet nogalamysiinin biosyn-teesigeenit, ja käyttäneet kyseisiä geenejä menestyksellisesti hybridiantrasykliinien tuotossa. Useimmat geenit liittyvät polyketidireittiin, ja ne ovat vastuussa trisyklisen 20 välituotteen muodostumisesta, ja niistä on raportoitu julkaisuissa Ylihonko et ai., . 1996a ja b, sekä Torkkell et ai., 1997. Huolimatta molekulaarisessa kloonauksessa saavutetuista edistysaskeleista, antrasykliineistä havaittu glukoosin biosynteettinen reitti sokereiksi on yhä pääasiassa hypoteettinen.

25 Mitä tulee deoksiheksoosireitin geeneihin, Madduri et ai. (1998) ovat raportoineet, : että eräs avermektiinin biosynteesiryhmittymästä peräisin oleva geeni aiheutti hybridiantrasykliinien tuoton, kun se erääseen S. peucetiuksen mutanttiin siirrettäessä muutti sokeritähteen. Saatu tuote oli epirubisiini, kaupallisesti tärkeä antrasykliini. Tässä tapauksessa daunosamiiniosassa olevalla hydroksiryhmällä oli päinvastainen 30 stereokemia, minkä sai aikaan avermektiinin biosynteesigeeni. S. galilaeusta on käytetty isäntänä hybridiantrasykliinien valmistamiseksi käyttäen S. purpurascensin 3 107053 rodomysiinireitistä peräisin olevia geenejä (Niemi et ai., 1994), ja S. nogalaterin nogalamysiinin biosynteesiryhmittymästä peräisin olevia geenejä (Ylihonko et ai., 1996a). Nogalamysiinireitin geenejä käytettiin generoimaan hybridiantrasykliinien tuottoa S. steffisburgensisissa, joka tuottaa tyypillisesti steffimysiiniä (Kunnari et ai., 5 1997). Aikaisemmin aktinorodiinin biosynteesigeenejä on ilmennetty S. galilaeukses- sa, mikä johti aloesaponariinin tuotantoon (Strohl et ai., 1991). Näissä hybridiyhdis-teissä aglykonitähde oli muuntunut.

Keksinnön yhteenveto 10 Tämä keksintö koskee Streptomyces nogalaterin geeniryhmittymää, jossa suurin osa geeneistä on peräisin nogalamiinin ja nogaloosin deoksiheksoosireitistä. Kun mainitun alueen sisältämä DNA-jakso ilmennetään S. galilaeuksessa, joka tuottaa aklasino-mysiinejä, saadaan hybridiantrasykliinejä, joissa aglykoniosa on peräisin S. galilaeuk-15 s estä, kun taas sokeriosa ei ole luonteenomainen S. nogalaterille eikä myöskään S.

galilaeukselle. Kun mainittuun ryhmittymään sisältyvä, nogalamysiinin syklaasia koodaava geeni edelleen viedään sopivaan plasmidikonstruktioon, saadaan nogala-mysinoni, joka on nogalamysiinin aglykoni. Koska nogalamysiinin stereokemia eroaa useimmista muista antrasykliineistä, tätä geeniä käyttämällä on mahdollista valmistaa 20 antrasykliinimolekyylien C-9-stereoisomeereja.

• *

Keksinnön yksityiskohtainen kuvaus Tässä keksinnössä käytetyt koemenetelmät ovat alalla tavanomaisia. Sellaiset teknii-25 kat, joita ei tässä ole kuvattu yksityiskohtaisesti, on kuvattu käsikirjoissa Hopwood et - ai., "Genetic manipulation of Streptomyces: a laboratory manual" The John Innes

Foundation, Norwich (1985) ja Sambrook et al. (1989) "Molecular cloning: a laboratory manual". Tässä viitattujen julkaisujen, patenttien ja patenttihakemusten täydelliset tiedot on annettu viitejulkaisulistassa.

30 107053 4 Tämä keksintö koskee erityisesti nogalamysiinin biosynteesiin liittyvää geeniryhmit-tymää (5«o5-klusteri), jonka avulla voidaan tuottaa hybridiantibiootteja, joiden sokeri-osa on muunnettu. Aivan erityisesti keksintö koskee nogalamiinin/nogaloosin biosynteesiin liittyvien geenien käyttöä sokeriosastaan muunnettujen hybridiantibioottien 5 tuottamiseksi. Keksintö koskee myös keksinnön mukaiseen geeniryhmittymään sisältyvän spesifisen syklaasigeenin käyttöä tyypillisten antrasykliinien C-9-stereo-isomeerien valmistamiseksi.

Tämän keksinnön mukainen geeniryhmittymä on kytkeytynyt aikaisemmin raportoi-10 tuihin nogalamysiinin biosynteesiin liittyviin ryhmittymiin. Tämän keksinnön lähtökohta oli nogalamysiinikromoforiin liittyvä geeniryhmittymä (kansainvälinen patenttihakemus WO 96/10581). Tämän jälkeen löysimme joitakin nogalamysiinin biosynteesin deoksiheksoosireittiin liittyviä geenejä (Torkkell et ai., 1997), ja osaa mainitut geenit sisältävästä fragmentista käytettiin kloonattaessa tämän keksinnön mukaisia 15 geenejä.

Nogalamysiinin biosynteesiin liittyvät geenit voidaan eristää Sire/tfo/nym-lajeista, erityisesti S. nogalaterista, joka tuottaa nogalamysiiniä. Voidaan myös käyttää sellaisia lajeja, jotka tuottavat nogalamysiinin kaltaisia antrasykliinejä, esim. S.

20 violaceochromogenesiä, joka tuottaa arugomysiiniä (Kawai et ai., 1987), tai S. avi-, diniita, joka tuottaa avidinorubisiinia (Aoki et ai., 1991).

Genomikirjaston valmistuksessa käytetään nogalamysiinin biosynteesiin liittyvät geenit sisältävän Streptomyces-kannan genomista DNA:ta. Kloonaukseen sopivat geeni-25 fragmentit voidaan saada millä tahansa tiheästi katkaisevalla restriktioentsyymillä.

Tyypillisesti käytetään &zw3AI:tä. Eristetyt fragmentit voitaisiin viedä ligoimalla mihin tahansa Escherichia coli -vektoriin, kuten plasmidiin, fagemidiin, faagiin tai kosmidiin. Kosmidivektori on suositeltava, koska sen avulla voidaan kloonata suuria DNA-fragmentteja. Tähän tarkoitukseen on sopiva sellainen kosmidivektori kuin 30 pFD666 (ATCC n:o 77286), koska sen avulla voidaan kloonata noin 40 kb fragmentteja. Kloonaamiseen voidaan käyttää pFD666:n fiamHI-kohtaa, jolla saadaan kohesii- 107053 5 viset päät Sa«3AI-fragmentteihin. Kaupallisesti saatavissa olevia kittejä voidaan käyttää DNA:n pakkaamiseksi faagipartikkeleihin. Erilaisia E. coli -kantoja voidaan käyttää pakatulla DNA: 11a infektoimiseen. Sopiva E. coli -kanta on esimerkiksi XLIBlue MRF’, josta puuttuu useita restriktiosysteemeitä.

5

Kun E. colia käytetään isäntäkantana genomikirjastoa varten, hybridisaatio on edullinen seulontastrategia. Hybridisaatiokoettimena voidaan käyttää mitä tahansa tunnettua nogalamysiinin geeniryhmittymästä peräisin olevaa fragmenttia, mutta suositeltava on lyhyt, noin 1 kb fragmentti, joka on peräisin aikaisemmin kloonatun 10 biosynteettisen alueen toisesta päästä. Genomikirjastoa varten saadut pesäkkeet siirretään suodatinhybridisaatiota varten membraaneille, edullisesti nailonmembraa-neille. Koska genomisen DNA-fragmentin keskimääräinen koko on 40 kb, 2300 pesäkettä antoi 99,99 % :n todennäköisyyden laajennetun nogalamysiinibiosynteesi-alueen löytämiseksi. Mitä tahansa hybridisaatiomenetelmää voidaan käyttää, mutta 15 erityisen käyttökelpoinen on DIG-järjestelmä (Boehringer Mannheim GmbH, Saksa). Koska koetin on homologinen hybridisoidulle DNA:lie, on edullista suorittaa hybri-disaation rajoittavat pesut 70 °C:ssa alhaisessa suolakonsentraatiossa Boehringer Mannheimin käsikirjan "DIG System User's Guide for Filter Hybridization" mukaisesti. Todennäköisesti ainakin 80% :n homologia tarvitaan, jotta DNA sitoutuu 20 koettimeen pesussa käytetyissä olosuhteissa.

Kun käytettiin tätä menettelytapaa, seitsemän kloonia noin 5000:sta antoi positiivisen signaalin, ja ne otettiin erilleen DNA:n eristämistä varten. Positiiviset kloonit voidaan katkaista sopivilla restriktioentsyymeillä DNA-fragmenttien fysikaalisen kytkentäkar-25 tan osoittamiseksi. Kloonaukseen käytetty kosmidi oli kuljetinkosmidi, joka replikoi-tuu sekä E. colissa että Streptomyces-\&)eissdi. Rekombinanttikosmidien siirtäminen S. lividans TK24:ään, joka on tyypillinen Streptomycesin kloonauksessa käytetty laboratoriokanta, johti kuitenkin deleetioihin, ja tämä lähestymistapa hylättiin. Sen sijaan käytimme ekspressiotutkimuksissa mieluummin plasmidia pIJ486, joka on 30 voimakkaasti kopioituva Äre/tfomyces-plasmidi. Tähän tarkoitukseen voidaan kuiten- 107053 6 kin käyttää mitä tahansa plasmidia, joka kykenee stabiilisti replikoituinaan Streptomy-cesissä.

Yhdestä kloonista vietiin erikseen kaksi £g/II-fragmenttia pIJ486-vektoreihin, ja kaksi 5 saatua plasmidia siirrettiin ensisijaiseen isäntään, S. lividans TK24:ään. Saadut rekom-binanttiplasmidit (pSY42 ja pSY43), jotka sisälsivät 10 kb ja vastaavasti 7kb fragmentin S. nogalaterin genomisesta DNA:sta, eristettiin ensisijaisesta isännästä ja vietiin edelleen muihin StreptomycesA^ioMn protoplastitransformaatiolla. Rekombinantti-plasmidi, joka sisälsi 10 kb fragmentin, sai aikaan hybridiantrasykliinien tuoton S.

10 galilaeus -mutanttikannassa H039, joka luontaisesti tuottaa aklavinoni-rodinoosi- rodinoosi-rodinoosia. Transformaatiossa käytettiin muutamia muita S. galilaeus -kantoja (H075, H026, H063), joiden deoksiheksoosireitti oli mutatoitu aklasinomysiinin sokereiden muuttamiseksi, ja saatiin uusia hybridiyhdisteitä. Koska nogalamysiinin rakenne on lähes ainutlaatuinen antrasykliinien joukossa, plasmidit voitiin siirtää 15 muihin antrasykliinejä tuottaviin kantoihin, kuten S. peucetiukseen, joka tuottaa daunomysiiniä, ja S. purpurascensiin, joka tuottaa rodomysiinejä, luonteenomaisten antibioottien rakenteiden muuttamiseksi.

Koska kloonattu ryhmittymä oli liittynyt aiemmin tunnettuun nogalamysiinin biosyn-20 teesialueeseen, sen kyky aikaansaada muutos sokeriosassa osoitti, että läsnä saattaa olla deoksiheksoos heitin geenejä. Sekvensointi on kuitenkin välttämätöntä geenien toiminnan määrittämiseksi kloonatussa ryhmittymässä. 10 kb ja 7 kb DNA-fragmentit vietiin edelleen plasmidiin pSLl 190 alakloonausta varten. Sellaisia sekvensointistrate-gioita kuin esim. DNA-fragmentin asteittaista deletointia, fragmenttien satunnaista 25 kloonausta tai sekvensointia spesifisillä alukkeilla voidaan käyttää, mutta sekvensointia ; varten suosittelemme alakloonien valmistusta tunnetuista restriktiokohdista. ABI

PRISM -järjestelmällä (Perkin-Elmer) sekvensointia varten on mahdollista saada 500 -700 emästä yhtä reaktiota kohti, mikä tarkoittaa, että sekvensointia varten tarvitaan , noin 1 kb:n kokoisia fragmentteja, joissa on päällekkäin meneviä emäksiä: Tätä 30 tarkoitusta varten konstruoitiin 27 alakloonia.

107053 7

Kun sekvensoitiin viereiset J3g/II-fragmentit, jotka koostuivat noin 16000 emäsparista, saatiin 15 täydellistä ORF:ia. Sekvenssianalyysi voidaan tehdä millä tahansa tietokonepohjaisella ohjelmalla, kuten GCG-pakkauksella (Madison, Wisconsin, USA).

Tämän keksinnön mukaisesti otaksutut, kirjastoissa saatavilla olevien sekvenssien 5 homologian perusteella päätellyt geenifunktiot ovat aminotransferaasi (snogT), ei täydellinen 1. dTDP-glukoosisyntetaasi (snogi) 2. aminometyylitransferaasi (snogA) 3. polyketidisyklaasi (s/zoaM) 10 4. deoksiheksoosireitin geeni, tuntematon (snogN) 5. hydroksylaasi, (snoaG) 6. dTDP-4-dehydroramnoosireduktaasi (snogC) 7. dTDP-glukoosi-4,6-dehydrataasi (snogK) 8. NAME-syklaasi (snoaL) 15 9. tuntematon (jtzöK) 10. glykosyylitransferaasi, GTF (snogD) 11. tuntematon (snoW) 12. glykosyylitransferaasi, GTF (swogE) 13. tuntematon (snoL) 20 14. tuntematon (snoO) 15. C-7 ketoreduktaasi (s«oaF) tuntematon (snoN), ei täydellinen

Geenien nimet: g tarkoittaa, että geeni osallistui glykosidiosan biosynteesiin, mm.

25 glykosyylitransferaasit, kun taas a tarkoittaa, että geeniä tarvitaan aglykoniosan muodostamisessa.

«

Ottaen huomioon kuvassa 3 esitetyn, nogalamysUnille ehdotetun biosynteesireitin kykenemme identifioiduilla geeneillä, mm. snoaL:lla, joka vastaa aglykoniosan 30 neljännen renkaan syklisoitumisesta, saamaan aikaan useita muutoksia antibioottien rakenteisiin, ja samalla määräämään antrasyklinonin stereokemian, ja geeneillä, jotka 107053 8 vaikuttavat nogalamiinin ja nogaloosin muodostumiseen (snogJ, snogK, snogN, snogC, snogA), ja lisäksi geeneillä, jotka vastaavat sokeritähteiden kiinnittämisestä aglykoniosaan (snogD ja snogE).

5 Nämä geenit voitiin erikseen viedä vektoriin käyttämällä sopivia restriktiokohtia, tai monistamalla geenejä PCR:llä. Fragmentit voivat sisältää sisäisen promoottorin, tai promoottori voidaan kloonata erikseen. On edullista käyttää vektoria, jossa on promoottori, joka saa aikaan geenien ekspression Streptomyces-kannassa. Plasmidi pIJE486 sisältää erytromysiiniresistenssigeenin promoottorin ermE, mikä mahdollistaa 10 oikeassa orientaatiossa liitettyjen geenien konstitutiivisen ilmentymisen. Erityistä huomiota on kiinnitetty geeniin, joka koodaa alifaattisen renkaan syklaasia, mutta mikä tahansa mainitun-ryhmittymän geeni voidaan ilmentää Streptomyces-isännissä. Mainittu syklaasi muuntaa auramysinonin C9:n stereokemiaa TK24-kannassa, jos se viedään plasmidiin, jossa on muita auramysinonin biosynteesigeenejä, lukuunottamatta 15 antrasykliinien tyypillisestä stereokemiasta vastaavaa syklaasia.

Rekombinanttiplasmidit sisältäviä Streptomyces-kantoja., erityisesti S. galilaeusta, kasvatetaan alustoissa, joissa syntyy antibiootteja. Hybridiyhdisteet uutetaan orgaanisilla liuottimilla viljelyalustasta, ja yhdisteet erotetaan ja puhdistetaan käyttäen 20 kromatografiatekniikoita.

Tämän keksinnön mukaisesti S. galilaeus H039, jossa on plasmidi pSY42, ja jolle annettiin nimi H039/pSY42, tuottaa aklavinoni-4’-epi-2-deoksifukoosia El-alustassa, jota on täydennetty tiostreptonilla, jotta saataisiin aikaan valintapaine plasmidin 25 sisältäville kannoille.

S. lividans TK24, jossa on plasmidi pSY15c, joka sisältää nogalamysiinikromoforin geenit ja syklaasin (snoaL) ja ketoreduktaasin (s/zoaF) geenit, kasvatettiin El-alustas-sa, jota oli täydennetty tiostreptonilla. Syntyi yhdiste 9-epi-auramysinoni, ja tätä 30 rakennetta kutsutaan nyt nogalamysinoniksi. Mikä tahansa keksinnön mukainen DNA-fragmentti, joka on alakloonattu nogalamysiinibiosynteesin 17 kb alueelta, voidaan 107D53 9 liittää vektoriin, joka replikoituu Streptomycesissä, ja tuotteet voidaan tuottaa fermen- toimalla plasmidin sisältäviä kantoja.

Piirustusten lyhyt kuvaus 5

Kuva 1 esittää nogalamysiinin, daunomysiinin ja aklasinomysiinin rakenteet.

Kuva 2 on kaavio nogalamysiinin biosynteesiin liittyvästä geeniryhmittymästä (Sno5).

10

Kuva 3 kuvaa nogalamysiinin ehdotettua biosynteesireittiä.

Kuva 4 esittää plasmidin pSY15c kaavion. Mustalla esitetyt geenit snozL (aL) ja snoaF (aF) liitetään plasmidiin pSY15, jolloin saadaan pSY15c. aL tarkoit-

15 taa syklaasia snoaL ja aF tarkoittaa C-7-ketoreduktaasia snoaF. pSY15 (WO

96/10581) saa aikaan nogalamysiinibiosynteesin trisyklisen välituotteen syntymisen S. lividansissa. Lyhenteet ai, a2 ja a3 viittaavat minimaalisen PKS:n geeneihin sno&l, snoa2 ja vastaavasti snoa3. rA on aktivaattorin snorA-geeni, aB on oksigenaasin snoaB-geeni, aC on metylaasin snoaC- 20 geeni, aD on polyketidi-ketoreduktaasin snoaD-geeni ja aE on aromataasin • - snoaE-geeni. gF (snogF-geeni) ja gG (snogG-geeni), jotka liittyvät deoksi- heksoosireittiin, eivät ole toiminnallisia tässä rakenteessa, aph on aminogly-kosidifosfotransferaasigeeni ja tsr on tiostreptoniresistenssigeeni.

25 Seuraavassa esitetään esimerkkejä, jotka edelleen kuvaavat keksintöä.

«

KOKEELLINEN OSA

Käytetyt materiaalit 30 Käytetyt restriktioentsyymit hankittiin Promegalta (Madison, Wisconsin, USA) tai

Boehringer Mannheimilta (Saksa), ja alkalinen fosfataasi Boehringer Mannheimilta, ja 10 107C53 niitä käytettiin valmistajien ohjeiden mukaisesti. Proteinaasi K hankittiin Promegalta * ja lysotsyymi Sigmalta (St. Louis, USA). Hybridisaatiossa käytetyt Hybond™-N-nailonmembraanit hankittiin Amershamilta (Buckinghamshire, Englanti), DIG DNA-leimauspakkaus ja DIG Luminesenssin mittauspakkaus Boehringer Mannheimilta.

5 Qiagenilta (Hilden, Saksa) hankittua Qiaquick Gel Extraction -pakkausta käytettiin DNA: n eristämiseksi agaroosista.

Bakteerikannat ja niiden käyttö

Escherichia coli XL1 Blue MRF’-kantaa käytettiin kloonaukseen.

10 Streptomyces nogalater ATCC 27451; nogalamysiinin biosynteesiin liittyvä geeniryh-mittymä kloonattiin tästä kannasta.

Kloonattujen geenien ilmentämiseksi käytetyt isäntäkannat olivat:

Streptomyces lividans TK24, jota käytettiin myös ensisijaisena isäntänä E. colissa monistetun DNA:n kloonaamiseksi.

15 Streptomyces galilaeus H039, joka tuottaa aklavinoni-rodinoosi-rodinoosi-rodinoosia. Streptomyces galilaeus H026, joka tuottaa aklasinomysiini N:ää, ACMN, (aklavinoni-rodosamiini-2-deoksifukoosi-rodinoosi).

Streptomyces galilaeus H063, joka tuottaa aklavinonia.

Streptomyces galilaeus H075, joka tuottaa aklavinoni-rodosamiini-2-deoksifukoosi-2-20 deoksifukoosia.

c

Mutanttien H039 ja H026 yksityiskohtainen kuvaus on esitetty artikkelissa Ylihonko et ai. (1994) ja mutantin H075 FI-patenttihakemuksessa n:o 981062 (Ylihonko et ai, 1998). H063:a ei ole kuvattu kirjallisuudessa, mutta se saatiin S. galilaeuksen NTG- 25 mutagenoinnilla, ja se valittiin isäntäkannaksi hybridiyhdisteiden tuotannossa, koska i" siihen kerääntyy aklavinonia, jossa ei ole sokeritähteitä.

»*

Plasmidit E. coli - Streptomyces sukkulakosmidia pFD666 (ATCC 77286) käytettiin kro-30 mosomaalisen DNA:n kloonaamiseksi. E. coli -kloonausvektoreita pSLl 190 (Pharmacia) ja pUC19 käytettiin alakloonien valmistamiseksi.

107053 11 pIJ486 on monikopioplasmidivektori, joka saatiin prof. Sir David Hopwoodilta, John Innes Centre, UK (Ward et al., 1986).

pIJE486 on vektori, joka sisältää ermE-geenin pIJ486:n polylinkkerissä (Bibb et ai., 5 1985).

pSY15 on pIJ486:een perustuva plasmidikonstrukti, jossa nogalamysiinibiosynteesin polyketidireitin geenit kloonattiin (Ylihonko et ai., 1996a).

10 Ravintoalustat ja liuokset S. nogalaterin viljelemiseksi kokonais-DNA:n eristämistä varten käytettiin TSB-alustaa. Lysotsyymiliuosta (0,3 M sakkaroosia, 25 mM Tris, pH 8 ja 25 mM EDTA pH 8) käytettiin kokonais-DNA:n eristämiseksi. TE-puskuri (10 mM Tris, pH 8,0 ja ImM EDTA) käytettiin DNA: n liuottamiseksi.

15 TRYPTONI-SOIJALIEMI (TSB)

Litraa kohti: 30 g Oxoidin tryptoni-soijaliemijauhetta.

ISP4 20 Bacto-ISP-alusta 4, Difco; 37 g/1.

El Litraa kohti vesijohtovettä: glukoosia 20 g liukoista tärkkelystä 20 g 25 Farmamedia 5 g hiivauutetta 2,5 g Κ2ΗΡ04·3Η20 1,3 g - .· MgSO4*7H20 1 g

NaCl 3 g 30 CaC03 3 g pH säädettiin 7,4:ään ennen autoklavointia 107053 12

Yleiset menetelmät NMR-arvot kerättiin JEOL JNM-GX 400 -spektrometrillä ympäröivässä lämpötilassa. lH ja 13C-NMR-näytteiden sisäisinä referensseinä käytettiin TMS:ää.

5 Antrasykliinimetaboliitit detektoitiin HPLCrllä (LaChrom, Merck Hitachi, pumppu L-7100, detektori L-7400 ja integraattori D-7500) käyttäen LiChroCART RP-18 kolonnia (4,6x250mm). Liikkuvana faasina käytettiin asetonitriiii:kaiiumvetyfosfaatti-puskuria (60 mM, pH 3,0 säädetty sitruunahapolla). Yhdisteiden erottamiseksi käytettiin gradienttisysteemiä lähtien 65%:isesta ja päätyen 30%:iseen kaliumdivety-10 fosfaattipuskuriin. Virtausnopeus oli 1 ml/min ja detektio suoritettiin 430 nm:ssä.

Plasmidit sisältävien viljelmien ylläpitämiseksi käytettiin ISP4-maljoja, jotka oli täydennetty tiostreptonilla (50 £/g/ml).

15 Esimerkki 1. Nogalamysiinin biosynteesiin liittyvän geeniryhmittymän kloonaaminen 1.1 Kosmidikirjasto

Kokonais-DNA:n eristämiseksi Streptomyces nogalateria (ATCC 27451) kasvatettiin 20 kolme päivää 50 mlrssa TSB-alustaa, joka oli täydennetty 0,5 %:illa glysiiniä. Solut otettiin talteen sentrifiigoimalla 15 min 3900 x g:ssä 12 ml Falcon-putkissa, ja soluja säilytettiin -20 °C:ssa. 12 ml:n näytteestä saatuja soluja käytettiin DNA:n eristämiseksi. Solujen päälle lisättiin 5 ml lysotsyymiliuosta, joka sisälsi lysotsyymiä 5 mg/ml, ja inkuboitiin 20 min 37 °C:ssa. Soluille lisättiin 500 μ\ 10%:ista SDS:ää, 25 joka sisälsi 0,7 mg of proteinaasi K:ta, ja inkuboitiin 80 min 62 °C:ssa, lisättiin toiset . 500 μ\ 10%:ista SDS:ää, joka sisälsi 0,7 mg proteinaasi K:ta, ja inkubointia jatkettiin 60 min. Näyte jäähdytettiin jäiden päällä ja lisättiin 600 μΐ 3M NaAc:ta, pH 5,8, ja seosta uutettiin tasapainotetulla fenolilla (Sigma). Faasit erotettiin sentrifugoimalla 1400 x g 10 min. DNA saostettiin vesifaasista yhtä suurella tilavuudella isopropanolia 30 ja kerättiin lasisauvalla, ja pestiin kastamalla 70%:iseen etanoliin, ilmakuivattiin ja liuotettiin 500 /iltaan TE-puskuria.

107053 13

Kromosomaalinen DNA pilkottiin osittain &ut3AI:llä. DNA-fragmentit erotettiin agaroosigeelielektroforeesilla, ja 30 - 50 kb fragmentit leikattiin 0,3%:isesta alhaisessa lämpötilassa geeliytyvästä SeaPlaque®-agaroosista. DNA-vyöhykkeet eristettiin geelistä kuumentamalla 65 °C:seen, uuttamalla yhtä suurella tilavuudella tasapaino-5 tettua fenolia, ja faasit erotettiin sentrifugoimalla 15 min 2500 x g. Fenolifaasi uutettiin TE-puskurilla, sentrifugoitiin ja vesifaasit yhdistettiin. DNA saostettiin lisäämällä 0,1 tilavuutta NaAcrtä, pH 5,8 ja 2 tilavuutta etanolia -20 °C:ssa 30 min, sentrifugoitiin 30 min 15 000 rpm Sorvali RC5C -sentrifuugilla käyttäen SS-34 roottoria, jossa oli adapterit 10 ml:n putkille. Pelletti ilmakuivattiin ja liuotettiin 20 10 jukaan TE-puskuria. Eristetyt fragmentit liitettiin pFD666-kosmidivektoriin, joka oli katkaistu BamHItllä ja defosforyloitiin. DNA pakattiin faagipartikkeleihin ja infektoi-tiin E. coliin käyttäen Gigapack® III XL Packing Extract Kit -pakkausta valmistajan ohjeiden mukaisesti.

15 1.2 Kloonien identifiointi hybridisaatiolla

Infektoituja soluja kasvatettiin LB-maljoilla, jotka sisälsivät 50 y^g/ml kanamysiiniä ja siirrettiin Hybond™-N-nailonmembraaneille (Amersham). Membraanit käsiteltiin Boehringer Mannheimin käsikirjassa "The DIG System User’s Guide for Filter Hybridization" kuvattujen menetelmien mukaisesti. Nogalamysiinin laajennetun 20 geeniryhmittymän sisältämien pesäkkeiden seulontaan käytetty koetin oli 1,07 kb ' " 5ad-fragmentti aikaisemmin kuvatusta ryhmittymästä (Torkkell et ai, 1997).

Koettimen sisältävä plasmidi katkaistiin SacLllä, ja fragmentti erotettiin vektorista agaroosigeelielektroforeesilla ja eristettiin geelistä käyttäen Qiaquick Gel Extraction Kit -pakkausta (Qiagen). Koetin leimattiin digoksigeniinillä käyttäen lyhyen oligo-25 nukleotidialukkeen leimaussysteemiä Boehringer Mannheimin käsikirjan "The DIG System User’s Guide for Filter Hybridization" mukaisesti. 5000 pesäkettä seulottiin hybridisoimalla 70 °C:ssa käyttäen kuvattua koetinta. Positiiviset pesäkkeet detek-toitiin käyttäen DIG Luminescent Detection Kit -pakkausta (Boehringer Mannheim). Seitsemän pesäkettä antoi positiivisen signaalin. Positiivisista klooneista saadut 30 kosmidit eristettiin 5 ml viljelmästä alkalisella lysointimenetelmällä. Restriktioanalyysi osoitti, että kloonatut fragmentit olivat osittain päällekkäisiä vastaten ainakin 60 kb:n 107053 14 fragmentit olivat osittain päällekkäisiä vastaten ainakin 60 kb:n jatkuvaa DNA:ta. Saaduille positiivisille klooneille annettiin nimet pFDShol - pFD5>io7.

1.3 Fragmenttien alakloonaaminen sekvensointia varten 5 Klooni n:o 5, nimeltään pFDiSWo5, katkaistiin 2?g/II:lla, ja alakloonausta varten kaksi fragmenttia, noin 10 kb ja 7 kb, eristettiin ja liitettiin pSL1190:aan, katkaistiin Bgl-II: 11a ja defosforyloitiin. Saaduille plasmideille annettiin nimet pSn42 ja vastaavasti pSn43. Nämä kaksi fragmenttia kattavat DNA-alueen, joka on välittömästi kiinni aikaisemmin karakterisoidussa nogalamysiinin biosynteesiryhmittymän alueessa.

10 Plasmideihin pSn42 ja pSn43 kloonatun koko 17 kb:n alueen nukleotidisekvenssin määrittämiseksi käytettiin sopivia restriktiokohtia, jotta fragmentit saatiin ala-kloonatuiksi vektoriin pUC19 tai pSL1190, jolloin pSn42:n insertistä saatiin 16 alakloonia ja pSn43:n insertistä 11 alakloonia.

15 E. coli XL1 Blue MRF’ -soluja viljeltiin yli yön 37 °C:ssa 5 mlrssa LB-alustaa, jota oli täydennetty 50 /ag/ml ampisilliinia. Plasmidien eristämiseksi sekvenssireaktioita varten käytettiin Promegan Wizard Plus Minipreps DNA-puhdistuspakkausta tai Biometran silica spin plasmid miniprep -pakkausta (Biomedizinische Analytik Gmbh) valmistajien ohjeiden mukaisesti.

20 • r DNA-sekvensointi suoritettiin käyttäen automaattista ABI DNA-sekvenaattoria (Perkin-Elmer) valmistajan ohjeiden mukaisesti.

1.4 Sekvenssianalyysi ja geenien päätellyt funktiot 25 Sekvenssianalyysit suoritettiin käyttäen GCG-sekvenssianalyysiohjelmapakkausta (Versio 8; Genetics Computer Group, Madison, Wisconsin, USA). Käännöstaulukko muunnettiin siten, että se hyväksyi myös GTG:n aloituskodoniksi. Kodonikäyttö analysoitiin käyttäen julkaistuja tietoja (Wright ja Bibb 1992).

30 CODONPREFERENCE-ohjelman mukaan sekvensoitu DNA-fragmentti sisälsi 15 täydellistä avointa lukukehystä (open reading frames, ORFs), ja kahden muun ORF:n 15 107053 5’-pään keksinnön mukaisen fragmentin molemmissa päissä. Geenien funktiot pääteltiin vertaamalla emässekvensseistään transloituja aminohapposekvenssejä tietopankeissa oleviin tunnettujen proteiinien sekvensseihin. Tulokset on esitetty Taulukossa 1. Annetut asemat viittaavat oheen liitettyyn sekvenssilistaan. Peptidien 5 aminohapposekvenssit on annettu sekvensseissä SEQ ID NO:2 - SEQ ID NO: 18.

« 107053 16

Taulukko 1__^

Geeni Asema Aminohapot Päätelty funktio Huom.

___(SEQ ID NO)___ snogl -1027 >342 (2) aminotransferaasi 5'-pää __kömpi____ snogJ__1192-2073 293 (3)__dTDP-glukoosisyntetaasi__ snogA 2106-2822 238 (4) aminometyylitransferaasi __kömpi____ s/zoaM 2826-3800 324 (5) polyketidisyklaasi __kömpi____ s/zogN 3799-5025 408 (6) <7«rQ-homologia (Otten et ____ai, 1995), tuntematon__ snoaG 5088-6356 422 (7)__hydroksylaasi__ snogC 6334-7209 291 (8) dTDP-4-dehydroramnoosi- __kömpi___reduktaasi__ snogK 7245-8297 350 (9) dTDP-glukoosi-4,6-dehydra- __kömpi___taasi__ snoaL 8537-8941 134 (10) NAME-syklaasi (nogaloni- ____hapon metyyliesteri)__ snoK__8992-9699 235 (11)__tuntematon__ snogD 9745-10917 390 (12) glykosyylitransferaasi __kömpi____ snoW__11057-11884 275 (13)__tuntematon__ * ; snogE__11928-*__>424 (14)__glykosyylitransferaasi__ snob 13335-13754 139 (15) tuntematon __kömpi____ snoO 13974-14441 155 (16) homologinen mtmX: n mitra- ____mysiiniryhmittymän kanssa__ snoaF 14532-15377 281 (17) aklaviketonin ketoreduktaa- sin kanssa analoginen C-7- ____ketoreduktaasi__ STioN__15450-__> 190 (18)__tuntematon__5'-pää *, noin 100 bp nukleotidisekvenssi, ei tunnettu 107053 17 1.5 Ekspressiokloonaus 10 kb:n Bg/II-fragmentti pFD5no5:sta kloonattiin plasmidiin pIJ486 ja saadulle plasmidille annettiin nimi pSY42. Vastaavasti 7 kb:n 5g/II-fragmentti pFDSno5:sta kloonattiin plasmidiin pIJE486, ja saatiin plasmidi pSY43. Plasmidi pSY42 liitettiin S.

5 .. lividans-kaataan TK24 protoplastitransformaatiolla, eristettiin siitä ja liitettiin edelleen S. galilaeus-mutzattiw H039, ja kun sitä oli monistettu H039:ssa, se siirrettiin muihin S. galilaeus-mutsaitteihm, joiden aklasinomysiineille luonteenomaisten sokereiden deoksiheksoosireitti oli katkaistu (H075, H026, ja H063). El-alustaa käytettiin antra-sykliinin tuottoon, ja tuotteet uutettiin viljelmästä tolueeni:metanolillä (1:1) pHrssa 7.

10 Antrasykliinimetaboliitit analysoitiin HPLC:llä. pSY42:n sisältämien mutanttien H039, H026, H063 ja H075 tuotteet olivat erilaisia kuin sellaisten mutanttien, joissa plasmidia ei ollut.

Sekvenssianalyysin mukaan pSY42 sisälsi syklaasin, jolle annettiin nimi NAMEC 15 (nogalonic acid methyl ester cyclase, nogalonihappometyyliesterisyklaasi), ja pSY43:sta identifioitiin ketoreduktaasigeeni. Valmistettiin ekspressiokonstruktiot, jotka sisälsivät kaikki geenit, jotka tarvitaan nogalamysiiniaglykonin muodostamiseksi. 1,4 kb 5amHI-5acI-fragmentti pSY42:sta (joka sisältää NAMEC:in) ja 1,1 kb Mlul-Kpnl-fragmtntti pSY43:sta, jossa on C-7-ketoryhmän ketoreduktaasigeeni, 20 liitettiin pSY15:een, joka oli linearisoitu SacEllä, plasmidin pSY15c muodostamiseksi . (Kuva 4). Plasmidi pSY15c liitettiin S. lividans TK24:ään, ja kantaa TK24/pSY15c viljeltiin El-alustassa, jota oli täydennetty tiostreptonilla. Syntyi aglykoniyhdiste, ja tätä rakennetta kutsutaan nyt nogalamysmoniksi.

25 Esimerkki 2. s«o5-ryhmittymän tuottamat yhdisteet • · 2.1 H039/pSY42:sta ja TK24/pSY15c:stä peräisin olevien tuotteiden tuottaminen ja puhdistus

Ymppiviljelmä, 180 ml plasmidia sisältävän kannan H039/pSY42 tai TK24/pSY15c 30 El-viljelmää saatiin viljelemällä kantaa kolmessa 250 ml Erlenmeyer-pullossa, jotka sisälsivät 60 ml El-alustaa, jota oli täydennetty tiostreptonilla (5 Mg/ml), neljän 107053 18 päivän ajan 30 °C:ssa, 330 rpm. Yhdistetyt viljelyliemet (180 ml) käytettiin siirrosta-maan 13 1 El-alustaa fermentorissa (Biostat E). Fermentoinnin annettiin olla käynnissä seitsemän päivää 28 °C:ssa (330 rpm, ilmastus: 450 1/min).

5 Solut otettiin talteen sentrifugoimalla. Bakteerisolujen rikkomiseksi ja kerääntyneiden antrasykliinimetaboliittien uuttamiseksi käytettiin 2,6 1 metanolia. Antrasykliinimeta-boliitit uutettiin käyttäen 2 1 dikloorimetaania pH:ssa 6. Orgaaninen kerros haihdutettiin kuiviin. Viskoosi jäännös flash-kromatografoitiin polyamidipylvään (11) läpi käyttäen eluenttina vesi:metanolia 1:9-0:10. Yhdisteitä sisältävät yhdistetyt fraktiot 10 puhdistettiin edelleen Merck-Hitachi HPLC-laitteella käyttäen preparatiivista käänteis-faasipylvästä (LichroCART RP-18, 5 μτα) käyttäen liikkuvana faasina asetonitriili: 1 % AcOH -seosta vedessä (1:1). Kun asetonitriili haihdutettiin, saatiin puhtaita tuotteita keltaisina tyhjiössä kuivattuina jauheina.

15 2.2 H039/pSY42:sta ja TK24/pSY15c:sta saatujen tuotteiden rakenteen määritys NMR-analyysi suoritettiin NON-, BMC-, NOE-, DEPT- ja HMBC-tekniikoilla.

Protonit määritettiin käyttäen NOESY- ja 2D pTOCSY -tekniikoita ja hiilet käyttäen DEPT- ja HMBC-tekniikoita.

20 Määritettynä taulukoissa 2 ja 3 esitettyjen tietojen perusteella saadut rakenteet olivat H039/pSY42:n viljelmästä aklavinoni4’-epi-2-deoksifukoosi ja TK24/pSY15c:n viljelmästä 9-epi-auramysinoni (=nogalamysinoni). Yhdisteiden kemialliset rakenteet on esitetty alla kaavoilla I ja vastaavasti II.

25 O COOCH3 OH 0 0H 9 30 ^

Me^TT^J

HO

OH

107055 19 O COOCH3 5 ΟΜΟ^λ m

OH O OH OH

10

Talletetut mikro-organismit

Seuraavat mikro-organismit talletettiin Budapestin sopimuksen mukaisesti talletuslaitokseen Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ), 15 Mascheroder Weg lb, D-38124 Braunschweig, Saksa.

Mikro-organismi Talletus numero Talletuspäivä S. lividans TK24/pSY42, 20 jossa on plasmidi pSY42 DSM 12451 14. lokakuuta 1998 « S. lividans TK24/pSY43, jossa on plasmidi pSY43 DSM 12452 14. lokakuuta 1998 107053 20

Taulukko 2. Yhdisteen aklaYinom-4’-epi-2-deoksifukoosi ‘H- ja 13C-siirtymät (Kaava I)

~Kohta *H 13C

1 7,74, 1H, dd, 7,5, 1,3 120,1 2 7,68, 1H, dd, 8,4,7,5 137,3 3 7,27, 1H, dd, 8,3, 1,3 124,6 4 - 161,9 4-OH 11,70, 1H, s 4a - 115,4 5 - 192,3 5a - 114,4 6 - 162,4 6-OH 12,46, 1H, s 6a - 130,9 7 5,18, 1H, dd, 4,3,3,1 71,3 8A 2,51, 1H, dd, 15,0,4,3 33,9 8B 2,32, 1H, dd, 15,0, 3,1 9 - 72,1 9-OH 4,58, 1H, s 10 4,02, 1H, s 56,9 10a - 142,4 11 7,40, 1H, s 120,8 11a - 133,1 12 - 180,7 12a - 132,6 13A 1,73, 1H, dq, 14,2,7,4 32,0 13B 1,51, 1H, dq, 14,2, 7,4 . - 14 1,10,3H, t, 7,4 6,7 15 - 171,1 16 3,69,3H, s 52,5 Γ 5,41, 1H, d, 3,5 101,7 2'a 1,75, 1H, ddd, 12,8, 11,2, 3,4 37,7 2'e 2,19, 1H, dd, 12,8, 5,3 3' 3,71, 1H, ddd, 12,0, 9,0, 5,3 69,0 4' 3,14, 1H, dd, 9,1, 9,0 78,1 5' 3,88, 1H, dq, 9,1,6,2 68,8 6' 1,36, 3H, d, 6,2 17,6 107053 21

Taulukko 3. Yhdisteen 9-epi-auramysinoni Ή- ja 13C-siirtymät (Kaava Π).

Kohta *H 13C

1 7,76, 1H, dd, 7,5, 1,2 119,8 2 7,67, 1H, dd, 8,3,7,5 137,4 3 7,28, 1H, dd, 8,3, 1,2 124,8 4 - 162,5 4-OH 11,86, 1H, s 4a - 115,6 5 - 192,7 5a - 114,6 6 - 160,9 6-OH 12,76, 1H, s 6a - 134,1 7 5,40, 1H, t, 7,0 64,0 8A 2,66, 1H, dd, 13,9,7,0 40,9 8B 1,89, 1H, dd, 13,9, 7,1 9 - 70,5 9-OH 3,49, 1H, brs 10 3,93, 1H, d, 0,8 56,0 10a - 142,1 11 7,51, 1H, d, 0,8 120,1 11a - 133,3 12 - 180,9 12a - 132,1 13 1,44,3H, s 28,7 14 - 173,0 15 3,90, 3H, s 52,6 107053 22

Viitejulkaisut

Aoki, M., Shirai, H., Nakayama, N., Itezono, Y., Mori, Mitsuko, Satoh, T., Ohishima, S., Watanabe, J. ja Yokose, K. 1991. Structural studies on avidinoru-bicin, a novel anthracycline with platelet aggregation inhibitory activity.

J. Antibiot. 44: 635-645.

Bibb, M.J., Janssen, G.R. ja Ward, J.M. 1985. Cloning and analysis of the promoter region of the erythromycin resistance gene (ErmE) of Streptomyces erythra-eus. Gene 38: 215-226.

Bhuyan, B.K. ja Dietz, A. 1965. Fermentation, taxonomic and biological studies of nogalamycin. Antimicrob. Ag. Chemother. 1965: 836-844.

Bhuyan, B.K. ja Smith C.G. 1975. In: Antineoplastic and immunosuppressive agents, part II, pp. 623-632. Sartorell, A.C., and Johns, D.G. (eds), Springer-Verlag, Berlin.

Fujii, I. ja Ebizuka, Y. 1997. Anthracycline biosynthesis in Streptomyces galilaeus. Chem. Rev. 97: 7: 2511-2523.

Kawai, H., Hayakawa, Y., Nakagawa, M., Furihata, K., Shimazu, A., Seto, H. ja Otake, N. 1987. Arugomycin, a new anthracycline antibiotic I. Taxonomy, fermentation, isolation and physico-chemical properties. J. Antibiot. 19: 1266-1271.

Kunnari, T., Tiukkanen, J., Hautala, A., Hakala, J., Ylihonko, K. ja Mäntsälä, P. 1997. Isolation and characterization of 8-demethoxy steffimycins and generation of 2,8-demethoxy steffimycins in Streptomyces steffisburgensis by the nogalamycin biosynthesis genes. J. Antibiot. 50: 496-501.

. Lomovskaya, N., Doi-Katayama, Y., Filippini, S., Nastro, C., Fonstein, L.,

Gallo, M., Colombo, A.L. ja Hutchinson, C.R. 1998. The Streptomyces peucetius dpsYand dnrX genes govern early and late steps of daunorubicin and doxorubicin biosynthesis. J. Bacteriol. 180: 9: 2379-2386.

Madduri, K., Kennedy, J., Rivola,G., Inventi-Solari, A., Filippini, S., Zanuso, G., Colombo, A.L., Gewain, K.M., Occi, J.L., MacNeil, D.J. ja Hutchinson, : - C.R. 1998. Production of antitumor drug epirubicin (4’-epidoxorubicin) and its precursor by a genetically engineered strain of S. peucetius. Nature Biotech. 16: 69- 74.

Niemi, J., Ylihonko, K., Hakala, J., Kopio, A., Pärssinen, R. ja Mäntsälä, P.

1994. Hybrid anthracycline antibiotics: production of new anthracyclines by cloned genes from Streptomyces purpurascens in Streptomyces galilaeus. Microbiol. 140: 1351-1358.

23 107055

Otten, S.L., Liu, X., Ferguson, J. ja Hutchinson C.R. 1995. Cloning and characterization of the Streptomyces peucetius dnrQS genes encoding a daunosamine biosyntesis enzyme and a glycosyl transferase involved in daunorubicin biosynthesis.

J. Bacteriol. 177: 6688-6692.

Rajgarhia, V.B. ja Strohl, W.R. 1997. Minimal Streptomyces sp. strain C5 daunorubicin polyketide biosynthesis genes required for aklanonic acid biosynthesis.

J. Bacteriol. 179: 8: 2690-2696.

Strohl, W.R., Bartel, P.L., Li, Y., Connors, N.C. ja Woodman, R.H. 1991. Expression of polyketide biosynthesis and regulatory genes in heterologous strepto-mycetes. J. Ind. Microbiol. 7: 3: 163-174.

TorkkeU, S., Ylihonko, K., Hakala, J., Skurnik, M. ja Mäntsälä, P. 1997. Characterization of Streptomyces nogalater genes encoding enzymes involved in glycosylation steps in nogalamycin biosynthesis. Mol. Gen. Genet. 256: 203-209.

Ward, J.M., Janssen, G.R., Kieser, T., Bibb, M.J., Buttner, M.J. ja Bibb, M.J. 1986. Construction and characterization of a series of multicopy promoter-probe plasmid vectors for Streptomyces using the aminoglycoside phosphotransferase from Tn5 as indicator. Mol. Gen. Genet. 203: 468-478.

Wiley, P.F., Kelly, R.B., Caron, E.L., Wiley, V.H., Johnson, J.H., MacKellar, F.A. ja Mizsak, S.A. 1977. Structure of nogalamycin. J. Am. Chem. Soc. 99: 542-549.

Wiley, P.F., Elrod, D.W. ja Marshall, V.P. 1978. Biosynthesis of the anthracycli-ne antibiotics nogalamycin and steffimycin. B. J. Org. Chem. 43: 3457-3461.

Wright, F. ja Bibb, MJ. 1992. Codon usage in the G+C -rich Streptomyces . . genome. Gene 113: 55-65.

Ylihonko, K., Hakala, J., Niemi, J., Lundell, J. ja Mäntsälä, P. 1994. Isolation and characterization of aclacinomycin A-non-producing Streptomyces galilaeus (ATCC 31615) mutants. Microbiol. 140: 1359-1365.

Ylihonko, K., Hakala, J. ja Mäntsälä, P. 1995. Process for producing anthracycli-. nes and intermediates thereof. WO 96/10581.

Ylihonko, K., Hakala, J., Kunnari, T. ja Mäntsälä, P. 1996a. Production of hybrid anthracycline antibiotics by heterologous expression of Streptomyces nogalater nogalamycin biosynthesis genes. Microbiol. 142: 1965-1972.

107053 24

Ylihonko, K., Tiukkanen, J., Jussila, S., Cong, L. ja Mäntsälä, P. 1996b. A gene cluster involved in nogalamycin biosynthesis from Streptomyces nogalater: sequence analysis and complementation of early-block mutations in the anthracycline pathway. Mol. Gen. Genet. 251: 113-120.

Ylihonko, K., Hakala, J. ja Kunnari, T. 1998. Hybrid anthracyclines from genetically engineered Streptomyces galilaeus strains. No. 981062.

Yoshida, M., Fujioka, A., Nakano, K., Yuasa, C., Toko, T., Takeda, S. ja Unemi, N. 1996. Activity of menogaril against various malignant lymphoma cell lines and a human lymphoma xenograft in mice. Anticancer Res. 16: 2875-2879.

4 25 107053

SEKVENSSILISTA

(1) YLEISET TIEDOT: (i) HAKIJA: (A) NIMI: Galilaeus Oy (B) KATU: Kairiskulmantie 10 (C) KAUPUNKI: Piispanristi (E) MAA: Finland (F) POSTINUMERO: FIN-20760 (ii) KEKSINNÖN NMITYS: Nogalamysiinin bisynteesiin liittyvä geeni-ryhmittymä ja sen käyttö hybridiantibioottien tuotossa (iii) SEKVENSSIEN LUKUMÄÄRÄ: 18 (iv) TIETOKONEMUOTO: (A) TYYPPI: Disketti (B) TIETOKONE: IBM PC-yhteensopiva

(C) KÄYTTÖJÄRJESTELMÄ: PC-DOS/MS-DOS

(D) OHJELMA: Patentin #1.0, Versio #1.25 (EPO) (2) SEQ ID NO: 1:N TIEDOT: (i) SEKVENSSIN OMINAISUUDET: (A) PITUUS: 16020 emäsparia (B) TYYPPI: nukleiinihappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: DNA (genominen) (vi) ALKUPERÄ: (B) KANTA: Streptomyces nogalater ATCC 27451 (ix) PIIRRE: • (A) NIMITYS: CDS (= koodaava sekvenssi) (B) SIJAINTI: komplementaarinen (1..1027) (D) MUUT TIEDOT: /funktio= "aminotransferaasi" /geeni= "snogl" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 1192..2073 ! (D) MUUT TIEDOT: /funktio= "dTDP-glukoosisyntetaasi" /geeni= "snogJ" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: komplementaarinen (2106..2822) * (D) MUUT TIEDOT: /funktio» "aminometyylitransferaasi" /geeni» "snogA" • 107053 26 (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: komplementaarinen (2826..3800) (D) MUUT TIEDOT: /funktio= "polyketidisyklaasi" /geeni= "snoaM" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 3799..5025 (D) MUUT TIEDOT: /funktio= "tuntematon" /geeni= "snogN" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 5088..6356 (D) MUUT TIEDOT: /funktio= "hydroksylaasi" /geeni= "snoaG" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: komplementaarinen (6334..7209) (D) MUUT TIEDOT: /funktio= "dTDP-4-dehydroramnoosireduktaasi" /geeni= "snogC" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: komplementaarinen (7245..8297) (D) MUUT TIEDOT: /funktio= "dTDP-glukoosi-4,6-dehydrataasi" /geeni= "snogK" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 8537..8941 (D) MUUT TIEDOT: /funktio= "NAME-syklaasi" /geeni= "snoaL" (ix) PIIRRE:

’ (A) NIMITYS: CDS

(B) SIJAINTI: 8992..9699 (D) MUUT TIEDOT: /funktio® "tuntematon" /geeni= "snoK" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: komplementaarinen (9745..10917) . (D) MUUT TIEDOT: /funktio= "glykosyylitransferääsi" /geeni= "snogD" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 11057..11884 (D) MUUT TIEDOT: /funktio= "tuntematon" /geeni= "snoW" 107053 27 (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 11928..13200 (D) MUUT TIEDOT: /funktio= "glykosyylitransferääsi" /geeni= "snogE" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: komplementaarinen (13335..13754) (D) MUUT TIEDOT: /funktio= "tuntematon" /geeni= "snoL" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 13974..14441 (D) MUUT TIEDOT: /funktio» "homologinen mitramysiiniryhmittymän jntmX:lle" /geeni= "snoO" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 14532..15377 (D) MUUT TIEDOT: /funktio= "C-7-ketoreduktaasi" /geeni= "snoaF" (ix) PIIRRE:

(A) NIMITYS: CDS

(B) SIJAINTI: 15450..16020 (D) MUUT TIEDOT: /funktio» "tuntematon" /geeni» "snoN" (ix) PIIRRE: (A) NIMITYS: sekalainen piirre (B) SIJAINTI: 3799..3800 (D) MUUT TIEDOT: /huom.» "geenien snoaM ja snogN päällekkäin menevä sekvenssi" . (ix) PIIRRE: (A) NIMITYS: sekalainen piirre (B) SIJAINTI: 6334..6356 (D) MUUT TIEDOT: /huom.= "geenien snoaG and snogC päällekkäin menevä sekvenssi" (ix) PIIRRE: (A) NIMITYS: sekalainen piirre . (B) SIJAINTI: 13201..13300 * (D) MUUT TIEDOT: /huom.» "tuntematon alue" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 1: AGATCTCGTC CGCCAGTGCC TCGGTGACCG GCAACGAGCC CTTGGCGTAG CCGAGATGGG 60 AGAAACCGGT CATGGTGTGC ACGGGCCAGG GATAACTGAT GTTGAGGGCG ATGTCGTAGG 120 • - 28 107053 AGGCGCGCAG GGCCTCCAGC ACCGCGTCCC GTCGCGGATG GCGCACCACG TACACGTAGT 180 AGACGTGCTC GTTGCCCTGC GCGGTCCTCG GCAGCAGCAG CCCCGTGTCC GCCAGGCCCT 240 CCTCATAGCG GCGTGCCACC GCCCGGCGGG CCTCGATGTA GGACGGCAAC CGGGACAGCT 300 TGCGCCGCAG GATCTCTGCC TGTACTTCGT CCAGCCGGCT GTTGTGCCCG GGGGTTTCGA 360 CGACGTAGTA GCGGCTCTCC ATGCCGTAGT AGCGCAGCCG CCGCAGCCGG TCCGCCACCC 420 GCTCGTCGTC GGTGAGCACC GCGCCGCCGT CCCCGTACGC GCCCAGCACC TTGGTCGGGT 480 AGAAGGAGAA CGCGGCCGCG TCACCGGTCG AGCCGGCGAG TCGGCCGTGC CGGCGCGCCC 540 CGTGCGCCTG CGCGCAGTCC TCCAGGATCA CCAGGTTGTG CCGGGCGGCC AGATCGCGCA 600 GCGGTGCCAT GTCCACGCAC TGCCCGTAGA GGTGGACCGG CAGCAGACAC CGGGTGCGTG 660 GCGTGAGGAC GGCCTCCACC TGGGACGTGT CCATCAGGTA GTCCTCCTCG CGCACGTCCA 720 CGAAGACGGG CGTGGCACCG GCCGAGTCGA TCGCGACGAC CGTGGGCGCG GCGGTGTTGG 780 ACACGGTGAC GACCTCGTCG CCGGGCCCGA CACCCAAGGC CTGTAACCCC AGCTTGACGG 840 CGTTGGTCCC GTTGTCGACG CCGACGGCAT GTCCGACGCC CTGGAATGAG GCGAACTCGG 900 ACTCGAAGCC GCGCACGCTC TCACCGAGGA CGAGCCGGCC GGAGCGGAAC ACCGTCTCCA 960 CGGCATCGTG GATGTCCTCG CGTTCCAGCT CGTATTCCGG CAGATAGTCC CACACGTGTA 1020 CGGTCATCGA GCCCCTCCGG GATTCTCCCT GCGAAAAGTC ACCACTCTAC GACAACGTTC 1080 ACCACTCGCT TTTTCCTCAA CGTCCGCTTG AGACGGCCCG GCCTGCTGTG GCCCGGGGAA 1140 AGGTGCGGTC GTTATCATCG ACTCCGTCTT CTCATTCGGA GGTTGTTCAG GGTGAAGGGA 1200 ATCATTCTCG CCGGGGGTAC GGGGAGCAGG CTCCACCCGA CGACTCTCGC GGTGTCCAAG 1260 · CAGCTTCTCC CCGTCGGGGA CAAGCCGATG ATCTACTACC CGCTCTCCGT GCTGATGCTG 1320 GCCGGCGTCA CGGACATCCT CATCATCAGC ACACCGCACG AACTCCCCCG AATGCGCCGT 1380 CTGTTCGGCG ACGGCGCACA GCTCGGACTC CGCCTGGCCT ACGCCGAGCA GGAGAAACCC 1440 AGGGGTATCG CCGAGGCGTT CCTGATCGGT GCCGACCACG TGGGAAGCGA TGCCGTTGCG 1500 !! CTGGCGCTGG GCGACAACAT ATTCCACGGG AGTTCTTTTC AGGGGGTGCT GCGCAAGGAA 1560 GCCGAGGAAT TGGACGGGTG TGTCCTGTTC GGTTATCCGG TCAAGGATCC CCAGCGTTAT 1620 GGAGTCGGCG AGGCGAACGC GTCCGGGCGG CTCGTCTCCA TCGAGGAGAA ACCGGTACGC 1680 CCCCGCTCCA ACCGGGCCAT CACCGGACTC TATTTCTACG ACAACGAGGT GGTGGACATC 1740 GCCCGGCGGC TGCGCCCCTC CGCCCGCGGC GAACTCGAAA TCACCGACAT CAACCGTACC 1800 • < 107053 29 TACATGGAAC GAGGCCGGGC CCGGCTCGTG GACCTGGGCC GGGGATTCGC CTGGCTCGAC 1860 ACCGGCACAC CCGAGTCACT CCTGCAGGCC TCGCAGTACG TGTCCGCCCT GGAGGAACGC 1920 CAGGGCATCA GGATCGCCTG CATCGAGGAG GTGGCCCTCC GCATGGGCTT CATCAACGCC 1980 CAGGCCTGCT ACGAACTGGG CGCGCGCCTG TCCGGCTCCG GCTACGGGCA GTACGTGATG 2040 GCCATCGCGG AGGAGTGCAC GGGGCGGGTG TGAGCGGCCG TGCCGGGTGG GCGAACGGCC 2100 CGGCCTTACC CGGCCCCGCG CACCCCGACG AACAACCCCC GGCCGGTCAG CCCGTCGTCC 2160 AGGAACTCGG CCGGGCAGCC CGCGTCCTCG AACGCGGCGA GGTACTCCTC CCTGGTGAAC 2220 AGGGTGAGCA GGTCGATCTC CGTGAACTCG CGTATCCCGG TGGCCTCGCC GACCAGGAAC 2280 CGCACCTCCA TGCGGGTCCT GCGGCCCTGC CTGGTGGAGT GGGACACCCG GGCCACGGTC 2340 CGGCCCTCAC CGCGTGCCAG GTCCCCGGCG ACGTAGCCCT CCAGGAACCG CTCGGGGAAC 2400 CACCAGGGCT CCACCACGAG CACGCCGCCC GGCACCAGGT GCGCGGCCAT CGTGCGCACC 2460 GCCGCCCGCA TGTCCGCGAC GGTCTCCAGA TACCCGATGG AGCAGAACAG GCAGACCACG 2520 GCGTCGAAAC GCCCGCTCAG GGCGAAGTCG CGCATGTCCC CGGGCCGCAC CGGCACCCCC 2580 GGCAGCCGCC GTTCGGCCAG GGCCCGCATC TCGTCCGACA GCTCCAGGCC CTCCGTGTGC 2640 GCGAACAGCC CGCGGAAGGC CTCCAGATGG GCGCCGGTGC CGCAGGCGAC GTCGAGCAGC 2700 GAACGCGCCC CGGGCCGACG GGACCTGATC TCCGCGGTGA CCCGTTCGGC CTCGTCCGCC 2760 CAGCTCTTTC CCCGGCTGCG GTAGACCATC TCGTACACGT CCGCCAGTTC CCGGCCGTAC 2820 ACGCGTCAGT CCTCGTCCAC CAGGGCGACC GCCCGGGTCC ACCCGGCGCC GGCGCCGGCG 2880 ACCTTGACCG GGAAGCAGCA GACGCGGAAC CCGAAGGAGA CCGGCAGGCG GTCGAGGTTC 2940 < GCCAGCCGCT CGATCTGGCA GTACTCCCGC TCCCGGCCCA CCACGTGCGC GGGCCACAGC 3000 ACCGATCGGT CGCCGGTCGC GCGGTACCGG TCGATGATGT GGCCGAAGGG CGCGTCCAGG 3060 CTGAAGGCAT CGGTCCCGAT CACCCGGACC CCGTGGTCGA GAAGCATCCG TACCGCGGGC 3120 CCGTCGAGAC CGGCGAAGTC CGTGAAGTAG CGCGGGGTGC CCGCGTGCCG CTGGGCACCG 3180 *! GTGTGCAGCA GCACGATGTC CCCGGGCCGC AACGCGCACC CGGTCCGGGC CAGTTCCTTC 3240 TCCAGGCGCG CGGCGCTCAC GGTGCCCGTC GGAGCGTCGG TGAGGTCCAG CACCACCCCG 3300 CGCCCGAAGA ACCACTCCAG CGGCATCTGG TCGATGTGGC GGGGGACGCC GTCCCCGTAC 3360 AGCGCGCGCG AACCATAGTG CGACGGCGCG TCGACGTGCG TGCCGGTGTG CGTGGTCAGC 3420 . . GTGATCCTGT CCAGTGACAG GAACTCGCCG TCCGGCAGTT CGTCCGGAGA GAACTCGACA 3480 30 107053 CCGAAGTGCT CGCGCATCTC CGCGCACATG TGTTCCGCGC CCTGCCGGGG CGTGAGGACG 3540 TCGTGCACCA CCGGGTCGGG CTCGTACTGT GAGGAATCCA CCGGTGACGA AAGGTCGATG 3600 AGCCGCACGC GCACCTCCGG GTTCGTAGAC GGGCTCGGCT GACGCAGCGC GGGTACGACG 3660 CTGACACGCC CCTCTTGACG TGGCCTGGAA GCTGGTTCGA CGGGCGGGCA CCGCACGCGA 3720 CGGCCGGCGC CGCACCGGCG CCGTCCCGGC CGAGCGGGAA TCCAGGGAGG GTATAGCGGC 3780 GCGCCCCACG CTGCCGTCAT GGTGATGAAA CTGACGGACA GCGAGCTGGG GCGTGCGCTG 3840 CTCTCGCTGC GTGGTTACCA GTGGCTCCGC GGCATCCACC ACGATCCCTA CGCCCTGCTG 3900 CTGCGCGCCG AGAGCGACGA TCCGGCGCAG CTCGGCCGGC TGCTGCGTGA ACGCGGCCGG 3960 CTCCACCGCA GCGACACCGG CACCTGGGTC ACCGCGGACC ATGCGACGGC CTCCCGGCTG 4020 CTCGCCGACC CGCGCTTCGT GCTGCGCCGC CCGCCGGCCG GGCCCGCCAC CGGCACCGGG 4080 GACGTCATGC CGTGGGAAGA GGCCACGCTG AGCGACCTGC TGCCCCTCGA CGAGGCGCGC 4140 CTGACGACCG ACCGGGCACG GTGCCGCCGG CTCGGCGCGA CCGCCGCGCG GATCGCGGCG 4200 GACGGTCCCG TCGCGACGCG ACTCGCGGAC CTGGCCGGGG CCCGAGCCGA ACAGGTGCGC 4260 TCAACGGGCC ACTTCGACCT CAGGGCCGAC TACGCCCTCC CGTACGCGGT CGAGCCGGCC 4320 TGCGCGCTGC TCGGCCTGCC GGCCGGGCAG TGTTCCCTCT TCGGCGCCTT 'CTCCCCGGCC 4380 GTCCTGCTCG ACGCGACGGT CGTACCGCCC CGCCTTCCGG AGGCGCGCGC CCTGATCGCC 4440 TCCACGGCGG AACTGACCGC CCTCTGGCCG CGGCTGGCCC CGAGCCTGTC GAAGACCGTC 4500 CCGGAGGACG AAGCGCCGGA CCTCTTCCTG CTGACGGCCG TGTTACTCGT ACCGGCCGTC 4560 GTCCACCTGG TCTGCGAGGC GGTCGCCGCC CTGTCGCACG ACCCCGGGCA GGCCGGGCTG 4620 CTCAGGGACG ACCCGGTACT CGCCGCACCG GCGGTCGAGG AGACGCTGCG CCACGCACCG 4680 CCCGCCCGTC TGTTCACCCT CCACGCGACC GGACCGGAGC GCGTCGCGGA CGTCGACCTC 4740 CCCGCGGGCG CCGAGGTCGC CGTCGTCGTG GCGGCGGCGC ACCGCGATCC CTCCTGGTGC 4800 CCGGACCCCG ACCGCTTCGA CCTCACCAGG AACGAGCGGC ATCTGGCACT GCCGCCGGAT 4860 **; CTGCCGCTGG GGGCGCTCGC CCCGCTGCTG CGCGTCTGCG CGACCGCGGC CGTCGCGGCC 4920 CTCGCGGCCG GACTCCTCCC GCTGCGGGCC GTCGGCCCGC CCGTACGACG GCTGCGTGCC 4980 CCGGTCACCC GGTCCGTGCT GCGCTTCCCC GTCGCCCCGT GCTGAGCAGC CCCTCCTCAC 5040 GTCATCCCCG GCCCGCCTTC CCCCGCCCGC AACGGAAGGG ACTCTCCATG GACAACCGCG 5100 AGACCGTACG ACCGGTGAGC GTCTGCCGGG TCTGCGGCGG CAACGACTGG CAGGACGTCG 5160 « 107053 31 TGGACTTCGG TGACGTTCCC CTCGCCAACG GCTTCCTGTC CCCGGCCGAC TCCTACGAGA 5220 ACGAGCGCCG CTACCCGCTG GGCGTCCTGT CCTGCCGCGC CTGCCGGCTG ATGAGCCTGA 5280 CCCACGTGGT CGACCCCGAG GTGCTGTACC GCGACTACGC CTACACCACC CCCGACTCCG 5340 AAATGATCAC CCAGCACATG CGGCACATCA CCGCGCTGTG CCGCACCCGT TTCGAGCTTC 5400 CCCCGGACÄG CCTCGTCGTG GAGCTGGGCA GCAATACCGG CCGTCAGCTC ATGGCCTTCC 5460 GCGAAGCGGG GATGCGCACC CTGGGCGTGG ACCCCGCGCG CAACCTCACG GACGTCGCCC 5520 GGCGCAACGG CATCGAGACC TTCCCCGACT TCTTCTCCCA CGACGTGGCC CGCACCATCC 5580 GGCGCGACCA CGGGCAGGCG CGGCTCGTGC TGGGACGGCA TGTCTTCGCC CACATCGACG 5640 ACGTGTCGGA CATCGCGGCC GGCGTACGCG AACTCCTGTC TCCCGACGGG GTGTTCGCGA 5700 TCGAGGTGCC GTACGTTCTG GACCTGCTGG AGAAGGTCGC GTTCGACACC ATCTACCACG 5760 AGCACTTGTC GTACTTCACC ATGCGGTCCT TCGTCACCCT CTTCGCGCGC CACGGGCTGC 5820 GGGTGCTCGA CGTGGAGCGG TTCGGCGTGC ACGGCGGATC GGTCCTCGTC TTCGTGGGCC 5880 ACGAGGACGG CCCCTGGCCC GAACGTCCCT CCGTCCCCGA ACTGCTGCGC GTGGAACGGC 5940 AGCGGGGCCT CTACGACGAC GCCACCTACC GCACGTTCGC GCAGCGGATC GAGCGGGTGC 6000 GCACCGAACT GCCGGAACTG CTGCGCTCCC TCGTGGCCCA GGGCAAGCGC ATCGTCGGCT 6060 ACGGTGCTCC GGCCAAGGGC AACACCATCC TCACGGTGTG CGGGCTCGGC CTGAAGGAGC 6120 TGGAATACTG CACCGACACC ACCGAGCTGA AGCAGGGCAG GGTGCTGCCC GGCACCCACA 6180 TACCGGTGCA CGCTCCCGAG CACGCCAAGG AACACATCCC CGACTACTAC CTGTTGCTCG 6240 CCTGGAACTA CGCCACGGAG ATCCTCGACA AGGAGACGGC CTTCCGGGAC AACGGCGGCC 6300 GGTTGATCGT GCCCATCCCC CGCCCGTCGA TCCTCACGTC CCCGTCAGGT TCCTGAGGCG 6360 CCCGCCGGGC AGCAGCTGAC GCATCGCCTC GCGCAGGGCT GCACGCCAGT CGCGGGGCGG 6420 TGCGACGCCG ACCAGCCGCC AGCGGTCGTG CCCGAGCACC GTGCACGCCG GCCGGGGCGC 6480 CGGGCCCGGC CGGTCGGCCG TCGCCACCGG GCGCACCCGT TCCGGGTCCG CGCCCGCCAG 6540 ! CCGGAACACC TCCCGGGCCA GCTCGTACCA GGTGGCCGCC CCGGCGTTGG TGGCGTGGAA 6600 GATCCCGCGC GCCCGGTCTG GCGGCGTGCG GGCCAGCGTC ACCAGCAGCC GGGCCACGTC 6660 ACCGGCCCAC GTCGGCTGCC CCCACTGGTC GTTGACGACG TCGACATGGC CGTCGTCCGG 6720 GGCACGCTCC AGCATCGTGC GCACGAAGCT GCGGCCCTGC CCGCCGTAGA GCCACGCCGT 6780 ; GCGCACCACG GTGCCCGTAT CCGGCAGCAG CGACAGCACG GCCCGTTCCC CGGCCAGTTT 6840 107053 32 GCTGCGGCCG TACACCGTGC GCGGGCCCGG AGCGTCCGAC TCGCCGTAAG GGCTGCGGGT 6900 GTCGCCCGGG AAGACGTAGT CGGTCGAGAC GTGGATCAGC CGTACGCCGT GGCGCGCACA 6960 GCGGCGGGCC AGCAGCCGGG GCCCGCCGCC GTTGACGCGC ATCGCCTCCG CCCACCGCGA 7020 CTCGGCGCCG TCCACGTCCG TGAAGGCGGC GCAGTTGACC ACCACCCGCG GCCGGTGCGC 7080 GGCGAACGCG GCGTCCACCG CCCGCCCGTC GGTGATGTCC AGCGCGCGCC GCCCGAGTAC 7140 CACCGCCTCG GCGGCGGGCC GGCTCCTGCC GGTCTCCGCC AGGGCCGCGG TCAGGTGCCG 7200 GGCGAGCATG CCTTCTCCTC CGGTGACCAG CACGCGCATC CCGCTCACCG GACCCCGGGG 7260 ACGACGGTGG ACGTACCGCC CGGCGCCGTG ACTCCCCGCT TGAGCGGCTC CCACCAGGAC 7320 CGGTTCTCGC GGTACCACTG GACCGTCGAG CGCAGCCCCG AGGAGAACTC CCGCGCCGGA 7380 CGGTAGCCCA GTTCCTCACG GGCCCTGCCC CAGTCCAGGC TGTAACGCAG GTCGTGCCCC 7440 TTGCGGTCGG GCACGTGCCG GACGCTGCTC CAGTCCGCCC CGCACAGCTC CAGCAACATA 7500 CCCACCAGCT CCCGGTTGGA GAGCTCCCGG CCGCCGCCGA TGTGGTACAC ACCGCCGGGC 7560 CGGCCCGCGG TGCGCACCAG GTCCACGCCC CGGCAGTGGT CCTCCACGTG CAGCCACTCC 7620 CGCACGTTCC GCCCGTCCCC GTACAGCGGC ACCGGCAGCC CGTCCAACAA GTTGGTGACG 7680 AAGCGCGGGA TGAGCTTCTC CGGGTGCTGA CGCGGGCCGT AGTTGTTGGA ACAGCGGGTC 7740 ACCCGCACGT CCAGGCCGTG CGTGCGGTGG CAGGCGAACG CCATCAGGTC GGCCGACGCC 7800 TTGGAGGCGG CGTACGGGGA GTTGGGGCTC AGCGGGTGCT CCTCCGGCCA GGAACCGGAC 7860 GCGATGGAGC CGTAGACCTC GTCCGTGGAC ACCAGGACGA AGGGCTCCAC GCCGTGGCGC 7920 . . AGCGCGGCGT CCAGCAGCCG CTGGGTGCCG ACGACGTTGG TCAGCACGAA GTCGTCGGCC 7980 • > < GCGCGGATGG ACCGGTCGAC GTGCGACTCC GCGGCGAAGT GGACGACCTG GTCGCTGTGT 8040 GCCATCAGCT CGTCGACCAG CTCGGCGTCG AGGATGTCGC CCCGCACGAA GCGCAGCCGG 8100 TCACCGCGTA CCGCGTCCAG GTTCGTGAGG TTGCCCGCGT ACGTCAGTTT GTCGAGGACG 8160 GTGACGCGTA CCGCCGGGGC CCCCGCTCCG GGGGCCCGGT TCTCCAGCAG CATGCGCACA 8220 1 TAGGCCGAGC CGATGAAACC GACCGCGCCG GTGACCAGGA TGTTCACGTC CGTCGTCGCG 8280 GAGGTGTGCG ACGCCATGGG TTCCCTCCAT CCGTCGGGTG CCGTGGGGCG GAGTGCGCCC 8340 CCTCGACCCA GCGTCGGGGG CGGCCGTGGA GGAGCGGTTG AGCTTCGGCG CAGCGGCGGC 8400 TCGACCGGCG GCGGCCGGCG TCGCCGGACT CCAACGGTTC TCGACGGAAC GACCAACGGC 8460 ; CCTGGCGAGA CTGCCCGGAC AGCCCGGCCG AGAGAGGGAG GACCCGTTGA GCCGTCAGAC 8520 107053 33 AGAGATCGTC CGCCGGATGG TGAGCGCCTT CAACACCGGC AGGACCGACG ACGTGGACGA 8580 GTACATCCAC CCCGACTACC TCAATCCGGC CACCTTGGAA CACGGCATCC ACACCGGGCC 8640 CAAGGCGTTC GCCCAGCTGG TCGGCTGGGT GCGGGCGACG TTCTCCGAGG AAGCCCGCCT 8700 GGAGGAGGTG CGGATCGAGG AGCGCGGCCC GTGGGTCAAG GCCTACCTCG TGCTCTACGG 8760 CCGCGACGTC GGCCGGCTTG TCGGTATGCC GCCCACCGAC CGGCGCTTCT CCGGTGAACA 8820 GGTGCACCTG ATGCGCATCG TCGACGGGAA GATCCGCGAC CACCGGGACT GGCCCGACTT 8880 CCAGGGGACG CTGCGCCAGC TCGGCGACCC GTGGCCCGAC GACGAGGGCT GGCGTCCGTG 8940 ACCGTCCCTG AAACCGCACC CGACGAGACA TCAGACCAGG AAGGATGGCT CATGCCGGAT 9000 CCCGGCGGCC CGACCACGGC CGAGAACCTG TCGAAGGAGG CTGTCCGCTT CTACCGCGAG 9060 CAGGGTTACG TGCACATCCC GCGCGTCCTG TCGGAGACGG AGGTGACCGC CTTCCGGGCC 9120 GCCTGTGAGG AGGTCCTGGA GAAGGAGGGC CGCGAGATCT CCGGCATCGC CCTGCGGCTG 9180 GCCGGCGCGC CCCTGCGGGT CTACAGCAGC GACATCCTGG TCAAGGAGCC CAAGCGCACC 9240 CTGCCCACCC TGGTCCACGA CGACGAGACG GGACTGCCGC TGAACGAGCT GAGTGCCACG 9300 CTGACGGCCT GGATCGCGCT GACGGACGTA CCCGTCGAAC GCGGCTGCAT GAGCTACGTG 9360 CCGGGCTCCC ATCTCAGGGC CCGCGAGGAC CGGCAGGAGC ACATGACCAG CTTCGCCGAG 9420 TTCCGGGACC TCGCGGACGT GTGGCCCGAT TACCCGTGGC AGCCGCGCGT CGCCGTGCCC 9480 GTCCGCGCCG GAGACGTCGT GTTCCACCAT TGCCGTACCG TCCACATGGC CGAAGCCAAC 9540 ACCAGCGACT CGGTCCGCAT GGCGCATGGC GTCGTCTACA TGGACGCGGA CGCCACCTAC 9600 CGGCCGGGCG TCCAGGACGG CCACCTGTCC CGCCTGTCGC CGGGAGATCC ACTCGAAGGC 9660 GAGCTGTTCC CCCTGGTCAC GGCAGGCACA CGGCAGTGAG GTCCGCCGTT CCCGGCGGTC 9720 GCGGGACCGC CGGGGACGGC ACCGTCAGCC GGCCAGCGCC ACGAGCTTGG CGGCCGTCTC 9780 GGCCGGCGGC GGCATCTCGC TCATCTCCTG CCGCACCCGC AGGGCCGCCT CCCGCAACCC 9840 CGCGTCGTCC AGCAGCCGTC GGCACTGCTC GGCACCCAGC GATCCCGCCT CGGCATCGAA 9900 II CCCGATGCCC AGCCCGGTCA GCACATCGCG GTTGGTGTCC TGGTAGGAGC CGTGCGGGAT 9960 GACGCACTGC GGGACGCCGG CGGCCAGGGC CGTCAGCAGT GTGCCGCTGC CCCCGTGATG 10020 GATGATCGCG TCGCACGTCT CCAGCAGCGC GCCCAGCGGA ATCCACTCCA CCACCGGTAC 10080 GTTCGCGGGC AGTTCACCGA GCAGGGCCAG GTCGCCGCCG CCCAGGGTCA GCACGAACTC 10140 , . CGCGTCCACG TCCGCCACTT CGGAGAACAG CGGGGCCAGC TTGGCGATGC CGCCCGACAG 10200 • · 107053 34 CGCGTCGATG GAGCCCAGCG TCACCGCGAT ACGCCGCCGG CCGGCCGCGG GCGGCAGCCA 10260 GTCCGGCAGC ACCGCTCCGC CGTTGTAGGG GACGTACCGC ATCGGCCÄGG CACCCGGGGA 10320 GCGCCGGTCC TCCGGCAGCA GCGCCTCCAC GCTCGGCGGT GTCGTCGTCA GCCGCACGGA 10380 ACCGGTCGGC TCGCCGGTGA CGCCGTGGCG CTCGTAGTCC TTGGACATCG CCCGCCGGAT 10440 GAGCGCGCCG AGCCCCGGCT CGCTGTCCGC GGGACCCAGC GGCAGCTCTA CGCACGGCAG 10500 TTGCAGCGCT GCCGCCGTCA GCGGGCCCGC GCCCTGTGTC GGAGTGTGCA CGACGAGGTC 10560 GGGCCGCCAG CTCCGCGCCG TCCGCAGCGC CCCGTCGACG GCCACCGCCG ATACCCGGGC 10620 GAACATCTCG GCGAAGAAGC CCTCGCCCAG CCCCTCGGAG TGCATCGGGT CGGTGACGTC 10680 GGTGTCGTCG GGCACGAACA GCTTCGCGTA GTTCACGCCG GGCGACACGT CCACGGCGCA 10740 GAGCCCGGCC TCCGCGACGG CGCGGATGTC GCCCCCCGTG GCGTAGCGGA CCTCGTGGCC 10800 GAGAGCGCGC AGCGCCTGTG CCAGCGGCAC CGTCGGCAGG ATGTGGCTGA GCCCGGGTGA 10860 AGTGATGAAC AACGCACGCA TGATGCCCCC TGTTCGACAT GAACCTGGAA CACGCATCCT 10920 GACGGCGCCT TCTGTTGCTC CGGTCGACGC CCGGTCGACA GGCCCTCGTA CAGCCCGCCG 10980 GGGGCCGGTC CGGCCACGAC GCAGGCTCCA GCGGACGTCG ACGGCGGGGA CGCAGCGTGG 11040 TCGCCGGGAG GCATCGATGA CAGTATTGGT AACCGGAGCC ACAGGAAACG TCGGCCGGCA 11100 CGTCGTCACC GGGCTACTGG CCGCCGGCCG CCGGGTGCGG GCGCTGACCC GCACACCCGA 11160 CCGGTCCGGC CTGCCCGGCG GCGCGGAGAT CACAGGCGGC GACCTGACCC GCCCGGAGAC 11220 CTACGAGCGG ATGCTGGACG GTGTCGAAGC CGTCTACCTG TTCCCCGTCC CGGAGACCGC 11280 CGCGGCGTTC GCCGGGGCCG CGCGACGGGC CGGTGTCCGG CGGATCGTGG TGCTCTCCTC 11340 GGACTCCGTC ACCGACGGCA CCGACACCGG AGGACACCGG CGCGTGGAAC TGGCCGTGGA 11400 GGACACGGGG CTCGAGTGGA CCCATGTGCG CCCCGGCGAG TTCGCGCTCA ACAAGGTCAC 11460 CCTGTGGGCG CCGTCGATCC GCGCGGAGGG CGTCGTCCGG TCCGCGTATC CGGACGCCCG 11520 GGTGGCCCCG GTGCACGAGG CCGACGTCGC GGCCGTCGCG GTGACCGCGC TGCTGAAGGA 11580 !! GGGGCACGCC GGCCGCGCCT ACAGCGTGAC CGGACCGCAG GCCCTCACCC AGCGCGAACA 11640 GGTCCGCGCG GTAGGGGAGG GGCTCGGCCG GTCCCTCGCC TTCGTCGAGG TGACCCCCGG 11700 GCAGGCGCGG GCCGACCTGA CCGCCCAGGG GCTGCCCGCG CCCATCGCCG ACTACGTCCT 11760 CGCCTTCCAA GCCGGGTGGA CCGAGCGGCC CGCCCCCGCC CGGCCGACCG TGCGGGAGGT 11820 CACCGGCCGG CCCGCCCGCA CGCTCGCCCA GTGGGCCGCC GACCACCGAG CGGACTTCCG 11880 35 107053 GTGACCGGAG ACCGCGTCCA CCGCGCCACG ACAGAAAGGC GACGCCCGTG CGCGTACTGC 11940 TGACGTCCTT CGCCATGGAC GCCCACTTCT GCACCGCCGT GCCGCTGGCG TGGGCACTGC 12000 GGTCGGCCGG GCACGAGGTA CGGGTGGCCG GCCAGCCCGC GCTCACCTCC ACCATCACGG 12060 GAGCCGGCCT GACCGCCGTG CCGGTCGGCC GCGACCACAC GCACGGCAGC CTCCTGGGCC 12120 GGGTCGGCAG CGACATCCTC GCCCTGCACG ACGAGGCGGA CTACCTGGAG GCCCGTCACG 12180 ACGCCCTGGG CTTCGAGTTC CTCAAAGGGC ACAACACGGT GATGTCCGCG TTGTTCTACT 12240 CGCAGATCAA CAACGACTCG ATGGTCGACG ACCTGGTGGA CTTCGCCCGT CACTGGCGGC 12300 CCGACCTGGT CGTCTGGGAG CCGTTCACCT TCGCGGGCGC CGTGGCCGCG CGGGCCTCGG 12360 GCGCCGCCCA CGCCCGCCTG CTGTCCTTCC CCGACCTGTT CCTCAGCACG CGCCGCCTCT 12420 TCCTGGAGCG CATGGCGCGC CAGGAGCCCG AGCATCACGA CGACACACTC GCCGAATGGC 12480 TCGACTGGAC CCTTGGCCGG CACGGCCACT CCTTCGACGA GGAGATCGTC ACGGGGCAGT 12540 GGTCCATCGA CCAGACCCCC GCCCCCGTGC GGCTCGACGC CGGCGGTCCC ACCGTGCCGA 12600 TGCGGTACGT CCCCTACAGC GGACTGGTGC CCACAGTGGT GCCCGACTGG CTGCGCAGGC 12660 CGCCCGAGCG GCCACGGGTC CTGGTCACCC TCGGCATCAC CTCACGGCGG GTGAAGTCCT 12720 TCCTCGCCGT CTCCGTGGAC GACCTTTTCG AGGCCGTGGC CGGGCTCGGC GTCGAGGTGG 12780 TCGCCACCCT CGACGCCGAC CAGCGGGAGC TGCTGGGGCG CGTGCCGGAC CACTTCCGCA 12840 TCGTCGAGCA CGTGCCGCTG GACGCCGTTC TGCCGACCTG CTCGGCGATC GTCCACCACG 12900 GCGGAGCCGG CACCTGGTCG ACGGCCGCCG TGTACGGGGT GCCGCAGGTC TCCCTGGGCT 12960 CGATGTGGGA CCACTTCTAC CGGGCCCGTC GCCTGGAGGA ACTCGGGGCG GGGCTGCGGC 13020 • ' < TGCCCTCCGG CGAGCTGACT GCCGAGGGGC TGCGCACCCG GCTGGAGAGG GTGCTCGGCG 13080 AGCCCTCCTT CGGCACCGCC GCGCAGGCGC TGAGCGACAC CATCGCGGCG GAACCCAGCC 13140 CCAGCGAGGT CGTGCCGGTC CTGGAGGAGC TGACCGGACG GCACCGTCCC GGCACCCGGG 13200 NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN 13260 “ NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN CCGTCCGGGC CCCTCGCCGG 13320 TGAGGGAGCC CGGATCACAG TCCGTCCGGC ACCACGCCCA GGTCCCGGAA CAGCGGGGAG 13380 AAGTTGAAGA CGTCCCAGTG CTCCACGACC TTGCCGGCTT CGGAGAAGCG CAGCTCCTCC 13440 AAGTAGGTCC AGCGGACCTT GCGGCCGGTG GGGGCGATGC CCATGAACAC GCCCTGGTGC 13500 GTGGCCGAGC AGGTGATCCG CAGCATCACG CGGTCGCCCT CGCCCACGAT GCTCCGCACG 13560 • · 107053 36 TCCAGACGAA GGTCCGGGAA GGCCTCCACC GCGCTGTTCA TACGCCGTAC GACCTCCTCG 13620 GCGCTCACCG GTTTGTCCTC GTCGTCGTAG TGGACGACGT CGGGTGCCCA GTGCGCGACC 13680 ACCCCGGAGA CGTCCCACCG GTTCCATGCG GCCACCATCT CCAGGCAGCG TTCCTTGTTC 13740 GCGGTCGTTG ACATGTCGAC TCCTTGAAGG CCCGGGACTA CTGGTCACGC GCCAGCCTTC 13800 CAACCCGCCC CGGAAAAGCG GTGCACGACC GCTGGAGCCC GCACCGGAAC CTGCGCGGCG 13860 GAGCTGAACG GGGTTTCGAG CCGTTCACCA AGGACCTGCC GCAGCCTGTT ACGGCACACC 13920 CTGACGCCTC GCTCCGCGCG GGACGCGCCC GCCGGGAGGA AGGACÄCACC ACCATGTCGG 13980 TACGCACCGA TCAGACGGCG GCACCGGAAG ACCGAGCGGC GGCCACGGAT CCCGGGTTCG 14040 GGCACCTGTA CGCGCAGGTG CAGCAGTTCT ACGCCCGGCA GATGCAGCTC CTCGACTCCG 14100 GCGCGGCCGA GGAGTGGGCC GCCACCTTCA CCGAGGACGG CACGTTCGCC CGGCCCTCCT 14160 CGCCGGAACC GGCACGCGGQ CACGCCGAAC TGGCCGCCGG CGCCCGCGCC GCCGCCGAAC 14220 GCCTCGCCGC CGAGGGCCTT TCGCACCGGC ACGTCATCGG CATGACCGCG GTACGCCGGG 14280 AACCCGACGG CAGCGTGTTC GTACGCAGCT ACGCCCAGGT CTTCGCCACC CGCCGCGGGG 14340 AAGCTCCCCG GCTGCATCTG ATCTGCGTCT GCGAGGACGT GCTCGTGCGG GAGGGGCCGG 14400 GGCTGAAGGT GCGGGAACGG GTTGTCACGC ACGACGCGTG AGGGCGGTCG ACCCGCCGGC 14460 CGAGCCGCAC CTCTGCCACC CCCTCGGCAC GCCAGCCGGC GTCGAGTCCG CTGCGAGAGG 14520 GCGCACTTAG CGTGCGAGCC ATGACTGACT CGACAGGTCC CCGCCCGGTG CCCGCCATGT 14580 CACCCGCCCC CAGCCCCACG CCTTCCCCCG GCCCCGCCCC CGGGAGCGAA CCCGCGCCGC 14640 TCGCCGTGAT CGTCACCGGC GGCGGTTCGG GTATCGGCCG GGCCACCGCC CGCGCCTTCG 14700 « CCGCTCAGGG TGCGAAGGTG CTCGTCGTCG GCCGTACCGA GGACGCGCTC GCGCAGACCG 14760 CCGAGGGCTG TGCGGACATG CGTGTGCTCG TCGCCGACGT GGCCTCGCCC GACGGGCCGC 14820 AGGCGGTCGT CAACGCCGCC CTGCGGGAGT TCGGGAGGAT CGACGTCCTG GTCAACAACG 14880 CTGCCGTGGC GGGCATGGAG ACCCTGCAGA CCGTCGACCG GGACGCCGTG GCACGGCAGT 14940 • < ,·· TCGGCACCAA TCTGACGGCT CCCCTCTTCC TCGTCCAGTC CGCACTCGGC GCGCTGGAGA 15000 AGTCGCGCGG CATCGTCGTC AACGTGGGGA CCGCCGCGAC CCTGGGCCTG CGCGCCGCCC 15060 CGACCGGCGC GCTGTACGGG GCGAGCAAGG TGGCCCTCGA CTACCTGACC CGGACCTGGG 15120 CCGTCGAACT GGCCCCCCGG GGCATCCGTG TCGTCGGCGT GGCACCCGGG GTGATCGACA 15180 . CGGGCATCGG CGTCCGCATG GGCATGACCC CGGAGGGCTA CCGGGAGTTC CTGACCGGCA 15240 • · 107053 37 TGGGCGGCAG GGTGCCCGTG GGCCGGGTCG GCCGTCCGGA GGACGTGGCC TGGTGGATCG 15300 TCCAGCTCGC CCGCCCGGAG GCCGGCTACG CGACGGGCAT GGTCGTCCCC GTCGACGGCG 15360 GGCTGTCGCT GGTCTGACCG GACAAGGAAG GAAATACCGC AGGAAGGAAG TACCGCAGCA 15420 AGGAAATACC GCAGGAAGGA GATATCGCCG TGCAGGAAAC CGAACCCGGC GTCCCCGCGG 15480 ACCTGCCCGC CGAGAGCGAC CCTGCCGCCC TGGAGCGCCT CGCCGCACGG TACCGGCGGG 15540 ACGGCTACGT CCACGTCCCC GGCGTCCTCG ACGCCGGGGA GGTCGCCGAA TACCTGGCCG 15600 AGGCCCGTCG GCTCCTCGCC CACGAGGAGT CCGTGCGCTG GGGCTCCGGC GCCGGCACCG 15660 TCATGGACTA CGTCGCCGAC GCCCAGCTCG GCAGCGACAC GATGCGCCGC CTTGCCACCC 15720 ACCCGCGCAT CGCCGCCCTC GCCGAGTACC TGGCCGGCTC GCCCCTGAGG CTGTTCAAGC 15780 TGGAGGTGCT GCTCAAGGAG AACAAGGAGA AGGACGCCTC GGTCCCCACC GCCCCGCACC 15840 ACGATGCGTT CGCCTTCCCG. TTCTCCACCG CCGGCACCGC CCTGACGGCG. TGGGTCGCGC 15900 TGGTCGACGT CCCGGTGGAA CGCGGCTGCA TGACCTTCGT CCCCGGATCA CACCTGCTGC 15960 CGGATCCCGA TACCGGCGAC GAGCCGTGGG CCGGGGCCTT CACCCGGCCG GGAGAGATCT 16020

(2) SEQ ID NO: 2:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 342 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "sriogI:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 2:

Met Thr Vai His Vai Trp Asp Tyr Leu Pro Glu Tyr Glu Leu Glu Arg 15 10 15

Glu Asp Ile His Asp Ala Vai Glu Thr Vai Phe Arg Ser Gly Arg Leu ; 20 25 30 • « • (

Vai Leu Gly Glu Ser Vai Arg Gly Phe Glu Ser Glu Phe Ala Ser Phe 35 40 45

Gin Gly Vai Gly His Ala Vai Gly Vai Asp Asn Gly Thr Asn Ala Vai 50 55 60

Lys Leu Gly Leu Gin Ala Leu Gly Vai Gly Pro Gly Asp Glu Vai Vai ; - 65 70 75 80 ♦ 107053 38

Thr Vai Ser Asn Thr Ala Ala Pro Thr Vai Val Ala lie Asp Ser Ala 85 90 95

Gly Ala Thr Pro Val Phe Val Asp Val Arg Glu Glu Asp Tyr Leu Met 100 105 110

Asp Thr Ser Gin Val Glu Ala Val Leu Thr Pro Arg Thr Arg Cys Leu 115 120 125

Leu Pro Val His Leu Tyr Gly Gin Cys Val Asp Met Ala Pro Leu Arg 130 135 140

Asp Leu Ala Ala Arg His Asn Leu Val lie Leu Glu Asp Cys Ala Gin 145 150 155 160

Ala His Gly Ala Arg Arg His Gly Arg Leu Ala Gly Ser Thr Gly Asp 165 170 . 175

Ala Ala Ala Phe Ser Phe Tyr Pro Thr Lys Val Leu Gly Ala Tyr Gly 180 185 190

Asp Gly Gly Ala Val Leu Thr Asp Asp Glu Arg Val Ala Asp Arg Leu 195 200 205

Arg Arg Leu Arg Tyr Tyr Gly Met Glu Ser Arg Tyr Tyr Val Val Glu 210 215 220

Thr Pro Gly His Asn Ser Arg Leu Asp Glu Vai Gin Ala Glu He Leu 225 230 235 240

Arg Arg Lys Leu Ser Arg Leu Pro Ser Tyr He Glu Ala Arg Arg Ala 245 250 255

Val Ala Arg Arg Tyr Glu Glu Gly Leu Ala Asp Thr Gly Leu Leu Leu 260 265 270 , Pro Arg Thr Ala Gin Gly Asn Glu His Val Tyr Tyr Val Tyr Val Val ' 275 280 285

Arg His Pro Arg Arg Asp Ala Val Leu Glu Ala Leu Arg Ala Ser Tyr 290 295 300

Asp He Ala Leu Asn He Ser Tyr Pro Trp Pro Val His Thr Met Thr 305 310 315 320 , Gly Phe Ser His Leu Gly Tyr Ala Lys Gly Ser Leu Pro Val Thr Glu 325 330 335

Ala Leu Ala Asp Glu He 340

(2) SEQ ID NO: 3:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 293 aminohappoa 107053 39 (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi <D) MUUT TIEDOT: /huom.= "snogJ:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 3:

Vai Lys Gly Ile Ile Leu Ala Gly Gly Thr Gly Ser Arg Leu His Pro 15 10 15

Thr Thr Leu Ala Vai Ser Lys Gin Leu Leu Pro Vai Gly Asp Lys Pro 20 25 30

Met Ile Tyr Tyr Pro Leu Ser Vai Leu Met Leu Ala Gly Vai Thr Asp 35 40 45

Ile Leu Ile Ile Ser Thr Pro His Glu Leu Pro Arg Met Arg Arg Leu 50 55 60

Phe Gly Asp Gly Ala Gin Leu Gly Leu Arg Leu Ala Tyr Ala Glu Gin 65 70 75 80

Glu Lys Pro Arg Gly Ile Ala Glu Ala Phe Leu Ile Gly Ala Asp His 85 90 95

Vai Gly Ser Asp Ala Vai Ala Leu Ala Leu Gly Asp Asn Ile Phe His 100 105 110

Gly Ser Ser Phe Gin Gly Vai Leu Arg Lys Glu Ala Glu Glu Leu Asp 115 120 125

Gly Cys Vai Leu Phe Gly Tyr Pro Vai Lys Asp Pro Gin Arg Tyr Gly 130 135 140

Vai Gly Glu Ala Asn Ala Ser Gly Arg Leu Vai Ser Ile Glu Glu Lys 145 150 155 160

Pro Vai Arg Pro Arg Ser Asn Arg Ala Ile Thr Gly Leu Tyr Phe Tyr 165 170 175

Asp Asn Glu Vai Vai Asp Ile Ala Arg Arg Leu Arg Pro Ser Ala Arg 180 185 190 . Gly Glu Leu Glu Ile Thr Asp Ile Asn Arg Thr Tyr Met Glu Arg Gly 195 200 205

Arg Ala Arg Leu Vai Asp Leu Gly Arg Gly Phe Ala Trp Leu Asp Thr 210 215 220

Gly Thr Pro Glu Ser Leu Leu Gin Ala Ser Gin Tyr Vai Ser Ala Leu 225 230 235 240 107053 40

Glu Glu Arg Gin Gly Ile Arg Ile Ala Cys Ile Glu Glu Val Ala Leu 245 250 255

Arg Met Gly Phe lie Asn Ala Gin Ala Cys Tyr Glu Leu Gly Ala Arg 260 265 270

Leu Ser Gly Ser Gly Tyr Gly Gin Tyr Val Met Ala lie Ala Glu Glu 275 280 285

Cys Thr Gly Arg Val 290

(2) SEQ ID NO: 4:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 238 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogA:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 4:

Vai Tyr Gly Arg Glu Leu Ala Asp Vai Tyr Glu Met Vai Tyr Arg Ser 15 10 15

Arg Gly Lys Ser Trp Ala Asp Glu Ala Glu Arg Vai Thr Ala Glu Ile 20 25 30

Arg Ser Arg Arg Pro Gly Ala Arg Ser Leu Leu Asp Vai Ala Cys Gly 35 40 45

Thr Gly Ala His Leu Glu Ala Phe Arg Gly Leu Phe Ala His Thr Glu 50 55 60

Gly Leu Glu Leu Ser Asp Glu Met Arg Ala Leu Ala Glu Arg Arg Leu 65 70 75 80

Pro Gly Vai Pro Vai Arg Pro Gly Asp Met Arg Asp Phe Ala Leu Ser 85 90 95

Gly Arg Phe Asp Ala Vai Vai Cys Leu Phe Cys Ser Ile Gly Tyr Leu .. 100 105 110 • «

Glu Thr Vai Ala Asp Met Arg Ala Ala Vai Arg Thr Met Ala Ala His 115 120 125

Leu Vai Pro Gly Gly Vai Leu Vai Vai Glu Pro Trp Trp Phe Pro Glu 130 135 140

Arg Phe Leu Glu Gly Tyr Vai Ala Gly Asp Leu Ala Arg Gly Glu Gly 145 150 155 160 107053 41

Arg Thr Vai Ala Arg Vai Ser His Ser Thr Arg Gin Gly Arg Arg Thr 165 170 175

Arg Met Glu Val Arg Phe Leu Vai Gly Glu Ala Thr Gly He Arg Glu 180 185 190

Phe Thr Glu He Asp Leu Leu Thr Leu Phe Thr Arg Glu Glu Tyr Leu 195 200 205

Ala Ala Phe Glu Asp Ala Gly Cys Pro Ala Glu Phe Leu Asp Asp Gly 210 215 220

Leu Thr Gly Arg Gly Leu Phe Val Gly Val Arg Gly Ala Gly 225 230 235

(2) SEQ ID NO: 5:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 324 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoaM:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 5:

Met Thr Ala Ala Trp Gly Ala Pro Leu Tyr Pro Pro Trp He Pro Ala 1 5 10 15

Arg Pro Gly Arg Arg Arg Cys Gly Ala Gly Arg Arg Vai Arg Cys Pro 20 25 30

Pro Vai Glu Pro Ala Ser Arg Pro Arg Gin Glu Gly Arg Vai Ser Vai 35 40 45

Vai Pro Ala Leu Arg Gin Pro Ser Pro Ser Thr Asn Pro Glu Vai Arg 50 55 60

Vai Arg Leu He Asp Leu Ser Ser Pro Vai Asp Ser Ser Gin Tyr Glu 65 70 75 80

Pro Asp Pro Vai Vai His Asp Vai Leu Thr Pro Arg Gin Gly Ala Glu 85 90 95 *

His Met Cys Ala Glu Met Arg Glu His Phe Gly Vai Glu Phe Ser Pro 100 105 110

Asp Glu Leu Pro Asp Gly Glu Phe Leu Ser Leu Asp Arg He Thr Leu 115 120 125

Thr Thr His Thr Gly Thr His Vai Asp Ala Pro Ser His Tyr Gly Ser 130 135 140 107053 42

Arg Ala Leu Tyr Gly Asp Gly Val Pro Arg His He Asp Gin Met Pro 145 150 155 160

Leu Glu Trp Phe Phe Gly Arg Gly Val Val Leu Asp Leu Thr Asp Ala 165 170 175

Pro Thr Gly Thr Val Ser Ala Ala Arg Leu Glu Lys Glu Leu Ala Arg 180 185 190

Thr Gly Cys Ala Leu Arg Pro Gly Asp He Val Leu Leu His Thr Gly 195 200 205

Ala Gin Arg His Ala Gly Thr Pro Arg Tyr Phe Thr Asp Phe Ala Gly 210 215 220

Leu Asp Gly Pro Ala Val Arg Met Leu Leu Asp His Gly Val Arg Val 225 230 235 240

He Gly Thr Asp Ala Phe Ser Leu Asp Ala Pro Phe Gly His He He 245 250 255

Asp Arg Tyr Arg Ala Thr Gly Asp Arg Ser Val Leu Trp Pro Ala His 260 265 270

Val Val Gly Arg Glu Arg Glu Tyr Cys Gin He Glu Arg Leu Ala Asn 275 280 285

Leu Asp Arg Leu Pro Val Ser Phe Gly Phe Arg Val Cys Cys Phe Pro 290 295 300

Val Lys Val Ala Gly Ala Gly Ala Gly Trp Thr Arg Ala Val Ala Leu 305 310 315 320

Val Asp Glu Asp

(2) SEQ ID NO: 6:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 408 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogN:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 6:

Met Vai Met Lys Leu Thr Asp Ser Glu Leu Gly Arg Ala Leu Leu Ser 15 10 15

Leu Arg Gly Tyr Gin Trp Leu Arg Gly He His His Asp Pro Tyr Ala 20 25 30 107053 43

Leu Leu Leu Arg Ala Glu Ser Asp Asp Pro Ala Gin Leu Gly Arg Leu 35 40 45

Leu Arg Glu Arg Gly Arg Leu His Arg Ser Asp Thr Gly Thr Trp Val 50 55 60

Thr Ala Asp His Ala Thr Ala Ser Arg Leu Leu Ala Asp Pro Arg Phe 65 70 75 80

Val Leu Arg Arg Pro Pro Ala Gly Pro Ala Thr Gly Thr Gly Asp Val 85 90 95

Met Pro Trp Glu Glu Ala Thr Leu Ser Asp Leu Leu Pro Leu Asp Glu 100 105 110

Ala Arg Leu Thr Thr Asp Arg Ala Arg Cys Arg Arg Leu Gly Ala Thr 115 120 125

Ala Ala Arg lie Ala Ala Asp Gly Pro Val Ala Thr Arg Leu Ala Asp 130 135 140

Leu Ala Gly Ala Arg Ala Glu Gin Val Arg Ser Thr Gly His Phe Asp 145 150 155 160

Leu Arg Ala Asp Tyr Ala Leu Pro Tyr Ala Val Glu Pro Ala Cys Ala 165 170 175

Leu Leu Gly Leu Pro Ala Gly Gin Cys Ser Leu Phe Gly Ala Phe Ser 180 185 190

Pro Ala Val Leu Leu Asp Ala Thr Val Val Pro Pro Arg Leu Pro Glu 195 200 205

Ala Arg Ala Leu lie Ala Ser Thr Ala Glu Leu Thr Ala Leu Trp Pro 210 215 220

Arg Leu Ala Pro Ser Leu Ser Lys Thr Val Pro Glu Asp Glu Ala Pro • 225 230 235 240

Asp Leu Phe Leu Leu Thr Ala Val Leu Leu Val Pro Ala Val Val His 245 250 255

Leu Val Cys Glu Ala Val Ala Ala Leu Ser His Asp Pro Gly Gin Ala 260 265 270

Gly Leu Leu Arg Asp Asp Pro Val Leu Ala Ala Pro Ala Val Glu Glu 275 280 285

Thr Leu Arg His Ala Pro Pro Ala Arg Leu Phe Thr Leu His Ala Thr 290 295 300

Gly Pro Glu Arg Val Ala Asp Val Asp Leu Pro Ala Gly Ala Glu Val 305 310 315 320 107055 44

Ala Vai Vai Vai Ala Ala Ala His Arg Asp Pro Ser Trp Cys Pro Asp 325 330 335

Pro Asp Arg Phe Asp Leu Thr Arg Asn Glu Arg His Leu Ala Leu Pro 340 345 350

Pro Asp Leu Pro Leu Gly Ala Leu Ala Pro Leu Leu Arg Vai Cys Ala 355 360 365

Thr Ala Ala Vai Ala Ala Leu Ala Ala Gly Leu Leu Pro Leu Arg Ala 370 375 380

Vai Gly Pro Pro Vai Arg Arg Leu Arg Ala Pro Vai Thr Arg Ser Vai 385 390 395 400

Leu Arg Phe Pro Vai Ala Pro Cys 405

(2) SEQ ID NO: 7:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 422 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoaG:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 7:

Met Asp Asn Arg Glu Thr Vai Arg Pro Vai Ser Vai Cys Arg Vai Cys 15 10 15

Gly Gly Asn Asp Trp Gin Asp Vai Vai Asp Phe Gly Asp Vai Pro Leu 20 25 30

Ala Asn Gly Phe Leu Ser Pro Ala Asp Ser Tyr Glu Asn Glu Arg Arg 35 40 45

Tyr Pro Leu Gly Vai Leu Ser Cys Arg Ala Cys Arg Leu Met Ser Leu 50 55 60

Thr His Vai Vai Asp Pro Glu Vai Leu Tyr Arg Asp Tyr Ala Tyr Thr 65 70 75 80 • Thr Pro Asp Ser Glu Met Ile Thr Gin His Met Arg His Ile Thr Ala 85 90 95

Leu Cys Arg Thr Arg Phe Glu Leu Pro Pro Asp Ser Leu Vai Vai Glu 100 105 110

Leu Gly Ser Asn Thr Gly Arg Gin Leu Met Ala Phe Arg Glu Ala Gly 115 120 125 107055 45

Met Arg Thr Leu Gly Val Asp Pro Ala Arg Asn Leu Thr Asp Val Ala 130 135 140

Arg Arg Asn Gly lie Glu Thr Phe Pro Asp Phe Phe Ser His Asp Val 145 150 155 160

Ala Arg Thr lie Arg Arg Asp His Gly Gin Ala Arg Leu Val Leu Gly 165 170 175

Arg His Val Phe Ala His lie Asp Asp Val Ser Asp lie Ala Ala Gly 180 185 190

Val Arg Glu Leu Leu Ser Pro Asp Gly Val Phe Ala lie Glu Val Pro 195 200 205

Tyr Val Leu Asp Leu Leu Glu Lys Val Ala Phe Asp Thr lie Tyr His 210 215 220

Glu His Leu Ser Tyr Phe Thr Met Arg Ser Phe Val Thr Leu Phe Ala 225 230 235 240

Arg His Gly Leu Arg Val Leu Asp Val Glu Arg Phe Gly Val His Gly 245 250 255

Gly Ser Val Leu Val Phe Val Gly His Glu Asp Gly Pro Trp Pro Glu 260 265 270

Arg Pro Ser Val Pro Glu Leu Leu Arg Val Glu Arg Gin Arg Gly Leu 275 280 285

Tyr Asp Asp Ala Thr Tyr Arg Thr Phe Ala Gin Arg He Glu Arg Val 290 295 300

Arg Thr Glu Leu Pro Glu Leu Leu Arg Ser Leu Val Ala Gin Gly Lys 305 310 315 320 . Arg He Val Gly Tyr Gly Ala Pro Ala Lys Gly Asn Thr He Leu Thr • 325 330 335

Val Cys Gly Leu Gly Leu Lys Glu Leu Glu Tyr Cys Thr Asp Thr Thr 340 345 350

Glu Leu Lys Gin Gly Arg Val Leu Pro Gly Thr His He Pro Val His 355 360 365 i Ala Pro Glu His Ala Lys Glu His He Pro Asp Tyr Tyr Leu Leu Leu 370 375 380

Ala Trp Asn Tyr Ala Thr Glu He Leu Asp Lys Glu Thr Ala Phe Arg 385 390 395 400

Asp Asn Gly Gly Arg Phe He Val Pro He Pro Arg Pro Ser He Leu 405 410 415 107053 46

Thr Ser Pro Ser Gly Ser 420

(2) SEQ ID NO: 8:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 291 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= ”snogC:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 8:

Met Leu Ala Arg His Leu Thr Ala Ala Leu Ala Glu Thr Gly Arg Ser 15 10 15

Arg Pro Ala Ala Glu Ala Vai Vai Leu Gly Arg Arg Ala Leu Asp Ile 20 25 30

Thr Asp Gly Arg Ala Vai Asp Ala Ala Phe Ala Ala His Arg Pro Arg 35 40 45

Vai Vai Vai Asn Cys Ala Ala Phe Thr Asp Vai Asp Gly Ala Glu Ser 50 55 60

Arg Trp Ala Glu Ala Met Arg Vai Asn Gly Gly Gly Pro Arg Leu Leu 65 70 75 80

Ala Arg Arg Cys Ala Arg His Gly Vai Arg Leu Ile His Vai Ser Thr 85 90 95

Asp Tyr Vai Phe Pro Gly Asp Thr Arg Ser Pro Tyr Gly Glu Ser Asp . 100 105 110

Ala Pro Gly Pro Arg Thr Vai Tyr Gly Arg Ser Lys Leu Ala Gly Glu 115 120 125

Arg Ala Vai Leu Ser Leu Leu Pro Asp Thr Gly Thr Vai Vai Arg Thr 130 135 140

Ala Trp Leu Tyr Gly Gly Gin Gly Arg Ser Phe Vai Arg Thr Met Leu 145 150 155 160

Glu Arg Ala Pro Asp Asp Gly His Vai Asp Vai Vai Asn Asp Gin Trp 165 170 175

Gly Gin Pro Thr Trp Ala Gly Asp Vai Ala Arg Leu Leu Vai Thr Leu 180 185 190

Ala Arg Thr Pro Pro Asp Arg Ala Arg Gly Ile Phe His Ala Thr Asn 195 200 205 107053 47

Ala Gly Ala Ala Thr Trp Tyr Glu Leu Ala Arg Glu Vai Phe Arg Leu 210 215 220

Ala Gly Ala Asp Pro Glu Arg Vai Arg Pro Vai Ala Thr Ala Asp Arg 225 230 235 240

Pro Gly Pro Ala Pro Arg Pro Ala Cys Thr Vai Leu Gly His Asp Arg 245 250 255

Trp Arg Leu Vai Gly Vai Ala Pro Pro Arg Asp Trp Arg Ala Ala Leu 260 265 270

Arg Glu Ala Met Arg Gin Leu Leu Pro Gly Gly Arg Leu Arg Asn Leu 275 280 285

Thr Gly Thr 290

(2) SEQ ID NO: 9:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 350 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogK:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 9:

Met Ala Ser His Thr Ser Ala Thr Thr Asp Vai Asn Ile Leu Vai Thr 1 5 10 15

Gly Ala Vai Gly Phe Ile Gly Ser Ala Tyr Vai Arg Met Leu Leu Glu . 20 25 30

Asn Arg Ala Pro Gly Ala Gly Ala Pro Ala Vai Arg Vai Thr Vai Leu 35 40 45

Asp Lys Leu Thr Tyr Ala Gly Asn Leu Thr Asn Leu Asp Ala Vai Arg 50 55 60

Gly Asp Arg Leu Arg Phe Vai Arg Gly Asp Ile Leu Asp Ala Glu Leu . 65 70 75 80

Vai Asp Glu Leu Met Ala His Ser Asp Gin Vai Vai His Phe Ala Ala 85 90 95

Glu Ser His Vai Asp Arg Ser Ile Arg Ala Ala Asp Asp Phe Vai Leu 100 105 110

Thr Asn Vai Vai Gly Thr Gin Arg Leu Leu Asp Ala Ala Leu Arg His 115 120 125 107053 48

Gly Vai Glu Pro Phe Val Leu Vai Ser Thr Asp Glu Val Tyr Gly Ser 130 135 140 lie Ala Ser Gly Ser Trp Pro Glu Glu His Pro Leu Ser Pro Asn Ser 145 150 155 160

Pro'Tyr Ala Ala Ser Lys Ala Ser Ala Asp Leu Met Ala Phe Ala Cys 165 170 175

His Arg Thr His Gly Leu Asp Val Arg Val Thr Arg Cys Ser Asn Asn 180 185 190

Tyr Gly Pro Arg Gin His Pro Glu Lys Leu lie Pro Arg Phe Val Thr 195 200 205

Asn Leu Leu Asp Gly Leu Pro Val Pro Leu Tyr Gly Asp Gly Arg Asn 210 215 220

Val Arg Glu Trp Leu His Val Glu Asp His Cys Arg Gly Val Asp Leu 225 230 235 240

Val Arg Thr Ala Gly Arg Pro Gly Gly Val Tyr His He Gly Gly Gly 245 250 255

Arg Glu Leu Ser Asn Arg Glu Leu Val Gly Met Leu Leu Glu Leu Cys 260 265 270

Gly Ala Asp Trp Ser Ser Val Arg His Val Pro Asp Arg Lys Gly His 275 280 285

Asp Leu Arg Tyr Ser Leu Asp Trp Gly Arg Ala Arg Glu Glu Leu Gly 290 295 300

Tyr Arg Pro Ala Arg Glu Phe Ser Ser Gly Leu Arg Ser Thr Val Gin 305 310 315 320 -, -- Trp Tyr Arg Glu Asn Arg Ser Trp Trp Glu Pro Leu Lys Arg Gly Val 325 330 335

Thr Ala Pro Gly Gly Thr Ser Thr Val Val Pro Gly Val Arg 340 345 350

(2) SEQ ID NO: 10:N TIEDOT

(i) SEKVENSSIN TIEDOT: ] ' (A) PITUUS: 134 aminohappoa V. (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoaL:n translaatiotuote" 107053 49 (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 10:

Met Vai Ser Ala Phe Asn Thr Gly Arg Thr Asp Asp Val Asp Glu Tyr 15 10 15 lie His Pro Asp iyr Leu Asn Pro Ala Thr Leu Glu His Gly lie His 20 25 30

Thr Gly Pro Lys Ala Phe Ala Gin Leu Val Gly Trp Val Arg Ala Thr 35 40 45

Phe Ser Glu Glu Ala Arg Leu Glu Glu Val Arg lie Glu Glu Arg Gly 50 55 60

Pro Trp Val Lys Ala Tyr Leu Val Leu Tyr Gly Arg His Val Gly Arg 65 70 75 80

Leu Val Gly Met Pro Pro Thr Asp Arg Arg Phe Ser Gly Glu Gin Val 85 90 95

His Leu Met Arg lie Val Asp Gly Lys lie Arg Asp His Arg Asp Trp 100 105 110

Pro Asp Phe Gin Gly Thr Leu Arg Gin Leu Gly Asp Pro Trp Pro Asp 115 120 125

Asp Glu Gly Trp Arg Pro 130

(2) SEQ ID NO: 11:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 235 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen *:(ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoKm translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 11:

Met Pro Asp Pro Gly Gly Pro Thr Thr Ala Glu Asn Leu Ser Lys Glu 15 10 15 : Ala Vai Arg Phe Tyr Arg Glu Gin Gly Tyr Vai His Ile Pro Arg Vai 20 25 30

Leu Ser Glu Thr Glu Vai Thr Ala Phe Arg Ala Ala Cys Glu Glu Vai 35 40 45

Leu Glu Lys Glu Gly Arg Glu Ile Ser Gly Ile Ala Leu Arg Leu Ala 50 55 60 107053 50

Gly Ala Pro Leu Arg Val Tyr Ser Ser Asp lie Leu Val Lys Glu Pro 65 70 75 80

Lys Arg Thr Leu Pro Thr Leu Val His Asp Asp Glu Thr Gly Leu Pro 85 90 95

Leu Asn Glu Leu Ser Ala Thr Leu Thr Ala Trp lie Ala Leu Thr Asp 100 105 110

Val Pro Val Glu Arg Gly Cys Met Ser Tyr Val Pro Gly Ser His Leu 115 120 125

Arg Ala Arg Glu Asp Arg Gin Glu His Met Thr Ser Phe Ala Glu Phe 130 135 140

Arg Asp Leu Ala Asp Val Trp Pro Asp Tyr Pro Trp Gin Pro Arg Val 145 150 155 160

Ala Val Pro Val Arg Ala Gly Asp Val Val Phe His His Cys Arg Thr 165 170 175

Val His Met Ala Glu Ala Asn Thr Ser Asp Ser Val Arg Met Ala His 180 185 190

Gly Val Val Tyr Met Asp Ala Asp Ala Thr Tyr Arg Pro Gly Val Gin 195 200 205

Asp Gly His Leu Ser Arg Leu Ser Pro Gly Asp Pro Leu Glu Gly Glu 210 215 220

Leu Phe Pro Leu Val Thr Ala Gly Thr Arg Gin 225 230 235

(2) SEQ ID NO: 12:N TIEDOT

(i) SEKVENSSIN TIEDOT: t (A) PITUUS: 390 aminohappoa • (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogD:n translaatiotuote" . (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 12: • .

Met Arg Vai Pro Gly Ser Cys Arg Thr Gly Gly Ile Met Arg Ala Leu 15 10 15

Phe Ile Thr Ser Pro Gly Leu Ser His Ile Leu Pro Thr Vai Pro Leu 20 25 30

Ala Gin Ala Leu Arg Ala Leu Gly His Glu Vai Arg Tyr Ala Thr Gly 35 40 45 107053 51

Gly Asp Ile Arg Ala Vai Ala Glu Ala Gly Leu Cys Ala Vai Asp Vai 50 55 60

Ser Pro Gly Vai Asn Tyr Ala Lys Leu Phe Vai Pro Asp Asp Thr Asp 65 70 75 80

Vai Thr Asp Pro Met His Ser Glu Gly Leu Gly Glu Gly Phe Phe Ala 85 90 95

Glu Met Phe Ala Arg Vai Ser Ala Vai Ala Vai Asp Gly Ala Leu Arg 100 105 110

Thr Ala Arg Ser Trp Arg Pro Asp Leu Vai Vai His Thr Pro Thr Gin 115 120 125

Gly Ala Gly Pro Leu Thr Ala Ala Ala Leu Gin Leu Pro Cys Vai Glu 130 135 140

Leu Pro Leu Gly Pro Ala Asp Ser Glu Pro Gly Leu Gly Ala Leu Ile 145 150 155 160

Arg Arg Ala Met Ser Lys Asp Tyr Glu Arg His Gly Vai Thr Gly Glu 165 170 175

Pro Thr Gly Ser Vai Arg Leu Thr Thr Thr Pro Pro Ser Vai Glu Ala 180 185 190

Leu Leu Pro Glu Asp Arg Arg Ser Pro Gly Ala Trp Pro Met Arg Tyr 195 200 205

Vai Pro Tyr Asn Gly Gly Ala Vai Leu Pro Asp Trp Leu Pro Pro Ala 210 215 220

Ala Gly Arg Arg Arg Ile Ala Vai Thr Leu Gly Ser Ile Asp Ala Leu 225 230 235 240

Ser Gly Gly Ile Ala Lys Leu Ala Pro Leu Phe Ser Glu Vai Ala Asp ' 245 250 255

Vai Asp Ala Glu Phe Vai Leu Thr Leu Gly Gly Gly Asp Leu Ala Leu 260 265 270

Leu Gly Glu Leu Pro Ala Asn Vai Pro Vai Vai Glu Trp Ile Pro Leu 275 280 285

Gly Ala Leu Leu Glu Thr Cys Asp Ala Ile Ile His His Gly Gly Ser 290 295 300

Gly Thr Leu Leu Thr Ala Leu Ala Ala Gly Vai Pro Gin Cys Vai Ile 305 310 315 320

Pro His Gly Ser Tyr Gin Asp Thr Asn Arg Asp Vai Leu Thr Gly Leu 325 330 335 « « 107053 52

Gly Ile Gly Phe Asp Ala Glu Ala Gly Ser Leu Gly Ala Glu Gin Cys 340 345 350

Arg Arg Leu Leu Asp Asp Ala Gly Leu Arg Glu Ala Ala Leu Arg val 355 360 365

Arg Gin Glu Met Ser Glu Met Pro Pro Pro Ala Glu Thr Ala Ala Lys 370 375 380

Leu Val Ala Leu Ala Gly 385 390

(2) SEQ ID NO: 13:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 275 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoW:n translaatiotuote" <xi) SEKVENSSIN KUVAUS: SEQ ID NO: 13:

Met Thr Vai Leu Vai Thr Gly Ala Thr Gly Asn Vai Gly Arg His Vai 15 10 15

Vai Thr Gly Leu Leu Ala Ala Gly Arg Arg Vai Arg Ala Leu Thr Arg 20 25 30

Thr Pro Asp Arg Ser Gly Leu Pro Gly Gly Ala Glu Ile Thr Gly Gly 35 40 45

Asp Leu Thr Arg Pro Glu Thr Tyr Glu Arg Met Leu Asp Gly Vai Glu 50 55 60

Ala Vai Tyr Leu Phe Pro Vai Pro Glu Thr Ala Ala Ala Phe Ala Gly 65 70 75 80

Ala Ala Arg Arg Ala Gly Vai Arg Arg Ile Vai Vai Leu Ser Ser Asp 85 90 95

Ser Vai Thr Asp Gly Thr Asp Thr Gly Gly His Arg Arg Vai Glu Leu 100 105 110

Ala Vai Glu Asp Thr Gly Leu Glu Trp Thr His Vai Arg Pro Gly Glu 115 120 125

Phe Ala Leu Asn Lys Vai Thr Leu Trp Ala Pro Ser Ile Arg Ala Glu 130 135 140

Gly Vai Vai Arg Ser Ala Tyr Pro Asp Ala Arg Vai Ala Pro Vai His . 145 150 155 160 107053 53

Glu Ala Asp Vai Ala Ala Vai Ala Vai Thr Ala Leu Leu Lys Glu Gly 165 170 175

His Ala Gly Arg Ala Tyr Ser Vai Thr Gly Pro Gin Ala Leu Thr Gin 180 185 190

Arg Glu Gin Vai Arg Ala Vai Gly Glu Gly Leu Gly Arg Ser Leu Ala 195 200 205

Phe Vai Glu Vai Thr Pro Gly Gin Ala Arg Ala Asp Leu Thr Ala Gin 210 215 220

Gly Leu Pro Ala Pro Ile Ala Asp Tyr Vai Leu Ala Phe Gin Ala Gly 225 230 235 240

Trp Thr Glu Arg Pro Ala Pro Ala Arg Pro Thr Vai Arg Glu Vai Thr 245 250 255

Gly Arg Pro Ala Arg Thr Leu Ala Gin Trp Ala Ala Asp His Arg Ala 260 265 270

Asp Phe Arg 275

(2) SEQ ID NO: 14:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: over 424 aminohappoa (B) tyyppi: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen <ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snogE:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 14: • t

Vai Arg Vai Leu Leu Thr Ser Phe Ala Met Asp Ala His Phe Cys Thr 15 10 15

Ala Vai Pro Leu Ala Trp Ala Leu Arg Ser Ala Gly His Glu Vai Arg 20 25 30

Vai Ala Gly Gin Pro Ala Leu Thr Ser Thr Ile Thr Gly Ala Gly Leu 35 40 45

Thr Ala Vai Pro Vai Gly Arg Asp His Thr His Gly Ser Leu Leu Gly 50 55 60

Arg Vai Gly Ser Asp Ile Leu Ala Leu His Asp Glu Ala Asp Tyr Leu ' 65 70 75 80

Glu Ala Arg His Asp Ala Leu Gly Phe Glu Phe Leu Lys Gly His Asn : 85 90 95

10705S

54

Thr Vai Met Ser Ala Leu Phe Tyr Ser Gin lie Asn Asn Asp Ser Met 100 105 110

Val Asp Asp Leu Val Asp Phe Ala Arg His Trp Arg Pro Asp Leu Val 115 120 125

Val Trp Glu Pro Phe Thr Phe Ala Gly Ala Val Ala Ala Arg Ala Ser 130 135 140

Gly Ala Ala His Ala Arg Leu Leu Ser Phe Pro Asp Leu Phe Leu Ser 145 150 155 160

Thr Arg Arg Leu Phe Leu Glu Arg Met Ala Arg Gin Glu Pro Glu His 165 170 175

His Asp Asp Thr Leu Ala Glu Trp Leu Asp Trp Thr Leu Gly Arg His 180 185 190

Gly His Ser Phe Asp Glu Glu lie Val Thr Gly Gin Trp Ser lie Asp 195 200 205

Gin Thr Pro Ala Pro Val Arg Leu Asp Ala Gly Gly Pro Thr Val Pro 210 215 220

Met Arg Tyr Val Pro Tyr Ser Gly Leu Val Pro Thr Val Val Pro Asp 225 230 235 240

Trp Leu Arg Arg Pro Pro Glu Arg Pro Arg Val Leu Val Thr Leu Gly 245 250 255 lie Thr Ser Arg Arg Val Lys Ser Phe Leu Ala Val Ser Val Asp Asp 260 265 270

Leu Phe Glu Ala Val Ala Gly Leu Gly Val Glu Val Val Ala Thr Leu 275 280 285

Asp Ala Asp Gin Arg Glu Leu Leu Gly Arg Val Pro Asp His Phe Arg 290 295 300 lie Val Glu His Val Pro Leu Asp Ala Val Leu Pro Thr Cys Ser Ala 305 310 315 320 lie Val His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Ala Val Tyr 325 330 335

Gly Val Pro Gin Val Ser Leu Gly Ser Met Trp Asp His Phe Tyr Arg . 340 345 350

Ala Arg Arg Leu Glu Glu Leu Gly Ala Gly Leu Arg Leu Pro Ser Gly 355 360 365

Glu Leu Thr Ala Glu Gly Leu Arg Thr Arg Leu Glu Arg Val Leu Gly 370 375 380 55 10705ό

Glu Pro Ser Phe Gly Thr Ala Ala Gin Ala Leu Ser Asp Thr lie Ala 385 390 395 400

Ala Glu Pro Ser Pro Ser Glu Vai Val Pro Val Leu Glu Glu Leu Thr 405 410 415

Gly Arg His Arg Pro Gly Thr Arg 420

(2) SEQ ID NO: 15:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 139 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoL:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 15:

Met Ser Thr Thr Ala Asn Lys Glu Arg Cys Leu Glu Met Vai Ala Ala 15 10 15

Trp Asn Arg Trp Asp Vai Ser Gly Vai Vai Ala His Trp Ala Pro Asp 20 25 30

Vai Vai His Tyr Asp Asp Glu Asp Lys Pro Vai Ser Ala Glu Glu Vai 35 40 45

Vai Arg Arg Met Asn Ser Ala Vai Glu Ala Phe Pro Asp Leu Arg Leu 50 55 60

Asp Vai Arg Ser Ile Vai Gly Glu Gly Asp Arg Vai Met Leu Arg Ile 65 70 75 80

Thr Cys Ser Ala Thr His Gin Gly Vai Phe Met Gly Ile Ala Pro Thr 85 90 95

Gly Arg Lys Vai Arg Trp Thr Tyr Leu Glu Glu Leu Arg Phe Ser Glu 100 105 110

Ala Gly Lys Vai Vai Glu His Trp Asp Vai Phe Asn Phe Ser Pro Leu 115 120 125

Phe Arg Asp Leu Gly Vai Vai Pro Asp Gly Leu 130 ' 135

(2) SEQ ID NO: 16:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 155 aminohappoa . (B) TYYPPI: aminohappo 107053 56 (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MOOT TIEDOT: /huom.= "snoO:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 16:

Met Ser Val Arg Thr Asp Gin Thr Ala Ala Pro Glu Asp Arg Ala Ala 15 10 15

Ala Thr Asp Pro Gly Phe Gly His Leu Tyr Ala Gin Val Gin Gin Phe 20 25 30

Tyr Ala Arg Gin Met Gin Leu Leu Asp Ser Gly Ala Ala Glu Glu Trp 35 40 45

Ala Ala Thr Phe Thr Glu Asp Gly Thr Phe Ala Arg Pro Ser Ser Pro 50 55 60

Glu Pro Ala Arg Gly His Ala Glu Leu Ala Ala Gly Ala Arg Ala Ala 65 70 75 80

Ala Glu Arg Leu Ala Ala Glu Gly Leu Ser His Arg His Val lie Gly 85 90 95

Met Thr Ala Val Arg Arg Glu Pro Asp Gly Ser Val Phe Val Arg Ser 100 105 110

Tyr Ala Gin Val Phe Ala Thr Arg Arg Gly Glu Ala Pro Arg Leu His 115 120 125

Leu lie Cys Val Cys Glu Asp Val Leu Val Arg Glu Gly Pro Gly Leu 130 135 140

Lys Val Arg Glu Arg Val Val Thr His Asp Ala .

; ' 145 150 155

(2) SEQ ID NO: 17:N TIEDOT

(i) SEKVENSSIN TIEDOT: (A) PITUUS: 281 aminohappoa (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoaF:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 17:

Vai Arg Ala Met Thr Asp Ser Thr Gly Pro Arg Pro Vai Pro Ala Met : 1 5 10 15 « 107053 57

Ser Pro Ala Pro Ser Pro Thr Pro Ser Pro Gly Pro Ala Pro Gly Ser 20 25 30

Glu Pro Ala Pro Leu Ala Vai Ile Val Thr Gly Gly Gly Ser Gly lie 35 40 45

Gly Arg Ala Thr Ala Arg Ala Phe Ala Ala Gin Gly Ala Lys Val Leu 50 55 60

Val Val Gly Arg Thr Glu Asp Ala Leu Ala Gin Thr Ala Glu Gly Cys 65 70 75 80

Ala Asp Met Arg Val Leu Val Ala Asp Val Ala Ser Pro Asp Gly Pro 85 90 95

Gin Ala Val Val Asn Ala Ala Leu Arg Glu Phe Gly Arg lie Asp Val 100 105 110

Leu Val Asn Asn Ala Ala Val Ala Gly Met Glu Thr Leu Gin Thr Val 115 120 125

Asp Arg Asp Ala Val Ala Arg Gin Phe Gly Thr Asn Leu Thr Ala Pro 130 135 140

Leu Phe Leu Val Gin Ser Ala Leu Gly Ala Leu Glu Lys Ser Arg Gly 145 150 155 160 lie Val Val Asn Val Gly Thr Ala Ala Thr Leu Gly Leu Arg Ala Ala 165 170 175

Pro Thr Gly Ala Leu Tyr Gly Ala Ser Lys Val Ala Leu Asp Tyr Leu 180 185 190

Thr Arg Thr Trp Ala Val Glu Leu Ala Pro Arg Gly lie Arg Val Val 195 200 205

Gly Val Ala Pro Gly Val lie Asp Thr Gly lie Gly Val Arg Met Gly i : - - 210 215 220

Met Thr Pro Glu Gly Tyr Arg Glu Phe Leu Thr Gly Met Gly Gly Arg 225 230 235 240

Val Pro Val Gly Arg Val Gly Arg Pro Glu Asp Val Ala Trp Trp lie 245 250 255

Val Gin Leu Ala Arg Pro Glu Ala Gly Tyr Ala Thr Gly Met Val Val 260 265 270

Pro Val Asp Gly Gly Leu Ser Leu Val 275 280

(2) SEQ ID NO: 18:N TIEDOT

(i) SEKVENSSIN TIEDOT: , (A) PITUUS: 190 aminohappoa 107053 58 (B) TYYPPI: aminohappo (C) JUOSTEISUUS: yksijuosteinen (D) TOPOLOGIA: lineaarinen (ii) MOLEKYYLITYYPPI: peptidi (D) MUUT TIEDOT: /huom.= "snoN:n translaatiotuote" (xi) SEKVENSSIN KUVAUS: SEQ ID NO: 18:

Vai Gin Glu Thr Glu Pro Gly Vai Pro Ala Asp Leu Pro Ala Glu Ser 15 10 15

Asp Pro Ala Ala Leu Glu Arg Leu Ala Ala Arg Tyr Arg Arg Asp Gly 20 25 30

Tyr Vai His Vai Pro Gly Vai Leu Asp Ala Gly Glu Vai Ala Glu Tyr 35 40 45

Leu Ala Glu Ala Arg Arg Leu Leu Ala His Glu Glu Ser Vai Arg Trp 50 55 60

Gly Ser Gly Ala Gly Thr Vai Met Asp Tyr Vai Ala Asp Ala Gin Leu 65 70 75 80

Gly Ser Asp Thr Met Arg Arg Leu Ala Thr His Pro Arg Ile Ala Ala 85 90 95

Leu Ala Glu Tyr Leu Ala Gly Ser Pro Leu Arg Leu Phe Lys Leu Glu 100 105 110

Vai Leu Leu Lys Glu Asn Lys Glu Lys Asp Ala Ser Vai Pro Thr Ala 115 120 125

Pro His His Asp Ala Phe Ala Phe Pro Phe Ser Thr Ala Gly Thr Ala 130 135 140 • - Leu Thr Ala Trp Vai Ala Leu Vai Asp Vai Pro Vai Glu Arg Gly Cys 145 150 155 160

Met Thr Phe Vai Pro Gly Ser His Leu Leu Pro Asp Pro Asp Thr Gly 165 170 175

Asp Glu Pro Trp Ala Gly Ala Phe Thr Arg Pro Gly Glu Ile 180 185 190

Claims

107053

1. Isolerat och renat DNA-fragment, som är en gengruppering, som hänför sig tili antracyklinbiosyntesvägen av bakterien Streptomyces nogaloter, vilken gruppering inkluderas i success iva lOkb och 7kb BgUl fragment av S. nogalater, säsom är angivet i fig. 2.

1. Eristettyjä puhdistettu DNA-fragmentti, joka on Streptomyces nogalater -bakteerin antrasykliinin biosynteesireittiin liittyvä geeniryhmittymä, joka sisältyy S. nogalaterin 5 genomin peräkkäisiin lOkb ja 7kb Bglil fragmentteihin, kuten kuvassa 2 on esitetty.

2. DNA-fragment enligt patentkravet 1, som innehäller en nukleotidsekvens angiven i SEQ ID NO:l eller en sekvens, som har ätminstone 80%:ig homologi med avseende pä nämnda sekvens.

2. Patenttivaatimuksen 1 mukainen DNA-fragmentti, joka sisältää SEQ ID NO:l:ssa esitetyn nukleotidisekvenssin tai sekvenssin, jolla on ainakin 80% :n homologia mainittuun sekvenssiin nähden. 10

3. Hybrid-DNA, som innehäller ett DNA-fragment enligt patentkravet 1 eller 2, 30 klonat i en plasmid som replikeras i Streptomyces. 107053

3. Yhdistelmä-DNA, joka sisältää patenttivaatimuksen 1 tai 2 mukaisen DNA-fragmentin, kloonattuna Streptomycesissä replikoitavaan plasmidiin.

4. Hybrid-DNA enligt patentkravet 3, som är plasmid pSY15c, som innehäller ett 1,4 kb ZtomHI-Sad-fragment ur plasmiden pSY42 och ett 1,1 kb A/M-K/wI-fragment ur plasmiden pSY43.

4. Patenttivaatimuksen 3 mukainen yhdistelmä-DNA, joka on plasmidi pSY15c, joka 15 sisältää 1,4 kb SarnHI-ÄccI-fragmentin plasmidista pSY42 ja 1,1 kb Mlul-Kpnl- fragmentin plasmidista pSY43.

5. Plasmiden pSY42, som deponerats i S. lividans-atammen TK24/pSY42 med deponeringsnumret DSM 12451.

5. Plasmidi pSY42, joka on talletettu S. lividans -kannassa TK24/pSY42 talletusnu-merolla DSM 12451. 20

6. Plasmiden pSY43, som deponerats i S. lividans-stammen TK24/pSY43 med deponeringsnumret DSM 12452. 10

6. Plasmidi pSY43, joka on talletettu S. lividans -kannassa TK24/pSY43 talletusnu-merolla DSM 12452.

7. Förfarande for att ffamställa hybridföreningar, kännetecknat därav, att ett DNA-fragment enligt patentkravet 1 eller 2 transformeras in i en Streptomyces-värd, den erhällna hybridstammen odlas och de bildade föreningarna isoleras. 15 8. Förfarande enligt patentkravet 7, kännetecknat därav, att Streptomyces-värden är en Streptomyces galilaeus-väid.

7. Menetelmä hybridiyhdisteiden valmistamiseksi, tunnettu siitä, että patenttivaati-25 muksen 1 tai 2 mukainen DNA-fragmentti siirretään Äreptomyces-isäntään, viljellään saatua yhdistelmäkantaa ja eristetään syntyneet yhdisteet.

8. Patenttivaatimuksen 7 mukainen menetelmä, tunnettu siitä, että Streptomyces-isäntä on Streptomyces galilaeus -isäntä. 30 , · 107055

9. Förfarande enligt patentkravet 8, kännetecknat därav, att Streptomyces galilaeus-värden är en av stammarna H026, H039, H063 eller H075, vilka är mutantstammar 20 av S. galilaeus ATCC 31615. • «'· 1 « 1 · *

9. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että Streptomyces galilaeus -isäntä on jokin kannoista H026, H039, H063 tai H075, jotka ovat S. galilaeus ATCC 31615:n mutanttikantoja.

10 OH O OH Oli

10. Förfarande enligt patentkravet 8, kännetecknat därav, att man producerar en antracyklin, som har följande formel I 25. cooch3 in 0 011 9 (I>

30 Me-^7~° / ηο^η X oh 107053

10. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että tuotetaan antrasykliiniä, jolla on seuraava kaava I O COOCH3 Ah 0 0H <? (I) Me-7~° 7 OH 15

11. Förfarande enligt patentkravet 8, kännetecknat därav, att man producerar en antracyklinon, sora har följande formel II 5 O CÖOCIlj (P)

11. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että tuotetaan antrasyklinonia, jolla on seuraava kaava II

20. COOCH3 .. Il ATm· OH O OH ÖH 25 107053

12. Förfarande för att framställa hybridföreningar, kännetecknat därav, att man 15 transformerar ätminstone an av generna snogi, snogA, snoaM, snogN, snoaG, snogC, snogK, snoah, snoK., snogD, snoW, snogE, snoL, snoO och i«oaF in i en Strepto-myces-värd, vilka gener härstammar frän ett DNA-fragment enligt patentkravet 1 eller 2, odlar den erhällna hybridstammen och isolerar de bildade föreningarna. 20 13. Förfarande enligt patentkravet 12, kännetecknat därav, att man transformerar in i ... Streptomyces-värden snoäL, som kodar för NAME-cyklas. • « • i

12. Menetelmä hybridiyhdisteiden valmistamiseksi, tunnettu siitä, että siirretään ainakin yksi geeneistä snog], snogA, snoaM, snogN, snoaG, snogC, snogK, snoaL, snoK, snogO, snoW, snogE, snoL, snoO ja inoaF Streptomyces-ismtääa, jotka geenit ovat peräisin patenttivaatimuksen 1 tai 2 mukaisesta DNA-ffagmentista, viljellään 5 saatua yhdistelmäkantaa ja eristetään syntyneet yhdisteet.

13. Patenttivaatimuksen 12 mukainen menetelmä, tunnettu siitä, että Streptomyces-isäntään siirretään snoaL, joka koodaa NAME-syklaasia.

14. Förfarande enligt patentkravet 12, kännetecknat därav, att man transformerar in i Streptomyces-väidtn ätminstone en av generna snogD och snogE, som kodar för 25 glycosyltransferaser.

14. Patenttivaatimuksen 12 mukainen menetelmä, tunnettu siitä, että Streptomyces- isäntään siirretään ainakin toinen geeneistä snogL and snogE, jotka koodaavat glykosyylitransferaaseja.

15. Patenttivaatimuksen 12 mukainen menetelmä, tunnettu siitä, että Streptomyces-15 isäntään siirretään ainakin yksi geeneistä snogJ, snogN, snogC, snogK ja snogK, jotka vaikuttavat nogalamiinin ja nogaloosin muodostumiseen.

15. Förfarande enligt patentkravet 12, kännetecknat därav, att man transformerar in i Streptomyces-väidtn ätminstone en av generna snogi, snogN, snogC, snogK och snogA, som inverkar pä bildning av nogalamin och nogalos. 30 • r «