PL202457B1

PL202457B1 - Polinukleotyd przyspieszający biosyntezę ML-236B, wektor, komórka gospodarza transformowana tym wektorem, polipeptyd, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny

Info

Publication number: PL202457B1
Application number: PL347118A
Authority: PL
Inventors: Hiroji Yoshikawa; Yuki Abe; Chiho Ono
Original assignee: Sankyo Co
Priority date: 2000-04-18
Filing date: 2001-04-18
Publication date: 2009-06-30
Also published as: MXPA01003913A; CZ20011367A3; PT1149919E; DE60130394D1; CN1325959A; RU2236463C2; EP1149919B1; US20030078395A1; EP1149919A2; ES2293966T3; CN1325959B; HK1037683A1; TWI312807B; HUP0101569A2; KR100632174B1; KR20010098713A; NZ511166A; HU0101569D0; HUP0101569A3; AU3709201A

Abstract

Przedmiotem wynalazku jest polinukleotyd odpowiedni do stosowania w przyspieszaniu biosyn- tezy ML-236B oraz polipeptyd kodowany przez ten polinukleotyd, wektor z w laczonym takim polinu- kleotydem, komórka gospodarza transformowana tym wektorem oraz sposób wytwarzania ML-236B przy zastosowaniu tego polinukleotydu i sposób wytwarzania prawastatyny. Wynalazek ma na celu przeprowadzenie pe lnej analizy molekularno-biologicznej biosyntezy ML-236B i reguluj acych j a czyn- ników oraz dostarczenie polinukleotydu, który przy spiesza biosyntez e inhibitora reduktazy HMG-CoA, ML-236B. PL PL PL PL

Description

Przedmiotem wynalazku jest polinukleotyd przyspieszający biosyntezę ML-236B i polipeptyd kodowany przez ten polinukleotyd, wektor zawierający ten polinukleotyd, komórka gospodarza transformowana tym wektorem, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny.

Bardziej szczegółowo wynalazek dotyczy polinukleotydu takiego jak DNA, który przyspiesza biosyntezę inhibitora reduktazy HMG-CoA, ML-236B, w mikroorganizmie produkującym ML-236B gdy jest on wprowadzony do organizmu produkującego ML-236B.

Prawastatyna jest inhibitorem reduktazy HMG-CoA. Prawastatyna sodowa jest stosowana do leczenia hiperlipemii lub hiperlipidemii i ma korzystne działanie farmakologiczne polegające na obniżaniu cholesterolu w surowicy. Prawastatyna może być uzyskana stosując Streptomyces carbophilus poprzez konwersję przez mikroorganizmy ML-236B produkowanego przez Penicillium citrinum [opisane w Endo, A. i wsp., J. Antibiot.,29 1346(1976): Matsuoka, T. i wsp., Eur. J. Biochem., 184, 707 (1989), i w Publikacji Japońskiego Zgłoszenia Patentowego Nr 57-2240].

Wykazano, że zarówno ML-236B, prekursor prawastatyny oraz lowastatyna, inhibitor reduktazy HMG-CoA, mają wspólną strukturę częściową. Są one syntetyzowane biologicznie poprzez poliketydy [opisane w Moore, R.N. i wsp., J.Am.Chem.Soc,107, 3694(1985); Shiao, M.i Don, H.S., Proc. Natl. Sci. Counc. Repub. China B, 11, 223(1987)].

Poliketydy są związkami pochodzącymi z łańcuchów węgla β-keto, które są wynikiem ciągłej reakcji kondensacji kwasów karboksylowych o niskiej masie cząsteczkowej takich jak kwas octowy, kwas propionowy, kwas masłowy lub podobne. Można wywieść różne struktury w zależności od szlaku kondensacji lub redukcji każdej z grup węgla β-keto karbonylowych [opisane w Hopwood, D.A. i Sherman, D.H., Annu. Rev.Genet., 24, 37-66 (1990); Hutchinson, C. R. i Fujii, I., Annu. Rev. Microbiol., 49, 201-238(1995)].

Syntazy poliketydów (dalej określane jako PKS), które biorą udział w syntezie poliketydów są enzymami o których wiadomo, że są obecne w grzybach nitkowatych i bakteriach. Enzymy grzybów nitkowatych badano stosując techniki biologii molekularnej [jak opisano w Feng, G.H. i Leonard, T. J., J. Bacteriol., 177, 6246 (1995); Takano, Y. i wsp. Mol. Gen. Genet. 249, 162 (1995)]. U Aspergillus terreus, który jest mikroorganizmem produkującym lowastatynę, przebadano gen PKS związany z biosyntezą lowastatyny [opisane w Międzynarodowym zgłoszeniu otwartym w Japonii (KOHYO) Nr 9-504436, i zobacz odpowiedni WO 9512661, który zastrzega DNA kodujący syntazę poliketydu triolu].

Geny związane z biosyntezą metabolitów wtórnych grzybów nitkowatych często tworzą skupienia w genomie. W szlakach biosyntezy poliketydów, wiadomo, że istnieją skupienia genów biorących udział w tym szlaku. W biosyntezie aflatoksyny, która jest poliketydem produkowanym przez Aspergillus flavus i Aspergillus parasiticus, stwierdzano, że geny kodujące białka enzymatyczne biorące udział w tej biosyntezie (takie jak PKS) tworzą strukturę skupienia. Przeprowadzono analizę genomową i porównanie genów biorących udział w biosyntezie aflatoksyny u każdego z tych mikroorganizmów [zobacz Yu, J. i wsp., Appl. Environ. Microbiol., 61, 2365 (1995)]. Doniesiono, że geny biorące udział w biosyntezie sterigmatocystyny produkowanej przez Aspergillus nidulans tworzą strukturę skupienia w około 60 kb ciągłego regionu na jego genomie [opisane w Brown, D. W. i wsp., Proc. Natl. Acad. Sci. USA, 93, 1418 (1996)].

Modulacja aktywności syntazy poliketydów przez dodatkowe białka w czasie syntezy lowastatyny była badana [zobacz Kennedy, J i wsp., Science Vol 284, 1368 (1999)].

Jednak dotychczas analiza molekularno-biologiczna biosyntezy ML-236B i regulujących ją czynników była niewystarczająca. Niniejszy wynalazek ma na celu zajęcie się tym problemem.

Zgodny z wynalazkiem jest polinukleotyd odpowiedni do stosowania w przyspieszaniu biosyntezy ML-236B, wybrany z grupy złożonej z:

(a) polinukleotydu kodującego białko mające sekwencję aminokwasów SEQ ID NO 42, (b) polinukleotydu, który zawiera sekwencję nukleotydów SEQ ID NO 41, odpowiedniego do stosowania w przyspieszaniu biosyntezy ML-236B, (c) polinukleotydu, który stanowi sekwencję nukleotydów SEQ ID NO 41, (d) polinukleotydu, który hybrydyzuje w ostrych warunkach z p-linukleotydem określonym w (a) do (c), i który jest odpowiedni do przyspieszania biosyntezy ML-236B w mikroorganizmie wytwarzającym ML-236B gdy jest wprowadzany do tego mikroorganizmu wytwarzającego ML-236B, (e) mRNA, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (d).

PL 202 457 B1

Korzystnie polinukleotyd według wynalazku zawiera DNA, który można uzyskać z transformowanej Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006) i korzystnie jest on w połączeniu funkcjonalnym z jednym lub więcej polinukleotydów, przy czym ta kombinacja jest odpowiednia do stosowania w zwiększaniu wytwarzania ML-236B w mikroorganizmie wytwarzającym ML-236B.

Szczególnie korzystnie jest on w połączeniu funkcjonalnym z polinukleotydem kodującym białko, które zawiera lub stanowi sekwencję aminokwasów wybraną z SEQ ID NO 38, 42, 44, 46, 48 lub 50 albo zawiera polinukleotyd o SEQ ID NO 41 w połączeniu z jedną lub więcej sekwencji wybranych z SEQ ID NO 37, 41, 43, 45, 47 lub 49.

W szczególnych przypadkach polinukleotyd jest DNA, genomowym DNA lub cDNA.

Zgodnym z wynalazkiem jest również wektor zawierający powyżej określony polinukleotyd, a w szczególności zawierający ponadto polinukleotyd mający sekwencję nukleotydową SEQ ID NO 37 lub jedną albo więcej sekwencji nukleotydowych wybranych z SEQ ID NO 43, 45, 47 lub 49.

Korzystnym wektorem, zgodnie z wynalazkiem, jest wektor, który nie zawiera sekwencji nukleotydowych SEQ ID NO 37, 43, 45, 47 lub 49 albo wektor, który nie zawiera sekwencji nukleotydowych SEQ ID NO 43, 45, 47 lub 49.

Wektor według wynalazku korzystnie wytwarza się z Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006) i korzystnie jest to wektor ekspresyjny.

Zgodna z wynalazkiem jest komórka gospodarza transformowana określonym powyżej wektorem, zwłaszcza komórka gospodarza, który jest mikroorganizmem wytwarzającym ML-236B, zwłaszcza pochodzącym z gatunku Penicillium, korzystnie jest to komórka Penicillium citrinum.

Korzystnie komórką gospodarza jest też komórka Escherichia coli, a zwłaszcza komórka Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).

Zgodnym z wynalazkiem jest również polipeptyd kodowany przez określony powyżej polinukleotyd, a zwłaszcza polipeptyd zawierający sekwencję SEQ ID NO 42 lub jej wariant, który ma przynajmniej 80% identyczności do SEQ ID NO 42 i który jest zdolny do przyspieszenia produkcji ML-236B w organizmie wytwarzają cym ML236B, przy czym szczególnie korzystnym polipeptydem według wynalazku jest polipeptyd mający sekwencję SEQ ID NO 42.

Sposób wytwarzania ML-236B według wynalazku polega na tym, że hoduje się komórkę gospodarza określoną powyżej i następnie odzyskuje się ML-236B z hodowli. Korzystnie komórkę gospodarza transformuje się wektorem zawierającym SEQ ID NO 41, przy czym szczególnie korzystnie wektorem, który równocześnie nie zawiera sekwencji polinukleotydowej SEQ ID NO 37 albo równocześnie nie zawiera co najmniej jednej sekwencji polinukleotydowej kodującej sekwencję aminokwasów odpowiadającą SEQ ID NO 44, 46, 48 i/lub 50.

Sposób wytwarzania według wynalazku jest korzystny gdy ML-236B wytwarza się w nieobecności jednego lub więcej zrekombinowanych polipeptydów mających sekwencje aminokwasowe odpowiadające SEQ ID NO 38, 44, 46, 48 i/lub 50 albo wówczas gdy ML-236B wytwarza się w nieobecności jednego lub więcej cDNA odpowiadającego SEQ ID NO 37,43,45,47 i/lub 49.

Sposób wytwarzania prawastatyny według wynalazku polega na tym, że przeprowadza się sposób wytwarzania ML-236B określony wyżej i następnie przekształca się ML-236B w prawastatynę.

Tabela Listy Sekwencji

Lista sekwencji tworzy część niniejszego opisu patentowego. Aby pomóc w zrozumieniu podajemy następującą tabelę wyliczonych sekwencji.

SEQ ID NR tożsamość wstawka pML48 komplementarne do SEQ ID NO 1 primer do PCR dla Przykładu 4 primer do PCR dla Przykładu 4 oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (2) do 5'-RACE oligonukleotyd DNA (2) do 5'-RACE

Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8

PL 202 457 B1 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 Fragment końca 5'cDNA, Przykład 8

Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 primer RT-PCR, Przykład 9 primer RT-PCR, Przykład 9 mlcE; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcE primer RT-PCR, Przykład 12 primer RT-PCR, Przykład 12 mlcR; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcR mlcA; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcA mlcB; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcB mlcC; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcC mlcD; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcD primer RT-PCR, Przykład 17

Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17

Polinukleotydy kodujące sekwencję aminokwasów SEQ ID NO 38, 42, 44, 46, 48 lub 50 mogą być cDNA, genomowym DNA lub mRNA. Genomowe DNA kodujące każdą z tych sześciu sekwencji są określane jako geny struktury mlcE, mlcR, mlcA, mlcB, mlcC i mlcD, odpowiednio. Bez wiązania się tymi określeniami, uważamy, że te geny struktury kodują białka z następującymi funkcjami:

mlcA syntaza poliketydów mlcB syntaza poliketydów primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR,

PL 202 457 B1 mlcC monooksygenaza P450 mlcD reduktaza HMG-CoA mlcE pompa wypływowa mlcR czynnik transkrypcyjny

Stwierdzono, że włączenie mlcE lub cDNA odpowiadającego mlcE B oraz włączenie mlcR lub cDNA odpowiadającego mlcR może przyspieszyć biosyntezę ML-236B. Co więcej, mlcR stymuluje transkrypcyjną ekspresję mlcA do D. MlcA, B, C i D biorą udział w produkcji ML-236B, niezależnie i razem, jak wykazał y badania dysrupcji genów.

Warianty mlcA, B i/lub C uzyskiwane poprzez naturalne lub syntetyczne zmiany są pożyteczne do produkcji pochodnych ML-236B, w tym statyn takich jak prawastatyna lub lowastatyna. W tym względzie może być możliwe wyprodukowanie prawastatyny bezpośrednio przez takie warianty tylko z jednym etapem fermentacji i bez potrzeby konwersji ML-236B do prawastatyny przez mikroorganizmy Streptomyces carbophilus.

Polinukleotyd obejmujący sekwencję zawierającą SEQ ID NO 37, lub zawierającą jej mutanta lub wariant jest zdolny do przyspieszania biosyntezy ML-236B. Taki polinukleotyd DNA można uzyskać z transformowanej Escherichia coli pSAKexpE SANK 72499 (FERM BP-7005).

Polinukleotyd obejmujący sekwencję zawierającą SEQ ID NO 41 lub zawierającą jej mutanta lub wariant jest zdolny do przyspieszania biosyntezy ML-236B. Taki polinukleotyd DNA można uzyskać z transformowanej Escherichia coli pSAKexpE SANK 72599 (FERM BP-7006).

Polinukleotyd według wynalazku jest typowym DNA, cDNA lub genomowym DNA, lub RNA i może być sensowny albo antysensowny. Stosowany polinukleotyd jest oczyszczony, tzn. wolny od innych składników komórkowych.

Stosowane dalej określenie warianty polinukleotydu kodujące sekwencję aminokwasów wskazanych SEQ ID NO 38, 42, 44, 46, 48 lub 50, oznacza polinukleotydy gdzie zmieniony jest jeden lub więcej nukleotydów. Te zmiany mogą występować naturalnie i mogą być zrobione w obrębie nadmiarowości lub degeneracji tripletów kodu genetycznego. Takie zdegenerowane zmienione polinukleotydy kodują te same sekwencje aminokwasów. W obrębie tych wariantów polinukleotydów rozumiany jest także genomowy DNA mający eksony i introny, a nie samą sekwencję jak jest w przypadku cDNA.

Pojęcie warianty polinukleotydu kodujące sekwencję aminokwasów wskazanych SEQ ID NO 38, 42, 44, 46, 48 lub 50, obejmuje też polinukleotydy, które kodują zmodyfikowaną sekwencję aminokwasów mającą przynajmniej jedną delecję, addycję, substytucję lub zmianę oraz warianty polinukleotydu o wskazanych sekwencjach, które kodują sekwencje aminokwasów, które są krótsze, dłuższe lub tej samej długości jak kodowane przez wskazane sekwencje. Warianty polipeptydów zachowują zdolność do przyspieszania syntezy ML-236B i korzystnie mają aktywność zasadniczo podobną lub lepszą niż rodzicielska sekwencja, z której powstał wariant sekwencji.

Warianty polinukleotydu zachowują stopień identyczności z sekwencją rodzicielską. Odpowiedni stopień identyczności wynosi przynajmniej 60%, przynajmniej 80%, przynajmniej 90% lub przynajmniej 95% lub 100%. Stopień identyczności jest korzystnie oceniany przez program komputerowy taki jak program BLAST, który stosuje algorytm do przeprowadzenia poszukiwań homologii.

Polinukleotyd według wynalazku przyspiesza biosyntezę ML-236B w mikroorganizmie produkującym ML-236B. Przykłady mikroorganizmów produkujących ML-236B obejmują gatunki Penicillium, takie jak Penicillium citrinum, Penicillium brevicompactum [opisane w Brown, A.G. i wsp., J. Chem. Soc. Perkin-1., 1165(1976)], Penicillium cyclopium [opisane w Doss, S.L. i wsp., J. Natl. Prod.,49, 357 (1986)] lub podobne. Inne przykłady obejmują: Eupenicillium sp.M6603 [opisane w Endo A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Paecilomyces viridis FERM P-6236 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 58-98092], Paecilomyces sp.M2016 [opisane w Endo A. i wsp., J. Antibiot. -Tokyo, 39, 1609 (1986)], Trichoderma longibrachiatum M6735 [opisane w Endo, A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Hypomyces chrysospermus IFO 7798 [opisane w Endo A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Gliocladium sp. YJ-9515 [opisane w WO 9806867], Trichorderma viride IFO 5836 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 62-19159], Eupenicillium reticulisporum IFO 9022 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 62-19159], lub dowolny inny odpowiedni organizm.

Wśród tych mikroorganizmów produkujących ML-236B, korzystny jest Penicillium citrinum, a bardziej korzystny jest szczep Penicillium citrinum SANK 13380. Szczep Penicillium citrinum SANK 13380 zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu. FERM BP-4129, zgodnie z Traktatem

PL 202 457 B1

Budapeszteńskim o Deponowaniu Mikroorganizmów. Przykłady mikroorganizmów produkujących ML-236B także obejmują izolowane z naturalnych źródeł i mutowane naturalnie lub syntetycznie.

Wynalazek dotyczy polipeptydu obejmującego sekwencję NO 42, lub jej wariant, który ma z nią specyficzny stopień identyczności i który jest zdolny do przyspieszania produkcji ML236B w organizmie produkującym ML236B. Inne polipeptydy według wynalazku to te, które są kodowane przez opisane powyżej sekwencje polinukleotydu i warianty, które zachowują stopień identyczności.

Odpowiedni stopień identyczności wariantów polipeptydu do SEQ ID NO 42 jest przynajmniej 80%, przynajmniej 90% lub przynajmniej 95% lub 100%. Stopień identyczności wariantu jest korzystnie oceniany przez program komputerowy, taki jak program BLAST, który stosuje algorytm do przeprowadzenia poszukiwań homologii.

Polipeptydy według wynalazku obejmują krótsze lub dłuższe sekwencje SEQ ID NO 42 lub wariantów. Krótsze polipeptydy zawierają częściową sekwencję aminokwasów SEQ ID NO 42 lub jej wariantów i korzystnie zachowują zdolność do przyspieszania biosyntezy ML236B. Dłuższe polipeptydy zawierają całą lub częściową sekwencję aminokwasów SEQ ID NO 42 lub ich wariantów i korzystnie zachowują zdolność do przyspieszania biosyntezy ML236B. Dłuższe polipeptydy obejmują fuzje białkowe takie jak białko w fuzji z Fc.

W odpowiedzi na obecność polipeptydu według wynalazku mogą być wytwarzane zarówno poliklonalne jak i monoklonalne przeciwciała. Są one użyteczne do regulowania wytwarzania pochodnych ML-236B, takich jak statyny, a w tym prawastatyny i lowastatyny. Ponadto przeciwciała mogą być korzystnie użyte do analizy biosyntezy ML-236B i jego mechanizmów regulacyjnych. Taka analiza jest użyteczna do modulowania wytwarzania ML-236B i do wytwarzania pochodnych ML-236B.

Szczegółowy opis wynalazku

Twórcy wynalazku sklonowali genomowy DNA zawierający geny biorące udział w biosyntezie ML-236B u Penicillium citrinum. Genomowy DNA jest dalej określany jako genomowy DNA związany z biosyntezą ML-236B, i był sklonowany z biblioteki genomowego DNA mikroorganizmu produkującego ML-236B. Genomowy DNA analizowano by znaleźć geny struktury na tym genomowym DNA, następnie uzyskano cDNA odpowiadające tym genom struktury za pomocą odwrotnej transkrypcji - reakcji łańcuchowej z polimerazą (dalej określana jak RT-PCR) stosując całkowity RNA, który zawiera mRNA Penicillium citrinum jako matrycę. Stwierdzono, że biosynteza ML-236B w mikroorganizmie produkującym ML-236B była przyspieszona gdy mikroorganizm produkujący ML-236B był transformowany zrekombinowanym wektorem zawierającym te cDNA.

Niniejszy wynalazek dotyczy szczególnie cDNA (dalej określane jako cDNA przyspieszające biosyntezę ML-236B), które przyspieszają biosyntezę ML-236B w mikroorganizmie produkującym ML-236B gdy są wprowadzone do tego mikroorganizmu produkującego ML-236B.

Polinukleotyd według niniejszego wynalazku przyspieszający biosyntezę ML-236B, taki jak cDNA przyspieszający biosyntezę ML-236B obejmuje, jako przykłady:

(I) DNA uzyskany za pomocą syntezy stosując jako matrycę transkrybowany produkt (informacyjny RNA, dalej określany jako mRNA) genu struktury, który bierze udział w biosyntezie ML-236B i który istnieje w genomowym DNA mikroorganizmu produkującego ML-236B;

(II) dwuniciowy DNA wytworzony w wyniku asocjacji DNA (I) i DNA drugiej nici zsyntetyzowanego stosując DNA (I) jako pierwszą nić;

(III) dwuniciowy DNA wytworzony przez replikację lub amplifikację dwuniciowego DNA (II), na przykład, przez metodę klonowania lub podobną;

(IV) DNA, który może hybrydyzować do jednego z powyższych DNA lub mRNA w warunkach ostrych.

DNA (IV) może być tym pokazanym w dowolnej sekwencji genu struktury, na przykład jako nukleotydy Nr 1 do 1662 SEQ ID No. 37 lub nukleotydy Nr 1 do 1380 SEQ ID No 41.

Gdy dwa jednoniciowe kwasy nukleinowe hybrydyzują tworzą dwuniciową cząsteczkę w regionie, w którym są komplementarne lub wysoce komplementarne, i warunki ostre odpowiednio dotyczą przypadku gdy roztwór do hybrydyzacji jest 6 x SSC [1 x SSC ma skład 150 mM NaCI, 15 mM cytrynian sodu] i temperatura hybrydyzacji wynosi 55°C.

cDNA przyspieszający biosyntezę ML-236B może być uzyskany, na przykład, przez izolację klonu zawierającego cDNA z biblioteki cDNA mikroorganizmu produkującego ML-236B. Jako alternatywa można zastosować RT-PCR z użyciem pary primerów zaprojektowanych na podstawie sekwencji nukleotydów genomowego DNA związanego z biosyntezą ML-236B razem z mRNA lub całkowitym RNA mikroorganizmu produkującego ML-236B.

PL 202 457 B1

Mikroorganizm produkujący ML-236B jest mikroorganizmem mającym wewnętrzną zdolność do produkcji ML-236B. Jak uprzednio wskazano, przykłady mikroorganizmów produkujących ML-236B obejmują gatunki Penicillium takie jak Penicillium citrinum, Penicillium brevicompactum, Penicillium cyclopium lub podobne i inne przykłady obejmują: Eupenicillium sp.M6603, Paecilomyces viridis FERM P-6236, Paecilomyces sp.M2016, Trichoderma longibrachiatum M6735, Hypomyces chrysospermus IFO 7798, Gliocladium sp. YJ-9515, Trichorderma viride IFO 5836, Eupenicillium reticulisporum IFO 9022 i inne dowolne odpowiednie organizmy.

Wśród tych mikroorganizmów produkujących ML-236B, Penicillium citrinum jest korzystny i szczep Penicillium citrinum SANK 13380 jest bardziej korzystny. Szczep Penicillium citrinum SANK 13380 zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu FERM BP-4129, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów. Przykłady mikroorganizmów produkujących ML-236B także obejmują zarówno te izolowane ze źródeł naturalnych jak i zmutowane naturalnie lub sztucznie.

Genomowy DNA związany z biosyntezą ML236-B może być też uzyskany przez przeszukanie genomowej biblioteki DNA mikroorganizmu produkującego ML-236B odpowiednią sondą. Odpowiednio sonda jest zaprojektowana na podstawie sekwencji DNA, dla której przewiduje się rolę w biosyntezie ML-236B, odpowiednio pochodzącej z grzyba nitkowatego.

Wybór sposobów tworzenia biblioteki genomowego DNA nie jest ograniczony i może być stosowana dowolny odpowiedni sposób, korzystnie będący ogólnym sposobem konstrukcji biblioteki genomowego DNA organizmu eukariotycznego. Przykłady tego obejmują sposób Maniatis i wsp. [Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2., Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Inne odpowiednie sposoby są znane w dziedzinie.

Pokrótce, genomowy DNA z mikroorganizmu produkującego ML-236B może być otrzymany przez odzyskanie komórek z hodowli tego mikroorganizmu produkującego ML-236B, fizyczne rozbicie komórek, ekstrakcję DNA obecnego w jego jądrach i oczyszczenie tego DNA.

Hodowlę mikroorganizmu produkującego ML-236B można prowadzić w warunkach odpowiednich dla danego mikroorganizmu produkującego ML-236B. Na przykład hodowla Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B może być przeprowadzona przez zaszczepienie komórek w podłożu MBG3-8 [skład: 7% (waga/obj) gliceryna, 3% (waga/obj) glukoza, 1% (waga/obj) proszek sojowy, 1% (waga/obj) pepton (wyprodukowany przez Kyokuto Seiyaku Kogyo corporation), 1% (waga/obj) płyn z maceracji kukurydzy (wyprodukowany przez Honen corporation), 0,5% (waga/obj) azotan sodu, 0,1%(waga/obj) siedmiowodny siarczan magnezu (pH 6,5)] i inkubację w 22 do 28°C z wytrząsaniem przez 3 do 7 dni. Skos do przechowywania bakterii można przygotować przez wylanie roztopionego podłoża agarowego PGA [skład: 200g/L wyciągu ziemniaczanego, 15% (waga/obj) gliceryna, 2% (waga/obj) agar] do probówki i zestalenie agaru pod kątem. Penicillium citrinum można wówczas zaszczepić na skosie platynową igłą a następnie prowadzi się inkubację w 22 do 28°C przez 7 do 15 dni. Mikroorganizmy lub bakterie hodowane w ten sposób mogą być w sposób ciągły utrzymywane na skosie przez trzymanie skosu w 0 do 4°C.

Komórki mikroorganizmu produkującego ML-236B hodowane w podłożu płynnym można odzyskać za pomocą wirowania, a hodowane na podłożu stałym można zdrapać z podłoża stałego zdrapywaczem do komórek lub podobnym.

Fizyczne rozbicie komórek można przeprowadzić przez roztarcie komórek stosując tłuczek i moździerz, zamrożenie w ciekłym azocie i podobnie. DNA w jądrach rozbitych komórek może być wyekstrahowany stosując związek powierzchniowo czynny taki jak sól sodowa siarczanu dodecylu (dalej określany jako SDS) lub inny odpowiedni związek powierzchniowo czynny. Wekstrahowany genomowy DNA jest odpowiednio poddany działaniu fenolu - chloroformu aby usunąć białka i odzyskiwany jako osad przez przeprowadzenie strącania etanolem.

Powstały genomowy DNA fragmentuje się przez trawienie odpowiednim enzymem restrykcyjnym. Nie ma ograniczenia na enzymy restrykcyjne, które mogą być stosowane do trawienia restrykcyjnego, korzystne są ogólnie dostępne enzymy restrykcyjne. Przykłady obejmują Sau3AI. Inne odpowiednie enzymy są znane w dziedzinie. Trawiony DNA poddaje się następnie elektroforezie w żelu i genomowy DNA mają cy odpowiednią wielkość odzyskuje się ż elu. Wielkość fragmentu DNA nie jest szczególnie ograniczana, ale korzystnie wynosi 20 kb lub więcej.

Także nie ma ograniczenia wyboru wektora DNA stosowanego w konstrukcji biblioteki genomowego DNA, o ile wektor ma sekwencję DNA potrzebną do replikacji w komórce gospodarza, która

PL 202 457 B1 ma być transformowana przez wektor. Przykłady odpowiednich wektorów obejmują wektor plazmidowy, wektor fagowy, wektor kosmidowy, wektor BAC lub podobne, korzystny jest wektor kosmidowy. Wektor DNA jest korzystnie wektorem ekspresyjnym. Bardziej korzystnie wektor DNA zawiera DNA lub sekwencję nukleotydów, która nadaje selektywny fenotyp komórce gospodarza transformowanej wektorem.

Wektor DNA jest odpowiednio wektorem, który może być stosowany zarówno do klonowania i do ekspresji. Korzystnie wektor jest wektorem wahadł owym, który moż e być stosowany do transformacji więcej niż jednego mikroorganizmu- gospodarza. Wektor wahadłowy ma odpowiednio sekwencję DNA, która pozwala na replikację w komórce gospodarza i korzystnie sekwencję lub sekwencje, które pozwalają na replikację w szeregu różnych komórek gospodarza z różnych grup mikroorganizmów takich jak bakterie i grzyby. Dalej, wektor wahadłowy korzystnie zawiera sekwencję DNA, która może zapewnić fenotyp selekcyjny dla zakresu różnych komórek gospodarza, takich jak komórki z róż nych grup mikroorganizmów.

Wybór kombinacji grupy mikroorganizmów i komórek gospodarza transformowanych przez wektor wahadłowy nie jest szczególnie ograniczany pod warunkiem, że jedna z grup mikroorganizmów może być użyta do klonowania a druga ma zdolność do produkcji ML-236B. Takie kombinacje mogą być, na przykład, kombinacją bakterii i grzybów nitkowatych, kombinacją drożdży i grzybów nitkowatych, z korzystną kombinacją bakterii i grzybów nitkowatych. Wybór bakterii nie jest szczególnie ograniczany o ile może ona być ogólnie stosowana w biotechnologii, taka jak na przykład Escherichia coli, Bacillus subtilis lub podobne. Escherichia coli jest korzystne i Escherichia coli XL1-Blue MR jest najbardziej korzystna. Podobnie nie ma ograniczenia gatunku drożdży o ile może być on ogólnie stosowany w biotechnologii tak jak na przykład Saccharomyces cerevisiae lub podobne. Przykłady grzybów nitkowatych obejmują mikroorganizmy produkujące ML-236B opisane powyżej. Inne odpowiednie przykłady mikroorganizmów są znane w dziedzinie.

W niniejszym wynalazku, grupa mikroorganizmów moż e być wybrana z bakterii, grzybów nitkowatych i drożdży.

Przykłady wymienionego powyżej wektora wahadłowego obejmują wektor kosmidowy mający odpowiedni gen markera do selekcji fenotypu i miejsce cos. Inne odpowiednie wektory są znane w dziedzinie. Korzystnym wektorem jest pSAKcos1, skonstruowany przez wstawienie miejsca cos z wektora kosmidowego pWE15 (wyprodukowany przez STRATAGENE) do plazmidu pSAK333, który zawiera sekwencję genu fosfotransferazy hygromycyny B Escherichia coli [opisane w Japońskim Zgłoszeniu Patentowym Publikacja Nr 3-262486]. Sposób konstrukcji pSAKcos1 przedstawiono na Figurze 1. Niniejszy wynalazek nie jest ograniczony do tego wektora.

Biblioteką genomowego DNA można przygotować przez wprowadzenie wektora wahadłowego do komórki gospodarza, wektor zawiera genomowy fragment DNA z mikroorganizmu produkującego ML-236B. Komórka gospodarza, która ma być stosowana jest korzystnie Escherichia coli, bardziej korzystnie Escherichia coli XL1-Blue MR. Gdy komórka gospodarza jest Escherichia coli, wprowadzenie można przeprowadzić przez pakowanie in vitro. W niniejszym wynalazku transformacja także obejmuje wprowadzanie obcego DNA przez pakowanie in vitro, i transformowana komórka także obejmuje komórkę, do której obcy DNA wprowadzono za pomocą pakowania in vitro.

Biblioteka genomowa może być przeszukiwana aby zidentyfikować pożądany klon stosując jako sondą przeciwciało lub kwas nukleinowy, przy czym sonda kwasu nukleinowego jest korzystna. Korzystnie sondę kwasu nukleinowego przygotowuje się w oparciu o sekwencją nukleotydów genu lub DNA związanego z biosyntezą poliketydów, korzystnie jest to sekwencja pochodząca z grzyba nitkowatego. Wybór danego genu nie jest ograniczony o ile bierze on udział w biosyntezie poliketydów a jego sekwencja nukleotydów jest znana. Przykł ady takich genów obejmują gen PKS aflatoksyny Aspergillus flavus i Aspergillus parasiticus, gen PKS sterygmatocystyny Aspergillus nidulans lub podobne.

Odpowiednie sondy kwasu nukleinowego można uzyskać, na przykład, przez syntezą sondy oligonukleotydowej zawierającej część znanej genomowej sekwencji DNA jak opisano powyżej lub przez przygotowanie primerów oligonukleotydowych i amplifikacją docelowego DNA stosując reakcję łańcuchową polimerazy [dalej określaną jako PCR, opisane w Saiki, R. K i wsp., Science, 239, 487 (1988)] i genomowy DNA jako matrycą lub poprzez RT-PCR stosując mRNA jako matrycę. Inne odpowiednie sposoby otrzymania takich sond są dobrze znane w dziedzinie.

Sonda kwasu nukleinowego może być otrzymana z mikroorganizmu produkującego ML-236B, używając na przykład PCR lub RT-PCR. Zaprojektowanie primerów stosowanych do PCR lub RT-PCR

PL 202 457 B1 (dalej określany jako primer do PCR) jest korzystnie przeprowadzane na podstawie sekwencji nukleotydów genu związanego z biosyntezą poliketydów dla którego jest znana sekwencja nukleotydów. Korzystnie gen jest genem PKS aflatoksyny Aspergillus flavus, Aspergillus parasiticus, lub genem PKS sterygmatocystyny Aspergillus nidulans.

Primery do PCR są odpowiednio zaprojektowane by zawierały sekwencje nukleotydów, które kodują sekwencje aminokwasów, które są wysoce konserwatywne w genach PKS. Sposoby identyfikacji sekwencji nukleotydów odpowiadających danej sekwencji aminokwasów obejmują dedukcję na podstawie wykorzystywania kodonów komórki gospodarza, i sposoby przygotowywania mieszanych sekwencji oligonukleotydów stosując wielokrotne kodony (dalej określany jako 'zdegenerowane oligonukleotydy'). W tym drugim przypadku wielokrotność oligonukleotydów może być zmniejszona przez wprowadzenie hipoksantyny do ich sekwencji nukleotydów.

Primer do PCR może zawierać sekwencją nukleotydów zaprojektowaną aby hybrydyzowała z nicią matrycy, primer jest połączony z dodatkową sekwencją 5'. Wybór takiej dodatkowej sekwencji nukleotydów 5' nie jest szczególnie ograniczony tak długo jak primer może być użyty do PCR lub RT-PCR. Taka dodatkowa sekwencja 5' może być na przykład, sekwencją nukleotydów wygodną dla klonowania produktu PCR. Taka sekwencja nukleotydów może być na przykład, miejscem cięcia enzymu restrykcyjnego lub sekwencją nukleotydów zawierającą miejsce cięcia enzymu restrykcyjnego.

Dalej w projektowaniu primera do PCR, jest korzystne, że suma liczby zasad guaninowych (G) i liczba cytozynowych (C) wynosi 40 do 60% całkowitej liczby zasad. Dalej, korzystnie występuje mało lub brak autohybrydyzacji danego primera i w przypadku pary primerów, korzystnie mało lub brak hybrydyzacji między primerami.

Liczba nukleotydów tworzących primer do PCR nie jest szczególnie ograniczona, o ile może być stosowany do PCR. Dolna granica liczby wynosi na ogół 10 do 14 nukleotydów, z górną granicą 40 do 60 nukleotydów. Korzystnie, primery mają 14 do 40 oligonukleotydów długości.

Primer do PCR korzystnie jest DNA. Nukleozydy w primerze mogą być deoksy adenozyną, deoksycytydyną, deoksytymidyną i deoksyguanozyną i dodatkowo deoksyinozyną. Pozycja 5' nukleozydu na końcu 5' primera do PCR jest odpowiednio grupą hydroksylową do której jest przyłączony jeden kwas fosforowy za pomocą wiązania estrowego.

Synteza primera do PCR może być przeprowadzona za pomocą sposobów do syntezy kwasów nukleinowych, na przykład metody fosfoamidynowej. W takim sposobie może być korzystnie stosowany automatyczny syntetyzator DNA.

Genomowy DNA i mRNA z mikroorganizmu produkującego ML-236B mogą być stosowane jako matryce dla odpowiednio PCR lub RT-PCR. Całkowity RNA może też być stosowany jako matryca do RT-PCR zamiast mRNA.

Produkt PCR lub produkt RT-PCR może być klonowany poprzez włączenie do odpowiedniego wektora DNA. Wybór wektora DNA stosowanego do etapu klonowania na ogół nie jest ograniczony. Zestawy do łatwego klonowania produktów PCR i RT-PCR są dostępne handlowo. Jako przykład, Original TA Cloning Kit (wyprodukowany przez lnvitrogen: stosujący pCR2.1 jako wektor DNA) jest odpowiedni do takiego klonowania.

Aby uzyskać taki sklonowany produkt PCR, transformowane komórki gospodarza zawierające plazmidy zawierające pożądany produkt PCR hoduje się i następnie plazmidy ekstrahuje się z komórek i oczyszcza. Wstawiony fragment DNA następnie odzyskuje się z powstałego plazmidu.

Hodowanie transformowanych komórek gospodarza odpowiednio przeprowadza się w warunkach odpowiednich dla komórek gospodarza. Korzystna komórka gospodarza, Escherichia coli, może być hodowana w podłożu LB [1% (waga/obj) trypton, 0,5% (waga/obj) ekstrakt drożdżowy, 0,5% (waga/obj) chlorek sodu] w 30 do 37°C przez 18 godzin do dwóch dni z wytrząsaniem.

Preparatyka plazmidów z hodowli transformowanych komórek gospodarza może być przeprowadzona przez odzyskanie komórek gospodarza i izolację plazmidów wolnych od innych składników komórki takich jak genomowy DNA lub białko gospodarza. Preparatykę DNA plazmidowego z hodowli Escherichia coli można przeprowadzić według metody lizy alkalicznej Maniatisa [opisane w Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2., Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Handlowo są dostępne zestawy do uzyskania plazmidu mającego wyższą czystość. Plasmid Mini Kit [wyprodukowany przez QIAGEN AG] jest korzystny. Dalej dostępny jest handlowo zestaw do masowej produkcji plazmidu. Plasmid Maxi Kit (wyprodukowany przez QIAGEN AG) jest korzystny.

PL 202 457 B1

Stężenie powstałego DNA plazmidu można określić przez pomiar absorbancji przy długości fali

260 nm po odpowiednim rozcieńczeniu próbki DNA i wyliczeniu na podstawie, że roztwór z absorbancją OD₂₆₀ 1 zawiera 50 μg/ml DNA (opisane w Maniatis T., i wsp., powyżej).

Czystość DNA można wyliczyć ze stosunku absorbancji przy długości fali 280 i 260 nm (opisane w Maniatis, T. i wsp., powyżej).

Sposoby znakowania sond kwasów nukleinowych można ogólnie sklasyfikować jako znakowanie radioaktywne i nie radioaktywne. Wybór radionukleotydu do znakowania radioaktywnego nie jest na ogół ograniczony i może być na przykład, ³²P, ³⁵S, ¹⁴C lub podobne. Stosowanie ³²P w znakowaniu jest korzystne. Wybór czynnika do znakowania nieradioaktywnego także nie jest ogólnie ograniczony, o ile może być ogólnie stosowany do znakowania kwasów nukleinowych i może być, na przykład, digoksygeniną, biotyną lub podobnym, digoksygenina jest korzystna.

Sposoby znakowania sondy kwasów nukleinowych także nie są ogólnie ograniczone. Korzystne są powszechnie stosowane sposoby takie jak na przykład, sposoby włączające znak do produktu za pomocą PCR lub RT-PCR stosując znakowane substraty nukleotydowe, nick translację, stosowanie losowych primerów, znakowanie końców i sposoby syntetyzowania oligonukleotydów DNA stosując znakowane substraty nukleotydowe. Odpowiedni sposób może być wybrany z tych sposobów w zależności od typu sondy kwasu nukleinowego.

Obecność w genomie mikroorganizmu produkującego ML-236B sekwencji nukleotydów, która jest taka sama jak sekwencja nukleotydów danej sondy kwasu nukleinowego może być potwierdzona za pomocą hybrydyzacji typu Southerna z genomowym DNA tego mikroorganizmu produkującego

ML-236B.

Hybrydyzacja typu Southerna może być przeprowadzona według sposobu Maniatis [opisane w Maniatis, T. i wsp., powyżej].

Znakowana sonda kwasu nukleinowego przygotowana jak opisano powyżej może być stosowana do przeszukiwania biblioteki genomowego DNA. Wybór sposobu przeszukiwania nie jest szczególnie ograniczony o ile jest on ogólnie odpowiedni do klonowania genów, ale jest korzystnie metodą hybrydyzacji kolonijnej [opisane w Maniatis, T., i wsp., powyżej].

Hodowla kolonii stosowanych do hybrydyzacji kolonijnej jest odpowiednio przeprowadzana w warunkach odpowiednich dla komórki gospodarza. Hodowla Escherichia coli, korzystnego gospodarza może być przeprowadzona przez inkubację w podłożu agarowym LB [1% (waga/obj) trypton, 0,5% (waga/obj) ekstrakt drożdżowy, 0,5% (waga/obj) chlorek sodu, 1,5% (waga/obj) agaroza] w 30 do 37°C przez 18 godzin do dwóch dni.

Preparatyka wektora zrekombinowanego DNA z dodatniego klonu uzyskanego za pomocą hybrydyzacji kolonijnej na ogół jest przeprowadzana przez ekstrakcją plazmidu z hodowli dodatniego klonu i oczyszczenia go.

Transformowany szczep Escherichia coli, Escherichia coli pML48 SANK71199 reprezentujący dodatni klon uzyskany według niniejszego wynalazku, zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 7 lipca, 1999, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów i uzyskał numer dostąpu FERM BP-6780.

Typowy wektor DNA niesiony przez Escherichia coli pML48 SANK71199 określono jako pML48.

Potwierdzenie, że zrekombinowany wektor DNA obecny w dodatnim klonie zawiera genomowy DNA związany z biosyntezą ML-236B można odpowiednio uzyskać przez ustalenie sekwencji nukleotydów wstawki zrekombinowanego wektora DNA, hybrydyzację typu Southerna lub ekspresję wstawki w celu ustalenia funkcji.

Sekwencję nukleotydów DNA można ustalić za pomocą techniki modyfikacji chemicznej Maxama i Gilberta [opisane w Maxam, A. M. M. i Gilbert, W., Methods in Enzymology, 65, 499 (1980)] lub metodą terminacji łańcucha dideoksy [opisane w Messing, J. i Vieira, J., Gene, 19, 269 (1982)]. Inne odpowiednie sposoby są dobrze znane w dziedzinie. DNA plazmidowy stosowany do określania sekwencji nukleotydów korzystnie jest próbką o wysokiej czystości, jak opisano powyżej.

Sekwencja nukleotydów wstawki pML48 jest przedstawiona w SEQ ID No. 1 Listy sekwencji. Sekwencja nukleotydów przedstawiona w SEQ ID No. 2 Listy sekwencji jest całkowicie komplementarna do sekwencji nukleotydów przedstawionej w SEQ ID No. 1. Ogólnie, sekwencja nukleotydów genomowego DNA może mieć polimorfizmy genetyczne w obrębie gatunku, to znaczy różnice allogeniczne. Dalej, w procesie klonowania i sekwencjonowania DNA wiadomo, że podstawienia nukleotydów lub inne zmiany, mogą zachodzić z pewną częstością. Tak więc genomowy DNA związany z biosyntezą ML-236B także obejmuje genomowy i inne DNA, które mogą być hybrydyzowane do

PL 202 457 B1

DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji. Korzystny są genomowy lub inne DNA, które mogą hybrydyzować w warunkach ostrych do DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji. Te DNA obejmują DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji, znamienny tym, że jeden lub więcej nukleotydów jest podstawionych, wydeletowanych i/lub dodanych. Dodatkowo ten hybrydyzujący genomowy lub inny DNA mogą obejmować DNA pochodzący z mikroorganizmów produkujących ML-236B innych niż Penicillium citrinum SANK13380, korzystnie są to te zdolne do poprawienia produkcji ML-236B gdy są wprowadzone do mikroorganizmu produkującego ML-236B.

Genomowy DNA związany z biosyntezą ML-236B odpowiednio się analizuje zgodnie z następującymi sposobami 1) do 3).

1) Analiza za pomocą programów analizujących geny

Geny w obrębie genomowego DNA można znaleźć stosując program do szukania genów (dalej określany jako GRAIL) i program do poszukiwania homologicznych sekwencji (BLASTN i BLASTX).

GRAIL jest programem, który poszukuje genów struktury w genomowym DNA przez rozdzielenie genomowych sekwencji na siedem parametrów dla oceny wyglądu sekwencji genu i integrację wyników stosując metodę sieci [opisane w Uberbacher, E.C. i Mural, R.J., Proc. Natl. Acad. Sci. USA., 88, 11261 (1991)]. Jako przykład, można stosować ApoCom GRAIL Toolkit [produkowany przez Apocom corporation].

BLAST jest programem stosującym algorytm do przeprowadzania poszukiwań homologii sekwencji nukleotydów i sekwencji aminokwasów [opisane w Altschul, S.F., Madden, T. L. i wsp., Nucl. Acids Res., 25, 3389 (1997)].

Pozycję i kierunek genu struktury w przykładowej sekwencji genomowego DNA można przewidzieć przez podział sekwencji DNA na odpowiednie długości i przeprowadzenie poszukiwania homologii w genetycznej bazie danych stosując BLASTN. Pozycja i kierunek genu struktury w sekwencji DNA, która ma być testowana może też być przewidziana przez translację podzielonych sekwencji genomowego DNA na sześć ramek translacji (trzy na nici sensownej i pozostałe trzy na nici antysensownej) i przeprowadzenie poszukiwania homologii wywiedzionych sekwencji aminokwasów w bazie danych peptydów stosując BLASTX.

Kodujące obszary genów struktury w genomowym DNA są czasami podzielone przez introny u organizmów eukariotycznych. Do analizy genów struktury mających takie przerwy, bardziej skuteczny jest program BLAST dla sekwencji zawierających przerwy, korzystny jest program Gapped-BLAST (zainstalowany w BLAST2: WISCONSIN GCG package ver. 10.0).

2) Analiza według metody hybrydyzacji typu Northern

Ekspresja genu struktury przewidzianego przez sposoby analizy opisane w akapicie 1) może być badana stosując metodę hybrydyzacji typu Northern.

Odpowiednio uzyskuje się całkowity RNA z mikroorganizmu produkującego ML-236B z hodowli mikroorganizmu. Hodowlę korzystnego mikroorganizmu produkującego ML-236B Penicillium citrinum można uzyskać przez zaszczepienie tego mikroorganizmu ze skosu do podłoża MGB3-8 a następnie inkubację z wytrząsaniem, inkubując w 22 do 28°C przez jeden do czterech dni.

Wybór metody ekstrakcji RNA z mikroorganizmu produkującego ML-236B nie jest ograniczony i korzystna jest metoda rodanek guanidyny- gorą cy fenol, metoda rodanek guanidyny- chlorowodorek guanidyny i podobne. Przykłady handlowo dostępnego zestawu do przygotowania całkowitego RNA o wysokiej czystoś ci obejmują RNeasy Plant Mini Kit (wyprodukowany przez Qiagen AG). Co wię cej, mRNA można uzyskać przez nałożenie całkowitego RNA na kolumnę oligo (dT) i odzyskanie frakcji zaadsorbowanej na kolumnie.

Przeniesienie RNA na membranę, przygotowanie sondy, hybrydyzacja i detekcja sygnału mogą być przeprowadzone w podobny sposób do wymienionej powyżej metody hybrydyzacji Southerna.

3) Analiza końca 5' i końca 3' transkryptu

Analiza końca 5' i końca 3' każdego transkryptu może być przeprowadzona według metody 'RACE' (szybka amplifikacja końców cDNA). RACE jest metodą uzyskania cDNA zawierającego znany region nukleotydów i nieznany region na końcu 5' lub końcu 3' genu, stosując RT-PCR z mRNA jako matrycą [opisane w Frohman. M. A., Methods Enzymol. 218, 340 (1998)].

5'-RACE można przeprowadzić według następującego sposobu. Pierwsza nić cDNA jest syntetyzowana według reakcji odwrotnej transkryptazy stosując mRNA jako matrycę. Jako primer stosuje się oligonukleotydy antysensowne (1), które są zaprojektowane na znane części sekwencji nukleotydów. Homopolimeryczny łańcuch nukleotydów (złożony z jednego rodzaju zasady) dodaje się do koń12

PL 202 457 B1 ca 3' pierwszej nici cDNA stosując terminalną transferazę deoksynukleotydów. Następnie dwuniciowy cDNA w regionie 5' końca amplifikuje się za pomocą PCR stosując pierwszą nić cDNA jako matrycę. Do amplifikacji stosuje się 2 primery; oligonukleotyd DNA z nici sensownej zawierający sekwencję komplementarną do sekwencji homopolimerycznej oligonukleotyd (2) na nici antysensownej na końcu 3' oligonukleotydu DNA (1) [opisane w Frohman, M.A., Methods in Enzymol., 218, 340 (1993]. Zestaw do 5' RACE jest dostępny handlowo, odpowiednio 5' RACE System for Rapid Amplification of cDNA ends, Version 2.0 (wyprodukowany przez GIBCO Corporation).

3' RACE jest metodą stosującą region poliA istniejący na końcu 3' mRNA. Specyficznie, pierwsza nić cDNA jest syntetyzowana przez reakcję odwrotnej transkrypcji stosując mRNA jako matrycę adaptor oligo d(T) jako primer. Następnie dwuniciowy cDNA w regionie końca 3' jest amplifikowany za pomocą PCR stosując pierwszą nić cDNA jako matrycę. Jako primery stosuje się oligonukleotyd DNA (3) na nici sensownej zaprojektowany do znanej części sekwencji nukleotydów nici sensownej i adaptor oligo d(T) na nici antysensownej. Zestaw do 3' RACE jest handlowo dostępny, odpowiednio Ready-To-Go T-primed First-Strand Kit (Pharmacia Corporation).

Wyniki analizy 1) i 2) powyżej są korzystnie stosowane w procedurze RACE, w projektowaniu primerów opartym na znanej części interesującej sekwencji nukleotydów.

Stosując metody analizy opisane w 1) do 3) powyżej można wydedukować kierunek genu struktury w sekwencji genomowego DNA, położenie miejsca inicjacji transkrypcji w genie struktury, pozycję kodonu inicjacji translacji i kodon terminacji translacji i jego pozycję. W oparciu o powyższą informację można uzyskać każdy gen struktury i jego cDNA a mianowicie cDNA przyspieszających biosyntezę ML-236B.

Zakłada się, że we włączonej sekwencji w zrekombinowanym wektorze DNA pML48 uzyskanym według niniejszego wynalazku jest obecnych sześć genów struktury. Nazwane są odpowiednio mlcA mlcB, mlcC, mlcD, mlcE, i mlcR. Wśród nich zakłada się, że mlcA mlcB, mlcE i mlcR mają region kodujący na sekwencji nukleotydów przedstawionych w SEQ ID No. 2 Listy sekwencji. Zakłada się, że mlcC i mlcD mają region kodujący na sekwencji nukleotydów przedstawionej w SEQ ID No. 1 Listy sekwencji.

Przykłady sposobu uzyskania cDNA specyficznie przyspieszających biosyntezę ML-236B odpowiadających wymienionym powyżej genom struktury obejmują: klonowanie z RT-PCR stosując primery zaprojektowane dla sekwencji każdego genu struktury i jego flankującego DNA i klonowanie z biblioteki cDNA stosują c odpowiednie sondy DNA zaprojektowane dla znanych sekwencji nukleotydów. Inne odpowiednie metody są dobrze znane w dziedzinie. Aby wyrażać funkcjonalnie cDNA uzyskany według tych sposobów, korzystne jest uzyskanie cDNA pełnej długości.

Poniżej wytłumaczono sposób uzyskana cDNA przyspieszających biosyntezę ML-236B stosując RT-PCR.

Musi być zaprojektowana para primerów do RT-PCR i do uzyskania cDNA przyspieszającego biosyntezę ML-236B tak, że selektywnie hybrydyzuje z każdym łańcuchem matrycy, aby pozwolić na uzyskanie cDNA. Jednak nie jest niezbędne by primery do RT-PCR były całkowicie komplementarne do części każdego łańcucha matrycy, pod warunkiem że spełniają warunek opisany powyżej. Odpowiednie primery do RT-PCR, które mogą hybrydyzować z łańcuchem antysensowny, (dalej określany jako primer sensowny) są primerami sensownymi, które są całkowicie komplementarne do części łańcucha antysensownego (dalej określany jako niepodstawiony primer sensowny) lub primery sensowne, które nie są całkowicie komplementarne do części łańcucha antysensownego (dalej określany jako częściowo podstawiony primer sensowny). Inne odpowiednie primery do RT-PCR, które mogą hybrydyzować z łańcuchem sensownym (dalej określany jako primer antysensowny) są primerami antysensownymi, które są całkowicie komplementarne do części łańcucha sensownego (dalej określany jako niepodstawiony primer antysensowny) lub primery antysensowne, które nie są całkowicie komplementarne do części łańcucha sensownego (dalej określany jako częściowo podstawiony primer antysensowny).

Primer sensowny jest zaprojektowany odpowiednio tak, że produkt RT-PCR uzyskany z jego zastosowaniem zawiera kodon ATG w oryginalnej pozycji inicjacji translacji. Odpowiednio produkt RT-PCR także tylko zawiera prawidłowy kodon terminacji translacji w ramce odczytu mającej oryginalne miejsce startu ATG i nie ma dodatkowych (pozornych) miejsc zakończenia translacji. Pozycja kodonu inicjacji translacji tych genów struktury przewidzianych w niniejszym wynalazku jest przedstawiona w Tabeli 5 dla genów umieszczonych w SEQ ID No. 1 i SEQ ID No. 2 Listy sekwencji.

PL 202 457 B1

Koniec 5' niepodstawionego primeru sensownego jest odpowiednio nukleotydem 'A' kodonu inicjacji translacji ATG, lub zasadą istniejącą na jego końcu 5'.

Częściowo podstawiony primer sensowny hybrydyzuje selektywnie ze specyficznym regionem w SEQ ID No. 1 lub SEQ ID No. 2 Listy sekwencji, sekwencja nukleotydów SEQ ID No. 2 Listy sekwencji, który jest całkowicie komplementarna do SEQ ID No. 1 Listy sekwencji.

Gdy częściowo podstawiony primer sensowny zawiera sekwencję nukleotydów obecną po stronie 3' kodonu inicjacji translacji ATG, odpowiednio nie zawiera sekwencji nukleotydów w tym regionie, które są kodonami terminacyjnymi (TAA, TAG lub TGA) w tej samej ramce odczytu jak ATG.

Częściowo podstawiony primer sensowny może zawierać nukleotyd A, sekwencję nukleotydówAT lub ATG (dalej określany jako nukleotyd lub sekwencja nukleotydów m') która odpowiada nukleotydowi A, sekwencji nukleotydówAT lub ATG kodonu inicjacji translacji (dalej określany jako nukleotyd lub sekwencja nukleotydów m'). Gdy nukleotyd m' jest A, odpowiadający A sekwencji m, preferujemy że m' A jest umieszczone na końcu 3' częściowo podstawionego primera sensownego. Podobnie, gdy m' jest AT, korzystne jest żeby ta sekwencja m' AT była zlokalizowana na końcu 3' częściowo podstawionego primera sensownego. Gdy nukleotyd lub sekwencja nukleotydów m jest ATG, odpowiadające m' ATG, korzystne jest by te trinukleotydy, które są od strony 3' ATG w primerze nie były kodonami stop. Inaczej mówiąc, dla trinukleotydów nukleotyd końca 5' jest (3 x n +1) tym nukleotydem (n przedstawia liczbę całkowitą o wartości jedne lub więcej) liczone od A do m' ATG w kierunku końca 3' sekwencja nukleotydów trinukleotydu korzystnie nie jest TAA, TAG ani TGA. Primery opisane powyżej mogą być stosowane do uzyskania cDNA mającego kodon metioniny w pozycji odpowiadającej kodonowi inicjacji translacji mRNA stosowanego jako matryca RT-PCT.

Gdy koniec 3' częściowo podstawionego primera sensownego jest pozycją nukleotydu (3 x n + 1), korzystnie trinukleotyd, który rozpoczyna się w tej pozycji nie jest TAA, TAG ani TGA w produkcie RT-PCR uzyskanym stosując częściowo podstawiony primer sensowny jako jeden z primerów i RNA lub mRNA mikroorganizmu produkującego ML-236B jako matrycę, lub w produktach PCR uzyskanych poprzez genomowy DNA lub cDNA jako matrycę. Pozycja nukleotydu jest liczona od 'A' kodonu inicjacji translacji ATG w kierunku końca 3' i gdzie 'n' reprezentuje liczbę całkowitą jeden lub więcej.

Gdy koniec 3' częściowo podstawionego primera sensownego jest pozycją nukleotydu (3 x n + 2), trójka, dla której pozycja 3 x n+2 jest nukleotydem centralnym korzystnie nie jest żadną z sekwencji TAA, TAG ani TGA dla produktu PCR lub RT-PCR otrzymanego jak powyżej.

Gdy koniec 3' częściowo podstawionego primera sensownego jest w pozycji nukleotydu (3 x n+ 3), trójka, dla której pozycja (3 x n+ 3) przy 3' nukleotydzie korzystnie nie jest żadną z sekwencji TAA, TAG lub TGA.

Wymagania dla primera sensownego są jak przedyskutowano powyżej.

Zaprojektowano primer antysensowny tak, że gdy jest sparowany z primerem sensownym, można zamplifikować cDNA kodujący każdy z genów struktury (mlcA, mlcB, mlcC, mlcD, mlcE i mlcR) stosując RT-PCR w kierunku równoważnym do N-końca i C-końca odpowiadających peptydów.

Wybór niepodstawionego primera antysensownego nie jest ograniczony o ile jest primerem antysensownym mającym sekwencję nukleotydów komplementarną do sekwencji nukleotydów umieszczonej w regionie miejsca terminacji translacji cDNA. Jednak korzystny jest primer mający zasadę na końcu 5', która jest komplementarna do zasady na końcu 3' tego primera. Primer zawierający trzy zasady komplementarne do kodonu terminacji translacji, jest korzystny. Tabele 8 do 10 przedstawiają kodon terminacji translacji każdego genu struktury, sekwencję komplementarną do kodonu terminacji translacji, resztę aminokwasu na C-końcu peptydu kodowanego przez każdy gen struktury, sekwencję nukleotydów kodującą reszty aminokwasów i ich pozycji SEOJD No. 1 lub SEQ ID No. 2.

Częściowo podstawione primery antysensowne hybrydyzują selektywnie ze specyficznym obszarem w sekwencji nukleotydów SEQ ID No. 1 lub SEQ ID No. 2 Listy sekwencji.

Powyższe są wymaganiami dla primera antysensownego.

Jest możliwe dodanie odpowiedniej sekwencji nukleotydów do końca 5' częściowo podstawionych primerów sensownych i częściowo podstawionych primerów antysensownych o ile są spełnione powyżej wymienione wymagania. Wybór takiej sekwencji nukleotydów nie jest szczególnie ograniczony o ile primer może być użyty do PCR. Przykłady odpowiednich sekwencji obejmują sekwencje nukleotydów wygodne do klonowania produktów PCR, takie jak miejsca cięcia enzymów restrykcyjnych i sekwencję nukleotydów zawierającą odpowiednie miejsca cięcia enzymów restrykcyjnych.

Dodatkowo primer sensowny i primer antysensowny są odpowiednio zaprojektowane zgodnie z powyż szym opisem i z ogólnym schematem projektowania primerów do PCR.

PL 202 457 B1

Jak opisano powyżej, mRNA lub całkowity RNA z organizmu produkującego ML-236B może być stosowany jako matryca do RT-PCR. W obecnym wynalazku przyspieszający biosyntezę ML-236B cDNA odpowiadający genowi struktury mlcE uzyskano przez zaprojektowanie i syntezę pary primerów odpowiednich do amplifikacji całej sekwencji kodującej genu struktury mlcE w sekwencji wstawki pMI-48 i następnie przeprowadzenie RT-PCR stosując całkowity RNA SANK13380 jako matrycę [primery reprezentowane przez sekwencje nukleotydów SEQ ID No. 35 i 36 Listy sekwencji, odpowiednio].

Przyspieszający biosyntezę ML-236B cDNA odpowiadający genowi struktury mlcR uzyskano w podobny sposób stosując primery reprezentowane przez sekwencje nukleotydów SEQ ID No. 39 i 40 Listy sekwencji, odpowiednio.

Jak opisano powyżej, produkt RT-PCR może być sklonowany przez włączenie do odpowiedniego wektora DNA. Wybór wektora DNA stosowanego do takiego klonowania nie jest ograniczony i jest odpowiednio wektorem DNA ogólnie stosowanym do klonowania fragmentów DNA. Zestawy do łatwego przeprowadzenia klonowania produktu RT-PCR są dostępne handlowo i korzystny jest Original TA Cloning Kit [wyprodukowany przez lnvitrogen: stosujący pCR2.1 jako wektor DNA].

Potwierdzenie funkcjonalnej ekspresji cDNA przyspieszającego biosyntezę ML-236B cDNA uzyskanego stosując powyższe sposoby w mikroorganizmie produkującym ML-236B może być uzyskane przez sklonowanie cDNA do wektora DNA odpowiedniego do funkcjonalnej ekspresji w mikroorganizmie produkującym ML-236B. Odpowiednie komórki są wówczas transformowane zrekombinowanym wektorem i porównuje się zdolność do biosyntezy ML-236B transformowanych i nietransformowanych komórek gospodarza. Jeśli cDNA przyspieszający biosyntezę ML-236B jest funkcjonalnie wyrażany w transformowanej komórce wówczas zdolność do biosyntezy ML-236B transformowanej komórki jest poprawiona w porównaniu z komórką gospodarza.

Wybór wektora DNA odpowiedniego do ekspresji w mikroorganizmie produkującym ML-236B [dalej określany jako funkcjonalny wektor ekspresyjny] nie jest szczególnie ograniczony o ile może być on stosowany do transformacji mikroorganizmu produkującego ML-236B i może funkcjonalnie wyrażać polipeptyd kodowany przez cDNA przyspieszający biosyntezę ML-236B w tym organizmie. Korzystnie wektor jest odpowiedni w komórce gospodarza, i ma sekwencję nukleotydów, która pozwala na replikację w komórce gospodarza.

Wektor do funkcjonalnej ekspresji może zawierać jeden lub więcej niż jeden cDNA przyspieszający biosyntezę ML-236B, na przykład cDNA odpowiadające genom struktury mlcE i/lub mlcR.

Wektor do funkcjonalnej ekspresji może zawierać jeden lub więcej rodzajów DNA, innych niż cDNA odpowiadający genom struktury mlcE i/lub mlcR, które przyspieszają biosyntezę ML-236B gdy są wprowadzane do mikroorganizmu produkującego ML-236B. Przykłady takich DNA obejmują: cDNA odpowiadające genom struktury mlcA, mlcB, mlcC, lub mlcD, genomowy DNA związany z biosyntezą ML-236B, DNA kodujący czynniki regulujące ekspresją cDNA przyspieszającego biosyntezę ML-236B według niniejszego wynalazku lub podobne.

Wektor do funkcjonalnej ekspresji korzystnie zawiera sekwencję nukleotydów dostarczającą fenotyp selektywny dla plazmidu w komórce gospodarza i korzystnie jest wektorem wahadłowym.

Co więcej, fenotyp selektywny może być fenotypem oporności na lek, korzystnie oporności na antybiotyk i bardziej korzystnie oporności na ampicylinę lub oporności na hygromycynę B.

Jeśli wektor ekspresyjny jest wektorem wahadłowym, wektor odpowiednio zawiera sekwencję nukleotydów, która pozwala wektorowi na replikację w komórce gospodarza z jednej z grup mikroorganizmów i sekwencję nukleotydów potrzebną dla ekspresji polipeptydów kodowanych przez wstawkę wektora w innym typie komórki gospodarza. Jest korzystne by wektor dawał inny fenotyp selektywny dla każdej komórki gospodarza z różnych transformowanych grup mikroorganizmów. Wymagania dla kombinacji grup mikroorganizmów są podobne jak dla wektora wahadłowego stosowanego do klonowania i ekspresji genomowego DNA związanego z biosyntezą ML-236B opisane w obecnym zgłoszeniu.

W niniejszym wynalazku odpowiednim wektorem wahadłowym DNA jest pSAK700, skonstruowany przez połączenie promotora kinazy 3-fosfoglicerynianowej (dalej określany jako pgk) pochodzącego z Aspergillus nidulans istniejącego w wektorze DNA pSAK333 (opisane w Japońskim Zgłoszeniu Patentowym Publikacja Nr 3-262486), adaptera do włączenia obcego genu i terminatora pgk istniejącego w DNA, w tej kolejności (zobacz Figura 4).

Polipeptyd może być wyrażany w mikroorganizmie produkującym ML-236B przez włączenie cDNA odpowiadającego genowi struktury mlcE, opisanego powyżej, do wektora ekspresyjnego opisanego powyżej. W niniejszym wynalazku zrekombinowany wektor do ekspresji cDNA pSAKexpE uzyPL 202 457 B1 skano przez włączenie cDNA odpowiadającego genowi struktury mlcE do miejsca adaptera pSAK700. Sekwencja włączona w pSAKexpE, a mianowicie sekwencja nukleotydów cDNA odpowiadającego genowi struktury mlcE jest przedstawiona w SEQ ID No. 37 Listy sekwencji. Podobnie uzyskano zrekombinowany wektor pSAKexpR do ekspresji cDNA przez włączenie cDNA odpowiadającego genowi struktury mlcR do miejsca adaptera pSAK700. Sekwencja włączona w pSAKexpR, a mianowicie sekwencja nukleotydów cDNA odpowiadającego genowi struktury mlcR jest przedstawiona w SEQ ID No. 41 Listy sekwencji.

Escherichia coli pSAKexpE SANK 72499 to znaczy szczep Escherichia coli transformowany pSAKexpE zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu. FERM BP-7005, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów. Escherichia coli pSAKexpR SANK 72599 to znaczy szczep Escherichia coli transformowany przez pSAKexpR zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 25 stycznia 2000, jako numery depozytu. FERM BP-7006, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów.

Można wybrać odpowiednie sposoby transformacji w zależności od komórki gospodarza, aby uzyskać ekspresję cDNA przyspieszającego biosyntezę ML-236B, genomowego DNA związanego z biosyntezą ML-236B lub jego fragmentów. Transformacja Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B może być przeprowadzona przez przygotowanie protoplastów ze spor Penicillium citrinum, a następnie wprowadzenie zrekombinowanego wektora do protoplastów [opisane w Nara, F. i wsp., Curr. Genet. 23, 28 (1993)].

Odpowiednio spory ze skosu hodowli Penicillium citrinum zaszczepia się na płytkę podłoża agarowego PGA i inkubuje w 22 do 28°C, przez 10 do 14 dni. Spory następnie się zbiera z płytki i zaszczepia 1 x 10⁷ - 1 x 10⁹ spor do 50 do 100 ml podłoża hodowlanego YPL-20 [skład: 0,1% (waga/obj) ekstrakt drożdżowy (wyprodukowany przez Difco corporation), 0,5% (waga/obj) polipepton (wyprodukowany przez Nihon Seiyaku corporation), 20% (waga/obj) laktozy, pH 5,0], a następnie inkubuje w 22 do 28°C przez 18 godzin do dwóch dni. Kiełkujące spory odzyskuje się z hodowli i poddaje działaniu enzymów degradujących ścianę komórkową aby uzyskać protoplasty Wybór enzymu degradującego ścianę komórkową nie jest szczególnie ograniczony o ile może on degradować ścianę komórkową Penicillium citrinum i nie ma szkodliwego wpływu na mikroorganizm. Przykłady tego obejmują: zymoliazę, chitynazę lub podobne.

Zmieszanie zrekombinowanego wektora DNA zawierającego cDNA przyspieszającego biosyntezę ML-236B i mikroorganizmu produkującego ML-236B lub jego protoplastu w odpowiednich warunkach pozwala na wprowadzenie DNA zrekombinowanego wektora do tego protoplastu, aby dostarczyć transformanta.

Hodowla transformantów mikroorganizmu produkującego ML-236B jest odpowiednio przeprowadzana w warunkach odpowiednich dla każdej z komórek gospodarza. Hodowlę transformanta Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B można przeprowadzić przez hodowlę uprzednio transformowanego protoplast w warunkach odpowiednich do regeneracji ściany komórkowej, a następnie hodowanie. Mianowicie transformowany protoplast Penicillium citrinum może być wprowadzony do podłoża agarowego VGS środkowej warstwy [skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 2% (waga/obj) agar], i następnie agar VGS warstwy środkowej umieszcza się między podłożem agarowym VGS warstwy dolnej [skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 2,7% (waga/obj) agar] i podłożem agarowym VGS warstwy górnej

[skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 1,5% (waga/obj) agar] zawierającym 800 μg/ml hygromycyny B, a następnie inkubację w 22 do 28°C przez 7 do 15 dni. Powstały szczep subkulturuje się z inkubacją w 22 do 28°C na podłożu PGA. Szczep zaszczepia się platynową igłą na skos przygotowany z podłożem PGA, inkubuje w 22 do 28°C przez 10 do 14 dni, i następnie przechowuje w 0 do 4°C.

Jak opisano powyżej, można przygotować ML-236B wydajnie przez zaszczepienie transformanta Penicillium citrinum uzyskanego ze skosu jak powyżej i mającego zregenerowaną ścianę komórkową do podłoża MBG 3-8, a następnie inkubację w 22 do 28°C przez 7 do 12 z wytrząsaniem. Penicillium citrinum jako gospodarz może być hodowany także w podłożu płynnym aby wyprodukować

ML-236B.

Oczyszczanie ML-236B z hodowli transformanta mikroorganizmu produkującego ML-236B może być przeprowadzone przez połączenie różnych sposobów ogólnie stosowanych do oczyszczania

PL 202 457 B1 produktów naturalnych. Wybór takich metod nie jest szczególnie ograniczony i może być na przykład, przez wirowanie, rozdział substancji stałych i płynów przez sączenie, działanie zasadą lub kwasem, ekstrakcję rozpuszczalnikami organicznymi, rozpuszczenie, metody chromatograficzne takie jak chromatografia adsorpcyjna, chromatografia rozdziału lub podobne i krystalizacji lub podobne. ML-236B może być w postaci hydroksykwasu lub laktonu, które mogą być wzajemnie przekształcane w siebie. Hydroksykwas można przekształcić do jego soli, która jest bardziej stabilna. Stosując takie właściwości fizyczne można otrzymać ML-236B w formie hydroksykwasu (dalej określany jako wolny hydroksykwas), sole hydroksykwasu ML-236B (dalej określany jako sól hydroksykwasu), lub postać laktonu ML-236B (dalej określany jako lakton).

Hodowlę poddaje się hydrolizie alkalicznej w podwyższonej temperaturze lub pokojowej temperaturze dla otwarcia pierścienia i przekształcenia do soli hydroksykwasu i następnie roztwór reakcyjny zakwasza, a następnie przesącza. Przesącz ekstrahuje się rozpuszczalnikiem organicznym, który rozdziela się od wody by dostarczyć zamierzony produkt jako wolny hydroksykwas. Wybór rozpuszczalnika organicznego nie jest szczególnie ograniczony. Przykłady obejmują: alifatyczne węglowodory takie jak heksan, heptan lub podobne, aromatyczne węglowodory takie jak benzen, toluen lub podobne; chlorowcopochodne węglowodorów takie jak chlorek metylenu, chloroform lub podobne; etery takie jak eter dietylowy lub podobne; estry takie jak mrówczan etylu, octan etylu lub podobne; lub mieszanina złożona z dwóch lub więcej rozpuszczalników.

Zamierzony związek może być uzyskany jako sól hydroksykwasu przez rozpuszczenie wolnego hydroksykwasu w wodnym roztworze soli metalu alkalicznego takiego jak wodorotlenek sodu.

Dalej zamierzony związek może być uzyskany jako lakton przez zamknięcie pierścienia przez podgrzanie wolnego hydroksykwasu w rozpuszczalniku organicznym aby go odwodnić, lub za pomocą innych odpowiednich sposobów.

Możliwe jest oczyszczenie i izolacja otrzymanego w ten sposób wolnego hydroksykwasu, hydroksykwasu lub laktonu za pomocą chromatografii kolumnowej lub podobnej. Nośnik dla kolumny stosowanej do chromatografii nie jest szczególnie ograniczony. Przykłady obejmują: Sephadex LH-20 (produkowany przez Pharmacia Corporation), Diaion HP-20 (produkowany przez Mitsubishi Kagaku corporation), żel krzemionkowy, nośniki fazy odwróconej Iub podobne, nośniki serii C18 są korzystne.

Wybór sposobu oznaczenia ilościowego ML-236B nie jest szczególnie ograniczony, korzystna jest metoda ogólnie stosowana do oznaczenia ilościowego związków organicznych. Przykłady: wysokiej jakości chromatografia cieczowa fazy odwróconej (dalej określana jako HPLC fazy odwróconej) lub podobne. Oznaczenie ilościowe według HPLC fazy odwróconej może być przeprowadzone przez poddanie hodowli mikroorganizmu produkującego ML-236B hydrolizie alkalicznej, poddanie rozpuszczalnej frakcji HPLC fazy odwróconej stosując kolumnę C18, pomiar absorpcji w UV i przekształcenie wartości absorpcji na ilość ML-236B. Wybór kolumny C18 nie jest szczególnie ograniczony, korzystna jest kolumna C18 stosowana do ogólnego HPLC fazy odwróconej. Przykłady obejmują: SSC-ODS-262 (średnica 6 mm, długość 100 mm, wyprodukowany przez Senshu Kagaku corporation) lub podobne. Wybór rozpuszczalnika dla fazy ruchomej nie jest szczególnie ograniczony o ile jest to rozpuszczalnik ogólnie stosowany do HPLC fazy odwróconej. Jest to na przykład, 75% (obj/obj) metanol - 0,1% (obj/obj) trietyloamina - 0,1% (obj/obj) kwas octowy lub podobne. Gdy ML-236B jest dodawany w temperaturze pokojowej do kolumny SSC-ODS-262, gdzie stosuje się 75% (obj/obj) metanol - 0,1%(obj/obj) trietyloamina - 0,1%(obj/obj) kwas octowy jest stosowany jako faza ruchoma przy tempie 2 ml/minutę, ML-236B eluuje się po 4,0 minutach. ML-236B można wykryć stosując detektor do UV dla HPLC. Zaabsorbowana długość fali do detekcji UV wynosi 220 do 280 nm, korzystnie 220 do 260 nm, bardziej korzystnie 236 nm.

Dostarczone są kompozycje farmaceutyczne zawierające ML-236B uzyskane stosując niniejszy wynalazek, wraz z nośnikiem farmaceutycznym.

Dostarczone są także kompozycje farmaceutyczne zawierające prawastatyną preparowaną z ML-236B uzyskanego wedł ug niniejszego wynalazku razem z noś nikiem farmaceutycznym.

Kompozycje farmaceutyczne według wynalazku mogą być konwencjonalne i takie same jak te stosowane dla istniejących formuł ML-236B lub prawastatyny.

Sposoby leczenia są także częścią wynalazku i stosują związek lub kompozycje do leczenia hiperlipemii i innych stanów.

Wynalazek jest obecnie ilustrowany bardziej szczegółowo przez odniesienie do następujących Figur i Przykładów. Przykłady są ilustracją ale nie są ograniczeniem niniejszego wynalazku.

PL 202 457 B1

Opis figur

Figura 1 jest schematem przedstawiającym konstrukcję wektora DNA pSAKcos1;

Figura 2 jest wynikiem analizy genów struktury wstawionej sekwencji pML48;

Figura 3 przedstawia hybrydyzacje typu Northern wstawionej sekwencji pML48;

Figura 4 jest schematem przedstawiającym konstrukcję wektora ekspresyjnego cDNA pSAK700; i

Figura 5 przedstawia analizę RT-PCR dla transkrypcji mlc A-E i R w transformancie pSAKexpR.

Figura 6 przedstawia analizę RT-PCR dla transkrypcji mlcE w transformancie pSAKexpE.

P r z y k ł a d y w y n a l a z k u

P r z y k ł a d 1: Konstrukcja wektora pSAKcos1

Plazmid pSAK333 zawierający gen fosfotransferazy hygromycyny B (dalej określany jako HPT) pochodzący z Escherichia coli (Japońskie Zgłoszenie Patentowe Publikacja Nr 3-262486) strawiono enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia), i poddano działaniu polimerazy DNA T4 (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia) w celu uzyskania tępych końców.

Fragment DNA uzyskany jak powyżej samoligowano do formy kolistej stosując zestaw do ligacji Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia), i następnie transformowano nim kompetentne komórki Escherichia coli JM 109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Szczep mający plazmid, w którym miejsce BamHI uległo delecji wybrano z transformowanej Escherichia coli i określono jako pSAK360.

pSAK 360 strawiono enzymem restrykcyjnym Pvull i następnie poddano działaniu fosfatazy alkalicznej aby wyprodukować fragment defosforylowany na końcu 5'. Fragment Sall-Scal (około 3kb) zawierający miejsce cos uzyskano z wektora kosmidowego pWE15 (wyprodukowany przez STRATAGENE) i poddano działaniu polimerazy DNA T4 aby uzyskać tępe końce. Następnie został wligowany w miejsce Pvull pSAK360. JM109 transformowano tym DNA. Szczepy mające plazmid do którego wstawiono fragment Sall-Scal (około 3kb) w miejscu Pvull wybrano z transformowanej Escherichia coli, i plazmid niesiony przez szczep określono jako pSAKcos1. pSAKcos1 zawiera miejsca cięcia dla enzymów restrykcyjnych BamHI, EcoRI i Notl, każde miejsce pochodzi z pWE15. pSAKcos1 ma gen oporności na ampicylinę i gen oporności na hygromycynę jako markery selekcyjne.

W następujących przykładach, gdy jako gospodarza stosowano Escherichia coli selekcja transformantów pSAKcos1 lub transformantów pSAKcos1 zawierających wstawkę obcego genu była przeprowadzana przez dodanie 40 μg/ml ampicyliny (Ampicillin: wyprodukowana przez Sigma Corporation) do odpowiedniego podłoża. Gdy jako gospodarza stosowano Penicillium citrinum SANK13380, selekcja transformantów pSAKcos1 lub transformantów pSAKcos1 zawierających wstawkę obcego genu była przeprowadzana przez dodanie 200 μg/ml hygromycyny (Hygromycin B: wyprodukowana przez Sigma Corporation) do odpowiedniego podłoża.

Sposób konstrukcji pSAKcos1 przedstawiono na Fig.1

P r z y k ł a d 2: Przygotowanie genomowego DNA Penicillium citrinum SANK 13380

1) Hodowla Penicillium citrinum SANK 13380

Zrobiono wyjściową hodowlę Penicillium citrinum SANK 13380 na skosie z podłoża agarowego PGA. Mianowicie agar zaszczepiono Penicillium citrinum SANK 13380 stosując igłę platynową i trzymano w 26°C przez 14 dni. Skos przechowywano w 4°C.

Główną hodowlę prowadzono w napowietrzanej hodowli płynnej. Komórki z 5 mm kwadratu wymienionego powyżej skosu zaszczepiono do 50 ml podłoża MBG3-8 w 500 ml kolbie stożkowej i inkubowano w 26°C z wytrząsaniem przy 210 obr/min przez pięć dni.

2) Przygotowanie genomowego DNA z Penicillium citrinum SANK 13380

Hodowlę uzyskaną w etapie 1) zwirowano przy 10000 x G w temperaturze pokojowej przez 10 minut i zebrano komórki. 3g (mokra masa) komórek rozbito w moździerzu oziębionym suchym lodem do postaci proszku. Rozbite komórki umieszczono w probówce do wirowania wypełnionej 20 ml buforu 62,5 mM EDTA2Na (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) - 5% (waga/obj)SDS - 50mM Tris kwas solny (pH 8,0) (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i wymieszano je delikatnie a następnie pozostawiono w 0°C przez jedną godzinę. Dodano 10 ml fenolu nasyconego 10 mM Tris kwas solny - 0,1 mM EDTA2Na (pH 8,0, dalej określany jako TE) i mieszano delikatnie w 50°C przez jedną godzinę.

Po wirowaniu w temperaturze pokojowej przy 10000 x G przez 10 minut, 15 ml górnej warstwy (faza wodna) umieszczono w innej probówce do wirowania. Do roztworu dodano 0,5 objętości fenolu

PL 202 457 B1 nasyconego TE i 0,5 objętości roztworu chloroformu. Mieszaninę mieszano przez dwie minuty i wirowano w temperaturze pokojowej przy 10000 x G przez 10 minut (dalej określane jako ekstrakcja fenolem-chloroformem). Do 10 ml warstwy górnej (faza wodna) dodano 10 ml 8M octanu amonu (pH 7,5) i 25 ml 2-propanolu (wyprodukowany przez Wako Pure Chemical Industries, Ltd.), a następnie schł odzenie w -80°C przez 15 minut i wirowanie w 4°C przy 10000 x G przez 10 minut.

Po strąceniu osady rozpuszczono w 5 ml TE, po czym dodano 20 μΐ 10 mg/ml rybonukleazy A (wyprodukowana przez Sigma corporation) i 250 jednostek rybonukleazy T1 (wyprodukowana przez GIBCO Corporation), a następnie inkubowano w 37°C przez 20 minut. Dodano 20 ml 2-propanolu i łagodnie wymieszano. Następnie nici genomowego DNA nawinięto na koniec pipety pasterowskiej i rozpuszczono w jednym ml TE.

Następnie do roztworu DNA dodano 0,1 objętości 3 M octanu sodu (pH 6,5) i 2,5 objętości etanolu. Roztwór schłodzono do - 80°C przez 15 minut i następnie odwirowano w 4°C, przy 10000 x G przez pięć minut (następnie określane jako strącanie etanolem). Powstały osad rozpuszczono w 200 μl TE, i był frakcją genomowego DNA.

P r z y k ł a d 3: Przygotowanie biblioteki genomowego DNA Penicillium citrinum SANK13380

1) Przygotowanie fragmentu genomowego DNA

0,25 jednostek Sau3AI (Takara Shuzo Co., Ltd., Japonia) dodano do 100 μl wodnego roztworu genomowego DNA (50 μg) Penicillium citrinum SANK13380 uzyskanego w Przykładzie 2. Po przedziałach 10, 30, 60, 90 i 120 sekund pobrano próbki 20 μl mieszaniny i do każdej próbki dodano 0,5 M EDTA (pH 8,0) aby zakończyć reakcję enzymu restrykcyjnego. Powstałe częściowo strawione fragmenty DNA rozdzielono za pomocą elektroforezy w żelu agarozowym i odzyskano żel agarozowy zawierający fragmenty DNA 30 kb lub większe.

Odzyskany żel rozgnieciono na drobne fragmenty i umieszczono w Ultra Free C3 Centrifuged Filtration Unit (wyprodukowany przez Japan Milipore Corporation). Żel schłodzono w -80°C przez 15 minut do momentu zamarznięcia i następnie żel stopiono przez inkubację go w 37°C przez 10 minut. Był on wirowany przy 5000 x G przez 5 minut, aby wyekstrahować DNA. DNA poddano ekstrakcji fenol - chloroform i strącono etanolem. Powstałe osady rozpuszczono w małej odpowiedniej ilości TE.

2) Wstępna obróbka DNA wektora pSAKcos1 pSAKcos1 strawiono enzymem restrykcyjnym BamHI (Takara Shuzo Co., Ltd., Japonia), i następnie poddano działaniu fosfatazy alkalicznej (Takara Shuzo Co., Ltd., Japonia) w 65°C przez 30 minut. Powstały roztwór reakcyjny poddano ekstrakcji fenol-chloroform i strąceniu etanolem. Powstały osad rozpuszczono w małej ilości TE.

3) Ligacja i pakowanie in vitro

Genomowy fragment DNA (2 |ag) opisany w powyższym etapie 1) i pSAKcos1 (1 μg poddany wstępnej obróbce jak powyżej zmieszano i następnie zligowano w 16°C przez 16 godzin stosując zestaw do ligacji DNA kit Ver.2 (Takara Shuzo Co., Ltd., Japonia). Powstały roztwór reakcyjny poddano ekstrakcji fenol - chloroform i strąceniu etanolem. Powstałe osady rozpuszczono w 5 μl TE. Roztwór produktu ligacji poddano pakowaniu in vitro stosując GIGAPAK II Gold kit (wyprodukowany przez STRATAGENE corporation) aby dostarczyć transformanty Escherichia coli zawierające zrekombinowany wektor DNA. 3 ml podłoża LB wylano na szalkę, na której powstały kolonie transformanta Escherichia coli, i odzyskano kolonie na szalce stosując zdrapywacz do komórek (określane jako odzyskany roztwór 1). Płytkę wypłukano kolejnymi 3 ml podłoża LB i komórki odzyskano (określane jako odzyskany roztwór 2). Do mieszaniny odzyskanych roztworów 1 i 2 dodano glicerol aby uzyskać ostateczne stężenie 18% (określane jako roztwór komórek Escherichia coli), który trzymano w - 80°C jako bibliotekę genomowego DNA Penicillium citrinum SANK13380.

P r z y k ł a d 4: Amplifikacja fragmentu genu PKS za pomocą PCR stosując genomowy DNA Penicillium citrinum SANK13380 jako matrycę

1) Zaprojektowanie i synteza primerów do PCR.

W oparciu o sekwencję aminokwasów genu PKS Aspergillus flavus (opisana w Brown, D.W. i wsp., Proc. Natl. Acad. Sci. USA, 93, 1418 (1996)), zaprojektowano i zsyntetyzowano zdegenerowane primery pokazane w SEQ ID No. 3 i 4 Listy sekwencji. Syntezę przeprowadzono według metody fosfoaminidynowej.

SEQ ID No. 3 Listy sekwencji:

gayacngcntgyasttc

SEQ ID No. 4 Listy sekwencji:

tcnccnknrcwgtgncc

PL 202 457 B1

W sekwencji nukleotydów SEQ ID No. 3 i 4, n przedstawia inozynę (hipoksantynę ), y przedstawia t lub c, s przedstawia g lub c, k przedstawia g lub t, r przedstawia g lub a, i w przedstawia a lub t.

2) Amplifikacja odcinka DNA za pomocą PCR

Przygotowano 50 μΐ roztworu do reakcji zawierającego primery do PCR opisane w powyższym etapie 1) (każdy 100 pmol), genomowy DNA Penicillium citrinum SANK13380 uzyskany w Przykładzie 2 (500 ng), 0,2 mM dATP, 0,2 mM dCTP, 0,2 mM dGTP, 0,2 mM dTTP, 50 mM chlorek potasu, 2 mM chlorek magnezu i 1,25 jednostek polimerazy DNA Ex. Tac (Takara Shuzo Co., Ltd., Japonia). Roztwór poddano cyklowi reakcji złożonemu z trzech następujących kolejnych etapów: jedna minuta w 94°C, dwie minuty w 58°C i 3 minuty w 70°C. Cykl powtórzono 30 razy aby zamplifkować fragment DNA. PCR przeprowadzono stosując TaKaRa PCR Thermal Cycler MP TP 3000 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia).

Zamplifikowane fragmenty DNA poddano elektroforezie w żelu agarozowym i następnie odzyskano agarozę zawierającą fragmenty DNA mające wielkość około 1,0 do 2,0 kb. DNA odzyskano z żelu i poddano ekstrakcji fenol-chloroform i strącono etanolem. Powstały osad rozpuszczono w małej ilości TE.

3) Ligacja i transformacja

Fragment DNA uzyskany w etapie 2) zligowano z plazmidem pCR2.1 stosując system klonowania TA pCR 2.1 (wyprodukowany przez lnvitrogen Corporation), plazmid jest dostarczony jako część zestawu. Plazmidem transformowano Escherichia coli JM109 aby uzyskać transformanty.

Z powstałych transformantów wybrano kilka kolonii i hodowano je według metody Maniatis i wsp., [opisane w Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Mianowicie każą z kolonii zaszczepiono do probówki 24 ml zawierającej 2 ml podłoża LB i inkubowano w 37°C przez 18 godzin z wytrząsaniem.

Zrekombinowany wektor DNA przygotowano z hodowli za pomocą metody lizy alkalicznej (opisanej w in Maniatis, T. i wsp., powyżej). A mianowicie 1,5 ml roztworu hodowli żwirowano w temperaturze pokojowej przy 10000 x G przez dwie minuty. Komórki następnie odzyskano z osadu. Do komórek dodano 100 μl roztworu 50 mM glukozy, 25 mM Tris - kwas solny, 10 mM EDTA (pH 8,0), aby wytworzyć zawiesinę. Do niej dodano 200 μl 0,2 N wodorotlenek sodu - 1% (waga/obj) SDS. Roztwór mieszano łagodnie aby zlizować mikroorganizmy. Następnie dodano 150 μl 3 M octanu potasu 11,5%(waga/obj) kwas octowy by zdenaturować białka a następnie wirowano w temperaturze pokojowej przy 10000 x G przez 10 minut. Odzyskano zawiesinę. Supernatant poddano ekstrakcji fenolem-chloroformem i strącaniu etanolem. Powstały osad rozpuszczono w 50 μl TE zawierającego 40 μg/ml rybonukleazy A (wyprodukowany przez Sigma Corporation).

Każdy ze zrekombinowanych wektorów DNA strawiono enzymem restrykcyjnym i poddano elektroforezie. Sekwencję nukleotydów wstawek DNA w zrekombinowanych wektorach DNA określono stosując sekwenator DNA (model 377: wyprodukowany przez Perkin Elmer Japonia) dla wszystkich wstawek mających różne wzory trawienia przy elektroforezie.

W ten sposób zidentyfikowano szczep mający wektor ze zrekombinowanym DNA zawierający fragment PKS pochodzący z Penicillium citrinum.

P r z y k ł a d 5: Genomowa hybrydyzacja techniką Southerna Penicillium citrinum SANK13380

1) Elektroforeza i przeniesienie na błonę

Genomowy DNA (10 μg) Penicillium citrinum SANK13380 uzyskany w Przykładzie 2 strawiono enzymem restrykcyjnym EcoRI, SalI, Hind-lll lub Sac1 (wszystkie wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), i następnie poddano elektroforezie w żelu agarozowym. Żel przygotowano stosując agarozę L03 TAKARA (Takara Shuzo Co., Ltd., Japonia). Po elektroforezie, żel moczono w 0,25 N kwasie solnym (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i inkubowano w temperaturze pokojowej przez 10 minut z łagodnym wytrząsaniem. Żel przenoszono do 0,4 N wodorotlenku sodu (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i łagodnie inkubowano w temperaturze pokojowej przez 30 minut. Stosując metodę zasadowego transferu Maniatis i wsp. (powyżej), DNA w żelu przenoszono na nylonową membranę Hybond ™-N+ (wyprodukowany przez Amersham corporation) i utrwalono na niej. Membranę płukano 2 x SSC (1 x SSC zawiera 150 mM NaCI, 15 mM cytrynian sodu) i suszono na powietrzu.

2) Hybrydyzacja i detekcja sygnału

Błonę uzyskaną w etapie 1) hybrydyzowano z fragmentem genu PKS uzyskanym w Przykładzie 4 jako sondą.

PL 202 457 B1

Aby uzyskać sondę 1 μg DNA fragmentu wstawki genu PKS uzyskanego w Przykładzie 4 znakowano DIG DNA Labeling Kit (wyprodukowany przez Boeringer-Mannheim) i gotowano przez 10 minut i następnie szybko schłodzono tuż przed użyciem.

Membranę opisaną w etapie 1) moczono w płynie do hybrydyzacji (DIG Easy Hyb: wyprodukowany przez Boeringer-Mannheim) i następnie poddano prehybrydyzacji z wytrząsaniem przy 20 obr/min w 42°C przez 2 godziny. Następnie do roztworu do hybrydyzacji dodano wymienioną powyżej wyznakowaną sondę, i przeprowadzono hybrydyzację z wytrząsaniem w 20 obr/min w 42°C przez 18 godzin stosując Multishaker Oven HB (wyprodukowany przez TAITEC corporation). Błona poddana hybrydyzacji była następnie płukana trzy razy stosując 2 x SSC w temperaturze pokojowej przez 20 minut, a następnie dwa płukania stosując 0,1 x SSC w 55°C przez 30 minut.

Przepłukaną membranę poddano działaniu DIG Luminescent Detection Kit for Nucleic Acids (wyprodukowany przez Boeringer-Mannheim) i eksponowano na kliszę rentgenowską (Lumifilm, wyprodukowany przez Boeringer-Mannheim). Ekspozycję przeprowadzono stosując maszynę do obrabiania klisz medycznych Fuji FPM 800A (wyprodukowany przez Fuji Film Corporation).

Potwierdzono, że fragment genu PKS uzyskany w Przykładzie 4 jest obecny w genomie Penicillium citrinum.

P r z y k ł a d 6: Przeszukiwanie biblioteki genomowego DNA Penicillium citrinum SANK13380 stosując fragment genu PKS jako sondę

Klonowanie genomowego fragmentu DNA zawierającego gen PKS przeprowadzono stosując metodę hybrydyzacji kolonijnej.

1) Przygotowanie membrany

Roztwór komórek Escherichia coli utrzymywany jako biblioteka genomowego DNA f Penicillium citrinum SANK13380 (opisany w Przykładzie 3) rozcieńczono i rozprowadzono na płytce z podłożem agarowym LB tak by na płytce rosło 5000 do 10000 kolonii. Płytki trzymano w 26°C przez 18 godzin i schłodzono do 4°C przez jedną godzinę. Hybond™-N+ (wyprodukowany przez Amasham corporation) umieszczono na płytce i kontaktowano go z nią przez jedną minutę. Błona do której przylegała kolonia była starannie usuwana z płytki. Powierzchnia, które była w kontakcie z koloniami była odwracana do góry i moczona w 200 ml roztworu 1,5 M chlorku sodu, 0,5 N wodorotlenku sodu przez 7 minut i następnie moczono w 200 ml roztworu 1,5 M chlorku sodu, 0,5 M Tris kwas solny, 1 mM EDTA (pH 7,5) przez trzy minuty dwa razy i następnie płukano 400 ml 2 x SSC. Płukaną membranę suszono na powietrzu 30 minut.

2) Hybrydyzacja

DNA wstawki genu otrzymany w Przykładzie 4 (1 μg) zastosowano jako sondę. DNA wyznakowano stosując DIG DNA Labeling Kit (wyprodukowany przez Boeringer-Mannheim) i gotowano go 10 minut i szybko schłodzono bezpośrednio przed użyciem.

Membranę opisaną w etapie 1) moczono w płynie do hybrydyzacji (DIG Easy Hyb: wyprodukowany przez Boeringer-Mannheim) a następnie poddano prehybrydyzacji z wytrząsaniem przy 20 obr/min w 42°C przez 2 godziny. Następnie do roztworu do hybrydyzacji dodano wymienioną powyżej wyznakowaną sondę i przeprowadzono hybrydyzację z wytrząsaniem w 20 obr/min w 42°C przez 18 godzin stosując Multishaker Oven HB (wyprodukowany przez TAITEC corporation). Błona poddana hybrydyzacji była następnie płukana trzy razy stosując 2 x SSC w temperaturze pokojowej przez 20 minut, a następnie dwa płukania stosując 0,1 x SSC w 68°C przez 30 minut.

Przepłukaną membranę poddano działaniu DIG Luminescent Detection Kit for Nucleic Acids (wyprodukowany przez Boehringer-Mannheim) i eksponowano na kliszę rentgenowską (Lumifilm, wyprodukowany przez Boeringer-Mannheim). Ekspozycję przeprowadzono stosując maszynę do obrabiania klisz medycznych Fuji FPM 800A (wyprodukowany przez Fuji Film Corporation).

Powyższe etapy 1) i 2) są określane jako przeszukiwanie.

Kolonie na płytce, na której wykryto dodatni sygnał przy pierwszym przeszukiwaniu zdrapano i odzyskane komórki zawieszono w podłożu LB. Następnie komórki odpowiednio rozcieńczono i rozsiano na odpowiedniej płytce. Następnie przeprowadzono drugie przeszukiwanie aby oczyścić dodatni klon.

Dodatni klon uzyskany w obecnym przykładzie, a mianowicie transformowana Escherichia coli, szczep Escherichia coli pML48 SANK71199 został zdeponowany w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 7 lipca 1999 jako depozyty Nr FERM BP-6780, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów,

PL 202 457 B1

P r z y k ł a d 7: Analiza wstawionej sekwencji zrekombinowanego wektora DNA pML48 (1)

Hodowlę szczepu Escherichia coli pML48 SANK71199 uzyskanego w Przykładzie 6 i przygotowanie DNA zrekombinowanego wektora z hodowli przeprowadzono podobnie jak opisano w Przykładzie 4.

Uzyskany wektor DNA określono jako pML48. Wstawkę pML48, która jest genomowym DNA związanym z biosyntezą ML-236B strawiono różnymi enzymami restrykcyjnymi i powstałe fragmenty subklonowano w pUC119 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Stosując powstałe subklony jako sondy przeprowadzono hybrydyzację typu Southerna w sposób podobny jak opisano w Przykładzie 5. Mianowicie produkty uzyskane przez trawienie pML48 różnymi enzymami restrykcyjnymi poddano elektroforezie i DNA przeniesiono na membranę i poddano hybrydyzacji. W efekcie sporządzono mapę restrykcyjną wstawionej sekwencji pML48 stosując standardowe w dziedzinie techniki.

Ustalono sekwencję nukleotydów wstawionej sekwencji każdego z subklonów stosując sekwenator DNA model 377 (wyprodukowany przez Perkin Elmer Japonia Co.Ltd.), a następnie określono całą sekwencję nukleotydów pML48.

Wstawiona sekwencja pML48 składała się łącznie z 34203 zasad.

Sekwencja nukleotydów wstawionej sekwencji pML48 jest opisana w SEQ ID No. 1 i 2 Listy sekwencji. Sekwencje opisane w SEQ ID No. 1 i 2 Listy sekwencji są całkowicie komplementarne do siebie.

Istnienie genów strukturalnych na sekwencji wstawki pML48 analizowano stosując program poszukiwania genów GRAIL (ApoCom GRAIL Toolkit: wyprodukowany przez Apcom Corporation) i program poszukiwania homologii BLAST (Gapped-BLAST (BLAST2): zainstalowany w pakiecie WISCONSIN GCG ver.10.0).

W efekcie przewidziano, że we wstawionej sekwencji pML48 istnieje sześć różnych genów, i zostały one określone jako mlcA, mlcB, mlcC, mlcD, mlcE i mlcR odpowiednio. Co więcej przewidziano, że mlcA, mlcB, mlcE i mlcR mają region kodujący w sekwencji nukleotydów SEQ ID NO. 2 Listy sekwencji i mlcC i mlcD mają region kodujący w sekwencji nukleotydów SEQ ID NO. 1 Listy sekwencji. Względne położenie i długość każdego z przypuszczalnych genów struktury wstawionej sekwencji było też przewidziane.

Wyniki tego przykładu przedstawiono na Figurze 2. Każda strzałka wskazuje położenie, kierunek i względną wielkość każdego genu struktury na wstawce pML48. Strzałka, która wskazuje w lewo pokazuje, że region kodujący genu struktury (mlcA, B, E lub R) istnieje na ID SEQ NO 2. Strzałka, która wskazuje w prawo wskazuje, że region kodujący genu struktury (mlcC lub D) istnieje na ID SEQ NO 1.

P r z y k ł a d 8: Analiza wstawionej sekwencji wektora zrekombinowanego DNA pML48 (2)

Analizę ekspresji genów struktury, których obecność przewidziano w Przykładzie 7 przeprowadzono za pomocą hybrydyzacji typu Northern hybrydyzacja i RACE. Przeprowadzono analizę regionów końców 5' i 3'.

1) Preparatyka całkowitego RNA Penicillium citrinum SANK13380

Komórki z kwadratu 5 mm hodowli Penicillium citrinum SANK 13380 na skosie (opisanej w Przykładzie 2) zaszczepiono do 10 ml podłoża MGB3-8 w 100 ml kolbie stożkowej i inkubowano w 26°C przez 3 dni z wytrząsaniem.

Preparatykę całkowitego RNA z hodowli przeprowadzono z RNeasy Plant Mini Kit (wyprodukowany przez Qiagen AG), który stosuje metodę rodanku guanidyny. Mianowicie hodowlę zwirowano w temperaturze pokojowej przy 5000 x G przez 10 minut aby odzyskać komórki. Następnie 2 g (mokra masa) komórek zamrożono w ciekłym azocie i następnie rozgnieciono w moździerzu aby otrzymać proszek. Rozgniecione komórki zawieszono w 4 ml buforu do lizy (zawarty w zestawie). 450 μl zawiesiny wlano do każdej z 10 kolumn do wirowania QlAshredder zawartych w zestawie i następnie wirowano w temperaturze pokojowej przy 1000 x G przez 10 minut. Odzyskano każdy z powstałych eluatów i dodano do nich 225 μl etanolu, co następnie dodano do minikolumny do wirowania RNA zawartej w zestawie. Kolumnę płukano buforem do płukania zawartym w zestawie, a następnie eluowano zadsorbowane cząsteczki w każdej kolumnie za pomocą 50 μl wody destylowanej wolnej od rybonukleazy. Eluat użyto jako całkowitą frakcję RNA.

2) Hybrydyzacja typu Northern

Uzyskano próbkę RNA przez dodanie 2,25 μl wodnego roztworu zawierającego 20 μg całkowitego RNA Penicillium citrinum SANK13380 do: jednego μl 10 x MOPS (skład: 200 mM kwas 3-morfolino propanosulfonowy, 50 mM octan sodu, 10 mM EDTA2Na; pH 7,0; stosowane po sterylizacji w 121°C przez 20 minut w autoklawie; wyprodukowany przez Dojinkagaku Laboratory Co.Ltd.), 1,75μl formaldehydu i 5 μl formamidu, a następnie zmieszano. Próbkę RNA trzymano w 65°C przez 10 minut, a następnie

PL 202 457 B1 szybko schłodzono w wodzie z lodem i poddano elektroforezie w żelu agarozowym. Żel do elektroforezy przygotowano przez zmieszanie 10 ml 10 x MOPS i jednego grama agarozy L03 TAKARA (wyprodukowana przez Takara Shuzo Co., Ltd., Japonia) z 72 ml wody traktowanej estrem dietylowym kwasu pirowęglowego (wyprodukowany przez Sigma Corporation), podgrzano w celu rozpuszczenia agarozy, i następnie schłodzono, po czym dodano 18 ml formaldehydu. Jako bufor do próbki stosowano 1 x MOPS (przygotowany przez rozcieńczenie 10 x MOPS 10 krotnie wodą). RNA w żelu przeniesiono na Hybond ™-N+ (wyprodukowany przez Amasham corporation) w 10 X SSC.

Fragmenty DNA a, b, c, d i e, uzyskane przez trawienie wstawionej sekwencji pML48 enzymami restrykcyjnymi 1 i 2 przedstawione w następującej Tabeli 1, zastosowano jako sondy. Na górnym panelu Figury 3 pokazano lokalizację każdej sondy wstawki pML48.

T a b e l a 1

Sondy do hybrydyzacji typu Northern

Sonda	Enzym restrykcyjny 1	Numer nukleotydu miejsca enzymu restrykcyjnego *	Enzym restrykcyjny 2	Numer nukleotydu miejsca enzymu restrykcyjnego *
a	EcoRI	6319 do 6324	EcoRI	15799 do 15804
b	BamHI	16793 do 16798	Pstl	18164 do 18169
c	Kpnl	26025 do 26030	BamHI	27413 do 27418
d	SalI	28691 do 28696	SalI	29551 do 29556
e	Hindlll	33050 do 33055	SacI	34039 do 34044

* Każ dy Nr nukleotydu istnieje na SEQ ID No. 1 Listy sekwencji

Oznakowanie sond, hybrydyzacja i detekcja sygnału były przeprowadzone według hybrydyzacji typu Southerna opisanej w Przykładzie 5.

Wyniki Przykładu przedstawiono w dolnym panelu Figury 3.

Każdy sygnał pokazuje istnienie produktu transkrypcji homologicznego do sekwencji nukleotydów każdej sondy.

Wyniki sugerują, że geny struktury, których istnienie przewidziano we wstawionej sekwencji pML48 w obecnym przykładzie, a mianowicie mlcA mlcB, mlcC mlcD, mlcE i mlcR były transkrybowane w Penicillium citrinum SANK13380.

Pozycja każdego sygnału nie pokazuje względnej wielkości produktu transkrypcji.

3) Określenie końca 5' ekwencji za pomocą 5' RACE cDNA zawierający region końca 5' każdego genu struktury uzyskano stosując 5' RACE System for Rapid Amplification of cDNA ends, Version 2.0 (wyprodukowany przez GIBCO corporation).

Wyprodukowano dwa rodzaje antysensownych oligonukleotydów DNA. Projekt był oparty na sekwencji nukleotydów uważanej za obecną w regionie kodującym blisko końca 5' każdego genu struktury we wstawionej sekwencji pML48, jak przewidziały wyniki Przykładu 7 i punkt 2) tego przykładu.

Sekwencja nukleotydów antysensownego oligonukleotydu DNA (1) zaprojektowanego w oparciu o sekwencję nukleotydów na końcu 3' każdego genu struktury jest przedstawiona w Tabeli 2. Sekwencja nukleotydów antysensownego oligonukleotydu DNA (2), zaprojektowanego w oparciu o sekwencję nukleotydów na końcu 5' każdego genu struktury była przedstawiona w Tabeli 3.

T a b e l a 2: Oligonukleotydy DNA (1) stosowane do określenia sekwencji końca 3' za pomocą 5'RACE

Gen	SEQ ID No. z listy sekwencji	Sekwencja nukleotydów
mlcA	SEQ ID No.5	Gcatgttcaatttgctctc
mlcB	SEQ ID No.6	Ctggatcagacttttctgc
mlcC	SEQ ID No.7	Gtcgcagtagcatgggcc
mlcD	SEQ ID No.8	Gtcag ag tg atg ctcttctc
mlcE	SEQ ID No.9	Gttgagaggattgtgagggc
mlcR	SEQ ID No.10	Ttgcttgtgttggattgtc

PL 202 457 B1

T a b e l a 3: Oligonukleotydy DNA (2) stosowane do określenia sekwencji końca 5' za pomocą 5'RACE

Gen	SEQ ID No. Listy sekwencji	Sekwencja nukleotydów
mlcA	SEQ ID No.11	Catggtactctcgcccgttc
mlcB	SEQ ID No.12	Ctccccagtacgtaagctc
mlcC	SEQ ID No.13	Ccataatgagtgtgactgttc
mlcD	SEQ ID No.14	Gaacatctgcatccccgtc
mlcE	SEQ ID No.15	Ggaaggcaaagaaagtgtac
mlcR	SEQ ID No.16	Ag attcattg ctgttg g catc

Pierwszą nić cDNA zsyntetyzowano według reakcji odwrotnej transkryptazy stosując oligonukleotyd DNA (1) jako primer i całkowity RNA Penicillium citrinum SANK13380 jako matrycę. Mianowicie 24 μI mieszaniny reakcyjnej zawierającej jeden μg całkowitego RNA, 2,5 pmol oligonukleotydu DNA (1) i jeden μl odwrotnej transkryptazy SUPER SCRIPTTM II (zawartej w zestawie) inkubowano w 16°C przez jedną godzinę i produkt reakcji dodano do naboju do wirowania GLASSMAX zawartego w zestawie aby oczyścić pierwszą nić cDNA.

Do końca 3'cDNA pierwszej nici dodano łańcuch poliC stosując terminalną deoksyrybonukleotydylo transferazę zawartą w zestawie.

μl mieszaniny reakcyjnej zawierającej pierwszą nić cDNA do której końca 3' dodano łańuch poli C zmieszano z 40 pmol oligonukleotydu DNA (2) i 40 pmol Abriged Anchor Primer (zawartego w zestawie) a następnie inkubowano w 94°C przez dwie minuty. Cykl inkubacji 30 sekund w 94°C, 30 sekund w 55°C i dwie minuty w 72°C następnie powtórzono 35 razy a następnie inkubowano w 72°C przez pięć minut i 4°C przez 18 godzin. Powstały produkt poddano elektroforezie w żelu agarozowym i DNA odzyskano z żelu. Produkt oczyszczono za pomocą ekstrakcji fenol - chloroform i strącono etanolem i sklonowano podobnie do metody opisanej w Przykładzie 4 stosując pCR 2.1.

Powyżej opisana operacja to 5'-RACE.

Ustalono sekwencję nukleotydów fragmentu cDNA zawierającego koniec 5' i przewidziano pozycję miejsca inicjacji transkrypcji i miejsca inicjacji translacji.

Tabela 4 przedstawia SEQ ID No. w którym sekwencja nukleotydów fragmentu DNA końca 5' odpowiadającemu każdemu genowi struktury uzyskanemu za pomocą 5' RACE była opisana. Tabela 5 przedstawia SEQ ID No. w którym istnieje miejsce inicjacji transkrypcji i miejsce inicjacji translacji każdego genu struktury i pozycję miejsca inicjacji transkrypcji i miejsca inicjacji translacji.

T a b e l a 4: SEQ ID No, w których pokazano sekwencję nukleotydową końca 5' fragmentu cDNA.

Gen	Odpowiedni SEQ ID NO listy sekwencji
mlcA	SEQ ID No.17
mlcB	SEQ ID No.18
mlcC	SEQ ID No.19
mlcD	SEQ ID No.20
mlcE	SEQ ID No.21
mlcR	SEQ ID No.22

T a b e l a 5: Pozycja początku transkrypcji oraz początku translacji każdego genu.

Gen nr	SEQ ID NO, w którym występuje kodon inicjacyjny dla translacji	Numer nukleotydu w SEQ ID NO 1 lub SEQ ID NO 2
		Pozycja początku transkrypcji	Pozycja kodonu inicjacyjnego dla translacji
1	2	3	4
mlcA	SEQ ID No.2	22913	23045 do 23047
mlcB	SEQ ID No.2	11689	11748 do 11750

PL 202 457 B1 cd. tabeli 5

1	2	3	4
mlcC	SEQ ID No.1	11631	11796 do 11798
mlcD	SEQ ID No.1	24066	24321 do 24323
mlcE	SEQ ID No.2	3399	3545 do 3547
mlcR	SEQ ID No.2	365	400 do 402

* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.

4) Wyznaczenie sekwencji końca 3' przy pomocy techniki 3' RACE cDNA, zawierające końce 3'-każdego z genów struktury, otrzymano wykorzystując zestaw Ready To Go: T-Primed First-Strand (wyprodukowane przez Pharmacia).

W oparciu o dane z przykł adu 7 oraz punkt 2) opisywanego przykł adu, wytworzono jeden rodzaj sensownych oligonukleotydów DNA (3), będących przypuszczalnie w obszarze kodującym i jednocześnie blisko końca 3' każdego z genów struktury w sekwencji wstawionej w pML48.

Sekwencje oligonukleotydów DNA(3), wytworzonych dla każdego z genów struktury przedstawiono w Tabeli 6.

T a b e l a 6: Oligonukleotydy DNA (3) wykorzystywane do wyznaczania sekwencji końców 3' zgodnie z techniką 3' RACE

Gen nr	Odpowiedni SEQ ID NO listy sekwencji	Sekwencja nukleotydowa
mlcA	SEQ ID No.23	Atcataccatcttcaacaac
mlcB	SEQ ID No.24	Gctagaataggttacaagcc
mlcC	SEQ ID No.25	Acattgccaggcacccagac
mlcD	SEQ ID No.26	Caacgcccaagctgccaatc
mlcE	SEQ ID No.27	Gtcttttcctactatctacc
mlcR	SEQ ID No.28	Ctttcccag ctg ctactatc

Pierwszą nić cDNA zsyntetyzowano w reakcji odwrotnej transkrypcji, wykorzystując starter Notl-d(T)18 (pochodzący z zestawu) oraz jako matrycę całkowite RNA Penicillium citrinum SANK13380 (1 mg).

100 ml mieszaniny reakcyjnej, zawierającej pierwszą nić cDNA, 10 pmoli oligonukleotydu DNA (3) oraz starter Notl-d(T)18 (pochodzący z zestawu) inkubowano w 94°C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 55°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 35 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz klonowano według metody opisanej w przykładzie 4, wykorzystując plazmid pCR2.1.

Procedury opisane powyżej to właśnie technika 3'-RACE.

Ustalono sekwencję nukleotydową cDNA na końcach 3', a następnie wyznaczono pozycję kodonu terminacyjnego dla translacji.

Tabela 7 przedstawia odpowiednie SEQ ID NO listy sekwencji, dla których przy pomocy techniki 3' RACE, przedstawionej powyżej, wyznaczono sekwencje nukleotydowe końców 3' fragmentów cDNA dla każdego z genów struktury. Tabela 8 przedstawia kodony terminacyjne dla translacji oraz pozycje tych kodonów w oparciu o SEQ ID No.1 i 2 w liście sekwencji.

T a b e l a 7: SEQ ID No, w których pokazano sekwencję nukleotydową końca 3' fragmentu cDNA.

Gen	Odpowiedni SEQ ID NO listy sekwencji
1	2
mlcA	SEQ ID No.29
mlcB	SEQ ID No.30
mlcC	SEQ ID No.31

PL 202 457 B1 cd. tabeli 7

1	2
mlcD	SEQ ID No.32
mlcE	SEQ ID No.33
mlcR	SEQ ID No.34

T a b e l a 8: Kodony terminacyjne dla translacji oraz pozycje kodonów terminacyjnych, dla każdego z genów struktury.

Gen nr	Kodon terminacyjny dla translacji	SEQ ID NO w których występuje kodon terminacyjny dla translacji	Pozycja nukleotydowa kodonu terminacyjnego dla translacji w SEQ ID NO 1 lub SEQ ID NO 2
mlcA	tag	SEQ ID No.2	32723 do 32725
mlcB	taa	SEQ ID No.2	19840 do 19842
mlcC	taa	SEQ ID No.1	13479 do 13481
mlcD	tga	SEQ ID No.1	27890 do 27892
mlcE	tga	SEQ ID No.2	5730 do 5732
mlcR	tag	SEQ ID No.2	1915 do 1917

Tabela 9 przedstawia aminokwasy z końca C polipeptydów, kodowanych przez każdy z genów struktury, trójkę nukleotydów kodujących odpowiedni aminokwas oraz pozycję trójki.

T a b e l a 9: Aminokwas z końca C polipeptydu, kodowanego przez każdy z genów struktury

Gen nr	Aminokwas na końcu C	Sekwencja nukleotydowa trójki kodującej aminokwas	SEQ ID, w której występuje odpowiednia trójka	Pozycja nukleotydowa trójki w SEQ ID NO 1 lub SEQ ID NO 2
mlcA	alanina	gcc	SEQ ID No.2	32720 do 32722
mlcB	serina	agt	SEQ ID No.2	19837 do 19839
mlcC	cysteina	tgc	SEQ ID No.1	13476 do 13478
mlcD	arginina	cgc	SEQ ID No.1	27887 do 27889
mlcE	alanina	gct	SEQ ID No.2	5727 do 5729
mlcR	alanina	gct	SEQ ID No.2	1912 do 1914

Tabela 10 przedstawia sekwencje komplementarne do kodonów terminacji translacji, pokazanych w Tabeli 8, SEQ ID, w której występuje odpowiednia sekwencja komplementarna oraz pozycję tej sekwencji.

T a b e l a 10 Sekwencja komplementarna do kodonu terminacji translacji, dla każdego z genów struktury.

Gen nr	Sekwencja komplementarna do kodonu terminacji translacji	SEQ ID, w której występuje odpowiednia sekwencja komplementarna	Pozycja nukleotydowa sekwencji komplementarnej w SEQ ID NO 1 lub SEQ ID NO 2
mlcA	eta	SEQ ID No.1	1479 do 1481
mlcB	tta	SEQ ID No.1	14362 do 14364
mlcC	tta	SEQ ID No.2	20723 do 20725
mlcD	tca	SEQ ID No.2	6312 do 6314
mlcE	tca	SEQ ID No.1	28472 do 28474
mlcR	cta	SEQ ID No.1	32287 do 32289

PL 202 457 B1

Tak jak opisano powyżej, ustalono pozycję oraz orientację każdego z genów struktury. W oparciu o te informacje, można ustalić jaki będzie produkt transkrypcji i translacji każdego z nich.

P r z y k ł a d 9: Otrzymywanie cDNA genu struktury mlcE

1) Przygotowywanie całkowitego RNA

Całkowite RNA Penicillium citrinum izolowano zgodnie z procedurą z przykładu 8.

2) Projektowanie starterów

W celu otrzymanie pełnej długości cDNA dla genu struktury mlcE, określonego w przykładzie 8, zaprojektowano i zsyntetyzowano następujące startery:

Starter nici sensownej 5'-gttaacatgtcagaacctctaccccc-3' (patrz SEQ ID 35 listy sekwencji); oraz starter nici antysensownej 5'-aatatttcaagcatcagtctcaggcac-3': (patrz SEQ ID 36 listy sekwencji).

Startery pochodzą odpowiednio z sekwencji na 5' końcu obszaru powyżej genu struktury mlcE oraz z sekwencji na 3' końcu obszaru poniżej tego genu. Syntezę starterów przeprowadzono według metody fosfoamidowej.

3) Reakcja RT-PCR

W celu otrzymania pełnej długości cDNA, kodującego produkt genu mlcE, używano zestawu Takara RNA LA PCR (AMV) Ver. 1.1.

Dokładnie, 20 μl mieszaniny reakcyjnej, zawierającej 1 μg całkowitego RNA, 2.5 pmoli losowych starterów o długości 9 nukleotydów (zawarte w zestawie) oraz 1 μl odwrotnej transkryptazy (zawarta w zestawie) inkubowano w 42°C przez 30 minut w celu wytworzenia pierwszej nici cDNA. Następnie odwrotną transkryptazę inaktywowano poprzez inkubację w 99°C przez 5 minut.

100 μl kolejnej mieszaniny reakcyjnej, zawierającej całkowitą objętość mieszaniny reakcyjnej z pierwszą nicią cDNA (patrz wyżej), 40 pmoli startera dla nici sensownej oraz 40 pmoli startera dla nici antysensownej inkubowano w 94°C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 60°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 30 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz transformowano do kompetentnych komórek Escherichia coli JM109 (wytworzonych przez Takara Shuzo Co., Ltd., Japonia) wg metody opisanej w przykładzie 4, wykorzystującej pCR 2.1. Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA i nazwano go pCRexpE.

Ustalono sekwencję wstawionego fragmentu DNA w wynikowym plazmidzie (pCRexpE). DNA zawierające pełnej długości cDNA odpowiadało genowi struktury mlcE. Sekwencja nukleotydowa oraz sekwencja aminokwasów otrzymana w oparciu o sekwencję nukleotydów pokazano jako SEQ ID N0.37 i/lub SEQ ID NO 38 listy sekwencji.

Najbliższym homologiem mlcE jest ORF10 pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (70% identyczności na poziomie aminokwasów).

P r z y k ł a d 10: Wytwarzanie wektora ekspresyjnego pSAK 700

Wektor ekspresyjny cDNA pSAK700 wytworzono wykorzystując wektory pSAK333 i pSAK360 opisane w przykładzie 1.

pSAK333 strawiono enzymami restrykcyjnymi BamHI i Hind III (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), poddano elektroforezie w żelu agarozowym, następnie fragment o długości 4.1 kpz wyizolowano z żelu i stępiono jego końce przy użyciu T4 DNA polimerazy (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia).

W kolejnym kroku, do powyższego fragmentu dołączono adaptor EcoRI-Notl-BamHI (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia) wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM 109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący plazmid z adaptorem; nazwano go pSAK410.

Plazmid pSAK360 strawiono enzymami restrykcyjnymi Pvu II i Ssp I, poddano elektroforezie w żelu agarozowym, następnie fragment (o długości ok. 2,9 kb), zawierający promotor i terminator genu kinazy 3-fosfoglicerynianowej (tu określanej jako „pgk) i HPT, pochodzące Escherichia coli, wyizolowano z żelu

Tak wyizolowany fragment zligowano w miejsce Pvu II plazmidu pSAK410, używając zestawu do ligacji DNA Ver.2 (wyprodukowanego przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo

PL 202 457 B1

Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA; nazwano go pSAK700.

Sposób wytwarzania plazmidu pSAK700 pokazano na Fig. 4.

Plazmid pSAK700 zawierał po jednym miejscu dla enzymów restrykcyjnych BamHI i Notl, gen oporności na ampicylinę (tu określany jako „Amp^r), jak również gen HTP, warunkujący oporność na higromycynę, jako marker selekcyjny. W opisywanych przykładach, przy selekcji komórek Escherichia coli, transformowanych pSAK700 lub pSAK700, zawierającym wstawkę DNA, stosowano pożywkę uzupełnioną ampicyliną o stężeniu 40 μg/ml. Natomiast, przy selekcji komórek Penicillium citrinum SANK13380, transformowanych pSAK700 lub pSAK700, zawierającym wstawkę DNA, stosowano pożywkę uzupełnioną higromycyną ampicyliną o stężeniu 200 μg/ml.

P r z y k ł a d 11: Wytwarzanie wektora ekspresyjnego pSAKexpE

Wektor pCRexpE, otrzymany w przykładzie 9, trawiono w 37°C przez 2 godziny enzymami restrykcyjnymi Hpal i Sspl (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), następnie strawiony plazmid poddano elektroforezie w żelu agarozowym, poczym fragment, zawierający pełnej długości cDNA mlcE, o długości ok. 1.7 kpz izolowano DNA z żelu.

Po trawieniu plazmidu pSAK700 enzymem restrykcyjnym Not1 (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia) przez godzinę w 37°C, lepkie końce plazmidu stępiono przy użyciu T4 DNA polimerazy (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia). Następnie wektor poddano ekstrakcji mieszaniną fenolu z chloroformem i wytrącono etanolem. Wytrącone DNA zawieszono w małej ilości TE, po czym dodano do niego alkalicznej fosfatazy i inkubonano w 65°C przez 30 minut. Tak przygotowany wektor pSAK700 zligowano z fragmentem o długości 1.7 kpz (otrzymanym w pierwszym kroku), wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący odpowiedni wektor ekspresyjny.

Stransformowany szczep Escherichia coli, nazwany Escherichia coli pSAKexpE SANK 72499, otrzymany w opisywanym przykładzie zdeponowano w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 25 stycznia 2000, pod numerem depozytu FERM BP-7005, zgodnie z budapeszteńskim porozumieniem dotyczącym deponowania mikroorganizmów.

P r z y k ł a d 12: Otrzymywanie cDNA genu struktury mlcR

1) Przygotowywanie całkowitego RNA

2) Projektowanie starterów

starter nici sensownej: 5'-ggatccatgtccctgccgcatgcaacgattc-3': (patrz SEQ ID 39 listy sekwencji);

oraz starter nici antysensownej 5'-ggatccctaagcaatattgtgtttcttcgc-3': (patrz SEQ ID 40 listy sekwencji).

Startery pochodzą odpowiednio z sekwencji na 5' końcu obszaru powyżej genu struktury mlcE oraz z sekwencji na 3' końcu obszaru poniżej tego genu. Syntezę starterów przeprowadzono według metody fosfoamidowej

3) RT-PCR

W celu otrzymania pełnej długości cDNA, kodującego produkt genu mlcR, używano zestawu Takara RNA LA PCR (AMV) Ver. 1.1.

100 μl kolejnej mieszaniny reakcyjnej, zawierającej całkowitą objętość mieszaniny reakcyjnej z pierwszą nicią cDNA (patrz wyżej), 40 pmoli startera dla nici sensownej oraz 40 pmoli startera dla nici antysensownej inkubowano w 94 °C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 60°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 30 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz transformowano do kompetentnych komórek Escherichia

PL 202 457 B1 coli JM109 (wytworzonych przez Takara Shuzo Co., Ltd., Japonia) wg metody opisanej w przykładzie 4, wykorzystującej pCR 2.1. Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA i nazwano go pCRexpR.

Ustalono sekwencję wstawionego fragmentu DNA w wynikowym plazmidzie (pCRexpE). DNA zawierające pełnej długości cDNA odpowiadało genowi struktury mlcE. Sekwencja nukleotydowa oraz sekwencja aminokwasów otrzymana w oparciu o sekwencję nukleotydów pokazano jako SEQ ID NO.41 i/lub SEQ ID NO 42 listy sekwencji.

Najbliższym homologiem mlcR jest lovE pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (34% identyczności na poziomie aminokwasów).

P r z y k ł a d 11: Wytwarzanie wektora ekspresyjnego pSAKexpR

Wektor pCRexpE, otrzymany w przykładzie 12, trawiono w 37°C przez 2 godziny enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia), następnie strawiony plazmid poddano elektroforezie w żelu agarozowym, po czym fragment, zawierający pełnej długości cDNA mlcR, o długości ok. 1.4 kpz izolowano DNA z żelu.

Po trawieniu plazmidu pSAK700 enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia) dodano do niego alkalicznej fosfatazy i inkubonano w 65°C przez 30 minut. Tak przygotowany wektor pSAK700 zligowano z fragmentem o długości 1.4 kpz (otrzymanym w pierwszym kroku), wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący odpowiedni wektor ekspresyjny.

Stransformowany szczep Escherichia coli, nazwany Escherichia coli pSAKexpR SANK 72599, otrzymany w opisywanym przykładzie zdeponowano w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 25 stycznia 2000, pod numerem depozytu FERM BP-7006, zgodnie z budapeszteńskim porozumieniem dotyczącym deponowania mikroorganizmów.

P r z y k ł a d 14: Transformacja mikroorganizmów produkujących ML-236B

1) Przygotowywanie protoplastów

Spory szczepu Penicillium citrinum SANK 13380 z hodowli na skosach inokulowano na podłożu z agarem PGA i hodowano przez 14 dni w 26°C. Po hodowli, 1 x 10⁸, wyizolowanych spor szczepu Penicillium citrinum SANK 13380 inokulowano w 80 ml pożywki YPL-20 i inkubowano w 26°C przez 1 dzień. Po potwierdzeniu kiełkowania, poprzez obserwację pod mikroskopem, kiełkujące spory wirowano w temperaturze pokojowej w 5000 x G przez 10 minut, a następnie odzyskiwano w postaci osadu.

Następnie spory przemywano trzykrotnie w sterylnej wodzie, aby umożliwić wytworzenie protoplastów. Dokładnie, 200 mg zymoliazy 20 T (wyprodukowanej przez Seikagaku Kogyo Corporation) oraz 100 mg chitynazy (wyprodukowanej przez Sigma Corporation) rozpuszczono w 10 ml 0.55M chlorku magnezu i wirowano w temperaturze pokojowej w 5000 x G przez 10 minut. Supernatant używano jako roztworu enzymu. 20 ml roztworu enzymu oraz 0.5 g (mokrej masy) kiełkujących spor, umieszczono w 100 ml konikalnej butelce i inkubowano z delikatnym wytrząsaniem w 30°C przez 60 minut. Po potwierdzeniu uzyskania protoplastów z kiełkujących spor (obserwacja mikroskopowa), mieszaninę filtrowano przez filtr szklany 3G-2 (wyprodukowany przez HARIO corporation). Przefiltrowaną mieszaninę wirowano w temperaturze pokojowej w 1000 x G przez 10 minut, a następnie protoplasty odzyskiwano w postaci osadu

2) Transformacja

Protoplasty otrzymane w punkcie 1 przemywano dwukrotnie w 30 ml 0,55 M chlorku magnezu i raz w 30 ml roztworu zawierającego 0,55 M chlorku magnezu, 50 mM chlorku wapnia oraz 10 mM 3-morfiolino propano sulfonian (pH 6,3 lub mniejsze, poniżej określane jako roztwór MCM). Następnie protoplasty zawieszano w 100 μl 4% (w/v) glikolu polietylenowego 8000, 10 mM 3-morfiolino propano sulfonianu, 0,0025% (w/v) heparyny (wyprodukowanej przez sigma corporation), 50 mM chlorku magnezu (pH 6,3 lub mniejsze, poniżej określane jako „mieszanina transformacyjna).

μl mieszaniny transformacyjnej, zawierającej około 5 x 10⁷ protoplastów oraz 10 μl of TE, zawierającego 120 μg pSAKexpE lub pSA-KexpR, mieszano i inkubowano w lodzie przez 30 minut. Do powyższej mieszaniny dodawano 1.2 ml mieszaniny, zawierającej 20% (w/v) glikolu polietylenowego, 50 mM chlorku magnezu, 10 mM 3- morfiolino propano sulfonianu (pH 6,3). Następnie, tak otrzymaną mieszaninę delikatnie pipetowano i pozostawiono w temperaturze pokojowej na 20 minut. W kolejnym kroku dodawano 10 ml roztworu MCM, delikatnie mieszano i wirowano w temperaturze pokojowej przy 1000 x G przez 10 minut. Stransformowane protoplasty odzyskiwano w postaci osadu.

PL 202 457 B1

3) Regeneracja ściany komórkowej stransformowanych protoplastów.

Stransformowane protoplasty otrzymane w kroku 2) zawieszono w 5 ml półpłynnej pożywki VGS wylano na 10 ml stałej pożywki VGS. Płytkę inkubowano w 26°C przez jeden dzień, po czym 10 ml płynnego VGS, zawierającego 5 mg higromycyny B na szalkę (końcowe stężenie higromycyny 200 μg/ml) wylano na górę. Po inkubacji w 26°C przez 14 dni, oba szczepy (tj. pochodzące z protoplastów transformowanych pSAKexpE lub pSAKexpR) przesiano na pożywkę PGA, zawirającą 200 (ng/ml higromycyny B, po czym przesiano na skosy z pożywką PGA i inkubowano w 26°C przez 14 dni.

Skosy przechowywano w 4°C.

Test Przykładu 1: Porównanie zdolności do biosyntezy ML-236B w transformowanych i nietransformowanych szczepach.

Hodowano stransformowane szczepy otrzymane w przykładzie 14 oraz Penicillium citrinum SANK 13380, następnie w przypadku każdej hodowli oznaczano ilość ML-236B.

mm kwadratowych inokulum spor ze skosów, na których przechowywano strasformowane szczepy z przykładu 14 oraz ze skosów opisanych w przykładzie 2 (Penicillium citrinum SANK 13380). Komórki inokulowano w 10 ml pożywki MBG3-8 w 100 ml butelkach i inkubowano w 24°C przez dwa dni z wytrząsaniem. Następnie dodawano 3.5 ml 50% (w/v) roztworu gliceryny i kontynuowano hodowlę w 24°C przez 10 dni z wytrząsaniem.

Do 10 ml hodowli dodawano 50 ml 0,2 N wodorotlenku sodu, a następnie inkubowano w 26°C przez jedną godzinę z wytrząsaniem. Hodowlę wirowano w temperaturze pokojowej w 3000 x G przez minuty. 1 ml uzyskanego supernatantu mieszano z 9 ml 75% metanolu i poddawano analizie HPLC.

Jako kolumny w HPLC, używano SSC-ODS-262 (o przekroju 6 mm i długości 100 mm, wyprodukowanej przez Senshu Kagaku Co.Ltd). 75% (v/v) metanolu - 0.1% (v/v) trietyloaminy - 0.1% (v/v) kwasu octowego używano jako fazy ciekłej. Elucję przeprowadzano w temperaturze pokojowej, z szybkością 2ml/minutę. W powyższych warunkach, ML 236B był eluowany w 4 minuty po nałożeniu na kolumny. Detekcje przeprowadzano w detektorze UV przy długości fali 236 nm.

Biosynteza ML-236B była podwyższona w 3 z 8 szczepów transformowanych pSAKexpE. Zdolność do bisyntezy ML-236B w tych szczepach była 10% wyższa w porównaniu ze szczepami nietransformowanymi. Jednocześnie biosynteza ML-236B była bardziej stabilna po przesiewaniu (na pojedyncze spory). Powyższe wyniki dowodzą, że wstawka na plazmidzie pSAKexpE, jest cDNA, przyśpieszającym biosyntezę ML-236B.

Biosynteza ML-236B była podwyższona w 5 szczepach transformowanych pSAKexpR. Zdolność do bisyntezy ML-236B w tych szczepach była 15% wyższa w porównaniu ze szczepami nietransformowanymi. Jednocześnie biosynteza ML-236B była bardziej stabilna po przesiewaniu (na pojedyncze spory). Powyższe wyniki dowodzą, że wstawka na plazmidzie pSAKexpR, jest cDNA, przyśpieszającym biosyntezę ML-236B.

Stąd, cDNA powodujące przyśpieszoną biosyntezę ML-236B, otrzymane ze szczepu produkującego ML-236B zgodnie z opisywanym wynalazkiem, przyśpiesza biosyntezę ML-236B w mikroorganizmach produkujących ML-236B, po wprowadzeniu do mikroorganizmu produkującego ML-236B.

P r z y k ł a d 15: Okeślenie sekwencji cDNA genów struktury mlc A-D.

Określono sekwencja cDNA genu struktury mlc A.

Pierwszą nić cDNA zsyntetyzowano używając zestawu TAKARA LA PCR kit ver1.1 (Takara Shuzo Co., Ltd.). Przeprowadzono kilka reakcji PCR w celu amplifikacji części lub całości cDNA, używając pierwszej nici cDNA jako matrycy oraz różnych par oligonukleotydów jako starterów.

Używano następujących cykli: 30 sekund w 94°C, 30 sekund w 60°C i 5 minut w 72°C, powtarzając 30 razy. Do reakcji używano zestawu Big Dye Primer/Terminator Cycle Sequencing Kit oraz aparatu ABI Prism 377 sequence (PE Applied Biosystems).

Produkt każdej reakcji wstawiano do plazmidu pCR2.1.

Otrzymano transformanty Escherichia coli dla każdego plazmidu.

Ustalano sekwencję nukleotydową każdej wstawki.

Sekwencje eksonów i intronów ustalono porównując sekwencje produktów reakcji RT-PCR, wspomnianych powyżej z sekwencją genu struktury mlc A.

Następnie ustalono sekwencję cDNA genu struktury mlc A (SEQ ID NO 43), sekwencję aminokwasów otrzymaną w oparciu o opisane cDNA (SEQ ID NO 44) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.

Najbliższym homologiem mlcA jest LNKS(lovB) pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (60% identyczności na poziomie aminokwasów).

PL 202 457 B1

W podobny sposób uzyskano sekwencję cDNA genu struktury mlc B (SEQ ID NO 45). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 46) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.

Najbliższym homologiem mlcB jest LDKS(lov/F) pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (61% identyczności na poziomie aminokwasów).

W podobny sposób uzyskano sekwencję cDNA genu struktury mlc C (SEQ ID NO 47). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 48) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji..

Najbliższym homologiem mlcC jest lovA, pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (72% identyczności na poziomie aminokwasów).

Następnie, uzyskano sekwencję cDNA genu struktury mlc D (SEQ ID NO 49). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 50) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.

Najbliższym homologiem mlcC jest ORF8, pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (63% identyczności na poziomie aminokwasów).

Miejsca występowania eksonów każdego z genów struktury w sekwencji SEQ ID NO 1 lub SEQ ID NO 2 określono jak podano poniżej:

T a b e l a 11: Miejsca występowania eksonów w mlcA-D we wstawkach pML48

	SEQ ID sekwencji, w której występuje ekson	Bumer Eksonu	Numer nukleotydu w SEQ ID NO 1 lubSEQ ID NO 2
MlcA	2	1	22913 do 22945
2	23003 do 23846
3	23634 do 23846
4	23918 do 24143
5	24221 do 24562
6	24627 do 27420
7	27479 do 27699
8	27761 do 30041
9	30112 do 30454
10	30514 do 30916
11	30972 do 32910
MlcB	2	1	11689 do 12002
2	12106 do 12192
3	12247 do 12304
4	12359 do 12692
5	12761 do 13271
6	13330 do 13918
7	13995 do 20052
MlcC	1	1	11631 do 12140
2	12207 do 12378
3	12442 do 13606
MlcD	1	1	24066 do 24185
2	24270 do 27463
3	27514 do 28130

PL 202 457 B1

Miejsca terminacji transkrypcji każdego z genów struktury w sekwencji SEQ ID NO 1 lub SEQ ID NO 2 określono jak podano poniżej:

T a b e l a 12: Miejsca terminacji transkrypcji każdego z genów struktury mlc A-E i R we wstawkach pML48

Gen	SEQ ID NO sekwencji, w której występuje miejsce terminacji transkrypcji	Numer nukleotydu w SEQ ID NO 1 lub SEQ ID NO 2
mlcA	SEQ ID NO 2	32910
mlcB	SEQ ID NO 2	20052
mlcC	SEQ ID NO 1	13606
mlcD	SEQ ID NO 1	28130
mlcE	SEQ ID NO 2	5814
mlcR	SEQ ID NO 2	1918

P r z y k ł a d 16: Badania dysrupcji genu.

Geny struktury mlc A, B i D P.citrinum poddano dysrupcji, przy użyciu ukierunkowaną mutagenezę, wykorzystującą rekombinację homologiczną.

Plazmid umożliwiający dysrupcję genu struktury mlcA P.citrinum wytworzono używając plazmidu pSAK333.

Fragment o długości 4,1 kpz, otrzymany po cięciu enzymem Kpnl plazmidu pML48, zawierający mlcA, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcA

P.citrinum SANK13380 stransformowano plazmidem pdismlcA

Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcA w celu potwierdzenia dysrupcji genu mlcA.

Otrzymany mutant dysrupcyjny, nie produkował ML-236B lub jego prekursora.

Plazmid umożliwiający dysrupcję genu struktury mlcB P.citrinum wytworzono używając plazmidu pSAK333.

Fragment o długości 1,4 kpz, otrzymany po cięciu enzymami Psl BamHI plazmidu pML48, zawierający mlcB, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcB.

P.citrinum SANK13380 stransformowano plazmidem pdismlcB.

Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcB, w celu potwierdzenia dysrupcji genu mlcB.

Otrzymany mutant dysrupcyjny genu mlcB, nie produkował ML-236B, ale produkował jego prekursor.

Plazmid umożliwiający dysrupcję genu struktury mlcD P.citrinum wytworzono używając plazmidu pSAK333.

Fragment o długości 1,4 kpz, otrzymany po cięciu enzymami Kpnl BamHI plazmidu pML48, zawierający mlcD, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcD.

P.citrinum SANK13380 stransformowano plazmidem pdismlcD.

Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcD, w celu potwierdzenia dysrupcji genu mlcD.

Otrzymany mutant dysrupcyjny genu mlcD, produkował ML-236B w 30% wzglądem szczepu kontrolnego.

P r z y k ł a d 17: Analiza funkcjonalna mlc R w transformantach pSA-KexpR.

Dwa transformanty pSAKexpR otrzymane w przykładzie 12, oznaczone odpowiednio jako TR1 i TR2, oraz nietransformowany szczep Penicillium citrinum SANK13380 inokulowano w pożywce MBG3-8, a następnie inkubowano oddzielnie, jak opisano w przykładzie 8.

Wyizolowano całkowite RNA z każdej hodowli, jak opisano w przykładzie 8.

PL 202 457 B1

Przeprowadzono reakcję RT-PCR, używając całkowitego RNA jako matrycy i oligonukletydów zaprojektowanych w oparciu o sekwencje genów struktury mlc A, B, C D E i R jako starterów.

T a b e l a 13: Sekwencje nukleotydowe par starterów do reakcji RT-PCR.

Cel RT-PCR	Starter 1	SEQ ID NO	Starter 2	SEQ ID NO
mlcA	5'-gcaagctctgctaccagcac-3'	51	5'-ctaggccaacttcagagccg-3'	52
mlcB	5'-agtcatgcaggatctgggtc-3'	53	5'-gcagacacatcggtgaagtc-3'	54
mlcC	5'-aaaccgcacctgtctattcc-3'	55	5'-ctttg tg gttg g atg catac-3'	56
mlcD	5'-cgctctatcatttcgaggac-3'	57	5'-tcaatagacggcatggagac-3'	58
mlcE	5'-atgtcagaacctctaccccc-3'	59	5'-tcaagcatcagtctcaggca-3'	60
mlcR	5'atgtccctgccgcatgcaac-3'	61	5'-ctaagcaatattgtgtttct-3'	62

Wyniki analizy RT-PCR przedstawiono na Fig. 5 dla nietransformowanego szczepu Pencillium citrinum 13380 oraz dla transformantów oznaczonych jako TR1 i TR2.

Geny struktury mlc A, B, C, D i R były wyrażane w transformantach pSAKexpR pierwszego, drugiego i trzeciego dnia hodowli.

Dla porównania, wymienione geny struktury w nietransformowanym szczepie były wyrażane jedynie trzeciego dnia hodowli.

Nie zaobserwowano różnicy w ekspresji struktury mlcE pomiędzy transformantami pSAKexpR i szczepem nietransformowanym.

Wyniki sugerują, że białko kodowane przez cDNA genu struktury mlc R, indukuje transkrypcje innych genów struktury (np. mlc A, B, C, D), znajdujących się w skupieniu genów biosyntezy ML-236B.

P r z y k ł a d 18: Analiza funkcjonalna mlc E w transformantach pSA-KexpE.

Transformant pSAKexpE otrzymany w przykładzie 12, oznaczony jako TE1 oraz nietransformowany szczep Penicillium citrinum SANK 13380 inokulowano w pożywce MBG3-8, a następnie inkubowano oddzielnie, jak opisano w przykładzie 8.

Wyizolowano całkowite RNA z każdej hodowli, jak opisano w przykładzie 8.

Przeprowadzono reakcję RT-PCR, używając całkowitego RNA jako matrycy i oligonukletydów zaprojektowanych w oparciu o sekwencje genów struktury mlc A, B, C D E i R jako starterów. Startery użyte w opisywanym przykładzie są takie same, jak przedstawione w tabeli z poprzedniego przykładu.

Wyniki analizy RT-PCR przedstawiono na Fig. 6 dla nietransformowanego szczepu Pencillium citrinum 13380 oraz dla transformanta oznaczonego jako TE1.

Gen struktury mlc E był wyrażany w transformantach pSAKexpE pierwszego, drugiego i trzeciego dnia hodowli.

Dla porównania, wymieniony gen struktury w nietransformowanym szczepie był wyrażany jedynie trzeciego dnia hodowli.

Z drugiej strony, nie zaobserwowano różnicy w ekspresji genów struktury mlcA, B, C, D i R pomiędzy transformantami pSAKexpE i szczepem nietransformowanym (wyniki nie załączone).

Wyniki sugerują, że białko kodowane przez cDNA genu struktury mlc E, przyśpiesza biosyntezę ML-236B, niezależnie od genów struktury mlc A, B, C, D i R.

PL 202 457 B1

WYKAZ SEKWENCJI

<110>	Sankyo Company. Limited
<120>	Geny ze skupienia genów
<130>	EPP83481
<150>	JP 2000-116591
<15li	2000-04-18
<150>	JP 2000-117458
<151?	2000-04-19
<160>	52
<170 =	Patentln. version 3.0
<210>	1
<211>	34203
<212 >	DNA
<213>	Penicillium citrinum
<400>	1
gatcaatact acgtcgttgt tatttccttg	tcagtaatga	ctaacaaatt	ccccagaaca
gacgaagtca cagctcacac cacaagagaa	aatgagtcca	gcgaggatta	cagatttctc
gccaggcaaa ccgagaaaag ctctcttatg	catccacggt	gccgggtgct	cagcagccat

attccgcgtc cagatctcta aactgcgcgt ggcgttgaaa aacgagtttg aattcgtata tgcgaccgcg ccgtttagct ccagccccgg acccggcgtg cttcctgtct tccaaggcat gggtccatac tacacctggt tccaaaagca tcatgacgcc gttacaaaca cgacaacccc cacggtgggc gatagagtag cggctgtgat cgggcctgtg caaaagaccg tccaagattg gtctataact aacccacagg cacccattgt cggcatagtg gccttctctg agggcgcatt ggtcgccact ttgctgctcc atcaacagca aatgggaaaa ctgccatggt ttccgaaaat gagcattgct gttttgattt gctgtttcta tagcgatgaa gccagagatt acatgagagc cgaggcgcaa gacgacgacg acaagctaat aatcaacgtg ccgacactgc atcttcacgg tcgtcaagat tttgctctcc aagggtcgag acagatggtt gaaacacatt acctgcctca gaatgcagat gtactcgagt ttcagggaaa gcataatttt cccaacagac cgagtgatgt ccaggagacg gtcaagcgct tccaacagct atatcaaaag gtcaagatgt caggttcatt tgtctaggtg agacaacagg gtatatagca aggctctggc tctcatgcct agtccatacc acatttttac tgaacaaatt tgaatagttc taatcttaca cggtttgaat gctcaccttc caagggtgat ttagttatag tggtcgcgac catctcataa atatttcgtg aacatatttt ggatagatca tggaaggctc gttctgaaca ggcatgacag acatctaaaa ccactcgatc accacaacaa ggcactaaac cagtaactat ggaactattt gcaatggcgt cgaatttata tacaggatgg attgaaatca attccaagcc ttggaggttt caccttcctc acagagtctt tcgaaacgcg ctaccgaggt atatttatca ccgttacggt actctgaacc gcgctatcta acttgatgtt acgattgctg caataaagaa gagcaacgaa ggtagaagta attttgacaa agatacaaga cgaattcgct atttgtagat gaatatgcgt gtgtcaattg acgccgaatt caggatagat ttgccatctg ctctattgcc aatttctaat ccatctttat catgaacaac actcaaacca cacatctgaa ttcacggcgc tgaacgatct aggccaactt cagagccggg ttcatcgaga acatagtgag gattgaagaa aagtggtcta caaaggcctg agcgtgctca gggccataca gcgagctctg aagtttgaca tgaatgagtg ggtccttggt agggtcatcc

SO 12 0 180 240 300 3S0 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620

PL 202 457 B1 cacatctcga gaacgatgtc ataaggagtg cgctcacggg aagcgagaac actcgtcatt 1680 ttggcattgc caattgagcc actctccgct tgaccctgct tgtaatcaaa gacagcctgg 1740 aacaaggggg cgtgtgtctg agtcttgggt tcctcgcctg aggtagggag attcaggcct 1800 agacagtcga ggatgacgcc atacggcacc cgcgcgtgtt gcatggcctc acgcacactg 1860 tccttggtgg ctacaaggtg ctcgccgaat gtcttgctgc cgacgaactc atcaaagcgc 1920 ^a999g^aa9^ca cgttagcgaa aaagcccatc gccgaaattt cttccatggt ggatcggttg 1980 gtttcggcga ggccgatggt tatgtctttg ctgccggtaa gacgcgccaa caaaacgtgg 2040 taggcggcca ggtagaactg eatgggggtt gccttgtgct tgcggctccg ctctttgatt 2100 cggaaggcga ccatgggatc taaacgagca attgcttcat actgctgcca cgtgaatggc 2160 tgtatttgct gctgctctga attggcagca gggtcattga tcagattcat gatgggaagc 2220 acggttggcg cagatgacga gactttgcta tgcatggact tccagaacgc gatatcgtcc 2280 cccattcgcc cattttccag gttttcccgc tgttggacgg ctagatcaga gaattgggtc 2340 gatggtcgct gcattttcac cccgctgtaa atctgcccga tctcattgaa caggttttct 2400 gttgttgagc catcaccaac taatctgtgg tagccgatta ccaacaggtg gtcatctgtg 2460 ccccagtaga aatcaacgag tctgagagtg tcacctgtgg agatgctata gtttgtcttc 2520 tcgagtttcc ggtactcttc ctctgcctcc gcagcgttgt tcacctgaac aaagtgcact 2580 ctgttctccg ggttcttgag aaccacttgg acgggaccat ttaaatcgct gctatagtca 2640 tcgccagtaa caaagcacgt acggaagatc tcgtgacggc gcaatgaggc tttcagagcc 2700 cgcctcaacc ggtcgaggtc aatggtaccc ttcatgaaca tgccaatagt gttgttgaag 2760 atggtatgat cttttaccat ttgttgctgc ctccaggaat actcctggcc aagggacaac 2820 ctctcgcgac gaagaatctt acggcctccc tgctcattat cgtcctcttg ctcttcatcc 2880 tcttcggctg acgacgcatc tgtgctggta gcagagcttg cttcatcatg gctgtctgtt 2940 ggtgtcggag aagccccgct gtccgaggtt cccgtggaat caccaatttg caacagcagc 3000 ggaatggatg tagctgggag tcgggtggcc gcgtcgtcgg caagatcagc gacagaagca 3 OSO ccgccaagta ecctcaagag tgggaggtca aggtagagtt gctttgagaa ccatgagccg 3120 acagtcactg cacccaagga gtcgacacct tgatcaatga gaggaatggt tgggtccacg 3180 ctctccccgt ccgaaacttg gagggtaaca cggagtttct cagatagacc atctgcaact 3240 ttgttagttt gaactcgata tcaggaaacg catgagagat aacttaccaa tcacgatttg 3300 ccgaacttgg tctaaagttg ttgcttgttt gagctggtcg gcaatggagc ctttagaccc 33S0 tgatccattg tcgccaccgt ctccgcgttg accgggaatt ttgaagtttc cgaaacgagg 3420 gtcgttgaag taaataattc gatcttgaag cgcagggtca agatctggga tacccgtggt 3480 aagctcaagg tccgccatgt caatgaccgt cttgcgctgt ggttgctgcc gggcacgctg 3540 gtcagacacg accgcttcgg cgaaaagcgt gtgcagctca tgctcttcaa ctgagtcaaa 3600 catgaaacgg atagcatcaa agtcctcctc catctcggcc ctcgtgacaa accctacacc 36S0 gtaaacggca ccaatatcga tggttgatcc ctgtggttgt gcgttagtaa cttgacgtcg 3720 atgcatgata attcaggggt agaaaatacc gccaatcctc tggcgcaccg ttgctgggcc 3780 agagcctgta ggtaggcatt cgcagcgcca tagttggact ggccaggatt gccaataact 3840 gcaacaatgg acgaaaacat gatgaagaag tcgagcgcct tgctgcccgt ctgttcggag 3900 aaccgttcat gaagaatgcg tgctccttgt accttgggct tcaacaccat gtccatcatc 39S0 tggtggtcca tgttcttcag catgacatcc tgcagcacca aaggcccgaa cgcgatgccg 4020 gcaacaggtg gcaacttcat atcgacaagc ttgccaaggc cagcatcgac tgaatcctca 4080 ttggcaacat ccctaaagaa agtaattgga taagtaaacg aggatgtggt agcaaggtgt 4140 gatgtgatat caatcaactt acattgacag aacggtgatg tcaccaccaa gtgcctccat 4200 gttggcgatc catttgggat caagtcgagg gttccggcta gtgagcacaa catggcgggc 4260 gccatgcaag atcatccagc gacagagaga gcgaccaagg tccccggtaa gaccaacaag 4320 caaatacgtc ttcttgttgg aaaataagtt accagagtcg atggggcaaa tcctagcgga 4380 cacctcattt tccttccagt cgatgacggt ggccagattg aagcgttggt cattgtggtt 4440 gacagagagc tgaccaggca agagaatttg tgtggctgta ataactttct cagtgtcgtc 4500 gacagtcgac gcagagacgg tattttttgc cattgccaca gagtgctcga ggattggaat 4560 atcctcaaca tgactaactt tgtatgtgga agctgtactt cggataagat agtcaccact 4620 gtacatgaag caactgggtg gtagcaactt ggccaaacgg ttggttatcc cggcagcagt 4680 ccggtcggta gacaagtcaa agaatgccat catgtttgtc ggcaggctgt gtttcagccg 4740 agcgtcggtt tccttggcat gtaatcggat ccaaggagcc ggaatagttt tgacgtcgga 4800

PL 202 457 B1 cagagttgtt gccaaatgaa cctgaacacc gtaggttttg gccgactcca gaattgcttt 4860 gacgcagaag attgggggct ecataatcag aattgatgca tcagagccaa aggactgagc 4920 gctagagaga attgtttcgg caaggagggc tgcagctgtg gacaacaaga aggaactatc 4980 ctcgccttcc gccatgttat cgggcagact atgcatgtag tttctcggta catgcagtat 5040 agatccattc ttctcagcca gggcgactac aggcacctca catgtattct ccagaatact 5100 gccctgcacg acatggaagt atccgagatg gcccacgcga attgcctggg gaagagcgta 5160 gcgaacacga acagttgctt ttccagcatg acgagcgtct tctaacgaat cacacgtctc 5220 ggttgactca agatagtaca tcgatgagga tgctcccctc gcctctttca gtgcaatggc 5280 cgtcttggac gaattaaagt taccgaaaat tggacgacga gacgagttca tacggtcgtt 5340 cctagcaata tcctgcttca aacgagggac ccaggcacga cccttgcacc agtacacttc 5400 gggctcatga gtccatgtta ttgattccaa aagctgatca tcgctctcct cgaagcgcaa 5460 aagttgctca acgaagaatt tggtgtctag gttctccaca gtatcgacat cgaagacgtg 5520 cgttcccaag tcagggttct cgagcttgat tgtcctcaac attccgatgg tgctggcctg 5580 gtggggatga tcaatccagg cattctctgt cagccacatc atgcgtccgg cgtagaagag 5640 aagagacttg actgcctcaa acttgtcctc ttcaaggttg caaaacactt catcatcaag 5700 ttccgagagg atgacaaaag tcgacttagg ctgcaaggcc gggtcgtcga gaacactttc 5760 cagccgcttg acggagtgga tgtgtctatg cggtagggca gctttcatgt cgttcaaaat 5820 gcgttcggtt tttgtcgatt cgccaccgat aaccactaat ggcgggtatg agtccttcaa 5880 tggagcagaa agtggatcat acaaacgctc aacggtggca tccacagcat gtgtactgaa 5940 gacagacggg atcaaatcat cctctcgatc aagtgtccga ctatcgacgc cagagaaccc 6000 aactctcttg agggtatgct cccattggtc aacggacccc gaggcactca aagcacgagt 6060 ttcgtcttct ccagtccatc gatcagcgaa aagcccagag atgaaggcga ggcgagcagg 6120 ctcgcgatgg gtgaccccga aagtaaccaa gtgaccaccc ggcttgagca aggaccttat 6180 gtgagccaat ttttcctcga agttggagct ggcatggagg acatcggatg caataatcag 6240 atcgtaggag tgaggcttga atccttgctc tgctgggctt ctgttgatgt ctagtgcctc 6300 aaactgcatg agaccgtcga attcggaaag ttgttcacgg gccttgccaa taacatccgc 6360 cgagatgtca gtgcaagtgt aactgttgaa accaagttga ggtgatgcaa gaacgcgctt 6420 cgtggcgatg cctgtaccca agcctaaaaa gcgaacgaca gattagcaaa ctgcctagtt 6480 acttacattt cagattcgac ttaccgatct caaggatatc aatggattgg tagcgatgag 6540 caatttggct aaccagatcc tgaacgacgt gtattgctga gccaaaggcg agcttgttgg 6600 tatagtactc ggtgaacaac ccatcgcggt tcatgatatc caaaggatcc ccgttcccgc 6660 gaacaattga aattaattct ttgcctaccc tttggatcag gcgcacatgt gggtgggacg 6720 agttgcttca agtaaaaggt taatataaaa gaatgaaaaa acacggaaca gctttgggtg 6780 tacctttcac acatttgctc aatgtgaaca gaagtgtcct cctcccaaga ctcctggtac 6840 cactgatggt ggccagcccg agcatcggcc tgaacctggt cacaccattc aatgtacttc 6900 tgggaatgga ggtcggcatt ttgacggtcg tcgggggtta tctgggctag gaaggatttg 6960 atgtagaagt aaacgattcg ctcgatggtc agaatgtcct ccttgtcccg agctatgatc 7020 aacgtcgcag ggtcctccag cagtttttcg ggcgtgaggg gtccccagac ccactttgcg- 7080 aagattcggt ggtcggtcga agcagtcggg ggagagaaag gcttaaagac aatgttatca 7140 acttggaaaa gcgttgtctt ggtcgaatcg tacaccgtga tgtcgccgct caggaaatca 7200 cccttgtcgt gtgtgttgat tgtgtcaaac gcaagctcgg tttcaccaga attacccgcc 7260 gatatacaga gcgatggaat cagagtcact ctgtcaacgt gagtaggcac gtacaatgag 7320 cgtaggcgac gatctcctgg agaggaatac gctccaatga cagtctggaa cgcgatgtcc 7380 aggggcgctg ggtggagcaa gaggggctca ttgcgcaatt catccttaag tggaaggaaa 7440 gccaaggtgc cgctagcttt ggagtcggcc cttctcatgg tctgcaaacg acggaagtct 7500 ttgctgtagt catacccaag gaggtcaagt tcccgataga agaaatcgat gttgacattg 7560 ttcatctggg ggtactcttc ctcaggtggc ggcaaaagct gcgatgacgg tgatgcctcg 7620 ccaagggtta tgacgatttg gcctttggcg gatgtcgaaa gctcactctc ctttgccaga 7680 caggaatcaa taacaaattt gaccgtgact tggccatccg catcattgtc actggtgact 7740 tcggctgtca agttcagctc cacggaggtg ttttcatctt caaacacgat ggctttgttg 7800 atgctcatgt ccaagatttc caggagctga acttgggcgg cacgctcacc agccaccttc 7860 atggcagctt ccatggccat aattatgtac ccagcagcgg ggaacacagt ctggccttgt 7920 agcgcatgac cgtcgagcca ttccagatcc cggggcctga tgaagtttgt ccactggaag 7980

PL 202 457 B1 gtcgatgctg tgctgtaaga agaaagcttt ccaagcagaa gatggggcgc acctccacga 8040 agatgctggc gggtggagcg agattctgcc cagtattgac gagtatgatc ccaagagtat 8100 gtgggcaatg actttgacag gttttgaacg gcacgatcgg gccggacttg ttgtacgaag 8160 ccctcggcgt cgatactccg aactccgaaa cgctcccaaa tgtatcccag acctccagca 8220 aaagcgtcca catcgtcaac gtttcgtgcc aagcacccgg tatacggcag ctccacaccg 8280 gcaagagcat ccttgatggt ggctagacac ggacccttga gagcagggtg ggcgccaatt 8340 tcgatggcga cgtcgattag acgatgagtg atgactgctt tctgcacagc ctgcgagaac 8400 aagaccggag agacgagatt gtctttccaa taagcgggca tcacatcctg tacagtcatt 8460 tgcttgctgg tctcgtggac ggcagagaac caagcaacac tatcgttacc ttggccatcg 8520 gcaacagcac agtcgcactc cagcaatgcc ttgacatatg gagctgcgca tgggtgcatg 8580 tgatgcgaat ggtaggcctt gtcaactctc aagattctgg caaaagtgga ttcatcctcc 8640 aagacacctt caacgtgctg gatagcatcc atgtcgccgg agaaggtcac actatccggt 8700 gaattgctag cggcgacgca gacccgaccc tcaaaggctt cgagctcgca tagttccttt 8760 gcgtcatcgt acgacatacc tgccgcCagc atagcgcctg tctggccgct tggagaagag 8820 gcatgctccg cggacacaac tccacgcaga tgcgcaatac ggatagcttg agtggcactg 8880 atgaatcctg ccgcaaaggc acaggcaatc tcacctgaac tgtggccgac aattgcactg 8940 aactcgatac cagctgcagc gagaagtcgg accagaacga tttgtacggc gcagcataga 9000 ggctgggaga agctggcgag tctgacgttt gaggcatccc cttcaagcat gagctggtca 9050 tacagtgtcc acgtaggccg atacttttca ggcagtgttt gcagtgaatt atccagctct 9120 tcgagaatgc ctctcacaaa tggcataccc accatgagct tcttcagcat gcccggccac 9180 tgtgcacctt ggccagtaaa gacacctagt acgcgagggt tgtcattcgc gtcggtgcgg 9240 aagtcggtga cgacctcacc gtccgcgatg gcagcctcca gtgccgcgcg ggctacttcc 9300 ttgttgtgtg ctgeaatcgc acgacggaag ggcaagatag accgtttctc aagtaaggta 93S0 tatgcgatat catgcatgtc cacgtcatca tgcgtttcca gaaattggag catattttct 9420 agegttgcct tcatggagcg ctgcgacttc gatgaaagca caaggggcaa gctgcatgca 9480 tctgcatctg aggtcacctc tgttaccact gctgtcggct tgtgtggagg agccatatac 9540 tcttcgataa tagcatgggc atttgtacca ccaaatcctg atgtgtttat atgtttagct 9600 aacttcactt tcgttctcaa gaagtgcagt tgaatcctta ccaaatgaat taacgctgac 9660 tctgcgaggc tgcccgggcg caacaatcgg ccattctgtg gcctccgttg caattttcaa 9720 gtgcgtatag aacggagcga cacggggact gatcttctca aacagcaggt ttggcgggat 9780 cacgccattt cgtacagcaa acgatgcctt cattaagccc gcaataccag cagtgccttc 9840 cgtgtgaccg agaactgtct tgatgctgcc gacaaaaagc tcatctttct cgccgtcgct 9900 gtcgattgtt ccatccttgt gtccgaagaa ggctgttgca atagcctcag cttcctgtgg 9960 gtcaccggct ggtgtaccag ttcctgggat cttcgtgtta gggagagaga gactttctgc 10020 aacttccata aggctgatac ttccagggaa taccacttac catgggcttc aaagaactgg 10080 cagcgttcct gggggttggt aatatcaaga ccagccttgg catatgtggc ccgaatgagg 10140 gcttcttgtg cgctatggtt tggcattgtg atacctgtcg ttcggccatc ttggttgata 10200 ccggtctctc ggataacaca ctcgatactg tccccgtcgc gcagtgcctg gctcagcgtt 10260 ttcaggacaa tagagcaaac accttcctaa aaagcagtta caggaggtca gtgccatctt 10320 gctttttttg aaaggaattg atgcattgtc aacttactcc tctggcatat ccatcggcag 103Θ0 cagcatccca cattcgagat ctaccattgg gggacagcat gttcaatttg ctctccatta 10440 caaaggtcat ggggcccaat atcagattcg caccggctgc aaccgccatg gtactctcgc 10500 ccgttctaag ctgttggacg gccagatgca cggcagctaa ggatgaacta caggctgtgt 10560 cgatcgtcat ctgcagaatc agtcaggaat ctgtcagcac ttgacgaagt cgggctcgct 10620 caatgagtgg cactcacact cggcccatgc cagtcgaaga agtatgatac acggttggag 10680 gccacactga cagctacccc cgtggcagag tatgtaggaa tactatccaa ttcacgcgtc 10740 acgatagtct catagtcatg cgtcatcata ccgacgtaca cagcagtaga ggatccttga 10800 aggccttgga tccgtaggcc tgcgttggat acagcttcat agaccgtctc cagcagcagc 10860 ctttgctgtg ggtcaatcgt ttcggcctct ccagcttgga tgttgaagaa agaggcatca 10920 aaaccgcgta gatcctcctg cagcaagtat gcaaagggtg cgttcgtgcg cccggggtga 10980 gtgccatcgg ggctgtaaaa tgtatcgacg tcaaatctct ccttagggat cttggtctgt 11040 acatcccggg gctctttgag cagctcccaa agttttgatg gtgtgttgac accacctgga 11100 aaccgacaac cgcttcccac taccacaatt ggctcgtttg gatagttggc ttgatccata 11160

PL 202 457 B1 actgctgatc tcttctcact gagcgaacaa ctcatctaga gcaatgcaag tcctccatac ggctgtatca ctgctcctaa tttttttttt agtgctgtta ccactggtgt tcgaatcgta gtctcatcgc aatggtggga ggatcgaagc attgcaccat tgtacaagtt tCtCt3£ł^3.t tcaaggaaat cccaagcccc tgttcggtaa gacataccgc ttgtcacacg ggctggatat tatggcccat gtgaccaagt aaaaggccgc ggtttgaaga atttcgccgg ggcacccaga gctggacgcc agcgaatcaa tatccaatgg acaaccctga gcgaggatcc gcttcggctg ttctcctcgc aatactaccg ggcgcaacga aacaaatatg gctgtattag tttgtaatcg agaagggaga ctacaccgcc tctccccatt agtcttgatg tggacacaag gtgccaacgc gagaaaaaga agtataaaaa ttctcagggc gcattaaata ggccgctatg ctgtttttgg gcatgccggg gccggccttg ttcggacaat ctcggcacct ggcgttattc aggtgaaacc aggaaacaac ttcaaggttg ttcgattata gcataggtcc ccaatgggta ctaccgtttg gttgacgacc ttggttctcg cctcccatcg tttggcggat +- r-i-rt s l-na - fctgccaggat caagtacaca aagcgagggt gaatatacta aacagtcaca tgcaaagaac gctactgcga gcgccgcgca atgtgtagcg caccgccgac catctacgcc ccttattcag tgcctctctg gccggtcgag cctcttcatt tgtgtgggaa agacaaggcc gaacccacgc tcatatactg tcacgctttt ggacatcccg catccgtccc tcgagtaggt aacgtggtgt gagtgtgtat acgtagggaa ctctcaggcg ttcctactca tactccctcc ctttcgaccg gagaactttt gcattcactc cactgtaatg gtcaggctca ctccttcgta gcgataggat cacaacattt caaccgatac ttcaagatcc agcaaaccct ggtcacacga gagtttttca cgaactgccc actggaagag aaccgtcgca tatctgtctc tcgacccctc cgggggcgcc atgagggcta aaaaacgaca tccatggccg gtatgacctc i t i ΓίΓΐ -n /- +gcacatcttg aagccattgg aagtgtcaat gagtggcaaa ctcattatgg catgccgtga ccgctcgctc cgaaagatca aagggcgtgc ggccgctggt tcgacggatc cctctccgcc ttcaagctga tgcgccacta cccaagggcg aaccccgaaa ttcaccgctc gcttgtcccg attcagtatg agcgttcgta ctccctcatg caggcttatt tagtaaaata agactttggc tcctgctacg gtcggcagta ttgactggcg acatccccga cgccttccga ttcaacgcgc gacagtcaag ttccgacttc gtatttcagg gcccaggctc ctatacctcc tgggattaaa gttcttacag cgtcgttata attctagtac cccggcgtca ggctgaatga ctcggattgt catccaggta tgctctcggc gcgctctcat acgcaatgct aagcccttgt agtccgaact ggcaggactt agcccctgcg acgagtttcg tgaattttcc tcaacaaagt ctaccttggc ttttctgtct ccgcacctgt tcggcgacaa gtgtggcggt actggtttca ttgatcctga agccgcccca acgatgtggc ttttcgtcgg aagagatccg agctcctcga tgcgcagtac agttggccgc attatgatcc aattggagaa ggcggttctt atgtgaagcc tgcatccaac accggtgcta ccaatagttt aaacgcattt tatgtgcgag cagagcggcc atgaagcttt cttacgatga ctaggcgaaa ctacatatcc atttacaagg cctccgaggt gagaacgagt tatctctatt gattcagatt gtcgagctat ccttgtcttg aatcgeagag tttacttgca tcaaatgccc ttcggtgcac atcaaacgtg tcttgtgctg aacttcgatt cacaaaatcc tcttcgctct cggccaggtt ggcggtcgca gcaagtctat cgatacgtat cttcattgtt gaaaatcaaa attgttgtaa tctccctgga tgttttgaac cgacgctact tgagcattga ctattccaat aatctgccac acaagctcgc accgcaagga gattcagcga gtacgtcgat gggtgctcag tgcccttgtg cactgtaatc cagctgcatg cgctctcaga tgtggctgca ctaccgattt taccaacggt cgcctcgaag tgtaccagga cacaaagctc agatataaca ccgtcccaga tattcgattg agacagaaac atctgcttct tctcccggta cgagggctta gagaggacgg acaatctgta cttgcgggaa gctaagacag gcacatgtgt tactgctatc ggattcaggc acccgcttgg cgtcagtaga ttgaatctct cgtatcagta ccacttccca gaatagccat aatatcaatt ctcggtgaag gggggggggg cagaagcatt ttcttctttt cttctgaccg gtgcttctta aatcccaaaa ggtccgagct gattccggct gatatgtgca ctcaatgacg fcfcCy ciCyy y t cagttacaaa attgccaagt gcctctggct ggattggacc aatgaggagt caacttcgcg cgcaaattgc cgacgtgctg accatgcaat ctcgctatgg gacattgcca ggagaagggg aaagagacgc gacatcactc gaccgcatga atgcgcatgc gatcacatcg gaaatcaaga gacgatgaca atggtacgcc cgcaaactaa gaaactaggt tgatgccttc acagagagag ataccgccag caatcaccga ggctctgtta cgcaacgacg cccactgccc tcataatgga cttccctggt actttgttgc cagaagtcag ttcagaccat ccagacaaaa

11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 122 4 0 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740

800 13860 13920 13980 14040 14100 14160

22 0 14280 14340

PL 202 457 B1 ggcttcactg aacccttcaa cttaactgca tttcgccaca actaactcga cgaggccggc 14400 gatggtgtta ccattcatga gctcaaagat cgacacatca acatggattt cagatgtgat 14460 ccagtttcga agttcaatgg cgacgagtga gtctacgccg acacctgcca ggtttttgga 14520 cgaggacatg tcgtcttctg ccagaccaaa cattcgcatc agcttttccg tcattgcttt 14580 gaggacgata gaaatggcct cgtcgtgaga ggtgaccctg cttagttggg cccgcacgcc 14640 atctggtcct tttttatgcg aagagacaaa ggattggtct gcatgaagga cttggcggta 14700 tttaagtccc acaaaccgct gttcctgtat ccagtttgcc tcggtccagt gagcacccgg 14760 ggatgtgttg attcctgtaa ccacagctgc gggaggtgat ggaaattgag gggaagaaca 14820 caggattgcc ttctccaaca catccatgac gtccttttca tgcataggct tgtaacctat 14880 tctagcgagc cggtcggcca caccacggcc agtttcagcc acgtatccaa cagacttgac 14940 catgcccaag tcaatggtga cagccggcat gccatgggct ctccggtggt gcgcaagtgc 15000 gtcctggaat gcaccagcag ctgcgtaatt ggcctggcct gccccaccca tgaccccaac 15060 aagggatgag agcatcacga agaagtcaac atcctgtgcg atcttgtgaa gataccaact 15120 accctgtact tttgggcgtg ttgctgcatt aaattcatcc aatgtcattc gcgatagaag 15180 cgcgtccttg agaaccatgg caccttgtat gatacctcga attggcggtg catgtgcttc 15240 ttcgcacaac cggagcacct tggtgacctg atcttgatct gagatgtcac atgcgtgtag 15300 atagacagcg cactgttgat tttgcaagct ggttatgaat ggactggcct ttgcacttct 15360 cgataggata atcaagtgct tcgcgccatg atcaacaagc cactgacaga tctgctttcc 15420 aattcccccc agcccaccag caactaggta agaactgtca ggcttcagct tcagcgagaa 15480 ccctccatcg ccgactggga ccagttcgtc cccagataca ttgaccacaa ctttgccaac 15540 atgctgacca ctctgcatcg tacggaaggc cttctcgatg tttgacaagg agtgctgctg 15600 gattggacca atcaagccaa tcgcttttgt ctcgaggagt tttgtgacat ggttcaacgc 15660 ttcggatact tcttcacttt tggctctttg ccacgagaga agatcaattg atgtgaaaga 15720 gacgtcccgg gtgaatggca gcatgtcaag tctgctgttt tgctccaggt ccttttttcc 15780 aatctcaaca aatctgccga attcggccat gcagtcaaag cttgcttgga ggagttgacc 15840 tgccaatgag tttagaacga catgaacgcc aagtccgccc gtgtaggctt tgatgccgtc 15900 gacgaataag tcattcctgc tcgagaagat atgatccgga ttgatgccga atttatcgcc 15960 gacaaagtca cgcttggctt gagttcccgc tgtgacgaag acctcggcac ccgcaagctg 16020 ggacaaaatg atcgctgctt gaccgacgcc tccagctcca ctgtggatca agactctttc 16080 gcctcgtcgt agctttgccg tggtataaag cgcaatatat gcggtagtga aagccagggg 16140 gaccgaagcg gcttctggga agcccatttc gtccggaata cggacgacat tagtgtacgg 16200 cgtctgtgtt ctggtcgccc aatggccttt cagtagtgca catacgcggt cccctaatct 16260 gaggccttgg ctagcggcag cagctccacc gagctttgtg atcactccgg cgcattcgaa 16320 gcccatcaca cggttggcct ccaattgacc catggcaacc atgacatccc gaaaattgag 16380 accgaaagct ttgggttcga tttctaccca atcatccgga agatccttgc cttcacgtcc 16440 ttcgtcgtct cgaaattgca gggagtctaa gagccctggc gtctcaacct ccatccgcag 16500 acgacgcccg ggttgctcga acggctgcag tgtgaectca accgcttctt ggtccttcca 16560 gtgcgggtca ttgaaaagtc gcggtacgtg gatgacgccg tttctctctg caaattcaaa 16620 ctccttgtct tcggaaaggt cgccgaggcg gccattgaag atattgcaga tagcatacag 16680 ggactcgtgg gtgtatgcgt ttcgagaagg atcgagatcc aacgatacat attccttccc 16740 gttattttcg ttgcggatgg tacgcagcag accaatatgt agagctttcc atggatcctc 16800 ggagctcatg gctgctcctc tagacaccca gagaagtgcg ttgcagttat tcagcatcgc 16860 ggtgatggat ttgaaggtct cgcttcccac ctctccaagg agcgaggact ccatttcccc 16920 aagaaaaatg catgtccttc cagtggtatc tacctcgccc agagcgttga tcgatgggct 16980 agaactggtc ttttcacaaa ttgctgcctg gagactttcc agccaagatg aaggaggtcg 17040 gagcgctccg tgcagcaaaa gcacctccga ttctgccact gtatccgggg ttgtattctc 17100 ttttctagcc gtcgatagca ttgtgctgat catgtaaaac tcatcgtctt cacaatcacg 17160 aacctccaat tccacaccgt tgaaaccgct cgtgtccaac atggtgttcc aaagatcggt 17220 agtgagcgat ggcgtcgact tccgctcagg ctcctcactg agccaccaac ctggcaacag 17280 tccgaaggta aagaacaaat cgagctgatc cctggtagtc tcaaccaaaa tcaagttgcc 17340 cccaggcttg agcaattttc gaacgttact cagtgttcgt ttcatgcatc gagttgcatg 17400 caggacctgg caagccacga ccacatcgta ggtggcacat tcaaaccctt gttgctcggg 17460 atcgctttca atatccaatt ttttgaaagt catcacgtct tgccaatccg caaattgctc 17520

PL 202 457 B1 acgcgccgac tcgaaaaacc cggcagacac atcggtgaag tcataacgat cgatcggctt 17580 ggtgtttccc aatgcattga caataagctt tgtgcagccg cccgtgcctc cgccaatctc 17640 caaaatgcga gaacgcgggt tcttgtgggc gcaaagtcgg atcagctcgc tggcttgtgc 17700 gtttgatcgg ctccatttga ttgcgttgac gtagtatctg cttagcagct gatcttgcat 17760 catcaactca agtggctctg tttcgcggcg tagcattgct attaactgag gtcctagacg 17820 agaaatcatc tcgccattga cgctttctcc agcgactctg gcctgtaggc atttcttctg 17880 ctcagcatcg tcacttagcc agtcgcaact ggctgggctg agcttgtttt gtctcgcaag 17940 gtccaattgg acattcatcc aatcgaaata cttctgaagg tggccatcca gatgttggat 18000 atcagaattt gtcaaatcag tgacagcctc ctgtataaag ttgatcgtgc atcttcggag 18060 gCccatcatg agttccgttt ctttcgtctc agcctcagtg ctcaactttt ctttgagcca 18120 agtggagtca cccaagctga tgtcaggggc ccaaacccag gagctgcagg cattttctgt 18180 gtcgttggag tctgactttt ggtcagagaa gctgcttcca accgactgga aaacaaggcc 18240 ttcaatctct atgactggga ttccgtccga gggagaagaa ccgctatcat agtcatcaaa 18300 cactgccaag tcggtagaga aggattgaga gttgcgatcc ttgatgctgg cctgtgcgtc 18360 cagagcatca ccagcctcca agtcagccag gctagaggat attttgacat ttcttagcct 18420 ccttggtacc atggccgttt tcatacgtgt tcccgcgtag ggtaacaccg tgtatgccgc 18480 ctggatcacc gagtccagag tagtaggatg gacgatgtgt cgattctcgt acgagtgagg 18540 catagccgag gcagtgtcag caatggaaaa tctgcaaaac gagccctgtc cattyttttg 18600 aattcgctga atgttctgaa aaatgggtcc gtggcatatc ccattcgcgt gtaaggactc 18660 ccagagatcg ttgggatcaa tgctccggtt atctgagcct agattcaacc tgcgtgaggc 18720 ttccacagtt gaacagtcaa ggtggcttct ttcgctctcc gaacgtatta atccggtgca 18780 gtgttctgtc caggtattat tttcgcccga aattgagtgc acagaaaatt gatgccagtt 18840 ctttgtgccg agggaccttt cctcacatga acggatcgtt aggcgcaggt caacctctgc 18900 ttctgcatca gcgggtatta tgagagcctg cgcgagttca acgtcacgca agttgtagtt 18960 gatgctagcc cccgcaactg gtgggcagac ttgtgaaaac ccctcgatgg ccatgctgat 19020 gaagccagct cccggaaaga tgatgctcga accaacgacg tgatctcgta tccatggaat 19080 atctgacaga cggagaacat gtttccattt aggcgcgaaa tgaggagaga gagattcccg 19140 tgagcctatc aaagtgtgag gcggatgggt tctctgtttg gactcacgac Cgccgcgagg 19200 ctctctccaa taacgggttt ggtgattcca cgggtacgcc ggcaaatcgc tcagtacctt 19260 cactctgggc tcttttcttc catgaggaaa gtttatagcg tccattttga gcccataacc 19320 cttgcttatc aactccgtag cagcacgata cattgtctcc aacgagcttc tgccgcgaga 19380 aaggcaactg agatagttta tatctgttcc tttcagaccc agatcctgca tgacttggtt 19440 gattggacca ccaagcgctc cgtgaggccc tatttcaata atcacatcga cggctttctc 19500 tttggtgttg ggatcaaagc acatctcgcg gagtgaggac tcgaactcta ccggctgtag 19560 catactatcc atccagtgtg tgggatccaa tagcaattta agatcggtca tgcgactacc 19620 agtcttaggt gatgaatata atacaccctt tgaggtgtca gcattgggat tgtcgttgtt 19680 gttatccgag ttgaacagat ctctcagtga cgccccaaag gcatctgcca ttggtcgcat 19740 gtggcttgaa tggaaggctt cagtgacttt cagtttcctg gtaaagatgc catcggcgtg 19800 taacaacttt tcaagtttct cgattgcacc caaatctccc gacaccgtca cactacattg 19860 actgttgata catccaacca ccacacagcc gtcctcctgg ttgagacgcg aaatgtaaac 19920 attggtctca ctgcgaccaa gacccaccgc catcattcct cctttggctg ccaatgcggg 19980 cttgggctta gtggtcaata caccgcgtat ataagtgatc ccaatggccg accgcgcgga 20040 taaagcccca gctgcgtagg cagcagcagc ctctccactt gagtgactgg ttatccccgt 20100 tggccgaatt ccccatgacc aaaggagacg cacaagtgca atttggatag cggttgacag 20160 tggtagactg tattcggcat catttacccg agtcgtcagc tcatcacggt ggagctcctc 20220 tgtgcaattg aatgttagta cctcaagctt gatacagtat tacttttccc gggctcgcaa 20280 cttacccata aaattccaac tcgcgcccag ttgcttgatg tagccatcac attcaagaat 20340 cgcctgtttg aatactggga atgtattgac cagctctctg cccattgcat gccactgcgc 20400 cccctgaccg gtgaatacaa atccgagccg tactttctca ttcgctcgtt ttggttgatt 20460 ggactcatcg ctgagggcag aaacaaggcc gccaaggctg tctgctacat acactgacgt 20520 ccatggcaga atggaacggc gagagcctag tgtataggcg aggctggcga ggaagggttc 20580 cccgtcaatg tcagcgacgg atttaatgta gtctcgcagg cttgctatcg ttcgccgaca 20640 agcttgctcg tccttggcac gcacaacgta tatgcggctc tgtttggaac catcctcaac 20700

PL 202 457 B1 cctaccatgc tcagagttac cattgacatg cacttgatcc tctggcaggg ccaatgatgc 20760 gcgatcatat gattccaaaa tgacgtgagc attcgaacca ccaaagccga agttattgac 20820 agatgcgcga cgagtcccat ctttcacagg ccagtcttga gcagacatgg ggatctttga 20880 aacattaacc tttgaaacat ataactgaat ctgcgaatgc gcaaagcctt accttgatgt 20940 tcttttggtc aagcatcagc ttgctgttct tttgcaggaa ccgcgcatta gggggaatca 21000 agcccttctc caaggccaag gccaccttga ttatactggc caggccactg gcggcttctg 21060 tatggccaat atttgctttc acagagccaa ggtgcagagg atgtccttta aaagctgctg 21120 aaattgctga gatttcaagg gggtcaccag ttggtgttcc agttccgtgg gcctccacgt 21160 acgaggtcaa cgacatatct agcccagcct tatcgtaaca ctcctggatc agacttttct 21240 gcgccacatc actcggcgca gtaattgcgg gtgttttgcc atcctggttc agcgctgtct 21300 ctcgaatgac ggctcggata gggtcttggt ctcgcaacgc gttagggagg gcctttatta 21360 ccagagcggc aattccttcc ccgcgaccat atccattcgc tcgaggatca aaagagtacg 21420 agataccatc cggggacaaa aatctgtcat tgagcaacaa ggattgctta gttcaagact 21480 ctcgatctgg aatcttcttc ggaaaactca ccccaggttt gacatcgtaa caaaaacatc 21540 gggattgagc agaagatttg caccgataac gatggctgta tctgactccc cagtacgtaa 21600 gctctggcac gccaagtgca gtgcggtcaa tgtcgtcgaa caggccgtgt caaccgtcac 21S60 gctgggaeea cgtaagtcgt agaagtgtga tatccggttc gaaagcattg ttcctgagtt 21720 gccagttatg aaataacgcg gaactgtctc ggggtcacga ttgagcgaat cctgatagtc 21780 gtggtacatg acacccccaa acaccgacgt attagagcct gccataccat cgatggtgat 21840 accggctgga tgatggtcag tgacgtttgc ttacagtgag gatgacccac actacatacc 21900 actctccagc gattcgtaga ccacctcaag cataagccga tactgcggat ccatgcactg 21960 tccaatatta gatctctgcg tcccgggtta gatcaattga aataatcata cgctggcgac 22020 ctctgtggtc atgttgaaga acgcggcgtc aaataaagca ggatcctcgt cgatgaagtg 22080 tccacccttt acgtgggtct atccagtcat ccttggagtc agtaaccaag cttcagtgat 22140 gctcaaatct tgtgtcaaat attcaaaaca agatataaat gcatgcatgt tagatactca 22200 cggacccgac cctttcgcca ttcgggtggt atactcctct cacattgaat cgcgaggagg 22260 ggaccttaga ccaggcactg cctcctcttt caaccatttc ccaaagcttc tgtggactcg 22320 ttgcatctcc agcaaatcga catcccattc caactatggc aatgggcgtg gatgtgttag 22380 agcaagccga gcctgccatt gcggttgcgg ttgcggttgc ggttgcggtt gcggttacgg 22440 cgggggtatt gttcattcca acgttgtttc attgactgat atatcagtcg ccctggtgat 22500 aaaaccgttg atagtcttcc aacagtctac aggtccctgg catagctata gatgcataag 22560 ctgcccccga cacgtgattc atagttcggg gtttgttttc atcttggacg tgacacgata 22620 ttcgctctgt gcccatggga aaccccggac caccatgcta tgctcggggc aataccttag 22680 aggtaccggt tcgggaggca ttgtctgtcg tcacgataat cccgagtcaa aacgccgatg 22740 ggaaaccgtc gaacaagacg aaacaggtca ggccggccag gtagttttcg ggtataatgg 22800 aggctgtcag aatccgatac tccgtacaca gatgcgaaat acgcatacga gctatcaaac 22860 caaacgaatc caaaagcctt ggaaaagctt ggaaaggctt agtgggtaat cctgtcccaa 22920 ggtttgttga gggcctgagc gcagggtggg tcctgtaagc agttggtaat tcaatttcca 22980 acaatacaca atccccaaaa tttgcattat cggttgacta agacaagcaa acaaaatata 23040 tgcaggaagc gcaattcatc gcgagcaaac gatcatcatg agcatgtgac cctttcctct 23100 tttttctact tcggaaggcg gcatgatcat ctgtcagaac tcccaatcgg gagcaatacc 23160 ataccttacg gcaccccact cagacccatg cacaaagaaa atccatgcgc cgaatattga 23220 agccttggca acaaagcccc gtgtaactcc gaaggtatcc aaagaccgag agacgccgat 23280 ttgagagaca cgtacggagg tccacacaaa atgttcccga gtctatacac tatactccaa 23340 actgacttct tgtctacctg ggtatcttgt tcaggttgct gtttactgag ataaatgata 23400 ccgggggggg gggggggggg gggggttgac actggctttt cgtggacaga ataataccca 23460 tacatccctg cgtaagtagt cgtttcgaga agaatgtgtt tcgtggtgca ttactccgta 23520 ggcacaatat atttccattc ctcacgaagt ggcctcgtcc gggcgtgatc gatgcagctt 23580 gccgccccac caaaaaagga ccacaatacg agtcagatta gaaacgtcta acaggacgtc 23640 tatgtaagag gacgctcctt tgtatgtcgg atctaggcat gacaaaataa ctatacctag 23700 gtagtgttct gtcttattgg tcatttggcc tactttcgga acaatcttgg aagttcacat 23760 tcctaggtat cagggcaatt gattggtgtc cccagaattc ttttttctcg aataaaggat 23820 aaatttatgc ataaaaacct tggaaactga gcatagttat gagcacaaat actagttttc 23880

PL 202 457 B1 agtgcaattg agttgacacc aatctttccg tcccgtacct ccaatctacg tggaggtatg ttgcagagct tgtagcacag aatcaatgaa aatttctatc tagctagtac ttgataaagc agaatggctg atcaagcact caccattcct gccctttaac cgccggaact * .~r~^ rr.', r-Tiracacaaaacg tcaagagcgc tgactttcgt caagcgtcct taggggttcc ttggctttga gaaagcccca tcaattacgc tggtcgagat acttctgtgt acactgcgat ggtacgcgtt atgatgccca ttccgaagtt gctccaccct aaagtctgag gactagatga tcgcccccat acgagtatgg tcctctccaa tcaaggccgc ttgagcttga caagtctcca atgcctcatt cagccactag agaacacaat ttcccgggta gctctatcat agctgccgta ttggctatat atttcattcc aggcaatcaa gcccgtgtgt cggacgtcgg tacaaagtat gtcctactat ggtcatgaat ctgcctcagc aggaactgtt acggcagatt cactttatct gactagattc acctttcagc tcagcagcac caaaacggcg cacatacgtt agaatggggc gaagtggcag aatgaccttg tgctcccctc cgcctattcg cgtggctgct a h ł· n a h ± λ ca.

cagccttgct tcaaacgctc ctcactcttc tttgtcgtca gatgagcatg gaagagcatc gaagatacag cgtacgaagc ectgctccta tctagctgca tctgtctatc ggaagatgag agacagtgca caaattctgg tttccaagcc cggatcggcc actacttttc caagtacgaa agttggtgga atgggtgttt cagactggga ccaggccgaa agctcctcag agtcttaatt tgaacttccc cagcgagttg tgccctagag ttcgaggaca cgaaaactac gccagtccct tatggcaacc cctcggtggc gaagtttgat ccagaccgta gcggacaact cctttgcttg ccattcataa ctcaggggcg cagttgtccc atacctaggc caagccctaa ttttctcaga atggtcgctt cctctacgct tgtctacacc ggactactca tctttggtcg agcttcgacg gtattcccgg cctgtgaacc aaagataaag gttcaagaaa atggaacgcc caatgggtgc gacgtggttg ctcagcatga acatttgcct aggttgctat actctgacca tctgaccagg gccattcggg gttatcggtg ttgatcctgt aagctcgagg ggtctcagtc cgtacatatc atggtcgttg tcttctagtg attaaacccc caggcaagag ctagagtatc aaaatggtcg gtggcacttg atcaaagatc agcttcaacg accagagtgt aaagcatctc gtgtctcgca aacgatgagg aagagtctca ccggctaccg gcctgggaac gttggcgtcg accgagggcg ggtgccgtga gtccttgaac atgaaagaag atcgccggta

gtacccctta	ccaattatac	cctaggcagc	23940
aggtggacca	gatgcaggga	taaggaagcg	24000
cgcgccattt	gttattttct	tctactcatt	24060
tcccaacccc	ttgggccgaa	caaccttcct	24120
gcctaaccga	ttaggttgct	cattcgattt	24180
ttcccaattg	aagtgctttt	ccgtccccat	24240
gactacctag	ctataggtac	cactccaagc	24300
cgttgctacc	ctctcgcttt	cgcggtaggg	243S0
cgggaaatcg	ggcattgacc	tccacactcc	24420
cgatccatac	cgtttgcacc	atagctattc	24480
aagacagctt	cttccatggc	cccgcaaacg	24540
aaggaagtcg	aagcttgatc	accggcccac	24600
gggatgcaga	tgttctcgga	gatttcaacc	24660
ggtcatatgg	ggttgcatct	caagcagcct	24720
tatctgtgat	tgaccttccc	tcaacgtcga	24780
ttttcgcctt	ctctgtggaa	tacagcagcg	24840
tccccaacaa	cagtgccgac	ctgaaattgc	24900
O \ U < 4” u—r/·« — +“ L---J uyyat	catgaaggct	yCCayyyCtC	2 4 960
acgatacctg	gacagagtct	cttgatctta	25020
tcatggtgct	aggttatata	tcaatgcact	25080
aaaaattggg	atcgaaggtt	tggctggcta	25140
ttctcctcgg	tctcgacgtg	gccataagac	25200
ccgaaggcct	ccccttcttg	gtggtgatcg	25260
gggctgtttt	gtcctatgct	gtgcagcacc	25320
gtagcgtgac	agccattgct	gaaagtacca	25380
agaagggtta	caatatcgtg	tgccactacg	25440
ctgtcttagg	catccaaggt	gggctacagc	25500
tctttgactg	tctgctgctg	tttacattct	25560
taaaccgcct	caaacgtcat	atcaacatgc	25620
agcggacggc	ggagagtgtc	gcgaccagca	25680
tgtttggcaa	tgatatgaaa	ggcagcagtg	25740
gtttccttat	cgtcaacctc	gtcaacatcg	25800
gatcgttgtc	cagtatatca	tcttggaccg	25860
cgcttgagcc	cttcaaggta	gctggaagtg	25920
ggcgcggtca	atcgactatg	gtcactgtcc	25980
cttccattca	ccgtggtacc	tcgcagctac	26040
gtagcctgct	caccagcctg	gaagatcccg	26100
ccctaagtgt	cgctctgaac	agctatctgt	26160
ctaatctccc	gagtcaccca	gttgatccag	26220
ctgcccagaa	ccagacccct	cagattcaat	26280
tcactcctac	caccaccgac	agtgacagtg	26340
taaaggtcac	taagcgagca	gaaggaaaga	26400
cacaaatcga	actggacaat	ttgctgaagc	26460
atgtcgttgc	cttgtctttg	cggggaaagg	26520
aagactgcac	tcgtgccgtc	aaggttcgcc	26580
cagagcttac	aagtatgctg	gagcactcga	26640
gcgtgctcgg	tgcatgttgc	gagaacgtta	26700
ccggtcctat	tgttatcgac	ggcaagagtt	26760
tcctcgtcgc	tagtgctagc	cgtggcagta	26820
cagtcctgac	tggcgacggt	atgacacgag	26880
gagctggtgc	tgctaagatc	tggctcgatt	26940
ccttcaattc	aaccagcaga	tttgcgcgct	27000
ctcacttata	tattcgattt	aagactacta	27060

PL 202 457 B1 ctggcgacgc tatgggaatg aatatgattt ctaagggcgt ggagcatgca ctgaatgtta 27120 tggcgacaga ggcaggtttc agcgatatga atattattac cctatcagga aattactgta 27180 cggataagaa accttcagct ttgaattgga tcgatggacg gggcaagggc attgtggccg 27240 aagccatcat accggcgaac gttgtcaggg atgtcttaaa gagcgatgtg gatagcatgg 27300 ttcagctcaa catatcgaaa aatctgattg ggtccgctat ggctggctca gttggcggct 27360 tcaacgccca agctgccaat cttgcggcag ccattttcat tgccacaggt caggatccgg 27420 cgcaagttgt ggagagcgct aactgcatca ctctcatgaa caagtaagtt gaaagcggcc 27480 gcttacttgg aaacattcac taatcctgtt tagtcttcgc ggatcgcttc aaatctctgt 27540 ctccatgccg tctattgagg ttggaacgtt gggcggtggt acgattctgg agccccaggg 27600 cgcaatgctt gacatgcttg gtgtccgcgg atcacacccg accactcccg gtgagaatgc 27660 acgtcaactt gcgcgcatca tcggaagcgc tgttttggct ggggagctct cgctatgtgc 27720 tgccetagcc gccggtcacc tggtcaaggc gcacatggcg cacaaccgtt ctgccccggc 27780 atcttcagcc ccttctcgaa gtgtctcccc gtcaggcgga accaggacag tccctgttcc 27840 taacaatgca ctgaggccga gtgctgcagc tactgatcgg gctcgacgct gattaggtcg 27900 gaatcttagg agcattccaa gctccgtacc ccctccagtg gattcattgc aggaggatca 27960 tattttttct cattggttgt tattgtcata attttcaaaa gcacaatgca atgagacagg 28020 caggtggtag agtgaacggc cagaaagggt atctcatgtt tatatgttgt tgaaatttac 28080 gatgcaagta gtagggaaga agaatatata aagagatggt ccttttccag agagtgttta 28140 ggtctgatcc ctcataatta tttaatgagt gaaagctttg ttcaagctat aacttactga 28200 gtaggttgaa tgttgatctg attcattcct gaggtatcag gattgatgcc tgaaacatca 28260 atcatccatt gtcagatgcc gtaactaact aactatgaat ctcaacatag ttatatgttg 28320 ccaatctagc cacggtgact agaaccttga gatggactta gactagacat gggtcgcggg 28380 caatgacata tagaatcttt gaaatcgaca ttaattaagt atgtggagat tctttgtgga 28440 ggcacggtaa tgtgtctatc tagcaacgcg gtcaagcatc agtctcaggc acagcccggg 28500 tgtcgttttt ggttgcaatc ttccgccatc ccattccaaa ggcaaacaca aacgtgcacg 28560 ccgtagctcc cactgctaag taaaaagtat gatcaacggc gagactgtaa gcttttacaa 28620 cccctggaag gttattcttg ctgaccacat ctctgaagcc agtcgcccct gctgccgtca 28680 cggcctgcgt gtcgacagtg ggcgcatact tgctcaggcc agttctcaaa ccggacccaa 28740 agacaaggtt agcaaagtcc aggaagagcg atcctccaaa cgtctgtcca aacacggcga 28800 gagaaattcc gagggcacct tgttcgggcg aaagcgtgct ttggatggcg atgataggct 28860 ggccattgag tattgatgtc agcgtctagc ggttgcatgc tcttcttgct ttgatacaaa 28920 gccgaaagcg tgagagatga tcaaaggttt catagcttac cgtttgcatg ccacaaccac 28980 gaccgaagcc cgcgataaat tggtacatga cccatttcac agttgatgta tggggctgga 29040 aggtggatac cagacctgcg cctatggcga cgagaacagc gctgcctagg gcccaaggca 29100 aatagtatcc tgtctttcca actggtgcgt catatgtcag tatacacgat atccaagccc 29160 gatgtcagac ggttgtggca agaaaggagc catagaaatg gacggggtgg agaaaaatgt 29220 gtacgcgagt ttcacttact tgcgaagcca gaaaccatag ccataatgac ttgtccaaga 29280 attccaggca acatgtacac accactcagt gtgggagaaa catccttcac agcctggaag 29340 tagatcggta gatagtagga aaagacaagc aaggagccag agaaaaagcc cataaataaa 29400 caagagcacc acacttgtcg tttaccagcc actgagccag gaatcatggc aacagcatcg 29460 ccaacatgac gctcccatag cacgaacgca atcagagcaa accctccgcc acagaacagg 29520 ccgatgatga cggaacttcg ccaggtgtag gtcgaccctc cccattctag tgcgagggaa 29580 atcatggttg cgaaggctgc aaagaccaca aagcctacaa ggtccagttt gcgaagtgtg 29640 gattttatgt tggccattgg tttgtcggtc gagagttcgc tgtccgtgga tgaaattcgg 29700 tcgggtatgg tgatgacgag aaggaggaat gcagcgacag cgccgatggg gagattgata 29760 taaaagcctg aattccaagt gagaacatgg acaacaatca taaaaaggcc aaaggtcaac 29820 atacaccatc gccaagtggc gtgttgagtg aaagcacctc cgagcagtgg tccacagaca 29880 atggcaatct gactaactga aaacatattg tcagacgacg aaccgttcgt ttggggtaca 29940 tcagatcttg agatgacata cgacccatca tcactccaat caaaacttca tatgcgaggt 30000 cagcgtgtac acggcaccca gcagacttcc aaaaatcggt tcccttacct ggttgcttgt 30060 gcttaggagc agctgttgag aggattgtga gggctccgtt gacaagacct gagcctccca 30120 ttccagcaac ggcccgccca acaatcaaca tggtggaaga tcttgcggca ccgcatagca 30180 ccgagcctag ttcaaaaata cagaggaagg caaagaaagt gtacttcaag cccaagagtg 30240

PL 202 457 B1 tatacaattt accggccagg ggctggagag cacagctaaa tatgatgtta gctaatctgt 30300 tcgtacaatg aacaaggtca aggagaacag agccatactt agccagaaga taagcactgc 30360 cgtaccaccc tacatcgttc agagagtgga actcgcttgt gatatgtggg attgcctgtg 30420 gctggagtca attgactgtg ctgcgctctg ttctgaggta gccaccatct taccgtgacg 30480 ataatggaca tatcaaggag catcaaaaat gctacgaaag taactgaagc aaccaccagc 30540 ccgagcttga ggcctgtgat gtgctgggac ttggactcag tcgcttcgag cgtgtcattt 30600 tgactttctt ccttctgtgg ccttggttcc ccttctttag ggggtagagg ttctgacatc 30660 gcgcaattcc ttccgacttt tgcttcaagg ggcggtgtga atctctactg cgcggcgctt 30720 ctatagtacc tgtgttttgg tgtatgaatg atctcgctct cgttgtttcg ttaaggtccg 30780 ctagcctgaa gtcagattga tggatgggga tcaggggaaa ttggcgacgt ctttaatttt 30840 gcttttcttt gttaccggaa gtgttgcggt attagcgtgt ctgggcttat ttacgacgca 30900 caagatgcat tgaactggcc ccactgctag atctcactag tattgtggtt gtaatttacc 30960 tatactccat attgactggg caggttttga acacaaccca caccccccca tactacacat 31020 tagttttgca tattttcctg ggggccaaaa aaaccccaaa aggcttcaat attttgcggc 31080 caatggagag tgtaactaat ttggcccaca ctccggtggt atcaatcgga tctcactgca 31140 tatatgatga aagcaagagg gggcaggaga tacgctcttt attggctgtc tgcgcgaagc 31200 tggacaaatg caaataaaaa gacaaacaac cagctggaag accgggcgac aaacatggtt 31260 tacctaacac cctcgatccc aacaatgtgc atgttaatca atgtgctccg tggggagtat 31320 gaactataac atacgaagca gccattcatg tcaaaaaaaa aaccaggcga atgggcgtcg 31380 tcaacggttt cacataagta ctatattgta ctaactaccc gtgagactgg agagaacagt 31440 ctcgcgcgaa gaaacgataa gagcatcggt catatcggtc catctcggtc taagtgtatg 31500 agaatattcc gacgtgaatc catccgtcag tgatcaatgt ctccaagtaa ttcatcattt 31560 caattaccct cgctttactc cgtagaatac aagaccttac tagcgcaaac aagtgggggc 31620 taacggtgtg atctccttcc gttgcggccg ccacctcggt tccagccgta atacgacgac 31680 ccgtctatcg cgacccccta gccttggcca tttttggcgt tacagtaaag ctttggagag 31740 aaacgccaag ggaaaatgct agccaccaat tctataaatt actcttcaca tgcagctagt 31300 atcactggta agtctacggg gcacatgtaa aatttttatt actttctaat aatctttcca 31860 agttcttttc cacggggccc caatgcttaa aatactcaaa agacgtgaaa aacctgcaag 31920 ccgccagtga tatcacacgt aatgcctcaa cagcctgatt ccgagccatt atatgctgtt 31980 tgatgatctc aaattgagat ggcgagcget ggatctggga aattggtagt gggattggta 32040 tagaaacgta agtgcagaag accatgtaat aagtacatat ggaggctatg tgatggcccg 32100 atctagtttc ttcaatatag cgctgggtat aaaaaaaagc aggggctttc tcagggtaat 32160 gtcgcagtct acaacgagtg gcgtccactg acagggaaag gcgagcgggg ctatgctacc 32220 ttcaatttcc atagaggggg gatgcaccat ctccgacaat ctatagttac tcaaacaggt 32280 acggtactaa gcaatattgt gtttcttcgc taatgcgaat atttccttat agcaacgtcg 32340 caacacattt atcgtcttcc ctgaggcctt tgttgacttg ggctcttcgt ctccggcttc 32400 gtcactccaa agcacagata ggagacgaga ggccggcgtt atggttttat tttcagcgcc 32460 aaggatttgc cacgatgtgc ttggcatatc tgataggacc tattccccct ctcccggtca 32520 gcgcattgct gatgtatgca agggaagaaa agactggtgg ttatcggtcc cacttactag 32580 acgaatagat gccgcagccc cgtgctcctg tgctatcccc aaagcagtct caatctcact 32640 caatagtcga aggcttacac gcaatgtcgt gcatgcagaa gataaggcgt gcatgaatgg 32700 gtcgagatgt gaaatgagct cgccgatatg aagattagag tgaaacgagg gaagtgcttc 32760 ggctcttcca ttgtcatttc tagtggttga gccagaccag taccaatcca ttcgtgtgct 32820 ttgcttttgt ccacaaggtt gggctttcat cacctcggat agtagcagct gggaaagtga 32880 tgtcatgatt ttgacagaca acatgtagca atgcaccgcc atgaacaagt tcttggtttg 32940 cagacaccca tctaacatgc tgctattgct gctcgtgatc acacgttctt gaagatgtag 33000 tagcaatcta ccaaaggcat tcaaaaagtc ccctatcggg tctaggaaga agctttagcg 33060 acaatcaaga ggcagtaaac aggcagaatt gaaaatctca cagcttaaaa ttttttgctt 33120 gggccattcc acagtcaccc cgtggagtat tacctctagg tcctgtgaca catccgacag 33180 actttcgaaa aggtctcgtt gcgtgttgct tgtgttggat tgtccggatg acgagttccc 33240 ctctacttcg aggtcaaaca gcgatggcga gacaggcgcc gttgcatcca aagggccttc 33300 aaagtcgtag cctagatctg gtatccccga agattcattg ctgttggcat cgtcgcgaaa 33360 tgtatttggc tgaggccagc cgccgggaaa cgactcggga tcatcaaagt tgattgatgt 33420

PL 202 457 B1 atcatagaat gccaatatgc cgtagaagat ggcttcttta ttgttgacaa cttttgtgca aatcgttgca ctttgcatgt agttcaggtc gacaccaaaa tagcctctgc gtattacact atgccagatg atc <210> 2 <211? 342 < 212> DNA <213> Pen tgcagggttg gtaggtggtg gtcgcggtca tgtaaattgc cgttgacact tgacaccggt tgcggcaggg tcctggatct gtcttgctgg gccaatagtc tcttatgcga agaaagagtt aaatacctgt cillium ci ccgctgatgg agcagtaagg tcggttgtga gcttgggtag gagcacggac cacatgagcg acataattat ttatgtattg aagacttact ttactatgaa gctcatcaaa ctaaaagaaa aacgtggggc rinum ttctgataat tggaggagtc ggtttctgtg cctttcgctg taaattggca tcgaaacgcg tggattaaga gaattggaga aagttatatg tgtcttttca gctgggcata tagattcggc ataaaaaggc gtttccttga tctgccaatg gctcttgtag tacacacacc ttgctaccgg cgacggcgta tcaaataatg gtaagctcgt caaacaagtg gtcacccgga cataccccat cccccatctg aggctctagt gtgccgaggt atgagaagac ttccagctgc ttaatccggc tacatttgag ggttcgtcgg tgaggtgaga gcaggagata ttttcgagcg gaaatactct ccagcgccac gctatcatat ctaccagcag

33480

33540

33600

33S60

33720

33780

33840

33900

33960

34020

34080

34140

34200

34203 <400> 2 gatctgctgg catatatgat tacgtggcgc ctaagagtat gtccgctcga acttatctcc aagtctcacc attccgacga aagctcaaat caagccggat gccgcagctg acggtcttct ggcacctcgg gatacatcaa acatttcgcg tttgaaggcc gaggggaact agtctgtcgg cccaagcaaa tgtcgctaaa ctactacatc ctgcaaacca acatcacttt caaagcacac gccgaagcac gacccattca ttgagtgaga cgtctagtaa cgctgaccgg cttggcgctg gacgaagccg ttgcgacgtt tagactagag agccagatgg tggatggggt ttctccgggt aaacacttgt tgcacgagct tcacattatt acctacgccg gtaccggtag taaggtgtgt gaactacaag catcattggc cactcaagga tcaactttga acgatgccaa ctttggatgc cgtcatccgg atgtgtcaca aaattttaag gcttcttcct ttcaagaacg agaacttgtt cccagctgct gaatggattg ttccctcgtt tgcacgcctt ttgagactgc gtgggaccga gagaggggga aaaataaaac gagacgaaga gctataagga cctgcctttt ggggccgaat atgtatgccc gactgaaaag ttgcatataa tactctccaa tgatcttaat tcgcgcgttt caatgccaat gtacagcgaa agccacagaa agagactcct aacattatca tgatcccgag cagcaatgaa aacggcgcct acaatccaac ggacctagag ctgtgagatt agacccgata tgtgatcacg catggcggtg actatccgag gtactggtct tcactctaat atcttctgca tttggggata taaccaccag ataggtccta cataacgccg gcccaagtca aatattcgca tatgccccac ctatttcttt agctttgatg acattcatag cttagtaagt ttccaataca ccaataatta cgacgctcat ttagtccgtg aggctaccca acctcacaac ccaccttact gaaccatcag tcgtttcccg tcttcgggga gtctcgccat acaagcaaca gtaatactcc ttcaattctg ggggactttt agcagcaata cattgctaca gtgatgaaag ggctcaacca cttcatatcg tgcacgacat gcacaggagc tcttttcttc tcagatatgc gcctctcgtc acaaaggcct ttagcgaaga gttacaggta tagaactctt agctcgcata taagactatt cttccagcaa taaagatcca tgtccctgcc gtgaccggtg ctcagtgtca agcgcaattt cgatgaccgc gctcaccacc cggcaaccct gcggctggcc taccagatct cgctgtttga cgcaacgaga acggggtgac cctgtttact tgaatgcctt gcagcatgtt tgttgtctgt cccaaccttg ctagaaatga gcgagctcat tgcgtgtaag acggggctgc ccttgcatac caagcacatc tcctatctgt cagggaagac aacacaatat tttcatctgg tctagtgtaa agagcagagg ggcttttggt gacgacctga ggaacatgca gcatgcaacg tcatgcacaa acgttgtcaa acataaagaa gacatcttct tacgcatatt gcaattctat tcagccaaat aggctacgac cctcgaagta ccttttcgaa tgtggaatgg gcctcttgat tggtagattg agatgggtgt caaaatcatg tggacaaaag caatggaaga ttcacatctc ccttcgacta ggcatctatt atcagcaatg gtggcaaatc gctttggagt gataaatgtg tgcttagtac

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

1920

PL 202 457 B1 cgtacctgtt tgagtaacta tagattgtcg gagatggtgc atcccccctc tatggaaatt 1980 gaaggtagca tagccccgct cgcctttccc tgtcagtgga cgccactcgt tgtagactgc 2040 gacattaccc tgagaaagcc cctgcttttt tttataccca gcgctatatt gaagaaacta 2100 gatcgggcca tcacatagcc tccatatgta cttattacat ggtcttctgc acttacgttt 2160 ctataccaat cccactacca atttcccaga tccagcgctc gccatctcaa tttgagatca 2220 tcaaacagca tataatggct cggaatcagg ctgttgaggc attacgtgtg atatcactgg 2280 cggcttgcag gtttttcacg tcttttgagt attttaagca ttggggcccc gtggaaaaga 2340 acttggaaag attattagaa agtaataaaa attttacatg tgccccgtag acttaccagt 2400 gatactagct gcatgtgaag agtaatttat agaattggtg gctagcattt tcccttggcg 2460 tttctctcca aagctttact gtaacgccaa aaatggccaa ggctaggggg tcgcgataga 2520 cgggtcgtcg tattacggct ggaaccgagg tggcggccgc aacggaagga gatcacaccg 2580 ttagCcccca cttgtttgcg ctagtaaggt cttgtattct acggagtaaa gcgagggtaa 2640 ttgaaatgat gaattacttg gagacattga tcactgacgg atggattcac gtcggaatat 2700 tctcatacac ttagaccgag atggaccgat atgaccgatg ctcttatcgt ttcttcgcgc 2760 gagactgttc tctccagtct cacgggtagt tagtacaata tagtacttat gtgaaaccgt 2820 tgacgacgcc cattcgcctg gttttttttt tgacatgaat ggctgcttcg tatgttatag 2880 ttcatactcc ccacggagca cattgattaa catgcacatt gttgggatcg agggtgttag 2940 gtaaaccatg tttgtcgccc ggtcttccag ctggttgttt gtctttttat ttgcatttgc 3000 ccagcttcgc gcagacagcc aataaagagc gtatctcctg ccccctcttg ctttcatcat 3060 atatgcagtg agatccgatt gataccaccg gagtgtgggc caaattagtt acactctcca 3120 ttggccgcaa aatattgaag ccttttgggg tttttttggc ccccaggaaa atatgcaaaa 3180 ctaatgtgta gtatgggggg gtgtgggttg tgttcaaaac ctgcccagtc aatatggagt 3240 ataggtaaat tacaaccaca atactagtga gatctagcag tggggccagt tcaatgcatc 3300 ttgtgcgtcg taaataagcc cagacacgct aataccgcaa cacttccggt aacaaagaaa 3360 agcaaaatta aagacgtcgc caatttcccc tgatccccat ccatcaatct gacttcaggc 3420 tagcggacct taacgaaaca acgagagcga gatcattcat acaccaaaac acaggtacta 3480 tagaagcgcc gcgcagtaga gattcacacc gccccttgaa gcaaaagtcg gaaggaattg 3540 cgcgatgtca gaacctctac cccctaaaga aggggaacca aggccacaga aggaagaaag 3600 tcaaaatgac acgctcgaag cgactgagtc caagtcccag cacatcacag gcctcaagct 3660 cgggctggtg gttgcttcag ttactttcgt agcatttttg atgctccttg atatgtccat 3720 tatcgtcacg gtaagatggt ggctacctca gaacagagcg cagcacagtc aattgactcc 3780 agccacaggc aatcccacat atcacaagcg agttccactc tctgaacgat gtagggtggt 3840 acggcagtgc ttatcttctg gctaagtatg gctctgttct ccttgacctt gttcattgta 3900 cgaacagatt agctaacatc atatttagct gtgctctcca gcccctggcc ggtaaattgt 3960 atacactctt gggcttgaag tacactttct ttgccttcct ctgtattttt gaactaggct 4020 cggtgctatg cggtgccgca agatcttcca ccatgttgat tgttgggcgg gccgttgctg 4080 gaatgggagg ctcaggtctt gtcaacggag ccctcacaat cctctcaaca gctgctccta 4140 agcacaagca accaggtaag ggaaccgatt tttggaagtc tgctgggtgc cgtgtacacg 4200 ctgacctcgc atatgaagtt ttgattggag tgatgatggg tcgtatgtca tctcaagatc 4260 tgatgtaccc caaacgaacg gttcgtcgtc tgacaatatg ttttcagtta gtcagattgc 4320 cattgtctgt ggaccactgc tcggaggtgc tttcactcaa cacgccactt ggcgatggtg 4380 tatgttgacc tttggccttt ttatgattgt tgtccatgtt ctcacttgga attcaggctt 4440 ttatatcaat ctccccatcg gcgctgtcgc tgcattcctc cttctcgtca tcaccatacc 4500 cgaccgaatt tcatccacgg acagcgaact ctcgaccgac aaaccaatgg ccaacataaa 4560 atccacactt cgcaaactgg accttgtagg ctttgtggtc tttgcagcct tcgcaaccat 4620 gatttccctc gcactagaat ggggagggtc gacctacacc tggcgaagtt ccgtcatcat 4680 cggcctgttc tgtggcggag ggtttgctct gattgcgttc gtgctatggg agcgtcatgt 4740 t99C9atgct gttgccatga ttcctggctc agtggctggt aaacgacaag tgtggtgctc 4800 ttgtttattt atgggctttt tctctggctc cttgcttgtc ttttcctact atctaccgat 4860 ctacttccag gctgtgaagg atgtttctcc cacactgagt ggtgtgtaca tgttgcctgg 4920 aattcttgga caagtcatta tggctatggt ttctggcttc gcaagtaagt gaaactcgcg 4980 tacacatttt tctccaccec gtccatttct atggctcctt tcttgccaca accgtctgac 5040 atcgggcttg gatatcgtgt atactgacat atgacgcacc agttggaaag acaggatact 5100

PL 202 457 B1 atttgccttg ccttccagcc gtcgtggttg ggctttgtat gccagcctat ctctcgccgt tctttgggtc ccgtgacggc gggttgtaaa cggcgtgcac acacccgggc gcctccacaa ttgcccgcga tggcaacata gattgatgtt tactcagtaa acctaaacac ctgcctgtct atatgatcct ttccgaccta ttaggaacag gatgccgggg gcagcacata cgtgcattct gcgccctggg gagacagaga agcggccgct gcgccggatc tgaagccgcc gaaccatgct cttcggccac ccgtacagta ccataacatt cagtagtagt gtaagcgcgc ccgaatcgag ggcctcgtgt ccttactgcc aataactctt caataacgtt gcttcgagtg agcggcgaac gaacctttcc tctgcttcag ctgtctttcc catcactgtc ttgattgaat caactggatc tgaacagata ggacgggatc cgtgtagctg cgaggacagt ggccctaggc ccatacatca tggcatgcaa caaagcaaga catcgccatc gtttggacag cggtttgaga agcaggggcg agcttacagt gtttgtgttt tgtgcctgag agaatctcca cccatgtcta taactatgtt tcaggcatca gttatagctt tctctggaaa cattgcattg cctgcaatga atcagcgtcg ggactgtcct cagaacggtt gcgagagctc caccgggagt gctccagaat tttgaagcga ttcaacttac ctgacctgtg aactgagcca atccacatcg aatgcccttg atttcctgat cagtgcatgc cttaaatcga aaatctgctg ccagatctta cataccgtcg acggctagca gccgtcgata ctcgcaacat ctccagcata cttgacggca ccgcaaagac caaattgtcc ttctgctcgc actgtcggtg ctgaggggtc aactgggtga gctgttcaga ttccaggctg cgaggtacca gaccatagtc agcgctgttc actgtgaaat acggtaagct agagcatgca caaagcacgc acgtttggag actggcctga actggcttca ctcgccgttg gcctttggaa actgatgctt catacttaat gtctaagtcc gagattcata atcctgatac gaacaaagct aggaccatct 3 t 3.3.3. Ca t Cjci tgcttttgaa atccactgga agcccgatca ggttccgcct gtgcgccatg cccagccaaa ggtcgggtgt cgtaccaccg tccgcgaaga ttgttcatga gcaatgaaaa gccatagcgg ctctttaaga ccccgtccat agggtaataa tccacgccct atatataagt gttgaattga gcagcaccag ccagtcagga ctagcgacga acaataggac gcaccgagca cttgtaagct cgagtgcagt aaggcaacga agttcgattt ttagtgacct gtggtaggag tggttctggg ctcgggagat gcgacactta gtgagcaggc cggtgaatgg gattgaccgc tcgtcgccat gggtcatgta atgaaacctt accgctagac tttcgcccga gatcgctctt gcaagtatgc gagatgtggt atcatacttt tgggatggcg gaccgcgttg taatgtcgat atctcaaggt gttagttagt ctcaggaatg ttcactcatt ctttatatat ~~i H —i η Ή ł· yaLagpg i, tu aattatgaca gggggtacgg gtagctgcag gacggggaga tgcgccttga acagcgcttc gatccgcgga cccaacgttc ctaaacagga gagtgatgca tggctgccgc acccaatcag catccctgac cgatccaatt tattcatatc tagaaatcat gagtaccggc aggcttcttt ctcgttcaag ctgtcacggc ggacgccctc cggcgacgcc cgcgttccca ctgcggtagc ctttgagact catcctcatc gtgtgcgaga ttagagatgc tgaacactct cagcgttgaa taggatcttt gggcaagtgc taccgaccat aaggatactc gccctcttgc aggcgcaggt ccaatttatc tgatcatctc gctgacatca acaaggtgcc cctggacttt gcccactgtc cagcaagaat ttacttagca gaagattgca ctagatagac ttcaaagatt tctagtcacc tacggcatct aatcagatca aaataattat tcttcttccc ctggccgttc ataacaacca agcttggaat cactcggcct cacttcgaga ccaggtgacc cgatgatgcg caccaagcat caacctcaat ttagtgaatg gttagcgctc aagattggca atttttcgat aacgttcgcc caaagctgaa gctgaaacct attcattccc gatagttgtc cattacggtc gacatcaaac accgccaccg ggtggttgcc aacagggact ggcgtagttt cggtgtcctc cttctctagg gttcaactcg cacgggaagt tttaattaag ggtctgagga gctttcggcc gattcccagt cacaaacacc ttttccacca tagttcgtac ctggaaaagt ctggtatcca gcgggcttcg tcacgctttc atactcaatg ctcggaattt gctaaccttg gacacgcagg aaccttccag gtgggagcta accaaaaacg acattaccgt ctatatgtca gtggctagat gacaatggat acattcaacc gagggatcag tactacttgc —i 4-n4--ir*r*-\ratgagaaaaa gctcctaaga cagtgcattg aggggctgaa ggcggctagg cgcaagttga gtcaagcatt agacggcatg tttccaagta tccacaactt gcttgggcgt atgttgagct ggtatgatgg ggtttcttat gcctctgtcg atagcgtcgc cgcatacttt tggccgacgt ttcacacacg aggttgattg ataggaatga ggcatatagc tcgtacggca gaaatgatag gcatacccgg ctgattgtgt tcactagtgg actaatgagg gcttggagac tggtcaagct ctggcggcct catttggaga actccatact ttgatggggg agttcatcta

5150

5220

5280

5340

5400

5450

5520

5580

5640

5700

5760

5820

5880

5940

5000

6060

6120 r ·ολ U _L O 'J

6240 6300 6360 6420 6480 6540 6600 6660 6720 67B0 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 7500 7560 7620 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 82 80

PL 202 457 B1 gtccacttcc agctaccttg aagggctcaa gcgggggttt aatggccgat ccgctcagac 8340 tttcggtcca agatgatata ctggacaacg atccactaga agaggcttgg aaaagggtgg 8400 agccgatgtt gacgaggttg acgataagga aaccaacgac catccagaat ttgaacttcg 8460 gaacactgct gcctttcata tcattgccaa acagatatgt acgtgcactg tcttgggcat 8520 cattgctggt cgcgacactc tccgccgtcc gctgactgag accctcatct tccaacgcgt 8580 accgcatgtt gatatgacgt ttgaggcggt ttacctcgag cttgatagac agaatcgcag 8640 tgtagaatgt aaacagcagc agacagtcaa agaacaggat caatgcagct agaacacaga 8700 agtgctgtag cccaccttgg atgcctaaga cagcaccgat aactaggagc aggatctcga 8760 ccacgtagtg gcacacgata ttgtaaccct tctcccgaat ggcgcttcgt acggcgtaat 8820 tgatggtact ttcagcaatg gctgtcacgc taccctggtc agactgtatc ttctggggct 8880 ttcggtgctg cacagcatag gacaaaacag ccctggtcag agtgatgctc ttctcaaagc 8940 caacgatcac caccaagaag gggaggcctt cggatagcaa cctcatgctc atcggaaccc 9000 ctagtcttat ggccacgtcg agaccgagga gaaaggcaaa tgttgacgac aaaaggacgc 9060 ttgtagccag ecaaaccttc gatcccaatt ttttcatgct gaggaagagt gagacgaaag 9120 tcaagtgcat tgatatataa cctagcacca tgacaaccac gtcgagcgtt tgagcgctct 9180 tgataagatc aagagactct gtccaggtat cgtgcaccca ttgagcaagg ctgcgttttg 9240 tgtgagccct ggcagccttc atgatccaca tctggcgttc catctcgatc aattgcgtct 9300 cctgcaattt caggtcggca ctgttgttgg ggatttcttg aacagcagcc acgagttccg 9360 gcgcgctgct gtattccaca gagaaggcga aaactttatc tttcgaatag gcggttaaag 9420 ggctcgacgt tgagggaagg tcaatcacag ataggttcac agggagggga gcaaggaatg 9480 gtgaggctgc ttgagatgca accccatatg accccgggaa taccaaggtc attagtgctt 9540 gatggttgaa atctccgaga acatctgcat ccccgtcgaa gctctgccac ttccagccat 9600 tctgtgggcc ggtgatcaag cttcgacttc cttcgaccaa agagccccat tctgctttat 9660 caacgtttgc ggggccatgg aagaagctgt ctttgagtag tccaacgtat gtggtactag 9720 ctagaatagc tatggtgcaa acggtatgga tcgggtgtag acacgccgtt ttggatagaa 9780 attggagtgt ggaggtcaat gcccgatttc ccgagcgtag agggtgctgc tgattcattg 9840 attccctacc gcgaaagcga gagggtagca acgaagcgac catgctgaaa ggtctgtgct 9900 acagcttgga gtggtaccta tagctaggta gtctctgaga aaagaatcta gtcagctctg 9960 caaatgggga cggaaaagca cttcaattgg gaattagggc ttgagataaa gtgcatacct 10020 ccaaaatcga atgagcaacc taatcggtta ggcgcctagg tataatctgc cgtcgtagat 10080 tggaggaagg ttgttcggcc caaggggttg ggagggacaa ctgaacagtt cctaggtacg 10140 ggaaatgagt agaagaaaat aacaaatggc gcgcgcccct gaggctgagg cagcggaaag 10200 attcgcttcc ttatccctgc atctggtcca cctttatgaa tggattcatg accggtgtca 10260 actgctgcct agggtataat tggtaagggg taccaagcaa aggatagtag gaccaattgc 10320 actgaaaact agtatttgtg ctcataacta tgctcagttt ccaaggtttt tatgcataaa 10380 tttatccttt attcgagaaa aaagaattct ggggacacca atcaattgcc ctgataccta 10440 ggaatgtgaa cttccaagat tgttccgaaa gtaggccaaa tgaccaataa gacagaacac 10500 tacctaggta tagttatttt gtcatgccta gatccgacat acaaaggagc gtcctcttac 10560 atagacgtcc tgttagacgt ttctaatctg actcgtattg tggtcctttt ttggtggggc 10620 ggcaagctgc atcgatcacg cccggacgag gccacttcgt gaggaatgga aatatattgt 10680 gcctacggag taatgcacca cgaaacacat tcttctcgaa acgactactt acgcagggat 10740 gtatgggtat tattctgtcc acgaaaagcc agtgtcaacc cccccccccc cccccccccc 10800 cggtatcatt tatctcagta aacagcaacc tgaacaagat acccaggtag acaagaagtc 10860 agtttggagt atagtgtata gactcgggaa cattttgtgt ggacctccgt acgtgtctct 10920 caaatcggcg tctctcggtc tttggatacc ttcggagtta cacggggctt tgttgccaag 10980 gcttcaatat tcggcgcatg gattttcttt gtgcatgggt ctgagtgggg tgccgtaagg 11040 tatggtattg ctcccgattg ggagttctga cagatgatca tgccgccttc cgaagtagaa 11100 aaaagaggaa agggtcacat gctcatgatg atcgtttgct cgcgatgaat tgcgcttcct 11160 gcatatattt tgtttgcttg tcttagtcaa ccgataatgc aaattttggg gattgtgtat 11220 tgttggaaat tgaattacca actgcttaca ggacccaccc tgcgctcagg ccctcaacaa 11280 accttgggac aggattaccc actaagcctt tccaagcttt tccaaggctt ttggattcgt 11340 ttggtttgat agctcgtatg cgtatttcgc atctgtgtac ggagtatcgg attctgacag 11400 cctccattat acccgaaaac tacctggccg gcctgacctg tttcgtcttg ttcgacggtt 11460

PL 202 457 B1 tcccatcggc gttttgactc gggattatcg tgacgacaga caatgcctcc cgaaccggta 11520 cctctaaggt attgccccga gcatagcatg gtggtccggg gtttcccatg ggcacagagc 11580 gaatatcgtg tcacgtccaa gatgaaaaca aaccccgaac tatgaatcac gtgtcggggg 11640 cagcttatgc atctatagct atgccaggga cctgtagact gttggaagac tatcaacggt 11700 tttatcacca gggcgactga tatatcagtc aatgaaacaa cgttggaatg aacaataccc 11760 ccgccgtaac cgcaaccgca accgcaaccg caaccgcaac cgcaatggca ggctcggctt 11820 gctctaacac atccacgccc attgccatag ttggaatggg atgtcgattt gctggagatg 11880 caacgagtcc acagaagctt tgggaaatgg ttgaaagagg aggcagtgcc tggtctaagg 11940 tcccctcctc gcgattcaat gtgagaggag tataccaccc gaatggcgaa agggtcgggt 12000 ccgtgagtat ctaacatgca tgcatttata tcttgttttg aatatttgac acaagatttg 12060 agcatcactg aagcttggtt actgactcca aggatgactg gatagaccca cgtaaagggt 12120 ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa catgaccaca 12180 gaggtcgcca gcgtatgatt atttcaattg atctaacccg ggacgcagag atctaatatt 12240 ggacagtgca tggatccgca gtatcggctt atgcttgagg tggtctacga atcgctggag 12300 agtggtatgt agtgtgggtc atcctcactg taagcaaacg tcactgacca tcatccagcc 12360 ggtatcacca tcgatggtat ggcaggctct aatacgtcgg tgtttggggg tgtcatgtac 12420 cacgactatc aggattcgct caatcgtgac cccgagacag ttccgcgtta tttcataact 12480 ggcaactcag gaacaatgct ttcgaaccgg afca.tcaca.ct· tctacgactt acytyytccc 12540 agcgtgacgg ttgacacggc ctgttcgacg acattgaccg cactgcactt ggcgtgccag 12600 agcttacgta ctggggagtc agatacagcc atcgttatcg gtgcaaatct tctgctcaat 12660 cccgatgttt ttgttacgat gtcaaacctg gggtgagttt tccgaagaag attccagatc 12720 gagagtcttg aactaagcaa tccttgttgc tcaatgacag atttttgtcc ccggatggta 12780 tctcgtactc ttttgatcct cgagcgaatg gatatggtcg cggggaagga attgccgctc 12840 tggtaataaa ggccctccct aacgcgttgc gagaccaaga ccctatccga gccgtcattc 12900 gagagacagc gctgaaccag gatggcaaaa cacccgcaat tactgcgccg agtgatgtgg 12960 cgcagaaaag tctgatccag gagtgttacg ataaggctgg gctagatatg tcgttgacct 13020 cgtacgtgga ggcccacgga actggaacac caactggtga cccccttgaa atctcagcaa 13080 tttcagcagc ttttaaagga catcctctgc accttggctc tgtgaaagca aatattggcc 13140 atacagaagc cgccagtggc ctggccagta taatcaaggt ggccttggcc ttggagaagg 13200 gcttgattcc ccctaatgcg cggttcctgc aaaagaacag caagctgatg cttgaccaaa 13260 agaacatcaa ggtaaggctt tgcgcattcg cagattcagt tatatgtttc aaaggttaat 13320 gtttcaaaga tccccatgtc tgctcaagac tggcctgtga aagatgggac tcgtcgcgca 13380 tctgtcaata acttcggctt tggtggttcg aatgctcacg tcattttgga atcatatgat 13440 cgcgcatcat tggccctgcc agaggatcaa gtgcatgtca atggtaactc tgagcatggt 13500 agggttgagg atggttccaa acagagccgc atatacgttg tgcgtgccaa ggacgagcaa 13560 gcttgtcggc gaacgatagc aagcctgcga gactacatta aatccgtcgc tgacattgac 13620 ggggaaccct tcctcgccag cctcgcctat acactaggct ctcgccgttc cattctgcca 13680 tggacgtcag tgtatgtagc agacagcctt ggcggccttg tttctgccct cagcgatgag 13740 tccaatcaac caaaacgagc gaatgagaaa gtacggctcg gatttgtatt caccggtcag 13800 ggggcgcagt ggcatgcaat gggcagagag ctggtcaata cattcccagt attcaaacag 13860 gcgattcttg aatgtgatgg ctacatcaag caactgggcg cgagttggaa ttttatgggt 13920 aagttgcgag cccgggaaaa gtaatactgt atcaagcttg aggtactaac attcaattgc 13980 acagaggagc tccaccgtga tgagctgacg actcgggtaa atgatgccga atacagtcta 14040 ccactgtcaa ccgctatcca aattgcactt gtgcgtctcc tttggtcatg gggaattcgg 14100 ccaacgggga taaccagtca ctcaagtgga gaggctgctg ctgcctacgc agctggggct 14160 ttatccgcgc ggtcggccat tgggatcact tatatacgcg gtgtattgac cactaagccc 14220 aagcccgcat tggcagccaa aggaggaatg atggcggtgg gtcttggtcg cagtgagacc 14280 aatgtttaca tttcgcgtct caaccaggag gacggctgtg tggtggttgg atgtatcaac 14340 agtcaatgta gtgtgacggt gtcgggagat ttgggtgcaa tcgagaaact tgaaaagttg 14400 ttacacgccg atggcatctt taccaggaaa ctgaaagtca ctgaagcctt ccattcaagc 14460 cacatgcgac caatggcaga tgcctttggg gcgtcactga gagatctgtt caactcggat 14520 aacaacaacg acaatcccaa tgctgacacc tcaaagggtg tattatattc atcacctaag 14580 actggtagtc gcatgaccga tcttaaattg ctattggatc ccacacactg gatggatagt 14640

PL 202 457 B1 atgctacagc cggtagagtt cgagtcctca ctccgcgaga tgtgctttga tcccaacacc 14700 aaagagaaag ccgtcgatgt gattattgaa atagggcctc acggagcgct tggtggtcca 14760 atcaaccaag tcatgcagga tctgggtctg aaaggaacag atataaacta tctcagttgc 14820 ctttctcgcg gcagaagctc gttggagaca atgtatcgtg ctgctacgga gttgataagc 14880 aagggttatg ggctcaaaat ggacgctata aactttcctc atggaagaaa agagcccaga 14940 gtgaaggtac tgagcgattt gccggcgtac ccgtggaatc accaaacccg ttattggaga 15000 gagcctcgcg gcagtcgtga gtccaaacag agaacccatc cgcctcacac tttgataggc 15060 tcacgggaat ctctctctcc tcatttcgcg cctaaatgga aacatgttct ccgtctgtca 15120 gatattccat ggatacgaga tcacgtcgtt ggttcgagca tcatctttcc gggagctggc 15180 ttcatcagca tggccatcga ggggttttca caagtctgcc caccagttgc gggggctagc 15240 atcaactaca acttgcgtga cgttgaactc gcgcaggctc tcataatacc cgctgatgca 15300 gaagćagagg ttgacctgcg cctaacgatc cgttcatgtg aggaaaggtc cctcggcaca 15360 aagaactggc atcaattttc tgtgcactca atttcgggcg aaaataatac ctggacagaa 15420 cactgcaccg gattaatacg ttcggagagc gaaagaagcc accttgactg ttcaactgtg 15480 gaagcctcac gcaggttgaa tctaggctca gataaccgga gcattgatcc caacgatctc 15540 tgggagtcct tacacgcgaa tgggatatgc cacggaccca tttttcagaa cattcagcga 15600 attcaaaaca atggacaggg ctcgttttgc agattttcca ttgctgacac tgcctcggct 15660 atgcctcact cgtacgagaa tcgacacatc gtccatccta ctactctgga ctcggtgatc 15720 caggcggcat acacggtgtt accctacgcg ggaacacgta tgaaaacggc catggtacca 15780 aggaggctaa gaaatgtcaa aatatcctct agcctggctg acttggaggc tggtgatgct 15840 ctggacgcac aggccagcat caaggatcgc aactctcaat ccttctctac cgacttggca 15900 gtgtttgatg actatgatag cggttcttct ccctcggacg gaatcccagt catagagatt 15960 gaaggccttg ttttccagtc ggttggaagc agcttctctg accaaaagtc agactccaac 16020 gacacagaaa atgcctgcag ctcctgggtt tgggcccctg acatcagctt gggtgactcc 16080 acttggctca aagaaaagtt gagcactgag gctgagacga aagaaacgga actcatgatg 16140 gacctccgaa gatgcacgat caactttata caggaggctg tcactgattt gacaaattct 16200 gatatccaac atctggatgg ccaccttcag aagtatttcg attggatgaa tgtccaattg 16260 gaccttgcga gacaaaacaa gctcagccca gccagttgcg actggctaag tgacgatgct 16320 gagcagaaga aatgcctaca ggccagagtc gctggagaaa gcgtcaatgg cgagatgatt 16380 tctcgtctag gacctcagtt aatagcaatg ctacgccgcg aaacagagcc acttgagttg 16440 atgatgcaag atcagctgct aagcagatac tacgtcaacg caatcaaatg gagccgatca 16500 aacgcacaag ccagcgagct gatccgactt tgcgcccaca agaacccgcg ttctcgcatt 16560 ttggagattg gcggaggcac gggcggctgc acaaagctta ttgtcaatgc attgggaaac 16620 accaagccga tcgatcgtta tgacttcacc gatgtgtctg ccgggttttt cgagtcggcg 16680 cgtgagcaat ttgcggattg gcaagacgtg atgactttca aaaaattgga tattgaaagc 16740 gatcccgagc aacaagggtt tgaatgtgcc acctacgatg tggtcgtggc ttgccaggtc 16800 ctgcatgcaa ctcgatgcat gaaacgaaca ctgagtaacg ttcgaaaatt gctcaagcct 16860 gggggcaact tgattttggt tgagactacc agggatcagc tcgatttgtt ctttaccttc 16920 ggactgttgc caggttggtg gctcagtgag gagcctgagc ggaagtcgac gccatcgctc 16980 actaccgatc tttggaacac catgttggac acgagcggtt tcaacggtgt ggaattggag 17040 gttcgtgatt gtgaagacga tgagttttac atgatcagca caatgctatc gacggctaga 17100 aaagagaata caaccccgga tacagtggca gaatcggagg tgcttttgct gcacggagcg 17160 ctccgacctc cttcatcttg gctggaaagt ctccaggcag caatttgtga aaagaccagt 17220 tctagcccat cgatcaacgc tctgggcgag gtagatacca ctggaaggac atgcattttt 17280 cttggggaaa tggagtcctc gctccttgga gaggtgggaa gcgagacctt caaatccatc 17340 accgcgatgc tgaataactg caacgcactt ctctgggtgt ctagaggagc agccatgagc 17400 tccgaggatc catggaaagc tctacatatt ggtctgctgc gtaccatccg caacgaaaat 17460 aacgggaagg aatatgtatc gttggatctc gatccttctc gaaacgcata cacccacgag 17520 tccctgtatg ctatctgcaa tatcttcaat ggccgcctcg gcgacctttc cgaagacaag 17580 gagtttgaat ttgcagagag aaacggcgtc atccacgtac cgcgactttt caatgacccg 17640 cactggaagg accaagaagc ggttgaggtc acactgcagc cgttcgagca acccgggcgt 17700 cgtctgcgga tggaggttga gacgccaggg ctcttagact ccctgcaatt tcgagacgac 17760 gaaggacgtg aaggcaagga tcttccggat gattgggtag aaatcgaacc caaagctttc 17820

PL 202 457 B1 ggtctcaatt ggcttcgaat ctcagattag acgccgtaca gtccccctgg ggcgaaagag tcccagcttg gtcggcgata gtcgacggca gcaggtcaac attggaaaaa gtctćtttca gaagcgttga atccagcagc catgttggca gggttctcgc attggaaagc ł-fi-rarfaar-rt-f-f

- ~ tatctacacg gaagaagcac gcgcttctat ggtagttggt cttgttgggg gacgcacttg atggtcaagt agaataggtt ctgtgttctt tccccgggtg aaataccgcc gatggcgtgc ctcaaagcaa tcgtccaaaa tggatcacat atcgccggcc gccttttgtc gccatggtct tgcctgactt gaagcaacaa actaccaggg ctctccatta cacgggcagt ccacgtcgtt acttaacaga agatcggtga tagctggcgg tctctctctc aaagaaggca agcacctagt gttttagttt gccggcgtac atttgtcatc gaatcttgat agccgatgtg ttcgggatgt gcgccggagt gggaccgcgt ctaatgtcgt ctttcactac tcttgatcca cgggtgccga aattcggcat tcaaagccta tcctccaagc aggacctgga catcaattga accatgtcac actccttgtc aagttgtggt tgaagctgaa agatctgtca catgtgacat atgcaecgcc cgcgaatgac atcttcacaa tcatgggtgg cgcaccaccg ctgttggata acaagcctat cccctcaatt ctcactggac aagtccttca gggcccaact tgacggaaaa acctggcagg ctgaaatcca tcgtcgagtt tggccaagcg gaagcctgaa ctggatagca agtacacatg aagctgtctt tgattcccgc gggtacagat gcgccgtcct gcctaagccc ttgtaccggg tatagaagca tgtgtttctg tcacaatcga ttctctggga gcgtgttata catgagcttt gtctcctggt ttccttcgag atcaccgttg catggttgcc gatcacaaag atgtgcacta ccgtattccg cgcatatatt cagtggagct ggtcttcgtc caatccggat cacgggcgga aagctttgac gcaaaacagc tcttctctcg aaaactcctc aaacatcgag caatgtatct gcctgacagt gtggcttgtt ctcagatcaa aattcgaggt attggatgaa gatcgcacag ggcaggccag gagagcccat cgtggctgaa gcatgaaaag tccatcacct cgaggcaaac tgcagaccaa aagcagggtc gctgatgcga tgtcggcgta tgttgatgtg agttgtggcg ggtatagctc tccaatctga gtaaatagag tgcactcgtt agcacctcgg aagccttgta tgtggatatg ctctttcgcc tcgtcatcgt agaaaagctt gatggccgct tctctcgcac ataaaatgcg cggaaactat tcttagcacc gtggttggat acaggcttca gcgaagaacc gtattctcca atgggtcaat ctcggtggag ctgaaaggcc gacgaaatgg gcgctttata ggaggcgtcg acagcgggaa catatcttct cttggcgttc tgcatggccg agacttgaca tggcaaagag gagacaaaag aaggccttcc ggggacgaac tcttacctag gatcatggcg accagcttgc gatcaggtca atcatacaag tttaatgcag gatgttgact gccaattacg ggcatgccgg actggccgtg gacgtcatgg cccgcagctg tggatacagg tcctttgtct acctctcacg atgtttggtc gactcactcg tcgatctttg aaatgcagtt gacggaggta atcgagcctg atacctgaaa ctcgaagtcg aggcttgact aatgcgcgtt tagtcggaag tagtcgggga aagcgccagt cattactgcc ctgcgtagca atagccaaag ttttatttta tggaataagc ggtcatgagg gcatacgaac catcatactg gcccgggaca attgagcggt tggaggccaa ctgctgccgc attgggcgac gcttcccaga ccacggcaaa gtcaagcagc ctcaagccaa cgagcaggaa atgtcgttct aattcggcag tgctgccatt ccaaaagtga cgattggctt gtacgatgca tggtcccagt ttgctggtgg cgaagcactt

a.a.aćłtCaaCa.

ccaaggtgct gtgccatggt caacacgccc tcttcgtgat cagctgctgg ctgtcaccat gtgtggccga atgtgttgga tggttacagg aacagcggtt cttcgcataa acgaggccat tggcagaaga tcgccattga agctcatgaa aagttgaagg tagtacgaag ggctgagcct taccattaca gaagagtgaa gtcaaaagtt gaacggtcga gcgggaggga tgttgagtag caacgcctga gacttcccta ggaatacaca tctacaccac ctaacctact ctggggacgg gagcgggatg gctaaaagcg aatcagtata agcgcgtggg gaaggccttg ccgtgtgatg tagccaaggc cagaacacag agccgcttcg gctacgacga gatcattttg gcgtgacttt tgacttattc aaactcattg atttgttgag cacccgggac agaagtatcc gattggtcca gagtggtcag cggcgatgga gctgggggga gattatccta gtgcgctgtc ccggttgtgc tctcaaggac aaaagtacag gctctcatcc tgcattccag tgacttgggc ccggctcgct gaaggcaatc aatcaacaca tgtgggactt aaaaggacca ttctatcgtc cgacatgtcc acttcgaaac tggtaacacc gttcagtgaa gagcatagcg gactatttaa gtggccctga tgctttttat ctctcttttt aaggcgttgg gtacttgtgt gaacatcaag gagaatgggg cgtggcggtg ctctctccct gttcgattac cgactaatac atgcatattt tcctcgttgc tgacggtagt tgagcgagga ttccagccga tctggatcct

17880

17940

18000

18060

18120

18180

18240

18300

18360

18420

18480

18540

18600

18660

18720

18780

18840 o 9 O G

18960

19020

19080

19140

19200

19260

19320

19380

19440

19500

19560

19620

19680

19740

19800

19860

19920

19980

20040

20100

20160

20220

20280

20340

20400

20460

20520

20580

20640

0700 20760 20820 20880 20940 21000

PL 202 457 B1 cgcgcatgcg cataaatcgg tagggatcat aattttcggg gttttcccac acatcagggt 21060 tgttcatgcg gtctgcagcc acagcggcca actcgccctt gggaatgaag aggccattgg 21120 atagagtgat gtctctgaga gcggtactgc gcatagtggc gcactcgacc ggcttgattc 21180 gctgcgtetc tttcatgcag ctgtcgagga gcttcagctt gaacagagag gcaggcgtcc 21240 agcccccttc tccgattaca gtgcggatct cttggcggag aggctgaata aggtctgggt 21300 gcctggcaat gtccacaagg gcaccgacga aaagatccgt cgaggcgtag atgccggcga 21360 aatccatagc gagctgagca cccgccacat cgtaccagcg gccgtcggcg gtgtcttcaa 21420 accattgcat ggtatcgacg tactggggcg gctgcacgcc cttcgctaca catgcggcct 21480 tttcagcacg tcgtcgctga atctcaggat caatgatctt tcgtgcgcgg cgcacttggt 21540 cacgcaattt gcgtccttgc ggttgaaacc agtgagcgag cggtcgcagt agcatgggcc 21600 atacgcgaag ttggcgagct tgtaccgcca cactcacggc atggttcttt gcaatatcca 21660 gccaćtcctc attgtggcag attttgtcgc cgaccataat gagtgtgact gttcgtgtga 21720 caaggtccaa tccattggaa tagacaggtg cggtttgcca ctctagtata ttcgcggtat 21780 gtcagccaga ggctcaatgc tcaagacaga aaaattgaca cttaccctcg cttttaccga 21840 acaacttggc aatagtagcg tcggccaagg tagccaatgg ctttgtgtac ttgggggctt 21900 gggtttgtaa ctggttcaaa acaactttgt tgacaagatg tgcatcctgg cagatttcct 21960 tgaacccgtc gaatccaggg agatgagagt gaaagtccta tacattcatc agaatcttag 22020 agacgfcoatt. gagt-tacaac a.atggaaaat tcagaggtca tacatccgcc aaaaacttgt 22080 acatgcacat atctttgatt ttccgaaact cgtcggccat ggacgatggg aggatggtgc 22140 aatagccgga atcaacaatg aagcgcaggg gcttgtcgtt tttcgagaac caagcttcga 22200 tccagctcgg accatacgta tcgaagtect gcctagccct catggtcgtc aactcccacc 22260 attttttggg attatagact tgcagttcgg actggcgccc ccgcaaacgg taggcgatga 22320 gaetaagaag cactgcgacc gccacaaggg cttgaggggt cgatacccat tggtacgatt 22380 cgacggtcag aagaacctgg ccgagcattg cgtgagacag ataggaccta tgcacaccag 22440 tggaaaagaa gaaagagcga agaatgagag cgctgcgacg gtttataatc gaataacagc 22500 actaatgctt ctgggatttt gtggccgaga gcactcttcc agtcaacctt gaaaaaaaaa 22560 aaaccccccc cccaatcgaa gtttacctgg atggggcagt tcggttgttt cctttaggag 22620 cagcttcacc gagcagcaca agaacaatcc gagtgaaaaa ctcggtttca ccttgataca 22680 gccaattgat attcacgttt gattcattca gcctcgtgtg accgaataac gccgtatgga 22740 ggaatggcta ttcgtgcacc gaatgacgcc gggagggttt gctaggtgcc gagcttgcat 22800 tgctgggaag tgggggcatt tgagtactag aatggatctt gaaattgtcc gaatctagat 22860 gagtactgat acgtgcaagt aaatataacg acggtatcgg ttgcaaggcc ggcttgttcg 22920 ctcagagatt caactctgcg attctgtaag aacaaatgtt gtgcccggca tgcagtgaga 22980 agatctactg acgcaagaca aggtttaatc ccaatcctat cgcccaaaaa caggatcagc 23040 agttatggat caagccaact atccaaacga gccaattgtg gtagtgggaa gcggttgtcg 23100 gtttccaggt ggtgtcaaca caccatcaaa actttgggag ctgctcaaag agccccggga 23160 tgtacagacc aagatcccta aggagagatt tgacgtcgat acattttaca gccccgatgg 23220 cactcacccc gggcgcacga acgcaccctt tgcatacttg ctgcaggagg atctacgcgg 23280 ttttgatgcc tctttcttca acatccaagc tggagaggcc gaaacgattg acccacagca 23340 aaggctgctg ctggagacgg tctatgaagc tgtatccaac gcaggcctac ggatccaagg 23400 ccttcaagga tcctctactg ctgtgtacgt cggtatgatg acgcatgact atgagactat 23460 cgtgacgcgt gaattggata gtattcctac atactctgcc acgggggtag ctgtcagtgt 23520 ggcctccaac cgtgtatcat acttcttcga ctggcatggg ccgagtgtga gtgccactca 23580 ttgagcgagc ccgacttcgt caagtgctga cagattcctg actgattctg cagatgacga 23640 tcgacacagc ctgtagttca tccttagctg ccgtgcatct ggccgtccaa cagcttagaa 23700 cgggcgagag taccatggcg gttgcagccg gtgcgaatct gafcattgggc cccatgacct 23760 ttgtaatgga gagcaaattg aacatgctgt cccccaatgg tagatctcga atgtgggatg 23820 ctgctgccga tggatatgcc agaggagtaa gttgacaatg catcaattcc tttcaaaaaa 23880 agcaagatgg cactgacctc ctgtaactgc tttttaggaa ggtgtttgct ctattgtcct 23940 gaaaacgctg agccaggcac tgcgcgacgg ggacagtatc gagtgtgtta tccgagagac 24000 cggtatcaac caagatggcc gaacgacagg tatcacaatg ccaaaccata gcgcacaaga 24060 agccctcatt cgggccacat atgccaaggc tggtcttgat attaccaacc cccaggaacg 24120 ctgccagttc tttgaagccc atggtaagtg gtattccctg gaagtatcag ccttatggaa 24180

PL 202 457 B1 gttgcagaaa gacccacagg gacagcgacg acggaaggca gtgatcccgc cacttgaaaa agagtcagcg gttagctaaa agagtatatg agatgcatgc gctagaaaat atatacctta caaggaagta cttccgcacc acagtggccg cgaagagctg gtatgaccag

-'Ί ,4 gttcagtgca catcagtgcc tgcctcttct cgcaaaggaa ttcaccggat cttggaggat tcacatgcac tgccgatggc gcaaatgact cttgttctcg cgaaattggc tgccggtgtg ttttgctgga gggcttcgta cacatactct tcttcgtgga gaccttccag gctacaaggc catgaaggtg catcaacaaa cgaagtcacc ctgtctggca tggcgaggca gaacaatgtc caaagacttc ggctttcctt cctggacatc acgctcattg atcggcgggt gggtgatttc agttgataac cttcgcaaag gttgatcata catcaaatcc ccagaagtac gtctctctct aagctgaggc gcgagaaaga ctgctggtat caaacctgct ttgcaacgga ttaattcatt catataaaca gctcctccac agcttgcccc atgctccaat cttgagaaac gcccgcgcgg gaegcgaatg ggcatgctga gataattcac ctcatgcttg tgcgccgtac attgtcggcc actcaagcta ccaagcggcc ctatgcgagc agtgtgacct gaatccactt ccatgcgcag caaggtaacg gtacaggatg caggctgtgc gcccaccctg gagctgccgt ggtctgggat caacaagtcc tgggatcata ggtgcgcccc tggacaaact cagactgtgt gctggtgagc gccatcgtgt agtgacaatg aaggagagtg tcaccgtcat aacatcgatt cgtcgtttgc ccacttaagg gcgttccaga tacgtgccta aattctggtg ctgagcggcg attgtcttta tgggtctggg gctcgggaca ttcctagccc attgaatggt ccctaacacg tattgcaaca tgagcttttt tgcgggctta gtttgagaag ggccacagaa tggtaaggat catcaggatt acaagccgac ttgtgctttc ttctggaaac ggtctatctt cactggaggc acaaccctcg agaagctcat tgcaaacact aaggggatgc —» —t —» Ί— r</-i ł- l- η łO.CŁCŁ l_ k_ l_ L.

acagttcagg tccgtattgc agacaggcgc tcgaagcctt tctccggcga ttgccagaat ctccatatgt atagtgttgc tgatgcccgc agaaagcagt ctctcaaggg ataccgggtg acatttggga ggcccgatcg ctcgtcaata atcttctgct tcatcaggcc tccccgctgc gtgccgccca ttgaagatga atgcggatgg agctttcgac cgcagctttt tcttctatcg agaccatgag atgaattgcg ctgtcattgg ctcacgttga aaaccgagct acatcacggt agcctttctc gacccctcac aggaggacat agataacccc gtgaccaggt aagatcccag gccttcttcg gtcggcagca atgaaggcat atcagtcccc tggccgattg tcaactgcac tggtggtaca agcagtggta atcgaagtcg gcatgatgac gcccttccgt tgccatcgcg cgtactaggt ggtgggtatg gcctgaaaag ctcaaacgtc

-~r·—vł— β-t —1 r~. 4— 4— y y i_ l.

tgagattgcc gcatctgcgt tatgctagcg tgagggtcgg catggatgct cttgagagtt caaggcattg ttggttctct ttattggaaa catcactcat tccgtgtcta cttggcacga gcgtttcgga tgccgttcaa ctgggcagaa tggaaagctt ccgggatctg tgggtacata agttcagctc aaacacctcc ccaagtcacg atccgccaaa gccgccacct ggaacttgac aagggccgac caatgagccc agcgtattcc cagagtgact tgcgtttgac gtacgattcg tcccccgact gcccgaaaaa tctgaccatc cgacgaccgt tcaggccgat gaactggtac gacacaagga tcaagacagt cgtttgctgt gtgtcgctcc ttgcgcccgg ttcttgagaa aatgcccatg acagaggtga cagcgctcca gtggacatgc cgtgcgattg gacggtgagg gtctttactg ccatttgtga tatcggccta agactcgcca

Ct-CyCtyCay tgtgcctttg ggagttgtgt gcaggtatgt gtctgcgtcg atccagcacg gacaaggcct ctggagtgcg gccgtccacg gacaatctcg cgtctaatcg gccaccatca aacgttgacg gttcggagta aacctgtcaa tctcgctcca tcttcttaca gaatggctcg attatggcca ctggaaatct gtggagctga gtcaaatttg ggccaaatcg gaggaagagt ctccttgggt tccaaagcta ctcttgctcc tctccaggag ctgattccat acaatcaaca accaagacaa gcttcgaccg ctgctggagg gagcgaatcg caaaatgccg gctcgggctg accagccggt tggaacaatc tctcggtcac acgaaatggc gttctatacg gcagcctcgc cgaaagtgaa ctattatcga cctcagatgc tgaaggcaac atgatatcgc cagcacacaa tcgtcaccga gccaaggtgc gaggcattct cgtggacact gcttctccca Ctyy ta. uCy S. cggcaggatt ccgcggagca cgtacgatga ccgctagcaa ttgaaggtgt accattcgca actgtgctgt agaccagcaa tctctccggt acgtcgccat aggatgctct atgtggacgc tcgacgccga agtcattgcc cccgccagca gcacagcatc acggtcatgc tggaagctgc tggacatgag acttgacagc ttattgattc tcataaccct acccccagat atgactacag gcggcacctt acccagcgcc atcgtcgcct cgctctgtat cacacgacaa cgcttttcca accaccgaat accctgcgac tttacttcta acctccattc gccaccatca

24240 24300 24360 24420 24480 24540 24600 24660 24720 24780 24840 24900 24960 25020 25080 25140 25200 25 2 6 0 25320 25380 25440 25500 25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 26220 26280 26340 26400 26460 26520 26580 26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360

PL 202 457 B1 gtggtaccag gagtcttggg aggaggacac ttctgttcac attgagcaaa tgtgtgaaag 27420 gtacacccaa agctgttccg tgttttttca ttcttttata ttaacctttt acttgaagca 27490 actcgtccca cccacatgtg cgcctgatcc aaagggtagg caaagaatta atttcaattg 27540 ttcgcgggaa cggggatcct ttggatatca tgaaccgcga tgggttgttc accgagtact 27600 ataccaacaa gctcgccttt ggctcagcaa tacacgtcgt tcaggatctg gttagccaaa 27660 ttgctcatcg ctaccaatcc attgatatcc ttgagatcgg taagtcgaat ctgaaatgta 27720 agtaactagg cagtttgcta atctgtcgtt cgctttttag gcttgggtac aggcatcgcc 27780 acgaagcgcg ttcttgcatc acctcaactt ggtttcaaca gttacacttg cactgacatc 27840 tcggcggatg ttattggcaa ggcccgtgaa caactttccg aattcgacgg tctcatgcag 27900 tttgaggcac tagacatcaa cagaagccca gcagagcaag gattcaagcc tcactcctac 27960 gatctgatta ttgcatccga tgtcctccat gccagctcca acttcgagga aaaattggct 28020 cacataaggt ccttgctcaa gccgggtggt cacttggtta ctttcggggt cacccatcgc 28080 gagcctgctc gcctcgcctt catctctggg cttttcgctg atcgatggac tggagaagac 28140 gaaactcgtg ctttgagtgc ctcggggtcc gttgaccaat gggagcatac cctcaagaga 28200 gttgggttct ctggcgtcga tagtcggaca cttgatcgag aggatgattt gatcccgtct 28260 gtcttcagta cacatgctgt ggatgccacc gttgagcgtt tgtatgatcc actttctgct 28320 ccattgaagg actcataccc gccattagtg gttatcggtg gcgaatcgac aaaaaccgaa 28380 cgcattttga acgacatgaa agctgcccta ccgcatagac acatccactc cgtcaagcgg 28440 ctggaaagtg ttctcgacga cccggccttg cagcctaagt cgacttttgt catcctctcg 28500 gaacttgatg atgaagtgtt ttgcaacctt gaagaggaca agtttgaggc agtcaagtct 28560 cttctcttct acgccggacg catgatgtgg ctgacagaga atgcctggat tgatcatccc 28620 caccaggcca gcaccatcgg aatgttgagg acaatcaagc tcgagaaccc tgacttggga 28680 acgcacgtct tcgatgtcga tactgtggag aacctagaca ccaaattctt cgttgagcaa 28740 cttttgcgct tcgaggagag cgatgatcag cttttggaat caataacatg gactcatgag 28800 cccgaagtgt actggtgcaa gggtcgtgcc tgggtccctc gtttgaagca ggatattgct 28860 aggaacgacc gtatgaactc gtctcgtcgt ccaattttcg gtaactttaa ttcgtccaag 28920 acggccattg cactgaaaga ggcgagggga gcatcctcat cgatgtacta tcttgagtca 28980 accgagacgt gtgattcgtt agaagacgct cgtcatgctg gaaaagcaac tgttcgtgtt 29040 cgctacgctc ttccccaggc aattcgcgtg ggccatctcg gatacttcca tgtcgtgcag 29100 ggcagtattc tggagaatac atgtgaggtg cctgtagtcg ccctggctga gaagaatgga 29160 tctatactgc atgtaccgag aaactacatg catagtctgc ccgataacat ggcggaaggc 29220 gaggatagtt ccttcttgtt gtccacagct gcagccctcc ttgccgaaac aattctctct 29280 agcgctcagt cctttggctc tgatgcatca attctgatta tggagccccc aatcttctgc 29340 gtcaaagcaa ttctggagtc ggccaaaacc tacggtgttc aggttcattt ggcaacaact 29400 ctgtccgacg tcaaaactat tccggctcct tggatccgat tacatgccaa ggaaaccgac 29460 gctcggctga aacacagcct gccgacaaac atgatggcat tctttgactt gtctaccgac 29520 cggactgctg ccgggataac caaccgtttg gccaagttgc taccacccag ttgcttcatg 29580 tacagtggtg actatcttat ccgaagtaca gcttccacat acaaagttag tcatgttgag 29640 gatattccaa tcctcgagca ctctgtggca atggcaaaaa ataccgtctc tgcgtcgact 29700 gtcgacgaca ctgagaaagt tattacagcc acacaaattc tcttgcctgg tcagctctct 29760 gtcaaccaca atgaccaacg cttcaatctg gccaccgtca tcgactggaa ggaaaatgag 29820 gtgtccgcta ggatttgccc catcgactct ggtaacttat tttccaacaa gaagacgtat 29880 ttgcttgttg gtcttaccgg ggaccttggt cgctctctct gtcgctggat gatcttgcat 29940 ggcgcccgcc atgttgtgct cactagccgg aaccctcgac ttgatcccaa atggatcgcc 30000 aacatggagg cacttggtgg tgacatcacc gttctgtcaa tgtaagttga ttgatatcac 30060 atcacacctt gctaccacat cctcgtttac ttatccaatt actttcttta gggatgttgc 30120 caatgaggat tcagtcgatg ctggccttgg caagcttgtc gatatgaagt tgccacctgt 30180 tgccggcatc gcgttcgggc ctttggtgct gcaggatgtc atgctgaaga acatggacca 30240 ccagatgatg gacatggtgt tgaagcccaa ggtacaagga gcacgcattc ttcatgaacg 30300 gttctccgaa cagacgggca gcaaggcgct cgacttcttc atcatgtttt cgtccattgt 30350 tgcagttatt ggcaatcctg gccagtccaa ctatggcgct gcgaatgcct acctacaggc 30420 tctggcccag caacggtgcg ccagaggatt ggcggtattt tctacccctg aattatcatg 30480 catcgacgtc aagttactaa cgcacaacca cagggatcaa ccatcgatat tggtgccgtt 30540

PL 202 457 B1 tacggtgtag atgtttgact gaccagcgtg cttaccacgg gaccctcgtt tcagggtcta cggcaaatcg caaagttgca gagcgtggac tgtcggctca cggtgcttct tccgćtgctg accaacagac agaggatgaa gaggttgtcc catcttcaac gcgggctctg at“'-‘u.

cagagtgcac cgagaagaca gggcacagat aacagaaaac atcgacccaa gggggacgat cgtgcttccc acagccattc ccgaatcaaa ctaccacgtt aaccaaccga cctgcgcttt ggacagtgtg tctaggcctg 'gttccaggct caaaatgacg gtgggatgac ccctgagcac gaacccggct agtgttgttc ctgaattcgg tctttgtcaa agttagatag cgaaagactc gtatataaat ggtgatcgag tccaaaatat ttggaaggtg tgtggtatgg acaaatgaac tggacatcac ttctgaggca cgaccgtgaa tcggctctca ctcattttcg ggtttgtcac cagttgaaga cccggcagca gtatcccaga tcggaaactt aaggctccat tgattggtaa gatggtctat ccaaccattc tggttctcaa gtcgctgatc ttgcaaattg agccatgatg gagcaagagg cttggccagg aacactattg aaagcctcat

ΟΓ-η-ΊΐίΊ^ΛίΏΐ-Ιu U L· tttgttcagg aactatagca gaccacctgt ctgttcaatg ttctctgatc atcgcgttct atcatgaatc acgtggcagc gagcggagcc ttgttggcgc tccaccatgg gatgagttcg cgtgaggcca aatctcccta gtctttgatt agtgttctcg cctaccaagg gctcaggcct ctgaagttgg atgataaaga cgtcaattga aattacttct cgcggttcag tgtgaggaag tcgacgccat tggttttaga gttcacgaaa agcattcaaa actaggcatg ctgacatctt tcggtctgtt ggtaatgtgt gatgcagtgt tgtaatctct gaaaccatgg gagggccgag gcatgagctg accacagcgc tcttgaccct caaaattccc tgccgaccag gttatctctc ctgagaaact ctctcattga agcaactcta ttgccgacga gtgattccac aagcaagctc acgataatga agtattcctg gcatgttcat tgcgccgtca ł“ —1 -Ί —1 4” ΓΤΠ— t-l i—l υ«αα uyy i_ \_ ·_ tgaacaacgc tctccacagg tggtaatcgg agatcgggca tagccgtcca ggaagtccat tgatcaatga agtatgaagc gcaagcacaa gtcttaccgg aagaaatttc tcggcagcaa tgcaacacgc cctcaggcga acaagcaggg cttcccgtga acccactcat ttgtagacca cctagatcgt tggattagaa cacacgcata accttcgttg agtaccgtaa gtgaaacctc tgcaaatagt tgtctgtcat tatttatgag ccgtgtaaga agagccagag gaccttttga gggaaaatta ttcaaccatc cggcacgttg ggcttcatcg cagttttccc atggaggagg cacacgcttt aagacggtca gcgcttcaag ggtcaacgcg ctcaaacaag atgcgtttcc ccgtgttacc tcaaggtgtc ccttgacctc cgcggccacc gggaacctcg tgctaccagc gcagggaggc gaggcagcaa gaagggtacc cgagatcttc cgtccaagtg tgcggaggca tgacactctc ctaccacaga gatttacagc acagcgggaa gcatagcaaa ccctgctgcc aattgctcgt ggcaaccccc cagcaaagac ggcgatgggc gacattcggc gcgggtgccg ggaacccaag tcaagcggag gcgcactcct tcatgtcaaa cttttcttca tcagcgccgt attggcaata ttcatctaca ctcttcttta cggtgataaa caaggcttgg tccatagtta gcctgttcag atggtcgcga ttagaactat ccttgctata tatagctgtt tgctttccct tgtctcgacc attattagct ctatagaaac atttgctgtt actttgatgc tcgccgaagc ttgacatggc atcgaattat gagacggtgg caacaacttt tgatatcgag ctccaagttt gactccttgg ccactcttga cgactcccag gacagcgggg acagatgcgt cgtaagattc caaatggtaa attgacctcg cgtacgtgct gttctcaaga gaggaagagt agactcgttg ttagttggtg ggggtgaaaa aacctggaaa gtctcgtcat aattcagagc ttagatccca atgcagttct ataaccatcg tttttcgcta gagcaccttg tatggcgtca actcagacac agtggctcaa tatgacatcg cttcagagct atcctcacta gaattcagat gagcagatgg aatagcgaat ttgcagcaat tatacctcgg aattgatttc ctggtttagt aacgagcctt ccactataac tcaaatttgt taccctgttg ggaagcgctt gaaactcgag cttggagagc tgtcgtcgtc agcaaatcaa gatggagcag tatccgtttc ggtcgtgtct ggaccttgag ttacttcaac cgacaatgga agaccaagtt ttcaaactaa cggacgggga gtgcagtgac gggtacttgg ctacatccat cttctccgac cgtcagccga ttcgtcgcga aagatcatac accggttgag ttgttactgg aCCCyy ety 3.S accggaaact atttctactg atggctcaac tgcagcgacc atgggcgaat ctgcgccaac agcagcaaat tggtcgcctt acctggccgc gcctcgccga acgtgcttcc tagccaccaa tcctcgactg acgccccctt ttggcaatgc ttctcgagat cgctgtatgg tgttctcgat gtgtggtttg caaatctatc tcgtcttgta cgtaacatca tagcgcgttt aatccatcct gccttgttgt ccatgatcta taaatcaccc tcagtaaaaa tctcacctag gaccgtctcc tacatctgca aaaatcttga gtcttgcgcc aacagcaatg caaagtggcg

30600 30660 30720 30780 30840 30900 30960 31020 31080 31140 31200 31260 31320 31380 31440 31500 31560 3162 0 31680 31740 31800 31860 31920 31980 32040 32100 32160 32220 32280 32340 32400 32460 32520 32580 32640 32700 32760 32820 32880 32940 33000 33060 33120 33180 33240 33300 33360 33420 33480 33540 33600 33660 33720

PL 202 457 B1 accaatgcgc cctcagagaa ggccactatg ccgacaatgg gtgcctgtgg gttagttata 33780 gaccaatctt ggacggtctt ttgcacaggc ccgatcacag ccgctactct atcgcccacc 33840 gtgggggttg tcgtgtttgt aacggcgtca tgatgctttt ggaaccaggt gtagtatgga 33900 cccatgcctt ggaagacagg aagcacgccg ggtccggggc tggagctaaa cggcgcggtc 33960 gcatatacga attcaaactc gtttttcaac gccacgcgca gtttagagat ctggacgcgg 34020 aatatggctg ctgagcaccc ggcaccgtgg atgcataaga gagcttttct cggtttgcct 34080 ggcgagaaat ctgtaatcct cgctggactc attttctctt gtggtgtgag ctgtgacttc 34140 gtctgttctg gggaatttgt tagtcattac tgacaaggaa ataacaacga cgtagtattg 34200 atc 34203 <210» 3 <2113 17 <212» DNA <213» Sekwencja syntetyczna <22 0» <221» misc_feature <223» Opis sekwencji syntetycznej: Mieszany primer mający sekwencję DNA wydedukowaną z sekwencji aminokwasów PKS of Aspergillus flavus.

<220» <221» zmodyfikowana zasada <222> (6) . . (6) <223» i <220» <221> zmodyfikowana zasada <222» (9) . . (9) <223» i <400» 3 gayacngcnt gyasttc 17 <210» 4 <211» 17 <212» DNA <213» Sekwencja syntetyczna <220>

<221» misc_feature ' <223» Opis sekwencji syntetycznej: Mieszany primer mający sekwencję dna wydedukowaną z sekwencji aminokwasów PKS of Aspergillus flavus.

<220» <221» zmodyfikowana zasada <222» (3)..(3) <223» i <22 0» <221» zmodyfikowana zasada <222» (6)..(6) <223» i

PL 202 457 B1

<210?	10
<211?	19
<212?	DNA
<213?	Penicillium citrinum

<400? 10 ttgcttgtgt tggattgtc 19

<210?	11
<211?	20
<212?	DNA
<213?	Penicillium citrinum

<400? 11 catggtactc tcgcccgttc 20

<210?	12
<211?	19
<212?	DNA
<213?	Penicillium citrinum

<400? 12 ctccccagta cgtaagctc 19

<210?	13
<211?	21
<212?	DNA
<213?	Penicillium citrinum

<400? 13 ccataatgag tgtgactgtt c 21

<210?	14
<211?	19
<212?	DNA
<213?	Penicillium citrinum

<400? 14 gaacatctgc atccccgtc 19

<210?	15
<211 ?	20
<212?	DNA
<213?	Penicillium citrinum
<400?	15

ggaaggcaaa gaaagtgtac 20

<210?	15
<211?	21
<212 ?	DNA
<213?	Penicillium citrinum

PL 202 457 B1 <400 = 16 agattcattg ctgttggcat c <210 = 17 <211 = 722 <212 = DNA <213 = Penicillium citrinum <400 = 17 ggccacgcgt aactctgcga atcaagccaa gtggtgtcaa ccaagatccc ccgggcgcac cctctttctt tgctggagac gatcctctac gtgaattgga accgtgtatc gttcatcctt tg cgactagtac ttctgtttaa ctatccaaac cacaccatca taaggagaga gaacgcaccc caacatccaa ggtctatgaa tgctgtgtac tagtattcct atacttcttc agctgccgtg gggggggggg tcccaatcct gagccaattg aaactttggg tttgacgtcg tttgcatact gctggagagg gctgtatcca gtcggtatga acatactctg gactggcatg catctggccg gggggggggg atcgcccaaa tggtagtggg agctgctcaa atacatttta tgctgcagga ccgaaacgat acgcaggcct tgacgcatga ccacgggggt ggccgagtat tccaacagct gcttgttcgc aacaggatca aagcggttgt agagccccgg cagccccgat ggatctacgc tgacccacag acggatccaa ctatgagact agctgtcagt gacgatcgac tagaacgggc tcagagattc gcagttatgg cggtttccag gatgtacaga ggcactcacc ggttttgatg caaaggctgc ggccttcaag atcgtgacgc gtggcctcca acagcctgta gagagtacca

120

180

240

300

360

420

480

540

600

660

720

722 <210 = 18 <211 = 760 <212 = DNA <213 = Penicillium citrinum <400 = 18 ggccacgcgt ccagggcgac aaccgcaacc cacatccacg tccacagaag ctcgcgattc cgtaaagggt catgaccaca ctacgaatcg ggtgtttggg agttccgcgt cttctacgac cgcactgcac cgactagtac tgatatatca gcaaccgcaa cccattgcca ctttgggaaa aatgtgagag ggacacttca gaggtcgcca ctggagagtg ggtgtcatgt tatttcataa ttacgtggtc ttggcgtgcc gggggggggg gtcaatgaaa ccgcaaccgc tagttggaat tggttgaaag gagtatacca tcgacgagga gctgcatgga ccggtatcac accacgacta ctggcaactc ccagcgtgac agagcttacg gggggggggg caacgttgga aaccgcaatg gggatgtcga aggaggcagt cccgaatggc tcctgcttta tccgcagtat catcgatggt tcaggattcg aggaacaatg ggttgacacg tactggggag gactatcaac atgaacaata gcaggctcgg tttgctggag gcctggtcta gaaagggtcg tttgacgccg cggcttatgc atggcaggct ctcaatcgtg ctttcgaacc gcctgttcga ggttttatca cccccgccgt cttgctctaa atgcaacgag aggtcccctc ggtccaccca cgttcttcaa ttgaggtggt ctaatacgtc accccgagac ggatatcaca cgacattgac

120

180

240

300

360

420

480

540

600

660

720

760 <210 = 19 <211 = 773 <212=· DNA <213= Penicillium citrinum <400= 19 ggccacgcgt cgactagtac gggggggggg ggtttttttt ttttcaaggt tgactggaag 60 agtgctctcg gccacaaaat cccagaagca ttagtgctgt tattcgatta taaaccgtcg 120 cagcgctctc attcttcgct ctttcttctt ttccactggt gtgcataggt cctatctgtc 1BO tcacgcaatg ctcggccagg ttcttctgac cgtcgaatcg taccaatggg tatcgacccc 240

PL 202 457 B1 tcaagccctt ccagtccgaa

Łaggcaggac caagcccctg cgacgagttt ctctcatctc caaagttgtt cttggccgac tgtctattcc gtggcggtcg ctgcaagtct ttcgatacgt cgcttcattg cggaaaatca cctggattcg ttgaaccagt gctactattg aatggattgg cagtgcttct ataatcccaa atggtccgag ttgattccgg aagatatgtg ^ac999ttcaa tacaaaccca ccaagttgtt accttgtcac tagtctcatc aaaatggtgg ctggatcgaa ctattgcacc catgtacaag ggaaatctgc agcccccaag cggtaaaagc acgaacagtc gcctaccgtt gagttgacga gcttggttct atcctcccat tttttggcgg caggatgcac tacacaaagc gaggagtggc acactcatta tgcgggggcg ccatgagggc cgaaaaacga cgtccatggc atgactttca atcttgtcaa cattggctac aaaccgcacc tgg

300

360

420

480

540

600

660

720

773 <210> 20 <211» 527 <212» DNA <213» Penicillium citrinum <400» 20 ggccacgcgt cgactagtac gggggggggg aaccgattag gctgtagcac ggaatcaatg ccaatttcta tctagctagt cgttgataaa acagaatggc gttgctcatt agacctttca aatcagcagc tccaaaacgg accacatacg gcagaatggg tggaagtggc cgattttgga gcatggtcgc accctctacg cgtgtctaca ttggactact gctctttggt agagcttcga gtacctagga tdtSCyo-Cyy gagactacct ttcgttgcta ctcgggaaat cccgatccat caaagacagc cgaaggaagt cggggatgca actgttcagt

Caya.ttfitaC agctataggt ccctctcgct cgggcattga accgtttgca ttcttccatg cgaagcttga gatgttc tgtccctccc ctaggcgcct accactccaa ttcgcggtag cctccacact ccatagctat gccccgcaaa tcaccggccc

12 0 180 240 300 360 420 480 527 <210» 21 <211» 522 <212» DNA <213» Penicillium citrinum <400» 21 ggccacgcgt aggctagcgg actatagaag attgcgcgat aaagtcaaaa agctcgggct ccattatcgt ggtggtacgg tgtatacact cgactagtac accttaacga cgccgcgcag gtcagaacct tgacacgctc ggtggttgct cacggcaatc cagtgcttat cttgggcttg gggggggggg aacaacgaga tagagattca ctacccccta gaagcgactg tcagttactt ccacatatca cttctggcta aagtacactt gggggggggg gcgagatcat caccgcccct aagaagggga agtccaagtc tcgtagcatt caagcgagtt actgtgctct tctttgcctt ggatccatca tcatacacca tgaagcaaaa accaaggcca ccagcacatc tttgatgctc ccactctctg ccagcccctg cc atctgacttc aaacacaggt gtcggaagga cagaaggaag acaggcctca cttgatatgt aacgatgtag gccggtaaat

120

180

240

300

360

420

480

522 <210> 22 <211 » 541 <2 12» DNA <213» Penicillium citrinum <400» 22 ggccacgcgt cgactagtac gggggggggg ggctcacctc acattatttg atcttaatcc 60 aataattatg tccctgccgc atgcaacgat tccgacgaac ctacgccgtc gcgcgtttcg 120 acgctcatgt gaccggtgtc atgcacaaaa gctcaaatgt accggtagca atgccaattt 180 agtccgtgct cagtgtcaac gttgtcagca agccggatta aggtgtgtgt acagcgaaag 240 gctacccaag cgcaatttac ataaagaagc cgcagctgga actacaagag ccacagaaac 300

PL 202 457 B1 ctcacaaccg atgaccgcga catcttctac ggtcttctca tcattggcag agactcctcc accttactgc tcaccaccta cgcatattgg cacctcggca ctcaaggaaa cattatcaga accatcagcg gcaaccctgc aattctatga tacatcaatc aactttgatg atcccgagtc gtttcccggc ggctggcctc agccaaatac atttcgcgac gatgccaaca gcaatgaatc

360

420

480

540

541 <210? 23 <211? 20 <212? DNA <213? Penicillium citrinum <400? 23 atcataccat cttcaacaac <210? 24 <211? 20 <212? DNA <213? Penicillium citrinum <400? 24 gctagaatag gttacaagcc <210? 25 <211? 20 <212? DNA <213? Penicillium citrinum <400? 25 acattgccag gcacccagac <210 ? 2 6 <211? 20 <212? DNA <213? Penicillium citrinum <400? 26 caacgcccaa gctgccaatc <210? 27 <211? 20 <212? DNA <213? Penicillium citrinum <400? 27 gtcttttcct actatctacc <210? 28 <211? 20 <212? DNA <213? Penicillium citrinum <400? 28 ctttcccagc tgctactatc

PL 202 457 B1 <210> 29 <211? 1524 <212? DNA <213? Penicillium citrinum <400? 29 aactggaaga agtaattttg attgaagccg ttatcatgaa acttcagagc cctgagcgtg tggtagggtc gaacactcgt caaagacagc ggagattcag cctcacgcac actcatcaaa tggtggatcg ccaacaaaac tccgctcttt gccacgtgaa tcatgatggg acgcgatatc cagagaattg tgaacaggtt ggtggtcatc tatagtttgt gaacaaagtg cgctgctata aggctttcag tagtgttgtt attcgcggcc acaaagatac aattcaggat caacactcaa cgggttcatc ctcagggcca atcccacatc cattttggca ctggaacaag gcctagacag actgtccttg gcgcagggga gttggtttcg gtggtaggcg gattcggaag tggctgtatt aagcacggtt gtcccccatt ggtcgatggt ttctgttgtt tgtgccccag cttctcgagt cactctgttc gtcatcgcca agcccgcctc gaagatggta gcaggaattt aagacgaatt agatttgcca accacacatc gagaacatag tacagcgagc tcgagaacga ttgccaattg ggggcgtgtg tcgaggatga gtggctacaa agcacgttag gcgaggccga gccaggtaga gcgaccatgg tgctgctgct ggcgcagatg cgcccatttt cgctgcattt gagccatcac tagaaatcaa ttccggtact tccgggttct gtaacaaagc aaccggtcga tgat tttttttttt cgctatttgt tctgctctat tgaattcacg tgaggattga tctgaagttt tgtcataagg agccactctc tctgagtctt cgccatacgg ggtgctcgcc cgaaaaagcc tggttatgtc actgcatggg gatctaaacg ctgaattggc acgagacttt ccaggttttc tcaccccgct caactaatct cgagtctgag cttcctctgc tgagaaccac acgtacggaa ggtcaatggt tttttttcaa agatgaatat tgccaatttc gcgctgaacg agaaaagtgg gacatgaatg agtgcgctca cgcttgaccc gggttcctcg cacccgcgcg gaatgtcttg catcgccgaa tttgctgccg ggttgccttg agcaattgct agcagggtca gctatgcatg ccgctgttgg gtaaatctgc gtggtagccg agtgtcacct ctccgcagcg ttggacggga gatctcgtga acccttcatg cgaaggtaga gcgtgtgtca taatccatct atctaggcca tctacaaagg agtgggtcct cgggaagcga tgcttgtaat cctgaggtag tgttgcatgg ctgccgacga atttcttcca gtaagacgcg tgcttgcggc tcatactgct ttgatcagat gacttccaga acggctagat ccgatctcat attaccaaca gtggagatgc ttgttcacct ccatttaaat cggcgcaatg aacatgccaa

120 ISO 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 12 6 0 1320 1380 1440 1500 1524 <210? 30 <211? 784 <212? DNA <213? Penicillium citrinum <400? 30 aactggaaga ctcagggcca attaaatagt ccgctatgct cttcactgaa tggtgttacc agtttcgaag aggacatgtc ggacgataga ctggtccttt taagtcccac atgtgttgat ggattgcctt tagc attcgcggcc ctgtaatggt caggctcagc ccttcgtact cccttcaact attcatgagc ttcaatggcg gtcttctgcc aatggcctcg tttatgcgaa aaaccgctgt tcctgtaacc ctccaacaca gcaggaattt atttcaggta ccaggctcga atacctccgt taactgcatt tcaaagatcg acgagtgagt agaccaaaca tcgtgagagg gagacaaagg tcctgtatcc acagctgcgg tccatgacgt tttttttttt tctctattta ttcagattgg cgagctatac tcgccacaac acacatcaac ctacgccgac ttcgcatcag tgaccctgct attggtctgc agtttgcctc gaggtgatgg ccttttcatg tttttttttc ctgctatcca attcaggctt ccgcttggcc taactcgacg atggatttca acctgccagg cttttccgtc tagttgggcc atgaaggact ggtccagtga aaattgaggg cataggcttg tttgttgctt gaagtcaggc cagaccatgg agacaaaagg aggccggcga gatgtgatcc tttttggacg attgctttga cgcacgccat tggcggtatt gcacccgggg gaagaacaca taacctattc

120

180

240

300

360

420

480

540

600

660

720

780

784

PL 202 457 B1 <210? 31 <211? 764 <212? DNA <213? Penicillium citrinum <400? 31 aactggaaga cgttttattt attggaataa ccggtcatga atgcatacga cacatcatac ccgcccggga caattgagcg ataattttcg caactcgccc gcgcatagtg gagcttcagc ctcttggcgg attcgcggcc tactaaccta gcctggggac gggagcggga acgctaaaag tgaatcagta caagcgcgtg gtgaaggcct gggttttccc ttgggaatga gcgcactcga ttgaacagag agaggctgaa gcaggaattt ctcgactaat ggatgcatat tgtcctcgtt cgtgacggta tatgagcgag ggttccagcc tgtctggatc acacatcagg agaggccatt ccggcttgat aggcaggcgt taaggtctgg tttttttttt acagcaccta ttgttttagt gcgccggcgt gtatttgtca gagaatcttg gaagccgatg ctcgcgcatg gttgttcatg ggatagagtg tcgctgcgtc ccagccccct gtgcctggca tttttttttc gtttctctgg ttgcgtgtta accatgagct tcgtctcctg atttccttcg tgatcaccgt cgcataaatc cggtctgcag atgtctctga tctttcatgc tctccgatta atgt gaataaaatg gacggaaacc tatcttagca ttgtggttgg gtacaggctt aggcgaagaa tggtattctc ggtagggatc ccacagcggc gagcggtact agctgtcgag cagtgcggat

120

180

240

300

360

420

480

540

600

660

720

764 <210? 32 <211? 765 <212? DNA <213? Penicillium citrinum <400? 32 aactggaaga tctctttata tgagataccc gaaaattatg ggagggggta tcagtagctg cctgacgggg atgtgcgcct aaaacagcgc tgtgatccgc ccgcccaacg agattgttca gtggcaatga attcgcggcc tattcttctt tttctggccg acaataacaa cggagcttgg cagcactcgg agacacttcg tgaccaggtg ttccgatgat ggacaccaag ttccaacctc tgagagtgat aaatggctgc gcaggaattt ccctactact ttcactctac ccaatgagaa aatgctccta cctcagtgca agaaggggct accggcggct gcgcgcaagt catgtcaagc aatagacggc gcagttagcg cgcaagattg tttttttttt tgcatcgtaa cacctgcctg aaaatatgat agattccgac ttgttaggaa gaagatgccg agggcagcac tgacgtgcat attgcgccct atggagacag ctctccacaa gcagcttggg ttttttctgg atttcaacaa tctcattgca cctcctgcaa ctaatcagcg cagggactgt gggcagaacg atagcgagag tctcaccggg ggggctccag agatttgaag cttgcgccgg cgttg aaaaggacca catataaaca ttgtgctttt tgaatccact tcgagcccga cctggttccg gttgtgcgcc ctccccagcc agtggtcggg aatcgtacca cgatccgcga atcctgacct

120

180

240

300

360

420

480

540

600

660

720

765 <210? 33 <211? 802 <212? DNA <213? Penicillium citrinum <400? 33 aactggaaga tcgacattaa aacgcggtca gccatcccat aagtatgatc ccacatctct catacttgct attcgcggcc ttaagtatgt agcatcagtc tccaaaggca aacggcgaga gaagccagtc caggccagtt gcaggaattt ggagattctt tcaggcacag aacacaaacg ctgtaagctt gcccctgctg ctcaaaccgg tttttttttt tgtggaggca cccgggtgtc tgcacgccgt ttacaacccc ccgtcacggc acccaaagac tttttataga cggtaatgtg gtttttggtt agctcccact tggaaggtta ctgcgtgtcg aaggttagca atctttgaaa tctatctagc gcaatcttcc gctaagtaaa ttcttgctga acagtgggcg aagtccagga

120

180

240

300

360

420

PL 202 457 B1 agagcgatcc cgggcgaaag agcccgcgat ataccagacc atcctgtctt caggcaacat tcggtagata tccaaacgtc cgtgctttgg aaattggtac tgcgcctatg tccaattgcg gtacacacca gtaggaaaag tgtccaaaca atggcgatga atgacccatt gcgacgagaa aagccagaaa ctcagtgtgg cggcgagaga taggcgtttg tcacagttga cagcgctgcc ccatagccat gagaaacatc aattccgagg catgccacaa tgtatggggc tagggcccaa aatgacttgt cttcacagcc gcaccttgtt ccacgaccga tggaaggtgg ggcaaatagt ccaagaattc tggaagtaga

480

540

600

660

720

780

802 <210> 34 <211? 562 <212> DNA <213? Penicillium citrinum <400> 34 aactggaaga tgtgtttctt tccctgaggc ataggagacg tgcttggcat tccccaaagc cagaagataa tagagtgaaa accagtacca cggatagtag attcgcggcc cgctaatgcg ctttgttgac agaggccggc atctgatagg agtctcaatc ggcgtgcatg cgagggaagt atccattcgt cagctgggaa gcaggaattt aatatttcct ttgggctctt gttatggttt actagacgaa ccactcaata aatgggtcga gcttcggctc gtgctttgct ag tttttttttt tatagcaacg cgtctccggc tattttcagc tagatgccgc gtcgaaggct gatgtgaaat ttccattgtc tttgtccaca ttttttttac tcgcaacaca ttcgtcactc gccaaggatt agccccgtgc tacacgcaat gagctcgccg atttctagtg aggttgggct taagcaatat tttatcgtct caaagcacag tgccacgatg tcctgtgcta gtcgtgcatg atatgaagat gttgagccag ttcatcacct

120

130

240

300

360

420

480

540

562 <210> 35 <211? 26 <212> DNA <213> Penicillium citrinum <400> 35 gttaacatgt cagaacctct accccc <210? 36 <211> 27 <212> DNA <213> Penicillium citrinum <400> 36 aatatttcaa gcatcagtct caggcac <210> 37 <211> 1662 <212> DNA <213> Penicillium citrinum <220> < 2 2 1 >

< 2 2 2 >

CDS (1) . . (1662)

PL 202 457 B1 <400> 37

atg Met 1

tca Ser

gaa Glu

cct Pro

eta Leu 5

ccc Pro

cct Pro

aaa Lys

gaa Glu

ggg Gly 10

gaa Glu

cca Pro

agg Arg

cca Pro

cag Gin 15

aag Lys

48

gaa

agt

caa

aat

gac

acg

ctc

gaa

gcg

act

gag

tcc

aag

tcc

cag

96

Glu

Ser

Gin

Asn

Asp

Thr

Leu

Glu

Ala

Thr

Glu

Ser

Lys

Ser

Gin

20

25

30

cac

atc

aca

ggc

ctc

aag

ctc

ggg

ctg

gtg

gtt

gct

tca

gtt

act

ttc

144

His

Ile

Thr

Gly

Leu

Lys

Leu

Gly

Leu

Val

Ala

Ser

Val

Thr

Phe

35

40

45

gta

gca

ttt

ttg

atg

ctc

ctt

gat

atg

tcc

att

atc

gtc

acg

gca

atc

192

Val

Ala

Phe

Leu

Met

Leu

Asp

Met

Ser

Ile

Val

Thr

Ala

Ile

50

55

60

cca

cat

atc

aca

agc

gag

ttc

cac

tct

ctg

aac

gat

gta

ggg

tgg

tac

240

Pro

His

Ile

Thr

Ser

Glu

Phe

His

Ser

Leu

Asn

Asp

Val

Gly

Trp

Tyr

65

70

75

80

99^c

agt

gct

tat

ctt

ctg

gct

aac

tgt

gct

ctc

cag

ccc

ctg

gcc

ggt

288

Gly

Ser

Ala

Tyr

Leu

Ala

Asn

Cys

Ala

Leu

Gin

Pro

Leu

Ala

Gly

85

90

95

aaa

ttg

tat

aca

ctc

ttg

ggc

ttg

aag

tac

act

ttc

ttt

gcc

ttc

CtC

336

Lys

Leu

Tyr

Thr

Leu

Gly

Leu

Lys

Tyr

Thr

Phe

Ala

Phe

Leu

100

105

110

tgt

att

ttt

gaa

eta

ggc

teg

gtg

eta

tgc

ggt

gcc

gca

aga

tct

tcc

384

Cys

Ile

Phe

Glu

Leu

Gly

Ser

Val

Leu

Cys

Gly

Ala

Arg

Ser

115

120

125

acc

atg

ttg

att

gtt

ggg

=gg

gcc

gtt

gct

gga

atg

gga

ggc

tca

ggt

432

Thr

Met

Leu

Ile

Val

Gly

Arg

Ala

Val

Ala

Gly

Met

Gly

Ser

Gly

130

135

140

ctt

gtc

aac

gga

gcc

ctc

aca

atc

ctc

tca

aca

gct

cct

aag

cac

480

Leu

Val

Asn

Gly

Ala

Leu

Thr

Ile

Leu

Ser

Thr

Ala

Pro

Lys

His

145

150

155

160

aag

caa

cca

gtt

ttg

att

gga

gtg

atg

ggt

ctt

agt

cag

att

gcc

528

Lys

Gin

Pro

Val

Leu

Ile

Gly

Val

Met

Gly

Leu

Ser

Gin

Ile

Ala

165

170

175

att

gtc

tgt

gga

cca

ctg

ctc

gga

ggt

gct

ttc

act

caa

cac

gcc

act

576

Ile

Val

Cys

Gly

Pro

Leu

Gly

Ala

Phe

Thr

Gin

His

Ala

Thr

180

185

190

tgg

ega

tgg

tgc

ttt

tat

atc

aat

ctc

ccc

atc

ggc

gct

gtc

gct

gca

624

Trp

Arg

Trp

Cys

Phe

Tyr

Ile

Asn

Leu

Pro

Ile

Gly

Ala

Val

Ala

195 200 205

PL 202 457 B1

ttc Phe

ctc Leu 210

ctt Leu

ctc Leu

gtc Val

atc Ile

acc Thr 215

ata Ile

ccc Pro

gac Asp

ega Arg

att Ile 220

tea Ser

tcc Ser

acg Thr

gac Asp

672

age

gaa

ctc

teg

acc

gac

aaa

cca

atg

gcc

aac

ata

aaa

tcc

aca

ctt

720

Ser

Glu

Leu

Ser

Thr

Asp

Lys

Pro

Met

Ala

Asn

Ile

Lys

Ser

Thr

Leu

225

230

235

240

ege

aaa

ctg

gac

ctt

gta

ggc

ttt

gtg

gtc

ttt

gca

gcc

ttc

gca

acc

768

Arg

Lys

Leu

Asp

Leu

Val

Gly

Phe

Val

val

Phe

Ala

Phe

Ala

Thr

245

250

255

atg

att

tcc

ctc

gca

eta

gaa

tgg

gga

ggg

teg

acc

tac

acc

tgg

ega

816

Met

ile

Ser

Leu

Ala

Leu

Glu

Trp

Gly

Ser

Thr

Tyr

Thr

Trp

Arg

260

265

270

agt

tcc

gtc

atc

ggc

ctg

ttc

tgt

ggc

gga

ggg

ttt

gct

ctg

att

364

Ser

Val

Ile

Gly

Leu

Phe

Cys

Gly

Phe

Ala

Leu

Ile

275

280

285

gcg

ttc

gtg

eta

tgg

gag

cgt

cat

gtt

ggc

gat

gct

gtt

gcc

atg

att

912

Ala

Phe

Val

Leu

Trp

Glu

Arg

His

Val

Gly

Asp

Ala

Val

Ala

Met

Ile

290

295

300

cct

ggc

tea

gtg

gct

ggt

aaa

ega

caa

gtg

tgg

tgc

tct

tgt

tta

ttt

960

Pro

Gly

Ser

Val

Ala

Gly

Lys

Arg

Gin

Val

Trp

Cys

Ser

Cys

Leu

Phe

305

310

315

320

atg

ggc

ttt

ttc

tct

ggc

tcc

ttg

ctt

gtc

ttt

tcc

tac

tat

eta

ccg

1008

Met

Gly

Phe

Ser

Gly

Ser

Leu

val

Phe

Ser

Tyr

Leu

Pro

325

330

335

atc

tac

ttc

cag

gct

gtg

aag

gat

gtt

tct

ccc

aca

ctg

agt

ggt

gtg

1056

Ile

Tyr

Phe

Gin

Ala

Val

Lys

Asp

Val

Ser

Pro

Thr

Leu

Ser

Gly

Val

340

345

350

tac

atg

ttg

cct

gga

att

ctt

gga

caa

gtc

att

atg

gct

atg

gtt

tct

1104

Tyr

Met

Leu

Pro

Gly

Ile

Leu

Gly

Gin

val

Ile

Met

Ala

Met

Val

Ser

355

360

365

ggc

ttc

gca

att

gga

aag

aca

gga

tac

tat

ttg

cct

tgg

gcc

eta

ggc

1152

Gly

Phe

Ala

Ile

Gly

Lys

Thr

Gly

Tyr

Leu

Pro

Trp

Ala

Leu

Gly

370

375

380

age

gct

gtt

ctc

gtc

gcc

ata

ggc

gca

ggt

ctg

gta

tcc

acc

ttc

cag

1200

Ser

Ala

Val

Leu

Val

Ala

Ile

Gly

Ala

Gly

Leu

Val

Ser

Thr

Phe

Gin

385

390

395

400

CCC

cat

aca

tea

act

gtg

aaa

tgg

gtc

atg

tac

caa

ttt

atc

gcg

ggc

1248

Pro

His

Thr

Ser

Thr

Val

Lys

Trp

Val

Met

Tyr

Gin

Phe

Ile

Ala

Gly

405

410

415

PL 202 457 B1

ttc Phe

ggt Gly

cgt Arg

ggt Gly 420

tgt Cys

ggc Gly

atg Met

caa Gin

acg Thr 425

cct Pro

atc ile

gcc Ala

atc Ile 430

caa Gin

agc Ser

1296

acg

Ctt

teg

ccc

gaa

caa

ggt

gcc

ctc

gga

att

tct

ctc

gcc

gtg

ttt

1344

Thr

Leu

Ser

Pro

Glu

Gin

Gly

Ala

Leu

Gly

Ile

Ser

Leu

Ala

Val

Phe

435

440

445

gga

cag

acg

ttt

gga

teg

ctc

ttc

ctg

gac

ttt

gct

aac

ctt

gtc

1392

Gly

Gin

Thr

Phe

Gly

Ser

Leu

Phe

Leu

Asp

Phe

Ala

Asn

Leu

Val

450

455

460

ttt

ggg

tcc

ggt

ttg

aga

act

ggc

ctg

agc

aag

tat

gcg

ccc

act

gtc

1440

Phe

Gly

Ser

Gly

Leu

Arg

Thr

Gly

Leu

Ser

Lys

Tyr

Ala

Pro

Thr

Val

465

470

475

480

gac

acg

cag

gcc

gtg

acg

gca

ggg

gcg

act

ggc

ttc

aga

gat

gtg

1488

Asp

Thr

Gin

Ala

Val

Thr

Ala

Gly

Ala

Thr

Gly

Phe

Arg

Aep

Val

485

490

495

gtc

agc

aag

aat

aac

ctt

cca

ggg

gtt

gta

aaa

gct

tac

agt

ctc

gcc

1536

Val

Ser

Lys

Asn

Leu

Pro

Gly

Val

Lys

Ala

Tyr

Ser

Leu

Ala

500

505

510

gtt

gat

cat

act

ttt

tac

tta

gca

gtg

gga

gct

acg

gcg

tgc

acg

ttt

1584

Val

Asp

His

Thr

Phe

Tyr

Leu

Ala

Val

Gly

Ala

Thr

Ala

Cys

Thr

Phe

515

520

525

gtg

ttt

gcc

ttt

gga

atg

gga

tgg

cgg

aag

att

gca

acc

aaa

aac

gac

1632

Val

Phe

Ala

Phe

Gly

Met

Gly

Trp

Arg

Lys

Ile

Ala

Thr

Lys

Asn

Asp

530

535

540

acc

cgg

gct

gtg

cct

gag

act

gat

gct

tga

1662

Thr

Arg

Ala

Val

Pro

Glu

Thr

Asp

Ala

545

550

<210» 38

<211» 553

<212» PRT <213> Penicillium citrinum

<400> 38

Arg

Pro

Gin 15

Lys

Met 1

Ser

Glu

Pro

Leu 5

Pro

Lys

Glu

Gly 10

Glu

Pro

C-lu

Glu

Ser

Gin 20

Asn

Asp

Thr

Leu

Glu 25

Ala

Thr

Glu

Ser

Lys 30

Ser

Gin

His

Ile

Thr 35

Gly

Leu

Lys

Leu

Gly 40

Leu

Val

Ala

Ser 45

Val

Thr

Phe

Val

Ala

Phe

Leu

Met

Leu

Asp

Met

Ser

Ile

Val

Thr

Ala

Ile

55 SO

PL 202 457 B1

Pro 65

His

Tle

Thr

Ser

Glu 70

Phe

His

Ser

Leu

Asn 75

Asp

Val

Gly

Trp

Tyr 80

Gly

Ser

Ala

Tyr

Leu

Ala

Asn

Cys

Ala

Leu

Gin

Pro

Leu

Ala

Gly

85

90

95

Lys

Leu

Tyr

Thr

Leu

Gly

Leu

Lys

Tyr

Thr

Phe

Ala

Phe

Leu

100

105

110

Cys

Ile

Phe

Glu

Leu

Gly

Ser

Val

Leu

Cys

Gly

Ala

Arg

Ser

115

120

125

Thr

Met

Leu

Ile

Val

Gly

Arg

Ala

Val

Ala

Gly

Met

Gly

Ser

Gly

130

135

140

Leu

Val

Asn

Gly

Ala

Leu

Thr

Ile

Leu

Ser

Thr

Ala

Pro

Lys

His

145

150

155

160

Lys

Gin

Pro

Val

Leu

Ile

Gly

Val

Met

Gly

Leu

Ser

Gin

Ile

Ala

165

170

175

ile

Val

Cys

Gly

Pro

Leu

Gly

Ala

Phe

Thr

Gin

His

Ala

Thr

180

185

190

Trp

Arg

Trp

Cys

Phe

Tyr

Ile

Asn

Leu

Pro

Ile

Gly

Ala

Val

Ala

195

200

205

Phe

Leu

Val

Ile

Thr

Ile

Pro

Asp

Arg

Ile

Ser

Thr

Asp

210

215

220

Ser

Glu

Leu

Ser

Thr

Asp

Lys

Pro

Met

Ala

Asn

Ile

Lys

Ser

Thr

Leu

225

230

235

240

Arg

Lys

Leu

Asp

Leu

Val

Gly

Phe

Val

Phe

Ala

Phe

Ala

Thr

245

250

255

Met

Ile

Ser

Leu

Ala

Leu

Glu

Trp

Gly

Ser

Thr

Tyr

Thr

Trp

Arg

260

265

270

Ser

Val

Ile

Gly

Leu

Phe

Cys

Gly

Phe

Ala

Leu

ile

275

280

285

Ala

Phe

Val

Leu

Trp

Glu

Arg

His

Val

Gly

Asp

Ala

Val

Ala

Met

Ile

290

295

300

Pro

Gly

Ser

Val

Ala

Gly

Lys

Arg

Gin

Val

Trp

Cys

Ser

Cys

Leu

Phe

305

310

315

320

Met

Gly

Phe

Ser

Gly

Ser

Leu

Val

Phe

Ser

Tyr

Leu

Pro

325

330

335

Ile

Tyr

Phe

Gin

Ala

Val

Lys

Asp

Val

Ser

Pro

Thr

Leu

Ser

Gly

Val

340

345

350

PL 202 457 B1

PL 202 457 B1 <400> 40 ggatccctaa gcaatattgt gtttcttcgc 30 <210> 41 <211> 1380 <212> DNA

<213

> Penicillium citrinum

<22C

) >

<221> CDS

<222>

(1) . .

(1380)

<400> 41

atg

tcc

ctg

ccg

cat

gca

acg

att

ccg

acg

aac

eta

cgc

cgt

cgc

gcg

48

Met

Ser

Leu

Pro

His

Ala

Thr

Ile

Pro

Thr

Asn

Leu

Arg

Ala

Ί

5

10

15

ttt

ega

cgc

tea

tgt

gac

cgg

tgt

cat

gca

caa

aag

ctc

aaa

tgt

acc

96

Phe

Arg

Ser

Cys

Asp

Arg

Cys

His

Ala

Gin

Lys

Leu

Lys

Cys

Thr

20

25

30

ggt

agc

aat

gcc

aat

tta

gtc

cgt

get

cag

tgt

caa

cgt

tgt

caa

144

G] y

Ser

Asn

Ala

Asn

Leu

Val

Arg

Ala

Gin

Cys

Gin

Arg

Cys

Gin

35

40

45

gcc

gga

tta

agg

tgt

gtg

tac

agc

gaa

agg

eta

ccc

aag

cgc

aat

tta

192

Ala

Gly

Leu

Arg

Cys

Val

Tyr

Ser

Glu

Arg

Leu

Pro

Lys

Arg

Asn

Leu

50

55

60

cat

aaa

gaa

gcc

gca

get

gga

act

aca

aga

gcc

aca

gaa

acc

tea

caa

240

Hi s

Lys

Glu

Ala

Gly

Thr

Arg

Ala

Thr

Glu

Thr

Ser

Gin

65

70

75

80

ccg

atg

acc

gcg

aca

tct

acg

gtc

ttc

tea

ttg

gca

gag

act

288

Pro

Met

Thr

Ala

Thr

Ser

Thr

Val

Phe

Ser

Leu

Ala

Glu

Thr

85

90

95

cct

cca

cct

tac

tgc

tea

cca

cct

acg

cat

att

ggc

acc

teg

gca

ctc

336

Pro

Tyr

Cys

Ser

Pro

Thr

His

Ile

Gly

Thr

Ser

Ala

Leu

100

105

110

aag

gaa

aca

tta

tea

gaa

cca

tea

gcg

gca

acc

ctg

caa

ttc

tat

gat

384

Lys

Glu

Thr

Leu

Ser

Glu

Pro

Ser

Ala

Thr

Leu

Gin

Phe

Tyr

Asp

115

12 0

125

aca

tea

atc

aac

ttt

gat

ccc

gag

teg

ttt

ccc

ggc

tgg

cct

432

Thr

Ser

Ile

Asn

Phe

Asp

Pro

Glu

Ser

Phe

Pro

Gly

Trp

Pro

130

135

140

cag

cca

aat

aca

ttt

cgc

gac

gat

gcc

aac

agc

aat

gaa

tct

teg

ggg

480

Gin

Pro

Asn

Thr

Phe

Arg

Asp

Ala

Asn

Ser

Asn

Glu

Ser

Gly

145

150

155

160

PL 202 457 B1

ata cca

gat

eta

9SC

tac

gac

ttt

gaa

ggc

cct

ttg

gat

gca

acg

gtg

528

Ile Pro

Asp

Leu

Gly

Tyr

Asp

Phe

Glu

Gly

Pro

Leu

Asp

Ala

Thr

Ala

165

170

175

cct gtc

tcg

cca

tcg

ctg

ttt

gac

ctc

gaa

gta

gag

ggg

aac

tcg

tca

576

Pro Va1

Ser

Pro

Ser

Leu

Phe

Asp

Leu

Glu

Val

Glu

Gly

Asn

Ser

180

185

190

tcc gga

caa

tcc

aac

aca

agc

aac

acg

caa

ega

gac

ctt

ttc

gaa

agt

624

Ser Gly

Gin

Ser

Asn

Thr

Ser

Asn

Thr

Gin

Arg

Asp

Leu

Phe

Glu

Ser

195

200

205

ctg tcg

gat

gtg

tca

cag

gac

eta

gag

gta

ata

ctc

cac

ggg

gtg

act

672

Leu Ser

Asp

Val

Ser

Gin

Asp

Leu

Glu

Val

Ile

Leu

His

Gly

val

Thr

210

215

220

gtg gaa

tgg

ccc

aag

caa

aaa

att

tta

agc

tac

ccg

ata

ggg

gac

ttt

720

Val Glu

Trp

Pro

Lys

Gin

Lys

Ile

Leu

Ser

Tyr

Pro

Ile

Gly

Asp

Phe

225

230

235

240

ttg aat

gcc

ttt

ggt

aga

ttg

eta

cat

Ctt

caa

gaa

cgt

gtg

atc

768

Leu Asn

Ala

Phe

Gly

Arg

Leu

His

Leu

Gin

Glu

Arg

Val

Ile

245

250

255

acg agc

agc

aat

agc

atg

tta

gat

ggg

tgt

ctg

caa

acc

aag

aac

816

Thr Ser

Ser

Asn

Ser

Met

Leu

Asp

Gly

Cys

Leu

Gin

Thr

Lys

Asn ·

260

265

270

ttg ttc

atg

gcg

gtg

cat

tgc

tac

atg

ttg

tct

gtc

aaa

atc

atg

aca

864

Leu Phe

Met

Ala

Val

His

Cys

Tyr

Met

Leu

Ser

Val

Lys

Ile

Met

Thr

275

280

285

tca ctt

tcc

cag

ctg

eta

tcc

gag

gtg

atg

aaa

gcc

caa

cct

tgt

912

Ser Leu

Ser

Gin

Leu

Ser

Glu

Val

Met

Lys

Ala

Gin

Pro

Cys

290

2S5

300

gga caa

aag

caa

agc

aca

ega

atg

gat

tgg

tac

tgg

tct

ggc

tca

acc

960

Gly Gin

Lys

Gin

Ser

Thr

Arg

Met

Asp

Trp

Tyr

Trp

Ser

Gly

Ser

Thr

305

310

315

320

act aga

aat

gac

aat

gga

aga

gcc

gaa

gca

ctt

ccc

tcg

ttt

cac

tct

1003

Thr Arg

Asn

Aep

Asn

Gly

Arg

Ala

Glu

Ala

Leu

Pro

Ser

Phe

His

Ser

325

330

335

aat ctt

cat

atc

ggc

gag

ctc

att

tca

cat

ctc

gac

cca

ttc

atg

cac

1056

Asn Leu

His

Ile

Gly

Glu

Leu

Ile

ser

His

Leu

Asp

Pro

Phe

Met

His

340

345

350

gcc tta

tct

gca

tgc

acg

aca

ttg

cgt

gta

agc

ctt

ega

eta

ttg

1104

Ala Leu

Ser

Ala

Cys

Thr

Leu

Arg

Val

Ser

Leu

Arg

Leu

355

360

365

PL 202 457 B1

agt Ser

gag Glu 370

att Ile

gag act Glu Thr

gct Ala

ttg Leu 375

ggg Gly

ata Ile

gca Ala

cag Gin

gag Glu 380

cac His

ggg Gly

gct Ala

gcg Ala

1152

gca

tet

att

cgt eta

gtc

eta

tca

gat

atg

cca

agc

aca

teg

tgg

caa

1200

Ala

Ser

Ile

Arg Leu

Val

Leu

Ser

Asp

Met

Pro

Ser

Thr

Ser

Trp

Gin

385

390

395

400

atc

ctt

ggc

gct gaa

aat

aaa

acc

ata

acg

ccg

gcc

tet

cgt

ctc

eta

1248

Ile

Leu

Gly

Ala Glu

Asn

Lyc

Thr

Ile

Thr

Pro

Ala

Ser

Arg

Leu

405

410

415

tet

gtg

ctt

tgg agt

gac

gaa

gcc

gga

gac

gaa

gag

ccc

aag

tca

aca

1296

Ser

Val

Leu

Trp Ser

Asp

Glu

Ala

Gly

Asp

Glu

Pro

Lys

Ser

Thr

420

425

430

aag

gcc

tca

ggg aag

acg

ata

aat

gtg

ttg

ega

cgt

tgc

tat

aag

gaa

1344

Lys

Ala

Ser

Gly Lys

Thr

Ile

Asn

Val

Leu

Arg

Cys

Tyr

Lys

Glu

435

440

445

ata

ttc

gca

tca gcg

aag

aaa

cac

aat

att

gct

tag

1380

ile

Phe

Ala

Leu Ala

Lys

His

Asn

Ile

Ala

450

455

<210> ·

42

<211>

459

<212? 1

PRT

<213> 1

Penicillium citrinum

<400> >

42

Met

Ser

Leu

Pro His

Ala

Thr

Ile

Pro

Thr

Asn

Leu

Arg

Ala

3

5

10

15

Phe

Arg

Ser Cys

Asp

Arg

Cys

His

Ala

Gin

Lys

Leu

Lys

Cys

Thr

20

25

30

Gly

Ser

Asn

Ala Asn

Leu

Val

Arg

Ala

Gin

Cys

Gin

Arg

Cys

Gin

35

40

45

Ala

Gly

Leu

Arg Cys

Val

Tyr

Ser

GlU

Arg

Leu

Pro

Lys

Arg

Asn

Leu

50

55

60

His

Lys

Glu

Ala Ala

Ala

Gly

Thr

Arg

Ala

Thr

Glu

Thr

Ser

Gin

65

70

75

80

Pro

Met

Thr

Ala Thr

Ser

Thr

Val

Phe

Ser

Leu

Ala

Glu

Thr

85

90

95

Pro

Tyr Cys

Ser

Pro

Thr

His

Ile

Gly

Thr

Ser

Ala

Leu

100

105

110

Lys

Glu

Thr

Leu Ser

Glu

Pro

Ser

Ala

Thr

Leu

Gin

Phe

Tyr

Asp

115

120

125

PL 202 457 B1

Thr

Ser 130

Ile

Asn

Phe

Asp

Asp 135

Pro

Glu

Ser

Phe

Pro 140

Gly

Trp

Pro

Gin

Pro

Asn

Thr

Phe

Arg

Asp

Ala

Asn

Ser

Asn

Glu

Ser

Gly

145

150

155

160

Ile

Pro

Asp

Leu

Gly

Tyr

Asp

Phe

Glu

Gly

Pro

Leu

Asp

Ala

Thr

Ala

165

170

175

Pro

Va 1

Ser

Pro

Ser

Leu

Phe

Asp

Leu

Glu

Val

Glu

Gly

Asn

Ser

180

185

190

Ser

Gly

Gin

Ser

Asn

Thr

Ser

Asn

Thr

Gin

Arg

Asp

Leu

Phe

Glu

Ser

195

200

205

Leu

Ser

Asp

Val

Ser

Gin

Asp

Leu

Glu

Val

Ile

Leu

His

Gly

Val

Thr

210

215

220

Val

Glu

Trp

Pro

Lys

Gin

Lys

Ile

Leu

Ser

Tyr

Pro

Ile

Gly

Asp

Phe

225

230

235

240

Leu

Asn

Ala

Phe

Gly

Arg

Leu

His

Leu

Gin

Glu

Arg

Val

Ile

245

250

255

Thr

Ser

Asn

Ser

Met

Leu

Asp

Gly

Cys

Leu

Gin

Thr

Lys

Asn

260

265

270

Leu

Phe

Met

Ala

Val

His

Cys

Tyr

Met

Leu

Ser

Val

Lys

Ile

Met

Thr

275

280

285

Ser

Leu

Ser

Gin

Leu

Ser

Glu

val

Met

Lys

Ala

Gin

Pro

Cys

290

295

300

Gly

Gin

Lys

Gin

Ser

Thr

Arg

Met

Asp

Trp

Tyr

Trp

Ser

Gly

Ser

Thr

305

310

315

320

Thr

Arg

Asn

Asp

Asn

Gly

Arg

Ala

Glu

Ala

Leu

Pro

Ser

Phe

His

Ser

325

330

335

Asn

Leu

His

Ile

Gly

Glu

Leu

Ile

Ser

His

Leu

Asp

Pro

Phe

Met

His

340

345

350

Ala

Leu

Ser

Ala

Cys

Thr

Leu

Arg

Val

Ser

Leu

Arg

Leu

355

3S0

365

Ser

Glu

Ile

Glu

Thr

Ala

Leu

Gly

Ile

Ala

Gin

Glu

His

Gly

Ala

370

375

380

Ala

Ser

Ile

Arg

Leu

Val

Leu

Ser

Asp

Met

Pro

Ser

Thr

Ser

Trp

Gin

385

390

395

400

Ile

Leu

Gly

Ala

Glu

Asn

Lys

Thr

Ile

Thr

Pro

Ala

Ser

Arg

Leu

405

410

415

PL 202 457 B1

Ser

Val

Leu

Trp 420

Ser

Asp

Glu

Ala

Gly 425

Asp

Glu

Pro

Lys 430

Ser

Thr

Lys

Ala

Ser 435

Gly

Lys

Thr

Ile

Asn 440

Val

Leu

Arg

Cys 445

Tyr

Lys

Glu

Ile

Phe

Ala

Leu

Ala

Lys

His

Asn

Ile

Ala

450 455 <210> 43 <211> 9099 <212 > DNA <213> Penicillium citrinum

<220 =

<221= CDS

(9099)

<222

> (

:u ..

<4 0 0 > 4 3

atg

gat

caa

gcc

aac

tat

cca

aac

gag

cca

att

gtg

gta

gtg

gga

age

48

Met

Asp

Gin

Ala

Asn

Tyr

Pro

Asn

Glu

Pro

Ile

val

Val

Gly

Ser

1

5

10

15

ggt

tgt

cgg

ttt

cca

ggt

gtc

aac

aca

cca

tea

aaa

ctt

tgg

gag

96

Gly

Cys

Arg

Phe

Pro

Gly

Val

Asn

Thr

Pro

Ser

Lys

Leu

Trp

Glu

20

25

30

ctg

ctc

aaa

gag

ccc

cgg

gat

gta

cag

acc

aag

atc

cct

aag

gag

aga

144

Leu

Lys

Glu

Pro

Arg

Asp

Val

Gin

Thr

Lys

Ile

Pro

Lys

Glu

Arg

35

40

45

ttt

gac

gtc

gat

aca

ttt

tac

age

ccc

gat

ggc

act

cac

ccc

ggg

ege

192

Phe

Asp

Val

Asp

Thr

Phe

Tyr

Ser

Pro

Asp

Gly

Thr

His

Pro

Gly

Arg

50

55

60

acg

aac

gca

ccc

ttt

gca

tac

ttg

ctg

cag

gag

gat

eta

ege

ggt

ttt

240

Thr

Asn

Ala

Pro

Phe

Ala

Tyr

Leu

Gin

Glu

Asp

Leu

Arg

Gly

Phe

65

70

75

80

gat

gcc

tct

ttc

aac

atc

caa

gct

gga

gag

gcc

gaa

acg

att

gac

288

Asp

Ala

Ser

Phe

Asn

Ile

Gin

Ala

Gly

Glu

Ala

Glu

Thr

Ile

Asp

85

90

95

cca

cag

caa

agg

ctg

gag

acg

gtc

tat

gaa

gct

gta

tcc

aac

336

Pro

Gin

Arg

Leu

Glu

Thr

Val

Tyr

Glu

Ala

Val

Ser

Asn

100

105

110

gca

ggc

eta

cgg

atc

caa

ggc

ctt

caa

gga

tcc

tct

act

gct

gtg

tac

384

Ala

Gly

Leu

Arg

Ile

Gin

Gly

Leu

Gin

Gly

Ser

Thr

Ala

Val

Tyr

115

120

125

PL 202 457 B1

gtc Val

ggt Gly 130

atg Met

acg Thr

cat His

gac Asp 135

tat Tyr

gag Glu

act Thr

atc Ile

gtg Val 140

acg Thr

cgt Arg

gaa Glu

ttg Leu

432

gat

agt

att

cct

aca

tac

tct

gcc

acg

ggg

gta

gct

gtc

agt

gtg

gcc

480

Asp

Ser

Ile

Pro

Thr

Tyr

Ser

Ala

Thr

Gly

Val

Ala

Val

Ser

Val

Ala

145

150

155

160

tcc

aac

cgt

gta

tca

tac

ttc

gac

tgg

cat

ggg

ccg

agt

atg

acg

528

Ser

Asn

Arg

Val

Ser

Tyr

Phe

Asp

Trp

His

Gly

Pro

Ser

Met

Thr

165

170

175

atc

gac

aca

gcc

tgt

agt

tca

tcc

tta

gct

gcc

gtg

cat

ctg

gcc

gtc

576

Ile

Asp

Thr

Ala

Cys

Ser

Leu

Ala

Val

Hi s

Leu

Ala

Val

180

185

190

caa

cag

ctt

aga

acg

ggc

gag

agt

acc

atg

gcg

gtt

gca

gcc

ggt

gcg

624

Gin

Leu

Arg

Thr

Gly

Glu

Ser

Thr

Met

Ala

val

Ala

Gly

Ala

195

200

205

aat

ctg

ata

ttg

ggc

ccc

atg

acc

ttt

gta

atg

gag

agc

aaa

ttg

aac

672

Asn

Leu

Ile

Leu

Gly

Pro

Met

Thr

Phe

Val

Met

Glu

Ser

Lys

Leu

Asn

210

215

220

atg

ctg

tcc

ccc

aat

ggt

aga

tct

ega

atg

tgg

gat

gct

gcc

gat

720

Met

Leu

Ser

Pro

Asn

Gly

Arg

Ser

Arg

Met

Trp

Asp

Ala

Asp

225

230

235

240

gga

tat

gcc

aga

gga

gaa

ggt

gtt

tgc

tct

att

gtc

ctg

aaa

acg

ctg

768

Gly

Tyr

Ala

Arg

Gly

Glu

Gly

Val

Cys

Ser

Ile

val

Leu

Lys

Thr

Leu

245

250

255

agc

cag

gca

ctg

cgc

gac

ggg

gac

agt

atc

gag

tgt

gtt

atc

ega

gag

816

Ser

Gin

Ala

Leu

Arg

Asp

Gly

Asp

Ser

Ile

Glu

Cys

Val

Ile

Arg

Glu

260

265

270

acc

ggt

atc

aac

caa

gat

ggc

ega

acg

aca

ggt

atc

aca

atg

cca

aac

864

Thr

Gly

Ile

Asn

Gin

Asp

Gly

Arg

Thr

Gly

Ile

Thr

Met

Pro

Asn

275

280

285

cat

agc

gca

caa

gaa

gcc

ctc

att

cgg

gcc

aca

tat

gcc

aag

gct

ggt

912

His

Ser

Ala

Gin

Glu

Ala

Leu

Ile

Arg

Ala

Thr

Tyr

Ala

Lys

Ala

Gly

290

295

300

ctt

gat

att

acc

aac

ccc

cag

gaa

cgc

tgc

cag

ttc

ttt

gąa

gcc

cat

960

Leu

Asp

Ile

Thr

Asn

Pro

Gin

Glu

Arg

Cys

Gin

Phe

Glu

Ala

His

305

310

315

320

gga

act

ggt

aca

cca

gcc

ggt

gac

cca

cag

gaa

gct

gag

gct

att

gca

1008

Gly

Thr

Gly

Thr

Pro

Ala

Gly

Asp

Pro

Gin

Glu

Ala

Glu

Ala

Ile

Ala

325

330

335

PL 202 457 B1

aca Thr

gcc Ala

ttc Phe

ttc Phe 340

gga Gly

cac His

aag Lys

gat Asp

gga Gly 345

aca Thr

atc Ile

gac Asp

agc Ser

gac Asp 350

ggc Gly

gag Glu

1056

aaa

gat

gag

ctt

ttt

gtc

ggc

agc

atc

aag

aca

gtt

ctc

ggt

cac

acg

1104

Lys

Asp

Glu

Leu

Phe

Val

Gly

Ser

Ile

Lys

Thr

Val

Leu

Gly

His

Thr

355

360

365

gaa

ggc

act

gct

ggt

att

gcg

ggc

tta

atg

aag

gca

teg

ttt

gct

gta

1152

Glu

Gly

Thr

Ala

Gly

Ile

Ala

Gly

Leu

Met

Lys

Ala

Ser

Phe

Ala

Val

370

375

380

ega

aat

99^c

gtg

atc

ccg

cca

aac

ctg

ttt

gag

aag

atc

agt

ccc

1200

Arg

Asn

Gly

Val

Ile

Pro

Asn

Leu

Phe

Glu

Lys

Ile

Ser

Pro

3 85

390

395

400

cgt

gtc

gct

ccg

ttc

tat

acg

cac

ttg

aaa

att

gca

acg

gag

gcc

aca

1248

Arg

Val

Ala

Pro

Phe

Tyr

Thr

His

Leu

Lys

Ile

Ala

Thr

Glu

Ala

Thr

405

410

415

gaa

tgg

ccg

att

gtt

gcg

ccc

ggg

cag

cct

cgc

aga

gtc

agc

gtt

aat

1296

Glu

Trp

Pro

Ile

Val

Ala

Pro

Gly

Gin

Pro

Arg

Val

Ser

Val

Asn

420

425

430

tea

ttt

gga

ttt

ggt

aca

aat

gcc

cat

gct

att

atc

gaa

gag

tat

1344

Ser

Phe

Gly

Phe

Gly

Thr

Asn

Ala

His

Ala

Ile

Glu

Tyr

435

440

445

atg

gct

cct

cca

cac

aag

ccg

aca

gca

gtg

gta

aca

gag

gtg

acc

tea

1392

Met

Ala

Pro

His

Lys

Pro

Thr

Ala

Val

Thr

Glu

Val

Thr

Ser

450

455

460

gat

gca

gat

gca

tgc

agc

ttg

ccc

ctt

gtg

ctt

tea

teg

aag

teg

cag

1440

Asp

Ala

Asp

Ala

Cys

Ser

Leu

Pro

Leu

Val

Leu

Ser

Lys

Ser

Gin

465

470

475

480

cgc

tcc

atg

aag

gca

acg

eta

gaa

aat

atg

ctc

caa

ttt

ctg

gaa

acg

1488

Arg

Ser

Met

Lys

Ala

Thr

Leu

Glu

Asn

Met

Leu

Gin

Phe

Leu

Glu

Thr

485

490

495

cat

gat

gac

gtg

gac

atg

cat

gat

atc

gca

tat

acc

tta

ctt

gag

aaa

1536

His

Asp

Val

Asp

Met

His

Asp

Ile

Ala

Tyr

Thr

Leu

Glu

Lys

500

505

510

cgg

tct

atc

ttg

ccc

ttc

cgt

gcg

att

gca

cac

aac

aag

gaa

1584

Arg

Ser

Ile

Leu

Pro

Phe

Arg

Ala

Ile

Ala

His

Asn

Lys

Glu

515

520

525

gta

gcc

cgc

gcg

gca

ctg

gag

gct

gcc

atc

gcg

gac

ggt

gag

gtc

1632

val

Ala

Arg

Ala

Leu

Glu

Ala

Ile

Ala

Asp

Gly

Glu

Val

530

535

540

PL 202 457 B1

acc Thr 545

gac Asp

ttc Phe

cgc Arg

acc Thr

gac Asp 550

gcg Ala

aat Asn

gac Asp

aac Asn

cct Pro 555

cgc Arg

gta val

cta Leu

ggt Gly

gtc Val 560

1680

ttt

act

ggc

caa

ggt

gca

cag

tgg

ccg

ggc

atg

ctg

aag

ctc

atg

1728

Phe

Thr

Gly

Gin

Gly

Ala

Gin

Trp

Pro

Gly

Met

Leu

Lys

Leu

Met

565

570

575

gtg

ggt

atg

cca

ttt

gtg

aga

ggc

att

ctc

gaa

gag

ctg

gat

aat

tca

1776

val

Gly

Met

Pro

Phe

Val

Arg

Gly

Ile

Leu

Glu

Leu

Asp

Asn

Ser

580

585

590

ctg

caa

aca

ctg

cct

gaa

aag

tat

cgg

cct

acg

tgg

aca

ctg

tat

gac

1824

Leu

Gin

Thr

Leu

Pro

Glu

Lys

Tyr

Arg

Pro

Thr

Trp

Thr

Leu

Tyr

Asp

595

600

605

cag

ctc

atg

ctt

gaa

ggg

gat

gcc

tca

aac

gtc

aga

ctc

gcc

agc

ttc

1872

Gin

Leu

Met

Leu

Glu

Gly

Asp

Ala

Ser

Asn

Val

Arg

Leu

Ala

Ser

Phe

510

615

620

tcc

cag

cct

cta

tgc

gcc

gta

caa

atc

gtt

ctg

gtc

ega

ctt

ctc

1920

Ser

Gin

Pro

Leu

Cys

Ala

Val

Gin

Ile

Val

Leu

Val

Arg

Leu

S25

630

635

640

gct

gca

gct

ggt

atc

gag

ttc

agt

gca

att

gtc

ggc

cac

agt

tca

ggt

1968

Ala

Gly

Ile

Glu

Phe

Ser

Ala

Ile

Val

Gly

His

Ser

Gly

645

550

655

gag

att

gcc

tgt

gcc

ttt

gcg

gca

gga

ttc

atc

agt

gcc

act

caa

gct

2016

Glu

Ile

Ala

Cys

Ala

Phe

Ala

Gly

Phe

Ile

Ser

Ala

Thr

Gin

Ala

660

665

670

atc

cgt

att

gcg

cat

ctg

cgt

gga

gtt

gtg

tcc

gcg

gag

cat

gcc

tct

2064

Ile

Arg

Ile

Ala

His

Leu

Arg

Gly

Val

Ser

Ala

Glu

His

Ala

Ser

575

680

685

tct

cca

agc

ggc

cag

aca

ggc

gct

atg

cta

gcg

gca

ggt

atg

teg

tac

2112

Ser

Pro

Ser

Gly

Gin

Thr

Gly

Ala

Met

Leu

Ala

Gly

Met

Ser

Tyr

690

695

700

gat

gac

gca

aag

gaa

cta

tgc

gag

ctc

gaa

gcc

ttt

gag

ggt

cgg

gtc

2160

Asp

Ala

Lys

Glu

Leu

Cys

Glu

Leu

Glu

Ala

Phe

Glu

Gly

Arg

Val

705

710

715

720

tgc

gtc

gcc

gct

agc

aat

tca

ccg

gat

agt

gtg

acc

ttc

tcc

ggc

gac

2208

Cys

Val

Ala

Ser

Asn

Ser

Pro

Asp

Ser

val

Thr

Phe

Ser

Gly

Asp

725

730

735

atg

gat

gct

atc

cag

cac

gtt

gaa

ggt

gtc

ttg

gag

gat

gaa

tcc

act

2256

Met

Asp

Al a

Ile

Gin

His

Val

Glu

Gly

Val

Leu

Glu

Asp

Glu

Ser

Thr

740

745

750

PL 202 457 B1

ttt Phe

gcc Ala

aga Arg 755

atc Ile

ttg Leu

aga Arg

gtt Val

gac Asp 760

aag Lys

gcc Ala

tac Tyr

cat His

tcg Ser 765

cat His

cac His

atg Met

2304

cac

cca

tgc

gca

gct

cca

tat

gtc

aag

gca

ttg

ctg

gag

tgc

gac

tgt

2352

His

Pro

Cys

Ala

Pro

Tyr

Val

Lys

Ala

Leu

Glu

Cys

Asp

Cys

770

775

780

gct

gtt

gcc

gat

ggc

caa

ggt

aac

gat

agt

gtt

gct

tgg

ttc

tct

gcc

2400

Ala

Val

Ala

Asp

Gly

Gin

Gly

Asn

Asp

Ser

Val

Ala

Trp

Phe

Ser

Ala

785

790

795

800

gtc

cac

gag

acc

agc

aag

caa

atg

act

gta

cag

gat

gtg

atg

ccc

gct

2448

Val

His

Glu

Thr

Ser

Lys

Gin

Met

Thr

Val

Gin

Asp

Val

Met

Pro

Ala

805

810

815

tat

tgg

3.3.3.

gac

aat

ctc

gtc

tct

ccg

gtc

ttg

ttc

tcg

cag

gct

gtg

2496

Tyr

Trp

Lys

Asp

Asn

Leu

val

Ser

Pro

Val

Leu

Phe

Ser

Gin

Ala

val

820

825

830

cag

aaa

gca

gtc

atc

act

cat

cgt

eta

atc

gac

gtc

gcc

atc

gaa

att

2544

Gin

Lys

Ala

Val

Ile

Thr

His

Arg

Leu

Ile

Asp

Val

Ala

Ile

Glu

Ile

835

840

845

ggc

gcc

cac

cct

gct

ctc

aag

ggt

ccg

tgt

eta

gcc

acc

atc

aag

gat

2592

Gly

Ala

His

Pro

Ala

Leu

Lys

Gly

Pro

Cys

Leu

Ala

Thr

Ile

Lys

Asp

850

855

860

gct

ctt

gcc

ggt

gtg

gag

ctg

ccg

tat

acc

ggg

tgc

ttg

gca

ega

aac

2640

Ala

Leu

Ala

Gly

Val

Glu

Leu

Pro

Tyr

Thr

Gly

Cys

Leu

Ala

Arg

Asn

865

870

875

380

gtt

gac

gat

gtg

gac

gct

ttt

gct

gga

ggt

ctg

gga

tac

att

tgg

gag

2688

Val

Asp

val

Asp

Ala

Phe

Ala

Gly

Leu

Gly

Tyr

Ile

Trp

Glu

835

890

895

cgt

ttc

gga

gtt

cgg

agt

atc

gac

gcc

gag

ggc

ttc

gta

caa

gtc

2736

Arg

Phe

Gly

Val

Arg

Ser

I le

Asp

Ala

Glu

Gly

Phe

Val

Gin

Val

900

905

910

cgg

ccc

gat

cgt

gcc

gtt

caa

aac

ctg

tca

aag

tca

ttg

ccc

aca

tac

2784

Arg

Pro

Asp

Arg

Ala

Val

Gin

Asn

Leu

Ser

Lys

Ser

Leu

Pro

Thr

Tyr

915

920

925

tct

tgg

gat

cat

act

cgt

caa

tac

tgg

gca

gaa

tct

ege

tcc

acc

ege

2832

Ser

Trp

Asp

His

Thr

Arg

Gin

Tyr

Trp

Ala

Glu

Ser

Arg

Ser

Thr

Arg

930

935

94 0

cag

cat

ctt

cgt

gga

ggt

gcg

ccc

cat

ctt

ctg

ctt

gga

aag

ctt

tct

2880

Gin

His

Leu

Arg

Gly

Ala

Pro

His

Leu

Gly

Lys

Leu

Ser

94 5

950

955

960

PL 202 457 B1 tct tac agc aca gca teg acc Ser Tyr Ser Thr Ala Ser Thr

965 cgg gat ctg gaa tgg ctc gac Arg Asp Leu Glu Trp Leu Asp 980 ttc ccc get get ggg tac ata Phe Pro Ala Ala Gly Tyr Ile

995

ttc Phe	cag Gin	tgg Trp 970	aca aac	ttc Phe	atc Ile	agg ccc	2928
Thr	Asn	Arg 975	Pro
ggt	cat	gcg	eta	caa	ggc	cag	act	gtg	2976
Gly	His	Ala	Leu	Gin	Gly	Gin	Thr	Val
	985					990
att	atg	- gcc	atg	i gaa	get	gcc atg aag	3024
Ile	Met	Ala	Met	Glu	Ala	Ala Met Lys
1000				1005

gtg Val

get Ala 1010

ggt Gly

gag Glu

cgt Arg

gcc Ala

gcc Ala 1015

caa Gin

gtt Val

cag Gin

ctc Leu

ctg Leu 1020

gaa Glu

atc Ile

ttg Leu

3069

gac

atg

agc

atc

aac

aaa

gcc

atc

gtg

ttt

gaa

gat

gaa

aac

acc

3114

Asp

Met 1025

Ser

Ile

Asn

Lys

Ala 1030

Ile

Val

Phe

Glu

Asp 1035

Glu

Asn

Thr

tcc

gtg

gag

ctg

aac

ttg

aca

gcc

gaa

gtc

acc

agt

gac

aat

gat

3159

Ser

Val 1040

Glu

Leu

Asn

Leu

Thr 1045

Ala

Glu

Val

Thr

Ser 1050

Asp

Asn

Asp

gcg

gat

ggc

caa

gtc

acg

gtc

aaa

ttt

gtt

att

gat

tcc

tgt

ctg

3204

Ala

Asp 1055

Gly

Gin

Val

Thr

Val 1060

Lys

Phe

Val

Ile

Asp 1065

Ser

Cys

Leu

gca

aag

gag

agt

gag

ctt

teg

aca

tcc

gcc

aaa

ggc

caa

atc

gtc

3249

Ala

Lys 1070

Glu

Ser

Glu

Leu

Ser 1075

Thr

Ser

Ala

Lys

Gly 1080

Gin

Ile

Val

ata

acc

ctt

ggc

gag

gca

tea

ccg

tea

teg

cag

ctt

ttg

ccg

cca

3 2 94

Ile

Thr 1085

Leu

Gly

Glu

Ala

Ser 1090

Pro

Ser

ser

Gin

Leu 1095

Leu

Pro

cct

gag

gaa

gag

tac

ccc

cag

atg

aac

aat

gtc

aac

atc

gat

ttc

3339

Pro

Glu 1100

Glu

Tyr

Pro

Gin 1105

Met

Asn

Val

Asn 1110

Ile

Asp

Phe

ttc

tat

cgg

gaa

ctt

gac

ctc

ctt

ggg

tat

gac

tac

agc

aaa

gac

3384

Phe

Tyr 1115

Arg

Glu

Leu

Asp

Leu 1120

Leu

Gly

Tyr

Asp

Tyr 1125

Ser

Lys

Asp

ttc

cgt

ttg

cag

acc

atg

aga

agg

gcc

gac

tcc

aaa

get

agc

3429

Phe

Arg 1130

Arg

Leu

Gin

Thr

Met 1135

Arg

Ala

Asp

Ser 1140

Lys

Ala

Ser

ggc

acc

ttg

get

ttc

ctt

cca

ctt

aag

gat

gaa

ttg

cgc

aat

gag

3474

Gly

Thr 1145

Leu

Ala

Phe

Leu

Pro 1150

Leu

Lys

Asp

Glu

Leu 1155

Arg

Asn

Glu

PL 202 457 B1

ccc Pro

ctc Leu 1160

ttg Leu

ctc Leu

cac His

cca Pro

gcg Ala 1165

ccc Pro

ctg Leu

gac Asp

atc ile

gcg Ala 1170

ttc Phe

cag Gin

act Thr

3519

gtc

att

gga

gcg

tat

tcc

tet

cca

gga

gat

cgt

cgc

eta

cgc

tca

3564

Val

Ile 1175

Gly

Ala

Tyr

Ser

Ser 1180

Pro

Gly

Asp

Arg

Arg 1185

Leu

Arg

Ser

ttg

tac

gtg

cct

act

cac

gtt

gac

aga

gtg

act

ctg

att

cca

teg

3609

Leu

Tyr 1190

Val

Pro

Thr

His

Val 1195

Asp

Arg

Val

Thr

Leu 1200

Ile

Pro

Ser

ctc

tgt

ata

teg

gcg

ggt

aat

tet

ggt

gaa

acc

gag

ctt

gcg

ttt

3654

Leu

Cys 1205

Ile

Ser

Ala

Gly

Asn 1210

Ser

Gly

Glu

Thr

Glu 1215

Leu

Ala

Phe

gac

aca

atc

aac

aca

cac

gac

aag

ggt

gat

ttc

ctg

agc

ggc

gac

3699

Asp

Thr 1220

Ile

Asn

Thr

His

Asp 1225

Lys

Gly

Asp

Phe

Leu 1230

Ser

Gly

Asp

atc

acg

gtg

tac

gat

teg

acc

aag

aca

acg

ctt

ttc

caa

gtt

gat

3744

Ile

Thr 1235

Val

Tyr

Asp

Ser

Thr 1240

Lys

Thr

Leu

Phe 1245

Gin

Val

Asp

aac

att

gtc

ttt

aag

cct

ttc

tet

ccc

ccg

act

gct

teg

acc

gac

3789

Asn

Ile 1250

Val

Phe

Lys

Pro

Phe 1255

Ser

Pro

Thr

Ala 1260

Ser

Thr

Asp

cac

ega

atc

ttc

gca

aag

tgg

gtc

tgg

gga

ccc

ctc

acg

ccc

gaa

3834

His

Arg 1265

Ile

Phe

Ala

Lys

Trp 1270

val

Trp

Gly

Pro

Leu 1275

Thr

Pro

Glu

aaa.

ctg

gag

gac

cct

gcg

acg

ttg

atc

ata

gct

cgg

gac

aag

3879

Lys

Leu 1280

Leu

Glu

Asp

Pro

Ala 1285

Thr

Leu

Ile

Ala 1290

Arg

Asp

Lys

gag

gac

att

ctg

acc

atc

gag

ega

atc

gtt

tac

ttc

tac

atc

aaa

3924

Glu

Asp 1295

Ile

Leu

Thr

Ile

Glu 1300

Arg

Ile

Val

Tyr

Phe 1305

Tyr

Ile

Lys

tcc

ttc

eta

gcc

cag

ata

acc

ccc

gac

cgt

caa

aat

gcc

gac

3969

Ser

Phe 1310

Leu

Ala

Gin

Ile

Thr 1315

Pro

Asp

Arg

Gin 1320

Asn

Ala

Asp

ctc

cat

tcc

cag

aag

tac

att

gaa

tgg

tgt

gac

cag

gtt

cag

gcc

4014

Leu

His 1325

Ser

Gin

Lys

Tyr

Ile 1330

Glu

Trp

Cys

Asp

Gin 1335

Val

Gin

Ala

gat

gct

cgg

gct

ggc

cac

cat

cag

tgg

tac

cag

gag

tet

tgg

gag

4059

Asp

Ala 1340

Arg

Ala

Gly

His

His 1345

Gin

Trp

Tyr

Gin

Glu 1350

Ser

Trp

Glu

PL 202 457 B1

gag Glu

gac Asp 1355

act Thr

tct Ser

gtt Val

cac His

att Ile 1360

gag Glu

caa Gin

atg Met

tgt Cys

gaa Glu 1365

age Ser

aac Asn

teg Ser

4104

tcc

cac

cca

cat

gtg

cgc

ctg

atc

caa

agg

gta

ggc

aaa

gaa

tta

4149

Ser

His 137 0

Pro

His

Val

Arg

Leu 1375

ile

Gin

Arg

Val

Gly 1380

Lys

Glu

Leu

att

tea

att

gtt

cgc

ggg

aac

ggg

gat

cct

ttg

gat

atc

atg

aac

4194

Ile

Ser 1385

Ile

Val

Arg

Gly

Asn 1390

Gly

Asp

Pro

Leu

Asp 1395

Ile

Met

Asn

cgc

gat

ggg

ttg

ttc

acc

gag

tac

tat

acc

aac

aag

ctc

gcc

ttt

4239

Arg

Asp 1400

Gly

Leu

Phe

Thr

Glu 1405

Tyr

Thr

Asn

Lys 1410

Leu

Ala

Phe

ggc

tea

gca

ata

cac

gtc

gtt

cag

gat

ctg

gtt

age

caa

att

gct

4284

Gly

Ser 1415

Ala

Ile

His

Val

Val 1420

Gin

Asp

Leu

Val

Ser 1425

Gin

Ile

Ala

cat

cgc

tac

caa

tcc

att

gat

atc

ctt

gag

atc

ggc

ttg

ggt

aca

4329

His

Arg 1430

Tyr

Gin

Ser

Ile

Asp 1435

Ile

Leu

Glu

Ile

Gly 1440

Leu

Gly

Thr

ggc

atc

gcc

acg

aag

cgc

gtt

ctt

gca

tea

cct

caa

ctt

ggt

ttc

4374

Gly

11 e 1445

Ala

Thr

Lys

Arg

val 1450

Leu

Ala

Ser

Pro

Gin 1455

Leu

Gly

Phe

aac

agt

tac

act

tgc

act

gac

atc

teg

gcg

gat

gtt

att

ggc

aag

4419

Asn

Ser 1460

Tyr

Thr

Cys

Thr

Asp 1465

Ile

Ser

Ala

Asp

val 1470

Ile

Gly

Lys

gcc

cgt

gaa

caa

ctt

tcc

gaa

ttc

gac

ggt

ctc

atg

cag

ttt

gag

4464

Ala

Arg 1475

Glu

Gin

Leu

Ser

Glu 1480

Phe

Asp

Gly

Leu

Met 1485

Gin

Phe

Glu

gca

eta

gac

atc

aac

aga

age

cca

gca

gag

caa

gga

ttc

aag

cct

4509

Ala

Leu 1490

Asp

Tle

Asn

Arg

Ser 1495

Pro

Ala

Glu

Gin

Gly 1500

Phe

Lys

Pro

cac

tcc

tac

gat

ctg

att

gca

tcc

gat

gtc

ctc

cat

gcc

age

4554

His

Ser 1505

Tyr

Asp

Leu

Ile

Ile 1510

Ala

Ser

Asp

Val

Leu 1515

His

Ala

Ser

tcc

aac

ttc

gag

gaa

aaa

ttg

gct

cac

ata

agg

tcc

ttg

ctc

aag

4599

Ser

Asn 152 0

Phe

Glu

Lys

Leu 1525

Ala

His

Ile

Arg

Ser 1530

Leu

Lys

ccg

ggt

cac

ttg

gtt

act

ttc

ggg

gtc

acc

cat

cgc

gag

cct

4644

Pro

Gly 1535

Glv

His

Leu

Val

Thr 1540

Phe

Gly

Val

Thr

His 1545

Arg

Glu

Pro

PL 202 457 B1

gct Ala

cgc Arg 1550

ctc Leu

gcc Ala

ttc Phe

atc Ile

tct Ser 1555

ggg Gly

ctt Leu

ttc Phe

gct Ala

gat Asp 1560

ega Arg

tgg Trp

act Thr

4669

gga

gaa

gac

gaa

act

cgt

gct

ttg

agt

gcc

teg

ggg

tcc

gtt

gac

4734

Gly

Glu 1565

Asp

Glu

Thr

Arg

Ala 1570

Leu

Ser

Ala

Ser

Gly 1575

Ser

Val

Asp

CciĆL

tgg

gag

cat

acc

ctc

aag

aga

gtt

ggg

ttc

tct

ggc

gtc

gat

4779

Gin

Trp 1580

Glu

His

Thr

Leu

Lys 1585

Arg

Val

Gly

Phe

Ser 1590

Gly

Val

Asp

agt

cgg

aca

ctt

gat

ega

gag

gat

ttg

atc

ccg

tct

gtc

ttc

4824

Ser

Arg 1595

Thr

Leu

Asp

Arg

Glu 1600

Asp

Leu

Ile

Pro 1605

Ser

Val

Phe

agt

aca

cat

gct

gtg

gat

gcc

acc

gtt

gag

cgt

ttg

tat

gat

cca

4869

Ser

Thr 1610

His

Ala

Val

Asp

Ala 1615

Thr

Val

Glu

Arg

Leu 1620

Tyr

Asp

Pro

ctt

tct

gct

cca

ttg

aag

gac

tea

tac

ccg

cca

tta

gtg

gtt

atc

4914

Leu

Ser 1625

Ala

Pro

Leu

Lys

Asp 1630

Ser

Tyr

Pro

Leu 1635

Val

Ile

ggt

ggc

gaa

teg

aca

aaa

acc

gaa

cgc

att

ttg

aac

gac

atg

aaa

4959

Gly

Gly 1640

Glu

Ser

Thr

Lys

Thr 1645

Glu

Arg

Ile

Leu

Asn 1650

Asp

Met

Lys

gct

gcc

eta

ccg

cat

aga

cac

atc

cac

tcc

gtc

aag

cgg

ctg

gaa

5004

Ala

Ala 1655

Leu

Pro

His

Arg

His 1660

Ile

His

Ser

Val

Lys 1665

Arg

Leu

Glu

agt

gtt

ctc

gac

ccg

gcc

ttg

cag

cct

aag

teg

act

ttt

gtc

5049

Ser

Val 1670

Leu

Asp

Pro

Ala 1675

Leu

Gin

Pro

Lys

Ser 1680

Thr

Phe

Val

atc

ctc

teg

gaa

ctt

gat

gaa

gtg

ttt

tgc

aac

ctt

gaa

gag

5094

Ile

Leu 1685

Ser

Glu

Leu

Asp

Asp 1690

Glu

val

Phe

Cys

Asn 1695

Leu

Glu

gac

aag

ttt

gag

gca

gtc

aag

tct

ctt

ctc

ttc

tac

gcc

gga

cgc

5139

Asp

Lys 1700

Phe

Glu

Ala

Val

Lys 1705

Ser

Leu

Phe

Tyr 1710

Ala

Gly

Arg

atg

tgg

ctg

aca

gag

aat

gcc

tgg

att

gat

cat

ccc

cac

cag

5184

Met

Met 1715

Trp

Leu

Thr

Glu

Asn 1720

Ala

Trp

Ile

Asp

His 1725

Pro

His

Gin

gcc

agc

acc

atc

gga

atg

ttg

agg

aca

atc

aag

ctc

gag

aac

cct

5229

Ala

Ser 1730

Thr

Ile

Gly

Met

Leu 1735

Arg

Thr

Ile

Lys

Leu 1740

Glu

Asn

Pro

PL 202 457 B1

gac Asp

ttg Leu 1745

gga Gly

acg Thr

cac His

gtc Val

ttc Phe 1750

gat Asp

gtc Val

gat Asp

acc Thr

gtg Val 1755

gag Glu

aac Asn

cta Leu

5274

gac

acc

aaa

ttc

gtt

gag

caa

ctt

ttg

cgc

ttc

gag

agc

5319

Asp

Thr 1760

Lys

Phe

Val

Glu 1765

Gin

Leu

Arg

Phe 1770

Glu

Ser

gat

cag

ctt

ttg

gaa

tca

ata

aca

tgg

act

cat

gag

ccc

gaa

5364

Asp

Asp 1775

Gin

Leu

Glu

Ser 1780

Ile

Thr

Trp

Thr

His 1785

Glu

Pro

Glu

gtg

tac

tgg

tgc

aag

ggt

cgt

gcc

tgg

gtc

cct

cgt

ttg

aag

cag

5409

val

Tyr 1790

Trp

Cys

Lys

Gly

Arg 1795

Ala

Trp

Val

Pro

Arg 1800

Leu

Lys

Gin

gat

att

gct

agg

aac

gac

cgt

atg

aac

teg

tct

cgt

cca

att

5454

Asp

Ile 1805

Ala

Arg

Asn

Asp

Arg 1810

Met

Asn

Ser

Arg 1815

Arg

Pro

Ile

ttc

ggt

aac

ttt

aat

teg

tcc

aag

acg

gcc

att

gca

ctg

aaa

gag

5499

Phe

Glv 1820

Asn

Phe

Asn

Ser

Ser 1825

Lys

Thr

Ala

Ile

Ala 1830

Leu

Lys

Glu

gcg

agg

gga

gca

tcc

tca

teg

atg

tac

tat

ctt

gag

tca

acc

gag

5544

Ala

Arg 1S35

Gly

Ala

Ser

Ser 1840

Met

Tyr

Leu

Glu 1845

Ser

Thr

Glu

acg

tgt

gat

teg

tta

gaa

gac

gct

cgt

cat

gct

gga

aaa

gca

act

5589

Thr

Cys 1850

Asp

Ser

Leu

Glu

Asp 1855

Ala

Arg

His

Ala

Gly 1860

Lys

Ala

Thr

gtt

cgt

gtt

cgc

tac

gct

Ctt

ccc

cag

gca

att

cgc

gtg

ggc

cat

5634

Val

Arg 1865

Val

Arg

Tyr

Ala

Leu 1870

Pro

Gin

Ala

Ile

Arg 1875

Val

Gly

His

ctc

gga

tac

ttc

cat

gtc

gtg

cag

ggc

agt

att

ctg

gag

aat

aca

5679

Leu

Gly 1880

Tyr

Phe

His

Va]

Val 1885

Gin

Gly

Ser

Ile

Leu 1890

Glu

Asn

Thr

tgt

gag

gtg

cct

gta

gtc

gcc

ctg

gct

gag

aag

aat

gga

tct

ata

5724

Cys

Glu 1895

Val

Pro

Val

Ala 1900

Leu

Ala

Glu

Lys

Asn 1905

Gly

Ser

Ile

ctg

cat

gta

ccg

aga

aac

tac

atg

cat

agt

ctg

ccc

gat

aac

atg

5769

Leu

His 1910

Val

Pro

Arg

Asn

Tyr 1915

Met

His

Ser

Leu

Pro 1920

Asp

Asn

Met

gcg

gaa

gg<=

gag

gat

agt

tcc

ttc

ttg

tcc

aca

gct

gca

gcc

5814

Ala

Glu 1925

Gly

Glu

Asp

Ser

Ser 1930

Phe

Leu

Ser

Thr 1935

Ala

PL 202 457 B1

ctc Leu

ctt Leu 1940

gcc Ala

gaa Glu

aca Thr

att Ile

ctc Leu 1945

tct Ser

agc Ser

gct Ala

cag Gin

tcc Ser 1950

ttt Phe

ggc Gly

tct Ser

5859

gat

gca

tca

att

ctg

att

atg

gag

ccc

cca

atc

ttc

tgc

gtc

aaa

5904

Asp

Ala 1955

Ser

Ile

Leu

Ile

Met 1960

Glu

Pro

Ile

Phe 1965

Cys

Val

Lys

gca

att

ctg

gag

tcg

gcc

aaa

acc

tac

ggt

gtt

cag

gtt

cat

ttg

5949

Ala

Ile 1970

Leu

Glu

Ser

Ala

Lys 1975

Thr

Tyr

Gly

Val

Gin 1980

Val

His

Leu

gca

aca

act

ctg

tcc

gac

gtc

aaa

act

att

ccg

gct

cct

tgg

atc

5994

Ala

Thr 1985

Thr

Leu

Ser

Asp

Val 1990

Lys

Thr

Ile

Pro

Ala 1995

Pro

Trp

Ile

ega

tta

cat

gcc

aag

gaa

acc

gac

gct

cgg

ctg

aaa

cac

agc

ctg

603 9

Arg

Leu 2000

His

Ala

Lys

Glu

Thr 2005

Asp

Ala

Arg

Leu

Lys 2010

His

Ser

Leu

ccg

aca

aac

atg

gca

ttc

ttt

gac

ttg

tct

acc

gac

cgg

act

6084

Pro

Thr 2015

Asn

Met

Ala

Phe 2020

Phe

Asp

Leu

Ser

Thr 2025

Asp

Arg

Thr

gct

gcc

ggg

ata

acc

aac

cgt

ttg

gcc

aag

ttg

eta

cca

ccc

agt

6129

Ala

Ala 2030

Gly

Ile

Thr

Asn

Arg 2035

Leu

Ala

Lys

Leu

Leu 2040

Pro

Ser

tgc

ttc

atg

tac

agt

ggt

gac

tat

ctt

atc

ega

agt

aca

gct

tcc

6174

Cys

Phe 2045

Met

Tyr

Ser

Gly

Asp 2050

Tyr

Leu

Ile

Arg

Ser 2055

Thr

Ala

Ser

aca

tac

aaa

gtt

agt

cat

gtt

gag

gat

att

cca

atc

ctc

gag

cac

6219

Thr

Tyr 2060

Lys

val

Ser

His

Val 2065

Glu

Asp

Ile

Pro

Ile 2070

Leu

Glu

His

tct

gtg

gca

atg

gca

aaa

aat

acc

gtc

tct

gcg

tcg

act

gtc

gac

6254

Ser

Val 2075

Ala

Met

Ala

Lys

Asn 2080

Thr

Val

Ser

Ala

Ser 2085

Thr

Val

Asp

gac

act

gag

aaa

gtt

att

aca

gcc

aca

caa

att

ctc

ttg

cct

ggt

6309

Asp

Thr 2090

Glu

Lys

Val

Ile

Thr 2095

Ala

Thr

Gin

Ile

Leu 2100

Leu

Pro

Gly

cag

ctc

tct

gtc

aac

cac

aat

gac

caa

ege

ttc

aat

ctg

gcc

acc

6354

Gin

Leu 2105

Ser

Val

Asn

His

Asn 2110

Asp

Gin

Arg

Phe

Asn 2115

Leu

Ala

Thr

gtc

atc

gac

tgg

aag

gaa

aat

gag

gtg

tcc

gct

agg

att

tgc

CCC

6399

Val

Ile 2120

Asp

Trp

Lys

Glu

Asn 2125

Glu

Val

Ser

Ala

Arg 2130

Ile

Cys

Pro

PL 202 457 B1

atc ile

gac Asp 213 5

tct Ser

ggt Gly

aac Asn.

tta Leu

ttt Phe 2140

tcc Ser

aac Asn

aag Lys

acg Thr 2145

tat Tyr

ttg Leu

ctt Leu

6444

gtt

ggt

ctt

acc

ggg

gac

ctt

ggt

cgc

tct

ctc

tgt

cgc

tgg

atg

6489

Val

Gly 2150

Leu

Thr

Gly

Asp

Leu 2155

Gly

Arg

Ser

Leu

Cys 2160

Arg

Trp

Met

atc

ttg

cat

ggc

gcc

cgc

cat

gtt

gtg

ctc

act

agc

cgg

aac

cct

6534

Ile

Leu 2165

His

Gly

Ala

Arg

His 2170

Val

Leu

Thr

Ser 2175

Arg

Asn

Pro

ega

ctt

gat

ccc

aaa

tgg

atc

gcc

aac

atg

gag

gca

ctt

ggt

6579

Arg

Leu 2180

Asp

Pro

Lys

Trp

Ile 2185

Ala

Asn

Met

Glu

Ala 2190

Leu

Gly

gac

atc

acc

gtt

ctg

tea

atg

gat

gtt

gcc

aat

gag

gat

tea

gtc

6624

Asp

Ile 2195

Thr

Val

Leu

Ser

Met 2200

Asp

Val

Ala

Asn

Glu 2205

Asp

Ser

Val

gat

gct

ggc

ctt

ggc

aag

ctt

gtc

gat

atg

aag

ttg

cca

cct

gtt

6669

Asp

Ala 2210

Gly

Leu

Gly

Lys

Leu 2215

Val

Asp

Met

Lys

Leu 2220

Pro

Val

gcc

ggc

atc

gcg

ttc

ggg

cct

ttg

gtg

ctg

cag

gat

gtc

atg

ctg

6714

Ala

Gly 2225

Ile

Ala

Phe

Gly

Pro 2230

Leu

Val

Leu

Gin

Asp 2235

Val

Met

Leu

aag

aac

atg

gac

cac

cag

atg

gac

atg

gtg

ttg

aag

ccc

aag

6759

Lys

Asn 2240

Met

Asp

His

Gin

Met 2245

Met

Asp

Met

Val

Leu 2250

Lys

Pro

Lys

gta

caa

gga

gca

cgc

att

ctt

cat

gaa

cgg

ttc

tcc

gaa

cag

acg

6804

Val

Gin 2255

Gly

Ala

Arg

Ile

Leu 2260

His

Glu

Arg

Phe

Ser 2265

Glu

Gin

Thr

ggc

agc

aag

gcg

ctc

gac

ttc

atc

atg

ttt

teg

tcc

att

gtt

584 9

Gly

Ser 2270

Lys

Ala

Leu

Asp

Phe 2275

Phe

Ile

Met

Phe

Ser 2280

Ser

Ile

Val

gca

gtt

att

ggc

aat

cct

ggc

cag

tcc

aac

tat

ggc

gct

gcg

aat

6894

Ala.

Val 2285

ile

Gly

Asn

Pro

Gly 2290

Gin

Ser

Asn

Tyr

Gly 2295

Ala

Asn

gcc

tac

eta

cag

gct

ctg

gcc

cag

caa

cgg

tgc

gcc

aga

gga

ttg

6939

Ala

Tyr 2300

Leu

Gin

Ala

Leu

Ala 2305

Gin

Arg

Cys

Ala 2310

Arg

Gly

Leu

gcg

gga

tea

acc

atc

gat

att

ggt

gcc

gtt

tac

ggt

gta

ggg

ttt

6984

Ala

Gly 2315

Ser

Thr

Ile

Asp

Ile 2320

Gly

Ala

Val

Tyr

Gly 2325

Val

Gly

Phe

PL 202 457 B1

gtc Val

acg Thr 2330

agg Arg

gcc Ala

gag Glu

atg Met

gag Glu 2335

gag Glu

gac Asp

ttt Phe

gat Asp

get Ala 2340

atc Ile

cgt Arg

ttc Phe

7029

atg

ttt

gac

tea

gtt

gaa

gag

cat

gag

ctg

cac

acg

ctt

ttc

gcc

7074

Met

Phe 2345

Asp

Ser

Val

Glu

Glu 2350

His

Glu

Leu

His

Thr 2355

Leu

Phe

Ala

gaa

gcg

gtc

gtg

tct

gac

cag

cgt

gcc

cgg

cag

caa

cca

cag

cgc

7119

Glu

Ala 2350

Val

Ser

Asp

Gin 2355

Arg

Ala

Arg

Gin

Gin 2370

Pro

Gin

Arg

aag

acg

gtc

att

gac

atg

gcg

gac

ctt

gag

ctt

acc

acg

ggt

atc

7164

Lys

Thr 2375

Val

Ile

Asp

Met

Ala 2380

Asp

Leu

Glu

Leu

Thr 2385

Thr

Gly

Ile

cca

gat

ctt

gac

cct

gcg

ctt

caa

gat

ega

att

tac

ttc

aac

7209

Pro

Asp 23 90

Leu

Asp

Pro

Ala

Leu 2395

Gin

Asp

Arg

Ile

Ile 2400

Tyr

Phe

Asn

gac

cct

cgt

ttc

gga

aac

ttc

aaa

att

ccc

ggt

caa

cgc

gga

gac

7254

Asp

Pro 2405

Arg

Phe

Gly

Asn

Phe 2410

Lys

Ile

Pro

Gly

Gin 2415

Arg

Gly

Asp

ggt

ggc

gac

aat

gga

tea

ggg

tct

aaa

ggc

tcc

att

gcc

gac

cag

7299

Gly

Gly 2420

Asp

Asn

Gly

Ser

Gly 2425

Ser

Lys

Gly

Ser

Ile 2430

Ala

Asp

Gin

ctc

aaa

caa

gca

aca

act

tta

gac

caa

gtt

cgg

caa

atc

gtg

att

7344

Leu

Lys 2435

Gin

Ala

Thr

Leu 2440

Asp

Gin

Val

Arg

Gin 2445

Ile

Val

Ile

gat

ggt

eta

tct

gag

aaa

ctc

cgt

gtt

acc

ctc

caa

gtt

teg

gac

7389

Asp

Gly 2450

Leu

Ser

Glu

Lys

Leu 2455

Arg

Val

Thr

Leu

Gin 2460

Val

Ser

Asp

ggg

gag

agc

gtg

gac

cca

acc

att

cct

ctc

att

gat

caa

ggt

gtc

7434

Gly

Glu 2465

Ser

Val

Asp

Pro

Thr 2470

Ile

Pro

Leu

Ile

Asp 2475

Gin

Gly

Val

gac

tcc

ttg

ggt

gca

gtg

act

gtc

ggc

tea

tgg

ttc

tea

aag

caa

7479

Asp

Ser 2480

Leu

Gly

Ala

Val

Thr 2485

Val

Gly

Ser

Trp

Phe 2490

Ser

Lys

Gin

ctc

tac

ctt

gac

ctc

cca

ctc

ttg

agg

gta

ctt

ggc

ggt

get

tct

7524

Leu

Tyr 2495

Leu

Asp

Leu

Pro

Leu 2500

Leu

Arg

Val

Leu

Gly 2505

Gly

Ala

Ser

gtc

get

gat

ctt

gcc

gac

gcg

gcc

acc

ega

ctc

cca

get

aca

7569

Val

Ala 2510

Asp

Leu

Ala

Asp

Asp 2515

Ala

Thr

Arg

Leu 2520

Pro

Ala

Thr

PL 202 457 B1

tcc Ser

att Ile 2525

ccg Pro

ctg Leu

ttg Leu

caa Gin 2530

att Ile

ggt Gly

gat Asp

tcc Ser

acg Thr 2535

gga Gly

acc Thr

tcg Ser

7614

gac

agc

ggg

gct

tct

ccg

aca

cca

aca

gac

agc

cat

gat

gaa

gca

7659

Asp

Ser 2540

Gly

Ala

Ser

Pro

Thr 2545

Pro

Thr

Asp

Ser

His 2550

Asp

Glu

Ala

agc

tct

gct

acc

agc

aca

gat

gcg

tcg

tca

gcc

gaa

gag

gat

gaa

7704

Ser

Ser 2555

Ala

Thr

Ser

Thr

Asp 2560

Ala

Ser

Ala

Glu 2565

Glu

Asp

Glu

gag

caa

gag

gac

gat

aat

gag

cag

gga

ggc

cgt

aag

att

Ctt

cgt

7749

Glu

Gin 2570

Glu

Asp

Asn

Glu 2575

Gin

Gly

Arg

Lys 2580

Ile

Leu

Arg

cgc

gag

agg

ttg

tcc

ctt

ggc

cag

gag

tat

tcc

tgg

agg

cag

caa

7794

Arg

Glu 2585

Arg

Leu

Ser

Leu

Gly 2590

Gin

Glu

Tyr

Ser

Trp 2595

Arg

Gin

caa

atg

gta

aaa

gat

cat

acc

atc

ttc

aac

act

att

ggc

atg

7839

Gin

Met 2600

Val

Lys

Asp

His

Thr 2605

Ile

Phe

Asn

Thr 2610

Ile

Gly

Met

ttc

atg

aag

ggt

acc

att

gac

ctc

gac

cgg

ttg

agg

cgg

gct

ctg

7884

Phe

Met 2615

Lys

Gly

Thr

Ile

Asp 2620

Leu

Asp

Arg

Leu

Arg 2625

Arg

Ala

Leu

aaa

gcc

tca

ttg

cgc

cgt

cac

gag

atc

ttc

cgt

acg

tgc

ttt

gtt

7929

Lys

Ala 2630

Ser

Leu

Arg

His 2635

Glu

Ile

Phe

Arg

Thr 2640

Cys

Phe

Val

act

ggc

gat

gac

tat

agc

gat

tta

aat

ggt

ccc

gtc

caa

gtg

7974

Thr

Gly 2645

Asp

Tyr

Ser

Ser 2650

Asp

Leu

Asn

Gly

Pro 2655

Val

Gin

Val

gtt

ctc

aag

aac

ccg

gag

aac

aga

gtg

cac

ttt

gtt

cag

gtg

aac

8019

Val

Leu 2660

Lys

Asn

Pro

Glu

Asn 2665

Arg

Val

His

Phe

Val 2670

Gin

Val

Asn

aac

gct

gcg

gag

gca

gag

gaa

gag

tac

cgg

aaa

ctc

gag

aag

aca

8064

Asn

Ala 2675

Ala

Glu

Ala

Glu

Glu 2630

Glu

Tyr

Arg

Lys

Leu 2685

Glu

Lys

Thr

aac

tat

agc

atc

tcc

aca

ggt

gac

act

ctc

aga

ctc

gtt

gat

ttc

8109

Asn

Tyr 2690

Ser

Ile

Ser

Thr

Gly 2 6 95

Asp

Thr

Leu

Arg

Leu 2700

Val

Asp

Phe

tac

tgg

ggc

aca

gat

gac

cac

ctg

ttg

gta

atc

ggc

tac

cac

aga

8154

Tyr

Trp 2705

Gly

Thr

Asp

His 2710

Leu

Val

Ile

Gly 2715

Tyr

His

Arg

PL 202 457 B1

tta Leu

gtt val 2720

ggt Gly

gat Asp

ggc Gly

tea Ser

aca Thr 2725

aca Thr

gaa Glu

aac Asn

ctg Leu

ttc Phe 2730

aat Asn

gag Glu

atc Ile

8199

ggg

cag

att

tac

agc

ggg

gtg

aaa

atg

cag

ega

cca

teg

acc

caa

8244

Gly

Gin 2735

Ile

Tyr

Ser

Gly

Val 2740

Lys

Met

Gin

Arg

Pro 2745

Ser

Thr

Gin

ttc

tct

gat

eta

gcc

gtc

caa

cag

cgg

gaa

aac

ctg

gaa

aat

ggg

8289

Phe

Ser 2750

Asp

Leu

Ala

Val

Gin 2755

Gin

Arg

Glu

Asn

Leu 2760

Glu

Asn

Gly

ega

atg

ggg

gac

gat

atc

gcg

ttc

tgg

aag

tcc

atg

cat

agc

aaa

8334

Arg

Met 2755

Gly

Asp

Ile

Ala 2770

Phe

Trp

Lys

Ser

Met 2775

His

Ser

Lys

gtc

teg

tea

tct

gcg

cca

acc

gtg

ctt

ccc

atc

atg

aat

ctg

atc

8379

Val

Ser 2780

Ser

Ala

Pro

Thr 2785

Val

Leu

Pro

Ile

Met 2790

Asn

Leu

Ile

aat

gac

cct

gct

gcc

aat

tea

gag

cag

caa

ata

cag

cca

ttc

8424

Asn

Asp 2795

Pro

Ala

Asn

Ser 2800

Glu

Gin

Ile 2805

Gin

Pro

Phe

acg

tgg

cag

tat

gaa

gca

att

gct

cgt

tta

gat

ccc

atg

gtc

8469

Thr

Trp 2810

Gin

Tyr

Glu

Ala 2815

Ile

Ala

Arg

Leu

Asp 2820

Pro

Met

Val

gcc

ttc

ega

atc

aaa

gag

cgg

agc

cgc

aag

cac

aag

gca

acc

ccc

8514

Ala

Phe 2825

Arg

Ile

Lys

Glu

Arg 2830

Ser

Arg

Lys

His

Lys 2835

Ala

Thr

Pro

atg

cag

ttc

tac

ctg

gcc

tac

cac

gtt

ttg

gcg

cgt

ctt

8559

Met

Gin 2840

Phe

Tyr

Leu

Ala

Ala 2845

Tyr

His

Val

Leu

Leu 2850

Ala

Arg

Leu

acc

ggc

agc

aaa

gac

ata

acc

atc

ggc

ctc

gcc

gaa

acc

aac

ega

8604

Thr

Gly 2855

Ser

Lys

Asp

Ile

Thr 2860

Ile

Gly

Leu

Ala

Glu 2865

Thr

Asn

Arg

tcc

acc

atg

gaa

att

teg

gcg

atg

ggc

ttt

ttc

gct

aac

gtg

8649

Ser

Thr 2870

Met

Glu

Ile

Ser 2875

Ala

Met

Gly

Phe

Phe 2880

Ala

Asn

Val

ctt

ccc

ctg

cgc

ttt

gat

gag

ttc

gtc

ggc

agc

aag

aca

ttc

ggc

8694

Leu

Pro 2885

Leu

Arg

Phe

Asp

Glu 2890

Phe

Val

Gly

Ser

Lys 2895

Thr

Phe

Gly

gag

cac

ctt

gta

gcc

acc

aag

gac

agt

gtg

cgt

gag

gcc

atg

caa

8739

Glu

His 2900

Leu

Val

Ala

Thr

Lys 2905

Asp

Ser

Val

Arg

Glu 2910

Ala

Met

Gin

PL 202 457 B1

cac

gcg

cgg

gtg

ccg

tat

ggc

gtc

atc

ctc

gac

tgt

eta

ggc

ctg

8784

His

Ala

Arg

Val

Pro

Tyr

Gly

val

Ile

Leu

Asp

Cys

Leu

Gly

Leu

2915

2920

2925

aat

ctc

cct

acc

tea

ggc

gag

gaa

ccc

aag

act

cag

aca

cac

gcc

8829

Asn

Leu

Pro

Thr

Ser

Gly

Glu

Pro

Lys

Thr

Gin

Thr

His

Ala

2930

2935

2940

ccc

ttg

ttc

cag

get

gtc

ttt

gat

tac

aag

cag

ggt

caa

gcg

gag

8874

Pro

Leu

Phe

Gin

Ala

Val

Phe

Asp

Tyr

Lys

Gin

Gly

Gin

Ala

Glu

2945

2950

2955

agt

ggc

tea

att

ggc

aat

gcc

aaa

atg

acg

agt

gtt

ctc

get

tcc

8919

Ser

Gly

Ser

Ile

Gly

Asn

Ala

Lys

Met

Thr

Ser

Val

Leu

Ala

Ser

2950

2965

2 97 0

cgt

gag

cgc

act

cct

tat

gac

atc

gtt

ctc

gag

atg

tgg

gat

gac

8964

Arg

Glu

Arg

Thr

Pro

Tyr

Asp

Ile

Val

Leu

Glu

Met

Trp

Asp

2975

2980

2985

cct

acc

aag

gac

cca

ctc

att

cat

gtc

aaa

ctt

cag

agc

teg

ctg

9009

Pro

Thr

Lys

Asp

Pro

Leu

Ile

His

Val

Lys

Leu

Gin

Ser

Leu

2990

2995

3000

tat

ggc

cct

gag

cac

get

cag

gcc

ttt

gta

gac

cac

ttt

tct

tea

9054

Tyr

Gly

Pro

Glu

His

Ala

Gin

Ala

Phe

Val

Asp

His

Phe

Ser

3005

3010

3015

atc

ctc

act

atg

ttc

teg

atg

aac

ccg

get

ctg

aag

ttg

gcc

tag

9099

Ile

Leu

Thr

Met

Phe

Ser

Met

Asn

Pro

Ala

Leu

Lys

Leu

Ala

3020

3025

3030

<210>	44
<211>	3032
<212>	PRT
<213>	Penicillium citrinum
<400>	44

Met

Asp Gin Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Se

Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu

Leu

Leu Lys Glu Pro Arg Asp Val Gin Thr Lys Ile Pro Lys Glu Arg

Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg

Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gin Glu Asp Leu Arg Gly Phe

PL 202 457 B1

Asp Ala Ser Phe Phe Asn Ile Gin Ala Gly Glu Ala Glu Thr Ile Asp 85 90 95

Pro Gin Gin Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn 100 105 110

Ala Gly Leu Arg Ile Gin Gly Leu Gin Gly Ser Ser Thr Ala Val Tyr 115 120 125

Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu 130 135 140

Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala

145 150 155 160

Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr

165 170 175

Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val 180 185 190

Gin Gin Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala 195 200 205

Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn 210 215 220

Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp

225 230 235 240

Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu

245 250 255

Ser Gin Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu 260 265 270

Thr Gly Ile Asn Gin Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn 275 280 285

His Ser Ala Gin Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly 290 295 300

Leu Asp Tle Thr Asn Pro Gin Glu Arg Cys Gin Phe Phe Glu Ala His

305 310 315 320

Gly Thr Gly Thr Pro Ala Gly Asp Pro Gin Glu Ala Glu Ala Ile Ala

325 330 335

Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu 340 345 350

Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr 355 360 365

PL 202 457 B1

Glu

Gly 370

Thr

Ala

Gly

Ile

Ala 375

Gly

Leu

Met

Lys

Ala 380

Ser

Phe

Ala

Val

Arg

Asn

Gly

Val

Ile

Pro

Asn

Leu

Phe

Glu

Lys

Ile

Ser

Pro

385

390

395

400

Arg

Val

Ala

Pro

Phe

Tyr

Thr

His

Leu

Lys

Ile

Ala

Thr

Glu

Ala

Thr

405

410

415

Glu

Trp

Pro

Ile

Val

Ala

Pro

Gly

Gin

Pro

Arg

Val

Ser

Val

Asn

420

425

430

Ser

Phe

Gly

Phe

Gly

Thr

Asn

Ala

His

Ala

Ile

ile

Glu

Tyr

435

440

445

Met

Ala

Pro

His

Lys

Pro

Thr

Ala

Val

val

Thr

Glu

Val

Thr

Ser

450

455

460

Asp

Ala

Asp

Ala

Cys

Ser

Leu

Pro

Leu

Val

Leu

Ser

Lys

Ser

Gin

465

470

475

480

Arg

Ser

Met

Lys

Ala

Thr

Leu

Glu

Asn

Met

Leu

Gin

Phe

Leu

Glu

Thr

485

490

495

His

Asp

Val

Asp

Met

His

Asp

Ile

Ala

Tyr

Thr

Leu

Glu

Lys

500

505

510

Arg

Ser

Ile

Leu

Pro

Phe

Arg

Ala

Ile

Ala

His

Asn

Lys

Glu

515

520

525

Val

Ala

Arg

Ala

Leu

Glu

Ala

Ile

Ala

Asp

Gly

Glu

Val

530

535

540

Thr

Asp

Phe

Arg

Thr

Asp

Ala

Asn

Asp

Asn

Pro

Arg

val

Leu

Gly

Val

545

550

555

560

Phe

Thr

Gly

Gin

Gly

Ala

Gin

Trp

Pro

Gly

Met

Leu

Lys

Leu

Met

565

570

575

Val

Gly

Met

Pro

Phe

Val

Arg

Gly

Ile

Leu

Glu

Leu

Asp

Asn

Ser

580

585

590

Leu

Gin

Thr

Leu

Pro

Glu

Lys

Tyr

Arg

Pro

Thr

Trp

Thr

Leu

Tyr

Asp

595

600

605

Gin

Leu

Met

Leu

Glu

Gly

Asp

Ala

Ser

Asn

Val

Arg

Leu

Ala

Ser

Phe

SIO

615

620

Ser

Gin

Pro

Leu

Cys

Ala

Val

Gin

Ile

Val

Leu

Val

Arg

Leu

625

530

635

640

Ala

Gly

Ile

Glu

Phe

Ser

Ala

Ile

Val

Gly

His

Ser

Gly

645

650

655

PL 202 457 B1

Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gin Ala 660 565 670

Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser 675 680 685

Ser Pro Ser Gly Gin Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr 690 695 7oo

Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val

705 710 715 720

Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp

725 730 735

Met Asp Ala Ile Gin His Val Glu Gly Val Leu Glu Asp Glu Ser Thr 740 745 750

Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met 755 760 765

His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys 770 775 780

Ala Val Ala Asp Gly Gin Gly Asn Asp Ser Val Ala Trp Phe Ser Ala

785 790 795 800

Val His Glu Thr Ser Lys Gin Met Thr Val Gin Asp Val Met Pro Ala

805 810 815

Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gin Ala Val 820 825 830

Gin Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile 835 840 845

Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp 850 855 860

Aia Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn

865 870 875 880

Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu

885 890 895

Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gin Gin Val 900 905 910

Arg Pro Asp Arg Ala Val Gin Asn Leu Ser Lys Ser Leu Pro Thr Tyr 915 920 925

Ser Trp Asp His Thr Arg Gin Tyr Trp Ala Glu Ser Arg Ser Thr Arg 930 935 940

PL 202 457 B1

Gin 945

His

Leu

Arg

Gly

Gly 950

Ala

Pro

His

Leu

Leu 955

Leu

Gly Lys

Leu

Ser 960

Ser

Tyr

Ser

Thr

Ala 965

Ser

Thr

Phe

Gin

Trp 970

Thr

Asn

Phe Ile

Arg 975

Pro

Arg

Asp

Leu

Glu 980

Trp

Leu

Asp

Gly

His 985

Ala

Leu

Gin

Gly Gin 990

Thr

Val

Phe

Pro

Ala 995

Ala

Gly

Tyr

Ile

Ile 100C

Met Ala Met Glu Ala Ala Met L- l 1005

Val

Ala 1010

Gly

Glu

Arg

Ala

Ala 1015

Gin

Val

Gin

Leu

Leu 1020

Glu

Ile

Leu

Asp

Met 1025

Ser

ile

Asn

Lys

Ala 1030

ile

Val

Phe

Glu

Asp 1035

Glu

Asn

Thr

Ser

Val 1040

Glu

Leu

Asn

Leu

Thr 1045

Ala

Glu

Val

Thr

Ser 1050

Asp

Asn

Asp

Ala

Asp 1055

Gly

Gin

Val

Thr

Val 1060

Lys

Phe

Val

Ile

Asp 1065

Ser

Cys

Leu

Ala

Lys 1070

Glu

Ser

Glu

Leu

Ser 1075

Thr

Ser

Ala

Lys

Gly 1080

Gin

Ile

Val

I le

Thr 1085

Leu

Gly

Glu

Ala

Ser 1090

Pro

Ser

Gin

Leu 1095

Leu

Pro

Glu 1100

Glu

Tyr

Pro

Gin 1105

Met

Asn

Val

Asn 1110

Ile

Asp

Phe

Tyr 1115

Arg

Glu

Leu

Asp

Leu 1120

Leu

Gly

Tyr

Asp

Tyr 1125

Ser

Lys

Asp

Phe

Arg 1130

Arg

Leu

Gin

Thr

Met 1135

Arg

Ala

Asp

Ser 1140

Lys

Ala

Ser

Gly

Thr 1145

Leu

Ala

Phe

Leu

Pro 1150

Leu

Lys

Asp

Glu

Leu 1155

Arg

Asn

Glu

Pro

Leu 1160

Leu

His

Pro

Ala 1165

Pro

Leu

Asp

Ile

Ala 1170

Phe

Gin

Thr

Val

Ile 1175

Gly

Ala

Tyr

Ser

Ser 1180

Pro

Gly

Asp

Arg

Arg 1185

Leu

Arg

Ser

Leu

Tyr 1190

Val

Pro

Thr

His

Val 1195

Asp

Arg

Val

Thr

Leu 1200

Ile

Pro

Ser

Leu

Cys 1205

Ile

Ser

Ala

Gly

Asn 1210

Ser

Gly

Glu

Thr

Glu 1215

Leu

Ala

Phe

PL 202 457 B1

Asp

Thr 1220

Ile

Asn

Thr

His

Asp 1225

Lys

Gly

Asp

Phe

Leu 1230

Ser

Gly

Asp

Ile

Thr 1235

Val

Tyr

Asp

Ser

Thr 1240

Lys

Thr

Leu

Phe 1245

Gin

Val

Asp

Asn

Ile 1250

Val

Phe

Lys

Pro

Phe 1255

Ser

Pro

Thr

Ala 1260

Ser

Thr

Asp

Hi s

Arg 1265

Ile

Phe

Ala

Lys

Trp 1270

val

Trp

Gly

Pro

Leu 1275

Thr

Pro

Glu

Lys

Leu 1280

Leu

Glu

Asp

Pro

Ala 1285

Thr

Leu

Ile

Ala 1290

Arg

Asp

Lys

Glu

Asp 1295

Ile

Leu

Thr

Ile

Glu 1300

Arg

Ile

Val

Tyr

Phe 1305

Tyr

Ile

Lys

Ser

Phe 1310

Leu

Ala

Gin

Ile

Thr 1315

Pro

Asp

Arg

Gin 1320

Asn

Ala

Asp

Leu

His 1325

Ser

Gin

Lys

Tyr

Ile 1330

Glu

Trp

Cys

Asp

Gin 1335

Val

Gin

Ala

Asp

Ala 1340

Arg

Ala

Gly

His

His 1345

Gin

Trp

Tyr

Gin

Glu 1350

Ser

Trp

Glu

Asp 1355

Thr

Ser

Val

His

Ile 1360

Glu

Gin

Met

Cys

Glu 1365

Ser

Asn

Ser

His 1370

Pro

His

Val

Arg

Leu 1375

Ile

Gin

Arg

Val

Gly 1380

Lys

Glu

Leu

Ile

Ser 1385

Ile

Val

Arg

Gly

Asn 1390

Gly

Asp

Pro

Leu

Asp 1395

Ile

Met

Asn

Arg

Asp 1400

Gly

Leu

Phe

Thr

Glu 1405

Tyr

Thr

Asn

Lys 1410

Leu

Ala

Phe

Gly

Ser 1415

Ala

Ile

His

Val

Val 1420

Gin

Asp

Leu

val

Ser 1425

Gin

Ile

Ala

His

Arg 1430

Tyr

Gin

Ser

Ile

Asp 1435

Ile

Leu

Glu

Ile

Gly 1440

Leu

Gly

Thr

Gly

Ile 1445

Ala

Thr

Lys

Arg

Val 1450

Leu

Ala

Ser

Pro

Gin 1455

Leu

Gly

Phe

Asn

Ser 1460

Tyr

Thr

Cys

Thr

Asp 1465

Ile

Ser

Ala

Asp

Val 1470

Ile

Gly

Lys

Ala

Arg 1475

Glu

Gin

Leu

Ser

Glu 1480

Phe

Asp

Gly

Leu

Met 1485

Gin

Phe

Glu

PL 202 457 B1

Ala

Leu 1490

Asp

Ile

Asn

Arg

Ser 1495

Pro

Ala

Glu

Gin

Gly 1500

Phe

Lys

Pro

His

Ser 1505

Tyr

Asp

Leu

Ile

Ile 1510

Ala

Ser

Asp

Val

Leu 1515

His

Ala

Ser

Asn 1520

Phe

Glu

Lys

Leu 1525

Ala

His

Ile

Arg

Ser 1530

Leu

Lys

Pro

Gly 1535

Gly

His

Leu

Val

Thr 1540

Phe

Gly

Val

Thr

His 1545

Arg

Glu

Pro

Ala

Arg 1550

Leu

Ala

Phe

Ile

Ser 1555

Gly

Leu

Phe

Ala

Asp 1560

Arg

Trp

Thr

Gly

Glu 1565

Asp

Glu

Thr

Arg

Ala 1570

Leu

Ser

Ala

Ser

Gly 1575

Ser

Val

Asp

Gin

Trp 1580

Glu

His

Thr

Leu

Lys 1585

Arg

Val

Gly

Phe

Ser 1590

Gly

Val

Asp

Ser

Arg 1595

Thr

Leu

Asp

Arg

Glu 1600

Asp

Leu

Ile

Pro 1605

Ser

Val

Phe

Ser

Thr 1510

His

Ala

Val

Asp

Ala 1615

Thr

Val

Glu

Arg

Leu 1620

Tyr

Asp

Pro

Leu

Ser 1625

Ala

Pro

Leu

Lys

Asp 1630

Ser

Tyr

Pro

Leu 1635

Val

Ile

Gly

Gly 1640

Glu

Ser

Thr

Lys

Thr 1645

Glu

Arg

Ile

Leu

Asn 1650

Asp

Met

Lys

Aia

Ala 1655

Leu

Pro

His

Arg

His 1660

Ile

His

Ser

Val

Lys 1665

Arg

Leu

Glu

Ser

Val 1670

Leu

Asp

Pro

Ala 1675

Leu

Gin

Pro

Lys

Ser 1680

Thr

Phe

Val

Ile

Leu 1685

Ser

Glu

Leu

Asp

Asp 1690

Glu

Val

Phe

Cys

Asn 1695

Leu

Glu

Asp

Lys 1700

Phe

Glu

Ala

Val

Lys 1705

Ser

Leu

Phe

Tyr 1710

Ala

Gly

Arg

Met

Met 1715

Trp

Leu

Thr

Glu

Asn 1720

Ala

Trp

Ile

Asp

His 1725

Pro

His

Gin

Ala

Ser 1730

Thr

Ile

Gly

Met

Leu 1735

Arg

Thr

Ile

Lys

Leu 1740

Glu

Asn

Pro

Asp

Leu 1745

Gly

Thr

His

Val

Phe 1750

Asp

Val

Asp

Thr

Val 1755

Glu

Asn

Leu

PL 202 457 B1

Asp Thr Lys 1760

Asp Asp Gin 1775

Val Tyr Trp 1790

Asp Ile Ala 1805

Phe Gly Asn 1820

Ala Arg Gly 1835

Thr Cys Asp 1850

Val Arg Val 1865

Leu Gly Tyr 18 80

Cys Glu Val 1895

Leu His Val 1910

Ala Glu Gly 1925

Leu Leu Ala 1940

Asp Ala Ser 1955

Ala Ile Leu 1970

Ala Thr Thr 1985

Arg Leu His 2000

Pro Thr Asn 2015

Phe

Leu

Cys

Arg

Phe

Ala

Ser

Arg

Phe

Pro

Glu

Ile

Glu

Leu

Ala

Met

Phe

Leu

Lys

Asn

Ser

Leu

Tyr

His

Val

Arg

Asp

Thr

Leu

Ser

Lys

Met

Val

Glu

Gly

Asp

Ser

Glu

Ala

Val

Asn

Ser

Ile

Ala

Asp

Glu

Ala

Glu Gin Leu Leu 1765

Ser ile Thr Trp 1780

Arg Ala Trp Val 1795

Arg Met Asn Ser 1810

Ser Lys Thr Ala 1825

Ser Met Tyr Tyr 1840

Asp Ala Arg His 1855

Leu Pro Gin Ala 1870

Val Gin Gly Ser 1885

Ala Leu Ala Glu 1900

Tyr Met His Ser 1915

Ser Phe Leu Leu 1930

Leu Ser Ser Ala 1945

Met Glu Pro Pro 1960

Lys Thr Tyr Gly 1975

Val Lys Thr Ile 1990

Thr Asp Ala Arg 2005

Phe Phe Asp Leu 2020

Arg Phe Glu Glu Ser 1770

Thr His Glu Pro Glu 1785

Pro Arg Leu Lys Gin 1800

Ser Arg Arg Pro Ile 1815

Ile Ala Leu Lys Glu 1830

Leu Glu Ser Thr Glu 1845

Ala Gly Lys Ala Thr 1860

Ile Arg Val Gly His 1875 ile Leu Glu Asn Thr 1890

Lys Asn Gly Ser Ile 1905

Leu Pro Asp Asn Met 1920

Ser Thr Ala Ala Ala 1935

Gin Ser Phe Gly Ser 1950

Ile Phe Cys Val Lys 1965

Val Gin Val His Leu 1980

Pro Ala Pro Trp Ile 1995

Leu Lys His Ser Leu 2010

Ser Thr Asp Arg Thr 2025

PL 202 457 B1

Ala

Ala 2030

Gly

Ile

Thr

Asn

Arg 2035

Leu

Ala

Lys

Leu

Leu 2040

Pro

Ser

Cys

Phe 2045

Met

Tyr

Ser

Gly

Asp 2050

Tyr

Leu

Ile

Arg

Ser 2055

Thr

Ala

Ser

Thr

Tyr 2060

Lys

val

Ser

His

Val 2065

Glu

Asp

Ile

Pro

Ile 2070

Leu

Glu

His

Ser

Val 2075

Ala

Met

Ala

Lys

Asn 2080

Thr

Val

Ser

Ala

Ser 2085

Thr

Val

Asp

Thr 2090

Glu

Lys

Val

Ile

Thr 2095

Ala

Thr

Gin

Ile

Leu 2100

Leu

Pro

Gly

Gin

Leu 2105

Ser

Val

Asn

His

Asn 2110

Asp

Gin

Arg

Phe

Asn 2115

Leu

Ala

Thr

Val

Tle 2120

Asp

Trp

Lys

Glu

Asn 2125

Glu

Val

Ser

Ala

Arg 2130

Ile

Cys

Pro

Ile

Asp 2135

Ser

Gly

Asn

Leu

Phe 2140

Ser

Asn

Lys

Thr 2145

Tyr

Leu

fal

Gly 2150

Leu

Thr

Gly

Asp

Leu 2155

Gly

Arg

Ser

Leu

Cys 2160

Arg

Trp

Met

Ile

Leu 2165

His

Gly

Ala

Arg

His 2170

val

Val

Leu

Thr

Ser 2175

Arg

Asn

Pro

Arg

Leu 2180

Asp

Pro

Lys

Trp

Ile 2185

Ala

Asn

Met

Glu

Ala 2190

Leu

Gly

Asp

ile 2195

Thr

val

Leu

Ser

Met 2200

Asp

Val

Ala

Asn

Glu 2205

Asp

Ser

Val

Asp

Ala 2210

Gly

Leu

Gly

Lys

Leu 2215

Val

Asp

Met

Lys

Leu 2220

Pro

Val

Ala

Gly 2225

I le

Ala

Phe

Gly

Pro 2230

Leu

Val

Leu

Gin

Asp 2235

Val

Met

Leu

Lys

Asn 2240

Met

Asp

His

Gin

Met 2245

Met

Asp

Met

val

Leu 2250

Lys

Pro

Lys

Val

Gin 2255

Gly

Ala

Arg

Ile

Leu 2260

His

Glu

Arg

Phe

Ser 2265

Glu

Gin

Thr

Gly

Ser 2270

Lys

Ala

Leu

Asp

Phe 2275

Phe

Ile

Met

phe

Ser 2280

Ser

Ile

Val

Ala

Val 2285

Ile

Gly

Asn

Pro

Gly 2290

Gin

Ser

Asn

Tyr

Gly 2295

Ala

Asn

PL 202 457 B1

Ala Tyr Leu Gin Ala Leu Ala Gin Gin Arg Cys Ala Arg Gly Leu 2300 2305 2310

Ala Gly Ser Thr Ile Asp Ile Gly Ala Val Tyr Gly Val Gly Phe 2315 2320 2325 tal Thr Arg Ala Glu Met Glu Glu Asp Phe Asp Ala Ile Arg Phe 2330 2335 2340

Met Phe Asp Ser val Glu Glu His Glu Leu His Thr Leu Phe Ala 2345 2350 2355

Glu Ala Val Val Ser Asp Gin Arg Ala Arg Gin Gin Pro Gin Arg 2360 2365 2370

Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu Thr Thr Gly Ile 2375 2380 2385

Pro Asp Leu Asp Pro Ala Leu Gin Asp Arg Ile Ile Tyr Phe Asn 2390 2395 2400

Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gin Arg Gly Asp 2405 2410 2415

Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp Gin 2420 2425 2430

Leu Lys Gin Ala Thr Thr Leu Asp Gin Val Arg Gin Ile Val Ile 2435 2440 2445

Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gin Val Ser Asp 2450 2455 2460

Gly Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gin Gly Val 2465 2470 2475

Asp Ser Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gin 2480 2485 2490

Leu Tyr Leu Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser 2495 2500 2505

Val Ala Asp Leu Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr 2510 2515 2520

Ser Ile Pro Leu Leu Leu Gin Ile Gly Asp Ser Thr Gly Thr Ser 2525 2530 2535

Asp Ser Gly Ala Ser Pro Thr Pro Thr Asp Ser His Asp Glu Ala 2540 2545 2550

Ser Ser Ala Thr Ser Thr Asp Ala Ser Ser Ala Glu Glu Asp Glu 2555 2560 2565

PL 202 457 B1

Glu Glu 2570

Glu

Asp

Asn Glu 2575

Gin i

Gly i

Gly ;

Arg

Lys 2580

Ile

Leu .

Arg

Arg Glu 2 58 5

Arg

Leu

Ser

Leu Gly 2590

Gin

Glu

Tyr

Ser

Trp 2595

Arg

Gin

Gin Met 2600

Val

Lys

Asp

His Thr 2605

Ile

Phe

Asn

Thr 2610

Ile

Gly

Met

Phe Met 2615

Lys

Gly

Thr

Ile Asp 2620

Leu

Asp

Arg

Leu

Arg 2625

Arg

Ala

Leu

Lys Ala 2630

Ser

Leu

Arg

Arg His 2635

Glu

Ile

Phe

Arg

Thr 2640

Cys

Phe

Val

Thr Gly 2645

Asp

Tyr

Ser Ser 2650

Aap

Leu

Asn

Gly

Pro 2655

val

Gin

Val

Val Leu 2660

Lys

Asn

Pro

Glu Asn 2665

Arg

Val

His

Phe

Val 2670

Gin

Val

Asn

Ssn Ala 2575

Ala

Glu

Ala

Glu Glu 2680

Glu

Tyr

Arg

Lys

Leu 2685

Glu

Lys

Thr

Asn Tyr 2690

Ser

Ile

Ser

Thr Gly 2695

Asp

Thr

Leu

Arg

Leu 2700

Val

Asp

Phe

Tyr Trp 2705

Gly

Thr

Asp

Asp His 2710

Leu

Val

Ile

Gly 2715

Tyr

His

Arg

Leu Val 2720

Gly

Asp

Gly

Ser Thr 2725

Thr

Glu

Asn

Leu

Phe 2730

Asn

Glu

Ile

Gly Gin 2735

Ile

Tyr

Ser

Gly Val 2740

Lys

Met

Gin

Arg

Pro 2745

Ser

Thr

Gin

Phe Ser 2750

Asp

Leu

Ala

Val Gin 2755

Gin

Arg

Glu

Asn

Leu 2760

Glu

Asn

Gly

Arg Met 2765

Gly

Asp

ASp

Ile Ala 2770

Phe

Trp

Lys

Ser

Met 2775

His

Ser

Lys

Val Ser 2780

Ser

Ala

Pro Thr 2 7SS

Val

Leu

Pro

Ile

Met 2790

Asn

Leu

Ile

Asn Asp 2795

Pro

Ala

Asn Ser 2Θ00

Glu

Gin

Ile 2805

Gin

Pro

Phe

Thr Trp 2310

Gin

Tyr

Glu Ala 2815

Ile

Ala

Arg

Leu

, Asp 2820

Pro

Met

val

Ala Phe 2825

Arg

Ile

Lys

Glu Arg 2830

Ser

Arg

; Lys

His

i Lys 2835

Ala

Thr

Pro

PL 202 457 B1

100

PL 202 457 B1

gca Ala

acc Thr

gca Ala

atg Met 20

gca Ala

ggc Gly

teg Ser

gct Ala

tgc Cys 25

tct Ser

aac Asn

aca Thr

tcc Ser

acg Thr 30

ccc Pro

att Ile

95

gcc

ata

gtt

gga

atg

gga

tgt

ega

ttt

gct

gga

gat

gca

acg

agt

cca

144

Ala

Ile

Val

Gly

Met

Gly

Cys

Arg

Phe

Ala

Gly

Asp

Ala

Thr

Ser

Pro

35

40

45

cag

aag

ctt

tgg

gaa

atg

gtt

gaa

aga

gga

ggc

agt

gcc

tgg

tct

aag

192

Gin

Lys

Leu

Trp

Glu

Met

Val

Glu

Arg

Gly

Ser

Ala

Trp

Ser

Lys

50

55

60

gtc

ccc

tcc

teg

ega

ttc

aat

gtg

aga

gga

gta

tac

cac

ccg

aat

ggc

240

Val

Pro

Ser

Arg

Phe

Asn

Val

Arg

Gly

Val

Tyr

His

Pro

Asn

Gly

55

70

75

80

gaa

agg

gtc

ggg

tcc

acc

cac

gta

aaq

ggt

gga

cac

ttc

atc

gac

gag

288

Glu

Arg

Val

Gly

Ser

Thr

His

Val

Lys

Gly

His

Phe

Ile

Asp

Glu

85

90

95

gat

cct

gct

tta

ttt

gac

g=c

gcg

ttc

aac

atg

acc

aca

gag

gtc

33S

Asp

Pro

Ala

Leu

Phe

Asp

Ala

Phe

Asn

Met

Thr

Glu

Val

100

105

110

gcc

agc

tgc

atg

gat

ccg

cag

tat

cgg

ctt

atg

ctt

gag

gtg

gtc

tac

3 84

Ala

Ser

Cys

Met

Asp

Pro

Gin

Tyr

Arg

Leu

Met

Leu

Glu

Val

Tyr

115

120

125

gaa

teg

ctg

gag

agt

gcc

ggt

atc

acc

atc

gat

ggt

atg

gca

ggc

tct

432

Glu

Ser

Leu

Glu

Ser

Ala

Gly

Ile

Thr

Ile

Asp

Gly

Met

Ala

Gly

Ser

130

135

14 0

aat

acg

teg

gtg

ttt

ggg

ggt

gtc

atg

tac

cac

gac

tat

cag

gat

teg

480

Asn

Thr

Ser

Val

Phe

Gly

Val

Met

Tyr

His

Asp

Tyr

Gin

Asp

Ser

14 5

150

155

160

ctc

aat

cgt

gac

ccc

gag

aca

gtt

ccg

cgt

tat

ttc

ata

act

ggc

aac

528

Leu

Asn

Arg

Asp

Pro

Glu

Thr

Val

Pro

Arg

Tyr

Phe

Ile

Thr

Gly

Asn

165

170

175

tea

gga

aca

atg

Ctt

teg

aac

cgg

ata

tea

cac

ttc

tac

gac

tta

cgt

576

Ser

Gly

Thr

Met

Leu

Ser

Asn

Arg

Ile

Ser

His

Phe

Tyr

Asp

Leu

Arg

ISO

185

190

ggt

ccc

agc

gtg

acg

gtt

gac

acg

gcc

tgt

teg

acg

aca

ttg

acc

gca

624

Gly

Pro

Ser

Val

Thr

Val

Asp

Thr

Ala

Cys

Ser

Thr

Leu

Thr

Ala

195

200

205

ctg

cac

ttg

gcg

tgc

cag

agc

tta

cgt

act

ggg

gag

tea

gat

aca

gcc

672

Leu

His

Leu

Ala

Cys

Gin

Ser

Leu

Arg

Thr

Gly

Glu

Ser

Asp

Thr

Ala

2 10

215

220

PL 202 457 B1

101

atc Ile 225

gtt Val

atc Ile

ggt Gly

gca Ala

aat Asn 230

Ctt Leu

ctg Leu

ctc Leu

aat Asn

ccc Pro 235

gat Asp

gtt Val

ttt Phe

gtt Val

acg Thr 240

720

atg

tea

aac

ctg

gga

ttt

ttg

tcc

ccg

gat

ggt

atc

teg

tac

tct

ttt

7S8

Met

Ser

Asn

Leu

Gly

Phe

Leu

Ser

Pro

Asp

Gly

Ile

Ser

Tyr

Ser

Phe

245

250

255

gat

cct

ega

gcg

aat

gga

tat

ggt

cgc

ggg

gaa

gga

att

gcc

get

ctg

816

Asp

Pro

Arg

Ala

Asn

Gly

Tyr

Gly

Arg

Gly

Glu

Gly

Ile

Ala

Leu

260

265

270

gta

ata

aag

gcc

ctc

cct

aac

gcg

ttg

ega

gac

caa

gac

cct

atc

ega

864

Val

Ile

Lys

Ala

Leu

Pro

Asn

Ala

Leu

Arg

Asp

Gin

Asp

Pro

Ile

Arg

275

280

285

gcc

gtc

att

ega

gag

aca

gcg

ctg

aac

cag

gat

ggc

aaa

aca

ccc

gca

912

Ala

Val

Ile

Arg

Glu

Thr

Ala

Leu

Asn

Gin

Asp

Gly

Lys

Thr

Pro

Ala

290

295

300

att

act

gcg

ccg

agt

gat

gtg

gcg

cag

aaa

agt

ctg

atc

cag

gag

tgt

9S0

Ile

Thr

Ala

Pro

Ser

Asp

Val

Ala

Gin

Lys

Ser

Leu

Ile

Gin

Glu

Cys

305

310

315

320

tac

gat

aag

get

ggg

eta

gat

atg

teg

ttg

acc

teg

tac

gtg

gag

gcc

1008

Tyr

Asp

Lys

Ala

Gly

Leu

Asp

Met

Ser

Leu

Thr

Ser

Tyr

Val

Glu

Ala

325

330

335

cac

gga

act

gga

aca

cca

act

ggt

gac

ccc

ctt

gaa

atc

tea

gca

att

1056

Hi s

Gly

Thr

Gly

Thr

Pro

Thr

Gly

Asp

Pro

Leu

Glu

Ile

Ser

Ala

Ile

340

345

350

tea

gca

get

ttt

aaa

gga

cat

cct

ctg

cac

ctt

ggc

tct

gtg

aaa

gca

1104

Ser

Ala

Phe

Lys

Gly

His

Pro

Leu

His

Leu

Gly

Ser

Val

Lys

Ala

355

360

365

aat

att

ggc

cat

aca

gaa

gcc

agt

ggc

ctg

gcc

agt

ata

atc

aag

1152

Asn

Ile

Gly

His

Thr

Glu

Ala

Ser

Gly

Leu

Ala

Ser

I le

Ile

Lys

370

375

380

gtg

gcc

ttg

gcc

ttg

gag

aag

ggc

ttg

att

ccc

cct

aat

gcg

cgg

ttc

1200

Val

Ala

Leu

Ala

Leu

Glu

Lys

Gly

Leu

Ile

Pro

Asn

Ala

Arg

Phe

385

390

395

400

ctg

caa

aag

aac

agc

aag

ctg

atg

ctt

gac

caa

aag

aac

atc

aag

atc

1248

Leu

Gin

Lys

Asn

Ser

Lys

Leu

Met

Leu

Asp

Gin

Lys

Asn

Ile

Lys

Ile

405

410

415

ccc

atg

tct

get

caa

gac

tgg

cct

gtg

aaa

gat

ggg

act

cgt

cgc

gca

1296

Pro

Met

Ser

Ala

Gin

Asp

Trp

Pro

Val

Lys

Asp

Gly

Thr

Arg

Ala

420

425

430

102

PL 202 457 B1

tct Ser

gtc Val

aat Asn 435

aac Asn

ttc Phe

ggc Gly

ttt Phe

ggt Gly 440

ggt Gly

tcg Ser

aat Asn

gct Ala

cac His 445

gtc Val

att Ile

ttg Leu

1344

gaa

tca

tat

gat

cgc

gca

tca

ttg

gcc

ctg

cca

gag

gat

caa

gtg

cat

1392

Glu

Ser

Tyr

Asp

Arg

Ala

Ser

Leu

Ala

Leu

Pro

Glu

Asp

Gin

Val

His

450

455

460

gtc

aat

ggt

aac

tct

gag

cat

ggt

agg

gtt

gag

gat

ggt

tcc

aaa

cag

1440

Val

Asn

Gly

Asn

Ser

Glu

His

Gly

Arg

Val

Glu

Asp

Gly

Ser

Lys

Gin

465

470

475

480

agc

cgc

ata

tac

gtt

gtg

cgt

gcc

aag

gac

gag

caa

gct

tgt

cgg

ega

1488

Ser

Arg

Ile

Tyr

Val

Arg

Ala

Lys

Asp

Glu

Gin

Ala

Cys

Arg

485

490

495

acg

ata

gca

agc

ctg

ega

gac

tac

att

aaa

tcc

gtc

gct

gac

att

gac

1536

Thr

Ile

Ala

Ser

Leu

Arg

Asp

Tyr

Ile

Lys

Ser

Val

Ala

Asp

Ile

Asp

500

505

510

ggg

gaa

ccc

ttc

ctc

gcc

agc

ctc

gcc

tat

aca

eta

ggc

tct

cgc

cgt

1584

Gly

Glu

Pro

Phe

Leu

Ala

Ser

Leu

Ala

Tyr

Thr

Leu

Gly

Ser

Arg

515

520

525

tcc

att

ctg

cca

tgg

acg

tca

gtg

tat

gta

gca

gac

agc

ctt

ggc

1632

Ser

Ile

Leu

Pro

Trp

Thr

Ser

Val

Tyr

Val

Ala

Asp

Ser

Leu

Gly

530

535

540

ctt

gtt

tct

gcc

ctc

agc

gat

gag

tcc

aat

caa

cca

aaa

ega

gcg

aat

1680

Leu

Val

Ser

Ala

Leu

Ser

Asp

Glu

Ser

Asn

Gin

Pro

Lys

Arg

Ala

Asn

545

550

555

560

gag

aaa

gta

cgg

ctc

gga

ttt

gta

ttc

acc

ggt

cag

ggg

gcg

cag

tgg

1728

Glu

Lys

Val

Arg

Leu

Gly

Phe

Val

Phe

Thr

Gly

Gin

Gly

Ala

Gin

Trp

565

570

575

cat

gca

atg

ggc

aga

gag

ctg

gtc

aat

aca

ttc

cca

gta

ttc

aaa

cag

1776

His

Ala

Met

Gly

Arg

Glu

Leu

Val

Asn

Thr

Phe

Pro

Val

Phe

Lys

Gin

580

585

590

gcg

att

ctt

gaa

tgt

gat

ggc

tac

atc

aag

caa

ctg

ggc

gcg

agt

tgg

1824

Ala

Ile

Leu

Glu

Cys

Asp

Gly

Tyr

Ile

Lys

Gin

Leu

Gly

Ala

Ser

Trp

595

600

605

aat

ttt

atg

gag

ctc

cac

cgt

gat

gag

ctg

acg

act

cgg

gta

aat

1872

Asn

Phe

Met

Glu

Leu

His

Arg

Asp

Glu

Leu

Thr

Arg

Val

Asn

610

615

620

gat

gcc

gaa

tac

agt

eta

cca

ctg

tca

acc

gct

atc

caa

att

gca

ctt

1920

Asp

Ala

Glu

Tyr

Ser

Leu

Pro

Leu

Ser

Thr

Ala

Ile

Gin

Ile

Ala

Leu

625

S30

635

640

PL 202 457 B1

103

gtg Val

cgt Arg

ctc Leu

Ctt Leu

tgg Trp 645

tca Ser

tgg Trp

gga Gly

att Ile

cgg Arg 650

cca Pro

acg Thr

ggg Gly

ata Ile

acc Thr 655

agt Ser

1968

cac

tca

agt

gga

gag

gct

gcc

tac

gca

gct

ggg

gct

tta

tcc

2016

His

Ser

Gly

Glu

Ala

Tyr

Ala

Gly

Ala

Leu

Ser

660

665

670

gcg

cgg

teg

gcc

att

ggg

atc

act

tat

ata

cgc

ggt

gta

ttg

acc

act

2064

Ala

Arg

Ser

Ala

Ile

Gly

Ile

Thr

Tyr

Ile

Arg

Gly

Val

Leu

Thr

675

680

685

aag

ccc

aag

ccc

gca

ttg

gca

gcc

aaa

gga

atg

gcg

gtg

ggt

2112

Lys

Pro

Lys

Pro

Ala

Leu

Ala

Lys

Gly

Met

Ala

Val

Gly

690

695

700

ctt

ggt

cgc

agt

gag

acc

aat

gtt

tac

att

teg

cgt

ctc

aac

cag

gag

2160

Leu

Gly

Arg

Ser

Glu

Thr

Asn

Val

Tyr

ile

Ser

Arg

Leu

Asn

Gin

Glu

705

710

715

720

gac

ggc

tgt

gtg

gtt

gga

tgt

atc

aac

agt

caa

tgt

agt

gtg

acg

2208

Asp

Gly

Cys

Val

Gly

Cys

Ile

Asn

Ser

Gin

Cys

Ser

Val

Thr

725

730

735

gtg

teg

gga

gat

ttg

ggt

gca

atc

gag

aaa

ctt

gaa

aag

ttg

tta

cac

2256

Val

Ser

Gly

Asp

Leu

Gly

Ala

Ile

Glu

Lys

Leu

Glu

Lys

Leu

His

740

745

750

gcc

gat

ggc

atc

ttt

acc

agg

aaa

ctg

aaa

gtc

act

gaa

gcc

ttc

cat

2304

Ala

Asp

Gly

Ile

Phe

Thr

Arg

Lys

Leu

Lys

Val

Thr

Glu

Ala

Phe

His

755

760

765

tca

agc

cac

atg

ega

cca

atg

gca

gat

gcc

ttt

ggg

gcg

tca

ctg

aga

2352

Ser

His

Met

Arg

Pro

Met

Ala

Asp

Ala

Phe

Gly

Ala

Ser

Leu

Arg

770

775

780

gat

ctg

ttc

aac

teg

gat

aac

gac

aat

ccc

aat

gct

gac

acc

2400

Asp

Leu

Phe

Asn

Ser

Asp

Asn

Asp

Asn

Pro

Asn

Ala

Asp

Thr

785

790

795

800

tca

aag

ggt

gta

tta

tat

tca

cct

aag

act

ggt

agt

cgc

atg

acc

2448

Ser

Lys

Gly

Val

Leu

Tyr

Ser

Pro

Lys

Thr

Gly

Ser

Arg

Met

Thr

805

810

815

gat

ctt

aaa

ttg

cta

ttg

gat

ccc

aca

cac

tgg

atg

gat

agt

atg

cta

2496

Asp

Leu

Lys

Leu

Asp

Pro

Thr

His

Trp

Met

Asp

Ser

Met

Leu

820

825

830

cag

ccg

gta

gag

ttc

gag

tcc

tca

ctc

cgc

gag

atg

tgc

ttt

gat

ccc

2544

Gin

Pro

Val

Glu

Phe

Glu

Ser

Leu

Arg

Glu

Met

Cys

Phe

Asp

Pro

835

840

845

104

PL 202 457 B1

aac Asn

acc Thr 850

aaa gag Lys Glu

aaa Lys

gcc Ala

gtc Val 855

gat Asp

gtg Val

att Ile

gaa Glu 860

ata Ile

ggg Gly

cct Pro

cac His

2592

gga

gcg

ctt ggt

ggt

cca

atc

aac

caa

gtc

atg

cag

gat

ctg

ggt

ctg

2640

Gly

Ala

Leu Gly

Gly

Pro

Ile

Asn

Gin

Val

Met

Gin

Asp

Leu

Gly

Leu

865

870

875

880

aaa

gga

aca gat

ata

aac

tat

ctc

agt

tgc

Ctt

tct

cgc

ggc

aga

age

2688

Lys

Gly

Thr Asp

Ile

Asn

Tyr

Leu

Ser

Cys

Leu

Ser

Arg

Gly

Arg

Ser

885

890

895

teg

ttg

gag aca

atg

tat

cgt

gct

acg

gag

ttg

ata

age

aag

ggt

2736

Ser

Leu

Glu Thr

Met

Tyr

Arg

Ala

Thr

Glu

Leu

Ile

Ser

Lys

Gly

900

905

910

tat

ggg

ctc aaa

atg

gac

gct

ata

aac

ttt

cct

cat

gga

aga

aaa

gag

2784

Tyr

Gly

Leu Lys

Met

Asp

Ala

Ile

Asn

Phe

Pro

His

Gly

Arg

Lys

Glu

915

920

925

ccc

aga

gtg aag

gta

ctg

age

gat

ttg

ccg

gcg

tac

ccg

tgg

aat

cac

2832

Pro

Arg

val Lys

Val

Leu

Ser

Asp

Leu

Pro

Ala

Tyr

Pro

Trp

Asn

His

930

935

940

caa

acc

cgt tat

tgg

aga

gag

cct

cgc

ggc

agt

cgt

gag

tcc

aaa

cag

2880

Gin

Thr

Arg Tyr

Trp

Arg

Glu

Pro

Arg

Gly

Ser

Arg

Glu

Ser

Lys

Gin

945

950

955

960

aga

acc

cat ccg

cct

cac

act

ttg

ata

ggc

tea

cgg

gaa

tct

ctc

tct

2928

Arg

Thr

Hi s Pro

Pro

His

Thr

Leu

Ile

Gly

Ser

Arg

Glu

Ser

Leu

Ser

965

970

975

cct

cat

ttc gcg

cct

aaa

tgg

aaa

cat

gtt

ctc

cgt

ctg

tea

gat

att

2976

Pro

His

Phe Ala

Pro

Lys

Trp

Lys

His

Val

Leu

Arg

Leu

Ser

Asp

Ile

980

985

990

cca

tgg

ata ega

gat

cac

gtc

gtt

ggt teg age atc atc ttt ccg gga

3024

Pro

Trp

Ile Arg

Asp

His

Val

Gly Ser Ser Ile Ile Phe Pro Gly

995

1000

1005

gct

ggc

ttc atc age atg gcc atc gag ggg ttt tea

caa ,

gtc

tgc

3069

Ala

Gly

Phe Ile Ser Met Ala Ile Glu Gly Phe Ser i

Gin '

fal

Cys

1010

1015

1020

cca

gtt gcg ggg gct

: age atc aac tac aac ttg

cgt '

gac

gtt

3114

Pro

Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu .

Arg .

Asp

Val

1025

1030

1035

gaa

ctc

gcg cag gct ctc ata ata ccc gct gat gca

gaa '

gca

gag

3159

Glu

Leu

Ala Gin Ala Leu Ile Ile Pro Ala Asp Ala

Glu .

Ala

Glu

1040

1045

1050

PL 202 457 B1

105

gtt Val

gac Asp 1055

ctg Leu

cgc Arg

eta Leu

acg Thr

atc Ile 1060

cgt Arg

tca Ser

tgt Cys

gag Glu

gaa Glu 1065

agg Arg

tcc Ser

ctc Leu

3204

ggc

aca

aag

aac

tgg

cat

caa

ttt

tet

gtg

cac

tca

att

teg

ggc

3249

Gly

Thr 1070

Lys

Asn

Trp

His

Gin 1075

Phe

Ser

val

His

Ser 1080

Ile

Ser

Gly

gaa

aat

acc

tgg

aca

gaa

cac

tgc

acc

gga

tta

ata

cgt

teg

3294

Glu

Asn 1085

Asn

Thr

Trp

Thr

Glu 1090

His

Cys

Thr

Gly

Leu 1095

Ile

Arg

Ser

gag

agc

gaa

aga

agc

cac

ctt

gac

tgt

tca

act

gtg

gaa

gcc

tca

3339

Glu

Ser 1100

Glu

Arg

Ser

His

Leu 1105

Asp

Cys

Ser

Thr

Val 1110

Glu

Ala

Ser

cgc

agg

ttg

aat

eta

ggc

tca

gat

aac

cgg

agc

att

gat

ccc

aac

3384

Arg

Arg 1115

Leu

Asn

Leu

Gly

Ser 1120

Asp

Asn

Arg

Ser

Ile 1125

Asp

Pro

Asn

gat

ctc

tgg

gag

tcc

tta

cac

gcg

aat

ggg

ata

tgc

cac

gga

ccc

3429

Asp

Leu 1130

Trp

Glu

Ser

Leu

His 1135

Ala

Asn

Gly

Ile

Cys 114 0

His

Gly

Pro

att

ttt

cag

aac

att

cag

ega

att

caa

aac

aat

gga

cag

ggc

teg

3474

Ile

Phe 1145

Gin

Asn

Ile

Gin

Arg 1150

Ile

Gin

Asn

Gly 1155

Gin

Gly

Ser

ttt

tgc

aga

ttt

tcc

att

gct

gac

act

gcc

teg

gct

atg

cct

cac

3519

Phe

cys 1160

Arg

Phe

Ser

Ile

Ala 1165

Asp

Thr

Ala

Ser

Ala 1170

Met

Pro

Hi s

teg

tac

gag

aat

ega

cac

atc

gtc

cat

cct

act

ctg

gac

teg

3564

Ser

Tyr 1175

Glu

Asn

Arg

His

Ile 1180

val

His

Pro

Thr

Thr 1185

Leu

Asp

Ser

gtg

atc

cag

gcg

gca

tac

acg

gtg

tta

ccc

tac

gcg

gga

aca

cgt

3609

Val

ile 1190

Gin

Ala

Tyr

Thr 1195

Val

Leu

Pro

Tyr

Ala 1200

Gly

Thr

Arg

atg

aaa

acg

gcc

atg

gta

cca

agg

eta

aga

aat

gtc

cl <3. cl

ata

3654

Met

Lys 1205

Thr

Ala

Met

Val

Pro 1210

Arg

Leu

Arg

Asn 1215

Val

Lys

Ile

tcc

tet

agc

ctg

gct

gac

ttg

gag

gct

ggt

gat

gct

ctg

gac

gca

3699

Ser

Ser 1220

Ser

Leu

Ala

Asp

Leu 1225

Glu

Ala

Gly

Asp

Ala 1230

Leu

Asp

Ala

cag

gcc

agc

atc

aag

gat

cgc

aac

tet

caa

tcc

ttc

tet

acc

gac

3744

Gin

Ala 1235

Ser

Ile

Lys

Asp

Arg 1240

Asn

Ser

Gin

Ser

Phe 1245

Ser

Thr

Asp

106

PL 202 457 B1

ttg Leu

gca Ala 1250

gtg Val

ttt Phe

gat Asp

gac Asp

tat Tyr 1255

gat Asp

agc Ser

ggt Gly

tct Ser

tct Ser 1260

ccc Pro

teg Ser

gac Asp

3789

gga

atc

cca

gtc

ata

gag

att

gaa

ggc

ctt

gtt

ttc

cag

teg

gtt

3834

Gly

Ile 1265

Pro

Val

Ile

Glu

Ile 1270

Glu

Giy

Leu

Val

Phe 1275

Gin

Ser

Val

gga

agc

ttc

tct

gac

caa

aag

tea

gac

tcc

aac

gac

aca

gaa

3879

Gly

Ser 1280

Ser

Phe

Ser

Asp

Gin 1285

Lys

Ser

Asp

Ser

Asn 1290

Asp

Thr

Glu

aat

gcc

tgc

agc

tcc

tgg

gtt

tgg

gcc

cct

gac

atc

agc

ttg

ggt

3924

Asn

Ala 1295

Cys

Ser

Trp

Val 1300

Trp

Ala

Pro

Asp

Ile 1305

Ser

Leu

Gly

gac

tcc

act

tgg

ctc

aaa

gaa

aag

ttg

agc

act

gag

gct

gag

acg

3969

Asp

Ser 1310

Thr

Trp

Leu

Lys

Glu 1315

Lys

Leu

Ser

Thr

Glu 1320

Ala

Glu

Thr

aaa

gaa

acg

gaa

ctc

atg

gac

ctc

ega

aga

tgc

acg

atc

aac

4014

Lys

Glu 1325

Thr

Glu

Leu

Met

Met 1330

Asp

Leu

Arg

Cys 1335

Thr

Ile

Asn

ttt

ata

cag

gag

gct

gtc

act

gat

ttg

aca

aat

tct

gat

atc

caa

4059

Phe

Ile 1340

Gin

Glu

Ala

Val

Thr 1345

Asp

Leu

Thr

Asn

Ser 1350

Asp

Ile

Gin

cat

ctg

gat

ggc

cac

ctt

cag

aag

tat

ttc

gat

tgg

atg

aat

gtc

4104

His

Leu 1355

Asp

Gly

Hi s

Leu

Gin 1360

Lys

Tyr

Phe

Asp

Trp 1365

Met

Asn

Val

caa

ttg

gac

ctt

gcg

aga

caa

aac

aag

ctc

agc

cca

gcc

agt

tgc

4149

Gin

Leu 1370

Asp

Leu

Ala

Arg

Gin 1375

Asn

Lys

Leu

Ser

Pro 1380

Ala

Ser

cys

gac

tgg

eta

agt

gac

gat

gct

gag

cag

aag

aaa

tgc

eta

cag

gcc

4194

Asp

Trp 1385

Leu

Ser

Asp

Ala 1390

Glu

Gin

Lys

Cys 1395

Leu

Gin

Ala

aga

gtc

gct

gga

gaa

agc

gtc

aat

ggc

gag

atg

att

tct

cgt

eta

4239

Arg

Val 1400

Ala

Gly

Glu

Ser

Val 1405

Asn

Gly

Glu

Met

Ile 1410

Ser

Arg

Leu

gga

cct

cag

tta

ata

gca

atg

eta

cgc

gaa

aca

gag

cca

ctt

4284

Gly

Pro 1415

Gin

Leu

Ile

Ala

Met 1420

Leu

Arg

Glu

Thr 1425

Glu

Pro

Leu

gag

ttg

atg

caa

gat

cag

ctg

eta

agc

aga

tac

gtc

aac

4329

Glu

Leu 1430

Met

Gin

Asp

Gin 1435

Leu

Ser

Arg

Tyr 1440

Tyr

Val

Asn

PL 202 457 B1

107

gca. Ala

atc Ile 1445

aaa Lys

tgg Trp

agc Ser

ega Arg

tca Ser 1450

aac Asn

gca Ala

caa Gin

gcc Ala

agc Ser 1455

gag Glu

ctg Leu

atc Ile

4374

ega

ctt

tgc

gcc

cac

aag

aac

ccg

cgt

tct

cgc

att

ttg

gag

att

4419

Arg

Leu 1460

Cys

Ala

His

Lys

Asn 1465

Pro

Arg

Ser

Arg

Ile 1470

Leu

Glu

Ile

ggc

gga

ggc

acg

ggc

tgc

aca

aag

ctt

att

gtc

aat

gca

ttg

4464

Gly

Gly 1475

Gly

Thr

Gly

Cys 1430

Thr

Lys

Leu

Ile

Val 1485

Asn

Ala

Leu

gga

aac

acc

aag

ccg

atc

gat

cgt

tat

gac

ttc

acc

gat

gtg

tct

4509

Gly

Asn 1490

Thr

Lys

Pro

Ile

Asp 1495

Arg

Tyr

Asp

Phe

Thr 1500

Asp

Val

Ser

gcc

ggg

ttt

ttc

gag

tcg

gcg

cgt

gag

caa

ttt

gcg

gat

tgg

caa

4554

Ala

Gly 1505

Phe

Glu

Ser

Ala 1510

Arg

Glu

Gin

Phe

Ala 1515

Asp

Trp

Gin

gac

gtg

atg

act

ttc

aaa

ttg

gat

att

gaa

agc

gat

ccc

gag

4599

Asp

Val 1520

Met

Thr

Phe

Lys

Lys 1525

Leu

Asp

Ile

Glu

Ser 1530

Asp

Pro

Glu

caa

ggg

ttt

gaa

tgt

gcc

acc

tac

gat

gtg

gtc

gtg

gct

tgc

4644

Gin

Gin 1535

Gly

Phe

Glu

Cys

Ala 1540

Thr

Tyr

Asp

val

Val 1545

Val

Ala

Cys

cag

gtc

ctg

cat

gca

act

ega

tgc

atg

aaa

ega

aca

ctg

agt

aac

4689

Gin

Val 1550

Leu

His

Ala

Thr

Arg 1555

cys

Met

Lys

Arg

Thr 1560

Leu

Ser

Asn

gtt

ega

aaa

ttg

ctc

aag

cct

ggg

ggc

aac

ttg

att

ttg

gtt

gag

4734

Val

Arg 1565

Lys

Leu

Lys

Pro 1570

Gly

Asn

Leu

Ile 1575

Leu

Val

Glu

act

acc

agg

gat

cag

ctc

gat

ttg

ttc

ttt

acc

ttc

gga

ctg

ttg

4779

Thr

Thr 1580

Arg

Asp

Gin

Leu

Asp 1585

Leu

Phe

Thr

Phe 1590

Gly

Leu

cca

ggt

tgg

ctc

agt

gag

cct

gag

cgg

aag

tcg

acg

cca

4824

Pro

Gly 1595

Trp

Leu

Ser

Glu 1600

Glu

Pro

Glu

Arg

Lys 1605

Ser

Thr

Pro

tcg

ctc

act

acc

gat

ctt

tgg

aac

acc

atg

ttg

gac

acg

agc

ggt

4S69

Ser

Leu 1610

Thr

Asp

Leu

Trp 1615

Asn

Thr

Met

Leu

Asp 1620

Thr

Ser

Gly

ttc

aac

ggt

gtg

gaa

ttg

gag

gtt

cgt

gat

tgt

gaa

gac

gat

gag

4914

Phe

Asn 1625

Gly

Val

Glu

Leu

Glu 1630

Val

Arg

Asp

Cys

Glu 1635

Asp

Glu

108

PL 202 457 B1

ttt Phe

tac Tyr 1640

atg Met

atc Ile

agc Ser

aca Thr

atg Met 1645

eta Leu

tcg Ser

acg Thr

gct Ala

aga Arg 1650

aaa Lys

gag Glu

aat Asn

4959

aca

acc

ccg

gat

aca

gtg

gca

gaa

tcg

gag

gtg

ctt

ttg

ctg

cac

5004

Thr

Thr 1655

Pro

Asp

Thr

Val

Ala 1660

Glu

Ser

Glu

Val

Leu 1665

Leu

His

gga

gcg

ctc

ega

cct

tca

tct

tgg

ctg

gaa

agt

ctc

cag

gca

5049

Gly

Ala 1670

Leu

Arg

Pro

Ser 1675

Ser

Trp

Leu

Glu

Ser 1680

Leu

Gin

Ala

gca

att

tgt

gaa

aag

acc

agt

tct

agc

cca

tcg

atc

aac

gct

ctg

5094

Ala

Ile 1685

Cys

Glu

Lys

Thr

Ser 1690

Ser

Pro

Ser

Ile 1695

Asn

Ala

Leu

ggc

gag

gta

gat

acc

act

gga

agg

aca

tgc

att

ttt

ctt

ggg

gaa

5139

Gly

Glu 1700

Val

Asp

Thr

Gly 1705

Arg

Thr

Cys

Ile

Phe 1710

Leu

Gly

Glu

atg

gag

tcc

tcg

ctc

ctt

gga

gag

gtg

gga

agc

gag

acc

ttc

aaa

5184

Met

Glu 1715

Ser

Leu

Gly 1720

Glu

Val

Gly

Ser

Glu 1725

Thr

Phe

Lys

tcc

atc

acc

gcg

atg

ctg

aat

aac

tgc

aac

gca

ctt

ctc

tgg

gtg

5229

Ser

Ile 1730

Thr

Ala

Met

Leu

Asn 1735

Asn

Cys

Asn

Ala

Leu 1740

Leu

Trp

Val

tct

aga

gga

gca

gcc

atg

agc

tcc

gag

gat

cca

tgg

aaa

gct

eta

5274

Ser

Arg 1745

Gly

Ala

Met

Ser 1750

Ser

Glu

Asp

Pro

Trp 1755

Lys

Ala

Leu

cat

att

ggt

ctg

cgt

acc

atc

cgc

aac

gaa

aat

aac

ggg

aag

5319

His

Ile 1760

Gly

Leu

Arg

Thr 1765

Ile

Arg

Asn

Glu

Asn 1770

Asn

Gly

Lys

gaa

tat

gta

tcg

ttg

gat

ctc

gat

cct

tct

ega

aac

gca

tac

acc

5364

Glu

Tyr 1775

Val

Ser

Leu

Asp

Leu 1780

Asp

Pro

Ser

Arg

Asn 1785

Ala

Tyr

Thr

cac

gag

tcc

ctg

tat

gct

atc

tgc

aat

atc

ttc

aat

ggc

cgc

ctc

5409

His

Glu 1790

Ser

Leu

Tyr

Ala

Ile 1795

Cys

Asn

Ile

Phe

Asn 1800

Gly

Arg

Leu

ggc

gac

ctt

tcc

gaa

gac

aag

gag

ttt

gaa

ttt

gca

gag

aga

aac

5454

Gly

Asp 1805

Leu

Ser

Glu

Asp

Lys 1810

Glu

Phe

Glu

Phe

Ala 1815

Glu

Arg

Asn

ggc

gtc

atc

cac

gta

ccg

ega

ctt

ttc

aat

gac

ccg

cac

tgg

aag

5499

Gly

Val 1820

Ile

His

Val

Pro

Arg 1825

Leu

Phe

Asn

Asp

Pro 1830

His

Trp

Lys

PL 202 457 B1

109

gac Asp

caa Gin 1835

gaa Glu

gcg Ala

gtt Val

gag Glu

gtc Val 1840

aca Thr

ctg Leu

cag Gin

ccg Pro

ttc Phe 1845

gag Glu

caa Gin

ccc Pro

5544

ggg

cgt

ctg

cgg

atg

gag

gtt

gag

acg

cca

ggg

ctc

tta

gac

5589

Gly

Arg 1850

Arg

Leu

Arg

Met

Glu 1855

Val

Glu

Thr

Pro

Gly 1860

Leu

Asp

tcc

ctg

caa

ttt

ega

gac

gaa

gga

cgt

gaa

ggc

aag

gat

ctt

5634

Ser

Leu 1855

Gin

Phe

Arg

Asp

Asp 1870

Glu

Gly

Arg

Glu

Gly 1875

Lys

Asp

Leu

ccg

gat

tgg

gta

gaa

atc

gaa

ccc

aaa

get

ttc

ggt

ctc

aat

5679

Pro

Asp 1880

Asp

Trp

Val

Glu

Ile 1885

Glu

Pro

Lys

Ala

Phe 1890

Gly

Leu

Asn

ttt

cgg

gat

gtc

atg

gtt

gcc

atg

ggt

caa

ttg

gag

gcc

aac

cgt

5724

Phe

Arg 1895

Asp

Val

Met

Val

Ala 1900

Met

Gly

Gin

Leu

Glu 1905

Ala

Asn

Arg

gtg

atg

ggc

ttc

gaa

tgc

gcc

gga

gtg

atc

aca

aag

ctc

ggt

gga

5769

Val

Met 1910

Gly

Phe

Glu

Cys

Ala 1915

Gly

Val

Ile

Thr

Lys 1920

Leu

Gly

get

gcc

get

agc

caa

ggc

ctc

aga

tta

ggg

gac

cgc

gta

tgt

5814

Ala

Ala 1925

Ala

Ser

Gin

Gly 1930

Leu

Arg

Leu

eiy

Asp 1935

Arg

Val

Cys

gca

eta

ctg

aaa

ggc

cat

tgg

gcg

acc

aga

aca

cag

acg

ccg

tac

5859

Ala

Leu 1940

Leu

Lys

Gly

His

Trp 1945

Ala

Thr

Arg

Thr

Gin 1950

Thr

Pro

Tyr

act

aat

gtc

cgt

att

ccg

gac

gaa

atg

ggc

ttc

cca

gaa

gcc

5904

Thr

Asn 1955

Val

Arg

Ile

Pro 1960

Asp

Glu

Met

Gly

Phe 1965

Pro

Glu

Ala

get

teg

gtc

ccc

ctg

get

ttc

act

acc

gca

tat

att

gcg

ctt

tat

5949

Ala

Ser 1970

val

Pro

Leu

Ala

Phe 1975

Thr

Ala

Tyr

Ile 1980

Ala

Leu

Tyr

acc

acg

gca

aag

eta

ega

ggc

gaa

aga

gtc

ttg

atc

cac

agt

5994

Thr

Thr 1985

Ala

Lys

Leu

Arg

Arg 1990

Gly

Glu

Arg

val

Leu 1995

Ile

His

Ser

gga

get

gga

ggc

gtc

ggt

caa

gca

gcg

atc

att

ttg

tcc

cag

ctt

6039

Gly

Ala 2000

Gly

Val

Gly

Gin 2005

Ala

Ile

Leu 2010

Ser

Gin

Leu

gcg

ggt

gcc

gag

gtc

ttc

gtc

aca

gcg

gga

act

caa

gcc

aag

cgt

6084

Ala

Gly 2015

Ala

Glu

Val

Phe

Val 2020

Thr

Ala

Gly

Thr

Gin 2025

Ala

Lys

Arg

110

PL 202 457 B1

gac Asp

ttt Phe 2030

gtc Val

ggc Gly

gat Asp

aaa Lys

ttc Phe 2035

ggc Gly

atc Ile

aat Asn

ccg Pro

gat Asp 2040

cat His

atc Ile

ttc Phe

6129

teg

agc

agg

aat

gac

tta

ttc

gtc

gac

ggc

atc

aaa

gcc

tac

acg

6174

Ser

Ser 2045

Arg

Asn

Asp

Leu

Phe 2050

Val

Asp

Gly

Ile

Lys 2055

Ala

Tyr

Thr

ggc

gga

ctt

ggc

gtt

cat

gtc

gtt

eta

aac

tea

ttg

gca

ggt

caa

6219

Gly

Gly 2060

Leu

Gly

Val

His

Val 2065

Val

Leu

Asn

Ser

Leu 2070

Ala

Gly

Gin

ctc

caa

gca

agc

ttt

gac

tgc

atg

gcc

gaa

ttc

ggc

aga

ttt

6264

Leu

Leu 2075

Gin

Ala

Ser

Phe

Asp 2080

Cys

Met

Ala

Glu

Phe 2085

Gly

Arg

Phe

gtt

gag

att

gga

aaa

aag

gac

ctg

gag

caa

aac

agc

aga

ctt

gac

6309

Val

Glu 2090

Ile

Gly

Lys

Asp 2095

Leu

Glu

Gin

Asn

Ser 2100

Arg

Leu

Asp

atg

ctg

cca

ttc

acc

cgg

gac

gtc

tct

ttc

aca

tea

att

gat

ctt

6354

Met

Leu 2105

Pro

Phe

Thr

Arg

Asp 2110

Val

Ser

Phe

Thr

Ser 2115

Ile

Asp

Leu

ctc

teg

tgg

caa

aga

gcc

aaa

agt

gaa

gta

tcc

gaa

gcg

ttg

6399

Leu

Ser 2120

Trp

Gin

Arg

Ala

Lys 2125

Ser

Glu

Val

Ser 2130

Glu

Ala

Leu

aac

cat

gtc

aca

aaa

ctc

gag

aca

aaa

gcg

att

ggc

ttg

att

6444

Asn

His 2135

val

Thr

Lys

Leu

Leu 2140

Glu

Thr

Lys

Ala

Ile 2145

Gly

Leu

Ile

ggt

cca

atc

cag

cac

tcc

ttg

tea

aac

atc

gag

aag

gcc

ttc

6489

Gly

Pro 2150

Ile

Gin

His

Ser 2155

Leu

Ser

Asn

Ile

Glu 2160

Lys

Ala

Phe

cgt

acg

atg

cag

agt

ggt

cag

cat

gtt

ggc

aaa

gtt

gtg

gtc

aat

6534

Arg

Thr 2165

Met

Gin

Ser

Gly

Gin 2170

His

Val

Gly

Lys

Val 2175

Val

val

Asn

gta

tct

ggg

gac

gaa

ctg

gtc

cca

gtc

ggc

gat

gga

ggg

ttc

teg

6579

Val

Ser 2180

Gly

Asp

Glu

Leu

Val 2185

Pro

Val

Gly

Asp

Gly 2190

Gly

Phe

Ser

ctg

aag

ctg

aag

cct

gac

agt

tct

tac

eta

gtt

gct

ggt

ggg

ctg

6624

Leu

Lys 2195

Leu

Lys

Pro

Asp

Ser 2200

Ser

Tyr

Leu

Val

Ala 2205

Gly

Leu

ggg

gga

att

gga

aag

cag

atc

tgt

cag

tgg

ctt

gtt

gat

cat

ggc

6669

Gly

Gly 2210

Ile

Gly

Lys

Gin

Ile 2215

Cys

Gin

Trp

Leu

val 2220

Asp

His

Gly

PL 202 457 B1

111

gcg Ala.

aag Lys 2225

cac His

ttg Leu

att Ile

atc Ile

cta Leu 2230

teg Ser

aga Arg

agt Ser

gca Ala

aag Lys 2235

gcc Ala

agt Ser

cca Pro

6714

ttc

ata

acc

agc

ttg

caa

aat

caa

cag

tgc

gct

gtc

tat

cta

cac

6759

Phe

Ile 2240

Thr

Ser

Leu

Gin

Asn 2245

Gin

Cys

Ala

Val 2250

Tyr

Leu

His

gca

tgt

gac

atc

tca

gat

caa

gat

cag

gtc

acc

aag

gtg

ctc

cgg

6804

Ala

Cys 2255

Asp

Ile

Ser

Asp

Gin 2260

Asp

Gin

Val

Thr

Lys 2265

Val

Leu

Arg

ttg

tgc

gaa

gca

cat

gca

ccg

cca

att

ega

ggt

atc

ata

caa

6849

Leu

Cys 2270

Glu

Ala

His

Ala 2275

Pro

Ile

Arg

Gly 2280

Ile

Gin

ggt

gcc

atg

gtt

ctc

aag

gac

gcg

ctt

cta

teg

ega

atg

aca

ttg

6894

Gly

Ala 2285

Met

Val

Leu

Lys

Asp 2290

Ala

Leu

Ser

Arg 2295

Met

Thr

Leu

gat

gaa

ttt

aat

gca

aca

cgc

cca

aaa

gta

cag

ggt

agt

tgg

6939

Asp

Glu 2300

Phe

Asn

Ala

Thr 2305

Arg

Pro

Lys

Val

Gin 2310

Gly

Ser

Trp

tat

ctt

cac

aag

atc

gca

cag

gat

gtt

gac

ttc

gtg

atg

ctc

6984

Tyr

Leu 2315

His

Lys

Ile

Ala

Gin 2320

Asp

Val

Asp

Phe

Phe 2325

Val

Met

Leu

tca

tcc

ctt

gtt

ggg

gtc

atg

ggt

ggg

gca

ggc

cag

gcc

aat

tac

7029

Ser

Ser 2330

Leu

Val

Gly

Val

Met 2335

Gly

Ala

Gly

Gin 2340

Ala

Asn

Tyr

gca

gct

ggt

gca

ttc

cag

gac

gca

ctt

gcg

cac

cgg

aga

7074

Ala

Al a 2345

Ala

Gly

Ala

Phe

Gin 2350

Asp

Ala

Leu

Ala

His 2355

His

Arg

gcc

cat

ggc

atg

ccg

gct

gtc

acc

att

gac

ttg

ggc

atg

gtc

aag

7119

Ala

His 2360

Gly

Met

Pro

Ala

Val 2365

Thr

Ile

Asp

Leu

Gly 2370

Met

Val

Lys

tct

gtt

gga

tac

gtg

gct

gaa

act

ggc

cgt

ggt

gtg

gcc

gac

cgg

7164

Ser

Val 2375

Gly

Tyr

Val

Ala

Glu 2380

Thr

Gly

Arg

Gly

Val 2385

Ala

Asp

Arg

ctc

gct

aga

ata

ggt

tac

aag

cct

atg

cat

gaa

aag

gac

gtc

atg

7209

Leu

Ala 23 90

Arg

Ile

Gly

Tyr

Lys 2395

Pro

Met

His

Glu

Lys 2400

Asp

Val

Met

gat

gtg

ttg

gag

aag

gca

atc

ctg

tgt

tct

tcc

cct

caa

ttt

cca

7254

Asp

Val 2405

Leu

Glu

Lys

Ala

Ile 2410

Leu

Cys

Ser

Pro 2415

Gin

Phe

Pro

112

PL 202 457 B1

tea

cct

CCC

gca

gct

gtg

gtt

aca

gga

atc

aac

aca

tcc

ccg

ggt

7299

Ser

Pro

Ala

val

Val

Thr

Gly

Ile

Asn

Thr

Ser

Pro

Gly

2420

2425

2430

gct

cac

tgg

acc

gag

gca

aac

tgg

ata

cag

gaa

cag

cgg

ttt

gtg

7344

Ala

His

Trp

Thr

Glu

Ala

Asn

Trp

Ile

Gin

Glu

Gin

Arg

Phe

Val

2435

2440

2445

gga

ctt

aaa

tac

cgc

caa

gtc

ctt

cat

gca

gac

caa

tcc

ttt

gtc

7389

Gly

Leu

Lys

Tyr

Arg

Gin

Val

Leu

His

Ala

Asp

Gin

Ser

Phe

Val

2450

2455

2460

tct

teg

cat

aaa

gga

cca

gat

ggc

gtg

cgg

gcc

caa

eta

age

7434

Ser

His

Lys

Gly

Pro

Asp

Gly

Val

Arg

Ala

Gin

Leu

Ser

2465

2470

2475

agg

gtc

acc

tct

cac

gac

gag

gcc

att

tct

atc

gtc

ctc

aaa

gca

7479

Arg

Val

Thr

Ser

His

Asp

Glu

Ala

Ile

Ser

Ile

Val

Leu

Lys

Ala

2480

2485

2490

atg

acg

gaa

aag

ctg

atg

ega

atg

ttt

ggt

ctg

gca

gaa

gac

7524

Met

Thr

Glu

Lys

Leu

Met

Arg

Met

Phe

Gly

Leu

Ala

Glu

Asp

2495

2500

2505

atg

tcc

teg

tcc

aaa

aac

ctg

gca

ggt

gtc

ggc

gta

gac

tea

ctc

7569

Met

Ser

Lys

Asn

Leu

Ala

Gly

val

Gly

Val

Asp

Ser

Leu

2510

2515

2520

gtc

gcc

att

gaa

ctt

ega

aac

tgg

atc

aca

tct

gaa

atc

cat

gtt

7614

Val

Ala

Ile

Glu

Leu

Arg

Asn

Trp

Ile

Thr

Ser

Glu

Ile

His

Val

2525

2530

2535

gat

gtg

teg

atc

ttt

gag

ctc

atg

aat

ggt

aac

acc

atc

gcc

ggc

7659

Asp

Val

Ser

Ile

Phe

Glu

Leu

Met

Asn

Gly

Asn

Thr

Ile

Ala

Gly

2540

2545

2550

ctc

gtc

gag

tta

gtt

gtg

gcg

aaa

tgc

agt

taa

7692

Leu

Val

Glu

Leu

Val

Ala

Lys

Cys

Ser

2555

2560

<210 = 46 <211= 2563 :212:

PRT <213= Penicillium citrinum <400= 46

Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr

Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile

PL 202 457 B1

113

Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro ³⁵ 40 ₄₅

Gin Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys ⁵⁰ 55 60

Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly ⁶⁵ 70 75 go

Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu

90 95

Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val 100 105 no

Ala Ser Cys Met Asp Pro Gin Tyr Arg Leu Met Leu Glu Val Val Tyr 115 120 125

Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser 130 135 140

Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gin Asp Ser ¹⁴⁵ 150 155 iso

Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn

165 170 175

Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg 180 185 190

Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala 195 200 205

Leu His Leu Ala Cys Gin Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala 210 215 220

Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr

225 230 235 240

Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe

245 250 255

Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu 260 265 270

Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gin Asp Pro Ile Arg 275 280 285

Ala Val Ile Arg Glu Thr Ala Leu Asn Gin Asp Gly Lys Thr Pro Ala 290 295 300

Ile Thr Ala Pro Ser Asp Val Ala Gin Lys Ser Leu Ile Gin Glu Cys 305 310 315 320

114

PL 202 457 B1

Tyr

Asp

Lys

Ala

Gly 325

Leu

Asp

Met

Ser

Leu Thr 330

Ser

Tyr

Val

Glu 335

Ala

His

Gly

Thr

Gly

Thr

Pro

Thr

Gly

Asp

Pro

Leu

Glu

Ile

Ser

Ala

Ile

340

345

350

Ser

Ala

Phe

Lys

Gly

His

Pro

Leu

His

Leu

Gly

Ser

Val

Lys

Ala

355

360

365

Asn

Ile

Gly

His

Thr

Glu

Ala

Ser

Gly

Leu

Ala

Ser

Ile

Lys

370

375

380

Val

Ala

Leu

Ala

Leu

Glu

Lys

Gly

Leu

Ile

Pro

Asn

Ala

Arg

Phe

385

390

395

400

Leu

Gin

Lys

Asn

Ser

Lys

Leu

Met

Leu

Asp

Gin

Lys

Asn

Ile

Lys

Ile

405

410

415

Pro

Met

Ser

Ala

Gin

Asp

Trp

Pro

Val

Lys

Asp

Gly

Thr

Arg

Ala

420

425

430

Ser

Val

Asn

Phe

Gly

Phe

Gly

Ser

Asn

Ala

His

Val

Ile

Leu

435

440

445

Glu

Ser

Tyr

Asp

Arg

Ala

Ser

Leu

Ala

Leu

Pro

Glu

Asp

Gin

Val

His

450

455

460

Val

Asn

Gly

Asn

Ser

Glu

His

Gly

Arg

Val

Glu

Asp

Gly

Ser

Lys

Gin

465

470

475

480

Ser

Arg

Ile

Tyr

Val

Arg

Ala

Lys

Asp

Glu

Gin

Ala

Cys

Arg

485

490

495

Thr

Ile

Ala

Ser

Leu

Arg

Asp

Tyr

Ile

Lys

Ser

Val

Ala

Asp

Ile

Asp

500

505

510

Gly

Glu

Pro

Phe

Leu

Ala

Ser

Leu

Ala

Tyr

Thr

Leu

Gly

Ser

Arg

515

520

525

Ser

Ile

Leu

Pro

Trp

Thr

Ser

Val

Tyr

Val

Ala

Asp

Ser

Leu

Gly

530

535

540

Leu

Val

Ser

Ala

Leu

Ser

Asp

Glu

Ser

Asn

Gin

Pro

Lys

Ara

Ala

Asn

545

550

555

560

Glu

Lys

Val

Arg

Leu

Gly

Phe

Val

Phe

Thr

Gly

Gin

Gly

Ala

Gin

Trp

565

570

575

His

Ala

Met

Gly

Arg

Glu

Leu

Val

Asn

Thr

Phe

Pro

Val

Phe

Lys

Gin

580

585

590

Ala

Ile

Leu

Glu

Cys

Asp

Gly

Tyr

Ile

Lys

Gin

Leu

Gly

Ala

Ser

Trp

595

600

605

PL 202 457 B1

115

Asn

Phe 610

Met

Glu

Leu

His 615

Arg

Asp

Glu

Leu

Thr 620

Thr

Arg

Val

Asn

Asp

Ala

Glu

Tyr

Ser

Leu

Pro

Leu

Ser

Thr

Ala

Ile

Gin

Ile

Ala

Leu

625

630

635

640

Val

Arg

Leu

Trp

Ser

Trp

Gly

Ile

Arg

Pro

Thr

Gly

Ile

Thr

Ser

645

650

655

His

Ser

Gly

Glu

Ala

Tyr

Ala

Gly

Ala

Leu

Ser

660

665

670

Ala

Arg

Ser

Ala

Ile

Gly

Ile

Thr

Tyr

Ile

Arg

Gly

Val

Leu

Thr

675

680

685

Lys

Pro

Lys

Pro

Ala

Leu

Ala

Lys

Gly

Met

Ala

Val

Gly

690

695

700

Leu

Gly

Arg

Ser

Glu

Thr

Asn

Val

Tyr

Ile

Ser

Arg

Leu

Asn

Gin

Glu

705

710

715

720

Asp

Gly

Cys

Val

Gly

Cys

Ile

Asn

Ser

Gin

Cys

Ser

Val

Thr

725

730

735

Val

Ser

Gly

Asp

Leu

Gly

Ala

Ile

Glu

Lys

Leu

Glu

Lys

Leu

His

740

745

750

Ala

Asp

Gly

Ile

Phe

Thr

Arg

Lys

Leu

Lys

Val

Thr

Glu

Ala

Phe

His

755

760

765

Ser

His

Met

Arg

Pro

Met

Ala

Asp

Ala

Phe

Gly

Ala

Ser

Leu

Arg

770

775

780

Asp

Leu

Phe

Asn

Ser

Asp

Asn

Asp

Asn

Pro

Asn

Ala

Asp

Thr

785

790

795

800

Ser

Lys

Gly

Val

Leu

Tyr

Ser

Pro

Lys

Thr

Gly

Ser

Arg

Met

Thr

805

810

815

Asp

Leu

Lys

Leu

Asp

Pro

Thr

His

Trp

Met

Asp

Ser

Met

Leu

820

825

830

Gin

Pro

Val

Glu

Phe

Glu

Ser

Leu

Arg

Glu

Met

Cys

Phe

Asp

Pro

835

840

845

Asn

Thr

Lys

Glu

Lys

Ala

Val

Asp

Val

Ile

Glu

Ile

Gly

Pro

His

850

855

860

Gly

Ala

Leu

Gly

Pro

Ile

Asn

Gin

Val

Met

Gin

Asp

Leu

Gly

Leu

865

870

875

880

Lys

Gly

Thr

Asp

Ile

Asn

Tyr

Leu

Ser

Cys

Leu

Ser

Arg

Gly

Arg

Ser

885

890

895

116

PL 202 457 B1

Ser	Leu	Glu Thr Met 900	Tyr Arg Ala	Ala 905	Thr	Glu Leu Ile	Ser Lys 910	Gly
Tyr	Gly	Leu Lys Met	Asp Ala Ile	Asn	Phe	Pro His Gly	' Arg Lys	Glu
		915	920			925
Pro	Arg	Val Lys Val	Leu Ser Asp	Leu	Pro	Ala Tyr Pro	> Trp Asn	His
	930		935			940
Gin	Thr	Arg Tyr Trp .	Arg Glu Pro	Arg	Gly	Ser Arg Glu	Ser Lys	Gin
945			950			955		950
Arg	Thr	His Pro Pro	His Thr Leu	Ile	Gly	Ser Arg Glu	. Ser Leu	Ser
		965			970		975
Pro	His	Phe Ala Pro	Lys Trp Lys	His	Val	Leu Arg Leu	. Ser Asp	Ile
		980		935			990
Pro	Trp	Ile Arg Asp	His Val Val	Gly Ser Ser Ile Ile Phe Pro G
		995	1000		1005
Ala	Gly	Phe Ile Ser	Met Ala Ile Glu Gly Phe Ser	Gin Val	Cys
	1010		1015			1020
Pro	Pro	Val Ala Gly	Ala Ser Ile Asn Tyr Asn Leu	Arg Asp	Val
	102 5		1030			1035
Glu	Leu	Ala Gin Ala	Leu Ile Ile Pro Ala Asp Ala	Glu Ala	Glu
	1040		1045			1050
Val	Asp	Leu Arg Leu	Thr Ile Arg Ser Cys Glu Glu	Arg Ser	Leu
	1055		1060			1065
Gly	Thr	Lys Asn Trp	His Gin Phe Ser Val His Ser	Ile Ser	Gly
	1070		1075			1080
Glu	Asn	Asn Thr Trp	Thr Glu His Cys Thr Gly Leu	Ile Arg	Ser
	1035		1090			1095
Glu	Ser	Glu Arg Ser	His Leu Asp Cys ser Thr Val	Glu Ala	Ser
	1100		1105			1110
Arg	Arg	Leu Asn Leu	Gly Ser Asp Asn Arg Ser Ile	Asp Pro	Asn
	1115		1120			1125
Asp	Leu	Trp Glu Ser	Leu His Ala Asn Gly Ile Cys	His Gly	Pro
	1130		1135			114 0
Ile	Phe	Gin Asn Ile	Gin Arg Ile Gin Asn Asn Gly	Gin Gly	Ser
	1145		1150			1155
Phe	Cys	Arg Phe Ser	Ile Ala Asp Thr Ala Ser Ala	Met Pro	His
	1160		1165			1170

PL 202 457 B1

117

Ser Tyr Glu Asn Arg His 1175

Val Ile Gin Ala Ala Tyr 1190

Met Lys Thr Ala Met Val 1205

Ser Ser Ser Leu Ala Asp 1220

Gin Ala Ser Ile Lys Asp 1255

Leu Ala Val Phe Asp Asp 12 5 0

Gly ile Pro Val Ile Glu 1255

Gly Ser Ser Phe Ser Asp 1280

Asn Ala Cys Ser Ser Trp 1295

Asp Ser Thr Trp Leu Lys 1310

Lys Glu Thr Glu Leu Met 1325

Phe Ile Gin Glu Ala Val 1340

His Leu Asp Gly His Leu 1355

Gin Leu Asp Leu Ala Arg 1370

Asp Trp Leu Ser Asp Asp 1385

Arg Val Ala Gly Glu Ser 1400

Gly Pro Gin Leu Ile Ala

1415

Glu Leu Met Met Gin Asp 1430

Ile Val His Pro 1180

Thr Val Leu Pro 1195

Pro Arg Arg Leu 1210

Leu Glu Ala Gly 1225

Arg Asn Ser Gin 1240

Tyr Asp Ser Gly 1255

Ile Glu Gly Leu 1270

Gin Lys Ser Asp 1285

Val Trp Ala Pro 1300

Glu Lys Leu Ser 1315

Met Asp Leu Arg 1330

Thr Asp Leu Thr 1345

Gin Lys Tyr Phe 1360

Gin Asn Lys Leu 1375

Ala Glu Gin Lys 1390

Val Asn Gly Glu 1405

Met Leu Arg Arg 1420

Gin Leu Leu Ser 1435

Thr Thr Leu Asp Ser 1185

Tyr Ala Gly Thr Arg 1200

Arg Asn Val Lys Ile 1215

Asp Ala Leu Asp Ala 1230

Ser Phe Ser Thr Asp 1245

Ser Ser Pro Ser Asp 1250

Val Phe Gin Ser Val 1275

Ser Asn Asp Thr Glu 1290

Asp Ile Ser Leu Gly 1305

Thr Glu Ala Glu Thr 1320

Arg Cys Thr Ile Asn 1335

Asn ser Asp Ile Gin 1350

Asp Trp Met Asn Val 1355

Ser Pro Ala Ser Cys 1380

Lys Cys Leu Gin Ala 1395

Met Ile Ser Arg Leu 1410

Glu Thr Glu Pro Leu 1425

Arg Tyr Tyr Val Asn 1440

118

PL 202 457 B1

Ala Ile Lys 1445

Arg Leu Cys 1460

Gly Gly Gly 1475

Gly Asn Thr 1490

Ala Gly Phe 1505

Asp Val Met 1520

Gin Gin Gly 1535

Gin Val Leu 1550

Val Arg Lys 1565

Thr Thr Arg 1580

Pro Gly Trp 1595

Ser Leu Thr 1610

Phe Asn Gly 1625

Phe Tyr Met 1640

Thr Thr Pro 1655

Gly Ala Leu 1670

Ala Ile Cys 1685

Gly Glu Val 1700

Trp

Ala

Thr

Lys

Phe

Thr

Phe

His

Leu

Asp

Trp

Thr

Val

Ile

Asp

Arg

Glu

Asp

Ser

His

Gly

Pro

Glu

Phe

Glu

Ala

Leu

Gin

Leu

Asp

Glu

Ser

Thr

Pro

Lys

Thr

Arg

Lys

Gly

Ile

Ser

Lys

Cys

Thr

Lys

Leu

Ser

Leu

Thr

Val

Pro

Thr

Ser Asn Ala Gin 1450

Asn Pro Arg Ser 1465

Cys Thr Lys Leu 1430

Asp Arg Tyr Asp 1495

Ala Arg Glu Gin 1510

Lys Leu Asp Ile 1525

Ala Thr Tyr Asp 1540

Arg Cys Met Lys 1555

Pro Gly Gly Asn 1570

Asp Leu Phe Phe 1585

Glu Glu Pro Glu 1600

Trp Asn Thr Met 1615

Glu Val Arg Asp 1630

Met Leu Ser Thr 1645

Ala Glu Ser Glu 1660

Ser Ser Trp Leu 1675

Ser Ser Ser Pro 1690

Gly Arg Thr Cys 1705

Ala Ser Glu Leu Ile 1455

Arg Ile Leu Glu Ile 1470

Ile Val Asn Ala Leu 1485

Phe Thr Asp Val Ser 1500

Phe Ala Asp Trp Gin 1515

Glu Ser Asp Pro Glu 1530

Val Val Val Ala Cys 1545

Arg Thr Leu Ser Asn 1560

Leu Ile Leu Val Glu 1575

Thr Phe Gly Leu Leu 1590

Arg Lys Ser Thr Pro 1605

Leu Asp Thr Ser Gly 1620

Cys Glu Asp Asp Glu 1635

Ala Arg Lys Glu Asn 1650

Val Leu Leu Leu His 1665

Glu Ser Leu Gin Ala 1680

Ser Ile Asn Ala Leu 1695

Ile Phe Leu Gly Glu 1710

PL 202 457 B1

119

Met

Glu 1715

Ser

Leu

Gly 1720

Glu

Val

Gly

Ser

Glu 1725

Thr

Phe

Lys

Ser

Ile 1730

Thr

Ala

Met

Leu

Asn 1735

Asn

Cys

Asn

Ala

Leu 1740

Leu

Trp

Val

Ser

Arg 1745

Gly

Ala

Met

Ser 1750

Ser

Glu

Asp

Pro

Trp 1755

Lys

Ala

Leu

His

Ile 1760

Gly

Leu

Arg

Thr 1765

Ile

Arg

Asn

Glu

Asn 1770

Asn

Gly

Lys

Glu

Tyr 1775

Val

Ser

Leu

Asp

Leu 1780

Asp

Pro

Ser

Arg

Asn 1785

Ala

Tyr

Thr

His

Glu 1790

Ser

Leu

Tyr

Ala

ile 1795

Cys

Asn

Ile

Phe

Asn 1800

Gly

Arg

Leu

Gly

Asp 1805

Leu

Ser

Glu

Asp

Lys 1810

Glu

Phe

Glu

Phe

Ala 1815

Glu

Arg

Asn

Gly

Val 1820

Ile

His

Val

Pro

Arg 1825

Leu

Phe

Asn

Asp

Pro 1830

His

Trp

Lys

Asp

Gin 1835

Glu

Ala

Val

Glu

Val 1840

Thr

Leu

Gin

Pro

Phe 1845

Glu

Gin

Pro

Gly

Arg 1850

Arg

Leu

Arg

Met

Glu 1855

Val

Glu

Thr

Pro

Gly 1860

Leu

Asp

Ser

Leu 1865

Gin

Phe

Arg

Asp

Asp 1870

Glu

Gly

Arg

Glu

Gly 1875

Lys

Asp

Leu

Pro

Asp 1880

Asp

Trp

Val

Glu

Ile 1885

Glu

Pro

Lys

Ala

Phe 1890

Gly

Leu

Asn

Phe

Arg 1895

Asp

Val

Met

Val

Ala 1900

Met

Gly

Gin

Leu

Glu 1905

Ala

Asn

Arg

Val

Met 1910

Gly

Phe

Glu

Cys

Ala 1915

Gly

Val

Ile

Thr

Lys 1920

Leu

Gly

Ala

Ala 1925

Ala

Ser

Gin

Gly 1930

Leu

Arg

Leu

Gly

Asp 1935

Arg

Val

Cys

Ala

Leu 1940

Leu

Lys

Gly

His

Trp 1945

Ala

Thr

Arg

Thr

Gin 1950

Thr

Pro

Tyr

Thr

Asn 1955

Val

Arg

Ile

Pro 1960

Asp

Glu

Met

Gly

Phe 1965

Pro

Glu

Ala

Ser 1970

Val

Pro

Leu

Ala

Phe 1975

Thr

Ala

Tyr

Ile 1980

Ala

Leu

Tyr

120

PL 202 457 B1

Thr Thr Ala Lys Leu 1985

Gly Ala Gly Gly Val 2000

Ala Gly Ala Glu Val 2015

Asp Phe Val Gly Asp 2030

Ser Ser Arg Asn Asp

2045

Gly Gly Leu Gly Val 2060

Leu Leu Gin Ala Ser 2075

Val Glu Ile Gly Lys 2090

Met Leu Pro Phe Thr 2105

Leu Ser Trp Gin Arg 212 0

Asn His Val Thr Lys 2135

Gly Pro Ile Gin Gin 2150

Arg Thr Met Gin Ser 2165

Val Ser Gly Asp Glu 2180

Leu Lys Leu Lys Pro 2195

Gly Gly Ile Gly Lys 2210

Ala Lys His Leu Ile 2225

Phe Ile Thr Ser Leu 2240

Arg

Gly

Phe

Lys

Leu

His

Phe

Lys

Arg

Ala

Leu

His

Gly

Leu

Asp

Gin

Ile

Gin

Arg Gly Glu Arg 1990

Gin Ala Ala Ile 2005

Val Thr Ala Gly 2020

Phe Gly Ile Asn 2035

Phe Val Asp Gly 2050

Val Val Leu Asn 2055

Asp Cys Met Ala 2080

Asp Leu Glu Gin 2095

Asp Val Ser Phe 2110

Lys Ser Glu Glu 2125

Leu Glu Thr Lys 2140

Ser Leu Ser Asn 2155

Gin His Val Gly 2170

Val Pro Val Gly 2185

Ser Ser Tyr Leu 2200

Ile Cys Gin Trp 2215

Leu Ser Arg Ser 2230

Asn Gin Gin Cys 2245

Val Leu Ile His Ser 1995

Ile Leu Ser Gin Leu 2010

Thr Gin Ala Lys Arg 2025

Pro Asp His Ile Phe 2040

Ile Lys Ala Tyr Thr 2055

Ser Leu Ala Gly Gin 2070

Glu Phe Gly Arg Phe 2085

Asn Ser Arg Leu Asp 2100

Thr Ser Ile Asp Leu 2115

Val Ser Glu Ala Leu 2130

Ala Ile Gly Leu Ile 2145

Ile Glu Lys Ala Phe 2160

Lys Val Val Val Asn 2175

Asp Gly Gly Phe Ser 2190

Val Ala Gly Gly Leu 2205

Leu Val Asp His Gly 2220

Ala Lys Ala Ser Pro 2235

Ala Val Tyr Leu His 2250

PL 202 457 B1

121

Ala

Cys 2255

Asp

ile

Ser

Asp

Gin 2260

Asp

Gin

Val

Thr

Lys 2265

Val

Leu

Arg

Leu

Cys

Glu

Ala

His

Ala

Pro

Ile

Arg

Gly

Ile

ile

Gin

2270

2275

2280

Gly

Ala

Met

Val

Leu

Lys

Asp

Ala

Leu

Ser

Arg

Met

Thr

Leu

2285

2290

2295

Asp

Glu

Phe

Asn

Ala

Thr

Arg

Pro

Lys

Val

Gin

Gly

Ser

Trp

2300

2305

2310

Tyr

Leu

His

Lys

Ile

Ala

Gin

Asp

Val

Asp

Phe

Val

Met

Leu

2315

2320

2325

Ser

Leu

Val

Gly

Val

Met

Gly

Ala

Gly

Gin

Ala

Asn

Tyr

2330

2335

2340

Ala

Gly

Ala

Phe

Gin

Asp

Ala

Leu

Ala

His

Arg

2345

2350

2355

Ala

His

Gly

Met

Pro

Ala

Val

Thr

Ile

Asp

Leu

Gly

Met

Val

Lys

23S0

2365

2370

Ser

Val

Gly

Tyr

Val

Ala

Glu

Thr

Gly

Arg

Gly

Val

Ala

Asp

Arg

2375

2380

2385

Leu

Ala

Arg

Ile

Gly

Tyr

Lys

Pro

Met

His

Glu

Lys

Asp

Val

Met

23 90

2395

2400

Asp

Val

Leu

Glu

Lys

Ala

Ile

Leu

Cys

Ser

Pro

Gin

Phe

Pro

2405

2410

2415

Ser

Pro

Ala

Val

Thr

Gly

Ile

Asn

Thr

Ser

Pro

Gly

2420

2425

2430

Ala

His

Trp

Thr

Glu

Ala

Asn

Trp

Ile

Gin

Glu

Gin

Arg

Phe

Val

2435

2440

2445

Gly

Leu

Lys

Tyr

Arg

Gin

Val

Leu

His

Ala

Asp

Gin

Ser

Phe

Val

2450

2455

2460

Ser

His

Lys

Gly

Pro

Asp

Gly

Val

Arg

Ala

Gin

Leu

Ser

2465

2470

2475

Arg

Val

Thr

Ser

His

Asp

Glu

Ala

Ile

Ser

Ile

Val

Leu

Lys

Ala

24 80

2485

2490

Met

Thr

Glu

Lys

Leu

Met

Arg

Met

phe

Gly

Leu

Ala

Glu

Asp

2495

2500

2505

Met

Ser

Lys

Asn

Leu

Ala

Gly

Val

Gly

Val

Asp

Ser

Leu

2510

2515

2520

122

PL 202 457 B1

<220>

<221» CDS <222 > (1),. (1557) <400> 47

atg Met 1

ctc Leu

ggc Gly

cag Gin

gtt Val 5

Ctt Leu

ctg Leu

acc Thr

gtc Val

gaa Glu 10

teg Ser

tac Tyr

caa Gin

tgg Trp

gta Val 15

teg Ser

48

acc

cct

caa

gcc

ctt

gtg

gcg

gtc

gca

gtg

ctt

agt

ctc

atc

gcc

96

Thr

Pro

Gin

Ala

Leu

Val

Ala

Val

Ala

Val

Leu

Ser

Leu

Ile

Ala

20

25

30

tac

cgt

ttg

cgg

ggg

cgc

cag

tcc

gaa

ctg

caa

gtc

tat

aat

ccc

aaa

144

Tyr

Arg

Leu

Arg

Gly

Arg

Gin

Ser

Glu

Leu

Gin

Val

Tyr

Asn

Pro

Lys

35

40

45

aaa

tgg

gag

ttg

acg

acc

atg

agg

gct

agg

cag

gac

ttc

gat

acg

192

Lys

Trp

Glu

Leu

Thr

Met

Arg

Ala

Arg

Gin

Asp

Phe

Asp

Thr

50

55

60

tat

ggt

ccg

agc

tgg

atc

gaa

gct

tgg

ttc

teg

aaa

aac

gac

aag

ccc

240

Tyr

Gly

Pro

Ser

Trp

Ile

Glu

Ala

Trp

Phe

Ser

Lys

Asn

Asp

Lys

Pro

65

70

75

80

ctg

cgc

ttc

att

gtt

gat

tcc

ggc

tat

tgc

acc

atc

ctc

cca

teg

tcc

288

Leu

Arg

Phe

ile

Val

Asp

Ser

Gly

Tyr

Gys

Thr

Ile

Leu

Pro

Ser

85

90

95

atg

gcc

gac

gag

ttt

cgg

aaa

atc

aaa

gat

atg

tgc

atg

tac

aag

ttt

336

Met

Ala

Asp

Glu

Phe

Arg

Lys

Ile

Lys

Asp

Met

Cys

Met

Tyr

Lys

Phe

100

105

110

ttg

gcg

gat

gac

ttt

cac

tct

cat

ctc

cct

gga

ttc

gac

ggg

ttc

aag

384

Leu

Ala

Asp

Phe

His

Ser

His

Leu

Pro

Gly

Phe

Asp

Gly

Phe

Lys

115

120

125

PL 202 457 B1

123

gaa Glu

atc Ile 130

tgc Cys

cag Gin

gat Asp

gca Ala

cat His 135

ctt Leu

gtc val

aac Asn

aaa Lys

gtt Val 14 0

gtt Val

ttg Leu

aac Asn

cag Gin

432

tta

caa

acc

caa

gcc

ccc

aag

tac

aca

aag

cca

ttg

gct

acc

ttg

gcc

480

Leu

Gin

Thr

Gin

Ala

Pro

Lys

Tyr

Thr

Lys

Pro

Leu

Ala

Thr

Leu

Ala

14 5

150

155

160

gac

gct

act

att

gcc

aag

ttg

ttc

ggt

aaa

age

gag

tgg

caa

acc

528

Asp

Ala

Thr

Ile

Ala

Lys

Leu

Phe

Gly

Lys

Ser

Glu

Trp

Gin

Thr

165

170

175

gca

cct

gtc

tat

tcc

aat

gga

ttg

gac

ctt

gtc

aca

ega

aca

gtc

aca

576

Ala

Pro

Val

Tyr

Ser

Asn

Gly

Leu

Asp

Leu

Val

Thr

Arg

Thr

Val

Thr

180

185

190

ctc

att

atg

gtc

ggc

gac

aaa

atc

tgc

cac

aat

gag

tgg

ctg

gat

624

Leu

Ile

Met

Val

Gly

Asp

Lys

Ile

Cys

His

Asn

Glu

Trp

Leu

Asp

195

200

205

att

gca

aag

aac

cat

gcc

gtg

agt

gtg

gcg

gta

caa

gct

cgc

caa

ctt

672

Ile

Ala

Lys

Asn

His

Ala

Val

Ser

Val

Ala

Val

Gin

Ala

Arg

Gin

Leu

210

215

220

cgc

gta

tgg

ccc

atg

eta

ctg

ega

ccg

ctc

gct

cac

tgg

ttt

caa

ccg

720

Arg

Val

Trp

Pro

Met

Leu

Arg

Pro

Leu

Ala

His

Trp

Phe

Gin

Pro

225

230

235

240

caa

gga

cgc

aaa

ttg

cgt

gac

caa

gtg

cgc

gca

ega

aag

atc

att

768

Gl n

Gly

Arg

Lys

Leu

Arg

Asp

Gin

Val

Arg

Ala

Arg

Lys

Ile

245

250

255

gat

cct

gag

att

cag

ega

cgt

gct

gaa

aag

gcc

gca

tgt

gta

gcg

816

Asp

Pro

Glu

Ile

Gin

Arg

Ala

Glu

Lys

Ala

Cys

Val

Ala

260

265

270

aag

ggc

gtg

cag

ccg

ccc

cag

tac

gtc

gat

acc

atg

caa

tgg

ttt

gaa

864

Lys

Gly

Val

Gin

Pro

Gin

Tyr

Val

Asp

Thr

Met

Gin

Trp

Phe

Glu

275

280

285

gac

acc

gcc

gac

ggc

cgc

tgg

tac

gat

gtg

gcg

ggt

gct

cag

ctc

gct

912

Asp

Thr

Ala

Asp

Gly

Arg

Trp

Tyr

Asp

Val

Ala

Gly

Ala

Gin

Leu

Ala

290

295

300

atg

gat

ttc

gcc

ggc

atc

tac

gcc

teg

acg

gat

ctt

ttc

gtc

ggt

gcc

960

Met

Asp

Phe

Ala

Gly

Ile

Tyr

Ala

Ser

Thr

Asp

Leu

Phe

Val

Gly

Ala

305

310

315

320

ctt

gtg

gac

att

gcc

agg

cac

cca

gac

ctt

att

cag

cct

ctc

cgc

caa

1008

Leu

Val

Asp

Ile

Ala

Arg

His

Pro

Asp

Leu

Ile

Gin

Pro

Leu

Arg

Gin

325

330

335

124

PL 202 457 B1

gag Glu

atc Ile

cgc Arg

act Thr 340

gta val

atc Ile

gga Gly

gaa Glu

ggg Gly 345

ggc Gly

tgg Trp

acg Thr

cct Pro

gcc Ala 350

tct Ser

ctg Leu

1056

ttc

aag

ctg

aag

ctc

gac

agc

tgc

atg

aaa

gag

acg

cag

ega

atc

1104

Phe

Lys

Leu

Lys

Leu

Asp

Ser

Cys

Met

Lys

Glu

Thr

Gin

Arg

Ile

355

360

365

aag

ccg

gtc

gag

tgc

gcc

act

atg

cgc

agt

acc

get

ctc

aga

gac

atc

1152

Lys

Pro

Val

Glu

Cys

Ala

Thr

Met

Arg

Ser

Thr

Ala

Leu

Arg

Asp

Ile

370

375

380

act

eta

tcc

aat

ggc

ctc

ttc

att

ccc

aag

ggc

gag

ttg

gcc

get

gtg

1200

Thr

Leu

Ser

Asn

Gly

Leu

Phe

Ile

Pro

Lys

Gly

Glu

Leu

Ala

Val

385

390

395

400

get

gca

gac

cgc

atg

aac

cct

gat

gtg

tgg

gaa

aac

ccc

gaa

aat

1248

Al a

Ala

Asp

Arg

Met

Asn

Pro

Asp

Val

Trp

Glu

Asn

Pro

Glu

Asn

405

410

415

tat

gat

ccc

tac

ega

ttt

atg

cgc

atg

cgc

gag

gat

cca

gac

aag

gcc

1296

Tyr

Asp

Pro

Tyr

Arg

Phe

Met

Arg

Met

Arg

Glu

Asp

Pro

Asp

Lys

Ala

420

425

430

ttc

acc

get

caa

ttg

gag

aat

acc

aac

ggt

gat

cac

atc

ggc

ttc

ggc

1344

Phe

Thr

Ala

Gin

Leu

Glu

Asn

Thr

Asn

Gly

Asp

His

Ile

Gly

Phe

Gly

435

440

445

tgg

aac

cca

cgc

get

tgt

ccc

ggg

cgg

ttc

gcc

teg

aag

gaa

atc

1392

Trp

Asn

Pro

Arg

Ala

Cys

Pro

Gly

Arg

Phe

Ala

Ser

Lys

Glu

Ile

450

455

460

aag

att

ctc

get

cat

ata

ctg

att

cag

tat

gat

gtg

aag

cct

gta

1440

Lys

I Le

Leu

Ala

Hi s

Ile

Leu

Ile

Gin

Tyr

Asp

Val

Lys

Pro

val

4S5

470

475

480

cca

gga

gac

gat

gac

cl cl cl

tac

cgt

cac

get

ttt

agc

gtt

cgt

atg

1488

Pro

Gly

Asp

Lys

Tyr

Arg

His

Ala

Phe

Ser

Val

Arg

Met

485

490

495

cat

cca

acc

aca

aag

ctc

atg

gta

cgc

cgg

cgc

aac

gag

gac

atc

ccg

1536

His

Pro

Thr

Lys

Leu

Met

Val

Arg

Asn

Glu

Asp

Ile

Pro

500

505

510

ctc

cct

cat

gac

cgg

tgc

taa

1557

Leu

Pro

His

Asp

Arg

Cys

515 <210> 48 <211> 518 <212> PRT <213> Penicillium citrinum

PL 202 457 B1

125 <400> 48

Met Leu Gly Gin Val Leu Leu Thr Val Glu Ser Tyr Gin Trp Val Ser 15 10 15

Thr Pro Gin Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala 20 25 30

Tyr Arg Leu Arg Gly Arg Gin Ser Glu Leu Gin Val Tyr Asn Pro Lys 35 40 45

Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gin Asp Phe Asp Thr '50 55 60

Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro

70 75 80

Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser

90 95

Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe 100 105 110

Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys 115 120 125

Glu Ile Cys Gin Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gin 130 135 140

Leu Gin Thr Gin Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala

145 150 155 160

Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gin Thr

165 170 175

Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr 180 185 190

Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp 195 200 205

Tle Ala Lys Asn His Ala Val Ser Val Ala Val Gin Ala Arg Gin Leu 210 215 220

Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gin Pro

225 230 235 240

Gin Gly Arg Lys Leu Arg Asp Gin Val Arg Arg Ala Arg Lys Ile Ile

245 250 255

Asp Pro Glu Ile Gin Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala 260 265 270

126

PL 202 457 B1

Glu

Ala

320

Gin

Leu

Ile

Val

400

Asn

Ala

Gly

Ile

Val

480

Met

Pro

PL 202 457 B1

127 <22 O >

<221? CDS <222> (1) . . (3522) <400> 49

atg Met 1

gtc Val

gct Ala

teg Ser

ttg Leu 5

eta Leu

ccc Pro

tct Ser

cgc Arg

ttt Phe 10

cgc Arg

ggt Gly

agg Arg

gaa Glu

tea Ser 15

atg Met

48

aat

cag

cac

cct

eta

cgc

teg

gga

aat

cgg

gca

ttg

acc

tcc

aca

96

Asn

Gin

His

Pro

Leu

Arg

Ser

Gly

Asn

Arg

Ala

Leu

Thr

Ser

Thr

20

25

30

ctc

caa

ttt

eta

tcc

aaa

acg

gcg

tgt

eta

cac

ccg

atc

cat

acc

gtt

144

Leu

Gin

Phe

Leu

Ser

Lys

Thr

Ala

Cys

Leu

His

Pro

Ile

His

Thr

Val

35

40

45

tgc

acc

ata

gct

att

eta

gct

agt

acc

aca

tac

gtt

gga

eta

ctc

aaa

192

Cy s

Thr

ile

Ala

Ile

Leu

Ala

Ser

Thr

Tyr

Val

Gly

Leu

Lys

50

55

60

gac

agc

ttc

cat

ggc

ccc

gca

aac

gtt

gat

aaa

gca

gaa

tgg

ggc

240

Asp

Ser

Phe

His

Gly

Pro

Ala

Asn

Val

Asp

Lys

Ala

Glu

Trp

Gly

55

70

75

80

tct

ttg

gtc

gaa

gga

agt

ega

agc

ttg

atc

acc

ggc

cca

cag

aat

ggc

288

Ser

Leu

Val

Glu

Gly

Ser

Arg

Ser

Leu

Ile

Thr

Gly

Pro

Gin

Asn

Gly

85

90

95

tgg

aag

tgg

cag

agc

ttc

gac

ggg

gat

gca

gat

gtt

ctc

gga

gat

ttc

336

Trp

Lys

Trp

Gin

Ser

Phe

Asp

Gly

Asp

Ala

Asp

Val

Leu

Gly

Asp

Phe

100

105

110

aac

cat

caa

gca

eta

atg

acc

ttg

gta

ttc

ccg

ggg

tea

tat

ggg

gtt

3 84

Asn

His

Gin

Ala

Leu

Met

Thr

Leu

Val

Phe

Pro

Gly

Ser

Tyr

Gly

Val

115

120

125

gca

tct

caa

gca

gcc

tea

cca

ttc

ctt

gct

CCC

ctc

cct

gtg

aac

eta

432

Ala

Ser

Gin

Ala

Ser

Pro

Phe

Leu

Ala

Pro

Leu

Pro

Val

Asn

Leu

130

135

14 0

tct

gtg

att

gac

ctt

ccc

tea

acg

teg

agc

CCt

tta

acc

gcc

tat

teg

480

Ser

Val

Ile

Asp

Leu

Pro

Ser

Thr

Ser

Pro

Leu

Thr

Ala

Tyr

Ser

145

150

155

160

aaa

gat

aaa

gtt

ttc

gcc

ttc

tct

gtg

gaa

tac

agc

gcg

ccg

gaa

528

Lys

Asp

Lys

Val

Phe

Ala

Phe

Ser

Val

Glu

Tyr

Ser

Ala

Pro

Glu

165

170

175

ctc

gtg

gct

gtt

caa

gaa

atc

ccc

aac

agt

gcc

gac

ctg

aaa

576

Leu

Val

Ala

Val

Gin

Glu

Ile

Pro

Asn

Ser

Ala

Asp

Leu

Lys

180

185

190

128

PL 202 457 B1

ttg Leu

cag Gin

gag Glu 195

acg Thr

caa Gin

ttg Leu

atc Ile

gag Glu 200

atg Met

gaa Glu

cgc Arg

cag Gin

atg Met 205

tgg Trp

atc Ile

atg Met

624

aag

gct

gcc

agg

gct

cac

aca

aaa

cgc

agc

ctt

gct

caa

tgg

gtg

cac

672

Lys

Ala

Arg

Ala

His

Thr

Lys

Arg

Ser

Leu

Ala

Gin

Trp

Val

His

210

215

220

gat

acc

tgg

aca

gag

tet

ctt

gat

ctt

atc

aag

agc

gct

caa

acg

ctc

720

Asp

Thr

Trp

Thr

Glu

Ser

Leu

Asp

Leu

ile

Lys

Ser

Ala

Gin

Thr

Leu

225

230

235

240

gac

gtg

gtt

gtc

atg

gtg

eta

ggt

tat

ata

tca

atg

cac

ttg

act

ttc

768

Asp

Val

val

Val

Met

Val

Leu

Gly

Tyr

Ile

Ser

Met

His

Leu

Thr

Phe

245

250

255

gtc

tca

ctc

ttc

ctc

agc

atg

aaa

ttg

gga

teg

aag

gtt

tgg

ctg

816

Val

Ser

Leu

Phe

Leu

Ser

Met

Lys

Leu

Gly

Ser

Lys

Val

Trp

Leu

260

255

270

gct

aca

agc

gtc

ctt

ttg

teg

tca

aca

ttt

gcc

ttt

ctc

ggt

ctc

864

Ala

Thr

Ser

Val

Leu

Ser

Thr

Phe

Ala

Phe

Leu

Gly

Leu

275

280

285

gac

gtg

gcc

ata

aga

eta

ggg

gtt

ccg

atg

agc

atg

agg

ttg

eta

tcc

912

Asp

Val

Ala

Ile

Arg

Leu

Gly

Val

Pro

Met

Ser

Met

Arg

Leu

Ser

290

295

300

gaa

ggc

ctc

ccc

ttc

ttg

gtg

atc

gtt

ggc

ttt

gag

aag

agc

atc

960

Glu

Gly

Leu

Pro

Phe

Leu

Val

val

ile

Val

Gly

Phe

Glu

Lys

Ser

Ile

305

310

315

320

act

ctg

acc

agg

gct

gtt

ttg

tcc

tat

gct

gtg

cag

cac

ega

aag

ccc

1008

Thr

Leu

Thr

Arg

Ala

Val

Leu

Ser

Tyr

Ala

Val

Gin

His

Arg

Lys

Pro

325

330

335

cag

aag

ata

cag

tet

gac

cag

ggt

agc

gtg

aca

gcc

att

gct

gaa

agt

1056

Gin

Lys

Ile

Gin

Ser

Asp

Gin

Gly

Ser

Val

Thr

Ala

Ile

Ala

Glu

Ser

340

345

350

acc

atc

aat

tac

gcc

gta

ega

agc

gcc

att

cgg

gag

aag

ggt

tac

aat

1104

Thr

Ile

Asn

Tyr

Ala

Val

Arg

Ser

Ala

Ile

Arg

Glu

Lys

Gly

Tyr

Asn

355

360

365

atc

gtg

tgc

cac

tac

gtg

gtc

gag

atc

ctg

ctc

eta

gtt

atc

ggt

gct

1152

Ile

Val

cys

His

Tyr

val

Val

Glu

Ile

Leu

Val

Ile

Gly

Ala

370

375

380

gtc

tta

ggc

atc

caa

ggt

ggg

eta

cag

cac

ttc

tgt

gtt

eta

gct

gca

12 00

Val

Leu

Gly

Ile

Gin

Gly

Leu

Gin

His

Phe

Cys

Val

Leu

Ala

385

390

395

400

PL 202 457 B1

129

ttg Leu

atc Ile

ctg Leu

ttc Phe

ttt Phe 405

gac Asp

tgt Cys

ctg Leu

ctg Leu 410

ttt Phe

aca Thr

ttc Phe

tac Tyr

act Thr 415

gcg Ala

1248

att

ctg

tct

atc

aag

ctc

gag

gta

aac

cgc

ctc

aaa

cgt

cat

atc

aac

1296

Ile

Leu

Ser

Ile

Lys

Leu

Glu

Val

Asn

Arg

Leu

Lys

Arg

His

Ile

Asn

420

425

430

atg

cgg

tac

gcg

ttg

gaa

gat

gag

ggt

ctc

agt

cag

cgg

acg

gcg

gag

1344

Met

Arg

Tyr

Ala

Leu

Glu

Asp

Glu

Gly

Leu

Ser

Gin

Arg

Thr

Ala

Glu

435

440

445

agt

gtc

gcg

acc

agc

aat

gat

gcc

caa

gac

agt

gca

cgt

aca

tat

ctg

1392

Ser

Val

Ala

Thr

Ser

Asn

Asp

Ala

Gin

Asp

Ser

Ala

Arg

Thr

Tyr

Leu

450

455

460

ttt

ggc

aat

gat

atg

aaa

ggc

agc

agt

gtt

ccg

aag

ttc

aaa

ttc

tgg

1440

Phe

Gly

Asn

Asp

Met

Lys

Gly

Ser

Val

Pro

Lys

Phe

Lys

Phe

Trp

465

470

475

480

atg

gtc

gtt

ggt

ttc

ctt

atc

gtc

aac

ctc

gtc

aac

atc

ggc

tcc

acc

1480

Met

Val

Gly

Phe

Leu

Ile

Val

Asn

Leu

Val

Asn

Ile

Gly

Ser

Thr

485

490

495

ctt

ttc

caa

gcc

tct

agt

gga

tcg

ttg

tcc

agt

ata

tca

tct

tgg

1536

Leu

Phe

Gin

Ala

Ser

Gly

Ser

Leu

Ser

Ile

Ser

Trp

500

505

510

acc

gaa

agt

ctg

agc

gga

tcg

gcc

att

aaa

ccc

ccg

ctt

gag

ccc

ttc

1584

Ttir

Glu

Ser

Leu

Ser

Gly

Ser

Ala

Ile

Lys

Pro

Leu

Glu

Pro

Phe

515

520

525

aag

gta

gct

gga

agt

gga

eta

gat

gaa

eta

ctt

ttc

cag

gca

aga

ggg

1632

Lys

Val

Ala

Gly

Ser

Gly

Leu

Asp

Glu

Leu

Phe

Gin

Ala

Arg

Gly

530

535

540

cgc

ggt

caa

tcg

act

atg

gtc

act

gtc

ctc

gcc

ccc

atc

aag

tac

gaa

1680

Arg

Gly

Gin

Ser

Thr

Met

val

Thr

Val

Leu

Ala

Pro

Ile

Lys

Tyr

Glu

545

550

555

560

eta

gag

tat

cct

tcc

att

cac

cgt

ggt

acc

tcg

cag

eta

cac

Sag

tat

172 8

Leu

Glu

Tyr

Pro

Ser

Ile

His

Arg

Gly

Thr

Ser

Gin

Leu

His

Glu

Tyr

565

570

575

gga

gtt

ggt

gga

aaa

atg

gtc

ggt

agc

ctg

ctc

acc

agc

ctg

gaa

gat

1776

Gly

Val

Gly

Lys

Met

Val

Gly

Ser

Leu

Thr

Ser

Leu

Glu

Asp

580

585

590

ccc

gtc

ctc

tcc

aaa

tgg

gtg

ttt

gtg

gca

ctt

gcc

eta

agt

gtc

gct

1824

Pro

Val

Leu

Ser

Lys

Trp

Val

Phe

Val

Ala

Leu

Ala

Leu

Ser

Val

Ala

595

600

605

130

PL 202 457 B1

ctg Leu

aac Asn 610

agc Ser

tat Tyir

ctg Leu

ttc Phe

aag Lys 615

gcc Ala

aga Arg

ctg Leu

gga Gly 620

atc Ile

aaa Lys

gat Asp

cct Pro

1872

aat

ctc

ccg

agt

cac

cca

gtt

gat

cca

gtt

gag

Ctt

gac

cag

gcc

gaa

1920

Asn

Leu

Pro

Ser

His

Pro

Val

Asp

Pro

Val

Glu

Leu

Asp

Gin

Ala

Glu

625

630

635

640

agc

ttc

aac

gct

gcc

cag

aac

cag

acc

cct

cag

att

caa

tca

agt

ctc

1968

Ser

Phe

Asn

Al a

Ala

Gin

Asn

Gin

Thr

Pro

Gin

Ile

Gin

Ser

Leu

645

650

655

caa

gct

cct

cag

acc

aga

gtg

ttc

act

cct

acc

gac

agt

gac

2016

Gin

Ala

Pro

Gin

Thr

Arg

Val

Phe

Thr

Pro

Thr

Asp

Ser

AS?

660

665

670

agt

gat

gcc

tca

tta

gtc

tta

att

aaa

gca

tct

cta

aag

gtc

act

aag

2064

Ser

Asp

Ala

Ser

Leu

Val

Leu

Ile

Lys

Ala

Ser

Leu

Lys

Val

Thr

Lys

675

630

685

ega

gca

gaa

gga

aag

aca

gcc

act

agt

gaa

ctt

ccc

gtg

tct

cgc

aca

2112

Arg

Ala

Glu

Gly

Lys

Thr

Ala

Thr

Ser

Glu

Leu

Pro

Val

Ser

Arg

Thr

690

695

700

caa

atc

gaa

ctg

gac

aat

ttg

ctg

aag

cag

aac

aca

atc

agc

gag

ttg

2160

Gin

Ile

Glu

Leu

Asp

Asn

Leu

Lys

Gin

Asn

Thr

Ile

Ser

Glu

Leu

705

710

715

720

aac

gat

gag

gat

gtc

gtt

gcc

ttg

tct

ttg

cgg

gga

aag

gtt

ccc

999

2208

Asn

Asp

Glu

Asp

Val

Ala

Leu

Ser

Leu

Arg

Gly

Lys

val

Pro

Gly

725

730

735

tat

gcc

cta

gag

aag

agt

ctc

aaa

gac

tgc

act

cgt

gcc

gtc

aag

gtt

2256

Tyr

Ala

Leu

Glu

Lys

Ser

Leu

Lys

Asp

Cys

Thr

Arg

Ala

Val

Lys

Val

740

745

750

cgc

tct

atc

att

teg

agg

aca

ccg

gct

acc

gca

gag

ctt

aca

agt

2304

Arg

Ser

Ile

Ser

Arg

Thr

Pro

Ala

Thr

Ala

Glu

Leu

Thr

Ser

755

760

765

atg

ctg

gag

cac

teg

aag

ctg

ccg

tac

gaa

aac

tac

gcc

tgg

gaa

cgc

2352

Met

Leu

Glu

His

Ser

Lys

Leu

Pro

Tyr

Glu

Asn

Tyr

Ala

Trp

Glu

Arg

770

775

780

gtg

ctc

ggt

gca

tgt

tgc

gag

aac

gtt

att

ggc

tat

atg

cca

gtc

cct

2400

Vai

Leu

Gly

Ala

Cys

Glu

Asn

Val

Ile

Gly

Tyr

Met

Pro

Val

Pro

785

790

795

800

gtt

ggc

gtc

gcc

ggt

cct

att

gtt

atc

gac

ggc

aag

agt

tat

ttc

att

2448

Val

Gly

Val

Ala

Gly

Pro

Ile

Val

Ile

Asp

Gly

Lys

Ser

Tyr

Phe

Ile

805

810

815

PL 202 457 B1

131

cct Pro

atg Met

gca Ala

acc Thr 820

acc Thr

gag Glu

ggc Gly

gtc Val

ctc Leu 825

gtc Val

gct Ala

agt Ser

gct Ala

agc Ser 830

cgt Arg

ggc Gly

2496

agt

aag

gca

atc

aac

ctc

ggt

ggc

ggt

gcc

gtg

aca

gtc

ctg

act

ggc

2544

Ser

Lys

Ala 835

Ile

Asn

Leu

Gly

Gly 840

Gly

Ala

Val

Thr

Val 845

Leu

Thr

Gly

gac

ggt

atg

aca

ega

ggc

ccg

tgt

gtg

aag

ttt

gat

gtc

ctt

gaa

ega

2592

Asp

Gly 850

Met

Thr

Arg

Gly

Pro 855

Cys

Val

Lys

Phe

Asp 860

Val

Leu

Glu

Arg

gct

ggt

gct

aag

atc

tgg

ctc

gat

tcg

gac

gtc

ggc

cag

acc

gta

2640

Ala 865

Gly

Ala

Lys

Ile 870

Trp

Leu

Asp

Ser

Asp 875

Val

Gly

Gin

Thr

Val 880

atg

aaa

gaa

gcc

ttc

aat

tca

acc

agc

aga

ttt

gcg

cgc

tta

caa

agt

2688

Met

Lys

Glu

Ala

Phe Θ85

Asn

Ser

Thr

Ser

Arg 890

Phe

Ala

Arg

Leu

Gin 895

Ser

atg

cgg

aca

act

atc

gcc

ggt

act

cac

tta

tat

att

ega

ttt

aag

act

2736

Met

Arg

Thr

Thr 900

Ile

Ala

Gly

Thr

His 905

Leu

Tyr

Ile

Arg

Phe 910

Lys

Thr

act

ggc

gac

gct

atg

gga

atg

aat

atg

att

tct

aag

ggc

gtg

gag

2784

Thr

Gly 915

Asp

Ala

Met

Gly

Met 920

Asn

Met

Ile

Ser

Lys 925

Gly

Val

Glu

cat

gca

ctg

aat

gtt

atg

gcg

aca

gag

gca

ggt

ttc

agc

gat

atg

aat

2 832

His

Ala 930

Leu

Asn

Val

Met

Ala 935

Thr

Glu

Ala

Gly

Phe 940

Ser

Asp

Met

Asn

att

acc

eta

tca

gga

aat

tac

tgt

acg

gat

aag

aaa

cct

tca

gct

2880

Ile 945

Ile

Thr

Leu

Ser

Gly 950

Asn

Tyr

Cys

Thr

Asp 955

Lys

Pro

Ser

Ala 960

ttg

aat

tgg

atc

gat

gga

cgg

ggc

aag

ggc

att

gtg

gcc

gaa

gcc

atc

2928

Leu

Asn

Trp

Ile

Asp 965

Gly

Arg

Gly

Lys

Gly 970

Ile

Val

Ala

Glu

Ala 975

Ile

ata

ccg

gcg

aac

gtt

gtc

agg

gat

gtc

tta

aag

agc

gat

gtg

gat

agc

2976

Ile

Pro

Ala

Asn 980

Val

Arg

Asp

Val 985

Leu

Lys

Ser

Asp

Val 990

Asp

Ser

atg gtt cag ctc aac ata tcg aaa aat ctg att ggg tcc gct atg gct 3024

Met Val Gin Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala

995 1000 1005 ggc tca gtt ggc ggc ttc aac gcc caa gct gcc aat ctt gcg gca 3069

Gly Ser Val Gly Gly Phe Asn Ala Gin Ala Ala Asn Leu Ala Ala

1010 1015 1020

132

PL 202 457 B1

gcc Ala

att Ile 1025

ttc Phe

att Ile

gcc Ala

aca Thr

ggt Gly 1030

cag Gin

gat Asp

ccg Pro

gcg Ala

caa Gin 1035

gtt Val

gtg val

gag Glu

3114

agc

gct

aac

tgc

atc

act

ctc

atg

aac

aat

ctt

cgc

gga

teg

ctt

3159

Ser

Ala 1040

Asn

Cys

Ile

Thr

Leu 1045

Met

Asn

Leu

Arg 1050

Gly

Ser

Leu

caa

atc

tct

gtc

tcc

atg

ccg

tct

att

gag

gtt

gga

acg

ttg

ggc

3204

Gin

Ile 1055

Ser

Val

Ser

Met

Pro 1060

Ser

Ile

Glu

Val

Gly 1065

Thr

Leu

Gly

ggt

acg

att

ctg

gag

ccc

cag

ggc

gca

atg

ctt

gac

atg

ctt

3249

Gly

Gly 1070

Thr

Ile

Leu

Glu

Pro 1075

Gin

Gly

Ala

Met

Leu 1080

Asp

Met

Leu

ggt

gtc

cgc

gga

tea

cac

ccg

acc

act

ccc

ggt

gag

aat

gca

cgt

3294

Gly

Val 1085

Arg

Gly

Ser

His

Pro 1090

Thr

Pro

Gly

Glu 1095

Asn

Ala

Arg

caa

ctt

gcg

cgc

atc

gga

agc

gct

gtt

ttg

gct

ggg

gag

ctc

3339

Gin

Leu 1100

Ala

Arg

Ile

Gly 1105

Ser

Ala

Val

Leu

Ala 1110

Gly

Glu

Leu

teg

eta

tgt

gct

gcc

eta

gcc

ggt

cac

ctg

gtc

aag

gcg

cac

3384

Ser

Leu 1115

Cys

Ala

Leu

Ala 1120

Ala

Giy

His

Leu

Val 1125

Lys

Ala

His

atg

gcg

cac

aac

cgt

tct

gcc

ccg

gca

tct

tea

gcc

cct

tct

ega

3429

Met

Ala 1130

His

Asn

Arg

Ser

Ala 1135

Pro

Ala

Ser

Ala 1140

Pro

Ser

Arg

agt

gtc

tcc

ccg

tea

ggt

gga

acc

agg

aca

gtc

cct

gtt

cct

aac

3474

Ser

Val 1145

Ser

Pro

Ser

Gly

Gly 1150

Thr

Arg

Thr

Val

Pro 1155

Val

Pro

Asn

aat

gca

ctg

agg

ccg

agt

gct

gca

gct

act

gat

cgg

gct

ega

cgc

3519

Asn

Ala 1160

Leu

Arg

Pro

Ser

Ala 1165

Ala

Thr

Asp

Arg 1170

Ala

Arg

^c9^a 3522 <210? 50 <211? 1173 <212? PRT <213? Penicillium citrinum <400? 50

Met Val Aia Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met

10 15

PL 202 457 B1

133

Asn Gin Gin His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr 20 25 30

Leu Gin Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val 35 40 45

Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys 50 55 60

Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly

70 75 SO

Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gin Asn Gly

90 95

Trp Lys Trp Gin Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe 100 105 110

Asn His Gin Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val 115 120 125

Ala Ser Gin Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu 130 135 140

Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser

145 150 155 160

Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu

165 170 175

Leu Val Ala Ala Val Gin Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys 180 185 190

Leu Gin Glu Thr Gin Leu Ile Glu Met Glu Arg Gin Met Trp Ile Met 195 200 205

Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gin Trp Val His 210 215 220

Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gin Thr Leu

225 230 235 240

Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe

245 250 255

Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu 260 265 270

Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu 275 280 285

Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser 290 295 300

134

PL 202 457 B1

Glu Gly Leu Pro Phe Leu 305 310

Thr Leu Thr Arg Ala Val 325

Gin Lys Ile Gin Ser Asp 340

Thr Ile Asn Tyr Ala Val 3 55

Ile Val Cys His Tyr Val 370

Val Leu Gly Ile Gin Gly 385 390

Leu Ile Leu Phe Phe Asp 405

Ile Leu Ser Ile Lys Leu 420

Met Arg Tyr Ala Leu Glu 435

Ser Val Ala Thr Ser Asn 450

Phe Gly Asn Asp Met Lys 465 470

Met Val Val Gly Phe Leu 485

Leu Phe Gin Ala Ser Ser 500

Thr Glu Ser Leu Ser Gly 515

Lys Val Ala Gly Ser Gly 530

Arg Gly Gin Ser Thr Met 545 550

Leu Glu Tyr Pro Ser Ile 565

Gly Val Gly Gly Lys Met 580

Val Val Ile Val

Leu Ser Tyr Ala 330

Gin Gly Ser Val 345

Arg Ser Ala Ile 360

Val Glu Ile Leu 375

Gly Leu Gin His

Cys Leu Leu Leu 410

Glu Val Asn Arg 425

Asp Glu Gly Leu 440

Asp Ala Gin Asp 455

Gly Ser Ser Val

Ile Val Asn Leu 490

Ser Gly Ser Leu 505

Ser Ala Ile Lys 520

Leu Asp Glu Leu 535

Val Thr Val Leu

His Arg Gly Thr 570

Val Gly Ser Leu 585

Gly Phe Glu Lys Ser Ile 315 320

Val Gin His Arg Lys Pro 335

Thr Ala Ile Ala Glu Ser 350

Arg Glu Lys Gly Tyr Asn 365

Leu Leu Val Ile Gly Ala 380

Phe Cys Val Leu Ala Ala 395 400

Phe Thr Phe Tyr Thr Ala 415

Leu Lys Arg His Ile Asn 430

Ser Gin Arg Thr Ala Glu 445

Ser Ala Arg Thr Tyr Leu 460

Pro Lys Phe Lys Phe Trp 475 480

Val Asn Ile Gly Ser Thr 495

Ser Ser Ile Ser Ser Trp 510

Pro Pro Leu Glu Pro Phe 525

Leu Phe Gin Ala Arg Gly 540

Ala Pro ile Lys Tyr Glu 555 560

Ser Gin Leu His Glu Tyr 575

Leu Thr Ser Leu Glu Asp 590

PL 202 457 B1

135

Pro

fal

Leu 595

Ser

Lys

Trp

fal

Phe 600

Val

Ala

Leu

Ala

Leu 605

Ser

fal

Ala

Leu

Asn

Ser

Tyr

Leu

Phe

Lys

Ala

Arg

Leu

Gly

Ile

Lys

Asp

Pro

610

615

620

Asn

Leu

Pro

Ser

His

Pro

fal

Asp

Pro

Val

Glu

Leu

Asp

Gin

Ala

Glu

625

630

635

640

Ser

Phe

Asn

Ala

Gin

Asn

Gin

Thr

Pro

Gin

Ile

Gin

Ser

Leu

645

650

655

Gl n

Ala

Pro

Gin

Thr

Arg

fal

Phe

Thr

Pro

Thr

Asp

Ser

Asp

6S0

665

670

Ser

Asp

Ala

Ser

Leu

fal

Leu

Ile

Lys

Ala

Ser

Leu

Lys

fal

Thr

Lys

675

680

685

Arg

Ala

Glu

Gly

Lys

Thr

Ala

Thr

Ser

Glu

Leu

Pro

Val

Ser

Arg

Thr

690

695

700

Gin

Ile

Glu

Leu

Asp

Asn

Leu

Lys

Gin

Asn

Thr

Ile

Ser

Glu

Leu

705

710

715

720

Asn

Asp

Glu

Asp

Val

fal

Ala

Leu

Ser

Leu

Arg

Gly

Lys

Val

Pro

Gly

725

730

735

Tyr

Ala

Leu

Glu

Lys

Ser

Leu

Lys

Asp

Cys

Thr

Arg

Ala

fal

Lys

fal

740

745

750

Arg

Ser

Ile

ile

Ser

Arg

Thr

Pro

Ala

Thr

Ala

Glu

Leu

Thr

Ser

755

760

765

Met

Leu

Glu

His

Ser

Lys

Leu

Pro

Tyr

Glu

Asn

Tyr

Ala

Trp

Glu

Arg

770

775

780

fal

Leu

Gly

Ala

Cys

Glu

Asn

Val

Ile

Gly

Tyr

Met

Pro

fal

Pro

785

790

795

800

fal

Gly

Val

Ala

Gly

Pro

Ile

Val

Ile

Asp

Gly

Lys

Ser

Tyr

Phe

Ile

805

810

815

Pro

Met

Ala

Thr

Glu

Gly

Val

Leu

val

Ala

Ser

Ala

Ser

Arg

Gly

820

825

830

Ser

Lys

Ala

Ile

Asn

Leu

Gly

Ala

Val

Thr

fal

Leu

Thr

Gly

835

840

845

Asp

Gly

Met

Thr

Arg

Gly

Pro

Cys

fal

Lys

Phe

Asp

fal

Leu

Glu

Arg

850

855

860

A-l a

Gly

Ala

Lys

ile

Trp

Leu

Asp

Ser

Asp

Val

Gly

Gin

Thr

Val

865

870

875

880

136

PL 202 457 B1

Met

Lys

Glu

Ala

Phe 885

Asn

Ser

Thr

Ser

Arg 890

Phe

Ala

Arg

Leu

Gin 895

Ser

Met

Arg

Thr

Thr 900

Ile

Ala

Gly

Thr

His 905

Leu

Tyr

Ile

Arg

Phe 910

Lys

Thr

Gly 915

Asp

Ala

Met

Gly

Met 92 0

Asn

Met

Ile

Ser

Lys 925

Gly

Val

Glu

His

Ala 930

Leu

Asn

Val

Met

Ala 935

Thr

Glu

Ala

Gly

Phe 940

Ser

Asp

Met

Asn

Ile 945

ile

Thr

Leu

Ser

Gly 950

Asn

Tyr

Cys

Thr

Asp 955

Lys

Pro

Ser

Ala 960

Leu

Asn

Trp

Ile

Asp 965

Gly

Arg

Gly

Lys

Gly 970

Ile

Val

Ala

Glu

Ala 975

Ile

Tle

Pro

Ala

Asn 980

Val

Arg

Asp

Val 985

Leu

Lys

Ser

Asp

Val 990

Asp

Ser

Met

Gly

Ala

Ser

Gin

Gly

Gin

Ser

Met

Ser

Val Gin Leu Asn Ile I 995

Ser val Gly Gly Phe 1010

Ile Phe Ile Ala Thr 1025

Ala Asn Cys Ile Thr 1040

Ile Ser Val Ser Met 1055

Gly Thr Ile Leu Glu 1070

Vai Arg Gly Ser His 1085

Leu Ala Arg Ile Ile 1100

Leu Cys Ala Ala Leu

1115

Ala His Asn Arg Ser

1130

Val Ser Pro Ser Gly 1145 ier Lys Asn Leu Ile 1000

Asn Ala Gin Ala Ala 1015

Gly Gin Asp Pro Ala 1030

Leu Met Asn Asn Leu 1045

Pro Ser Ile Glu Val 1060

Pro Gin Gly Ala Met 1075

Pro Thr Thr Pro Gly 1090

Gly Ser Ala Val Leu 1105

Ala Ala Gly His Leu 1120

Ala Pro Ala Ser Ser 1135

Gly Thr Arg Thr Val 1150

Gly Ser Ala Met Ala 1005

Asn Leu Ala Ala 1020

Gin Val Val Glu 1035

Arg Gly Ser Leu 1050

Gly Thr Leu Gly 1065

Leu Asp Met Leu 1080

Glu Asn Ala Arg 1095

Ala Gly Glu Leu 1110

Val Lys Ala His 1125

Ala Pro Ser Arg 1140

Pro Val Pro Asn 1155

PL 202 457 B1

137

Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr Asp Arg Ala Arg Arg 1160 1165 1170 <210? 51 <211> 20 <212? DNA <213? Penicillium citrinum <400? 51 gcaagctctg ctaccagcac <2105 52 <211? 20 <212? DNA <213? Penicillium citrinum <400? 52 ctaggccaac btcagagccg <210? 53 <211? 20 <212? DNA <213? Penicillium citrinum <400? 53 agtcatgcag gatctgggtc <210? 54 <211? 20 <212? DNA <213? Penicillium citrinum <4C0> 54 gcagacacat cggtgaagtc <210? 55 <211? 20 <212? DNA <213? Penicillium citrinum <400? 55 aaaccgcacc tgtctattcc <210? 56 <211? 20 < 212 > DNA <213? Penicillium citrinum <400? 56 ctttgtggtt ggatgcatac <210? 57 <211? 20

138

PL 202 457 B1

139

Claims

1. Polinukleotyd przyspieszają cy biosyntez ę ML-236B, wybrany z grupy zł o ż onej z:

(a) polinukleotydu kodującego białko mające sekwencję aminokwasów SEQ ID NO 42, (b) polinukleotydu, który zawiera sekwencję nukleotydów SEQ ID NO 41, odpowiedniego do stosowania w przyspieszaniu biosyntezy ML-236B, (c) polinukleotydu, który stanowi sekwencję nukleotydów SEQ ID NO 41, (d) polinukleotydu, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (a) do (c), i który jest odpowiedni do przyspieszania biosyntezy ML-236B w mikroorganizmie wytwarzającym ML-236B gdy jest wprowadzany do tego mikroorganizmu wytwarzającego ML-236B, (e) mRNA, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (d).

2. Polinukleotyd według zastrz. 1, znamienny tym, ż e zawiera DNA, który można uzyskać z transformowanej Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).

3. Polinukleotyd według zastrz. 1 albo 2, znamienny tym, że jest w połączeniu funkcjonalnym z jednym lub wię cej polinukleotydów, przy czym ta kombinacja jest odpowiednia do stosowania w zwię kszaniu wytwarzania ML-236B w mikroorganizmie wytwarzają cym ML-236B.

4. Polinukleotyd według zastrz. 3, znamienny tym, że zawiera polinukleotyd określony w zastrz. 1 albo 2 w połączeniu z polinukleotydem kodującym białko, które zawiera lub stanowi sekwencję aminokwasów wybraną z SEQ ID NO 38, 42, 44, 46, 48 lub 50.

5. Polinukleotyd według zastrz. 3, znamienny tym, że zawiera polinukleotyd o SEQ ID NO 41 w połączeniu z jedną lub wię cej sekwencji wybranych z SEQ ID NO 37, 41, 43, 45, 47 lub 49.

6. Polinukleotyd wedł ug zastrz. 1, znamienny tym, ż e jest nim DNA.

7. Polinukleotyd według zastrz. 1, znamienny tym, że jest genomowym DNA.

8. Polinukleotyd według zastrz. 1, znamienny tym, że jest nim cDNA.

9. Wektor znamienny tym, że zawiera polinukleotyd określony w zastrz. 1-8.

10. Wektor według zastrz. 9, znamienny tym, że ponadto zawiera polinukleotyd mający sekwencję nukleotydowa SEQ ID NO 37.

11. Wektor według zastrz. 9 albo 10, znamienny tym, że ponadto zawiera jedną lub więcej sekwencji nukleotydowych wybranych z SEQ ID NO 43, 45, 47 lub 49.

12. Wektor według zastrz. 9, znamienny tym, że nie zawiera sekwencji nukleotydowych SEQ ID NO 37, 43, 45, 47 lub 49.

13 Wektor według zastrz. 9, znamienny tym, że nie zawiera sekwencji nukleotydowych SEQ ID NO 43, 45, 47 lub 49.

14. Wektor według zastrz. 9, znamienny tym, że wytwarza się go z Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).

15. Wektor według zastrz. 9, znamienny tym, że jest wektorem ekspresyjnym.

16. Komórka gospodarza transformowana wektorem określonym w dowolnym z zastrz. 9 do 15.

17. Komórka gospodarza według zastrz. 16, znamienna tym, że jest mikroorganizmem wytwarzającym ML-236B.

18. Komórka gospodarza według zastrz. 17, znamienna tym, że pochodzi z gatunku Penicillium.

19. Komórka gospodarza według zastrz. 17 albo 18, znamienna tym, że jest to komórka Penicillium citrinum.

20. Komórka gospodarza według zastrz. 16, znamienna tym, że jest to komórka Escherichia coli.

21. Komórka gospodarza według zastrz. 20, znamienna tym, że jest komórką Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).

22. Polipeptyd kodowany przez polinukleotyd określony w dowolnym z zastrz. 1 do 8.

23. Polipeptyd zawierający sekwencję SEQ ID NO 42, lub jej wariant, który ma przynajmniej

80% identyczności do SEQ ID NO 42 i który jest zdolny do przyspieszenia produkcji ML-236B w organizmie wytwarzającym ML236B.

24. Polipeptyd według zastrz. 22, znamienny tym, że ma sekwencję SEQ ID NO 42.

25. Sposób wytwarzania ML-236B, znamienny tym, że hoduje się komórki gospodarza określone w zastrz. 16 do 19 i następnie odzyskuje się ML-236B z hodowli.

26. Sposób według zastrz. 25, znamienny tym, że komórkę gospodarza transformuje się wektorem zawierającym SEQ ID NO 41.

140

PL 202 457 B1

27. Sposób według zastrz. 26, znamienny tym, że wektor nie zawiera sekwencji polinukleotydowej SEQ ID NO 37.

28. Sposób według zastrz. 26 albo 27, znamienny tym, że wektor nie zawiera co najmniej jednej sekwencji polinukleotydowej kodującej sekwencję aminokwasów odpowiadającą SEQ ID NO 44, 46, 48 i/lub 50

29. Sposób według zastrz. 25, znamienny tym, że wytwarzanie zachodzi w nieobecności jednego lub więcej zrekombinowanych polipeptydów mających sekwencje aminokwasowe odpowiadające SEQ ID NO 38, 44, 46, 48 i/lub 50.

30. Sposób według zastrz. 25, znamienny tym, że wytwarzanie zachodzi w nieobecności jednego lub więcej cDNA odpowiadającego SEQ ID NO 37, 43, 45, 47 i/lub 49.

31. Sposób wytwarzania prawastatyny, znamienny tym, że przeprowadza się sposób określony w zastrz. 25 do 30 i przekształca się ML-236B w prawastatynę.