PL202457B1 - Polinukleotyd przyspieszający biosyntezę ML-236B, wektor, komórka gospodarza transformowana tym wektorem, polipeptyd, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny - Google Patents

Polinukleotyd przyspieszający biosyntezę ML-236B, wektor, komórka gospodarza transformowana tym wektorem, polipeptyd, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny

Info

Publication number
PL202457B1
PL202457B1 PL347118A PL34711801A PL202457B1 PL 202457 B1 PL202457 B1 PL 202457B1 PL 347118 A PL347118 A PL 347118A PL 34711801 A PL34711801 A PL 34711801A PL 202457 B1 PL202457 B1 PL 202457B1
Authority
PL
Poland
Prior art keywords
seq
polynucleotide
dna
sequence
vector
Prior art date
Application number
PL347118A
Other languages
English (en)
Other versions
PL347118A1 (en
Inventor
Hiroji Yoshikawa
Yuki Abe
Chiho Ono
Original Assignee
Sankyo Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sankyo Co filed Critical Sankyo Co
Publication of PL347118A1 publication Critical patent/PL347118A1/xx
Publication of PL202457B1 publication Critical patent/PL202457B1/pl

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/385Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Penicillium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Przedmiotem wynalazku jest polinukleotyd odpowiedni do stosowania w przyspieszaniu biosyn- tezy ML-236B oraz polipeptyd kodowany przez ten polinukleotyd, wektor z w laczonym takim polinu- kleotydem, komórka gospodarza transformowana tym wektorem oraz sposób wytwarzania ML-236B przy zastosowaniu tego polinukleotydu i sposób wytwarzania prawastatyny. Wynalazek ma na celu przeprowadzenie pe lnej analizy molekularno-biologicznej biosyntezy ML-236B i reguluj acych j a czyn- ników oraz dostarczenie polinukleotydu, który przy spiesza biosyntez e inhibitora reduktazy HMG-CoA, ML-236B. PL PL PL PL

Description

Przedmiotem wynalazku jest polinukleotyd przyspieszający biosyntezę ML-236B i polipeptyd kodowany przez ten polinukleotyd, wektor zawierający ten polinukleotyd, komórka gospodarza transformowana tym wektorem, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny.
Bardziej szczegółowo wynalazek dotyczy polinukleotydu takiego jak DNA, który przyspiesza biosyntezę inhibitora reduktazy HMG-CoA, ML-236B, w mikroorganizmie produkującym ML-236B gdy jest on wprowadzony do organizmu produkującego ML-236B.
Prawastatyna jest inhibitorem reduktazy HMG-CoA. Prawastatyna sodowa jest stosowana do leczenia hiperlipemii lub hiperlipidemii i ma korzystne działanie farmakologiczne polegające na obniżaniu cholesterolu w surowicy. Prawastatyna może być uzyskana stosując Streptomyces carbophilus poprzez konwersję przez mikroorganizmy ML-236B produkowanego przez Penicillium citrinum [opisane w Endo, A. i wsp., J. Antibiot.,29 1346(1976): Matsuoka, T. i wsp., Eur. J. Biochem., 184, 707 (1989), i w Publikacji Japońskiego Zgłoszenia Patentowego Nr 57-2240].
Wykazano, że zarówno ML-236B, prekursor prawastatyny oraz lowastatyna, inhibitor reduktazy HMG-CoA, mają wspólną strukturę częściową. Są one syntetyzowane biologicznie poprzez poliketydy [opisane w Moore, R.N. i wsp., J.Am.Chem.Soc,107, 3694(1985); Shiao, M.i Don, H.S., Proc. Natl. Sci. Counc. Repub. China B, 11, 223(1987)].
Poliketydy są związkami pochodzącymi z łańcuchów węgla β-keto, które są wynikiem ciągłej reakcji kondensacji kwasów karboksylowych o niskiej masie cząsteczkowej takich jak kwas octowy, kwas propionowy, kwas masłowy lub podobne. Można wywieść różne struktury w zależności od szlaku kondensacji lub redukcji każdej z grup węgla β-keto karbonylowych [opisane w Hopwood, D.A. i Sherman, D.H., Annu. Rev.Genet., 24, 37-66 (1990); Hutchinson, C. R. i Fujii, I., Annu. Rev. Microbiol., 49, 201-238(1995)].
Syntazy poliketydów (dalej określane jako PKS), które biorą udział w syntezie poliketydów są enzymami o których wiadomo, że są obecne w grzybach nitkowatych i bakteriach. Enzymy grzybów nitkowatych badano stosując techniki biologii molekularnej [jak opisano w Feng, G.H. i Leonard, T. J., J. Bacteriol., 177, 6246 (1995); Takano, Y. i wsp. Mol. Gen. Genet. 249, 162 (1995)]. U Aspergillus terreus, który jest mikroorganizmem produkującym lowastatynę, przebadano gen PKS związany z biosyntezą lowastatyny [opisane w Międzynarodowym zgłoszeniu otwartym w Japonii (KOHYO) Nr 9-504436, i zobacz odpowiedni WO 9512661, który zastrzega DNA kodujący syntazę poliketydu triolu].
Geny związane z biosyntezą metabolitów wtórnych grzybów nitkowatych często tworzą skupienia w genomie. W szlakach biosyntezy poliketydów, wiadomo, że istnieją skupienia genów biorących udział w tym szlaku. W biosyntezie aflatoksyny, która jest poliketydem produkowanym przez Aspergillus flavus i Aspergillus parasiticus, stwierdzano, że geny kodujące białka enzymatyczne biorące udział w tej biosyntezie (takie jak PKS) tworzą strukturę skupienia. Przeprowadzono analizę genomową i porównanie genów biorących udział w biosyntezie aflatoksyny u każdego z tych mikroorganizmów [zobacz Yu, J. i wsp., Appl. Environ. Microbiol., 61, 2365 (1995)]. Doniesiono, że geny biorące udział w biosyntezie sterigmatocystyny produkowanej przez Aspergillus nidulans tworzą strukturę skupienia w około 60 kb ciągłego regionu na jego genomie [opisane w Brown, D. W. i wsp., Proc. Natl. Acad. Sci. USA, 93, 1418 (1996)].
Modulacja aktywności syntazy poliketydów przez dodatkowe białka w czasie syntezy lowastatyny była badana [zobacz Kennedy, J i wsp., Science Vol 284, 1368 (1999)].
Jednak dotychczas analiza molekularno-biologiczna biosyntezy ML-236B i regulujących ją czynników była niewystarczająca. Niniejszy wynalazek ma na celu zajęcie się tym problemem.
Zgodny z wynalazkiem jest polinukleotyd odpowiedni do stosowania w przyspieszaniu biosyntezy ML-236B, wybrany z grupy złożonej z:
(a) polinukleotydu kodującego białko mające sekwencję aminokwasów SEQ ID NO 42, (b) polinukleotydu, który zawiera sekwencję nukleotydów SEQ ID NO 41, odpowiedniego do stosowania w przyspieszaniu biosyntezy ML-236B, (c) polinukleotydu, który stanowi sekwencję nukleotydów SEQ ID NO 41, (d) polinukleotydu, który hybrydyzuje w ostrych warunkach z p-linukleotydem określonym w (a) do (c), i który jest odpowiedni do przyspieszania biosyntezy ML-236B w mikroorganizmie wytwarzającym ML-236B gdy jest wprowadzany do tego mikroorganizmu wytwarzającego ML-236B, (e) mRNA, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (d).
PL 202 457 B1
Korzystnie polinukleotyd według wynalazku zawiera DNA, który można uzyskać z transformowanej Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006) i korzystnie jest on w połączeniu funkcjonalnym z jednym lub więcej polinukleotydów, przy czym ta kombinacja jest odpowiednia do stosowania w zwiększaniu wytwarzania ML-236B w mikroorganizmie wytwarzającym ML-236B.
Szczególnie korzystnie jest on w połączeniu funkcjonalnym z polinukleotydem kodującym białko, które zawiera lub stanowi sekwencję aminokwasów wybraną z SEQ ID NO 38, 42, 44, 46, 48 lub 50 albo zawiera polinukleotyd o SEQ ID NO 41 w połączeniu z jedną lub więcej sekwencji wybranych z SEQ ID NO 37, 41, 43, 45, 47 lub 49.
W szczególnych przypadkach polinukleotyd jest DNA, genomowym DNA lub cDNA.
Zgodnym z wynalazkiem jest również wektor zawierający powyżej określony polinukleotyd, a w szczególności zawierający ponadto polinukleotyd mający sekwencję nukleotydową SEQ ID NO 37 lub jedną albo więcej sekwencji nukleotydowych wybranych z SEQ ID NO 43, 45, 47 lub 49.
Korzystnym wektorem, zgodnie z wynalazkiem, jest wektor, który nie zawiera sekwencji nukleotydowych SEQ ID NO 37, 43, 45, 47 lub 49 albo wektor, który nie zawiera sekwencji nukleotydowych SEQ ID NO 43, 45, 47 lub 49.
Wektor według wynalazku korzystnie wytwarza się z Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006) i korzystnie jest to wektor ekspresyjny.
Zgodna z wynalazkiem jest komórka gospodarza transformowana określonym powyżej wektorem, zwłaszcza komórka gospodarza, który jest mikroorganizmem wytwarzającym ML-236B, zwłaszcza pochodzącym z gatunku Penicillium, korzystnie jest to komórka Penicillium citrinum.
Korzystnie komórką gospodarza jest też komórka Escherichia coli, a zwłaszcza komórka Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
Zgodnym z wynalazkiem jest również polipeptyd kodowany przez określony powyżej polinukleotyd, a zwłaszcza polipeptyd zawierający sekwencję SEQ ID NO 42 lub jej wariant, który ma przynajmniej 80% identyczności do SEQ ID NO 42 i który jest zdolny do przyspieszenia produkcji ML-236B w organizmie wytwarzają cym ML236B, przy czym szczególnie korzystnym polipeptydem według wynalazku jest polipeptyd mający sekwencję SEQ ID NO 42.
Sposób wytwarzania ML-236B według wynalazku polega na tym, że hoduje się komórkę gospodarza określoną powyżej i następnie odzyskuje się ML-236B z hodowli. Korzystnie komórkę gospodarza transformuje się wektorem zawierającym SEQ ID NO 41, przy czym szczególnie korzystnie wektorem, który równocześnie nie zawiera sekwencji polinukleotydowej SEQ ID NO 37 albo równocześnie nie zawiera co najmniej jednej sekwencji polinukleotydowej kodującej sekwencję aminokwasów odpowiadającą SEQ ID NO 44, 46, 48 i/lub 50.
Sposób wytwarzania według wynalazku jest korzystny gdy ML-236B wytwarza się w nieobecności jednego lub więcej zrekombinowanych polipeptydów mających sekwencje aminokwasowe odpowiadające SEQ ID NO 38, 44, 46, 48 i/lub 50 albo wówczas gdy ML-236B wytwarza się w nieobecności jednego lub więcej cDNA odpowiadającego SEQ ID NO 37,43,45,47 i/lub 49.
Sposób wytwarzania prawastatyny według wynalazku polega na tym, że przeprowadza się sposób wytwarzania ML-236B określony wyżej i następnie przekształca się ML-236B w prawastatynę.
Tabela Listy Sekwencji
Lista sekwencji tworzy część niniejszego opisu patentowego. Aby pomóc w zrozumieniu podajemy następującą tabelę wyliczonych sekwencji.
SEQ ID NR tożsamość wstawka pML48 komplementarne do SEQ ID NO 1 primer do PCR dla Przykładu 4 primer do PCR dla Przykładu 4 oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (2) do 5'-RACE oligonukleotyd DNA (2) do 5'-RACE
Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8
PL 202 457 B1 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 Fragment końca 5'cDNA, Przykład 8
Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 primer RT-PCR, Przykład 9 primer RT-PCR, Przykład 9 mlcE; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcE primer RT-PCR, Przykład 12 primer RT-PCR, Przykład 12 mlcR; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcR mlcA; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcA mlcB; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcB mlcC; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcC mlcD; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcD primer RT-PCR, Przykład 17
Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17
Polinukleotydy kodujące sekwencję aminokwasów SEQ ID NO 38, 42, 44, 46, 48 lub 50 mogą być cDNA, genomowym DNA lub mRNA. Genomowe DNA kodujące każdą z tych sześciu sekwencji są określane jako geny struktury mlcE, mlcR, mlcA, mlcB, mlcC i mlcD, odpowiednio. Bez wiązania się tymi określeniami, uważamy, że te geny struktury kodują białka z następującymi funkcjami:
mlcA syntaza poliketydów mlcB syntaza poliketydów primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR,
PL 202 457 B1 mlcC monooksygenaza P450 mlcD reduktaza HMG-CoA mlcE pompa wypływowa mlcR czynnik transkrypcyjny
Stwierdzono, że włączenie mlcE lub cDNA odpowiadającego mlcE B oraz włączenie mlcR lub cDNA odpowiadającego mlcR może przyspieszyć biosyntezę ML-236B. Co więcej, mlcR stymuluje transkrypcyjną ekspresję mlcA do D. MlcA, B, C i D biorą udział w produkcji ML-236B, niezależnie i razem, jak wykazał y badania dysrupcji genów.
Warianty mlcA, B i/lub C uzyskiwane poprzez naturalne lub syntetyczne zmiany są pożyteczne do produkcji pochodnych ML-236B, w tym statyn takich jak prawastatyna lub lowastatyna. W tym względzie może być możliwe wyprodukowanie prawastatyny bezpośrednio przez takie warianty tylko z jednym etapem fermentacji i bez potrzeby konwersji ML-236B do prawastatyny przez mikroorganizmy Streptomyces carbophilus.
Polinukleotyd obejmujący sekwencję zawierającą SEQ ID NO 37, lub zawierającą jej mutanta lub wariant jest zdolny do przyspieszania biosyntezy ML-236B. Taki polinukleotyd DNA można uzyskać z transformowanej Escherichia coli pSAKexpE SANK 72499 (FERM BP-7005).
Polinukleotyd obejmujący sekwencję zawierającą SEQ ID NO 41 lub zawierającą jej mutanta lub wariant jest zdolny do przyspieszania biosyntezy ML-236B. Taki polinukleotyd DNA można uzyskać z transformowanej Escherichia coli pSAKexpE SANK 72599 (FERM BP-7006).
Polinukleotyd według wynalazku jest typowym DNA, cDNA lub genomowym DNA, lub RNA i może być sensowny albo antysensowny. Stosowany polinukleotyd jest oczyszczony, tzn. wolny od innych składników komórkowych.
Stosowane dalej określenie warianty polinukleotydu kodujące sekwencję aminokwasów wskazanych SEQ ID NO 38, 42, 44, 46, 48 lub 50, oznacza polinukleotydy gdzie zmieniony jest jeden lub więcej nukleotydów. Te zmiany mogą występować naturalnie i mogą być zrobione w obrębie nadmiarowości lub degeneracji tripletów kodu genetycznego. Takie zdegenerowane zmienione polinukleotydy kodują te same sekwencje aminokwasów. W obrębie tych wariantów polinukleotydów rozumiany jest także genomowy DNA mający eksony i introny, a nie samą sekwencję jak jest w przypadku cDNA.
Pojęcie warianty polinukleotydu kodujące sekwencję aminokwasów wskazanych SEQ ID NO 38, 42, 44, 46, 48 lub 50, obejmuje też polinukleotydy, które kodują zmodyfikowaną sekwencję aminokwasów mającą przynajmniej jedną delecję, addycję, substytucję lub zmianę oraz warianty polinukleotydu o wskazanych sekwencjach, które kodują sekwencje aminokwasów, które są krótsze, dłuższe lub tej samej długości jak kodowane przez wskazane sekwencje. Warianty polipeptydów zachowują zdolność do przyspieszania syntezy ML-236B i korzystnie mają aktywność zasadniczo podobną lub lepszą niż rodzicielska sekwencja, z której powstał wariant sekwencji.
Warianty polinukleotydu zachowują stopień identyczności z sekwencją rodzicielską. Odpowiedni stopień identyczności wynosi przynajmniej 60%, przynajmniej 80%, przynajmniej 90% lub przynajmniej 95% lub 100%. Stopień identyczności jest korzystnie oceniany przez program komputerowy taki jak program BLAST, który stosuje algorytm do przeprowadzenia poszukiwań homologii.
Polinukleotyd według wynalazku przyspiesza biosyntezę ML-236B w mikroorganizmie produkującym ML-236B. Przykłady mikroorganizmów produkujących ML-236B obejmują gatunki Penicillium, takie jak Penicillium citrinum, Penicillium brevicompactum [opisane w Brown, A.G. i wsp., J. Chem. Soc. Perkin-1., 1165(1976)], Penicillium cyclopium [opisane w Doss, S.L. i wsp., J. Natl. Prod.,49, 357 (1986)] lub podobne. Inne przykłady obejmują: Eupenicillium sp.M6603 [opisane w Endo A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Paecilomyces viridis FERM P-6236 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 58-98092], Paecilomyces sp.M2016 [opisane w Endo A. i wsp., J. Antibiot. -Tokyo, 39, 1609 (1986)], Trichoderma longibrachiatum M6735 [opisane w Endo, A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Hypomyces chrysospermus IFO 7798 [opisane w Endo A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Gliocladium sp. YJ-9515 [opisane w WO 9806867], Trichorderma viride IFO 5836 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 62-19159], Eupenicillium reticulisporum IFO 9022 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 62-19159], lub dowolny inny odpowiedni organizm.
Wśród tych mikroorganizmów produkujących ML-236B, korzystny jest Penicillium citrinum, a bardziej korzystny jest szczep Penicillium citrinum SANK 13380. Szczep Penicillium citrinum SANK 13380 zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu. FERM BP-4129, zgodnie z Traktatem
PL 202 457 B1
Budapeszteńskim o Deponowaniu Mikroorganizmów. Przykłady mikroorganizmów produkujących ML-236B także obejmują izolowane z naturalnych źródeł i mutowane naturalnie lub syntetycznie.
Wynalazek dotyczy polipeptydu obejmującego sekwencję NO 42, lub jej wariant, który ma z nią specyficzny stopień identyczności i który jest zdolny do przyspieszania produkcji ML236B w organizmie produkującym ML236B. Inne polipeptydy według wynalazku to te, które są kodowane przez opisane powyżej sekwencje polinukleotydu i warianty, które zachowują stopień identyczności.
Odpowiedni stopień identyczności wariantów polipeptydu do SEQ ID NO 42 jest przynajmniej 80%, przynajmniej 90% lub przynajmniej 95% lub 100%. Stopień identyczności wariantu jest korzystnie oceniany przez program komputerowy, taki jak program BLAST, który stosuje algorytm do przeprowadzenia poszukiwań homologii.
Polipeptydy według wynalazku obejmują krótsze lub dłuższe sekwencje SEQ ID NO 42 lub wariantów. Krótsze polipeptydy zawierają częściową sekwencję aminokwasów SEQ ID NO 42 lub jej wariantów i korzystnie zachowują zdolność do przyspieszania biosyntezy ML236B. Dłuższe polipeptydy zawierają całą lub częściową sekwencję aminokwasów SEQ ID NO 42 lub ich wariantów i korzystnie zachowują zdolność do przyspieszania biosyntezy ML236B. Dłuższe polipeptydy obejmują fuzje białkowe takie jak białko w fuzji z Fc.
W odpowiedzi na obecność polipeptydu według wynalazku mogą być wytwarzane zarówno poliklonalne jak i monoklonalne przeciwciała. Są one użyteczne do regulowania wytwarzania pochodnych ML-236B, takich jak statyny, a w tym prawastatyny i lowastatyny. Ponadto przeciwciała mogą być korzystnie użyte do analizy biosyntezy ML-236B i jego mechanizmów regulacyjnych. Taka analiza jest użyteczna do modulowania wytwarzania ML-236B i do wytwarzania pochodnych ML-236B.
Szczegółowy opis wynalazku
Twórcy wynalazku sklonowali genomowy DNA zawierający geny biorące udział w biosyntezie ML-236B u Penicillium citrinum. Genomowy DNA jest dalej określany jako genomowy DNA związany z biosyntezą ML-236B, i był sklonowany z biblioteki genomowego DNA mikroorganizmu produkującego ML-236B. Genomowy DNA analizowano by znaleźć geny struktury na tym genomowym DNA, następnie uzyskano cDNA odpowiadające tym genom struktury za pomocą odwrotnej transkrypcji - reakcji łańcuchowej z polimerazą (dalej określana jak RT-PCR) stosując całkowity RNA, który zawiera mRNA Penicillium citrinum jako matrycę. Stwierdzono, że biosynteza ML-236B w mikroorganizmie produkującym ML-236B była przyspieszona gdy mikroorganizm produkujący ML-236B był transformowany zrekombinowanym wektorem zawierającym te cDNA.
Niniejszy wynalazek dotyczy szczególnie cDNA (dalej określane jako cDNA przyspieszające biosyntezę ML-236B), które przyspieszają biosyntezę ML-236B w mikroorganizmie produkującym ML-236B gdy są wprowadzone do tego mikroorganizmu produkującego ML-236B.
Polinukleotyd według niniejszego wynalazku przyspieszający biosyntezę ML-236B, taki jak cDNA przyspieszający biosyntezę ML-236B obejmuje, jako przykłady:
(I) DNA uzyskany za pomocą syntezy stosując jako matrycę transkrybowany produkt (informacyjny RNA, dalej określany jako mRNA) genu struktury, który bierze udział w biosyntezie ML-236B i który istnieje w genomowym DNA mikroorganizmu produkującego ML-236B;
(II) dwuniciowy DNA wytworzony w wyniku asocjacji DNA (I) i DNA drugiej nici zsyntetyzowanego stosując DNA (I) jako pierwszą nić;
(III) dwuniciowy DNA wytworzony przez replikację lub amplifikację dwuniciowego DNA (II), na przykład, przez metodę klonowania lub podobną;
(IV) DNA, który może hybrydyzować do jednego z powyższych DNA lub mRNA w warunkach ostrych.
DNA (IV) może być tym pokazanym w dowolnej sekwencji genu struktury, na przykład jako nukleotydy Nr 1 do 1662 SEQ ID No. 37 lub nukleotydy Nr 1 do 1380 SEQ ID No 41.
Gdy dwa jednoniciowe kwasy nukleinowe hybrydyzują tworzą dwuniciową cząsteczkę w regionie, w którym są komplementarne lub wysoce komplementarne, i warunki ostre odpowiednio dotyczą przypadku gdy roztwór do hybrydyzacji jest 6 x SSC [1 x SSC ma skład 150 mM NaCI, 15 mM cytrynian sodu] i temperatura hybrydyzacji wynosi 55°C.
cDNA przyspieszający biosyntezę ML-236B może być uzyskany, na przykład, przez izolację klonu zawierającego cDNA z biblioteki cDNA mikroorganizmu produkującego ML-236B. Jako alternatywa można zastosować RT-PCR z użyciem pary primerów zaprojektowanych na podstawie sekwencji nukleotydów genomowego DNA związanego z biosyntezą ML-236B razem z mRNA lub całkowitym RNA mikroorganizmu produkującego ML-236B.
PL 202 457 B1
Mikroorganizm produkujący ML-236B jest mikroorganizmem mającym wewnętrzną zdolność do produkcji ML-236B. Jak uprzednio wskazano, przykłady mikroorganizmów produkujących ML-236B obejmują gatunki Penicillium takie jak Penicillium citrinum, Penicillium brevicompactum, Penicillium cyclopium lub podobne i inne przykłady obejmują: Eupenicillium sp.M6603, Paecilomyces viridis FERM P-6236, Paecilomyces sp.M2016, Trichoderma longibrachiatum M6735, Hypomyces chrysospermus IFO 7798, Gliocladium sp. YJ-9515, Trichorderma viride IFO 5836, Eupenicillium reticulisporum IFO 9022 i inne dowolne odpowiednie organizmy.
Wśród tych mikroorganizmów produkujących ML-236B, Penicillium citrinum jest korzystny i szczep Penicillium citrinum SANK 13380 jest bardziej korzystny. Szczep Penicillium citrinum SANK 13380 zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu FERM BP-4129, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów. Przykłady mikroorganizmów produkujących ML-236B także obejmują zarówno te izolowane ze źródeł naturalnych jak i zmutowane naturalnie lub sztucznie.
Genomowy DNA związany z biosyntezą ML236-B może być też uzyskany przez przeszukanie genomowej biblioteki DNA mikroorganizmu produkującego ML-236B odpowiednią sondą. Odpowiednio sonda jest zaprojektowana na podstawie sekwencji DNA, dla której przewiduje się rolę w biosyntezie ML-236B, odpowiednio pochodzącej z grzyba nitkowatego.
Wybór sposobów tworzenia biblioteki genomowego DNA nie jest ograniczony i może być stosowana dowolny odpowiedni sposób, korzystnie będący ogólnym sposobem konstrukcji biblioteki genomowego DNA organizmu eukariotycznego. Przykłady tego obejmują sposób Maniatis i wsp. [Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2., Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Inne odpowiednie sposoby są znane w dziedzinie.
Pokrótce, genomowy DNA z mikroorganizmu produkującego ML-236B może być otrzymany przez odzyskanie komórek z hodowli tego mikroorganizmu produkującego ML-236B, fizyczne rozbicie komórek, ekstrakcję DNA obecnego w jego jądrach i oczyszczenie tego DNA.
Hodowlę mikroorganizmu produkującego ML-236B można prowadzić w warunkach odpowiednich dla danego mikroorganizmu produkującego ML-236B. Na przykład hodowla Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B może być przeprowadzona przez zaszczepienie komórek w podłożu MBG3-8 [skład: 7% (waga/obj) gliceryna, 3% (waga/obj) glukoza, 1% (waga/obj) proszek sojowy, 1% (waga/obj) pepton (wyprodukowany przez Kyokuto Seiyaku Kogyo corporation), 1% (waga/obj) płyn z maceracji kukurydzy (wyprodukowany przez Honen corporation), 0,5% (waga/obj) azotan sodu, 0,1%(waga/obj) siedmiowodny siarczan magnezu (pH 6,5)] i inkubację w 22 do 28°C z wytrząsaniem przez 3 do 7 dni. Skos do przechowywania bakterii można przygotować przez wylanie roztopionego podłoża agarowego PGA [skład: 200g/L wyciągu ziemniaczanego, 15% (waga/obj) gliceryna, 2% (waga/obj) agar] do probówki i zestalenie agaru pod kątem. Penicillium citrinum można wówczas zaszczepić na skosie platynową igłą a następnie prowadzi się inkubację w 22 do 28°C przez 7 do 15 dni. Mikroorganizmy lub bakterie hodowane w ten sposób mogą być w sposób ciągły utrzymywane na skosie przez trzymanie skosu w 0 do 4°C.
Komórki mikroorganizmu produkującego ML-236B hodowane w podłożu płynnym można odzyskać za pomocą wirowania, a hodowane na podłożu stałym można zdrapać z podłoża stałego zdrapywaczem do komórek lub podobnym.
Fizyczne rozbicie komórek można przeprowadzić przez roztarcie komórek stosując tłuczek i moździerz, zamrożenie w ciekłym azocie i podobnie. DNA w jądrach rozbitych komórek może być wyekstrahowany stosując związek powierzchniowo czynny taki jak sól sodowa siarczanu dodecylu (dalej określany jako SDS) lub inny odpowiedni związek powierzchniowo czynny. Wekstrahowany genomowy DNA jest odpowiednio poddany działaniu fenolu - chloroformu aby usunąć białka i odzyskiwany jako osad przez przeprowadzenie strącania etanolem.
Powstały genomowy DNA fragmentuje się przez trawienie odpowiednim enzymem restrykcyjnym. Nie ma ograniczenia na enzymy restrykcyjne, które mogą być stosowane do trawienia restrykcyjnego, korzystne są ogólnie dostępne enzymy restrykcyjne. Przykłady obejmują Sau3AI. Inne odpowiednie enzymy są znane w dziedzinie. Trawiony DNA poddaje się następnie elektroforezie w żelu i genomowy DNA mają cy odpowiednią wielkość odzyskuje się ż elu. Wielkość fragmentu DNA nie jest szczególnie ograniczana, ale korzystnie wynosi 20 kb lub więcej.
Także nie ma ograniczenia wyboru wektora DNA stosowanego w konstrukcji biblioteki genomowego DNA, o ile wektor ma sekwencję DNA potrzebną do replikacji w komórce gospodarza, która
PL 202 457 B1 ma być transformowana przez wektor. Przykłady odpowiednich wektorów obejmują wektor plazmidowy, wektor fagowy, wektor kosmidowy, wektor BAC lub podobne, korzystny jest wektor kosmidowy. Wektor DNA jest korzystnie wektorem ekspresyjnym. Bardziej korzystnie wektor DNA zawiera DNA lub sekwencję nukleotydów, która nadaje selektywny fenotyp komórce gospodarza transformowanej wektorem.
Wektor DNA jest odpowiednio wektorem, który może być stosowany zarówno do klonowania i do ekspresji. Korzystnie wektor jest wektorem wahadł owym, który moż e być stosowany do transformacji więcej niż jednego mikroorganizmu- gospodarza. Wektor wahadłowy ma odpowiednio sekwencję DNA, która pozwala na replikację w komórce gospodarza i korzystnie sekwencję lub sekwencje, które pozwalają na replikację w szeregu różnych komórek gospodarza z różnych grup mikroorganizmów takich jak bakterie i grzyby. Dalej, wektor wahadłowy korzystnie zawiera sekwencję DNA, która może zapewnić fenotyp selekcyjny dla zakresu różnych komórek gospodarza, takich jak komórki z róż nych grup mikroorganizmów.
Wybór kombinacji grupy mikroorganizmów i komórek gospodarza transformowanych przez wektor wahadłowy nie jest szczególnie ograniczany pod warunkiem, że jedna z grup mikroorganizmów może być użyta do klonowania a druga ma zdolność do produkcji ML-236B. Takie kombinacje mogą być, na przykład, kombinacją bakterii i grzybów nitkowatych, kombinacją drożdży i grzybów nitkowatych, z korzystną kombinacją bakterii i grzybów nitkowatych. Wybór bakterii nie jest szczególnie ograniczany o ile może ona być ogólnie stosowana w biotechnologii, taka jak na przykład Escherichia coli, Bacillus subtilis lub podobne. Escherichia coli jest korzystne i Escherichia coli XL1-Blue MR jest najbardziej korzystna. Podobnie nie ma ograniczenia gatunku drożdży o ile może być on ogólnie stosowany w biotechnologii tak jak na przykład Saccharomyces cerevisiae lub podobne. Przykłady grzybów nitkowatych obejmują mikroorganizmy produkujące ML-236B opisane powyżej. Inne odpowiednie przykłady mikroorganizmów są znane w dziedzinie.
W niniejszym wynalazku, grupa mikroorganizmów moż e być wybrana z bakterii, grzybów nitkowatych i drożdży.
Przykłady wymienionego powyżej wektora wahadłowego obejmują wektor kosmidowy mający odpowiedni gen markera do selekcji fenotypu i miejsce cos. Inne odpowiednie wektory są znane w dziedzinie. Korzystnym wektorem jest pSAKcos1, skonstruowany przez wstawienie miejsca cos z wektora kosmidowego pWE15 (wyprodukowany przez STRATAGENE) do plazmidu pSAK333, który zawiera sekwencję genu fosfotransferazy hygromycyny B Escherichia coli [opisane w Japońskim Zgłoszeniu Patentowym Publikacja Nr 3-262486]. Sposób konstrukcji pSAKcos1 przedstawiono na Figurze 1. Niniejszy wynalazek nie jest ograniczony do tego wektora.
Biblioteką genomowego DNA można przygotować przez wprowadzenie wektora wahadłowego do komórki gospodarza, wektor zawiera genomowy fragment DNA z mikroorganizmu produkującego ML-236B. Komórka gospodarza, która ma być stosowana jest korzystnie Escherichia coli, bardziej korzystnie Escherichia coli XL1-Blue MR. Gdy komórka gospodarza jest Escherichia coli, wprowadzenie można przeprowadzić przez pakowanie in vitro. W niniejszym wynalazku transformacja także obejmuje wprowadzanie obcego DNA przez pakowanie in vitro, i transformowana komórka także obejmuje komórkę, do której obcy DNA wprowadzono za pomocą pakowania in vitro.
Biblioteka genomowa może być przeszukiwana aby zidentyfikować pożądany klon stosując jako sondą przeciwciało lub kwas nukleinowy, przy czym sonda kwasu nukleinowego jest korzystna. Korzystnie sondę kwasu nukleinowego przygotowuje się w oparciu o sekwencją nukleotydów genu lub DNA związanego z biosyntezą poliketydów, korzystnie jest to sekwencja pochodząca z grzyba nitkowatego. Wybór danego genu nie jest ograniczony o ile bierze on udział w biosyntezie poliketydów a jego sekwencja nukleotydów jest znana. Przykł ady takich genów obejmują gen PKS aflatoksyny Aspergillus flavus i Aspergillus parasiticus, gen PKS sterygmatocystyny Aspergillus nidulans lub podobne.
Odpowiednie sondy kwasu nukleinowego można uzyskać, na przykład, przez syntezą sondy oligonukleotydowej zawierającej część znanej genomowej sekwencji DNA jak opisano powyżej lub przez przygotowanie primerów oligonukleotydowych i amplifikacją docelowego DNA stosując reakcję łańcuchową polimerazy [dalej określaną jako PCR, opisane w Saiki, R. K i wsp., Science, 239, 487 (1988)] i genomowy DNA jako matrycą lub poprzez RT-PCR stosując mRNA jako matrycę. Inne odpowiednie sposoby otrzymania takich sond są dobrze znane w dziedzinie.
Sonda kwasu nukleinowego może być otrzymana z mikroorganizmu produkującego ML-236B, używając na przykład PCR lub RT-PCR. Zaprojektowanie primerów stosowanych do PCR lub RT-PCR
PL 202 457 B1 (dalej określany jako primer do PCR) jest korzystnie przeprowadzane na podstawie sekwencji nukleotydów genu związanego z biosyntezą poliketydów dla którego jest znana sekwencja nukleotydów. Korzystnie gen jest genem PKS aflatoksyny Aspergillus flavus, Aspergillus parasiticus, lub genem PKS sterygmatocystyny Aspergillus nidulans.
Primery do PCR są odpowiednio zaprojektowane by zawierały sekwencje nukleotydów, które kodują sekwencje aminokwasów, które są wysoce konserwatywne w genach PKS. Sposoby identyfikacji sekwencji nukleotydów odpowiadających danej sekwencji aminokwasów obejmują dedukcję na podstawie wykorzystywania kodonów komórki gospodarza, i sposoby przygotowywania mieszanych sekwencji oligonukleotydów stosując wielokrotne kodony (dalej określany jako 'zdegenerowane oligonukleotydy'). W tym drugim przypadku wielokrotność oligonukleotydów może być zmniejszona przez wprowadzenie hipoksantyny do ich sekwencji nukleotydów.
Primer do PCR może zawierać sekwencją nukleotydów zaprojektowaną aby hybrydyzowała z nicią matrycy, primer jest połączony z dodatkową sekwencją 5'. Wybór takiej dodatkowej sekwencji nukleotydów 5' nie jest szczególnie ograniczony tak długo jak primer może być użyty do PCR lub RT-PCR. Taka dodatkowa sekwencja 5' może być na przykład, sekwencją nukleotydów wygodną dla klonowania produktu PCR. Taka sekwencja nukleotydów może być na przykład, miejscem cięcia enzymu restrykcyjnego lub sekwencją nukleotydów zawierającą miejsce cięcia enzymu restrykcyjnego.
Dalej w projektowaniu primera do PCR, jest korzystne, że suma liczby zasad guaninowych (G) i liczba cytozynowych (C) wynosi 40 do 60% całkowitej liczby zasad. Dalej, korzystnie występuje mało lub brak autohybrydyzacji danego primera i w przypadku pary primerów, korzystnie mało lub brak hybrydyzacji między primerami.
Liczba nukleotydów tworzących primer do PCR nie jest szczególnie ograniczona, o ile może być stosowany do PCR. Dolna granica liczby wynosi na ogół 10 do 14 nukleotydów, z górną granicą 40 do 60 nukleotydów. Korzystnie, primery mają 14 do 40 oligonukleotydów długości.
Primer do PCR korzystnie jest DNA. Nukleozydy w primerze mogą być deoksy adenozyną, deoksycytydyną, deoksytymidyną i deoksyguanozyną i dodatkowo deoksyinozyną. Pozycja 5' nukleozydu na końcu 5' primera do PCR jest odpowiednio grupą hydroksylową do której jest przyłączony jeden kwas fosforowy za pomocą wiązania estrowego.
Synteza primera do PCR może być przeprowadzona za pomocą sposobów do syntezy kwasów nukleinowych, na przykład metody fosfoamidynowej. W takim sposobie może być korzystnie stosowany automatyczny syntetyzator DNA.
Genomowy DNA i mRNA z mikroorganizmu produkującego ML-236B mogą być stosowane jako matryce dla odpowiednio PCR lub RT-PCR. Całkowity RNA może też być stosowany jako matryca do RT-PCR zamiast mRNA.
Produkt PCR lub produkt RT-PCR może być klonowany poprzez włączenie do odpowiedniego wektora DNA. Wybór wektora DNA stosowanego do etapu klonowania na ogół nie jest ograniczony. Zestawy do łatwego klonowania produktów PCR i RT-PCR są dostępne handlowo. Jako przykład, Original TA Cloning Kit (wyprodukowany przez lnvitrogen: stosujący pCR2.1 jako wektor DNA) jest odpowiedni do takiego klonowania.
Aby uzyskać taki sklonowany produkt PCR, transformowane komórki gospodarza zawierające plazmidy zawierające pożądany produkt PCR hoduje się i następnie plazmidy ekstrahuje się z komórek i oczyszcza. Wstawiony fragment DNA następnie odzyskuje się z powstałego plazmidu.
Hodowanie transformowanych komórek gospodarza odpowiednio przeprowadza się w warunkach odpowiednich dla komórek gospodarza. Korzystna komórka gospodarza, Escherichia coli, może być hodowana w podłożu LB [1% (waga/obj) trypton, 0,5% (waga/obj) ekstrakt drożdżowy, 0,5% (waga/obj) chlorek sodu] w 30 do 37°C przez 18 godzin do dwóch dni z wytrząsaniem.
Preparatyka plazmidów z hodowli transformowanych komórek gospodarza może być przeprowadzona przez odzyskanie komórek gospodarza i izolację plazmidów wolnych od innych składników komórki takich jak genomowy DNA lub białko gospodarza. Preparatykę DNA plazmidowego z hodowli Escherichia coli można przeprowadzić według metody lizy alkalicznej Maniatisa [opisane w Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2., Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Handlowo są dostępne zestawy do uzyskania plazmidu mającego wyższą czystość. Plasmid Mini Kit [wyprodukowany przez QIAGEN AG] jest korzystny. Dalej dostępny jest handlowo zestaw do masowej produkcji plazmidu. Plasmid Maxi Kit (wyprodukowany przez QIAGEN AG) jest korzystny.
PL 202 457 B1
Stężenie powstałego DNA plazmidu można określić przez pomiar absorbancji przy długości fali
260 nm po odpowiednim rozcieńczeniu próbki DNA i wyliczeniu na podstawie, że roztwór z absorbancją OD260 1 zawiera 50 μg/ml DNA (opisane w Maniatis T., i wsp., powyżej).
Czystość DNA można wyliczyć ze stosunku absorbancji przy długości fali 280 i 260 nm (opisane w Maniatis, T. i wsp., powyżej).
Sposoby znakowania sond kwasów nukleinowych można ogólnie sklasyfikować jako znakowanie radioaktywne i nie radioaktywne. Wybór radionukleotydu do znakowania radioaktywnego nie jest na ogół ograniczony i może być na przykład, 32P, 35S, 14C lub podobne. Stosowanie 32P w znakowaniu jest korzystne. Wybór czynnika do znakowania nieradioaktywnego także nie jest ogólnie ograniczony, o ile może być ogólnie stosowany do znakowania kwasów nukleinowych i może być, na przykład, digoksygeniną, biotyną lub podobnym, digoksygenina jest korzystna.
Sposoby znakowania sondy kwasów nukleinowych także nie są ogólnie ograniczone. Korzystne są powszechnie stosowane sposoby takie jak na przykład, sposoby włączające znak do produktu za pomocą PCR lub RT-PCR stosując znakowane substraty nukleotydowe, nick translację, stosowanie losowych primerów, znakowanie końców i sposoby syntetyzowania oligonukleotydów DNA stosując znakowane substraty nukleotydowe. Odpowiedni sposób może być wybrany z tych sposobów w zależności od typu sondy kwasu nukleinowego.
Obecność w genomie mikroorganizmu produkującego ML-236B sekwencji nukleotydów, która jest taka sama jak sekwencja nukleotydów danej sondy kwasu nukleinowego może być potwierdzona za pomocą hybrydyzacji typu Southerna z genomowym DNA tego mikroorganizmu produkującego
ML-236B.
Hybrydyzacja typu Southerna może być przeprowadzona według sposobu Maniatis [opisane w Maniatis, T. i wsp., powyżej].
Znakowana sonda kwasu nukleinowego przygotowana jak opisano powyżej może być stosowana do przeszukiwania biblioteki genomowego DNA. Wybór sposobu przeszukiwania nie jest szczególnie ograniczony o ile jest on ogólnie odpowiedni do klonowania genów, ale jest korzystnie metodą hybrydyzacji kolonijnej [opisane w Maniatis, T., i wsp., powyżej].
Hodowla kolonii stosowanych do hybrydyzacji kolonijnej jest odpowiednio przeprowadzana w warunkach odpowiednich dla komórki gospodarza. Hodowla Escherichia coli, korzystnego gospodarza może być przeprowadzona przez inkubację w podłożu agarowym LB [1% (waga/obj) trypton, 0,5% (waga/obj) ekstrakt drożdżowy, 0,5% (waga/obj) chlorek sodu, 1,5% (waga/obj) agaroza] w 30 do 37°C przez 18 godzin do dwóch dni.
Preparatyka wektora zrekombinowanego DNA z dodatniego klonu uzyskanego za pomocą hybrydyzacji kolonijnej na ogół jest przeprowadzana przez ekstrakcją plazmidu z hodowli dodatniego klonu i oczyszczenia go.
Transformowany szczep Escherichia coli, Escherichia coli pML48 SANK71199 reprezentujący dodatni klon uzyskany według niniejszego wynalazku, zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 7 lipca, 1999, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów i uzyskał numer dostąpu FERM BP-6780.
Typowy wektor DNA niesiony przez Escherichia coli pML48 SANK71199 określono jako pML48.
Potwierdzenie, że zrekombinowany wektor DNA obecny w dodatnim klonie zawiera genomowy DNA związany z biosyntezą ML-236B można odpowiednio uzyskać przez ustalenie sekwencji nukleotydów wstawki zrekombinowanego wektora DNA, hybrydyzację typu Southerna lub ekspresję wstawki w celu ustalenia funkcji.
Sekwencję nukleotydów DNA można ustalić za pomocą techniki modyfikacji chemicznej Maxama i Gilberta [opisane w Maxam, A. M. M. i Gilbert, W., Methods in Enzymology, 65, 499 (1980)] lub metodą terminacji łańcucha dideoksy [opisane w Messing, J. i Vieira, J., Gene, 19, 269 (1982)]. Inne odpowiednie sposoby są dobrze znane w dziedzinie. DNA plazmidowy stosowany do określania sekwencji nukleotydów korzystnie jest próbką o wysokiej czystości, jak opisano powyżej.
Sekwencja nukleotydów wstawki pML48 jest przedstawiona w SEQ ID No. 1 Listy sekwencji. Sekwencja nukleotydów przedstawiona w SEQ ID No. 2 Listy sekwencji jest całkowicie komplementarna do sekwencji nukleotydów przedstawionej w SEQ ID No. 1. Ogólnie, sekwencja nukleotydów genomowego DNA może mieć polimorfizmy genetyczne w obrębie gatunku, to znaczy różnice allogeniczne. Dalej, w procesie klonowania i sekwencjonowania DNA wiadomo, że podstawienia nukleotydów lub inne zmiany, mogą zachodzić z pewną częstością. Tak więc genomowy DNA związany z biosyntezą ML-236B także obejmuje genomowy i inne DNA, które mogą być hybrydyzowane do
PL 202 457 B1
DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji. Korzystny są genomowy lub inne DNA, które mogą hybrydyzować w warunkach ostrych do DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji. Te DNA obejmują DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji, znamienny tym, że jeden lub więcej nukleotydów jest podstawionych, wydeletowanych i/lub dodanych. Dodatkowo ten hybrydyzujący genomowy lub inny DNA mogą obejmować DNA pochodzący z mikroorganizmów produkujących ML-236B innych niż Penicillium citrinum SANK13380, korzystnie są to te zdolne do poprawienia produkcji ML-236B gdy są wprowadzone do mikroorganizmu produkującego ML-236B.
Genomowy DNA związany z biosyntezą ML-236B odpowiednio się analizuje zgodnie z następującymi sposobami 1) do 3).
1) Analiza za pomocą programów analizujących geny
Geny w obrębie genomowego DNA można znaleźć stosując program do szukania genów (dalej określany jako GRAIL) i program do poszukiwania homologicznych sekwencji (BLASTN i BLASTX).
GRAIL jest programem, który poszukuje genów struktury w genomowym DNA przez rozdzielenie genomowych sekwencji na siedem parametrów dla oceny wyglądu sekwencji genu i integrację wyników stosując metodę sieci [opisane w Uberbacher, E.C. i Mural, R.J., Proc. Natl. Acad. Sci. USA., 88, 11261 (1991)]. Jako przykład, można stosować ApoCom GRAIL Toolkit [produkowany przez Apocom corporation].
BLAST jest programem stosującym algorytm do przeprowadzania poszukiwań homologii sekwencji nukleotydów i sekwencji aminokwasów [opisane w Altschul, S.F., Madden, T. L. i wsp., Nucl. Acids Res., 25, 3389 (1997)].
Pozycję i kierunek genu struktury w przykładowej sekwencji genomowego DNA można przewidzieć przez podział sekwencji DNA na odpowiednie długości i przeprowadzenie poszukiwania homologii w genetycznej bazie danych stosując BLASTN. Pozycja i kierunek genu struktury w sekwencji DNA, która ma być testowana może też być przewidziana przez translację podzielonych sekwencji genomowego DNA na sześć ramek translacji (trzy na nici sensownej i pozostałe trzy na nici antysensownej) i przeprowadzenie poszukiwania homologii wywiedzionych sekwencji aminokwasów w bazie danych peptydów stosując BLASTX.
Kodujące obszary genów struktury w genomowym DNA są czasami podzielone przez introny u organizmów eukariotycznych. Do analizy genów struktury mających takie przerwy, bardziej skuteczny jest program BLAST dla sekwencji zawierających przerwy, korzystny jest program Gapped-BLAST (zainstalowany w BLAST2: WISCONSIN GCG package ver. 10.0).
2) Analiza według metody hybrydyzacji typu Northern
Ekspresja genu struktury przewidzianego przez sposoby analizy opisane w akapicie 1) może być badana stosując metodę hybrydyzacji typu Northern.
Odpowiednio uzyskuje się całkowity RNA z mikroorganizmu produkującego ML-236B z hodowli mikroorganizmu. Hodowlę korzystnego mikroorganizmu produkującego ML-236B Penicillium citrinum można uzyskać przez zaszczepienie tego mikroorganizmu ze skosu do podłoża MGB3-8 a następnie inkubację z wytrząsaniem, inkubując w 22 do 28°C przez jeden do czterech dni.
Wybór metody ekstrakcji RNA z mikroorganizmu produkującego ML-236B nie jest ograniczony i korzystna jest metoda rodanek guanidyny- gorą cy fenol, metoda rodanek guanidyny- chlorowodorek guanidyny i podobne. Przykłady handlowo dostępnego zestawu do przygotowania całkowitego RNA o wysokiej czystoś ci obejmują RNeasy Plant Mini Kit (wyprodukowany przez Qiagen AG). Co wię cej, mRNA można uzyskać przez nałożenie całkowitego RNA na kolumnę oligo (dT) i odzyskanie frakcji zaadsorbowanej na kolumnie.
Przeniesienie RNA na membranę, przygotowanie sondy, hybrydyzacja i detekcja sygnału mogą być przeprowadzone w podobny sposób do wymienionej powyżej metody hybrydyzacji Southerna.
3) Analiza końca 5' i końca 3' transkryptu
Analiza końca 5' i końca 3' każdego transkryptu może być przeprowadzona według metody 'RACE' (szybka amplifikacja końców cDNA). RACE jest metodą uzyskania cDNA zawierającego znany region nukleotydów i nieznany region na końcu 5' lub końcu 3' genu, stosując RT-PCR z mRNA jako matrycą [opisane w Frohman. M. A., Methods Enzymol. 218, 340 (1998)].
5'-RACE można przeprowadzić według następującego sposobu. Pierwsza nić cDNA jest syntetyzowana według reakcji odwrotnej transkryptazy stosując mRNA jako matrycę. Jako primer stosuje się oligonukleotydy antysensowne (1), które są zaprojektowane na znane części sekwencji nukleotydów. Homopolimeryczny łańcuch nukleotydów (złożony z jednego rodzaju zasady) dodaje się do koń12
PL 202 457 B1 ca 3' pierwszej nici cDNA stosując terminalną transferazę deoksynukleotydów. Następnie dwuniciowy cDNA w regionie 5' końca amplifikuje się za pomocą PCR stosując pierwszą nić cDNA jako matrycę. Do amplifikacji stosuje się 2 primery; oligonukleotyd DNA z nici sensownej zawierający sekwencję komplementarną do sekwencji homopolimerycznej oligonukleotyd (2) na nici antysensownej na końcu 3' oligonukleotydu DNA (1) [opisane w Frohman, M.A., Methods in Enzymol., 218, 340 (1993]. Zestaw do 5' RACE jest dostępny handlowo, odpowiednio 5' RACE System for Rapid Amplification of cDNA ends, Version 2.0 (wyprodukowany przez GIBCO Corporation).
3' RACE jest metodą stosującą region poliA istniejący na końcu 3' mRNA. Specyficznie, pierwsza nić cDNA jest syntetyzowana przez reakcję odwrotnej transkrypcji stosując mRNA jako matrycę adaptor oligo d(T) jako primer. Następnie dwuniciowy cDNA w regionie końca 3' jest amplifikowany za pomocą PCR stosując pierwszą nić cDNA jako matrycę. Jako primery stosuje się oligonukleotyd DNA (3) na nici sensownej zaprojektowany do znanej części sekwencji nukleotydów nici sensownej i adaptor oligo d(T) na nici antysensownej. Zestaw do 3' RACE jest handlowo dostępny, odpowiednio Ready-To-Go T-primed First-Strand Kit (Pharmacia Corporation).
Wyniki analizy 1) i 2) powyżej są korzystnie stosowane w procedurze RACE, w projektowaniu primerów opartym na znanej części interesującej sekwencji nukleotydów.
Stosując metody analizy opisane w 1) do 3) powyżej można wydedukować kierunek genu struktury w sekwencji genomowego DNA, położenie miejsca inicjacji transkrypcji w genie struktury, pozycję kodonu inicjacji translacji i kodon terminacji translacji i jego pozycję. W oparciu o powyższą informację można uzyskać każdy gen struktury i jego cDNA a mianowicie cDNA przyspieszających biosyntezę ML-236B.
Zakłada się, że we włączonej sekwencji w zrekombinowanym wektorze DNA pML48 uzyskanym według niniejszego wynalazku jest obecnych sześć genów struktury. Nazwane są odpowiednio mlcA mlcB, mlcC, mlcD, mlcE, i mlcR. Wśród nich zakłada się, że mlcA mlcB, mlcE i mlcR mają region kodujący na sekwencji nukleotydów przedstawionych w SEQ ID No. 2 Listy sekwencji. Zakłada się, że mlcC i mlcD mają region kodujący na sekwencji nukleotydów przedstawionej w SEQ ID No. 1 Listy sekwencji.
Przykłady sposobu uzyskania cDNA specyficznie przyspieszających biosyntezę ML-236B odpowiadających wymienionym powyżej genom struktury obejmują: klonowanie z RT-PCR stosując primery zaprojektowane dla sekwencji każdego genu struktury i jego flankującego DNA i klonowanie z biblioteki cDNA stosują c odpowiednie sondy DNA zaprojektowane dla znanych sekwencji nukleotydów. Inne odpowiednie metody są dobrze znane w dziedzinie. Aby wyrażać funkcjonalnie cDNA uzyskany według tych sposobów, korzystne jest uzyskanie cDNA pełnej długości.
Poniżej wytłumaczono sposób uzyskana cDNA przyspieszających biosyntezę ML-236B stosując RT-PCR.
Musi być zaprojektowana para primerów do RT-PCR i do uzyskania cDNA przyspieszającego biosyntezę ML-236B tak, że selektywnie hybrydyzuje z każdym łańcuchem matrycy, aby pozwolić na uzyskanie cDNA. Jednak nie jest niezbędne by primery do RT-PCR były całkowicie komplementarne do części każdego łańcucha matrycy, pod warunkiem że spełniają warunek opisany powyżej. Odpowiednie primery do RT-PCR, które mogą hybrydyzować z łańcuchem antysensowny, (dalej określany jako primer sensowny) są primerami sensownymi, które są całkowicie komplementarne do części łańcucha antysensownego (dalej określany jako niepodstawiony primer sensowny) lub primery sensowne, które nie są całkowicie komplementarne do części łańcucha antysensownego (dalej określany jako częściowo podstawiony primer sensowny). Inne odpowiednie primery do RT-PCR, które mogą hybrydyzować z łańcuchem sensownym (dalej określany jako primer antysensowny) są primerami antysensownymi, które są całkowicie komplementarne do części łańcucha sensownego (dalej określany jako niepodstawiony primer antysensowny) lub primery antysensowne, które nie są całkowicie komplementarne do części łańcucha sensownego (dalej określany jako częściowo podstawiony primer antysensowny).
Primer sensowny jest zaprojektowany odpowiednio tak, że produkt RT-PCR uzyskany z jego zastosowaniem zawiera kodon ATG w oryginalnej pozycji inicjacji translacji. Odpowiednio produkt RT-PCR także tylko zawiera prawidłowy kodon terminacji translacji w ramce odczytu mającej oryginalne miejsce startu ATG i nie ma dodatkowych (pozornych) miejsc zakończenia translacji. Pozycja kodonu inicjacji translacji tych genów struktury przewidzianych w niniejszym wynalazku jest przedstawiona w Tabeli 5 dla genów umieszczonych w SEQ ID No. 1 i SEQ ID No. 2 Listy sekwencji.
PL 202 457 B1
Koniec 5' niepodstawionego primeru sensownego jest odpowiednio nukleotydem 'A' kodonu inicjacji translacji ATG, lub zasadą istniejącą na jego końcu 5'.
Częściowo podstawiony primer sensowny hybrydyzuje selektywnie ze specyficznym regionem w SEQ ID No. 1 lub SEQ ID No. 2 Listy sekwencji, sekwencja nukleotydów SEQ ID No. 2 Listy sekwencji, który jest całkowicie komplementarna do SEQ ID No. 1 Listy sekwencji.
Gdy częściowo podstawiony primer sensowny zawiera sekwencję nukleotydów obecną po stronie 3' kodonu inicjacji translacji ATG, odpowiednio nie zawiera sekwencji nukleotydów w tym regionie, które są kodonami terminacyjnymi (TAA, TAG lub TGA) w tej samej ramce odczytu jak ATG.
Częściowo podstawiony primer sensowny może zawierać nukleotyd A, sekwencję nukleotydówAT lub ATG (dalej określany jako nukleotyd lub sekwencja nukleotydów m') która odpowiada nukleotydowi A, sekwencji nukleotydówAT lub ATG kodonu inicjacji translacji (dalej określany jako nukleotyd lub sekwencja nukleotydów m'). Gdy nukleotyd m' jest A, odpowiadający A sekwencji m, preferujemy że m' A jest umieszczone na końcu 3' częściowo podstawionego primera sensownego. Podobnie, gdy m' jest AT, korzystne jest żeby ta sekwencja m' AT była zlokalizowana na końcu 3' częściowo podstawionego primera sensownego. Gdy nukleotyd lub sekwencja nukleotydów m jest ATG, odpowiadające m' ATG, korzystne jest by te trinukleotydy, które są od strony 3' ATG w primerze nie były kodonami stop. Inaczej mówiąc, dla trinukleotydów nukleotyd końca 5' jest (3 x n +1) tym nukleotydem (n przedstawia liczbę całkowitą o wartości jedne lub więcej) liczone od A do m' ATG w kierunku końca 3' sekwencja nukleotydów trinukleotydu korzystnie nie jest TAA, TAG ani TGA. Primery opisane powyżej mogą być stosowane do uzyskania cDNA mającego kodon metioniny w pozycji odpowiadającej kodonowi inicjacji translacji mRNA stosowanego jako matryca RT-PCT.
Gdy koniec 3' częściowo podstawionego primera sensownego jest pozycją nukleotydu (3 x n + 1), korzystnie trinukleotyd, który rozpoczyna się w tej pozycji nie jest TAA, TAG ani TGA w produkcie RT-PCR uzyskanym stosując częściowo podstawiony primer sensowny jako jeden z primerów i RNA lub mRNA mikroorganizmu produkującego ML-236B jako matrycę, lub w produktach PCR uzyskanych poprzez genomowy DNA lub cDNA jako matrycę. Pozycja nukleotydu jest liczona od 'A' kodonu inicjacji translacji ATG w kierunku końca 3' i gdzie 'n' reprezentuje liczbę całkowitą jeden lub więcej.
Gdy koniec 3' częściowo podstawionego primera sensownego jest pozycją nukleotydu (3 x n + 2), trójka, dla której pozycja 3 x n+2 jest nukleotydem centralnym korzystnie nie jest żadną z sekwencji TAA, TAG ani TGA dla produktu PCR lub RT-PCR otrzymanego jak powyżej.
Gdy koniec 3' częściowo podstawionego primera sensownego jest w pozycji nukleotydu (3 x n+ 3), trójka, dla której pozycja (3 x n+ 3) przy 3' nukleotydzie korzystnie nie jest żadną z sekwencji TAA, TAG lub TGA.
Wymagania dla primera sensownego są jak przedyskutowano powyżej.
Zaprojektowano primer antysensowny tak, że gdy jest sparowany z primerem sensownym, można zamplifikować cDNA kodujący każdy z genów struktury (mlcA, mlcB, mlcC, mlcD, mlcE i mlcR) stosując RT-PCR w kierunku równoważnym do N-końca i C-końca odpowiadających peptydów.
Wybór niepodstawionego primera antysensownego nie jest ograniczony o ile jest primerem antysensownym mającym sekwencję nukleotydów komplementarną do sekwencji nukleotydów umieszczonej w regionie miejsca terminacji translacji cDNA. Jednak korzystny jest primer mający zasadę na końcu 5', która jest komplementarna do zasady na końcu 3' tego primera. Primer zawierający trzy zasady komplementarne do kodonu terminacji translacji, jest korzystny. Tabele 8 do 10 przedstawiają kodon terminacji translacji każdego genu struktury, sekwencję komplementarną do kodonu terminacji translacji, resztę aminokwasu na C-końcu peptydu kodowanego przez każdy gen struktury, sekwencję nukleotydów kodującą reszty aminokwasów i ich pozycji SEOJD No. 1 lub SEQ ID No. 2.
Częściowo podstawione primery antysensowne hybrydyzują selektywnie ze specyficznym obszarem w sekwencji nukleotydów SEQ ID No. 1 lub SEQ ID No. 2 Listy sekwencji.
Powyższe są wymaganiami dla primera antysensownego.
Jest możliwe dodanie odpowiedniej sekwencji nukleotydów do końca 5' częściowo podstawionych primerów sensownych i częściowo podstawionych primerów antysensownych o ile są spełnione powyżej wymienione wymagania. Wybór takiej sekwencji nukleotydów nie jest szczególnie ograniczony o ile primer może być użyty do PCR. Przykłady odpowiednich sekwencji obejmują sekwencje nukleotydów wygodne do klonowania produktów PCR, takie jak miejsca cięcia enzymów restrykcyjnych i sekwencję nukleotydów zawierającą odpowiednie miejsca cięcia enzymów restrykcyjnych.
Dodatkowo primer sensowny i primer antysensowny są odpowiednio zaprojektowane zgodnie z powyż szym opisem i z ogólnym schematem projektowania primerów do PCR.
PL 202 457 B1
Jak opisano powyżej, mRNA lub całkowity RNA z organizmu produkującego ML-236B może być stosowany jako matryca do RT-PCR. W obecnym wynalazku przyspieszający biosyntezę ML-236B cDNA odpowiadający genowi struktury mlcE uzyskano przez zaprojektowanie i syntezę pary primerów odpowiednich do amplifikacji całej sekwencji kodującej genu struktury mlcE w sekwencji wstawki pMI-48 i następnie przeprowadzenie RT-PCR stosując całkowity RNA SANK13380 jako matrycę [primery reprezentowane przez sekwencje nukleotydów SEQ ID No. 35 i 36 Listy sekwencji, odpowiednio].
Przyspieszający biosyntezę ML-236B cDNA odpowiadający genowi struktury mlcR uzyskano w podobny sposób stosując primery reprezentowane przez sekwencje nukleotydów SEQ ID No. 39 i 40 Listy sekwencji, odpowiednio.
Jak opisano powyżej, produkt RT-PCR może być sklonowany przez włączenie do odpowiedniego wektora DNA. Wybór wektora DNA stosowanego do takiego klonowania nie jest ograniczony i jest odpowiednio wektorem DNA ogólnie stosowanym do klonowania fragmentów DNA. Zestawy do łatwego przeprowadzenia klonowania produktu RT-PCR są dostępne handlowo i korzystny jest Original TA Cloning Kit [wyprodukowany przez lnvitrogen: stosujący pCR2.1 jako wektor DNA].
Potwierdzenie funkcjonalnej ekspresji cDNA przyspieszającego biosyntezę ML-236B cDNA uzyskanego stosując powyższe sposoby w mikroorganizmie produkującym ML-236B może być uzyskane przez sklonowanie cDNA do wektora DNA odpowiedniego do funkcjonalnej ekspresji w mikroorganizmie produkującym ML-236B. Odpowiednie komórki są wówczas transformowane zrekombinowanym wektorem i porównuje się zdolność do biosyntezy ML-236B transformowanych i nietransformowanych komórek gospodarza. Jeśli cDNA przyspieszający biosyntezę ML-236B jest funkcjonalnie wyrażany w transformowanej komórce wówczas zdolność do biosyntezy ML-236B transformowanej komórki jest poprawiona w porównaniu z komórką gospodarza.
Wybór wektora DNA odpowiedniego do ekspresji w mikroorganizmie produkującym ML-236B [dalej określany jako funkcjonalny wektor ekspresyjny] nie jest szczególnie ograniczony o ile może być on stosowany do transformacji mikroorganizmu produkującego ML-236B i może funkcjonalnie wyrażać polipeptyd kodowany przez cDNA przyspieszający biosyntezę ML-236B w tym organizmie. Korzystnie wektor jest odpowiedni w komórce gospodarza, i ma sekwencję nukleotydów, która pozwala na replikację w komórce gospodarza.
Wektor do funkcjonalnej ekspresji może zawierać jeden lub więcej niż jeden cDNA przyspieszający biosyntezę ML-236B, na przykład cDNA odpowiadające genom struktury mlcE i/lub mlcR.
Wektor do funkcjonalnej ekspresji może zawierać jeden lub więcej rodzajów DNA, innych niż cDNA odpowiadający genom struktury mlcE i/lub mlcR, które przyspieszają biosyntezę ML-236B gdy są wprowadzane do mikroorganizmu produkującego ML-236B. Przykłady takich DNA obejmują: cDNA odpowiadające genom struktury mlcA, mlcB, mlcC, lub mlcD, genomowy DNA związany z biosyntezą ML-236B, DNA kodujący czynniki regulujące ekspresją cDNA przyspieszającego biosyntezę ML-236B według niniejszego wynalazku lub podobne.
Wektor do funkcjonalnej ekspresji korzystnie zawiera sekwencję nukleotydów dostarczającą fenotyp selektywny dla plazmidu w komórce gospodarza i korzystnie jest wektorem wahadłowym.
Co więcej, fenotyp selektywny może być fenotypem oporności na lek, korzystnie oporności na antybiotyk i bardziej korzystnie oporności na ampicylinę lub oporności na hygromycynę B.
Jeśli wektor ekspresyjny jest wektorem wahadłowym, wektor odpowiednio zawiera sekwencję nukleotydów, która pozwala wektorowi na replikację w komórce gospodarza z jednej z grup mikroorganizmów i sekwencję nukleotydów potrzebną dla ekspresji polipeptydów kodowanych przez wstawkę wektora w innym typie komórki gospodarza. Jest korzystne by wektor dawał inny fenotyp selektywny dla każdej komórki gospodarza z różnych transformowanych grup mikroorganizmów. Wymagania dla kombinacji grup mikroorganizmów są podobne jak dla wektora wahadłowego stosowanego do klonowania i ekspresji genomowego DNA związanego z biosyntezą ML-236B opisane w obecnym zgłoszeniu.
W niniejszym wynalazku odpowiednim wektorem wahadłowym DNA jest pSAK700, skonstruowany przez połączenie promotora kinazy 3-fosfoglicerynianowej (dalej określany jako pgk) pochodzącego z Aspergillus nidulans istniejącego w wektorze DNA pSAK333 (opisane w Japońskim Zgłoszeniu Patentowym Publikacja Nr 3-262486), adaptera do włączenia obcego genu i terminatora pgk istniejącego w DNA, w tej kolejności (zobacz Figura 4).
Polipeptyd może być wyrażany w mikroorganizmie produkującym ML-236B przez włączenie cDNA odpowiadającego genowi struktury mlcE, opisanego powyżej, do wektora ekspresyjnego opisanego powyżej. W niniejszym wynalazku zrekombinowany wektor do ekspresji cDNA pSAKexpE uzyPL 202 457 B1 skano przez włączenie cDNA odpowiadającego genowi struktury mlcE do miejsca adaptera pSAK700. Sekwencja włączona w pSAKexpE, a mianowicie sekwencja nukleotydów cDNA odpowiadającego genowi struktury mlcE jest przedstawiona w SEQ ID No. 37 Listy sekwencji. Podobnie uzyskano zrekombinowany wektor pSAKexpR do ekspresji cDNA przez włączenie cDNA odpowiadającego genowi struktury mlcR do miejsca adaptera pSAK700. Sekwencja włączona w pSAKexpR, a mianowicie sekwencja nukleotydów cDNA odpowiadającego genowi struktury mlcR jest przedstawiona w SEQ ID No. 41 Listy sekwencji.
Escherichia coli pSAKexpE SANK 72499 to znaczy szczep Escherichia coli transformowany pSAKexpE zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu. FERM BP-7005, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów. Escherichia coli pSAKexpR SANK 72599 to znaczy szczep Escherichia coli transformowany przez pSAKexpR zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 25 stycznia 2000, jako numery depozytu. FERM BP-7006, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów.
Można wybrać odpowiednie sposoby transformacji w zależności od komórki gospodarza, aby uzyskać ekspresję cDNA przyspieszającego biosyntezę ML-236B, genomowego DNA związanego z biosyntezą ML-236B lub jego fragmentów. Transformacja Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B może być przeprowadzona przez przygotowanie protoplastów ze spor Penicillium citrinum, a następnie wprowadzenie zrekombinowanego wektora do protoplastów [opisane w Nara, F. i wsp., Curr. Genet. 23, 28 (1993)].
Odpowiednio spory ze skosu hodowli Penicillium citrinum zaszczepia się na płytkę podłoża agarowego PGA i inkubuje w 22 do 28°C, przez 10 do 14 dni. Spory następnie się zbiera z płytki i zaszczepia 1 x 107 - 1 x 109 spor do 50 do 100 ml podłoża hodowlanego YPL-20 [skład: 0,1% (waga/obj) ekstrakt drożdżowy (wyprodukowany przez Difco corporation), 0,5% (waga/obj) polipepton (wyprodukowany przez Nihon Seiyaku corporation), 20% (waga/obj) laktozy, pH 5,0], a następnie inkubuje w 22 do 28°C przez 18 godzin do dwóch dni. Kiełkujące spory odzyskuje się z hodowli i poddaje działaniu enzymów degradujących ścianę komórkową aby uzyskać protoplasty Wybór enzymu degradującego ścianę komórkową nie jest szczególnie ograniczony o ile może on degradować ścianę komórkową Penicillium citrinum i nie ma szkodliwego wpływu na mikroorganizm. Przykłady tego obejmują: zymoliazę, chitynazę lub podobne.
Zmieszanie zrekombinowanego wektora DNA zawierającego cDNA przyspieszającego biosyntezę ML-236B i mikroorganizmu produkującego ML-236B lub jego protoplastu w odpowiednich warunkach pozwala na wprowadzenie DNA zrekombinowanego wektora do tego protoplastu, aby dostarczyć transformanta.
Hodowla transformantów mikroorganizmu produkującego ML-236B jest odpowiednio przeprowadzana w warunkach odpowiednich dla każdej z komórek gospodarza. Hodowlę transformanta Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B można przeprowadzić przez hodowlę uprzednio transformowanego protoplast w warunkach odpowiednich do regeneracji ściany komórkowej, a następnie hodowanie. Mianowicie transformowany protoplast Penicillium citrinum może być wprowadzony do podłoża agarowego VGS środkowej warstwy [skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 2% (waga/obj) agar], i następnie agar VGS warstwy środkowej umieszcza się między podłożem agarowym VGS warstwy dolnej [skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 2,7% (waga/obj) agar] i podłożem agarowym VGS warstwy górnej
[skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 1,5% (waga/obj) agar] zawierającym 800 μg/ml hygromycyny B, a następnie inkubację w 22 do 28°C przez 7 do 15 dni. Powstały szczep subkulturuje się z inkubacją w 22 do 28°C na podłożu PGA. Szczep zaszczepia się platynową igłą na skos przygotowany z podłożem PGA, inkubuje w 22 do 28°C przez 10 do 14 dni, i następnie przechowuje w 0 do 4°C.
Jak opisano powyżej, można przygotować ML-236B wydajnie przez zaszczepienie transformanta Penicillium citrinum uzyskanego ze skosu jak powyżej i mającego zregenerowaną ścianę komórkową do podłoża MBG 3-8, a następnie inkubację w 22 do 28°C przez 7 do 12 z wytrząsaniem. Penicillium citrinum jako gospodarz może być hodowany także w podłożu płynnym aby wyprodukować
ML-236B.
Oczyszczanie ML-236B z hodowli transformanta mikroorganizmu produkującego ML-236B może być przeprowadzone przez połączenie różnych sposobów ogólnie stosowanych do oczyszczania
PL 202 457 B1 produktów naturalnych. Wybór takich metod nie jest szczególnie ograniczony i może być na przykład, przez wirowanie, rozdział substancji stałych i płynów przez sączenie, działanie zasadą lub kwasem, ekstrakcję rozpuszczalnikami organicznymi, rozpuszczenie, metody chromatograficzne takie jak chromatografia adsorpcyjna, chromatografia rozdziału lub podobne i krystalizacji lub podobne. ML-236B może być w postaci hydroksykwasu lub laktonu, które mogą być wzajemnie przekształcane w siebie. Hydroksykwas można przekształcić do jego soli, która jest bardziej stabilna. Stosując takie właściwości fizyczne można otrzymać ML-236B w formie hydroksykwasu (dalej określany jako wolny hydroksykwas), sole hydroksykwasu ML-236B (dalej określany jako sól hydroksykwasu), lub postać laktonu ML-236B (dalej określany jako lakton).
Hodowlę poddaje się hydrolizie alkalicznej w podwyższonej temperaturze lub pokojowej temperaturze dla otwarcia pierścienia i przekształcenia do soli hydroksykwasu i następnie roztwór reakcyjny zakwasza, a następnie przesącza. Przesącz ekstrahuje się rozpuszczalnikiem organicznym, który rozdziela się od wody by dostarczyć zamierzony produkt jako wolny hydroksykwas. Wybór rozpuszczalnika organicznego nie jest szczególnie ograniczony. Przykłady obejmują: alifatyczne węglowodory takie jak heksan, heptan lub podobne, aromatyczne węglowodory takie jak benzen, toluen lub podobne; chlorowcopochodne węglowodorów takie jak chlorek metylenu, chloroform lub podobne; etery takie jak eter dietylowy lub podobne; estry takie jak mrówczan etylu, octan etylu lub podobne; lub mieszanina złożona z dwóch lub więcej rozpuszczalników.
Zamierzony związek może być uzyskany jako sól hydroksykwasu przez rozpuszczenie wolnego hydroksykwasu w wodnym roztworze soli metalu alkalicznego takiego jak wodorotlenek sodu.
Dalej zamierzony związek może być uzyskany jako lakton przez zamknięcie pierścienia przez podgrzanie wolnego hydroksykwasu w rozpuszczalniku organicznym aby go odwodnić, lub za pomocą innych odpowiednich sposobów.
Możliwe jest oczyszczenie i izolacja otrzymanego w ten sposób wolnego hydroksykwasu, hydroksykwasu lub laktonu za pomocą chromatografii kolumnowej lub podobnej. Nośnik dla kolumny stosowanej do chromatografii nie jest szczególnie ograniczony. Przykłady obejmują: Sephadex LH-20 (produkowany przez Pharmacia Corporation), Diaion HP-20 (produkowany przez Mitsubishi Kagaku corporation), żel krzemionkowy, nośniki fazy odwróconej Iub podobne, nośniki serii C18 są korzystne.
Wybór sposobu oznaczenia ilościowego ML-236B nie jest szczególnie ograniczony, korzystna jest metoda ogólnie stosowana do oznaczenia ilościowego związków organicznych. Przykłady: wysokiej jakości chromatografia cieczowa fazy odwróconej (dalej określana jako HPLC fazy odwróconej) lub podobne. Oznaczenie ilościowe według HPLC fazy odwróconej może być przeprowadzone przez poddanie hodowli mikroorganizmu produkującego ML-236B hydrolizie alkalicznej, poddanie rozpuszczalnej frakcji HPLC fazy odwróconej stosując kolumnę C18, pomiar absorpcji w UV i przekształcenie wartości absorpcji na ilość ML-236B. Wybór kolumny C18 nie jest szczególnie ograniczony, korzystna jest kolumna C18 stosowana do ogólnego HPLC fazy odwróconej. Przykłady obejmują: SSC-ODS-262 (średnica 6 mm, długość 100 mm, wyprodukowany przez Senshu Kagaku corporation) lub podobne. Wybór rozpuszczalnika dla fazy ruchomej nie jest szczególnie ograniczony o ile jest to rozpuszczalnik ogólnie stosowany do HPLC fazy odwróconej. Jest to na przykład, 75% (obj/obj) metanol - 0,1% (obj/obj) trietyloamina - 0,1% (obj/obj) kwas octowy lub podobne. Gdy ML-236B jest dodawany w temperaturze pokojowej do kolumny SSC-ODS-262, gdzie stosuje się 75% (obj/obj) metanol - 0,1%(obj/obj) trietyloamina - 0,1%(obj/obj) kwas octowy jest stosowany jako faza ruchoma przy tempie 2 ml/minutę, ML-236B eluuje się po 4,0 minutach. ML-236B można wykryć stosując detektor do UV dla HPLC. Zaabsorbowana długość fali do detekcji UV wynosi 220 do 280 nm, korzystnie 220 do 260 nm, bardziej korzystnie 236 nm.
Dostarczone są kompozycje farmaceutyczne zawierające ML-236B uzyskane stosując niniejszy wynalazek, wraz z nośnikiem farmaceutycznym.
Dostarczone są także kompozycje farmaceutyczne zawierające prawastatyną preparowaną z ML-236B uzyskanego wedł ug niniejszego wynalazku razem z noś nikiem farmaceutycznym.
Kompozycje farmaceutyczne według wynalazku mogą być konwencjonalne i takie same jak te stosowane dla istniejących formuł ML-236B lub prawastatyny.
Sposoby leczenia są także częścią wynalazku i stosują związek lub kompozycje do leczenia hiperlipemii i innych stanów.
Wynalazek jest obecnie ilustrowany bardziej szczegółowo przez odniesienie do następujących Figur i Przykładów. Przykłady są ilustracją ale nie są ograniczeniem niniejszego wynalazku.
PL 202 457 B1
Opis figur
Figura 1 jest schematem przedstawiającym konstrukcję wektora DNA pSAKcos1;
Figura 2 jest wynikiem analizy genów struktury wstawionej sekwencji pML48;
Figura 3 przedstawia hybrydyzacje typu Northern wstawionej sekwencji pML48;
Figura 4 jest schematem przedstawiającym konstrukcję wektora ekspresyjnego cDNA pSAK700; i
Figura 5 przedstawia analizę RT-PCR dla transkrypcji mlc A-E i R w transformancie pSAKexpR.
Figura 6 przedstawia analizę RT-PCR dla transkrypcji mlcE w transformancie pSAKexpE.
P r z y k ł a d y w y n a l a z k u
P r z y k ł a d 1: Konstrukcja wektora pSAKcos1
Plazmid pSAK333 zawierający gen fosfotransferazy hygromycyny B (dalej określany jako HPT) pochodzący z Escherichia coli (Japońskie Zgłoszenie Patentowe Publikacja Nr 3-262486) strawiono enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia), i poddano działaniu polimerazy DNA T4 (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia) w celu uzyskania tępych końców.
Fragment DNA uzyskany jak powyżej samoligowano do formy kolistej stosując zestaw do ligacji Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia), i następnie transformowano nim kompetentne komórki Escherichia coli JM 109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Szczep mający plazmid, w którym miejsce BamHI uległo delecji wybrano z transformowanej Escherichia coli i określono jako pSAK360.
pSAK 360 strawiono enzymem restrykcyjnym Pvull i następnie poddano działaniu fosfatazy alkalicznej aby wyprodukować fragment defosforylowany na końcu 5'. Fragment Sall-Scal (około 3kb) zawierający miejsce cos uzyskano z wektora kosmidowego pWE15 (wyprodukowany przez STRATAGENE) i poddano działaniu polimerazy DNA T4 aby uzyskać tępe końce. Następnie został wligowany w miejsce Pvull pSAK360. JM109 transformowano tym DNA. Szczepy mające plazmid do którego wstawiono fragment Sall-Scal (około 3kb) w miejscu Pvull wybrano z transformowanej Escherichia coli, i plazmid niesiony przez szczep określono jako pSAKcos1. pSAKcos1 zawiera miejsca cięcia dla enzymów restrykcyjnych BamHI, EcoRI i Notl, każde miejsce pochodzi z pWE15. pSAKcos1 ma gen oporności na ampicylinę i gen oporności na hygromycynę jako markery selekcyjne.
W następujących przykładach, gdy jako gospodarza stosowano Escherichia coli selekcja transformantów pSAKcos1 lub transformantów pSAKcos1 zawierających wstawkę obcego genu była przeprowadzana przez dodanie 40 μg/ml ampicyliny (Ampicillin: wyprodukowana przez Sigma Corporation) do odpowiedniego podłoża. Gdy jako gospodarza stosowano Penicillium citrinum SANK13380, selekcja transformantów pSAKcos1 lub transformantów pSAKcos1 zawierających wstawkę obcego genu była przeprowadzana przez dodanie 200 μg/ml hygromycyny (Hygromycin B: wyprodukowana przez Sigma Corporation) do odpowiedniego podłoża.
Sposób konstrukcji pSAKcos1 przedstawiono na Fig.1
P r z y k ł a d 2: Przygotowanie genomowego DNA Penicillium citrinum SANK 13380
1) Hodowla Penicillium citrinum SANK 13380
Zrobiono wyjściową hodowlę Penicillium citrinum SANK 13380 na skosie z podłoża agarowego PGA. Mianowicie agar zaszczepiono Penicillium citrinum SANK 13380 stosując igłę platynową i trzymano w 26°C przez 14 dni. Skos przechowywano w 4°C.
Główną hodowlę prowadzono w napowietrzanej hodowli płynnej. Komórki z 5 mm kwadratu wymienionego powyżej skosu zaszczepiono do 50 ml podłoża MBG3-8 w 500 ml kolbie stożkowej i inkubowano w 26°C z wytrząsaniem przy 210 obr/min przez pięć dni.
2) Przygotowanie genomowego DNA z Penicillium citrinum SANK 13380
Hodowlę uzyskaną w etapie 1) zwirowano przy 10000 x G w temperaturze pokojowej przez 10 minut i zebrano komórki. 3g (mokra masa) komórek rozbito w moździerzu oziębionym suchym lodem do postaci proszku. Rozbite komórki umieszczono w probówce do wirowania wypełnionej 20 ml buforu 62,5 mM EDTA2Na (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) - 5% (waga/obj)SDS - 50mM Tris kwas solny (pH 8,0) (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i wymieszano je delikatnie a następnie pozostawiono w 0°C przez jedną godzinę. Dodano 10 ml fenolu nasyconego 10 mM Tris kwas solny - 0,1 mM EDTA2Na (pH 8,0, dalej określany jako TE) i mieszano delikatnie w 50°C przez jedną godzinę.
Po wirowaniu w temperaturze pokojowej przy 10000 x G przez 10 minut, 15 ml górnej warstwy (faza wodna) umieszczono w innej probówce do wirowania. Do roztworu dodano 0,5 objętości fenolu
PL 202 457 B1 nasyconego TE i 0,5 objętości roztworu chloroformu. Mieszaninę mieszano przez dwie minuty i wirowano w temperaturze pokojowej przy 10000 x G przez 10 minut (dalej określane jako ekstrakcja fenolem-chloroformem). Do 10 ml warstwy górnej (faza wodna) dodano 10 ml 8M octanu amonu (pH 7,5) i 25 ml 2-propanolu (wyprodukowany przez Wako Pure Chemical Industries, Ltd.), a następnie schł odzenie w -80°C przez 15 minut i wirowanie w 4°C przy 10000 x G przez 10 minut.
Po strąceniu osady rozpuszczono w 5 ml TE, po czym dodano 20 μΐ 10 mg/ml rybonukleazy A (wyprodukowana przez Sigma corporation) i 250 jednostek rybonukleazy T1 (wyprodukowana przez GIBCO Corporation), a następnie inkubowano w 37°C przez 20 minut. Dodano 20 ml 2-propanolu i łagodnie wymieszano. Następnie nici genomowego DNA nawinięto na koniec pipety pasterowskiej i rozpuszczono w jednym ml TE.
Następnie do roztworu DNA dodano 0,1 objętości 3 M octanu sodu (pH 6,5) i 2,5 objętości etanolu. Roztwór schłodzono do - 80°C przez 15 minut i następnie odwirowano w 4°C, przy 10000 x G przez pięć minut (następnie określane jako strącanie etanolem). Powstały osad rozpuszczono w 200 μl TE, i był frakcją genomowego DNA.
P r z y k ł a d 3: Przygotowanie biblioteki genomowego DNA Penicillium citrinum SANK13380
1) Przygotowanie fragmentu genomowego DNA
0,25 jednostek Sau3AI (Takara Shuzo Co., Ltd., Japonia) dodano do 100 μl wodnego roztworu genomowego DNA (50 μg) Penicillium citrinum SANK13380 uzyskanego w Przykładzie 2. Po przedziałach 10, 30, 60, 90 i 120 sekund pobrano próbki 20 μl mieszaniny i do każdej próbki dodano 0,5 M EDTA (pH 8,0) aby zakończyć reakcję enzymu restrykcyjnego. Powstałe częściowo strawione fragmenty DNA rozdzielono za pomocą elektroforezy w żelu agarozowym i odzyskano żel agarozowy zawierający fragmenty DNA 30 kb lub większe.
Odzyskany żel rozgnieciono na drobne fragmenty i umieszczono w Ultra Free C3 Centrifuged Filtration Unit (wyprodukowany przez Japan Milipore Corporation). Żel schłodzono w -80°C przez 15 minut do momentu zamarznięcia i następnie żel stopiono przez inkubację go w 37°C przez 10 minut. Był on wirowany przy 5000 x G przez 5 minut, aby wyekstrahować DNA. DNA poddano ekstrakcji fenol - chloroform i strącono etanolem. Powstałe osady rozpuszczono w małej odpowiedniej ilości TE.
2) Wstępna obróbka DNA wektora pSAKcos1 pSAKcos1 strawiono enzymem restrykcyjnym BamHI (Takara Shuzo Co., Ltd., Japonia), i następnie poddano działaniu fosfatazy alkalicznej (Takara Shuzo Co., Ltd., Japonia) w 65°C przez 30 minut. Powstały roztwór reakcyjny poddano ekstrakcji fenol-chloroform i strąceniu etanolem. Powstały osad rozpuszczono w małej ilości TE.
3) Ligacja i pakowanie in vitro
Genomowy fragment DNA (2 |ag) opisany w powyższym etapie 1) i pSAKcos1 (1 μg poddany wstępnej obróbce jak powyżej zmieszano i następnie zligowano w 16°C przez 16 godzin stosując zestaw do ligacji DNA kit Ver.2 (Takara Shuzo Co., Ltd., Japonia). Powstały roztwór reakcyjny poddano ekstrakcji fenol - chloroform i strąceniu etanolem. Powstałe osady rozpuszczono w 5 μl TE. Roztwór produktu ligacji poddano pakowaniu in vitro stosując GIGAPAK II Gold kit (wyprodukowany przez STRATAGENE corporation) aby dostarczyć transformanty Escherichia coli zawierające zrekombinowany wektor DNA. 3 ml podłoża LB wylano na szalkę, na której powstały kolonie transformanta Escherichia coli, i odzyskano kolonie na szalce stosując zdrapywacz do komórek (określane jako odzyskany roztwór 1). Płytkę wypłukano kolejnymi 3 ml podłoża LB i komórki odzyskano (określane jako odzyskany roztwór 2). Do mieszaniny odzyskanych roztworów 1 i 2 dodano glicerol aby uzyskać ostateczne stężenie 18% (określane jako roztwór komórek Escherichia coli), który trzymano w - 80°C jako bibliotekę genomowego DNA Penicillium citrinum SANK13380.
P r z y k ł a d 4: Amplifikacja fragmentu genu PKS za pomocą PCR stosując genomowy DNA Penicillium citrinum SANK13380 jako matrycę
1) Zaprojektowanie i synteza primerów do PCR.
W oparciu o sekwencję aminokwasów genu PKS Aspergillus flavus (opisana w Brown, D.W. i wsp., Proc. Natl. Acad. Sci. USA, 93, 1418 (1996)), zaprojektowano i zsyntetyzowano zdegenerowane primery pokazane w SEQ ID No. 3 i 4 Listy sekwencji. Syntezę przeprowadzono według metody fosfoaminidynowej.
SEQ ID No. 3 Listy sekwencji:
gayacngcntgyasttc
SEQ ID No. 4 Listy sekwencji:
tcnccnknrcwgtgncc
PL 202 457 B1
W sekwencji nukleotydów SEQ ID No. 3 i 4, n przedstawia inozynę (hipoksantynę ), y przedstawia t lub c, s przedstawia g lub c, k przedstawia g lub t, r przedstawia g lub a, i w przedstawia a lub t.
2) Amplifikacja odcinka DNA za pomocą PCR
Przygotowano 50 μΐ roztworu do reakcji zawierającego primery do PCR opisane w powyższym etapie 1) (każdy 100 pmol), genomowy DNA Penicillium citrinum SANK13380 uzyskany w Przykładzie 2 (500 ng), 0,2 mM dATP, 0,2 mM dCTP, 0,2 mM dGTP, 0,2 mM dTTP, 50 mM chlorek potasu, 2 mM chlorek magnezu i 1,25 jednostek polimerazy DNA Ex. Tac (Takara Shuzo Co., Ltd., Japonia). Roztwór poddano cyklowi reakcji złożonemu z trzech następujących kolejnych etapów: jedna minuta w 94°C, dwie minuty w 58°C i 3 minuty w 70°C. Cykl powtórzono 30 razy aby zamplifkować fragment DNA. PCR przeprowadzono stosując TaKaRa PCR Thermal Cycler MP TP 3000 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia).
Zamplifikowane fragmenty DNA poddano elektroforezie w żelu agarozowym i następnie odzyskano agarozę zawierającą fragmenty DNA mające wielkość około 1,0 do 2,0 kb. DNA odzyskano z żelu i poddano ekstrakcji fenol-chloroform i strącono etanolem. Powstały osad rozpuszczono w małej ilości TE.
3) Ligacja i transformacja
Fragment DNA uzyskany w etapie 2) zligowano z plazmidem pCR2.1 stosując system klonowania TA pCR 2.1 (wyprodukowany przez lnvitrogen Corporation), plazmid jest dostarczony jako część zestawu. Plazmidem transformowano Escherichia coli JM109 aby uzyskać transformanty.
Z powstałych transformantów wybrano kilka kolonii i hodowano je według metody Maniatis i wsp., [opisane w Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Mianowicie każą z kolonii zaszczepiono do probówki 24 ml zawierającej 2 ml podłoża LB i inkubowano w 37°C przez 18 godzin z wytrząsaniem.
Zrekombinowany wektor DNA przygotowano z hodowli za pomocą metody lizy alkalicznej (opisanej w in Maniatis, T. i wsp., powyżej). A mianowicie 1,5 ml roztworu hodowli żwirowano w temperaturze pokojowej przy 10000 x G przez dwie minuty. Komórki następnie odzyskano z osadu. Do komórek dodano 100 μl roztworu 50 mM glukozy, 25 mM Tris - kwas solny, 10 mM EDTA (pH 8,0), aby wytworzyć zawiesinę. Do niej dodano 200 μl 0,2 N wodorotlenek sodu - 1% (waga/obj) SDS. Roztwór mieszano łagodnie aby zlizować mikroorganizmy. Następnie dodano 150 μl 3 M octanu potasu 11,5%(waga/obj) kwas octowy by zdenaturować białka a następnie wirowano w temperaturze pokojowej przy 10000 x G przez 10 minut. Odzyskano zawiesinę. Supernatant poddano ekstrakcji fenolem-chloroformem i strącaniu etanolem. Powstały osad rozpuszczono w 50 μl TE zawierającego 40 μg/ml rybonukleazy A (wyprodukowany przez Sigma Corporation).
Każdy ze zrekombinowanych wektorów DNA strawiono enzymem restrykcyjnym i poddano elektroforezie. Sekwencję nukleotydów wstawek DNA w zrekombinowanych wektorach DNA określono stosując sekwenator DNA (model 377: wyprodukowany przez Perkin Elmer Japonia) dla wszystkich wstawek mających różne wzory trawienia przy elektroforezie.
W ten sposób zidentyfikowano szczep mający wektor ze zrekombinowanym DNA zawierający fragment PKS pochodzący z Penicillium citrinum.
P r z y k ł a d 5: Genomowa hybrydyzacja techniką Southerna Penicillium citrinum SANK13380
1) Elektroforeza i przeniesienie na błonę
Genomowy DNA (10 μg) Penicillium citrinum SANK13380 uzyskany w Przykładzie 2 strawiono enzymem restrykcyjnym EcoRI, SalI, Hind-lll lub Sac1 (wszystkie wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), i następnie poddano elektroforezie w żelu agarozowym. Żel przygotowano stosując agarozę L03 TAKARA (Takara Shuzo Co., Ltd., Japonia). Po elektroforezie, żel moczono w 0,25 N kwasie solnym (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i inkubowano w temperaturze pokojowej przez 10 minut z łagodnym wytrząsaniem. Żel przenoszono do 0,4 N wodorotlenku sodu (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i łagodnie inkubowano w temperaturze pokojowej przez 30 minut. Stosując metodę zasadowego transferu Maniatis i wsp. (powyżej), DNA w żelu przenoszono na nylonową membranę Hybond ™-N+ (wyprodukowany przez Amersham corporation) i utrwalono na niej. Membranę płukano 2 x SSC (1 x SSC zawiera 150 mM NaCI, 15 mM cytrynian sodu) i suszono na powietrzu.
2) Hybrydyzacja i detekcja sygnału
Błonę uzyskaną w etapie 1) hybrydyzowano z fragmentem genu PKS uzyskanym w Przykładzie 4 jako sondą.
PL 202 457 B1
Aby uzyskać sondę 1 μg DNA fragmentu wstawki genu PKS uzyskanego w Przykładzie 4 znakowano DIG DNA Labeling Kit (wyprodukowany przez Boeringer-Mannheim) i gotowano przez 10 minut i następnie szybko schłodzono tuż przed użyciem.
Membranę opisaną w etapie 1) moczono w płynie do hybrydyzacji (DIG Easy Hyb: wyprodukowany przez Boeringer-Mannheim) i następnie poddano prehybrydyzacji z wytrząsaniem przy 20 obr/min w 42°C przez 2 godziny. Następnie do roztworu do hybrydyzacji dodano wymienioną powyżej wyznakowaną sondę, i przeprowadzono hybrydyzację z wytrząsaniem w 20 obr/min w 42°C przez 18 godzin stosując Multishaker Oven HB (wyprodukowany przez TAITEC corporation). Błona poddana hybrydyzacji była następnie płukana trzy razy stosując 2 x SSC w temperaturze pokojowej przez 20 minut, a następnie dwa płukania stosując 0,1 x SSC w 55°C przez 30 minut.
Przepłukaną membranę poddano działaniu DIG Luminescent Detection Kit for Nucleic Acids (wyprodukowany przez Boeringer-Mannheim) i eksponowano na kliszę rentgenowską (Lumifilm, wyprodukowany przez Boeringer-Mannheim). Ekspozycję przeprowadzono stosując maszynę do obrabiania klisz medycznych Fuji FPM 800A (wyprodukowany przez Fuji Film Corporation).
Potwierdzono, że fragment genu PKS uzyskany w Przykładzie 4 jest obecny w genomie Penicillium citrinum.
P r z y k ł a d 6: Przeszukiwanie biblioteki genomowego DNA Penicillium citrinum SANK13380 stosując fragment genu PKS jako sondę
Klonowanie genomowego fragmentu DNA zawierającego gen PKS przeprowadzono stosując metodę hybrydyzacji kolonijnej.
1) Przygotowanie membrany
Roztwór komórek Escherichia coli utrzymywany jako biblioteka genomowego DNA f Penicillium citrinum SANK13380 (opisany w Przykładzie 3) rozcieńczono i rozprowadzono na płytce z podłożem agarowym LB tak by na płytce rosło 5000 do 10000 kolonii. Płytki trzymano w 26°C przez 18 godzin i schłodzono do 4°C przez jedną godzinę. Hybond™-N+ (wyprodukowany przez Amasham corporation) umieszczono na płytce i kontaktowano go z nią przez jedną minutę. Błona do której przylegała kolonia była starannie usuwana z płytki. Powierzchnia, które była w kontakcie z koloniami była odwracana do góry i moczona w 200 ml roztworu 1,5 M chlorku sodu, 0,5 N wodorotlenku sodu przez 7 minut i następnie moczono w 200 ml roztworu 1,5 M chlorku sodu, 0,5 M Tris kwas solny, 1 mM EDTA (pH 7,5) przez trzy minuty dwa razy i następnie płukano 400 ml 2 x SSC. Płukaną membranę suszono na powietrzu 30 minut.
2) Hybrydyzacja
DNA wstawki genu otrzymany w Przykładzie 4 (1 μg) zastosowano jako sondę. DNA wyznakowano stosując DIG DNA Labeling Kit (wyprodukowany przez Boeringer-Mannheim) i gotowano go 10 minut i szybko schłodzono bezpośrednio przed użyciem.
Membranę opisaną w etapie 1) moczono w płynie do hybrydyzacji (DIG Easy Hyb: wyprodukowany przez Boeringer-Mannheim) a następnie poddano prehybrydyzacji z wytrząsaniem przy 20 obr/min w 42°C przez 2 godziny. Następnie do roztworu do hybrydyzacji dodano wymienioną powyżej wyznakowaną sondę i przeprowadzono hybrydyzację z wytrząsaniem w 20 obr/min w 42°C przez 18 godzin stosując Multishaker Oven HB (wyprodukowany przez TAITEC corporation). Błona poddana hybrydyzacji była następnie płukana trzy razy stosując 2 x SSC w temperaturze pokojowej przez 20 minut, a następnie dwa płukania stosując 0,1 x SSC w 68°C przez 30 minut.
Przepłukaną membranę poddano działaniu DIG Luminescent Detection Kit for Nucleic Acids (wyprodukowany przez Boehringer-Mannheim) i eksponowano na kliszę rentgenowską (Lumifilm, wyprodukowany przez Boeringer-Mannheim). Ekspozycję przeprowadzono stosując maszynę do obrabiania klisz medycznych Fuji FPM 800A (wyprodukowany przez Fuji Film Corporation).
Powyższe etapy 1) i 2) są określane jako przeszukiwanie.
Kolonie na płytce, na której wykryto dodatni sygnał przy pierwszym przeszukiwaniu zdrapano i odzyskane komórki zawieszono w podłożu LB. Następnie komórki odpowiednio rozcieńczono i rozsiano na odpowiedniej płytce. Następnie przeprowadzono drugie przeszukiwanie aby oczyścić dodatni klon.
Dodatni klon uzyskany w obecnym przykładzie, a mianowicie transformowana Escherichia coli, szczep Escherichia coli pML48 SANK71199 został zdeponowany w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 7 lipca 1999 jako depozyty Nr FERM BP-6780, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów,
PL 202 457 B1
P r z y k ł a d 7: Analiza wstawionej sekwencji zrekombinowanego wektora DNA pML48 (1)
Hodowlę szczepu Escherichia coli pML48 SANK71199 uzyskanego w Przykładzie 6 i przygotowanie DNA zrekombinowanego wektora z hodowli przeprowadzono podobnie jak opisano w Przykładzie 4.
Uzyskany wektor DNA określono jako pML48. Wstawkę pML48, która jest genomowym DNA związanym z biosyntezą ML-236B strawiono różnymi enzymami restrykcyjnymi i powstałe fragmenty subklonowano w pUC119 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Stosując powstałe subklony jako sondy przeprowadzono hybrydyzację typu Southerna w sposób podobny jak opisano w Przykładzie 5. Mianowicie produkty uzyskane przez trawienie pML48 różnymi enzymami restrykcyjnymi poddano elektroforezie i DNA przeniesiono na membranę i poddano hybrydyzacji. W efekcie sporządzono mapę restrykcyjną wstawionej sekwencji pML48 stosując standardowe w dziedzinie techniki.
Ustalono sekwencję nukleotydów wstawionej sekwencji każdego z subklonów stosując sekwenator DNA model 377 (wyprodukowany przez Perkin Elmer Japonia Co.Ltd.), a następnie określono całą sekwencję nukleotydów pML48.
Wstawiona sekwencja pML48 składała się łącznie z 34203 zasad.
Sekwencja nukleotydów wstawionej sekwencji pML48 jest opisana w SEQ ID No. 1 i 2 Listy sekwencji. Sekwencje opisane w SEQ ID No. 1 i 2 Listy sekwencji są całkowicie komplementarne do siebie.
Istnienie genów strukturalnych na sekwencji wstawki pML48 analizowano stosując program poszukiwania genów GRAIL (ApoCom GRAIL Toolkit: wyprodukowany przez Apcom Corporation) i program poszukiwania homologii BLAST (Gapped-BLAST (BLAST2): zainstalowany w pakiecie WISCONSIN GCG ver.10.0).
W efekcie przewidziano, że we wstawionej sekwencji pML48 istnieje sześć różnych genów, i zostały one określone jako mlcA, mlcB, mlcC, mlcD, mlcE i mlcR odpowiednio. Co więcej przewidziano, że mlcA, mlcB, mlcE i mlcR mają region kodujący w sekwencji nukleotydów SEQ ID NO. 2 Listy sekwencji i mlcC i mlcD mają region kodujący w sekwencji nukleotydów SEQ ID NO. 1 Listy sekwencji. Względne położenie i długość każdego z przypuszczalnych genów struktury wstawionej sekwencji było też przewidziane.
Wyniki tego przykładu przedstawiono na Figurze 2. Każda strzałka wskazuje położenie, kierunek i względną wielkość każdego genu struktury na wstawce pML48. Strzałka, która wskazuje w lewo pokazuje, że region kodujący genu struktury (mlcA, B, E lub R) istnieje na ID SEQ NO 2. Strzałka, która wskazuje w prawo wskazuje, że region kodujący genu struktury (mlcC lub D) istnieje na ID SEQ NO 1.
P r z y k ł a d 8: Analiza wstawionej sekwencji wektora zrekombinowanego DNA pML48 (2)
Analizę ekspresji genów struktury, których obecność przewidziano w Przykładzie 7 przeprowadzono za pomocą hybrydyzacji typu Northern hybrydyzacja i RACE. Przeprowadzono analizę regionów końców 5' i 3'.
1) Preparatyka całkowitego RNA Penicillium citrinum SANK13380
Komórki z kwadratu 5 mm hodowli Penicillium citrinum SANK 13380 na skosie (opisanej w Przykładzie 2) zaszczepiono do 10 ml podłoża MGB3-8 w 100 ml kolbie stożkowej i inkubowano w 26°C przez 3 dni z wytrząsaniem.
Preparatykę całkowitego RNA z hodowli przeprowadzono z RNeasy Plant Mini Kit (wyprodukowany przez Qiagen AG), który stosuje metodę rodanku guanidyny. Mianowicie hodowlę zwirowano w temperaturze pokojowej przy 5000 x G przez 10 minut aby odzyskać komórki. Następnie 2 g (mokra masa) komórek zamrożono w ciekłym azocie i następnie rozgnieciono w moździerzu aby otrzymać proszek. Rozgniecione komórki zawieszono w 4 ml buforu do lizy (zawarty w zestawie). 450 μl zawiesiny wlano do każdej z 10 kolumn do wirowania QlAshredder zawartych w zestawie i następnie wirowano w temperaturze pokojowej przy 1000 x G przez 10 minut. Odzyskano każdy z powstałych eluatów i dodano do nich 225 μl etanolu, co następnie dodano do minikolumny do wirowania RNA zawartej w zestawie. Kolumnę płukano buforem do płukania zawartym w zestawie, a następnie eluowano zadsorbowane cząsteczki w każdej kolumnie za pomocą 50 μl wody destylowanej wolnej od rybonukleazy. Eluat użyto jako całkowitą frakcję RNA.
2) Hybrydyzacja typu Northern
Uzyskano próbkę RNA przez dodanie 2,25 μl wodnego roztworu zawierającego 20 μg całkowitego RNA Penicillium citrinum SANK13380 do: jednego μl 10 x MOPS (skład: 200 mM kwas 3-morfolino propanosulfonowy, 50 mM octan sodu, 10 mM EDTA2Na; pH 7,0; stosowane po sterylizacji w 121°C przez 20 minut w autoklawie; wyprodukowany przez Dojinkagaku Laboratory Co.Ltd.), 1,75μl formaldehydu i 5 μl formamidu, a następnie zmieszano. Próbkę RNA trzymano w 65°C przez 10 minut, a następnie
PL 202 457 B1 szybko schłodzono w wodzie z lodem i poddano elektroforezie w żelu agarozowym. Żel do elektroforezy przygotowano przez zmieszanie 10 ml 10 x MOPS i jednego grama agarozy L03 TAKARA (wyprodukowana przez Takara Shuzo Co., Ltd., Japonia) z 72 ml wody traktowanej estrem dietylowym kwasu pirowęglowego (wyprodukowany przez Sigma Corporation), podgrzano w celu rozpuszczenia agarozy, i następnie schłodzono, po czym dodano 18 ml formaldehydu. Jako bufor do próbki stosowano 1 x MOPS (przygotowany przez rozcieńczenie 10 x MOPS 10 krotnie wodą). RNA w żelu przeniesiono na Hybond ™-N+ (wyprodukowany przez Amasham corporation) w 10 X SSC.
Fragmenty DNA a, b, c, d i e, uzyskane przez trawienie wstawionej sekwencji pML48 enzymami restrykcyjnymi 1 i 2 przedstawione w następującej Tabeli 1, zastosowano jako sondy. Na górnym panelu Figury 3 pokazano lokalizację każdej sondy wstawki pML48.
T a b e l a 1
Sondy do hybrydyzacji typu Northern
Sonda Enzym restrykcyjny 1 Numer nukleotydu miejsca enzymu restrykcyjnego * Enzym restrykcyjny 2 Numer nukleotydu miejsca enzymu restrykcyjnego *
a EcoRI 6319 do 6324 EcoRI 15799 do 15804
b BamHI 16793 do 16798 Pstl 18164 do 18169
c Kpnl 26025 do 26030 BamHI 27413 do 27418
d SalI 28691 do 28696 SalI 29551 do 29556
e Hindlll 33050 do 33055 SacI 34039 do 34044
* Każ dy Nr nukleotydu istnieje na SEQ ID No. 1 Listy sekwencji
Oznakowanie sond, hybrydyzacja i detekcja sygnału były przeprowadzone według hybrydyzacji typu Southerna opisanej w Przykładzie 5.
Wyniki Przykładu przedstawiono w dolnym panelu Figury 3.
Każdy sygnał pokazuje istnienie produktu transkrypcji homologicznego do sekwencji nukleotydów każdej sondy.
Wyniki sugerują, że geny struktury, których istnienie przewidziano we wstawionej sekwencji pML48 w obecnym przykładzie, a mianowicie mlcA mlcB, mlcC mlcD, mlcE i mlcR były transkrybowane w Penicillium citrinum SANK13380.
Pozycja każdego sygnału nie pokazuje względnej wielkości produktu transkrypcji.
3) Określenie końca 5' ekwencji za pomocą 5' RACE cDNA zawierający region końca 5' każdego genu struktury uzyskano stosując 5' RACE System for Rapid Amplification of cDNA ends, Version 2.0 (wyprodukowany przez GIBCO corporation).
Wyprodukowano dwa rodzaje antysensownych oligonukleotydów DNA. Projekt był oparty na sekwencji nukleotydów uważanej za obecną w regionie kodującym blisko końca 5' każdego genu struktury we wstawionej sekwencji pML48, jak przewidziały wyniki Przykładu 7 i punkt 2) tego przykładu.
Sekwencja nukleotydów antysensownego oligonukleotydu DNA (1) zaprojektowanego w oparciu o sekwencję nukleotydów na końcu 3' każdego genu struktury jest przedstawiona w Tabeli 2. Sekwencja nukleotydów antysensownego oligonukleotydu DNA (2), zaprojektowanego w oparciu o sekwencję nukleotydów na końcu 5' każdego genu struktury była przedstawiona w Tabeli 3.
T a b e l a 2: Oligonukleotydy DNA (1) stosowane do określenia sekwencji końca 3' za pomocą 5'RACE
Gen SEQ ID No. z listy sekwencji Sekwencja nukleotydów
mlcA SEQ ID No.5 Gcatgttcaatttgctctc
mlcB SEQ ID No.6 Ctggatcagacttttctgc
mlcC SEQ ID No.7 Gtcgcagtagcatgggcc
mlcD SEQ ID No.8 Gtcag ag tg atg ctcttctc
mlcE SEQ ID No.9 Gttgagaggattgtgagggc
mlcR SEQ ID No.10 Ttgcttgtgttggattgtc
PL 202 457 B1
T a b e l a 3: Oligonukleotydy DNA (2) stosowane do określenia sekwencji końca 5' za pomocą 5'RACE
Gen SEQ ID No. Listy sekwencji Sekwencja nukleotydów
mlcA SEQ ID No.11 Catggtactctcgcccgttc
mlcB SEQ ID No.12 Ctccccagtacgtaagctc
mlcC SEQ ID No.13 Ccataatgagtgtgactgttc
mlcD SEQ ID No.14 Gaacatctgcatccccgtc
mlcE SEQ ID No.15 Ggaaggcaaagaaagtgtac
mlcR SEQ ID No.16 Ag attcattg ctgttg g catc
Pierwszą nić cDNA zsyntetyzowano według reakcji odwrotnej transkryptazy stosując oligonukleotyd DNA (1) jako primer i całkowity RNA Penicillium citrinum SANK13380 jako matrycę. Mianowicie 24 μI mieszaniny reakcyjnej zawierającej jeden μg całkowitego RNA, 2,5 pmol oligonukleotydu DNA (1) i jeden μl odwrotnej transkryptazy SUPER SCRIPTTM II (zawartej w zestawie) inkubowano w 16°C przez jedną godzinę i produkt reakcji dodano do naboju do wirowania GLASSMAX zawartego w zestawie aby oczyścić pierwszą nić cDNA.
Do końca 3'cDNA pierwszej nici dodano łańcuch poliC stosując terminalną deoksyrybonukleotydylo transferazę zawartą w zestawie.
μl mieszaniny reakcyjnej zawierającej pierwszą nić cDNA do której końca 3' dodano łańuch poli C zmieszano z 40 pmol oligonukleotydu DNA (2) i 40 pmol Abriged Anchor Primer (zawartego w zestawie) a następnie inkubowano w 94°C przez dwie minuty. Cykl inkubacji 30 sekund w 94°C, 30 sekund w 55°C i dwie minuty w 72°C następnie powtórzono 35 razy a następnie inkubowano w 72°C przez pięć minut i 4°C przez 18 godzin. Powstały produkt poddano elektroforezie w żelu agarozowym i DNA odzyskano z żelu. Produkt oczyszczono za pomocą ekstrakcji fenol - chloroform i strącono etanolem i sklonowano podobnie do metody opisanej w Przykładzie 4 stosując pCR 2.1.
Powyżej opisana operacja to 5'-RACE.
Ustalono sekwencję nukleotydów fragmentu cDNA zawierającego koniec 5' i przewidziano pozycję miejsca inicjacji transkrypcji i miejsca inicjacji translacji.
Tabela 4 przedstawia SEQ ID No. w którym sekwencja nukleotydów fragmentu DNA końca 5' odpowiadającemu każdemu genowi struktury uzyskanemu za pomocą 5' RACE była opisana. Tabela 5 przedstawia SEQ ID No. w którym istnieje miejsce inicjacji transkrypcji i miejsce inicjacji translacji każdego genu struktury i pozycję miejsca inicjacji transkrypcji i miejsca inicjacji translacji.
T a b e l a 4: SEQ ID No, w których pokazano sekwencję nukleotydową końca 5' fragmentu cDNA.
Gen Odpowiedni SEQ ID NO listy sekwencji
mlcA SEQ ID No.17
mlcB SEQ ID No.18
mlcC SEQ ID No.19
mlcD SEQ ID No.20
mlcE SEQ ID No.21
mlcR SEQ ID No.22
T a b e l a 5: Pozycja początku transkrypcji oraz początku translacji każdego genu.
Gen nr SEQ ID NO, w którym występuje kodon inicjacyjny dla translacji Numer nukleotydu w SEQ ID NO 1 lub SEQ ID NO 2
Pozycja początku transkrypcji Pozycja kodonu inicjacyjnego dla translacji
1 2 3 4
mlcA SEQ ID No.2 22913 23045 do 23047
mlcB SEQ ID No.2 11689 11748 do 11750
PL 202 457 B1 cd. tabeli 5
1 2 3 4
mlcC SEQ ID No.1 11631 11796 do 11798
mlcD SEQ ID No.1 24066 24321 do 24323
mlcE SEQ ID No.2 3399 3545 do 3547
mlcR SEQ ID No.2 365 400 do 402
* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.
4) Wyznaczenie sekwencji końca 3' przy pomocy techniki 3' RACE cDNA, zawierające końce 3'-każdego z genów struktury, otrzymano wykorzystując zestaw Ready To Go: T-Primed First-Strand (wyprodukowane przez Pharmacia).
W oparciu o dane z przykł adu 7 oraz punkt 2) opisywanego przykł adu, wytworzono jeden rodzaj sensownych oligonukleotydów DNA (3), będących przypuszczalnie w obszarze kodującym i jednocześnie blisko końca 3' każdego z genów struktury w sekwencji wstawionej w pML48.
Sekwencje oligonukleotydów DNA(3), wytworzonych dla każdego z genów struktury przedstawiono w Tabeli 6.
T a b e l a 6: Oligonukleotydy DNA (3) wykorzystywane do wyznaczania sekwencji końców 3' zgodnie z techniką 3' RACE
Gen nr Odpowiedni SEQ ID NO listy sekwencji Sekwencja nukleotydowa
mlcA SEQ ID No.23 Atcataccatcttcaacaac
mlcB SEQ ID No.24 Gctagaataggttacaagcc
mlcC SEQ ID No.25 Acattgccaggcacccagac
mlcD SEQ ID No.26 Caacgcccaagctgccaatc
mlcE SEQ ID No.27 Gtcttttcctactatctacc
mlcR SEQ ID No.28 Ctttcccag ctg ctactatc
Pierwszą nić cDNA zsyntetyzowano w reakcji odwrotnej transkrypcji, wykorzystując starter Notl-d(T)18 (pochodzący z zestawu) oraz jako matrycę całkowite RNA Penicillium citrinum SANK13380 (1 mg).
100 ml mieszaniny reakcyjnej, zawierającej pierwszą nić cDNA, 10 pmoli oligonukleotydu DNA (3) oraz starter Notl-d(T)18 (pochodzący z zestawu) inkubowano w 94°C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 55°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 35 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz klonowano według metody opisanej w przykładzie 4, wykorzystując plazmid pCR2.1.
Procedury opisane powyżej to właśnie technika 3'-RACE.
Ustalono sekwencję nukleotydową cDNA na końcach 3', a następnie wyznaczono pozycję kodonu terminacyjnego dla translacji.
Tabela 7 przedstawia odpowiednie SEQ ID NO listy sekwencji, dla których przy pomocy techniki 3' RACE, przedstawionej powyżej, wyznaczono sekwencje nukleotydowe końców 3' fragmentów cDNA dla każdego z genów struktury. Tabela 8 przedstawia kodony terminacyjne dla translacji oraz pozycje tych kodonów w oparciu o SEQ ID No.1 i 2 w liście sekwencji.
T a b e l a 7: SEQ ID No, w których pokazano sekwencję nukleotydową końca 3' fragmentu cDNA.
Gen Odpowiedni SEQ ID NO listy sekwencji
1 2
mlcA SEQ ID No.29
mlcB SEQ ID No.30
mlcC SEQ ID No.31
PL 202 457 B1 cd. tabeli 7
1 2
mlcD SEQ ID No.32
mlcE SEQ ID No.33
mlcR SEQ ID No.34
T a b e l a 8: Kodony terminacyjne dla translacji oraz pozycje kodonów terminacyjnych, dla każdego z genów struktury.
Gen nr Kodon terminacyjny dla translacji SEQ ID NO w których występuje kodon terminacyjny dla translacji Pozycja nukleotydowa kodonu terminacyjnego dla translacji w SEQ ID NO 1 lub SEQ ID NO 2
mlcA tag SEQ ID No.2 32723 do 32725
mlcB taa SEQ ID No.2 19840 do 19842
mlcC taa SEQ ID No.1 13479 do 13481
mlcD tga SEQ ID No.1 27890 do 27892
mlcE tga SEQ ID No.2 5730 do 5732
mlcR tag SEQ ID No.2 1915 do 1917
* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.
Tabela 9 przedstawia aminokwasy z końca C polipeptydów, kodowanych przez każdy z genów struktury, trójkę nukleotydów kodujących odpowiedni aminokwas oraz pozycję trójki.
T a b e l a 9: Aminokwas z końca C polipeptydu, kodowanego przez każdy z genów struktury
Gen nr Aminokwas na końcu C Sekwencja nukleotydowa trójki kodującej aminokwas SEQ ID, w której występuje odpowiednia trójka Pozycja nukleotydowa trójki w SEQ ID NO 1 lub SEQ ID NO 2
mlcA alanina gcc SEQ ID No.2 32720 do 32722
mlcB serina agt SEQ ID No.2 19837 do 19839
mlcC cysteina tgc SEQ ID No.1 13476 do 13478
mlcD arginina cgc SEQ ID No.1 27887 do 27889
mlcE alanina gct SEQ ID No.2 5727 do 5729
mlcR alanina gct SEQ ID No.2 1912 do 1914
* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.
Tabela 10 przedstawia sekwencje komplementarne do kodonów terminacji translacji, pokazanych w Tabeli 8, SEQ ID, w której występuje odpowiednia sekwencja komplementarna oraz pozycję tej sekwencji.
T a b e l a 10 Sekwencja komplementarna do kodonu terminacji translacji, dla każdego z genów struktury.
Gen nr Sekwencja komplementarna do kodonu terminacji translacji SEQ ID, w której występuje odpowiednia sekwencja komplementarna Pozycja nukleotydowa sekwencji komplementarnej w SEQ ID NO 1 lub SEQ ID NO 2
mlcA eta SEQ ID No.1 1479 do 1481
mlcB tta SEQ ID No.1 14362 do 14364
mlcC tta SEQ ID No.2 20723 do 20725
mlcD tca SEQ ID No.2 6312 do 6314
mlcE tca SEQ ID No.1 28472 do 28474
mlcR cta SEQ ID No.1 32287 do 32289
* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.
PL 202 457 B1
Tak jak opisano powyżej, ustalono pozycję oraz orientację każdego z genów struktury. W oparciu o te informacje, można ustalić jaki będzie produkt transkrypcji i translacji każdego z nich.
P r z y k ł a d 9: Otrzymywanie cDNA genu struktury mlcE
1) Przygotowywanie całkowitego RNA
Całkowite RNA Penicillium citrinum izolowano zgodnie z procedurą z przykładu 8.
2) Projektowanie starterów
W celu otrzymanie pełnej długości cDNA dla genu struktury mlcE, określonego w przykładzie 8, zaprojektowano i zsyntetyzowano następujące startery:
Starter nici sensownej 5'-gttaacatgtcagaacctctaccccc-3' (patrz SEQ ID 35 listy sekwencji); oraz starter nici antysensownej 5'-aatatttcaagcatcagtctcaggcac-3': (patrz SEQ ID 36 listy sekwencji).
Startery pochodzą odpowiednio z sekwencji na 5' końcu obszaru powyżej genu struktury mlcE oraz z sekwencji na 3' końcu obszaru poniżej tego genu. Syntezę starterów przeprowadzono według metody fosfoamidowej.
3) Reakcja RT-PCR
W celu otrzymania pełnej długości cDNA, kodującego produkt genu mlcE, używano zestawu Takara RNA LA PCR (AMV) Ver. 1.1.
Dokładnie, 20 μl mieszaniny reakcyjnej, zawierającej 1 μg całkowitego RNA, 2.5 pmoli losowych starterów o długości 9 nukleotydów (zawarte w zestawie) oraz 1 μl odwrotnej transkryptazy (zawarta w zestawie) inkubowano w 42°C przez 30 minut w celu wytworzenia pierwszej nici cDNA. Następnie odwrotną transkryptazę inaktywowano poprzez inkubację w 99°C przez 5 minut.
100 μl kolejnej mieszaniny reakcyjnej, zawierającej całkowitą objętość mieszaniny reakcyjnej z pierwszą nicią cDNA (patrz wyżej), 40 pmoli startera dla nici sensownej oraz 40 pmoli startera dla nici antysensownej inkubowano w 94°C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 60°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 30 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz transformowano do kompetentnych komórek Escherichia coli JM109 (wytworzonych przez Takara Shuzo Co., Ltd., Japonia) wg metody opisanej w przykładzie 4, wykorzystującej pCR 2.1. Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA i nazwano go pCRexpE.
Ustalono sekwencję wstawionego fragmentu DNA w wynikowym plazmidzie (pCRexpE). DNA zawierające pełnej długości cDNA odpowiadało genowi struktury mlcE. Sekwencja nukleotydowa oraz sekwencja aminokwasów otrzymana w oparciu o sekwencję nukleotydów pokazano jako SEQ ID N0.37 i/lub SEQ ID NO 38 listy sekwencji.
Najbliższym homologiem mlcE jest ORF10 pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (70% identyczności na poziomie aminokwasów).
P r z y k ł a d 10: Wytwarzanie wektora ekspresyjnego pSAK 700
Wektor ekspresyjny cDNA pSAK700 wytworzono wykorzystując wektory pSAK333 i pSAK360 opisane w przykładzie 1.
pSAK333 strawiono enzymami restrykcyjnymi BamHI i Hind III (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), poddano elektroforezie w żelu agarozowym, następnie fragment o długości 4.1 kpz wyizolowano z żelu i stępiono jego końce przy użyciu T4 DNA polimerazy (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia).
W kolejnym kroku, do powyższego fragmentu dołączono adaptor EcoRI-Notl-BamHI (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia) wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM 109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący plazmid z adaptorem; nazwano go pSAK410.
Plazmid pSAK360 strawiono enzymami restrykcyjnymi Pvu II i Ssp I, poddano elektroforezie w żelu agarozowym, następnie fragment (o długości ok. 2,9 kb), zawierający promotor i terminator genu kinazy 3-fosfoglicerynianowej (tu określanej jako „pgk) i HPT, pochodzące Escherichia coli, wyizolowano z żelu
Tak wyizolowany fragment zligowano w miejsce Pvu II plazmidu pSAK410, używając zestawu do ligacji DNA Ver.2 (wyprodukowanego przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo
PL 202 457 B1
Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA; nazwano go pSAK700.
Sposób wytwarzania plazmidu pSAK700 pokazano na Fig. 4.
Plazmid pSAK700 zawierał po jednym miejscu dla enzymów restrykcyjnych BamHI i Notl, gen oporności na ampicylinę (tu określany jako „Ampr), jak również gen HTP, warunkujący oporność na higromycynę, jako marker selekcyjny. W opisywanych przykładach, przy selekcji komórek Escherichia coli, transformowanych pSAK700 lub pSAK700, zawierającym wstawkę DNA, stosowano pożywkę uzupełnioną ampicyliną o stężeniu 40 μg/ml. Natomiast, przy selekcji komórek Penicillium citrinum SANK13380, transformowanych pSAK700 lub pSAK700, zawierającym wstawkę DNA, stosowano pożywkę uzupełnioną higromycyną ampicyliną o stężeniu 200 μg/ml.
P r z y k ł a d 11: Wytwarzanie wektora ekspresyjnego pSAKexpE
Wektor pCRexpE, otrzymany w przykładzie 9, trawiono w 37°C przez 2 godziny enzymami restrykcyjnymi Hpal i Sspl (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), następnie strawiony plazmid poddano elektroforezie w żelu agarozowym, poczym fragment, zawierający pełnej długości cDNA mlcE, o długości ok. 1.7 kpz izolowano DNA z żelu.
Po trawieniu plazmidu pSAK700 enzymem restrykcyjnym Not1 (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia) przez godzinę w 37°C, lepkie końce plazmidu stępiono przy użyciu T4 DNA polimerazy (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia). Następnie wektor poddano ekstrakcji mieszaniną fenolu z chloroformem i wytrącono etanolem. Wytrącone DNA zawieszono w małej ilości TE, po czym dodano do niego alkalicznej fosfatazy i inkubonano w 65°C przez 30 minut. Tak przygotowany wektor pSAK700 zligowano z fragmentem o długości 1.7 kpz (otrzymanym w pierwszym kroku), wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący odpowiedni wektor ekspresyjny.
Stransformowany szczep Escherichia coli, nazwany Escherichia coli pSAKexpE SANK 72499, otrzymany w opisywanym przykładzie zdeponowano w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 25 stycznia 2000, pod numerem depozytu FERM BP-7005, zgodnie z budapeszteńskim porozumieniem dotyczącym deponowania mikroorganizmów.
P r z y k ł a d 12: Otrzymywanie cDNA genu struktury mlcR
1) Przygotowywanie całkowitego RNA
Całkowite RNA Penicillium citrinum izolowano zgodnie z procedurą z przykładu 8.
2) Projektowanie starterów
W celu otrzymanie pełnej długości cDNA dla genu struktury mlcE, określonego w przykładzie 8, zaprojektowano i zsyntetyzowano następujące startery:
starter nici sensownej: 5'-ggatccatgtccctgccgcatgcaacgattc-3': (patrz SEQ ID 39 listy sekwencji);
oraz starter nici antysensownej 5'-ggatccctaagcaatattgtgtttcttcgc-3': (patrz SEQ ID 40 listy sekwencji).
Startery pochodzą odpowiednio z sekwencji na 5' końcu obszaru powyżej genu struktury mlcE oraz z sekwencji na 3' końcu obszaru poniżej tego genu. Syntezę starterów przeprowadzono według metody fosfoamidowej
3) RT-PCR
W celu otrzymania pełnej długości cDNA, kodującego produkt genu mlcR, używano zestawu Takara RNA LA PCR (AMV) Ver. 1.1.
Dokładnie, 20 μl mieszaniny reakcyjnej, zawierającej 1 μg całkowitego RNA, 2.5 pmoli losowych starterów o długości 9 nukleotydów (zawarte w zestawie) oraz 1 μl odwrotnej transkryptazy (zawarta w zestawie) inkubowano w 42°C przez 30 minut w celu wytworzenia pierwszej nici cDNA. Następnie odwrotną transkryptazę inaktywowano poprzez inkubację w 99°C przez 5 minut.
100 μl kolejnej mieszaniny reakcyjnej, zawierającej całkowitą objętość mieszaniny reakcyjnej z pierwszą nicią cDNA (patrz wyżej), 40 pmoli startera dla nici sensownej oraz 40 pmoli startera dla nici antysensownej inkubowano w 94 °C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 60°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 30 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz transformowano do kompetentnych komórek Escherichia
PL 202 457 B1 coli JM109 (wytworzonych przez Takara Shuzo Co., Ltd., Japonia) wg metody opisanej w przykładzie 4, wykorzystującej pCR 2.1. Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA i nazwano go pCRexpR.
Ustalono sekwencję wstawionego fragmentu DNA w wynikowym plazmidzie (pCRexpE). DNA zawierające pełnej długości cDNA odpowiadało genowi struktury mlcE. Sekwencja nukleotydowa oraz sekwencja aminokwasów otrzymana w oparciu o sekwencję nukleotydów pokazano jako SEQ ID NO.41 i/lub SEQ ID NO 42 listy sekwencji.
Najbliższym homologiem mlcR jest lovE pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (34% identyczności na poziomie aminokwasów).
P r z y k ł a d 11: Wytwarzanie wektora ekspresyjnego pSAKexpR
Wektor pCRexpE, otrzymany w przykładzie 12, trawiono w 37°C przez 2 godziny enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia), następnie strawiony plazmid poddano elektroforezie w żelu agarozowym, po czym fragment, zawierający pełnej długości cDNA mlcR, o długości ok. 1.4 kpz izolowano DNA z żelu.
Po trawieniu plazmidu pSAK700 enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia) dodano do niego alkalicznej fosfatazy i inkubonano w 65°C przez 30 minut. Tak przygotowany wektor pSAK700 zligowano z fragmentem o długości 1.4 kpz (otrzymanym w pierwszym kroku), wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący odpowiedni wektor ekspresyjny.
Stransformowany szczep Escherichia coli, nazwany Escherichia coli pSAKexpR SANK 72599, otrzymany w opisywanym przykładzie zdeponowano w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 25 stycznia 2000, pod numerem depozytu FERM BP-7006, zgodnie z budapeszteńskim porozumieniem dotyczącym deponowania mikroorganizmów.
P r z y k ł a d 14: Transformacja mikroorganizmów produkujących ML-236B
1) Przygotowywanie protoplastów
Spory szczepu Penicillium citrinum SANK 13380 z hodowli na skosach inokulowano na podłożu z agarem PGA i hodowano przez 14 dni w 26°C. Po hodowli, 1 x 108, wyizolowanych spor szczepu Penicillium citrinum SANK 13380 inokulowano w 80 ml pożywki YPL-20 i inkubowano w 26°C przez 1 dzień. Po potwierdzeniu kiełkowania, poprzez obserwację pod mikroskopem, kiełkujące spory wirowano w temperaturze pokojowej w 5000 x G przez 10 minut, a następnie odzyskiwano w postaci osadu.
Następnie spory przemywano trzykrotnie w sterylnej wodzie, aby umożliwić wytworzenie protoplastów. Dokładnie, 200 mg zymoliazy 20 T (wyprodukowanej przez Seikagaku Kogyo Corporation) oraz 100 mg chitynazy (wyprodukowanej przez Sigma Corporation) rozpuszczono w 10 ml 0.55M chlorku magnezu i wirowano w temperaturze pokojowej w 5000 x G przez 10 minut. Supernatant używano jako roztworu enzymu. 20 ml roztworu enzymu oraz 0.5 g (mokrej masy) kiełkujących spor, umieszczono w 100 ml konikalnej butelce i inkubowano z delikatnym wytrząsaniem w 30°C przez 60 minut. Po potwierdzeniu uzyskania protoplastów z kiełkujących spor (obserwacja mikroskopowa), mieszaninę filtrowano przez filtr szklany 3G-2 (wyprodukowany przez HARIO corporation). Przefiltrowaną mieszaninę wirowano w temperaturze pokojowej w 1000 x G przez 10 minut, a następnie protoplasty odzyskiwano w postaci osadu
2) Transformacja
Protoplasty otrzymane w punkcie 1 przemywano dwukrotnie w 30 ml 0,55 M chlorku magnezu i raz w 30 ml roztworu zawierającego 0,55 M chlorku magnezu, 50 mM chlorku wapnia oraz 10 mM 3-morfiolino propano sulfonian (pH 6,3 lub mniejsze, poniżej określane jako roztwór MCM). Następnie protoplasty zawieszano w 100 μl 4% (w/v) glikolu polietylenowego 8000, 10 mM 3-morfiolino propano sulfonianu, 0,0025% (w/v) heparyny (wyprodukowanej przez sigma corporation), 50 mM chlorku magnezu (pH 6,3 lub mniejsze, poniżej określane jako „mieszanina transformacyjna).
μl mieszaniny transformacyjnej, zawierającej około 5 x 107 protoplastów oraz 10 μl of TE, zawierającego 120 μg pSAKexpE lub pSA-KexpR, mieszano i inkubowano w lodzie przez 30 minut. Do powyższej mieszaniny dodawano 1.2 ml mieszaniny, zawierającej 20% (w/v) glikolu polietylenowego, 50 mM chlorku magnezu, 10 mM 3- morfiolino propano sulfonianu (pH 6,3). Następnie, tak otrzymaną mieszaninę delikatnie pipetowano i pozostawiono w temperaturze pokojowej na 20 minut. W kolejnym kroku dodawano 10 ml roztworu MCM, delikatnie mieszano i wirowano w temperaturze pokojowej przy 1000 x G przez 10 minut. Stransformowane protoplasty odzyskiwano w postaci osadu.
PL 202 457 B1
3) Regeneracja ściany komórkowej stransformowanych protoplastów.
Stransformowane protoplasty otrzymane w kroku 2) zawieszono w 5 ml półpłynnej pożywki VGS wylano na 10 ml stałej pożywki VGS. Płytkę inkubowano w 26°C przez jeden dzień, po czym 10 ml płynnego VGS, zawierającego 5 mg higromycyny B na szalkę (końcowe stężenie higromycyny 200 μg/ml) wylano na górę. Po inkubacji w 26°C przez 14 dni, oba szczepy (tj. pochodzące z protoplastów transformowanych pSAKexpE lub pSAKexpR) przesiano na pożywkę PGA, zawirającą 200 (ng/ml higromycyny B, po czym przesiano na skosy z pożywką PGA i inkubowano w 26°C przez 14 dni.
Skosy przechowywano w 4°C.
Test Przykładu 1: Porównanie zdolności do biosyntezy ML-236B w transformowanych i nietransformowanych szczepach.
Hodowano stransformowane szczepy otrzymane w przykładzie 14 oraz Penicillium citrinum SANK 13380, następnie w przypadku każdej hodowli oznaczano ilość ML-236B.
mm kwadratowych inokulum spor ze skosów, na których przechowywano strasformowane szczepy z przykładu 14 oraz ze skosów opisanych w przykładzie 2 (Penicillium citrinum SANK 13380). Komórki inokulowano w 10 ml pożywki MBG3-8 w 100 ml butelkach i inkubowano w 24°C przez dwa dni z wytrząsaniem. Następnie dodawano 3.5 ml 50% (w/v) roztworu gliceryny i kontynuowano hodowlę w 24°C przez 10 dni z wytrząsaniem.
Do 10 ml hodowli dodawano 50 ml 0,2 N wodorotlenku sodu, a następnie inkubowano w 26°C przez jedną godzinę z wytrząsaniem. Hodowlę wirowano w temperaturze pokojowej w 3000 x G przez minuty. 1 ml uzyskanego supernatantu mieszano z 9 ml 75% metanolu i poddawano analizie HPLC.
Jako kolumny w HPLC, używano SSC-ODS-262 (o przekroju 6 mm i długości 100 mm, wyprodukowanej przez Senshu Kagaku Co.Ltd). 75% (v/v) metanolu - 0.1% (v/v) trietyloaminy - 0.1% (v/v) kwasu octowego używano jako fazy ciekłej. Elucję przeprowadzano w temperaturze pokojowej, z szybkością 2ml/minutę. W powyższych warunkach, ML 236B był eluowany w 4 minuty po nałożeniu na kolumny. Detekcje przeprowadzano w detektorze UV przy długości fali 236 nm.
Biosynteza ML-236B była podwyższona w 3 z 8 szczepów transformowanych pSAKexpE. Zdolność do bisyntezy ML-236B w tych szczepach była 10% wyższa w porównaniu ze szczepami nietransformowanymi. Jednocześnie biosynteza ML-236B była bardziej stabilna po przesiewaniu (na pojedyncze spory). Powyższe wyniki dowodzą, że wstawka na plazmidzie pSAKexpE, jest cDNA, przyśpieszającym biosyntezę ML-236B.
Biosynteza ML-236B była podwyższona w 5 szczepach transformowanych pSAKexpR. Zdolność do bisyntezy ML-236B w tych szczepach była 15% wyższa w porównaniu ze szczepami nietransformowanymi. Jednocześnie biosynteza ML-236B była bardziej stabilna po przesiewaniu (na pojedyncze spory). Powyższe wyniki dowodzą, że wstawka na plazmidzie pSAKexpR, jest cDNA, przyśpieszającym biosyntezę ML-236B.
Stąd, cDNA powodujące przyśpieszoną biosyntezę ML-236B, otrzymane ze szczepu produkującego ML-236B zgodnie z opisywanym wynalazkiem, przyśpiesza biosyntezę ML-236B w mikroorganizmach produkujących ML-236B, po wprowadzeniu do mikroorganizmu produkującego ML-236B.
P r z y k ł a d 15: Okeślenie sekwencji cDNA genów struktury mlc A-D.
Określono sekwencja cDNA genu struktury mlc A.
Pierwszą nić cDNA zsyntetyzowano używając zestawu TAKARA LA PCR kit ver1.1 (Takara Shuzo Co., Ltd.). Przeprowadzono kilka reakcji PCR w celu amplifikacji części lub całości cDNA, używając pierwszej nici cDNA jako matrycy oraz różnych par oligonukleotydów jako starterów.
Używano następujących cykli: 30 sekund w 94°C, 30 sekund w 60°C i 5 minut w 72°C, powtarzając 30 razy. Do reakcji używano zestawu Big Dye Primer/Terminator Cycle Sequencing Kit oraz aparatu ABI Prism 377 sequence (PE Applied Biosystems).
Produkt każdej reakcji wstawiano do plazmidu pCR2.1.
Otrzymano transformanty Escherichia coli dla każdego plazmidu.
Ustalano sekwencję nukleotydową każdej wstawki.
Sekwencje eksonów i intronów ustalono porównując sekwencje produktów reakcji RT-PCR, wspomnianych powyżej z sekwencją genu struktury mlc A.
Następnie ustalono sekwencję cDNA genu struktury mlc A (SEQ ID NO 43), sekwencję aminokwasów otrzymaną w oparciu o opisane cDNA (SEQ ID NO 44) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.
Najbliższym homologiem mlcA jest LNKS(lovB) pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (60% identyczności na poziomie aminokwasów).
PL 202 457 B1
W podobny sposób uzyskano sekwencję cDNA genu struktury mlc B (SEQ ID NO 45). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 46) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.
Najbliższym homologiem mlcB jest LDKS(lov/F) pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (61% identyczności na poziomie aminokwasów).
W podobny sposób uzyskano sekwencję cDNA genu struktury mlc C (SEQ ID NO 47). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 48) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji..
Najbliższym homologiem mlcC jest lovA, pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (72% identyczności na poziomie aminokwasów).
Następnie, uzyskano sekwencję cDNA genu struktury mlc D (SEQ ID NO 49). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 50) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.
Najbliższym homologiem mlcC jest ORF8, pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (63% identyczności na poziomie aminokwasów).
Miejsca występowania eksonów każdego z genów struktury w sekwencji SEQ ID NO 1 lub SEQ ID NO 2 określono jak podano poniżej:
T a b e l a 11: Miejsca występowania eksonów w mlcA-D we wstawkach pML48
SEQ ID sekwencji, w której występuje ekson Bumer Eksonu Numer nukleotydu w SEQ ID NO 1 lubSEQ ID NO 2
MlcA 2 1 22913 do 22945
2 23003 do 23846
3 23634 do 23846
4 23918 do 24143
5 24221 do 24562
6 24627 do 27420
7 27479 do 27699
8 27761 do 30041
9 30112 do 30454
10 30514 do 30916
11 30972 do 32910
MlcB 2 1 11689 do 12002
2 12106 do 12192
3 12247 do 12304
4 12359 do 12692
5 12761 do 13271
6 13330 do 13918
7 13995 do 20052
MlcC 1 1 11631 do 12140
2 12207 do 12378
3 12442 do 13606
MlcD 1 1 24066 do 24185
2 24270 do 27463
3 27514 do 28130
PL 202 457 B1
Miejsca terminacji transkrypcji każdego z genów struktury w sekwencji SEQ ID NO 1 lub SEQ ID NO 2 określono jak podano poniżej:
T a b e l a 12: Miejsca terminacji transkrypcji każdego z genów struktury mlc A-E i R we wstawkach pML48
Gen SEQ ID NO sekwencji, w której występuje miejsce terminacji transkrypcji Numer nukleotydu w SEQ ID NO 1 lub SEQ ID NO 2
mlcA SEQ ID NO 2 32910
mlcB SEQ ID NO 2 20052
mlcC SEQ ID NO 1 13606
mlcD SEQ ID NO 1 28130
mlcE SEQ ID NO 2 5814
mlcR SEQ ID NO 2 1918
P r z y k ł a d 16: Badania dysrupcji genu.
Geny struktury mlc A, B i D P.citrinum poddano dysrupcji, przy użyciu ukierunkowaną mutagenezę, wykorzystującą rekombinację homologiczną.
Plazmid umożliwiający dysrupcję genu struktury mlcA P.citrinum wytworzono używając plazmidu pSAK333.
Fragment o długości 4,1 kpz, otrzymany po cięciu enzymem Kpnl plazmidu pML48, zawierający mlcA, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcA
P.citrinum SANK13380 stransformowano plazmidem pdismlcA
Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcA w celu potwierdzenia dysrupcji genu mlcA.
Otrzymany mutant dysrupcyjny, nie produkował ML-236B lub jego prekursora.
Plazmid umożliwiający dysrupcję genu struktury mlcB P.citrinum wytworzono używając plazmidu pSAK333.
Fragment o długości 1,4 kpz, otrzymany po cięciu enzymami Psl BamHI plazmidu pML48, zawierający mlcB, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcB.
P.citrinum SANK13380 stransformowano plazmidem pdismlcB.
Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcB, w celu potwierdzenia dysrupcji genu mlcB.
Otrzymany mutant dysrupcyjny genu mlcB, nie produkował ML-236B, ale produkował jego prekursor.
Plazmid umożliwiający dysrupcję genu struktury mlcD P.citrinum wytworzono używając plazmidu pSAK333.
Fragment o długości 1,4 kpz, otrzymany po cięciu enzymami Kpnl BamHI plazmidu pML48, zawierający mlcD, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcD.
P.citrinum SANK13380 stransformowano plazmidem pdismlcD.
Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcD, w celu potwierdzenia dysrupcji genu mlcD.
Otrzymany mutant dysrupcyjny genu mlcD, produkował ML-236B w 30% wzglądem szczepu kontrolnego.
P r z y k ł a d 17: Analiza funkcjonalna mlc R w transformantach pSA-KexpR.
Dwa transformanty pSAKexpR otrzymane w przykładzie 12, oznaczone odpowiednio jako TR1 i TR2, oraz nietransformowany szczep Penicillium citrinum SANK13380 inokulowano w pożywce MBG3-8, a następnie inkubowano oddzielnie, jak opisano w przykładzie 8.
Wyizolowano całkowite RNA z każdej hodowli, jak opisano w przykładzie 8.
PL 202 457 B1
Przeprowadzono reakcję RT-PCR, używając całkowitego RNA jako matrycy i oligonukletydów zaprojektowanych w oparciu o sekwencje genów struktury mlc A, B, C D E i R jako starterów.
T a b e l a 13: Sekwencje nukleotydowe par starterów do reakcji RT-PCR.
Cel RT-PCR Starter 1 SEQ ID NO Starter 2 SEQ ID NO
mlcA 5'-gcaagctctgctaccagcac-3' 51 5'-ctaggccaacttcagagccg-3' 52
mlcB 5'-agtcatgcaggatctgggtc-3' 53 5'-gcagacacatcggtgaagtc-3' 54
mlcC 5'-aaaccgcacctgtctattcc-3' 55 5'-ctttg tg gttg g atg catac-3' 56
mlcD 5'-cgctctatcatttcgaggac-3' 57 5'-tcaatagacggcatggagac-3' 58
mlcE 5'-atgtcagaacctctaccccc-3' 59 5'-tcaagcatcagtctcaggca-3' 60
mlcR 5'atgtccctgccgcatgcaac-3' 61 5'-ctaagcaatattgtgtttct-3' 62
Wyniki analizy RT-PCR przedstawiono na Fig. 5 dla nietransformowanego szczepu Pencillium citrinum 13380 oraz dla transformantów oznaczonych jako TR1 i TR2.
Geny struktury mlc A, B, C, D i R były wyrażane w transformantach pSAKexpR pierwszego, drugiego i trzeciego dnia hodowli.
Dla porównania, wymienione geny struktury w nietransformowanym szczepie były wyrażane jedynie trzeciego dnia hodowli.
Nie zaobserwowano różnicy w ekspresji struktury mlcE pomiędzy transformantami pSAKexpR i szczepem nietransformowanym.
Wyniki sugerują, że białko kodowane przez cDNA genu struktury mlc R, indukuje transkrypcje innych genów struktury (np. mlc A, B, C, D), znajdujących się w skupieniu genów biosyntezy ML-236B.
P r z y k ł a d 18: Analiza funkcjonalna mlc E w transformantach pSA-KexpE.
Transformant pSAKexpE otrzymany w przykładzie 12, oznaczony jako TE1 oraz nietransformowany szczep Penicillium citrinum SANK 13380 inokulowano w pożywce MBG3-8, a następnie inkubowano oddzielnie, jak opisano w przykładzie 8.
Wyizolowano całkowite RNA z każdej hodowli, jak opisano w przykładzie 8.
Przeprowadzono reakcję RT-PCR, używając całkowitego RNA jako matrycy i oligonukletydów zaprojektowanych w oparciu o sekwencje genów struktury mlc A, B, C D E i R jako starterów. Startery użyte w opisywanym przykładzie są takie same, jak przedstawione w tabeli z poprzedniego przykładu.
Wyniki analizy RT-PCR przedstawiono na Fig. 6 dla nietransformowanego szczepu Pencillium citrinum 13380 oraz dla transformanta oznaczonego jako TE1.
Gen struktury mlc E był wyrażany w transformantach pSAKexpE pierwszego, drugiego i trzeciego dnia hodowli.
Dla porównania, wymieniony gen struktury w nietransformowanym szczepie był wyrażany jedynie trzeciego dnia hodowli.
Z drugiej strony, nie zaobserwowano różnicy w ekspresji genów struktury mlcA, B, C, D i R pomiędzy transformantami pSAKexpE i szczepem nietransformowanym (wyniki nie załączone).
Wyniki sugerują, że białko kodowane przez cDNA genu struktury mlc E, przyśpiesza biosyntezę ML-236B, niezależnie od genów struktury mlc A, B, C, D i R.
PL 202 457 B1
WYKAZ SEKWENCJI
<110> Sankyo Company. Limited
<120> Geny ze skupienia genów
<130> EPP83481
<150> JP 2000-116591
<15li 2000-04-18
<150> JP 2000-117458
<151? 2000-04-19
<160> 52
<170 = Patentln. version 3.0
<210> 1
<211> 34203
<212 > DNA
<213> Penicillium citrinum
<400> 1
gatcaatact acgtcgttgt tatttccttg tcagtaatga ctaacaaatt ccccagaaca
gacgaagtca cagctcacac cacaagagaa aatgagtcca gcgaggatta cagatttctc
gccaggcaaa ccgagaaaag ctctcttatg catccacggt gccgggtgct cagcagccat
attccgcgtc cagatctcta aactgcgcgt ggcgttgaaa aacgagtttg aattcgtata tgcgaccgcg ccgtttagct ccagccccgg acccggcgtg cttcctgtct tccaaggcat gggtccatac tacacctggt tccaaaagca tcatgacgcc gttacaaaca cgacaacccc cacggtgggc gatagagtag cggctgtgat cgggcctgtg caaaagaccg tccaagattg gtctataact aacccacagg cacccattgt cggcatagtg gccttctctg agggcgcatt ggtcgccact ttgctgctcc atcaacagca aatgggaaaa ctgccatggt ttccgaaaat gagcattgct gttttgattt gctgtttcta tagcgatgaa gccagagatt acatgagagc cgaggcgcaa gacgacgacg acaagctaat aatcaacgtg ccgacactgc atcttcacgg tcgtcaagat tttgctctcc aagggtcgag acagatggtt gaaacacatt acctgcctca gaatgcagat gtactcgagt ttcagggaaa gcataatttt cccaacagac cgagtgatgt ccaggagacg gtcaagcgct tccaacagct atatcaaaag gtcaagatgt caggttcatt tgtctaggtg agacaacagg gtatatagca aggctctggc tctcatgcct agtccatacc acatttttac tgaacaaatt tgaatagttc taatcttaca cggtttgaat gctcaccttc caagggtgat ttagttatag tggtcgcgac catctcataa atatttcgtg aacatatttt ggatagatca tggaaggctc gttctgaaca ggcatgacag acatctaaaa ccactcgatc accacaacaa ggcactaaac cagtaactat ggaactattt gcaatggcgt cgaatttata tacaggatgg attgaaatca attccaagcc ttggaggttt caccttcctc acagagtctt tcgaaacgcg ctaccgaggt atatttatca ccgttacggt actctgaacc gcgctatcta acttgatgtt acgattgctg caataaagaa gagcaacgaa ggtagaagta attttgacaa agatacaaga cgaattcgct atttgtagat gaatatgcgt gtgtcaattg acgccgaatt caggatagat ttgccatctg ctctattgcc aatttctaat ccatctttat catgaacaac actcaaacca cacatctgaa ttcacggcgc tgaacgatct aggccaactt cagagccggg ttcatcgaga acatagtgag gattgaagaa aagtggtcta caaaggcctg agcgtgctca gggccataca gcgagctctg aagtttgaca tgaatgagtg ggtccttggt agggtcatcc
SO 12 0 180 240 300 3S0 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620
PL 202 457 B1 cacatctcga gaacgatgtc ataaggagtg cgctcacggg aagcgagaac actcgtcatt 1680 ttggcattgc caattgagcc actctccgct tgaccctgct tgtaatcaaa gacagcctgg 1740 aacaaggggg cgtgtgtctg agtcttgggt tcctcgcctg aggtagggag attcaggcct 1800 agacagtcga ggatgacgcc atacggcacc cgcgcgtgtt gcatggcctc acgcacactg 1860 tccttggtgg ctacaaggtg ctcgccgaat gtcttgctgc cgacgaactc atcaaagcgc 1920 a999gaa9ca cgttagcgaa aaagcccatc gccgaaattt cttccatggt ggatcggttg 1980 gtttcggcga ggccgatggt tatgtctttg ctgccggtaa gacgcgccaa caaaacgtgg 2040 taggcggcca ggtagaactg eatgggggtt gccttgtgct tgcggctccg ctctttgatt 2100 cggaaggcga ccatgggatc taaacgagca attgcttcat actgctgcca cgtgaatggc 2160 tgtatttgct gctgctctga attggcagca gggtcattga tcagattcat gatgggaagc 2220 acggttggcg cagatgacga gactttgcta tgcatggact tccagaacgc gatatcgtcc 2280 cccattcgcc cattttccag gttttcccgc tgttggacgg ctagatcaga gaattgggtc 2340 gatggtcgct gcattttcac cccgctgtaa atctgcccga tctcattgaa caggttttct 2400 gttgttgagc catcaccaac taatctgtgg tagccgatta ccaacaggtg gtcatctgtg 2460 ccccagtaga aatcaacgag tctgagagtg tcacctgtgg agatgctata gtttgtcttc 2520 tcgagtttcc ggtactcttc ctctgcctcc gcagcgttgt tcacctgaac aaagtgcact 2580 ctgttctccg ggttcttgag aaccacttgg acgggaccat ttaaatcgct gctatagtca 2640 tcgccagtaa caaagcacgt acggaagatc tcgtgacggc gcaatgaggc tttcagagcc 2700 cgcctcaacc ggtcgaggtc aatggtaccc ttcatgaaca tgccaatagt gttgttgaag 2760 atggtatgat cttttaccat ttgttgctgc ctccaggaat actcctggcc aagggacaac 2820 ctctcgcgac gaagaatctt acggcctccc tgctcattat cgtcctcttg ctcttcatcc 2880 tcttcggctg acgacgcatc tgtgctggta gcagagcttg cttcatcatg gctgtctgtt 2940 ggtgtcggag aagccccgct gtccgaggtt cccgtggaat caccaatttg caacagcagc 3000 ggaatggatg tagctgggag tcgggtggcc gcgtcgtcgg caagatcagc gacagaagca 3 OSO ccgccaagta ecctcaagag tgggaggtca aggtagagtt gctttgagaa ccatgagccg 3120 acagtcactg cacccaagga gtcgacacct tgatcaatga gaggaatggt tgggtccacg 3180 ctctccccgt ccgaaacttg gagggtaaca cggagtttct cagatagacc atctgcaact 3240 ttgttagttt gaactcgata tcaggaaacg catgagagat aacttaccaa tcacgatttg 3300 ccgaacttgg tctaaagttg ttgcttgttt gagctggtcg gcaatggagc ctttagaccc 33S0 tgatccattg tcgccaccgt ctccgcgttg accgggaatt ttgaagtttc cgaaacgagg 3420 gtcgttgaag taaataattc gatcttgaag cgcagggtca agatctggga tacccgtggt 3480 aagctcaagg tccgccatgt caatgaccgt cttgcgctgt ggttgctgcc gggcacgctg 3540 gtcagacacg accgcttcgg cgaaaagcgt gtgcagctca tgctcttcaa ctgagtcaaa 3600 catgaaacgg atagcatcaa agtcctcctc catctcggcc ctcgtgacaa accctacacc 36S0 gtaaacggca ccaatatcga tggttgatcc ctgtggttgt gcgttagtaa cttgacgtcg 3720 atgcatgata attcaggggt agaaaatacc gccaatcctc tggcgcaccg ttgctgggcc 3780 agagcctgta ggtaggcatt cgcagcgcca tagttggact ggccaggatt gccaataact 3840 gcaacaatgg acgaaaacat gatgaagaag tcgagcgcct tgctgcccgt ctgttcggag 3900 aaccgttcat gaagaatgcg tgctccttgt accttgggct tcaacaccat gtccatcatc 39S0 tggtggtcca tgttcttcag catgacatcc tgcagcacca aaggcccgaa cgcgatgccg 4020 gcaacaggtg gcaacttcat atcgacaagc ttgccaaggc cagcatcgac tgaatcctca 4080 ttggcaacat ccctaaagaa agtaattgga taagtaaacg aggatgtggt agcaaggtgt 4140 gatgtgatat caatcaactt acattgacag aacggtgatg tcaccaccaa gtgcctccat 4200 gttggcgatc catttgggat caagtcgagg gttccggcta gtgagcacaa catggcgggc 4260 gccatgcaag atcatccagc gacagagaga gcgaccaagg tccccggtaa gaccaacaag 4320 caaatacgtc ttcttgttgg aaaataagtt accagagtcg atggggcaaa tcctagcgga 4380 cacctcattt tccttccagt cgatgacggt ggccagattg aagcgttggt cattgtggtt 4440 gacagagagc tgaccaggca agagaatttg tgtggctgta ataactttct cagtgtcgtc 4500 gacagtcgac gcagagacgg tattttttgc cattgccaca gagtgctcga ggattggaat 4560 atcctcaaca tgactaactt tgtatgtgga agctgtactt cggataagat agtcaccact 4620 gtacatgaag caactgggtg gtagcaactt ggccaaacgg ttggttatcc cggcagcagt 4680 ccggtcggta gacaagtcaa agaatgccat catgtttgtc ggcaggctgt gtttcagccg 4740 agcgtcggtt tccttggcat gtaatcggat ccaaggagcc ggaatagttt tgacgtcgga 4800
PL 202 457 B1 cagagttgtt gccaaatgaa cctgaacacc gtaggttttg gccgactcca gaattgcttt 4860 gacgcagaag attgggggct ecataatcag aattgatgca tcagagccaa aggactgagc 4920 gctagagaga attgtttcgg caaggagggc tgcagctgtg gacaacaaga aggaactatc 4980 ctcgccttcc gccatgttat cgggcagact atgcatgtag tttctcggta catgcagtat 5040 agatccattc ttctcagcca gggcgactac aggcacctca catgtattct ccagaatact 5100 gccctgcacg acatggaagt atccgagatg gcccacgcga attgcctggg gaagagcgta 5160 gcgaacacga acagttgctt ttccagcatg acgagcgtct tctaacgaat cacacgtctc 5220 ggttgactca agatagtaca tcgatgagga tgctcccctc gcctctttca gtgcaatggc 5280 cgtcttggac gaattaaagt taccgaaaat tggacgacga gacgagttca tacggtcgtt 5340 cctagcaata tcctgcttca aacgagggac ccaggcacga cccttgcacc agtacacttc 5400 gggctcatga gtccatgtta ttgattccaa aagctgatca tcgctctcct cgaagcgcaa 5460 aagttgctca acgaagaatt tggtgtctag gttctccaca gtatcgacat cgaagacgtg 5520 cgttcccaag tcagggttct cgagcttgat tgtcctcaac attccgatgg tgctggcctg 5580 gtggggatga tcaatccagg cattctctgt cagccacatc atgcgtccgg cgtagaagag 5640 aagagacttg actgcctcaa acttgtcctc ttcaaggttg caaaacactt catcatcaag 5700 ttccgagagg atgacaaaag tcgacttagg ctgcaaggcc gggtcgtcga gaacactttc 5760 cagccgcttg acggagtgga tgtgtctatg cggtagggca gctttcatgt cgttcaaaat 5820 gcgttcggtt tttgtcgatt cgccaccgat aaccactaat ggcgggtatg agtccttcaa 5880 tggagcagaa agtggatcat acaaacgctc aacggtggca tccacagcat gtgtactgaa 5940 gacagacggg atcaaatcat cctctcgatc aagtgtccga ctatcgacgc cagagaaccc 6000 aactctcttg agggtatgct cccattggtc aacggacccc gaggcactca aagcacgagt 6060 ttcgtcttct ccagtccatc gatcagcgaa aagcccagag atgaaggcga ggcgagcagg 6120 ctcgcgatgg gtgaccccga aagtaaccaa gtgaccaccc ggcttgagca aggaccttat 6180 gtgagccaat ttttcctcga agttggagct ggcatggagg acatcggatg caataatcag 6240 atcgtaggag tgaggcttga atccttgctc tgctgggctt ctgttgatgt ctagtgcctc 6300 aaactgcatg agaccgtcga attcggaaag ttgttcacgg gccttgccaa taacatccgc 6360 cgagatgtca gtgcaagtgt aactgttgaa accaagttga ggtgatgcaa gaacgcgctt 6420 cgtggcgatg cctgtaccca agcctaaaaa gcgaacgaca gattagcaaa ctgcctagtt 6480 acttacattt cagattcgac ttaccgatct caaggatatc aatggattgg tagcgatgag 6540 caatttggct aaccagatcc tgaacgacgt gtattgctga gccaaaggcg agcttgttgg 6600 tatagtactc ggtgaacaac ccatcgcggt tcatgatatc caaaggatcc ccgttcccgc 6660 gaacaattga aattaattct ttgcctaccc tttggatcag gcgcacatgt gggtgggacg 6720 agttgcttca agtaaaaggt taatataaaa gaatgaaaaa acacggaaca gctttgggtg 6780 tacctttcac acatttgctc aatgtgaaca gaagtgtcct cctcccaaga ctcctggtac 6840 cactgatggt ggccagcccg agcatcggcc tgaacctggt cacaccattc aatgtacttc 6900 tgggaatgga ggtcggcatt ttgacggtcg tcgggggtta tctgggctag gaaggatttg 6960 atgtagaagt aaacgattcg ctcgatggtc agaatgtcct ccttgtcccg agctatgatc 7020 aacgtcgcag ggtcctccag cagtttttcg ggcgtgaggg gtccccagac ccactttgcg- 7080 aagattcggt ggtcggtcga agcagtcggg ggagagaaag gcttaaagac aatgttatca 7140 acttggaaaa gcgttgtctt ggtcgaatcg tacaccgtga tgtcgccgct caggaaatca 7200 cccttgtcgt gtgtgttgat tgtgtcaaac gcaagctcgg tttcaccaga attacccgcc 7260 gatatacaga gcgatggaat cagagtcact ctgtcaacgt gagtaggcac gtacaatgag 7320 cgtaggcgac gatctcctgg agaggaatac gctccaatga cagtctggaa cgcgatgtcc 7380 aggggcgctg ggtggagcaa gaggggctca ttgcgcaatt catccttaag tggaaggaaa 7440 gccaaggtgc cgctagcttt ggagtcggcc cttctcatgg tctgcaaacg acggaagtct 7500 ttgctgtagt catacccaag gaggtcaagt tcccgataga agaaatcgat gttgacattg 7560 ttcatctggg ggtactcttc ctcaggtggc ggcaaaagct gcgatgacgg tgatgcctcg 7620 ccaagggtta tgacgatttg gcctttggcg gatgtcgaaa gctcactctc ctttgccaga 7680 caggaatcaa taacaaattt gaccgtgact tggccatccg catcattgtc actggtgact 7740 tcggctgtca agttcagctc cacggaggtg ttttcatctt caaacacgat ggctttgttg 7800 atgctcatgt ccaagatttc caggagctga acttgggcgg cacgctcacc agccaccttc 7860 atggcagctt ccatggccat aattatgtac ccagcagcgg ggaacacagt ctggccttgt 7920 agcgcatgac cgtcgagcca ttccagatcc cggggcctga tgaagtttgt ccactggaag 7980
PL 202 457 B1 gtcgatgctg tgctgtaaga agaaagcttt ccaagcagaa gatggggcgc acctccacga 8040 agatgctggc gggtggagcg agattctgcc cagtattgac gagtatgatc ccaagagtat 8100 gtgggcaatg actttgacag gttttgaacg gcacgatcgg gccggacttg ttgtacgaag 8160 ccctcggcgt cgatactccg aactccgaaa cgctcccaaa tgtatcccag acctccagca 8220 aaagcgtcca catcgtcaac gtttcgtgcc aagcacccgg tatacggcag ctccacaccg 8280 gcaagagcat ccttgatggt ggctagacac ggacccttga gagcagggtg ggcgccaatt 8340 tcgatggcga cgtcgattag acgatgagtg atgactgctt tctgcacagc ctgcgagaac 8400 aagaccggag agacgagatt gtctttccaa taagcgggca tcacatcctg tacagtcatt 8460 tgcttgctgg tctcgtggac ggcagagaac caagcaacac tatcgttacc ttggccatcg 8520 gcaacagcac agtcgcactc cagcaatgcc ttgacatatg gagctgcgca tgggtgcatg 8580 tgatgcgaat ggtaggcctt gtcaactctc aagattctgg caaaagtgga ttcatcctcc 8640 aagacacctt caacgtgctg gatagcatcc atgtcgccgg agaaggtcac actatccggt 8700 gaattgctag cggcgacgca gacccgaccc tcaaaggctt cgagctcgca tagttccttt 8760 gcgtcatcgt acgacatacc tgccgcCagc atagcgcctg tctggccgct tggagaagag 8820 gcatgctccg cggacacaac tccacgcaga tgcgcaatac ggatagcttg agtggcactg 8880 atgaatcctg ccgcaaaggc acaggcaatc tcacctgaac tgtggccgac aattgcactg 8940 aactcgatac cagctgcagc gagaagtcgg accagaacga tttgtacggc gcagcataga 9000 ggctgggaga agctggcgag tctgacgttt gaggcatccc cttcaagcat gagctggtca 9050 tacagtgtcc acgtaggccg atacttttca ggcagtgttt gcagtgaatt atccagctct 9120 tcgagaatgc ctctcacaaa tggcataccc accatgagct tcttcagcat gcccggccac 9180 tgtgcacctt ggccagtaaa gacacctagt acgcgagggt tgtcattcgc gtcggtgcgg 9240 aagtcggtga cgacctcacc gtccgcgatg gcagcctcca gtgccgcgcg ggctacttcc 9300 ttgttgtgtg ctgeaatcgc acgacggaag ggcaagatag accgtttctc aagtaaggta 93S0 tatgcgatat catgcatgtc cacgtcatca tgcgtttcca gaaattggag catattttct 9420 agegttgcct tcatggagcg ctgcgacttc gatgaaagca caaggggcaa gctgcatgca 9480 tctgcatctg aggtcacctc tgttaccact gctgtcggct tgtgtggagg agccatatac 9540 tcttcgataa tagcatgggc atttgtacca ccaaatcctg atgtgtttat atgtttagct 9600 aacttcactt tcgttctcaa gaagtgcagt tgaatcctta ccaaatgaat taacgctgac 9660 tctgcgaggc tgcccgggcg caacaatcgg ccattctgtg gcctccgttg caattttcaa 9720 gtgcgtatag aacggagcga cacggggact gatcttctca aacagcaggt ttggcgggat 9780 cacgccattt cgtacagcaa acgatgcctt cattaagccc gcaataccag cagtgccttc 9840 cgtgtgaccg agaactgtct tgatgctgcc gacaaaaagc tcatctttct cgccgtcgct 9900 gtcgattgtt ccatccttgt gtccgaagaa ggctgttgca atagcctcag cttcctgtgg 9960 gtcaccggct ggtgtaccag ttcctgggat cttcgtgtta gggagagaga gactttctgc 10020 aacttccata aggctgatac ttccagggaa taccacttac catgggcttc aaagaactgg 10080 cagcgttcct gggggttggt aatatcaaga ccagccttgg catatgtggc ccgaatgagg 10140 gcttcttgtg cgctatggtt tggcattgtg atacctgtcg ttcggccatc ttggttgata 10200 ccggtctctc ggataacaca ctcgatactg tccccgtcgc gcagtgcctg gctcagcgtt 10260 ttcaggacaa tagagcaaac accttcctaa aaagcagtta caggaggtca gtgccatctt 10320 gctttttttg aaaggaattg atgcattgtc aacttactcc tctggcatat ccatcggcag 103Θ0 cagcatccca cattcgagat ctaccattgg gggacagcat gttcaatttg ctctccatta 10440 caaaggtcat ggggcccaat atcagattcg caccggctgc aaccgccatg gtactctcgc 10500 ccgttctaag ctgttggacg gccagatgca cggcagctaa ggatgaacta caggctgtgt 10560 cgatcgtcat ctgcagaatc agtcaggaat ctgtcagcac ttgacgaagt cgggctcgct 10620 caatgagtgg cactcacact cggcccatgc cagtcgaaga agtatgatac acggttggag 10680 gccacactga cagctacccc cgtggcagag tatgtaggaa tactatccaa ttcacgcgtc 10740 acgatagtct catagtcatg cgtcatcata ccgacgtaca cagcagtaga ggatccttga 10800 aggccttgga tccgtaggcc tgcgttggat acagcttcat agaccgtctc cagcagcagc 10860 ctttgctgtg ggtcaatcgt ttcggcctct ccagcttgga tgttgaagaa agaggcatca 10920 aaaccgcgta gatcctcctg cagcaagtat gcaaagggtg cgttcgtgcg cccggggtga 10980 gtgccatcgg ggctgtaaaa tgtatcgacg tcaaatctct ccttagggat cttggtctgt 11040 acatcccggg gctctttgag cagctcccaa agttttgatg gtgtgttgac accacctgga 11100 aaccgacaac cgcttcccac taccacaatt ggctcgtttg gatagttggc ttgatccata 11160
PL 202 457 B1 actgctgatc tcttctcact gagcgaacaa ctcatctaga gcaatgcaag tcctccatac ggctgtatca ctgctcctaa tttttttttt agtgctgtta ccactggtgt tcgaatcgta gtctcatcgc aatggtggga ggatcgaagc attgcaccat tgtacaagtt tCtCt3£ł^3.t tcaaggaaat cccaagcccc tgttcggtaa gacataccgc ttgtcacacg ggctggatat tatggcccat gtgaccaagt aaaaggccgc ggtttgaaga atttcgccgg ggcacccaga gctggacgcc agcgaatcaa tatccaatgg acaaccctga gcgaggatcc gcttcggctg ttctcctcgc aatactaccg ggcgcaacga aacaaatatg gctgtattag tttgtaatcg agaagggaga ctacaccgcc tctccccatt agtcttgatg tggacacaag gtgccaacgc gagaaaaaga agtataaaaa ttctcagggc gcattaaata ggccgctatg ctgtttttgg gcatgccggg gccggccttg ttcggacaat ctcggcacct ggcgttattc aggtgaaacc aggaaacaac ttcaaggttg ttcgattata gcataggtcc ccaatgggta ctaccgtttg gttgacgacc ttggttctcg cctcccatcg tttggcggat +- r-i-rt s l-na - fctgccaggat caagtacaca aagcgagggt gaatatacta aacagtcaca tgcaaagaac gctactgcga gcgccgcgca atgtgtagcg caccgccgac catctacgcc ccttattcag tgcctctctg gccggtcgag cctcttcatt tgtgtgggaa agacaaggcc gaacccacgc tcatatactg tcacgctttt ggacatcccg catccgtccc tcgagtaggt aacgtggtgt gagtgtgtat acgtagggaa ctctcaggcg ttcctactca tactccctcc ctttcgaccg gagaactttt gcattcactc cactgtaatg gtcaggctca ctccttcgta gcgataggat cacaacattt caaccgatac ttcaagatcc agcaaaccct ggtcacacga gagtttttca cgaactgccc actggaagag aaccgtcgca tatctgtctc tcgacccctc cgggggcgcc atgagggcta aaaaacgaca tccatggccg gtatgacctc i t i ΓίΓΐ -n /- +gcacatcttg aagccattgg aagtgtcaat gagtggcaaa ctcattatgg catgccgtga ccgctcgctc cgaaagatca aagggcgtgc ggccgctggt tcgacggatc cctctccgcc ttcaagctga tgcgccacta cccaagggcg aaccccgaaa ttcaccgctc gcttgtcccg attcagtatg agcgttcgta ctccctcatg caggcttatt tagtaaaata agactttggc tcctgctacg gtcggcagta ttgactggcg acatccccga cgccttccga ttcaacgcgc gacagtcaag ttccgacttc gtatttcagg gcccaggctc ctatacctcc tgggattaaa gttcttacag cgtcgttata attctagtac cccggcgtca ggctgaatga ctcggattgt catccaggta tgctctcggc gcgctctcat acgcaatgct aagcccttgt agtccgaact ggcaggactt agcccctgcg acgagtttcg tgaattttcc tcaacaaagt ctaccttggc ttttctgtct ccgcacctgt tcggcgacaa gtgtggcggt actggtttca ttgatcctga agccgcccca acgatgtggc ttttcgtcgg aagagatccg agctcctcga tgcgcagtac agttggccgc attatgatcc aattggagaa ggcggttctt atgtgaagcc tgcatccaac accggtgcta ccaatagttt aaacgcattt tatgtgcgag cagagcggcc atgaagcttt cttacgatga ctaggcgaaa ctacatatcc atttacaagg cctccgaggt gagaacgagt tatctctatt gattcagatt gtcgagctat ccttgtcttg aatcgeagag tttacttgca tcaaatgccc ttcggtgcac atcaaacgtg tcttgtgctg aacttcgatt cacaaaatcc tcttcgctct cggccaggtt ggcggtcgca gcaagtctat cgatacgtat cttcattgtt gaaaatcaaa attgttgtaa tctccctgga tgttttgaac cgacgctact tgagcattga ctattccaat aatctgccac acaagctcgc accgcaagga gattcagcga gtacgtcgat gggtgctcag tgcccttgtg cactgtaatc cagctgcatg cgctctcaga tgtggctgca ctaccgattt taccaacggt cgcctcgaag tgtaccagga cacaaagctc agatataaca ccgtcccaga tattcgattg agacagaaac atctgcttct tctcccggta cgagggctta gagaggacgg acaatctgta cttgcgggaa gctaagacag gcacatgtgt tactgctatc ggattcaggc acccgcttgg cgtcagtaga ttgaatctct cgtatcagta ccacttccca gaatagccat aatatcaatt ctcggtgaag gggggggggg cagaagcatt ttcttctttt cttctgaccg gtgcttctta aatcccaaaa ggtccgagct gattccggct gatatgtgca ctcaatgacg fcfcCy ciCyy y t cagttacaaa attgccaagt gcctctggct ggattggacc aatgaggagt caacttcgcg cgcaaattgc cgacgtgctg accatgcaat ctcgctatgg gacattgcca ggagaagggg aaagagacgc gacatcactc gaccgcatga atgcgcatgc gatcacatcg gaaatcaaga gacgatgaca atggtacgcc cgcaaactaa gaaactaggt tgatgccttc acagagagag ataccgccag caatcaccga ggctctgtta cgcaacgacg cccactgccc tcataatgga cttccctggt actttgttgc cagaagtcag ttcagaccat ccagacaaaa
11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 122 4 0 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740
800 13860 13920 13980 14040 14100 14160
22 0 14280 14340
PL 202 457 B1 ggcttcactg aacccttcaa cttaactgca tttcgccaca actaactcga cgaggccggc 14400 gatggtgtta ccattcatga gctcaaagat cgacacatca acatggattt cagatgtgat 14460 ccagtttcga agttcaatgg cgacgagtga gtctacgccg acacctgcca ggtttttgga 14520 cgaggacatg tcgtcttctg ccagaccaaa cattcgcatc agcttttccg tcattgcttt 14580 gaggacgata gaaatggcct cgtcgtgaga ggtgaccctg cttagttggg cccgcacgcc 14640 atctggtcct tttttatgcg aagagacaaa ggattggtct gcatgaagga cttggcggta 14700 tttaagtccc acaaaccgct gttcctgtat ccagtttgcc tcggtccagt gagcacccgg 14760 ggatgtgttg attcctgtaa ccacagctgc gggaggtgat ggaaattgag gggaagaaca 14820 caggattgcc ttctccaaca catccatgac gtccttttca tgcataggct tgtaacctat 14880 tctagcgagc cggtcggcca caccacggcc agtttcagcc acgtatccaa cagacttgac 14940 catgcccaag tcaatggtga cagccggcat gccatgggct ctccggtggt gcgcaagtgc 15000 gtcctggaat gcaccagcag ctgcgtaatt ggcctggcct gccccaccca tgaccccaac 15060 aagggatgag agcatcacga agaagtcaac atcctgtgcg atcttgtgaa gataccaact 15120 accctgtact tttgggcgtg ttgctgcatt aaattcatcc aatgtcattc gcgatagaag 15180 cgcgtccttg agaaccatgg caccttgtat gatacctcga attggcggtg catgtgcttc 15240 ttcgcacaac cggagcacct tggtgacctg atcttgatct gagatgtcac atgcgtgtag 15300 atagacagcg cactgttgat tttgcaagct ggttatgaat ggactggcct ttgcacttct 15360 cgataggata atcaagtgct tcgcgccatg atcaacaagc cactgacaga tctgctttcc 15420 aattcccccc agcccaccag caactaggta agaactgtca ggcttcagct tcagcgagaa 15480 ccctccatcg ccgactggga ccagttcgtc cccagataca ttgaccacaa ctttgccaac 15540 atgctgacca ctctgcatcg tacggaaggc cttctcgatg tttgacaagg agtgctgctg 15600 gattggacca atcaagccaa tcgcttttgt ctcgaggagt tttgtgacat ggttcaacgc 15660 ttcggatact tcttcacttt tggctctttg ccacgagaga agatcaattg atgtgaaaga 15720 gacgtcccgg gtgaatggca gcatgtcaag tctgctgttt tgctccaggt ccttttttcc 15780 aatctcaaca aatctgccga attcggccat gcagtcaaag cttgcttgga ggagttgacc 15840 tgccaatgag tttagaacga catgaacgcc aagtccgccc gtgtaggctt tgatgccgtc 15900 gacgaataag tcattcctgc tcgagaagat atgatccgga ttgatgccga atttatcgcc 15960 gacaaagtca cgcttggctt gagttcccgc tgtgacgaag acctcggcac ccgcaagctg 16020 ggacaaaatg atcgctgctt gaccgacgcc tccagctcca ctgtggatca agactctttc 16080 gcctcgtcgt agctttgccg tggtataaag cgcaatatat gcggtagtga aagccagggg 16140 gaccgaagcg gcttctggga agcccatttc gtccggaata cggacgacat tagtgtacgg 16200 cgtctgtgtt ctggtcgccc aatggccttt cagtagtgca catacgcggt cccctaatct 16260 gaggccttgg ctagcggcag cagctccacc gagctttgtg atcactccgg cgcattcgaa 16320 gcccatcaca cggttggcct ccaattgacc catggcaacc atgacatccc gaaaattgag 16380 accgaaagct ttgggttcga tttctaccca atcatccgga agatccttgc cttcacgtcc 16440 ttcgtcgtct cgaaattgca gggagtctaa gagccctggc gtctcaacct ccatccgcag 16500 acgacgcccg ggttgctcga acggctgcag tgtgaectca accgcttctt ggtccttcca 16560 gtgcgggtca ttgaaaagtc gcggtacgtg gatgacgccg tttctctctg caaattcaaa 16620 ctccttgtct tcggaaaggt cgccgaggcg gccattgaag atattgcaga tagcatacag 16680 ggactcgtgg gtgtatgcgt ttcgagaagg atcgagatcc aacgatacat attccttccc 16740 gttattttcg ttgcggatgg tacgcagcag accaatatgt agagctttcc atggatcctc 16800 ggagctcatg gctgctcctc tagacaccca gagaagtgcg ttgcagttat tcagcatcgc 16860 ggtgatggat ttgaaggtct cgcttcccac ctctccaagg agcgaggact ccatttcccc 16920 aagaaaaatg catgtccttc cagtggtatc tacctcgccc agagcgttga tcgatgggct 16980 agaactggtc ttttcacaaa ttgctgcctg gagactttcc agccaagatg aaggaggtcg 17040 gagcgctccg tgcagcaaaa gcacctccga ttctgccact gtatccgggg ttgtattctc 17100 ttttctagcc gtcgatagca ttgtgctgat catgtaaaac tcatcgtctt cacaatcacg 17160 aacctccaat tccacaccgt tgaaaccgct cgtgtccaac atggtgttcc aaagatcggt 17220 agtgagcgat ggcgtcgact tccgctcagg ctcctcactg agccaccaac ctggcaacag 17280 tccgaaggta aagaacaaat cgagctgatc cctggtagtc tcaaccaaaa tcaagttgcc 17340 cccaggcttg agcaattttc gaacgttact cagtgttcgt ttcatgcatc gagttgcatg 17400 caggacctgg caagccacga ccacatcgta ggtggcacat tcaaaccctt gttgctcggg 17460 atcgctttca atatccaatt ttttgaaagt catcacgtct tgccaatccg caaattgctc 17520
PL 202 457 B1 acgcgccgac tcgaaaaacc cggcagacac atcggtgaag tcataacgat cgatcggctt 17580 ggtgtttccc aatgcattga caataagctt tgtgcagccg cccgtgcctc cgccaatctc 17640 caaaatgcga gaacgcgggt tcttgtgggc gcaaagtcgg atcagctcgc tggcttgtgc 17700 gtttgatcgg ctccatttga ttgcgttgac gtagtatctg cttagcagct gatcttgcat 17760 catcaactca agtggctctg tttcgcggcg tagcattgct attaactgag gtcctagacg 17820 agaaatcatc tcgccattga cgctttctcc agcgactctg gcctgtaggc atttcttctg 17880 ctcagcatcg tcacttagcc agtcgcaact ggctgggctg agcttgtttt gtctcgcaag 17940 gtccaattgg acattcatcc aatcgaaata cttctgaagg tggccatcca gatgttggat 18000 atcagaattt gtcaaatcag tgacagcctc ctgtataaag ttgatcgtgc atcttcggag 18060 gCccatcatg agttccgttt ctttcgtctc agcctcagtg ctcaactttt ctttgagcca 18120 agtggagtca cccaagctga tgtcaggggc ccaaacccag gagctgcagg cattttctgt 18180 gtcgttggag tctgactttt ggtcagagaa gctgcttcca accgactgga aaacaaggcc 18240 ttcaatctct atgactggga ttccgtccga gggagaagaa ccgctatcat agtcatcaaa 18300 cactgccaag tcggtagaga aggattgaga gttgcgatcc ttgatgctgg cctgtgcgtc 18360 cagagcatca ccagcctcca agtcagccag gctagaggat attttgacat ttcttagcct 18420 ccttggtacc atggccgttt tcatacgtgt tcccgcgtag ggtaacaccg tgtatgccgc 18480 ctggatcacc gagtccagag tagtaggatg gacgatgtgt cgattctcgt acgagtgagg 18540 catagccgag gcagtgtcag caatggaaaa tctgcaaaac gagccctgtc cattyttttg 18600 aattcgctga atgttctgaa aaatgggtcc gtggcatatc ccattcgcgt gtaaggactc 18660 ccagagatcg ttgggatcaa tgctccggtt atctgagcct agattcaacc tgcgtgaggc 18720 ttccacagtt gaacagtcaa ggtggcttct ttcgctctcc gaacgtatta atccggtgca 18780 gtgttctgtc caggtattat tttcgcccga aattgagtgc acagaaaatt gatgccagtt 18840 ctttgtgccg agggaccttt cctcacatga acggatcgtt aggcgcaggt caacctctgc 18900 ttctgcatca gcgggtatta tgagagcctg cgcgagttca acgtcacgca agttgtagtt 18960 gatgctagcc cccgcaactg gtgggcagac ttgtgaaaac ccctcgatgg ccatgctgat 19020 gaagccagct cccggaaaga tgatgctcga accaacgacg tgatctcgta tccatggaat 19080 atctgacaga cggagaacat gtttccattt aggcgcgaaa tgaggagaga gagattcccg 19140 tgagcctatc aaagtgtgag gcggatgggt tctctgtttg gactcacgac Cgccgcgagg 19200 ctctctccaa taacgggttt ggtgattcca cgggtacgcc ggcaaatcgc tcagtacctt 19260 cactctgggc tcttttcttc catgaggaaa gtttatagcg tccattttga gcccataacc 19320 cttgcttatc aactccgtag cagcacgata cattgtctcc aacgagcttc tgccgcgaga 19380 aaggcaactg agatagttta tatctgttcc tttcagaccc agatcctgca tgacttggtt 19440 gattggacca ccaagcgctc cgtgaggccc tatttcaata atcacatcga cggctttctc 19500 tttggtgttg ggatcaaagc acatctcgcg gagtgaggac tcgaactcta ccggctgtag 19560 catactatcc atccagtgtg tgggatccaa tagcaattta agatcggtca tgcgactacc 19620 agtcttaggt gatgaatata atacaccctt tgaggtgtca gcattgggat tgtcgttgtt 19680 gttatccgag ttgaacagat ctctcagtga cgccccaaag gcatctgcca ttggtcgcat 19740 gtggcttgaa tggaaggctt cagtgacttt cagtttcctg gtaaagatgc catcggcgtg 19800 taacaacttt tcaagtttct cgattgcacc caaatctccc gacaccgtca cactacattg 19860 actgttgata catccaacca ccacacagcc gtcctcctgg ttgagacgcg aaatgtaaac 19920 attggtctca ctgcgaccaa gacccaccgc catcattcct cctttggctg ccaatgcggg 19980 cttgggctta gtggtcaata caccgcgtat ataagtgatc ccaatggccg accgcgcgga 20040 taaagcccca gctgcgtagg cagcagcagc ctctccactt gagtgactgg ttatccccgt 20100 tggccgaatt ccccatgacc aaaggagacg cacaagtgca atttggatag cggttgacag 20160 tggtagactg tattcggcat catttacccg agtcgtcagc tcatcacggt ggagctcctc 20220 tgtgcaattg aatgttagta cctcaagctt gatacagtat tacttttccc gggctcgcaa 20280 cttacccata aaattccaac tcgcgcccag ttgcttgatg tagccatcac attcaagaat 20340 cgcctgtttg aatactggga atgtattgac cagctctctg cccattgcat gccactgcgc 20400 cccctgaccg gtgaatacaa atccgagccg tactttctca ttcgctcgtt ttggttgatt 20460 ggactcatcg ctgagggcag aaacaaggcc gccaaggctg tctgctacat acactgacgt 20520 ccatggcaga atggaacggc gagagcctag tgtataggcg aggctggcga ggaagggttc 20580 cccgtcaatg tcagcgacgg atttaatgta gtctcgcagg cttgctatcg ttcgccgaca 20640 agcttgctcg tccttggcac gcacaacgta tatgcggctc tgtttggaac catcctcaac 20700
PL 202 457 B1 cctaccatgc tcagagttac cattgacatg cacttgatcc tctggcaggg ccaatgatgc 20760 gcgatcatat gattccaaaa tgacgtgagc attcgaacca ccaaagccga agttattgac 20820 agatgcgcga cgagtcccat ctttcacagg ccagtcttga gcagacatgg ggatctttga 20880 aacattaacc tttgaaacat ataactgaat ctgcgaatgc gcaaagcctt accttgatgt 20940 tcttttggtc aagcatcagc ttgctgttct tttgcaggaa ccgcgcatta gggggaatca 21000 agcccttctc caaggccaag gccaccttga ttatactggc caggccactg gcggcttctg 21060 tatggccaat atttgctttc acagagccaa ggtgcagagg atgtccttta aaagctgctg 21120 aaattgctga gatttcaagg gggtcaccag ttggtgttcc agttccgtgg gcctccacgt 21160 acgaggtcaa cgacatatct agcccagcct tatcgtaaca ctcctggatc agacttttct 21240 gcgccacatc actcggcgca gtaattgcgg gtgttttgcc atcctggttc agcgctgtct 21300 ctcgaatgac ggctcggata gggtcttggt ctcgcaacgc gttagggagg gcctttatta 21360 ccagagcggc aattccttcc ccgcgaccat atccattcgc tcgaggatca aaagagtacg 21420 agataccatc cggggacaaa aatctgtcat tgagcaacaa ggattgctta gttcaagact 21480 ctcgatctgg aatcttcttc ggaaaactca ccccaggttt gacatcgtaa caaaaacatc 21540 gggattgagc agaagatttg caccgataac gatggctgta tctgactccc cagtacgtaa 21600 gctctggcac gccaagtgca gtgcggtcaa tgtcgtcgaa caggccgtgt caaccgtcac 21S60 gctgggaeea cgtaagtcgt agaagtgtga tatccggttc gaaagcattg ttcctgagtt 21720 gccagttatg aaataacgcg gaactgtctc ggggtcacga ttgagcgaat cctgatagtc 21780 gtggtacatg acacccccaa acaccgacgt attagagcct gccataccat cgatggtgat 21840 accggctgga tgatggtcag tgacgtttgc ttacagtgag gatgacccac actacatacc 21900 actctccagc gattcgtaga ccacctcaag cataagccga tactgcggat ccatgcactg 21960 tccaatatta gatctctgcg tcccgggtta gatcaattga aataatcata cgctggcgac 22020 ctctgtggtc atgttgaaga acgcggcgtc aaataaagca ggatcctcgt cgatgaagtg 22080 tccacccttt acgtgggtct atccagtcat ccttggagtc agtaaccaag cttcagtgat 22140 gctcaaatct tgtgtcaaat attcaaaaca agatataaat gcatgcatgt tagatactca 22200 cggacccgac cctttcgcca ttcgggtggt atactcctct cacattgaat cgcgaggagg 22260 ggaccttaga ccaggcactg cctcctcttt caaccatttc ccaaagcttc tgtggactcg 22320 ttgcatctcc agcaaatcga catcccattc caactatggc aatgggcgtg gatgtgttag 22380 agcaagccga gcctgccatt gcggttgcgg ttgcggttgc ggttgcggtt gcggttacgg 22440 cgggggtatt gttcattcca acgttgtttc attgactgat atatcagtcg ccctggtgat 22500 aaaaccgttg atagtcttcc aacagtctac aggtccctgg catagctata gatgcataag 22560 ctgcccccga cacgtgattc atagttcggg gtttgttttc atcttggacg tgacacgata 22620 ttcgctctgt gcccatggga aaccccggac caccatgcta tgctcggggc aataccttag 22680 aggtaccggt tcgggaggca ttgtctgtcg tcacgataat cccgagtcaa aacgccgatg 22740 ggaaaccgtc gaacaagacg aaacaggtca ggccggccag gtagttttcg ggtataatgg 22800 aggctgtcag aatccgatac tccgtacaca gatgcgaaat acgcatacga gctatcaaac 22860 caaacgaatc caaaagcctt ggaaaagctt ggaaaggctt agtgggtaat cctgtcccaa 22920 ggtttgttga gggcctgagc gcagggtggg tcctgtaagc agttggtaat tcaatttcca 22980 acaatacaca atccccaaaa tttgcattat cggttgacta agacaagcaa acaaaatata 23040 tgcaggaagc gcaattcatc gcgagcaaac gatcatcatg agcatgtgac cctttcctct 23100 tttttctact tcggaaggcg gcatgatcat ctgtcagaac tcccaatcgg gagcaatacc 23160 ataccttacg gcaccccact cagacccatg cacaaagaaa atccatgcgc cgaatattga 23220 agccttggca acaaagcccc gtgtaactcc gaaggtatcc aaagaccgag agacgccgat 23280 ttgagagaca cgtacggagg tccacacaaa atgttcccga gtctatacac tatactccaa 23340 actgacttct tgtctacctg ggtatcttgt tcaggttgct gtttactgag ataaatgata 23400 ccgggggggg gggggggggg gggggttgac actggctttt cgtggacaga ataataccca 23460 tacatccctg cgtaagtagt cgtttcgaga agaatgtgtt tcgtggtgca ttactccgta 23520 ggcacaatat atttccattc ctcacgaagt ggcctcgtcc gggcgtgatc gatgcagctt 23580 gccgccccac caaaaaagga ccacaatacg agtcagatta gaaacgtcta acaggacgtc 23640 tatgtaagag gacgctcctt tgtatgtcgg atctaggcat gacaaaataa ctatacctag 23700 gtagtgttct gtcttattgg tcatttggcc tactttcgga acaatcttgg aagttcacat 23760 tcctaggtat cagggcaatt gattggtgtc cccagaattc ttttttctcg aataaaggat 23820 aaatttatgc ataaaaacct tggaaactga gcatagttat gagcacaaat actagttttc 23880
PL 202 457 B1 agtgcaattg agttgacacc aatctttccg tcccgtacct ccaatctacg tggaggtatg ttgcagagct tgtagcacag aatcaatgaa aatttctatc tagctagtac ttgataaagc agaatggctg atcaagcact caccattcct gccctttaac cgccggaact * .~r~^ rr.', r-Tiracacaaaacg tcaagagcgc tgactttcgt caagcgtcct taggggttcc ttggctttga gaaagcccca tcaattacgc tggtcgagat acttctgtgt acactgcgat ggtacgcgtt atgatgccca ttccgaagtt gctccaccct aaagtctgag gactagatga tcgcccccat acgagtatgg tcctctccaa tcaaggccgc ttgagcttga caagtctcca atgcctcatt cagccactag agaacacaat ttcccgggta gctctatcat agctgccgta ttggctatat atttcattcc aggcaatcaa gcccgtgtgt cggacgtcgg tacaaagtat gtcctactat ggtcatgaat ctgcctcagc aggaactgtt acggcagatt cactttatct gactagattc acctttcagc tcagcagcac caaaacggcg cacatacgtt agaatggggc gaagtggcag aatgaccttg tgctcccctc cgcctattcg cgtggctgct a h ł· n a h ± λ ca.
cagccttgct tcaaacgctc ctcactcttc tttgtcgtca gatgagcatg gaagagcatc gaagatacag cgtacgaagc ectgctccta tctagctgca tctgtctatc ggaagatgag agacagtgca caaattctgg tttccaagcc cggatcggcc actacttttc caagtacgaa agttggtgga atgggtgttt cagactggga ccaggccgaa agctcctcag agtcttaatt tgaacttccc cagcgagttg tgccctagag ttcgaggaca cgaaaactac gccagtccct tatggcaacc cctcggtggc gaagtttgat ccagaccgta gcggacaact cctttgcttg ccattcataa ctcaggggcg cagttgtccc atacctaggc caagccctaa ttttctcaga atggtcgctt cctctacgct tgtctacacc ggactactca tctttggtcg agcttcgacg gtattcccgg cctgtgaacc aaagataaag gttcaagaaa atggaacgcc caatgggtgc gacgtggttg ctcagcatga acatttgcct aggttgctat actctgacca tctgaccagg gccattcggg gttatcggtg ttgatcctgt aagctcgagg ggtctcagtc cgtacatatc atggtcgttg tcttctagtg attaaacccc caggcaagag ctagagtatc aaaatggtcg gtggcacttg atcaaagatc agcttcaacg accagagtgt aaagcatctc gtgtctcgca aacgatgagg aagagtctca ccggctaccg gcctgggaac gttggcgtcg accgagggcg ggtgccgtga gtccttgaac atgaaagaag atcgccggta
gtacccctta ccaattatac cctaggcagc 23940
aggtggacca gatgcaggga taaggaagcg 24000
cgcgccattt gttattttct tctactcatt 24060
tcccaacccc ttgggccgaa caaccttcct 24120
gcctaaccga ttaggttgct cattcgattt 24180
ttcccaattg aagtgctttt ccgtccccat 24240
gactacctag ctataggtac cactccaagc 24300
cgttgctacc ctctcgcttt cgcggtaggg 243S0
cgggaaatcg ggcattgacc tccacactcc 24420
cgatccatac cgtttgcacc atagctattc 24480
aagacagctt cttccatggc cccgcaaacg 24540
aaggaagtcg aagcttgatc accggcccac 24600
gggatgcaga tgttctcgga gatttcaacc 24660
ggtcatatgg ggttgcatct caagcagcct 24720
tatctgtgat tgaccttccc tcaacgtcga 24780
ttttcgcctt ctctgtggaa tacagcagcg 24840
tccccaacaa cagtgccgac ctgaaattgc 24900
O \ U < 4” u—r/·« — +“ L---J uyyat catgaaggct yCCayyyCtC 2 4 960
acgatacctg gacagagtct cttgatctta 25020
tcatggtgct aggttatata tcaatgcact 25080
aaaaattggg atcgaaggtt tggctggcta 25140
ttctcctcgg tctcgacgtg gccataagac 25200
ccgaaggcct ccccttcttg gtggtgatcg 25260
gggctgtttt gtcctatgct gtgcagcacc 25320
gtagcgtgac agccattgct gaaagtacca 25380
agaagggtta caatatcgtg tgccactacg 25440
ctgtcttagg catccaaggt gggctacagc 25500
tctttgactg tctgctgctg tttacattct 25560
taaaccgcct caaacgtcat atcaacatgc 25620
agcggacggc ggagagtgtc gcgaccagca 25680
tgtttggcaa tgatatgaaa ggcagcagtg 25740
gtttccttat cgtcaacctc gtcaacatcg 25800
gatcgttgtc cagtatatca tcttggaccg 25860
cgcttgagcc cttcaaggta gctggaagtg 25920
ggcgcggtca atcgactatg gtcactgtcc 25980
cttccattca ccgtggtacc tcgcagctac 26040
gtagcctgct caccagcctg gaagatcccg 26100
ccctaagtgt cgctctgaac agctatctgt 26160
ctaatctccc gagtcaccca gttgatccag 26220
ctgcccagaa ccagacccct cagattcaat 26280
tcactcctac caccaccgac agtgacagtg 26340
taaaggtcac taagcgagca gaaggaaaga 26400
cacaaatcga actggacaat ttgctgaagc 26460
atgtcgttgc cttgtctttg cggggaaagg 26520
aagactgcac tcgtgccgtc aaggttcgcc 26580
cagagcttac aagtatgctg gagcactcga 26640
gcgtgctcgg tgcatgttgc gagaacgtta 26700
ccggtcctat tgttatcgac ggcaagagtt 26760
tcctcgtcgc tagtgctagc cgtggcagta 26820
cagtcctgac tggcgacggt atgacacgag 26880
gagctggtgc tgctaagatc tggctcgatt 26940
ccttcaattc aaccagcaga tttgcgcgct 27000
ctcacttata tattcgattt aagactacta 27060
PL 202 457 B1 ctggcgacgc tatgggaatg aatatgattt ctaagggcgt ggagcatgca ctgaatgtta 27120 tggcgacaga ggcaggtttc agcgatatga atattattac cctatcagga aattactgta 27180 cggataagaa accttcagct ttgaattgga tcgatggacg gggcaagggc attgtggccg 27240 aagccatcat accggcgaac gttgtcaggg atgtcttaaa gagcgatgtg gatagcatgg 27300 ttcagctcaa catatcgaaa aatctgattg ggtccgctat ggctggctca gttggcggct 27360 tcaacgccca agctgccaat cttgcggcag ccattttcat tgccacaggt caggatccgg 27420 cgcaagttgt ggagagcgct aactgcatca ctctcatgaa caagtaagtt gaaagcggcc 27480 gcttacttgg aaacattcac taatcctgtt tagtcttcgc ggatcgcttc aaatctctgt 27540 ctccatgccg tctattgagg ttggaacgtt gggcggtggt acgattctgg agccccaggg 27600 cgcaatgctt gacatgcttg gtgtccgcgg atcacacccg accactcccg gtgagaatgc 27660 acgtcaactt gcgcgcatca tcggaagcgc tgttttggct ggggagctct cgctatgtgc 27720 tgccetagcc gccggtcacc tggtcaaggc gcacatggcg cacaaccgtt ctgccccggc 27780 atcttcagcc ccttctcgaa gtgtctcccc gtcaggcgga accaggacag tccctgttcc 27840 taacaatgca ctgaggccga gtgctgcagc tactgatcgg gctcgacgct gattaggtcg 27900 gaatcttagg agcattccaa gctccgtacc ccctccagtg gattcattgc aggaggatca 27960 tattttttct cattggttgt tattgtcata attttcaaaa gcacaatgca atgagacagg 28020 caggtggtag agtgaacggc cagaaagggt atctcatgtt tatatgttgt tgaaatttac 28080 gatgcaagta gtagggaaga agaatatata aagagatggt ccttttccag agagtgttta 28140 ggtctgatcc ctcataatta tttaatgagt gaaagctttg ttcaagctat aacttactga 28200 gtaggttgaa tgttgatctg attcattcct gaggtatcag gattgatgcc tgaaacatca 28260 atcatccatt gtcagatgcc gtaactaact aactatgaat ctcaacatag ttatatgttg 28320 ccaatctagc cacggtgact agaaccttga gatggactta gactagacat gggtcgcggg 28380 caatgacata tagaatcttt gaaatcgaca ttaattaagt atgtggagat tctttgtgga 28440 ggcacggtaa tgtgtctatc tagcaacgcg gtcaagcatc agtctcaggc acagcccggg 28500 tgtcgttttt ggttgcaatc ttccgccatc ccattccaaa ggcaaacaca aacgtgcacg 28560 ccgtagctcc cactgctaag taaaaagtat gatcaacggc gagactgtaa gcttttacaa 28620 cccctggaag gttattcttg ctgaccacat ctctgaagcc agtcgcccct gctgccgtca 28680 cggcctgcgt gtcgacagtg ggcgcatact tgctcaggcc agttctcaaa ccggacccaa 28740 agacaaggtt agcaaagtcc aggaagagcg atcctccaaa cgtctgtcca aacacggcga 28800 gagaaattcc gagggcacct tgttcgggcg aaagcgtgct ttggatggcg atgataggct 28860 ggccattgag tattgatgtc agcgtctagc ggttgcatgc tcttcttgct ttgatacaaa 28920 gccgaaagcg tgagagatga tcaaaggttt catagcttac cgtttgcatg ccacaaccac 28980 gaccgaagcc cgcgataaat tggtacatga cccatttcac agttgatgta tggggctgga 29040 aggtggatac cagacctgcg cctatggcga cgagaacagc gctgcctagg gcccaaggca 29100 aatagtatcc tgtctttcca actggtgcgt catatgtcag tatacacgat atccaagccc 29160 gatgtcagac ggttgtggca agaaaggagc catagaaatg gacggggtgg agaaaaatgt 29220 gtacgcgagt ttcacttact tgcgaagcca gaaaccatag ccataatgac ttgtccaaga 29280 attccaggca acatgtacac accactcagt gtgggagaaa catccttcac agcctggaag 29340 tagatcggta gatagtagga aaagacaagc aaggagccag agaaaaagcc cataaataaa 29400 caagagcacc acacttgtcg tttaccagcc actgagccag gaatcatggc aacagcatcg 29460 ccaacatgac gctcccatag cacgaacgca atcagagcaa accctccgcc acagaacagg 29520 ccgatgatga cggaacttcg ccaggtgtag gtcgaccctc cccattctag tgcgagggaa 29580 atcatggttg cgaaggctgc aaagaccaca aagcctacaa ggtccagttt gcgaagtgtg 29640 gattttatgt tggccattgg tttgtcggtc gagagttcgc tgtccgtgga tgaaattcgg 29700 tcgggtatgg tgatgacgag aaggaggaat gcagcgacag cgccgatggg gagattgata 29760 taaaagcctg aattccaagt gagaacatgg acaacaatca taaaaaggcc aaaggtcaac 29820 atacaccatc gccaagtggc gtgttgagtg aaagcacctc cgagcagtgg tccacagaca 29880 atggcaatct gactaactga aaacatattg tcagacgacg aaccgttcgt ttggggtaca 29940 tcagatcttg agatgacata cgacccatca tcactccaat caaaacttca tatgcgaggt 30000 cagcgtgtac acggcaccca gcagacttcc aaaaatcggt tcccttacct ggttgcttgt 30060 gcttaggagc agctgttgag aggattgtga gggctccgtt gacaagacct gagcctccca 30120 ttccagcaac ggcccgccca acaatcaaca tggtggaaga tcttgcggca ccgcatagca 30180 ccgagcctag ttcaaaaata cagaggaagg caaagaaagt gtacttcaag cccaagagtg 30240
PL 202 457 B1 tatacaattt accggccagg ggctggagag cacagctaaa tatgatgtta gctaatctgt 30300 tcgtacaatg aacaaggtca aggagaacag agccatactt agccagaaga taagcactgc 30360 cgtaccaccc tacatcgttc agagagtgga actcgcttgt gatatgtggg attgcctgtg 30420 gctggagtca attgactgtg ctgcgctctg ttctgaggta gccaccatct taccgtgacg 30480 ataatggaca tatcaaggag catcaaaaat gctacgaaag taactgaagc aaccaccagc 30540 ccgagcttga ggcctgtgat gtgctgggac ttggactcag tcgcttcgag cgtgtcattt 30600 tgactttctt ccttctgtgg ccttggttcc ccttctttag ggggtagagg ttctgacatc 30660 gcgcaattcc ttccgacttt tgcttcaagg ggcggtgtga atctctactg cgcggcgctt 30720 ctatagtacc tgtgttttgg tgtatgaatg atctcgctct cgttgtttcg ttaaggtccg 30780 ctagcctgaa gtcagattga tggatgggga tcaggggaaa ttggcgacgt ctttaatttt 30840 gcttttcttt gttaccggaa gtgttgcggt attagcgtgt ctgggcttat ttacgacgca 30900 caagatgcat tgaactggcc ccactgctag atctcactag tattgtggtt gtaatttacc 30960 tatactccat attgactggg caggttttga acacaaccca caccccccca tactacacat 31020 tagttttgca tattttcctg ggggccaaaa aaaccccaaa aggcttcaat attttgcggc 31080 caatggagag tgtaactaat ttggcccaca ctccggtggt atcaatcgga tctcactgca 31140 tatatgatga aagcaagagg gggcaggaga tacgctcttt attggctgtc tgcgcgaagc 31200 tggacaaatg caaataaaaa gacaaacaac cagctggaag accgggcgac aaacatggtt 31260 tacctaacac cctcgatccc aacaatgtgc atgttaatca atgtgctccg tggggagtat 31320 gaactataac atacgaagca gccattcatg tcaaaaaaaa aaccaggcga atgggcgtcg 31380 tcaacggttt cacataagta ctatattgta ctaactaccc gtgagactgg agagaacagt 31440 ctcgcgcgaa gaaacgataa gagcatcggt catatcggtc catctcggtc taagtgtatg 31500 agaatattcc gacgtgaatc catccgtcag tgatcaatgt ctccaagtaa ttcatcattt 31560 caattaccct cgctttactc cgtagaatac aagaccttac tagcgcaaac aagtgggggc 31620 taacggtgtg atctccttcc gttgcggccg ccacctcggt tccagccgta atacgacgac 31680 ccgtctatcg cgacccccta gccttggcca tttttggcgt tacagtaaag ctttggagag 31740 aaacgccaag ggaaaatgct agccaccaat tctataaatt actcttcaca tgcagctagt 31300 atcactggta agtctacggg gcacatgtaa aatttttatt actttctaat aatctttcca 31860 agttcttttc cacggggccc caatgcttaa aatactcaaa agacgtgaaa aacctgcaag 31920 ccgccagtga tatcacacgt aatgcctcaa cagcctgatt ccgagccatt atatgctgtt 31980 tgatgatctc aaattgagat ggcgagcget ggatctggga aattggtagt gggattggta 32040 tagaaacgta agtgcagaag accatgtaat aagtacatat ggaggctatg tgatggcccg 32100 atctagtttc ttcaatatag cgctgggtat aaaaaaaagc aggggctttc tcagggtaat 32160 gtcgcagtct acaacgagtg gcgtccactg acagggaaag gcgagcgggg ctatgctacc 32220 ttcaatttcc atagaggggg gatgcaccat ctccgacaat ctatagttac tcaaacaggt 32280 acggtactaa gcaatattgt gtttcttcgc taatgcgaat atttccttat agcaacgtcg 32340 caacacattt atcgtcttcc ctgaggcctt tgttgacttg ggctcttcgt ctccggcttc 32400 gtcactccaa agcacagata ggagacgaga ggccggcgtt atggttttat tttcagcgcc 32460 aaggatttgc cacgatgtgc ttggcatatc tgataggacc tattccccct ctcccggtca 32520 gcgcattgct gatgtatgca agggaagaaa agactggtgg ttatcggtcc cacttactag 32580 acgaatagat gccgcagccc cgtgctcctg tgctatcccc aaagcagtct caatctcact 32640 caatagtcga aggcttacac gcaatgtcgt gcatgcagaa gataaggcgt gcatgaatgg 32700 gtcgagatgt gaaatgagct cgccgatatg aagattagag tgaaacgagg gaagtgcttc 32760 ggctcttcca ttgtcatttc tagtggttga gccagaccag taccaatcca ttcgtgtgct 32820 ttgcttttgt ccacaaggtt gggctttcat cacctcggat agtagcagct gggaaagtga 32880 tgtcatgatt ttgacagaca acatgtagca atgcaccgcc atgaacaagt tcttggtttg 32940 cagacaccca tctaacatgc tgctattgct gctcgtgatc acacgttctt gaagatgtag 33000 tagcaatcta ccaaaggcat tcaaaaagtc ccctatcggg tctaggaaga agctttagcg 33060 acaatcaaga ggcagtaaac aggcagaatt gaaaatctca cagcttaaaa ttttttgctt 33120 gggccattcc acagtcaccc cgtggagtat tacctctagg tcctgtgaca catccgacag 33180 actttcgaaa aggtctcgtt gcgtgttgct tgtgttggat tgtccggatg acgagttccc 33240 ctctacttcg aggtcaaaca gcgatggcga gacaggcgcc gttgcatcca aagggccttc 33300 aaagtcgtag cctagatctg gtatccccga agattcattg ctgttggcat cgtcgcgaaa 33360 tgtatttggc tgaggccagc cgccgggaaa cgactcggga tcatcaaagt tgattgatgt 33420
PL 202 457 B1 atcatagaat gccaatatgc cgtagaagat ggcttcttta ttgttgacaa cttttgtgca aatcgttgca ctttgcatgt agttcaggtc gacaccaaaa tagcctctgc gtattacact atgccagatg atc <210> 2 <211? 342 < 212> DNA <213> Pen tgcagggttg gtaggtggtg gtcgcggtca tgtaaattgc cgttgacact tgacaccggt tgcggcaggg tcctggatct gtcttgctgg gccaatagtc tcttatgcga agaaagagtt aaatacctgt cillium ci ccgctgatgg agcagtaagg tcggttgtga gcttgggtag gagcacggac cacatgagcg acataattat ttatgtattg aagacttact ttactatgaa gctcatcaaa ctaaaagaaa aacgtggggc rinum ttctgataat tggaggagtc ggtttctgtg cctttcgctg taaattggca tcgaaacgcg tggattaaga gaattggaga aagttatatg tgtcttttca gctgggcata tagattcggc ataaaaaggc gtttccttga tctgccaatg gctcttgtag tacacacacc ttgctaccgg cgacggcgta tcaaataatg gtaagctcgt caaacaagtg gtcacccgga cataccccat cccccatctg aggctctagt gtgccgaggt atgagaagac ttccagctgc ttaatccggc tacatttgag ggttcgtcgg tgaggtgaga gcaggagata ttttcgagcg gaaatactct ccagcgccac gctatcatat ctaccagcag
33480
33540
33600
33S60
33720
33780
33840
33900
33960
34020
34080
34140
34200
34203 <400> 2 gatctgctgg catatatgat tacgtggcgc ctaagagtat gtccgctcga acttatctcc aagtctcacc attccgacga aagctcaaat caagccggat gccgcagctg acggtcttct ggcacctcgg gatacatcaa acatttcgcg tttgaaggcc gaggggaact agtctgtcgg cccaagcaaa tgtcgctaaa ctactacatc ctgcaaacca acatcacttt caaagcacac gccgaagcac gacccattca ttgagtgaga cgtctagtaa cgctgaccgg cttggcgctg gacgaagccg ttgcgacgtt tagactagag agccagatgg tggatggggt ttctccgggt aaacacttgt tgcacgagct tcacattatt acctacgccg gtaccggtag taaggtgtgt gaactacaag catcattggc cactcaagga tcaactttga acgatgccaa ctttggatgc cgtcatccgg atgtgtcaca aaattttaag gcttcttcct ttcaagaacg agaacttgtt cccagctgct gaatggattg ttccctcgtt tgcacgcctt ttgagactgc gtgggaccga gagaggggga aaaataaaac gagacgaaga gctataagga cctgcctttt ggggccgaat atgtatgccc gactgaaaag ttgcatataa tactctccaa tgatcttaat tcgcgcgttt caatgccaat gtacagcgaa agccacagaa agagactcct aacattatca tgatcccgag cagcaatgaa aacggcgcct acaatccaac ggacctagag ctgtgagatt agacccgata tgtgatcacg catggcggtg actatccgag gtactggtct tcactctaat atcttctgca tttggggata taaccaccag ataggtccta cataacgccg gcccaagtca aatattcgca tatgccccac ctatttcttt agctttgatg acattcatag cttagtaagt ttccaataca ccaataatta cgacgctcat ttagtccgtg aggctaccca acctcacaac ccaccttact gaaccatcag tcgtttcccg tcttcgggga gtctcgccat acaagcaaca gtaatactcc ttcaattctg ggggactttt agcagcaata cattgctaca gtgatgaaag ggctcaacca cttcatatcg tgcacgacat gcacaggagc tcttttcttc tcagatatgc gcctctcgtc acaaaggcct ttagcgaaga gttacaggta tagaactctt agctcgcata taagactatt cttccagcaa taaagatcca tgtccctgcc gtgaccggtg ctcagtgtca agcgcaattt cgatgaccgc gctcaccacc cggcaaccct gcggctggcc taccagatct cgctgtttga cgcaacgaga acggggtgac cctgtttact tgaatgcctt gcagcatgtt tgttgtctgt cccaaccttg ctagaaatga gcgagctcat tgcgtgtaag acggggctgc ccttgcatac caagcacatc tcctatctgt cagggaagac aacacaatat tttcatctgg tctagtgtaa agagcagagg ggcttttggt gacgacctga ggaacatgca gcatgcaacg tcatgcacaa acgttgtcaa acataaagaa gacatcttct tacgcatatt gcaattctat tcagccaaat aggctacgac cctcgaagta ccttttcgaa tgtggaatgg gcctcttgat tggtagattg agatgggtgt caaaatcatg tggacaaaag caatggaaga ttcacatctc ccttcgacta ggcatctatt atcagcaatg gtggcaaatc gctttggagt gataaatgtg tgcttagtac
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
PL 202 457 B1 cgtacctgtt tgagtaacta tagattgtcg gagatggtgc atcccccctc tatggaaatt 1980 gaaggtagca tagccccgct cgcctttccc tgtcagtgga cgccactcgt tgtagactgc 2040 gacattaccc tgagaaagcc cctgcttttt tttataccca gcgctatatt gaagaaacta 2100 gatcgggcca tcacatagcc tccatatgta cttattacat ggtcttctgc acttacgttt 2160 ctataccaat cccactacca atttcccaga tccagcgctc gccatctcaa tttgagatca 2220 tcaaacagca tataatggct cggaatcagg ctgttgaggc attacgtgtg atatcactgg 2280 cggcttgcag gtttttcacg tcttttgagt attttaagca ttggggcccc gtggaaaaga 2340 acttggaaag attattagaa agtaataaaa attttacatg tgccccgtag acttaccagt 2400 gatactagct gcatgtgaag agtaatttat agaattggtg gctagcattt tcccttggcg 2460 tttctctcca aagctttact gtaacgccaa aaatggccaa ggctaggggg tcgcgataga 2520 cgggtcgtcg tattacggct ggaaccgagg tggcggccgc aacggaagga gatcacaccg 2580 ttagCcccca cttgtttgcg ctagtaaggt cttgtattct acggagtaaa gcgagggtaa 2640 ttgaaatgat gaattacttg gagacattga tcactgacgg atggattcac gtcggaatat 2700 tctcatacac ttagaccgag atggaccgat atgaccgatg ctcttatcgt ttcttcgcgc 2760 gagactgttc tctccagtct cacgggtagt tagtacaata tagtacttat gtgaaaccgt 2820 tgacgacgcc cattcgcctg gttttttttt tgacatgaat ggctgcttcg tatgttatag 2880 ttcatactcc ccacggagca cattgattaa catgcacatt gttgggatcg agggtgttag 2940 gtaaaccatg tttgtcgccc ggtcttccag ctggttgttt gtctttttat ttgcatttgc 3000 ccagcttcgc gcagacagcc aataaagagc gtatctcctg ccccctcttg ctttcatcat 3060 atatgcagtg agatccgatt gataccaccg gagtgtgggc caaattagtt acactctcca 3120 ttggccgcaa aatattgaag ccttttgggg tttttttggc ccccaggaaa atatgcaaaa 3180 ctaatgtgta gtatgggggg gtgtgggttg tgttcaaaac ctgcccagtc aatatggagt 3240 ataggtaaat tacaaccaca atactagtga gatctagcag tggggccagt tcaatgcatc 3300 ttgtgcgtcg taaataagcc cagacacgct aataccgcaa cacttccggt aacaaagaaa 3360 agcaaaatta aagacgtcgc caatttcccc tgatccccat ccatcaatct gacttcaggc 3420 tagcggacct taacgaaaca acgagagcga gatcattcat acaccaaaac acaggtacta 3480 tagaagcgcc gcgcagtaga gattcacacc gccccttgaa gcaaaagtcg gaaggaattg 3540 cgcgatgtca gaacctctac cccctaaaga aggggaacca aggccacaga aggaagaaag 3600 tcaaaatgac acgctcgaag cgactgagtc caagtcccag cacatcacag gcctcaagct 3660 cgggctggtg gttgcttcag ttactttcgt agcatttttg atgctccttg atatgtccat 3720 tatcgtcacg gtaagatggt ggctacctca gaacagagcg cagcacagtc aattgactcc 3780 agccacaggc aatcccacat atcacaagcg agttccactc tctgaacgat gtagggtggt 3840 acggcagtgc ttatcttctg gctaagtatg gctctgttct ccttgacctt gttcattgta 3900 cgaacagatt agctaacatc atatttagct gtgctctcca gcccctggcc ggtaaattgt 3960 atacactctt gggcttgaag tacactttct ttgccttcct ctgtattttt gaactaggct 4020 cggtgctatg cggtgccgca agatcttcca ccatgttgat tgttgggcgg gccgttgctg 4080 gaatgggagg ctcaggtctt gtcaacggag ccctcacaat cctctcaaca gctgctccta 4140 agcacaagca accaggtaag ggaaccgatt tttggaagtc tgctgggtgc cgtgtacacg 4200 ctgacctcgc atatgaagtt ttgattggag tgatgatggg tcgtatgtca tctcaagatc 4260 tgatgtaccc caaacgaacg gttcgtcgtc tgacaatatg ttttcagtta gtcagattgc 4320 cattgtctgt ggaccactgc tcggaggtgc tttcactcaa cacgccactt ggcgatggtg 4380 tatgttgacc tttggccttt ttatgattgt tgtccatgtt ctcacttgga attcaggctt 4440 ttatatcaat ctccccatcg gcgctgtcgc tgcattcctc cttctcgtca tcaccatacc 4500 cgaccgaatt tcatccacgg acagcgaact ctcgaccgac aaaccaatgg ccaacataaa 4560 atccacactt cgcaaactgg accttgtagg ctttgtggtc tttgcagcct tcgcaaccat 4620 gatttccctc gcactagaat ggggagggtc gacctacacc tggcgaagtt ccgtcatcat 4680 cggcctgttc tgtggcggag ggtttgctct gattgcgttc gtgctatggg agcgtcatgt 4740 t99C9atgct gttgccatga ttcctggctc agtggctggt aaacgacaag tgtggtgctc 4800 ttgtttattt atgggctttt tctctggctc cttgcttgtc ttttcctact atctaccgat 4860 ctacttccag gctgtgaagg atgtttctcc cacactgagt ggtgtgtaca tgttgcctgg 4920 aattcttgga caagtcatta tggctatggt ttctggcttc gcaagtaagt gaaactcgcg 4980 tacacatttt tctccaccec gtccatttct atggctcctt tcttgccaca accgtctgac 5040 atcgggcttg gatatcgtgt atactgacat atgacgcacc agttggaaag acaggatact 5100
PL 202 457 B1 atttgccttg ccttccagcc gtcgtggttg ggctttgtat gccagcctat ctctcgccgt tctttgggtc ccgtgacggc gggttgtaaa cggcgtgcac acacccgggc gcctccacaa ttgcccgcga tggcaacata gattgatgtt tactcagtaa acctaaacac ctgcctgtct atatgatcct ttccgaccta ttaggaacag gatgccgggg gcagcacata cgtgcattct gcgccctggg gagacagaga agcggccgct gcgccggatc tgaagccgcc gaaccatgct cttcggccac ccgtacagta ccataacatt cagtagtagt gtaagcgcgc ccgaatcgag ggcctcgtgt ccttactgcc aataactctt caataacgtt gcttcgagtg agcggcgaac gaacctttcc tctgcttcag ctgtctttcc catcactgtc ttgattgaat caactggatc tgaacagata ggacgggatc cgtgtagctg cgaggacagt ggccctaggc ccatacatca tggcatgcaa caaagcaaga catcgccatc gtttggacag cggtttgaga agcaggggcg agcttacagt gtttgtgttt tgtgcctgag agaatctcca cccatgtcta taactatgtt tcaggcatca gttatagctt tctctggaaa cattgcattg cctgcaatga atcagcgtcg ggactgtcct cagaacggtt gcgagagctc caccgggagt gctccagaat tttgaagcga ttcaacttac ctgacctgtg aactgagcca atccacatcg aatgcccttg atttcctgat cagtgcatgc cttaaatcga aaatctgctg ccagatctta cataccgtcg acggctagca gccgtcgata ctcgcaacat ctccagcata cttgacggca ccgcaaagac caaattgtcc ttctgctcgc actgtcggtg ctgaggggtc aactgggtga gctgttcaga ttccaggctg cgaggtacca gaccatagtc agcgctgttc actgtgaaat acggtaagct agagcatgca caaagcacgc acgtttggag actggcctga actggcttca ctcgccgttg gcctttggaa actgatgctt catacttaat gtctaagtcc gagattcata atcctgatac gaacaaagct aggaccatct 3 t 3.3.3. Ca t Cjci tgcttttgaa atccactgga agcccgatca ggttccgcct gtgcgccatg cccagccaaa ggtcgggtgt cgtaccaccg tccgcgaaga ttgttcatga gcaatgaaaa gccatagcgg ctctttaaga ccccgtccat agggtaataa tccacgccct atatataagt gttgaattga gcagcaccag ccagtcagga ctagcgacga acaataggac gcaccgagca cttgtaagct cgagtgcagt aaggcaacga agttcgattt ttagtgacct gtggtaggag tggttctggg ctcgggagat gcgacactta gtgagcaggc cggtgaatgg gattgaccgc tcgtcgccat gggtcatgta atgaaacctt accgctagac tttcgcccga gatcgctctt gcaagtatgc gagatgtggt atcatacttt tgggatggcg gaccgcgttg taatgtcgat atctcaaggt gttagttagt ctcaggaatg ttcactcatt ctttatatat ~~i H —i η Ή ł· yaLagpg i, tu aattatgaca gggggtacgg gtagctgcag gacggggaga tgcgccttga acagcgcttc gatccgcgga cccaacgttc ctaaacagga gagtgatgca tggctgccgc acccaatcag catccctgac cgatccaatt tattcatatc tagaaatcat gagtaccggc aggcttcttt ctcgttcaag ctgtcacggc ggacgccctc cggcgacgcc cgcgttccca ctgcggtagc ctttgagact catcctcatc gtgtgcgaga ttagagatgc tgaacactct cagcgttgaa taggatcttt gggcaagtgc taccgaccat aaggatactc gccctcttgc aggcgcaggt ccaatttatc tgatcatctc gctgacatca acaaggtgcc cctggacttt gcccactgtc cagcaagaat ttacttagca gaagattgca ctagatagac ttcaaagatt tctagtcacc tacggcatct aatcagatca aaataattat tcttcttccc ctggccgttc ataacaacca agcttggaat cactcggcct cacttcgaga ccaggtgacc cgatgatgcg caccaagcat caacctcaat ttagtgaatg gttagcgctc aagattggca atttttcgat aacgttcgcc caaagctgaa gctgaaacct attcattccc gatagttgtc cattacggtc gacatcaaac accgccaccg ggtggttgcc aacagggact ggcgtagttt cggtgtcctc cttctctagg gttcaactcg cacgggaagt tttaattaag ggtctgagga gctttcggcc gattcccagt cacaaacacc ttttccacca tagttcgtac ctggaaaagt ctggtatcca gcgggcttcg tcacgctttc atactcaatg ctcggaattt gctaaccttg gacacgcagg aaccttccag gtgggagcta accaaaaacg acattaccgt ctatatgtca gtggctagat gacaatggat acattcaacc gagggatcag tactacttgc —i 4-n4--ir*r*-\ratgagaaaaa gctcctaaga cagtgcattg aggggctgaa ggcggctagg cgcaagttga gtcaagcatt agacggcatg tttccaagta tccacaactt gcttgggcgt atgttgagct ggtatgatgg ggtttcttat gcctctgtcg atagcgtcgc cgcatacttt tggccgacgt ttcacacacg aggttgattg ataggaatga ggcatatagc tcgtacggca gaaatgatag gcatacccgg ctgattgtgt tcactagtgg actaatgagg gcttggagac tggtcaagct ctggcggcct catttggaga actccatact ttgatggggg agttcatcta
5150
5220
5280
5340
5400
5450
5520
5580
5640
5700
5760
5820
5880
5940
5000
6060
6120 r ·ολ U _L O 'J
6240 6300 6360 6420 6480 6540 6600 6660 6720 67B0 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 7500 7560 7620 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 82 80
PL 202 457 B1 gtccacttcc agctaccttg aagggctcaa gcgggggttt aatggccgat ccgctcagac 8340 tttcggtcca agatgatata ctggacaacg atccactaga agaggcttgg aaaagggtgg 8400 agccgatgtt gacgaggttg acgataagga aaccaacgac catccagaat ttgaacttcg 8460 gaacactgct gcctttcata tcattgccaa acagatatgt acgtgcactg tcttgggcat 8520 cattgctggt cgcgacactc tccgccgtcc gctgactgag accctcatct tccaacgcgt 8580 accgcatgtt gatatgacgt ttgaggcggt ttacctcgag cttgatagac agaatcgcag 8640 tgtagaatgt aaacagcagc agacagtcaa agaacaggat caatgcagct agaacacaga 8700 agtgctgtag cccaccttgg atgcctaaga cagcaccgat aactaggagc aggatctcga 8760 ccacgtagtg gcacacgata ttgtaaccct tctcccgaat ggcgcttcgt acggcgtaat 8820 tgatggtact ttcagcaatg gctgtcacgc taccctggtc agactgtatc ttctggggct 8880 ttcggtgctg cacagcatag gacaaaacag ccctggtcag agtgatgctc ttctcaaagc 8940 caacgatcac caccaagaag gggaggcctt cggatagcaa cctcatgctc atcggaaccc 9000 ctagtcttat ggccacgtcg agaccgagga gaaaggcaaa tgttgacgac aaaaggacgc 9060 ttgtagccag ecaaaccttc gatcccaatt ttttcatgct gaggaagagt gagacgaaag 9120 tcaagtgcat tgatatataa cctagcacca tgacaaccac gtcgagcgtt tgagcgctct 9180 tgataagatc aagagactct gtccaggtat cgtgcaccca ttgagcaagg ctgcgttttg 9240 tgtgagccct ggcagccttc atgatccaca tctggcgttc catctcgatc aattgcgtct 9300 cctgcaattt caggtcggca ctgttgttgg ggatttcttg aacagcagcc acgagttccg 9360 gcgcgctgct gtattccaca gagaaggcga aaactttatc tttcgaatag gcggttaaag 9420 ggctcgacgt tgagggaagg tcaatcacag ataggttcac agggagggga gcaaggaatg 9480 gtgaggctgc ttgagatgca accccatatg accccgggaa taccaaggtc attagtgctt 9540 gatggttgaa atctccgaga acatctgcat ccccgtcgaa gctctgccac ttccagccat 9600 tctgtgggcc ggtgatcaag cttcgacttc cttcgaccaa agagccccat tctgctttat 9660 caacgtttgc ggggccatgg aagaagctgt ctttgagtag tccaacgtat gtggtactag 9720 ctagaatagc tatggtgcaa acggtatgga tcgggtgtag acacgccgtt ttggatagaa 9780 attggagtgt ggaggtcaat gcccgatttc ccgagcgtag agggtgctgc tgattcattg 9840 attccctacc gcgaaagcga gagggtagca acgaagcgac catgctgaaa ggtctgtgct 9900 acagcttgga gtggtaccta tagctaggta gtctctgaga aaagaatcta gtcagctctg 9960 caaatgggga cggaaaagca cttcaattgg gaattagggc ttgagataaa gtgcatacct 10020 ccaaaatcga atgagcaacc taatcggtta ggcgcctagg tataatctgc cgtcgtagat 10080 tggaggaagg ttgttcggcc caaggggttg ggagggacaa ctgaacagtt cctaggtacg 10140 ggaaatgagt agaagaaaat aacaaatggc gcgcgcccct gaggctgagg cagcggaaag 10200 attcgcttcc ttatccctgc atctggtcca cctttatgaa tggattcatg accggtgtca 10260 actgctgcct agggtataat tggtaagggg taccaagcaa aggatagtag gaccaattgc 10320 actgaaaact agtatttgtg ctcataacta tgctcagttt ccaaggtttt tatgcataaa 10380 tttatccttt attcgagaaa aaagaattct ggggacacca atcaattgcc ctgataccta 10440 ggaatgtgaa cttccaagat tgttccgaaa gtaggccaaa tgaccaataa gacagaacac 10500 tacctaggta tagttatttt gtcatgccta gatccgacat acaaaggagc gtcctcttac 10560 atagacgtcc tgttagacgt ttctaatctg actcgtattg tggtcctttt ttggtggggc 10620 ggcaagctgc atcgatcacg cccggacgag gccacttcgt gaggaatgga aatatattgt 10680 gcctacggag taatgcacca cgaaacacat tcttctcgaa acgactactt acgcagggat 10740 gtatgggtat tattctgtcc acgaaaagcc agtgtcaacc cccccccccc cccccccccc 10800 cggtatcatt tatctcagta aacagcaacc tgaacaagat acccaggtag acaagaagtc 10860 agtttggagt atagtgtata gactcgggaa cattttgtgt ggacctccgt acgtgtctct 10920 caaatcggcg tctctcggtc tttggatacc ttcggagtta cacggggctt tgttgccaag 10980 gcttcaatat tcggcgcatg gattttcttt gtgcatgggt ctgagtgggg tgccgtaagg 11040 tatggtattg ctcccgattg ggagttctga cagatgatca tgccgccttc cgaagtagaa 11100 aaaagaggaa agggtcacat gctcatgatg atcgtttgct cgcgatgaat tgcgcttcct 11160 gcatatattt tgtttgcttg tcttagtcaa ccgataatgc aaattttggg gattgtgtat 11220 tgttggaaat tgaattacca actgcttaca ggacccaccc tgcgctcagg ccctcaacaa 11280 accttgggac aggattaccc actaagcctt tccaagcttt tccaaggctt ttggattcgt 11340 ttggtttgat agctcgtatg cgtatttcgc atctgtgtac ggagtatcgg attctgacag 11400 cctccattat acccgaaaac tacctggccg gcctgacctg tttcgtcttg ttcgacggtt 11460
PL 202 457 B1 tcccatcggc gttttgactc gggattatcg tgacgacaga caatgcctcc cgaaccggta 11520 cctctaaggt attgccccga gcatagcatg gtggtccggg gtttcccatg ggcacagagc 11580 gaatatcgtg tcacgtccaa gatgaaaaca aaccccgaac tatgaatcac gtgtcggggg 11640 cagcttatgc atctatagct atgccaggga cctgtagact gttggaagac tatcaacggt 11700 tttatcacca gggcgactga tatatcagtc aatgaaacaa cgttggaatg aacaataccc 11760 ccgccgtaac cgcaaccgca accgcaaccg caaccgcaac cgcaatggca ggctcggctt 11820 gctctaacac atccacgccc attgccatag ttggaatggg atgtcgattt gctggagatg 11880 caacgagtcc acagaagctt tgggaaatgg ttgaaagagg aggcagtgcc tggtctaagg 11940 tcccctcctc gcgattcaat gtgagaggag tataccaccc gaatggcgaa agggtcgggt 12000 ccgtgagtat ctaacatgca tgcatttata tcttgttttg aatatttgac acaagatttg 12060 agcatcactg aagcttggtt actgactcca aggatgactg gatagaccca cgtaaagggt 12120 ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa catgaccaca 12180 gaggtcgcca gcgtatgatt atttcaattg atctaacccg ggacgcagag atctaatatt 12240 ggacagtgca tggatccgca gtatcggctt atgcttgagg tggtctacga atcgctggag 12300 agtggtatgt agtgtgggtc atcctcactg taagcaaacg tcactgacca tcatccagcc 12360 ggtatcacca tcgatggtat ggcaggctct aatacgtcgg tgtttggggg tgtcatgtac 12420 cacgactatc aggattcgct caatcgtgac cccgagacag ttccgcgtta tttcataact 12480 ggcaactcag gaacaatgct ttcgaaccgg afca.tcaca.ct· tctacgactt acytyytccc 12540 agcgtgacgg ttgacacggc ctgttcgacg acattgaccg cactgcactt ggcgtgccag 12600 agcttacgta ctggggagtc agatacagcc atcgttatcg gtgcaaatct tctgctcaat 12660 cccgatgttt ttgttacgat gtcaaacctg gggtgagttt tccgaagaag attccagatc 12720 gagagtcttg aactaagcaa tccttgttgc tcaatgacag atttttgtcc ccggatggta 12780 tctcgtactc ttttgatcct cgagcgaatg gatatggtcg cggggaagga attgccgctc 12840 tggtaataaa ggccctccct aacgcgttgc gagaccaaga ccctatccga gccgtcattc 12900 gagagacagc gctgaaccag gatggcaaaa cacccgcaat tactgcgccg agtgatgtgg 12960 cgcagaaaag tctgatccag gagtgttacg ataaggctgg gctagatatg tcgttgacct 13020 cgtacgtgga ggcccacgga actggaacac caactggtga cccccttgaa atctcagcaa 13080 tttcagcagc ttttaaagga catcctctgc accttggctc tgtgaaagca aatattggcc 13140 atacagaagc cgccagtggc ctggccagta taatcaaggt ggccttggcc ttggagaagg 13200 gcttgattcc ccctaatgcg cggttcctgc aaaagaacag caagctgatg cttgaccaaa 13260 agaacatcaa ggtaaggctt tgcgcattcg cagattcagt tatatgtttc aaaggttaat 13320 gtttcaaaga tccccatgtc tgctcaagac tggcctgtga aagatgggac tcgtcgcgca 13380 tctgtcaata acttcggctt tggtggttcg aatgctcacg tcattttgga atcatatgat 13440 cgcgcatcat tggccctgcc agaggatcaa gtgcatgtca atggtaactc tgagcatggt 13500 agggttgagg atggttccaa acagagccgc atatacgttg tgcgtgccaa ggacgagcaa 13560 gcttgtcggc gaacgatagc aagcctgcga gactacatta aatccgtcgc tgacattgac 13620 ggggaaccct tcctcgccag cctcgcctat acactaggct ctcgccgttc cattctgcca 13680 tggacgtcag tgtatgtagc agacagcctt ggcggccttg tttctgccct cagcgatgag 13740 tccaatcaac caaaacgagc gaatgagaaa gtacggctcg gatttgtatt caccggtcag 13800 ggggcgcagt ggcatgcaat gggcagagag ctggtcaata cattcccagt attcaaacag 13860 gcgattcttg aatgtgatgg ctacatcaag caactgggcg cgagttggaa ttttatgggt 13920 aagttgcgag cccgggaaaa gtaatactgt atcaagcttg aggtactaac attcaattgc 13980 acagaggagc tccaccgtga tgagctgacg actcgggtaa atgatgccga atacagtcta 14040 ccactgtcaa ccgctatcca aattgcactt gtgcgtctcc tttggtcatg gggaattcgg 14100 ccaacgggga taaccagtca ctcaagtgga gaggctgctg ctgcctacgc agctggggct 14160 ttatccgcgc ggtcggccat tgggatcact tatatacgcg gtgtattgac cactaagccc 14220 aagcccgcat tggcagccaa aggaggaatg atggcggtgg gtcttggtcg cagtgagacc 14280 aatgtttaca tttcgcgtct caaccaggag gacggctgtg tggtggttgg atgtatcaac 14340 agtcaatgta gtgtgacggt gtcgggagat ttgggtgcaa tcgagaaact tgaaaagttg 14400 ttacacgccg atggcatctt taccaggaaa ctgaaagtca ctgaagcctt ccattcaagc 14460 cacatgcgac caatggcaga tgcctttggg gcgtcactga gagatctgtt caactcggat 14520 aacaacaacg acaatcccaa tgctgacacc tcaaagggtg tattatattc atcacctaag 14580 actggtagtc gcatgaccga tcttaaattg ctattggatc ccacacactg gatggatagt 14640
PL 202 457 B1 atgctacagc cggtagagtt cgagtcctca ctccgcgaga tgtgctttga tcccaacacc 14700 aaagagaaag ccgtcgatgt gattattgaa atagggcctc acggagcgct tggtggtcca 14760 atcaaccaag tcatgcagga tctgggtctg aaaggaacag atataaacta tctcagttgc 14820 ctttctcgcg gcagaagctc gttggagaca atgtatcgtg ctgctacgga gttgataagc 14880 aagggttatg ggctcaaaat ggacgctata aactttcctc atggaagaaa agagcccaga 14940 gtgaaggtac tgagcgattt gccggcgtac ccgtggaatc accaaacccg ttattggaga 15000 gagcctcgcg gcagtcgtga gtccaaacag agaacccatc cgcctcacac tttgataggc 15060 tcacgggaat ctctctctcc tcatttcgcg cctaaatgga aacatgttct ccgtctgtca 15120 gatattccat ggatacgaga tcacgtcgtt ggttcgagca tcatctttcc gggagctggc 15180 ttcatcagca tggccatcga ggggttttca caagtctgcc caccagttgc gggggctagc 15240 atcaactaca acttgcgtga cgttgaactc gcgcaggctc tcataatacc cgctgatgca 15300 gaagćagagg ttgacctgcg cctaacgatc cgttcatgtg aggaaaggtc cctcggcaca 15360 aagaactggc atcaattttc tgtgcactca atttcgggcg aaaataatac ctggacagaa 15420 cactgcaccg gattaatacg ttcggagagc gaaagaagcc accttgactg ttcaactgtg 15480 gaagcctcac gcaggttgaa tctaggctca gataaccgga gcattgatcc caacgatctc 15540 tgggagtcct tacacgcgaa tgggatatgc cacggaccca tttttcagaa cattcagcga 15600 attcaaaaca atggacaggg ctcgttttgc agattttcca ttgctgacac tgcctcggct 15660 atgcctcact cgtacgagaa tcgacacatc gtccatccta ctactctgga ctcggtgatc 15720 caggcggcat acacggtgtt accctacgcg ggaacacgta tgaaaacggc catggtacca 15780 aggaggctaa gaaatgtcaa aatatcctct agcctggctg acttggaggc tggtgatgct 15840 ctggacgcac aggccagcat caaggatcgc aactctcaat ccttctctac cgacttggca 15900 gtgtttgatg actatgatag cggttcttct ccctcggacg gaatcccagt catagagatt 15960 gaaggccttg ttttccagtc ggttggaagc agcttctctg accaaaagtc agactccaac 16020 gacacagaaa atgcctgcag ctcctgggtt tgggcccctg acatcagctt gggtgactcc 16080 acttggctca aagaaaagtt gagcactgag gctgagacga aagaaacgga actcatgatg 16140 gacctccgaa gatgcacgat caactttata caggaggctg tcactgattt gacaaattct 16200 gatatccaac atctggatgg ccaccttcag aagtatttcg attggatgaa tgtccaattg 16260 gaccttgcga gacaaaacaa gctcagccca gccagttgcg actggctaag tgacgatgct 16320 gagcagaaga aatgcctaca ggccagagtc gctggagaaa gcgtcaatgg cgagatgatt 16380 tctcgtctag gacctcagtt aatagcaatg ctacgccgcg aaacagagcc acttgagttg 16440 atgatgcaag atcagctgct aagcagatac tacgtcaacg caatcaaatg gagccgatca 16500 aacgcacaag ccagcgagct gatccgactt tgcgcccaca agaacccgcg ttctcgcatt 16560 ttggagattg gcggaggcac gggcggctgc acaaagctta ttgtcaatgc attgggaaac 16620 accaagccga tcgatcgtta tgacttcacc gatgtgtctg ccgggttttt cgagtcggcg 16680 cgtgagcaat ttgcggattg gcaagacgtg atgactttca aaaaattgga tattgaaagc 16740 gatcccgagc aacaagggtt tgaatgtgcc acctacgatg tggtcgtggc ttgccaggtc 16800 ctgcatgcaa ctcgatgcat gaaacgaaca ctgagtaacg ttcgaaaatt gctcaagcct 16860 gggggcaact tgattttggt tgagactacc agggatcagc tcgatttgtt ctttaccttc 16920 ggactgttgc caggttggtg gctcagtgag gagcctgagc ggaagtcgac gccatcgctc 16980 actaccgatc tttggaacac catgttggac acgagcggtt tcaacggtgt ggaattggag 17040 gttcgtgatt gtgaagacga tgagttttac atgatcagca caatgctatc gacggctaga 17100 aaagagaata caaccccgga tacagtggca gaatcggagg tgcttttgct gcacggagcg 17160 ctccgacctc cttcatcttg gctggaaagt ctccaggcag caatttgtga aaagaccagt 17220 tctagcccat cgatcaacgc tctgggcgag gtagatacca ctggaaggac atgcattttt 17280 cttggggaaa tggagtcctc gctccttgga gaggtgggaa gcgagacctt caaatccatc 17340 accgcgatgc tgaataactg caacgcactt ctctgggtgt ctagaggagc agccatgagc 17400 tccgaggatc catggaaagc tctacatatt ggtctgctgc gtaccatccg caacgaaaat 17460 aacgggaagg aatatgtatc gttggatctc gatccttctc gaaacgcata cacccacgag 17520 tccctgtatg ctatctgcaa tatcttcaat ggccgcctcg gcgacctttc cgaagacaag 17580 gagtttgaat ttgcagagag aaacggcgtc atccacgtac cgcgactttt caatgacccg 17640 cactggaagg accaagaagc ggttgaggtc acactgcagc cgttcgagca acccgggcgt 17700 cgtctgcgga tggaggttga gacgccaggg ctcttagact ccctgcaatt tcgagacgac 17760 gaaggacgtg aaggcaagga tcttccggat gattgggtag aaatcgaacc caaagctttc 17820
PL 202 457 B1 ggtctcaatt ggcttcgaat ctcagattag acgccgtaca gtccccctgg ggcgaaagag tcccagcttg gtcggcgata gtcgacggca gcaggtcaac attggaaaaa gtctćtttca gaagcgttga atccagcagc catgttggca gggttctcgc attggaaagc ł-fi-rarfaar-rt-f-f
- ~ tatctacacg gaagaagcac gcgcttctat ggtagttggt cttgttgggg gacgcacttg atggtcaagt agaataggtt ctgtgttctt tccccgggtg aaataccgcc gatggcgtgc ctcaaagcaa tcgtccaaaa tggatcacat atcgccggcc gccttttgtc gccatggtct tgcctgactt gaagcaacaa actaccaggg ctctccatta cacgggcagt ccacgtcgtt acttaacaga agatcggtga tagctggcgg tctctctctc aaagaaggca agcacctagt gttttagttt gccggcgtac atttgtcatc gaatcttgat agccgatgtg ttcgggatgt gcgccggagt gggaccgcgt ctaatgtcgt ctttcactac tcttgatcca cgggtgccga aattcggcat tcaaagccta tcctccaagc aggacctgga catcaattga accatgtcac actccttgtc aagttgtggt tgaagctgaa agatctgtca catgtgacat atgcaecgcc cgcgaatgac atcttcacaa tcatgggtgg cgcaccaccg ctgttggata acaagcctat cccctcaatt ctcactggac aagtccttca gggcccaact tgacggaaaa acctggcagg ctgaaatcca tcgtcgagtt tggccaagcg gaagcctgaa ctggatagca agtacacatg aagctgtctt tgattcccgc gggtacagat gcgccgtcct gcctaagccc ttgtaccggg tatagaagca tgtgtttctg tcacaatcga ttctctggga gcgtgttata catgagcttt gtctcctggt ttccttcgag atcaccgttg catggttgcc gatcacaaag atgtgcacta ccgtattccg cgcatatatt cagtggagct ggtcttcgtc caatccggat cacgggcgga aagctttgac gcaaaacagc tcttctctcg aaaactcctc aaacatcgag caatgtatct gcctgacagt gtggcttgtt ctcagatcaa aattcgaggt attggatgaa gatcgcacag ggcaggccag gagagcccat cgtggctgaa gcatgaaaag tccatcacct cgaggcaaac tgcagaccaa aagcagggtc gctgatgcga tgtcggcgta tgttgatgtg agttgtggcg ggtatagctc tccaatctga gtaaatagag tgcactcgtt agcacctcgg aagccttgta tgtggatatg ctctttcgcc tcgtcatcgt agaaaagctt gatggccgct tctctcgcac ataaaatgcg cggaaactat tcttagcacc gtggttggat acaggcttca gcgaagaacc gtattctcca atgggtcaat ctcggtggag ctgaaaggcc gacgaaatgg gcgctttata ggaggcgtcg acagcgggaa catatcttct cttggcgttc tgcatggccg agacttgaca tggcaaagag gagacaaaag aaggccttcc ggggacgaac tcttacctag gatcatggcg accagcttgc gatcaggtca atcatacaag tttaatgcag gatgttgact gccaattacg ggcatgccgg actggccgtg gacgtcatgg cccgcagctg tggatacagg tcctttgtct acctctcacg atgtttggtc gactcactcg tcgatctttg aaatgcagtt gacggaggta atcgagcctg atacctgaaa ctcgaagtcg aggcttgact aatgcgcgtt tagtcggaag tagtcgggga aagcgccagt cattactgcc ctgcgtagca atagccaaag ttttatttta tggaataagc ggtcatgagg gcatacgaac catcatactg gcccgggaca attgagcggt tggaggccaa ctgctgccgc attgggcgac gcttcccaga ccacggcaaa gtcaagcagc ctcaagccaa cgagcaggaa atgtcgttct aattcggcag tgctgccatt ccaaaagtga cgattggctt gtacgatgca tggtcccagt ttgctggtgg cgaagcactt
a.a.aćłtCaaCa.
ccaaggtgct gtgccatggt caacacgccc tcttcgtgat cagctgctgg ctgtcaccat gtgtggccga atgtgttgga tggttacagg aacagcggtt cttcgcataa acgaggccat tggcagaaga tcgccattga agctcatgaa aagttgaagg tagtacgaag ggctgagcct taccattaca gaagagtgaa gtcaaaagtt gaacggtcga gcgggaggga tgttgagtag caacgcctga gacttcccta ggaatacaca tctacaccac ctaacctact ctggggacgg gagcgggatg gctaaaagcg aatcagtata agcgcgtggg gaaggccttg ccgtgtgatg tagccaaggc cagaacacag agccgcttcg gctacgacga gatcattttg gcgtgacttt tgacttattc aaactcattg atttgttgag cacccgggac agaagtatcc gattggtcca gagtggtcag cggcgatgga gctgggggga gattatccta gtgcgctgtc ccggttgtgc tctcaaggac aaaagtacag gctctcatcc tgcattccag tgacttgggc ccggctcgct gaaggcaatc aatcaacaca tgtgggactt aaaaggacca ttctatcgtc cgacatgtcc acttcgaaac tggtaacacc gttcagtgaa gagcatagcg gactatttaa gtggccctga tgctttttat ctctcttttt aaggcgttgg gtacttgtgt gaacatcaag gagaatgggg cgtggcggtg ctctctccct gttcgattac cgactaatac atgcatattt tcctcgttgc tgacggtagt tgagcgagga ttccagccga tctggatcct
17880
17940
18000
18060
18120
18180
18240
18300
18360
18420
18480
18540
18600
18660
18720
18780
18840 o 9 O G
18960
19020
19080
19140
19200
19260
19320
19380
19440
19500
19560
19620
19680
19740
19800
19860
19920
19980
20040
20100
20160
20220
20280
20340
20400
20460
20520
20580
20640
0700 20760 20820 20880 20940 21000
PL 202 457 B1 cgcgcatgcg cataaatcgg tagggatcat aattttcggg gttttcccac acatcagggt 21060 tgttcatgcg gtctgcagcc acagcggcca actcgccctt gggaatgaag aggccattgg 21120 atagagtgat gtctctgaga gcggtactgc gcatagtggc gcactcgacc ggcttgattc 21180 gctgcgtetc tttcatgcag ctgtcgagga gcttcagctt gaacagagag gcaggcgtcc 21240 agcccccttc tccgattaca gtgcggatct cttggcggag aggctgaata aggtctgggt 21300 gcctggcaat gtccacaagg gcaccgacga aaagatccgt cgaggcgtag atgccggcga 21360 aatccatagc gagctgagca cccgccacat cgtaccagcg gccgtcggcg gtgtcttcaa 21420 accattgcat ggtatcgacg tactggggcg gctgcacgcc cttcgctaca catgcggcct 21480 tttcagcacg tcgtcgctga atctcaggat caatgatctt tcgtgcgcgg cgcacttggt 21540 cacgcaattt gcgtccttgc ggttgaaacc agtgagcgag cggtcgcagt agcatgggcc 21600 atacgcgaag ttggcgagct tgtaccgcca cactcacggc atggttcttt gcaatatcca 21660 gccaćtcctc attgtggcag attttgtcgc cgaccataat gagtgtgact gttcgtgtga 21720 caaggtccaa tccattggaa tagacaggtg cggtttgcca ctctagtata ttcgcggtat 21780 gtcagccaga ggctcaatgc tcaagacaga aaaattgaca cttaccctcg cttttaccga 21840 acaacttggc aatagtagcg tcggccaagg tagccaatgg ctttgtgtac ttgggggctt 21900 gggtttgtaa ctggttcaaa acaactttgt tgacaagatg tgcatcctgg cagatttcct 21960 tgaacccgtc gaatccaggg agatgagagt gaaagtccta tacattcatc agaatcttag 22020 agacgfcoatt. gagt-tacaac a.atggaaaat tcagaggtca tacatccgcc aaaaacttgt 22080 acatgcacat atctttgatt ttccgaaact cgtcggccat ggacgatggg aggatggtgc 22140 aatagccgga atcaacaatg aagcgcaggg gcttgtcgtt tttcgagaac caagcttcga 22200 tccagctcgg accatacgta tcgaagtect gcctagccct catggtcgtc aactcccacc 22260 attttttggg attatagact tgcagttcgg actggcgccc ccgcaaacgg taggcgatga 22320 gaetaagaag cactgcgacc gccacaaggg cttgaggggt cgatacccat tggtacgatt 22380 cgacggtcag aagaacctgg ccgagcattg cgtgagacag ataggaccta tgcacaccag 22440 tggaaaagaa gaaagagcga agaatgagag cgctgcgacg gtttataatc gaataacagc 22500 actaatgctt ctgggatttt gtggccgaga gcactcttcc agtcaacctt gaaaaaaaaa 22560 aaaccccccc cccaatcgaa gtttacctgg atggggcagt tcggttgttt cctttaggag 22620 cagcttcacc gagcagcaca agaacaatcc gagtgaaaaa ctcggtttca ccttgataca 22680 gccaattgat attcacgttt gattcattca gcctcgtgtg accgaataac gccgtatgga 22740 ggaatggcta ttcgtgcacc gaatgacgcc gggagggttt gctaggtgcc gagcttgcat 22800 tgctgggaag tgggggcatt tgagtactag aatggatctt gaaattgtcc gaatctagat 22860 gagtactgat acgtgcaagt aaatataacg acggtatcgg ttgcaaggcc ggcttgttcg 22920 ctcagagatt caactctgcg attctgtaag aacaaatgtt gtgcccggca tgcagtgaga 22980 agatctactg acgcaagaca aggtttaatc ccaatcctat cgcccaaaaa caggatcagc 23040 agttatggat caagccaact atccaaacga gccaattgtg gtagtgggaa gcggttgtcg 23100 gtttccaggt ggtgtcaaca caccatcaaa actttgggag ctgctcaaag agccccggga 23160 tgtacagacc aagatcccta aggagagatt tgacgtcgat acattttaca gccccgatgg 23220 cactcacccc gggcgcacga acgcaccctt tgcatacttg ctgcaggagg atctacgcgg 23280 ttttgatgcc tctttcttca acatccaagc tggagaggcc gaaacgattg acccacagca 23340 aaggctgctg ctggagacgg tctatgaagc tgtatccaac gcaggcctac ggatccaagg 23400 ccttcaagga tcctctactg ctgtgtacgt cggtatgatg acgcatgact atgagactat 23460 cgtgacgcgt gaattggata gtattcctac atactctgcc acgggggtag ctgtcagtgt 23520 ggcctccaac cgtgtatcat acttcttcga ctggcatggg ccgagtgtga gtgccactca 23580 ttgagcgagc ccgacttcgt caagtgctga cagattcctg actgattctg cagatgacga 23640 tcgacacagc ctgtagttca tccttagctg ccgtgcatct ggccgtccaa cagcttagaa 23700 cgggcgagag taccatggcg gttgcagccg gtgcgaatct gafcattgggc cccatgacct 23760 ttgtaatgga gagcaaattg aacatgctgt cccccaatgg tagatctcga atgtgggatg 23820 ctgctgccga tggatatgcc agaggagtaa gttgacaatg catcaattcc tttcaaaaaa 23880 agcaagatgg cactgacctc ctgtaactgc tttttaggaa ggtgtttgct ctattgtcct 23940 gaaaacgctg agccaggcac tgcgcgacgg ggacagtatc gagtgtgtta tccgagagac 24000 cggtatcaac caagatggcc gaacgacagg tatcacaatg ccaaaccata gcgcacaaga 24060 agccctcatt cgggccacat atgccaaggc tggtcttgat attaccaacc cccaggaacg 24120 ctgccagttc tttgaagccc atggtaagtg gtattccctg gaagtatcag ccttatggaa 24180
PL 202 457 B1 gttgcagaaa gacccacagg gacagcgacg acggaaggca gtgatcccgc cacttgaaaa agagtcagcg gttagctaaa agagtatatg agatgcatgc gctagaaaat atatacctta caaggaagta cttccgcacc acagtggccg cgaagagctg gtatgaccag
-'Ί ,4 gttcagtgca catcagtgcc tgcctcttct cgcaaaggaa ttcaccggat cttggaggat tcacatgcac tgccgatggc gcaaatgact cttgttctcg cgaaattggc tgccggtgtg ttttgctgga gggcttcgta cacatactct tcttcgtgga gaccttccag gctacaaggc catgaaggtg catcaacaaa cgaagtcacc ctgtctggca tggcgaggca gaacaatgtc caaagacttc ggctttcctt cctggacatc acgctcattg atcggcgggt gggtgatttc agttgataac cttcgcaaag gttgatcata catcaaatcc ccagaagtac gtctctctct aagctgaggc gcgagaaaga ctgctggtat caaacctgct ttgcaacgga ttaattcatt catataaaca gctcctccac agcttgcccc atgctccaat cttgagaaac gcccgcgcgg gaegcgaatg ggcatgctga gataattcac ctcatgcttg tgcgccgtac attgtcggcc actcaagcta ccaagcggcc ctatgcgagc agtgtgacct gaatccactt ccatgcgcag caaggtaacg gtacaggatg caggctgtgc gcccaccctg gagctgccgt ggtctgggat caacaagtcc tgggatcata ggtgcgcccc tggacaaact cagactgtgt gctggtgagc gccatcgtgt agtgacaatg aaggagagtg tcaccgtcat aacatcgatt cgtcgtttgc ccacttaagg gcgttccaga tacgtgccta aattctggtg ctgagcggcg attgtcttta tgggtctggg gctcgggaca ttcctagccc attgaatggt ccctaacacg tattgcaaca tgagcttttt tgcgggctta gtttgagaag ggccacagaa tggtaaggat catcaggatt acaagccgac ttgtgctttc ttctggaaac ggtctatctt cactggaggc acaaccctcg agaagctcat tgcaaacact aaggggatgc —» —t —» Ί— r</-i ł- l- η łO.CŁCŁ l_ k_ l_ L.
acagttcagg tccgtattgc agacaggcgc tcgaagcctt tctccggcga ttgccagaat ctccatatgt atagtgttgc tgatgcccgc agaaagcagt ctctcaaggg ataccgggtg acatttggga ggcccgatcg ctcgtcaata atcttctgct tcatcaggcc tccccgctgc gtgccgccca ttgaagatga atgcggatgg agctttcgac cgcagctttt tcttctatcg agaccatgag atgaattgcg ctgtcattgg ctcacgttga aaaccgagct acatcacggt agcctttctc gacccctcac aggaggacat agataacccc gtgaccaggt aagatcccag gccttcttcg gtcggcagca atgaaggcat atcagtcccc tggccgattg tcaactgcac tggtggtaca agcagtggta atcgaagtcg gcatgatgac gcccttccgt tgccatcgcg cgtactaggt ggtgggtatg gcctgaaaag ctcaaacgtc
-~r·—vł— β-t —1 r~. 4— 4— y y i_ l.
tgagattgcc gcatctgcgt tatgctagcg tgagggtcgg catggatgct cttgagagtt caaggcattg ttggttctct ttattggaaa catcactcat tccgtgtcta cttggcacga gcgtttcgga tgccgttcaa ctgggcagaa tggaaagctt ccgggatctg tgggtacata agttcagctc aaacacctcc ccaagtcacg atccgccaaa gccgccacct ggaacttgac aagggccgac caatgagccc agcgtattcc cagagtgact tgcgtttgac gtacgattcg tcccccgact gcccgaaaaa tctgaccatc cgacgaccgt tcaggccgat gaactggtac gacacaagga tcaagacagt cgtttgctgt gtgtcgctcc ttgcgcccgg ttcttgagaa aatgcccatg acagaggtga cagcgctcca gtggacatgc cgtgcgattg gacggtgagg gtctttactg ccatttgtga tatcggccta agactcgcca
Ct-CyCtyCay tgtgcctttg ggagttgtgt gcaggtatgt gtctgcgtcg atccagcacg gacaaggcct ctggagtgcg gccgtccacg gacaatctcg cgtctaatcg gccaccatca aacgttgacg gttcggagta aacctgtcaa tctcgctcca tcttcttaca gaatggctcg attatggcca ctggaaatct gtggagctga gtcaaatttg ggccaaatcg gaggaagagt ctccttgggt tccaaagcta ctcttgctcc tctccaggag ctgattccat acaatcaaca accaagacaa gcttcgaccg ctgctggagg gagcgaatcg caaaatgccg gctcgggctg accagccggt tggaacaatc tctcggtcac acgaaatggc gttctatacg gcagcctcgc cgaaagtgaa ctattatcga cctcagatgc tgaaggcaac atgatatcgc cagcacacaa tcgtcaccga gccaaggtgc gaggcattct cgtggacact gcttctccca Ctyy ta. uCy S. cggcaggatt ccgcggagca cgtacgatga ccgctagcaa ttgaaggtgt accattcgca actgtgctgt agaccagcaa tctctccggt acgtcgccat aggatgctct atgtggacgc tcgacgccga agtcattgcc cccgccagca gcacagcatc acggtcatgc tggaagctgc tggacatgag acttgacagc ttattgattc tcataaccct acccccagat atgactacag gcggcacctt acccagcgcc atcgtcgcct cgctctgtat cacacgacaa cgcttttcca accaccgaat accctgcgac tttacttcta acctccattc gccaccatca
24240 24300 24360 24420 24480 24540 24600 24660 24720 24780 24840 24900 24960 25020 25080 25140 25200 25 2 6 0 25320 25380 25440 25500 25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 26220 26280 26340 26400 26460 26520 26580 26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360
PL 202 457 B1 gtggtaccag gagtcttggg aggaggacac ttctgttcac attgagcaaa tgtgtgaaag 27420 gtacacccaa agctgttccg tgttttttca ttcttttata ttaacctttt acttgaagca 27490 actcgtccca cccacatgtg cgcctgatcc aaagggtagg caaagaatta atttcaattg 27540 ttcgcgggaa cggggatcct ttggatatca tgaaccgcga tgggttgttc accgagtact 27600 ataccaacaa gctcgccttt ggctcagcaa tacacgtcgt tcaggatctg gttagccaaa 27660 ttgctcatcg ctaccaatcc attgatatcc ttgagatcgg taagtcgaat ctgaaatgta 27720 agtaactagg cagtttgcta atctgtcgtt cgctttttag gcttgggtac aggcatcgcc 27780 acgaagcgcg ttcttgcatc acctcaactt ggtttcaaca gttacacttg cactgacatc 27840 tcggcggatg ttattggcaa ggcccgtgaa caactttccg aattcgacgg tctcatgcag 27900 tttgaggcac tagacatcaa cagaagccca gcagagcaag gattcaagcc tcactcctac 27960 gatctgatta ttgcatccga tgtcctccat gccagctcca acttcgagga aaaattggct 28020 cacataaggt ccttgctcaa gccgggtggt cacttggtta ctttcggggt cacccatcgc 28080 gagcctgctc gcctcgcctt catctctggg cttttcgctg atcgatggac tggagaagac 28140 gaaactcgtg ctttgagtgc ctcggggtcc gttgaccaat gggagcatac cctcaagaga 28200 gttgggttct ctggcgtcga tagtcggaca cttgatcgag aggatgattt gatcccgtct 28260 gtcttcagta cacatgctgt ggatgccacc gttgagcgtt tgtatgatcc actttctgct 28320 ccattgaagg actcataccc gccattagtg gttatcggtg gcgaatcgac aaaaaccgaa 28380 cgcattttga acgacatgaa agctgcccta ccgcatagac acatccactc cgtcaagcgg 28440 ctggaaagtg ttctcgacga cccggccttg cagcctaagt cgacttttgt catcctctcg 28500 gaacttgatg atgaagtgtt ttgcaacctt gaagaggaca agtttgaggc agtcaagtct 28560 cttctcttct acgccggacg catgatgtgg ctgacagaga atgcctggat tgatcatccc 28620 caccaggcca gcaccatcgg aatgttgagg acaatcaagc tcgagaaccc tgacttggga 28680 acgcacgtct tcgatgtcga tactgtggag aacctagaca ccaaattctt cgttgagcaa 28740 cttttgcgct tcgaggagag cgatgatcag cttttggaat caataacatg gactcatgag 28800 cccgaagtgt actggtgcaa gggtcgtgcc tgggtccctc gtttgaagca ggatattgct 28860 aggaacgacc gtatgaactc gtctcgtcgt ccaattttcg gtaactttaa ttcgtccaag 28920 acggccattg cactgaaaga ggcgagggga gcatcctcat cgatgtacta tcttgagtca 28980 accgagacgt gtgattcgtt agaagacgct cgtcatgctg gaaaagcaac tgttcgtgtt 29040 cgctacgctc ttccccaggc aattcgcgtg ggccatctcg gatacttcca tgtcgtgcag 29100 ggcagtattc tggagaatac atgtgaggtg cctgtagtcg ccctggctga gaagaatgga 29160 tctatactgc atgtaccgag aaactacatg catagtctgc ccgataacat ggcggaaggc 29220 gaggatagtt ccttcttgtt gtccacagct gcagccctcc ttgccgaaac aattctctct 29280 agcgctcagt cctttggctc tgatgcatca attctgatta tggagccccc aatcttctgc 29340 gtcaaagcaa ttctggagtc ggccaaaacc tacggtgttc aggttcattt ggcaacaact 29400 ctgtccgacg tcaaaactat tccggctcct tggatccgat tacatgccaa ggaaaccgac 29460 gctcggctga aacacagcct gccgacaaac atgatggcat tctttgactt gtctaccgac 29520 cggactgctg ccgggataac caaccgtttg gccaagttgc taccacccag ttgcttcatg 29580 tacagtggtg actatcttat ccgaagtaca gcttccacat acaaagttag tcatgttgag 29640 gatattccaa tcctcgagca ctctgtggca atggcaaaaa ataccgtctc tgcgtcgact 29700 gtcgacgaca ctgagaaagt tattacagcc acacaaattc tcttgcctgg tcagctctct 29760 gtcaaccaca atgaccaacg cttcaatctg gccaccgtca tcgactggaa ggaaaatgag 29820 gtgtccgcta ggatttgccc catcgactct ggtaacttat tttccaacaa gaagacgtat 29880 ttgcttgttg gtcttaccgg ggaccttggt cgctctctct gtcgctggat gatcttgcat 29940 ggcgcccgcc atgttgtgct cactagccgg aaccctcgac ttgatcccaa atggatcgcc 30000 aacatggagg cacttggtgg tgacatcacc gttctgtcaa tgtaagttga ttgatatcac 30060 atcacacctt gctaccacat cctcgtttac ttatccaatt actttcttta gggatgttgc 30120 caatgaggat tcagtcgatg ctggccttgg caagcttgtc gatatgaagt tgccacctgt 30180 tgccggcatc gcgttcgggc ctttggtgct gcaggatgtc atgctgaaga acatggacca 30240 ccagatgatg gacatggtgt tgaagcccaa ggtacaagga gcacgcattc ttcatgaacg 30300 gttctccgaa cagacgggca gcaaggcgct cgacttcttc atcatgtttt cgtccattgt 30350 tgcagttatt ggcaatcctg gccagtccaa ctatggcgct gcgaatgcct acctacaggc 30420 tctggcccag caacggtgcg ccagaggatt ggcggtattt tctacccctg aattatcatg 30480 catcgacgtc aagttactaa cgcacaacca cagggatcaa ccatcgatat tggtgccgtt 30540
PL 202 457 B1 tacggtgtag atgtttgact gaccagcgtg cttaccacgg gaccctcgtt tcagggtcta cggcaaatcg caaagttgca gagcgtggac tgtcggctca cggtgcttct tccgćtgctg accaacagac agaggatgaa gaggttgtcc catcttcaac gcgggctctg at“'-‘u.
cagagtgcac cgagaagaca gggcacagat aacagaaaac atcgacccaa gggggacgat cgtgcttccc acagccattc ccgaatcaaa ctaccacgtt aaccaaccga cctgcgcttt ggacagtgtg tctaggcctg 'gttccaggct caaaatgacg gtgggatgac ccctgagcac gaacccggct agtgttgttc ctgaattcgg tctttgtcaa agttagatag cgaaagactc gtatataaat ggtgatcgag tccaaaatat ttggaaggtg tgtggtatgg acaaatgaac tggacatcac ttctgaggca cgaccgtgaa tcggctctca ctcattttcg ggtttgtcac cagttgaaga cccggcagca gtatcccaga tcggaaactt aaggctccat tgattggtaa gatggtctat ccaaccattc tggttctcaa gtcgctgatc ttgcaaattg agccatgatg gagcaagagg cttggccagg aacactattg aaagcctcat
ΟΓ-η-ΊΐίΊ^ΛίΏΐ-Ιu U L· tttgttcagg aactatagca gaccacctgt ctgttcaatg ttctctgatc atcgcgttct atcatgaatc acgtggcagc gagcggagcc ttgttggcgc tccaccatgg gatgagttcg cgtgaggcca aatctcccta gtctttgatt agtgttctcg cctaccaagg gctcaggcct ctgaagttgg atgataaaga cgtcaattga aattacttct cgcggttcag tgtgaggaag tcgacgccat tggttttaga gttcacgaaa agcattcaaa actaggcatg ctgacatctt tcggtctgtt ggtaatgtgt gatgcagtgt tgtaatctct gaaaccatgg gagggccgag gcatgagctg accacagcgc tcttgaccct caaaattccc tgccgaccag gttatctctc ctgagaaact ctctcattga agcaactcta ttgccgacga gtgattccac aagcaagctc acgataatga agtattcctg gcatgttcat tgcgccgtca ł“ —1 -Ί —1 4” ΓΤΠ— t-l i—l υ«αα uyy i_ \_ ·_ tgaacaacgc tctccacagg tggtaatcgg agatcgggca tagccgtcca ggaagtccat tgatcaatga agtatgaagc gcaagcacaa gtcttaccgg aagaaatttc tcggcagcaa tgcaacacgc cctcaggcga acaagcaggg cttcccgtga acccactcat ttgtagacca cctagatcgt tggattagaa cacacgcata accttcgttg agtaccgtaa gtgaaacctc tgcaaatagt tgtctgtcat tatttatgag ccgtgtaaga agagccagag gaccttttga gggaaaatta ttcaaccatc cggcacgttg ggcttcatcg cagttttccc atggaggagg cacacgcttt aagacggtca gcgcttcaag ggtcaacgcg ctcaaacaag atgcgtttcc ccgtgttacc tcaaggtgtc ccttgacctc cgcggccacc gggaacctcg tgctaccagc gcagggaggc gaggcagcaa gaagggtacc cgagatcttc cgtccaagtg tgcggaggca tgacactctc ctaccacaga gatttacagc acagcgggaa gcatagcaaa ccctgctgcc aattgctcgt ggcaaccccc cagcaaagac ggcgatgggc gacattcggc gcgggtgccg ggaacccaag tcaagcggag gcgcactcct tcatgtcaaa cttttcttca tcagcgccgt attggcaata ttcatctaca ctcttcttta cggtgataaa caaggcttgg tccatagtta gcctgttcag atggtcgcga ttagaactat ccttgctata tatagctgtt tgctttccct tgtctcgacc attattagct ctatagaaac atttgctgtt actttgatgc tcgccgaagc ttgacatggc atcgaattat gagacggtgg caacaacttt tgatatcgag ctccaagttt gactccttgg ccactcttga cgactcccag gacagcgggg acagatgcgt cgtaagattc caaatggtaa attgacctcg cgtacgtgct gttctcaaga gaggaagagt agactcgttg ttagttggtg ggggtgaaaa aacctggaaa gtctcgtcat aattcagagc ttagatccca atgcagttct ataaccatcg tttttcgcta gagcaccttg tatggcgtca actcagacac agtggctcaa tatgacatcg cttcagagct atcctcacta gaattcagat gagcagatgg aatagcgaat ttgcagcaat tatacctcgg aattgatttc ctggtttagt aacgagcctt ccactataac tcaaatttgt taccctgttg ggaagcgctt gaaactcgag cttggagagc tgtcgtcgtc agcaaatcaa gatggagcag tatccgtttc ggtcgtgtct ggaccttgag ttacttcaac cgacaatgga agaccaagtt ttcaaactaa cggacgggga gtgcagtgac gggtacttgg ctacatccat cttctccgac cgtcagccga ttcgtcgcga aagatcatac accggttgag ttgttactgg aCCCyy ety 3.S accggaaact atttctactg atggctcaac tgcagcgacc atgggcgaat ctgcgccaac agcagcaaat tggtcgcctt acctggccgc gcctcgccga acgtgcttcc tagccaccaa tcctcgactg acgccccctt ttggcaatgc ttctcgagat cgctgtatgg tgttctcgat gtgtggtttg caaatctatc tcgtcttgta cgtaacatca tagcgcgttt aatccatcct gccttgttgt ccatgatcta taaatcaccc tcagtaaaaa tctcacctag gaccgtctcc tacatctgca aaaatcttga gtcttgcgcc aacagcaatg caaagtggcg
30600 30660 30720 30780 30840 30900 30960 31020 31080 31140 31200 31260 31320 31380 31440 31500 31560 3162 0 31680 31740 31800 31860 31920 31980 32040 32100 32160 32220 32280 32340 32400 32460 32520 32580 32640 32700 32760 32820 32880 32940 33000 33060 33120 33180 33240 33300 33360 33420 33480 33540 33600 33660 33720
PL 202 457 B1 accaatgcgc cctcagagaa ggccactatg ccgacaatgg gtgcctgtgg gttagttata 33780 gaccaatctt ggacggtctt ttgcacaggc ccgatcacag ccgctactct atcgcccacc 33840 gtgggggttg tcgtgtttgt aacggcgtca tgatgctttt ggaaccaggt gtagtatgga 33900 cccatgcctt ggaagacagg aagcacgccg ggtccggggc tggagctaaa cggcgcggtc 33960 gcatatacga attcaaactc gtttttcaac gccacgcgca gtttagagat ctggacgcgg 34020 aatatggctg ctgagcaccc ggcaccgtgg atgcataaga gagcttttct cggtttgcct 34080 ggcgagaaat ctgtaatcct cgctggactc attttctctt gtggtgtgag ctgtgacttc 34140 gtctgttctg gggaatttgt tagtcattac tgacaaggaa ataacaacga cgtagtattg 34200 atc 34203 <210» 3 <2113 17 <212» DNA <213» Sekwencja syntetyczna <22 0» <221» misc_feature <223» Opis sekwencji syntetycznej: Mieszany primer mający sekwencję DNA wydedukowaną z sekwencji aminokwasów PKS of Aspergillus flavus.
<220» <221» zmodyfikowana zasada <222> (6) . . (6) <223» i <220» <221> zmodyfikowana zasada <222» (9) . . (9) <223» i <400» 3 gayacngcnt gyasttc 17 <210» 4 <211» 17 <212» DNA <213» Sekwencja syntetyczna <220>
<221» misc_feature ' <223» Opis sekwencji syntetycznej: Mieszany primer mający sekwencję dna wydedukowaną z sekwencji aminokwasów PKS of Aspergillus flavus.
<220» <221» zmodyfikowana zasada <222» (3)..(3) <223» i <22 0» <221» zmodyfikowana zasada <222» (6)..(6) <223» i
PL 202 457 B1
PL 202 457 B1
<210? 10
<211? 19
<212? DNA
<213? Penicillium citrinum
<400? 10 ttgcttgtgt tggattgtc 19
<210? 11
<211? 20
<212? DNA
<213? Penicillium citrinum
<400? 11 catggtactc tcgcccgttc 20
<210? 12
<211? 19
<212? DNA
<213? Penicillium citrinum
<400? 12 ctccccagta cgtaagctc 19
<210? 13
<211? 21
<212? DNA
<213? Penicillium citrinum
<400? 13 ccataatgag tgtgactgtt c 21
<210? 14
<211? 19
<212? DNA
<213? Penicillium citrinum
<400? 14 gaacatctgc atccccgtc 19
<210? 15
<211 ? 20
<212? DNA
<213? Penicillium citrinum
<400? 15
ggaaggcaaa gaaagtgtac 20
<210? 15
<211? 21
<212 ? DNA
<213? Penicillium citrinum
PL 202 457 B1 <400 = 16 agattcattg ctgttggcat c <210 = 17 <211 = 722 <212 = DNA <213 = Penicillium citrinum <400 = 17 ggccacgcgt aactctgcga atcaagccaa gtggtgtcaa ccaagatccc ccgggcgcac cctctttctt tgctggagac gatcctctac gtgaattgga accgtgtatc gttcatcctt tg cgactagtac ttctgtttaa ctatccaaac cacaccatca taaggagaga gaacgcaccc caacatccaa ggtctatgaa tgctgtgtac tagtattcct atacttcttc agctgccgtg gggggggggg tcccaatcct gagccaattg aaactttggg tttgacgtcg tttgcatact gctggagagg gctgtatcca gtcggtatga acatactctg gactggcatg catctggccg gggggggggg atcgcccaaa tggtagtggg agctgctcaa atacatttta tgctgcagga ccgaaacgat acgcaggcct tgacgcatga ccacgggggt ggccgagtat tccaacagct gcttgttcgc aacaggatca aagcggttgt agagccccgg cagccccgat ggatctacgc tgacccacag acggatccaa ctatgagact agctgtcagt gacgatcgac tagaacgggc tcagagattc gcagttatgg cggtttccag gatgtacaga ggcactcacc ggttttgatg caaaggctgc ggccttcaag atcgtgacgc gtggcctcca acagcctgta gagagtacca
120
180
240
300
360
420
480
540
600
660
720
722 <210 = 18 <211 = 760 <212 = DNA <213 = Penicillium citrinum <400 = 18 ggccacgcgt ccagggcgac aaccgcaacc cacatccacg tccacagaag ctcgcgattc cgtaaagggt catgaccaca ctacgaatcg ggtgtttggg agttccgcgt cttctacgac cgcactgcac cgactagtac tgatatatca gcaaccgcaa cccattgcca ctttgggaaa aatgtgagag ggacacttca gaggtcgcca ctggagagtg ggtgtcatgt tatttcataa ttacgtggtc ttggcgtgcc gggggggggg gtcaatgaaa ccgcaaccgc tagttggaat tggttgaaag gagtatacca tcgacgagga gctgcatgga ccggtatcac accacgacta ctggcaactc ccagcgtgac agagcttacg gggggggggg caacgttgga aaccgcaatg gggatgtcga aggaggcagt cccgaatggc tcctgcttta tccgcagtat catcgatggt tcaggattcg aggaacaatg ggttgacacg tactggggag gactatcaac atgaacaata gcaggctcgg tttgctggag gcctggtcta gaaagggtcg tttgacgccg cggcttatgc atggcaggct ctcaatcgtg ctttcgaacc gcctgttcga ggttttatca cccccgccgt cttgctctaa atgcaacgag aggtcccctc ggtccaccca cgttcttcaa ttgaggtggt ctaatacgtc accccgagac ggatatcaca cgacattgac
120
180
240
300
360
420
480
540
600
660
720
760 <210 = 19 <211 = 773 <212=· DNA <213= Penicillium citrinum <400= 19 ggccacgcgt cgactagtac gggggggggg ggtttttttt ttttcaaggt tgactggaag 60 agtgctctcg gccacaaaat cccagaagca ttagtgctgt tattcgatta taaaccgtcg 120 cagcgctctc attcttcgct ctttcttctt ttccactggt gtgcataggt cctatctgtc 1BO tcacgcaatg ctcggccagg ttcttctgac cgtcgaatcg taccaatggg tatcgacccc 240
PL 202 457 B1 tcaagccctt ccagtccgaa
Łaggcaggac caagcccctg cgacgagttt ctctcatctc caaagttgtt cttggccgac tgtctattcc gtggcggtcg ctgcaagtct ttcgatacgt cgcttcattg cggaaaatca cctggattcg ttgaaccagt gctactattg aatggattgg cagtgcttct ataatcccaa atggtccgag ttgattccgg aagatatgtg ac999ttcaa tacaaaccca ccaagttgtt accttgtcac tagtctcatc aaaatggtgg ctggatcgaa ctattgcacc catgtacaag ggaaatctgc agcccccaag cggtaaaagc acgaacagtc gcctaccgtt gagttgacga gcttggttct atcctcccat tttttggcgg caggatgcac tacacaaagc gaggagtggc acactcatta tgcgggggcg ccatgagggc cgaaaaacga cgtccatggc atgactttca atcttgtcaa cattggctac aaaccgcacc tgg
300
360
420
480
540
600
660
720
773 <210> 20 <211» 527 <212» DNA <213» Penicillium citrinum <400» 20 ggccacgcgt cgactagtac gggggggggg aaccgattag gctgtagcac ggaatcaatg ccaatttcta tctagctagt cgttgataaa acagaatggc gttgctcatt agacctttca aatcagcagc tccaaaacgg accacatacg gcagaatggg tggaagtggc cgattttgga gcatggtcgc accctctacg cgtgtctaca ttggactact gctctttggt agagcttcga gtacctagga tdtSCyo-Cyy gagactacct ttcgttgcta ctcgggaaat cccgatccat caaagacagc cgaaggaagt cggggatgca actgttcagt
Caya.ttfitaC agctataggt ccctctcgct cgggcattga accgtttgca ttcttccatg cgaagcttga gatgttc tgtccctccc ctaggcgcct accactccaa ttcgcggtag cctccacact ccatagctat gccccgcaaa tcaccggccc
12 0 180 240 300 360 420 480 527 <210» 21 <211» 522 <212» DNA <213» Penicillium citrinum <400» 21 ggccacgcgt aggctagcgg actatagaag attgcgcgat aaagtcaaaa agctcgggct ccattatcgt ggtggtacgg tgtatacact cgactagtac accttaacga cgccgcgcag gtcagaacct tgacacgctc ggtggttgct cacggcaatc cagtgcttat cttgggcttg gggggggggg aacaacgaga tagagattca ctacccccta gaagcgactg tcagttactt ccacatatca cttctggcta aagtacactt gggggggggg gcgagatcat caccgcccct aagaagggga agtccaagtc tcgtagcatt caagcgagtt actgtgctct tctttgcctt ggatccatca tcatacacca tgaagcaaaa accaaggcca ccagcacatc tttgatgctc ccactctctg ccagcccctg cc atctgacttc aaacacaggt gtcggaagga cagaaggaag acaggcctca cttgatatgt aacgatgtag gccggtaaat
120
180
240
300
360
420
480
522 <210> 22 <211 » 541 <2 12» DNA <213» Penicillium citrinum <400» 22 ggccacgcgt cgactagtac gggggggggg ggctcacctc acattatttg atcttaatcc 60 aataattatg tccctgccgc atgcaacgat tccgacgaac ctacgccgtc gcgcgtttcg 120 acgctcatgt gaccggtgtc atgcacaaaa gctcaaatgt accggtagca atgccaattt 180 agtccgtgct cagtgtcaac gttgtcagca agccggatta aggtgtgtgt acagcgaaag 240 gctacccaag cgcaatttac ataaagaagc cgcagctgga actacaagag ccacagaaac 300
PL 202 457 B1 ctcacaaccg atgaccgcga catcttctac ggtcttctca tcattggcag agactcctcc accttactgc tcaccaccta cgcatattgg cacctcggca ctcaaggaaa cattatcaga accatcagcg gcaaccctgc aattctatga tacatcaatc aactttgatg atcccgagtc gtttcccggc ggctggcctc agccaaatac atttcgcgac gatgccaaca gcaatgaatc
360
420
480
540
541 <210? 23 <211? 20 <212? DNA <213? Penicillium citrinum <400? 23 atcataccat cttcaacaac <210? 24 <211? 20 <212? DNA <213? Penicillium citrinum <400? 24 gctagaatag gttacaagcc <210? 25 <211? 20 <212? DNA <213? Penicillium citrinum <400? 25 acattgccag gcacccagac <210 ? 2 6 <211? 20 <212? DNA <213? Penicillium citrinum <400? 26 caacgcccaa gctgccaatc <210? 27 <211? 20 <212? DNA <213? Penicillium citrinum <400? 27 gtcttttcct actatctacc <210? 28 <211? 20 <212? DNA <213? Penicillium citrinum <400? 28 ctttcccagc tgctactatc
PL 202 457 B1 <210> 29 <211? 1524 <212? DNA <213? Penicillium citrinum <400? 29 aactggaaga agtaattttg attgaagccg ttatcatgaa acttcagagc cctgagcgtg tggtagggtc gaacactcgt caaagacagc ggagattcag cctcacgcac actcatcaaa tggtggatcg ccaacaaaac tccgctcttt gccacgtgaa tcatgatggg acgcgatatc cagagaattg tgaacaggtt ggtggtcatc tatagtttgt gaacaaagtg cgctgctata aggctttcag tagtgttgtt attcgcggcc acaaagatac aattcaggat caacactcaa cgggttcatc ctcagggcca atcccacatc cattttggca ctggaacaag gcctagacag actgtccttg gcgcagggga gttggtttcg gtggtaggcg gattcggaag tggctgtatt aagcacggtt gtcccccatt ggtcgatggt ttctgttgtt tgtgccccag cttctcgagt cactctgttc gtcatcgcca agcccgcctc gaagatggta gcaggaattt aagacgaatt agatttgcca accacacatc gagaacatag tacagcgagc tcgagaacga ttgccaattg ggggcgtgtg tcgaggatga gtggctacaa agcacgttag gcgaggccga gccaggtaga gcgaccatgg tgctgctgct ggcgcagatg cgcccatttt cgctgcattt gagccatcac tagaaatcaa ttccggtact tccgggttct gtaacaaagc aaccggtcga tgat tttttttttt cgctatttgt tctgctctat tgaattcacg tgaggattga tctgaagttt tgtcataagg agccactctc tctgagtctt cgccatacgg ggtgctcgcc cgaaaaagcc tggttatgtc actgcatggg gatctaaacg ctgaattggc acgagacttt ccaggttttc tcaccccgct caactaatct cgagtctgag cttcctctgc tgagaaccac acgtacggaa ggtcaatggt tttttttcaa agatgaatat tgccaatttc gcgctgaacg agaaaagtgg gacatgaatg agtgcgctca cgcttgaccc gggttcctcg cacccgcgcg gaatgtcttg catcgccgaa tttgctgccg ggttgccttg agcaattgct agcagggtca gctatgcatg ccgctgttgg gtaaatctgc gtggtagccg agtgtcacct ctccgcagcg ttggacggga gatctcgtga acccttcatg cgaaggtaga gcgtgtgtca taatccatct atctaggcca tctacaaagg agtgggtcct cgggaagcga tgcttgtaat cctgaggtag tgttgcatgg ctgccgacga atttcttcca gtaagacgcg tgcttgcggc tcatactgct ttgatcagat gacttccaga acggctagat ccgatctcat attaccaaca gtggagatgc ttgttcacct ccatttaaat cggcgcaatg aacatgccaa
120 ISO 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 12 6 0 1320 1380 1440 1500 1524 <210? 30 <211? 784 <212? DNA <213? Penicillium citrinum <400? 30 aactggaaga ctcagggcca attaaatagt ccgctatgct cttcactgaa tggtgttacc agtttcgaag aggacatgtc ggacgataga ctggtccttt taagtcccac atgtgttgat ggattgcctt tagc attcgcggcc ctgtaatggt caggctcagc ccttcgtact cccttcaact attcatgagc ttcaatggcg gtcttctgcc aatggcctcg tttatgcgaa aaaccgctgt tcctgtaacc ctccaacaca gcaggaattt atttcaggta ccaggctcga atacctccgt taactgcatt tcaaagatcg acgagtgagt agaccaaaca tcgtgagagg gagacaaagg tcctgtatcc acagctgcgg tccatgacgt tttttttttt tctctattta ttcagattgg cgagctatac tcgccacaac acacatcaac ctacgccgac ttcgcatcag tgaccctgct attggtctgc agtttgcctc gaggtgatgg ccttttcatg tttttttttc ctgctatcca attcaggctt ccgcttggcc taactcgacg atggatttca acctgccagg cttttccgtc tagttgggcc atgaaggact ggtccagtga aaattgaggg cataggcttg tttgttgctt gaagtcaggc cagaccatgg agacaaaagg aggccggcga gatgtgatcc tttttggacg attgctttga cgcacgccat tggcggtatt gcacccgggg gaagaacaca taacctattc
120
180
240
300
360
420
480
540
600
660
720
780
784
PL 202 457 B1 <210? 31 <211? 764 <212? DNA <213? Penicillium citrinum <400? 31 aactggaaga cgttttattt attggaataa ccggtcatga atgcatacga cacatcatac ccgcccggga caattgagcg ataattttcg caactcgccc gcgcatagtg gagcttcagc ctcttggcgg attcgcggcc tactaaccta gcctggggac gggagcggga acgctaaaag tgaatcagta caagcgcgtg gtgaaggcct gggttttccc ttgggaatga gcgcactcga ttgaacagag agaggctgaa gcaggaattt ctcgactaat ggatgcatat tgtcctcgtt cgtgacggta tatgagcgag ggttccagcc tgtctggatc acacatcagg agaggccatt ccggcttgat aggcaggcgt taaggtctgg tttttttttt acagcaccta ttgttttagt gcgccggcgt gtatttgtca gagaatcttg gaagccgatg ctcgcgcatg gttgttcatg ggatagagtg tcgctgcgtc ccagccccct gtgcctggca tttttttttc gtttctctgg ttgcgtgtta accatgagct tcgtctcctg atttccttcg tgatcaccgt cgcataaatc cggtctgcag atgtctctga tctttcatgc tctccgatta atgt gaataaaatg gacggaaacc tatcttagca ttgtggttgg gtacaggctt aggcgaagaa tggtattctc ggtagggatc ccacagcggc gagcggtact agctgtcgag cagtgcggat
120
180
240
300
360
420
480
540
600
660
720
764 <210? 32 <211? 765 <212? DNA <213? Penicillium citrinum <400? 32 aactggaaga tctctttata tgagataccc gaaaattatg ggagggggta tcagtagctg cctgacgggg atgtgcgcct aaaacagcgc tgtgatccgc ccgcccaacg agattgttca gtggcaatga attcgcggcc tattcttctt tttctggccg acaataacaa cggagcttgg cagcactcgg agacacttcg tgaccaggtg ttccgatgat ggacaccaag ttccaacctc tgagagtgat aaatggctgc gcaggaattt ccctactact ttcactctac ccaatgagaa aatgctccta cctcagtgca agaaggggct accggcggct gcgcgcaagt catgtcaagc aatagacggc gcagttagcg cgcaagattg tttttttttt tgcatcgtaa cacctgcctg aaaatatgat agattccgac ttgttaggaa gaagatgccg agggcagcac tgacgtgcat attgcgccct atggagacag ctctccacaa gcagcttggg ttttttctgg atttcaacaa tctcattgca cctcctgcaa ctaatcagcg cagggactgt gggcagaacg atagcgagag tctcaccggg ggggctccag agatttgaag cttgcgccgg cgttg aaaaggacca catataaaca ttgtgctttt tgaatccact tcgagcccga cctggttccg gttgtgcgcc ctccccagcc agtggtcggg aatcgtacca cgatccgcga atcctgacct
120
180
240
300
360
420
480
540
600
660
720
765 <210? 33 <211? 802 <212? DNA <213? Penicillium citrinum <400? 33 aactggaaga tcgacattaa aacgcggtca gccatcccat aagtatgatc ccacatctct catacttgct attcgcggcc ttaagtatgt agcatcagtc tccaaaggca aacggcgaga gaagccagtc caggccagtt gcaggaattt ggagattctt tcaggcacag aacacaaacg ctgtaagctt gcccctgctg ctcaaaccgg tttttttttt tgtggaggca cccgggtgtc tgcacgccgt ttacaacccc ccgtcacggc acccaaagac tttttataga cggtaatgtg gtttttggtt agctcccact tggaaggtta ctgcgtgtcg aaggttagca atctttgaaa tctatctagc gcaatcttcc gctaagtaaa ttcttgctga acagtgggcg aagtccagga
120
180
240
300
360
420
PL 202 457 B1 agagcgatcc cgggcgaaag agcccgcgat ataccagacc atcctgtctt caggcaacat tcggtagata tccaaacgtc cgtgctttgg aaattggtac tgcgcctatg tccaattgcg gtacacacca gtaggaaaag tgtccaaaca atggcgatga atgacccatt gcgacgagaa aagccagaaa ctcagtgtgg cggcgagaga taggcgtttg tcacagttga cagcgctgcc ccatagccat gagaaacatc aattccgagg catgccacaa tgtatggggc tagggcccaa aatgacttgt cttcacagcc gcaccttgtt ccacgaccga tggaaggtgg ggcaaatagt ccaagaattc tggaagtaga
480
540
600
660
720
780
802 <210> 34 <211? 562 <212> DNA <213? Penicillium citrinum <400> 34 aactggaaga tgtgtttctt tccctgaggc ataggagacg tgcttggcat tccccaaagc cagaagataa tagagtgaaa accagtacca cggatagtag attcgcggcc cgctaatgcg ctttgttgac agaggccggc atctgatagg agtctcaatc ggcgtgcatg cgagggaagt atccattcgt cagctgggaa gcaggaattt aatatttcct ttgggctctt gttatggttt actagacgaa ccactcaata aatgggtcga gcttcggctc gtgctttgct ag tttttttttt tatagcaacg cgtctccggc tattttcagc tagatgccgc gtcgaaggct gatgtgaaat ttccattgtc tttgtccaca ttttttttac tcgcaacaca ttcgtcactc gccaaggatt agccccgtgc tacacgcaat gagctcgccg atttctagtg aggttgggct taagcaatat tttatcgtct caaagcacag tgccacgatg tcctgtgcta gtcgtgcatg atatgaagat gttgagccag ttcatcacct
120
130
240
300
360
420
480
540
562 <210> 35 <211? 26 <212> DNA <213> Penicillium citrinum <400> 35 gttaacatgt cagaacctct accccc <210? 36 <211> 27 <212> DNA <213> Penicillium citrinum <400> 36 aatatttcaa gcatcagtct caggcac <210> 37 <211> 1662 <212> DNA <213> Penicillium citrinum <220> < 2 2 1 >
< 2 2 2 >
CDS (1) . . (1662)
PL 202 457 B1 <400> 37
atg Met 1 tca Ser gaa Glu cct Pro eta Leu 5 ccc Pro cct Pro aaa Lys gaa Glu ggg Gly 10 gaa Glu cca Pro agg Arg cca Pro cag Gin 15 aag Lys 48
gaa gaa agt caa aat gac acg ctc gaa gcg act gag tcc aag tcc cag 96
Glu Glu Ser Gin Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gin
20 25 30
cac atc aca ggc ctc aag ctc ggg ctg gtg gtt gct tca gtt act ttc 144
His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45
gta gca ttt ttg atg ctc ctt gat atg tcc att atc gtc acg gca atc 192
Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60
cca cat atc aca agc gag ttc cac tct ctg aac gat gta ggg tgg tac 240
Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr
65 70 75 80
99c agt gct tat ctt ctg gct aac tgt gct ctc cag ccc ctg gcc ggt 288
Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gin Pro Leu Ala Gly
85 90 95
aaa ttg tat aca ctc ttg ggc ttg aag tac act ttc ttt gcc ttc CtC 336
Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110
tgt att ttt gaa eta ggc teg gtg eta tgc ggt gcc gca aga tct tcc 384
Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125
acc atg ttg att gtt ggg =gg gcc gtt gct gga atg gga ggc tca ggt 432
Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140
ctt gtc aac gga gcc ctc aca atc ctc tca aca gct gct cct aag cac 480
Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His
145 150 155 160
aag caa cca gtt ttg att gga gtg atg atg ggt ctt agt cag att gcc 528
Lys Gin Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gin Ile Ala
165 170 175
att gtc tgt gga cca ctg ctc gga ggt gct ttc act caa cac gcc act 576
Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gin His Ala Thr
180 185 190
tgg ega tgg tgc ttt tat atc aat ctc ccc atc ggc gct gtc gct gca 624
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205
PL 202 457 B1
ttc Phe ctc Leu 210 ctt Leu ctc Leu gtc Val atc Ile acc Thr 215 ata Ile ccc Pro gac Asp ega Arg att Ile 220 tea Ser tcc Ser acg Thr gac Asp 672
age gaa ctc teg acc gac aaa cca atg gcc aac ata aaa tcc aca ctt 720
Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu
225 230 235 240
ege aaa ctg gac ctt gta ggc ttt gtg gtc ttt gca gcc ttc gca acc 768
Arg Lys Leu Asp Leu Val Gly Phe Val val Phe Ala Ala Phe Ala Thr
245 250 255
atg att tcc ctc gca eta gaa tgg gga ggg teg acc tac acc tgg ega 816
Met ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270
agt tcc gtc atc atc ggc ctg ttc tgt ggc gga ggg ttt gct ctg att 364
Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285
gcg ttc gtg eta tgg gag cgt cat gtt ggc gat gct gtt gcc atg att 912
Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300
cct ggc tea gtg gct ggt aaa ega caa gtg tgg tgc tct tgt tta ttt 960
Pro Gly Ser Val Ala Gly Lys Arg Gin Val Trp Cys Ser Cys Leu Phe
305 310 315 320
atg ggc ttt ttc tct ggc tcc ttg ctt gtc ttt tcc tac tat eta ccg 1008
Met Gly Phe Phe Ser Gly Ser Leu Leu val Phe Ser Tyr Tyr Leu Pro
325 330 335
atc tac ttc cag gct gtg aag gat gtt tct ccc aca ctg agt ggt gtg 1056
Ile Tyr Phe Gin Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350
tac atg ttg cct gga att ctt gga caa gtc att atg gct atg gtt tct 1104
Tyr Met Leu Pro Gly Ile Leu Gly Gin val Ile Met Ala Met Val Ser
355 360 365
ggc ttc gca att gga aag aca gga tac tat ttg cct tgg gcc eta ggc 1152
Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380
age gct gtt ctc gtc gcc ata ggc gca ggt ctg gta tcc acc ttc cag 1200
Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gin
385 390 395 400
CCC cat aca tea act gtg aaa tgg gtc atg tac caa ttt atc gcg ggc 1248
Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gin Phe Ile Ala Gly
405 410 415
PL 202 457 B1
ttc Phe ggt Gly cgt Arg ggt Gly 420 tgt Cys ggc Gly atg Met caa Gin acg Thr 425 cct Pro atc ile atc ile gcc Ala atc Ile 430 caa Gin agc Ser 1296
acg Ctt teg ccc gaa caa ggt gcc ctc gga att tct ctc gcc gtg ttt 1344
Thr Leu Ser Pro Glu Gin Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445
gga cag acg ttt gga gga teg ctc ttc ctg gac ttt gct aac ctt gtc 1392
Gly Gin Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460
ttt ggg tcc ggt ttg aga act ggc ctg agc aag tat gcg ccc act gtc 1440
Phe Gly Ser Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val
465 470 475 480
gac acg cag gcc gtg acg gca gca ggg gcg act ggc ttc aga gat gtg 1488
Asp Thr Gin Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Aep Val
485 490 495
gtc agc aag aat aac ctt cca ggg gtt gta aaa gct tac agt ctc gcc 1536
Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510
gtt gat cat act ttt tac tta gca gtg gga gct acg gcg tgc acg ttt 1584
Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525
gtg ttt gcc ttt gga atg gga tgg cgg aag att gca acc aaa aac gac 1632
Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540
acc cgg gct gtg cct gag act gat gct tga 1662
Thr Arg Ala Val Pro Glu Thr Asp Ala
545 550
<210» 38
<211» 553
<212» PRT <213> Penicillium citrinum
<400> 38 Arg Pro Gin 15 Lys
Met 1 Ser Glu Pro Leu 5 Pro Pro Lys Glu Gly 10 Glu Pro
C-lu Glu Ser Gin 20 Asn Asp Thr Leu Glu 25 Ala Thr Glu Ser Lys 30 Ser Gin
His Ile Thr 35 Gly Leu Lys Leu Gly 40 Leu Val Val Ala Ser 45 Val Thr Phe
Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
55 SO
PL 202 457 B1
Pro 65 His Tle Thr Ser Glu 70 Phe His Ser Leu Asn 75 Asp Val Gly Trp Tyr 80
Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gin Pro Leu Ala Gly
85 90 95
Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110
Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125
Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140
Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His
145 150 155 160
Lys Gin Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gin Ile Ala
165 170 175
ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gin His Ala Thr
180 185 190
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205
Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220
Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu
225 230 235 240
Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255
Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270
Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu ile
275 280 285
Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300
Pro Gly Ser Val Ala Gly Lys Arg Gin Val Trp Cys Ser Cys Leu Phe
305 310 315 320
Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335
Ile Tyr Phe Gin Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350
PL 202 457 B1
PL 202 457 B1 <400> 40 ggatccctaa gcaatattgt gtttcttcgc 30 <210> 41 <211> 1380 <212> DNA
<213 > Penicillium citrinum
<22C ) >
<221> CDS
<222> (1) . . (1380)
<400> 41
atg tcc ctg ccg cat gca acg att ccg acg aac eta cgc cgt cgc gcg 48
Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala
Ί 5 10 15
ttt ega cgc tea tgt gac cgg tgt cat gca caa aag ctc aaa tgt acc 96
Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gin Lys Leu Lys Cys Thr
20 25 30
ggt agc aat gcc aat tta gtc cgt get cag tgt caa cgt tgt caa caa 144
G] y Ser Asn Ala Asn Leu Val Arg Ala Gin Cys Gin Arg Cys Gin Gin
35 40 45
gcc gga tta agg tgt gtg tac agc gaa agg eta ccc aag cgc aat tta 192
Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60
cat aaa gaa gcc gca get gga act aca aga gcc aca gaa acc tea caa 240
Hi s Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gin
65 70 75 80
ccg atg acc gcg aca tct tct acg gtc ttc tea tea ttg gca gag act 288
Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95
cct cca cct tac tgc tea cca cct acg cat att ggc acc teg gca ctc 336
Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110
aag gaa aca tta tea gaa cca tea gcg gca acc ctg caa ttc tat gat 384
Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gin Phe Tyr Asp
115 12 0 125
aca tea atc aac ttt gat gat ccc gag teg ttt ccc ggc ggc tgg cct 432
Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140
cag cca aat aca ttt cgc gac gat gcc aac agc aat gaa tct teg ggg 480
Gin Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly
145 150 155 160
PL 202 457 B1
ata cca gat eta 9SC tac gac ttt gaa ggc cct ttg gat gca acg gtg 528
Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175
cct gtc tcg cca tcg ctg ttt gac ctc gaa gta gag ggg aac tcg tca 576
Pro Va1 Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190
tcc gga caa tcc aac aca agc aac acg caa ega gac ctt ttc gaa agt 624
Ser Gly Gin Ser Asn Thr Ser Asn Thr Gin Arg Asp Leu Phe Glu Ser
195 200 205
ctg tcg gat gtg tca cag gac eta gag gta ata ctc cac ggg gtg act 672
Leu Ser Asp Val Ser Gin Asp Leu Glu Val Ile Leu His Gly val Thr
210 215 220
gtg gaa tgg ccc aag caa aaa att tta agc tac ccg ata ggg gac ttt 720
Val Glu Trp Pro Lys Gin Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe
225 230 235 240
ttg aat gcc ttt ggt aga ttg eta eta cat Ctt caa gaa cgt gtg atc 768
Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gin Glu Arg Val Ile
245 250 255
acg agc agc aat agc agc atg tta gat ggg tgt ctg caa acc aag aac 816
Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gin Thr Lys Asn ·
260 265 270
ttg ttc atg gcg gtg cat tgc tac atg ttg tct gtc aaa atc atg aca 864
Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285
tca ctt tcc cag ctg eta eta tcc gag gtg atg aaa gcc caa cct tgt 912
Ser Leu Ser Gin Leu Leu Leu Ser Glu Val Met Lys Ala Gin Pro Cys
290 2S5 300
gga caa aag caa agc aca ega atg gat tgg tac tgg tct ggc tca acc 960
Gly Gin Lys Gin Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr
305 310 315 320
act aga aat gac aat gga aga gcc gaa gca ctt ccc tcg ttt cac tct 1003
Thr Arg Asn Aep Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335
aat ctt cat atc ggc gag ctc att tca cat ctc gac cca ttc atg cac 1056
Asn Leu His Ile Gly Glu Leu Ile ser His Leu Asp Pro Phe Met His
340 345 350
gcc tta tct tct gca tgc acg aca ttg cgt gta agc ctt ega eta ttg 1104
Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365
PL 202 457 B1
agt Ser gag Glu 370 att Ile gag act Glu Thr gct Ala ttg Leu 375 ggg Gly ata Ile gca Ala cag Gin gag Glu 380 cac His ggg Gly gct Ala gcg Ala 1152
gca tet att cgt eta gtc eta tca gat atg cca agc aca teg tgg caa 1200
Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gin
385 390 395 400
atc ctt ggc gct gaa aat aaa acc ata acg ccg gcc tet cgt ctc eta 1248
Ile Leu Gly Ala Glu Asn Lyc Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415
tet gtg ctt tgg agt gac gaa gcc gga gac gaa gag ccc aag tca aca 1296
Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430
aag gcc tca ggg aag acg ata aat gtg ttg ega cgt tgc tat aag gaa 1344
Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445
ata ttc gca tca gcg aag aaa cac aat att gct tag 1380
ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455
<210> · 42
<211> 459
<212? 1 PRT
<213> 1 Penicillium citrinum
<400> > 42
Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala
3 5 10 15
Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gin Lys Leu Lys Cys Thr
20 25 30
Gly Ser Asn Ala Asn Leu Val Arg Ala Gin Cys Gin Arg Cys Gin Gin
35 40 45
Ala Gly Leu Arg Cys Val Tyr Ser GlU Arg Leu Pro Lys Arg Asn Leu
50 55 60
His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gin
65 70 75 80
Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95
Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110
Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gin Phe Tyr Asp
115 120 125
PL 202 457 B1
Thr Ser 130 Ile Asn Phe Asp Asp 135 Pro Glu Ser Phe Pro 140 Gly Gly Trp Pro
Gin Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly
145 150 155 160
Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175
Pro Va 1 Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190
Ser Gly Gin Ser Asn Thr Ser Asn Thr Gin Arg Asp Leu Phe Glu Ser
195 200 205
Leu Ser Asp Val Ser Gin Asp Leu Glu Val Ile Leu His Gly Val Thr
210 215 220
Val Glu Trp Pro Lys Gin Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe
225 230 235 240
Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gin Glu Arg Val Ile
245 250 255
Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gin Thr Lys Asn
260 265 270
Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285
Ser Leu Ser Gin Leu Leu Leu Ser Glu val Met Lys Ala Gin Pro Cys
290 295 300
Gly Gin Lys Gin Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr
305 310 315 320
Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335
Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350
Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 3S0 365
Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gin Glu His Gly Ala Ala
370 375 380
Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gin
385 390 395 400
Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415
PL 202 457 B1
Ser Val Leu Trp 420 Ser Asp Glu Ala Gly 425 Asp Glu Glu Pro Lys 430 Ser Thr
Lys Ala Ser 435 Gly Lys Thr Ile Asn 440 Val Leu Arg Arg Cys 445 Tyr Lys Glu
Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455 <210> 43 <211> 9099 <212 > DNA <213> Penicillium citrinum
<220 =
<221= CDS (9099)
<222 > ( :u ..
<4 0 0 > 4 3
atg gat caa gcc aac tat cca aac gag cca att gtg gta gtg gga age 48
Met Asp Gin Ala Asn Tyr Pro Asn Glu Pro Ile val Val Val Gly Ser
1 5 10 15
ggt tgt cgg ttt cca ggt ggt gtc aac aca cca tea aaa ctt tgg gag 96
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30
ctg ctc aaa gag ccc cgg gat gta cag acc aag atc cct aag gag aga 144
Leu Leu Lys Glu Pro Arg Asp Val Gin Thr Lys Ile Pro Lys Glu Arg
35 40 45
ttt gac gtc gat aca ttt tac age ccc gat ggc act cac ccc ggg ege 192
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60
acg aac gca ccc ttt gca tac ttg ctg cag gag gat eta ege ggt ttt 240
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gin Glu Asp Leu Arg Gly Phe
65 70 75 80
gat gcc tct ttc ttc aac atc caa gct gga gag gcc gaa acg att gac 288
Asp Ala Ser Phe Phe Asn Ile Gin Ala Gly Glu Ala Glu Thr Ile Asp
85 90 95
cca cag caa agg ctg ctg ctg gag acg gtc tat gaa gct gta tcc aac 336
Pro Gin Gin Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110
gca ggc eta cgg atc caa ggc ctt caa gga tcc tct act gct gtg tac 384
Ala Gly Leu Arg Ile Gin Gly Leu Gin Gly Ser Ser Thr Ala Val Tyr
115 120 125
PL 202 457 B1
gtc Val ggt Gly 130 atg Met atg Met acg Thr cat His gac Asp 135 tat Tyr gag Glu act Thr atc Ile gtg Val 140 acg Thr cgt Arg gaa Glu ttg Leu 432
gat agt att cct aca tac tct gcc acg ggg gta gct gtc agt gtg gcc 480
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
tcc aac cgt gta tca tac ttc ttc gac tgg cat ggg ccg agt atg acg 528
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
atc gac aca gcc tgt agt tca tcc tta gct gcc gtg cat ctg gcc gtc 576
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val Hi s Leu Ala Val
180 185 190
caa cag ctt aga acg ggc gag agt acc atg gcg gtt gca gcc ggt gcg 624
Gin Gin Leu Arg Thr Gly Glu Ser Thr Met Ala val Ala Ala Gly Ala
195 200 205
aat ctg ata ttg ggc ccc atg acc ttt gta atg gag agc aaa ttg aac 672
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220
atg ctg tcc ccc aat ggt aga tct ega atg tgg gat gct gct gcc gat 720
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
gga tat gcc aga gga gaa ggt gtt tgc tct att gtc ctg aaa acg ctg 768
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile val Leu Lys Thr Leu
245 250 255
agc cag gca ctg cgc gac ggg gac agt atc gag tgt gtt atc ega gag 816
Ser Gin Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270
acc ggt atc aac caa gat ggc ega acg aca ggt atc aca atg cca aac 864
Thr Gly Ile Asn Gin Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285
cat agc gca caa gaa gcc ctc att cgg gcc aca tat gcc aag gct ggt 912
His Ser Ala Gin Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300
ctt gat att acc aac ccc cag gaa cgc tgc cag ttc ttt gąa gcc cat 960
Leu Asp Ile Thr Asn Pro Gin Glu Arg Cys Gin Phe Phe Glu Ala His
305 310 315 320
gga act ggt aca cca gcc ggt gac cca cag gaa gct gag gct att gca 1008
Gly Thr Gly Thr Pro Ala Gly Asp Pro Gin Glu Ala Glu Ala Ile Ala
325 330 335
PL 202 457 B1
aca Thr gcc Ala ttc Phe ttc Phe 340 gga Gly cac His aag Lys gat Asp gga Gly 345 aca Thr atc Ile gac Asp agc Ser gac Asp 350 ggc Gly gag Glu 1056
aaa gat gag ctt ttt gtc ggc agc atc aag aca gtt ctc ggt cac acg 1104
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365
gaa ggc act gct ggt att gcg ggc tta atg aag gca teg ttt gct gta 1152
Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370 375 380
ega aat 99c gtg atc ccg cca aac ctg ctg ttt gag aag atc agt ccc 1200
Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro
3 85 390 395 400
cgt gtc gct ccg ttc tat acg cac ttg aaa att gca acg gag gcc aca 1248
Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415
gaa tgg ccg att gtt gcg ccc ggg cag cct cgc aga gtc agc gtt aat 1296
Glu Trp Pro Ile Val Ala Pro Gly Gin Pro Arg Arg Val Ser Val Asn
420 425 430
tea ttt gga ttt ggt ggt aca aat gcc cat gct att atc gaa gag tat 1344
Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445
atg gct cct cca cac aag ccg aca gca gtg gta aca gag gtg acc tea 1392
Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460
gat gca gat gca tgc agc ttg ccc ctt gtg ctt tea teg aag teg cag 1440
Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gin
465 470 475 480
cgc tcc atg aag gca acg eta gaa aat atg ctc caa ttt ctg gaa acg 1488
Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gin Phe Leu Glu Thr
485 490 495
cat gat gac gtg gac atg cat gat atc gca tat acc tta ctt gag aaa 1536
His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510
cgg tct atc ttg ccc ttc cgt cgt gcg att gca gca cac aac aag gaa 1584
Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525
gta gcc cgc gcg gca ctg gag gct gcc atc gcg gac ggt gag gtc gtc 1632
val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540
PL 202 457 B1
acc Thr 545 gac Asp ttc Phe cgc Arg acc Thr gac Asp 550 gcg Ala aat Asn gac Asp aac Asn cct Pro 555 cgc Arg gta val cta Leu ggt Gly gtc Val 560 1680
ttt act ggc caa ggt gca cag tgg ccg ggc atg ctg aag aag ctc atg 1728
Phe Thr Gly Gin Gly Ala Gin Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575
gtg ggt atg cca ttt gtg aga ggc att ctc gaa gag ctg gat aat tca 1776
val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590
ctg caa aca ctg cct gaa aag tat cgg cct acg tgg aca ctg tat gac 1824
Leu Gin Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605
cag ctc atg ctt gaa ggg gat gcc tca aac gtc aga ctc gcc agc ttc 1872
Gin Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
510 615 620
tcc cag cct cta tgc tgc gcc gta caa atc gtt ctg gtc ega ctt ctc 1920
Ser Gin Pro Leu Cys Cys Ala Val Gin Ile Val Leu Val Arg Leu Leu
S25 630 635 640
gct gca gct ggt atc gag ttc agt gca att gtc ggc cac agt tca ggt 1968
Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 550 655
gag att gcc tgt gcc ttt gcg gca gga ttc atc agt gcc act caa gct 2016
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gin Ala
660 665 670
atc cgt att gcg cat ctg cgt gga gtt gtg tcc gcg gag cat gcc tct 2064
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
575 680 685
tct cca agc ggc cag aca ggc gct atg cta gcg gca ggt atg teg tac 2112
Ser Pro Ser Gly Gin Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700
gat gac gca aag gaa cta tgc gag ctc gaa gcc ttt gag ggt cgg gtc 2160
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
tgc gtc gcc gct agc aat tca ccg gat agt gtg acc ttc tcc ggc gac 2208
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser val Thr Phe Ser Gly Asp
725 730 735
atg gat gct atc cag cac gtt gaa ggt gtc ttg gag gat gaa tcc act 2256
Met Asp Al a Ile Gin His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750
PL 202 457 B1
ttt Phe gcc Ala aga Arg 755 atc Ile ttg Leu aga Arg gtt Val gac Asp 760 aag Lys gcc Ala tac Tyr cat His tcg Ser 765 cat His cac His atg Met 2304
cac cca tgc gca gct cca tat gtc aag gca ttg ctg gag tgc gac tgt 2352
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780
gct gtt gcc gat ggc caa ggt aac gat agt gtt gct tgg ttc tct gcc 2400
Ala Val Ala Asp Gly Gin Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
gtc cac gag acc agc aag caa atg act gta cag gat gtg atg ccc gct 2448
Val His Glu Thr Ser Lys Gin Met Thr Val Gin Asp Val Met Pro Ala
805 810 815
tat tgg 3.3.3. gac aat ctc gtc tct ccg gtc ttg ttc tcg cag gct gtg 2496
Tyr Trp Lys Asp Asn Leu val Ser Pro Val Leu Phe Ser Gin Ala val
820 825 830
cag aaa gca gtc atc act cat cgt eta atc gac gtc gcc atc gaa att 2544
Gin Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845
ggc gcc cac cct gct ctc aag ggt ccg tgt eta gcc acc atc aag gat 2592
Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850 855 860
gct ctt gcc ggt gtg gag ctg ccg tat acc ggg tgc ttg gca ega aac 2640
Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 380
gtt gac gat gtg gac gct ttt gct gga ggt ctg gga tac att tgg gag 2688
Val Asp Asp val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
835 890 895
cgt ttc gga gtt cgg agt atc gac gcc gag ggc ttc gta caa caa gtc 2736
Arg Phe Gly Val Arg Ser I le Asp Ala Glu Gly Phe Val Gin Gin Val
900 905 910
cgg ccc gat cgt gcc gtt caa aac ctg tca aag tca ttg ccc aca tac 2784
Arg Pro Asp Arg Ala Val Gin Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925
tct tgg gat cat act cgt caa tac tgg gca gaa tct ege tcc acc ege 2832
Ser Trp Asp His Thr Arg Gin Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 94 0
cag cat ctt cgt gga ggt gcg ccc cat ctt ctg ctt gga aag ctt tct 2880
Gin His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser
94 5 950 955 960
PL 202 457 B1 tct tac agc aca gca teg acc Ser Tyr Ser Thr Ala Ser Thr
965 cgg gat ctg gaa tgg ctc gac Arg Asp Leu Glu Trp Leu Asp 980 ttc ccc get get ggg tac ata Phe Pro Ala Ala Gly Tyr Ile
995
ttc Phe cag Gin tgg Trp 970 aca aac ttc Phe atc Ile agg ccc 2928
Thr Asn Arg 975 Pro
ggt cat gcg eta caa ggc cag act gtg 2976
Gly His Ala Leu Gin Gly Gin Thr Val
985 990
att atg - gcc atg i gaa get gcc atg aag 3024
Ile Met Ala Met Glu Ala Ala Met Lys
1000 1005
gtg Val get Ala 1010 ggt Gly gag Glu cgt Arg gcc Ala gcc Ala 1015 caa Gin gtt Val cag Gin ctc Leu ctg Leu 1020 gaa Glu atc Ile ttg Leu 3069
gac atg agc atc aac aaa gcc atc gtg ttt gaa gat gaa aac acc 3114
Asp Met 1025 Ser Ile Asn Lys Ala 1030 Ile Val Phe Glu Asp 1035 Glu Asn Thr
tcc gtg gag ctg aac ttg aca gcc gaa gtc acc agt gac aat gat 3159
Ser Val 1040 Glu Leu Asn Leu Thr 1045 Ala Glu Val Thr Ser 1050 Asp Asn Asp
gcg gat ggc caa gtc acg gtc aaa ttt gtt att gat tcc tgt ctg 3204
Ala Asp 1055 Gly Gin Val Thr Val 1060 Lys Phe Val Ile Asp 1065 Ser Cys Leu
gca aag gag agt gag ctt teg aca tcc gcc aaa ggc caa atc gtc 3249
Ala Lys 1070 Glu Ser Glu Leu Ser 1075 Thr Ser Ala Lys Gly 1080 Gin Ile Val
ata acc ctt ggc gag gca tea ccg tea teg cag ctt ttg ccg cca 3 2 94
Ile Thr 1085 Leu Gly Glu Ala Ser 1090 Pro Ser ser Gin Leu 1095 Leu Pro Pro
cct gag gaa gag tac ccc cag atg aac aat gtc aac atc gat ttc 3339
Pro Glu 1100 Glu Glu Tyr Pro Gin 1105 Met Asn Asn Val Asn 1110 Ile Asp Phe
ttc tat cgg gaa ctt gac ctc ctt ggg tat gac tac agc aaa gac 3384
Phe Tyr 1115 Arg Glu Leu Asp Leu 1120 Leu Gly Tyr Asp Tyr 1125 Ser Lys Asp
ttc cgt cgt ttg cag acc atg aga agg gcc gac tcc aaa get agc 3429
Phe Arg 1130 Arg Leu Gin Thr Met 1135 Arg Arg Ala Asp Ser 1140 Lys Ala Ser
ggc acc ttg get ttc ctt cca ctt aag gat gaa ttg cgc aat gag 3474
Gly Thr 1145 Leu Ala Phe Leu Pro 1150 Leu Lys Asp Glu Leu 1155 Arg Asn Glu
PL 202 457 B1
ccc Pro ctc Leu 1160 ttg Leu ctc Leu cac His cca Pro gcg Ala 1165 ccc Pro ctg Leu gac Asp atc ile gcg Ala 1170 ttc Phe cag Gin act Thr 3519
gtc att gga gcg tat tcc tet cca gga gat cgt cgc eta cgc tca 3564
Val Ile 1175 Gly Ala Tyr Ser Ser 1180 Pro Gly Asp Arg Arg 1185 Leu Arg Ser
ttg tac gtg cct act cac gtt gac aga gtg act ctg att cca teg 3609
Leu Tyr 1190 Val Pro Thr His Val 1195 Asp Arg Val Thr Leu 1200 Ile Pro Ser
ctc tgt ata teg gcg ggt aat tet ggt gaa acc gag ctt gcg ttt 3654
Leu Cys 1205 Ile Ser Ala Gly Asn 1210 Ser Gly Glu Thr Glu 1215 Leu Ala Phe
gac aca atc aac aca cac gac aag ggt gat ttc ctg agc ggc gac 3699
Asp Thr 1220 Ile Asn Thr His Asp 1225 Lys Gly Asp Phe Leu 1230 Ser Gly Asp
atc acg gtg tac gat teg acc aag aca acg ctt ttc caa gtt gat 3744
Ile Thr 1235 Val Tyr Asp Ser Thr 1240 Lys Thr Thr Leu Phe 1245 Gin Val Asp
aac att gtc ttt aag cct ttc tet ccc ccg act gct teg acc gac 3789
Asn Ile 1250 Val Phe Lys Pro Phe 1255 Ser Pro Pro Thr Ala 1260 Ser Thr Asp
cac ega atc ttc gca aag tgg gtc tgg gga ccc ctc acg ccc gaa 3834
His Arg 1265 Ile Phe Ala Lys Trp 1270 val Trp Gly Pro Leu 1275 Thr Pro Glu
aaa. ctg ctg gag gac cct gcg acg ttg atc ata gct cgg gac aag 3879
Lys Leu 1280 Leu Glu Asp Pro Ala 1285 Thr Leu Ile Ile Ala 1290 Arg Asp Lys
gag gac att ctg acc atc gag ega atc gtt tac ttc tac atc aaa 3924
Glu Asp 1295 Ile Leu Thr Ile Glu 1300 Arg Ile Val Tyr Phe 1305 Tyr Ile Lys
tcc ttc eta gcc cag ata acc ccc gac gac cgt caa aat gcc gac 3969
Ser Phe 1310 Leu Ala Gin Ile Thr 1315 Pro Asp Asp Arg Gin 1320 Asn Ala Asp
ctc cat tcc cag aag tac att gaa tgg tgt gac cag gtt cag gcc 4014
Leu His 1325 Ser Gin Lys Tyr Ile 1330 Glu Trp Cys Asp Gin 1335 Val Gin Ala
gat gct cgg gct ggc cac cat cag tgg tac cag gag tet tgg gag 4059
Asp Ala 1340 Arg Ala Gly His His 1345 Gin Trp Tyr Gin Glu 1350 Ser Trp Glu
PL 202 457 B1
gag Glu gac Asp 1355 act Thr tct Ser gtt Val cac His att Ile 1360 gag Glu caa Gin atg Met tgt Cys gaa Glu 1365 age Ser aac Asn teg Ser 4104
tcc cac cca cat gtg cgc ctg atc caa agg gta ggc aaa gaa tta 4149
Ser His 137 0 Pro His Val Arg Leu 1375 ile Gin Arg Val Gly 1380 Lys Glu Leu
att tea att gtt cgc ggg aac ggg gat cct ttg gat atc atg aac 4194
Ile Ser 1385 Ile Val Arg Gly Asn 1390 Gly Asp Pro Leu Asp 1395 Ile Met Asn
cgc gat ggg ttg ttc acc gag tac tat acc aac aag ctc gcc ttt 4239
Arg Asp 1400 Gly Leu Phe Thr Glu 1405 Tyr Tyr Thr Asn Lys 1410 Leu Ala Phe
ggc tea gca ata cac gtc gtt cag gat ctg gtt age caa att gct 4284
Gly Ser 1415 Ala Ile His Val Val 1420 Gin Asp Leu Val Ser 1425 Gin Ile Ala
cat cgc tac caa tcc att gat atc ctt gag atc ggc ttg ggt aca 4329
His Arg 1430 Tyr Gin Ser Ile Asp 1435 Ile Leu Glu Ile Gly 1440 Leu Gly Thr
ggc atc gcc acg aag cgc gtt ctt gca tea cct caa ctt ggt ttc 4374
Gly 11 e 1445 Ala Thr Lys Arg val 1450 Leu Ala Ser Pro Gin 1455 Leu Gly Phe
aac agt tac act tgc act gac atc teg gcg gat gtt att ggc aag 4419
Asn Ser 1460 Tyr Thr Cys Thr Asp 1465 Ile Ser Ala Asp val 1470 Ile Gly Lys
gcc cgt gaa caa ctt tcc gaa ttc gac ggt ctc atg cag ttt gag 4464
Ala Arg 1475 Glu Gin Leu Ser Glu 1480 Phe Asp Gly Leu Met 1485 Gin Phe Glu
gca eta gac atc aac aga age cca gca gag caa gga ttc aag cct 4509
Ala Leu 1490 Asp Tle Asn Arg Ser 1495 Pro Ala Glu Gin Gly 1500 Phe Lys Pro
cac tcc tac gat ctg att att gca tcc gat gtc ctc cat gcc age 4554
His Ser 1505 Tyr Asp Leu Ile Ile 1510 Ala Ser Asp Val Leu 1515 His Ala Ser
tcc aac ttc gag gaa aaa ttg gct cac ata agg tcc ttg ctc aag 4599
Ser Asn 152 0 Phe Glu Glu Lys Leu 1525 Ala His Ile Arg Ser 1530 Leu Leu Lys
ccg ggt ggt cac ttg gtt act ttc ggg gtc acc cat cgc gag cct 4644
Pro Gly 1535 Glv His Leu Val Thr 1540 Phe Gly Val Thr His 1545 Arg Glu Pro
PL 202 457 B1
gct Ala cgc Arg 1550 ctc Leu gcc Ala ttc Phe atc Ile tct Ser 1555 ggg Gly ctt Leu ttc Phe gct Ala gat Asp 1560 ega Arg tgg Trp act Thr 4669
gga gaa gac gaa act cgt gct ttg agt gcc teg ggg tcc gtt gac 4734
Gly Glu 1565 Asp Glu Thr Arg Ala 1570 Leu Ser Ala Ser Gly 1575 Ser Val Asp
CciĆL tgg gag cat acc ctc aag aga gtt ggg ttc tct ggc gtc gat 4779
Gin Trp 1580 Glu His Thr Leu Lys 1585 Arg Val Gly Phe Ser 1590 Gly Val Asp
agt cgg aca ctt gat ega gag gat gat ttg atc ccg tct gtc ttc 4824
Ser Arg 1595 Thr Leu Asp Arg Glu 1600 Asp Asp Leu Ile Pro 1605 Ser Val Phe
agt aca cat gct gtg gat gcc acc gtt gag cgt ttg tat gat cca 4869
Ser Thr 1610 His Ala Val Asp Ala 1615 Thr Val Glu Arg Leu 1620 Tyr Asp Pro
ctt tct gct cca ttg aag gac tea tac ccg cca tta gtg gtt atc 4914
Leu Ser 1625 Ala Pro Leu Lys Asp 1630 Ser Tyr Pro Pro Leu 1635 Val Val Ile
ggt ggc gaa teg aca aaa acc gaa cgc att ttg aac gac atg aaa 4959
Gly Gly 1640 Glu Ser Thr Lys Thr 1645 Glu Arg Ile Leu Asn 1650 Asp Met Lys
gct gcc eta ccg cat aga cac atc cac tcc gtc aag cgg ctg gaa 5004
Ala Ala 1655 Leu Pro His Arg His 1660 Ile His Ser Val Lys 1665 Arg Leu Glu
agt gtt ctc gac gac ccg gcc ttg cag cct aag teg act ttt gtc 5049
Ser Val 1670 Leu Asp Asp Pro Ala 1675 Leu Gin Pro Lys Ser 1680 Thr Phe Val
atc ctc teg gaa ctt gat gat gaa gtg ttt tgc aac ctt gaa gag 5094
Ile Leu 1685 Ser Glu Leu Asp Asp 1690 Glu val Phe Cys Asn 1695 Leu Glu Glu
gac aag ttt gag gca gtc aag tct ctt ctc ttc tac gcc gga cgc 5139
Asp Lys 1700 Phe Glu Ala Val Lys 1705 Ser Leu Leu Phe Tyr 1710 Ala Gly Arg
atg atg tgg ctg aca gag aat gcc tgg att gat cat ccc cac cag 5184
Met Met 1715 Trp Leu Thr Glu Asn 1720 Ala Trp Ile Asp His 1725 Pro His Gin
gcc agc acc atc gga atg ttg agg aca atc aag ctc gag aac cct 5229
Ala Ser 1730 Thr Ile Gly Met Leu 1735 Arg Thr Ile Lys Leu 1740 Glu Asn Pro
PL 202 457 B1
gac Asp ttg Leu 1745 gga Gly acg Thr cac His gtc Val ttc Phe 1750 gat Asp gtc Val gat Asp acc Thr gtg Val 1755 gag Glu aac Asn cta Leu 5274
gac acc aaa ttc ttc gtt gag caa ctt ttg cgc ttc gag gag agc 5319
Asp Thr 1760 Lys Phe Phe Val Glu 1765 Gin Leu Leu Arg Phe 1770 Glu Glu Ser
gat gat cag ctt ttg gaa tca ata aca tgg act cat gag ccc gaa 5364
Asp Asp 1775 Gin Leu Leu Glu Ser 1780 Ile Thr Trp Thr His 1785 Glu Pro Glu
gtg tac tgg tgc aag ggt cgt gcc tgg gtc cct cgt ttg aag cag 5409
val Tyr 1790 Trp Cys Lys Gly Arg 1795 Ala Trp Val Pro Arg 1800 Leu Lys Gin
gat att gct agg aac gac cgt atg aac teg tct cgt cgt cca att 5454
Asp Ile 1805 Ala Arg Asn Asp Arg 1810 Met Asn Ser Ser Arg 1815 Arg Pro Ile
ttc ggt aac ttt aat teg tcc aag acg gcc att gca ctg aaa gag 5499
Phe Glv 1820 Asn Phe Asn Ser Ser 1825 Lys Thr Ala Ile Ala 1830 Leu Lys Glu
gcg agg gga gca tcc tca teg atg tac tat ctt gag tca acc gag 5544
Ala Arg 1S35 Gly Ala Ser Ser Ser 1840 Met Tyr Tyr Leu Glu 1845 Ser Thr Glu
acg tgt gat teg tta gaa gac gct cgt cat gct gga aaa gca act 5589
Thr Cys 1850 Asp Ser Leu Glu Asp 1855 Ala Arg His Ala Gly 1860 Lys Ala Thr
gtt cgt gtt cgc tac gct Ctt ccc cag gca att cgc gtg ggc cat 5634
Val Arg 1865 Val Arg Tyr Ala Leu 1870 Pro Gin Ala Ile Arg 1875 Val Gly His
ctc gga tac ttc cat gtc gtg cag ggc agt att ctg gag aat aca 5679
Leu Gly 1880 Tyr Phe His Va] Val 1885 Gin Gly Ser Ile Leu 1890 Glu Asn Thr
tgt gag gtg cct gta gtc gcc ctg gct gag aag aat gga tct ata 5724
Cys Glu 1895 Val Pro Val Val Ala 1900 Leu Ala Glu Lys Asn 1905 Gly Ser Ile
ctg cat gta ccg aga aac tac atg cat agt ctg ccc gat aac atg 5769
Leu His 1910 Val Pro Arg Asn Tyr 1915 Met His Ser Leu Pro 1920 Asp Asn Met
gcg gaa gg<= gag gat agt tcc ttc ttg ttg tcc aca gct gca gcc 5814
Ala Glu 1925 Gly Glu Asp Ser Ser 1930 Phe Leu Leu Ser Thr 1935 Ala Ala Ala
PL 202 457 B1
ctc Leu ctt Leu 1940 gcc Ala gaa Glu aca Thr att Ile ctc Leu 1945 tct Ser agc Ser gct Ala cag Gin tcc Ser 1950 ttt Phe ggc Gly tct Ser 5859
gat gca tca att ctg att atg gag ccc cca atc ttc tgc gtc aaa 5904
Asp Ala 1955 Ser Ile Leu Ile Met 1960 Glu Pro Pro Ile Phe 1965 Cys Val Lys
gca att ctg gag tcg gcc aaa acc tac ggt gtt cag gtt cat ttg 5949
Ala Ile 1970 Leu Glu Ser Ala Lys 1975 Thr Tyr Gly Val Gin 1980 Val His Leu
gca aca act ctg tcc gac gtc aaa act att ccg gct cct tgg atc 5994
Ala Thr 1985 Thr Leu Ser Asp Val 1990 Lys Thr Ile Pro Ala 1995 Pro Trp Ile
ega tta cat gcc aag gaa acc gac gct cgg ctg aaa cac agc ctg 603 9
Arg Leu 2000 His Ala Lys Glu Thr 2005 Asp Ala Arg Leu Lys 2010 His Ser Leu
ccg aca aac atg atg gca ttc ttt gac ttg tct acc gac cgg act 6084
Pro Thr 2015 Asn Met Met Ala Phe 2020 Phe Asp Leu Ser Thr 2025 Asp Arg Thr
gct gcc ggg ata acc aac cgt ttg gcc aag ttg eta cca ccc agt 6129
Ala Ala 2030 Gly Ile Thr Asn Arg 2035 Leu Ala Lys Leu Leu 2040 Pro Pro Ser
tgc ttc atg tac agt ggt gac tat ctt atc ega agt aca gct tcc 6174
Cys Phe 2045 Met Tyr Ser Gly Asp 2050 Tyr Leu Ile Arg Ser 2055 Thr Ala Ser
aca tac aaa gtt agt cat gtt gag gat att cca atc ctc gag cac 6219
Thr Tyr 2060 Lys val Ser His Val 2065 Glu Asp Ile Pro Ile 2070 Leu Glu His
tct gtg gca atg gca aaa aat acc gtc tct gcg tcg act gtc gac 6254
Ser Val 2075 Ala Met Ala Lys Asn 2080 Thr Val Ser Ala Ser 2085 Thr Val Asp
gac act gag aaa gtt att aca gcc aca caa att ctc ttg cct ggt 6309
Asp Thr 2090 Glu Lys Val Ile Thr 2095 Ala Thr Gin Ile Leu 2100 Leu Pro Gly
cag ctc tct gtc aac cac aat gac caa ege ttc aat ctg gcc acc 6354
Gin Leu 2105 Ser Val Asn His Asn 2110 Asp Gin Arg Phe Asn 2115 Leu Ala Thr
gtc atc gac tgg aag gaa aat gag gtg tcc gct agg att tgc CCC 6399
Val Ile 2120 Asp Trp Lys Glu Asn 2125 Glu Val Ser Ala Arg 2130 Ile Cys Pro
PL 202 457 B1
atc ile gac Asp 213 5 tct Ser ggt Gly aac Asn. tta Leu ttt Phe 2140 tcc Ser aac Asn aag Lys aag Lys acg Thr 2145 tat Tyr ttg Leu ctt Leu 6444
gtt ggt ctt acc ggg gac ctt ggt cgc tct ctc tgt cgc tgg atg 6489
Val Gly 2150 Leu Thr Gly Asp Leu 2155 Gly Arg Ser Leu Cys 2160 Arg Trp Met
atc ttg cat ggc gcc cgc cat gtt gtg ctc act agc cgg aac cct 6534
Ile Leu 2165 His Gly Ala Arg His 2170 Val Val Leu Thr Ser 2175 Arg Asn Pro
ega ctt gat ccc aaa tgg atc gcc aac atg gag gca ctt ggt ggt 6579
Arg Leu 2180 Asp Pro Lys Trp Ile 2185 Ala Asn Met Glu Ala 2190 Leu Gly Gly
gac atc acc gtt ctg tea atg gat gtt gcc aat gag gat tea gtc 6624
Asp Ile 2195 Thr Val Leu Ser Met 2200 Asp Val Ala Asn Glu 2205 Asp Ser Val
gat gct ggc ctt ggc aag ctt gtc gat atg aag ttg cca cct gtt 6669
Asp Ala 2210 Gly Leu Gly Lys Leu 2215 Val Asp Met Lys Leu 2220 Pro Pro Val
gcc ggc atc gcg ttc ggg cct ttg gtg ctg cag gat gtc atg ctg 6714
Ala Gly 2225 Ile Ala Phe Gly Pro 2230 Leu Val Leu Gin Asp 2235 Val Met Leu
aag aac atg gac cac cag atg atg gac atg gtg ttg aag ccc aag 6759
Lys Asn 2240 Met Asp His Gin Met 2245 Met Asp Met Val Leu 2250 Lys Pro Lys
gta caa gga gca cgc att ctt cat gaa cgg ttc tcc gaa cag acg 6804
Val Gin 2255 Gly Ala Arg Ile Leu 2260 His Glu Arg Phe Ser 2265 Glu Gin Thr
ggc agc aag gcg ctc gac ttc ttc atc atg ttt teg tcc att gtt 584 9
Gly Ser 2270 Lys Ala Leu Asp Phe 2275 Phe Ile Met Phe Ser 2280 Ser Ile Val
gca gtt att ggc aat cct ggc cag tcc aac tat ggc gct gcg aat 6894
Ala. Val 2285 ile Gly Asn Pro Gly 2290 Gin Ser Asn Tyr Gly 2295 Ala Ala Asn
gcc tac eta cag gct ctg gcc cag caa cgg tgc gcc aga gga ttg 6939
Ala Tyr 2300 Leu Gin Ala Leu Ala 2305 Gin Gin Arg Cys Ala 2310 Arg Gly Leu
gcg gga tea acc atc gat att ggt gcc gtt tac ggt gta ggg ttt 6984
Ala Gly 2315 Ser Thr Ile Asp Ile 2320 Gly Ala Val Tyr Gly 2325 Val Gly Phe
PL 202 457 B1
gtc Val acg Thr 2330 agg Arg gcc Ala gag Glu atg Met gag Glu 2335 gag Glu gac Asp ttt Phe gat Asp get Ala 2340 atc Ile cgt Arg ttc Phe 7029
atg ttt gac tea gtt gaa gag cat gag ctg cac acg ctt ttc gcc 7074
Met Phe 2345 Asp Ser Val Glu Glu 2350 His Glu Leu His Thr 2355 Leu Phe Ala
gaa gcg gtc gtg tct gac cag cgt gcc cgg cag caa cca cag cgc 7119
Glu Ala 2350 Val Val Ser Asp Gin 2355 Arg Ala Arg Gin Gin 2370 Pro Gin Arg
aag acg gtc att gac atg gcg gac ctt gag ctt acc acg ggt atc 7164
Lys Thr 2375 Val Ile Asp Met Ala 2380 Asp Leu Glu Leu Thr 2385 Thr Gly Ile
cca gat ctt gac cct gcg ctt caa gat ega att att tac ttc aac 7209
Pro Asp 23 90 Leu Asp Pro Ala Leu 2395 Gin Asp Arg Ile Ile 2400 Tyr Phe Asn
gac cct cgt ttc gga aac ttc aaa att ccc ggt caa cgc gga gac 7254
Asp Pro 2405 Arg Phe Gly Asn Phe 2410 Lys Ile Pro Gly Gin 2415 Arg Gly Asp
ggt ggc gac aat gga tea ggg tct aaa ggc tcc att gcc gac cag 7299
Gly Gly 2420 Asp Asn Gly Ser Gly 2425 Ser Lys Gly Ser Ile 2430 Ala Asp Gin
ctc aaa caa gca aca act tta gac caa gtt cgg caa atc gtg att 7344
Leu Lys 2435 Gin Ala Thr Thr Leu 2440 Asp Gin Val Arg Gin 2445 Ile Val Ile
gat ggt eta tct gag aaa ctc cgt gtt acc ctc caa gtt teg gac 7389
Asp Gly 2450 Leu Ser Glu Lys Leu 2455 Arg Val Thr Leu Gin 2460 Val Ser Asp
ggg gag agc gtg gac cca acc att cct ctc att gat caa ggt gtc 7434
Gly Glu 2465 Ser Val Asp Pro Thr 2470 Ile Pro Leu Ile Asp 2475 Gin Gly Val
gac tcc ttg ggt gca gtg act gtc ggc tea tgg ttc tea aag caa 7479
Asp Ser 2480 Leu Gly Ala Val Thr 2485 Val Gly Ser Trp Phe 2490 Ser Lys Gin
ctc tac ctt gac ctc cca ctc ttg agg gta ctt ggc ggt get tct 7524
Leu Tyr 2495 Leu Asp Leu Pro Leu 2500 Leu Arg Val Leu Gly 2505 Gly Ala Ser
gtc get gat ctt gcc gac gac gcg gcc acc ega ctc cca get aca 7569
Val Ala 2510 Asp Leu Ala Asp Asp 2515 Ala Ala Thr Arg Leu 2520 Pro Ala Thr
PL 202 457 B1
tcc Ser att Ile 2525 ccg Pro ctg Leu ctg Leu ttg Leu caa Gin 2530 att Ile ggt Gly gat Asp tcc Ser acg Thr 2535 gga Gly acc Thr tcg Ser 7614
gac agc ggg gct tct ccg aca cca aca gac agc cat gat gaa gca 7659
Asp Ser 2540 Gly Ala Ser Pro Thr 2545 Pro Thr Asp Ser His 2550 Asp Glu Ala
agc tct gct acc agc aca gat gcg tcg tca gcc gaa gag gat gaa 7704
Ser Ser 2555 Ala Thr Ser Thr Asp 2560 Ala Ser Ser Ala Glu 2565 Glu Asp Glu
gag caa gag gac gat aat gag cag gga ggc cgt aag att Ctt cgt 7749
Glu Gin 2570 Glu Asp Asp Asn Glu 2575 Gin Gly Gly Arg Lys 2580 Ile Leu Arg
cgc gag agg ttg tcc ctt ggc cag gag tat tcc tgg agg cag caa 7794
Arg Glu 2585 Arg Leu Ser Leu Gly 2590 Gin Glu Tyr Ser Trp 2595 Arg Gin Gin
caa atg gta aaa gat cat acc atc ttc aac aac act att ggc atg 7839
Gin Met 2600 Val Lys Asp His Thr 2605 Ile Phe Asn Asn Thr 2610 Ile Gly Met
ttc atg aag ggt acc att gac ctc gac cgg ttg agg cgg gct ctg 7884
Phe Met 2615 Lys Gly Thr Ile Asp 2620 Leu Asp Arg Leu Arg 2625 Arg Ala Leu
aaa gcc tca ttg cgc cgt cac gag atc ttc cgt acg tgc ttt gtt 7929
Lys Ala 2630 Ser Leu Arg Arg His 2635 Glu Ile Phe Arg Thr 2640 Cys Phe Val
act ggc gat gac tat agc agc gat tta aat ggt ccc gtc caa gtg 7974
Thr Gly 2645 Asp Asp Tyr Ser Ser 2650 Asp Leu Asn Gly Pro 2655 Val Gin Val
gtt ctc aag aac ccg gag aac aga gtg cac ttt gtt cag gtg aac 8019
Val Leu 2660 Lys Asn Pro Glu Asn 2665 Arg Val His Phe Val 2670 Gin Val Asn
aac gct gcg gag gca gag gaa gag tac cgg aaa ctc gag aag aca 8064
Asn Ala 2675 Ala Glu Ala Glu Glu 2630 Glu Tyr Arg Lys Leu 2685 Glu Lys Thr
aac tat agc atc tcc aca ggt gac act ctc aga ctc gtt gat ttc 8109
Asn Tyr 2690 Ser Ile Ser Thr Gly 2 6 95 Asp Thr Leu Arg Leu 2700 Val Asp Phe
tac tgg ggc aca gat gac cac ctg ttg gta atc ggc tac cac aga 8154
Tyr Trp 2705 Gly Thr Asp Asp His 2710 Leu Leu Val Ile Gly 2715 Tyr His Arg
PL 202 457 B1
tta Leu gtt val 2720 ggt Gly gat Asp ggc Gly tea Ser aca Thr 2725 aca Thr gaa Glu aac Asn ctg Leu ttc Phe 2730 aat Asn gag Glu atc Ile 8199
ggg cag att tac agc ggg gtg aaa atg cag ega cca teg acc caa 8244
Gly Gin 2735 Ile Tyr Ser Gly Val 2740 Lys Met Gin Arg Pro 2745 Ser Thr Gin
ttc tct gat eta gcc gtc caa cag cgg gaa aac ctg gaa aat ggg 8289
Phe Ser 2750 Asp Leu Ala Val Gin 2755 Gin Arg Glu Asn Leu 2760 Glu Asn Gly
ega atg ggg gac gat atc gcg ttc tgg aag tcc atg cat agc aaa 8334
Arg Met 2755 Gly Asp Asp Ile Ala 2770 Phe Trp Lys Ser Met 2775 His Ser Lys
gtc teg tea tct gcg cca acc gtg ctt ccc atc atg aat ctg atc 8379
Val Ser 2780 Ser Ser Ala Pro Thr 2785 Val Leu Pro Ile Met 2790 Asn Leu Ile
aat gac cct gct gcc aat tea gag cag cag caa ata cag cca ttc 8424
Asn Asp 2795 Pro Ala Ala Asn Ser 2800 Glu Gin Gin Gin Ile 2805 Gin Pro Phe
acg tgg cag cag tat gaa gca att gct cgt tta gat ccc atg gtc 8469
Thr Trp 2810 Gin Gin Tyr Glu Ala 2815 Ile Ala Arg Leu Asp 2820 Pro Met Val
gcc ttc ega atc aaa gag cgg agc cgc aag cac aag gca acc ccc 8514
Ala Phe 2825 Arg Ile Lys Glu Arg 2830 Ser Arg Lys His Lys 2835 Ala Thr Pro
atg cag ttc tac ctg gcc gcc tac cac gtt ttg ttg gcg cgt ctt 8559
Met Gin 2840 Phe Tyr Leu Ala Ala 2845 Tyr His Val Leu Leu 2850 Ala Arg Leu
acc ggc agc aaa gac ata acc atc ggc ctc gcc gaa acc aac ega 8604
Thr Gly 2855 Ser Lys Asp Ile Thr 2860 Ile Gly Leu Ala Glu 2865 Thr Asn Arg
tcc acc atg gaa gaa att teg gcg atg ggc ttt ttc gct aac gtg 8649
Ser Thr 2870 Met Glu Glu Ile Ser 2875 Ala Met Gly Phe Phe 2880 Ala Asn Val
ctt ccc ctg cgc ttt gat gag ttc gtc ggc agc aag aca ttc ggc 8694
Leu Pro 2885 Leu Arg Phe Asp Glu 2890 Phe Val Gly Ser Lys 2895 Thr Phe Gly
gag cac ctt gta gcc acc aag gac agt gtg cgt gag gcc atg caa 8739
Glu His 2900 Leu Val Ala Thr Lys 2905 Asp Ser Val Arg Glu 2910 Ala Met Gin
PL 202 457 B1
cac gcg cgg gtg ccg tat ggc gtc atc ctc gac tgt eta ggc ctg 8784
His Ala Arg Val Pro Tyr Gly val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925
aat ctc cct acc tea ggc gag gaa ccc aag act cag aca cac gcc 8829
Asn Leu Pro Thr Ser Gly Glu Glu Pro Lys Thr Gin Thr His Ala
2930 2935 2940
ccc ttg ttc cag get gtc ttt gat tac aag cag ggt caa gcg gag 8874
Pro Leu Phe Gin Ala Val Phe Asp Tyr Lys Gin Gly Gin Ala Glu
2945 2950 2955
agt ggc tea att ggc aat gcc aaa atg acg agt gtt ctc get tcc 8919
Ser Gly Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser
2950 2965 2 97 0
cgt gag cgc act cct tat gac atc gtt ctc gag atg tgg gat gac 8964
Arg Glu Arg Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp
2975 2980 2985
cct acc aag gac cca ctc att cat gtc aaa ctt cag agc teg ctg 9009
Pro Thr Lys Asp Pro Leu Ile His Val Lys Leu Gin Ser Ser Leu
2990 2995 3000
tat ggc cct gag cac get cag gcc ttt gta gac cac ttt tct tea 9054
Tyr Gly Pro Glu His Ala Gin Ala Phe Val Asp His Phe Ser Ser
3005 3010 3015
atc ctc act atg ttc teg atg aac ccg get ctg aag ttg gcc tag 9099
Ile Leu Thr Met Phe Ser Met Asn Pro Ala Leu Lys Leu Ala
3020 3025 3030
<210> 44
<211> 3032
<212> PRT
<213> Penicillium citrinum
<400> 44
Met
Asp Gin Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Se
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
Leu
Leu Lys Glu Pro Arg Asp Val Gin Thr Lys Ile Pro Lys Glu Arg
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gin Glu Asp Leu Arg Gly Phe
PL 202 457 B1
Asp Ala Ser Phe Phe Asn Ile Gin Ala Gly Glu Ala Glu Thr Ile Asp 85 90 95
Pro Gin Gin Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn 100 105 110
Ala Gly Leu Arg Ile Gin Gly Leu Gin Gly Ser Ser Thr Ala Val Tyr 115 120 125
Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu 130 135 140
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val 180 185 190
Gin Gin Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala 195 200 205
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn 210 215 220
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255
Ser Gin Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu 260 265 270
Thr Gly Ile Asn Gin Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn 275 280 285
His Ser Ala Gin Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly 290 295 300
Leu Asp Tle Thr Asn Pro Gin Glu Arg Cys Gin Phe Phe Glu Ala His
305 310 315 320
Gly Thr Gly Thr Pro Ala Gly Asp Pro Gin Glu Ala Glu Ala Ile Ala
325 330 335
Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu 340 345 350
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr 355 360 365
PL 202 457 B1
Glu Gly 370 Thr Ala Gly Ile Ala 375 Gly Leu Met Lys Ala 380 Ser Phe Ala Val
Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro
385 390 395 400
Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415
Glu Trp Pro Ile Val Ala Pro Gly Gin Pro Arg Arg Val Ser Val Asn
420 425 430
Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile ile Glu Glu Tyr
435 440 445
Met Ala Pro Pro His Lys Pro Thr Ala Val val Thr Glu Val Thr Ser
450 455 460
Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gin
465 470 475 480
Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gin Phe Leu Glu Thr
485 490 495
His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510
Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525
Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540
Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg val Leu Gly Val
545 550 555 560
Phe Thr Gly Gin Gly Ala Gin Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575
Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590
Leu Gin Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605
Gin Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
SIO 615 620
Ser Gin Pro Leu Cys Cys Ala Val Gin Ile Val Leu Val Arg Leu Leu
625 530 635 640
Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655
PL 202 457 B1
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gin Ala 660 565 670
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser 675 680 685
Ser Pro Ser Gly Gin Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr 690 695 7oo
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735
Met Asp Ala Ile Gin His Val Glu Gly Val Leu Glu Asp Glu Ser Thr 740 745 750
Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met 755 760 765
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys 770 775 780
Ala Val Ala Asp Gly Gin Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
Val His Glu Thr Ser Lys Gin Met Thr Val Gin Asp Val Met Pro Ala
805 810 815
Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gin Ala Val 820 825 830
Gin Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile 835 840 845
Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp 850 855 860
Aia Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 880
Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895
Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gin Gin Val 900 905 910
Arg Pro Asp Arg Ala Val Gin Asn Leu Ser Lys Ser Leu Pro Thr Tyr 915 920 925
Ser Trp Asp His Thr Arg Gin Tyr Trp Ala Glu Ser Arg Ser Thr Arg 930 935 940
PL 202 457 B1
Gin 945 His Leu Arg Gly Gly 950 Ala Pro His Leu Leu 955 Leu Gly Lys Leu Ser 960
Ser Tyr Ser Thr Ala 965 Ser Thr Phe Gin Trp 970 Thr Asn Phe Ile Arg 975 Pro
Arg Asp Leu Glu 980 Trp Leu Asp Gly His 985 Ala Leu Gin Gly Gin 990 Thr Val
Phe Pro Ala 995 Ala Gly Tyr Ile Ile 100C Met Ala Met Glu Ala Ala Met L- l 1005
Val Ala 1010 Gly Glu Arg Ala Ala 1015 Gin Val Gin Leu Leu 1020 Glu Ile Leu
Asp Met 1025 Ser ile Asn Lys Ala 1030 ile Val Phe Glu Asp 1035 Glu Asn Thr
Ser Val 1040 Glu Leu Asn Leu Thr 1045 Ala Glu Val Thr Ser 1050 Asp Asn Asp
Ala Asp 1055 Gly Gin Val Thr Val 1060 Lys Phe Val Ile Asp 1065 Ser Cys Leu
Ala Lys 1070 Glu Ser Glu Leu Ser 1075 Thr Ser Ala Lys Gly 1080 Gin Ile Val
I le Thr 1085 Leu Gly Glu Ala Ser 1090 Pro Ser Ser Gin Leu 1095 Leu Pro Pro
Pro Glu 1100 Glu Glu Tyr Pro Gin 1105 Met Asn Asn Val Asn 1110 Ile Asp Phe
Phe Tyr 1115 Arg Glu Leu Asp Leu 1120 Leu Gly Tyr Asp Tyr 1125 Ser Lys Asp
Phe Arg 1130 Arg Leu Gin Thr Met 1135 Arg Arg Ala Asp Ser 1140 Lys Ala Ser
Gly Thr 1145 Leu Ala Phe Leu Pro 1150 Leu Lys Asp Glu Leu 1155 Arg Asn Glu
Pro Leu 1160 Leu Leu His Pro Ala 1165 Pro Leu Asp Ile Ala 1170 Phe Gin Thr
Val Ile 1175 Gly Ala Tyr Ser Ser 1180 Pro Gly Asp Arg Arg 1185 Leu Arg Ser
Leu Tyr 1190 Val Pro Thr His Val 1195 Asp Arg Val Thr Leu 1200 Ile Pro Ser
Leu Cys 1205 Ile Ser Ala Gly Asn 1210 Ser Gly Glu Thr Glu 1215 Leu Ala Phe
PL 202 457 B1
Asp Thr 1220 Ile Asn Thr His Asp 1225 Lys Gly Asp Phe Leu 1230 Ser Gly Asp
Ile Thr 1235 Val Tyr Asp Ser Thr 1240 Lys Thr Thr Leu Phe 1245 Gin Val Asp
Asn Ile 1250 Val Phe Lys Pro Phe 1255 Ser Pro Pro Thr Ala 1260 Ser Thr Asp
Hi s Arg 1265 Ile Phe Ala Lys Trp 1270 val Trp Gly Pro Leu 1275 Thr Pro Glu
Lys Leu 1280 Leu Glu Asp Pro Ala 1285 Thr Leu Ile Ile Ala 1290 Arg Asp Lys
Glu Asp 1295 Ile Leu Thr Ile Glu 1300 Arg Ile Val Tyr Phe 1305 Tyr Ile Lys
Ser Phe 1310 Leu Ala Gin Ile Thr 1315 Pro Asp Asp Arg Gin 1320 Asn Ala Asp
Leu His 1325 Ser Gin Lys Tyr Ile 1330 Glu Trp Cys Asp Gin 1335 Val Gin Ala
Asp Ala 1340 Arg Ala Gly His His 1345 Gin Trp Tyr Gin Glu 1350 Ser Trp Glu
Glu Asp 1355 Thr Ser Val His Ile 1360 Glu Gin Met Cys Glu 1365 Ser Asn Ser
Ser His 1370 Pro His Val Arg Leu 1375 Ile Gin Arg Val Gly 1380 Lys Glu Leu
Ile Ser 1385 Ile Val Arg Gly Asn 1390 Gly Asp Pro Leu Asp 1395 Ile Met Asn
Arg Asp 1400 Gly Leu Phe Thr Glu 1405 Tyr Tyr Thr Asn Lys 1410 Leu Ala Phe
Gly Ser 1415 Ala Ile His Val Val 1420 Gin Asp Leu val Ser 1425 Gin Ile Ala
His Arg 1430 Tyr Gin Ser Ile Asp 1435 Ile Leu Glu Ile Gly 1440 Leu Gly Thr
Gly Ile 1445 Ala Thr Lys Arg Val 1450 Leu Ala Ser Pro Gin 1455 Leu Gly Phe
Asn Ser 1460 Tyr Thr Cys Thr Asp 1465 Ile Ser Ala Asp Val 1470 Ile Gly Lys
Ala Arg 1475 Glu Gin Leu Ser Glu 1480 Phe Asp Gly Leu Met 1485 Gin Phe Glu
PL 202 457 B1
Ala Leu 1490 Asp Ile Asn Arg Ser 1495 Pro Ala Glu Gin Gly 1500 Phe Lys Pro
His Ser 1505 Tyr Asp Leu Ile Ile 1510 Ala Ser Asp Val Leu 1515 His Ala Ser
Ser Asn 1520 Phe Glu Glu Lys Leu 1525 Ala His Ile Arg Ser 1530 Leu Leu Lys
Pro Gly 1535 Gly His Leu Val Thr 1540 Phe Gly Val Thr His 1545 Arg Glu Pro
Ala Arg 1550 Leu Ala Phe Ile Ser 1555 Gly Leu Phe Ala Asp 1560 Arg Trp Thr
Gly Glu 1565 Asp Glu Thr Arg Ala 1570 Leu Ser Ala Ser Gly 1575 Ser Val Asp
Gin Trp 1580 Glu His Thr Leu Lys 1585 Arg Val Gly Phe Ser 1590 Gly Val Asp
Ser Arg 1595 Thr Leu Asp Arg Glu 1600 Asp Asp Leu Ile Pro 1605 Ser Val Phe
Ser Thr 1510 His Ala Val Asp Ala 1615 Thr Val Glu Arg Leu 1620 Tyr Asp Pro
Leu Ser 1625 Ala Pro Leu Lys Asp 1630 Ser Tyr Pro Pro Leu 1635 Val Val Ile
Gly Gly 1640 Glu Ser Thr Lys Thr 1645 Glu Arg Ile Leu Asn 1650 Asp Met Lys
Aia Ala 1655 Leu Pro His Arg His 1660 Ile His Ser Val Lys 1665 Arg Leu Glu
Ser Val 1670 Leu Asp Asp Pro Ala 1675 Leu Gin Pro Lys Ser 1680 Thr Phe Val
Ile Leu 1685 Ser Glu Leu Asp Asp 1690 Glu Val Phe Cys Asn 1695 Leu Glu Glu
Asp Lys 1700 Phe Glu Ala Val Lys 1705 Ser Leu Leu Phe Tyr 1710 Ala Gly Arg
Met Met 1715 Trp Leu Thr Glu Asn 1720 Ala Trp Ile Asp His 1725 Pro His Gin
Ala Ser 1730 Thr Ile Gly Met Leu 1735 Arg Thr Ile Lys Leu 1740 Glu Asn Pro
Asp Leu 1745 Gly Thr His Val Phe 1750 Asp Val Asp Thr Val 1755 Glu Asn Leu
PL 202 457 B1
Asp Thr Lys 1760
Asp Asp Gin 1775
Val Tyr Trp 1790
Asp Ile Ala 1805
Phe Gly Asn 1820
Ala Arg Gly 1835
Thr Cys Asp 1850
Val Arg Val 1865
Leu Gly Tyr 18 80
Cys Glu Val 1895
Leu His Val 1910
Ala Glu Gly 1925
Leu Leu Ala 1940
Asp Ala Ser 1955
Ala Ile Leu 1970
Ala Thr Thr 1985
Arg Leu His 2000
Pro Thr Asn 2015
Phe
Leu
Cys
Arg
Phe
Ala
Ser
Arg
Phe
Pro
Pro
Glu
Glu
Ile
Glu
Leu
Ala
Met
Phe
Leu
Lys
Asn
Asn
Ser
Leu
Tyr
His
Val
Arg
Asp
Thr
Leu
Ser
Ser
Lys
Met
Val
Glu
Gly
Asp
Ser
Ser
Glu
Ala
Val
Val
Asn
Ser
Ile
Ile
Ala
Asp
Glu
Ala
Glu Gin Leu Leu 1765
Ser ile Thr Trp 1780
Arg Ala Trp Val 1795
Arg Met Asn Ser 1810
Ser Lys Thr Ala 1825
Ser Met Tyr Tyr 1840
Asp Ala Arg His 1855
Leu Pro Gin Ala 1870
Val Gin Gly Ser 1885
Ala Leu Ala Glu 1900
Tyr Met His Ser 1915
Ser Phe Leu Leu 1930
Leu Ser Ser Ala 1945
Met Glu Pro Pro 1960
Lys Thr Tyr Gly 1975
Val Lys Thr Ile 1990
Thr Asp Ala Arg 2005
Phe Phe Asp Leu 2020
Arg Phe Glu Glu Ser 1770
Thr His Glu Pro Glu 1785
Pro Arg Leu Lys Gin 1800
Ser Arg Arg Pro Ile 1815
Ile Ala Leu Lys Glu 1830
Leu Glu Ser Thr Glu 1845
Ala Gly Lys Ala Thr 1860
Ile Arg Val Gly His 1875 ile Leu Glu Asn Thr 1890
Lys Asn Gly Ser Ile 1905
Leu Pro Asp Asn Met 1920
Ser Thr Ala Ala Ala 1935
Gin Ser Phe Gly Ser 1950
Ile Phe Cys Val Lys 1965
Val Gin Val His Leu 1980
Pro Ala Pro Trp Ile 1995
Leu Lys His Ser Leu 2010
Ser Thr Asp Arg Thr 2025
PL 202 457 B1
Ala Ala 2030 Gly Ile Thr Asn Arg 2035 Leu Ala Lys Leu Leu 2040 Pro Pro Ser
Cys Phe 2045 Met Tyr Ser Gly Asp 2050 Tyr Leu Ile Arg Ser 2055 Thr Ala Ser
Thr Tyr 2060 Lys val Ser His Val 2065 Glu Asp Ile Pro Ile 2070 Leu Glu His
Ser Val 2075 Ala Met Ala Lys Asn 2080 Thr Val Ser Ala Ser 2085 Thr Val Asp
Asp Thr 2090 Glu Lys Val Ile Thr 2095 Ala Thr Gin Ile Leu 2100 Leu Pro Gly
Gin Leu 2105 Ser Val Asn His Asn 2110 Asp Gin Arg Phe Asn 2115 Leu Ala Thr
Val Tle 2120 Asp Trp Lys Glu Asn 2125 Glu Val Ser Ala Arg 2130 Ile Cys Pro
Ile Asp 2135 Ser Gly Asn Leu Phe 2140 Ser Asn Lys Lys Thr 2145 Tyr Leu Leu
fal Gly 2150 Leu Thr Gly Asp Leu 2155 Gly Arg Ser Leu Cys 2160 Arg Trp Met
Ile Leu 2165 His Gly Ala Arg His 2170 val Val Leu Thr Ser 2175 Arg Asn Pro
Arg Leu 2180 Asp Pro Lys Trp Ile 2185 Ala Asn Met Glu Ala 2190 Leu Gly Gly
Asp ile 2195 Thr val Leu Ser Met 2200 Asp Val Ala Asn Glu 2205 Asp Ser Val
Asp Ala 2210 Gly Leu Gly Lys Leu 2215 Val Asp Met Lys Leu 2220 Pro Pro Val
Ala Gly 2225 I le Ala Phe Gly Pro 2230 Leu Val Leu Gin Asp 2235 Val Met Leu
Lys Asn 2240 Met Asp His Gin Met 2245 Met Asp Met val Leu 2250 Lys Pro Lys
Val Gin 2255 Gly Ala Arg Ile Leu 2260 His Glu Arg Phe Ser 2265 Glu Gin Thr
Gly Ser 2270 Lys Ala Leu Asp Phe 2275 Phe Ile Met phe Ser 2280 Ser Ile Val
Ala Val 2285 Ile Gly Asn Pro Gly 2290 Gin Ser Asn Tyr Gly 2295 Ala Ala Asn
PL 202 457 B1
Ala Tyr Leu Gin Ala Leu Ala Gin Gin Arg Cys Ala Arg Gly Leu 2300 2305 2310
Ala Gly Ser Thr Ile Asp Ile Gly Ala Val Tyr Gly Val Gly Phe 2315 2320 2325 tal Thr Arg Ala Glu Met Glu Glu Asp Phe Asp Ala Ile Arg Phe 2330 2335 2340
Met Phe Asp Ser val Glu Glu His Glu Leu His Thr Leu Phe Ala 2345 2350 2355
Glu Ala Val Val Ser Asp Gin Arg Ala Arg Gin Gin Pro Gin Arg 2360 2365 2370
Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu Thr Thr Gly Ile 2375 2380 2385
Pro Asp Leu Asp Pro Ala Leu Gin Asp Arg Ile Ile Tyr Phe Asn 2390 2395 2400
Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gin Arg Gly Asp 2405 2410 2415
Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp Gin 2420 2425 2430
Leu Lys Gin Ala Thr Thr Leu Asp Gin Val Arg Gin Ile Val Ile 2435 2440 2445
Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gin Val Ser Asp 2450 2455 2460
Gly Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gin Gly Val 2465 2470 2475
Asp Ser Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gin 2480 2485 2490
Leu Tyr Leu Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser 2495 2500 2505
Val Ala Asp Leu Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr 2510 2515 2520
Ser Ile Pro Leu Leu Leu Gin Ile Gly Asp Ser Thr Gly Thr Ser 2525 2530 2535
Asp Ser Gly Ala Ser Pro Thr Pro Thr Asp Ser His Asp Glu Ala 2540 2545 2550
Ser Ser Ala Thr Ser Thr Asp Ala Ser Ser Ala Glu Glu Asp Glu 2555 2560 2565
PL 202 457 B1
Glu Glu 2570 Glu Asp Asp Asn Glu 2575 Gin i Gly i Gly ; Arg Lys 2580 Ile Leu . Arg
Arg Glu 2 58 5 Arg Leu Ser Leu Gly 2590 Gin Glu Tyr Ser Trp 2595 Arg Gin Gin
Gin Met 2600 Val Lys Asp His Thr 2605 Ile Phe Asn Asn Thr 2610 Ile Gly Met
Phe Met 2615 Lys Gly Thr Ile Asp 2620 Leu Asp Arg Leu Arg 2625 Arg Ala Leu
Lys Ala 2630 Ser Leu Arg Arg His 2635 Glu Ile Phe Arg Thr 2640 Cys Phe Val
Thr Gly 2645 Asp Asp Tyr Ser Ser 2650 Aap Leu Asn Gly Pro 2655 val Gin Val
Val Leu 2660 Lys Asn Pro Glu Asn 2665 Arg Val His Phe Val 2670 Gin Val Asn
Ssn Ala 2575 Ala Glu Ala Glu Glu 2680 Glu Tyr Arg Lys Leu 2685 Glu Lys Thr
Asn Tyr 2690 Ser Ile Ser Thr Gly 2695 Asp Thr Leu Arg Leu 2700 Val Asp Phe
Tyr Trp 2705 Gly Thr Asp Asp His 2710 Leu Leu Val Ile Gly 2715 Tyr His Arg
Leu Val 2720 Gly Asp Gly Ser Thr 2725 Thr Glu Asn Leu Phe 2730 Asn Glu Ile
Gly Gin 2735 Ile Tyr Ser Gly Val 2740 Lys Met Gin Arg Pro 2745 Ser Thr Gin
Phe Ser 2750 Asp Leu Ala Val Gin 2755 Gin Arg Glu Asn Leu 2760 Glu Asn Gly
Arg Met 2765 Gly Asp ASp Ile Ala 2770 Phe Trp Lys Ser Met 2775 His Ser Lys
Val Ser 2780 Ser Ser Ala Pro Thr 2 7SS Val Leu Pro Ile Met 2790 Asn Leu Ile
Asn Asp 2795 Pro Ala Ala Asn Ser 2Θ00 Glu Gin Gin Gin Ile 2805 Gin Pro Phe
Thr Trp 2310 Gin Gin Tyr Glu Ala 2815 Ile Ala Arg Leu , Asp 2820 Pro Met val
Ala Phe 2825 Arg Ile Lys Glu Arg 2830 Ser Arg ; Lys His i Lys 2835 Ala Thr Pro
PL 202 457 B1
100
PL 202 457 B1
gca Ala acc Thr gca Ala atg Met 20 gca Ala ggc Gly teg Ser gct Ala tgc Cys 25 tct Ser aac Asn aca Thr tcc Ser acg Thr 30 ccc Pro att Ile 95
gcc ata gtt gga atg gga tgt ega ttt gct gga gat gca acg agt cca 144
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45
cag aag ctt tgg gaa atg gtt gaa aga gga ggc agt gcc tgg tct aag 192
Gin Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60
gtc ccc tcc teg ega ttc aat gtg aga gga gta tac cac ccg aat ggc 240
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly
55 70 75 80
gaa agg gtc ggg tcc acc cac gta aaq ggt gga cac ttc atc gac gag 288
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95
gat cct gct tta ttt gac g=c gcg ttc ttc aac atg acc aca gag gtc 33S
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110
gcc agc tgc atg gat ccg cag tat cgg ctt atg ctt gag gtg gtc tac 3 84
Ala Ser Cys Met Asp Pro Gin Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125
gaa teg ctg gag agt gcc ggt atc acc atc gat ggt atg gca ggc tct 432
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 14 0
aat acg teg gtg ttt ggg ggt gtc atg tac cac gac tat cag gat teg 480
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gin Asp Ser
14 5 150 155 160
ctc aat cgt gac ccc gag aca gtt ccg cgt tat ttc ata act ggc aac 528
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
tea gga aca atg Ctt teg aac cgg ata tea cac ttc tac gac tta cgt 576
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
ISO 185 190
ggt ccc agc gtg acg gtt gac acg gcc tgt teg acg aca ttg acc gca 624
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205
ctg cac ttg gcg tgc cag agc tta cgt act ggg gag tea gat aca gcc 672
Leu His Leu Ala Cys Gin Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
2 10 215 220
PL 202 457 B1
101
atc Ile 225 gtt Val atc Ile ggt Gly gca Ala aat Asn 230 Ctt Leu ctg Leu ctc Leu aat Asn ccc Pro 235 gat Asp gtt Val ttt Phe gtt Val acg Thr 240 720
atg tea aac ctg gga ttt ttg tcc ccg gat ggt atc teg tac tct ttt 7S8
Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255
gat cct ega gcg aat gga tat ggt cgc ggg gaa gga att gcc get ctg 816
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270
gta ata aag gcc ctc cct aac gcg ttg ega gac caa gac cct atc ega 864
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gin Asp Pro Ile Arg
275 280 285
gcc gtc att ega gag aca gcg ctg aac cag gat ggc aaa aca ccc gca 912
Ala Val Ile Arg Glu Thr Ala Leu Asn Gin Asp Gly Lys Thr Pro Ala
290 295 300
att act gcg ccg agt gat gtg gcg cag aaa agt ctg atc cag gag tgt 9S0
Ile Thr Ala Pro Ser Asp Val Ala Gin Lys Ser Leu Ile Gin Glu Cys
305 310 315 320
tac gat aag get ggg eta gat atg teg ttg acc teg tac gtg gag gcc 1008
Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
325 330 335
cac gga act gga aca cca act ggt gac ccc ctt gaa atc tea gca att 1056
Hi s Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350
tea gca get ttt aaa gga cat cct ctg cac ctt ggc tct gtg aaa gca 1104
Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365
aat att ggc cat aca gaa gcc gcc agt ggc ctg gcc agt ata atc aag 1152
Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser I le Ile Lys
370 375 380
gtg gcc ttg gcc ttg gag aag ggc ttg att ccc cct aat gcg cgg ttc 1200
Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe
385 390 395 400
ctg caa aag aac agc aag ctg atg ctt gac caa aag aac atc aag atc 1248
Leu Gin Lys Asn Ser Lys Leu Met Leu Asp Gin Lys Asn Ile Lys Ile
405 410 415
ccc atg tct get caa gac tgg cct gtg aaa gat ggg act cgt cgc gca 1296
Pro Met Ser Ala Gin Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430
102
PL 202 457 B1
tct Ser gtc Val aat Asn 435 aac Asn ttc Phe ggc Gly ttt Phe ggt Gly 440 ggt Gly tcg Ser aat Asn gct Ala cac His 445 gtc Val att Ile ttg Leu 1344
gaa tca tat gat cgc gca tca ttg gcc ctg cca gag gat caa gtg cat 1392
Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gin Val His
450 455 460
gtc aat ggt aac tct gag cat ggt agg gtt gag gat ggt tcc aaa cag 1440
Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gin
465 470 475 480
agc cgc ata tac gtt gtg cgt gcc aag gac gag caa gct tgt cgg ega 1488
Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gin Ala Cys Arg Arg
485 490 495
acg ata gca agc ctg ega gac tac att aaa tcc gtc gct gac att gac 1536
Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510
ggg gaa ccc ttc ctc gcc agc ctc gcc tat aca eta ggc tct cgc cgt 1584
Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525
tcc att ctg cca tgg acg tca gtg tat gta gca gac agc ctt ggc ggc 1632
Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540
ctt gtt tct gcc ctc agc gat gag tcc aat caa cca aaa ega gcg aat 1680
Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gin Pro Lys Arg Ala Asn
545 550 555 560
gag aaa gta cgg ctc gga ttt gta ttc acc ggt cag ggg gcg cag tgg 1728
Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gin Gly Ala Gin Trp
565 570 575
cat gca atg ggc aga gag ctg gtc aat aca ttc cca gta ttc aaa cag 1776
His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gin
580 585 590
gcg att ctt gaa tgt gat ggc tac atc aag caa ctg ggc gcg agt tgg 1824
Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gin Leu Gly Ala Ser Trp
595 600 605
aat ttt atg gag gag ctc cac cgt gat gag ctg acg act cgg gta aat 1872
Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620
gat gcc gaa tac agt eta cca ctg tca acc gct atc caa att gca ctt 1920
Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gin Ile Ala Leu
625 S30 635 640
PL 202 457 B1
103
gtg Val cgt Arg ctc Leu Ctt Leu tgg Trp 645 tca Ser tgg Trp gga Gly att Ile cgg Arg 650 cca Pro acg Thr ggg Gly ata Ile acc Thr 655 agt Ser 1968
cac tca agt gga gag gct gct gct gcc tac gca gct ggg gct tta tcc 2016
His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670
gcg cgg teg gcc att ggg atc act tat ata cgc ggt gta ttg acc act 2064
Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685
aag ccc aag ccc gca ttg gca gcc aaa gga gga atg atg gcg gtg ggt 2112
Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700
ctt ggt cgc agt gag acc aat gtt tac att teg cgt ctc aac cag gag 2160
Leu Gly Arg Ser Glu Thr Asn Val Tyr ile Ser Arg Leu Asn Gin Glu
705 710 715 720
gac ggc tgt gtg gtg gtt gga tgt atc aac agt caa tgt agt gtg acg 2208
Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gin Cys Ser Val Thr
725 730 735
gtg teg gga gat ttg ggt gca atc gag aaa ctt gaa aag ttg tta cac 2256
Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750
gcc gat ggc atc ttt acc agg aaa ctg aaa gtc act gaa gcc ttc cat 2304
Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765
tca agc cac atg ega cca atg gca gat gcc ttt ggg gcg tca ctg aga 2352
Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780
gat ctg ttc aac teg gat aac aac aac gac aat ccc aat gct gac acc 2400
Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr
785 790 795 800
tca aag ggt gta tta tat tca tca cct aag act ggt agt cgc atg acc 2448
Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815
gat ctt aaa ttg cta ttg gat ccc aca cac tgg atg gat agt atg cta 2496
Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830
cag ccg gta gag ttc gag tcc tca ctc cgc gag atg tgc ttt gat ccc 2544
Gin Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845
104
PL 202 457 B1
aac Asn acc Thr 850 aaa gag Lys Glu aaa Lys gcc Ala gtc Val 855 gat Asp gtg Val att Ile att Ile gaa Glu 860 ata Ile ggg Gly cct Pro cac His 2592
gga gcg ctt ggt ggt cca atc aac caa gtc atg cag gat ctg ggt ctg 2640
Gly Ala Leu Gly Gly Pro Ile Asn Gin Val Met Gin Asp Leu Gly Leu
865 870 875 880
aaa gga aca gat ata aac tat ctc agt tgc Ctt tct cgc ggc aga age 2688
Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895
teg ttg gag aca atg tat cgt gct gct acg gag ttg ata age aag ggt 2736
Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910
tat ggg ctc aaa atg gac gct ata aac ttt cct cat gga aga aaa gag 2784
Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925
ccc aga gtg aag gta ctg age gat ttg ccg gcg tac ccg tgg aat cac 2832
Pro Arg val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940
caa acc cgt tat tgg aga gag cct cgc ggc agt cgt gag tcc aaa cag 2880
Gin Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gin
945 950 955 960
aga acc cat ccg cct cac act ttg ata ggc tea cgg gaa tct ctc tct 2928
Arg Thr Hi s Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975
cct cat ttc gcg cct aaa tgg aaa cat gtt ctc cgt ctg tea gat att 2976
Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990
cca tgg ata ega gat cac gtc gtt ggt teg age atc atc ttt ccg gga 3024
Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro Gly
995 1000 1005
gct ggc ttc atc age atg gcc atc gag ggg ttt tea caa , gtc tgc 3069
Ala Gly Phe Ile Ser Met Ala Ile Glu Gly Phe Ser i Gin ' fal Cys
1010 1015 1020
cca cca gtt gcg ggg gct : age atc aac tac aac ttg cgt ' gac gtt 3114
Pro Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu . Arg . Asp Val
1025 1030 1035
gaa ctc gcg cag gct ctc ata ata ccc gct gat gca gaa ' gca gag 3159
Glu Leu Ala Gin Ala Leu Ile Ile Pro Ala Asp Ala Glu . Ala Glu
1040 1045 1050
PL 202 457 B1
105
gtt Val gac Asp 1055 ctg Leu cgc Arg eta Leu acg Thr atc Ile 1060 cgt Arg tca Ser tgt Cys gag Glu gaa Glu 1065 agg Arg tcc Ser ctc Leu 3204
ggc aca aag aac tgg cat caa ttt tet gtg cac tca att teg ggc 3249
Gly Thr 1070 Lys Asn Trp His Gin 1075 Phe Ser val His Ser 1080 Ile Ser Gly
gaa aat aat acc tgg aca gaa cac tgc acc gga tta ata cgt teg 3294
Glu Asn 1085 Asn Thr Trp Thr Glu 1090 His Cys Thr Gly Leu 1095 Ile Arg Ser
gag agc gaa aga agc cac ctt gac tgt tca act gtg gaa gcc tca 3339
Glu Ser 1100 Glu Arg Ser His Leu 1105 Asp Cys Ser Thr Val 1110 Glu Ala Ser
cgc agg ttg aat eta ggc tca gat aac cgg agc att gat ccc aac 3384
Arg Arg 1115 Leu Asn Leu Gly Ser 1120 Asp Asn Arg Ser Ile 1125 Asp Pro Asn
gat ctc tgg gag tcc tta cac gcg aat ggg ata tgc cac gga ccc 3429
Asp Leu 1130 Trp Glu Ser Leu His 1135 Ala Asn Gly Ile Cys 114 0 His Gly Pro
att ttt cag aac att cag ega att caa aac aat gga cag ggc teg 3474
Ile Phe 1145 Gin Asn Ile Gin Arg 1150 Ile Gin Asn Asn Gly 1155 Gin Gly Ser
ttt tgc aga ttt tcc att gct gac act gcc teg gct atg cct cac 3519
Phe cys 1160 Arg Phe Ser Ile Ala 1165 Asp Thr Ala Ser Ala 1170 Met Pro Hi s
teg tac gag aat ega cac atc gtc cat cct act act ctg gac teg 3564
Ser Tyr 1175 Glu Asn Arg His Ile 1180 val His Pro Thr Thr 1185 Leu Asp Ser
gtg atc cag gcg gca tac acg gtg tta ccc tac gcg gga aca cgt 3609
Val ile 1190 Gin Ala Ala Tyr Thr 1195 Val Leu Pro Tyr Ala 1200 Gly Thr Arg
atg aaa acg gcc atg gta cca agg agg eta aga aat gtc cl <3. cl ata 3654
Met Lys 1205 Thr Ala Met Val Pro 1210 Arg Arg Leu Arg Asn 1215 Val Lys Ile
tcc tet agc ctg gct gac ttg gag gct ggt gat gct ctg gac gca 3699
Ser Ser 1220 Ser Leu Ala Asp Leu 1225 Glu Ala Gly Asp Ala 1230 Leu Asp Ala
cag gcc agc atc aag gat cgc aac tet caa tcc ttc tet acc gac 3744
Gin Ala 1235 Ser Ile Lys Asp Arg 1240 Asn Ser Gin Ser Phe 1245 Ser Thr Asp
106
PL 202 457 B1
ttg Leu gca Ala 1250 gtg Val ttt Phe gat Asp gac Asp tat Tyr 1255 gat Asp agc Ser ggt Gly tct Ser tct Ser 1260 ccc Pro teg Ser gac Asp 3789
gga atc cca gtc ata gag att gaa ggc ctt gtt ttc cag teg gtt 3834
Gly Ile 1265 Pro Val Ile Glu Ile 1270 Glu Giy Leu Val Phe 1275 Gin Ser Val
gga agc agc ttc tct gac caa aag tea gac tcc aac gac aca gaa 3879
Gly Ser 1280 Ser Phe Ser Asp Gin 1285 Lys Ser Asp Ser Asn 1290 Asp Thr Glu
aat gcc tgc agc tcc tgg gtt tgg gcc cct gac atc agc ttg ggt 3924
Asn Ala 1295 Cys Ser Ser Trp Val 1300 Trp Ala Pro Asp Ile 1305 Ser Leu Gly
gac tcc act tgg ctc aaa gaa aag ttg agc act gag gct gag acg 3969
Asp Ser 1310 Thr Trp Leu Lys Glu 1315 Lys Leu Ser Thr Glu 1320 Ala Glu Thr
aaa gaa acg gaa ctc atg atg gac ctc ega aga tgc acg atc aac 4014
Lys Glu 1325 Thr Glu Leu Met Met 1330 Asp Leu Arg Arg Cys 1335 Thr Ile Asn
ttt ata cag gag gct gtc act gat ttg aca aat tct gat atc caa 4059
Phe Ile 1340 Gin Glu Ala Val Thr 1345 Asp Leu Thr Asn Ser 1350 Asp Ile Gin
cat ctg gat ggc cac ctt cag aag tat ttc gat tgg atg aat gtc 4104
His Leu 1355 Asp Gly Hi s Leu Gin 1360 Lys Tyr Phe Asp Trp 1365 Met Asn Val
caa ttg gac ctt gcg aga caa aac aag ctc agc cca gcc agt tgc 4149
Gin Leu 1370 Asp Leu Ala Arg Gin 1375 Asn Lys Leu Ser Pro 1380 Ala Ser cys
gac tgg eta agt gac gat gct gag cag aag aaa tgc eta cag gcc 4194
Asp Trp 1385 Leu Ser Asp Asp Ala 1390 Glu Gin Lys Lys Cys 1395 Leu Gin Ala
aga gtc gct gga gaa agc gtc aat ggc gag atg att tct cgt eta 4239
Arg Val 1400 Ala Gly Glu Ser Val 1405 Asn Gly Glu Met Ile 1410 Ser Arg Leu
gga cct cag tta ata gca atg eta cgc cgc gaa aca gag cca ctt 4284
Gly Pro 1415 Gin Leu Ile Ala Met 1420 Leu Arg Arg Glu Thr 1425 Glu Pro Leu
gag ttg atg atg caa gat cag ctg eta agc aga tac tac gtc aac 4329
Glu Leu 1430 Met Met Gin Asp Gin 1435 Leu Leu Ser Arg Tyr 1440 Tyr Val Asn
PL 202 457 B1
107
gca. Ala atc Ile 1445 aaa Lys tgg Trp agc Ser ega Arg tca Ser 1450 aac Asn gca Ala caa Gin gcc Ala agc Ser 1455 gag Glu ctg Leu atc Ile 4374
ega ctt tgc gcc cac aag aac ccg cgt tct cgc att ttg gag att 4419
Arg Leu 1460 Cys Ala His Lys Asn 1465 Pro Arg Ser Arg Ile 1470 Leu Glu Ile
ggc gga ggc acg ggc ggc tgc aca aag ctt att gtc aat gca ttg 4464
Gly Gly 1475 Gly Thr Gly Gly Cys 1430 Thr Lys Leu Ile Val 1485 Asn Ala Leu
gga aac acc aag ccg atc gat cgt tat gac ttc acc gat gtg tct 4509
Gly Asn 1490 Thr Lys Pro Ile Asp 1495 Arg Tyr Asp Phe Thr 1500 Asp Val Ser
gcc ggg ttt ttc gag tcg gcg cgt gag caa ttt gcg gat tgg caa 4554
Ala Gly 1505 Phe Phe Glu Ser Ala 1510 Arg Glu Gin Phe Ala 1515 Asp Trp Gin
gac gtg atg act ttc aaa aaa ttg gat att gaa agc gat ccc gag 4599
Asp Val 1520 Met Thr Phe Lys Lys 1525 Leu Asp Ile Glu Ser 1530 Asp Pro Glu
caa caa ggg ttt gaa tgt gcc acc tac gat gtg gtc gtg gct tgc 4644
Gin Gin 1535 Gly Phe Glu Cys Ala 1540 Thr Tyr Asp val Val 1545 Val Ala Cys
cag gtc ctg cat gca act ega tgc atg aaa ega aca ctg agt aac 4689
Gin Val 1550 Leu His Ala Thr Arg 1555 cys Met Lys Arg Thr 1560 Leu Ser Asn
gtt ega aaa ttg ctc aag cct ggg ggc aac ttg att ttg gtt gag 4734
Val Arg 1565 Lys Leu Leu Lys Pro 1570 Gly Gly Asn Leu Ile 1575 Leu Val Glu
act acc agg gat cag ctc gat ttg ttc ttt acc ttc gga ctg ttg 4779
Thr Thr 1580 Arg Asp Gin Leu Asp 1585 Leu Phe Phe Thr Phe 1590 Gly Leu Leu
cca ggt tgg tgg ctc agt gag gag cct gag cgg aag tcg acg cca 4824
Pro Gly 1595 Trp Trp Leu Ser Glu 1600 Glu Pro Glu Arg Lys 1605 Ser Thr Pro
tcg ctc act acc gat ctt tgg aac acc atg ttg gac acg agc ggt 4S69
Ser Leu 1610 Thr Thr Asp Leu Trp 1615 Asn Thr Met Leu Asp 1620 Thr Ser Gly
ttc aac ggt gtg gaa ttg gag gtt cgt gat tgt gaa gac gat gag 4914
Phe Asn 1625 Gly Val Glu Leu Glu 1630 Val Arg Asp Cys Glu 1635 Asp Asp Glu
108
PL 202 457 B1
ttt Phe tac Tyr 1640 atg Met atc Ile agc Ser aca Thr atg Met 1645 eta Leu tcg Ser acg Thr gct Ala aga Arg 1650 aaa Lys gag Glu aat Asn 4959
aca acc ccg gat aca gtg gca gaa tcg gag gtg ctt ttg ctg cac 5004
Thr Thr 1655 Pro Asp Thr Val Ala 1660 Glu Ser Glu Val Leu 1665 Leu Leu His
gga gcg ctc ega cct cct tca tct tgg ctg gaa agt ctc cag gca 5049
Gly Ala 1670 Leu Arg Pro Pro Ser 1675 Ser Trp Leu Glu Ser 1680 Leu Gin Ala
gca att tgt gaa aag acc agt tct agc cca tcg atc aac gct ctg 5094
Ala Ile 1685 Cys Glu Lys Thr Ser 1690 Ser Ser Pro Ser Ile 1695 Asn Ala Leu
ggc gag gta gat acc act gga agg aca tgc att ttt ctt ggg gaa 5139
Gly Glu 1700 Val Asp Thr Thr Gly 1705 Arg Thr Cys Ile Phe 1710 Leu Gly Glu
atg gag tcc tcg ctc ctt gga gag gtg gga agc gag acc ttc aaa 5184
Met Glu 1715 Ser Ser Leu Leu Gly 1720 Glu Val Gly Ser Glu 1725 Thr Phe Lys
tcc atc acc gcg atg ctg aat aac tgc aac gca ctt ctc tgg gtg 5229
Ser Ile 1730 Thr Ala Met Leu Asn 1735 Asn Cys Asn Ala Leu 1740 Leu Trp Val
tct aga gga gca gcc atg agc tcc gag gat cca tgg aaa gct eta 5274
Ser Arg 1745 Gly Ala Ala Met Ser 1750 Ser Glu Asp Pro Trp 1755 Lys Ala Leu
cat att ggt ctg ctg cgt acc atc cgc aac gaa aat aac ggg aag 5319
His Ile 1760 Gly Leu Leu Arg Thr 1765 Ile Arg Asn Glu Asn 1770 Asn Gly Lys
gaa tat gta tcg ttg gat ctc gat cct tct ega aac gca tac acc 5364
Glu Tyr 1775 Val Ser Leu Asp Leu 1780 Asp Pro Ser Arg Asn 1785 Ala Tyr Thr
cac gag tcc ctg tat gct atc tgc aat atc ttc aat ggc cgc ctc 5409
His Glu 1790 Ser Leu Tyr Ala Ile 1795 Cys Asn Ile Phe Asn 1800 Gly Arg Leu
ggc gac ctt tcc gaa gac aag gag ttt gaa ttt gca gag aga aac 5454
Gly Asp 1805 Leu Ser Glu Asp Lys 1810 Glu Phe Glu Phe Ala 1815 Glu Arg Asn
ggc gtc atc cac gta ccg ega ctt ttc aat gac ccg cac tgg aag 5499
Gly Val 1820 Ile His Val Pro Arg 1825 Leu Phe Asn Asp Pro 1830 His Trp Lys
PL 202 457 B1
109
gac Asp caa Gin 1835 gaa Glu gcg Ala gtt Val gag Glu gtc Val 1840 aca Thr ctg Leu cag Gin ccg Pro ttc Phe 1845 gag Glu caa Gin ccc Pro 5544
ggg cgt cgt ctg cgg atg gag gtt gag acg cca ggg ctc tta gac 5589
Gly Arg 1850 Arg Leu Arg Met Glu 1855 Val Glu Thr Pro Gly 1860 Leu Leu Asp
tcc ctg caa ttt ega gac gac gaa gga cgt gaa ggc aag gat ctt 5634
Ser Leu 1855 Gin Phe Arg Asp Asp 1870 Glu Gly Arg Glu Gly 1875 Lys Asp Leu
ccg gat gat tgg gta gaa atc gaa ccc aaa get ttc ggt ctc aat 5679
Pro Asp 1880 Asp Trp Val Glu Ile 1885 Glu Pro Lys Ala Phe 1890 Gly Leu Asn
ttt cgg gat gtc atg gtt gcc atg ggt caa ttg gag gcc aac cgt 5724
Phe Arg 1895 Asp Val Met Val Ala 1900 Met Gly Gin Leu Glu 1905 Ala Asn Arg
gtg atg ggc ttc gaa tgc gcc gga gtg atc aca aag ctc ggt gga 5769
Val Met 1910 Gly Phe Glu Cys Ala 1915 Gly Val Ile Thr Lys 1920 Leu Gly Gly
get get gcc get agc caa ggc ctc aga tta ggg gac cgc gta tgt 5814
Ala Ala 1925 Ala Ala Ser Gin Gly 1930 Leu Arg Leu eiy Asp 1935 Arg Val Cys
gca eta ctg aaa ggc cat tgg gcg acc aga aca cag acg ccg tac 5859
Ala Leu 1940 Leu Lys Gly His Trp 1945 Ala Thr Arg Thr Gin 1950 Thr Pro Tyr
act aat gtc gtc cgt att ccg gac gaa atg ggc ttc cca gaa gcc 5904
Thr Asn 1955 Val Val Arg Ile Pro 1960 Asp Glu Met Gly Phe 1965 Pro Glu Ala
get teg gtc ccc ctg get ttc act acc gca tat att gcg ctt tat 5949
Ala Ser 1970 val Pro Leu Ala Phe 1975 Thr Thr Ala Tyr Ile 1980 Ala Leu Tyr
acc acg gca aag eta ega ega ggc gaa aga gtc ttg atc cac agt 5994
Thr Thr 1985 Ala Lys Leu Arg Arg 1990 Gly Glu Arg val Leu 1995 Ile His Ser
gga get gga ggc gtc ggt caa gca gcg atc att ttg tcc cag ctt 6039
Gly Ala 2000 Gly Gly Val Gly Gin 2005 Ala Ala Ile Ile Leu 2010 Ser Gin Leu
gcg ggt gcc gag gtc ttc gtc aca gcg gga act caa gcc aag cgt 6084
Ala Gly 2015 Ala Glu Val Phe Val 2020 Thr Ala Gly Thr Gin 2025 Ala Lys Arg
110
PL 202 457 B1
gac Asp ttt Phe 2030 gtc Val ggc Gly gat Asp aaa Lys ttc Phe 2035 ggc Gly atc Ile aat Asn ccg Pro gat Asp 2040 cat His atc Ile ttc Phe 6129
teg agc agg aat gac tta ttc gtc gac ggc atc aaa gcc tac acg 6174
Ser Ser 2045 Arg Asn Asp Leu Phe 2050 Val Asp Gly Ile Lys 2055 Ala Tyr Thr
ggc gga ctt ggc gtt cat gtc gtt eta aac tea ttg gca ggt caa 6219
Gly Gly 2060 Leu Gly Val His Val 2065 Val Leu Asn Ser Leu 2070 Ala Gly Gin
ctc ctc caa gca agc ttt gac tgc atg gcc gaa ttc ggc aga ttt 6264
Leu Leu 2075 Gin Ala Ser Phe Asp 2080 Cys Met Ala Glu Phe 2085 Gly Arg Phe
gtt gag att gga aaa aag gac ctg gag caa aac agc aga ctt gac 6309
Val Glu 2090 Ile Gly Lys Lys Asp 2095 Leu Glu Gin Asn Ser 2100 Arg Leu Asp
atg ctg cca ttc acc cgg gac gtc tct ttc aca tea att gat ctt 6354
Met Leu 2105 Pro Phe Thr Arg Asp 2110 Val Ser Phe Thr Ser 2115 Ile Asp Leu
ctc teg tgg caa aga gcc aaa agt gaa gaa gta tcc gaa gcg ttg 6399
Leu Ser 2120 Trp Gin Arg Ala Lys 2125 Ser Glu Glu Val Ser 2130 Glu Ala Leu
aac cat gtc aca aaa ctc ctc gag aca aaa gcg att ggc ttg att 6444
Asn His 2135 val Thr Lys Leu Leu 2140 Glu Thr Lys Ala Ile 2145 Gly Leu Ile
ggt cca atc cag cag cac tcc ttg tea aac atc gag aag gcc ttc 6489
Gly Pro 2150 Ile Gin Gin His Ser 2155 Leu Ser Asn Ile Glu 2160 Lys Ala Phe
cgt acg atg cag agt ggt cag cat gtt ggc aaa gtt gtg gtc aat 6534
Arg Thr 2165 Met Gin Ser Gly Gin 2170 His Val Gly Lys Val 2175 Val val Asn
gta tct ggg gac gaa ctg gtc cca gtc ggc gat gga ggg ttc teg 6579
Val Ser 2180 Gly Asp Glu Leu Val 2185 Pro Val Gly Asp Gly 2190 Gly Phe Ser
ctg aag ctg aag cct gac agt tct tac eta gtt gct ggt ggg ctg 6624
Leu Lys 2195 Leu Lys Pro Asp Ser 2200 Ser Tyr Leu Val Ala 2205 Gly Gly Leu
ggg gga att gga aag cag atc tgt cag tgg ctt gtt gat cat ggc 6669
Gly Gly 2210 Ile Gly Lys Gin Ile 2215 Cys Gin Trp Leu val 2220 Asp His Gly
PL 202 457 B1
111
gcg Ala. aag Lys 2225 cac His ttg Leu att Ile atc Ile cta Leu 2230 teg Ser aga Arg agt Ser gca Ala aag Lys 2235 gcc Ala agt Ser cca Pro 6714
ttc ata acc agc ttg caa aat caa cag tgc gct gtc tat cta cac 6759
Phe Ile 2240 Thr Ser Leu Gin Asn 2245 Gin Gin Cys Ala Val 2250 Tyr Leu His
gca tgt gac atc tca gat caa gat cag gtc acc aag gtg ctc cgg 6804
Ala Cys 2255 Asp Ile Ser Asp Gin 2260 Asp Gin Val Thr Lys 2265 Val Leu Arg
ttg tgc gaa gaa gca cat gca ccg cca att ega ggt atc ata caa 6849
Leu Cys 2270 Glu Glu Ala His Ala 2275 Pro Pro Ile Arg Gly 2280 Ile Ile Gin
ggt gcc atg gtt ctc aag gac gcg ctt cta teg ega atg aca ttg 6894
Gly Ala 2285 Met Val Leu Lys Asp 2290 Ala Leu Leu Ser Arg 2295 Met Thr Leu
gat gaa ttt aat gca gca aca cgc cca aaa gta cag ggt agt tgg 6939
Asp Glu 2300 Phe Asn Ala Ala Thr 2305 Arg Pro Lys Val Gin 2310 Gly Ser Trp
tat ctt cac aag atc gca cag gat gtt gac ttc ttc gtg atg ctc 6984
Tyr Leu 2315 His Lys Ile Ala Gin 2320 Asp Val Asp Phe Phe 2325 Val Met Leu
tca tcc ctt gtt ggg gtc atg ggt ggg gca ggc cag gcc aat tac 7029
Ser Ser 2330 Leu Val Gly Val Met 2335 Gly Gly Ala Gly Gin 2340 Ala Asn Tyr
gca gct gct ggt gca ttc cag gac gca ctt gcg cac cac cgg aga 7074
Ala Al a 2345 Ala Gly Ala Phe Gin 2350 Asp Ala Leu Ala His 2355 His Arg Arg
gcc cat ggc atg ccg gct gtc acc att gac ttg ggc atg gtc aag 7119
Ala His 2360 Gly Met Pro Ala Val 2365 Thr Ile Asp Leu Gly 2370 Met Val Lys
tct gtt gga tac gtg gct gaa act ggc cgt ggt gtg gcc gac cgg 7164
Ser Val 2375 Gly Tyr Val Ala Glu 2380 Thr Gly Arg Gly Val 2385 Ala Asp Arg
ctc gct aga ata ggt tac aag cct atg cat gaa aag gac gtc atg 7209
Leu Ala 23 90 Arg Ile Gly Tyr Lys 2395 Pro Met His Glu Lys 2400 Asp Val Met
gat gtg ttg gag aag gca atc ctg tgt tct tcc cct caa ttt cca 7254
Asp Val 2405 Leu Glu Lys Ala Ile 2410 Leu Cys Ser Ser Pro 2415 Gin Phe Pro
112
PL 202 457 B1
tea cct CCC gca gct gtg gtt aca gga atc aac aca tcc ccg ggt 7299
Ser Pro Pro Ala Ala val Val Thr Gly Ile Asn Thr Ser Pro Gly
2420 2425 2430
gct cac tgg acc gag gca aac tgg ata cag gaa cag cgg ttt gtg 7344
Ala His Trp Thr Glu Ala Asn Trp Ile Gin Glu Gin Arg Phe Val
2435 2440 2445
gga ctt aaa tac cgc caa gtc ctt cat gca gac caa tcc ttt gtc 7389
Gly Leu Lys Tyr Arg Gin Val Leu His Ala Asp Gin Ser Phe Val
2450 2455 2460
tct teg cat aaa aaa gga cca gat ggc gtg cgg gcc caa eta age 7434
Ser Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gin Leu Ser
2465 2470 2475
agg gtc acc tct cac gac gag gcc att tct atc gtc ctc aaa gca 7479
Arg Val Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala
2480 2485 2490
atg acg gaa aag ctg atg ega atg ttt ggt ctg gca gaa gac gac 7524
Met Thr Glu Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp
2495 2500 2505
atg tcc teg tcc aaa aac ctg gca ggt gtc ggc gta gac tea ctc 7569
Met Ser Ser Ser Lys Asn Leu Ala Gly val Gly Val Asp Ser Leu
2510 2515 2520
gtc gcc att gaa ctt ega aac tgg atc aca tct gaa atc cat gtt 7614
Val Ala Ile Glu Leu Arg Asn Trp Ile Thr Ser Glu Ile His Val
2525 2530 2535
gat gtg teg atc ttt gag ctc atg aat ggt aac acc atc gcc ggc 7659
Asp Val Ser Ile Phe Glu Leu Met Asn Gly Asn Thr Ile Ala Gly
2540 2545 2550
ctc gtc gag tta gtt gtg gcg aaa tgc agt taa 7692
Leu Val Glu Leu Val Val Ala Lys Cys Ser
2555 2560
<210 = 46 <211= 2563 :212:
PRT <213= Penicillium citrinum <400= 46
Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr
Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
PL 202 457 B1
113
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro 35 40 45
Gin Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys 50 55 60
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly 65 70 75 go
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
90 95
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val 100 105 no
Ala Ser Cys Met Asp Pro Gin Tyr Arg Leu Met Leu Glu Val Val Tyr 115 120 125
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser 130 135 140
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gin Asp Ser 145 150 155 iso
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg 180 185 190
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala 195 200 205
Leu His Leu Ala Cys Gin Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala 210 215 220
Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr
225 230 235 240
Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu 260 265 270
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gin Asp Pro Ile Arg 275 280 285
Ala Val Ile Arg Glu Thr Ala Leu Asn Gin Asp Gly Lys Thr Pro Ala 290 295 300
Ile Thr Ala Pro Ser Asp Val Ala Gin Lys Ser Leu Ile Gin Glu Cys 305 310 315 320
114
PL 202 457 B1
Tyr Asp Lys Ala Gly 325 Leu Asp Met Ser Leu Thr 330 Ser Tyr Val Glu 335 Ala
His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350
Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365
Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380
Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe
385 390 395 400
Leu Gin Lys Asn Ser Lys Leu Met Leu Asp Gin Lys Asn Ile Lys Ile
405 410 415
Pro Met Ser Ala Gin Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430
Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445
Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gin Val His
450 455 460
Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gin
465 470 475 480
Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gin Ala Cys Arg Arg
485 490 495
Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510
Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525
Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540
Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gin Pro Lys Ara Ala Asn
545 550 555 560
Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gin Gly Ala Gin Trp
565 570 575
His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gin
580 585 590
Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gin Leu Gly Ala Ser Trp
595 600 605
PL 202 457 B1
115
Asn Phe 610 Met Glu Glu Leu His 615 Arg Asp Glu Leu Thr 620 Thr Arg Val Asn
Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gin Ile Ala Leu
625 630 635 640
Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655
His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670
Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685
Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700
Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gin Glu
705 710 715 720
Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gin Cys Ser Val Thr
725 730 735
Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750
Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765
Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780
Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr
785 790 795 800
Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815
Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830
Gin Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845
Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850 855 860
Gly Ala Leu Gly Gly Pro Ile Asn Gin Val Met Gin Asp Leu Gly Leu
865 870 875 880
Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895
116
PL 202 457 B1
Ser Leu Glu Thr Met 900 Tyr Arg Ala Ala 905 Thr Glu Leu Ile Ser Lys 910 Gly
Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly ' Arg Lys Glu
915 920 925
Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro > Trp Asn His
930 935 940
Gin Thr Arg Tyr Trp . Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gin
945 950 955 950
Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu . Ser Leu Ser
965 970 975
Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu . Ser Asp Ile
980 935 990
Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro G
995 1000 1005
Ala Gly Phe Ile Ser Met Ala Ile Glu Gly Phe Ser Gin Val Cys
1010 1015 1020
Pro Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu Arg Asp Val
102 5 1030 1035
Glu Leu Ala Gin Ala Leu Ile Ile Pro Ala Asp Ala Glu Ala Glu
1040 1045 1050
Val Asp Leu Arg Leu Thr Ile Arg Ser Cys Glu Glu Arg Ser Leu
1055 1060 1065
Gly Thr Lys Asn Trp His Gin Phe Ser Val His Ser Ile Ser Gly
1070 1075 1080
Glu Asn Asn Thr Trp Thr Glu His Cys Thr Gly Leu Ile Arg Ser
1035 1090 1095
Glu Ser Glu Arg Ser His Leu Asp Cys ser Thr Val Glu Ala Ser
1100 1105 1110
Arg Arg Leu Asn Leu Gly Ser Asp Asn Arg Ser Ile Asp Pro Asn
1115 1120 1125
Asp Leu Trp Glu Ser Leu His Ala Asn Gly Ile Cys His Gly Pro
1130 1135 114 0
Ile Phe Gin Asn Ile Gin Arg Ile Gin Asn Asn Gly Gin Gly Ser
1145 1150 1155
Phe Cys Arg Phe Ser Ile Ala Asp Thr Ala Ser Ala Met Pro His
1160 1165 1170
PL 202 457 B1
117
Ser Tyr Glu Asn Arg His 1175
Val Ile Gin Ala Ala Tyr 1190
Met Lys Thr Ala Met Val 1205
Ser Ser Ser Leu Ala Asp 1220
Gin Ala Ser Ile Lys Asp 1255
Leu Ala Val Phe Asp Asp 12 5 0
Gly ile Pro Val Ile Glu 1255
Gly Ser Ser Phe Ser Asp 1280
Asn Ala Cys Ser Ser Trp 1295
Asp Ser Thr Trp Leu Lys 1310
Lys Glu Thr Glu Leu Met 1325
Phe Ile Gin Glu Ala Val 1340
His Leu Asp Gly His Leu 1355
Gin Leu Asp Leu Ala Arg 1370
Asp Trp Leu Ser Asp Asp 1385
Arg Val Ala Gly Glu Ser 1400
Gly Pro Gin Leu Ile Ala
1415
Glu Leu Met Met Gin Asp 1430
Ile Val His Pro 1180
Thr Val Leu Pro 1195
Pro Arg Arg Leu 1210
Leu Glu Ala Gly 1225
Arg Asn Ser Gin 1240
Tyr Asp Ser Gly 1255
Ile Glu Gly Leu 1270
Gin Lys Ser Asp 1285
Val Trp Ala Pro 1300
Glu Lys Leu Ser 1315
Met Asp Leu Arg 1330
Thr Asp Leu Thr 1345
Gin Lys Tyr Phe 1360
Gin Asn Lys Leu 1375
Ala Glu Gin Lys 1390
Val Asn Gly Glu 1405
Met Leu Arg Arg 1420
Gin Leu Leu Ser 1435
Thr Thr Leu Asp Ser 1185
Tyr Ala Gly Thr Arg 1200
Arg Asn Val Lys Ile 1215
Asp Ala Leu Asp Ala 1230
Ser Phe Ser Thr Asp 1245
Ser Ser Pro Ser Asp 1250
Val Phe Gin Ser Val 1275
Ser Asn Asp Thr Glu 1290
Asp Ile Ser Leu Gly 1305
Thr Glu Ala Glu Thr 1320
Arg Cys Thr Ile Asn 1335
Asn ser Asp Ile Gin 1350
Asp Trp Met Asn Val 1355
Ser Pro Ala Ser Cys 1380
Lys Cys Leu Gin Ala 1395
Met Ile Ser Arg Leu 1410
Glu Thr Glu Pro Leu 1425
Arg Tyr Tyr Val Asn 1440
118
PL 202 457 B1
Ala Ile Lys 1445
Arg Leu Cys 1460
Gly Gly Gly 1475
Gly Asn Thr 1490
Ala Gly Phe 1505
Asp Val Met 1520
Gin Gin Gly 1535
Gin Val Leu 1550
Val Arg Lys 1565
Thr Thr Arg 1580
Pro Gly Trp 1595
Ser Leu Thr 1610
Phe Asn Gly 1625
Phe Tyr Met 1640
Thr Thr Pro 1655
Gly Ala Leu 1670
Ala Ile Cys 1685
Gly Glu Val 1700
Trp
Ala
Thr
Lys
Phe
Thr
Phe
His
Leu
Asp
Trp
Thr
Val
Ile
Asp
Arg
Glu
Asp
Ser
His
Gly
Pro
Glu
Phe
Glu
Ala
Leu
Gin
Leu
Asp
Glu
Ser
Thr
Pro
Lys
Thr
Arg
Lys
Gly
Ile
Ser
Lys
Cys
Thr
Lys
Leu
Ser
Leu
Leu
Thr
Val
Pro
Thr
Thr
Ser Asn Ala Gin 1450
Asn Pro Arg Ser 1465
Cys Thr Lys Leu 1430
Asp Arg Tyr Asp 1495
Ala Arg Glu Gin 1510
Lys Leu Asp Ile 1525
Ala Thr Tyr Asp 1540
Arg Cys Met Lys 1555
Pro Gly Gly Asn 1570
Asp Leu Phe Phe 1585
Glu Glu Pro Glu 1600
Trp Asn Thr Met 1615
Glu Val Arg Asp 1630
Met Leu Ser Thr 1645
Ala Glu Ser Glu 1660
Ser Ser Trp Leu 1675
Ser Ser Ser Pro 1690
Gly Arg Thr Cys 1705
Ala Ser Glu Leu Ile 1455
Arg Ile Leu Glu Ile 1470
Ile Val Asn Ala Leu 1485
Phe Thr Asp Val Ser 1500
Phe Ala Asp Trp Gin 1515
Glu Ser Asp Pro Glu 1530
Val Val Val Ala Cys 1545
Arg Thr Leu Ser Asn 1560
Leu Ile Leu Val Glu 1575
Thr Phe Gly Leu Leu 1590
Arg Lys Ser Thr Pro 1605
Leu Asp Thr Ser Gly 1620
Cys Glu Asp Asp Glu 1635
Ala Arg Lys Glu Asn 1650
Val Leu Leu Leu His 1665
Glu Ser Leu Gin Ala 1680
Ser Ile Asn Ala Leu 1695
Ile Phe Leu Gly Glu 1710
PL 202 457 B1
119
Met Glu 1715 Ser Ser Leu Leu Gly 1720 Glu Val Gly Ser Glu 1725 Thr Phe Lys
Ser Ile 1730 Thr Ala Met Leu Asn 1735 Asn Cys Asn Ala Leu 1740 Leu Trp Val
Ser Arg 1745 Gly Ala Ala Met Ser 1750 Ser Glu Asp Pro Trp 1755 Lys Ala Leu
His Ile 1760 Gly Leu Leu Arg Thr 1765 Ile Arg Asn Glu Asn 1770 Asn Gly Lys
Glu Tyr 1775 Val Ser Leu Asp Leu 1780 Asp Pro Ser Arg Asn 1785 Ala Tyr Thr
His Glu 1790 Ser Leu Tyr Ala ile 1795 Cys Asn Ile Phe Asn 1800 Gly Arg Leu
Gly Asp 1805 Leu Ser Glu Asp Lys 1810 Glu Phe Glu Phe Ala 1815 Glu Arg Asn
Gly Val 1820 Ile His Val Pro Arg 1825 Leu Phe Asn Asp Pro 1830 His Trp Lys
Asp Gin 1835 Glu Ala Val Glu Val 1840 Thr Leu Gin Pro Phe 1845 Glu Gin Pro
Gly Arg 1850 Arg Leu Arg Met Glu 1855 Val Glu Thr Pro Gly 1860 Leu Leu Asp
Ser Leu 1865 Gin Phe Arg Asp Asp 1870 Glu Gly Arg Glu Gly 1875 Lys Asp Leu
Pro Asp 1880 Asp Trp Val Glu Ile 1885 Glu Pro Lys Ala Phe 1890 Gly Leu Asn
Phe Arg 1895 Asp Val Met Val Ala 1900 Met Gly Gin Leu Glu 1905 Ala Asn Arg
Val Met 1910 Gly Phe Glu Cys Ala 1915 Gly Val Ile Thr Lys 1920 Leu Gly Gly
Ala Ala 1925 Ala Ala Ser Gin Gly 1930 Leu Arg Leu Gly Asp 1935 Arg Val Cys
Ala Leu 1940 Leu Lys Gly His Trp 1945 Ala Thr Arg Thr Gin 1950 Thr Pro Tyr
Thr Asn 1955 Val Val Arg Ile Pro 1960 Asp Glu Met Gly Phe 1965 Pro Glu Ala
Ala Ser 1970 Val Pro Leu Ala Phe 1975 Thr Thr Ala Tyr Ile 1980 Ala Leu Tyr
120
PL 202 457 B1
Thr Thr Ala Lys Leu 1985
Gly Ala Gly Gly Val 2000
Ala Gly Ala Glu Val 2015
Asp Phe Val Gly Asp 2030
Ser Ser Arg Asn Asp
2045
Gly Gly Leu Gly Val 2060
Leu Leu Gin Ala Ser 2075
Val Glu Ile Gly Lys 2090
Met Leu Pro Phe Thr 2105
Leu Ser Trp Gin Arg 212 0
Asn His Val Thr Lys 2135
Gly Pro Ile Gin Gin 2150
Arg Thr Met Gin Ser 2165
Val Ser Gly Asp Glu 2180
Leu Lys Leu Lys Pro 2195
Gly Gly Ile Gly Lys 2210
Ala Lys His Leu Ile 2225
Phe Ile Thr Ser Leu 2240
Arg
Gly
Phe
Lys
Leu
His
Phe
Lys
Arg
Ala
Leu
His
Gly
Leu
Asp
Gin
Ile
Gin
Arg Gly Glu Arg 1990
Gin Ala Ala Ile 2005
Val Thr Ala Gly 2020
Phe Gly Ile Asn 2035
Phe Val Asp Gly 2050
Val Val Leu Asn 2055
Asp Cys Met Ala 2080
Asp Leu Glu Gin 2095
Asp Val Ser Phe 2110
Lys Ser Glu Glu 2125
Leu Glu Thr Lys 2140
Ser Leu Ser Asn 2155
Gin His Val Gly 2170
Val Pro Val Gly 2185
Ser Ser Tyr Leu 2200
Ile Cys Gin Trp 2215
Leu Ser Arg Ser 2230
Asn Gin Gin Cys 2245
Val Leu Ile His Ser 1995
Ile Leu Ser Gin Leu 2010
Thr Gin Ala Lys Arg 2025
Pro Asp His Ile Phe 2040
Ile Lys Ala Tyr Thr 2055
Ser Leu Ala Gly Gin 2070
Glu Phe Gly Arg Phe 2085
Asn Ser Arg Leu Asp 2100
Thr Ser Ile Asp Leu 2115
Val Ser Glu Ala Leu 2130
Ala Ile Gly Leu Ile 2145
Ile Glu Lys Ala Phe 2160
Lys Val Val Val Asn 2175
Asp Gly Gly Phe Ser 2190
Val Ala Gly Gly Leu 2205
Leu Val Asp His Gly 2220
Ala Lys Ala Ser Pro 2235
Ala Val Tyr Leu His 2250
PL 202 457 B1
121
Ala Cys 2255 Asp ile Ser Asp Gin 2260 Asp Gin Val Thr Lys 2265 Val Leu Arg
Leu Cys Glu Glu Ala His Ala Pro Pro Ile Arg Gly Ile ile Gin
2270 2275 2280
Gly Ala Met Val Leu Lys Asp Ala Leu Leu Ser Arg Met Thr Leu
2285 2290 2295
Asp Glu Phe Asn Ala Ala Thr Arg Pro Lys Val Gin Gly Ser Trp
2300 2305 2310
Tyr Leu His Lys Ile Ala Gin Asp Val Asp Phe Phe Val Met Leu
2315 2320 2325
Ser Ser Leu Val Gly Val Met Gly Gly Ala Gly Gin Ala Asn Tyr
2330 2335 2340
Ala Ala Ala Gly Ala Phe Gin Asp Ala Leu Ala His His Arg Arg
2345 2350 2355
Ala His Gly Met Pro Ala Val Thr Ile Asp Leu Gly Met Val Lys
23S0 2365 2370
Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly Val Ala Asp Arg
2375 2380 2385
Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys Asp Val Met
23 90 2395 2400
Asp Val Leu Glu Lys Ala Ile Leu Cys Ser Ser Pro Gin Phe Pro
2405 2410 2415
Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro Gly
2420 2425 2430
Ala His Trp Thr Glu Ala Asn Trp Ile Gin Glu Gin Arg Phe Val
2435 2440 2445
Gly Leu Lys Tyr Arg Gin Val Leu His Ala Asp Gin Ser Phe Val
2450 2455 2460
Ser Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gin Leu Ser
2465 2470 2475
Arg Val Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala
24 80 2485 2490
Met Thr Glu Lys Leu Met Arg Met phe Gly Leu Ala Glu Asp Asp
2495 2500 2505
Met Ser Ser Ser Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu
2510 2515 2520
122
PL 202 457 B1
<220>
<221» CDS <222 > (1),. (1557) <400> 47
atg Met 1 ctc Leu ggc Gly cag Gin gtt Val 5 Ctt Leu ctg Leu acc Thr gtc Val gaa Glu 10 teg Ser tac Tyr caa Gin tgg Trp gta Val 15 teg Ser 48
acc cct caa gcc ctt gtg gcg gtc gca gtg ctt ctt agt ctc atc gcc 96
Thr Pro Gin Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30
tac cgt ttg cgg ggg cgc cag tcc gaa ctg caa gtc tat aat ccc aaa 144
Tyr Arg Leu Arg Gly Arg Gin Ser Glu Leu Gin Val Tyr Asn Pro Lys
35 40 45
aaa tgg tgg gag ttg acg acc atg agg gct agg cag gac ttc gat acg 192
Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gin Asp Phe Asp Thr
50 55 60
tat ggt ccg agc tgg atc gaa gct tgg ttc teg aaa aac gac aag ccc 240
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
65 70 75 80
ctg cgc ttc att gtt gat tcc ggc tat tgc acc atc ctc cca teg tcc 288
Leu Arg Phe ile Val Asp Ser Gly Tyr Gys Thr Ile Leu Pro Ser Ser
85 90 95
atg gcc gac gag ttt cgg aaa atc aaa gat atg tgc atg tac aag ttt 336
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110
ttg gcg gat gac ttt cac tct cat ctc cct gga ttc gac ggg ttc aag 384
Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
115 120 125
PL 202 457 B1
123
gaa Glu atc Ile 130 tgc Cys cag Gin gat Asp gca Ala cat His 135 ctt Leu gtc val aac Asn aaa Lys gtt Val 14 0 gtt Val ttg Leu aac Asn cag Gin 432
tta caa acc caa gcc ccc aag tac aca aag cca ttg gct acc ttg gcc 480
Leu Gin Thr Gin Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala
14 5 150 155 160
gac gct act att gcc aag ttg ttc ggt aaa age gag gag tgg caa acc 528
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gin Thr
165 170 175
gca cct gtc tat tcc aat gga ttg gac ctt gtc aca ega aca gtc aca 576
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190
ctc att atg gtc ggc gac aaa atc tgc cac aat gag gag tgg ctg gat 624
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205
att gca aag aac cat gcc gtg agt gtg gcg gta caa gct cgc caa ctt 672
Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gin Ala Arg Gin Leu
210 215 220
cgc gta tgg ccc atg eta ctg ega ccg ctc gct cac tgg ttt caa ccg 720
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gin Pro
225 230 235 240
caa gga cgc aaa ttg cgt gac caa gtg cgc cgc gca ega aag atc att 768
Gl n Gly Arg Lys Leu Arg Asp Gin Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
gat cct gag att cag ega ega cgt gct gaa aag gcc gca tgt gta gcg 816
Asp Pro Glu Ile Gin Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270
aag ggc gtg cag ccg ccc cag tac gtc gat acc atg caa tgg ttt gaa 864
Lys Gly Val Gin Pro Pro Gin Tyr Val Asp Thr Met Gin Trp Phe Glu
275 280 285
gac acc gcc gac ggc cgc tgg tac gat gtg gcg ggt gct cag ctc gct 912
Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gin Leu Ala
290 295 300
atg gat ttc gcc ggc atc tac gcc teg acg gat ctt ttc gtc ggt gcc 960
Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala
305 310 315 320
ctt gtg gac att gcc agg cac cca gac ctt att cag cct ctc cgc caa 1008
Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gin Pro Leu Arg Gin
325 330 335
124
PL 202 457 B1
gag Glu atc Ile cgc Arg act Thr 340 gta val atc Ile gga Gly gaa Glu ggg Gly 345 ggc Gly tgg Trp acg Thr cct Pro gcc Ala 350 tct Ser ctg Leu 1056
ttc aag ctg aag ctc ctc gac agc tgc atg aaa gag acg cag ega atc 1104
Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gin Arg Ile
355 360 365
aag ccg gtc gag tgc gcc act atg cgc agt acc get ctc aga gac atc 1152
Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380
act eta tcc aat ggc ctc ttc att ccc aag ggc gag ttg gcc get gtg 1200
Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val
385 390 395 400
get gca gac cgc atg aac aac cct gat gtg tgg gaa aac ccc gaa aat 1248
Al a Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415
tat gat ccc tac ega ttt atg cgc atg cgc gag gat cca gac aag gcc 1296
Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430
ttc acc get caa ttg gag aat acc aac ggt gat cac atc ggc ttc ggc 1344
Phe Thr Ala Gin Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445
tgg aac cca cgc get tgt ccc ggg cgg ttc ttc gcc teg aag gaa atc 1392
Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460
aag att ctc ctc get cat ata ctg att cag tat gat gtg aag cct gta 1440
Lys I Le Leu Leu Ala Hi s Ile Leu Ile Gin Tyr Asp Val Lys Pro val
4S5 470 475 480
cca gga gac gat gac cl cl cl tac tac cgt cac get ttt agc gtt cgt atg 1488
Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 495
cat cca acc aca aag ctc atg gta cgc cgg cgc aac gag gac atc ccg 1536
His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510
ctc cct cat gac cgg tgc taa 1557
Leu Pro His Asp Arg Cys
515 <210> 48 <211> 518 <212> PRT <213> Penicillium citrinum
PL 202 457 B1
125 <400> 48
Met Leu Gly Gin Val Leu Leu Thr Val Glu Ser Tyr Gin Trp Val Ser 15 10 15
Thr Pro Gin Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala 20 25 30
Tyr Arg Leu Arg Gly Arg Gin Ser Glu Leu Gin Val Tyr Asn Pro Lys 35 40 45
Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gin Asp Phe Asp Thr '50 55 60
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
70 75 80
Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
90 95
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe 100 105 110
Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys 115 120 125
Glu Ile Cys Gin Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gin 130 135 140
Leu Gin Thr Gin Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala
145 150 155 160
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gin Thr
165 170 175
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr 180 185 190
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp 195 200 205
Tle Ala Lys Asn His Ala Val Ser Val Ala Val Gin Ala Arg Gin Leu 210 215 220
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gin Pro
225 230 235 240
Gin Gly Arg Lys Leu Arg Asp Gin Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
Asp Pro Glu Ile Gin Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala 260 265 270
126
PL 202 457 B1
Glu
Ala
Ala
320
Gin
Leu
Ile
Ile
Val
400
Asn
Ala
Gly
Ile
Val
480
Met
Pro
PL 202 457 B1
127 <22 O >
<221? CDS <222> (1) . . (3522) <400> 49
atg Met 1 gtc Val gct Ala teg Ser ttg Leu 5 eta Leu ccc Pro tct Ser cgc Arg ttt Phe 10 cgc Arg ggt Gly agg Arg gaa Glu tea Ser 15 atg Met 48
aat cag cag cac cct eta cgc teg gga aat cgg gca ttg acc tcc aca 96
Asn Gin Gin His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
20 25 30
ctc caa ttt eta tcc aaa acg gcg tgt eta cac ccg atc cat acc gtt 144
Leu Gin Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
35 40 45
tgc acc ata gct att eta gct agt acc aca tac gtt gga eta ctc aaa 192
Cy s Thr ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60
gac agc ttc ttc cat ggc ccc gca aac gtt gat aaa gca gaa tgg ggc 240
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
55 70 75 80
tct ttg gtc gaa gga agt ega agc ttg atc acc ggc cca cag aat ggc 288
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gin Asn Gly
85 90 95
tgg aag tgg cag agc ttc gac ggg gat gca gat gtt ctc gga gat ttc 336
Trp Lys Trp Gin Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110
aac cat caa gca eta atg acc ttg gta ttc ccg ggg tea tat ggg gtt 3 84
Asn His Gin Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125
gca tct caa gca gcc tea cca ttc ctt gct CCC ctc cct gtg aac eta 432
Ala Ser Gin Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 14 0
tct gtg att gac ctt ccc tea acg teg agc CCt tta acc gcc tat teg 480
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
aaa gat aaa gtt ttc gcc ttc tct gtg gaa tac agc agc gcg ccg gaa 528
Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175
ctc gtg gct gct gtt caa gaa atc ccc aac aac agt gcc gac ctg aaa 576
Leu Val Ala Ala Val Gin Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
180 185 190
128
PL 202 457 B1
ttg Leu cag Gin gag Glu 195 acg Thr caa Gin ttg Leu atc Ile gag Glu 200 atg Met gaa Glu cgc Arg cag Gin atg Met 205 tgg Trp atc Ile atg Met 624
aag gct gcc agg gct cac aca aaa cgc agc ctt gct caa tgg gtg cac 672
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gin Trp Val His
210 215 220
gat acc tgg aca gag tet ctt gat ctt atc aag agc gct caa acg ctc 720
Asp Thr Trp Thr Glu Ser Leu Asp Leu ile Lys Ser Ala Gin Thr Leu
225 230 235 240
gac gtg gtt gtc atg gtg eta ggt tat ata tca atg cac ttg act ttc 768
Asp Val val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255
gtc tca ctc ttc ctc agc atg aaa aaa ttg gga teg aag gtt tgg ctg 816
Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
260 255 270
gct aca agc gtc ctt ttg teg tca aca ttt gcc ttt ctc ctc ggt ctc 864
Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
275 280 285
gac gtg gcc ata aga eta ggg gtt ccg atg agc atg agg ttg eta tcc 912
Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290 295 300
gaa ggc ctc ccc ttc ttg gtg gtg atc gtt ggc ttt gag aag agc atc 960
Glu Gly Leu Pro Phe Leu Val val ile Val Gly Phe Glu Lys Ser Ile
305 310 315 320
act ctg acc agg gct gtt ttg tcc tat gct gtg cag cac ega aag ccc 1008
Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gin His Arg Lys Pro
325 330 335
cag aag ata cag tet gac cag ggt agc gtg aca gcc att gct gaa agt 1056
Gin Lys Ile Gin Ser Asp Gin Gly Ser Val Thr Ala Ile Ala Glu Ser
340 345 350
acc atc aat tac gcc gta ega agc gcc att cgg gag aag ggt tac aat 1104
Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
355 360 365
atc gtg tgc cac tac gtg gtc gag atc ctg ctc eta gtt atc ggt gct 1152
Ile Val cys His Tyr val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370 375 380
gtc tta ggc atc caa ggt ggg eta cag cac ttc tgt gtt eta gct gca 12 00
Val Leu Gly Ile Gin Gly Gly Leu Gin His Phe Cys Val Leu Ala Ala
385 390 395 400
PL 202 457 B1
129
ttg Leu atc Ile ctg Leu ttc Phe ttt Phe 405 gac Asp tgt Cys ctg Leu ctg Leu ctg Leu 410 ttt Phe aca Thr ttc Phe tac Tyr act Thr 415 gcg Ala 1248
att ctg tct atc aag ctc gag gta aac cgc ctc aaa cgt cat atc aac 1296
Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
420 425 430
atg cgg tac gcg ttg gaa gat gag ggt ctc agt cag cgg acg gcg gag 1344
Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gin Arg Thr Ala Glu
435 440 445
agt gtc gcg acc agc aat gat gcc caa gac agt gca cgt aca tat ctg 1392
Ser Val Ala Thr Ser Asn Asp Ala Gin Asp Ser Ala Arg Thr Tyr Leu
450 455 460
ttt ggc aat gat atg aaa ggc agc agt gtt ccg aag ttc aaa ttc tgg 1440
Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp
465 470 475 480
atg gtc gtt ggt ttc ctt atc gtc aac ctc gtc aac atc ggc tcc acc 1480
Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 495
ctt ttc caa gcc tct tct agt gga tcg ttg tcc agt ata tca tct tgg 1536
Leu Phe Gin Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510
acc gaa agt ctg agc gga tcg gcc att aaa ccc ccg ctt gag ccc ttc 1584
Ttir Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
515 520 525
aag gta gct gga agt gga eta gat gaa eta ctt ttc cag gca aga ggg 1632
Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gin Ala Arg Gly
530 535 540
cgc ggt caa tcg act atg gtc act gtc ctc gcc ccc atc aag tac gaa 1680
Arg Gly Gin Ser Thr Met val Thr Val Leu Ala Pro Ile Lys Tyr Glu
545 550 555 560
eta gag tat cct tcc att cac cgt ggt acc tcg cag eta cac Sag tat 172 8
Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gin Leu His Glu Tyr
565 570 575
gga gtt ggt gga aaa atg gtc ggt agc ctg ctc acc agc ctg gaa gat 1776
Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590
ccc gtc ctc tcc aaa tgg gtg ttt gtg gca ctt gcc eta agt gtc gct 1824
Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605
130
PL 202 457 B1
ctg Leu aac Asn 610 agc Ser tat Tyir ctg Leu ttc Phe aag Lys 615 gcc Ala gcc Ala aga Arg ctg Leu gga Gly 620 atc Ile aaa Lys gat Asp cct Pro 1872
aat ctc ccg agt cac cca gtt gat cca gtt gag Ctt gac cag gcc gaa 1920
Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gin Ala Glu
625 630 635 640
agc ttc aac gct gcc cag aac cag acc cct cag att caa tca agt ctc 1968
Ser Phe Asn Al a Ala Gin Asn Gin Thr Pro Gin Ile Gin Ser Ser Leu
645 650 655
caa gct cct cag acc aga gtg ttc act cct acc acc acc gac agt gac 2016
Gin Ala Pro Gin Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser AS?
660 665 670
agt gat gcc tca tta gtc tta att aaa gca tct cta aag gtc act aag 2064
Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
675 630 685
ega gca gaa gga aag aca gcc act agt gaa ctt ccc gtg tct cgc aca 2112
Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700
caa atc gaa ctg gac aat ttg ctg aag cag aac aca atc agc gag ttg 2160
Gin Ile Glu Leu Asp Asn Leu Leu Lys Gin Asn Thr Ile Ser Glu Leu
705 710 715 720
aac gat gag gat gtc gtt gcc ttg tct ttg cgg gga aag gtt ccc 999 2208
Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys val Pro Gly
725 730 735
tat gcc cta gag aag agt ctc aaa gac tgc act cgt gcc gtc aag gtt 2256
Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750
cgc cgc tct atc att teg agg aca ccg gct acc gca gag ctt aca agt 2304
Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765
atg ctg gag cac teg aag ctg ccg tac gaa aac tac gcc tgg gaa cgc 2352
Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780
gtg ctc ggt gca tgt tgc gag aac gtt att ggc tat atg cca gtc cct 2400
Vai Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro
785 790 795 800
gtt ggc gtc gcc ggt cct att gtt atc gac ggc aag agt tat ttc att 2448
Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815
PL 202 457 B1
131
cct Pro atg Met gca Ala acc Thr 820 acc Thr gag Glu ggc Gly gtc Val ctc Leu 825 gtc Val gct Ala agt Ser gct Ala agc Ser 830 cgt Arg ggc Gly 2496
agt aag gca atc aac ctc ggt ggc ggt gcc gtg aca gtc ctg act ggc 2544
Ser Lys Ala 835 Ile Asn Leu Gly Gly 840 Gly Ala Val Thr Val 845 Leu Thr Gly
gac ggt atg aca ega ggc ccg tgt gtg aag ttt gat gtc ctt gaa ega 2592
Asp Gly 850 Met Thr Arg Gly Pro 855 Cys Val Lys Phe Asp 860 Val Leu Glu Arg
gct ggt gct gct aag atc tgg ctc gat tcg gac gtc ggc cag acc gta 2640
Ala 865 Gly Ala Ala Lys Ile 870 Trp Leu Asp Ser Asp 875 Val Gly Gin Thr Val 880
atg aaa gaa gcc ttc aat tca acc agc aga ttt gcg cgc tta caa agt 2688
Met Lys Glu Ala Phe Θ85 Asn Ser Thr Ser Arg 890 Phe Ala Arg Leu Gin 895 Ser
atg cgg aca act atc gcc ggt act cac tta tat att ega ttt aag act 2736
Met Arg Thr Thr 900 Ile Ala Gly Thr His 905 Leu Tyr Ile Arg Phe 910 Lys Thr
act act ggc gac gct atg gga atg aat atg att tct aag ggc gtg gag 2784
Thr Thr Gly 915 Asp Ala Met Gly Met 920 Asn Met Ile Ser Lys 925 Gly Val Glu
cat gca ctg aat gtt atg gcg aca gag gca ggt ttc agc gat atg aat 2 832
His Ala 930 Leu Asn Val Met Ala 935 Thr Glu Ala Gly Phe 940 Ser Asp Met Asn
att att acc eta tca gga aat tac tgt acg gat aag aaa cct tca gct 2880
Ile 945 Ile Thr Leu Ser Gly 950 Asn Tyr Cys Thr Asp 955 Lys Lys Pro Ser Ala 960
ttg aat tgg atc gat gga cgg ggc aag ggc att gtg gcc gaa gcc atc 2928
Leu Asn Trp Ile Asp 965 Gly Arg Gly Lys Gly 970 Ile Val Ala Glu Ala 975 Ile
ata ccg gcg aac gtt gtc agg gat gtc tta aag agc gat gtg gat agc 2976
Ile Pro Ala Asn 980 Val Val Arg Asp Val 985 Leu Lys Ser Asp Val 990 Asp Ser
atg gtt cag ctc aac ata tcg aaa aat ctg att ggg tcc gct atg gct 3024
Met Val Gin Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala
995 1000 1005 ggc tca gtt ggc ggc ttc aac gcc caa gct gcc aat ctt gcg gca 3069
Gly Ser Val Gly Gly Phe Asn Ala Gin Ala Ala Asn Leu Ala Ala
1010 1015 1020
132
PL 202 457 B1
gcc Ala att Ile 1025 ttc Phe att Ile gcc Ala aca Thr ggt Gly 1030 cag Gin gat Asp ccg Pro gcg Ala caa Gin 1035 gtt Val gtg val gag Glu 3114
agc gct aac tgc atc act ctc atg aac aat ctt cgc gga teg ctt 3159
Ser Ala 1040 Asn Cys Ile Thr Leu 1045 Met Asn Asn Leu Arg 1050 Gly Ser Leu
caa atc tct gtc tcc atg ccg tct att gag gtt gga acg ttg ggc 3204
Gin Ile 1055 Ser Val Ser Met Pro 1060 Ser Ile Glu Val Gly 1065 Thr Leu Gly
ggt ggt acg att ctg gag ccc cag ggc gca atg ctt gac atg ctt 3249
Gly Gly 1070 Thr Ile Leu Glu Pro 1075 Gin Gly Ala Met Leu 1080 Asp Met Leu
ggt gtc cgc gga tea cac ccg acc act ccc ggt gag aat gca cgt 3294
Gly Val 1085 Arg Gly Ser His Pro 1090 Thr Thr Pro Gly Glu 1095 Asn Ala Arg
caa ctt gcg cgc atc atc gga agc gct gtt ttg gct ggg gag ctc 3339
Gin Leu 1100 Ala Arg Ile Ile Gly 1105 Ser Ala Val Leu Ala 1110 Gly Glu Leu
teg eta tgt gct gcc eta gcc gcc ggt cac ctg gtc aag gcg cac 3384
Ser Leu 1115 Cys Ala Ala Leu Ala 1120 Ala Giy His Leu Val 1125 Lys Ala His
atg gcg cac aac cgt tct gcc ccg gca tct tea gcc cct tct ega 3429
Met Ala 1130 His Asn Arg Ser Ala 1135 Pro Ala Ser Ser Ala 1140 Pro Ser Arg
agt gtc tcc ccg tea ggt gga acc agg aca gtc cct gtt cct aac 3474
Ser Val 1145 Ser Pro Ser Gly Gly 1150 Thr Arg Thr Val Pro 1155 Val Pro Asn
aat gca ctg agg ccg agt gct gca gct act gat cgg gct ega cgc 3519
Asn Ala 1160 Leu Arg Pro Ser Ala 1165 Ala Ala Thr Asp Arg 1170 Ala Arg Arg
c9a 3522 <210? 50 <211? 1173 <212? PRT <213? Penicillium citrinum <400? 50
Met Val Aia Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met
10 15
PL 202 457 B1
133
Asn Gin Gin His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr 20 25 30
Leu Gin Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val 35 40 45
Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys 50 55 60
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
70 75 SO
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gin Asn Gly
90 95
Trp Lys Trp Gin Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe 100 105 110
Asn His Gin Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val 115 120 125
Ala Ser Gin Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu 130 135 140
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175
Leu Val Ala Ala Val Gin Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys 180 185 190
Leu Gin Glu Thr Gin Leu Ile Glu Met Glu Arg Gin Met Trp Ile Met 195 200 205
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gin Trp Val His 210 215 220
Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gin Thr Leu
225 230 235 240
Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255
Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu 260 265 270
Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu 275 280 285
Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser 290 295 300
134
PL 202 457 B1
Glu Gly Leu Pro Phe Leu 305 310
Thr Leu Thr Arg Ala Val 325
Gin Lys Ile Gin Ser Asp 340
Thr Ile Asn Tyr Ala Val 3 55
Ile Val Cys His Tyr Val 370
Val Leu Gly Ile Gin Gly 385 390
Leu Ile Leu Phe Phe Asp 405
Ile Leu Ser Ile Lys Leu 420
Met Arg Tyr Ala Leu Glu 435
Ser Val Ala Thr Ser Asn 450
Phe Gly Asn Asp Met Lys 465 470
Met Val Val Gly Phe Leu 485
Leu Phe Gin Ala Ser Ser 500
Thr Glu Ser Leu Ser Gly 515
Lys Val Ala Gly Ser Gly 530
Arg Gly Gin Ser Thr Met 545 550
Leu Glu Tyr Pro Ser Ile 565
Gly Val Gly Gly Lys Met 580
Val Val Ile Val
Leu Ser Tyr Ala 330
Gin Gly Ser Val 345
Arg Ser Ala Ile 360
Val Glu Ile Leu 375
Gly Leu Gin His
Cys Leu Leu Leu 410
Glu Val Asn Arg 425
Asp Glu Gly Leu 440
Asp Ala Gin Asp 455
Gly Ser Ser Val
Ile Val Asn Leu 490
Ser Gly Ser Leu 505
Ser Ala Ile Lys 520
Leu Asp Glu Leu 535
Val Thr Val Leu
His Arg Gly Thr 570
Val Gly Ser Leu 585
Gly Phe Glu Lys Ser Ile 315 320
Val Gin His Arg Lys Pro 335
Thr Ala Ile Ala Glu Ser 350
Arg Glu Lys Gly Tyr Asn 365
Leu Leu Val Ile Gly Ala 380
Phe Cys Val Leu Ala Ala 395 400
Phe Thr Phe Tyr Thr Ala 415
Leu Lys Arg His Ile Asn 430
Ser Gin Arg Thr Ala Glu 445
Ser Ala Arg Thr Tyr Leu 460
Pro Lys Phe Lys Phe Trp 475 480
Val Asn Ile Gly Ser Thr 495
Ser Ser Ile Ser Ser Trp 510
Pro Pro Leu Glu Pro Phe 525
Leu Phe Gin Ala Arg Gly 540
Ala Pro ile Lys Tyr Glu 555 560
Ser Gin Leu His Glu Tyr 575
Leu Thr Ser Leu Glu Asp 590
PL 202 457 B1
135
Pro fal Leu 595 Ser Lys Trp fal Phe 600 Val Ala Leu Ala Leu 605 Ser fal Ala
Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620
Asn Leu Pro Ser His Pro fal Asp Pro Val Glu Leu Asp Gin Ala Glu
625 630 635 640
Ser Phe Asn Ala Ala Gin Asn Gin Thr Pro Gin Ile Gin Ser Ser Leu
645 650 655
Gl n Ala Pro Gin Thr Arg fal Phe Thr Pro Thr Thr Thr Asp Ser Asp
6S0 665 670
Ser Asp Ala Ser Leu fal Leu Ile Lys Ala Ser Leu Lys fal Thr Lys
675 680 685
Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700
Gin Ile Glu Leu Asp Asn Leu Leu Lys Gin Asn Thr Ile Ser Glu Leu
705 710 715 720
Asn Asp Glu Asp Val fal Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735
Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala fal Lys fal
740 745 750
Arg Arg Ser Ile ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765
Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780
fal Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro fal Pro
785 790 795 800
fal Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815
Pro Met Ala Thr Thr Glu Gly Val Leu val Ala Ser Ala Ser Arg Gly
820 825 830
Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr fal Leu Thr Gly
835 840 845
Asp Gly Met Thr Arg Gly Pro Cys fal Lys Phe Asp fal Leu Glu Arg
850 855 860
A-l a Gly Ala Ala Lys ile Trp Leu Asp Ser Asp Val Gly Gin Thr Val
865 870 875 880
136
PL 202 457 B1
Met Lys Glu Ala Phe 885 Asn Ser Thr Ser Arg 890 Phe Ala Arg Leu Gin 895 Ser
Met Arg Thr Thr 900 Ile Ala Gly Thr His 905 Leu Tyr Ile Arg Phe 910 Lys Thr
Thr Thr Gly 915 Asp Ala Met Gly Met 92 0 Asn Met Ile Ser Lys 925 Gly Val Glu
His Ala 930 Leu Asn Val Met Ala 935 Thr Glu Ala Gly Phe 940 Ser Asp Met Asn
Ile 945 ile Thr Leu Ser Gly 950 Asn Tyr Cys Thr Asp 955 Lys Lys Pro Ser Ala 960
Leu Asn Trp Ile Asp 965 Gly Arg Gly Lys Gly 970 Ile Val Ala Glu Ala 975 Ile
Tle Pro Ala Asn 980 Val Val Arg Asp Val 985 Leu Lys Ser Asp Val 990 Asp Ser
Met
Gly
Ala
Ser
Gin
Gly
Gly
Gin
Ser
Met
Ser
Val Gin Leu Asn Ile I 995
Ser val Gly Gly Phe 1010
Ile Phe Ile Ala Thr 1025
Ala Asn Cys Ile Thr 1040
Ile Ser Val Ser Met 1055
Gly Thr Ile Leu Glu 1070
Vai Arg Gly Ser His 1085
Leu Ala Arg Ile Ile 1100
Leu Cys Ala Ala Leu
1115
Ala His Asn Arg Ser
1130
Val Ser Pro Ser Gly 1145 ier Lys Asn Leu Ile 1000
Asn Ala Gin Ala Ala 1015
Gly Gin Asp Pro Ala 1030
Leu Met Asn Asn Leu 1045
Pro Ser Ile Glu Val 1060
Pro Gin Gly Ala Met 1075
Pro Thr Thr Pro Gly 1090
Gly Ser Ala Val Leu 1105
Ala Ala Gly His Leu 1120
Ala Pro Ala Ser Ser 1135
Gly Thr Arg Thr Val 1150
Gly Ser Ala Met Ala 1005
Asn Leu Ala Ala 1020
Gin Val Val Glu 1035
Arg Gly Ser Leu 1050
Gly Thr Leu Gly 1065
Leu Asp Met Leu 1080
Glu Asn Ala Arg 1095
Ala Gly Glu Leu 1110
Val Lys Ala His 1125
Ala Pro Ser Arg 1140
Pro Val Pro Asn 1155
PL 202 457 B1
137
Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr Asp Arg Ala Arg Arg 1160 1165 1170 <210? 51 <211> 20 <212? DNA <213? Penicillium citrinum <400? 51 gcaagctctg ctaccagcac <2105 52 <211? 20 <212? DNA <213? Penicillium citrinum <400? 52 ctaggccaac btcagagccg <210? 53 <211? 20 <212? DNA <213? Penicillium citrinum <400? 53 agtcatgcag gatctgggtc <210? 54 <211? 20 <212? DNA <213? Penicillium citrinum <4C0> 54 gcagacacat cggtgaagtc <210? 55 <211? 20 <212? DNA <213? Penicillium citrinum <400? 55 aaaccgcacc tgtctattcc <210? 56 <211? 20 < 212 > DNA <213? Penicillium citrinum <400? 56 ctttgtggtt ggatgcatac <210? 57 <211? 20
138
PL 202 457 B1
PL 202 457 B1
139

Claims (31)

1. Polinukleotyd przyspieszają cy biosyntez ę ML-236B, wybrany z grupy zł o ż onej z:
(a) polinukleotydu kodującego białko mające sekwencję aminokwasów SEQ ID NO 42, (b) polinukleotydu, który zawiera sekwencję nukleotydów SEQ ID NO 41, odpowiedniego do stosowania w przyspieszaniu biosyntezy ML-236B, (c) polinukleotydu, który stanowi sekwencję nukleotydów SEQ ID NO 41, (d) polinukleotydu, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (a) do (c), i który jest odpowiedni do przyspieszania biosyntezy ML-236B w mikroorganizmie wytwarzającym ML-236B gdy jest wprowadzany do tego mikroorganizmu wytwarzającego ML-236B, (e) mRNA, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (d).
2. Polinukleotyd według zastrz. 1, znamienny tym, ż e zawiera DNA, który można uzyskać z transformowanej Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
3. Polinukleotyd według zastrz. 1 albo 2, znamienny tym, że jest w połączeniu funkcjonalnym z jednym lub wię cej polinukleotydów, przy czym ta kombinacja jest odpowiednia do stosowania w zwię kszaniu wytwarzania ML-236B w mikroorganizmie wytwarzają cym ML-236B.
4. Polinukleotyd według zastrz. 3, znamienny tym, że zawiera polinukleotyd określony w zastrz. 1 albo 2 w połączeniu z polinukleotydem kodującym białko, które zawiera lub stanowi sekwencję aminokwasów wybraną z SEQ ID NO 38, 42, 44, 46, 48 lub 50.
5. Polinukleotyd według zastrz. 3, znamienny tym, że zawiera polinukleotyd o SEQ ID NO 41 w połączeniu z jedną lub wię cej sekwencji wybranych z SEQ ID NO 37, 41, 43, 45, 47 lub 49.
6. Polinukleotyd wedł ug zastrz. 1, znamienny tym, ż e jest nim DNA.
7. Polinukleotyd według zastrz. 1, znamienny tym, że jest genomowym DNA.
8. Polinukleotyd według zastrz. 1, znamienny tym, że jest nim cDNA.
9. Wektor znamienny tym, że zawiera polinukleotyd określony w zastrz. 1-8.
10. Wektor według zastrz. 9, znamienny tym, że ponadto zawiera polinukleotyd mający sekwencję nukleotydowa SEQ ID NO 37.
11. Wektor według zastrz. 9 albo 10, znamienny tym, że ponadto zawiera jedną lub więcej sekwencji nukleotydowych wybranych z SEQ ID NO 43, 45, 47 lub 49.
12. Wektor według zastrz. 9, znamienny tym, że nie zawiera sekwencji nukleotydowych SEQ ID NO 37, 43, 45, 47 lub 49.
13 Wektor według zastrz. 9, znamienny tym, że nie zawiera sekwencji nukleotydowych SEQ ID NO 43, 45, 47 lub 49.
14. Wektor według zastrz. 9, znamienny tym, że wytwarza się go z Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
15. Wektor według zastrz. 9, znamienny tym, że jest wektorem ekspresyjnym.
16. Komórka gospodarza transformowana wektorem określonym w dowolnym z zastrz. 9 do 15.
17. Komórka gospodarza według zastrz. 16, znamienna tym, że jest mikroorganizmem wytwarzającym ML-236B.
18. Komórka gospodarza według zastrz. 17, znamienna tym, że pochodzi z gatunku Penicillium.
19. Komórka gospodarza według zastrz. 17 albo 18, znamienna tym, że jest to komórka Penicillium citrinum.
20. Komórka gospodarza według zastrz. 16, znamienna tym, że jest to komórka Escherichia coli.
21. Komórka gospodarza według zastrz. 20, znamienna tym, że jest komórką Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
22. Polipeptyd kodowany przez polinukleotyd określony w dowolnym z zastrz. 1 do 8.
23. Polipeptyd zawierający sekwencję SEQ ID NO 42, lub jej wariant, który ma przynajmniej
80% identyczności do SEQ ID NO 42 i który jest zdolny do przyspieszenia produkcji ML-236B w organizmie wytwarzającym ML236B.
24. Polipeptyd według zastrz. 22, znamienny tym, że ma sekwencję SEQ ID NO 42.
25. Sposób wytwarzania ML-236B, znamienny tym, że hoduje się komórki gospodarza określone w zastrz. 16 do 19 i następnie odzyskuje się ML-236B z hodowli.
26. Sposób według zastrz. 25, znamienny tym, że komórkę gospodarza transformuje się wektorem zawierającym SEQ ID NO 41.
140
PL 202 457 B1
27. Sposób według zastrz. 26, znamienny tym, że wektor nie zawiera sekwencji polinukleotydowej SEQ ID NO 37.
28. Sposób według zastrz. 26 albo 27, znamienny tym, że wektor nie zawiera co najmniej jednej sekwencji polinukleotydowej kodującej sekwencję aminokwasów odpowiadającą SEQ ID NO 44, 46, 48 i/lub 50
29. Sposób według zastrz. 25, znamienny tym, że wytwarzanie zachodzi w nieobecności jednego lub więcej zrekombinowanych polipeptydów mających sekwencje aminokwasowe odpowiadające SEQ ID NO 38, 44, 46, 48 i/lub 50.
30. Sposób według zastrz. 25, znamienny tym, że wytwarzanie zachodzi w nieobecności jednego lub więcej cDNA odpowiadającego SEQ ID NO 37, 43, 45, 47 i/lub 49.
31. Sposób wytwarzania prawastatyny, znamienny tym, że przeprowadza się sposób określony w zastrz. 25 do 30 i przekształca się ML-236B w prawastatynę.
PL347118A 2000-04-18 2001-04-18 Polinukleotyd przyspieszający biosyntezę ML-236B, wektor, komórka gospodarza transformowana tym wektorem, polipeptyd, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny PL202457B1 (pl)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000116591 2000-04-18
JP2000117458 2000-04-19

Publications (2)

Publication Number Publication Date
PL347118A1 PL347118A1 (en) 2001-10-22
PL202457B1 true PL202457B1 (pl) 2009-06-30

Family

ID=26590305

Family Applications (1)

Application Number Title Priority Date Filing Date
PL347118A PL202457B1 (pl) 2000-04-18 2001-04-18 Polinukleotyd przyspieszający biosyntezę ML-236B, wektor, komórka gospodarza transformowana tym wektorem, polipeptyd, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny

Country Status (24)

Country Link
US (3) US7056710B2 (pl)
EP (1) EP1149919B1 (pl)
KR (1) KR100632174B1 (pl)
CN (1) CN1325959B (pl)
AR (1) AR034550A1 (pl)
AT (1) ATE373101T1 (pl)
AU (1) AU783319B2 (pl)
BR (1) BR0101518A (pl)
CA (1) CA2342397C (pl)
CY (1) CY1106985T1 (pl)
CZ (1) CZ20011367A3 (pl)
DE (1) DE60130394T2 (pl)
DK (1) DK1149919T3 (pl)
ES (1) ES2293966T3 (pl)
HK (1) HK1037683A1 (pl)
HU (1) HUP0101569A3 (pl)
IL (1) IL142619A (pl)
MX (1) MXPA01003913A (pl)
NO (1) NO328653B1 (pl)
NZ (1) NZ511166A (pl)
PL (1) PL202457B1 (pl)
PT (1) PT1149919E (pl)
RU (1) RU2236463C2 (pl)
TW (1) TWI312807B (pl)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009540811A (ja) * 2006-06-22 2009-11-26 ディーエスエム アイピー アセッツ ビー.ブイ. プラバスタチンの産生
WO2010034686A1 (en) * 2008-09-24 2010-04-01 Dsm Ip Assets B.V. Improved statin production
WO2010069914A1 (en) * 2008-12-19 2010-06-24 Dsm Ip Assets B.V. Statin transcription regulators
WO2015161856A1 (en) * 2014-04-23 2015-10-29 Danmarks Tekniske Universitet Statin resistance and export

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS572240A (en) 1980-06-06 1982-01-07 Sankyo Co Ltd Ml-236b derivative
US5179013A (en) * 1987-02-02 1993-01-12 Sankyo Company, Limited Cytochrome P-450 enzymes
WO1995012661A1 (en) 1993-11-02 1995-05-11 Merck & Co., Inc. Dna encoding triol polyketide synthase
KR100186758B1 (ko) * 1996-08-09 1999-04-01 영진약품공업 주식회사 프라바스타틴(pravastatin)전구체의제조방법
US6391583B1 (en) 1998-12-18 2002-05-21 Wisconsin Alumni Research Foundation Method of producing antihypercholesterolemic agents
AU6475800A (en) 1999-08-11 2001-03-13 Sankyo Company Limited Ml-236b biosynthesis-associated dna
FR2801648B1 (fr) * 1999-11-30 2002-06-21 Commissariat Energie Atomique Injecteur a vapeur haute pression comportant un drain axial

Also Published As

Publication number Publication date
MXPA01003913A (es) 2003-08-20
CZ20011367A3 (cs) 2001-12-12
PT1149919E (pt) 2007-12-17
DE60130394D1 (de) 2007-10-25
CN1325959A (zh) 2001-12-12
RU2236463C2 (ru) 2004-09-20
EP1149919B1 (en) 2007-09-12
US20030078395A1 (en) 2003-04-24
EP1149919A2 (en) 2001-10-31
ES2293966T3 (es) 2008-04-01
CN1325959B (zh) 2010-05-05
HK1037683A1 (en) 2002-02-15
TWI312807B (en) 2009-08-01
HUP0101569A2 (hu) 2002-05-29
KR100632174B1 (ko) 2006-10-11
KR20010098713A (ko) 2001-11-08
NZ511166A (en) 2002-11-26
HU0101569D0 (en) 2001-06-28
HUP0101569A3 (en) 2005-01-28
AU3709201A (en) 2001-10-25
US20070111293A1 (en) 2007-05-17
CY1106985T1 (el) 2012-09-26
ATE373101T1 (de) 2007-09-15
NO20011890L (no) 2001-10-19
AU783319B2 (en) 2005-10-13
IL142619A (en) 2008-03-20
CA2342397A1 (en) 2001-10-18
AR034550A1 (es) 2004-03-03
DE60130394T2 (de) 2008-06-19
EP1149919A3 (en) 2002-02-06
NO20011890D0 (no) 2001-04-17
PL347118A1 (en) 2001-10-22
CA2342397C (en) 2011-08-23
BR0101518A (pt) 2001-11-13
US20050214909A1 (en) 2005-09-29
DK1149919T3 (da) 2007-12-03
US7056710B2 (en) 2006-06-06
NO328653B1 (no) 2010-04-19

Similar Documents

Publication Publication Date Title
US5849541A (en) DNA encoding triol polyketide synthase
CN113684169B (zh) 聚(3-羟基丁酸-4-羟基丁酸-5-羟基戊酸)三聚物及其微生物生产菌株构建
WO2000037629A2 (en) Method of producing antihypercholesterolemic agents
CN113227364A (zh) 用于产生熊去氧胆酸及其前体的细胞和方法
EP2029750A2 (en) Production of pravastatin
JP2002518004A (ja) エポチロン生合成用遺伝子
US20070111293A1 (en) Genes from a gene cluster
US6632650B1 (en) Genes involved in cyclododecanone degradation pathway
US20030215930A1 (en) Genes involved in cyclododecanone degradation pathway
JP2001169780A (ja) ドコサヘキサエン酸生産細菌の遺伝子
JP2002315579A (ja) 遺伝子クラスター上の構造遺伝子
JP2001112487A (ja) Ml−236b生合成関連dna
KR20130097538A (ko) 해양 미생물 하헬라 제주엔시스의 제주엔올라이드 생합성 유전자 클러스터
CN114774443B (zh) 生产小白菊内酯的重组酿酒酵母菌株及其构建方法
CN115261243B (zh) 重组酿酒酵母及其构建方法和应用
JP2003116567A (ja) 遺伝子クラスター
WO2001012814A1 (fr) Adn lie a la biosynthese ml-236b
WO2000055304A2 (en) A chc biosynthetic gene cluster
JP2006271380A (ja) コマモナス属遺伝子破壊株を用いたステロイド代謝産物の製造方法

Legal Events

Date Code Title Description
LAPS Decisions on the lapse of the protection rights

Effective date: 20110418