CZ20011367A3 - Polynukleotid, vektor, hostitelská buňka, polypeptid, protilátka a způsob přípravy ML-236B - Google Patents

Polynukleotid, vektor, hostitelská buňka, polypeptid, protilátka a způsob přípravy ML-236B Download PDF

Info

Publication number
CZ20011367A3
CZ20011367A3 CZ20011367A CZ20011367A CZ20011367A3 CZ 20011367 A3 CZ20011367 A3 CZ 20011367A3 CZ 20011367 A CZ20011367 A CZ 20011367A CZ 20011367 A CZ20011367 A CZ 20011367A CZ 20011367 A3 CZ20011367 A3 CZ 20011367A3
Authority
CZ
Czechia
Prior art keywords
seq
polynucleotide
dna
sequence
vector
Prior art date
Application number
CZ20011367A
Other languages
English (en)
Inventor
Hiroji Yoshikawa
Yuki Abe
Chiho Ono
Original Assignee
Sankyo Company Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sankyo Company Limited filed Critical Sankyo Company Limited
Publication of CZ20011367A3 publication Critical patent/CZ20011367A3/cs

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/385Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Penicillium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)

Description

Ά V ULoo A — Polynukleotid, vektor, hostitelská buňka, polypeptid, protilátka a způsob přípravy ML-236B
Oblast techniky
Vynález popisuje skupinu genů, zejména pak charakterizuje jednotlivé geny ze této skupiny genů.
Zvláště pak se vynález vztahuje na polynukleotidy, jako je DNA, které urychlují biosyntézu inhibitoru HMG-CoA reduktasy označeného ML-236B, a to v mikroorganismech produkujících ML-236B po zavedení této DNA. Vynález se dále vztahuje na vektory, do kterých jsou řečené polynukleotidy vloženy, hostitelské buňky transformované danými vektory, proteiny exprimované pomocí daných vektorů, způsob přípravy uvedených polynukleotidů a/nebo proteinů, kde způsob přípravy zahrnuje i izolaci ML-236B z kultury řečených hostitelských buněk a kdy se vynález vztahuje dále na všechny přidružené aspekty.
Dosavadní stav techniky
Pravastatin je inhibitor HMG-CoA reduktasy. Sodná sůl pravastatinu se používá k léčbě hyperlipemie nebo hyperlipidemie a má prokazatelný farmakologický vliv na snížení hladiny cholesterolu v séru. Pravastatin lze získat užitím Streptomyces carbophilus pomocí mikrobiální konverze ML-236B produkovaného Penicillium citrinum [popsáno v: Endo, A., a další, J. Antibiot.,29 1346(1976); Matsuoka, T., a další., Eur. J. Biochem., 184, 707 (1989) a v Japonské patentové publikaci č. 57-2240].
Bylo dokázáno, že jak ML-236B, jako prekurzor pravastatinu, tak lovastatin, který je inhibitorm HMG-CoA, obsahují tutéž parciální strukturu. Jsou biologicky syntetizovány cestou přes polyketidy [popsáno v: Moore, R.N., a další, J.Am.Chem.Soc.,107, 3694(1985); Shiao, M. a Don, H.S., Proč. Nati. Sci. Counc. Repub. China B, 11, 223(1987)]. Polyketidy jsou sloučeniny odvozené z β-keto uhlíkových řetězců, které vznikají kontinuální kondenzací karboxylových kyselin o nízkých molekulových hmotnostech, jako je kyselina octová, kyselina propionová, máselná a nebo dalších tohoto typu.V závislosti na způsobu kondenzace a následné redukce β-keto karbonylových skupin mohou vznikat různé struktury polyketidů [popsáno v: Hopwood, D.A. a Sherman, D.H., Annu. Rev.Genet. 24,37-66 (1990); Hutchinson, C. R. a Fujii, I., Annu. Rev. Microbiol. 49, 201-238 (1995)].
Polyketidsynthasy (dále v textu se používá zkratka PKS), které se podílejí na syntéze polyketidů, jsou enzymy, o kterých je známo, že se vyskytují ve vláknitých houbách a bakteriích. Enzymy vyskytující se ve vláknitých houbách byly již dříve studovány pomocí
: : : · :
• · * · · · · . . »·.» molekulárně biologických technik [jak je popsáno v: Feng, G.H. a Leonard, T. J., J. Bacteriol. 177,6246 (1995); Takano, Y„ a další, Mol. Gen. Genet. 249,162 (1995)]. U Aspergillus terreus, což je mikroorganismus produkující lovastatin, byl analyzován PKS gen podílející se na biosyntéze lovastatinu [popsáno v: Mezinárodní přihláška v Japonsku (KOHYO) č.9504436, a podívejte se také na odpovídající WO 9512661, kde jsou nároky na DNA kódující triolpolyketidsynthasu].
Příbuzné geny, vztahující se na biosyntézu sekundárních metabolitů vláknitých hub, velmi často tvoří v genomu skupiny (klastry). Také pro cesty biosyntézy polyketidů jsou takovéto genové skupiny, podílející se na řečené biosyntetické dráze, známy. Při biosyntéze aflatoxinu, což je polyketid produkovaný Aspergillus flavus a Aspergillus parasiticus, byly objeveny takovéto skupiny genů, kódující enzymové proteiny (tak jako PKS), které se podílejí na zmíněné biosyntéze. Byla provedena genomová analýza a srovnání genů účastnících se na biosyntéze aflatoxinu u každého z mikroorganismů [popsáno v: Yu, J., a další, Appl. Environ. Microbiol., 61, 2365 (1995)]. Dále je také známo, že geny podílející se na biosyntéze sterigmatocystinu produkovaného Aspergillus nidulans, tvoří také ve spojité oblasti genomu daného mikroorganismu klastrové struktury o velikosti asi 60 kb [popsáno v : Brown, D. W. a další, Proč. Nati. Acad. Sci. USA, 93,1418 (1996)].
Bylo zkoumáno i ovlivnění aktivity polyketidsynthasy pomocí doplňkových proteinů během syntézy lovastatinu [popsáno v: Kennedy, J, a další., Science Vol 284,1368 (1999)].
Avšak doposud nebyla provedena molekulárně biologická analýza biosyntézy ML-236B a faktorů tuto syntézu ovlivňujících. Předložený vynález se zabývá právě tímto problémem.
Podstata vynálezu
Podle předloženého vynálezu se připraví polynukleotid, který lze využít pro urychlení biosyntézy ML-236B.
Polynukleotid je typickým polynukleotidem kódujícím protein obsahující sekvenci aminokyselin uvedenou jako Sekvence pod identifikačními čísly - SEKV. ID. C. 38,42, 44, 46, 48 nebo 50. Také jsou připraveny varianty polynukleotidu, které kódují modifikovanou aminokyselinovou sekvenci obsahující jednu deleci, adici, substituci či alteraci.
Tabulka uvádějící seznam sekvencí
Seznam sekvencí tvoří součást této patentové přihlášky. Pomáhá k porozumění. Proto je uvedena následující tabulka se seznamem sekvencí.
identita
SEKV. ID. Č.
pML48 inzert komplementární k SEKV. ID. Č. 1
PCR primer pro Příklad 4
PCR primer pro Příklad 4 oligonukleotid DNA (1) pro 5’-RACE, Příklad 8 oligonukleotid DNA (1) pro 5’-RACE, Příklad 8 oligonukleotid DNA (1) pro 5’-RACE, Příklad 8 oligonukleotid DNA (1) pro 5’-RACE, Příklad 8 oligonukleotid DNA (1) pro 5’-RACE, Příklad 8 oligonukleotid DNA (1) pro 5’-RACE, Příklad 8 oligonukleotid DNA (2) pro 5’-RACE, Příklad 8 oligonukleotid DNA (2) pro 5’-RACE, Příklad 8 oligonukleotid DNA (2) pro 5’-RACE, Příklad 8 oligonukleotid DNA (2) pro 5’-RACE, Příklad 8 oligonukleotid DNA (2) pro 5’-RACE, Příklad 8 oligonukleotid DNA (2) pro 5’-RACE, Příklad 8
5’-end cDNA fragment, Příklad 8
5’-end cDNA fragment, Příklad 8
5’-end cDNA fragment, Příklad 8
5’-end cDNA fragment, Příklad 8
5’-end cDNA fragment, Příklad 8
5’-end cDNA fragment, Příklad 8 oligonukleotid DNA (3) pro 3’-RACE, Příklad 8 oligonukleotid DNA (3) pro 3’-RACE, Příklad 8 oligonukleotid DNA (3) pro 3’-RACE, Příklad 8 oligonukleotid DNA (3) pro 3’-RACE, Příklad 8 oligonukleotid DNA (3) pro 3’-RACE, Příklad 8 oligonukleotid DNA (3) pro 3’-RACE, Příklad 8
3'-end cDNA fragment, Příklad 8
3'-end cDNA fragment, Příklad 8
3'-end cDNA fragment, Příklad 8
3'-end cDNA fragment, Příklad 8
3'-end cDNA fragment, Příklad 8
3'-end cDNA fragment, Příklad 8
RT-PCR příměr, Příklad 9
RT-PCR primer, Příklad 9 w/rE; cDNA nukleotidová sekvence a odvozená aminokyselinová odvozený mlcE polypeptid
RT-PCR primer, Příklad 12
RT-PCR primer, Příklad 12 mlcR; cDNA nukleotidová sekvence a odvozená aminokyselinová odvozený mlcR polypeptid mlcAr, cDNA nukleotidová sekvence a odvozená aminokyselinová odvozený mlcA polypeptid w/cB; cDNA nukleotidová sekvence a odvozená aminokyselinová odvozený mlcB polypeptid mlcC; cDNA nukleotidová sekvence a odvozená aminokyselinová odvozený mlcC polypeptid w/cD; cDNA nukleotidová sekvence a odvozená aminokyselinová odvozený mlcD polypeptid
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR přiměř, Příklad 17
RT-PCR primer, Příklad 17
RT-PCR primer, Příklad 17
Výhodné provedení vynálezu
Polynukleotidy kódující aminokyselinové sekvence SEKV. ID. Č. 38,42,44, 46,48 nebo 50 mohou být cDNA, genomová DNA nebo mRNA. Genomové DNA, kódující každou ze šesti sekvencí, jsou označeny jako strukturní geny mlcE, mlcR, mlcA, mlcB, mlcC a mlcO. Aniž bychom brali zřetel na tato označení, věříme, že tyto strukturní geny kódují proteiny s následujícími funkcemi:
mlcA polyketidsynthasa mlcB polyketidsynthasa mlcC P450 monooxygenasa mlcD HMG-CoA reduktasa mlcE efluxní pumpa mlcR transcripční faktor
Objevili jsme, že vložení mlcE nebo cDNA odpovídající mlcE může urychlit biosyntézu ML236B a dále, že vložení mlcB. nebo cDNA odpovídající mlcB může také urychlit biosyntézu ML-236B v buňce. Co více, mlcB stimuluje transkripční expresi mlcA a D. mlcA, B, C a D se účastní tvorby ML-236B, a to buď nezávisle nebo v kombinaci, jak bylo prokázáno studiemi se zavedením záměrného poškození genu.
K syntéze derivátů ML-236B, včetně statinů, jako je pravastatin a lovastatin, byly použity varianty mlcA, B a/nebo C, které je možno získat pomocí umělé nebo přirozeně zavedené změny. S ohledem na tento postup je možno získat pravastatin přímo použitím takovýchto variant v jediném fermentačním kroku, aniž by byla nutná mikrobiální konverze ML-236B na pravastatin běžně produkovaný Streptomyces carbophilus.
Ve výhodném provedení polynukleotid zahrnuje sekvenci obsahující SEKV. ID. Č. 37, nebo mutantní sekvenci či variantu této sekvence, která je schopna urychlit biosyntézu ML236B. Takovýto DNA polynukleotid je možno získat z bakterií Escherichia coli transformovaných vektory pSAKexpE SANK 72499 (FERM BP-7005).
V dalším výhodném provedení polynukleotid obsahuje sekvenci označenou SEKV. ID. Č. 41 nebo její mutantu či variantu, která je schopná urychlit biosyntézu ML-236B. Takovýto DNA polynukleotid je možno získat z bakterií Escherichia coli transformovaných vektory pSAKexpR SANK 72599 (FERM BP-7006).
Polynukleotidy uvedené ve vynálezu mohou být použity ve fimkční kombinaci s jedním či několika dalšími polynukleotidy. Zvláště výhodné kombinace je možné využít pro zvýšení produkce ML-236B v mikroorganismech produkujících ML-236B.
Příklady takovýchto kombinací zahrnují polynukleotid sekvence SEKV. ID. Č. 37 nebo jeho varianty mající podobné funkce, v kombinaci s jednou nebo více sekvencemi vybranými ze SEKV. ID. Č. 37 samotné, dále ze sekvencí 41,43,45,47 nebo 49; stejně polynukleotid o sekvenci SEKV. ID. Č. 41, nebo jeho varianty, které mají podobné funkce v kombinaci s jednou nebo více sekvencemi vybranými ze sekvence SEKV. ID. Č. 37, 41 samotných, nebo ze sekvencí 43, 45, 47 nebo 49.
Z tohoto hlediska je polynukleotid ve výhodném provedení nukleotid kódující protein obsahující nebo sestávající z aminokyselinových sekvencí SEKV. ID. Č. 38,42, 44, 46,48 nebo 50, který je schopen urychlit biosyntézu ML-236B samostaně nebo ve spojení s polynukleotidem SEKV. ID. Č. 37, SEKV. ID. Č. 41 nebo jejich variant, které mají podobné funkce.
Vynález dále popisuje další polynukleotidy, které jsou schopné za striktních podmínek hybridizovat s polynukleotidy uvedenými v předkládaném vynálezu. Takovéto polynukleotidy, jsou-li zavedeny do mikroorganismů produkujících ML-236B, rozšiřují rámec polynukleotidů vhodných pro zrychlení biosyntézy ML-236B v mikroorganismech produkujících ML-236B.
Typickým polynukleotidem je DNA, cDNA nebo genomová DNA, nebo RNA a mohou být jak sense tak antisense orientace. Polynukleotid je typicky purifikovaný polynukleotid, což je polynukleotid bez dalších buněčných komponent.
Předkládaný vynález rozšiřuje okruh variant polynukleotidů kódujících aminokyselinové sekvence popsané v SEKV. ID. Č. 38,42,44,46,48 nebo 50, kde jeden nebo více nukleotidů je změněno. Změny mohou být přirozeně se vyskytující a mohou být způsobeny nadbytečnými či degenerovanými triplety v genetickém kódu. Takovéto degenerativně pozměněné polynukleotidy kódují tutéž aminokyselelinovou sekvenci.
• «'
Do rámce těchto polynukleotidových variant zahrnujeme spíše genomovou DNA mající extrony a introny, než jednodušší cDNA sekvence.
Předkládaný vynález rozšiřuje okruh variant polynukleotidů kódujících aminokyselinové sekvence popsané v SEKV. ID. Č. 38,42,44,46,48 nebo 50, které kódují modifikované aminokyselinové sekvence mající alespoň jednu deleci, adici, substituci nebo alteraci. Tímto vynález rozšiřuje okruh variant polynukleotidů podle pospaných sekvencí o polynukleotidové sekvence kódující aminokyselinové sekvence, které jsou kratší, delší či stejné délky, jaké by měly být podle uvedených sekvencí. Ve výhodném uspořádání si varianty polynukleotidů zachovávají schopnost urychlit syntézu ML-236B a v ještě výhodnějším užití si zachovávají přibližně stejně vysokou nebo dokonce lepší aktivitu, než sekvence rodičovské, ze kterých tyto odvozené varianty vznikly.
Varianty polynukleotidových sekvencí si zachovávají určitou identitu s rodičovskými sekvencemi. Stupeň identity je výhodně přinejmenším alespoň 60 %, dále alespoň 80 %, nebo alespoň 90 % nebo alespoň 95 % nebo 100 %. Stupeň identity varianty se výhodně určuje pomocí počítačového software, jako je program BLAST, který používá algoritmus k určení homologních sekvencí.
Ve výhodném provedení je polynukleotid podle vynálezu DNA, vybraná ze skupiny obsahující:
(a) DNA, která se vyznačuje tím, že obsahuje jednu nebo více sekvencí uvedených v nukleotidu od č. 1 do 1662 v SEKV.ID Č. 37 v Seznamu sekvencí a která je charakterizovaná zvýšením rychlosti biosyntézy ML-236B v mikroorganismech produkujících ML-236B, do kterých byla tato sekvence zavedena;
(b) DNA, která hybridizuje za striktních podmínek s DNA popsanou v bodě (a) a která je chrakterizována zrychlením biosyntézy ML-236B v mikroorganismech produkujících ML236B, jestliže je do těchto mikroorganismů vložena;
(c) DNA, která obsahuje jednu nebo více nukleotidových sekvencí, popsaných pro nukleotid od č. 1 do 1380 v SEKV. ID. Č. 41 v Seznamu sekvencí a která je chrakterizována zrychlením biosyntézy ML-236B v mikroorganismech produkujících ML-236B, jestliže je do těchto mikroorganismů vložena;
(d) DNA, která hybridizuje za striktních podmínek s DNA popsanou v bodě (c) a která a je chrakterizována zrychlením biosyntézy ML-236B v mikroorganismech produkujících ML236B, jestliže je do těchto mikroorganismů vložena;
Polynukleotidy podle vynálezu urychlují biosyntézu ML-236B v mikroorganismech, které ML-236B produkují. Příklady mikroorganismů produkujících ML-236B zahrnují rody
8· · · · * • · » * • ♦ ·«· β · * e * β
Penicillium, jako je Penicillium citrinum, Penicillium brevicompactum [popsáno v : Brown, A.G, a další, J. Chem. Soc. Perkin-1., 1165(1976)], Penicillium cyclopium [popsáno v : Doss, S.L., a další, J. Nati. Prod.,49, 357 (1986)] nebo jinde. Další příklady zahrnují: Eupenicillium sp.M6603 [popsáno v: Endo, A., a další, J. Antibiot.-Tokyo, 39,1609(1986)], Paecilomyces viridis FERM P-6236 [popsáno v : Japonská patentová přihláška č,58-98092], Paecilomyces sp.M2016 [popsáno v: Endo, A., a další, J. Antibiot. -Tokyo, 39,1609 (1986)], Trichoderma longibrachiatum M6735 [popsáno v : Endo, A., a další, J. Antibiot.-Tokyo, 39,1609(1986)], Hypomyces chrysospermus IFO 7798 [popsáno v : Endo, A., a další, J. Antibiot.-Tokyo, 39, 1609(1986)], Gliocladium sp. YJ-9515 [popsáno v: WO 9806867], Trichorderma viride IFO 5836 [popsáno v . Japonská patentová přihláška č.62-19159], Eupenicillium reticulisporum IFO 9022 [popsáno v: Japonská patentová přihláška č.62-19159] a dále další vhodné použitelné mikroorganismy.
Mezi těmito mikroorganismy, které produkují ML-236B, je preferováno užití Penicillium citrinum, a ve zvláště výhodném provedení kmen Penicillium citrinum SANK 13380. Kmen Penicillium citrinum SANK 13380 byl uložen ve Výzkumném ústavu přírodních věd a technologií Agentury pro průmyslové vědy a technologie ( Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology) 22. prosince 1992 pod přístupovým číslem FERM BP-4129, v souladu s Budapešťskou smlouvou o uchovávání mikroorganismů. Příklady mikroorganismů produkujících ML-236B také zahrnují ty izoláty z přírodních zdrojů, které byly mutovány jak přirozenou cestou, tak uměle.
Vynález dále zahrnuje vektory obsahující polynukleotidy podle vynálezu, jako jsou vektory získané z Escherichia coli pSAKexpE SANK 72499 (FERM BP-7005) nebo Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006). Tyto vektory podle vynálezu zahrnují expresní vektory.
Hostitelské buňky transformované pomocí vektorů podle vynálezu jsou také součástí vynálezu, včetně těch, zahrnujících mikroorganismy produkující ML-236B. Hostitelské buňky podle vynálezu zahrnují Penicillium citrinum a Escherichia coli, jako jsou Escherichia coli pSAKexpE SANK 72499 (FERM BP-7005) nebo Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
Vynález dále rozšiřuje okruh polypeptidů kódovaných polynukleotidy podle vynálezu. Příklady polypeptidů podle vynálezu zahrnují sekvenci SEKV. ID. Č. 38 nebo 42 nebo jejich varianty, které mají určený stupeň identity se seknencemi SEKV. ID. Č. 38 nebo 42 a které jsou schopné urychlit produkci ML-236B v mikroorganismech produkujících ML-236B. Dalšími polypeptidy jsou ty, které jsou kódovány dalšími polynukleotidovými sekvencemi ♦ ♦ · í ·' *
9» · · ->
• · ·« «9 » ♦ « ♦ · · » > * «>« podle vynálezu a jejich variantami majícími zachovaný určitý stupeň identity.
Ve výhodném uspořádání je stupeň identity polypeptidových variant se sekvencí SEKV. ID. Č. 38 nebo 42 přinejmenším alespoň 80 %, dále alespoň 95 % nebo alespoň 100 %. Stupeň identity varianty se výhodně určuje pomocí počítačových programů, jako je program BLAST, který k určení homologních sekvencí používá určitý algoritmus.
Polypeptidy podle vynálezu obsahují kratší či delší sekvence ze sekvence SEKV. ID. C. 38 nebo 42 nebo jejich variant. Kratší polypeptidy obsahují částečné aminokyselinové sekvence z SEKV. ID. Č. 38,42 nebo jejich varianty a ve výhodném uspořádání jim zůstává schopnost urychlit biosyntézu ML-236B. Delší polypeptidy obsahují celé nebo částečné aminokyselinové sekvence SEKV. ID. Č. 38,42 nebo jijich varianty a v ještě výhodnějším uspořádání jim zůstává schopnost urychlit biosyntézu ML-236B. Delší polypeptidy obsahují fuzní proteiny jako je Fc-fuzní protein.
Polypeptidy podle vynálezu zahrnují jednu ze sekvencí SEKV. ID. Č. 38, SEKV. ID.
Č. 42, SEKV. ID. Č. 44, SEKV. ID. Č. 46, SEKV. ID. Č. 48 nebo jejich varianty mající podobné funkce. Jsou také k dispozici protilátky generované proti polypeptidům podle vynálezu. Součástí vynálezu je také příprava jak monoklonálních, tak polyklonálních protilátek. Zmíněné protilátky je možné použít pro regulaci produkce ML-236B a pro přípravu derivátů ML-236B jako jsou statiny, včetně pravastatinu a lovastatinu. Co více, řečené protilátky se ve výhodném uspořádání používají k analýze biosyntézy ML-236B a k regulaci jejího mechanismu. Takováto analýza je užitečná pro ovlivnění produkce ML-236B a pro přípravu derivátů ML-236B.
Hostitelské buňky podle vynálezu, které obsahují vektor podle vynálezu mohou být užity ve způsobu přípravy ML-236B, což spočívá v napěstování takovýchto hostitelských buněk a následném získám ML-236B z kultury. V jednom způsobu přípravy vektor obsahuje geny mlcE nebo mlcR, avšak nikoli další geny, jako je mlcA, mlcB, mlcC nebo mlcD.
Příprava podle tohoto způsobu se může projevit v absenci rekombinantních polypeptidů mlcA, mlcB, mlcC and/or mlcD odpovídajících SEKV. ID. Č. 44, SEKV. ID. Č. 46, SEKV. ID. Č. 48 nebo SEKV. ID. Č. 50.
V dalším textu následuje popis specifických provedení vynálezu. Předkládaný vynález bude v dalším textu podrobněji popsán.
Autoři předkládaného vynálezu klonovali genomovou DNA obsahující geny podílející se na biosyntéze ML-236B v Penicillium citrinum. Genomová DNA je v dalším textu označována jako DNA příbuzná genomové DNA pro biosyntézu ML-236B a je klonována z DNA genomové knihovny mikroorganismů produkujících ML-236B. Genomová DNA byla • · analysována za účelem nalezení strukturních genů řečené genomové DNA. Potom byly připraveny cDNAodpovídající strukturním genům pomocí reversní transkripční polymerázové řetězové reakce (dále bude užíváno označení RT PCR) za užití celkové RNA, která obsahovala mRNA z Penicillium citrinum jako templát. Bylo shledáno, že biosyntéza ML236B v mikroorganismech produkujících ML-236B je urychlena, když jsou mikroorganismy produkující ML-236B transformovány rekombinantními DNA vektory obsahujícími řečené cDNA.
Předkládaný vynález se vztahuje zvláště k cDNA (dále označovaných jako cDNA urychlující biosyntézu ML-236B), které urychlují biosyntézu ML-236B v mikroorganismech produkujících ML-236B, jsou-li do těchto mikroorganismů vloženy.
Polynukleotid urychlující biosyntézu ML-236B podle předkládaného vynálezu, jako je cDNA urychlující biosyntézu ML-236B, lze získat následujícími příklady postupů:
(I) DNA, získaná syntézou z templátu za použití transkripčního produktu (messenger RNA, dále označovaná jako mRNA) ze strukturního genu, kteiý se podílí na biosyntéze ML-236B a který se nachází v genomové DNA mikroorganismu produkujícícho ML-236B;
(II) dvouvláknová DNA, která vznikla jako výsledek asociace DNA (I) a druhého vlákna DNA syntetizované pomocí DNA (I) jako prvního vlákna;
(III) dvouvláknová DNA, která vznikla jako výsledek replikace či amplifikace dvouvláknové DNA (II), například, pomocí postupu klonování nebo podobného;
(IV) DNA, která může hybridizovat za striktně určených podmínek s jednou z výše zmíněných DNA nebo mRNA.
DNA (IV) může být stejná, jaká byla nalezena v sekvenci kteréhokoli strukturního genu uvedeného v patentu, například nukleotid od 1 do 1662 v SEKV. ID. Č. 37 ze Seznamu sekvencí nebo nukleotid číslovaný od 1 do 1380 v SEKV. ID. Č. 41, kde je jeden nebo více nukleotidů volitelně substituovaných, deletovaných a/nebo přidaných a které mohou urychlit biosyntézu ML-236B v mikroorganismech produkujících ML-236B, jsou-li do těchto mikroorganismů vloženy.
Hybridizují-li dvě jednovláknové nukleové kyseliny, tvoří dvouvláknovou molekulu, a to v oblasti, kde jsou k sobě komplementární, či vzájemně vysoce komplementární a použité „striktní podmínky “ ve výhodném uspořádání odpovídají použití postupu, kdy hybridizační roztok je 6 x SSC [1 xSSC má složení 150mMNaCl, 15 mM citrát sodný], a teplota hybridizace je 55 °C.
cDNA urychlující biosyntézu ML-236B lze získat například izolací klonu obsahujícího cDNA z cDNA knihovny pro mikroorganismy produkujícíc ML-236B. Alternativním postupem je použití RT PCR, kdy jsou užity dva primery navržené na bázi nukleotidové sekvence pro DNA příbuznou s genomovou DNA účastnící se biosyntézy ML236B, či na bázi mRNA nebo z celkové RNA získané z mikroorganismů produkujících ML236B.
Mikroorganismus produkující ML-236B je mikroorganismus mající z podstaty schopnost produkovat ML-236B. Jak bylo uvedeno již dříve, příklady mikroorganismů produkujících ML-236B zahrnují druhy Penicillium, jako je Penicillium citrinum, Penicillium brevicompactum, Penicillium cyclopium a další podobné. Další příklady zahrnují: Eupenicillium sp.M6603, Paecilomyces viridis FERM P-6236, Paecilomyces sp.M2016, Trichoderma longibrachiatum M6735, Hypomyces chrysospermus IFO 7798, Gliocladium sp. YJ-9515, Trichorderma viride IFO 5836, Eupenicillium reticulisporum IFO 9022, a další vhodné organismy.
Mezi těmito mikroorganismy produkujícími ML-236B je ve výhodném uspořádání používán Penicillium citrinum a ještě výhodnějším uspořádání Penicillium citrinum kmen SANK 13380. Kmen Penicillium citrinum SANK 13380 byl uložen ve Výzkumném ústavu přírodních věd a technologií Agentury pro průmyslové vědy a technologie ( Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology) 22. prosince 1992 pod přístupovým číslem FERM BP- 4129, v souladu s Budapešťskou smlouvou o uchovávání mikroorganismů. Příklady mikroorganismů produkujících ML-236B zahrnují jak izoláty z přírodních zdrojů, tak ty, co byly mutovány, a to jak přirozenou cestou, tak uměle.
DNA příbuzná genomové DNA pro biosyntézu ML-236B může být získána průzkumem genomové DNA knihovny organismu produkujícího ML-236B pomocí vhodné sondy. Výhodně je sonda navržena na bázi sekvence DNA, o které se předpokládá, že hraje roli při biosyntéze ML-236B, ve zvláště výhodném uspořádám pak je odvozena z vláknité houby.
Výběr postupů pro vytvoření genomové DNA knihovny není omezen na kterýkoli postup, může být použita jakákoli vhodná metoda všeobecně využívaná ke konstrukci genomové DNA knihovny eukaryotických organismů. Příklady vhodných postupů zahrnují metody popsané Maniatisem a dalšími. [Maniatis, T, a další, Molecular cloning, a laboratory manual, 2. vydám, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Další vhodné postupy jsou všeobecně známy odborníkům v daném oboru.
V přehledu lze konstatovat, že genomová DNA z mikroorganismu produkujícího
ML-236B může být získána z buněk buněčné kultury zmíněných mikroorganismů produkujících ML-236B fyzikálním rozbitím buněk, extrakcí DNA přítomné v jejich jádře a purifikací zmíněné DNA.
Kultivace mikroorganismů produkujících ML-236B může být uskutečněna za podmínek vhodných právě pro tyto mikroorganismy produkující ML-236B. Například, kultivace Penicillium citrinum, organismu produkujícího ML-236B a užívaného ve výhodném provedení, se provádí inokulací buněk v médiu MBG3-8 [složení: 7 % hmotn. glycerin, 3 % hmotn. glucosa, 1 % hmotn. sojový prášek, 1 % hmotn. pepton (vyrobený firmou Kyokuto Seiyaku Kogyo), 1 % hmotn. Com steep liqueur (vyrobený firmou Honěn), 0,5 % hmotn. dusičnan sodný, 0,1 % hmotn. heptahydrát síranu hořečnatého (pH 6,5)], a inkubací při 22 až 28 °C s třepáním po dobu 3 až 7 dní. Šikmý agar pro uchovávání kultury se připraví nalitím rozpuštěného PGA agarového média [složení: 200 g/L bramborový extrakt, 15 % hmotn. glycerin, 2% hmotn. agar] do zkumavky. Agar se nechá v nakloněné zkumavce utuhnout. Penicillium citrinum se potom inokoluje na šikmý agar pomocí platinové jehly. Následuje inkubace při teplotě 22 až 28 °C po dobu 7 až 15 dnů. Mikroorganismy nebo bakterie mohou být ze šikmého agaru kontinuálně odebírány pro další použití. Šikmý agar s mikro-organismy nebo bakteriemi lze uchovávat při teplotách od 0 do 4 °C.
Buňky mikroorganismů produkujících ML-236B, které se kultivují v kapalném médiu, mohou být získány centriíugací a ty, které jsou pěstované na pevném médiu mohou být získány seškrábnutím buněk pomocí buněčné škrabky z povrchu média či podobnou metodou.
Vzniklá genomová DNA je rozdělena na fragmenty štěpením vhodnými restrikčními enzymy. Není žádné omezení pro užití jakýchkoli restrikčních enzymů k štěpení vzniklé DNA, ale dává se přednost běžně užívaným a dostupným enzymům. Příklady užitých restrikčních enzymů zahrnují Sau3AI. Ale lze použít i další vhodné restrikční enzymy, které jsou známé odborníkům v daném oboru. Naštěpená DNA je potom nanesena na elektroforézu a z gelu se vyřízne DNA mající odpovídající velikost. Velikost fragmentů DNA není ničím omezena, ale ve výhodném provedení dosahuje velikosti kolem 20 kb či více.
Neexistuje také žádné omezení na výběr DNA vektorů použitých ke konstrukci genomové DNA knihovny, podmínkou je, že vektor musí obsahovat DNA sekvenci nezbytnou pro replikaci v hostitelských buňkách, které jsou tímto vektorem transformovány. Příklady vhodných vektorů zahrnují plazmidový vektor, fágový vektor, kosmidový vektor, BAC vektor nebo jiné podobné, přičemž je preferováno užití kosmidového vektoru. DNA vektor je ve výhodném provedení expresní vektor. V ještě výhodnějším uspořádání DNA vektor obsahuje DNA nebo nukleotidovou sekvenci, která vnáší do hostitelských buněk, které jsou transformovány vektorem,vybraný fenotyp.
DNA vektor je ve výhodném provedení vektor, jenž může být užit jak pro klonování, tak pro expresi. Ve výhodném uspořádání je vektror binární vektor, který může být použit pro transformaci více než jednoho hostitelského mikroorganismu. Binární vektor ve výhodném provedení obsahuje DNA sekvenci či sekvence , které umožňují replikaci v hostitelské buňce, ve zvláště výhodném uspořádání umožňují replikaci ve větším počtu hostitelských buněk různých mikroorganismů, jako jsou bakterie nebo houby. V ještě výhodnějším provedení binární vektor obsahuje sekvenci DNA, která může vnést vybraný fenotyp do okruhu různých hostitelských buněk, což mohou být buňky různých skupin mikroorganismů.
Výběr kombinací skupin mikroorganismů a hostitelských buněk transformovaných binárním vektorem není prakticky omezen, pod podmínkou, že jedna skupina mikroorganismů se používá pro klonování a další má schopnost produkovat ML-236B. Takováto kombinace může být například kombinací bakterie a vláknité houby, kombinace kvasinky a vláknité houby, ve výhodném uspořádání je upřednostňována kombinace bakterie a vláknité houby. Výběr bakterie není prakticky omezen, užívají se všechny bakterie běžně užívané v biotechnologiích, jako je například Escherichia coli, Bacillus subtilis a další. Ve výhodném provedení se používá Escherichia coli a v ještě výhodnějším provedení kmen Escherichia coli XLl-Blue MR. Podobně tomu, není nijak omezen druh kvasinek, užívají se všechny druhy běžně používané pro biotechnologické účely, jako je například Saccharomyces cerevisiae a další. Příklady vláknitých hub zahrnují mikroorganismy produkující ML-236B popsané výše. Další vhodné příklady mikroorganismů jsou známy odborníkům v daném oboru.
Ve předloženém vynálezu skupinu mikroorganismů lze vybrat z bakterií, vláknitých hub a kvasinek.
Příklady výše zmíněných binárních vektorů zahrnují kosmidový vektor mající vhodný markerový gen pro selekci fenotypu a cos místo. Další vhodné vektory jsou známy odborníkům v daném oboru. Ve výhodnémm provedení se užívá vektor pSAKcosl, konstruovaný inzercí cos místa z kosmidového vektoru pWE15 (vyráběný firmou STRATAGENE) do plazmidu pSAK333, který obsahuje sekvenci hygromycin Bfosfotransferasového genu z Escherichia coli [popsáno v : Japonská patentová přihláška č.3262486]. Způsob přípravy pSAKcosl je zobrazen na obrázku 1. Předkládaný vynález se však neomezuje na použtí pouze tohoto vektoru.
·· · ·· ·♦ ·· ···· · · * · · · • · · ····· ··
Genomová DNA knihovna se připravuje zavedením binárního vektoru do hostitelských buněk, vektor obsahuje fragmenty genomové DNA z mikroorganismů produkujícího ML-236B. Ve výhodném provedení je hostitelskou buňkou Escherichia coli, v ještě výhodnějším uspořádání Escherichia coli kmen XLl-Blue MR. Je-li hostitelská buňka Escherichia coli, zavedení vektoru lze provést pakážováním in vitro. V předkládaném vynálezu se transformace provádí rovněž zavedením cizorodé DNA pomocí pakážování in vitro a transformovaná buňka zahrnuje také buňku, do které byla zavedena cizorodá DNA pomocí pakážování in vitro.
Genomová knihovna může být prozkoumána pomocí protilátky či sondy na bázi nukleové kyseliny, čímž lze vybrat vhodný klon. Ve výhodném provedení se užívá sondy na bázi nukleové kyseliny. Ve výhodném provedení je nukleokyselinová sonda připravena na základě nukleotidové sekvence genu podobného genu nebo DNA vztahující se k biosyntéze polyketidů, ve výhodném uspořádání je sekvence odvozena z vláknité houby. Výběr jednotlivých genů není omezen, podmínkou je, aby se účastnily biosyntézy polyketidů a jejich nukleotidová sekvence musí být známa. Příklady takovýchto genů zahrnují gen pro aflatoxin PKS z Aspergillus flavus a Aspergillus parasiticus, gen pro Sterigmatocystin PKS z Aspergillus nidulans nebo jiné.
Vhodná sonda na bázi nukleové kyseliny může být získána například syntézou oligonukleotidové sondy obsahující část známé sekvence genomové DNA, tak, jak to bylo popsáno výše, nebo přípravou oligonukleotidových primerů a amplifikací cílové DNA pomocí polymerázové řetězové reakce, [dále v textuje používána zkratka PCR, popsáno v: Saiki, R. K., a další, Science, 239, 487 (1988)] a genomové DNA jako templátu, nebo pomocí RT-PCR za užití mRNA jako templátu. Odborníkům v daném oboru jsou známy ještě další způsoby přípravy takovýchto sond.
Specifickou sondu na bázi nukleových kyselin lze získat z mikroorganismů produkujících ML-236B za použití například PCR nebo RT-PCR. Návrh primerů užitých v PCR nebo RT-PCR (dále nazývaných jako primery pro PCR) se ve výhodném uspořádání vynálezu provádí na základě nukleotidové sekvence genu souvisejícího s biosyntézou polyketidů, jehož sekvence je známa. Ve výhodném provedení vynálezu je tento gen genem pro aflatoxin PKS z Aspergillus flavus, Aspergillus parasiticus, nebo gen pro sterigmatocystin PKS z Aspergillus nidulans.
Primery pro PCR lze vhodně navrhnout tak, aby obsahovaly nucleotidové sekvence, kkteré kódují aminokyselinové sekvence, které jsou v PKS genu vysoce konzervované. Způsob identifikace nukleotidových sekvencí odpvídá dané aminokyselinové sekvenci
• · · · • · e • * * · * • · *- * « • · · · • · « · · odvozené na základě užitých kodonů hostitelské buňky a metod umožňujících přípravu smíšených oligonukleotidových sekvencí pomocí užití násobných kodonů. (dále nazývanou jako ‘degenerované oligonukleotidy’). V posledně jmenovaném případě lze multiplicitu oligonukleotidů redukovat zavedením hypoxantinu do jejich nukleotidových sekvencí.
Primer pro PCR obsahuje nukleotidovou sekvenci navrženou tak, aby došlo k přisednutí na templátový řetězec, primer bývá připojen k dodatkové 5' sekvenci. Výběr takovéto 5' dodatkové nukleotidové sekvence není niěím omezen, za předpokladu, že primer může být užit pro PCR nebo RT-PCR. Takováto dodatková sekvence může obsahovat například nukleotidovou sekvenci vhodnou pro operace klonování PCR produktu. Takováto nukleotidová sekvence může být například štěpným místem pro restrikční enzym, nebo nukleotidová sekvence toto štěpné místo restrikčního enzymu obsahující.
Mimoto, v navrhování primeru pro PCR se preferuje, aby se celkový počet guaninových (G) a celkový počet cytosinových (C) baží pohyboval v rozmezí od 40 do 60 % celkového počtu baží. Mimoto se ve výhodném uspořádání dbá na to, aby primer na sebe vůvec či málo nasedal, v případě dvojice primerů, aby se nespojovaly (nenasedaly) na sebe vzájemně, nebo jen v minimální míře.
Bude-li primer použit pro PCR, není počet nukleotidů pro tvorbu primeru pro PCR prakticky ničím omezen. Spodní hranice počtu užitých nukleotidů se obecně pohybuje mezi 10 až 14 nukleotidy, horní hranice mezi 40 až 60 nukleotidy Ve výhodném provedení mají primery délku mezi 14 až 40 oligonukleotidy.
Primerem pro PCR je přednostně DNA. Nukleosidy v primeru mohou být deoxyadenosin, deoxycytidin, deoxythymidin a deoxyguanosin a ještě navíc deoxyinosin. Je vhodné, aby 5'-pozice v nukleosidu a 5'-konec primeru pro PCR nesly hydroxylovou skupinu nebo a hydroxylovou skupinu, na kterou je navázán pomocí esterové vazby jeden zbytek kyseliny fosorečné.
Syntézu primeru pro PCR lze provést způsoby obecně užívanými pro syntézu nukleových kyselin, například fosfoamiditové metody. Tyto metody jsou ve výhodném provedení vynálezu uskutečňovány na automatickém DNA syntetizátoru.
Jako templáty pro PCR a RT-PCR lze použít genomovou DNA a mRNA z mikroorganismů produkujících ML-236B. Místo mRNA může být také použita jako templát pro RT-PCR celková RNA.
PCR produkt nebo RT-PCR produkt lze klonovat pomocí začlenění do vhodných DNA vektorů. Výběr DNA vektorů použitých pro klonovací kroky není omezen. Soupravy pro snadné klonování PCR a RT-PCR produktů jsou komerčně dostupné. Jako příklad lze »· · ···· ·· • · ··« ·· ·· ·· ·· uvést Originál TA Cloning Kit (vyráběný firmou Invitrogen: užívající pCR 2.1 jako DNA vektor), který je vhodný pro takovýto druh klonování.
Za účelem získání klonovaného PCR produktu se musí pěstovat transformované hostitelské buňky obsahující plazmidy s vloženými požadovanými PCR produkty a po té musí být plazmidy z buněk vyjmuty a purifikovány. Vložený DNA fragment se potom získá ze vzniklého plazmidu.
Kultivaci transformovaných hostitelských buněk lze provést za podmínek vhodných pro daný druh hostitelských buněk. Ve výhodném uspořádání používané hostitelské buňky, Escherichia coli, se mohou kultivovat LB mediu [1 % hmotn. trypton, 0,5 % hmotn. kvasničný extract, 0,5 % hmotn. chlorid sodný] při teplotách v rozmezí od 30 do 37°C po dobu od 18 hodin do dvou dnů za třepání.
Příprava plazmidů z kultury transformovaných hostitelských buněk může být uskutečněna pomocí znovu napěstování hostitelských buněk a izolací plazmidů nekontaminovaného dalšími buněčnými komponentami, jako je genomová DNA nebo proteiny hostitelských buněk. Příprava plazmidové DNA z buněčné kultury Escherichia coli může být provedena alkalickou metodou podle Maniatise [popsáno v: Maniatis, T., a další., Molecular cloning, a laboratory manual, 2. vydání, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Komerčně jsou dostupné i soupravy na získám plazmidu, pomocí nichž lze docílit vyšší čistoty. Ve výhodném provedení vynálezu se používá Plazmid Mini Kit [vyráběný firmou QIAGEN AG]. Mimoto je komerčně dostupná i souprava pro přípravu plazmidu ve velkém. Ve výhodném provedení vynálezu se používá Plasmid Maxi Kit (vyrobený firmou QIAGEN AG).
Koncentrace vzniklé plazmidové DNA se dá určit měřením absorbance při vlnové délce 260 nm po náležitém naředění DNA vzorku a výpočtem na základě předpokladu, že roztok mající hodnotu absorbance OD260 rovnající se 1 obsahuje 50 pg/ml DNA (popsáno v: Maniatis, T., a další, supra).
Čistota DNA může být určena výpočtem z poměru absorbancí při vlnových délkách 280 a 260 nm (popsáno v: Maniatis, T., a další, supra).
Způsoby značení nukleokyselinových sond lze obecně rozdělit na radioaktivní a neradioaktivní. Výběr radionuklidu pro radioaktivní značení není obecně ničím omezen a může to být například 32P, 35S, 14C a další. Ve výhodném uspořádání vynálezu se ke značení upřednostňuje užití 32P. Výběr činidla pro neradioaktivní značení není také obecně ničím omezen, tak tedy lze pro neradioaktivní značení nukleové kyseliny obecně užít například, digoxigenin, biotin a další, ve výhodném provedení se užívá přednostně digoxigenin.
Způsob značení sond nukleových kyselin není obecně omezen. Přednostně se užívají běžné způsoby, například způsoby, jako metody zavádějící značku do PCR produktu pomocí PCR nebo RT-PCR užitím značených nukleotidových substrátů, nick translace, užití random primerů, terminalního značení a způsobů syntézy oligonukleotidové DNA pomocí značených nukleotidových substrátů. Vhodná metoda se vybere z předešlého výčtu v závislosti na druhu sondy nukleové kyseliny.
Potvrzení přítomnosti stejné nukleotidové sekvence v genomu mikroorganismu produkujícího ML-236B, která odpovídá nukleotidové sekvenci sondy se potvrdí v Southem blotu hybridizací s genomovou DNA řečeného mikroorganismu produkujícího ML-236B.
Southem blotová hybridizace se provádí podle postupu popsaného Maniatisem [popsáno v: Maniatis, T., a další, supra].
Značená nukleokyselinová sonda, připravená podle postupu popsaného výše, se užívá k prozkoumání genomové DNA knihovny. Výběr skríningového postupu není obecně omezen, za předpokladu, že je obecně vhodný pro klonování genu. Ve výhodném provedení vynálezu se používá postup hybridizace kolonií [popsáno v: Maniatis, T., a další, supra].
Kultivace kolonií užitých pro hybridizací kolonií se provádí za podmínek vhodných pro dané hostitelské buňky. Kultivace Escherichia coli, preferovaného hostitele, se děje inkubací buněk na LB agarovém mediu [1 % hmotn. trypton, 0,5 % hmotn. kvasničný extrakt, 0,5 % hmotn. chlorid sodný, 1,5 % hmotn. agarosa] při teplotách mezi 30 a 37 °C po dobu 18 hodin až dvou dnů.
Příprava rekombinantního DNA vektoru z pozitivního klonu získaného hybridizací kolonií se většinou provádí extrakcí plazmidu z kultury pozitivního klonu získaného hybridizací kolonií a jeho purifíkací.
Transformovný kmen Escherichia coli, Escherichia coli pML48 SANK71199 reprezentující pozitvní klon získaný podle způsobů popsaných ve vynálezu, byl uložen ve Výzkumném ústavu přírodních věd a technologií Agentury pro průmyslové vědy a technologie ( Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology) 7.července 1999 pod přístupovým číslem FERM BP-6780, v souladu s Budapešťskou smlouvou o uchovávám mikroorganismů.
Typický DNA vektor nesený Escherichia coli pML48 SANK71199 byl označen jako pML48.
Potvrzení faktu, že rekombinantní DNA vektor, který je přítomen v pozitivním klonu obsahuje genomovou DNA související s biosyntézou ML-236B, lze vhodně provést pomocí určení nukleotidové sekvence inzertu rekombinatního DNA vektoru hybridizací v Southem
blotu nebo expresí inzertu a určení jeho funkce.
Nukleotidová sekvence DNA může být určena podle Maxamovy a Gilbertovy chemické modifikační techniky [popsáno v: Maxam, A. Μ. M. a Gilbert, W., Methods in Enzymology, 65,499 (1980)] nebo pomocí dideoxy řetězové terminační techniky [popsáno v: Messing, J. a Vieira, J., Gene, 19,269 (1982)]. Další způsoby určení těchto sekvencí jsou známy odborníkům v daném oboru. Plazmidová DNA, která se užívá k určení nukleotidové sekvence je ve výhodném provedení vysoce čistý vzorek, tak, jak je to popsáno výše.
Nukleotidová sekvence inzertu pML48 je ukázána v SEKV. ID. Č. 1 ze Seznamu sekvencí. Nukleotidová sekvence znázorněná v SEKV. ID. Č. 2 v Seznamu sekvencí je zcela komplementární k nukleotidové sekvenci znázorněné v SEKV ID. Č. 1. Obecně, nukleotidová sekvence genomové DNA může vykazovat genetický polymorfismus v rámci druhů, to znamená allogenní rozdíly. Mimoto je známo, že v procesu klonování DNA a jejího sekvenování, může docházet s jistou frekvencí výskytu k substitucím nukleotudů nebo jejich alteracím. Proto tedy, genomová DNA související s biosyntézou ML-236B ve vynálezu také obsahuje genomovou a další DNA, které mohou hybridizovat k nukleotidům DNA od č. 1 do 34203 podle sekvence SEKV. ID. Č. 1 nebo 2 ze Seznamu sekvencí. Ve výhodném provedení jsou to genomové nebo jiné DNA, které mohou hybridizovat za striktních podmínek k nukleotidům DNA od č. 1 do 34203 podle sekvence SEKV. ID. Č. 1 nebo 2 podle Seznamu sekvencí. Tyto DNA zahrnují nukleotidy DNA od č. 1 do 34203 podle sekvence označené SEKV. ID. C. 1 nebo 2 ze Seznamu sekvencí, v němž jeden nebo více nukleotidů je substituováno, deletováno a/nebo přidáno. Navíc tyto hybridizující genomové nebo další DNA mohou zahrnovat DNA mající původ v mikroorganismech produkujících ML-236B, avšak jiných než je Penicillium citrinwn SANK13380, ve výhodném uspořádání jsou tyto DNA schopné zlepšit produkci ML-236B, jsou-li zavedeny do mikroorganismů produkujících ML-236B.
Genomovou DNA související s biosyntézou ML-236B lze vhodně analyzovat pomocí následujícíchzpůsobů očíslovaných od 1) do 3).
1) Analýza pomocí počítačového programu analyzujícího geny
Geny obsažené v genomové DNA lze lokalizovat pomocí programu pro vyhledávání genů (dále označovaného jako „GRAIL“) a pomocí programu pro hledání homologních sekvencí (BLASTN a BLASTX).
GRAIL je program, který vyhledává strukturní geny v rámci genomové DNA pomocí dělení genomových sekvencí podle sedmi parametrů pro hodnocení výskytu genové sekvence a integrace výsledků pomocí neurální síťové metody [popsáno v: Uberbacher, E.C. a
Mural, R.J., Proč. Nati. Acad. Sci. USA., 88,11261 (1991)]. Jako příklad lze uvést ApoCom GRAIL Toolkit [vyrobeno firmou Apocom corporation].
BLAST je program používající algoritmus k určení homologie nukleotidových a aminokyselinových sekvencí [popsáno v: Altschul, S.F., Madden, T. L., a další, Nucl. Acids Res., 25,3389 (1997)].
Pozici a orientaci strukturního genu ve vzorku sekvence genomové DNA lze předpovědět na základě dělení DNA sekvence na části o vhodné délce a provedení výzkumu homologie v databázi genetických dat pomocí BLASTN. Pozici a orientaci strukturního genu ve vzorku sekvence testované genomové DNA lze předpovědět pomocí translace rozdělené sekvence genomové DNA do šesti translačních rámců (tři na sense vlákně a tři na antisense vlákně) a následujícím provedení průzkumu homologie odvozených aminokyselinových sekvencí v peptidové databázi BLASTX.
Kódující oblasti pro strukturní geny jsou někdy v genomové DNA přerušeny introny z eukaryotických organismů. K provedení analýzy, zda strukturní geny obsahují takovéto mezery, lze výhodně použít BLAST program pro sekvence obsahující mezery, který je efektivnější a nazývá se Gapped-BLAST program (instalovaný v BLAST2: Wisconsin GCG balíček ver. 10,0).
2) Analýza podle způsobu hybridizace v Northem blotu
Expresi strukturního genu předpovězenou na základě analýzy popsané v odstavci 1) lze studovat pomocí Northem blot hybridizačního postupu.
Ve výhodném provedení vynálezu se z mikroorganismu produkujícího ML-236B získá celková RNA. Kultura preferovaného mikroorganismu produkujícího ML-236B Penicillium citrinum se získá inokulací řečeného mikroorganismu získaného z konzervy na šikmém agaru do media MGB3-8, poté následuje inkubace s třepáním. Inkubace probíhá v rozmezí teplot mezi 22 až 28 °C, po dobu jednoho až čtyř dnů.
Výběr způsobu extrakce RNA z mikroorganismu produkujícího ML-236B není omezen a výhodně se využívá způsobu za užití činidel guanidinthiokyanát-horký fenol, guanidinthiokyanát - guanidinchlorovodíkové kyseliny a dalších podobných. Příklady komerčně dostupných kitů pro přípravu celkové RNA o vyšší čistotě zahrnují RNAasy Plant Mini Kit (vyrobený firmou Qiagen AG). Mimoto lze mRNA získat nanesením celkové RNA na oligo (dT) sloupec a vymýt ze sloupce adsorbovanou frakci.
Přenos RNA na membránu, přípravu sondy, hybridizaci a detekci signálu lze provést obdobně, tak jak to bylo popsáno výše pro hybridizaci v Southem blotu.
• · · · · ·· · ···· ··· · • · · · ♦ · · · ·
3) Analýza 5'- konce a 3'-konce transkriptu
Analýzu 5'- konce a 3'-konce každého transkriptu lze provést podle postupem ‘RACE’ (rapid amplification of cDNA ends). RACE je metoda pro získání cDNA obsahující známou oblast nukleotidů a neznámou oblast na 5'-konci nebo 3'-konci genu. Provádí se pomocí RT-PCR s mRNA jako templátem [popsáno v: Frohman. M. A., Methods Enzymol. 218, 340(1998)].
5'-RACE se provádí podle následujícího postupu. První vlákno cDNA se syntetizuje pomocí užití reversní transkripční reakce s mRNA jako templátem. Jako primer se používají antisense oligonukleotidy (1), které jsou navrženy podle známé části nukleotidové sekvence. Na 3'-konec prvního vlákna cDNA se přidají pomocí terminální deoxynukleotidylové transferasy homopolymemí nukleotidové řetězce (řetězce sestávající z jednoho druhu báze). Potom se pomocí PCR amplifikuje dvojvláknová cDNA v oblasti 5'-konce za použití prvního vlákna cDNA jako templátu. V amplifíkační reakci se používají dva primery; DNA oligonukleotid ze sense vlákna obsahující sekvenci, která je komplementární k homopolymemí sekvenci a oligonukleotid (2) na antisense vlákně 3'-konce oligonukleotidu DNA (1) [popsáno v: Frohman, M.A., Methods in Enzymol., 218, 340 (1993]. Souprava pro 5' RACE je komerčně dostupná, ve výhodném provedení vynálezu se používá 5' RACE Systém for Rapid Amplification of cDNA ends, Verze 2,0 (vyrobeno firmou GIBCO).
3' RACE je způsob využívající polyA oblast existující na 3'-konci mRNA. Zvláště pak primární vlákno cDNA se syntetizuje pomocí reversní transkripční reakce za užití mRNA jako templátu a oligo d(T) adaptéru jako primeru. Potom se amplifikuje dvojvláknová cDNA 3'-koncové oblasti pomocí PCR, kdy se použije primární vlákno cDNA jako templát. Jako primery se užívají jednak DNA oligonukleotid (3) na sense vlákně navržený podle známé části nukleotidové sekvence sense vlákna a jednak oligo d(T) adaptér na antisense vlákně. Souprava pro 3' RACE je komerčně dostupná, ve výhodném provedení vynálezu se používá Ready-To-Go T-primed First-Strand Kit (společnosti Phramacia).
Při navrhování primerů pro postup RACE založených na známých oblastech požadovaných nukleotidových sekvencí je výhodné využít výsledky analýz 1) a 2).
Pomocí postupů popsaných výše v analýzách označených 1) až 3) se dá odvodit orintace strukturního genu na sekvenci genomové DNA, lokalizacaci místa pro transkripční počátek v strukturním genu, pozici iniciačního kodónu pro translaci a translačního terminačního kodónu. Na základě výše zmíněných informací lze získat každý strukturní gen i jejich cDNA, jmenovitě cDNA urychlující biosyntézu ML-236B.
V inkorporované sekvenci rekombinantní DNA vektoru pML48 podle předkládaného vynálezu se předpokládá přítomnost šesti strukturních genů. Jsou nazvány mlcA mlcB, mlcC, mlcD, mlcE, a mlcR. Předpokládá se, že mezi těmito geny mají následující geny mlcA, mlcB, mlcE a mlcR kódující oblast v sekvenci nukleotidů uvedené v SEKV. ID. Č. 2 v Seznamu seknencí. Dále se předpokládá, že mlcC a mlcD mají kódující oblast v nukleotidové sekvenci uvedené pod označením SEKV. ID. Č. 1 v Seznamu sekvencí.
Výše zmíněné příklady postupů k získání specifických cDNA podílejících se na urychlení biosyntézy ML-236B získáním výše popsaných strukturních genů zahrnují: klonování pomocí RT-PCR za užití primerů navržených podle sekvence každého strukturního genu a ohraničujících jejich DNA a klonováním z cDNA knihovny pomocí vhodných DNA sond navržených podle známých nukleotidových sekvencí. Avšak mohou být použity i další metody, které jsou známy odborníkům v daném oboru. Za účelem exprese funkční cDNA získané podle těchto postupů, je výhodné získat klon cDNA o úplné délce (full length clon).
V následujícícm textu jsou popsány způsoby získání cDNA urychlující biosyntézu ML-236B za použití RT-PCR.
,K získání cDNA urychlující biosyntézu ML-236B je třeba navrhnout pár primerů pro RT-PCR, a to tak, aby selektivně nasedly na každý templátový řetězec. Avšak není nezbytně nutné, aby primery pro RT PCR byly plně komplementární s každou částí templátového řetězce, za předpokladu, že splňují podmínky popsané výše. Vhodné primery pro RT-PCR, které mohou přisednout na antisense řetězec (dále označované jako „sense primery“) jsou sense primery, které jsou úplně komplementární s částí antisense řetězce (dále označované jako „nesubstituované sense primery“) nebo sense primery, které nejsou úplně komplementární k části antisense řetězce (dále v textu označované jako „částečně substituované sense primery“). Další použitelné primery pro RT-PCR, které mohou přisedat na sense řetězec (dále v textu označované jako „antisense primery“) jsou antisense primery, které jsou úplně komplementární k části sense řetězce (dále v textu označované jako „nesubstituované antisense primery“) nebo antisense primery, které nejsou úplně komplementární k části sense řetězce (dále v textu označované jako „částečně substituované antisense primery“).
Sense primer lze vhodně navrhnout tak, že získaný RT-PCR produkt obsahuje ATG kodón v příhodné původní pozici pro započetí translace. Ve výhodném uspořádám vynálezu RT-PCR produkt obsahuje ve čtecím rámci majícím originální ATG startovní místo pouze správný terminační kodón pro translaci a neobsahuje další přidané (spurious) stop místa pro translaci. Pozice iniciačního kodónu pro translaci těchto strukturních genů předpovězená v «1 · Μ · * ·«· »··· * · * · ·· · • « # · · · · · ♦ ·· ·« ·4>·*···** • · · · · · · ··
0 * * · ·· ·· ·· * · předloženém vynálezu je pro geny, které jsou součástí SEKV. ID. Č. I a SEKV. ID. Č. 2 ze Seznamu sekvencí znázorěna v tabulce 5.
Na 5'-konci nesubstituovaného sense primeru je ve výhodném uspořádání nukleotid ‘A’ z translačního iniciačního kodónu ATG nebo báze vyskytující se na straně jeho 5'-konce.
Částečně substituovaný sense primer selektivně dosedá na specifickou oblast v SEKV. ID. Č. I nebo SEKV. ID. Č. 2 ze Seznamu sekvencí, nukleotidová sekvence SEKV. ID. Č. 2 v Seznamu sekvencí bývá úplně komplementární k SEKV. ID. Č. I ze Seznamu sekvencí.
Jestliže částečně substituovaný sense primer obsahuje nukleotidovou sekvenci přítomnou na 3'- straně iniciačního translačního kodónu ATQ je výhodné, aby v této oblasti neobsahoval nukleotidovou sekvenci, kterou mají terminační kodóny (TAA, TAG nebo TGA) ve stejném čtecím rámci jako je ATG
Částečně substituovaný sense primer může obsahovat nukleotid „A“, nukleotidovou sekvenci „AT“ nebo „ATG“ (dále v textu budou označeny jako „nukleotid nebo nukleotidová sekvence m’), která odpovídá nukleotidu „A“, nukleotidová sekvenci „AT“ nebo „ATG“ translačního iniciačního kodónu (dále v textu značeno jako „nukleotid nebo nukleotidová sekvence m). Jestliže nukleotid m’je „A“, odpovídající „A“ ze sekvence „m“, dáváme přednost tomu, aby m’ „A“ byl lokalizován na 3'-konci částečně substituovaného sense primeru. Podobně, jestliže m’je AT, dáváme přednost tomu, aby tato m’ AT sekvence byla lokalizována na 3'-konci částečně substituovaného sense primeru. Jestliže nukleotid nebo nukleotidová sekvence m' je „ATG“, odpovídající m’ „ATG“, dáváme přednost tomu, aby tyto trinukleotidy, které jsou 3 'vzhledem k ATG v primeru, netvořily stop kodóny. Jinými slovy, pro trinukleotidy, jejichž 5' koncový nukleotid je (3 x n + l)-tý nukleotid (n reprezentuje celé číslo rovné jedné nebo vyšší) počítáno od A v m’ „ATG“ ve směru 3’-konce, nukleotidová sekvence trinukleotidu není ve výhodném provedení vynálezu ani TAA, TAG ani TGA. Výše popsané příměry mohou být užity k získám cDNA mající kodón pro methionin v pozici odpovídající iniciačnímu translačnímu kodónu v mRNA, která byla použita jako templát v RT-PCT.
Je-li 3'-konec částečně substituovaného sense primeru nukleotid v pozici (3 x η + l), ve výhodném uspořádání vynálezu není trinukleotid, který začíná v této pozici TAA, TAG nebo TGA v RT-PCR produktu získaném pomocí částečně substituovaného sense primeru, jako jednoho z primerů a RNA nebo mRNA z mikroorganismu produkujícícho ML-236B jako templátu nebo v PCR produktu získaném pomocí genomové DNA nebo cDNA jako templatu.
Pozice nukleotidu se počítá od ‘A’ v translačním iniciačním kodónu „ATG“ ve směru od 3'konce a kde ‘n’ reprezentuje celé číslo od jedné výše.
Je-li 3'-konec částečně substituovaného sense primeru nukleotid v pozici (3 x n + 2), triplet, pro který je pozice 3 x n+2 centrálním nukleotidem není ve výhodném uspořádání žádná z následujících sekvencí TAA, TAG nebo TGApro PCR nebo RT-PCR produkt získaný postupem popsaným výše.
Je-li 3'-konec částečně substituovaného sense primeru nukleotid v pozici (3 x n + 3), triplet, pro který je pozice 3 x n+3 nukleotidem 3' není ve výhodném uspořádání žádná z následujících sekvencí TAA, TAG nebo TGA.
Požadavky kladené na sense primer jsou diskutovány výše.
Antisense primer je navržen tak, že tvoří dohromady se sense primerem pár. cDNA kódující každý ze strukturních genů (mlcA, mlcB, mlcC, mlcD, mlcE a mlcR) lze amplifikovat pomocí RT-PCR ve směru ekvivalentním od N-konce k C-konci odpovídajících peptidů.
Výběr nesubstituovaných antisense primerů není omezen, dokud má antisense primer nukleotidovou sekvenci komplementární k nukleotidové sekvenci umístěné v oblasti terminačního místa pro translaci cDNA. Ve výhodném provedení vynálezu má primer na 5konci bázi, která je komplementární k bázi na 3'-konci translačního terminačního kodónu nebo májící tuto bázi na straně 5'-konce řečeného primeru. Ve výhodném uspořádání se používá primer obsahující tři báze, které jsou komplementární k terminačnímu kodónu translace. Tabulky 8 až 10 udávají terminační kodóny translace pro každý strukturní gen, sekvence komplementární k terminačním kodónům translace, aminokyselinové zbytky z Ckonce peptidů kódovaných každým ze strukturních genů, nukleotidové sekvence kódující aminokyselinové zbytky a jejich pozici v SEKV. ID. Č. 1 nebo SEKV. ID. Č. 2.
Částečně substituované antisense primery selektivně nasedají na specifické oblasti v nukleotidové sekvenci SEKV. ID. Č. 1 nebo SEKV. ID. Č. 2 ze Seznamu sekvencí.
Tyto všechny výše popsané požadavky jsou kladeny na antisense primer.
Pokud jsou zachovány výše zmíněné požadavky, lze k 5'- konci sekvence částečně substituovaného sense primeru a částečně substituovaného antisense primeru přidat vhodnou sekvenci nukleotidů. Výběr takovéto nukleotidové sekvence není prakticky limitován, pokud se primery užijí pro PCR. Příklady vhodných sekvencí včetně nukleotidových sekvencí vhodných pro klonování PCR produktů, jako jsou štěpná místa pro restrikční enzymy a nukleotidové sekvence obsahující vhodná štěpná místa restrikčních enzymů.
• · · ·· · · · · • · · · · · · · · « « · ····· · ·
Kromě toho, že sense primery i antisense primery jsou vhodně navrženy podle výše uvedených postupů, jsou dále i ve shodě s obecnými pravidly pro navrhování primerů pro PCR.
Jak bylo popsáno výše, jako templát pro RT-PCR lze využít mRNA nebo celkovou RNA z mikroorganismu produkujícího ML-236B. V předkládaném vynálezu cDNA urychlující biosyntézu ML-236B odpovídájí strukturnímu genu mlcE. Lze je získat návržením a syntézou páru primerů vhodných pro amplifíkaci celé kódující oblasti insertní sekvence pML48 ze strukturního genu mlcE a potom provést RT-PCR pomocí celkové RNA z SANK13380 jako templátu [primery reprezentované pomocí jednotlivých nukleotidových sekvencí SEKV. ID. Č. 35 a 36 ze Seznamu sekvencí].
cDNA urychlující biosyntézu ML-236B odpovídají strukturnímu genu mlcR byla získána podobnou cestou pomocí primerů reprezentovaných jednotlivými nukleotidovými sekvencemi SEKV. ID. Č. 39 a 40 ze Seznamu sekvencí.
Jak bylo popsáno výše, produkt z RT-PCR může být klonován vložením do vhodných DNA vektorů. Výběr DNA vektorů užívaných pro účely takovéhoto klonování není omezen a lze použít všechny vhodné vektory obecně užívané pro klonování DNA fragmentů. Soupravy pro snadné klonování RT-PCR produktů jsou komerčně dostupné a ve výhodném uspořádání se používá Originál TA Cloning Kit [vyrobený firmou Invitrogen: pomocí pCR 2.1 jako DNA vektoru].
Potvrzení funkční exprese cDNA urychlující biosyntézu ML-236B získané pomocí výše zmíněných postupů v mikroorganismech produkujících ML-236B lze získat klonováním cDNA do DNA vektoru vhodného pro funkční expresi v ML-236B produkujících mikroorganismech. Vhodné buňky jsou po té transformovány pomocí rekombinantního DNA vektoru a srovnává se schopnost biosyntézy ML-236B v transformovaných a netransformovaných hostitelských buňkách. Jestliže cDNA urychlující biosyntézu ML-236B je funkčně exprimována v transformované buňce, potom je schopnost biosyntézy ML-236B u transformované buňky vylepšena ve srovnání s touto schopností u hostitelské buňky.
Výběr DNA vektoru vhodného pro expresi v mikroorganismech produkuj ícícch ML236B [dále v textu nazývaný jako funkční expresní vektor] není omezen, pokud tento vektor může trasformovat mikroorganismy produkující ML-236B a může funkčně exprimovat polypeptid, který je kódován cDNA urychlující biosyntézu ML-236B v tomto organismu. Ve výhodném uspořádání je vektor stabilní v hostitelské buňce a má nukleotidovou sekvenci, která mu dovoluje replikaci v hostitelské buňce.
Vektor pro funkční expresi může obsahovat jednu nebo více cDNA urychlujících • * · · · · ··· • · · · ···· · ·» · ······ · ··· ······ •4 ··· ·· · ·· * biosyntézu ML-236B, například cDNA odpovídající strukturním genům zm/cE a/nebo mlcR.
Vektor pro funkční expresi může obsahovat jeden nebo více druhů DNA jiných, než jsou cDNA odpovídající strukturním genům mlcE a/nebo mlcR, které urychlují biosyntézu ML-236B, jestliže jsou vneseny do mikroorganismů produkujících ML-236B. Příklady takovýchto DNA zahrnují: cDNA odpovídající strukturním genům mlcA., mlcR, mlcC, nebo znZcD, genomové DNA podobné DNA pro biosyntézu ML-236B, DNA kódující expresní regulační faktoiy urychlující biosyntézu cDNA podle vynálezu pro ML-236 a podobné.
Vektor pro funkční expresi ve výhodném provedení vynálezu obsahuje nukleotidovou sekvenci poskytující vybraný fenotyp plazmidu v hostitelských buňkách a ve výhodném provedení vynálezu je to obvykle binární (člunkový) vektor.
Kromě toho, selektivní fenotyp může být fenotyp pro rezistenci na léky a tak podobně, ve výhodném provedení vynálezu je to rezistence k antibiotiku a v ještě výhodnějším uspořádání je to rezistence k ampicilinu nebo rezistence k hygromycinu B.
V případě, že expresní vektor je binárním vektorem, vektor ve výhodném uspořádání vynálezu obsahuje nukleotidovou sekvenci, která umožňuje vektoru replikaci v hostitelské buňce určitého jednoho nebo skupiny mikroorganismů a dále nukleotidovou sekvenci nezbytnou pro expresi polypeptidu kódovaného inzertem vektoru v jiném typu hostitelské buňky. Ve výhodném provedení vektor poskytuje různé vybrané fenotypy pro každou hostitelskou buňku v různých transfomovaných skupinách mikroorganismů. Požadavky kladené na kombinaci skupin mikroorganismů jsou podobné požadavkům kladeným na binární vektor užitý pro klonování a expresi genomové DNA související s urychlením biosyntézy ML-236B, která je předmětem předkládaného vynálezu.
V předkládaném vynálezu je vhodným binárním vektorem DNA vektor pSAK700, konstruovaný kombinací promotoru 3-fosfoglycerátkinasy (dále označované jako pgk), který je odvozen z Aspergillus nidulans existujícího v DNA vektoru pSAK333 (popsáno v : Japonská patentová přihláška Č. 3-262486), adaptoru pro zavedení cizího genu a pgk terminátoru existujícím v tomto pořadí v DNA, (viz obrázek 4).
Polypeptid lze exprimovat v mikroorganismech produkujících ML-236B vnesením cDNA odpovídající strukturnímu genu mlcE, který je popsán výše, do expresního vektoru popsaného výše. V předkládaném vynálezu byl pomocí vnesení cDNA odpovídající strukturnímu genu mlcE do adaptorového místa pSAK700 získán rekombinantní expresní vektor pSAKexpE . Sekvence vnesená do pSAKexpE, zejména nukleotidová sekvence cDNA odpovídající strukturnímu genu mlcE, je znázorněna v SEKV. ID. Č. 37 v Seznamu sekvencí. Podobně, cDNA rekombinantní expresní vektor pSAKexpR byl získán pomocí • · · ·· ·· · · ···· ··· · ·· · ····· · • · « ·· · é- · · · vnesení cDNA odpovídající strukturnímu genu zn/cR do adaptorového místa pSAK700. Do pSAKexpR vnesená sekvence, zejména nukleotidová sekvence cDNA odpovídající strukturnímu genu m/cR, je znázorněna SEKV. ID. Č. 41 v Seznamu sekvencí.
Escherichia coli pSAKexpE SANK 72499 je kmen Escherichia coli transformovaný pSAKexpE, který byl uložen v Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology dne 25. ledna 2000 pod postupovým číslem FERM BP-7005 v souladu s Budapešťskou smlouvou o ukládání mikroorganismů. Escherichia coli pSAKexpR SANK 72599 je kmen Escherichia coli transformovaný pSAKexpR a byl uložen v Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology dne 25. ledna 2000 pod přístupovým číslem FERM BP7006 v souladu s Budapešťskou smlouvou o ukládání mikroorganismů.
Aby bylo docíleno exprese cDNA urychlující biosyntézu ML-236B, příbuzné genomové DNA urychlující biosyntézu ML-236B nebo jejich fragmentů, byly také vybrány vhodné způsoby transformace, které závisí na hostitelské buňce. Transformace Penicillium citrinum, což je ve výhodném uspořádání mikroorganismus produkující ML-236B, může být dosaženo pomocí přípravy protoplastů ze spor Penicillium citrinum a po té vnesení rekombinantního vektoru DNA do protoplastů [popsáno v: Nara, F., a dalš, Curr. Genet. 23, 28 (1993)].
Vhodné spory získané z kultury Penicillium citrinum uchovávané na šikmém agaru se inokulují na plotny PGA agarového media a po té se inkubují při 22 až 28 °C po dobu 10 až 14 dnů. Spory se po napěstování sklidí z ploten alxl07-lxl09 spor se inokuluje do 50 až 100 ml YPL-20 kultivačního media [složení: 0,1 % hmotn. kvasničný extrakt (vyrobený firmou Difco), 0,5 % hmotn. polypepton (vyrobený firmou Nihon Seiyaku), 20 % hmotn. laktosa, pH 5,0] a potom se inkubují při 22 až 28 °C po dobu 18 hodin až dvou dnů. Z kultury se získají klíčící spory a nechájí se na ně působit enzymy degradující buněčnou stěnu; tak jsou získány protoplasty. Výběr enzymů degradujícíh buněčnou stěnu není omezen, pokud se jimi degraduje buněčná stěna Penicillium citrinum a nemají škodlivý vliv na mikroorganismus. Příklady těchto enzymů jsou: zymolyasa, chitinasa a další podobné.
Smíchání rekombinantního DNA vektoru obsahujícího cDNA urychlující biosyntézu ML-236B a mikroorganismů produkujících ML-236B nebo jejich protoplastů, dovoluje za určitých vhodných podmínek vnesení rekombinantího DNA vektoru do zmíněných protoplastů, čímž vzniká transformant.
Kultivaci transformantů mikroorganismů produkujících ML-236B je výhodné uskutečnit za podmínek vhodných pro každou zvolenou hostitelskou buňku. Kultivaci ·· · · · · · · · • · · · ··· · · · • · · ····· ·· transformantu Penicillium citrinum, mikroorganismu preferovaného jako mikroorganismus produkující ML-236B, lze provést kultivací dříve transformovaného protoplastu za podmínek vhodných k regeneraci buněčné stěny a následným pěstováním. Zejména transformovaný protoplast Penicillium citrinum lze nanést na VGS středně vrstvě agarové medium [složení: Vogelovo minimální medium, 2 % hmotn. glukosa, 1M glucitol, 1,5 % hmotn. agar] a VGS agarové medium pro horní vrstvu medium [složení: Vogelovo minimální medium, 2 % hmotn. glukosa, 1M glucitol, 1,5 % hmotn. agar] obsahující 800 pg/l hygromycinu B. Zde se potom inkubuje po dobu při 22 až 28 °C po dobu 7 až 15 dnů. Vzniklé kmeny se rozklonují inkubací při teplotě 22 až 28 °C na PGA mediu. Kmen se inokuluje pomocí platinové jehly na šikmý gel připravený z PGA media, potom se inkubuje při teplotě 22 až °C po dobu 10 až 14 dnů. Uchovávání kmene se děje při teplotě 0 až 4 °C.
Jak bylo popsáno výše, ML-236B lze efektivně produkovat inokulací Penicillium citrinum transformantem získaným z šikmého agaru, tak, jak je popsáno výše, kteiý má obnovené buněčné stěny, v mediu MBG 3-8, následnou inkubací při 22 až 28 °C po dobu 7 až 12 dnů za třepání. Za účelem produkukce ML-263B lze Penicillium citrinum, jako hostitele, pěstovat v tekutém mediu......
Purifikace ML-236B z kultury transformovaného mikroorganismu produkujícího ML-236B se provede kombinací různých metod obecně užívaných pro purifikace produktů v přirozeném stavu. Výběr takovýchto metod není omezen a může zahrnovat například centrifugaci, separaci pevných a kapalných součástí pomocí filtrace, působení louhů a kyselin, extrakci pomocí organických rozpouštědel, rozpouštěním, chromatografické postupy, jako je adsorpční chromatografie, dělící chromatografie a další podobné postupy, dále pak krystalizaci a podobné postupy. ML-236B může být buď ve formě hydroxykyseliny nebo laktonu, které mohou být vratně měněny. Hydroxykyselina se konvertuje na svoji sůl, která je daleko stabilnější. Využitím těchto fyzikálních vlastností lze získat ML-236B buď ve formě hydroxykyseliny (dále označováno jako volná hydroxykyselina), solí hydroxykyseliny ML236B (dále označováno jako sůl hydroxykyseliny) nebo jako laktonová forma ML-236B (dále značeno jako lakton).
Kultura se podrobí alkalické hydrolýze za zvýšené teploty nebo za pokojové teploty. Tím se otevře kruh a nastane konverze na sůl hydroxykyseliny. Dále se reakční roztok okyselí a následuje filtrace. Filtrát se extrahuje pomocí organických rozpouštědel, kterými se oddělí voda a získá se tak požadovaný produkt ve formě volné hydroxykyseliny. Výběr organického rozpouštědla není ničím omezen. Příklady různých rozpouštědel zahrnují: alifatické uhlovodíky jako je hexan, heptan a další podobné; aromatické uhlovodíky jako je benzen, ·· · 9 9 · · 99
9 9 9 9 9 9 ··· • · · ····· · · toluen a další podobné; halogenované uhlovodíky jako je metylchlorid, chloroform a další; étery, jako je dietylether a další; estery jako je etylmravenčnan, etylacetát a další; nebo směsi sestávající ze dvou Či více rozpuštědel.
Požadovaná sloučenina může být získána jako sůl hydroxykyseliny pomocí rozpuštění volné hydroxykyseliny ve vodném roztoku soli alkalického kovu, jako je hydroxid sodný.
Mimoto, požadovaná sloučenina může být získána jako lakton, uzavřením kruhu zahřátím volné hydroxykyseliny v organickém rozpouštědle, dehydratací nebo pomocí dalších vhodných způsobů.
Je možné purifíkovat a izolovat volné hydroxykyseliny, hydroxykyseliny nebo laktony získat tyto pomocí sloupcové chromatografie a dalších podobných metod. Doporučení pro užití sloupců v chromatografii není ničím omezeno. Příklady těchto sloupců zahrnují: Sephadex LH-20 (vyrobeno firmou Pharmacia), Diaion HP-20 (vyrobeno firmou Mitsubishi Kagaku), silikagel, nosič pro reversní fázi a další podobné, ve výhodném uspořádání vynálezu se doporučuje užití nosičů série Cl8.
Výběr způsobů kvantifikace ML-236B není ničím omezen, výhodně se užívají způsoby běžně používané pro kvantifikaci organických sloučenin. Příklady těchto metod zahrnují: reversní fázi vysokotlaké kapalinové chromatografie (dále nazývané „reversní fáze HPLC“) a další. Kvantifikaci pomocí reversní fáze HPLC lze provést podrobením kultury mikroorganismu produkujícího ML-236B alkalické hydrolýze, nanesením rozpustné fáze na reversní fázi HPLC za užití sloupce Cl8, měřením UV absorpce a přepočtem hodnot absorbance na jednotky odpovídající množství ML-236B. Výběr sloupců C18 není ničím omezen, ve výhodném provedení vynálezu je Cl 8 sloupec užívaný obecně pro reversní fázi HPLC. Příklady těchto sloupců zahrnují následujícíc: SSC-ODS-262 (průměr 6 mm, délka 100 mm, vyroben firmou Senshu Kagaku) nebo další. Výběr rozpouštědel pro mobilní fázi není také ničím zvláštním omezen, za předpokladu, že jsou to rozpouštědla obecně užívaná pro reversní fázi HPLC. Je to například 75 % obj. methanol - 0,1% obj. trietylamin - 0,1 % obj. kyselina octová a další. Nanese-li se ML-236B při pokojové teplotě na sloupec SSCODS-262, kde je jako mobilní fáze užita směs rozpuštědel 75 % obj. methanol - 0,1 % obj. trietylamin -0,1 % obj. kyselina octová při rychlosti 2 ml/minutu, ML-236B se eluuje po 4,0 minutách. ML-236B může být detekován pomocí UV detektoru pro HPLC. Absorpční vlnové délky pro UV detekci leží v rozmezí 220 až 280 nm, ve výhodném uspořádání mezi 220 až 260 nm, v ještě výhodnějším provedení vynálezu se absorpční vlnová délka rovná 236 nm.
Pomocí předkládaného vynálezu jsou připraveny farmaceutické kompozice obsahující ML-236B získaný způsoby popsanými ve vynálezu, které obsahují ještě farmaceutický nosič.
Dále jsou připraveny farmaceutiské kompozice obahující pravastatin připravený z ML-236B získaného užitím předkládaného vynálezu, které obsahují ještě farmaceutický nosič.
Farmaceutické kompozice podle vynálezu mohou být tradiční a tytéž, jako ty, které byly využity pro již existující sestavení ML-236B nebo pravastatin.
Způsoby léčby jsou také součástí předkládaného vynálezu a zahrnují sloučeniny nebo kompozice k léčení hyperlipemie a dalších stavů.
Vynález je v dalším textu popsán do větších detailů pomocí následujících obrázků a příkladů. Příklady jsou ilustrativní, ale nikoli vyčerpávající, pro užití předkládaného vynálezu. Přehled obrázků na výkrese
Obrázek 1 je diagram znázorňující konstrukci DNA vektoru pSAKcosl;
Obrázek 2 znázorňuje výsledky strukturním genové analýzy pro vloženou sekvenci pML48;
Obrázek 3 ukazuje hybridizaci metodou Northem blotu pro vloženou sekvenci pML48;
Obrázek 4 je diagram znázorňující konstrukci cDNA expresního vektoru pSAK700;
Obrázek 5 ukazuje RT-PCR analýzu přepisu mlc A-E a R v pSAKexpR transformantu.
Obrázek 6 ukazuje RT-PCR analýzu pro přepis mlcE v pSAKexpE transformantu.
Příklady provedení vynálezu
Příklad 1: Konstrukce vektoru pSAKcosls
Plazmid pSAK333 obsahující gen pro hygromycin B fosfotransferasu (dále označovaný jako „HPT“) získaný původně z Escherichia coli (Japonská patentová přihláška Č. 3-262486) byl naštěpen restrikčním enzymem BamHI (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) a
po té byl ošetřen pomocí T4DNA polymerasy (výrobek firmy Takara Shuzo Co., Ltd., Japonsko), aby vznikly tupé konce.
DNA fragment získaný způsobem popsaným výše se samočinně ligoval do cirkulámí formy pomocí soupravy DNA ligation kit Ver.2 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) a tímto fragmentem byly transformovány kompetentní buňky kmene JM 109 Escherichia coli (výrobek firmy Takara Shuzo Co., Ltd., Japonsko). Z transformovaných buněk Escherichia coli byl vybrán kmen, obsahující plazmid, ve kterém bylo vynecháno štěpné místo pro BamHI, který byl označen jako pSAK360.
pSAK 360 byl naštěpen restrikčním enzymem PvuII, dále ošetřen alkalickou fosfatasou, čímž se získaly fragmenty, které byly na 5’- konci defosforylovány.
Z kosmidového vektoru pWE15 (vyráběný firmou STRATAGENE ) byl získán fragment SallScal (kolem 3 kb) obsahující cos místo, na který se působilo T4 DNA polymerasou, aby byly získány tupé konce. Tento vektor byl následně ligován do PvuII místa pSAK360. Takto získanou DNA byly transformovány buňky JMI 09. Z transformovaných Escherichia coli byly vybrány kmeny, které obsahovaly plazmid se zabudovaným fragmentem Sall-Scal (kolem 3kb) do místa PvuII. Kmeny nesoucí tento plazmid byly označeny pSAKcosl. pSAKcosl obsahuje štěpné místo pro restrikční enzymy BamHI, EcoRI a Notl, každé místo má svůj původ v pWE15. pSAKcosl nese gen pro ampicilinovou resistenci a gen pro rezistenci k hygromycinu jakpo selekční markéry.
V následujících příkladech, kdy se užívá Escherichia coli jako hostitelského organismu, se provádí selekce pSAKcosl transformantů nebo transformantů pSAKcosl obsahujících cizí genový inzert, pomocí přidání 40 pg/ml ampicilinu (Ampicilin: vyrobeno firmou Sigma) do užívaného media. Používá-li se jako hostitelský organismus Penicillium citrinum kmen SANK13380, selekce pSAKcosl transformantů nebo transformantů pSAKcosl obsahujících cizí genový inzert se provádí přidáním 200 pg/ml hygromycinu (Hygromycin B: vyrobeno firmou Sigma) do používaného media.
Způsob konstrukce pSAKcosl je zobrazena na obrázku 1.
Příklad 2: Příprava genomové DNA z Penicillium citrinum kmene SANK 13380
1) Kultura Penicillium citrinum kmene SANK 13380
Výsev kultury Penicillium citrinum kmene SANK 13380 byl proveden na šikmém PGAagarovém mediu. Jmenovitě, agar byl inokulován Penicillium citrinum SANK 13380 za užití platinové jehly a byl udržován při 26 °C po dobu 14 dnů. Kultura byla po té skladována při 4 °C.
Hlavní kultivace se prováděla v tekuté provzdušněné kultuře. Buňky z 5 mm čtverečních odebraných z kultury uchovávané na šikmém agaru, zmíněné výše, se inokulovaly do 50 ml MBG3-8 media v 500 ml konických lahvích a ponechaly se inkubovat při 26 °C za třepání při otáčkách 210 ot./min po dobu 5 dnů.
2) Příprava genomové DNA z Penicillium citrinum SANK 13380
Kultura získaná v kroku 1) se centrifuguje při 10000 x G za pokojové teploty po dobu 10 minut a buňky se sklidí. 3 g (mokrá váha) buněk se třou v třecí misce vychlazené pomocí suchého ledu, až vznikne jejich prášková forma. Rozetřené buňky se vloží do centrifiigační kyvety naplněné pufrem obsahujícícm 20 ml 62,5 mM EDTA-2Na (výrobek firmy Wako Pure Chemical Industries, Ltd.) - 5% hmotn. SDS - 50 mM Tris-chlorovodíkové kyseliny (výrobek firmy Wako Pure Chemical Industries, Ltd.) (pH 8,0) a lehce se promíchají. Potom se nechají stát při teplotě 0 °C po dobu jedné hodiny. Následně se přidá 10 ml fenolu nasyceného směsí 10 mM Tris-chlorovodíková kyselina - 0,1 mM EDTA-2Na (pH 8,0, dále označováno „TE“). Směs se nechá jemně míchat po dobu 1 hodiny při teplotě 50 °C.
Po centrifugaci při pokojové teplotě, 10000 x G po dobu 10 minut se odebere 15 ml horní vrstvy-vodné fáze a přemístí se do další centrifugační zkumavky. K roztoku se přidá poloviční objem ΊΈ nasyceného fenolem a poloviční objem roztoku chloroformu. Směs se nechá míchat po dobu dvou minut a poté se centrifuguje při pokojové teplotě při 10000 x G po dobu 10 minut (tento proces se dále nazývá „fenol-chloroformová extrakce“). K 10 ml vrchní vrstvy (vodní fáze) se přidá 10 ml 8M octanu amonného (pH 7,5) a 25 ml 2-propanolu (výrobek firmy Wako Pure Chemical Industries, Ltd.); následuje zchlazení na -80 °C po dobu 15 minut a centrifugace při 4 °C a 10000 x G po dobu 10 minut.
Po precipitaci se precipitát rozpustí v 5 ml ΊΈ, do kterého byly přidáno 20 μΐ roztoku 10 mg/ml ribonukleasy A (vyrobeno firmou Sigma) a 250 jednotek ribonukleasy TI (vyrobeno firmou GIBCO). Následuje inkubace při 37 °C po dobu 20 minut. Po té se do směsi přidá 20 ml 2-propanolu a nechá se mírně míchat. Následně se vlákna genomové DNA namotají na špičku Pasteurovy pipety a rozpustí se v jednom ml TE pufru.
Do roztoku DNA se přidá 0,1 násobek objemu 3 M octanu sodného (pH 6,5) a 2,5 násobek objemu ethanolu. Roztok se nechá chladit při - 80 °C po dobu 15 minut a potom se centrifuguje při 4 °C, 10000 x G po dobu pěti minut (dále se tento postup bude nazývat „ethanolové srážení“). Vzniklá sraženina se rozpustí v 200 μΐ TE a vzniklý roztok je frakce genomové DNA.
Příklad 3: Příprava genomové DNA knihovny Penicillium citrinum SANK13380
1) Příprava genomových fragmentů DNA
K vodnému roztoku 100 μΐ genomové DNA (50 pg) z Penicillium citrinum SANK13380 získané postupem popsaným v příkladě 2 se přidá 0,25 jednotek Sau3 AI (Takara Shuzo Co., Ltd., Japonsko). V intervalech 10, 30, 60,90 a 120 s se odebírají ze směsi vzorky po 20 μΐ a ke každému vzorku se přidá 0,5 M EDTA (pH 8,0), čímž se ukončí reakce katalyzovaná restrikčními enzymy. Vzniklé, částečně naštěpené, fragmenty DNA se rozdělí pomocí elektroforézy na agarosovém gelu a z agarosy se vyjmou fragmenty obsahující DNA o molekulové hmotnosti 30 kb a více.
Vyříznutý gel je následně rozdrcen a vzniklá drť se vloží do centrifugačně filtrační jednotky Ultra Free C3 Centrifuged Filtration Unit (vyrobeno firmou Japan Milipore). Gel se chladí na -80 °C po dobu 15 minut, dokud nezmrzne. Potom je gel roztaven zahřátím inkubací při 37 °C po dobu 10 minut. Pro extrakci DNA se vzniklý roztok se centrifuguje při 5000 x G po dobu 5 minut. DNA se podrobí fenol - chloroformové extrakci a ethanolovému srážení. Vzniklé precipitáty se rozpustí v odpovídajícím malém množství TE.
2) Úprava DNA vektoru pSAKcosl pSAKcosl se štěpí pomocí restrikčních enzymů BamHI (Takara Shuzo Co., Ltd., Japonsko) a po té se podrobí působení alkalické fosfatasy (Takara Shuzo Co., Ltd., Japonsko) při 65 °C po dobu 30 minut. Výsledná reakční směs se podrobí následně fenol-chloroformové extrakci a ethanolovému srážení. Vzniklý precipitát se rozpustí v malém množství TE.
3) Ligace a in vitro pakážování
Smíchá se fragment genomové DNA (2 pg) popsaný v předchozím kroku 1) a pSAKcosl (1 pg), který byl podroben úpravě popsané výše. Po té se provede ligace při 16 °C po dobu 16 hodin za užití DNA ligačního kitu Ver.2 (Takara Shuzo Co., Ltd., Japonsko). Vzniklý reakční roztok se podrobí fenol - chloroformové extrakci a ethanolovému srážení. Vzniklé precipitáty se rozpustí v 5 μΐ TE. Takto vzniklý roztok ligačního produktu se podrobí in vitro pakážování pomocí GIGAPAKII Gold kitu (vyrobeno firmou STRATAGENE), tímto se získají transformanty Escherichia coli obsahující rekombinantní DNA vektor. Na plotnu, na které se vytvořily kolonie transformantů Escherichia coli se přidají 3 ml LB media a po té se kolonie z plotny sklidí seškrábáním kolonií pomocí buněčné škrabky (dále se tento produkt nazývá získané buňky- roztok 1). Plotna se omyje ještě dalšími 3 ml LB media a buňky takto získané se nazývají jako získané buňky - roztok 2. K roztokům získaných buněk 1 i 2 se přidá glycerol do konečné koncentrace 18 % (dále označováno jako roztok obsahující buňky Escherichia coli), který se uchovává při - 80 °C jako genomová DNA knihovna Penicillium citrinum SANK13380.
Příklad 4: Amplifikace fragmentů PKS genu pomocí PCR za užití genomové DNA z Penicillium citrinum SANK13380 jako templátu
1) Návrh a syntéza primerů pro PCR
Na základě aminokyselinové sekvence genu PKS z Aspergillus flavus (popsáno v: Brown, D.W., a další, Proč. Nati. Acad. Sci. USA, 93,1418 (1996)) byly navrženy a syntetizovány degenerované primery, které jsou uvedeny v sekvencích označených SEKV. ID. Č. 3 a 4 uvedných v seznamu sekvencí. Syntéza byla provedena fosfoamiditovou metodou. SEKV. ID. Č. 3 ze Seznamu sekvencí:
gayacngcntgyasttc
SEKV. ID. Č. 4 ze Seznamu sekvencí: tcnccnknrcwgtgncc .
V uvedených nukleotidových sekvencích SEKV. ID. Č. 3 a 4, n reprezentuje inosin (hypoxanthin), y reprezentuje t nebo c, s reprezentuje g nebo c, k reprezentuje g nebo t, r reprezentuje g nebo a, dále w reprezentuje a nebo t.
2) Amplifikace segmentů DNA pomocí PCR μΐ reakčního roztoku obsahuje primery pro PCR popsané v předchozím kroku 1) (každý v koncentraci 100 pmol), genomová DNA z Penicillium citrinum SANK13380 získané postupem v Příkladu 2 (500 ng), 0,2 mM dATP, 0,2 mM dCTP, 0,2 mM dGTP, 0,2 mM dTTP, 50 mM chlorid draselný, 2 mM chlorid hořečnatý a 1,25 jednotek Ex. Tac DNA polymerasy (Takara Shuzo Co., Ltd., Japonsko). Uvedený roztok se podrobí reakčním cyklům sestávajících ze tří následných kroků: jedna minuta při 94 °C, dvě minuty při 58 °C a 3 minuty při 70 °C. Uvedený cyklus tří kroků se 30 krát opakoval; tímto způsobem došlo k amplifikaci DNA fragmentů. PCR rekce byla prováděna v termocyklátoru TaKaRa PCR Thermal Cycler MP TP 3000 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko).
Amplifikované DNA fragmenty byly podrobeny elektroforéze na agarosovém gelu a agarosový gel obsahující DNA fragmenty mající velikost okolo 1,0 až 2,0 kb byly z gelu vyříznuty. Z vyříznutého gelu se získala DNA a poté se podrobila fenol-chloroformové extrakci a ethanolovému srážení. Vzniklé percipitáty se rozpustily v malém nožství TE.
3) Ligace a transformace
Fragmenty DNA získané postupem popsaným v kroku 2) byly ligovány do plazmidu pCR 2.1 za užití TA klonovacího systému CR2,1 (vyrobeno firmou Invitrogen), přičemž plazmid je dodáván jako součást soupravy. Za účelem získání transformantů byl plazmid transformován do Escherichia coli kmene JMI09.
Z výsledných transformantů bylo vybráno několik kolonií a ty byly množeny podle způsobu přípravy popsaném Maniatisem a dalšími, [popsáno v: Maniatis, T., a další, Molecular cloning, laboratorní manuál, druhé vydám, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Jmenovitě, každá kolonie se inokulovala do 24 ml zkumavky obsahující 2 ml LB media a po té se ponechala inkubovat při 37 °C po dobu 18 hodin s třepáním.
Rekombinantní DNA vektor byl připraven z kultury aplikací alkalické metody (popsáno v: Maniatis, T., a další, supra). Jmenovitě 1,5 ml kultivačního media se centrifugovalo při pokojové teplotě při 10000 x G po dobu dvou minut. Buňky tvořily potom precipitát. K buňkám se přidalo 100 μΐ roztoku 50 mM glukosy, 25 mM Tris chlorovodíkové kyseliny, 10 mM EDTA (pH 8,0). Vytvořila se suspenze. K této suspenzi bylo přidáno 200 μΐ 0,2 N hydroxidu sodného - 1 % hmotn. SDS. Suspenze se nechala mírně míchat, docházelo k lyži mikroorganismů. K následné denaturaci proteinů bylo přidáno 150 μΐ roztoku 3 M octanu draselného - 11,5 % hmotn. kyseliny octové, potom následovala centriíugace při pokojové teplotě při 10000 x G po dobu 10 minut. Shromáždil se supematant. Supematant byl podroben fenol - chloroformové extrakci a ethanolovému srážení. Vznikající precipitát se rozpustil v 50 μΐ TE obsahujícím 40 pg/ml ribonukleasy A (výrobek firmy Sigma).
Každý z rekombinantních DNA vektorů byl naštěpen restrikčními enzymy a podroben elektroforéze. Nukleotidové sekvence DNA inzertů v rekombinantních DNA vektorech byly určeny pomocí sekvenace DNA na sekvenátoru (model 377: výrobek firmy Perkin Elmer, Japonsko) a to pro všechny inzerty, které poskytly pro toto štěpení na elektroforéze rozdílné výsledky.
Touto cestou byl identifikován kmen mající rekombinantní vektor DNA obsahující PKS fragment odvozený z Penicillium citrinum.
Příklad 5: Hybridizace genomu Penicillium citrinum SANK13380 pomocí metody Southem blotu
1) Elektroforéza a přenos na membránu
Genomová DNA (10 pg) z Penicillium citrinum SANK13380 získaná postupem popsaným v příkladu 2 byla naštěpena restrikčními enzymy EcoRI, Sáli, HindlII nebo Sací (všechny enzymy jsou výrobky firmy Takara Shuzo Co., Ltd., Japonsko) a po té byla podrobena elektroforéze na agarosovém gelu. Gel byl připraven použitím agarosy L03 TAKARA (Takara Shuzo Co., Ltd., Japonsko). Po elektroforéze se gel ponořil do roztoku 0,25 N kyseliny chlorovodíkové (vyrobena firmou Wako Pure Chemical Industries, Ltd.) a zde se inkuboval po dobu 10 minut při pokojové teplotě za stálého jemného třepání. Potom byl gel přenesen do roztoku 0,4 N hydroxidu sodného (výrobek firmy Wako Pure Chemical Industries, Ltd.) a zde byl ponechán na inkubaci za jemného třepám po dobu 30 minut za pokojové teploty. Pomocí alkalického způsobu přenosu popsaném Maniatisem a dalšími, (supra), byla DNA obsažená v gelu přenesena na nylonovou membránu Hybond ™-N+ (výrobek firmy Amensham) a zde byla zafixována. Membrána byla dvakrát promyta pomocí roztoku 2 x SSC (1 x SSC obsahuje 150 mM NaCl, 15 mM citrát sodný) a potom byla membrána usušena vzduchem.
2) Hybridizace a detekce signálu
Membrána získaná v kroku 1) se hybridizovala s fragmentem PKS genu získaným podle postupu popsaného v příkladu 4 výše jako sondou.
Pro získání sondy byl 1 pg DNA fragmentu genu PKS získaného postupem popsaným v příkladu 4 označen DIG DNA Labeling Křtem (výrobce Boeringer-Mannheim) a po té byla směs 10 minut po vařena a před vlastním použitím rychle zchlazena.
Membrána popsaná v kroku 1) se ponořila do roztoku hybridizační kapaliny (DIG Easy Hyb: výrobce Boehringer-Mannheim), potom byla podrobena prehybridazační úpravě promytím za třepání při 20 ot./min při teplotě 42 °C po dobu 2 hodin. Následně byla k hybridizační kapalině přidána výše zmíněná značená sonda a hybridizace probíhala dále za třepání při 20 ot./min při teplotě 42 °C po dobu 18 hodin za užití Multishaker Oven HB (výrobce firma TAITEC). Membrána, která byla podrobena hybridizaci, byla poté třikrát promyta při pokojové teplotě po dobu 20 minut roztokem 2 x SSC a dvakrát promyta za užití roztoku 0,1 x SSC při 55 °C po dobu 30 minut.
Na promytou membránu se působilo činidly soupravy DIG Luminescent Detection Kit for Nucleic Acids (výrobce Boehringer-Mannheim) a exponoval se film citlivý na X paprsky (Lumifilm, výrobce Boehringer-Mannheim). Fotografie se získaly pomocí Fuji medical film procesoru FPM 800A (výrobce Fuji Film Corporation).
• · · ·· ·* ·· · • · · · «·* · · · ♦ • · · ·*>··· ·· « ·· ·*··<···· ·
Získaný výsledek potvrdil, že fragment genu PKS získaný postupem podle příkladu 4 je přítomen v genomu Penicillium citrinum .
Příklad 6: Analýza genomové DNA knihovny z Penicillium citrinum SANK13380 pomocí fragmentu genu PKS jako sondy
Klonování fragmentů genomové DNA obsahujících PKS gen bylo provedeno pomocí metody hybridizace kolonií.
1) Příprava membrány
Suspenze buněk Escherichia coli uchovávané jako genomová DNA knihovna Penicillium citrinum SANK13380 (popsáno v příkladu 3) byla naředěna a rozetřena na plotny s agarovým LB mediem, a to tak, aby mohlo na plotně vyrůst od 5000 do 10000 kolonií. Plotna byla vložena do inkubátoru a ponechána tam při 26 °C po dobu 18 hodin a potom dána na jednu hodinu k ochlazení do 4 °C. Membrána Hybond ™-N+ (výrobek firmy Amasham) byla položena na plotnu a uvedena na jednu minutu v kontakt s jejím povrchem. Membrána, na jejímž povrchu byly zachyceny kolonie, se opatrně sundala z plotny. Povrchem, kterým přišla do styku s koloniemi otočeným nahoru, byla membrána ponořena do 200 ml roztoku o složení 1,5 M chlorid sodný, 0,5 N hydroxid sodný na dobu 7 minut. Po té byla membrána namočena do 200 ml roztoku o složení 1,5 M chlorid sodný, 0,5 M Tris chlorovodíková kyselina, 1 mM EDTA (pH 7,5) na dobu tří minut. Tento krok se ještě jednou opakoval. Potom byla membrána promyta 400 ml 2 x SSC. Nakonec byla membrána sušena na vzduchu po dobu 30 minut.
2) Hybridizace
Jako sonda byl použit insert DNA z PKS genu získaný postupem popsaným v příkladu 4 v množství (1 pg). DNA byla označena pomocí DIG DNA Labeling Kit (výrobek firmy Boeringer-Mannheim) a potom povařena po dobu 10 minutes a před dalším použitím rychle zchlazena.
Membrána popsaná v kroku 1) se ponořila do roztoku hybridizační kapaliny (DIG Easy Hyb: výrobce Boeringer-Mannheim) a potom byla podrobena prehybridazační úpravě promytím za třepám při 20 ot./min při teplotě 42 °C po dobu 2 hodin. Následně byla k hybridizační kapalině přidána výše zmíněná značená sonda a hybridizace probíhala dále za třepání při 20 ot./min při teplotě 42 °C po dobu 18 hodin za užití Multishaker Oven HB (výrobce firma TAITEC). Membrána, která byla podrobena hybridizaci, byla poté třikrát promyta roztokem 2 x SSC při pokojové teplotě po dobu 20 minut a dvakrát byla promyta za užití roztoku 0,1 x SSC při 68 °C po dobu 30 minut.
Na promytou membránu se působilo činidly soupravy DIG Luminescent Detection Kit for Nucleic Acids (výrobce Boehringer-Mannheim) a exponoval se film citlivý na X paprsky (Lumifilm, výrobce Boehringer-Mannheim). Fotografie byly provedeny pomocí Fuji medical film procesoru FPM 800A (výrobce Fuji Film Corporation).
Výše zmíněné kroky 1) a 2) jsou nazývány analýzami.
Kolonie na plotně, kde byl detekován pozivní signál při prvním prozkoumání, se pomocí škrabky shrnuly a resuspendovaly se v LB mediu. Po té, co byly buňky adekvátně naředěny, byly vysety na vhodnou plotnu. Za účelem purifikace pozitivních klonů byla následně provedena druhá analýza.
Pozitivní klon získaný v popisovaném příkladu, jmenovitě transformovaný do Escherichia coli kmene pML48 SANK71199 byl uložen v Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology dne 7. července 1999 pod přístupovým číslem FERM BP-6780 v souladu s Budapešťskou smlouvou o ukládání mikroorganismů.
Příklad 7: Analýza vložené sekvence rekombinantmho DNA vekctoru pML48 (1)
Kultivace kmene Escherichia coli pML48 SANK71199 získaného postupem popsaným v příkladu 6 a příprava rekombinatního DNA vektoru z kultury byla provedena podobnými postupy, jaké byly popsány v příkladu 4.
Získaný DNA vektor byl označen jako pML48. Insert v pML48, což je genomová DNA související s biosyntézou ML-236B, byl naštěpen různými restrikčmmi enzymy a vzniklé fragmenty byly subklonovány do plazmidu pUC119 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko). Za použití výsledných subklonů jako sond, byla provedena hybridizace metodou Southem blotu, a to postupem obdobným tomu, který byl popsán v příkladu 5. Jmenovitě, produkty získané restrikcí pML48 různými restrikčními enzymy byly podrobeny rozdělení na elektroforéze a DNA byly přeneseny na membránu a po té byla provedena hybridizace. Jako výsledek tohoto postupu byla získána metodami obecně používanými v tomto oboru mapa restrikčního štěpení sekvence vložené do pML48.
Nukleotidová sekvence nukleotidového inzertu v každém subklonu byla určena pomocí DNA sekvenátoru model 377 (výrobek firmy Perkin Elmer Japonsko Co.Ltd.), následně byla určena vlastní nukleotidová sekvence pML48.
Vložená sekvence pML48 sestávala celkově z 34203 baží.
Nukleotidová sekvence vložené sekvence pML48 je uvedena v SEKV. ID. Č. 1 a 2
v Seznamu sekvencí. Sekvence popsané v SEKV. ID. Č. 1 a 2 v Seznamu sekvencí jsou vzájemně komplementární.
Existence strukturních genů v sekvenci inzertu pML48 byla analyzována pomocí programu k průzkumu genů nazvaného GRAIL (ApoCom GRAIL Toolkit: vyrobeno společností Apocom Corporation) a homologie byla zkoumána pomocí programu BLAST (Gapped-BLAST (BLAST2): instalovaný v Wisconsin GCG balíčku Ver,1.0).
Jako výsledek tohoto zkoumání byla ve vložené sekvenci pML48 předpovězena přítomnost šesti různých strukturních genů. Tyto geny byly označeny mlcA, mlcB, mlcC, mlcD, mlcE a mlcR. Dále bylo předpovězeno, že mlcA, mlcB, mlcE a mlcR mají kódující oblasti v nukleotidové sekvenci SEKV. ID. Č. 2 v Seznamu sekvencí a mlcC a mlcD mají kódující oblast v nukleotidové sekvenci označené SEKV. ID. Č. 1 v Seznamu sekvencí. Byla také předpovězena relativní poloha a délka každého z předpokládaných strukturních genů vložené sekvence.
Výsledky z popisovaného příkladu jsou ukázány na obrázku 2. Každá šipka indikuje lokalizaci, směr a relativní velikost každého strukturního genu v inzertu pML48. Šipka směřující vlevo znázorňuje existenci kódující oblasti strukturního genu (mlcA, B, E nebo R) nacházející se v sekvenci označené SEKV. ID. Č. 2. Šipka směřující vpravo znázorňuje, že kódující oblast strukturního genu (mlcC nebo D) existuje na SEKV. ID.Č. 1.
Příklad 8: Analýza vložené sekvence- inzertu rekombinantního DNA vektoru pML48 (2)
Analýza exprese strukturních genů, jejichž existence byla předpovězena v příkladu 7, byla provedena pomocí hybridizace metodou Northem blotu a RACE. Dále byla provedena analýza oblastí 5'- a 3'-konce.
1) Příprava celkové RNA z Penicillium citrinum kmene SANK13380
Buňky z 5 mm čtverečních odebrané z kultury Penicillium citrinum kmene SANK13380 uchovávané na šikmém agaru (popsáno v příkladu 2) se inokulovaly do 10 ml MBG3-8 media ve 100 ml konické láhvi a ponechalo se inkubovat při 26 °C za třepání po dobu 3 dnů.
Příprava celkové RNA z kultury se prováděla pomocí soupravy RNAeasy Plant Mini Kit (výrobek firmy Qiagen AG), která používá guanidin - isothiokyanátovou metodu. Jmenovitě, pro získání buněk se kultura centrifuguje při pokojové teplotě při 5000 x G po dobu 10 minut. Následně se 2 g (mokrá váha) buněk nechají zmrznout v tekutém dusíku a potom se rozetřou tloučkem v třecí misce na prášek. Rozdrcené buňky se suspendují ve 4 ml ···· · · · · ·· · ·· · ♦ · · · · · ·· • · ········· · ··· ···« · ·* •« ··· ·· ·· ·· ··* lyzovacího pufru (je součástí soupravy). Na každou z deseti centrifugovatelných kolonek obsažených v soupravě QIAshredder spin columns se nanese 450 μΐ suspenze a kolonky se centrifugují při pokojové teplotě při 1000 x G po dobu 10 minut. Shraňují se vzniklé eluáty, ke kterým se přidá 225 μΐ ethanolu, tento roztok se potom přenese na centrifugovatelné mini kolonky (RNA mini spin column) obsažené v soupravě. Kolonky se promyjí promývacím pufrem, který je také součástí soupravy. Potom následuje eluce adsorbované RNA z každé kolonky pomocí 50 μΐ destilované vody zbavené ribonukleasy. Eluent se užívá jako frakce celkové RNA.
2) Hybridizace Northem blotem
Připravil se vzorek RNA přidáním 2,25 μΐ vodného roztoku obsahujícího 20 pg celkové RNA z Penicillium citrinum kmene SANK13380 k jednomu μΐ 10 x MOPS (složení: 200 mM 3-morfolinopropansírová kyselina, 50 mM octan sodný, 10 mM EDTA-2Na; pH 7,0; k užití po sterilizaci v autoklávu při 121 °C po dobu 20 minut; vyrobeno Dojinkagaku Laboratory Co.Ltd.), 1,75 μΐ formaldehydu a 5 μΐ formamidu, vše se promíchalo. Vzorek RNA byl inkubován při 65 °C po dobu 10 minut, potom rychle zchlazen v ledové vodě a nanesen na agarosový gel, kde byl podroben elektroforéze. Gel pro elektroforézu byl připraven smícháním 10 ml 10 x MOPS a jednoho gramu Agarosy L03 „TAKARA“ (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) s 72 ml vody, která byla ošetřena dietylpyrokabonátem (výrobek firmy Sigma). Roztok s agarosou se zahřál, aby se agarosa rozpustila, potom byl zchlazen a bylo přidáno 18 ml formaldehydu. Jako vzorkový pufr byl použit 1 x MOPS (připravený ředěním 10 x MOPS s desetinásobkem vody). RNA byla po elektroforetickém rozdělení přenesena na membránu Hybond ™-N+ (výrobek firmy Amasham) v 10 X SSC.
Jako sondy byly užity DNA fragmenty a, b, c, d a e, získané štěpením vložené sekvence z pML48 pomocí restrikčních enzymů 1 a 2. Tyto sondy jsou znázorněny v následující tabulce 1. Lokalizace každé sondy v inzertu pML48 je ukázána na horním panelu obrázku 3.
• · • · · · · · · ♦ • · · ····· · • « · · · · «·· ·· ·· · *
Tabulka 1
Sondy pro hybridizaci Northem blotem
Sonda Restrikční Enzym 1 Nukleotid č. v štěpném místě restrikčmho enzymu * Restrikční Enzym 2 Nukleotid č. v štěpném místě restrikčmho enzymu*
A EcoRI 6319 až 6324 EcoRI 15799 až 15804
b BamHI 16793 až 16798 Pstl 18164 až 18169
c KpnI 26025 až 26030 BamHI 27413 až 27418
d Sáli 28691až 28696 Sáli 29551 až 29556
e HindlII 33050 až 33055 Sací 34039 až 34044
1 1 '. V 1 * Každý nukleotid je možné nalézt v SEKV. ID. C. 1 ze Seznamu sekvencí
Značení sond, jejich hybridizace a detekce signálu byly provedeny podle postupu popsaného pro hybridizaci metodou Southem blotu, tak jak to bylo popsáno v příkladu 5.
Výsledky dokumentující uvedený příklad jsou ukázány v dolním panelu na obrázku 3.
Každý vzniklý signál dokazuje existenci transkripčmho produktu homologního k nukleotidivé sekvenci každé sondy.
Výsledky dokazují, že strukturní geny, jejichž přítomnost ve vložené sekvenci pML48 byla předpovězena v předkládaném vynálezu, jmenovitě mlcA mlcB, mlcC mlcD, mlcE a mlcR se přepisují v Penicillium citrinum kmenu SANK13380.
Pozice každého signálu však neznázorňuje relativní velikost transkripčního produktu.
3) Určení sekvence 5'-konce pomocí 5'RACE cDNA obsahující 5'-koncovou oblast každého strukturního genu byla získána pomocí systému 5' RACE (Systém for Rapid Amplification of cDNA ends, Verze 2.0; vyrobeno firmou GIBCO).
Byly připraveny dva druhy antisense oligonucleotidových DNA. Návrh sekvencí byl založen na nukleotidové sekvenci, o které se předpokládalo, že se nachází v kódující oblasti blízko 5'41 ·· · ·· ·· ·· · 4 · · ··· · ·· · * · ······· * • · · · ·· ··· · · ·Ζ· ·· ·· ····* konce každého ze strukturních genů ve vložené sekvenci pML48, tak, jak to bylo predikováno ve výsledcích příkladu 7 a v odstavci 2) popisovaného příkladu.
Nukleotidová sekvence antisense oligonukleotidu DNA (1), navržená na základě nukleotidové sekvence 3'-konce každého strukturního genu, je ukázána v tabulce 2.
Nukleotidová sekvence antisense oligonukleotidu DNA (2), navržená na základě nukleotidové sekvence 5'- konce každého strukturního genu, je ukázána v tabulce 3.
Tabulka 2: Oligonukleotid DNA (1) použitý pro určení sekvence 5'-konce metodou 5'RACE
Gen SEKV. ID. Č. podle Seznamu sekvencí Nukleotidová Sekvence
mlcA SEKV. ID. Č. 5 catgttcaatttgctctc
mlcB SEKV. ID. Č. 6 ctggatcagacttttctgc
mlcC SEKV. ID. Č. 7 gtcgcagtagcatgggcc
mlcD SEKV. ID. Č. 8 gtcagagtgatgctcttctc
mlcE SEKV. ID. Č. 9 gttgagaggattgtgagggc
mlcR SEKV. ID. Č.10 ttgcttgtgttggattgtc
Tabulka 3: Oligonukleotid DNA (2) použitý pro určení sekvence 5'-konce metodou 5'RACE
Gen SEKV. ID. Č. podle Seznamu sekvencí Nukleotidová sekvence
mlcA SEKV. ID. Č. 11 catggtactctcgcccgttc
mlcB SEKV. ID. Č. 12 cccccagtacgtaagctc
mlcC SEKV. ID. Č. 13 ccataatgagtgtgactgttc
mlcD SEKV. ID. Č. 14 caacatctgcatccccgtc
mlcE SEKV. ID. Č. 15 ggaaggcaaagaaagtgtac
mlcR SEKV. ID. Č. 16 agattcattgctgttggcatc
První vlákno cDNA bylo syntetizováno podle nukleotidu DNA(l) jako primerů pomocí reversní transkripční reakce a celkové RNA z Penicillium citrinum kmene SANK13380 jako templátu. Jmenovitě, byla připravena 24 μΐ reakční směs obsahující jeden pg celkové RNA, 2,5 pmol oligonukleotidu DNA (1) a jeden μΐ reversní transkriptasy SUPER SCRIPTTMII (je součástí soupravy). Za účelem purifikace prvního vlákna cDNA byla tato reakční směs inkubována při 16 °C po dobu jedné hodiny a reakční produkt byl nanesen na GLASSMAX spin cartridge, která je taktéž součástí soupravy.
Pomocí terminální deoxyribonukleotidyltransferasy byl na 3'- konec cDNA přidán řetězec poly-C.
μΐ reakční směsi obsahující první řetězec cDNA, na jehož 3'-konec byl přidán póly C řetězec, bylo smícháno s 40 pmol oligonukleotidu DNA (2) a 40 pmol Abriged Anchor Primer (je součástí soupravy). Po té následovala inkubace při 94 °C dvě minuty. Inkubační cyklus skládající se z 30 s při 94 °C, 30 s při 55 °C a dvou minut při 72 °C se opakoval 35 krát. Nakonec následovala ještě pětiminutová inkubace při 72 °C a následně potom při 4 °C po dobu 18 hodin. Vzniklý produkt byl podroben elektroforéze na agarosovém gelu a DNA se vyizolovala z gelu. Výsledný produkt byl přečištěn pomocí fenol-chloroformové extrakce a ethanolového srážení. Následně byl klonován způsobem podobným způsobu popsanému v příkladu 4 do pCR 2.1.
Postup posaný výše je 5'-RACE.
Byla určena nukleotidová sekvence fragmentu cDNA obsahující 5'-konec a byla předpovězena pozice pro iniciační počátek transkripce a pro translační iniciační kodón.
Tabulka 4 ukazuje sekvenci, označenou podle Seznamu sekvencí SEKV. ID. Č., ve které nalezená nukleotidová sekvence 5'-konce cDNA fragmentu odpovídá sekvenci obsažené v každém ze strukturních genů. Sekvence 5'-konců byly získány popsaným postupem 5' RACE. Tabulka 5 ukazuje SEKV. ID. Č., ve které je pro každý strukturní gen vyznačena existence iniciačního bodu transkripce a iniciačního bodu translace.
Tabulka 4: SEKV. ID. Č., které znázorňují nukleotidové sekvence fragmentu 5'-konce cDNA
Gen SEKV. ID. Č. podle Seznamu sekvencí
MlcA SEKV. ID. Č. 17
mlcB SEKV. ID. Č. 18
mlcC SEKV. ID. Č. 19
mlcD SEKV. ID. Č. 20
mlcE SEKV. ID. Č. 21
mlcR SEKV. ID. Č. 22
...
e » · · ·
Tabulka 5: Pozice transkripčního počátku a iniciačního translačního bodu pro každý gen
Gen Č. SEKV. ID. Č. ve které se nachází iniciační kodón pro translaci Nukleotidové číslo v SEKV. ID. Č. 1 nebo SEKV. ID. Č. 2
Transkripční iniciační počátek Translačm iniciační kodón
mlcA SEKV. ID. Č. 2 22913 23045 až 23047
mlcB SEKV. ID. Č. 2 11689 11748 až 11750
mlcC SEKV. ID. Č. 1 11631 11796 až 11798
mlcD SEKV. ID. Č. 1 24066 24321 až 24323
mlcE SEKV. ID. Č. 2 3399 3545 až 3547
mlcR SEKV. ID. Č. 2 365 400 až 402
* nukleotidové sekvence znázorněné v SEKV. ID. Č. 1 a 2 podle Seznamu sekvencí jsou vzájemně zcela komplementární.
4) Určení sekvence 3'-konce pomocí 3' RACE cDNA obsahující oblast 3'-konce každého strukturního genu získaná pomocí Ready To Go: T-Primed First-Strand kit (výrobek firmy Pharmacia).
Takto byl připraven predikcí na základě výsledků získaných postupem popsaným v příkladu 7 a odstavci 2) tohoto příkladu jeden druh sense oligonukleotidu DNA (3), o kterém se předpokládá, že se nachází v kódující oblasti a v blízkosti 3'- konce v každém strukturním genu nacházejícím se ve vložené sekvenci v pML48.
Nukleotidová sekvence oligonukleotidu DNA (3) určená pro každý strukturní gen je ukázána v tabulce 6.
• · · · · ·· ·· ··
Tabulka 6: Oligonukleotid DNA (3) upoužitý k určení sekvence 3'- konce podle 3' RACE
Gen SEKV. ID. Č. Sekvence podle Seznamu sekvencí Nukleotidová sekvence
mlcA SEKV. ID. Č. 23 atcataccatcttcaacaac
mlcB SEKV. ID. Č. 24 gctagaataggttacaagcc
mlcC SEKV. ID. Č. 25 acattgccaggcacccagac
mlcD SEKV. ID. Č. 26 caacgcccaagctgccaatc
mlcE SEKV. ID. Č. 27 gtcttttcctactatctacc
mlcR SEKV. ID. Č. 28 ctttcccagctgctactatc
První vlákno cDNA bylo syntetizováno pomocí reversní transkripční reakce za užití NotI-d(T)18 jako primeru (je součástí kitu) a celkové RNA z Penicillium citrinum kmene SANK13380 (jeden pg) jako templátu.
100 μΐ reakční směsi obsahující primární vlákno cDNA, 40 pmol oligonukleotidu DNA (3) a Notl-d(T) 18 primer (který je součástí kitu) bylo inkubováno při 94 °C po dobu dvou minut. Reakce se skládala z opakování 35 cyklů skládajících se z inkubace 30 s při 94 °C, 30 s při 55 °C a dvou minut při 72 °C. Následovala inkubace při 72 °C po dobu 5 minut a při 4 °C po dobu 18 hodin. Výsledný produkt byl podroben elektroforetickému rozdělení na agarosovém gelu a potom byla z gelu vyizolována DNA. Product se purifikoval pomocí fenol — chloroformové extrakce a ethanolového srážení. Potom byl přečištěný produkt klonován za užití podobného způsobu, jako byl postup popsaný v příkladu 4 do pCR 2.1.
Výše popsaný postup je 3'-RACE.
Byla určena nukleotidová sekvence cDNA na 3'- konci a byla předpovězena pozice pro terminační kodón translace.
Tabulka 7 vyznačuje SEKV. ID. Č. podle Seznamu sekvencí, ve které nukleotidová sekvence 3'-konce cDNA fragmentu odpovídá každému z popsaných strukturních genů. Sekvence byly získány postupem 3' RACE. Tabulka 8 ukazuje terminační kodón translace a jeho pozici v sekvencích SEKV. ID. Č. 1 a 2 podle Seznamu sekvencí.
Tabulka 7: SEKV. ID. Č., ve které se nachází nukleotidová sekvence 3'-konce cDNA fragmentu.
Gen SEKV. ID. Č. v Seznamu sekvencí
mlcA SEKV. ID. Č. 29
mlcB SEKV. ID. Č. 30
mlcC SEKV. ID. Č. 31
mlcD SEKV. ID. Č. 32
mlcE SEKV. ID. Č. 33
mlcR SEKV. ID. Č. 34
Tabulka 8: Terminační kodón translace a jeho pozice v každém ze strukturních genů
Gen Terminační kodón translace SEKV. ID. Č., ve které se terminační kodón translace nachází Čísla nukleotidů pro terminační kodón translace v SEKV. ID. Č. 1 nebo SEKV. ID. Č. 2
mlcA tag SEKV. ID. Č. 2 32723 až 32725
mlcB taa SEKV. ID. Č. 2 19840 až 19842
mlcC taa SEKV. ID. Č. 1 13479 až 13481
mlcD tga SEKV. ID. Č. 1 27890 až 27892
mlcE tga SEKV. ID. Č. 2 5730 až 5732
mlcR tag SEKV. ID. Č. 2 1915 až 1917
* nukleotidové sekvence uvedené v SEKV. ID. Č.l a 2 podle Seznamu sekvencí jsou vzájemně zcela komplementární.
Tabulka 9 ukazuje C-koncové aminokyselinové zbytky z polypeptidu, o kterém se soudí, že je kodóván nukleotidovou sekvencí každého strukturního genu, nukleotidovou sekvenci trinukleotidů kódujících aminokyselinové zbytky a pozicí trinukleotidů.
Tabulka 9: C-koncový aminokyselinový zbytek polypetidu kódovaného každým ze strukturních genů
Gen C-koncový aminokyselino vý zbytek Nukleotidová sekvence trinukleotidu kódují cícho aminokyselinu SEKV ID Č, ve které se trinukleotid vyskytuje Nukleotidové číslo trinukleotidu v SEKV. ID. Č. 1 nebo 2
MlcA alanin gcc SEKV. ID. Č.2 32720 až 32722
MlcB serin agt SEKV. ID. Č.2 19837 až 19839
MlcC cystein tgc SEKV. ID. Č.l 13476 až 13478
MlcD arginin cgc SEKV. ID. Č.l 27887 až 27889
MlcE alanin gct SEKV. ID. Č.2 5727 až 5729
MlcR alanin gct SEKV. ID. Č.2 1912 až 1914
* nukleotidové sekvence uvedené v SEKV. D. Č.l a 2 podle Seznamu sekvencí jsou
vzájemně zcela komplementární.
Tabulka 10 shrnuje sekvence komplementární k sekvencím pro terminační translační kodón uvdené v Tabulce 8, SEKV. ID. Č., ve kterých se komplementární sekvence vyskytuje a pozici komplementární sekvence.
Tabulka 10: Sekvence komplementární k sekvenci terminačmho kodónu translace pro každý strukturní gen
Gen Sekvence komplementární k sekvenci terminačmho kodónu translace SEKV. ID. Č. kde se komplementární sekvence vyskytují Nukleotidové číslo komplementární sekvence v SEKV. ID. Č. 1 nebo SEKV. ID. Č.2
MlcA cta SEKV. ID. Č.l 1479 až 1481
MlcB tta SEKV. ID. Č.l 14362 až 14364
MlcC tta SEKV. ID. Č.2 20723 až 20725
MlcD tca SEKV. ID. Č.2 6312 až 6314
MlcE tca SEKV. ID. Č.l 28472 až 28474
MlcR cta SEKV. ID. Č.l 32287 až 32289
• · · ·· · ··· ♦ «··· ···♦··· ·· · ····»· · · • · · · · · ·* · · f ' · · · ·· ·· ··* · · * nukleotidové sekvence uvedené v SEKV. ID. Č.l a 2 podle Seznamu sekvencí jsou vzájemně zcela komplementární.
Jak bylo popsáno výše, byla určena pozice každého strukturního genu a jeho směr. Na základě výše zmíněných informací mohou být získány transkripčm a translačm produkty každého strukturního genu.
Příklad 9: Získání cDNA odpovídající strukturnímu genu mlcE
1) Příprava celkové RNA
Celková RNA z Penicillium citrinum byla připravena podle způsobu popsaného v přikladu 8.
2) Návrh primeru
Za účelem získám cDNA úplné délky odpovídající strukturnímu genu mlcE určenému v příkladu 8, byly navrženy a syntetizovány následující primery: sense primer 5'-gttaacatgtcagaacctctaccccc-3' (Viz SEKV. ID. Č. 35 ze Seznamu sekvencí); a antisense primer 5'-aatatttcaagcatcagtctcaggcac-3': (Viz SEKV. ID. Č. 36 ze Seznamu sekvencí).
Primery jsou odvozeny ze sekvence 5'-konce upstream oblasti strukturního genu mlcE a ze sekvence 3'-konce downstream oblasti téhož genu. Syntéza primerů byla učiněna pomocí fosfoamiditové metody.
3) RT-PCR
Za účelem získání cDNA úplné délky kódující genový produkt mlcE byla použita souprava vyrobená firmou Takara RNA LA PCR kit (AMV) Ver. 1,1.
V reakci bylo použito 20 μΐ následující reakční směsi o složení: jeden pg celkové RNA, 2,5 pmol Random 9 mers primeru (součástí soupravy) a jeden μΐ reversního transkripčního enzymu (enzym je součástí soupravy). Reakční směs se nechala inkubovat při 42 °C po dobu 30 minut, tak se připravilo primární vlákno cDNA. Aktivita reversního transkripčního enzymu byla zastavena zahříváním směsi při 99 °C po dobu pěti minut.
100 μΐ druhé rekční směsi obsahující celkové množství první reakční směsi s primárním vláknem cDNA (viz výše), 40 pmol sense primeru a 40 pmol antisense primeru se nechalo inkubovat při 94 °C po dobu dvou minut. Inkubační cyklus se skládal z 30 opakování cyklů : 30 s při 94 °C, 30 s při 60 °C a dvě minuty při 72 °C, následovala inkubace při 72 °C po dobu pěti minut a při 4 °C po dobu 18 hodin. Výsledný produkt byl podroben elektroforetickému dělení na agarosovém gelu, ze kterého byl také získán výsledný produkt.
Produkt byl přečištěn fenol - chloroformovou extrakcí a ethanolovým srážením. Potom byl použit k transformaci kompetentních buněk Escherichia coli kmene JMI 09 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko). Transformace byla provedena obdobným způsobem, jaký byl popsán v příkladu 4 za užití pCR 2.1. Z transformovaných buněk Escherichia coli byl vybrán kmen buněk nesoucí plazmid, který obsahoval požadovaný DNA fragment Plazmid obsažený a nesený tímto kmenem buněk byl nazván pCRexpE.
Byla určena nukleotidová sekvence vložené DNA výsledného rekombinantního DNA vektoru pCRexpE. Vložená DNA obsahuje cDNA úplné délky odpovídající strukturnímu genu mlcE. Nukleotidová sekvence této DNA a aminokyselinová sekvence peptidu, která byla odvozena na jejím základě, jsou uvedeny v SEKV. ID. Č. 37 a/nebo v SEKV. ID. Č. 38 podle Seznamu sekvencí.
Nejblíže známá sekvence odpovídající svým složením genu mlc E (polypeptidu) byla nalezena v ORF 10 na genu ze seskupení genů souvisejících s biosyntézou lovastatinu. Nalezená identita byla 70 %.
Příklad 10: Konstrukce expresního vektoru pSAK 700 cDNA expresní vektor pSAK700 byl konstruován pomocí užití vektorů pSAK333 a pSAK360 popsaných v příkladu 1.
pSAK333 byl štěpen dvěma restrikčními enzymy BamH I a Hind ΙΠ (vyrobeny firmou Takara Shuzo Co., Ltd., Japonsko) a po té byla provedena elektroforéza na agarosovém gelu. Z gelu byl vyříznut fragment o velikosti 4,1 kb a po té byl konec DNA fragmentu zatupen pomocí působení T4-DNA polymerasy (výrobek firmy Takara Shuzo Co., Ltd., Japonsko).
K oběma výše zmíněným fragmentům byl pomocí soupravy DNA ligation kit Ver.2 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) připojen adaptér EcoRI-Notl-BamHI adapter (výrobek firmy Takara Shuzo Co., Ltd., Japonsko). Kompetentní buňka Escherichia coli kmene JMI09 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) byla natransformována ligovanou DNA. Kmen nesoucí plazmid, který měl adaptér, byl izolován z transformovaných buněk Escherichia coli a plazmid obsažený v tomto kmenu byl označen jako pSAK410.
pSAK360 byl naštěpen dvěma restrikčními enzymy Pvu II a Ssp I a po té byla restrikční směs podrobena elektroforetickému dělení na agarosovém gelu. Z gelu byl izolován DNA fragment (velikost okolo 2,8 kb) obsahující promotor a terminátor 3-fofoglycerátkinasy (dále nazývaný jako „pgk“) gen a HPT mající svůj původ v Escherichia coli.
Oba výše zmíněné DNA fragmenty byly vloženy pomocí restrikčního místa Pvu II do • » * ·· ·· ·♦ · • · · I · · · · ·· · • · « ····· ··· • · · · · ·· ··· ·· ··· ······· v· «·· ♦· ♦· ···>· plazmidu pSAK410 užitím soupravy pro ligaci DNA ligation kit Ver.2 (výrobek firmy Takara
Shuzo Co., Ltd., Japonsko). Escherichia coli kompetentní buňka kmene JMI09 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) byla natransformována ligovanou DNA. Kmen nesoucí plazmid, který obsahoval DNA fragment byl izolován z transformovaných buněk
Escherichia coli a plazmid obsažený v tomto kmenu byl označen jako pSAK700.
Konstrukce pSAK700 je ukázána na obrázku 4.
pSAK 700 obsahuje po jednom restrikčním místě pro všechny následující restrikční enzymy: BamHI a Notl. pSAK700 obsahuje dále gen resistence k ampicilinu (dále označovaný jako „Ampr“) a gen resistence k hygromycinu HTP jako selekční markéry.
V následujících příkladech, je-li Escherichia coli užita jako hostitelský organismus, výběr buněk transformovaných plazmidy pSAK700 nebo pSAK700 obsahujícími inzerty cizorodé DNA se provádí za přidání 40 pg/ml ampicilinu do daného užitého media.
Je-li jako hostitelský organismus užit Penicillium citrinum SANK13380, selekce buněk transformovaných pSAK700 nebo pSAK700 obsahující inzert cizorodé DNA byla provedena přidáním 200 pg/ml hygromycinu k danému mediu.
Příklad 11: Konstrukce cDNA expresního vektoru pSAKexpE
Rekombinantní DNA vektor pCRexpE získaný v příkladu 9 byl štěpen při 37 °C po dobu 2 hodin restrikčními enzymy Hpal a SspI (výrobky firmy Takara Shuzo Co., Ltd., Japonsko) a výsledná restrikční směs se podrobila elektroforetickému dělem na agarosovém gelu. Z gelu byl získán proužek mající velikost kolem l,7kb, odpovídající cDNA úplné délky pro mlcE.
Plazmid pSAK700 se nechal reagovat po dobu jedné hodiny při 37 °C s restrikčním enzymem Notl (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) a konec naštěpeného vektoru se nechal zatupit pomocí užití T4 DNA polymerasy (Takara Shuzo Co., Ltd., Japonsko) při 37 °C po dobu 5 minut. Po té se vektor podrobil fenol-chloroformové extrakci a ethanolovému srážení. Vysrážená DNA se rozpustila v malém množství TE pufru. Do této reakční směsi se přidala alkalická fosfatasa a směs se nechala inkubovat při 65 °C po dobu 30 minut. pSAK700, připravený postupem popsaným výše, byl ligován s DNA fragmentem o velikosti 1,7 kb získaným v kroku 1), a to za užití soupravy DNA ligation kit Ver.2 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko). Kompetentní buňky Escherichia coli kmene JMI09 se transformovaly za užití výše zmíněné ligované DNA. Byl získán kmen Escherichia coli transformovaný cDNA expresním vektorem.
·· « · · ·· ·· « * · 4 · · · · · ·
Transformované buňky Escherichia coli, označené jako Escherichia coli pSAKexpE SANK 72499, získané v tomto popisovaném příkladu, byly uloženy 25.ledna 2000 v Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology pod přístupovým číslem FERM BP-7005 v souladu s Budapešťskou smlouvou o ukládání mikroorganismů.
Příklad 12: Získání cDNA odpovídající strukturnímu genu mlcR
1) Příprava celkové RNA
Celková RNA z Penicillium citrinum byla připravena podle postupu popsaného v příkladu 8.
2) Návrh primerů
Za účelem získání cDNA úplné délky odpovídající strukturnímu genu mlcR určenému v příkladu 8, byly navrženy a syntetizovány následující primery: sense primer : 5'-ggatccatgtccctgccgcatgcaacgattc-3': (Viz SEKV. ID. Č. 39 v Seznamu sekvencí); a antisense primer 5'-ggatccctaagcaatattgtgtttcttcgc-3': (Viz SEKV. ID. Č. 40 v Seznamu Sekvencí).
Primery byly navrženy pomocí sekvence 5'-konce upstream oblasti strukturního genu tmZcR a dále pomocí sekvence 3'-konce downstream oblasti téhož genu. Syntéza byla provedena pomocí fosfoamiditové metody.
3) RT-PCR
Za účelem získání cDNA úplné délky genu kódujícího produkt mlcR, byla použita souprava Takara RNA LA PCR kit (AMV) Ver. 1,1.
Jmenovitě, 20 μΐ reakční směsi obsahující jeden μg celkové RNA, 2,5 pmol Random mers primer (je součástí soupravy) a jeden μΐ reversního transkripčmho enzymu (je součástí soupravy) se nechalo inkubovat při 42 °C po dobu 30 minut. Tak bylo připraveno primární vlákno cDNA. Reversní transkripčm enzym byl potom deaktivován zahřátím na 99 °C po dobu pěti minut.
100 μΐ druhé reakční směsi obsahující celkové množství reakční směsi s primárním vláknem cDNA (viz výše), 40 pmol sense primeru a 40 pmol antisense primeru bylo inkubováno při 94 °C po dobu dvou minut. Dále následovalo třicet opakování inkubačmho cyklu skládajícího se z 30 s při 94 °C, 30 s při 60 °C a dvou minut při 72 °C. Po té
následovaly další inkubační kroky při 72 °C po dobu pěti minut a při 4 °C po dobu 18 hodin. Výsledný produkt byl podroben elektroforetickému dělem na agarosovém gelu a DNA byla extrahována z gelu. Product byl purifikován pomocí fenol - chloroformové extrakce a ethanolového srážení. Potom byl užit k transformaci kompetentních buněk Escherichia coli kmenu JMI 09 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko). Transformace byla provedena postupem podobným postupu popsanému v příkladu 4 za užití pCR2.1.
Z transformovaných buněk Escherichia coli, byl vybrán kmen nesoucí plazmid obsahující DNA fragment a tento kmen byl označen jako pCRexpR.
Byla určena nukleotidová sekvence vložené DNA vzniklého rekombinantního DNA vektoru pCRexpR. Vložená DNA obsahuje cDNA úplné délky odpovídající strukturnímu genu mlcR. Nukleotidová sekvence tohoto inzertu a aminokyselinová sekvence peptidu od této sekvence odvozená, jsou uvedeny v SEKV. ID. Č. 41 a/nebo SEKV. ID. Č. 42 podle Seznamu sekvencí.
Sekvence odpovídající nejvyšší identitou nalezené sekvenci genu mlcR (peptidu) je známá sekvence pro lovE nalézající se ve skupině genů souvisejících s biosyntézou lovastatinu, kdy identita dosahuje 34 %.
Příklad 13: Konstrukce cDNA expresního vektoru pSAKexpR
Rekombinantm DNA vektor pCRexpR získaný v příkladu 12 se nechal reagovat při 37 °C po dobu 2 hodin s restrikčním enzymem BamHI (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) a reakční produkt byl podroben elektroforetickému dělení na agarosovém gelu. Z gelu byl vyříznut proužek odpovídající velikostí úplné cDNA pro mlcR (okolo 1,4 kb).
Po reakci pSAK700 s restrikčním enzymem BamHI (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) při 37 °C po dobu jedné hodiny, byla do reakční směsi přidána alkalická fosfatasa (výrobek firmy Takara Shuzo Co., Ltd., Japonsko) a směs se nechala reagovat při 65 °C po dobu 30 minut. pSAK700 naštěpený BamHI, tak jak bylo popsáno výše, byl ligován s 1,4 kb fragmentem DNA získaným v kroku 1) pomocí soupravy DNA ligation kit Ver.2 (výrobek firmy Takara Shuzo Co., Ltd., Japonsko). Kompetentní buňky Escherichia coli kmene JMI09 se transformovaly ligační směsí obsahující danou DNA. Byl získán kmen Escherichia coli transformovaný cDNA z expresního vektoru.
Transformované buňky Escherichia coli, označené jako Escherichia coli pSAKexpR SANK 72599, získané v tomto popisovaném příkladu, byly uloženy 25.ledna 2000 v Research
Institute of Life Science and Technology of the Agency of Industrial Science and Technology pod přístupovým číslem FERM BP-7006 v souladu s Budapešťskou smlouvou o ukládání mikroorganismů.
Příklad 14: Transformace mikroorganismů produkujících ML-236B
1) Příprava protoplastů
Spory Penicillium citrinum kmene SANK 13380 z kultury uchovávané na šikmém agarovém mediu byly inokulovány na PGA agarové medium a potom inkubovány při °C po dobu 14 dnů. Spory Penicillium citrinum kmene SANK 13380 se potom vyizolovaly z kultury a následně bylo 1 x 108 spor inokulováno do 80 ml of YPL-20 kultivačního media a inokulované medium bylo inkubováno při 26 °C po dobu jednoho dne. Po potvrzení klíčem spor pozorováním pod mikroskopem, se klíčící spory centrifugovaly při pokojové teplotě při 5000 x G po dobu deseti minut a tak byly odděleny od media ve formě precipitátu.
Spory se promyly třikrát sterilizovanou vodou a začala příprava protoplastů. V prvním kroku bylo rozpuštěno 200 mg zymolyasy 20 T (výrobek firmy Seikagaku Kogyo) a 100 mg chitinasy (výrobek firmy Sigma) v 10 ml roztoku 0,55 M chloridu hořečnatého. Po té se roztok centrifugoval při pokojové teplotě při 5000 x G po dobu 10 minut. Výsledný supematant byl používán jako enzymový roztok. 20 ml enzymového roztoku a 0,5 g (mokrá váha) klíčících spor bylo vloženo do 100 ml konické láhhe a bylo za mírného třepání inkubováno při 30 °C po dobu 60 minut. Potom se pomocí sledování mikroskopem zjišťovalo, zda se z klíčících spor staly protoplasty. Reakční roztok se filtroval přes 3G-2 skleněný filtr (výrobek firmy HARIO). Filtrát se centrifugoval při pokojové teplotě při 1000 x G po dobu 10 minut, čímž se protoplasty získaly jako precipitát.
2) Transformace
Protoplasty získané v kroku 1) se dvakrát promyly 30 ml roztoku 0,55 M chloridu hořečnatého a jednou 30 ml roztoku obsahujícího 0,55 M chlorid hořečnatý, 50 mM chlorid vápenatý a 10 mM 3-morfolinopropansulfonát (pH 6,3 nebo nižší, dále v textuje tento roztok označován jako MCM roztok). Protoplasty byly potom resuspendovány ve 100 μΐ roztoku obsahujícího 4 % hmotn. polyethylenglykol 8000,10 mM 3-morfolinopropansulfonát, 0,0025% hmotn. heparin (výrobek firmy Sigma), 50 mM chlorid hořečnatý (pH 6,3 nebo nižší, v dalšímm textuje tento roztok označován jako „transformační roztok“).
Bylo smícháno 96 μΐ transformačního roztoku obsahujícího okolo 5 x 107 protoplastů ·· · · 4 ·· ·· · • 444 4444444 ·» · 4 · 4 4 4 444 • a a 4444 44a « · 4 4-4 44 «4 44444 a 10 μΐ TE obsahujícího 120 pg plazmidu pSAKexpE nebo pSAKexpR. Reakční směs se promíchala a následně se nechala stát v ledu po dobu 30 minut. Potom bylo do směsi přidáno 1.2 ml roztoku 20 % hmota, polyetylenglykolu, 50 mM roztok chloridu hořečnatého, 10 mM roztok 3-morfolinopropansulfonátu (pH 6,3). Kapalina se jemně přidávala pipetováním a po té se nechala směs stát při pokojové teplotě po dobu 20 minut. K reakční směsi se potom přidalo 10 ml roztoku MCM a směs se nechala jemně míchat. Potom se protoplasty oddělily centriíugací při pokojové teplotě při 1000 x G po dobu 10 minut. Transformované protoplasty se po centrifugaci získaly ve formě precipitátu.
3) Regenerace buněčné stěny u transformovaných protoplastů
Transformované protoplasty získané v kroku 2) byly resuspendovány v 5 ml tekutého VGS agarového media pro střední vrstvu a touto směsí byla převrstvena vrstva 10 ml tuhého VGS spodního agarového media nalitého na plotně. Plotna se nechala inkubovat při 26 °C po dobu jednoho dne, po této inkubaci se nalitá plotna s oběma medii převrstvila 10 ml tekutého VGS horního agarového media obsahujícího 5 mg hygromycinu B na plotnu (konečná koncentrace hygromycinu je 200 pg/ml). Po inkubaci při 26 °C po dobu 14 dnů, byly oba kmeny (to znamená, ty kmeny, které byly odvozeny od protoplastů transformovaných pSAKexpE nebo pSAKexpR ) subklonovány na PGA agarové medium obsahující 200 pg/ml hygromycinu B a dále dále subklonovány na připravené šikmé PGA agarové medium, kde se nechaly inkubovat při 26 °C po dobu 14 dnů.
Kultury zálohované na šikmém agarovém mediu se uchovávaly při 4 °C.
Testovací příklad 1: Srovnání schopnosti bosyntézy ML-236B v transformovaných a původních kmenech
Transformované kmeny získané podle postupu popsaného v příkladu 14 a Penicillium citrinum kmen SANK 13380 byly kultivovány a v každé kultuře bylo měřeno množství vzniklého ML-236B.
Inokulum spor o velikosti 5 mm čtverečních se odebralo ze zásobních šikmých agarových kultur obsahujících transformované kmeny a nechalo se kultivovat postupem popsaným v příkladu 14. Stejným způsobem popsaným v příkladu 2 se připravila kultura obsahující Penicillium citrinum kmen SANK 13380. Buňky byly poté inokulovány do 10 ml MBG3-8 media nalitého do 100 ml konických lahví, kde se nechaly inkubovat při 24 °C po dobu dvou dnů, po té následovalo přidání 3,5 ml roztoku 50 % hmota, glycerinu. Následovala kultivace probíhající ještě po dobu 10 dnů při 24 °C za třepám.
K 10 ml kultury se přidá 50 ml 0.2 N hydroxidu sodného, potom pokračuje inkubace při 26 °C jednu hodinu za třepání. Kultura se centrifuguje při pokojové teplotě a při 3000 x G po dobu dvou minut. Oddělí se jeden mililitr supematantu, smíchá se s 9 ml 75 % methanolu a vzniklý vzorek se podrobí dělení na HPLC.
Jako sloupec pro HPLC se používá SSC-ODS-262 (mající průměr 6 mm, délku 100 mm, vyrobené firmou Senshu Kagaku Co.Ltd.). Složení mobilní fáze je následující: 75 % obj. methanol - 0,1 % obj. trietylamin - 0,1 % obj. kyselina octová. Eluce se provádí za pokojové teploty a průtokové rychlosti 2 ml/minutu. Za těchto podmínek se ML-236B eluoval za 4 minuty po nanesení na sloupec. Detekce se prováděla pomocí UV detektoru při absorpční vlnové délce 236 nm.
Schopnost biosyntézy ML-236B byla zvýšena ve třech kmenech z osmi kmenů transformovaných pSAKexpE. Schopnost biosyntézy ML-236B těchto kmenů byla ve srovnání s původním kmenem v průměru o 10 % vyšší. Schopnost biosyntézy ML-236B těchto tří kmenů zůstala stabilně zachována také po jejich subklonování do subkultur, také po jejich převedení na monospóry a po dalších podobných postupech. Výsledky potvrdily, že inzert v plazmidu pSAKexpE obsahuje cDNA urychlující biosyntézu ML-236B.
Schopnost bisyntézy ML-236B byla zvýšena v pěti kmenech mezi kmeny transformovanými pSAKexpR. Schopnost biosyntézy ML-236B byla u těchto kmenů ve srovnání s kmenem původním přibližně o 15 % vyšší. Schopnost biosyntézy ML-236B u těchto pěti kmenů zůstala stabilně zachována také po převedení na monospóry a po dalších podobných postupech. Výsledky potvrdily, že inzert v plazmidu pSAKexpR obsahuje cDNA urychlující biosyntézu ML-236B.
Z výše uvedených výsledků vyplývá, že cDNA získaná z mikroorganismů produkujících ML-236B podle postupu popsaných v předkládaném vynálezu urychluje po svém vnesení do mikroorganismů produkujících ML-236B biosyntézu ML-236B .
Příklad 15: Určení sekvence cDNA odpovídajících strukturním genům mlc A-D.
Byla určena sekvence cDNA odpovídajících strukturnímu genu mlc mlc A.
Primární vlákno cDNA bylo syntetizováno pomocí soupravy TAKARA LA PCR kit verl,l (Takara Shuzo Co., Ltd.). K amplifikaci cDNA úplné délky, či částečných délek, bylo provedeno několik PCR reakcí.Primámí vlákno cDNA bylo použito jako templát a několik oddělených párů oligonukleotidů jako primery.
• · · · · · · · ·· · ····· ··
K určení sekvencí byl použit následující cyklus - 30 opakování následujících inkubací 30 s při 94 °C, 30 s při 60 °C a pět minut při 72 °C . Sekvenační souprava Big Dye Primer/Terminator Cycle Sequencing Kit a sekvenátor ABI Prism 377 byly použity pro vlastní určení sekvencí (PE Applied Biosystems).
Produkt každé reakce byl po té jednotlivě vložen do plazmidu pCR 2.1.
Od každého rekombinantního plazmidu byly získány transformanty Escherichia coli.
Pro každý inzert v získaných rekombinantních plazmidech byly určeny nukleotidové sekvence.
Na základě srovnání mezi několika nukleotidovými sekvencemi výše zmíněných RTPCR produktů byly určeny sekvence exonů a intronů a z nich potom odvozen strukturní gen mlc A.
Poté byla určena sekvence cDNA odpovídajícíc strukturnímu genu mlc A, která je uvedena v Seznamu sekvencí jako SEKV. ID. Č. 43. Také byla odvozena aminokyselinová sekvence polypeptidu kódovaného výše zmíněnou cDNA (SEKV. ID. Č. 44) a dále také na základě výzkumu homologií, založeného na porovnám aminokyselinových sekvencí, byla odvozena předpokládaná funkce tohoto polypeptidu.
Nejblížší známá homologm sekvence pro mlc A (polypeptid) byla LNKS(ZovB) ve skupině genů souvisejících s biosyntézou lovastatinu, kdy identita dosahovala 60 %.
Podobným způsobem byla odvozena sekvence cDNA odpovídající strukturnímu genu mlc B, která byla označena v Seznamu sekvncí jakoSEKV. ID. Č. 45. Byla odvozena odpovídající aminokyselinová sekvence polypeptidu kódovaného výše zmíněnou cDNA a označena v seznamu sekvencí jako SEKV. ID. C. 46 a byla také odvozena funkce daného polypeptidu, a to na základě výzkumu homologie aminokyselinových sekvencí.
Nejblížší známá homologm sekvence pro mlc B (polypeptid) byla LNKS(ZovF) ve skupině genů souvisejících s biosyntézou lovastatinu, kdy identita dosahovala 61 %.
Podobným způsobem byla odvozena sekvence cDNA odpovídající strukturnímu genu mlc C, která byla označena v Seznamu sekvncí jakoSEKV. ID. Č. 47. Byla odvozena odpovídající aminokyselinová sekvence polypeptidu kódovaného výše zmíněnou cDNA a označena v seznamu sekvencí jako SEKV. ID. Č. 48 a byla také odvozena funkce daného polypeptidu, a to na základě výzkumu homologie aminokyselinových sekvencí.
Nejblížší známá homologní sekvence pro mlc C (polypeptid) byla LNKS(ZovA) ve skupině genů souvisejících s biosyntézou lovastatinu, kdy identita dosahovala 72 %.
Dále byla podobným způsobem odvozena i sekvence cDNA odpovídající strukturnímu genu mlc D, která byla označena v Seznamu sekvncí jako SEKV. ID. Č. 49. Byla odvozena
odpovídající aminokyselinová sekvence polypeptidu kódovaného výše zmíněnou cDNA a označena v seznamu sekvencí jako SEKV. ID. Č. 50 a byla také odvozena funkce daného polypeptidu, a to na základě výzkumu homologie aminokyselinových sekvencí.
Nejblížší známá homologm sekvence pro mlc D (polypeptid) byl ORF8 ve skupině genů souvisejících s biosyntézou lovastatinu, kdy identita dosahovala 63 %.
Byly určeny následující pozice pro exony každého strukturního genu v sekvencích označených v Seznamu sekvencí jako SEKV. ID. Č. 1 nebo SEKV. ID. Č. 2:
Tabulka 11: Pozice exonů v mlcA-D v inzertech pML48
SEKV ID kde se exon vyskytuje Exon Číslo Nukleotidové číslo v SEKV. ID. Č. 1 nebo SEKV. ID. Č. 2
MlcK 2 1 22913 22945
2 23003 23846
3 23634 23846
4 23918 24143
5 24221 24562
6 24627 27420
7 27479 27699
8 27761 30041
9 30112 30454
10 30514 30916
11 30972 32910
MlcB 2 1 11689 12002
2 12106 12192
3 12247 12304
4 12359 12692
5 12761 v az 13271
6 13330 13918
7 13995 20052
MlcC 1 1 11631 12140
2 12207 12378
3 12442 13606
MlcO 1 1 24066 24185
2 24270 27463
3 27514 28130
Byly určeny následující pozice pro terminátory transkripce každého strukturního genu v sekvencích označených v Seznamu sekvencí jako SEKV. ID. Č. 1 nebo SEKV. ID. Č. 2:
···· ··· ··· • · · ····<· · ·
Tabulka 12: Pozice terminátorů transkripce u strukturních genů mlc A-E a R v inzertech pML48
Gen SEKV. ID. Č. kde se nachází terminační místo pro translaci Nukleotidové číslo transkripčního terminačního místa v SEKV. ID. Č. 1 nebo SEKV. ID. Č. 2
mlcA SEKV. ID. Č. 2 32910
mlcB SEKV. ID. Č. 2 20052
mlcC SEKV. ID. Č. 1 13606
mlcD SEKV. ID. Č. 1 28130
mlcE SEKV. ID. Č. 2 5814
mlcR SEKV. ID. Č. 2 1918
Příklad 16: Studie poškození genu
Strukturní geny mlc A, B nebo D z P. citrinum byly pozměněny pomocí místně směrované mutagenizace za užití postupu homologní rekombinace.
Rekombinantní plazmid pro získám pozměněné mutanty strukturního genu mlcA z P. citrinum byl konstruován pomocí plazmidu pSAK333.
Byl získán interní fragment 4,1-kb Kpn\ z lokusu pro mlcA na plazmidovém inzertu z pML48. Tento fragment byl purifikován, jeho konce zatupeny pomocí soupravy DNA Blunting Kit (Takara Shuzo Co., Ltd.) a tento fragment byl ligován do plazmidu pSAK333 štěpeného PuuTÍ. Výsledný plazmid byl označen jako pdismlcA.
P. citrinum kmen SANK13380 byl transformován pomocí pdis/wZc^.
Hybridizace genomové DNA z pdiswZc^ transformantu postupem Southem blotu byla použita k potvrzení změny ve strukturním genu mlcA..
Výsledný mutant mlc A- neprodukoval ani ML-236B ani jeho prekursory. Rekombinantní plazmid pro získání pozměněné mutanty strukturního genu tmZcB z P. citrinum byl konstruován pomocí plazmidu pSAK333.
Byl získán interní fragment 1,4-kb Psi- BamHI z lokusu pro mlc B na plazmidovém inzertu z pML48. Tento fragment byl purifikován, jeho konce zatupeny pomocí soupravy DNA Blunting Kit (Takara Shuzo Co., Ltd.) a tento fragment byl ligován do plazmidu pSAK333 štěpeného PuuQ.. Výsledný plazmid byl označen jako pdismlcB.
P. citrinum kmen SANK13380 byl transformován pomocí pdismlcB.
Hybridizace genomové DNA z pdismZcB transformantu postupem Southem blotu byla použita k potvrzení změny ve strukturním genu mlcB.
···· · · · ··· ·· · ····· ··
Výsledný mutant mlcB- neprodukoval ML-236B, ale ML-236A, což je prekursor ML236B.
Rekombinantní plazmid pro získání pozměněné mutanty strukturního genu mlčD z P. citrinum byl konstruován pomocí plazmidu pSAK333.
Byl získán fragment o velikosti 1,4-kb Kpn\ -ΒαηϊΆ z lokusu pro mlc\J na plazmidovém inzertu z pML48. Tento fragment byl purifikován, jeho konce zatupeny pomocí soupravy DNA Blunting Kit (Takara Shuzo Co., Ltd.) a tento fragment byl ligován do plazmidu pSAK333 štěpeného PuuII. Výsledný plazmid byl označen jako pdisw/cA
P. citrinum kmen SANK13380 byl transformován pomocí pdism/cD.
Hybridizace genomové DNA z pdisw/cZ) transformantu postupem Southem blotu byla použita k potvrzení změny ve strukturním genu mlcY)
Množství ML-236B produkované výslednou mutantou mlcD- dosahovalo přibližně % množství produkovaného netransformovaným hostitelským kmenem.
Příklad 17: Funkční analýza mlc R v pSAKexpR transformantech.
Dva pSAKexpR transformanty, které byly získány postupem popsaným v příkladu 12, označené jako TRI a TR2 a dále netransformované hostitelské buňky Penicillium citrinum kmene SANK13380 byly inokulovány do MBG3-8 media a jednotlivě inkubovány, jak je popsáno v příkladu 8.
Z každé kultury byla extrahována celková RNA postupem popsaným v příkladu 8.
Byla provedena RT-PCR s užitím výše zmíněné celkové RNA jako templátu a páru oligonukleotidů navržených na základě nukleotidové sekvence strukturních genů mlc A, B, C D E nebo R jako primerů.
Tabulka 13: Nukleotidová sekvence párů primerů pro RT-PCR.
Cíl <T-PCR Primer 1 SEKV .ID. Č. Primer 2 SEKV .ID. Č.
mlcA 5 ’ -gcaagctctgctaccagcac-3 ’ 51 5 ’ -ctaggccaacttcagagccg- 3’ 52
mlcB 5 ’ -agtcatgcaggatctgggtc-3 ’ 53 5 ’ -gcagacacatcggtgaagtc- 3’ 54
···· · · * · · · ·· · · · · · · · · • · · · · · · · · · · «· · · · · · ·· ·· ··· ·· · · · · ·
mlcC 5 ’-aaaccgcacctgtctattcc-3 ’ 55 5 ’ -ctttgtggttggatgcatac-3 ’ 56
mlcD 5 ’ -cgctctatcatttcgaggac-3 ’ 57 5 ’ -tcaatagacggcatggagac- 3’ 58
mlcE 5 ’ -atgtcagaacctctaccccc-3 ’ 59 5 ’ -tcaagcatcagtctcaggca-3 ’ 60
mlcR 5’atgtccctgccgcatgcaac-3' 61 5 ’ -ctaagcaatattgtgtttct-3 ’ 62
Výsledky analýzy RT-PCR jsou ukázány na obrázku 5 pro netransformovaný kmen Pencillium citrinum 13380 a pro dva transformanty označené TRI, TR2.
Strukturní geny mlc A, B, C, D a R byly exprimovány první, druhý a třetí den kultivace v pSAKexpR transformantech.
Naopak, všechny tyto strukturní geny se exprimovaly v netransformovaných hostitelských buňkách jen třetí den kultivace.
Pro strukturní gen mlcE nebyl shledán rozdíl v expresi mezi pSAKexpR transformovanými a netransformovanými hostitelskými buňkami.
Získané výsledky naznačují, že protein kódovaný cDNA odpovídající strukturnímu genu mlc R indukuje transkripci nějakých jiných, dalších strukturních genů, (například mlc A, B, C, D) nacházejících se ve skupině genů souvisejících s biosyntézou ML-236B.
Příklad 18: Funkční analýza mlc E v pSAKexpE transformantech
Transformant pSAKexpE označený jako TE1, který byl získán postupem popsaným v příkladu 12 a dále netransformované hostitelské buňky Penicillium citrinum kmene SANK13380, byly inokulovány do MBG3-8 media a inkubovány jednotlivě tak, jak je to popsáno v příkladu 8.
Z každé kultury byla extrahována celková RNA postupem popsaným v příkladu 8.
Byla provedena RT-PCR s užitím výše zmíněné celkové RNA jako templátu a páru oligonukleotidů navržených na základě nukleotidové sekvence strukturních genů mlc A, B, C D E nebo R jako primerů. Primery použité v tomto příkladu jsou identické s primery v příkladu předcházejícím.
Výsledky analýzy RT-PCR jsou ukázány na obrázku 6 pro netransformovaný kmen Pencillium citrinum 13380 a pro transformant označený TE1.
Strukturní gen mlc E byl exprimován první, druhý a třetí den kultivace v pSAKexpE transformantech.
Naopak, strukturní gen mlc E se exprimoval v netransformovaných hostitelských buňkách jen třetí den kultivace.
Na druhé straně nebyl nalezen žádný rozdíl v expresi strukturních genů mlc A, B, C , D a R mezi netransformovanými hostitelskými buňkami a mezi SAKexpE transformantem (data nejsou uvedena).
Výsledky naznačují, že protein kódovaný cDNA odpovídající strukturnímu genu mlc E urychluje biosyntézu ML-236B nezávisle na strukturních genech mlc A, B, C, D a R.
SEZNAM SEKVENCÍ <110> Sankyo Company. Limited
<120> Geny ze skupiny genů
<130> EPP83481
<150> JP 2000-116591
<151> 2000-04-18
<150> JP 2000-117458
<151> 2000-04-19
<160> 62
<170> Patent ve verzi 3.0
<210> 1
<211> 34203
<212> DNA
<213> Penicillium citrinum
<400> 1 gatcaatact acgtcgttgt tatttccttg tcagtaatga ctaacaaatt ccccagaaca 60
gacgaagtca cagctcacac cacaagagaa aatgagtcca gcgaggatta cagatttctc 120
gccaggcaaa ccgagaaaag ctctcttatg catccacggt gccgggtgct cagcagccat 180
attccgcgtc cagatctcta aactgcgcgt ggcgttgaaa aacgagtttg aattcgtata 240
tgcgaccgcg ccgtttagct ccagccccgg acccggcgtg cttcctgtct tccaaggcat 300
gggtccatac tacacctggt tccaaaagca tcatgacgcc gttacaaaca cgacaacccc 360
cacggtgggc gatagagtag cggctgtgat cgggcctgtg caaaagaccg tccaagattg 420
gtctataact aacccacagg cacccattgt cggcatagtg gccttctctg agggcgcatt 480
·· ··· · » ··
ggtcgccact ttgctgctcc atcaacagca aatgggaaaa ctgccatggt ttccgaaaat 540
gagcattgct gttttgattt gctgtttcta tagcgatgaa gccagagatt acatgagagc 600
cgaggcgcaa gacgacgacg acaagctaat aatcaacgtg ccgacactgc atcttcacgg 660
tcgtcaagat tttgctctcc aagggtcgag acagatggtt gaaacacatt acctgcctca 720
gaatgcagat gtactcgagt ttcagggaaa gcataatttt cccaacagac cgagtgatgt 780
ccaggagacg gtcaagcgct tccaacagct atatcaaaag gtcaagatgt caggttcatt 840
tgtctaggtg agacaacagg gtatatagca aggctctggc tctcatgcct agtccatacc 900
acatttttac tgaacaaatt tgaatagttc taatcttaca cggtttgaat gctcaccttc 960
caagggtgat ttagttatag tggtcgcgac catctcataa atatttcgtg aacatatttt 1020
ggatagatca tggaaggctc gttctgaaca ggcatgacag acatctaaaa ccactcgatc 1080
accacaacaa ggcactaaac cagtaactat ggaactattt gcaatggcgt cgaatttata 1140
tacaggatgg attgaaatca attccaagcc ttggaggttt caccttcctc acagagtctt 1200
tcgaaacgcg ctaccgaggt atatttatca ccgttacggt actctgaacc gcgctatcta 1260
acttgatgtt acgattgctg caataaagaa gagcaacgaa ggtagaagta attttgacaa 1320
agatacaaga cgaattcgct atttgtagat gaatatgcgt gtgtcaattg acgccgaatt 1380
caggatagat ttgccatctg ctctattgcc aatttctaat ccatctttat catgaacaac 1440
actcaaacca cacatctgaa ttcacggcgc tgaacgatct aggccaactt cagagccggg 1500
ttcatcgaga acatagtgag gattgaagaa aagtggtcta caaaggcctg agcgtgctca 1560
gggccataca gcgagctctg aagtttgaca tgaatgagtg ggtccttggt agggtcatcc 1620
cacatctcga gaacgatgtc ataaggagtg cgctcacggg aagcgagaac actcgtcatt 1680
ttggcattgc caattgagcc actctccgct tgaccctgct tgtaatcaaa gacagcctgg 1740
aacaaggggg cgtgtgtctg agtcttgggt tcctcgcctg aggtagggag attcaggcct 1800
agacagtcga ggatgacgcc atacggcacc cgcgcgtgtt gcatggcctc acgcacactg 1860
tccttggtgg ctacaaggtg ctcgccgaat gtcttgctgc cgacgaactc atcaaagcgc 1920
aggggaagca cgttagcgaa aaagcccatc gccgaaattt cttccatggt ggatcggttg 1980
gtttcggcga ggccgatggt tatgtctttg ctgccggtaa gacgcgccaa caaaacgtgg 2040
taggcggcca ggtagaactg catgggggtt gccttgtgct tgcggctccg ctctttgatt 2100
cggaaggcga ccatgggatc taaacgagca attgcttcat actgctgcca cgtgaatggc 2160
tgtatttgct gctgctctga attggcagca gggtcattga tcagattcat gatgggaagc 2220
acggttggcg cagatgacga gactttgcta tgcatggact tccagaacgc gatatcgtcc 2280
cccattcgcc cattttccag gttttcccgc tgttggacgg ctagatcaga gaattgggtc 2340
* · · ·« · · <· · ···· ··· ··· ·· · ····· ·· • · · · · · · » · · · • · · ···· · · • v ·>· ·· · · ·· ·
gatggtcgct gcattttcac cccgctgtaa atctgcccga tctcattgaa caggttttct 2400
gttgttgagc catcaccaac taatctgtgg tagccgatta ccaacaggtg gtcatctgtg 2460
ccccagtaga aatcaacgag tctgagagtg tcacctgtgg agatgctata gtttgtcttc 2520
tcgagtttcc ggtactcttc ctctgcctcc gcagcgttgt tcacctgaac aaagtgcact 2580
ctgttctccg ggttcttgag aaccacttgg acgggaccat ttaaatcgct gctatagtca 2640
tcgccagtaa caaagcacgt acggaagatc tcgtgacggc gcaatgaggc tttcagagcc 2700
cgcctcaacc ggtcgaggtc aatggtaccc ttcatgaaca tgccaatagt gttgttgaag 2760
atggtatgat cttttaccat ttgttgctgc ctccaggaat actcctggcc aagggacaac 2820
ctctcgcgac gaagaatctt acggcctccc tgctcattat cgtcctcttg ctcttcatcc 2880
tcttcggctg acgacgcatc tgtgctggta gcagagcttg cttcatcatg gctgtctgtt 2940
ggtgtcggag aagccccgct gtccgaggtt cccgtggaat caccaatttg caacagcagc 3000
ggaatggatg tagctgggag tcgggtggcc gcgtcgtcgg caagatcagc gacagaagca 3060
ccgccaagta ccctcaagag tgggaggtca aggtagagtt gctttgagaa ccatgagccg 3120
acagtcactg cacccaagga gtcgacacct tgatcaatga gaggaatggt tgggtccacg 3180
ctctccccgt ccgaaacttg gagggtaaca cggagtttct cagatagacc atctgcaact 3240
ttgttagttt gaactcgata tcaggaaacg catgagagat aacttaccaa tcacgatttg 3300
ccgaacttgg tctaaagttg ttgcttgttt gagctggtcg gcaatggagc ctttagaccc 3360
tgatccattg tcgccaccgt ctccgcgttg accgggaatt ttgaagtttc cgaaacgagg 3420
gtcgttgaag taaataattc gatcttgaag cgcagggtca agatctggga tacccgtggt 3480
aagctcaagg tccgccatgt caatgaccgt cttgcgctgt ggttgctgcc gggcacgctg 3540
gtcagacacg accgcttcgg cgaaaagcgt gtgcagctca tgctcttcaa ctgagtcaaa 3600
catgaaacgg atagcatcaa agtcctcctc catctcggcc ctcgtgacaa accctacacc 3660
gtaaacggca ccaatatcga tggttgatcc ctgtggttgt gcgttagtaa cttgacgtcg 3720
atgcatgata attcaggggt agaaaatacc gccaatcctc tggcgcaccg ttgctgggcc 3780
agagcctgta ggtaggcatt cgcagcgcca tagttggact ggccaggatt gccaataact 3840
gcaacaatgg acgaaaacat gatgaagaag tcgagcgcct tgctgcccgt ctgttcggag 3900
aaccgttcat gaagaatgcg tgctccttgt accttgggct tcaacaccat gtccatcatc 3960
tggtggtcca tgttcttcag catgacatcc tgcagcacca aaggcccgaa cgcgatgccg 4020
gcaacaggtg gcaacttcat atcgacaagc ttgccaaggc cagcatcgac tgaatcctca 4080
ttggcaacat ccctaaagaa agtaattgga taagtaaacg aggatgtggt agcaaggtgt 4140
« · c
gatgtgatat caatcaactt acattgacag aacggtgatg tcaccaccaa gtgcctccat 4200
gttggcgatc catttgggat caagtcgagg gttccggcta gtgagcacaa catggcgggc 4260
gccatgcaag atcatccagc gacagagaga gcgaccaagg tccccggtaa gaccaacaag 4320
caaatacgtc ttcttgttgg aaaataagtt accagagtcg atggggcaaa tcctagcgga 4380
cacctcattt tccttccagt cgatgacggt ggccagattg aagcgttggt cattgtggtt 4440
gacagagagc tgaccaggca agagaatttg tgtggctgta ataactttct cagtgtcgtc 4500
gacagtcgac gcagagacgg tattttttgc cattgccaca gagtgctcga ggattggaat 4560
atcctcaaca tgactaactt tgtatgtgga agctgtactt cggataagat agtcaccact 4620
gtacatgaag caactgggtg gtagcaactt ggccaaacgg ttggttatcc cggcagcagt 4680
ccggtcggta gacaagtcaa agaatgccat catgtttgtc ggcaggctgt gtttcagccg 4740
agcgtcggtt tccttggcat gtaatcggat ccaaggagcc ggaatagttt tgacgtcgga 4800
cagagttgtt gccaaatgaa cctgaacacc gtaggttttg gccgactcca gaattgcttt 4860
gacgcagaag attgggggct ccataatcag aattgatgca tcagagccaa aggactgagc 4920
gctagagaga attgtt.tcgg caaggagggc tgcagctgtg gacaacaaga aggaactatc 4980
ctcgccttcc gccatgttat cgggcagact atgcatgtag tttctcggta catgcagtat 5040
agatccattc ttctcagcca gggcgactac aggcacctca catgtattct ccagaatact 5100
gccctgcacg acatggaagt atccgagatg gcccacgcga attgcctggg gaagagcgta 5160
gcgaacacga acagttgctt ttccagcatg acgagcgtct tctaacgaat cacacgtctc 5220
ggttgactca agatagtaca tcgatgagga tgctcccctc gcctctttca gtgcaatggc 5280
cgtcttggac gaattaaagt taccgaaaat tggacgacga gacgagttca tacggtcgtt 5340
cctagcaata tcctgcttca aacgagggac ccaggcacga cccttgcacc agtacacttc 5400
gggctcatga gtccatgtta ttgattccaa aagctgatca tcgctctcct cgaagcgcaa 5460
aagttgctca acgaagaatt tggtgtctag gttctccaca gtatcgacat cgaagacgtg 5520
cgttcccaag tcagggttct cgagcttgat tgtcctcaac attccgatgg tgctggcctg 5580
gtggggatga tcaatccagg cattctctgt cagccacatc atgcgtccgg cgtagaagag 5640
aagagacttg actgcctcaa acttgtcctc ttcaaggttg caaaacactt catcatcaag 5700
ttccgagagg atgacaaaag tcgacttagg ctgcaaggcc gggtcgtcga gaacactttc 5760
cagccgcttg acggagtgga tgtgtctatg cggtagggca gctttcatgt cgttcaaaat 5820
gcgttcggtt tttgtcgatt cgccaccgat aaccactaat ggcgggtatg agtccttcaa 5880
tggagcagaa agtggatcat acaaacgctc aacggtggca tccacagcat gtgtactgaa 5940
gacagacggg atcaaatcat cctctcgatc aagtgtccga ctatcgacgc cagagaaccc 6000
aactctcttg agggtatgct cccattggtc aacggacccc gaggcactca aagcacgagt .6060
ttcgtcttct ccagtccatc gatcagcgaa aagcccagag atgaaggcga ggcgagcagg 6120
ctcgcgatgg gtgaccccga aagtaaccaa gtgaccaccc ggcttgagca aggaccttat 6180
gtgagccaat ttttcctcga agttggagct ggcatggagg acatcggatg caataatcag 6240
atcgtaggag tgaggcttga atccttgctc tgctgggctt ctgttgatgt ctagtgcctc 6300
aaactgcatg agaccgtcga attcggaaag ttgttcacgg gccttgccaa taacatccgc 6360
cgagatgtca gtgcaagtgt aactgttgaa accaagttga ggtgatgcaa gaacgcgctt 6420
cgtggcgatg cctgtaccca agcctaaaaa gcgaacgaca gattagcaaa ctgcctagtt 6480
acttacattt cagattcgac ttaccgatct caaggatatc aatggattgg tagcgatgag 6540
caatttggct aaccagatcc tgaacgacgt gtattgctga gccaaaggcg agcttgttgg 6600
tatagtactc ggtgaacaac ccatcgcggt tcatgatatc caaaggatcc ccgttcccgc 6660
gaacaattga aattaattct ttgcctaccc tttggatcag gcgcacatgt gggtgggacg 6720
agttgcttca agtaaaaggt taatataaaa gaatgaaaaa acacggaaca gctttgggtg 6780
tacctttcac acatttgctc aatgtgaaca gaagtgtcct cctcccaaga ctcctggtac 6840
cactgatggt ggccagcccg agcatcggcc tgaacctggt cacaccattc aatgtacttc 6900
tgggaatgga ggtcggcatt ttgacggtcg tcgggggtta tctgggctag gaaggatttg 6960
atgtagaagt aaacgattcg ctcgatggtc agaatgtcct ccttgtcccg agctatgatc 7020
aacgtcgcag ggtcctccag cagtttttcg ggcgtgaggg gtccccagac ccactttgcg 7080
aagattcggt ggtcggtcga agcagtcggg ggagagaaag gcttaaagac aatgttatca 7140
acttggaaaa gcgttgtctt ggtcgaatcg tacaccgtga tgtcgccgct caggaaatca 7200
cccttgtcgt gtgtgttgat tgtgtcaaac gcaagctcgg tttcaccaga attacccgcc 7260
gatatacaga gcgatggaat cagagtcact ctgtcaacgt gagtaggcac gtacaatgag 7320
cgtaggcgac gatctcctgg agaggaatac gctccaatga cagtctggaa cgcgatgtcc 7380
aggggcgctg ggtggagcaa gaggggctca ttgcgcaatt catccttaag tggaaggaaa 7440
gccaaggtgc cgctagcttt ggagtcggcc cttctcatgg tctgcaaacg acggaagtct 7500
ttgctgtagt catacccaag gaggtcaagt tcccgataga agaaatcgat gttgacattg 7560
ttcatctggg ggtactcttc ctcaggtggc ggcaaaagct gcgatgacgg tgatgcctcg 7620
ccaagggtta tgacgatttg gcctttggcg gatgtcgaaa gctcactctc ctttgccaga 7680
caggaatcaa taacaaattt gaccgtgact tggccatccg catcattgtc actggtgact 7740
tcggctgtca agttcagctc cacggaggtg ttttcatctt caaacacgat ggctttgttg 7800
atgctcatgt ccaagatttc caggagctga acttgggcgg cacgctcacc agccaccttc 7860
atggcagctt ccatggccat aattatgtac ccagcagcgg ggaacacagt ctggccttgt 7920
agcgcatgac cgtcgagcca ttccagatcc cggggcctga tgaagtttgt ccactggaag 7980
gtcgatgctg tgctgtaaga agaaagcttt ccaagcagaa gatggggcgc acctccacga 8040
agatgctggc gggtggagcg agattctgcc cagtattgac gagtatgatc ccaagagtat 8100
gtgggcaatg actttgacag gttttgaacg gcacgatcgg gccggacttg ttgtacgaag 8160
ccctcggcgt cgatactccg aactccgaaa cgctcccaaa tgtatcccag acctccagca 8220
aaagcgtcca catcgtcaac gtttcgtgcc aagcacccgg tatacggcag ctccacaccg 8280
gcaagagcat ccttgatggt ggctagacac ggacccttga gagcagggtg ggcgccaatt 8340
tcgatggcga cgtcgattag acgatgagtg atgactgctt tctgcacagc ctgcgagaac 8400
aagaccggag agacgagatt gtctttccaa taagcgggca tcacatcctg tacagtcatt 8460
tgcttgctgg tctcgtggac ggcagagaac caagcaacac tatcgttacc ttggccatcg 8520
gcaacagcac agtcgcactc cagcaatgcc ttgacatatg gagctgcgca tgggtgcatg 8580
tgatgcgaat ggtaggcctt gtcaactctc aagattctgg caaaagtgga ttcatcctcc 8640
aagacacctt caacgtgctg gatagcatcc atgtcgccgg agaaggtcac actatccggt 8700
gaattgctag cggcgacgca gacccgaccc tcaaaggctt cgagctcgca tagttccttt 8760
gcgtcatcgt acgacatacc tgccgctagc atagcgcctg tctggccgct tggagaagag 8820
gcatgctccg cggacacaac tccacgcaga tgcgcaatac ggatagcttg agtggcactg 8880
atgaatcctg ccgcaaaggc acaggcaatc tcacctgaac tgtggccgac aattgcactg 8940
aactcgatac cagctgcagc gagaagtcgg accagaacga tttgtacggc gcagcataga 9000
ggctgggaga agctggcgag tctgacgttt gaggcatccc cttcaagcat gagctggtca 9060
tacagtgtcc acgtaggccg atacttttca ggcagtgttt gcagtgaatt atccagctct 9120
tcgagaatgc ctctcacaaa tggcataccc accatgagct tcttcagcat gcccggccac 9180
tgtgcacctt ggccagtaaa gacacctagt acgcgagggt tgtcattcgc gtcggtgcgg 9240
aagtcggtga cgacctcacc gtccgcgatg gcagcctcca gtgccgcgcg ggctacttcc 9300
ttgttgtgtg ctgcaatcgc acgacggaag ggcaagatag accgtttctc aagtaaggta 9360
tatgcgatat catgcatgtc cacgtcatca tgcgtttcca gaaattggag catattttct 9420
agcgttgcct tcatggagcg ctgcgacttc gatgaaagca caaggggcaa gctgcatgca 9480
tctgcatctg aggtcacctc tgttaccact gctgtcggct tgtgtggagg agccatatac 9540
tcttcgataa tagcatgggc atttgtacca ccaaatcctg atgtgtttat atgtttagct 9600
aacttcactt tcgttctcaa gaagtgcagt tgaatcctta ccaaatgaat taacgctgac 9660
tctgcgaggc tgcccgggcg caacaatcgg ccattctgtg gcctccgttg caattttcaa 9720
gtgcgtatag aacggagcga cacggggact gatcttctca aacagcaggt ttggcgggat 9780
cacgccattt cgtacagcaa acgatgcctt cattaagccc gcaataccag cagtgccttc 9840
cgtgtgaccg agaactgtct tgatgctgcc gacaaaaagc tcatctttct cgccgtcgct 9900
gtcgattgtt ccatccttgt gtccgaagaa ggctgttgca atagcctcag cttcctgtgg 9960
gtcaccggct ggtgtaccag ttcctgggat cttcgtgtta gggagagaga gactttctgc 10020
aacttccata aggctgatac ttccagggaa taccacttac catgggcttc aaagaactgg 10080
cagcgttcct gggggttggt aatatcaaga ccagccttgg catatgtggc ccgaatgagg 10140
gcttcttgtg cgctatggtt tggcattgtg atacctgtcg ttcggccatc ttggttgata 10200
ccggtctctc ggataacaca ctcgatactg tccccgtcgc gcagtgcctg gctcagcgtt 10260
ttcaggacaa tagagcaaac accttcctaa aaagcagtta caggaggtca gtgccatctt 10320
gctttttttg aaaggaattg atgcattgtc aacttactcc tctggcatat ccatcggcag 10380
cagcatccca cattcgagat ctaccattgg gggacagcat gttcaatttg ctctccatta 10440
caaaggtcat ggggcccaat atcagattcg caccggctgc aaccgccatg gtactctcgc 10500
ccgttctaag ctgttggacg gccagatgca cggcagctaa ggatgaacta caggctgtgt 10560
cgatcgtcat ctgcagaatc agtcaggaat ctgtcagcac ttgacgaagt cgggctcgct 10620
caatgagtgg cactcacact cggcccatgc cagtcgaaga agtatgatac acggttggag 10680
gccacactga cagctacccc cgtggcagag tatgtaggaa tactatccaa ttcacgcgtc 10740
acgatagtct catagtcatg cgtcatcata ccgacgtaca cagcagtaga ggatccttga 10800
aggccttgga tccgtaggcc tgcgttggat acagcttcat agaccgtctc cagcagcagc 10860
ctttgctgtg ggtcaatcgt ttcggcctct ccagcttgga tgttgaagaa agaggcatca 10920
aaaccgcgta gatcctcctg cagcaagtat gcaaagggtg cgttcgtgcg cccggggtga 10980
gtgccatcgg ggctgtaaaa tgtatcgacg tcaaatctct ccttagggat cttggtctgt 11040
acatcccggg gctctttgag cagctcccaa agttttgatg gtgtgttgac accacctgga 11100
aaccgacaac cgcttcccac taccacaatt ggctcgtttg gatagttggc ttgatccata 11160
actgctgatc ctgtttttgg gcgataggat tgggattaaa ccttgtcttg cgtcagtaga 11220
tcttctcact gcatgccggg cacaacattt gttcttacag aatcgcagag ttgaatctct 11280
gagcgaacaa gccggccttg caaccgatac cgtcgttata tttacttgca cgtatcagta 11340
ctcatctaga ttcggacaat ttcaagatcc attctagtac tcaaatgccc ccacttccca 11400
gcaatgcaag ctcggcacct agcaaaccct cccggcgtca ttcggtgcac gaatagccat 11460
Ί • ·
tcctccatac ggcgttattc ggtcacacga ggctgaatga atcaaacgtg aatatcaatt 11520
ggctgtatca aggtgaaacc gagtttttca ctcggattgt tcttgtgctg ctcggtgaag 11580
ctgctcctaa aggaaacaac cgaactgccc catccaggta aacttcgatt gggggggggg 11640
tttttttttt ttcaaggttg actggaagag tgctctcggc cacaaaatcc cagaagcatt 11700
agtgctgtta ttcgattata aaccgtcgca gcgctctcat tcttcgctct ttcttctttt 11760
ccactggtgt gcataggtcc tatctgtctc acgcaatgct cggccaggtt cttctgaccg 11820
tcgaatcgta ccaatgggta tcgacccctc aagcccttgt ggcggtcgca gtgcttctta 11880
gtctcatcgc ctaccgtttg cgggggcgcc agtccgaact gcaagtctat aatcccaaaa 11940
aatggtggga gttgacgacc atgagggcta ggcaggactt cgatacgtat ggtccgagct 12000
ggatcgaagc ttggttctcg aaaaacgaca agcccctgcg cttcattgtt gattccggct 12060
attgcaccat cctcccatcg tccatggccg acgagtttcg gaaaatcaaa gatatgtgca 12120
tgtacaagtt tttggcggat gtatgacctc tgaattttcc attgttgtaa ctcaatgacg 12180
tctctaagat tctgatgaat gtataggact ttcactctca tctccctgga ttcgacgggt 12240
tcaaggaaat ctgccaggat gcacatcttg tcaacaaagt tgttttgaac cagttacaaa 12300
cccaagcccc caagtacaca aagccattgg ctaccttggc cgacgctact attgccaagt 12360
tgttcggtaa aagcgagggt aagtgtcaat ttttctgtct tgagcattga gcctctggct 12420
gacataccgc gaatatacta gagtggcaaa ccgcacctgt ctattccaat ggattggacc 12480
ttgtcacacg aacagtcaca ctcattatgg tcggcgacaa aatctgccac aatgaggagt 12540
ggctggatat tgcaaagaac catgccgtga gtgtggcggt acaagctcgc caacttcgcg 12600
tatggcccat gctactgcga ccgctcgctc actggtttca accgcaagga cgcaaattgc 12660
gtgaccaagt gcgccgcgca cgaaagatca ttgatcctga gattcagcga cgacgtgctg 12720
aaaaggccgc atgtgtagcg aagggcgtgc agccgcccca gtacgtcgat accatgcaat 12780
ggtttgaaga caccgccgac ggccgctggt acgatgtggc gggtgctcag ctcgctatgg 12840
atttcgccgg catctacgcc tcgacggatc ttttcgtcgg tgcccttgtg gacattgcca 12900
ggcacccaga ccttattcag cctctccgcc aagagatccg cactgtaatc ggagaagggg 12960
gctggacgcc tgcctctctg ttcaagctga agctcctcga cagctgcatg aaagagacgc 13020
agcgaatcaa gccggtcgag tgcgccacta tgcgcagtac cgctctcaga gacatcactc 13080
tatccaatgg cctcttcatt cccaagggcg agttggccgc tgtggctgca gaccgcatga 13140
acaaccctga tgtgtgggaa aaccccgaaa attatgatcc ctaccgattt atgcgcatgc 13200
gcgaggatcc agacaaggcc ttcaccgctc aattggagaa taccaacggt gatcacatcg 13260
gcttcggctg gaacccacgc gcttgtcccg ggcggttctt cgcctcgaag gaaatcaaga 13320
ttctcctcgc tcatatactg attcagtatg atgtgaagcc tgtaccagga gacgatgaca 13380
aatactaccg tcacgctttt agcgttcgta tgcatccaac cacaaagctc atggtacgcc 13440
ggcgcaacga ggacatcccg ctccctcatg accggtgcta agatataaca cgcaaactaa 13500
aacaaatatg catccgtccc caggcttatt ccaatagttt ccgtcccaga gaaactaggt 13560
gctgtattag tcgagtaggt tagtaaaata aaacgcattt tattcgattg tgatgccttc 13620
tttgtaatcg aacgtggtgt agactttggc tatgtgcgag agacagaaac acagagagag 13680
agaagggaga gagtgtgtat tcctgctacg cagagcggcc atctgcttct ataccgccag 13740
ctacaccgcc acgtagggaa gtcggcagta atgaagcttt tctcccggta caatcaccga 13800
tctccccatt ctctcaggcg ttgactggcg cttacgatga cgagggctta ggctctgtta 13860
agtcttgatg ttcctactca acatccccga ctaggcgaaa gagaggacgg cgcaacgacg 13920
tggacacaag tactccctcc cgccttccga ctacatatcc acaatctgta cccactgccc 13980
gtgccaacgc ctttcgaccg ttcaacgcgc atttacaagg cttgcgggaa tcataatgga 14040
gagaaaaaga gagaactttt gacagtcaag cctccgaggt gctaagacag cttccctggt 14100
agtataaaaa gcattcactc ttccgacttc gagaacgagt gcacatgtgt actttgttgc 14160
ttctcagggc cactgtaatg gtatttcagg tatctctatt tactgctatc cagaagtcag 14220
gcattaaata gtcaggctca gcccaggctc gattcagatt ggattcaggc ttcagaccat 14280
ggccgctatg ctccttcgta ctatacctcc gtcgagctat acccgcttgg ccagacaaaa 14340
ggcttcactg aacccttcaa cttaactgca tttcgccaca actaactcga cgaggccggc 14400
gatggtgtta ccattcatga gctcaaagat cgacacatca acatggattt cagatgtgat 14460
ccagtttcga agttcaatgg cgacgagtga gtctacgccg acacctgcca ggtttttgga 14520
cgaggacatg tcgtcttctg ccagaccaaa cattcgcatc agcttttccg tcattgcttt 14580
gaggacgata gaaatggcct cgtcgtgaga ggtgaccctg cttagttggg cccgcacgcc 14640
atctggtcct tttttatgcg aagagacaaa ggattggtct gcatgaagga cttggcggta 14700
tttaagtccc acaaaccgct gttcctgtat ccagtttgcc tcggtccagt gagcacccgg 14760
ggatgtgttg attcctgtaa ccacagctgc gggaggtgat ggaaattgag gggaagaaca 14820
caggattgcc ttctccaaca catccatgac gtccttttca tgcataggct tgtaacctat 14880
tctagcgagc cggtcggcca caccacggcc agtttcagcc acgtatccaa cagacttgac 14940
catgcccaag tcaatggtga cagccggcat gccatgggct ctccggtggt gcgcaagtgc 15000
gtcctggaat gcaccagcag ctgcgtaatt ggcctggcct gccccaccca tgaccccaac 15060
aagggatgag agcatcacga agaagtcaac atcctgtgcg atcttgtgaa gataccaact 15120
accctgtact tttgggcgtg ttgctgcatt aaattcatcc aatgtcattc gcgatagaag 15180
cgcgtccttg agaaccatgg caccttgtat gatacctcga attggcggtg catgtgcttc 15240
ttcgcacaac cggagcacct tggtgacctg atcttgatct gagatgtcac atgcgtgtag 15300
atagacagcg cactgttgat tttgcaagct ggttatgaat ggactggcct ttgcacttct 15360
cgataggata atcaagtgct tcgcgccatg atcaacaagc cactgacaga tctgctttcc 15420
aattcccccc agcccaccag caactaggta agaactgtca ggcttcagct tcagcgagaa 15480
ccctccatcg ccgactggga ccagttcgtc cccagataca ttgaccacaa ctttgccaac 15540
atgctgacca ctctgcatcg tacggaaggc cttctcgatg tttgacaagg agtgctgctg 15600
gattggacca atcaagccaa tcgcttttgt ctcgaggagt tttgtgacat ggttcaacgc 15660
ttcggatact tcttcacttt tggctctttg ccacgagaga agatcaattg atgtgaaaga 15720
gacgtcccgg gtgaatggca gcatgtcaag tctgctgttt tgctccaggt ccttttttcc 15780
aatctcaaca aatctgccga attcggccat gcagtcaaag cttgcttgga ggagttgacc 15840
tgccaatgag tttagaacga catgaacgcc aagtccgccc gtgtaggctt tgatgccgtc 15900
gacgaataag tcattcctgc tcgagaagat atgatccgga ttgatgccga atttatcgcc 15960
gacaaagtca cgcttggctt gagttcccgc tgtgacgaag acctcggcac ccgcaagctg 16020
ggacaaaatg atcgctgctt gaccgacgcc tccagctcca ctgtggatca agactctttc 16080
gcctcgtcgt agctttgccg tggtataaag cgcaatatat gcggtagtga aagccagggg 16140
gaccgaagcg gcttctggga agcccatttc gtccggaata cggacgacat tagtgtacgg 16200
cgtctgtgtt ctggtcgccc aatggccttt cagtagtgca catacgcggt cccctaatct 16260
gaggccttgg ctagcggcag cagctccacc gagctttgtg atcactccgg cgcattcgaa 16320
gcccatcaca cggttggcct ccaattgacc catggcaacc atgacatccc gaaaattgag 16380
accgaaagct ttgggttcga tttctaccca atcatccgga agatccttgc cttcacgtcc 16440
ttcgtcgtct cgaaattgca gggagtctaa gagccctggc gtctcaacct ccatccgcag 16500
acgacgcccg ggttgctcga acggctgcag tgtgacctca accgcttctt ggtccttcca 16560
gtgcgggtca ttgaaaagtc gcggtacgtg gatgacgccg tttctctctg caaattcaaa 16620
ctccttgtct tcggaaaggt cgccgaggcg gccattgaag atattgcaga tagcatacag 16680
ggactcgtgg gtgtatgcgt ttcgagaagg atcgagatcc aacgatacat attccttccc 16740
gttattttcg ttgcggatgg tacgcagcag accaatatgt agagctttcc atggatcctc 16800
ggagctcatg gctgctcctc tagacaccca gagaagtgcg ttgcagttat tcagcatcgc 16860
ggtgatggat ttgaaggtct cgcttcccac ctctccaagg agcgaggact ccatttcccc 16920
aagaaaaatg catgtccttc cagtggtatc tacctcgccc agagcgttga tcgatgggct 16980
• · ··· ·· ··
agaactggtc ttttcacaaa ttgctgcctg gagactttcc agccaagatg aaggaggtcg 17040
gagcgctccg tgcagcaaaa gcacctccga ttctgccact gtatccgggg ttgtattctc 17100
ttttctagcc gtcgatagca ttgtgctgat catgtaaaac tcatcgtctt cacaatcacg 17160
aacctccaat tccacaccgt tgaaaccgct cgtgtccaac atggtgttcc aaagatcggt 17220
agtgagcgat ggcgtcgact tccgctcagg ctcctcactg agccaccaac ctggcaacag 17280
tccgaaggta aagaacaaat cgagctgatc cctggtagtc tcaaccaaaa tcaagttgcc 17340
cccaggcttg agcaattttc gaacgttact cagtgttcgt ttcatgcatc gagttgcatg 17400
caggacctgg caagccacga ccacatcgta ggtggcacat tcaaaccctt gttgctcggg 17460
atcgctttca atatccaatt ttttgaaagt catcacgtct tgccaatccg caaattgctc 17520
acgcgccgac tcgaaaaacc cggcagacac atcggtgaag tcataacgat cgatcggctt 17580
ggtgtttccc aatgcattga caataagctt tgtgcagccg cccgtgcctc cgccaatctc 17640
caaaatgcga gaacgcgggt tcttgtgggc gcaaagtcgg atcagctcgc tggcttgtgc 17700
gtttgatcgg ctccatttga ttgcgttgac gtagtatctg cttagcagct gatcttgcat 17760
catcaactca agtggctctg tttcgcggcg tagcattgct attaactgag gtcctagacg 17820
agaaatcatc tcgccattga cgctttctcc agcgactctg gcctgtaggc atttcttctg 17880
ctcagcatcg tcacttagcc agtcgcaact ggctgggctg agcttgtttt gtctcgcaag 17940
gtccaattgg acattcatcc aatcgaaata cttctgaagg tggccatcca gatgttggat 18000
atcagaattt gtcaaatcag tgacagcctc ctgtataaag ttgatcgtgc atcttcggag 18060
gtccatcatg agttccgttt ctttcgtctc agcctcagtg ctcaactttt ctttgagcca 18120
agtggagtca cccaagctga tgtcaggggc ccaaacccag gagctgcagg cattttctgt 18180
gtcgttggag tctgactttt ggtcagagaa gctgcttcca accgactgga aaacaaggcc 18240
ttcaatctct atgactggga ttccgtccga gggagaagaa ccgctatcat agtcatcaaa 18300
cactgccaag tcggtagaga aggattgaga gttgcgatcc ttgatgctgg cctgtgcgtc 18360
cagagcatca ccagcctcca agtcagccag gctagaggat attttgacat ttcttagcct 18420
ccttggtacc atggccgttt tcatacgtgt tcccgcgtag ggtaacaccg tgtatgccgc 18480
ctggatcacc gagtccagag tagtaggatg gacgatgtgt cgattctcgt acgagtgagg 18540
catagccgag gcagtgtcag caatggaaaa tctgcaaaac gagccctgtc cattgttttg 18600
aattcgctga atgttctgaa aaatgggtcc gtggcatatc ccattcgcgt gtaaggactc 18660
ccagagatcg ttgggatcaa tgctccggtt atctgagcct agattcaacc tgcgtgaggc 18720
ttccacagtt gaacagtcaa ggtggcttct ttcgctctcc gaacgtatta atccggtgca 18780
• · ·· · ···· ·· · ·· ··· ·· · · · · ···
gtgttctgtc caggtattat tttcgcccga aattgagtgc acagaaaatt gatgccagtt 18840
ctttgtgccg agggaccttt cctcacatga acggatcgtt aggcgcaggt caacctctgc 18900
ttctgcatca gcgggtatta tgagagcctg cgcgagttca acgtcacgca agttgtagtt 18960
gatgctagcc cccgcaactg gtgggcagac ttgtgaaaac ccctcgatgg ccatgctgat 19020
gaagccagct cccggaaaga tgatgctcga accaacgacg tgatctcgta tccatggaat 19080
atctgacaga cggagaacat gtttccattt aggcgcgaaa tgaggagaga gagattcccg 19140
tgagcctatc aaagtgtgag gcggatgggt tctctgtttg gactcacgac tgccgcgagg 19200
ctctctccaa taacgggttt ggtgattcca cgggtacgcc ggcaaatcgc tcagtacctt 19260
cactctgggc tcttttcttc catgaggaaa gtttatagcg tccattttga gcccataacc 19320
cttgcttatc aactccgtag cagcacgata cattgtctcc aacgagcttc tgccgcgaga 19380
aaggcaactg agatagttta tatctgttcc tttcagaccc agatcctgca tgacttggtt 19440
gattggacca ccaagcgctc cgtgaggccc tatttcaata atcacatcga cggctttctc 19500
tttggtgttg ggatcaaagc acatctcgcg gagtgaggac tcgaactcta ccggctgtag 19560
catactatcc atccagtgtg tgggatccaa tagcaattta agatcggtca tgcgactacc 19620
agtcttaggt gatgaatata atacaccctt tgaggtgtca gcattgggat tgtcgttgtt 19680
gttatccgag ttgaacagat ctctcagtga cgccccaaag gcatctgcca ttggtcgcat 19740
gtggcttgaa tggaaggctt cagtgacttt cagtttcctg gtaaagatgc catcggcgtg 19800
taacaacttt tcaagtttct cgattgcacc caaatctccc gacaccgtca cactacattg 19860
actgttgata catccaacca ccacacagcc gtcctcctgg ttgagacgcg aaatgtaaac 19920
attggtctca ctgcgaccaa gacccaccgc catcattcct cctttggctg ccaatgcggg 19980
cttgggctta gtggtcaata caccgcgtat ataagtgatc ccaatggccg accgcgcgga 20040
taaagcccca gctgcgtagg cagcagcagc ctctccactt gagtgactgg ttatccccgt 20100
tggccgaatt ccccatgacc aaaggagacg cacaagtgca atttggatag cggttgacag 20160
tggtagactg tattcggcat catttacccg agtcgtcagc tcatcacggt ggagctcctc 20220
tgtgcaattg aatgttagta cctcaagctt gatacagtat tacttttccc gggctcgcaa 20280
cttacccata aaattccaac tcgcgcccag ttgcttgatg tagccatcac attcaagaat 20340
cgcctgtttg aatactggga atgtattgac cagctctctg cccattgcat gccactgcgc 20400
cccctgaccg gtgaatacaa atccgagccg tactttctca ttcgctcgtt ttggttgatt 20460
ggactcatcg ctgagggcag aaacaaggcc gccaaggctg tctgctacat acactgacgt 20520
ccatggcaga atggaacggc gagagcctag tgtataggcg aggctggcga ggaagggttc 20580
cccgtcaatg tcagcgacgg atttaatgta gtctcgcagg cttgctatcg ttcgccgaca 20640
• ·
agcttgctcg tccttggcac gcacaacgta tatgcggctc tgtttggaac catcctcaac 20700
cctaccatgc tcagagttac cattgacatg cacttgatcc tctggcaggg ccaatgatgc 20760
gcgatcatat gattccaaaa tgacgtgagc attcgaacca ccaaagccga agttattgac 20820
agatgcgcga cgagtcccat ctttcacagg ccagtcttga gcagacatgg ggatctttga 20880
aacattaacc tttgaaacat ataactgaat ctgcgaatgc gcaaagcctt accttgatgt 20940
tcttttggtc aagcatcagc ttgctgttct tttgcaggaa ccgcgcatta gggggaatca 21000
agcccttctc caaggccaag gccaccttga ttatactggc caggccactg gcggcttctg 21060
tatggccaat atttgctttc acagagccaa ggtgcagagg atgtccttta aaagctgctg 21120
aaattgctga gatttcaagg gggtcaccag ttggtgttcc agttccgtgg gcctccacgt 21180
acgaggtcaa cgacatatct agcccagcct tatcgtaaca ctcctggatc agacttttct 21240
gcgccacatc actcggcgca gtaattgcgg gtgttttgcc atcctggttc agcgctgtct 21300
ctcgaatgac ggctcggata gggtcttggt ctcgcaacgc gttagggagg gcctttatta 21360
ccagagcggc aattccttcc ccgcgaccat atccattcgc tcgaggatca aaagagtacg 21420
agataccatc cggggacaaa aatctgtcat tgagcaacaa ggattgctta gttcaagact 21480
ctcgatctgg aatcttcttc ggaaaactca ccccaggttt gacatcgtaa caaaaacatc 21540
gggattgagc agaagatttg caccgataac gatggctgta tctgactccc cagtacgtaa 21600
gctctggcac gccaagtgca gtgcggtcaa tgtcgtcgaa caggccgtgt caaccgtcac 21660
gctgggacca cgtaagtcgt agaagtgtga tatccggttc gaaagcattg ttcctgagtt 21720
gccagttatg aaataacgcg gaactgtctc ggggtcacga ttgagcgaat cctgatagtc 21780
gtggtacatg acacccccaa acaccgacgt attagagcct gccataccat cgatggtgat 21840
accggctgga tgatggtcag tgacgtttgc ttacagtgag gatgacccac actacatacc 21900
actctccagc gattcgtaga ccacctcaag cataagccga tactgcggat ccatgcactg 21960
tccaatatta gatctctgcg tcccgggtta gatcaattga aataatcata cgctggcgac 22020
ctctgtggtc atgttgaaga acgcggcgtc aaataaagca ggatcctcgt cgatgaagtg 22080
tccacccttt acgtgggtct atccagtcat ccttggagtc agtaaccaag cttcagtgat 22140
gctcaaatct tgtgtcaaat attcaaaaca agatataaat gcatgcatgt tagatactca 22200
cggacccgac cctttcgcca ttcgggtggt atactcctct cacattgaat cgcgaggagg 22260
ggaccttaga ccaggcactg cctcctcttt caaccatttc ccaaagcttc tgtggactcg 22320
ttgcatctcc agcaaatcga catcccattc caactatggc aatgggcgtg gatgtgttag 22380
agcaagccga gcctgccatt gcggttgcgg ttgcggttgc ggttgcggtt gcggttacgg 22440
• · · ·· · · ·· ···· ··· ·· ·· · ····· ··
cgcjgggtatt gttcattcca acgttgtttc attgactgat atatcagtcg ccctggtgat 22500
aaaaccgttg atagtcttcc aacagtctac aggtccctgg catagctata gatgcataag 22560
ctgcccccga cacgtgattc atagttcggg gtttgttttc atcttggacg tgacacgata 22620
ttcgctctgt gcccatggga aaccccggac caccatgcta tgctcggggc aataccttag 22680
aggtaccggt tcgggaggca ttgtctgtcg tcacgataat cccgagtcaa aacgccgatg 22740
ggaaaccgtc gaacaagacg aaacaggtca ggccggccag gtagttttcg ggtataatgg 22800
aggctgtcag aatccgatac tccgtacaca gatgcgaaat acgcatacga gctatcaaac 22860
caaacgaatc caaaagcctt ggaaaagctt ggaaaggctt agtgggtaat cctgtcccaa 22920
ggtttgttga gggcctgagc gcagggtggg tcctgtaagc agttggtaat tcaatttcca 22980
acaatacaca atccccaaaa tttgcattat cggttgacta agacaagcaa acaaaatata 23040
tgcaggaagc gcaattcatc gcgagcaaac gatcatcatg agcatgtgac cctttcctct 23100
tttttctact tcggaaggcg gcatgatcat ctgtcagaac tcccaatcgg gagcaatacc 23160
ataccttacg gcaccccact cagacccatg cacaaagaaa atccatgcgc cgaatattga 23220
agccttggca acaaagcccc gtgtaactcc gaaggtatcc aaagaccgag agacgccgat 23280
ttgagagaca cgtacggagg tccacacaaa atgttcccga gtctatacac tatactccaa 23340
actgacttct tgtctacctg ggtatcttgt tcaggttgct gtttactgag ataaatgata 23400
ccgggggggg gggggggggg gggggttgac actggctttt cgtggacaga ataataccca 23460
tacatccctg cgtaagtagt cgtttcgaga agaatgtgtt tcgtggtgca ttactccgta 23520
ggcacaatat atttccattc ctcacgaagt ggcctcgtcc gggcgtgatc gatgcagctt 23580
gccgccccac caaaaaagga ccacaatacg agtcagatta gaaacgtcta acaggacgtc 23640
tatgtaagag gacgctcctt tgtatgtcgg atctaggcat gacaaaataa ctatacctag 23700
gtagtgttct gtcttattgg tcatttggcc tactttcgga acaatcttgg aagttcacat 23760
tcctaggtat cagggcaatt gattggtgtc cccagaattc ttttttctcg aataaaggat 23820
aaatttatgc ataaaaacct tggaaactga gcatagttat gagcacaaat actagttttc 23880
agtgcaattg gtcctactat cctttgcttg gtacccctta ccaattatac cctaggcagc 23940
agttgacacc ggtcatgaat ccattcataa aggtggacca gatgcaggga taaggaagcg 24000
aatctttccg ctgcctcagc ctcaggggcg cgcgccattt gttattttct tctactcatt 24060
tcccgtacct aggaactgtt cagttgtccc tcccaacccc ttgggccgaa caaccttcct 24120
ccaatctacg acggcagatt atacctaggc gcctaaccga ttaggttgct cattcgattt 24180
tggaggtatg cactttatct caagccctaa ttcccaattg aagtgctttt ccgtccccat 24240
ttgcagagct gactagattc ttttctcaga gactacctag ctataggtac cactccaagc 24300
tgtagcacag acctttcagc atggtcgctt cgttgctacc ctctcgcttt cgcggtaggg 24360
aatcaatgaa tcagcagcac cctctacgct cgggaaatcg ggcattgacc tccacactcc 24420
aatttctatc caaaacggcg tgtctacacc cgatccatac cgtttgcacc atagctattc 24480
tagctagtac cacatacgtt ggactactca aagacagctt cttccatggc cccgcaaacg 24540
ttgataaagc agaatggggc tctttggtcg aaggaagtcg aagcttgatc accggcccac 24600
agaatggctg gaagtggcag agcttcgacg gggatgcaga tgttctcgga gatttcaacc 24660
atcaagcact aatgaccttg gtattcccgg ggtcatatgg ggttgcatct caagcagcct 24720
caccattcct tgctcccctc cctgtgaacc tatctgtgat tgaccttccc tcaacgtcga 24780
gccctttaac cgcctattcg aaagataaag ttttcgcctt ctctgtggaa tacagcagcg 24840
cgccggaact cgtggctgct gttcaagaaa tccccaacaa cagtgccgac ctgaaattgc 24900
aggagacgca attgatcgag atggaacgcc agatgtggat catgaaggct gccagggctc 24960
acacaaaacg cagccttgct caatgggtgc acgatacctg gacagagtct cttgatctta 25020
tcaagagcgc tcaaacgctc gacgtggttg tcatggtgct aggttatata tcaatgcact 25080
tgactttcgt ctcactcttc ctcagcatga aaaaattggg atcgaaggtt tggctggcta 25140
caagcgtcct tttgtcgtca acatttgcct ttctcctcgg tctcgacgtg gccataagac 25200
taggggttcc gatgagcatg aggttgctat ccgaaggcct ccccttcttg gtggtgatcg 25260
ttggctttga gaagagcatc actctgacca gggctgtttt gtcctatgct gtgcagcacc 25320
gaaagcccca gaagatacag tctgaccagg gtagcgtgac agccattgct gaaagtacca 25380
tcaattacgc cgtacgaagc gccattcggg agaagggtta caatatcgtg tgccactacg 25440
tggtcgagat cctgctccta gttatcggtg ctgtcttagg catccaaggt gggctacagc 25500
acttctgtgt tctagctgca ttgatcctgt tctttgactg tctgctgctg tttacattct 25560
acactgcgat tctgtctatc aagctcgagg taaaccgcct caaacgtcat atcaacatgc 25620
ggtacgcgtt ggaagatgag ggtctcagtc agcggacggc ggagagtgtc gcgaccagca 25680
atgatgccca agacagtgca cgtacatatc tgtttggcaa tgatatgaaa ggcagcagtg 25740
ttccgaagtt caaattctgg atggtcgttg gtttccttat cgtcaacctc gtcaacatcg 25800
gctccaccct tttccaagcc tcttctagtg gatcgttgtc cagtatatca tcttggaccg 25860
aaagtctgag cggatcggcc attaaacccc cgcttgagcc cttcaaggta gctggaagtg 25920
gactagatga actacttttc caggcaagag ggcgcggtca atcgactatg gtcactgtcc 25980
tcgcccccat caagtacgaa ctagagtatc cttccattca ccgtggtacc tcgcagctac 26040
acgagtatgg agttggtgga aaaatggtcg gtagcctgct caccagcctg gaagatcccg 26100
• ·
tcctctccaa atgggtgttt gtggcacttg ccctaagtgt cgctctgaac agctatctgt 26160
tcaaggccgc cagactggga atcaaagatc ctaatctccc gagtcaccca gttgatccag 26220
ttgagcttga ccaggccgaa agcttcaacg ctgcccagaa ccagacccct cagattcaat 26280
caagtctcca agctcctcag accagagtgt tcactcctac caccaccgac agtgacagtg 26340
atgcctcatt agtcttaatt aaagcatctc taaaggtcac taagcgagca gaaggaaaga 26400
cagccactag tgaacttccc gtgtctcgca cacaaatcga actggacaat ttgctgaagc 26460
agaacacaat cagcgagttg aacgatgagg atgtcgttgc cttgtctttg cggggaaagg 26520
ttcccgggta tgccctagag aagagtctca aagactgcac tcgtgccgtc aaggttcgcc 26580
gctctatcat ttcgaggaca ccggctaccg cagagcttac aagtatgctg gagcactcga 26640
agctgccgta cgaaaactac gcctgggaac gcgtgctcgg tgcatgttgc gagaacgtta 26700
ttggctatat gccagtccct gttggcgtcg ccggtcctat tgttatcgac ggcaagagtt 26760
atttcattcc tatggcaacc accgagggcg tcctcgtcgc tagtgctagc cgtggcagta 26820
aggcaatcaa cctcggtggc ggtgccgtga cagtcctgac tggcgacggt atgacacgag 26880
gcccgtgtgt gaagtttgat gtccttgaac gagctggtgc tgctaagatc tggctcgatt 26940
cggacgtcgg ccagaccgta atgaaagaag ccttcaattc aaccagcaga tttgcgcgct 27000
tacaaagtat gcggacaact atcgccggta ctcacttata tattcgattt aagactacta 27060
ctggcgacgc tatgggaatg aatatgattt ctaagggcgt ggagcatgca ctgaatgtta 27120
tggcgacaga ggcaggtttc agcgatatga atattattac cctatcagga aattactgta 27180
cggataagaa accttcagct ttgaattgga tcgatggacg gggcaagggc attgtggccg 27240
aagccatcat accggcgaac gttgtcaggg atgtcttaaa gagcgatgtg gatagcatgg 27300
ttcagctcaa catatcgaaa aatctgattg ggtccgctat ggctggctca gttggcggct 27360
tcaacgccca agctgccaat cttgcggcag ccattttcat tgccacaggt caggatccgg 27420
cgcaagttgt ggagagcgct aactgcatca ctctcatgaa caagtaagtt gaaagcggcc 27480
gcttacttgg aaacattcac taatcctgtt tagtcttcgc ggatcgcttc aaatctctgt 27540
ctccatgccg tctattgagg ttggaacgtt gggcggtggt acgattctgg agccccaggg 27600
cgcaatgctt gacatgcttg gtgtccgcgg atcacacccg accactcccg gtgagaatgc 27660
acgtcaactt gcgcgcatca tcggaagcgc tgttttggct ggggagctct cgctatgtgc 27720
tgccctagcc gccggtcacc tggtcaaggc gcacatggcg cacaaccgtt ctgccccggc 27780
atcttcagcc ccttctcgaa gtgtctcccc gtcaggcgga accaggacag tccctgttcc 27840
taacaatgca ctgaggccga gtgctgcagc tactgatcgg gctcgacgct gattaggtcg 27900
gaatcttagg agcattccaa gctccgtacc ccctccagtg gattcattgc aggaggatca 27960
tattttttct cattggttgt tattgtcata attttcaaaa gcacaatgca atgagacagg 28020
caggtggtag agtgaacggc cagaaagggt atctcatgtt tatatgttgt tgaaatttac 28080
gatgcaagta gtagggaaga agaatatata aagagatggt ccttttccag agagtgttta 28140
ggtctgatcc ctcataatta tttaatgagt gaaagctttg ttcaagctat aacttactga 28200
gtaggttgaa tgttgatctg attcattcct gaggtatcag gattgatgcc tgaaacatca 28260
atcatccatt gtcagatgcc gtaactaact aactatgaat ctcaacatag ttatatgttg 28320
ccaatctagc cacggtgact agaaccttga gatggactta gactagacat gggtcgcggg 28380
caatgacata tagaatcttt gaaatcgaca ttaattaagt atgtggagat tctttgtgga 28440
ggcacggtaa tgtgtctatc tagcaacgcg gtcaagcatc agtctcaggc acagcccggg 28500
tgtcgttttt ggttgcaatc ttccgccatc ccattccaaa ggcaaacaca aacgtgcacg 28560
ccgtagctcc cactgctaag taaaaagtat gatcaacggc gagactgtaa gcttttacaa 28620
cccctggaag gttattcttg ctgaccacat ctctgaagcc agtcgcccct gctgccgtca 28680
cggcctgcgt gtcgacagtg ggcgcatact tgctcaggcc agttctcaaa ccggacccaa 28740
agacaaggtt agcaaagtcc aggaagagcg atcctccaaa cgtctgtcca aacacggcga 28800
gagaaattcc gagggcacct tgttcgggcg aaagcgtgct ttggatggcg atgataggct 28860
ggccattgag tattgatgtc agcgtctagc ggttgcatgc tcttcttgct ttgatacaaa 28920
gccgaaagcg tgagagatga tcaaaggttt catagcttac cgtttgcatg ccacaaccac 28980
gaccgaagcc cgcgataaat tggtacatga cccatttcac agttgatgta tggggctgga 29040
aggtggatac cagacctgcg cctatggcga cgagaacagc gctgcctagg gcccaaggca 29100
aatagtatcc tgtctttcca actggtgcgt catatgtcag tatacacgat atccaagccc 29160
gatgtcagac ggttgtggca agaaaggagc catagaaatg gacggggtgg agaaaaatgt 29220
gtacgcgagt ttcacttact tgcgaagcca gaaaccatag ccataatgac ttgtccaaga 29280
attccaggca acatgtacac accactcagt gtgggagaaa catccttcac agcctggaag 29340
tagatcggta gatagtagga aaagacaagc aaggagccag agaaaaagcc cataaataaa 29400
caagagcacc acacttgtcg tttaccagcc actgagccag gaatcatggc aacagcatcg 29460
ccaacatgac gctcccatag cacgaacgca atcagagcaa accctccgcc acagaacagg 29520
ccgatgatga cggaacttcg ccaggtgtag gtcgaccctc cccattctag tgcgagggaa 29580
atcatggttg cgaaggctgc aaagaccaca aagcctacaa ggtccagttt gcgaagtgtg 29640
gattttatgt tggccattgg tttgtcggtc gagagttcgc tgtccgtgga tgaaattcgg 29700
tcgggtatgg tgatgacgag aaggaggaat gcagcgacag cgccgatggg gagattgata 29760
• · • ·
taaaagcctg aattccaagt gagaacatgg acaacaatca taaaaaggcc aaaggtcaac 29820
atacaccatc gccaagtggc gtgttgagtg aaagcacctc cgagcagtgg tccacagaca 29880
atggcaatct gactaactga aaacatattg tcagacgacg aaccgttcgt ttggggtaca 29940
tcagatcttg agatgacata cgacccatca tcactccaat caaaacttca tatgcgaggt 30000
cagcgtgtac acggcaccca gcagacttcc aaaaatcggt tcccttacct ggttgcttgt 30060
gcttaggagc agctgttgag aggattgtga gggctccgtt gacaagacct gagcctccca 30120
ttccagcaac ggcccgccca acaatcaaca tggtggaaga tcttgcggca ccgcatagca 30180
ccgagcctag ttcaaaaata cagaggaagg caaagaaagt gtacttcaag cccaagagtg 30240
tatacaattt accggccagg ggctggagag cacagctaaa tatgatgtta gctaatctgt 30300
tcgtacaatg aacaaggtca aggagaacag agccatactt agccagaaga taagcactgc 30360
cgtaccaccc tacatcgttc agagagtgga actcgcttgt gatatgtggg attgcctgtg 30420
gctggagtca attgactgtg ctgcgctctg ttctgaggta gccaccatct taccgtgacg 30480
ataatggaca tatcaaggag catcaaaaat gctacgaaag taactgaagc aaccaccagc 30540
ccgagcttga ggcctgtgat gtgctgggac ttggactcag tcgcttcgag cgtgtcattt 30600
tgactttctt ccttctgtgg ccttggttcc ccttctttag ggggtagagg ttctgacatc 30660
gcgcaattcc ttccgacttt tgcttcaagg ggcggtgtga atctctactg cgcggcgctt 30720
ctatagtacc tgtgttttgg tgtatgaatg atctcgctct cgttgtttcg ttaaggtccg 30780
ctagcctgaa gtcagattga tggatgggga tcaggggaaa ttggcgacgt ctttaatttt 30840
gcttttcttt gttaccggaa gtgttgcggt attagcgtgt ctgggcttat ttacgacgca 30900
caagatgcat tgaactggcc ccactgctag atctcactag tattgtggtt gtaatttacc 30960
tatactccat attgactggg caggttttga acacaaccca caccccccca tactacacat 31020
tagttttgca tattttcctg ggggccaaaa aaaccccaaa aggcttcaat attttgcggc 31080
caatggagag tgtaactaat ttggcccaca ctccggtggt atcaatcgga tctcactgca 31140
tatatgatga aagcaagagg gggcaggaga tacgctcttt attggctgtc tgcgcgaagc 31200
tgggcaaatg caaataaaaa gacaaacaac cagctggaag accgggcgac aaacatggtt 31260
tacctaacac cctcgatccc aacaatgtgc atgttaatca atgtgctccg tggggagtat 31320
gaactataac atacgaagca gccattcatg tcaaaaaaaa aaccaggcga atgggcgtcg 31380
tcaacggttt cacataagta ctatattgta ctaactaccc gtgagactgg agagaacagt 31440
ctcgcgcgaa gaaacgataa gagcatcggt catatcggtc catctcggtc taagtgtatg 31500
agaatattcc gacgtgaatc catccgtcag tgatcaatgt ctccaagtaa ttcatcattt 31560
caattaccct cgctttactc cgtagaatac aagaccttac tagcgcaaac aagtgggggc 31620
• « ♦
• « • · • · «
♦ · ·
taacggtgtg atctccttcc gttgcggccg ccacctcggt tccagccgta atacgacgac 31680
ccgtctatcg cgacccccta gccttggcca tttttggcgt tacagtaaag ctttggagag 31740
aaacgccaag ggaaaatgct agccaccaat tctataaatt actcttcaca tgcagctagt 31800
atcactggta agtctacggg gcacatgtaa aatttttatt actttctaat aatctttcca 31860
agttcttttc cacggggccc caatgcttaa aatactcaaa agacgtgaaa aacctgcaag 31920
ccgccagtga tatcacacgt aatgcctcaa cagcctgatt ccgagccatt atatgctgtt 31980
tgatgatctc aaattgagat ggcgagcgct ggatctggga aattggtagt gggattggta 32040
tagaaacgta agtgcagaag accatgtaat aagtacatat ggaggctatg tgatggcccg 32100
atctagtttc ttcaatatag cgctgggtat aaaaaaaagc aggggctttc tcagggtaat 32160
gtcgcagtct acaacgagtg gcgtccactg acagggaaag gcgagcgggg ctatgctacc 32220
ttcaatttcc atagaggggg gatgcaccat ctccgacaat ctatagttac tcaaacaggt 32280
acggtactaa gcaatattgt gtttcttcgc taatgcgaat atttccttat agcaacgtcg 32340
caacacattt atcgtcttcc ctgaggcctt tgttgacttg ggctcttcgt ctccggcttc 32400
gtcactccaa agcacagata ggagacgaga ggccggcgtt atggttttat tttcagcgcc 32460
aaggatttgc cacgatgtgc ttggcatatc tgataggacc tattccccct ctcccggtca 32520
gcgcattgct gatgtatgca agggaagaaa agactggtgg ttatcggtcc cacttactag 32580
acgaatagat gccgcagccc cgtgctcctg tgctatcccc aaagcagtct caatctcact 32640
caatagtcga aggcttacac gcaatgtcgt gcatgcagaa gataaggcgt gcatgaatgg 32700
gtcgagatgt gaaatgagct cgccgatatg aagattagag tgaaacgagg gaagtgcttc 32760
ggctcttcca ttgtcatttc tagtggttga gccagaccag taccaatcca ttcgtgtgct 32820
ttgcttttgt ccacaaggtt gggctttcat cacctcggat agtagcagct gggaaagtga 32880
tgtcatgatt ttgacagaca acatgtagca atgcaccgcc atgaacaagt tcttggtttg 32940
cagacaccca tctaacatgc tgctattgct gctcgtgatc acacgttctt gaagatgtag 33000
tagcaatcta ccaaaggcat tcaaaaagtc ccctatcggg tctaggaaga agctttagcg 33060
acaatcaaga ggcagtaaac aggcagaatt gaaaatctca cagcttaaaa ttttttgctt 33120
gggccattcc acagtcaccc cgtggagtat tacctctagg tcctgtgaca catccgacag 33180
actttcgaaa aggtctcgtt gcgtgttgct tgtgttggat tgtccggatg acgagttccc 33240
ctctacttcg aggtcaaaca gcgatggcga gacaggcgcc gttgcatcca aagggccttc 33300
aaagtcgtag cctagatctg gtatccccga agattcattg ctgttggcat cgtcgcgaaa 33360
tgtatttggc tgaggccagc cgccgggaaa cgactcggga tcatcaaagt tgattgatgt 33420
atcatagaat tgcagggttg ccgctgatgg ttctgataat gtttccttga gtgccgaggt 33480
gccaatatgc gtaggtggtg agcagtaagg tggaggagtc tctgccaatg atgagaagac 33540
cgtagaagat gtcgcggtca tcggttgtga ggtttctgtg gctcttgtag ttccagctgc 33600
ggcttcttta tgtaaattgc gcttgggtag cctttcgctg tacacacacc ttaatccggc 33660
ttgttgacaa cgttgacact gagcacggac taaattggca ttgctaccgg tacatttgag 33720
cttttgtgca tgacaccggt cacatgagcg tcgaaacgcg cgacggcgta ggttcgtcgg 33780
aatcgttgca tgcggcaggg acataattat tggattaaga tcaaataatg tgaggtgaga 33840
ctttgcatgt tcctggatct ttatgtattg gaattggaga gtaagctcgt gcaggagata 33900
agttcaggtc gtcttgctgg aagacttact aagttatatg caaacaagtg ttttcgagcg 33960
gacaccaaaa gccaatagtc ttactatgaa tgtcttttca gtcacccgga gaaatactct 34020
tagcctctgc tcttatgcga gctcatcaaa gctgggcata cataccccat ccagcgccac 34080
gtattacact agaaagagtt ctaaaagaaa tagattcggc cccccatctg gctatcatat 34140
atgccagatg aaatacctgt aacgtggggc ataaaaaggc aggctctagt ctaccagcag 34200
atc 34203
<210> 2
<211> 34203
<212> DNA
<213> Penicillium citrinum
<400> 2
gatctgctgg tagactagag cctgcctttt tatgccccac gttacaggta tttcatctgg 60
catatatgat agccagatgg ggggccgaat ctatttcttt tagaactctt tctagtgtaa 120
tacgtggcgc tggatggggt atgtatgccc agctttgatg agctcgcata agagcagagg 180
ctaagagtat ttctccgggt gactgaaaag acattcatag taagactatt ggcttttggt 240
gtccgctcga aaacacttgt ttgcatataa cttagtaagt cttccagcaa gacgacctga 300
acttatctcc tgcacgagct tactctccaa ttccaataca taaagatcca ggaacatgca 360
aagtctcacc tcacattatt tgatcttaat ccaataatta tgtccctgcc gcatgcaacg 420
attccgacga acctacgccg tcgcgcgttt cgacgctcat gtgaccggtg tcatgcacaa 480
aagctcaaat gtaccggtag caatgccaat ttagtccgtg ctcagtgtca acgttgtcaa 540
caagccggat taaggtgtgt gtacagcgaa aggctaccca agcgcaattt acataaagaa 600
gccgcagctg gaactacaag agccacagaa acctcacaac cgatgaccgc gacatcttct 660
acggtcttct catcattggc agagactcct ccaccttact gctcaccacc tacgcatatt 720
ggcacctcgg cactcaagga aacattatca gaaccatcag cggcaaccct gcaattctat 780
gatacatcaa tcaactttga tgatcccgag tcgtttcccg gcggctggcc tcagccaaat 840
acatttcgcg acgatgccaa cagcaatgaa tcttcgggga taccagatct aggctacgac 900
tttgaaggcc ctttggatgc aacggcgcct gtctcgccat cgctgtttga cctcgaagta 960
gaggggaact cgtcatccgg acaatccaac acaagcaaca cgcaacgaga ccttttcgaa 1020
agtctgtcgg atgtgtcaca ggacctagag gtaatactcc acggggtgac tgtggaatgg 1080
cccaagcaaa aaattttaag ctgtgagatt ttcaattctg cctgtttact gcctcttgat 1140
tgtcgctaaa gcttcttcct agacccgata ggggactttt tgaatgcctt tggtagattg 1200
ctactacatc ttcaagaacg tgtgatcacg agcagcaata gcagcatgtt agatgggtgt 1260
ctgcaaacca agaacttgtt catggcggtg cattgctaca tgttgtctgt caaaatcatg 1320
acatcacttt cccagctgct actatccgag gtgatgaaag cccaaccttg tggacaaaag 1380
caaagcacac gaatggattg gtactggtct ggctcaacca ctagaaatga caatggaaga 1440
gccgaagcac ttccctcgtt tcactctaat cttcatatcg gcgagctcat ttcacatctc 1500
gacccattca tgcacgcctt atcttctgca tgcacgacat tgcgtgtaag ccttcgacta 1560
ttgagtgaga ttgagactgc tttggggata gcacaggagc acggggctgc ggcatctatt 1620
cgtctagtaa gtgggaccga taaccaccag tcttttcttc ccttgcatac atcagcaatg 1680
cgctgaccgg gagaggggga ataggtccta tcagatatgc caagcacatc gtggcaaatc 1740
cttggcgctg aaaataaaac cataacgccg gcctctcgtc tcctatctgt gctttggagt 1800
gacgaagccg gagacgaaga gcccaagtca acaaaggcct cagggaagac gataaatgtg 1860
ttgcgacgtt gctataagga aatattcgca ttagcgaaga aacacaatat tgcttagtac 1920
cgtacctgtt tgagtaacta tagattgtcg gagatggtgc atcccccctc tatggaaatt 1980
gaaggtagca tagccccgct cgcctttccc tgtcagtgga cgccactcgt tgtagactgc 2040
gacattaccc tgagaaagcc cctgcttttt tttataccca gcgctatatt gaagaaacta 2100
gatcgggcca tcacatagcc tccatatgta cttattaóat ggtcttctgc acttacgttt 2160
ctataccaat cccactacca atttcccaga tccagcgctc gccatctcaa tttgagatca 2220
tcaaacagca tataatggct cggaatcagg ctgttgaggc attacgtgtg atatcactgg 2280
cggcttgcag gtttttcacg tcttttgagt attttaagca ttggggcccc gtggaaaaga 2340
acttggaaag attattagaa agtaataaaa attttacatg tgccccgtag acttaccagt 2400
gatactagct gcatgtgaag agtaatttat agaattggtg gctagcattt tcccttggcg 2460
tttctctcca aagctttact gtaacgccaa aaatggccaa ggctaggggg tcgcgataga 2520
cgggtcgtcg tattacggct ggaaccgagg tggcggccgc aacggaagga gatcacaccg 2580
ttagccccca cttgtttgcg ctagtaaggt cttgtattct acggagtaaa gcgagggtaa 2640
ttgaaatgat gaattacttg gagacattga tcactgacgg atggattcac gtcggaatat 2700
tctcatacac ttagaccgag atggaccgat atgaccgatg ctcttatcgt ttcttcgcgc 2760
gagactgttc tctccagtct cacgggtagt tagtacaata tagtacttat gtgaaaccgt 2820
tgacgacgcc cattcgcctg gttttttttt tgacatgaat ggctgcttcg tatgttatag 2880
ttcatactcc ccacggagca cattgattaa catgcacatt gttgggatcg agggtgttag 2940
gtaaaccatg tttgtcgccc ggtcttccag ctggttgttt gtctttttat ttgcatttgc 3000
ccagcttcgc gcagacagcc aataaagagc gtatctcctg ccccctcttg ctttcatcat 3060
atatgcagtg agatccgatt gataccaccg gagtgtgggc caaattagtt acactctcca 3120
ttggccgcaa aatattgaag ccttttgggg tttttttggc ccccaggaaa atatgcaaaa 3180
ctaatgtgta gtatgggggg gtgtgggttg tgttcaaaac ctgcccagtc aatatggagt 3240
ataggtaaat tacaaccaca atactagtga gatctagcag tggggccagt tcaatgcatc 3300
ttgtgcgtcg taaataagcc cagacacgct aataccgcaa cacttccggt aacaaagaaa 3360
agcaaaatta aagacgtcgc caatttcccc tgatccccat ccatcaatct gacttcaggc 3420
tagcggacct taacgaaaca acgagagcga gatcattcat acaccaaaac acaggtacta 3480
tagaagcgcc gcgcagtaga gattcacacc gccccttgaa gcaaaagtcg gaaggaattg 3540
cgcgatgtca gaacctctac cccctaaaga aggggaacca aggccacaga aggaagaaag 3600
tcaaaatgac acgctcgaag cgactgagtc caagtcccag cacatcacag gcctcaagct 3660
cgggctggtg gttgcttcag ttactttcgt agcatttttg atgctccttg atatgtccat 3720
tatcgtcacg gtaagatggt ggctacctca gaacagagcg cagcacagtc aattgactcc 3780
agccacaggc aatcccacat atcacaagcg agttccactc tctgaacgat gtagggtggt 3840
acggcagtgc ttatcttctg gctaagtatg gctctgttct ccttgacctt gttcattgta 3900
cgaacagatt agctaacatc atatttagct gtgctctcca gcccctggcc ggtaaattgt 3960
atacactctt gggcttgaag tacactttct ttgccttcct ctgtattttt gaactaggct 4020
cggtgctatg cggtgccgca agatcttcca ccatgttgat tgttgggcgg gccgttgctg 4080
gaatgggagg ctcaggtctt gtcaacggag ccctcacaat cctctcaaca gctgctccta 4140
agcacaagca accaggtaag ggaaccgatt tttggaagtc tgctgggtgc cgtgtacacg 4200
ctgacctcgc atatgaagtt ttgattggag tgatgatggg tcgtatgtca tctcaagatc 4260
tgatgtaccc caaacgaacg gttcgtcgtc tgacaatatg ttttcagtta gtcagattgc 4320
·· · · ·· ·· · ···· · * * * · · · • » · ·►···> « * · • » · · 9 * . · · *· e • · « «··· 9*· • 9 ··· ·9 ·· 9 *>···
cattgtctgt ggaccactgc tcggaggtgc tttcactcaa cacgccactt ggcgatggtg 4380
tatgttgacc tttggccttt ttatgattgt tgtccatgtt ctcacttgga attcaggctt 4440
ttatatcaat ctccccatcg gcgctgtcgc tgcattcctc cttctcgtca tcaccatacc 4500
cgaccgaatt tcatccacgg acagcgaact ctcgaccgac aaaccaatgg ccaacataaa 4560
atccacactt cgcaaactgg accttgtagg ctttgtggtc tttgcagcct tcgcaaccat 4620
gatttccctc gcactagaat ggggagggtc gacctacacc tggcgaagtt ccgtcatcat 4680
cggcctgttc tgtggcggag ggtttgctct gattgcgttc gtgctatggg agcgtcatgt 4740
tggcgatgct gttgccatga ttcctggctc agtggctggt aaacgacaag tgtggtgctc 4800
ttgtttattt atgggctttt tctctggctc cttgcttgtc ttttcctact atctaccgat 4860
ctacttccag gctgtgaagg atgtttctcc cacactgagt ggtgtgtaca tgttgcctgg 4920
aattcttgga caagtcatta tggctatggt ttctggcttc gcaagtaagt gaaactcgcg 4980
tacacatttt tctccacccc gtccatttct atggctcctt tcttgccaca accgtctgac 5040
atcgggcttg gatatcgtgt atactgacat atgacgcacc agttggaaag acaggatact 5100
atttgccttg ggccctaggc agcgctgttc tcgtcgccat aggcgcaggt ctggtatcca 5160
ccttccagcc ccatacatca actgtgaaat gggtcatgta ccaatttatc gcgggcttcg 5220
gtcgtggttg tggcatgcaa acggtaagct atgaaacctt tgatcatctc tcacgctttc 5280
ggctttgtat caaagcaaga agagcatgca accgctagac gctgacatca atactcaatg 5340
gccagcctat catcgccatc caaagcacgc tttcgcccga acaaggtgcc ctcggaattt 5400
ctctcgccgt gtttggacag acgtttggag gatcgctctt cctggacttt gctaaccttg 5460
tctttgggtc cggtttgaga actggcctga gcaagtatgc gcccactgtc gacacgcagg 5520
ccgtgacggc agcaggggcg actggcttca gagatgtggt cagcaagaat aaccttccag 5580
gggttgtaaa agcttacagt ctcgccgttg atcatacttt ttacttagca gtgggagcta 5640
cggcgtgcac gtttgtgttt gcctttggaa tgggatggcg gaagattgca accaaaaacg 5700
acacccgggc tgtgcctgag actgatgctt gaccgcgttg ctagatagac acattaccgt 5760
gcctccacaa agaatctcca catacttaat taatgtcgat ttcaaagatt ctatatgtca 5820
ttgcccgcga cccatgtcta gtctaagtcc atctcaaggt tctagtcacc gtggctagat 5880
tggcaacata taactatgtt gagattcata gttagttagt tacggcatct gacaatggat 5940
gattgatgtt tcaggcatca atcctgatac ctcaggaatg aatcagatca acattcaacc 6000
tactcagtaa gttatagctt gaacaaagct ttcactcatt aaataattat gagggatcag 6060
acctaaacac tctctggaaa aggaccatct ctttatatat tcttcttccc tactacttgc 6120
atcgtaaatt tcaacaacat ataaacatga gatacccttt ctggccgttc actctaccac 6180
ctgcctgtct cattgcattg tgcttttgaa aattatgaca ataacaacca atgagaaaaa 6240
atatgatcct cctgcaatga atccactgga gggggtacgg agcttggaat gctcctaaga 6300
ttccgaccta atcagcgtcg agcccgatca gtagctgcag cactcggcct cagtgcattg 6360
ttaggaacag ggactgtcct ggttccgcct gacggggaga cacttcgaga aggggctgaa 6420
gatgccgggg cagaacggtt gtgcgccatg tgcgccttga ccaggtgacc ggcggctagg 6480
gcagcacata gcgagagctc cccagccaaa acagcgcttc cgatgatgcg cgcaagttga 6540
cgtgcattct caccgggagt ggtcgggtgt gatccgcgga caccaagcat gtcaagcatt 6600
gcgccctggg gctccagaat cgtaccaccg cccaacgttc caacctcaat agacggcatg 6660
gagacagaga tttgaagcga tccgcgaaga ctaaacagga ttagtgaatg tttccaagta 6720
agcggccgct ttcaacttac ttgttcatga gagtgatgca gttagcgctc tccacaactt 6780
gcgccggatc ctgacctgtg gcaatgaaaa tggctgccgc aagattggca gcttgggcgt 6840
tgaagccgcc aactgagcca gccatagcgg acccaatcag atttttcgat atgttgagct 6900
gaaccatgct atccacatcg ctctttaaga catccctgac aacgttcgcc ggtatgatgg 6960
cttcggccac aatgcccttg ccccgtccat cgatccaatt caaagctgaa ggtttcttat 7020
ccgtacagta atttcctgat agggtaataa tattcatatc gctgaaacct gcctctgtcg 7080
ccataacatt cagtgcatgc tccacgccct tagaaatcat attcattccc atagcgtcgc 7140
cagtagtagt cttaaatcga atatataagt gagtaccggc gatagttgtc cgcatacttt 7200
gtaagcgcgc aaatctgctg gttgaattga aggcttcttt cattacggtc tggccgacgt 7260
ccgaatcgag ccagatctta gcagcaccag ctcgttcaag gacatcaaac ttcacacacg 7320
ggcctcgtgt cataccgtcg ccagtcagga ctgtcacggc accgccaccg aggttgattg 7380
ccttactgcc acggctagca ctagcgacga ggacgccctc ggtggttgcc ataggaatga 7440
aataactctt gccgtcgata acaataggac cggcgacgcc aacagggact ggcatatagc 7500
caataacgtt ctcgcaacat gcaccgagca cgcgttccca ggcgtagttt tcgtacggca 7560
gcttcgagtg ctccagcata cttgtaagct ctgcggtagc cggtgtcctc gaaatgatag 7620
agcggcgaac cttgacggca cgagtgcagt ctttgagact cttctctagg gcatacccgg 7680
gaacctttcc ccgcaaagac aaggcaacga catcctcatc gttcaactcg ctgattgtgt 7740
tctgcttcag caaattgtcc agttcgattt gtgtgcgaga cacgggaagt tcactagtgg 7800
ctgtctttcc ttctgctcgc ttagtgacct ttagagatgc tttaattaag actaatgagg 7860
catcactgtc actgtcggtg gtggtaggag tgaacactct ggtctgagga gcttggagac 7920
ttgattgaat ctgaggggtc tggttctggg cagcgttgaa gctttcggcc tggtcaagct 7980
caactggatc aactgggtga ctcgggagat taggatcttt gattcccagt ctggcggcct 8040
tgaacagata gctgttcaga gcgacactta gggcaagtgc cacaaacacc catttggaga 8100
ggacgggatc ttccaggctg gtgagcaggc taccgaccat ttttccacca actccatact 8160
cgtgtagctg cgaggtacca cggtgaatgg aaggatactc tagttcgtac ttgatggggg 8220
cgaggacagt gaccatagtc gattgaccgc gccctcttgc ctggaaaagt agttcatcta 8280
gtccacttcc agctaccttg aagggctcaa gcgggggttt aatggccgat ccgctcagac 8340
tttcggtcca agatgatata ctggacaacg atccactaga agaggcttgg aaaagggtgg 8400
agccgatgtt gacgaggttg acgataagga aaccaacgac catccagaat ttgaacttcg 8460
gaacactgct gcctttcata tcattgccaa acagatatgt acgtgcactg tcttgggcat 8520
cattgctggt cgcgacactc tccgccgtcc gctgactgag accctcatct tccaacgcgt 8580
accgcatgtt gatatgacgt ttgaggcggt ttacctcgag cttgatagac agaatcgcag 8640
tgtagaatgt aaacagcagc agacagtcaa agaacaggat caatgcagct agaacacaga 8700
agtgctgtag cccaccttgg atgcctaaga cagcaccgat aactaggagc aggatctcga 8760
ccacgtagtg gcacacgata ttgtaaccct tctcccgaat ggcgcttcgt acggcgtaat 8820
tgatggtact ttcagcaatg gctgtcacgc taccctggtc agactgtatc ttctggggct 8880
ttcggtgctg cacagcatag gacaaaacag ccctggtcag agtgatgctc ttctcaaagc 8940
caacgatcac caccaagaag gggaggcctt cggatagcaa cctcatgctc atcggaaccc 9000
ctagtcttat ggccacgtcg agaccgagga gaaaggcaaa tgttgacgac aaaaggacgc 9060
ttgtagccag ccaaaccttc gatcccaatt ttttcatgct gaggaagagt gagacgaaag 9120
tcaagtgcat tgatatataa cctagcacca tgacaaccac gtcgagcgtt tgagcgctct 9180
tgataagatc aagagactct gtccaggtat cgtgcaccca ttgagcaagg ctgcgttttg 9240
tgtgagccct ggcagccttc atgatccaca tctggcgttc catctcgatc aattgcgtct 9300
cctgcaattt caggtcggca ctgttgttgg ggatttcttg aacagcagcc acgagttccg 9360
gcgcgctgct gtattccaca gagaaggcga aaactttatc tttcgaatag gcggttaaag 9420
ggctcgacgt tgagggaagg tcaatcacag ataggttcac agggagggga gcaaggaatg 9480
gtgaggctgc ttgagatgca accccatatg accccgggaa taccaaggtc attagtgctt 9540
gatggttgaa atctccgaga acatctgcát ccccgtcgaa gctctgccac ttccagccat 9600
tctgtgggcc ggtgatcaag cttcgacttc cttcgaccaa agagccccat tctgctttat 9660
caacgtttgc ggggccatgg aagaagctgt ctttgagtag tccaacgtat gtggtactag 9720
ctagaatagc tatggtgcaa acggtatgga tcgggtgtag acacgccgtt ttggatagaa 9780
attggagtgt ggaggtcaat gcccgatttc ccgagcgtag agggtgctgc tgattcattg 9840
attccctacc gcgaaagcga gagggtagca acgaagcgac catgctgaaa ggtctgtgct 9900
acagcttgga gtggtaccta tagctaggta gtctctgaga aaagaatcta gtcagctctg 9960
caaatgggga cggaaaagca cttcaattgg gaattagggc ttgagataaa gtgcatacct 10020
ccaaaatcga atgagcaacc taatcggtta ggcgcctagg tataatctgc cgtcgtagat 10080
tggaggaagg ttgttcggcc caaggggttg ggagggacaa ctgaacagtt cctaggtacg 10140
ggaaatgagt agaagaaaat aacaaatggc gcgcgcccct gaggctgagg cagcggaaag 10200
attcgcttcc ttatccctgc atctggtcca cctttatgaa tggattcatg accggtgtca 10260
actgctgcct agggtataat tggtaagggg taccaagcaa aggatagtag gaccaattgc 10320
actgaaaact agtatttgtg ctcataacta .tgctcagttt ccaaggtttt tatgcataaa 10380
tttatccttt attcgagaaa aaagaattct ggggacacca atcaattgcc ctgataccta 10440
ggaatgtgaa cttccaagat tgttccgaaa gtaggccaaa tgaccaataa gacagaacac 10500
tacctaggta tagttatttt gtcatgccta gatccgacat acaaaggagc gtcctcttac 10560
atagacgtcc tgttagacgt ttctaatctg actcgtattg tggtcctttt ttggtggggc 10620
ggcaagctgc atcgatcacg cccggacgag gccacttcgt gaggaatgga aatatattgt 10680
gcctacggag taatgcacca cgaaacacat tcttctcgaa acgactactt acgcagggat 10740
gtatgggtat tattctgtcc acgaaaagcc agtgtcaacc cccccccccc cccccccccc 10800
cggtatcatt tatctcagta aacagcaacc tgaacaagat acccaggtag acaagaagtc 10860
agtttggagt atagtgtata gactcgggaa cattttgtgt ggacctccgt acgtgtctct 10920
caaatcggcg tctctcggtc tttggatacc ttcggagtta cacggggctt tgttgccaag 10980
gcttcaatat tcggcgcatg gattttcttt gtgcatgggt ctgagtgggg tgccgtaagg 11040
tatggtattg ctcccgattg ggagttctga cagatgatca tgccgccttc cgaagtagaa 11100
aaaagaggaa agggtcacat gctcatgatg atcgtttgct cgcgatgaat tgcgcttcct 11160
gcatatattt tgtttgcttg tcttagtcaa ccgataatgc aaattttggg gattgtgtat 11220
tgttggaaat tgaattacca actgcttaca ggacccaccc tgcgctcagg ccctcaacaa 11280
accttgggac aggattaccc actaagcctt tccaagcttt tccaaggctt ttggattcgt 11340
ttggtttgat agctcgtatg cgtatttcgc atctgtgtac ggagtatcgg attctgacag 11400
cctccattat acccgaaaac tacctggccg gcctgacctg tttcgtcttg ttcgacggtt 11460
tcccatcggc gttttgactc gggattatcg tgacgacaga caatgcctcc cgaaccggta 11520
cctctaaggt attgccccga gcatagcatg gtggtccggg gtttcccatg ggcacagagc 11580
gaatatcgtg tcacgtccaa gatgaaaaca aaccccgaac tatgaatcac gtgtcggggg 11640
···· ··· ··· • · · · · · · · · · • · ··· · · · * · · ··♦
cagcttatgc atctatagct atgccaggga cctgtagact gttggaagac tatcaacggt 11700
tttatcacca gggcgactga tatatcagtc aatgaaacaa cgttggaatg aacaataccc 11760
ccgccgtaac cgcaaccgca accgcaaccg caaccgcaac cgcaatggca ggctcggctt 11820
gctctaacac atccacgccc attgccatag ttggaatggg atgtcgattt gctggagatg 11880
caacgagtcc acagaagctt tgggaaatgg ttgaaagagg aggcagtgcc tggtctaagg 11940
tcccctcctc gcgattcaat gtgagaggag tataccaccc gaatggcgaa agggtcgggt 12000
ccgtgagtat ctaacatgca tgcatttata tcttgttttg aatatttgac acaagatttg 12060
agcatcactg aagcttggtt actgactcca aggatgactg gatagaccca cgtaaagggt 12120
ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa catgaccaca 12180
gaggtcgcca gcgtatgatt atttcaattg atctaacccg ggacgcagag atctaatatt 12240
ggacagtgca tggatccgca gtatcggctt atgcttgagg tggtctacga atcgctggag 12300
agtggtatgt agtgtgggtc atcctcactg taagcaaacg tcactgacca tcatccagcc 12360
ggtatcacca tcgatggtat ggcaggctct aatacgtcgg tgtttggggg tgtcatgtac 12420
cacgactatc aggattcgct caatcgtgac cccgagacag ttccgcgtta tttcataact 12480
ggcaactcag gaacaatgct ttcgaaccgg atatcacact tctacgactt acgtggtccc 12540
agcgtgacgg ttgacacggc ctgttcgacg acattgaccg cactgcactt ggcgtgccag 12600
agcttacgta ctggggagtc agatacagcc atcgttatcg gtgcaaatct tctgctcaat 12660
cccgatgttt ttgttacgat gtcaaacctg gggtgagttt tccgaagaag attccagatc 12720
gagagtcttg aactaagcaa tccttgttgc tcaatgacag atttttgtcc ccggatggta 12780
tctcgtactc ttttgatcct cgagcgaatg gatatggtcg cggggaagga attgccgctc 12840
tggtaataaa ggccctccct aacgcgttgc gagaccaaga ccctatccga gccgtcattc 12900
gagagacagc gctgaaccag gatggcaaaa cacccgcaat tactgcgccg agtgatgtgg 12960
cgcagaaaag tctgatccag gagtgttacg ataaggctgg gctagatatg tcgttgacct 13020
cgtacgtgga ggcccacgga actggaacac caactggtga cccccttgaa atctcagcaa 13080
tttcagcagc ttttaaagga catcctctgc accttggctc tgtgaaagca aatattggcc 13140
atacagaagc cgccagtggc ctggccagta taatcaaggt ggccttggcc ttggagaagg 13200
gcttgattcc ccctaatgcg cggttcctgc aaaagaacag caagctgatg cttgaccaaa 13260
agaacatcaa ggtaaggctt tgcgcattcg cagattcagt tatatgtttc aaaggttaat 13320
gtttcaaaga tccccatgtc tgctcaagac tggcctgtga aagatgggac tcgtcgcgca 13380
tctgtcaata acttcggctt tggtggttcg aatgctcacg tcattttgga atcatatgat 13440
cgcgcatcat tggccctgcc agaggatcaa gtgcatgtca atggtaactc tgagcatggt 13500
agggttgagg atggttccaa acagagccgc atatacgttg tgcgtgccaa ggacgagcaa 13560
gcttgtcggc gaacgatagc aagcctgcga gactacatta aatccgtcgc tgacattgac 13620
ggggaaccct tcctcgccag cctcgcctat acactaggct ctcgccgttc cattctgcca 13680
tggacgtcag tgtatgtagc agacagcctt ggcggccttg tttctgccct cagcgatgag 13740
tccaatcaac caaaacgagc gaatgagaaa gtacggctcg gatttgtatt caccggtcag 13800
ggggcgcagt ggcatgcaat gggcagagag ctggtcaata cattcccagt attcaaacag 13860
gcgattcttg aatgtgatgg ctacatcaag caactgggcg cgagttggaa ttttatgggt 13920
aagttgcgag cccgggaaaa gtaatactgt atcaagcttg aggtactaac attcaattgc 13980
acagaggagc tccaccgtga tgagctgacg actcgggtaa atgatgccga atacagtcta 14040
ccactgtcaa ccgctatcca aattgcactt gtgcgtctcc tttggtcatg gggaattcgg 14100
ccaacgggga taaccagtca ctcaagtgga gaggctgctg ctgcctacgc agctggggct 14160
ttatccgcgc ggtcggccat tgggatcact tatatacgcg gtgtattgac cactaagccc 14220
aagcccgcat tggcagccaa aggaggaatg atggcggtgg gtcttggtcg cagtgagacc 14280
aatgtttaca tttcgcgtct. caaccaggag gacggctgtg tggtggttgg atgtatcaac 14340
agtcaatgta gtgtgacggt gtcgggagat ttgggtgcaa tcgagaaact tgaaaagttg 14400
ttacacgccg atggcatctt taccaggaaa ctgaaagtca ctgaagcctt ccattcaagc 14460
cacatgcgac caatggcaga tgcctttggg gcgtcactga gagatctgtt caactcggat 14520
aacaacaacg acaatcccaa tgctgacacc tcaaagggtg tattatattc atcacctaag 14580
actggtagtc gcatgaccga tcttaaattg ctattggatc ccacacactg gatggatagt 14640
atgctacagc cggtagagtt cgagtcctca ctccgcgaga tgtgctttga tcccaacacc 14700
aaagagaaag ccgtcgatgt gattattgaa atagggcctc acggagcgct tggtggtcca 14760
atcaaccaag tcatgcagga tctgggtctg aaaggaacag atataaacta tctcagttgc 14820
ctttctcgcg gcagaagctc gttggagaca atgtatcgtg ctgctacgga gttgataagc 14880
aagggttatg ggctcaaaat ggacgctata aactttcctc atggaagaaa agagcccaga 14940
gtgaaggtac tgagcgattt gccggcgtac ccgtggaatc accaaacccg ttattggaga 15000
gagcctcgcg gcagtcgtga gtccaaacag agaacccatc cgcctcacac tttgataggc 15060
tcacgggaat ctctctctcc tcatttcgcg cctaaatgga aacatgttct ccgtctgtca 15120
gatattccat ggatacgaga tcacgtcgtt ggttcgagca tcatctttcc gggagctggc 15180
ttcatcagca tggccatcga ggggttttca caagtctgcc caccagttgc gggggctagc 15240
atcaactaca acttgcgtga cgttgaactc gcgcaggctc tcataatacc cgctgatgca 15300
gaágcagagg ttgacctgcg cctaacgatc cgttcatgtg aggaaaggtc cctcggcaca 15360
aagaactggc atcaattttc tgtgcactca atttcgggcg aaaataatac ctggacagaa 15420
cactgcaccg gattaatacg ttcggagagc gaaagaagcc accttgactg ttcaactgtg 15480
gaagcctcac gcaggttgaa tctaggctca gataaccgga gcattgatcc caacgatctc 15540
tgggagtcct tacacgcgaa tgggatatgc cacggaccca tttttcagaa cattcagcga 15600
attcaaaaca atggacaggg ctcgttttgc agattttcca ttgctgacac tgcctcggct 15660
atgcctcact cgtacgagaa tcgacacatc gtccatccta ctactctgga ctcggtgatc 15720
caggcggcat acacggtgtt accctacgcg ggaacacgta tgaaaacggc catggtacca 15780
aggaggctaa gaaatgtcaa aatatcctct agcctggctg acttggaggc tggtgatgct 15840
ctggacgcac aggccagcat caaggatcgc aactctcaat ccttctctac cgacttggca 15900
gtgtttgatg actatgatag cggttcttct ccctcggacg gaatcccagt catagagatt 15960
gaaggccttg ttttccagtc ggttggaagc agcttctctg accaaaagtc agactccaac 16020
gacacagaaa atgcctgcag ctcctgggtt tgggcccctg acatcagctt gggtgactcc 16080
acttggctca aagaaaagtt gagcactgag gctgagacga aagaaacgga actcatgatg 16140
gacctccgaa gatgcacgat caactttata caggaggctg tcactgattt gacaaattct 16200
gatatccaac atctggatgg ccaccttcag aagtatttcg attggatgaa tgtccaattg 16260
gaccttgcga gacaaaacaa gctcagccca gccagttgcg actggctaag tgacgatgct 16320
gagcagaaga aatgcctaca ggccagagtc gctggagaaa gcgtcaatgg cgagatgatt 16380
tctcgtctag gacctcagtt aatagcaatg ctacgccgcg aaacagagcc acttgagttg 16440
atgatgcaag atcagctgct aagcagatac tacgtcaacg caatcaaatg gagccgatca 16500
aacgcacaag ccagcgagct gatccgactt tgcgcccaca agaacccgcg ttctcgcatt 16560
ttggagattg gcggaggcac gggcggctgc acaaagctta ttgtcaatgc attgggaaac 16620
accaagccga tcgatcgtta tgacttcacc gatgtgtctg ccgggttttt cgagtcggcg 16680
cgtgagcaat ttgcggattg gcaagacgtg atgactttca aaaaattgga tattgaaagc 16740
gatcccgagc aacaagggtt tgaatgtgcc acctacgatg tggtcgtggc ttgccaggtc 16800
ctgcatgcaa ctcgatgcat gaaacgaaca ctgagtaacg ttcgaaaatt gctcaagcct 16860
gggggcaact tgattttggt tgagactacc agggatcagc tcgatttgtt ctttaccttc 16920
ggactgttgc caggttggtg gctcagtgag gagcctgagc ggaagtcgac gccatcgctc 16980
actaccgatc tttggaacac catgttggac acgagcggtt tcaacggtgt ggaattggag 17040
gttcgtgatt gtgaagacga tgagttttac atgatcagca caatgctatc gacggctaga 17100
aaagagaata caaccccgga tacagtggca gaatcggagg tgcttttgct gcacggagcg 17160
ctccgacctc cttcatcttg gctggaaagt ctccaggcag caatttgtga aaagaccagt 17220
tctagcccat cgatcaacgc tctgggcgag gtagatacca ctggaaggac atgcattttt 17280
cttggggaaa tggagtcctc gctccttgga gaggtgggaa gcgagacctt caaatccatc 17340
accgcgatgc tgaataactg caacgcactt ctctgggtgt ctagaggagc agccatgagc 17400
tccgaggatc catggaaagc tctacatatt ggtctgctgc gtaccatccg caacgaaaat 17460
aacgggaagg aatatgtatc gttggatctc gatccttctc gaaacgcata cacccacgag 17520
tccctgtatg ctatctgcaa tatcttcaat ggccgcctcg gcgacctttc cgaagacaag 17580
gagtttgaat ttgcagagag aaacggcgtc atccacgtac cgcgactttt caatgacccg 17640
cactggaagg accaagaagc ggttgaggtc acactgcagc cgttcgagca acccgggcgt 17700
cgtctgcgga tggaggttga gacgccaggg ctcttagact ccctgcaatt tcgagacgac 17760
gaaggacgtg aaggcaagga tcttccggat gattgggtag aaatcgaacc caaagctttc 17820
ggtctcaatt ttcgggatgt catggttgcc atgggtcaat tggaggccaa ccgtgtgatg 17880
ggcttcgaat gcgccggagt gatcacaaag ctcggtggag ctgctgccgc tagccaaggc 17940
ctcagattag gggaccgcgt atgtgcacta ctgaaaggcc attgggcgac cagaacacag 18000
acgccgtaca ctaatgtcgt ccgtattccg gacgaaatgg gcttcccaga agccgcttcg 18060
gtccccctgg ctttcactac cgcatatatt gcgctttata ccacggcaaa gctacgacga 18120
ggcgaaagag tcttgatcca cagtggagct ggaggcgtcg gtcaagcagc gatcattttg 18180
tcccagcttg cgggtgccga ggtcttcgtc acagcgggaa ctcaagccaa gcgtgacttt 18240
gtcggcgata aattcggcat caatccggat catatcttct cgagcaggaa tgacttattc 18300
gtcgacggca tcaaagccta cacgggcgga cttggcgttc atgtcgttct aaactcattg 18360
gcaggtcaac tcctccaagc aagctttgac tgcatggccg aattcggcag atttgttgag 18420
attggaaaaa aggacctgga gcaaaacagc agacttgaca tgctgccatt cacccgggac 18480
gtctctttca catcaattga tcttctctcg tggcaaagag ccaaaagtga agaagtatcc 18540
gaagcgttga accatgtcac aaaactcctc gagacaaaag cgattggctt gattggtcca 18600
atccagcagc actccttgtc aaacatcgag aaggccttcc gtacgatgca gagtggtcag 18660
catgttggca aagttgtggt caatgtatct ggggacgaac tggtcccagt cggcgatgga 18720
gggttctcgc tgaagctgaa gcctgacagt tcttacctag ttgctggtgg gctgggggga 18780
attggaaagc agatctgtca gtggcttgtt gatcatggcg cgaagcactt gattatccta 18840
tcgagaagtg caaaggccag tccattcata accagcttgc aaaatcaaca gtgcgctgtc 18900
tatctacacg catgtgacat ctcagatcaa gatcaggtca ccaaggtgct ccggttgtgc 18960
gaágaagcac atgcaccgcc aattcgaggt atcatacaag gtgccatggt tctcaaggac 19020
gcgcttctat cgcgaatgac attggatgaa tttaatgcag caacacgccc aaaagtacag 19080
ggtagttggt atcttcacaa gatcgcacag gatgttgact tcttcgtgat gctctcatcc 19140
cttgttgggg tcatgggtgg ggcaggccag gccaattacg cagctgctgg tgcattccag 19200
gacgcacttg cgcaccaccg gagagcccat ggcatgccgg ctgtcaccat tgacttgggc 19260
atggtcaagt ctgttggata cgtggctgaa actggccgtg gtgtggccga ccggctcgct 19320
agaataggtt acaagcctat gcatgaaaag gacgtcatgg atgtgttgga gaaggcaatc 19380
ctgtgttctt cccctcaatt tccatcacct cccgcagctg tggttacagg aatcaacaca 19440
tccccgggtg ctcactggac cgaggcaaac tggatacagg aacagcggtt tgtgggactt 19500
aaataccgcc aagtccttca tgcagaccaa tcctttgtct cttcgcataa aaaaggacca 19560
gatggcgtgc gggcccaact aagcagggtc acctctcacg acgaggccat ttctatcgtc 19620
ctcaaagcaa tgacggaaaa gctgatgcga atgtttggtc tggcagaaga cgacatgtcc 19680
tcgtccaaaa acctggcagg tgtcggcgta gactcactcg tcgccattga acttcgaaac 19740
tggatcacat ctgaaatcca tgttgatgtg tcgatctttg agctcatgaa tggtaacacc 19800
atcgccggcc tcgtcgagtt agttgtggcg aaatgcagtt aagttgaagg gttcagtgaa 19860
gccttttgtc tggccaagcg ggtatagctc gacggaggta tagtacgaag gagcatagcg 19920
gccatggtct gaagcctgaa tccaatctga atcgagcctg ggctgagcct gactatttaa 19980
tgcctgactt ctggatagca gtaaatagag atacctgaaa taccattaca gtggccctga 20040
gaagcaacaa agtacacatg tgcactcgtt ctcgaagtcg gaagagtgaa tgctttttat 20100
actaccaggg aagctgtctt agcacctcgg aggcttgact gtcaaaagtt ctctcttttt 20160
ctctccatta tgattcccgc aagccttgta aatgcgcgtt gaacggtcga aaggcgttgg 20220
cacgggcagt gggtacagat tgtggatatg tagtcggaag gcgggaggga gtacttgtgt 20280
ccacgtcgtt gcgccgtcct ctctttcgcc tagtcgggga tgttgagtag gaacatcaag 20340
acttaacaga gcctaagccc tcgtcatcgt aagcgccagt caacgcctga gagaatgggg 20400
agatcggtga ttgtaccggg agaaaagctt cattactgcc gacttcccta cgtggcggtg 20460
tagctggcgg tatagaagca gatggccgct ctgcgtagca ggaatacaca ctctctccct 20520
tctctctctc tgtgtttctg tctctcgcac atagccaaag tctacaccac gttcgattac 20580
aaagaaggca tcacaatcga ataaaatgcg ttttatttta ctaacctact cgactaatac 20640
agcacctagt ttctctggga cggaaactat tggaataagc ctggggacgg atgcatattt 20700
gttttagttt gcgtgttata tcttagcacc ggtcatgagg gagcgggatg tcctcgttgc 20760
gccggcgtac catgagcttt gtggttggat gcatacgaac gctaaaagcg tgacggtagt 20820
atttgtcatc gtctcctggt acaggcttca catcatactg aatcagtata tgagcgagga 20880
gaatcttgat ttccttcgag gcgaagaacc gcccgggaca agcgcgtggg ttccagccga 20940
agccgatgtg atcaccgttg gtattctcca attgagcggt gaaggccttg tctggatcct 21000
cgcgcatgcg cataaatcgg tagggatcat aattttcggg gttttcccac acatcagggt 21060
tgttcatgcg gtctgcagcc acagcggcca actcgccctt gggaatgaag aggccattgg 21120
atagagtgat gtctctgaga gcggtactgc gcatagtggc gcactcgacc ggcttgattc 21180
gctgcgtctc tttcatgcag ctgtcgagga gcttcagctt gaacagagag gcaggcgtcc 21240
agcccccttc tccgattaca gtgcggatct cttggcggag aggctgaata aggtctgggt 21300
gcctggcaat gtccacaagg gcaccgacga aaagatccgt cgaggcgtag atgccggcga 21360
aatccatagc gagctgagca cccgccacat cgtaccagcg gccgtcggcg gtgtcttcaa 21420
accattgcat ggtatcgacg tactggggcg gctgcacgcc cttcgctaca catgcggcct 21480
tttcagcacg tcgtcgctga atctcaggat caatgatctt tcgtgcgcgg cgcacttggt 21540
cacgcaattt gcgtccttgc ggttgaaacc agtgagcgag cggtcgcagt agcatgggcc 21600
atacgcgaag ttggcgagct tgtaccgcca cactcacggc atggttcttt gcaatatcca 21660
gccactcctc attgtggcag attttgtcgc cgaccataat gagtgtgact gttcgtgtga 21720
caaggtccaa tccattggaa tagacaggtg cggtttgcca ctctagtata ttcgcggtat 21780
gtcagccaga ggctcaatgc tcaagacaga aaaattgaca cttaccctcg cttttaccga 21840
acaacttggc aatagtagcg tcggccaagg tagccaatgg ctttgtgtac ttgggggctt 21900
gggtttgtaa ctggttcaaa acaactttgt tgacaagatg tgcatcctgg cagatttcct 21960
tgaacccgtc gaatccaggg agatgagagt · gaaagtccta tacattcatc agaatcttag 22020
agacgtcatt gagttacaac aatggaaaat tcagaggtca tacatccgcc aaaaacttgt 22080
acatgcacat atctttgatt ttccgaaact cgtcggccat ggacgatggg aggatggtgc 22140
aatagccgga atcaacaatg aagcgcaggg gcttgtcgtt tttcgagaac caagcttcga 22200
tccagctcgg accatacgta tcgaagtcct gcctagccct catggtcgtc aactcccacc 22260
attttttggg attatagact tgcagttcgg actggcgccc ccgcaaacgg taggcgatga 22320
gactaagaag cactgcgacc gccacaaggg cttgaggggt cgatacccat tggtacgatt 22380
cgacggtcag aagaacctgg ccgagcattg cgtgagacag ataggaccta tgcacaccag 22440
tggaaaagaa gaaagagcga agaatgagag cgctgcgacg gtttataatc gaataacagc 22500
actaatgctt ctgggatttt gtggccgaga gcactcttcc agtcaacctt gaaaaaaaaa 22560
aaaccccccc cccaatcgaa gtttacctgg atggggcagt tcggttgttt cctttaggag 22620
cagcttcacc gagcagcaca agaacaatcc gagtgaaaaa ctcggtttca ccttgataca 22680
gccaattgat attcacgttt gattcattca gcctcgtgtg accgaataac gccgtatgga 22740
ggaatggcta ttcgtgcacc gaatgacgcc gggagggttt gctaggtgcc gagcttgcat 22800
tgctgggaag tgggggcatt tgagtactag aatggatctt gaaattgtcc gaatctagat 22860
gagtactgat acgtgcaagt aaatataacg acggtatcgg ttgcaaggcc ggcttgttcg 22920
ctcagagatt caactctgcg attctgtaag aacaaatgtt gtgcccggca tgcagtgaga 22980
agatctactg acgcaagaca aggtttaatc ccaatcctat cgcccaaaaa caggatcagc 23040
agttatggat caagccaact atccaaacga gccaattgtg gtagtgggaa gcggttgtcg 23100
gtttccaggt ggtgtcaaca caccatcaaa actttgggag ctgctcaaag agccccggga 23160
tgtacagacc aagatcccta aggagagatt tgacgtcgat acattttaca gccccgatgg 23220
cactcacccc gggcgcacga acgcaccctt tgcatacttg ctgcaggagg atctacgcgg 23280
ttttgatgcc tctttcttca acatccaagc tggagaggcc gaaacgattg acccacagca 23340
aaggctgctg ctggagacgg tctatgaagc tgtatccaac gcaggcctac ggatccaagg 23400
ccttcaagga tcctctactg ctgtgtacgt cggtatgatg acgcatgact atgagactat 23460
cgtgacgcgt gaattggata gtattcctac atactctgcc acgggggtag ctgtcagtgt 23520
ggcctccaac cgtgtatcat acttcttcga ctggcatggg ccgagtgtga gtgccactca 23580
ttgagcgagc ccgacttcgt caagtgctga cagattcctg actgattctg cagatgacga 23640
tcgacacagc ctgtagttca tccttagctg ccgtgcatct ggccgtccaa cagcttagaa 23700
cgggcgagag taccatggcg gttgcagccg gtgcgaatct gatattgggc cccatgacct 23760
ttgtaatgga gagcaaattg aacatgctgt cccccaatgg tagatctcga atgtgggatg 23820
ctgctgccga tggatatgcc agaggagtaa gttgacaatg catcaattcc tttcaaaaaa 23880
agcaagatgg cactgacctc ctgtaactgc tttttaggaa ggtgtttgct ctattgtcct 23940
gaaaacgctg agccaggcac tgcgcgacgg ggacagtatc gagtgtgtta tccgagagac 24000
cggtatcaac caagatggcc gaacgacagg tatcacaatg ccaaaccata gcgcacaaga 24060
agccctcatt cgggccacat atgccaaggc tggtcttgat attaccaacc cccaggaacg 24120
ctgccagttc tttgaagccc atggtaagtg gtattccctg gaagtatcag ccttatggaa 24180
gttgcagaaa gtctctctct ccctaacacg aagatcccag gaactggtac accagccggt 24240
gacccacagg aagctgaggc tattgcaaca gccttcttcg gacacaagga tggaacaatc 24300
gacagcgacg gcgagaaaga tgagcttttt gtcggcagca tcaagacagt tctcggtcac 24360
acggaaggca ctgctggtat tgcgggctta atgaaggcat cgtttgctgt acgaaatggc 24420
« ·
gtgatcccgc caaacctgct gtttgagaag atcagtcccc gtgtcgctcc gttctatacg 24480
cacttgaaaa ttgcaacgga ggccacagaa tggccgattg ttgcgcccgg gcagcctcgc 24540
agagtcagcg ttaattcatt tggtaaggat tcaactgcac ttcttgagaa cgaaagtgaa 24600
gttagctaaa catataaaca catcaggatt tggtggtaca aatgcccatg ctattatcga 24660
agagtatatg gctcctccac acaagccgac agcagtggta acagaggtga cctcagatgc 24720
agatgcatgc agcttgcccc ttgtgctttc atcgaagtcg cagcgctcca tgaaggcaac 24780
gctagaaaat atgctccaat ttctggaaac gcatgatgac gtggacatgc atgatatcgc 24840
atatacctta cttgagaaac ggtctatctt gcccttccgt cgtgcgattg cagcacacaa 24900
caaggaagta gcccgcgcgg cactggaggc tgccatcgcg gacggtgagg tcgtcaccga 24960
cttccgcacc gacgcgaatg acaaccctcg cgtactaggt gtctttactg gccaaggtgc 25020
acagtggccg ggcatgctga agaagctcat ggtgggtatg ccatttgtga gaggcattct 25080
cgaagagctg gataattcac tgcaaacact gcctgaaaag tatcggccta cgtggacact 25140
gtatgaccag ctcatgcttg aaggggatgc ctcaaacgtc agactcgcca gcttctccca 25200
gcctctatgc tgcgccgtac aaatcgttct ggtccgactt ctcgctgcag ctggtatcga 25260
gttcagtgca attgtcggcc acagttcagg tgagattgcc tgtgcctttg cggcaggatt 25320
catcagtgcc actcaagcta tccgtattgc gcatctgcgt ggagttgtgt ccgcggagca 25380
tgcctcttct ccaagcggcc agacaggcgc tatgctagcg gcaggtatgt cgtacgatga 25440
cgcaaaggaa ctatgcgagc tcgaagcctt tgagggtcgg gtctgcgtcg ccgctagcaa 25500
ttcaccggat agtgtgacct tctccggcga catggatgct atccagcacg ttgaaggtgt 25560
cttggaggat gaatccactt ttgccagaat cttgagagtt gacaaggcct accattcgca 25620
tcacatgcac ccatgcgcag ctccatatgt caaggcattg ctggagtgcg actgtgctgt 25680
tgccgatggc caaggtaacg atagtgttgc ttggttctct gccgtccacg agaccagcaa 25740
gcaaatgact gtacaggatg tgatgcccgc ttattggaaa gacaatctcg tctctccggt 25800
cttgttctcg caggctgtgc agaaagcagt catcactcat cgtctaatcg acgtcgccat 25860
cgaaattggc gcccaccctg ctctcaaggg tccgtgtcta gccaccatca aggatgctct 25920
tgccggtgtg gagctgccgt ataccgggtg cttggcacga aacgttgacg atgtggacgc 25980
ttttgctgga ggtctgggat acatttggga gcgtttcgga gttcggagta tcgacgccga 26040
gggcttcgta caacaagtcc ggcccgatcg tgccgttcaa aacctgtcaa agtcattgcc 26100
cacatactct tgggatcata ctcgtcaata ctgggcagaa tctcgctcca cccgccagca 26160
tcttcgtgga ggtgcgcccc atcttctgct tggaaagctt tcttcttaca gcacagcatc 26220
gaccttccag tggacaaact tcatcaggcc ccgggatctg gaatggctcg acggtcatgc 26280
• ♦ « ·
gctacaaggc cagactgtgt tccccgctgc tgggtacata attatggcca tggaagctgc 26340
catgaaggtg gctggtgagc gtgccgccca agttcagctc ctggaaatct tggacatgag 26400
catcaacaaa gccatcgtgt ttgaagatga aaacacctcc gtggagctga acttgacagc 26460
cgaagtcacc agtgacaatg atgcggatgg ccaagtcacg gtcaaatttg ttattgattc 26520
ctgtctggca aaggagagtg agctttcgac atccgccaaa ggccaaatcg tcataaccct 26580
tggcgaggca tcaccgtcat cgcagctttt gccgccacct gaggaagagt acccccagat 26640
gaacaatgtc aacatcgatt tcttctatcg ggaacttgac ctccttgggt atgactacag 26700
caaagacttc cgtcgtttgc agaccatgag aagggccgac tccaaagcta gcggcacctt 26760
ggctttcctt ccacttaagg atgaattgcg caatgagccc ctcttgctcc acccagcgcc 26820
cctggacatc gcgttccaga ctgtcattgg agcgtattcc tctccaggag atcgtcgcct 26880
acgctcattg tacgtgccta ctcacgttga cagagtgact ctgattccat cgctctgtat 26940
atcggcgggt aattctggtg aaaccgagct tgcgtttgac acaatcaaca cacacgacaa 27000
gggtgatttc ctgagcggcg acatcacggt gtacgattcg accaagacaa cgcttttcca 27060
agttgataac attgtcttta agcctttctc tcccccgact gcttcgaccg accaccgaat 27120
cttcgcaaag tgggtctggg gacccctcac gcccgaaaaa ctgctggagg accctgcgac 27180
gttgatcata gctcgggaca aggaggacat tctgaccatc gagcgaatcg tttacttcta 27240
catcaaatcc ttcctagccc agataacccc cgacgaccgt caaaatgccg acctccattc 27300
ccagaagtac attgaatggt gtgaccaggt tcaggccgat gctcgggctg gccaccatca 27360
gtggtaccag gagtcttggg aggaggacac ttctgttcac attgagcaaa tgtgtgaaag 27420
gtacacccaa agctgttccg tgttttttca ttcttttata ttaacctttt acttgaagca 27480
actcgtccca cccacatgtg cgcctgatcc aaagggtagg caaagaatta atttcaattg 27540
ttcgcgggaa cggggatcct ttggatatca tgaaccgcga tgggttgttc accgagtact 27600
ataccaacaa gctcgccttt ggctcagcaa tacacgtcgt tcaggatctg gttagccaaa 27660
ttgctcatcg ctaccaatcc attgatatcc ttgagatcgg taagtcgaat ctgaaatgta 27720
agtaactagg cagtttgcta atctgtcgtt cgctttttag gcttgggtac aggcatcgcc 27780
acgaagcgcg ttcttgcatc acctcaactt ggtttcaaca gttacacttg cactgacatc 27840
tcggcggatg ttattggcaa ggcccgtgaa caactttccg aattcgacgg tctcatgcag 27900
tttgaggcac tagacatcaa cagaagccca gcagagcaag gattcaagcc tcactcctac 27960
gatctgatta ttgcatccga tgtcctccat gccagctcca acttcgagga aaaattggct 28020
cacataaggt ccttgctcaa gccgggtggt cacttggtta ctttcggggt cacccatcgc 28080
gagcctgctc gcctcgcctt catctctggg cttttcgctg atcgatggac tggagaagac 28140
gaaactcgtg ctttgagtgc ctcggggtcc gttgaccaat gggagcatac cctcaagaga 28200
gttgggttct ctggcgtcga tagtcggaca cttgatcgag aggatgattt gatcccgtct 28260
gtcttcagta cacatgctgt ggatgccacc gttgagcgtt tgtatgatcc actttctgct 28320
ccattgaagg actcataccc gccattagtg gttatcggtg gcgaatcgac aaaaaccgaa 28380
cgcattttga acgacatgaa agctgcccta ccgcatagac acatccactc cgtcaagcgg 28440
ctggaaagtg ttctcgacga cccggccttg cagcctaagt cgacttttgt catcctctcg 28500
gaacttgatg atgaagtgtt ttgcaacctt gaagaggaca agtttgaggc agtcaagtct 28560
cttctcttct acgccggacg catgatgtgg ctgacagaga atgcctggat tgatcatccc 28620
caccaggcca gcaccatcgg aatgttgagg acaatcaagc tcgagaaccc tgacttggga 28680
acgcacgtct tcgatgtcga tactgtggag aacctagaca ccaaattctt cgttgagcaa 28740
cttttgcgct tcgaggagag cgatgatcag cttttggaat caataacatg gactcatgag 28800
cccgaagtgt actggtgcaa gggtcgtgcc tgggtccctc gtttgaagca ggatattgct 28860
aggaacgacc gtatgaactc gtctcgtcgt ccaattttcg gtaactttaa ttcgtccaag 28920
acggccattg cactgaaaga ggcgagggga gcatcctcat cgatgtacta tcttgagtca 28980
accgagacgt gtgattcgtt agaagacgct cgtcatgctg gaaaagcaac tgttcgtgtt 29040
cgctacgctc ttccccaggc aattcgcgtg ggccatctcg gatacttcca tgtcgtgcag 29100
ggcagtattc tggagaatac atgtgaggtg cctgtagtcg ccctggctga gaagaatgga 29160
tctatactgc atgtaccgag aaactacatg catagtctgc ccgataacat ggcggaaggc 29220
gaggatagtt ccttcttgtt gtccacagct gcagccctcc ttgccgaaac aattctctct 29280
agcgctcagt cctttggctc tgatgcatca attctgatta tggagccccc aatcttctgc 29340
gtcaaagcaa ttctggagtc ggccaaaacc tacggtgttc aggttcattt ggcaacaact 29400
ctgtccgacg tcaaaactat tccggctcct tggatccgat tacatgccaa ggaaaccgac 29460
gctcggctga aacacagcct gccgacaaac atgatggcat tctttgactt gtctaccgac 29520
cggactgctg ccgggataac caaccgtttg gccaagttgc taccacccag ttgcttcatg 29580
tacagtggtg actatcttat ccgaagtaca gcttccacat acaaagttag tcatgttgag 29640
gatattccaa tcctcgagca ctctgtggca atggcaaaaa ataccgtctc tgcgtcgact 29700
gtcgacgaca ctgagaaagt tattacagcc acacaaattc tcttgcctgg tcagctctct 29760
gtcaaccaca atgaccaacg cttcaatctg gccaccgtca tcgactggaa ggaaaatgag 29820
gtgtccgcta ggatttgccc catcgactct ggtaacttat tttccaacaa gaagacgtat 29880
ttgcttgttg gtcttaccgg ggaccttggt cgctctctct gtcgctggat gatcttgcat 29940
ggcgcccgcc atgttgtgct cactagccgg aaccctcgac ttgatcccaa atggatcgcc 30000
aacatggagg cacttggtgg tgacatcacc gttctgtcaa tgtaagttga ttgatatcac 30060
atcacacctt gctaccacat cctcgtttac ttatccaatt actttcttta gggatgttgc 30120
caatgaggat tcagtcgatg ctggccttgg caagcttgtc gatatgaagt tgccacctgt 30180
tgccggcatc gcgttcgggc ctttggtgct gcaggatgtc atgctgaaga acatggacca 30240
ccagatgatg gacatggtgt tgaagcccaa ggtacaagga gcacgcattc ttcatgaacg 30300
gttctccgaa cagacgggca gcaaggcgct cgacttcttc atcatgtttt cgtccattgt 30360
tgcagttatt ggcaatcctg gccagtccaa ctatggcgct gcgaatgcct acctacaggc 30420
tctggcccag caacggtgcg ccagaggatt ggcggtattt tctacccctg aattatcatg 30480
catcgacgtc aagttactaa cgcacaacca cagggatcaa ccatcgatat tggtgccgtt 30540
tacggtgtag ggtttgtcac gagggccgag atggaggagg actttgatgc tatccgtttc 30600
atgtttgact cagttgaaga gcatgagctg cacacgcttt tcgccgaagc ggtcgtgtct 30660
gaccagcgtg cccggcagca accacagcgc aagacggtca ttgacatggc ggaccttgag 30720
cttaccacgg gtatcccaga tcttgaccct gcgcttcaag atcgaattat ttacttcaac 30780
gaccctcgtt tcggaaactt caaaattccc ggtcaacgcg gagacggtgg cgacaatgga 30840
tcagggtcta aaggctccat tgccgaccag ctcaaacaag caacaacttt agaccaagtt 30900
cggcaaatcg tgattggtaa gttatctctc atgcgtttcc tgatatcgag ttcaaactaa 30960
caaagttgca gatggtctat ctgagaaact ccgtgttacc ctccaagttt cggacgggga 31020
gagcgtggac ccaaccattc ctctcattga tcaaggtgtc gactccttgg gtgcagtgac 31080
tgtcggctca tggttctcaa agcaactcta ccttgacctc ccactcttga gggtacttgg 31140
cggtgcttct gtcgctgatc ttgccgacga cgcggccacc cgactcccag ctacatccat 31200
tccgctgctg ttgcaaattg gtgattccac gggaacctcg gacagcgggg cttctccgac 31260
accaacagac agccatgatg aagcaagctc tgctaccagc acagatgcgt cgtcagccga 31320
agaggatgaa gagcaagagg acgataatga gcagggaggc cgtaagattc ttcgtcgcga 31380
gaggttgtcc cttggccagg agtattcctg gaggcagcaa caaatggtaa aagatcatac 31440
catcttcaac aacactattg gcatgttcat gaagggtacc attgacctcg accggttgag 31500
gcgggctctg aaagcctcat tgcgccgtca cgagatcttc cgtacgtgct ttgttactgg 31560
cgatgactat agcagcgatt taaatggtcc cgtccaagtg gttctcaaga acccggagaa 31620
cagagtgcac tttgttcagg tgaacaacgc tgcggaggca gaggaagagt accggaaact 31680
cgagaagaca aactatagca tctccacagg tgacactctc agactcgttg atttctactg 31740
gggcacagat gaccacctgt tggtaatcgg ctaccacaga ttagttggtg atggctcaac 31800
aacagaaaac ctgttcaatg agatcgggca gatttacagc ggggtgaaaa tgcagcgacc 31860
atcgacccaa ttctctgatc tagccgtcca acagcgggaa aacctggaaa atgggcgaat 31920
gggggacgat atcgcgttct ggaagtccat gcatagcaaa gtctcgtcat ctgcgccaac 31980
cgtgcttccc atcatgaatc tgatcaatga ccctgctgcc aattcagagc agcagcaaat 32040
acagccattc acgtggcagc agtatgaagc aattgctcgt ttagatccca tggtcgcctt 32100
ccgaatcaaa gagcggagcc gcaagcacaa ggcaaccccc atgcagttct acctggccgc 32160
ctaccacgtt ttgttggcgc gtcttaccgg cagcaaagac ataaccatcg gcctcgccga 32220
aaccaaccga tccaccatgg aagaaatttc ggcgatgggc tttttcgcta acgtgcttcc 32280
cctgcgcttt gatgagttcg tcggcagcaa gacattcggc gagcaccttg tagccaccaa 32340
ggacagtgtg cgtgaggcca tgcaacacgc gcgggtgccg tatggcgtca tcctcgactg 32400
tctaggcctg aatctcccta cctcaggcga ggaacccaag actcagacac acgccccctt 32460
gttccaggct gtctttgatt acaagcaggg tcaagcggag agtggctcaa ttggcaatgc 32520
caaaatgacg agtgttctcg cttcccgtga gcgcactcct tatgacatcg ttctcgagat 32580
gtgggatgac cctaccaagg acccactcat tcatgtcaaa cttcagagct cgctgtatgg 32640
ccctgagcac gctcaggcct ttgtagacca cttttcttca atcctcacta tgttctcgat 32700
gaacccggct ctgaagttgg cctagatcgt tcagcgccgt gaattcagat gtgtggtttg 32760
agtgttgttc atgataaaga tggattagaa attggcaata gagcagatgg caaatctatc 32820
ctgaattcgg cgtcaattga cacacgcata ttcatctaca aatagcgaat tcgtcttgta 32880
tctttgtcaa aattacttct accttcgttg ctcttcttta ttgcagcaat cgtaacatca 32940
agttagatag cgcggttcag agtaccgtaa cggtgataaa tatacctcgg tagcgcgttt 33000
cgaaagactc tgtgaggaag gtgaaacctc caaggcttgg aattgatttc aatccatcct 33060
gtatataaat tcgacgccat tgcaaatagt tccatagtta ctggtttagt gccttgttgt 33120
ggtgatcgag tggttttaga tgtctgtcat gcctgttcag aacgagcctt ccatgatcta 33180
tccaaaatat gttcacgaaa tatttatgag atggtcgcga ccactataac taaatcaccc 33240
ttggaaggtg agcattcaaa ccgtgtaaga ttagaactat tcaaatttgt tcagtaaaaa 33300
tgtggtatgg actaggcatg agagccagag ccttgctata taccctgttg tctcacctag 33360
acaaatgaac ctgacatctt gaccttttga tatagctgtt ggaagcgctt gaccgtctcc 33420
tggacatcac tcggtctgtt gggaaaatta tgctttccct gaaactcgag tacatctgca 33480
ttctgaggca ggtaatgtgt ttcaaccatc tgtctcgacc cttggagagc aaaatcttga 33540
cgaccgtgaa gatgcagtgt cggcacgttg attattagct tgtcgtcgtc gtcttgcgcc 33600
tc^gctctca tgtaatctct ggcttcatcg ctatagaaac agcaaatcaa aacagcaatg 33660
ctcattttcg gaaaccatgg cagttttccc atttgctgtt gatggagcag caaagtggcg 33720
accaatgcgc cctcagagaa ggccactatg ccgacaatgg gtgcctgtgg gttagttata 33780
gaccaatctt ggacggtctt ttgcacaggc ccgatcacag ccgctactct atcgcccacc 33840
gtgggggttg tcgtgtttgt aacggcgtca tgatgctttt ggaaccaggt gtagtatgga 33900
cccatgcctt ggaagacagg aagcacgccg ggtccggggc tggagctaaa cggcgcggtc 33960
gcatatacga attcaaactc gtttttcaac gccacgcgca gtttagagat ctggacgcgg 34020
aatatggctg ctgagcaccc ggcaccgtgg atgcataaga gagcttttct cggtttgcct 34080
ggcgagaaat ctgtaatcct cgctggactc attttctctt gtggtgtgag ctgtgacttc 34140
gtctgttctg gggaatttgt tagtcattac tgacaaggaa ataacaacga cgtagtattg 34200
atc34203 <210>3 <211>17 <212> DNA <213> Umělá sekvence <220>
<221> neurčená vlastnost
<223> Popis umělé sekvence: Smíšený primer který obsahuje DNA sekvenci odvozenou z aminokyselinové sekvence PKS z Aspergillus flavus.
<220>
<221> modifikovaná báze
<222> (6)..(6)
<223> i
<220>
<221> modifikovaná báze
<222> (9) .. (9)
<223> i
»· « · · · · · · · • · · · · · * ···« ·· · ··«·· · · · ·« · ···· « · · ·· ··· · · ·« · · ··· <400> 3 gayacngcnt gyasttc
<210> 4
<211> 17
<212> DNA
<213> Umělá sekvence
<220>
<221> neurčená vlastnost
<223> Popis umělé sekvence: Smíšený primer který obsahuje DNA sekvenci odvozenou z aminokyselinové sekvence PKS z Aspergillus flavus.
<220>
<221> modifikovaná báze
<222> (3) . . (3)
<223> i
<220>
<221> modifikovaná báze
<222> (6) . . (6)
<223> i
<220>
<221> modifikovaná báze
<222> (8) . . (8)
<223> i
<220>
<221> modifikovaná báze
<222> (15) . . (15)
<223> i
<400> 4 tcnccnknrc wgtgncc
<210> 5
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 5
gcatgttcaa tttgctctc 19
<210> 6
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 6 ctggatcaga cttttctgc
<210> 7
<211> 18
<212> DNA
<213> Penicillium citrinum
<400> 7
gtcgcagtag catgggcc 18
<210> 8
<211> 20
<212> DNA
<213> Penicillium citrinum
• 4 4 44 · • * · · < * · « » 4 · r « · • « 4 4 4 * - 4 4 * « · · 44 «44 »· 4
<400> 8
gtcagagtga tgctcttctc 20
<210> 9
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 9
gttgagagga ttgtgagggc 20
<210> 10
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 10
ttgcttgtgt tggattgtc 19
<210> 11
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 11
catggtactc tcgcccgttc 20
<210> 12
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 12
ctccccagta cgtaagctc 19
<210> 13
<211> 21
<212> DNA
<213> Penicillium citrinum
<400> 13
ccataatgag tgtgactgtt c 21
<210> 14
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 14
gaacatctgc atccccgtc 19
<210> 15
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 15
ggaaggcaaa gaaagtgtac 20
<210> 16
<211> 21
<212> DNA
<213> Penicillium citrinum
<400> 16
agattcattg ctgttggcat c 21
<210> 17 <211> 722 • · <212> DNA <213> Penicillium citrinum <400> 17 ggccacgcgt aactctgcga atcaagccaa gtggtgtcaa ccaagatccc ccgggcgcac cctctttctt tgctggagac gatcctctac gtgaattgga accgtgtatc gttcatcctt tg cgactagtac ttctgtttaa ctatccaaac cacaccatca taaggagaga gaacgcaccc caacatccaa ggtctatgaa tgctgtgtac tagtattcct atacttcttc agctgccgtg gggggggggg tcccaatcct gagccaattg aaactttggg tttgacgtcg tttgcatact gctggagagg gctgtatcca gtcggtatga acatactctg gactggcatg catctggccg gggggggggg atcgcccaaa tggtagtggg agctgctcaa atacatttta tgctgcagga ccgaaacgat acgcaggcct tgacgcatga ccacgggggt ggccgagtat tccaacagct gcttgttcgc aacaggatca aagcggttgt agagccccgg cagccccgat ggatctacgc tgacccacag acggatccaa ctatgagact agctgtcagt gacgatcgac tagaacgggc tcagagattc gcagttatgg cggtttccag gatgtacaga ggcactcacc ggttttgatg caaaggctgc ggccttcaag atcgtgacgc gtggcctcca acagcctgta gagagtacca
120
180
240
300
360
420
480
540
600
660
720
722 <210> 18 <211> 760 <212> DNA <213> Penicillium citrinum
<400> 18
ggccacgcgt cgactagtac gggggggggg gggggggggg gactatcaac ggttttatca 60
ccagggcgac tgatatatca gtcaatgaaa caacgttgga atgaacaata cccccgccgt 120
aaccgcaacc gcaaccgcaa ccgcaaccgc aaccgcaatg gcaggctcgg cttgctctaa 180
cacatccacg cccattgcca tagttggaat gggatgtcga tttgctggag atgcaacgag 240
tccacagaag ctttgggaaa tggttgaaag aggaggcagt gcctggtcta aggtcccctc 300
ctcgcgattc aatgtgagag gagtatacca cccgaatggc gaaagggtcg ggtccaccca 360
cgtaaagggt ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa 420
catgaccaca gaggtcgcca gctgcatgga tccgcagtat cggcttatgc ttgaggtggt 480
ctacgaatcg ctggagagtg ccggtatcac catcgatggt atggcaggct ctaatacgtc 540
ggtgtttggg ggtgtcatgt accacgacta tcaggattcg ctcaatcgtg accccgagac 600
agttccgcgt tatttcataa ctggcaactc aggaacaatg ctttcgaacc ggatatcaca 660
cttctacgac ttacgtggtc ccagcgtgac ggttgacacg gcctgttcga cgacattgac 720
cgcactgcac ttggcgtgcc agagcttacg tactggggag 760
<210> 19
<211> 773
<212> DNA
<213> Penicillium citrinum
<400> 19 ggccacgcgt agtgctctcg cagcgctctc tcacgcaatg tcaagccctt ccagtccgaa taggcaggac caagcccctg cgacgagttt ctctcatctc caaagttgtt cttggccgac tgtctattcc cgactagtac gccacaaaat attcttcgct ctcggccagg gtggcggtcg ctgcaagtct ttcgatacgt cgcttcattg cggaaaatca cctggattcg ttgaaccagt gctactattg aatggattgg gggggggggg cccagaagca ctttcttctt ttcttctgac cagtgcttct ataatcccaa atggtccgag ttgattccgg aagatatgtg acgggttcaa tacaaaccca ccaagttgtt accttgtcac ggtttttttt ttagtgctgt ttccactggt cgtcgaatcg tagtctcatc aaaatggtgg ctggatcgaa ctattgcacc catgtacaag ggaaatctgc agcccccaag cggtaaaagc acgaacagtc ttttcaaggt tattcgatta gtgcataggt taccaatggg gcctaccgtt gagttgacga gcttggttct atcctcccat tttttggcgg caggatgcac tacacaaagc gaggagtggc acactcatta tgactggaag taaaccgtcg cctatctgtc tatcgacccc tgcgggggcg ccatgagggc cgaaaaacga cgtccatggc atgactttca atcttgtcaa cattggctac aaaccgcacc tgg
120
180
240
300
360
420
480
540
600
660
720
773
<210> 20
<211> 527
<212> DNA
<213> Penicillium citrinum
<400> 20
ggccacgcgt cgactagtac gggggggggg gtacctagga actgttcagt tgtccctccc 60
aaccccttgg gccgaacaac cttcctccaa tctacgacgg cagattatac ctaggcgcct 120
aaccgattag gttgctcatt cgattttgga gagactacct agctataggt accactccaa 180
gctgtagcac agacctttca gcatggtcgc ttcgttgcta ccctctcgct ttcgcggtag 240
ggaatcaatg aatcagcagc accctctacg ctcgggaaat cgggcattga cctccacact 300
ccaatttcta tccaaaacgg cgtgtctaca cccgatccat accgtttgca ccatagctat 360
tctagctagt accacatacg ttggactact caaagacagc ttcttccatg gccccgcaaa 420
cgttgataaa gcagaatggg gctctttggt cgaaggaagt cgaagcttga tcaccggccc 480
acagaatggc tggaagtggc agagcttcga cggggatgca gatgttc 527
<210> 21
<211> 522
<212> DNA
<213> Penicillium citrinum
<400> 21
ggccacgcgt cgactagtac gggggggggg gggggggggg ggatccatca atctgacttc 60
aggctagcgg accttaacga aacaacgaga gcgagatcat tcatacacca aaacacaggt 120
actatagaag cgccgcgcag tagagattca caccgcccct tgaagcaaaa gtcggaagga 180
attgcgcgat gtcagaacct ctacccccta aagaagggga accaaggcca cagaaggaag 240
aaagtcaaaa tgacacgctc gaagcgactg agtccaagtc ccagcacatc acaggcctca 300
agctcgggct ggtggttgct tcagttactt tcgtagcatt tttgatgctc cttgatatgt 360
ccattatcgt cacggcaatc ccacatatca caagcgagtt ccactctctg aacgatgtag 420
ggtggtacgg cagtgcttat cttctggcta actgtgctct ccagcccctg gccggtaaat 480
tgtatacact cttgggcttg aagtacactt tctttgcctt cc 522
<210> 22 <211> 541 <212> DNA <213> Penicillium citrinum <400> 22 ggccacgcgt cgactagtac gggggggggg ggctcacctc acattatttg atcttaatcc • ·
aataattatg tccctgccgc atgcaacgat tccgacgaac ctacgccgtc gcgcgtttcg 120
acgctcatgt gaccggtgtc atgcacaaaa gctcaaatgt accggtagca atgccaattt 180
agtccgtgct cagtgtcaac gttgtcagca agccggatta aggtgtgtgt acagcgaaag 240
gctacccaag cgcaatttac ataaagaagc cgcagctgga actacaagag ccacagaaac 300
ctcacaaccg atgaccgcga catcttctac ggtcttctca tcattggcag agactcctcc 360
accttactgc tcaccaccta cgcatattgg cacctcggca ctcaaggaaa cattatcaga 420
accatcagcg gcaaccctgc aattctatga tacatcaatc aactttgatg atcccgagtc 480
gtttcccggc ggctggcctc agccaaatac atttcgcgac gatgccaaca gcaatgaatc 540
t 541
<210> 23
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 23 atcataccat cttcaacaac
<210> 24
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 24 gctagaatag gttacaagcc
<210> 25
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 25
acattgccag gcacccagac
<210> 26
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 26
caacgcccaa gctgccaatc
<210> 27
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 27 gtcttttcct actatctacc
<210> 28
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 28 ctttcccagc tgctactatc
<210> 29
<211> 1524
<212> DNA
<213> Penicillium citrinum
<400> aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttcaa cgaaggtaga agtaattttg acaaagatac aagacgaatt cgctatttgt agatgaatat gcgtgtgtca
120 attgaagccg aattcaggat agatttgcca tctgctctat tgccaatttc taatccatct
180 ttatcatgaa caacactcaa accacacatc tgaattcacg gcgctgaacg atctaggcca
240 acttcagagc cgggttcatc gagaacatag tgaggattga r cctgagcgtg ctcagggcca tacagcgagc tctgaagttt tggtagggtc atcccacatc tcgagaacga tgtcataagg gaacactcgt cattttggca ttgccaattg agccactctc caaagacagc ctggaacaag ggggcgtgtg tctgagtctt ggagattcag gcctagacag tcgaggatga cgccatacgg cctcacgcac actgtccttg gtggctacaa ggtgctcgcc actcatcaaa gcgcagggga agcacgttag cgaaaaagcc tggtggatcg gttggtttcg gcgaggccga tggttatgtc ccaacaaaac gtggtaggcg gccaggtaga actgcatggg tccgctcttt gattcggaag gcgaccatgg gatctaaacg gccacgtgaa tggctgtatt tgctgctgct ctgaattggc tcatgatggg aagcacggtt ggcgcagatg acgagacttt acgcgatatc gtcccccatt cgcccatttt ccaggttttc cagagaattg ggtcgatggt cgctgcattt tcaccccgct tgaacaggtt ttctgttgtt gagccatcac caactaatct ggtggtcatc tgtgccccag tagaaatcaa cgagtctgag tatagtttgt cttctcgagt ttccggtact cttcctctgc gaacaaagtg cactctgttc tccgggttct tgagaaccac cgctgctata gtcatcgcca gtaacaaagc acgtacggaa aggctttcag agcccgcctc aaccggtcga ggtcaatggt tagtgttgtt gaagatggta tgat <210>30 <211>784 <212> DNA <213> Penicillium citrinum <400>30 aactggaaga attcgcggcc gcaggaattt tttttttttt ctcagggcca ctgtaatggt atttcaggta tctctattta attaaatagt caggctcagc ccaggctcga ttcagattgg
• · · • · · · • · · • · · · • · · • · · · · • • · · • ·
agaaaagtgg tctacaaagg 300
gacatgaatg agtgggtcct 360
agtgcgctca cgggaagcga 420
cgcttgaccc tgcttgtaat 480
gggttcctcg cctgaggtag 540
cacccgcgcg tgttgcatgg 600
gaatgtcttg ctgccgacga 660
catcgccgaa atttcttcca 720
tttgctgccg gtaagacgcg 780
ggttgccttg tgcttgcggc 840
agcaattgct tcatactgct 900
agcagggtca ttgatcagat 960
gctatgcatg gacttccaga 1020
ccgctgttgg acggctagat. 1080
gtaaatctgc ccgatctcat 1140
gtggtagccg attaccaaca 1200
agtgtcacct gtggagatgc 1260
ctccgcagcg ttgttcacct 1320
ttggacggga ccatttaaat 1380
gatctcgtga cggcgcaatg 1440
acccttcatg aacatgccaa 1500
1524
tttttttttc tttgttgctt 60
ctgctatcca gaagtcaggc 120
attcaggctt cagaccatgg 180
• ·
ccgctatgct ccttcgtact atacctccgt cgagctatac ccgcttggcc agacaaaagg240 cttcactgaa cccttcaact taactgcatt tcgccacaac taactcgacg aggccggcga300 tggtgttacc attcatgagc tcaaagatcg acacatcaac atggatttca gatgtgatcc360 agtttcgaag ttcaatggcg acgagtgagt ctacgccgac acctgccagg tttttggacg420 aggacatgtc gtcttctgcc agaccaaaca ttcgcatcag cttttccgtc attgctttga480 ggacgataga aatggcctcg tcgtgagagg tgaccctgct tagttgggcc cgcacgccat540 ctggtccttt tttatgcgaa gagacaaagg attggtctgc atgaaggact tggcggtatt600 taagtcccac aaaccgctgt tcctgtatcc agtttgcctc ggtccagtga gcacccgggg660 atgtgttgat tcctgtaacc acagctgcgg gaggtgatgg aaattgaggg gaagaacaca720 ggattgcctt ctccaacaca tccatgacgt ccttttcatg cataggcttg taacctattc780 tagc784 <210>31 <211>764 <212> DNA <213> Penicillium citrinum <400> 31 aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttttc gaataaaatg 60 cgttttattt tactaaccta ctcgactaat acagcaccta gtttctctgg gacggaaacc 120 attggaataa gcctggggac ggatgcatat ttgttttagt ttgcgtgtta tatcttagca 180 ccggtcatga gggagcggga tgtcctcgtt gcgccggcgt accatgagct ttgtggttgg 240 atgcatacga acgctaaaag cgtgacggta gtatttgtca tcgtctcctg gtacaggctt 300 cacatcatac tgaatcagta tatgagcgag gagaatcttg atttccttcg aggcgaagaa 360 ccgcccggga caagcgcgtg ggttccagcc gaagccgatg tgatcaccgt tggtattctc 420 caattgagcg gtgaaggcct tgtctggatc ctcgcgcatg cgcataaatc ggtagggatc 480 ataattttcg gggttttccc acacatcagg gttgttcatg cggtctgcag ccacagcggc 540 caactcgccc ttgggaatga agaggccatt ggatagagtg atgtctctga gagcggtact 600 gcgcatagtg gcgcactcga ccggcttgat tcgctgcgtc tctttcatgc agctgtcgag 660 gagcttcagc ttgaacagag aggcaggcgt ccagccccct tctccgatta cagtgcggat 720 ctcttggcgg agaggctgaa taaggtctgg gtgcctggca atgt 764
<210> 32
<211> 765
<212> DNA
<213> Penicillium citrinum
<400> 32
aactggaaga attcgcggcc gcaggaattt tttttttttt ttttttctgg aaaaggacca 60
tctctttata tattcttctt ccctactact tgcatcgtaa atttcaacaa catataaaca 120
tgagataccc tttctggccg ttcactctac cacctgcctg tctcattgca ttgtgctttt 180
gaaaattatg acaataacaa ccaatgagaa aaaatatgat cctcctgcaa tgaatccact 240
ggagggggta cggagcttgg aatgctccta agattccgac ctaatcagcg tcgagcccga 300
tcagtagctg cagcactcgg cctcagtgca ttgttaggaa cagggactgt cctggttccg 360
cctgacgggg agacacttcg agaaggggct gaagatgccg gggcagaacg gttgtgcgcc 420
atgtgcgcct tgaccaggtg accggcggct agggcagcac atagcgagag ctccccagcc 480
aaaacagcgc ttccgatgat gcgcgcaagt tgacgtgcat tctcaccggg agtggtcggg 540
tgtgatccgc ggacaccaag catgtcaagc attgcgccct ggggctccag aatcgtacca 600
ccgcccaacg ttccaacctc aatagacggc atggagacag agatttgaag cgatccgcga 660
agattgttca tgagagtgat gcagttagcg ctctccacaa cttgcgccgg atcctgacct 720
gtggcaatga aaatggctgc cgcaagattg gcagcttggg cgttg 765
<210> 33
<211> 802
<212> DNA
<213> Penicillium citrinum
<400> 33
aactggaaga attcgcggcc gcaggaattt tttttttttt tttttataga atctttgaaa 60
tcgacattaa ttaagtatgt ggagattctt tgtggaggca cggtaatgtg tctatctagc 120
aacgcggtca agcatcagtc tcaggcacag cccgggtgtc gtttttggtt gcaatcttcc 180
gccatcccat tccaaaggca aacacaaacg tgcacgccgt agctcccact gctaagtaaa 240
aagtatgatc aacggcgaga ctgtaagctt ttacaacccc tggaaggtta ttcttgctga 300
ccacatctct gaagccagtc gcccctgctg ccgtcacggc ctgcgtgtcg acagtgggcg 360
• « • ·
catacttgct caggccagtt ctcaaaccgg acccaaagac aaggttagca aagtccagga 420
agagcgatcc tccaaacgtc tgtccaaaca cggcgagaga aattccgagg gcaccttgtt 480
cgggcgaaag cgtgctttgg atggcgatga taggcgtttg catgccacaa ccacgaccga 540
agcccgcgat aaattggtac atgacccatt tcacagttga tgtatggggc tggaaggtgg 600
ataccagacc tgcgcctatg gcgacgagaa cagcgctgcc tagggcccaa ggcaaatagt 660
atcctgtctt tccaattgcg aagccagaaa ccatagccat aatgacttgt ccaagaattc 720
caggcaacat gtacacacca ctcagtgtgg gagaaacatc cttcacagcc tggaagtaga 780
tcggtagata gtaggaaaag ac 802
<210> 34
<211> 562
<212> DNA
<213> Penicillium citrinum
<400> 34
aactggaaga attcgcggcc gcaggaattt tttttttttt ttttttttac taagcaatat 60
tgtgtttctt cgctaatgcg aatatttcct tatagcaacg tcgcaacaca tttatcgtct 120
tccctgaggc ctttgttgac ttgggctctt cgtctccggc ttcgtcactc caaagcacag 180
ataggagacg agaggccggc gttatggttt tattttcagc gccaaggatt tgccacgatg 240
tgcttggcat atctgatagg actagacgaa tagatgccgc agccccgtgc tcctgtgcta 300
tccccaaagc agtctcaatc ccactcaata gtcgaaggct tacacgcaat gtcgtgcatg 360
cagaagataa ggcgtgcatg aatgggtcga gatgtgaaat gagctcgccg atatgaagat 420
tagagtgaaa cgagggaagt gcttcggctc ttccattgtc atttctagtg gttgagccag 480
accagtacca atccattcgt gtgctttgct tttgtccaca aggttgggct ttcatcacct 540
cggatagtag cagctgggaa ag 562
<210> 35
<211> 26
<212> DNA
<213> Penicillium citrinum
<400> 35
• · 5 ·» • · · · · · • · « · ·
• · · » · 4 · · » · · ·
gttaacatgt cagaacctct accccc 26
<210> 36
<211> 27
<212> DNA
<213> Penicillium citrinum
<400> 36 aatatttcaa gcatcagtct caggcac 27
<210> 37
<211> 1662
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1662)
<400> 37
atg Met 1 tca Ser gaa Glu cct Pro cta Leu 5 ccc Pro cct Pro aaa Lys gaa Glu ggg Gly 10 gaa Glu cca Pro agg Arg cca Pro cag Gin 15 aag Lys 48
gaa gaa agt caa aat gac acg ctc gaa gcg act gag tcc aag tcc cag 96
Glu Glu Ser Gin Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gin
20 25 30
cac atc aca ggc ctc aag ctc ggg ctg gtg gtt gct tca gtt act ttc 144
His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45
gta gca ttt ttg atg ctc ctt gat atg tcc att atc gtc acg gca atc 192
Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60
cca cat atc aca agc gag ttc cac tet ctg aac gat gta ggg tgg tac 240
Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr
65 70 75 80
ggc agt gct tat ctt ctg gct aac tgt gct ctc cag ccc ctg gcc ggt 288
Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gin Pro Leu Ala Gly
85 90 95
aaa ttg tat aca ctc ttg ggc ttg aag tac act ttc ttt gcc ttc ctc 336
* · · 4
Lys Leu Tyr Thr Leu 100 Leu Gly Leu Lys 105 Tyr Thr Phe Phe Ala 110 Phe Leu
tgt att ttt gaa cta ggc tcg gtg cta tgc ggt gcc gca aga tet tcc 384
Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125
acc atg ttg att gtt ggg cgg gcc gtt get gga atg gga ggc tea ggt 432
Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140
ctt gtc aac gga gcc ctc aca atc ctc tea aca get get cct aag cac 480
Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His
145 150 155 160
aag caa cca gtt ttg att gga gtg atg atg ggt ctt agt cag att gcc 528
Lys Gin Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gin Ile Ala
165 170 175
att gtc tgt gga cca ctg ctc gga ggt get ttc act caa cac gcc act 576
Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gin His Ala Thr
180 185 190
tgg ega tgg tgc ttt tat atc aat ctc ccc atc ggc get gtc get gca 624
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205
ttc ctc ctt ctc gtc atc acc ata ccc gac ega att tea tcc acg gac 672
Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220
agc gaa ctc tcg acc gac aaa cca atg gcc aac ata aaa tcc aca ctt 720
Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu
225 230 235 240
cgc aaa ctg gac ctt gta ggc ttt gtg gtc ttt gca gcc ttc gca acc 768
Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255
atg att tcc ctc gca cta gaa tgg gga ggg tcg acc tac acc tgg ega 816
Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270
agt tcc gtc atc atc ggc ctg ttc tgt ggc gga ggg ttt get ctg att 864
Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285
gcg ttc gtg cta tgg gag cgt cat gtt ggc gat get gtt gcc atg att 912
Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300
cct ggc tea gtg get ggt aaa ega caa gtg tgg tgc tet tgt tta ttt 960
Pro Gly Ser Val Ala Gly Lys Arg Gin Val Trp Cys Ser Cys Leu Phe
305 310 315 320
atg ggc ttt ttc tet ggc tcc ttg ctt gtc ttt tcc tac tat cta ccg 1008
Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335
atc tac ttc cag get gtg aag gat gtt tet ccc aca ctg agt ggt gtg 1056
Ile Tyr Phe Gin Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340
345
350
tac Tyr atg ttg cct gga Gly att Ile ctt Leu gga Gly 360 caa Gin gtc Val att Ile atg gct atg Met gtt Val tet Ser 1104
Met Leu 355 Pro Met Ala 365
ggc ttc gca att gga aag aca gga tac tat ttg cct tgg gcc cta ggc 1152
Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380
agc gct gtt ctc gtc gcc ata ggc gca ggt ctg gta tcc acc ttc cag 1200
Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gin
385 390 395 400
CCC cat aca tca act gtg aaa tgg gtc atg tac caa ttt atc gcg ggc 1248
Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gin Phe Ile Ala Gly
405 410 415
ttc ggt cgt ggt tgt ggc atg caa acg cct atc atc gcc atc caa agc 1296
Phe Gly Arg Gly Cys Gly Met Gin Thr Pro Ile Ile Ala Ile Gin Ser
420 425 430
acg ctt tcg CCC gaa caa ggt gcc ctc gga att tet ctc gcc gtg ttt 1344
Thr Leu Ser Pro Glu Gin Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445
gga cag acg ttt gga gga tcg ctc ttc ctg gac ttt gct aac ctt gtc 1392
Gly Gin Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460
ttt ggg tcc ggt ttg aga act ggc ctg agc aag tat gcg CCC act gtc 1440
Phe Gly Ser Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val
465 470 475 480
gac acg cag gcc gtg acg gca gca ggg gcg act ggc ttc aga gat gtg 1488
Asp Thr Gin Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
485 490 495
gtc agc aag aat aac ctt cca ggg gtt gta aaa gct tac agt ctc gcc 1536
Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510
gtt gat cat act ttt tac tta gca gtg gga gct acg gcg tgc acg ttt 1584
Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525
gtg ttt gcc ttt gga atg gga tgg cgg aag att gca acc aaa aac gac 1632
Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540
acc cgg gct gtg cct gag act gat gct tga 1662
Thr Arg Ala Val Pro Glu Thr Asp Ala
545 550
<210> 38
<211> 553
<212> PRT
<213> Penicillium citrinum <400> 38
Met 1 Ser Glu Pro Leu 5 Pro Pro Lys Glu Gly Glu 10 Pro Arg Pro Gin 15 Lys
Glu Glu Ser Gin Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gin
20 25 30
His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45
Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60
Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr
65 70 75 80
Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gin Pro Leu Ala Gly
85 90 95
Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110
Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125
Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140
Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His
145 150 155 160
Lys Gin Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gin Ile Ala
165 170 175
Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gin His Ala Thr
180 185 190
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205
Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220
Ser 225 Glu Leu Ser Thr Asp 230 Lys Pro Met Ala Asn 235 Ile Lys Ser Thr Leu 240
Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255
Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270
Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285
Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300
Pro Gly Ser Val Ala Gly Lys Arg Gin Val Trp Cys Ser Cys Leu Phe
305 310 315 320
Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335
Ile Tyr Phe Gin Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350
Tyr Met Leu Pro Gly Ile Leu Gly Gin Val Ile Met Ala Met Val Ser
355 360 365
Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380
Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gin
385 390 395 400
Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gin Phe Ile Ala Gly
405 410 415
Phe Gly Arg Gly Cys Gly Met Gin Thr Pro Ile Ile Ala Ile Gin Ser
420 425 430
Thr Leu Ser Pro Glu Gin Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445
Gly Gin Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460
Phe 4 65 Gly Ser Gly Leu Arg 470 Thr Gly Leu Ser Lys 475 Tyr Ala Pro Thr Val 480
Asp Thr Gin Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
485 490 495
Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510
Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525
Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540
Thr Arg Ala Val Pro Glu Thr Asp Ala
545 550
<210> 39 <211> 31 <212> DNA <213> Penicillium citrinum <400> 39
ggatccatgt ccctgccgca tgcaacgatt c 31
<210> 40
<211> 30
<212> DNA
<213> Penicillium citrinum
<400> 40 ggatccctaa gcaatattgt gtttcttcgc 30
<210> 41
<211> 1380
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS <222> (1)..(1380) <400> 41
atg Met 1 tcc Ser ctg Leu ccg Pro cat His 5 gca Ala acg Thr att Ile ccg Pro acg Thr 10 aac Asn cta Leu ege Arg cgt Arg ege Arg 15 gcg Ala 48
ttt ega ege tea tgt gac cgg tgt cat gca caa aag ctc aaa tgt acc 96
Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gin Lys Leu Lys Cys Thr
20 25 30
ggt age aat gcc aat tta gtc cgt get cag tgt caa cgt tgt caa caa 144
Gly Ser Asn Ala Asn Leu Val Arg Ala Gin Cys Gin Arg Cys Gin Gin
35 40 45
gcc gga tta agg tgt gtg tac age gaa agg cta ccc aag ege aat tta 192
Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60
cat aaa gaa gcc gca get gga act aca aga gcc aca gaa acc tea caa 240
His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gin
65 70 75 80
ccg atg acc gcg aca tet tet acg gtc ttc tea tea ttg gca gag act 288
Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95
cct cca cct tac tgc tea cca cct acg cat att ggc acc tcg gca ctc 336
Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110
aag gaa aca tta tea gaa cca tea gcg gca acc ctg caa ttc tat gat 384
Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gin Phe Tyr Asp
115 120 125
aca tea atc aac ttt gat gat ccc gag tcg ttt ccc ggc ggc tgg cct 432
Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140
cag cca aat aca ttt ege gac gat gcc aac age aat gaa tet tcg ggg 480
Gin Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly
145 150 155 160
ata cca gat cta ggc tac gac ttt gaa ggc cct ttg gat gca acg gcg 528
Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175
cct gtc tcg cca tcg ctg ttt gac ctc gaa gta gag ggg aac tcg tea 576
Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190
tcc gga caa tcc aac aca age aac acg caa ega gac ctt ttc gaa agt 624
Ser Gly Gin Ser Asn Thr Ser Asn Thr Gin Arg Asp Leu Phe Glu Ser
195
200
205
ctg Leu tcg Ser 210 gat Asp gtg Val tca Ser cag Gin gac Asp 215 cta Leu gag Glu gta Val ata Ile ctc Leu 220 cac His ggg Gly gtg Val act Thr 672
gtg gaa tgg ccc aag caa aaa att tta age tac ccg ata ggg gac ttt 720
Val Glu Trp Pro Lys Gin Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe
225 230 235 240
ttg aat gcc ttt ggt aga ttg cta cta cat ctt caa gaa cgt gtg atc 768
Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gin Glu Arg Val Ile
245 250 255
acg age age aat age age atg tta gat ggg tgt ctg caa acc aag aac 816
Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gin Thr Lys Asn
260 265 270
ttg ttc atg gcg gtg cat tgc tac atg ttg tet gtc aaa atc atg aca 864
Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285
tca ctt tcc cag ctg cta cta tcc gag gtg atg aaa gcc caa cct tgt 912
Ser Leu Ser Gin Leu Leu Leu Ser Glu Val Met Lys Ala Gin Pro Cys
290 295 300
gga caa aag caa age aca ega atg gat tgg tac tgg tet ggc tca acc 960
Gly Gin Lys Gin Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr
305 310 315 320
act aga aat gac aat gga aga gcc gaa gca ctt ccc tcg ttt cac tet 1008
Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335
aat ctt cat atc ggc gag ctc att tca cat ctc gac cca ttc atg cac 1056
Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350
gcc tta tet tet gca tgc acg aca ttg cgt gta age ctt ega cta ttg 1104
Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365
agt gag att gag act gct ttg ggg ata gca cag gag cac ggg gct gcg 1152
Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gin Glu His Gly Ala Ala
370 375 380
gca tet att cgt cta gtc cta tca gat atg cca age aca tcg tgg caa 1200
Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gin
385 390 395 400
atc ctt ggc gct gaa aat aaa acc ata acg ccg gcc tet cgt ctc cta 1248
Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415
tet gtg ctt tgg agt gac gaa gcc gga gac gaa gag ccc aag tca aca 1296
Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430
aag gcc tca ggg aag acg ata aat gtg ttg ega cgt tgc tat aag gaa 1344
Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445
ata ttc gca tta gcg aag aaa cac aat att gct tag 1380
Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455
<210> 42
<211> 459
<212> PRT
<213> Penicillium citrinum
<400> 42
Met 1 Ser Leu Pro His 5 Ala Thr Ile Pro Thr 10 Asn Leu Arg Arg Arg 15 Ala
Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gin Lys Leu Lys Cys Thr
20 25 30
Gly Ser Asn Ala Asn Leu Val Arg Ala Gin Cys Gin Arg Cys Gin Gin
35 40 45
Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60
His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gin
65 70 75 80
Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95
Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110
Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gin Phe Tyr Asp
115 120 125
Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140
Gin Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly
145 150 155 160
Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175
Pro Val Ser Pro 180 Ser Leu Phe Asp Leu Glu 185 Val Glu Gly Asn 190 Ser Ser
Ser Gly Gin Ser Asn Thr Ser Asn Thr Gin Arg Asp Leu Phe Glu Ser
195 200 205
Leu Ser Asp Val Ser Gin Asp Leu Glu Val Ile Leu His Gly Val Thr
210 215 220
Val Glu Trp Pro Lys Gin Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe
225 230 235 240
Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gin Glu Arg Val Ile
245 250 255
Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gin Thr Lys Asn
260 265 270
Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285
Ser Leu Ser Gin Leu Leu Leu Ser Glu Val Met Lys Ala Gin Pro Cys
290 295 300
Gly Gin Lys Gin Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr
305 310 315 320
Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335
Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350
Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365
Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gin Glu His Gly Ala Ala
370 375 380
Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gin
385 390 395 400
Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415
Sep Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430
Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445
Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455
<210> 43 <211> 9099 <212> DNA <213> Penicillium citrinum <220>
<221> CDS <222> (1)..(9099)
<400> 43 48
atg Met 1 gat Asp caa Gin gcc Ala aac Asn 5 tat Tyr cca Pro aac Asn gag Glu cca Pro 10 att Ile gtg Val gta Val gtg Val gga Gly 15 age Ser
ggt tgt cgg ttt cca ggt ggt gtc aac aca cca tea aaa ctt tgg gag 96
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30
ctg ctc aaa gag ccc cgg gat gta cag acc aag atc cct aag gag aga 144
Leu Leu Lys Glu Pro Arg Asp Val Gin Thr Lys Ile Pro Lys Glu Arg
35 40 45
ttt gac gtc gat aca ttt tac age ccc gat ggc act cac ccc ggg ege 192
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60
acg aac gca ccc ttt gca tac ttg ctg cag gag gat cta ege ggt ttt 240
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gin Glu Asp Leu Arg Gly Phe
65 70 75 80
gat gcc tet ttc ttc aac atc caa get gga gag gcc gaa acg att gac 288
Asp Ala Ser Phe Phe Asn Ile Gin Ala Gly Glu Ala Glu Thr Ile Asp
85 90 95
cca cag caa agg ctg ctg ctg gag acg gtc tat gaa get gta tcc aac 336
Pro Gin Gin Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110
gca ggc cta cgg atc caa ggc ctt caa gga tcc tet act get gtg tac 384
Ala Gly Leu Arg Ile Gin Gly Leu Gin Gly Ser Ser Thr Ala Val Tyr
115
120
125
gtc ggt atg Met atg acg cat His gac Asp 135 tat Tyr gag act atc Ile gtg Val 140 acg Thr cgt Arg gaa Glu ttg Leu 432
Val Gly 130 Met Thr Glu Thr
gat agt att cct aca tac tet gcc acg ggg gta get gtc agt gtg gcc 480
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
tcc aac cgt gta tca tac ttc ttc gac tgg cat ggg ccg agt atg acg 528
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
atc gac aca gcc tgt agt tca tcc tta get gcc gtg cat ctg gcc gtc 576
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
180 185 190
caa cag ctt aga acg ggc gag agt acc atg gcg gtt gca gcc ggt gcg 624
Gin Gin Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
195 200 205
aat ctg ata ttg ggc ccc atg acc ttt gta atg gag agc aaa ttg aac 672
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220
atg ctg tcc ccc aat ggt aga tet ega atg tgg gat get get gcc gat 720
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
gga tat gcc aga gga gaa ggt gtt tgc tet att gtc ctg aaa acg ctg 768
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255
agc cag gca ctg cgc gac ggg gac agt atc gag tgt gtt atc ega gag 816
Ser Gin Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270
acc ggt atc aac caa gat ggc ega acg aca ggt atc aca atg cca aac 864
Thr Gly Ile Asn Gin Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285
cat agc gca caa gaa gcc ctc att cgg gcc aca tat gcc aag get ggt 912
His Ser Ala Gin Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300
ctt gat att acc aac ccc cag gaa cgc tgc cag ttc ttt gaa gcc cat 960
Leu Asp Ile Thr Asn Pro Gin Glu Arg Cys Gin Phe Phe Glu Ala His
305 310 315 320
gga act ggt aca cca gcc ggt gac cca cag gaa get gag get att gca 1008
Gly Thr Gly Thr Pro Ala Gly Asp Pro Gin Glu Ala Glu Ala Ile Ala
325 330 335
aca gcc ttc ttc gga cac aag gat gga aca atc gac agc gac ggc gag 1056
Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
340 345 350
aaa gat gag ctt ttt gtc ggc agc atc aag aca gtt ctc ggt cac acg 1104
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365
gaa Glu ggc Gly 370 act Thr get Ala ggt Gly att Ile gcg Ala 375 ggc tta atg Met aag Lys gca tcg ttt Phe get Ala gta Val 1152
Gly Leu Ala 380 Ser
ega aat ggc gtg atc ccg cca aac ctg ctg ttt gag aag atc agt ccc 1200
Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro
385 390 395 400
cgt gtc get ccg ttc tat acg cac ttg aaa att gca acg gag gcc aca 1248
Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415
gaa tgg ccg att gtt gcg ccc ggg cag cct ege aga gtc age gtt aat 1296
Glu Trp Pro Ile Val Ala Pro Gly Gin Pro Arg Arg Val Ser Val Asn
420 425 430
tea ttt gga ttt ggt ggt aca aat gcc cat get att atc gaa gag tat 1344
Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445
atg get cct cca cac aag ccg aca gca gtg gta aca gag gtg acc tea 1392
Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460
gat gca gat gca tgc age ttg ccc ctt gtg ctt tea tcg aag tcg cag 1440
Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gin
465 470 475 480
ege tec atg aag gca acg cta gaa aat atg ctc caa ttt ctg gaa acg 1488
Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gin Phe Leu Glu Thr
485 490 495
cat gat gac gtg gac atg cat gat atc gca tat acc tta ctt gag aaa 1536
His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510
cgg tet atc ttg ccc ttc cgt cgt gcg att gca gca cac aac aag gaa 1584
Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525
gta gcc ege gcg gca ctg gag get gcc atc gcg gac ggt gag gtc gtc 1632
Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540
acc gac ttc ege acc gac gcg aat gac aac cct ege gta cta ggt gtc 1680
Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val
545 550 555 560
ttt act ggc caa ggt gca cag tgg ccg ggc atg ctg aag aag ctc atg 1728
Phe Thr Gly Gin Gly Ala Gin Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575
gtg ggt atg cca ttt gtg aga ggc att ctc gaa gag ctg gat aat tea 1776
Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590
ctg caa aca ctg cct gaa aag tat cgg cct acg tgg aca ctg tat gac 1824
Leu Gin Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605
cag Gin ctc atg ctt Leu gaa Glu ggg gat gcc tea aac Asn gtc aga ctc Leu gcc Ala age Ser ttc Phe 1872
Leu 610 Met Gly Asp 615 Ala Ser Val Arg 620
tcc cag cct cta tgc tgc gcc gta caa atc gtt ctg gtc ega ctt ctc 1920
Ser Gin Pro Leu Cys Cys Ala Val Gin Ile Val Leu Val Arg Leu Leu
625 630 635 640
gct gca gct ggt atc gag ttc agt gca att gtc ggc cac agt tea ggt 1968
Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655
gag att gcc tgt gcc ttt gcg gca gga ttc atc agt gcc act caa gct 2016
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gin Ala
660 665 670
atc cgt att gcg cat ctg cgt gga gtt gtg tcc gcg gag cat gcc tet 2064
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
675 680 685
tet cca age ggc cag aca ggc gct atg cta gcg gca ggt atg tcg tac 2112
Ser Pro Ser Gly Gin Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700
gat gac gca aag gaa cta tgc gag ctc gaa gcc ttt gag ggt cgg gtc 2160
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
tgc gtc gcc gct age aat tea ccg gat agt gtg acc ttc tcc ggc gac 2208
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735
atg gat gct atc cag cac gtt gaa ggt gtc ttg gag gat gaa tcc act 2256
Met Asp Ala Ile Gin His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750
ttt gcc aga atc ttg aga gtt gac aag gcc tac cat tcg cat cac atg 2304
Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
755 760 765
cac cca tgc gca gct cca tat gtc aag gca ttg ctg gag tgc gac tgt 2352
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780
gct gtt gcc gat ggc caa ggt aac gat agt gtt gct tgg ttc tet gcc 2400
Ala Val Ala Asp Gly Gin Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
gtc cac gag acc age aag caa atg act gta cag gat gtg atg ccc gct 2448
Val His Glu Thr Ser Lys Gin Met Thr Val Gin Asp Val Met Pro Ala
805 810 815
tat tgg aaa gac aat ctc gtc tet ccg gtc ttg ttc tcg cag gct gtg 2496
Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gin Ala Val
820 825 830
cag aaa gca gtc atc act cat cgt cta atc gac gtc gcc atc gaa att 2544
Gin Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845
ggc gcc cac cct gct ctc aag ggt ccg tgt cta gcc acc atc aag gat 2592
Gly Ala 850 His Pro Ala Leu Lys 855 Gly Pro Cys Leu Ala 860 Thr Ile Lys Asp
gct ctt gcc ggt gtg gag ctg ccg tat acc ggg tgc ttg gca ega aac 2640
Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 880
gtt gac gat gtg gac gct ttt gct gga ggt ctg gga tac att tgg gag 2688
Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895
cgt ttc gga gtt cgg agt atc gac gcc gag ggc ttc gta caa caa gtc 2736
Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gin Gin Val
900 905 910
cgg ccc gat cgt gcc gtt caa aac ctg tea aag tea ttg ccc aca tac 2784
Arg Pro Asp Arg Ala Val Gin Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925
tet tgg gat cat act cgt caa tac tgg gca gaa tet ege tcc acc ege 2832
Ser Trp Asp His Thr Arg Gin Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 940
cag cat ctt cgt gga ggt gcg ccc cat ctt ctg ctt gga aag ctt tet 2880
Gin His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser
945 950 955 960
tet tac age aca gca tcg acc ttc cag tgg aca aac ttc atc agg ccc 2928
Ser Tyr Ser Thr Ala Ser Thr Phe Gin Trp Thr Asn Phe Ile Arg Pro
965 970 975
cgg gat ctg gaa tgg ctc gac ggt cat gcg cta caa ggc cag act gtg 2976
Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gin Gly Gin Thr Val
980 985 990
ttc ccc gct gct ggg tac ata att atg [ gcc : atg [ gaa i gct gcc atg aag 3024
Phe Pro Ala Ala Gly Tyr Ile Ile Met . Ala i Met . Glu Ala Ala Met Lys
995 1000 1005
gtg Val gct Ala 1010 ggt Gly gag Glu cgt Arg gcc Ala gcc Ala 1015 caa Gin gtt Val cag Gin ctc Leu ctg Leu 1020 gaa Glu atc Ile ttg Leu 3069
gac atg age atc aac aaa gcc atc gtg ttt gaa gat gaa aac acc 3114
Asp Met Ser Ile Asn Lys Ala Ile Val Phe Glu Asp Glu Asn Thr
1025 1030 1035
tcc gtg gag ctg aac ttg aca gcc gaa gtc acc agt gac aat gat 3159
Ser Val Glu Leu Asn Leu Thr Ala Glu Val Thr Ser Asp Asn Asp
1040 1045 1050
gcg gat ggc caa gtc acg gtc aaa ttt gtt att gat tcc tgt ctg 3204
Ala Asp Gly Gin Val Thr Val Lys Phe Val Ile Asp Ser Cys Leu
1055 1060 1065
gca aag gag agt gag ctt tcg aca tcc gcc aaa ggc caa atc gtc 3249
Ala Lys Glu Ser Glu Leu Ser Thr Ser Ala Lys Gly Gin Ile Val
1070 1075 1080
ata acc ctt ggc gag gca tea ccg tea tcg cag ctt ttg ccg cca 3294
Ile Thr Leu Gly Glu Ala Ser Pro Ser Ser Gin Leu Leu Pro Pro
1085 1090 1095
cct gag gaa gag tac ccc cag atg aac aat gtc aac atc gat ttc 3339
Pro Glu 1100 Glu Glu Tyr Pro Gin 1105 Met Asn Asn Val Asn 1110 Ile Asp Phe
ttc tat cgg gaa ctt gac ctc ctt ggg tat gac tac age aaa gac 3384
Phe Tyr 1115 Arg Glu Leu Asp Leu 1120 Leu Gly Tyr Asp Tyr 1125 Ser Lys Asp
ttc cgt cgt ttg cag acc atg aga agg gcc gac tcc aaa get age 3429
Phe Arg 1130 Arg Leu Gin Thr Met 1135 Arg Arg Ala Asp Ser 1140 Lys Ala Ser
ggc acc ttg get ttc ctt cca ctt aag gat gaa ttg ege aat gag 3474
Gly Thr 1145 Leu Ala Phe Leu Pro 1150 Leu Lys Asp Glu Leu 1155 Arg Asn Glu
ccc ctc ttg ctc cac cca gcg ccc ctg gac atc gcg ttc cag act 3519
Pro Leu 1160 Leu Leu His Pro Ala 1165 Pro Leu Asp Ile Ala 1170 Phe Gin Thr
gtc att gga gcg tat tcc tet cca gga gat cgt ege cta ege tea 3564
Val Ile 1175 Gly Ala Tyr Ser Ser 1180 Pro Gly Asp Arg Arg 1185 Leu Arg Ser
ttg tac gtg cct act cac gtt gac aga gtg act ctg att cca tcg 3609
Leu Tyr 1190 Val Pro Thr His Val 1195 Asp Arg Val Thr Leu 1200 Ile Pro Ser
ctc tgt ata tcg gcg ggt aat tet ggt gaa acc gag ctt gcg ttt 3654
Leu Cys 1205 Ile Ser Ala Gly Asn 1210 Ser Gly Glu Thr Glu 1215 Leu Ala Phe
gac aca atc aac aca cac gac aag ggt gat ttc ctg age ggc gac 3699
Asp Thr 1220 Ile Asn Thr His Asp 1225 Lys Gly Asp Phe Leu 1230 Ser Gly Asp
atc acg gtg tac gat tcg acc aag aca acg ctt ttc caa gtt gat 3744
Ile Thr 1235 Val Tyr Asp Ser Thr 1240 Lys Thr Thr Leu Phe 1245 Gin Val Asp
aac att gtc ttt aag cct ttc tet ccc ccg act get tcg acc gac 3789
Asn Ile 1250 Val Phe Lys Pro Phe 1255 Ser Pro Pro Thr Ala 1260 Ser Thr Asp
cac ega atc ttc gca aag tgg gtc tgg gga ccc ctc acg ccc gaa 3834
His Arg 1265 Ile Phe Ala Lys Trp 1270 Val Trp Gly Pro Leu 1275 Thr Pro Glu
aaa ctg ctg gag gac cct gcg acg ttg atc ata get cgg gac aag 3879
Lys Leu 1280 Leu Glu Asp Pro Ala 1285 Thr Leu Ile Ile Ala 1290 Arg Asp Lys
gag gac att ctg acc atc gag ega atc gtt tac ttc tac atc aaa 3924
Glu Asp 1295 Ile Leu Thr Ile Glu 1300 Arg Ile Val Tyr Phe 1305 Tyr Ile Lys
tcc ttc cta gcc cag ata acc ccc gac gac cgt caa aat gcc gac 3969
Ser Phe 1310 Leu Ala Gin Ile Thr 1315 Pro Asp Asp Arg Gin 1320 Asn Ala Asp
ctc Leu cat His 1325 tcc Ser cag Gin aag Lys tac Tyr att Ile 1330 gaa tgg tgt Cys gac Asp cag Gin 1335 gtt Val cag Gin gcc Ala 4014
Glu Trp
gat gct cgg gct ggc cac cat cag tgg tac cag gag tet tgg gag 4059
Asp Ala 1340 Arg Ala Gly His His 1345 Gin Trp Tyr Gin Glu 1350 Ser Trp Glu
gag gac act tet gtt cac att gag caa atg tgt gaa age aac tcg 4104
Glu Asp 1355 Thr Ser Val His Ile 1360 Glu Gin Met Cys Glu 1365 Ser Asn Ser
tcc cac cca cat gtg cgc ctg atc caa agg gta ggc aaa gaa tta 4149
Ser His 1370 Pro His Val Arg Leu 1375 Ile Gin Arg Val Gly 1380 Lys Glu Leu
att tca att gtt cgc ggg aac ggg gat cct ttg gat atc atg aac 4194
Ile Ser 1385 Ile Val Arg Gly Asn 1390 Gly Asp Pro Leu Asp 1395 Ile Met Asn
cgc gat ggg ttg ttc acc gag tac tat acc aac aag ctc gcc ttt 4239
Arg Asp 1400 Gly Leu Phe Thr Glu 1405 Tyr Tyr Thr Asn Lys 1410 Leu Ala Phe
ggc tca gca ata cac gtc gtt cag gat ctg gtt age caa att gct 4284
Gly Ser 1415 Ala Ile His Val Val 1420 Gin Asp Leu Val Ser 1425 Gin Ile Ala
cat cgc tac caa tcc att gat atc ctt gag atc ggc ttg ggt aca 4329
His Arg 1430 Tyr Gin Ser Ile Asp 1435 Ile Leu Glu Ile Gly 1440 Leu Gly Thr
ggc atc gcc acg aag cgc gtt ctt gca tca cct caa ctt ggt ttc 4374
Gly Ile 1445 Ala Thr Lys Arg Val 1450 Leu Ala Ser Pro Gin 1455 Leu Gly Phe
aac agt tac act tgc act gac atc tcg gcg gat gtt att ggc aag 4419
Asn Ser 1460 Tyr Thr Cys Thr Asp 1465 Ile Ser Ala Asp Val 1470 Ile Gly Lys
gcc cgt gaa caa ctt tcc gaa ttc gac ggt ctc atg cag ttt gag 4464
Ala Arg 1475 Glu Gin Leu Ser Glu 1480 Phe Asp Gly Leu Met 1485 Gin Phe Glu
gca cta gac atc aac aga age cca gca gag caa gga ttc aag cct 4509
Ala Leu 1490 Asp Ile Asn Arg Ser 1495 Pro Ala Glu Gin Gly 1500 Phe Lys Pro
cac tcc tac gat ctg att att gca tcc gat gtc ctc cat gcc age 4554
His Ser 1505 Tyr Asp Leu Ile Ile 1510 Ala Ser Asp Val Leu 1515 His Ala Ser
tcc aac ttc gag gaa aaa ttg gct cac ata agg tcc ttg ctc aag 4599
Ser Asn 1520 Phe Glu Glu Lys Leu 1525 Ala His Ile Arg Ser 1530 Leu Leu Lys
ccg ggt ggt cac ttg gtt act ttc ggg gtc acc cat cgc gag cct 4644
Pro Gly 1535 Gly His Leu Val Thr 1540 Phe Gly Val Thr His 1545 Arg Glu Pro
gct Ala cgc Arg 1550 ctc gcc ttc Phe atc Ile tet Ser 1555 ggg Gly ctt Leu ttc Phe gct Ala gat Asp 1560 ega Arg tgg Trp act Thr 4689
Leu Ala
gga gaa gac gaa act cgt gct ttg agt gcc tcg ggg tcc gtt gac 4734
Gly Glu Asp Glu Thr Arg Ala Leu Ser Ala Ser Gly Ser Val Asp
1565 1570 1575
caa tgg gag cat acc ctc aag aga gtt ggg ttc tet ggc gtc gat 4779
Gin Trp Glu His Thr Leu Lys Arg Val Gly Phe Ser Gly Val Asp
1580 1585 1590
agt cgg aca ctt gat ega gag gat gat ttg atc ccg tet gtc ttc 4824
Ser Arg Thr Leu Asp Arg Glu Asp Asp Leu Ile Pro Ser Val Phe
1595 1600 1605
agt aca cat gct gtg gat gcc acc gtt gag cgt ttg tat gat cca 4869
Ser Thr His Ala Val Asp Ala Thr Val Glu Arg Leu Tyr Asp Pro
1610 1615 1620
ctt tet gct cca ttg aag gac tea tac ccg cca tta gtg gtt atc 4914
Leu Ser Ala Pro Leu Lys Asp Ser Tyr Pro Pro Leu Val Val Ile
1625 1630 1635
ggt ggc gaa tcg aca aaa acc gaa cgc att ttg aac gac atg aaa 4959
Gly Gly Glu Ser Thr Lys Thr Glu Arg Ile Leu Asn Asp Met Lys
1640 1645 1650
gct gcc cta ccg cat aga cac atc cac tcc gtc aag cgg ctg gaa 5004
Ala Ala Leu Pro His Arg His Ile His Ser Val Lys Arg Leu Glu
1655 1660 1665
agt gtt ctc gac gac ccg gcc ttg cag cct aag tcg act ttt gtc 5049
Ser Val Leu Asp Asp Pro Ala Leu Gin Pro Lys Ser Thr Phe Val
1670 1675 1680
atc ctc tcg gaa ctt gat gat gaa gtg ttt tgc aac ctt gaa gag 5094
Ile Leu Ser Glu Leu Asp Asp Glu Val Phe Cys Asn Leu Glu Glu
1685 1690 1695
gac aag ttt gag gca gtc aag tet ctt ctc ttc tac gcc gga cgc 5139
Asp Lys Phe Glu Ala Val Lys Ser Leu Leu Phe Tyr Ala Gly Arg
1700 1705 1710
atg atg tgg ctg aca gag aat gcc tgg att gat cat ccc cac cag 5184
Met Met Trp Leu Thr Glu Asn Ala Trp Ile Asp His Pro His Gin
1715 1720 1725
gcc age acc atc gga atg ttg agg aca atc aag ctc gag aac cct 5229
Ala Ser Thr Ile Gly Met Leu Arg Thr Ile Lys Leu Glu Asn Pro
1730 1735 1740
gac ttg gga acg cac gtc ttc gat gtc gat act gtg gag aac cta 5274
Asp Leu Gly Thr His Val Phe Asp Val Asp Thr Val Glu Asn Leu
1745 1750 1755
gac acc aaa ttc ttc gtt gag caa ctt ttg cgc ttc gag gag age 5319
Asp Thr Lys Phe Phe Val Glu Gin Leu Leu Arg Phe Glu Glu Ser
1760 1765 1770
gat gat cag ctt ttg gaa tea ata aca tgg act cat gag ccc gaa 5364
Asp Asp 1775 Gin Leu Leu Glu Ser 1780 Ile Thr Trp Thr His 1785 Glu Pro Glu
gtg tac tgg tgc aag ggt cgt gcc tgg gtc cct cgt ttg aag cag 5409
Val Tyr 1790 Trp Cys Lys Gly Arg 1795 Ala Trp Val Pro Arg 1800 Leu Lys Gin
gat att get agg aac gac cgt atg aac tcg tet cgt cgt cca att 5454
Asp Ile 1805 Ala Arg Asn Asp Arg 1810 Met Asn Ser Ser Arg 1815 Arg Pro Ile
ttc ggt aac ttt aat tcg tcc aag acg gcc att gca ctg aaa gag 5499
Phe Gly 1820 Asn Phe Asn Ser Ser 1825 Lys Thr Ala Ile Ala 1830 Leu Lys Glu
gcg agg gga gca tcc tea tcg atg tac tat ctt gag tea acc gag 5544
Ala Arg 1835 Gly Ala Ser Ser Ser 1840 Met Tyr Tyr Leu Glu 1845 Ser Thr Glu
acg tgt gat tcg tta gaa gac get cgt cat get gga aaa gca act 5589
Thr Cys 1850 Asp Ser Leu Glu Asp 1855 Ala Arg His Ala Gly 1860 Lys Ala Thr
gtt cgt gtt ege tac get ctt ccc cag gca att ege gtg ggc cat 5634
Val Arg 1865 Val Arg Tyr Ala Leu 1870 Pro Gin Ala Ile Arg 1875 Val Gly His
ctc gga tac ttc cat gtc gtg cag ggc agt att ctg gag aat aca 5679
Leu Gly 1880 Tyr Phe His Val Val 1885 Gin Gly Ser Ile Leu 1890 Glu Asn Thr
tgt gag gtg cct gta gtc gcc ctg get gag aag aat gga tet ata 5724
Cys Glu 1895 Val Pro Val Val Ala 1900 Leu Ala Glu Lys Asn 1905 Gly Ser Ile
ctg cat gta ccg aga aac tac atg cat agt ctg ccc gat aac atg 5769
Leu His 1910 Val Pro Arg Asn Tyr 1915 Met His Ser Leu Pro 1920 Asp Asn Met
gcg gaa ggc gag gat agt tcc ttc ttg ttg tcc aca get gca gcc 5814
Ala Glu 1925 Gly Glu Asp Ser Ser 1930 Phe Leu Leu Ser Thr 1935 Ala Ala Ala
ctc ctt gcc gaa aca att ctc tet age get cag tcc ttt ggc tet 5859
Leu Leu 1940 Ala Glu Thr Ile Leu 1945 Ser Ser Ala Gin Ser 1950 Phe Gly Ser
gat gca tea att ctg att atg gag ccc cca atc ttc tgc gtc aaa 5904
Asp Ala 1955 Ser Ile Leu Ile Met 1960 Glu Pro Pro Ile Phe 1965 Cys Val Lys
gca att ctg gag tcg gcc aaa acc tac ggt gtt cag gtt cat ttg 5949
Ala Ile 1970 Leu Glu Ser Ala Lys 1975 Thr Tyr Gly Val Gin 1980 Val His Leu
gca aca act ctg tcc gac gtc aaa act att ccg get cct tgg atc 5994
Ala Thr 1985 Thr Leu Ser Asp Val 1990 Lys Thr Ile Pro Ala 1995 Pro Trp Ile
ega tta cat gcc aag gaa acc gac get cgg ctg aaa cac age ctg 6039
Arg Leu His Ala Lys Glu Thr Asp Ala Arg Leu Lys His Ser Leu
• 9 9 » *
2000 2005 2010
ccg Pro aca Thr 2015 aac Asn atg atg gca ttc ttt Phe gac ttg Asp Leu tet Ser acc Thr 2025 gac Asp cgg Arg act Thr 6084
Met Met Ala Phe 2020
gct gcc ggg ata acc aac cgt ttg gcc aag ttg cta cca ccc agt 6129
Ala Ala Gly Ile Thr Asn Arg Leu Ala Lys Leu Leu Pro Pro Ser
2030 2035 2040
tgc ttc atg tac agt ggt gac tat ctt atc ega agt aca gct tcc 6174
Cys Phe Met Tyr Ser Gly Asp Tyr Leu Ile Arg Ser Thr Ala Ser
2045 2050 2055
aca tac aaa gtt agt cat gtt gag gat att cca atc ctc gag cac 6219
Thr Tyr Lys Val Ser His Val Glu Asp Ile Pro Ile Leu Glu His
2060 2065 2070
tet gtg gca atg gca aaa aat acc gtc tet gcg tcg act gtc gac 6264
Ser Val Ala Met Ala Lys Asn Thr Val Ser Ala Ser Thr Val Asp
2075 2080 2085
gac act gag aaa gtt att aca gcc aca caa att ctc ttg cct ggt 6309
Asp Thr Glu Lys Val Ile Thr Ala Thr Gin Ile Leu Leu Pro Gly
2090 2095 2100
cag ctc tet gtc aac cac aat gac caa ege ttc aat ctg gcc acc 6354
Gin Leu Ser Val Asn His Asn Asp Gin Arg Phe Asn Leu Ala Thr
2105 2110 2115
gtc atc gac tgg aag gaa aat gag gtg tcc gct agg att tgc ccc 6399
Val Ile Asp Trp Lys Glu Asn Glu Val Ser Ala Arg Ile Cys Pro
2120 2125 2130
atc gac tet ggt aac tta ttt tcc aac aag aag a cg tat ttg ctt 6444
Ile Asp Ser Gly Asn Leu Phe Ser Asn Lys Lys Thr Tyr Leu Leu
2135 2140 2145
gtt ggt ctt acc ggg gac ctt ggt ege tet ctc tgt ege tgg atg 6489
Val Gly Leu Thr Gly Asp Leu Gly Arg Ser Leu Cys Arg Trp Met
2150 2155 2160
atc ttg cat ggc gcc ege cat gtt gtg ctc act age cgg aac cct 6534
Ile Leu His Gly Ala Arg His Val Val Leu Thr Ser Arg Asn Pro
2165 2170 2175
ega ctt gat CCC aaa tgg atc gcc aac atg gag gca ctt ggt ggt 6579
Arg Leu Asp Pro Lys Trp Ile Ala Asn Met Glu Ala Leu Gly Gly
2180 2185 2190
gac atc acc gtt ctg tea atg gat gtt gcc aat gag gat tea gtc 6624
Asp Ile Thr Val Leu Ser Met Asp Val Ala Asn Glu Asp Ser Val
2195 2200 2205
gat gct ggc ctt ggc aag ctt gtc gat atg aag ttg cca cct gtt 6669
Asp Ala Gly Leu Gly Lys Leu Val Asp Met Lys Leu Pro Pro Val
2210 2215 2220
gcc ggc atc gcg ttc ggg cct ttg gtg ctg cag gat gtc atg ctg 6714
Ala Gly Ile Ala Phe Gly Pro Leu Val Leu Gin Asp Val Met Leu
2225 2230 2235
• · · · · · * • · · · · · ♦ • · · 0 · · · · • · ······ • · · « · · · • · ··· ·· · ·
aag Lys aac Asn 2240 atg Met gac Asp cac His cag Gin atg Met 2245 atg Met gac Asp atg Met gtg Val ttg Leu 2250 aag Lys ccc Pro aag Lys 6759
gta caa gga gca ege att ctt cat gaa cgg ttc tcc gaa cag acg 6804
Val Gin Gly Ala Arg Ile Leu His Glu Arg Phe Ser Glu Gin Thr
2255 2260 2265
ggc agc aag gcg ctc gac ttc ttc atc atg ttt tcg tcc att gtt 6849
Gly Ser Lys Ala Leu Asp Phe Phe Ile Met Phe Ser Ser Ile Val
2270 2275 2280
gca gtt att ggc aat cct ggc cag tcc aac tat ggc get gcg aat 6894
Ala Val Ile Gly Asn Pro Gly Gin Ser Asn Tyr Gly Ala Ala Asn
2285 2290 2295
gcc tac cta cag get ctg gcc cag caa cgg tgc gcc aga gga ttg 6939
Ala Tyr Leu Gin Ala Leu Ala Gin Gin Arg Cys Ala Arg Gly Leu
2300 2305 2310
gcg gga tca acc atc gat att ggt gcc gtt tac ggt gta ggg ttt 6984
Ala Gly Ser Thr Ile Asp Ile Gly Ala Val Tyr Gly Val Gly Phe
2315 2320 2325
gtc acg agg gcc gag atg gag gag gac ttt gat get atc cgt ttc 7029
Val Thr Arg Ala Glu Met Glu Glu Asp Phe Asp Ala Ile Arg Phe
2330 2335 2340
atg ttt gac tca gtt gaa gag cat gag ctg cac acg ctt ttc gcc 7074
Met Phe Asp Ser Val Glu Glu His Glu Leu His Thr Leu Phe Ala
2345 2350 2355
gaa gcg gtc gtg tet gac cag cgt gcc cgg cag caa cca cag ege 7119
Glu Ala Val Val Ser Asp Gin Arg Ala Arg Gin Gin Pro Gin Arg
2360 2365 2370
aag acg gtc att gac atg gcg gac ctt gag ctt acc acg ggt atc 7164
Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu Thr Thr Gly Ile
2375 2380 2385
cca gat ctt gac cct gcg ctt caa gat ega att att tac ttc aac 7209
Pro Asp Leu Asp Pro Ala Leu Gin Asp Arg Ile Ile Tyr Phe Asn
2390 2395 2400
gac cct cgt ttc gga aac ttc aaa att ccc ggt caa ege gga gac 7254
Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gin Arg Gly Asp
2405 2410 2415
ggt ggc gac aat gga tca ggg tet aaa ggc tcc att gcc gac cag 7299
Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp Gin
2420 2425 2430
ctc aaa caa gca aca act tta gac caa gtt cgg caa atc gtg att 7344
Leu Lys Gin Ala Thr Thr Leu Asp Gin Val Arg Gin Ile Val Ile
2435 2440 2445
gat ggt cta tet gag aaa ctc cgt gtt acc ctc caa gtt tcg gac 7389
Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gin Val Ser Asp
2450 2455 2460
• ·
ggg gag agc Ser gtg Val gac Asp cca Pro acc Thr 2470 att Ile cct Pro ctc Leu att Ile gat Asp 2475 caa Gin ggt Gly gtc Val 7434
Gly Glu 2465
gac tcc ttg ggt gca gtg act gtc ggc tea tgg ttc tea aag caa 7479
Asp Ser Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gin
2480 2485 2490
ctc tac ctt gac ctc cca ctc ttg agg gta ctt ggc ggt gct tet 7524
Leu Tyr Leu Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser
2495 2500 2505
gtc gct gat ctt gcc gac gac gcg gcc acc ega ctc cca gct aca 7569
Val Ala Asp Leu Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr
2510 2515 2520
tcc att ccg ctg ctg ttg caa att ggt gat tcc acg gga acc tcg 7614
Ser Ile Pro Leu Leu Leu Gin Ile Gly Asp Ser Thr Gly Thr Ser
2525 2530 2535
gac agc ggg gct tet ccg aca cca aca gac agc cat gat gaa gca 7659
Asp Ser Gly Ala Ser Pro Thr Pro Thr Asp Ser His Asp Glu Ala
2540 2545 2550
agc tet gct acc agc aca gat gcg tcg tea gcc gaa gag gat gaa 7704
Ser Ser Ala Thr Ser Thr Asp Ala Ser Ser Ala Glu Glu Asp Glu
2555 2560 2565
gag caa gag gac gat aat gag cag gga ggc cgt aag att ctt cgt 7749
Glu Gin Glu Asp Asp Asn Glu Gin Gly Gly Arg Lys Ile Leu Arg
2570 2575 2580
cgc gag agg ttg tcc ctt ggc cag gag tat tcc tgg agg cag caa 7794
Arg Glu Arg Leu Ser Leu Gly Gin Glu Tyr Ser Trp Arg Gin Gin
2585 2590 2595
caa atg gta aaa gat cat acc atc ttc aac aac act att ggc atg 7839
Gin Met Val Lys Asp His Thr Ile Phe Asn Asn Thr Ile Gly Met
2600 2605 2610
ttc atg aag ggt acc att gac ctc gac cgg ttg agg cgg gct ctg 7884
Phe Met Lys Gly Thr Ile Asp Leu Asp Arg Leu Arg Arg Ala Leu
2615 2620 2625
aaa gcc tea ttg cgc cgt cac gag atc ttc cgt acg tgc ttt gtt 7929
Lys Ala Ser Leu Arg Arg His Glu Ile Phe Arg Thr Cys Phe Val
2630 2635 2640
act ggc gat gac tat agc agc gat tta aat ggt ccc gtc caa gtg 7974
Thr Gly Asp Asp Tyr Ser Ser Asp Leu Asn Gly Pro Val Gin Val
2645 2650 2655
gtt ctc aag aac ccg gag aac aga gtg cac ttt gtt cag gtg aac 8019
Val Leu Lys Asn Pro Glu Asn Arg Val His Phe Val Gin Val Asn
2660 2665 2670
aac gct gcg gag gca gag gaa gag tac cgg aaa ctc gag aag aca 8064
Asn Ala Ala Glu Ala Glu Glu Glu Tyr Arg Lys Leu Glu Lys Thr
2675 2680 2685
aac tat agc atc tcc aca ggt gac act ctc aga ctc gtt gat ttc 8109
Asn Tyr 2690 Ser Ile Ser Thr Gly 2695 Asp Thr Leu Arg Leu 2700 Val Asp Phe
tac tgg ggc aca gat gac cac ctg ttg gta atc ggc tac cac aga 8154
Tyr Trp Gly Thr Asp Asp His Leu Leu Val Ile Gly Tyr His Arg
2705 2710 2715
tta gtt ggt gat ggc tea aca aca gaa aac ctg ttc aat gag atc 8199
Leu Val Gly Asp Gly Ser Thr Thr Glu Asn Leu Phe Asn Glu Ile
2720 2725 2730
ggg cag att tac age ggg gtg aaa atg cag ega cca tcg acc caa 8244
Gly Gin Ile Tyr Ser Gly Val Lys Met Gin Arg Pro Ser Thr Gin
2735 2740 2745
ttc tet gat cta gcc gtc caa cag cgg gaa aac ctg gaa aat ggg 8289
Phe Ser Asp Leu Ala Val Gin Gin Arg Glu Asn Leu Glu Asn Gly
2750 2755 2760
ega atg ggg gac gat atc gcg ttc tgg aag tcc atg cat age aaa 8334
Arg Met Gly Asp Asp Ile Ala Phe Trp Lys Ser Met His Ser Lys
2765 2770 2775
gtc tcg tea tet gcg cca acc gtg ctt CCC atc atg aat ctg atc 8379
Val Ser Ser Ser Ala Pro Thr Val Leu Pro Ile Met Asn Leu Ile
2780 2785 2790
aat gac cct get gcc aat tea gag cag cag caa ata cag cca ttc 8424
Asn Asp Pro Ala Ala Asn Ser Glu Gin Gin Gin Ile Gin Pro Phe
2795 2800 2805
acg tgg cag cag tat gaa gca att get cgt tta gat CCC atg gtc 8469
Thr Trp Gin Gin Tyr Glu Ala Ile Ala Arg Leu Asp Pro Met Val
2810 2815 2820
gcc ttc ega atc aaa gag cgg age ege aag cac aag gca acc CCC 8514
Ala Phe Arg Ile Lys Glu Arg Ser Arg Lys His Lys Ala Thr Pro
2825 2830 2835
atg cag ttc tac ctg gcc gcc tac cac gtt ttg ttg gcg cgt ctt 8559
Met Gin Phe Tyr Leu Ala Ala Tyr His Val Leu Leu Ala Arg Leu
2840 2845 2850
acc ggc age aaa gac ata acc atc ggc ctc gcc gaa acc aac ega 8604
Thr Gly Ser Lys Asp Ile Thr Ile Gly Leu Ala Glu Thr Asn Arg
2855 2860 2865
tcc acc atg gaa gaa att tcg gcg atg ggc ttt ttc get aac gtg 8649
Ser Thr Met Glu Glu Ile Ser Ala Met Gly Phe Phe Ala Asn Val
2870 2875 2880
ctt CCC ctg ege ttt gat gag ttc gtc ggc age aag aca ttc ggc 8694
Leu Pro Leu Arg Phe Asp Glu Phe Val Gly Ser Lys Thr Phe Gly
2885 2890 2895
gag cac ctt gta gcc acc aag gac agt gtg cgt gag gcc atg caa 8739
Glu His Leu Val Ala Thr Lys Asp Ser Val Arg Glu Ala Met Gin
2900 2905 2910
cac gcg cgg gtg ccg tat ggc gtc atc ctc gac tgt cta ggc ctg 8784
His Ala Arg Val Pro Tyr Gly Val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925
aat Asn ctc Leu 2930 cct Pro acc Thr tca Ser ggc Gly gag Glu 2935 gaa Glu ccc Pro aag Lys act Thr cag Gin 2940 aca Thr cac His gcc Ala 8829
ccc ttg ttc cag gct gtc ttt gat tac aag cag ggt caa gcg gag 8874
Pro Leu Phe Gin Ala Val Phe Asp Tyr Lys Gin Gly Gin Ala Glu
2945 2950 2955
agt ggc tca att ggc aat gcc aaa atg acg agt gtt ctc gct tcc 8919
Ser Gly Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser
2960 2965 2970
cgt gag cgc act cct tat gac atc gtt ctc gag atg tgg gat gac 8964
Arg Glu Arg Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp
2975 2980 2985
cct acc aag gac cca ctc att cat gtc aaa ctt cag agc tcg ctg 9009
Pro Thr Lys Asp Pro Leu Ile His Val Lys Leu Gin Ser Ser Leu
2990 2995 3000
tat ggc cct gag cac gct cag gcc ttt gta gac cac ttt tet tca 9054
Tyr Gly Pro Glu His Ala Gin Ala Phe Val Asp His Phe Ser Ser
3005 3010 3015
atc ctc act atg ttc tcg atg aac ccg gct ctg aag ttg gcc tag 9099
Ile Leu Thr Met Phe Ser Met Asn Pro Ala Leu Lys Leu Ala
3020 3025 3030
<210> 44
<211> 3032
<212> PRT
<213> Penicillium citrinum
<400> 44
Met Asp 1 Gin Ala Asn 5 Tyr Pro Asn Glu Pro 10 Ile Val Val Val Gly 15 Ser
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30
Leu Leu Lys Glu Pro Arg Asp Val Gin Thr Lys Ile Pro Lys Glu Arg
35 40 45
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gin Glu Asp Leu Arg Gly Phe
65 70 75 80
Asp Ala Ser Phe Phe Asn 85 Ile Gin Ala Gly Glu 90 Ala Glu Thr Ile 95 Asp
Pro Gin Gin Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110
Ala Gly Leu Arg Ile Gin Gly Leu Gin Gly Ser Ser Thr Ala Val Tyr
115 120 125
Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130 135 140
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
180 185 190
Gin Gin Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
195 200 205
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255
Ser Gin Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270
Thr Gly Ile Asn Gin Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285
His Ser Ala Gin Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300
Leu Asp Ile Thr Asn Pro Gin Glu Arg Cys Gin Phe Phe Glu Ala His
305 310 315 320
• ·
Gly Thr Gly Thr Pro 325 Ala Gly Asp Pro Gin 330 Glu Ala Glu Ala Ile Ala 335
Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
340 345 350
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365
Glu Gly Thr Ala Gly Ile Ala Gly Leu 375 Met Lys Ala 380 Ser Phe Ala Val
370
Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro
385 390 395 400
Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415
Glu Trp Pro Ile Val Ala Pro Gly Gin Pro Arg Arg Val Ser Val Asn
420 425 430
Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445
Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460
Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gin
465 470 475 480
Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gin Phe Leu Glu Thr
485 490 495
His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510
Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525
Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540
Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val
545 550 555 560
Phe Thr Gly Gin Gly 565 Ala Gin Trp Pro Gly 570 Met Leu Lys Lys Leu 575 Met
Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590
Leu Gin Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605
Gin Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610 615 620
Ser Gin Pro Leu Cys Cys Ala Val Gin Ile Val Leu Val Arg Leu Leu
625 630 635 640
Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gin Ala
660 665 670
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
675 680 685
Ser Pro Ser Gly Gin Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735
Met Asp Ala Ile Gin His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750
Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
755 760 765
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780
Ala Val Ala Asp Gly Gin Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
Val His Glu Thr Ser Lys Gin Met Thr Val Gin Asp Val Met Pro Ala
Ί9
805
810
815
Tyr Trp Lys Asp Asn 820 Leu Val Ser Pro Val 825 Leu Phe Ser Gin 830 Ala Val
Gin Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845
Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850 855 860
Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 880
Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895
Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gin Gin Val
900 905 910
Arg Pro Asp Arg Ala Val Gin Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925
Ser Trp Asp His Thr Arg Gin Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 940
Gin His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser
945 950 955 960
Ser Tyr Ser Thr Ala Ser Thr Phe Gin Trp Thr Asn Phe Ile Arg Pro
965 970 975
Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gin Gly Gin Thr Val
980 985 990
Phe Pro Ala Ala Gly Tyr Ile
995
Ile Met Ala Met Glu Ala Ala Met Lys
1000 1005
Val Ala 1010 Gly Glu Arg Ala Ala 1015 Gin Val Gin Leu Leu 1020 Glu Ile Leu
Asp Met Ser Ile Asn Lys Ala Ile Val Phe Glu Asp Glu Asn Thr
1025 1030 1035
Ser Val Glu Leu Asn Leu Thr Ala Glu Val Thr Ser Asp Asn Asp
1040 1045 1050
Ala Asp Gly Gin Val Thr Val 1060 Lys Phe Val Ile Asp 1065 Ser Cys Leu
1055
Ala Lys Glu Ser Glu Leu Ser Thr Ser Ala Lys Gly Gin Ile Val
1070 1075 1080
Ile Thr Leu Gly Glu Ala Ser Pro Ser Ser Gin Leu Leu Pro Pro
1085 1090 1095
Pro Glu Glu Glu Tyr Pro Gin Met Asn Asn Val Asn Ile Asp Phe
1100 1105 1110
Phe Tyr Arg Glu Leu Asp Leu Leu Gly Tyr Asp Tyr Ser Lys Asp
1115 1120 1125
Phe Arg Arg Leu Gin Thr Met Arg Arg Ala Asp Ser Lys Ala Ser
1130 1135 1140
Gly Thr Leu Ala Phe Leu Pro Leu Lys Asp Glu Leu Arg Asn Glu
1145 1150 1155
Pro Leu Leu Leu His Pro Ala Pro Leu Asp Ile Ala Phe Gin Thr
1160 1165 1170
Val Ile Gly Ala Tyr Ser Ser Pro Gly Asp Arg Arg Leu Arg Ser
1175 1180 1185
Leu Tyr Val Pro Thr His Val Asp Arg Val Thr Leu Ile Pro Ser
1190 1195 1200
Leu Cys Ile Ser Ala Gly Asn Ser Gly Glu Thr Glu Leu Ala Phe
1205 1210 1215
Asp Thr Ile Asn Thr His Asp Lys Gly Asp Phe Leu Ser Gly Asp
1220 1225 1230
Ile Thr Val Tyr Asp Ser Thr Lys Thr Thr Leu Phe Gin Val Asp
1235 1240 1245
Asn Ile Val Phe Lys Pro Phe Ser Pro Pro Thr Ala Ser Thr Asp
1250 1255 1260
His Arg Ile Phe Ala Lys Trp Val Trp Gly Pro Leu Thr Pro Glu
1265 1270 1275
Lys Leu 1280 Leu Glu Asp Pro Ala 1285 Thr Leu Ile Ile Ala 1290 Arg Asp Lys
Glu Asp Ile Leu Thr Ile Glu Arg Ile Val Tyr Phe Tyr Ile Lys
1295 1300 1305
Ser Phe Leu Ala Gin Ile Thr Pro Asp Asp Arg Gin Asn Ala Asp
1310 1315 1320
Leu His Ser Gin Lys Tyr Ile Glu Trp Cys Asp Gin Val Gin Ala
1325 1330 1335
Asp Ala Arg Ala Gly His His Gin Trp Tyr Gin Glu Ser Trp Glu
1340 1345 1350
Glu Asp Thr Ser Val His Ile Glu Gin Met Cys Glu Ser Asn Ser
1355 1360 1365
Ser His Pro His Val Arg Leu Ile Gin Arg Val Gly Lys Glu Leu
1370 1375 1380
Ile Ser Ile Val Arg Gly Asn Gly Asp Pro Leu Asp Ile Met Asn
1385 1390 1395
Arg Asp Gly Leu Phe Thr Glu Tyr Tyr Thr Asn Lys Leu Ala Phe
1400 1405 1410
Gly Ser Ala Ile His Val Val Gin Asp Leu Val Ser Gin Ile Ala
1415 1420 1425
His Arg Tyr Gin Ser Ile Asp Ile Leu Glu Ile Gly Leu Gly Thr
1430 1435 1440
Gly Ile Ala Thr Lys Arg Val Leu Ala Ser Pro Gin Leu Gly Phe
1445 1450 1455
Asn Ser Tyr Thr Cys Thr Asp Ile Ser Ala Asp Val Ile Gly Lys
1460 1465 1470
Ala Arg Glu Gin Leu Ser Glu Phe Asp Gly Leu Met Gin Phe Glu
1475 1480 1485
Ala Leu Asp Ile Asn Arg Ser Pro Ala Glu Gin Gly Phe Lys Pro
1490 1495 1500
His Ser 1505 Tyr Asp Leu Ile Ile 1510 Ala Ser Asp Val Leu 1515 His Ala Ser
Ser Asn Phe Glu Glu Lys Leu Ala His Ile Arg Ser Leu Leu Lys
1520 1525 1530
Pro Gly Gly His Leu Val Thr Phe Gly Val Thr His Arg Glu Pro
1535 1540 1545
Ala Arg Leu Ala Phe Ile Ser Gly Leu Phe Ala Asp Arg Trp Thr
1550 1555 1560
Gly Glu Asp Glu Thr Arg Ala Leu Ser Ala Ser Gly Ser Val Asp
1565 1570 1575
Gin Trp Glu His Thr Leu Lys Arg Val Gly Phe Ser Gly Val Asp
1580 1585 1590
Ser Arg Thr Leu Asp Arg Glu Asp Asp Leu Ile Pro Ser Val Phe
1595 1600 1605
Ser Thr His Ala Val Asp Ala Thr Val Glu Arg Leu Tyr Asp Pro
1610 1615 1620
Leu Ser Ala Pro Leu Lys Asp Ser Tyr Pro Pro Leu Val Val Ile
1625 1630 1635
Gly Gly Glu Ser Thr Lys Thr Glu Arg Ile Leu Asn Asp Met Lys
1640 1645 1650
Ala Ala Leu Pro His Arg His Ile His Ser Val Lys Arg Leu Glu
1655 1660 1665
Ser Val Leu Asp Asp Pro Ala Leu Gin Pro Lys Ser Thr Phe Val
1670 1675 1680
Ile Leu Ser Glu Leu Asp Asp Glu Val Phe Cys Asn Leu Glu Glu
1685 1690 1695
Asp Lys Phe Glu Ala Val Lys Ser Leu Leu Phe Tyr Ala Gly Arg
1700 1705 1710
Met Met Trp Leu Thr Glu Asn Ala Trp Ile Asp His Pro His Gin
1715 1720 1725
Ala Ser Thr Ile Gly Met Leu Arg Thr Ile Lys Leu Glu Asn Pro
1730
1735
1740
Asp Leu Gly Thr His Val Phe 1750 Asp Val Asp Thr Val 1755 Glu Asn Leu
1745
Asp Thr Lys Phe Phe Val Glu Gin Leu Leu Arg Phe Glu Glu Ser
1760 1765 1770
Asp Asp Gin Leu Leu Glu Ser Ile Thr Trp Thr His Glu Pro Glu
1775 1780 1785
Val Tyr Trp Cys Lys Gly Arg Ala Trp Val Pro Arg Leu Lys Gin
1790 1795 1800
Asp Ile Ala Arg Asn Asp Arg Met Asn Ser Ser Arg Arg Pro Ile
1805 1810 1815
Phe Gly Asn Phe Asn Ser Ser Lys Thr Ala Ile Ala Leu Lys Glu
1820 1825 1830
Ala Arg Gly Ala Ser Ser Ser Met Tyr Tyr Leu Glu Ser Thr Glu
1835 1840 1845
Thr Cys Asp Ser Leu Glu Asp Ala Arg His Ala Gly Lys Ala Thr
1850 1855 1860
Val Arg Val Arg Tyr Ala Leu Pro Gin Ala Ile Arg Val Gly His
1865 1870 1875
Leu Gly Tyr Phe His Val Val Gin Gly Ser Ile Leu Glu Asn Thr
1880 1885 1890
Cys Glu Val Pro Val Val Ala Leu Ala Glu Lys Asn Gly Ser Ile
1895 1900 1905
Leu His Val Pro Arg Asn Tyr Met His Ser Leu Pro Asp Asn Met
1910 1915 1920
Ala Glu Gly Glu Asp Ser Ser Phe Leu Leu Ser Thr Ala Ala Ala
1925 1930 1935
Leu Leu Ala Glu Thr Ile Leu Ser Ser Ala Gin Ser Phe Gly Ser
1940 1945 1950
Asp Ala Ser Ile Leu Ile Met Glu Pro Pro Ile Phe Cys Val Lys
1955 1960 1965
Ala Ile 1970 Leu Glu Ser Ala Lys 1975 Thr Tyr Gly Val Gin 1980 Val His Leu
Ala Thr Thr Leu Ser Asp Val Lys Thr Ile Pro Ala Pro Trp Ile
1985 1990 1995
Arg Leu His Ala Lys Glu Thr Asp Ala Arg Leu Lys His Ser Leu
2000 2005 2010
Pro Thr Asn Met Met Ala Phe Phe Asp Leu Ser Thr Asp Arg Thr
2015 2020 2025
Ala Ala Gly Ile Thr Asn Arg Leu Ala Lys Leu Leu Pro Pro Ser
2030 2035 2040
Cys Phe Met Tyr Ser Gly Asp Tyr Leu Ile Arg Ser Thr Ala Ser
2045 2050 2055
Thr Tyr Lys Val Ser His Val Glu Asp Ile Pro Ile Leu Glu His
2060 2065 2070
Ser Val Ala Met Ala Lys Asn Thr Val Ser Ala Ser Thr Val Asp
2075 2080 2085
Asp Thr Glu Lys Val Ile Thr Ala Thr Gin Ile Leu Leu Pro Gly
2090 2095 2100
Gin Leu Ser Val Asn His Asn Asp Gin Arg Phe Asn Leu Ala Thr
2105 2110 2115
Val Ile Asp Trp Lys Glu Asn Glu Val Ser Ala Arg Ile Cys Pro
2120 2125 2130
Ile Asp Ser Gly Asn Leu Phe Ser Asn Lys Lys Thr Tyr Leu Leu
2135 2140 2145
Val Gly Leu Thr Gly Asp Leu Gly Arg Ser Leu Cys Arg Trp Met
2150 2155 2160
Ile Leu His Gly Ala Arg His Val Val Leu Thr Ser Arg Asn Pro
2165 2170 2175
Arg Leu Asp Pro Lys Trp Ile Ala Asn Met Glu Ala Leu Gly Gly
2180 2185 2190
Asp Ile 2195 Thr Val Leu Ser Met 2200 Asp Val Ala Asn Glu 2205 Asp Ser Val
Asp Ala Gly Leu Gly Lys Leu Val Asp Met Lys Leu Pro Pro Val
2210 2215 2220
Ala Gly Ile Ala Phe Gly Pro Leu Val Leu Gin Asp Val Met Leu
2225 2230 2235
Lys Asn Met Asp His Gin Met Met Asp Met Val Leu Lys Pro Lys
2240 2245 2250
Val Gin Gly Ala Arg Ile Leu His Glu Arg Phe Ser Glu Gin Thr
2255 2260 2265
Gly Ser Lys Ala Leu Asp Phe Phe Ile Met Phe Ser Ser Ile Val
2270 2275 2280
Ala Val Ile Gly Asn Pro Gly Gin Ser Asn Tyr Gly Ala Ala Asn
2285 2290 2295
Ala Tyr Leu Gin Ala Leu Ala Gin Gin Arg Cys Ala Arg Gly Leu
2300 2305 2310
Ala Gly Ser Thr Ile Asp Ile Gly Ala Val Tyr Gly Val Gly Phe
2315 2320 2325
Val Thr Arg Ala Glu Met Glu Glu Asp Phe Asp Ala Ile Arg Phe
2330 2335 2340
Met Phe Asp Ser Val Glu Glu His Glu Leu His Thr Leu Phe Ala
2345 2350 2355
Glu Ala Val Val Ser Asp Gin Arg Ala Arg Gin Gin Pro Gin Arg
2360 2365 2370
Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu Thr Thr Gly Ile
2375 2380 2385
Pro Asp Leu Asp Pro Ala Leu Gin Asp Arg Ile Ile Tyr Phe Asn
2390 2395 2400
Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gin Arg Gly Asp
2405 2410 2415
• ·
Gly Gly 2420 Asp Asn Gly Ser Gly 2425 Ser Lys Gly Ser Ile 2430 Ala Asp Gin
Leu Lys Gin Ala Thr Thr Leu Asp Gin Val Arg Gin Ile Val Ile
2435 2440 2445
Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gin Val Ser Asp
2450 2455 2460
Gly Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gin Gly Val
2465 2470 2475
Asp Ser Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gin
2480 2485 2490
Leu Tyr Leu Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser
2495 2500 2505
Val Ala Asp Leu Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr
2510 2515 2520
Ser Ile Pro Leu Leu Leu Gin Ile Gly Asp Ser Thr Gly Thr Ser
2525 2530 2535
Asp Ser Gly Ala Ser Pro Thr Pro Thr Asp Ser His Asp Glu Ala
2540 2545 2550
Ser Ser Ala Thr Ser Thr Asp Ala Ser Ser Ala Glu Glu Asp Glu
2555 2560 2565
Glu Gin Glu Asp Asp Asn Glu Gin Gly Gly Arg Lys Ile Leu Arg
2570 2575 2580
Arg Glu Arg Leu Ser Leu Gly Gin Glu Tyr Ser Trp Arg Gin Gin
2585 2590 2595
Gin Met Val Lys Asp His Thr Ile Phe Asn Asn Thr Ile Gly Met
2600 2605 2610
Phe Met Lys Gly Thr Ile Asp Leu Asp Arg Leu Arg Arg Ala Leu
2615 2620 2625
Lys Ala Ser Leu Arg Arg His Glu Ile Phe Arg Thr Cys Phe Val
2630 2635 2640
Thr Gly Asp Asp Tyr Ser Ser Asp Leu Asn Gly Pro Val Gin Val
2645
2650
2655
Val Leu 2660 Lys Asn Pro Glu Asn 2665 Arg Val His Phe Val 2670 Gin Val Asn
Asn Ala Ala Glu Ala Glu Glu Glu Tyr Arg Lys Leu Glu Lys Thr
2675 2680 2685
Asn Tyr Ser Ile Ser Thr Gly Asp Thr Leu Arg Leu Val Asp Phe
2690 2695 2700
Tyr Trp Gly Thr Asp Asp His Leu Leu Val Ile Gly Tyr His Arg
2705 2710 2715
Leu Val Gly Asp Gly Ser Thr Thr Glu Asn Leu Phe Asn Glu Ile
2720 2725 2730
Gly Gin Ile Tyr Ser Gly Val Lys Met Gin Arg Pro Ser Thr Gin
2735 2740 2745
Phe Ser Asp Leu Ala Val Gin Gin Arg Glu Asn Leu Glu Asn Gly
2750 2755 2760
Arg Met Gly Asp Asp Ile Ala Phe Trp Lys Ser Met His Ser Lys
2765 2770 2775
Val Ser Ser Ser Ala Pro Thr Val Leu Pro Ile Met Asn Leu Ile
2780 2785 2790
Asn Asp Pro Ala Ala Asn Ser Glu Gin Gin Gin Ile Gin Pro Phe
2795 2800 2805
Thr Trp Gin Gin Tyr Glu Ala Ile Ala Arg Leu Asp Pro Met Val
2810 2815 2820
Ala Phe Arg Ile Lys Glu Arg Ser Arg Lys His Lys Ala Thr Pro
2825 2830 2835
Met Gin Phe Tyr Leu Ala Ala Tyr His Val Leu Leu Ala Arg Leu
2840 2845 2850
Thr Gly Ser Lys Asp Ile Thr Ile Gly Leu Ala Glu Thr Asn Arg
2855 2860 2865
Ser Thr Met Glu Glu Ile Ser Ala Met Gly Phe Phe Ala Asn Val
2870 2875 2880
Leu Pro 2885 Leu Arg Phe Asp Glu 2890 Phe Val Gly Ser Lys 2895 Thr Phe Gly
Glu His Leu Val Ala Thr Lys Asp Ser Val Arg Glu Ala Met Gin
2900 2905 2910
His Ala Arg Val Pro Tyr Gly Val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925
Asn Leu Pro Thr Ser Gly Glu Glu Pro Lys Thr Gin Thr His Ala
2930 2935 2940
Pro Leu Phe Gin Ala Val Phe Asp Tyr Lys Gin Gly Gin Ala Glu
2945 2950 2955
Ser Gly Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser
2960 2965 2970
Arg Glu Arg Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp
2975 2980 2985
Pro Thr Lys Asp Pro Leu Ile His Val Lys Leu Gin Ser Ser Leu
2990 2995 3000
Tyr Gly Pro Glu His Ala Gin Ala Phe Val Asp His Phe Ser Ser
3005 3010 3015
Ile Leu Thr Met Phe Ser Met Asn Pro Ala Leu Lys Leu Ala
3020 3025 3030
<210> 45 <211> 7692 <212> DNA <213> Penicillium citrinum <220>
<221> CDS <222> (1)..(7692) <400> 45
atg aac aat acc Thr ccc Pro 5 gcc Ala gta Val acc gca acc Thr 10 gca Ala acc Thr gca Ala acc Thr gca Ala 15 acc Thr 48
Met Asn 1 Asn Thr Ala
gca acc gca atg gca ggc tcg gct tgc tet aac aca tcc acg ccc att 96
Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
20 25 30
gcc ata gtt gga atg gga tgt ega ttt gct gga gat gca acg agt cca 144
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45
cag aag ctt tgg gaa atg gtt gaa aga gga ggc agt gcc tgg tet aag 192
Gin Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60
gtc ccc tcc tcg ega ttc aat gtg aga gga gta tac cac ccg aat ggc 240
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly
65 70 75 80
gaa agg gtc ggg tcc acc cac gta aag ggt gga cac ttc atc gac gag 288
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95
gat cct gct tta ttt gac gcc gcg ttc ttc aac atg acc aca gag gtc 336
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110
gcc age tgc atg gat ccg cag tat cgg ctt atg ctt gag gtg gtc tac 384
Ala Ser Cys Met Asp Pro Gin Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125
gaa tcg ctg gag agt gcc ggt atc acc atc gat ggt atg gca ggc tet 432
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 140
aat acg tcg gtg ttt ggg ggt gtc atg tac cac gac tat cag gat tcg 480
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gin Asp Ser
145 150 155 160
ctc aat cgt gac ccc gag aca gtt ccg cgt tat ttc ata act ggc aac 528
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
tca gga aca atg ctt tcg aac cgg ata tca cac ttc tac gac tta cgt 576
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
180 185 190
ggt ccc age gtg acg gtt gac acg gcc tgt tcg acg aca ttg acc gca 624
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205
ctg cac ttg gcg tgc cag age tta cgt act ggg gag tca gat aca gcc 672
Leu His Leu Ala Cys Gin Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210 215 220
atc gtt atc ggt gca aat ctt ctg ctc aat ccc gat gtt ttt gtt acg 720
Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr
225 230 235 240
atg tca aac ctg gga ttt ttg tcc ccg gat ggt atc tcg tac tet ttt 768
Met Ser Asn Leu Gly 245 Phe Leu Ser Pro Asp 250 Gly Ile Ser Tyr Ser 255 Phe
gat cct ega gcg aat gga tat ggt ege ggg gaa gga att gcc gct ctg 816
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270
gta ata aag gcc ctc cct aac gcg ttg ega gac caa gac cct atc ega 864
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gin Asp Pro Ile Arg
275 280 285
gcc gtc att ega gag aca gcg ctg aac cag gat ggc aaa aca ccc gca 912
Ala Val Ile Arg Glu Thr Ala Leu Asn Gin Asp Gly Lys Thr Pro Ala
290 295 300
att act gcg ccg agt gat gtg gcg cag aaa agt ctg atc cag gag tgt 960
Ile Thr Ala Pro Ser Asp Val Ala Gin Lys Ser Leu Ile Gin Glu Cys
305 310 315 320
tac gat aag gct ggg cta gat atg tcg ttg acc tcg tac gtg gag gcc 1008
Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
325 330 335
cac gga act gga aca cca act ggt gac ccc ctt gaa atc tea gca att 1056
His cly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350
tea gca gct ttt aaa gga cat cct ctg cac ctt ggc tet gtg aaa gca 1104
Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365
aat att ggc cat aca gaa gcc gcc agt ggc ctg gcc agt ata atc aag 1152
Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380
gtg gcc ttg gcc ttg gag aag ggc ttg att ccc cct aat gcg cgg ttc 1200
Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe
385 390 395 400
ctg caa aag aac age aag ctg atg ctt gac caa aag aac atc aag atc 1248
Leu Gin Lys Asn Ser Lys Leu Met Leu Asp Gin Lys Asn Ile Lys Ile
405 410 415
ccc atg tet gct caa gac tgg cct gtg aaa gat ggg act cgt ege gca 1296
Pro Met Ser Ala Gin Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430
tet gtc aat aac ttc ggc ttt ggt ggt tcg aat gct cac gtc att ttg 1344
Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445
gaa tea tat gat ege gca tea ttg gcc ctg cca gag gat caa gtg cat 1392
Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gin Val His
450 455 460
gtc aat ggt aac tet gag cat ggt agg gtt gag gat ggt tcc aaa cag 1440
Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gin
465 470 475 480
age ege ata tac gtt gtg cgt gcc aag gac gag caa gct tgt cgg ega 1488
Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gin Ala Cys Arg Arg
• v
485 490 495
acg Thr ata Ile gca Ala age Ser 500 ctg Leu ega Arg gac tac Asp Tyr att Ile 505 aaa Lys tcc Ser gtc Val gct Ala gac Asp 510 att Ile gac Asp 1536
ggg gaa ccc ttc ctc gcc age ctc gcc tat aca cta ggc tet ege cgt 1584
Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525
tcc att ctg cca tgg acg tea gtg tat gta gca gac age ctt ggc ggc 1632
Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540
ctt gtt tet gcc ctc age gat gag tcc aat caa cca aaa ega gcg aat 1680
Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gin Pro Lys Arg Ala Asn
545 550 555 560
gag aaa gta cgg ctc gga ttt gta ttc acc ggt cag ggg gcg cag tgg 1728
Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gin Gly Ala Gin Trp
565 570 575
cat gca atg ggc aga gag ctg gtc aat aca ttc cca gta ttc aaa cag 1776
His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gin
580 585 590
gcg att ctt gaa tgt gat ggc tac atc aag caa ctg ggc gcg agt tgg 1824
Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gin Leu Gly Ala Ser Trp
595 600 605
aat ttt atg gag gag ctc cac cgt gat gag ctg acg act cgg gta aat 1872
Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620
gat gcc gaa tac agt cta cca ctg tea acc gct atc caa att gca ctt 1920
Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gin Ile Ala Leu
625 630 635 640
gtg cgt ctc ctt tgg tea tgg gga att cgg cca acg ggg ata acc agt 1968
Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655
cac tea agt gga gag gct gct gct gcc tac gca gct ggg gct tta tcc 2016
His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670
gcg cgg tcg gcc att ggg atc act tat ata ege ggt gta ttg acc act 2064
Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685
aag ccc aag ccc gca ttg gca gcc aaa gga gga atg atg gcg gtg ggt 2112
Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700
ctt ggt ege agt gag acc aat gtt tac att tcg cgt ctc aac cag gag 2160
Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gin Glu
705 710 715 720
gac ggc tgt gtg gtg gtt gga tgt atc aac agt caa tgt agt gtg acg 2208
Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gin Cys Ser Val Thr
725 730 735 • ·
gtg Val tcg Ser gga Gly gat Asp 740 ttg Leu ggt Gly gca Ala atc gag aaa ctt Leu gaa Glu aag ttg tta Leu cac His 2256
Ile Glu 745 Lys Lys Leu 750
gcc gat ggc atc ttt acc agg aaa ctg aaa gtc act gaa gcc ttc cat 2304
Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765
tea age cac atg ega cca atg gca gat gcc ttt ggg gcg tea ctg aga 2352
Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780
gat ctg ttc aac tcg gat aac aac aac gac aat ccc aat get gac acc 2400
Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr
785 790 795 800
tea aag ggt gta tta tat tea tea cct aag act ggt agt ege atg acc 2448
Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815
gat ctt aaa ttg cta ttg gat ccc aca cac tgg atg gat agt atg cta 2496
Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830
cag ccg gta gag ttc gag tcc tea ctc ege gag atg tgc ttt gat ccc 2544
Gin Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845
aac acc aaa gag aaa gcc gtc gat gtg att att gaa ata ggg cct cac 2592
Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850 855 860
gga gcg ctt ggt ggt cca atc aac caa gtc atg cag gat ctg ggt ctg 2640
Gly Ala Leu Gly Gly Pro Ile Asn Gin Val Met Gin Asp Leu Gly Leu
865 870 875 880
aaa gga aca gat ata aac tat ctc agt tgc ctt tet ege ggc aga age 2688
Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895
tcg ttg gag aca atg tat cgt get get acg gag ttg ata age aag ggt 2736
Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910
tat ggg ctc aaa atg gac get ata aac ttt cct cat gga aga aaa gag 2784
Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925
ccc aga gtg aag gta ctg age gat ttg ccg gcg tac ccg tgg aat cac 2832
Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940
caa acc cgt tat tgg aga gag cct ege ggc agt cgt gag tcc aaa cag 2880
Gin Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gin
945 950 955 960
aga acc cat ccg cct cac act ttg ata ggc tea cgg gaa tet ctc tet 2928
Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975
• ·
cct cat ttc gcg cct aaa tgg aaa cat gtt ctc cgt ctg tea gat att 2976
Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990
cca tgg ata ega gat cac gtc gtt ggt tcg agc atc atc ttt ccg gga 3024
Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro Gly
995 1000 1005
gct Ala ggc Gly 1010 ttc Phe atc Ile agc Ser atg Met gcc Ala 1015 atc Ile gag Glu ggg Gly ttt Phe tea Ser 1020 caa Gin gtc Val tgc Cys 3069
cca cca gtt gcg ggg gct agc atc aac tac aac ttg cgt gac gtt 3114
Pro Pro 1025 Val Ala Gly Ala Ser 1030 Ile Asn Tyr Asn Leu 1035 Arg Asp Val
gaa ctc gcg cag gct ctc ata ata CCC gct gat gca gaa gca gag 3159
Glu Leu 1040 Ala Gin Ala Leu Ile 1045 Ile Pro Ala Asp Ala 1050 Glu Ala Glu
gtt gac ctg ege cta acg atc cgt tea tgt gag gaa agg tcc ctc 3204
Val Asp 1055 Leu Arg Leu Thr Ile 1060 Arg Ser Cys Glu Glu 1065 Arg Ser Leu
ggc aca aag aac tgg cat caa ttt tet gtg cac tea att tcg ggc 3249
Gly Thr 1070 Lys Asn Trp His Gin 1075 Phe Ser Val His Ser 1080 Ile Ser Gly
gaa aat aat acc tgg aca gaa cac tgc acc gga tta ata cgt tcg 3294
Glu Asn 1085 Asn Thr Trp Thr Glu 1090 His Cys Thr Gly Leu 1095 Ile Arg Ser
gag agc gaa aga agc cac ctt gac tgt tea act gtg gaa gcc tea 3339
Glu Ser 1100 Glu Arg Ser His Leu 1105 Asp Cys Ser Thr Val 1110 Glu Ala Ser
ege agg ttg aat cta ggc tea gat aac cgg agc att gat CCC aac 3384
Arg Arg 1115 Leu Asn Leu Gly Ser 1120 Asp Asn Arg Ser Ile 1125 Asp Pro Asn
gat ctc tgg gag tcc tta cac gcg aat ggg ata tgc cac gga CCC 3429
Asp Leu 1130 Trp Glu Ser Leu His 1135 Ala Asn Gly Ile Cys 1140 His Gly Pro
att ttt cag aac att cag ega att caa aac aat gga cag ggc tcg 3474
Ile Phe 1145 Gin Asn Ile Gin Arg 1150 Ile Gin Asn Asn Gly 1155 Gin Gly Ser
ttt tgc aga ttt tcc att gct gac act gcc tcg gct atg cct cac 3519
Phe Cys 1160 Arg Phe Ser Ile Ala 1165 Asp Thr Ala Ser Ala 1170 Met Pro His
tcg tac gag aat ega cac atc gtc cat cct act act ctg gac tcg 3564
Ser Tyr 1175 Glu Asn Arg His Ile 1180 Val His Pro Thr Thr 1185 Leu Asp Ser
gtg atc cag gcg gca tac acg gtg tta CCC tac gcg gga aca cgt 3609
Val Ile 1190 Gin Ala Ala Tyr Thr 1195 Val Leu Pro Tyr Ala 1200 Gly Thr Arg
atg aaa acg gcc atg gta cca agg agg cta aga aat gtc aaa ata 3654
• · • · · · •· •· •· •· • · • · •· •· •· •· • »
Met Lys 1205 Thr Ala Met Val Pro 1210 Arg Arg Leu Arg Asn 1215 Val Lys Ile
tcc tet age ctg gct gac ttg gag gct ggt gat gct ctg gac gca 3699
Ser Ser 1220 Ser Leu Ala Asp Leu 1225 Glu Ala Gly Asp Ala 1230 Leu Asp Ala
cag gcc age atc aag gat ege aac tet caa tcc ttc tet acc gac 3744
Gin Ala 1235 Ser Ile Lys Asp Arg 1240 Asn Ser Gin Ser Phe 1245 Ser Thr Asp
ttg gca gtg ttt gat gac tat gat age ggt tet tet ccc tcg gac 3789
Leu Ala 1250 Val Phe Asp Asp Tyr 1255 Asp Ser Gly Ser Ser 1260 Pro Ser Asp
gga atc cca gtc ata gag att gaa ggc ctt gtt ttc cag tcg gtt 3834
Gly Ile 1265 Pro Val Ile Glu Ile 1270 Glu Gly Leu Val Phe 1275 Gin Ser Val
gga age age ttc tet gac caa aag tca gac tcc aac gac aca gaa 3879
Gly Ser 1280 Ser Phe Ser Asp Gin 1285 Lys Ser Asp Ser Asn 1290 Asp Thr Glu
aat gcc tgc age tcc tgg gtt tgg gcc cct gac atc age ttg ggt 3924
Asn Ala 1295 Cys Ser Ser Trp Val 1300 Trp Ala Pro Asp Ile 1305 Ser Leu Gly
gac tcc act tgg ctc aaa gaa aag ttg age act gag gct gag acg 3969
Asp Ser 1310 Thr Trp Leu Lys Glu 1315 Lys Leu Ser Thr Glu 1320 Ala Glu Thr
aaa gaa acg gaa ctc atg atg gac ctc ega aga tgc acg atc aac 4014
Lys Glu 1325 Thr Glu Leu Met Met 1330 Asp Leu Arg Arg Cys 1335 Thr Ile Asn
ttt ata cag gag gct gtc act gat ttg aca aat tet gat atc caa 4059
Phe Ile 1340 Gin Glu Ala Val Thr 1345 Asp Leu Thr Asn Ser 1350 Asp Ile Gin
cat ctg gat ggc cac ctt cag aag tat ttc gat tgg atg aat gtc 4104
His Leu 1355 Asp Gly His Leu Gin 1360 Lys Tyr Phe Asp Trp 1365 Met Asn Val
caa ttg gac ctt gcg aga caa aac aag ctc age cca gcc agt tgc 4149
Gin Leu 1370 Asp Leu Ala Arg Gin 1375 Asn Lys Leu Ser Pro 1380 Ala Ser Cys
gac tgg cta agt gac gat gct gag cag aag aaa tgc cta cag gcc 4194
Asp Trp 1385 Leu Ser Asp Asp Ala 1390 Glu Gin Lys Lys Cys 1395 Leu Gin Ala
aga gtc gct gga gaa age gtc aat ggc gag atg att tet cgt cta 4239
Arg Val 1400 Ala Gly Glu Ser Val 1405 Asn Gly Glu Met Ile 1410 Ser Arg Leu
gga cct cag tta ata gca atg cta ege ege gaa aca gag cca ctt 4284
Gly Pro 1415 Gin Leu Ile Ala Met 1420 Leu Arg Arg Glu Thr 1425 Glu Pro Leu
gag ttg atg atg caa gat cag ctg cta age aga tac tac gtc aac 4329
Glu Leu Met Met Gin Asp Gin Leu Leu Ser Arg Tyr Tyr Val Asn
• ·
1430 1435 1440
gca Ala atc Ile 1445 aaa tgg age ega Ser Arg tea Ser 1450 aac Asn gca Ala caa Gin gcc Ala age Ser 1455 gag ctg atc Ile 4374
Lys Trp Glu Leu
ega ctt tgc gcc cac aag aac ccg cgt tet ege att ttg gag att 4419
Arg Leu 1460 Cys Ala His Lys Asn 1465 Pro Arg Ser Arg Ile 1470 Leu Glu Ile
ggc gga ggc acg ggc ggc tgc aca aag ctt att gtc aat gca ttg 4464
Gly Gly 1475 Gly Thr Gly Gly Cys 1480 Thr Lys Leu Ile Val 1485 Asn Ala Leu
gga aac acc aag ccg atc gat cgt tat gac ttc acc gat gtg tet 4509
Gly Asn 1490 Thr Lys Pro Ile Asp 1495 Arg Tyr Asp Phe Thr 1500 Asp Val Ser
gcc ggg ttt ttc gag tcg gcg cgt gag caa ttt gcg gat tgg caa 4554
Ala Gly 1505 Phe Phe Glu Ser Ala 1510 Arg Glu Gin Phe Ala 1515 Asp Trp Gin
gac gtg atg act ttc aaa aaa ttg gat att gaa age gat ccc gag 4599
Asp Val 1520 Met Thr Phe Lys Lys 1525 Leu Asp Ile Glu Ser 1530 Asp Pro Glu
caa caa ggg ttt gaa tgt gcc acc tac gat gtg gtc gtg get tgc 4644
Gin Gin 1535 Gly Phe Glu Cys Ala 1540 Thr Tyr Asp Val Val 1545 Val Ala Cys
cag gtc ctg cat gca act ega tgc atg aaa ega aca ctg agt aac 4689
Gin Val 1550 Leu His Ala Thr Arg 1555 Cys Met Lys Arg Thr 1560 Leu Ser Asn
gtt ega aaa ttg ctc aag cct ggg ggc aac ttg att ttg gtt gag 4734
Val Arg 1565 Lys Leu Leu Lys Pro 1570 Gly Gly Asn Leu Ile 1575 Leu Val Glu
act acc agg gat cag ctc gat ttg ttc ttt acc ttc gga ctg ttg 4779
Thr Thr 1580 Arg Asp Gin Leu Asp 1585 Leu Phe Phe Thr Phe 1590 Gly Leu Leu
cca ggt tgg tgg ctc agt gag gag cct gag cgg aag tcg acg cca 4824
Pro Gly 1595 Trp Trp Leu Ser Glu 1600 Glu Pro Glu Arg Lys 1605 Ser Thr Pro
tcg ctc act acc gat ctt tgg aac acc atg ttg gac acg age ggt 4869
Ser Leu 1610 Thr Thr Asp Leu Trp 1615 Asn Thr Met Leu Asp 1620 Thr Ser Gly
ttc aac ggt gtg gaa ttg gag gtt cgt gat tgt gaa gac gat gag 4914
Phe Asn 1625 Gly Val Glu Leu Glu 1630 Val Arg Asp Cys Glu 1635 Asp Asp Glu
ttt tac atg atc age aca atg cta tcg acg get aga aaa gag aat 4959
Phe Tyr 1640 Met Ile Ser Thr Met 1645 Leu Ser Thr Ala Arg 1650 Lys Glu Asn
aca acc ccg gat aca gtg gca gaa tcg gag gtg ctt ttg ctg cac 5004
Thr Thr 1655 Pro Asp Thr Val Ala 1660 Glu Ser Glu Val Leu 1665 Leu Leu His
• · • ·
gga Gly gcg Ala 1670 ctc Leu ega Arg cct Pro cct Pro tea Ser 1675 tet Ser tgg Trp ctg Leu gaa Glu agt Ser 1680 ctc Leu cag Gin gca Ala 5049
gca att tgt gaa aag acc agt tet agc cca tcg atc aac gct ctg 5094
Ala Ile 1685 Cys Glu Lys Thr Ser 1690 Ser Ser Pro Ser Ile 1695 Asn Ala Leu
ggc gag gta gat acc act gga agg aca tgc att ttt ctt ggg gaa 5139
Gly Glu 1700 Val Asp Thr Thr Gly 1705 Arg Thr Cys Ile Phe 1710 Leu Gly Glu
atg gag tcc tcg ctc ctt gga gag gtg gga agc gag acc ttc aaa 5184
Met Glu 1715 Ser Ser Leu Leu Gly 1720 Glu Val Gly Ser Glu 1725 Thr Phe Lys
tcc atc acc gcg atg ctg aat aac tgc aac gca ctt ctc tgg gtg 5229
Ser Ile 1730 Thr Ala Met Leu Asn 1735 Asn Cys Asn Ala Leu 1740 Leu Trp Val
tet aga gga gca gcc atg agc tcc gag gat cca tgg aaa gct cta 5274
Ser Arg 1745 Gly Ala Ala Met Ser 1750 Ser Glu Asp Pro Trp 1755 Lys Ala Leu
cat att ggt ctg ctg cgt acc atc cgc aac gaa aat aac ggg aag 5319
His Ile 1760 Gly Leu Leu Arg Thr 1765 Ile Arg Asn Glu Asn 1770 Asn Gly Lys
gaa tat gta tcg ttg gat ctc gat cct tet ega aac gca tac acc 5364
Glu Tyr 1775 Val Ser Leu Asp Leu 1780 Asp Pro Ser Arg Asn 1785 Ala Tyr Thr
cac gag tcc ctg tat gct atc tgc aat atc ttc aat ggc cgc ctc 5409
His Glu 1790 Ser Leu Tyr Ala Ile 1795 Cys Asn Ile Phe Asn 1800 Gly Arg Leu
ggc gac ctt tcc gaa gac aag gag ttt gaa ttt gca gag aga aac 5454
Gly Asp 1805 Leu Ser Glu Asp Lys 1810 Glu Phe Glu Phe Ala 1815 Glu Arg Asn
ggc gtc atc cac gta ccg ega ctt ttc aat gac ccg cac tgg aag 5499
Gly Val 1820 Ile His Val Pro Arg 1825 Leu Phe Asn Asp Pro 1830 His Trp Lys
gac caa gaa gcg gtt gag gtc aca ctg cag ccg ttc gag caa ccc 5544
Asp Gin 1835 Glu Ala Val Glu Val 1840 Thr Leu Gin Pro Phe 1845 Glu Gin Pro
ggg cgt cgt ctg cgg atg gag gtt gag acg cca ggg ctc tta gac 5589
Gly Arg 1850 Arg Leu Arg Met Glu 1855 Val Glu Thr Pro Gly 1860 Leu Leu Asp
tcc ctg caa ttt ega gac gac gaa gga cgt gaa ggc aag gat ctt 5634
Ser Leu 1865 Gin Phe Arg Asp Asp 1870 Glu Gly Arg Glu Gly 1875 Lys Asp Leu
ccg gat gat tgg gta gaa atc gaa ccc aaa gct ttc ggt ctc aat 5679
Pro Asp 1880 Asp Trp Val Glu Ile 1885 Glu Pro Lys Ala Phe 1890 Gly Leu Asn
ttt Phe cgg Arg 1895 gat Asp gtc Val atg Met gtt Val gcc Ala 1900 atg Met ggt Gly caa Gin ttg Leu gag Glu 1905 gcc aac cgt Arg 5724
Ala Asn
gtg atg ggc ttc gaa tgc gcc gga gtg atc aca aag ctc ggt gga 5769
Val Met Gly Phe Glu Cys Ala Gly Val Ile Thr Lys Leu Gly Gly
1910 1915 1920
gct gct gcc gct age caa ggc ctc aga tta ggg gac ege gta tgt 5814
Ala Ala Ala Ala Ser Gin Gly Leu Arg Leu Gly Asp Arg Val Cys
1925 1930 1935
gca cta ctg aaa ggc cat tgg gcg acc aga aca cag acg ccg tac 5859
Ala Leu Leu Lys Gly His Trp Ala Thr Arg Thr Gin Thr Pro Tyr
1940 1945 1950
act aat gtc gtc cgt att ccg gac gaa atg ggc ttc cca gaa gcc 5904
Thr Asn Val Val Arg Ile Pro Asp Glu Met Gly Phe Pro Glu Ala
1955 1960 1965
gct tcg gtc ccc ctg gct ttc act acc gca tat att gcg ctt tat 5949
Ala Ser Val Pro Leu Ala Phe Thr Thr Ala Tyr Ile Ala Leu Tyr
1970 1975 1980
acc acg gca aag cta ega ega ggc gaa aga gtc ttg atc cac agt 5994
Thr Thr Ala Lys Leu Arg Arg Gly Glu Arg Val Leu Ile His Ser
1985 1990 1995
gga gct gga ggc gtc ggt caa gca gcg atc att ttg tcc cag ctt 6039
Gly Ala Gly Gly Val Gly Gin Ala Ala Ile Ile Leu Ser Gin Leu
2000 2005 2010
gcg ggt gcc gag gtc ttc gtc aca gcg gga act caa gcc aag cgt 6084
Ala Gly Ala Glu Val Phe Val Thr Ala Gly Thr Gin Ala Lys Arg
2015 2020 2025
gac ttt gtc ggc gat aaa ttc ggc atc aat ccg gat cat atc ttc 6129
Asp Phe Val Gly Asp Lys Phe Gly Ile Asn Pro Asp His Ile Phe
2030 2035 2040
tcg age agg aat gac tta ttc gtc gac ggc atc aaa gcc tac acg 6174
Ser Ser Arg Asn Asp Leu Phe Val Asp Gly Ile Lys Ala Tyr Thr
2045 2050 2055
ggc gga ctt ggc gtt cat gtc gtt cta aac tea ttg gca ggt caa 6219
Gly Gly Leu Gly Val His Val Val Leu Asn Ser Leu Ala Gly Gin
2060 2065 2070
ctc ctc caa gca age ttt gac tgc atg gcc gaa ttc ggc aga ttt 6264
Leu Leu Gin Ala Ser Phe Asp Cys Met Ala Glu Phe Gly Arg Phe
2075 2080 2085
gtt gag att gga aaa aag gac ctg gag caa aac age aga ctt gac 6309
Val Glu Ile Gly Lys Lys Asp Leu Glu Gin Asn Ser Arg Leu Asp
2090 2095 2100
atg ctg cca ttc acc cgg gac gtc tet ttc aca tea att gat ctt 6354
Met Leu Pro Phe Thr Arg Asp Val Ser Phe Thr Ser Ile Asp Leu
2105 2110 2115
ctc tcg tgg caa aga gcc aaa agt gaa gaa gta tcc gaa gcg ttg 6399
• ·
Lep Ser 2120 Trp Gin Arg Ala Lys 2125 Ser Glu Glu Val Ser 2130 Glu Ala Leu
aac cat gtc aca aaa ctc ctc gag aca aaa gcg att ggc ttg att 6444
Asn His Val Thr Lys Leu Leu Glu Thr Lys Ala Ile Gly Leu Ile
2135 2140 2145
ggt cca atc cag cag cac tcc ttg tea aac atc gag aag gcc ttc 6489
Gly Pro Ile Gin Gin His Ser Leu Ser Asn Ile Glu Lys Ala Phe
2150 2155 2160
cgt acg atg cag agt ggt cag cat gtt ggc aaa gtt gtg gtc aat 6534
Arg Thr Met Gin Ser Gly Gin His Val Gly Lys Val Val Val Asn
2165 2170 2175
gta tet ggg gac gaa ctg gtc cca gtc ggc gat gga ggg ttc tcg 6579
Val Ser Gly Asp Glu Leu Val Pro Val Gly Asp Gly Gly Phe Ser
2180 2185 2190
ctg aag ctg aag cct gac agt tet tac cta gtt gct ggt ggg ctg 6624
Leu Lys Leu Lys Pro Asp Ser Ser Tyr Leu Val Ala Gly Gly Leu
2195 2200 2205
ggg gga att gga aag cag atc tgt cag tgg ctt gtt gat cat ggc 6669
Gly Gly Ile Gly Lys Gin Ile Cys Gin Trp Leu Val Asp His Gly
2210 2215 2220
gcg aag cac ttg att atc cta tcg aga agt gca aag gcc agt cca 6714
Ala Lys His Leu Ile Ile Leu Ser Arg Ser Ala Lys Ala Ser Pro
2225 2230 2235
ttc ata acc age ttg caa aat caa cag tgc gct gtc tat cta cac 6759
Phe Ile Thr Ser Leu Gin Asn Gin Gin Cys Ala Val Tyr Leu His
2240 2245 2250
gca tgt gac atc tea gat caa gat cag gtc acc aag gtg ctc cgg 6804
Ala Cys Asp Ile Ser Asp Gin Asp Gin Val Thr Lys Val Leu Arg
2255 2260 2265
ttg tgc gaa gaa gca cat gca ccg cca att ega ggt atc ata caa 6849
Leu Cys Glu Glu Ala His Ala Pro Pro Ile Arg Gly Ile Ile Gin
2270 2275 2280
ggt gcc atg gtt ctc aag gac gcg ctt cta tcg ega atg aca ttg 6894
Gly Ala Met Val Leu Lys Asp Ala Leu Leu Ser Arg Met Thr Leu
2285 2290 2295
gat gaa ttt aat gca gca aca cgc cca aaa gta cag ggt agt tgg 6939
Asp Glu Phe Asn Ala Ala Thr Arg Pro Lys Val Gin Gly Ser Trp
2300 2305 2310
tat ctt cac aag atc gca cag gat gtt gac ttc ttc gtg atg ctc 6984
Tyr Leu His Lys Ile Ala Gin Asp Val Asp Phe Phe Val Met Leu
2315 2320 2325
tea tcc ctt gtt ggg gtc atg ggt ggg gca ggc cag gcc aat tac 7029
Ser Ser Leu Val Gly Val Met Gly Gly Ala Gly Gin Ala Asn Tyr
2330 2335 2340
gca gct gct ggt gca ttc cag gac gca ctt gcg cac cac cgg aga 7074
Ala Ala Ala Gly Ala Phe Gin Asp Ala Leu Ala His His Arg Arg
• ·
2345 2350 2355
gcc Ala cat His 2360 ggc atg ccg get Ala gtc Val 2365 acc Thr att Ile gac ttg Asp Leu ggc Gly 2370 atg Met gtc Val aag Lys 7119
Gly Met Pro
tet gtt gga tac gtg get gaa act ggc cgt ggt gtg gcc gac cgg 7164
Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly Val Ala Asp Arg
2375 2380 2385
ctc get aga ata ggt tac aag cct atg cat gaa aag gac gtc atg 7209
Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys Asp Val Met
2390 2395 2400
gat gtg ttg gag aag gca atc ctg tgt tet tcc cct caa ttt cca 7254
Asp Val Leu Glu Lys Ala Ile Leu Cys Ser Ser Pro Gin Phe Pro
2405 2410 2415
tea cct CCC gca get gtg gtt aca gga atc aac aca tcc ccg ggt 7299
Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro Gly
2420 2425 2430
get cac tgg acc gag gca aac tgg ata cag gaa cag cgg ttt gtg 7344
Ala His Trp Thr Glu Ala Asn Trp Ile Gin Glu Gin Arg Phe Val
2435 2440 2445
gga ctt aaa tac ege caa gtc ctt cat gca gac caa tcc ttt gtc 7389
Gly Leu Lys Tyr Arg Gin Val Leu His Ala Asp Gin Ser Phe Val
2450 2455 2460
tet tcg cat aaa aaa gga cca gat ggc gtg cgg gcc caa cta age 7434
Ser Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gin Leu Ser
2465 2470 2475
agg gtc acc tet cac gac gag gcc att tet atc gtc ctc aaa gca 7479
Arg Val Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala
2480 2485 2490
atg acg gaa aag ctg atg ega atg ttt ggt ctg gca gaa gac gac 7524
Met Thr Glu Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp
2495 2500 2505
atg tcc tcg tcc aaa aac ctg gca ggt gtc ggc gta gac tea ctc 7569
Met Ser Ser Ser Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu
2510 2515 2520
gtc gcc att gaa ctt ega aac tgg atc aca tet gaa atc cat gtt 7614
Val Ala Ile Glu Leu Arg Asn Trp Ile Thr Ser Glu Ile His Val
2525 2530 2535
gat gtg tcg atc ttt gag ctc atg aat ggt aac acc atc gcc ggc 7659
Asp Val Ser Ile Phe Glu Leu Met Asn Gly Asn Thr Ile Ala Gly
2540 2545 2550
ctc gtc gag tta gtt gtg gcg aaa tgc agt taa 7692
Leu Val Glu Leu Val Val Ala Lys Cys Ser
2555 2560
<210> 46
100
<2J1> 2563 <212> PRT <213> Penicillium citrinum <400> 46
Met 1 Asn Asn Thr Pro 5 Ala Val Thr Ala Thr 10 Ala Thr Ala Thr Ala 15 Thr
Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
20 25 30
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45
Gin Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly
65 70 75 80
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110
Ala Ser Cys Met Asp Pro Gin Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 140
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gin Asp Ser
145 150 155 160
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
180 185 190
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205
101
Leu His Leu Ala Cys Gin Ser 215 Leu Arg Thr Gly Glu 220 Ser Asp Thr Ala
210
Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr
225 230 235 240
Met Ser Asn Leu Gly 245 Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
250 255
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gin Asp Pro Ile Arg
275 280 285
Ala Val Ile Arg Glu Thr Ala Leu Asn Gin Asp Gly Lys Thr Pro Ala
290 295 300
Ile Thr Ala Pro Ser Asp Val Ala Gin Lys Ser Leu Ile Gin Glu Cys
305 310 315 320
Tyr Asp Lys Ala Gly 325 Leu Asp Met Ser Leu Thr Ser 330 Tyr Val Glu 335 Ala
His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350
Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365
Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380
Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe
385 390 395 400
Leu Gin Lys Asn Ser Lys Leu Met Leu Asp Gin Lys Asn Ile Lys Ile
405 410 415
Pro Met Ser Ala Gin Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430
Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445
102 • ·
Glu Ser Tyr Asp Arg Ala
450
Ser Leu Ala Leu Pro Glu Asp Gin Val His
455 460
Val Asn 465 Gly Asn Ser Glu His 470 Gly Arg Val Glu 475 Asp Gly Ser Lys Gin 480
Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gin Ala Cys Arg Arg
485 490 495
Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510
Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525
Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540
Leu Val 545 Ser Ala Leu Ser Asp Glu Ser Asn Gin Pro Lys Arg Ala Asn 560
550 555
Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Glri Gly Ala Gin Trp
565 570 575
His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gin
580 585 590
Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gin Leu Gly Ala Ser Trp
595 600 605
Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620
Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gin Ile Ala Leu
625 630 635 640
Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655
His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670
Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685
Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
103
690
695
700
Leu 705 Gly Arg Ser Glu Thr 710 Asn Val Tyr Ile Ser Arg Leu 715 Asn Gin Glu 720
Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gin Cys Ser Val Thr
725 730 735
Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750
Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765
Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780
Asp 785 Leu Phe Asn Ser Asp 790 Asn Asn Asn Asp Asn 795 Pro Asn Ala Asp Thr 800
Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815
Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830
Gin Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845
Asn Thr Lys Glu Lys Ala Val Asp Val 855 Ile Ile Glu 860 Ile Gly Pro His
850
Gly Ala Leu Gly Gly Pro Ile Asn Gin Val Met Gin Asp Leu Gly Leu
865 870 875 880
Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895
Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910
Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925
Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940
104
Gin Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gin
945 950 955 960
Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975
Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990
Pro Trp
Ile Arg Asp His
995
Val Val Gly Ser Ser Ile Ile
1000 1005
Phe Pro Gly
Ala Gly 1010 Phe Ile Ser Met Ala 1015 Ile Glu Gly Phe Ser 1020 Gin Val Cys
Pro Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu Arg Asp Val
1025 1030 1035
Glu Leu Ala Gin Ala Leu Ile Ile Pro Ala Asp Ala Glu Ala Glu
1040 1045 1050
Val Asp Leu Arg Leu Thr Ile Arg Ser Cys Glu Glu Arg Ser Leu
1055 1060 1065
Gly Thr Lys Asn Trp His Gin Phe Ser Val His Ser Ile Ser Gly
1070 1075 1080
Glu Asn Asn Thr Trp Thr Glu His Cys Thr Gly Leu Ile Arg Ser
1085 1090 1095
Glu Ser 1100 Glu Arg Ser His Leu 1105 Asp Cys Ser Thr Val 1110 Glu Ala Ser
Arg Arg Leu Asn Leu Gly Ser Asp Asn Arg Ser Ile Asp Pro Asn
1115 1120 1125
Asp Leu Trp Glu Ser Leu His Ala Asn Gly Ile Cys His Gly Pro
1130 1135 1140
Ile Phe Gin Asn Ile Gin Arg Ile Gin Asn Asn Gly Gin Gly Ser
1145 1150 1155
Phe Cys Arg Phe Ser 1160
Ile Ala Asp Thr Ala 1165
Ser Ala Met Pro His
1170
105
Ser Tyr 1175 Glu Asn Arg His Ile 1180 Val His Pro Thr Thr 1185 Leu Asp Ser
Val Ile Gin Ala Ala Tyr Thr Val Leu Pro Tyr Ala Gly Thr Arg
1190 1195 1200
Met Lys Thr Ala Met Val Pro Arg Arg Leu Arg Asn Val Lys Ile
1205 1210 1215
Ser Ser Ser Leu Ala Asp Leu Glu Ala Gly Asp Ala Leu Asp Ala
1220 1225 1230
Gin Ala Ser Ile Lys Asp Arg 1240 Asn Ser Gin Ser Phe 1245 Ser Thr Asp
1235
Leu Ala Val Phe Asp Asp Tyr Asp Ser Gly Ser Ser Pro Ser Asp
1250 1255 1260
Gly Ile 1265 Pro Val Ile Glu Ile 1270 Glu Gly Leu Val Phe 1275 Gin Ser Val
Gly Ser 1280 Ser Phe Ser Asp Gin 1285 Lys Ser Asp Ser Asn 1290 Asp Thr Glu
Asn Ala 1295 Cys Ser Ser Trp Val 1300 Trp Ala Pro Asp Ile 1305 Ser Leu Gly
Asp Ser 1310 Thr Trp Leu Lys Glu 1315 Lys Leu Ser Thr Glu 1320 Ala Glu Thr
Lys Glu Thr Glu Leu Met Met Asp Leu Arg Arg Cys Thr Ile Asn
1325 1330 1335
Phe Ile Gin Glu Ala Val Thr Asp Leu Thr Asn Ser Asp Ile Gin
1340 1345 1350
His Leu Asp Gly His Leu Gin Lys Tyr Phe Asp Trp Met Asn Val
1355 1360 1365
Gin Leu Asp Leu Ala Arg Gin Asn Lys Leu Ser Pro Ala Ser Cys
1370 1375 1380
Asp Trp Leu
1385
Ser Asp Asp Ala
1390
Glu Gin
Lys
Lys Cys Leu Gin Ala
1395
106
Arg Val Ala Gly Glu Ser Val 1405 Asn Gly Glu Met Ile 1410 Ser Arg Leu
1400
Gly Pro Gin Leu Ile Ala Met Leu Arg Arg Glu Thr Glu Pro Leu
1415 1420 1425
Glu Leu Met Met Gin Asp Gin Leu Leu Ser Arg Tyr Tyr Val Asn
1430 1435 1440
Ala Ile Lys Trp Ser Arg Ser Asn Ala Gin Ala Ser Glu Leu Ile
1445 1450 1455
Arg Leu Cys Ala His Lys Asn Pro Arg Ser Arg Ile Leu Glu Ile
1460 1465 1470
Gly Gly Gly Thr Gly Gly Cys 1480 Thr Lys Leu Ile Val 1485 Asn Ala Leu
1475
Gly Asn Thr Lys Pro Ile Asp Arg Tyr Asp Phe Thr Asp Val Ser
1490 1495 1500
Ala Gly Phe Phé Glu Ser Ala Arg Glu Gin Phe Ala Asp Trp Gin
1505 1510 1515
Asp Val Met Thr Phe Lys Lys Leu Asp Ile Glu Ser Asp Pro Glu
1520 1525 1530
Gin Gin Gly Phe Glu Cys Ala Thr Tyr Asp Val Val Val Ala Cys
1535 1540 1545
Gin Val Leu His Ala Thr Arg Cys Met Lys Arg Thr Leu Ser Asn
1550 1555 1560
Val Arg Lys Leu Leu Lys Pro Gly Gly Asn Leu Ile Leu Val Glu
1565 1570 1575
Thr Thr Arg Asp Gin Leu Asp Leu Phe Phe Thr Phe Gly Leu Leu
1580 1585 1590
Pro Gly Trp Trp Leu Ser Glu Glu Pro Glu Arg Lys Ser Thr Pro
1595 1600 1605
Ser Leu Thr Thr Asp Leu Trp Asn Thr Met Leu Asp Thr Ser Gly
1610 1615 1620
Phe Asn Gly Val Glu Leu Glu Val Arg Asp Cys Glu Asp Asp Glu
107
1625
1630
1635
Phe Tyr Met Ile Ser Thr Met 1645 Leu Ser Thr Ala Arg 1650 Lys Glu Asn
1640
Thr Thr Pro Asp Thr Val Ala Glu Ser Glu Val Leu Leu Leu His
1655 1660 1665
Gly Ala Leu Arg Pro Pro Ser Ser Trp Leu Glu Ser Leu Gin Ala
1670 1675 1680
Ala Ile Cys Glu Lys Thr Ser Ser Ser Pro Ser Ile Asn Ala Leu
1685 1690 1695
Gly Glu
1700
Val Asp Thr Thr Gly Arg Thr Cys
1705
Ile
Phe Leu Gly Glu 1710
Met Glu 1715 Ser Ser Leu Leu Gly 1720 Glu Val Gly Ser Glu 1725 Thr Phe Lys
Ser Ile Thr Ala Met Leu Asn Asn Cys Asn Ala Leu Leu Trp Val
1730 1735 1740
Ser Arg Gly Ala Ala Met Ser Ser Glu Asp Pro Trp Lys Ala Leu
1745 1750 1755
His Ile Gly Leu Leu Arg Thr Ile Arg Asn Glu Asn Asn Gly Lys
1760 1765 1770
Glu Tyr Val Ser Leu Asp Leu Asp Pro Ser Arg Asn Ala Tyr Thr
1775 1780 1785
His Glu 1790 Ser Leu Tyr Ala Ile 1795 Cys Asn Ile Phe Asn 1800 Gly Arg Leu
Gly Asp Leu Ser Glu Asp Lys Glu Phe Glu Phe Ala Glu Arg Asn
1805 1810 1815
Gly Val Ile His Val Pro Arg Leu Phe Asn Asp Pro His Trp Lys
1820 1825 1830
Asp Gin Glu Ala Val Glu Val Thr Leu Gin Pro Phe Glu Gin Pro
1835 1840 1845
Gly Arg Arg
1850
Leu Arg Met
Glu Val Glu Thr
1855
Pro Gly Leu Leu Asp
1860
108
Ser Leu Gin Phe Arg Asp Asp Glu Gly Arg Glu Gly
1865 1870 1875
Lys Asp Leu
Pro Asp Asp Trp Val Glu Ile 1885 Glu Pro Lys Ala Phe 1890 Gly Leu Asn
1880
Phe Arg Asp Val Met Val Ala Met Gly Gin Leu Glu Ala Asn Arg
1895 1900 1905
Val Met Gly Phe Glu Cys Ala Gly Val Ile Thr Lys Leu Gly Gly
1910 1915 1920
Ala Ala Ala Ala Ser Gin Gly Leu Arg Leu Gly Asp Arg Val Cys
1925 1930 1935
Ala Leu 1940 Leu Lys Gly His Trp 1945 Ala Thr Arg Thr Gin 1950 Thr Pro Tyr
Thr Asn Val Val Arg Ile Pro Asp Glu Met Gly Phe Pro Glu Ala
1955 1960 1965
Ala Ser Val Pro Leu Ala Phe Thr Thr Ala Tyr Ile Ala Leu Tyr
1970 1975 1980
Thr Thr Ala Lys Leu Arg Arg Gly Glu Arg Val Leu Ile His Ser
1985 1990 1995
Gly Ala Gly Gly Val Gly Gin Ala Ala Ile Ile Leu Ser Gin Leu
2000 2005 2010
Ala Gly 2015 Ala Glu Val Phe Val 2020 Thr Ala Gly Thr Gin 2025 Ala Lys Arg
Asp Phe Val Gly Asp Lys Phe Gly Ile Asn Pro Asp His Ile Phe
2030 2035 2040
Ser Ser Arg Asn Asp Leu Phe Val Asp Gly Ile Lys Ala Tyr Thr
2045 2050 2055
Gly Gly Leu Gly Val His Val Val Leu Asn Ser Leu Ala Gly Gin
2060 2065 2070
Leu Leu Gin Ala Ser Phe Asp Cys Met Ala Glu Phe Gly Arg Phe
2075 2080 2085
109
Val Glu
2090
Ile Gly Lys Lys Asp Leu Glu Gin Asn 2095 • ·
Ser Arg
2100
Leu Asp
Met Leu 2105 Pro Phe Thr Arg Asp 2110 Val Ser Phe Thr Ser 2115 Ile Asp Leu
Leu Ser Trp Gin Arg Ala Lys Ser Glu Glu Val Ser Glu Ala Leu
2120 2125 2130
Asn His Val Thr Lys Leu Leu Glu Thr Lys Ala Ile Gly Leu Ile
2135 2140 2145
Gly Pro Ile Gin Gin His Ser Leu Ser Asn Ile Glu Lys Ala Phe
2150 2155 2160
Arg Thr Met Gin Ser Gly Gin His Val Gly Lys Val Val Val Asn
2165 2170 2175
Val Ser Gly Asp Glu Leu Val 2185 Pro Val Gly Asp Gly 2190 Gly Phe Ser
2180
Leu Lys Leu Lys Pro Asp Ser Ser Tyr Leu Val Ala Gly Gly Leu
2195 2200 2205
Gly Gly Ile Gly Lys Gin Ile Cys Gin Trp Leu Val Asp His Gly
2210 2215 2220
Ala Lys His Leu Ile Ile Leu Ser Arg Ser Ala Lys Ala Ser Pro
2225 2230 2235
Phe Ile Thr Ser Leu Gin Asn Gin Gin Cys Ala Val Tyr Leu His
2240 2245 2250
Ala Cys Asp Ile Ser Asp Gin Asp Gin Val Thr Lys Val Leu Arg
2255 2260 2265
Leu Cys Glu Glu Ala His Ala Pro Pro Ile Arg Gly Ile Ile Gin
2270 2275 2280
Gly Ala Met Val Leu Lys Asp Ala Leu Leu Ser Arg Met Thr Leu
2285 2290 2295
Asp Glu Phe Asn Ala Ala Thr Arg Pro Lys Val Gin Gly Ser Trp
2300 2305 2310
110
Tyr Leu 2315 His Lys Ile Ala Gin 2320 Asp Val Asp Phe Phe 2325 Val Met Leu
Ser Ser 2330 Leu Val Gly Val Met 2335 Gly Gly Ala Gly Gin 2340 Ala Asn Tyr
Ala Ala Ala Gly Ala Phe Gin 2350 Asp Ala Leu Ala His 2355 His Arg Arg
2345
Ala His Gly Met Pro Ala Val Thr Ile Asp Leu Gly Met Val Lys
2360 2365 2370
Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly Val Ala Asp Arg
2375 2380 2385
Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys Asp Val Met
2390 2395 2400
Asp Val 2405 Leu Glu Lys Ala Ile 2410 Leu Cys Ser Ser Pro 2415 Gin Phe Pro
Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro Gly
2420 2425 2430
Ala His Trp Thr Glu Ala Asn Trp Ile Gin Glu Gin Arg Phe Val
2435 2440 2445
Gly Leu Lys Tyr Arg Gin Val Leu His Ala Asp Gin Ser Phe Val
2450 2455 2460
Ser Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gin Leu Ser
2465 2470 2475
Arg Val Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala
2480 2485 2490
Met Thr Glu Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp
2495 2500 2505
Met Ser Ser Ser Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu
2510 2515 2520
Val Ala Ile Glu Leu Arg Asn Trp Ile Thr Ser Glu Ile His Val
2525 2530 2535
Asp Val Ser Ile Phe Glu Leu Met Asn Gly Asn Thr Ile Ala Gly
111
2540
2545
2550
Leu Val Glu Leu Val Val Ala Lys Cys Ser 2555 2560
<210> 47
<211> 1557
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1557)
<400> 47 cag Gin gtt Val 5 ctt Leu ctg Leu acc Thr gtc Val gaa Glu 10 tcg Ser tac Tyr caa Gin tgg Trp gta Val 15 tcg Ser 48
atg Met 1 ctc ggc Leu Gly
acc cct caa gcc ctt gtg gcg gtc gca gtg ctt ctt agt ctc atc gcc 96
Thr Pro Gin Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30
tac cgt ttg cgg ggg cgc cag tcc gaa ctg caa gtc tat aat ccc aaa 144
Tyr Arg Leu Arg Gly Arg Gin Ser Glu Leu Gin Val Tyr Asn Pro Lys
35 40 45
aaa tgg tgg gag ttg acg acc atg agg get agg cag gac ttc gat acg 192
Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gin Asp Phe Asp Thr
50 55 60
tat ggt ccg age tgg atc gaa get tgg ttc tcg aaa aac gac aag ccc 240
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
65 70 75 80
ctg cgc ttc att gtt gat tcc ggc tat tgc acc atc ctc cca tcg tcc 288
Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
85 90 95
atg gcc gac gag ttt cgg aaa atc aaa gat atg tgc atg tac aag ttt 336
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110
ttg gcg gat gac ttt cac tet cat ctc cct gga ttc gac ggg ttc aag 384
Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
115 120 125
gaa atc tgc cag gat gca cat ctt gtc aac aaa gtt gtt ttg aac cag 4 32
Glu Ile Cys Gin Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gin
130 135 140
112
tta Leu 145 caa Gin acc caa Thr Gin gcc ccc aag Lys tac Tyr aca aag cca ttg gct Ala acc ttg gcc 480
Ala Pro 150 Thr Lys Pro 155 Leu Thr Leu Ala 160
gac gct act att gcc aag ttg ttc ggt aaa age gag gag tgg caa acc 528
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gin Thr
165 170 175
gca cct gtc tat tcc aat gga ttg gac ctt gtc aca ega aca gtc aca 576
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190
ctc att atg gtc ggc gac aaa atc tgc cac aat gag gag tgg ctg gat 624
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205
att gca aag aac cat gcc gtg agt gtg gcg gta caa gct cgc caa ctt 672
Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gin Ala Arg Gin Leu
210 215 220
cgc gta tgg ccc atg cta ctg ega ccg ctc gct cac tgg ttt caa ccg 720
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gin Pro
225 230 235 240
caa gga cgc aaa ttg cgt gac caa gtg cgc cgc gca ega aag atc att 768
Gin Gly Arg Lys Leu Arg Asp Gin Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
gat cct gag att cag ega ega cgt gct gaa aag gcc gca tgt gta gcg 816
Asp Pro Glu Ile Gin Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270
aag ggc gtg cag ccg ccc cag tac gtc gat acc atg caa tgg ttt gaa 864
Lys Gly Val Gin Pro Pro Gin Tyr Val Asp Thr Met Gin Trp Phe Glu
275 280 285
gac acc gcc gac ggc cgc tgg tac gat gtg gcg ggt gct cag ctc gct 912
Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gin Leu Ala
290 295 300
atg gat ttc gcc ggc atc tac gcc tcg acg gat ctt ttc gtc ggt gcc 960
Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala
305 310 315 320
ctt gtg gac att gcc agg cac cca gac ctt att cag cct ctc cgc caa 1008
Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gin Pro Leu Arg Gin
325 330 335
gag atc cgc act gta atc gga gaa ggg ggc tgg acg cct gcc tet ctg 1056
Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
340 345 350
ttc aag ctg aag ctc ctc gac age tgc atg aaa gag acg cag ega atc 1104
Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gin Arg Ile
355 360 365
aag ccg gtc gag tgc gcc act atg cgc agt acc gct ctc aga gac atc 1152
Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380
113
act Thr 385 cta Leu tcc aat ggc Gly ctc Leu 390 ttc Phe att Ile ccc Pro aag ggc gag ttg gcc get Ala gtg Val 400 1200
Ser Asn Lys Gly 395 Glu Leu Ala
get gca gac ege atg aac aac cct gat gtg tgg gaa aac ccc gaa aat 1248
Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415
tat gat ccc tac ega ttt atg ege atg ege gag gat cca gac aag gcc 1296
Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430
ttc acc get caa ttg gag aat acc aac ggt gat cac atc ggc ttc ggc 1344
Phe Thr Ala Gin Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445
tgg aac cca ege get tgt ccc ggg cgg ttc ttc gcc tcg aag gaa atc 1392
Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460
aag att ctc ctc get cat ata ctg att cag tat gat gtg aag cct gta 1440
Lys Ile Leu Leu Ala His Ile Leu Ile Gin Tyr Asp Val Lys Pro Val
465 470 475 480
cca gga gac gat gac aaa tac tac cgt cac get ttt age gtt cgt atg 1488
Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 495
cat cca acc aca aag ctc atg gta ege cgg ege aac gag gac atc ccg 1536
His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510
ctc cct cat gac cgg tgc taa 1557
Leu Pro His Asp Arg Cys
515
<210> 48
<211> 518
<212> PRT
<213> Penicillium citrinum
<400> 48
Met 1 Leu Gly Gin Val 5 Leu Leu Thr Val Glu Ser Tyr Gin Trp Val Ser
10 15
Thr Pro Gin Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30
Tyr Arg Leu Arg Gly Arg Gin Ser Glu Leu Gin Val Tyr Asn Pro Lys
35 40 45
114
Lys Trp 50 Trp Glu Leu Thr Thr Met Arg Ala Arg Gin Asp Phe Asp Thr
55 60
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
65 70 75 80
Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
85 90 95
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110
Leu Ala Asp Asp Phe His 115 Ser His Leu Pro Gly Phe Asp Gly Phe Lys
120 125
Glu Ile Cys Gin Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gin
130 135 140
Leu Gin Thr Gin Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala
145 150 155 160
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gin Thr
165 170 175
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205
Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gin Ala Arg Gin Leu
210 215 220
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gin Pro
225 230 235 240
Gin Gly Arg Lys Leu Arg Asp Gin Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
Asp Pro Glu Ile Gin Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270
Lys Gly Val Gin Pro Pro Gin Tyr Val Asp Thr Met Gin Trp Phe Glu
275 280 285
Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gin Leu Ala
115 • ·
290
295
300
Met 305 Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala 320
310 315
Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gin Pro Leu Arg Gin
325 330 335
Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
340 345 350
Phe Lys Leu 355 Lys Leu Leu Asp Ser Cys Met 360 Lys Glu Thr Gin 365 Arg Ile
Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380
Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val
385 390 395 400
Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415
Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430
Phe Thr Ala Gin Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445
Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460
Lys Ile Leu Leu Ala His Ile Leu Ile Gin Tyr Asp Val Lys Pro Val
465 470 475 480
Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 4 95
His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510
Leu Pro
His Asp Arg Cys
515 <210> 49
116 • · • · • · · ·
<211> 3522 <212> DNA <213> Penicillium citrinum
<220>
<221> CDS
<222> (1)·.(3522)
<400> 49 tcg Ser ttg Leu 5 cta Leu ccc Pro tet Ser ege Arg ttt Phe 10 ege Arg ggt Gly agg Arg gaa Glu tea Ser 15 atg Met 48
atg Met 1 gtc get Val Ala
aat cag cag cac cct cta ege tcg gga aat cgg gca ttg acc tcc aca 96
Asn Gin Gin His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
20 25 30
ctc caa ttt cta tcc aaa acg gcg tgt cta cac ccg atc cat acc gtt 144
Leu Gin Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
35 40 45
tgc acc ata get att cta get agt acc aca tac gtt gga cta ctc aaa 192
Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60
gac age ttc ttc cat ggc ccc gca aac gtt gat aaa gca gaa tgg ggc 240
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
65 70 75 80
tet ttg gtc gaa gga agt ega age ttg atc acc ggc cca cag aat ggc 288
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gin Asn Gly
85 90 95
tgg aag tgg cag age ttc gac ggg gat gca gat gtt ctc gga gat ttc 336
Trp Lys Trp Gin Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110
aac cat caa gca cta atg acc ttg gta ttc ccg ggg tea tat ggg gtt 384
Asn His Gin Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125
gca tet caa gca gcc tea cca ttc ctt get ccc ctc cct gtg aac cta 432
Ala Ser Gin Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 140
tet gtg att gac ctt ccc tea acg tcg age cct tta acc gcc tat tcg 480
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
aaa gat aaa gtt ttc gcc ttc tet gtg gaa tac age age gcg ccg gaa 528
Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175
117
ctc Leu gtg gct gct Ala 180 gtt Val caa Gin gaa Glu atc Ile ccc aac aac agt gcc gac Ala Asp 190 ctg Leu aaa Lys 576
Val Ala Pro 185 Asn Asn Ser
ttg cag gag acg caa ttg atc gag atg gaa cgc cag atg tgg atc atg 624
Leu Gin Glu Thr Gin Leu Ile Glu Met Glu Arg Gin Met Trp Ile Met
195 200 205
aag gct gcc agg gct cac aca aaa cgc agc ctt gct caa tgg gtg cac 672
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gin Trp Val His
210 215 220
gat acc tgg aca gag tet ctt gat ctt atc aag agc gct caa acg ctc 720
Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gin Thr Leu
225 230 235 240
gac gtg gtt gtc atg gtg cta ggt tat ata tea atg cac ttg act ttc 768
Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255
gtc tea ctc ttc ctc agc atg aaa aaa ttg gga tcg aag gtt tgg ctg 816
Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
260 265 270
gct aca agc gtc ctt ttg tcg tea aca ttt gcc ttt ctc ctc ggt ctc 864
Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
275 280 285
gac gtg gcc ata aga cta ggg gtt ccg atg agc atg agg ttg cta tcc 912
Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290 295 300
gaa ggc ctc ccc ttc ttg gtg gtg atc gtt ggc ttt gag aag agc atc 960
Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile
305 310 315 320
act ctg acc agg gct gtt ttg tcc tat gct gtg cag cac ega aag ccc 1008
Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gin His Arg Lys Pro
325 330 335
cag aag ata cag tet gac cag ggt agc gtg aca gcc att gct gaa agt 1056
Gin Lys Ile Gin Ser Asp Gin Gly Ser Val Thr Ala Ile Ala Glu Ser
340 345 350
acc atc aat tac gcc gta ega agc gcc att cgg gag aag ggt tac aat 1104
Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
355 360 365
atc gtg tgc cac tac gtg gtc gag atc ctg ctc cta gtt atc ggt gct 1152
Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370 375 380
gtc tta ggc atc caa ggt ggg cta cag cac ttc tgt gtt cta gct gca 1200
Val Leu Gly Ile Gin Gly Gly Leu Gin His Phe Cys Val Leu Ala Ala
385 390 395 400
ttg atc ctg ttc ttt gac tgt ctg ctg ctg ttt aca ttc tac act gcg 1248
Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
405 410 415
att ctg tet atc aag ctc gag gta aac cgc ctc aaa cgt cat atc aac 1296
118 • ·
Ile Leu Ser Ile Lys 420 Leu Glu Val Asn Arg 425 Leu Lys Arg His 430 Ile Asn
atg cgg tac gcg ttg gaa gat gag ggt ctc agt cag cgg acg gcg gag 1344
Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gin Arg Thr Ala Glu
435 440 445
agt gtc gcg acc age aat gat gcc caa gac agt gca cgt aca tat ctg 1392
Ser Val Ala Thr Ser Asn Asp Ala Gin Asp Ser Ala Arg Thr Tyr Leu
450 455 460
ttt ggc aat gat atg aaa ggc age agt gtt ccg aag ttc aaa ttc tgg 1440
Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp
465 470 475 480
atg gtc gtt ggt ttc ctt atc gtc aac ctc gtc aac atc ggc tcc acc 1488
Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 4 95
ctt ttc caa gcc tet tet agt gga tcg ttg tcc agt ata tea tet tgg 1536
Leu Phe Gin Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510
acc gaa agt ctg age gga tcg gcc att aaa ccc ccg ctt gag ccc ttc 1584
Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
515 520 525
aag gta get gga agt gga cta gat gaa cta ctt ttc cag gca aga ggg 1632
Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gin Ala Arg Gly
530 535 540
cgc ggt caa tcg act atg gtc act gtc ctc gcc ccc atc aag tac gaa 1680
Arg Gly Gin Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu
545 550 555 560
cta gag tat cct tcc att cac cgt ggt acc tcg cag cta cac gag tat 1728
Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gin Leu His Glu Tyr
565 570 575
gga gtt ggt gga aaa atg gtc ggt age ctg ctc acc age ctg gaa gat 1776
Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590
ccc gtc ctc tcc aaa tgg gtg ttt gtg gca ctt gcc cta agt gtc get 1824
Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605
ctg aac age tat ctg ttc aag gcc gcc aga ctg gga atc aaa gat cct 1872
Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620
aat ctc ccg agt cac cca gtt gat cca gtt gag ctt gac cag gcc gaa 1920
Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gin Ala Glu
625 630 635 640
age ttc aac get gcc cag aac cag acc cct cag att caa tea agt ctc 1968
Ser Phe Asn Ala Ala Gin Asn Gin Thr Pro Gin Ile Gin Ser Ser Leu
645 650 655
caa get cct cag acc aga gtg ttc act cct acc acc acc gac agt gac 2016
Gin Ala Pro Gin Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
119
660
665
670
agt Ser gat Asp gcc Ala 675 tea Ser tta gtc Leu Val tta Leu att Ile 680 aaa Lys gca tet cta Leu aag Lys 685 gtc Val act Thr aag Lys 2064
Ala Ser
ega gca gaa gga aag aca gcc act agt gaa ctt ccc gtg tet cgc aca 2112
Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700
caa atc gaa ctg gac aat ttg ctg aag cag aac aca atc age gag ttg 2160
Gin Ile Glu Leu Asp Asn Leu Leu Lys Gin Asn Thr Ile Ser Glu Leu
705 710 715 720
aac gat gag gat gtc gtt gcc ttg tet ttg cgg gga aag gtt ccc ggg 2208
Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735
tat gcc cta gag aag agt ctc aaa gac tgc act cgt gcc gtc aag gtt 2256
Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750
cgc cgc tet atc att tcg agg aca ccg gct acc gca gag ctt aca agt 2304
Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765
atg ctg gag cac tcg aag ctg ccg tac gaa aac tac gcc tgg gaa cgc 2352
Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780
gtg ctc ggt gca tgt tgc gag aac gtt att ggc tat atg cca gtc cct 2400
Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro
785 790 795 800
gtt ggc gtc gcc ggt cct att gtt atc gac ggc aag agt tat ttc att 2448
Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815
cct atg gca acc acc gag ggc gtc ctc gtc gct agt gct age cgt ggc 2496
Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
820 825 830
agt aag gca atc aac ctc ggt ggc ggt gcc gtg aca gtc ctg act ggc 2544
Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
835 840 845
gac ggt atg aca ega ggc ccg tgt gtg aag ttt gat gtc ctt gaa ega 2592
Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850 855 860
gct ggt gct gct aag atc tgg ctc gat tcg gac gtc ggc cag acc gta 2640
Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gin Thr Val
865 870 875 880
atg aaa gaa gcc ttc aat tea acc age aga ttt gcg cgc tta caa agt 2688
Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gin Ser
885 890 8 95
atg cgg aca act atc gcc ggt act cac tta tat att ega ttt aag act 2736
Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
900 905 910
120
act Thr act Thr ggc gac gct Ala atg gga atg aat Met Asn 920 atg att tet Ser aag ggc gtg gag 2784
Gly 915 Asp Met Gly Met Ile Lys 925 Gly Val Glu
cat gca ctg aat gtt atg gcg aca gag gca ggt ttc age gat atg aat 2832
His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930 935 940
att att acc cta tca gga aat tac tgt acg gat aag aaa cct tca gct 2880
Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala
945 950 955 960
ttg aat tgg atc gat gga cgg ggc aag ggc att gtg gcc gaa gcc atc 2928
Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
965 970 975
ata ccg gcg aac gtt gtc agg gat gtc tta aag age gat gtg gat age 2976
Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
980 985 990
atg gtt cag ctc aac ata tcg aaa aat ctg att ggg [ tcc : gct atg gct 3024
Met Val Gin Leu Asn Ile Ser Lys Asn . Leu Ile Gly Ser Ala Met Ala
995 1000 1005
ggc tca gtt Val ggc Gly ggc Gly ttc Phe aac Asn 1015 gcc Ala caa gct Gin Ala gcc Ala aat Asn 1020 ctt Leu gcg Ala gca Ala 3069
Gly Ser 1010
gcc att ttc att gcc aca ggt cag gat ccg gcg caa gtt gtg gag 3114
Ala Ile Phe Ile Ala Thr Gly Gin Asp Pro Ala Gin Val Val Glu
1025 1030 1035
age gct aac tgc atc act ctc atg aac aat ctt ege gga tcg ctt 3159
Ser Ala Asn Cys Ile Thr Leu Met Asn Asn Leu Arg Gly Ser Leu
1040 1045 1050
caa atc tet gtc tcc atg ccg tet att gag gtt gga acg ttg ggc 3204
Gin Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Leu Gly
1055 1060 1065
ggt ggt acg att ctg gag ccc cag ggc gca atg ctt gac atg ctt 3249
Gly Gly Thr Ile Leu Glu Pro Gin Gly Ala Met Leu Asp Met Leu
1070 1075 1080
ggt gtc ege gga tca cac ccg acc act ccc ggt gag aat gca cgt 3294
Gly Val Arg Gly Ser His Pro Thr Thr Pro Gly Glu Asn Ala Arg
1085 1090 1095
caa ctt gcg ege atc atc gga age gct gtt ttg gct ggg gag ctc 3339
Gin Leu Ala Arg Ile Ile Gly Ser Ala Val Leu Ala Gly Glu Leu
1100 1105 1110
tcg cta tgt gct gcc cta gcc gcc ggt cac ctg gtc aag gcg cac 3384
Ser Leu Cys Ala Ala Leu Ala Ala Gly His Leu Val Lys Ala His
1115 1120 1125
atg gcg cac aac cgt tet gcc ccg gca tet tca gcc cct tet ega 3429
Met Ala His Asn Arg Ser Ala Pro Ala Ser Ser Ala Pro Ser Arg
1130 1135 1140
121 • ·
agt gtc tcc ccg tea ggc gga acc agg aca gtc cct gtt cct aac 3474
Ser Val Ser Pro Ser Gly Gly Thr Arg Thr Val Pro Val Pro Asn
1145 1150 1155 aat gca ctg agg ccg agt get gca get act gat cgg get ega ege 3519
Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr Asp Arg Ala Arg Arg
1160 1165 1170
tga 3522
<210> 50
<211> 1173
<212> PRT
<213> Penicillium citrinum
<400>
Met
Val
Ala
Ser
Leu
Leu
Pro
Ser
Arg
Phe
Arg
Gly
Arg
Glu
Ser
Met
Asn
Gin
Gin
His
Pro
Leu
Arg
Ser
Gly
Asn
Arg
Ala
Leu
Thr
Ser
Thr
Leu Gin Phe Leu 35 Ser Lys Thr Ala 40 Cys Leu His Pro Ile 45 His Thr Val
Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
65 70 75 80
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gin Asn Gly
85 90 95
Trp Lys Trp Gin Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110
Asn His Gin Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125
Ala Ser Gin Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 140
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
122
Lys Asp Lys Val Phe Ala 165 Phe Ser Val Glu 170 Tyr Ser Ser Ala Pro 175 Glu
Leu Val Ala Ala Val Gin Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
180 185 190
Leu Gin Glu Thr Gin Leu Ile Glu Met Glu Arg Gin Met Trp Ile Met
195 200 205
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gin Trp Val His
210 215 220
Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gin Thr Leu
225 230 235 240
Asp Val Val Val Met 245 Val Leu Gly
Val Ser Leu Phe 260 Leu Ser Met Lys
Ala Thr Ser 275 Val Leu Leu Ser Ser 280
Asp Val 290 Ala Ile Arg Leu Gly 295 Val
Glu 305 Gly Leu Pro Phe Leu 310 Val Val
Tyr Ile 250 Ser Met His Leu Thr 255 Phe
Lys 265 Leu Gly Ser Lys Val 270 Trp Leu
Thr Phe Ala Phe Leu 285 Leu Gly Leu
Pro Met Ser Met 300 Arg Leu Leu Ser
Ile Val Gly 315 Phe Glu Lys Ser Ile 320
Thr Leu Thr Arg Ala 325 Val Leu Ser
Gin Lys Ile Gin 340 Ser Asp Gin Gly
Thr Ile Asn 355 Tyr Ala Val Arg Ser 360
Ile Val 370 Cys His Tyr Val Val 375 Glu
Val 385 Leu Gly Ile Gin Gly 390 Gly Leu
Tyr Ala 330 Val Gin His Arg Lys 335 Pro
Ser 345 Val Thr Ala Ile Ala 350 Glu Ser
Ala Ile Arg Glu Lys 365 Gly Tyr Asn
Ile Leu Leu Leu 380 Val Ile Gly Ala
Gin His Phe 395 Cys Val Leu Ala Ala 400
123 • ·
Leu Ile Leu Phe Phe 405 Asp Cys Leu Leu Leu 410 Phe Thr Phe Tyr Thr 415 Ala
Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
420 425 430
Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gin Arg Thr Ala Glu
435 440 445
Ser Val Ala Thr Ser Asn Asp Ala Gin Asp Ser Ala Arg Thr Tyr Leu
450 455 460
Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp
465 470 475 480
Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 495
Leu Phe Gin Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510
Thr Glu Ser Leu 515 Ser Gly Ser Ala 520 Ile Lys Pro Pro Leu Glu 525 Pro Phe
Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gin Ala Arg Gly
530 535 540
Arg Gly Gin Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu
545 550 555 560
Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gin Leu His Glu Tyr
565 570 575
Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590
Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605
Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620
Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gin Ala Glu
625 630 635 640
124
Ser Phe Asn Ala Ala 645 Gin Asn Gin Thr Pro Gin 650 Ile Gin Ser Ser 655 Leu
Gin Ala Pro Gin Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
660 665 670
Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
675 680 685
Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700
Gin Ile Glu Leu Asp Asn Leu Leu Lys Gin Asn Thr Ile Ser Glu Leu
705 710 715 720
Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735
Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750
Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 7 60 765
Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780
Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro
785 790 795 800
Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815
Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
820 825 830
Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
835 840 845
Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850 855 860
Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gin Thr Val
865 870 875 880
Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gin Ser
125
» 885 890 895
Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
900 905 910
Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
915 920 925
His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930 935 940
Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala
945 950 955 960
Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
965 970 975
Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
980 985 990
Met Val Gin Leu Asn Ile Ser Lys Asn i Leu i Ile Gly Ser Ala Met Ala
995 1000 1005
Gly Ser 1010 Val Gly Gly Phe Asn 1015 Ala Gin Ala Ala Asn 1020 Leu Ala Ala
Ala Ile Phe Ile Ala Thr Gly Gin Asp Pro Ala Gin Val Val Glu
1025 1030 1035
Ser Ala Asn Cys Ile Thr Leu Met Asn Asn Leu Arg Gly Ser Leu
1040 1045 1050
Gin Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Leu Gly
1055 1060 1065
Gly Gly Thr Ile Leu Glu Pro Gin Gly Ala Met Leu Asp Met Leu
1070 1075 1080
Gly Val Arg Gly Ser His Pro Thr Thr Pro Gly Glu Asn Ala Arg
1085 1090 1095
Gin Leu Ala Arg Ile Ile Gly Ser Ala Val Leu Ala Gly Glu Leu
1100 1105 1110
Ser Leu Cys Ala Ala Leu Ala Ala Gly His Leu Val Lys Ala His
1115 1120 1125
126 • ·
Met Ala 1130 His Asn Arg Ser Ala 1135 Pro Ala Ser Ser Ala 1140 Pro Ser Arg
Ser Val Ser Pro Ser Gly Gly Thr Arg Thr Val Pro Val Pro Asn
1145 1150 1155
Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr Asp Arg Ala Arg Arg
1160 1165 1170
<210> 51
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 51 gcaagctctg ctaccagcac
<210> 52
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 52 ctaggccaac ttcagagccg
<210> 53
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 53
agtcatgcag gatctgggtc <210> 54 <211> 20
127 <212> DNA <213> Penicillium citrinum <400>54 gcagacacat cggtgaagtc <210>55 <211> 20 <212> DNA <213> Penicillium citrinum <400>55 aaaccgcacc tgtctattcc
<210> 56
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 56 ctttgtggtt ggatgcatac 20
<210> 57
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 57 cgctctatca tttcgaggac 20
<210> 58
<211> 20
<212> DNA
<213> Penicillium citrinum
128
<400> 58 tcaatagacg gcatggagac
<210> 59
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 59 atgtcagaac ctctaccccc 20
<210> 60
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 60 tcaagcatca gtctcaggca 20
<210> 61
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 61 atgtccctgc cgcatgcaac 20
<210> 62
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 62
ctaagcaata ttgtgtttct

Claims (41)

1. Polynukleotid vybraný ze skupiny obsahující:
(a) polynukleotid kódující protein mající aminokyselinovou sekvenci SEKV. ID. Č. 38 nebo varianta tohoto polynukleotidu kódující modifikovanou aminokyselinovou sekvenci obsahující alespoň jednu deleci, adici, substituci nebo alteraci, kdy zmíněná varianta polynukleotidu je vhodná pro urychlení biosyntézy ML-236B; a (b) polynukleotid kódující protein mající aminokyselinovou sekvenci SEKV. ID. Č. 42 nebo varianta tohoto polynukleotidu kódující modifikovanou aminokyselinu obsahující alespoň jednu deleci, substituci nebo alteraci a zmíněná varianta polynukleotidu je vhodná pro urychlení biosyntézy ML-236B.
2. Polynukleotid podle nároku 1 obsahující SEKV. ID. Č. 37 nebo její mutantu či variantu vhodnou pro urychlení biosyntézy ML-236B.
3. Polynukleotid podle nároku 1 nebo 2 obsahující SEKV. ID. Č. 37.
4. Polynukleotid podle kteréhokoli nároku 1 až 3 obsahující DNA, kterou lze získat z Escherichia coli transformované pSAKexpE SANK 72499; FERM BP-7005.
5. Polynukleotid podle nároku 1 obsahující SEKV. ID. Č. 41 nebo obsahující její variantu vhodnou pro urychlení biosyntézy ML-236B.
6. Polynukleotid podle nároku 1 nebo 5, obsahující SEKV. ID. Č. 41.
7. Polynukleotid podle nároku 1, 5 nebo 6 obsahující DNA, kterou lze získat z Escherichia coli transformované pSAKexpE SANK 72599; FERM BP-7006.
, ΛΛ · · · · * ·· · ”
Λ#Μ :::: ::.., : : ·:
ti I * · · · · ·· *
8. Polynukleotid podle kteréhokoli předcházejícího nároku ve funkční kombinaci s jedním nebo více polynukleotidy, kdy řečená kombinace je vhodná pro zesílení produkce ML-236B v mikroorganismu produkujícím ML-236B.
9. Polynukleotid podle nároku 8 obsahující polynukleotid sekvence SEKV. ID. C. 37 nebo její varianty mající podobnou funkci v kombinaci s jednou nebo více sekvencemi vybranými z SEKV. ID. Č. 37,41,43,45,47 nebo 49, nebo jejich variant majících podobnou funkci.
10. Polynukleotid podle nároku 8 obsahující polynukleotid SEKV. ID. Č. 41 nebo jeho variantu mající podobnou funkci v kombinaci s jednou nebo více sekvencemi vybranými ze sekvencí SEKV. ID. Č. 37,41,43,45,47 nebo 49, nebo jejich variant majících podobnou funkci.
11. Polynukleotid schopný za striktních podmínek hybridizovat s polynukleotidem podle kteréhokoli předchozího nároku.
12. Polynukleotid podle nároku 11, který, je-li vnesen do mikroorganismu produkujícího ML-236B, je vhodný pro urychlení biosyntézy ML-236B v mikroorganismu produkujícím ML-236B.
13. Polynukleotid podle nároku 11 nebo 12, který je RNA.
14. Vektor obsahující polynukleotid podle kteréhokoli předchozího nároku.
15. Vektor podle nároku 14, který lze získat z Escherichia coli pSAKexpE SANK 72499; FERM BP-7005 nebo Escherichia coli pSAKexpR SANK 72599; FERM BP-7006.
16. Vektor podle nároku 14 nebo 15, který je expresní vektor.
17. Hostitelská buňka transformovaná vektorem podle kteréhokoli nároku 14 nebo 16.
18. Hostitelská buňka podle nároku 17 charakterizovaná tím, že je mikroorganismem produkujícím ML-236B.
19. Hostitelská buňka podle nároku 18 charakterizovaná tím, zeje Penicillium citrinum.
20. Hostitelská buňka podle nároku 17 charakterizovaná tím, zeje Escherichia coli.
21. Hostitelská buňka podle nároku 20 charakterizovaná tím, že je Escherichia coli transformovaná vektorem pSAKexpE SANK 72499; FERM BP-7005.
22. Hostitelská buňka podle nároku 20 charakterizovaná tím, že je Escherichia coli. transformovaná vektorem pSAKexpR SANK 72599; FERM BP-7006.
23. Polypeptid kódovaný polynukleotidem podle kteréhokoli nároku 1 až 13.
24. Polypeptid obsahující sekvenci SEKV. ID. Č. 38 nebo její variantu, mající alespoň 80% identitu se SEKV. ID. Č. 38, který je schopen urychlovat produkci ML-236B v mikroorganismu produkujícím ML-236B.
25. Polypeptid podle nároku 24, mající sekvenci SEKV. ID. Č. 38.
26. Polypeptid obsahující sekvenci SEKV. ID. Č. 42 nebo její variantu mající alespoň 80% identitu se sekvencí SEKV. ID. Č. 42 a schopnost urychlit produkci ML-236B v mikroorganismu produkujícím ML-236B.
27. Polypeptid podle nároku 26, mající sekvenci SEKV. ID. Č. 42.
28. Způsob přípravy ML-236B, vyznačující se tím, že obsahuje kultivaci hostitelské buňky podle kteréhokoli nároku 17 až 19 a následné získání ML-236B z kultury.
29. Způsob podle nároku 28, v y z n a č u j í c í se t í m, že hostitelská buňka je transformována vektorem obsahujícím SEKV. ID. Č. 37 nebo SEKV. ID. Č. 41.
30. Způsob podle nároku 29, vyznačující se tím, že vektor neobsahuje další geny.
• · ·
31. Způsob podle kteréhokoli nároku 28 až 30, v y z n a č u j í c í se t í m, že produkce probíhá v nepřítomnosti rekombinantu mlcA, B, C nebo D odpovídajících SEKV. ID. Č. 44, 46, 48 nebo 50.
32. ML-236B produkovaný způsobem přípravy podle kteréhokoli nároku 28 až 31.
33. Způsob přípravy pravastatinu, vyznačující se tím, že zahrnuje způsoby přípravy podle kteréhokoli nároku 28 až 31 a přeměnu ML-236B na pravastatin.
34. Protilátka reagující s proteinem majícím sekvenci SEKV. ID. Č. 38 nebo SEKV. ID. Č. 42.
35. Polynukleotid kódující protein mající aminokyselinovou sekvenci vybranou ze sekvencí SEKV. ID. Č. 44,46,48 nebo 50, nebo varianta tohoto polynukleotidu kódující modifikaci uvedené aminokyselinové sekvence obsahující deleci, substituci, adici nebo alteraci, kdy je uvedená varianta vhodná pro užití ke zrychlení biosyntézy ML-236B.
36. Polynukleotid podle nároku 35 vybraný ze skupiny sestávající ze sekvencí SEKV. ID. Č. 43, 45, 47 nebo 49.
37. Polynukleotid podle nároku 35 nebo 36, kdy je řečený polynukleotid schopný urychlit biosyntézu ML-236B sám, nebo ve spojení s polynukleotidem o sekvenci SEKV. ID. Č. 37 nebo SEKV. ID. Č. 41.
38. Vektor obsahující polynukleotid podle kteréhokoli nároku 35 až 37.
39. Hostitelská buňka obsahující vektor podle nároku 38.
40. Polypeptid kódovaný polynukleotidem podle kteréhokoli nároku 35 až 37.
41. Způsob přípravy ML-236B, vyznačující se t í m, že obsahuje kultivaci hostitelské buňky podle nároku 39 a následné získání ML-236B z kultury.
CZ20011367A 2000-04-18 2001-04-17 Polynukleotid, vektor, hostitelská buňka, polypeptid, protilátka a způsob přípravy ML-236B CZ20011367A3 (cs)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000116591 2000-04-18
JP2000117458 2000-04-19

Publications (1)

Publication Number Publication Date
CZ20011367A3 true CZ20011367A3 (cs) 2001-12-12

Family

ID=26590305

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ20011367A CZ20011367A3 (cs) 2000-04-18 2001-04-17 Polynukleotid, vektor, hostitelská buňka, polypeptid, protilátka a způsob přípravy ML-236B

Country Status (24)

Country Link
US (3) US7056710B2 (cs)
EP (1) EP1149919B1 (cs)
KR (1) KR100632174B1 (cs)
CN (1) CN1325959B (cs)
AR (1) AR034550A1 (cs)
AT (1) ATE373101T1 (cs)
AU (1) AU783319B2 (cs)
BR (1) BR0101518A (cs)
CA (1) CA2342397C (cs)
CY (1) CY1106985T1 (cs)
CZ (1) CZ20011367A3 (cs)
DE (1) DE60130394T2 (cs)
DK (1) DK1149919T3 (cs)
ES (1) ES2293966T3 (cs)
HK (1) HK1037683A1 (cs)
HU (1) HUP0101569A3 (cs)
IL (1) IL142619A (cs)
MX (1) MXPA01003913A (cs)
NO (1) NO328653B1 (cs)
NZ (1) NZ511166A (cs)
PL (1) PL202457B1 (cs)
PT (1) PT1149919E (cs)
RU (1) RU2236463C2 (cs)
TW (1) TWI312807B (cs)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2029750T3 (da) * 2006-06-22 2011-10-17 Dsm Ip Assets Bv Fremstilling af pravastatin
CN102171328A (zh) * 2008-09-24 2011-08-31 帝斯曼知识产权资产管理有限公司 经改进的斯达汀生产
WO2010069914A1 (en) * 2008-12-19 2010-06-24 Dsm Ip Assets B.V. Statin transcription regulators
US20170088589A1 (en) * 2014-04-23 2017-03-30 Danmarks Tekniske Universitet Statin resistance and export

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS572240A (en) 1980-06-06 1982-01-07 Sankyo Co Ltd Ml-236b derivative
US5179013A (en) 1987-02-02 1993-01-12 Sankyo Company, Limited Cytochrome P-450 enzymes
JPH09504436A (ja) 1993-11-02 1997-05-06 メルク エンド カンパニー インコーポレーテッド トリオールポリケチドシンターゼをコードするdna
KR100186758B1 (ko) * 1996-08-09 1999-04-01 영진약품공업 주식회사 프라바스타틴(pravastatin)전구체의제조방법
US6391583B1 (en) 1998-12-18 2002-05-21 Wisconsin Alumni Research Foundation Method of producing antihypercholesterolemic agents
AU6475800A (en) 1999-08-11 2001-03-13 Sankyo Company Limited Ml-236b biosynthesis-associated dna
FR2801648B1 (fr) * 1999-11-30 2002-06-21 Commissariat Energie Atomique Injecteur a vapeur haute pression comportant un drain axial

Also Published As

Publication number Publication date
DE60130394T2 (de) 2008-06-19
EP1149919A3 (en) 2002-02-06
NO328653B1 (no) 2010-04-19
NO20011890L (no) 2001-10-19
US20070111293A1 (en) 2007-05-17
RU2236463C2 (ru) 2004-09-20
US20030078395A1 (en) 2003-04-24
PL202457B1 (pl) 2009-06-30
HUP0101569A2 (hu) 2002-05-29
IL142619A (en) 2008-03-20
HK1037683A1 (en) 2002-02-15
BR0101518A (pt) 2001-11-13
PL347118A1 (en) 2001-10-22
DK1149919T3 (da) 2007-12-03
US7056710B2 (en) 2006-06-06
NZ511166A (en) 2002-11-26
AU783319B2 (en) 2005-10-13
CY1106985T1 (el) 2012-09-26
CN1325959A (zh) 2001-12-12
PT1149919E (pt) 2007-12-17
DE60130394D1 (de) 2007-10-25
HUP0101569A3 (en) 2005-01-28
HU0101569D0 (en) 2001-06-28
TWI312807B (en) 2009-08-01
NO20011890D0 (no) 2001-04-17
AR034550A1 (es) 2004-03-03
CA2342397C (en) 2011-08-23
KR20010098713A (ko) 2001-11-08
ES2293966T3 (es) 2008-04-01
CN1325959B (zh) 2010-05-05
ATE373101T1 (de) 2007-09-15
KR100632174B1 (ko) 2006-10-11
AU3709201A (en) 2001-10-25
EP1149919B1 (en) 2007-09-12
MXPA01003913A (es) 2003-08-20
US20050214909A1 (en) 2005-09-29
EP1149919A2 (en) 2001-10-31
CA2342397A1 (en) 2001-10-18

Similar Documents

Publication Publication Date Title
CN113684169B (zh) 聚(3-羟基丁酸-4-羟基丁酸-5-羟基戊酸)三聚物及其微生物生产菌株构建
CA2574092C (en) Dna coding for polypeptide participating in biosynthesis of pladienolide
JPH09504436A (ja) トリオールポリケチドシンターゼをコードするdna
CN113227364A (zh) 用于产生熊去氧胆酸及其前体的细胞和方法
KR100632174B1 (ko) 유전자 클러스터의 유전자
US6632650B1 (en) Genes involved in cyclododecanone degradation pathway
JP2001169780A (ja) ドコサヘキサエン酸生産細菌の遺伝子
KR20170036789A (ko) 변경된 일산화탄소 탈수소효소(codh) 활성을 가지는 유전자 조작된 박테리아
US20030215930A1 (en) Genes involved in cyclododecanone degradation pathway
CN110305881B (zh) 一种聚酮类化合物neoenterocins的生物合成基因簇及其应用
KR20130097538A (ko) 해양 미생물 하헬라 제주엔시스의 제주엔올라이드 생합성 유전자 클러스터
JP2002315579A (ja) 遺伝子クラスター上の構造遺伝子
KR20120107519A (ko) 피리피로펜 생합성 유전자 클러스터 및 표지 유전자를 포함하는 핵산 구성체
CA2391131C (en) Genes and proteins for rosaramicin biosynthesis
JP5524053B2 (ja) ハーボキシジエンの生合成に関与するポリペプチドをコードするdna
CN111944840A (zh) 木霉菌Azaphilones类次级代谢产物的应用
JP2001112487A (ja) Ml−236b生合成関連dna
CA2878644A1 (en) Uk-2 biosynthetic genes and method for improving uk-2 productivity using the same
JP2003116567A (ja) 遺伝子クラスター
WO2000055304A2 (en) A chc biosynthetic gene cluster
JPH0646864A (ja) イコサペンタエン酸合成酵素群をコードする遺伝子及びイコサペンタエン酸の製造方法