PT1979375E - Aglomerados de genes biossintéticos lantibióticos de a. garbadinensis e a. liguriae - Google Patents

Aglomerados de genes biossintéticos lantibióticos de a. garbadinensis e a. liguriae Download PDF

Info

Publication number
PT1979375E
PT1979375E PT07704921T PT07704921T PT1979375E PT 1979375 E PT1979375 E PT 1979375E PT 07704921 T PT07704921 T PT 07704921T PT 07704921 T PT07704921 T PT 07704921T PT 1979375 E PT1979375 E PT 1979375E
Authority
PT
Portugal
Prior art keywords
seq
actagardine
compound
polypeptide
deoxyactagardine
Prior art date
Application number
PT07704921T
Other languages
English (en)
Inventor
Steven Boakes
Jesus Cortes Bargallo
Michael John Dawson
Original Assignee
Novacta Biosystems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novacta Biosystems Ltd filed Critical Novacta Biosystems Ltd
Publication of PT1979375E publication Critical patent/PT1979375E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/365Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinoplanes (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/045Actinoplanes

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Virology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Description

ΕΡ 1 979 375/PT DESCRIÇÃO "AGLOMERADOS DE GENES BIOSSINTÉTICOS LANTIBIÓTICOS DE A. GARBADINENSIS E A. LIGURIAE"
Campo do Invento
Este invento refere-se à caracterização do aglomerado de genes biossintéticos para o lantibiótico actagardina, à identificação de uma nova variante de actagardina e do seu aglomerado biossintético e a métodos de produção e utilização de actagardina, de uma nova variante de actagardina produzida numa estirpe de A. liguriae, e de variantes destas duas produzidas de acordo com este invento, utilizando os genes dos aglomerados de genes biossintéticos caracterizados.
Antecedentes do Invento
Os lantibióticos são péptidos que têm atividade de antibiótico e outras atividades, produzidos por bactérias Gram-positivas. Eles contêm, entre outros resíduos modificados, os aminoácidos tioéter lantionina e metilantionina, que reticulam a cadeia peptídica numa estrutura policíclica. Eles têm sido classificados em duas classes, tipo-A e tipo-B, embora uma tal classificação não seja problemática. Os lantibióticos tipo-A são geralmente anfífilos alongados que são capazes de formar poros em membranas bacterianas e noutras membranas plasmáticas. Exemplos são a nisina e a subtilina. Os lantibióticos tipo-B, por contrário, são péptidos conformacionalmente definidos, globulares, que inibem as funções enzimáticas. Exemplos são a cinamicina e duramicina.
As atividades atribuídas aos lantibióticos tipo-B tais como cinamicina incluem atividade antimicrobiana (o que proporciona uma aplicação potencial como antibióticos) , inibição de enzima conversora da angiotensina (o que proporciona uma aplicação potencial na regulação da pressão sanguínea), imunomodulação através da inibição da fosfolipase A2 (o que proporciona uma aplicação potencial como anti-inflamatórios) e interferência na biossíntese de prostaglandinas e leucotrienos. 2
ΕΡ 1 979 375/PT
Os lantibióticos tipo-B parecem exercer a sua atividade por interferência com atividades enzimáticas por bloqueio dos respetivos substratos. Por exemplo, os lantibióticos tipo-B tais como a mersacidina e a actagardina têm mostrado inibir a biossintese do peptidoglicano; a transglicosilação foi identificada como a reação alvo. 0 substrato desta reação é o lipido II precursor de parede celular ligada a lipido. Embora este seja um alvo para o lantibiótico vancomicina, o local de ação é diferente e é um novo local de ligação alvo não utilizado por qualquer fármaco antibacteriano atual.
Tem sido observada atividade antibacteriana na classe cinamicina de lantibióticos tipo-B, em particular com estirpes de Bacillus, com efeitos descritos nas funções de membrana, translocação de protões dependente de ATP e absorção de Ca2+ e nas ATPases. A formação de poros definidos tem também sido descrita nas membranas planares contendo fosfatidiletanolamina. Estes efeitos podem ser atribuídos à ligação específica destes lantibióticos tipo-B a fosfatidiletanolamina.
Os lantibióticos têm mostrado ter eficácia e utilidade como aditivos alimentares e agentes antibacterianos contra Propionibacterium acnes e patogénios problemáticos, por exemplo, Staphylococcus aureus resistentes à meticilina (MRSA), que tem ou está a desenvolver resistência a muitos antibióticos normalmente utilizados, e Streptococcus pneumoniae. Para revisões, ver Sahl e Bierbaum (1998) Annual Rev. Microbiol. 52:41-79/ Jack e Sahl (1995) TIBTECH 13:269 278; Gasson (1995) Capítulo 10, Lantibiotics, em Vining and Stuttard (eds) Biotechnology Series: Genetics and Biochemistry of Antibiotic Production, Biotechnological I 30 Series 28, páginas 283-306.
No campo dos antibióticos, há uma necessidade contínua para o fornecimento de novos compostos antibióticos, que ultrapassem problemas tais como resistência, biocompatibilidade, toxicidade e semelhantes. Por conseguinte, são desejáveis métodos de produção de lantibióticos e a produção de formas variantes de lantibióticos (que podem ter um perfil de atividade diferente quando comparados com as formas nativas). 3
ΕΡ 1 979 375/PT A actagardina é um lantibiótico tetraciclico tipo B conhecido, com 19 aminoácidos de comprimento (1890 Da) . Ela tem atividade potente contra patogénios Gram positivos importantes tais como Staphylococcus aureus e Streptococcus pyogenes quer em modelos animais in vitro quer em modelos animais in vivo. A estrutura da actagardina é apresentada na Figura 4. O composto é produzido a partir de um pré-pró-péptido, cuja porção C-terminal tem a sequência polipeptidica de SSGWVCTLTIECGTVICAC (SEQ ID NO:4). O polipéptido de SEQ ID NO: 4 é modificado pelas reticulações seguintes, criando a estrutura secundária e terciária: RETICULAÇÃO 1-6, Lantionina (Ser-Cys); RETICULAÇÃO 7-12, Beta-metilantionina (Thr-Cys); RETICULAÇÃO 9-17, Beta-metilantionina (Thr-Cys); RETICULAÇÃO 14-19, Sulfóxido de beta-metilantionina (Thr-Cys). A actagardina tem sido descrita ser produzida por duas espécies de Actinoplanes; A. garbadinensis e A. liguriae. É também coproduzido um análogo no qual a RETICULAÇÃO 14-19 não está oxidada, i.e. é uma beta-metilantionina não sulfóxido de beta-metilantionina cujo nome é aqui de desoxi-actagardina. A US 6022851 descreve o isolamento de actagardina a partir de estirpes isoladas de A. garbadinensis e A. liguriae.
Descrição do Invento O presente invento refere-se a um composto da fórmula: z
na qual: -X1-X2- representa -Leu-Val-; -Y- é -S-; 4
ΕΡ 1 979 375/PT Ζ é ou um aminoácido ou -NH2 em que o último representa o N-terminal da Ala na posição 1; R representa -OH ou -NR1R2, em que R1 e R2 representam independentemente: (i) hidrogénio; (ii) um grupo de fórmula - (CH2) n-NR3R4, em que n representa um número inteiro de 2 a 8 e R3 e R4 representam independentemente hidrogénio ou alquilo (Ci-4) ou R3 e R4 tomados em conjunto representam um grupo -(CH2)3-, -(CH2)4-, (CH2)2-0(CH2)2-, - (CH2)2-S (CH2)2 ou - (CH2) 5-; ou R1 e R2 tomados em conjunto com o átomo de azoto adjacente representam uma porção piperazina que pode ser substituída na posição 4 por um substituinte selecionado a partir de: (a) alquilo (C1-4) ; (b) cicloalquilo (C5-7) ; (c) piridilo, (d) - (CH2) P-NR5R6 em que p representa um número inteiro de 1 a 8 e R5 e R6 representam independentemente hidrogénio ou alquilo (C1-4) ; (e) piperidinilo; (f) piperidinilo substituído, em que o piperidinilo substituído possui um N-substituinte que é alquilo (C1-4) ; (g) benzilo; e (h) benzilo substituído, em que a porção fenilo possui 1 ou 2 substituintes selecionados a partir de cloro, bromo, nitro, alquilo (C1-4) e alcoxi (C1-4) . ou um seu sal farmaceuticamente aceitável.
Num outro aspeto o invento refere-se à informação estrutural e reguladora clonada, sequenciada e elucidada relevante para o aglomerado de genes biossintéticos para o lantibiótico tipo-B, actagardina, de Actinoplanes garbadinensis e A. liguriae.
Os investigadores descobriram também surpreendentemente que num isolado de A. liguriae, aqui designado como A. liguriae NCIMB 41362, é produzida uma nova forma de actagardina que eles denominaram actagardina B ou, na forma não oxidada, desoxi-actagardina B. Estas formas têm atividade antimicrobiana similar à actagardina e são produzidas a 5
ΕΡ 1 979 375/PT partir da sequência polipeptidica primária de SEQ ID N0:1, que sofre reticulação similar a actaqardina. As variantes proporcionam alternativas à actaqardina novas e úteis. Adicionalmente, a identificação de resíduos em actagardina B que são diferentes da actagardina conduz ao fornecimento de outros lantibióticos com base nestas diferenças.
Os investigadores isolaram também aglomerados de genes quer de A. garbadinensis produtoras de actagardina quer de A. liguriae NCIMB 41362 que compreendem os genes para a produção de actagardina e actagardina B.
Num aspeto, o presente invento proporciona a actagardina B nova e suas variantes, incluindo variantes baseadas nas sequências polipeptídicas primárias de SEQ ID NO: 2 e SEQ ID NO:3, assim como suas variantes.
Num aspeto adicional, o invento proporciona ácidos nucleicos que codificam actagardina B e suas variantes, conjuntos de ácidos nucleicos e suas variantes derivados dos aglomerados de genes acima mencionados, métodos de preparação de actagardina B e suas variantes e métodos de produção de variantes novas de actagardina B.
Descrição dos Desenhos A Figura 1 proporciona um mapa do aglomerado de genes reguladores e que codificam actagardina a partir de A. garbadinensis. A Figura 2 proporciona um mapa do aglomerado de genes reguladores e que codificam isolados a partir de A. liguriae que codifica uma nova variante de actagardina, aqui referida como actagardina B. A Figura 3 proporciona um esquema que representa um método aqui descrito para a produção de variantes de actagardina que utiliza sequências de ácidos nucleicos isoladas a partir de A. garbadinensis ou de A. liguriae. A Figura 4 é uma representação da estrutura primária de actagardina madura na qual X1-X2 representa Val-Ile, Y é - 6
ΕΡ 1 979 375/PT S(Ο) — e Z é NH2. A "desoxi-actagardina B" é a variante Vall5Leu Ilel6Val com uma ponte metilantionina não oxidada entre AbuS14 e AlaS19.
Descrição das Sequências
Para comodidade do leitor, as sequências do presente invento foram numeradas não contiguamente como se segue: SEQ ID NO:l é a sequência polipeptidica primária da
Actagardina B: SSGWVCTLTIECGTLVCAC. SEQ ID NO:2 é a sequência polipeptidica primária da variante W de Actagardina B: SSGWVCTLTIECGTWCAC.
SEQ ID NO:3 é a sequência polipeptidica primária da variante LI de Actagardina B SSGWVCTLTIECGTLICAC. SEQ ID NO: 4 é a sequência polipeptidica primária da
Actagardina: SSGWVCTLTIECGTVICAC; SEQ ID NO:ll é a sequência polipeptidica primária da Ala-Actagardina B: ASSGWVCTLTIECGTLVCAC. SEQ ID NO:12 é a sequência polipeptidica primária da variante W de Ala-Actagardina B: ASSGWVCTLTIECGTWCAC .
SEQ ID NO:13 é a sequência polipeptidica primária da variante LI de Ala-Actagardina B ASSGWVCTLTIECGTLICAC. SEQ ID NO: 14 é a sequência polipeptidica primária da Ala-Actagardina : ASSGWVCTLTIECGTVICAC. SEQ ID NO:212 é a sequência polipeptidica primária da pré-pró-Actagardina B: MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIE CG TLVCAC. SEQ ID NO:22 é a sequência polipeptidica primária da variante W de pré-pró-Actagardina B: MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIE CG TWCAC. 7 ΕΡ 1 979 375/ΡΤ
SEQ ID ΝΟ:23 é a sequência polipeptídica primária da variante LI de pré-pró-Actagardina B MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIE CG TLICAC. SEQ ID NO:119 é a sequência polipeptídica primária da pré-pró-Actagardina : MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIE CG TVICAC. SEQ ID ΝΟ.ΊΟΟ é a sequência nucleotídica, derivada de A. garbadinensis, não vectora, do cosmideo CosAG14. SEQ ID N0s:101 - 132 são as sequências polipeptidicas das estruturas de leitura aberta orfl - orf32 de SEQ ID NO:100, respetivamente. SEQ ID NO:200 é a sequência nucleotídica, derivada de A. liguriae, não vectora, do cosmideo CosAL02. SEQ ID NOs:201 - 231 são as sequências polipeptidicas das estruturas de leitura aberta orfl - orf31 de SEQ ID NO:200, respetivamente. SEQ ID NOs :300-312 são as sequências iniciadoras aqui descritas abaixo.
Descrição Detalhada do Invento
Compostos
Num aspeto, o presente invento proporciona um composto da fórmula (I):
na qual: -X1-X2- representa -Leu-Val-; -Val-Val- ou -Leu-Ile-; Y é -S- ou -S(0)e 8 ΕΡ 1 979 375/ΡΤ Ζ é Η2Ν- ou Ala-, ou um seu sal farmaceuticamente aceitável. Num outro aspeto, o invento proporciona variantes e derivados biologicamente ativos destes compostos.
Quando -X1-X2- representa -Leu-Val-, Y é -S(0)- e Z é NH2 o composto do invento é também referido como actagardina B.
Quando -X1-X2- representa -Leu-Val-, Y é -S(0)- e Z é Ala- o composto do invento é também referido como ala-actagardina B.
Quando -X1-X2- representa -Leu-Val-, Y é -S- e Z é NH2 o composto do invento é também referido como desoxi-actagardina B.
Quando -X1-X2- representa -Leu-Val-, Y é -S- e Z é Ala-o composto do invento é também referido como ala-desoxi-actagardina B.
Por referência a Z como sendo um grupo H2N-, deve-se compreender que esta porção representa o N-terminal do resíduo alanina na posição 1 do composto acima. Por referência ao grupo Z como sendo Ala-, deve-se compreender que esta porção representa uma alanina, convencionalmente referida na arte como Ala(O), ligada à alanina na posição 1 através de uma ligação amida.
Numa concretização Z é um aminoácido, por exemplo selecionado a partir de Ala, Ile-, Lys-, Phe-, Vai-, Glu-, Asp-, His-, Leu, Arg-, Ser- e Trp- e os referidos aminoácidos estão na configuração L ou D. Numa concretização, o aminoácido é Ala.
Variantes
Uma variante de um composto de fórmula (I) é um composto no qual um ou mais, por exemplo, de 1 a 5, tal como 1, 2, 3 ou 4 aminoácidos são substituídos por um outro aminoácido. De preferência, o aminoácido está numa posição selecionada a partir das posições 2, 3, 4, 5, 8, 10, 11, 13 ou 18 do composto de fórmula (I). 9
ΕΡ 1 979 375/PT
Uma variante pode também compreender uma substituição na posição 15 ou 16, desde que quando ambas as posições 15 e 16 são substituídas nenhuma das outras posições são alteradas, 15 e 16 não sejam Vai e Ile, respetivamente.
Quando Z é Ala-, as variantes dos compostos do invento incluem aquelas nas quais Ala- é substituída por um outro aminoácido (particularmente um aminoácido que ocorre naturalmente codificado pelo código genético ou a sua isoforma D), mais particularmente um aminoácido selecionado a partir do grupo Ile-, Lys-, Phe-, Vai-, Glu-, Asp-, His-, Leu, Arg-, Ser- e Trp-. Num aspeto, o aminoácido pode ser selecionado a partir do grupo Ile-, Lys-, Phe-, Vai-, Glu-, Asp-, His-, Leu-, Arg- e Ser-. Tais variantes podem ser produzidas por adição química do resíduo a compostos nos quais Z = H2N, como descrito na US 6022851. Será de observar que a adição química de um aminoácido permite ao aminoácido estar na configuração L ou D. Isto inclui D-Ala, adicionalmente às formas D de outros aminoácidos tais como aqueles acima mencionados.
Derivados
Os derivados dos compostos do invento (incluindo variantes) são aqueles nos quais uma ou mais cadeias laterais de aminoácidos do composto do invento foi(foram) modificada(s), por exemplo, por esterificação, amidação ou oxidação.
Os derivados dos compostos do invento podem ser derivados monoamida numa das funções carboxi da actagardina, particularmente no C-terminal. Mais particularmente, um derivado pode ser um composto no qual o C-terminal do composto do invento representa o grupo independentemente: (i) hidrogénio; (ii) um grupo seja da fórmula -COR, -NR1R2, em
que R e R - (CH2) n-NR3R4, na qual R representam de fórmula representa um número inteiro de 2 a 8 representam independentemente hidrogénio ou em que >3 e R e R alquilo(Ci~ C4) ou R3 e R4 tomados em conjunto representam um grupo - 10
ΕΡ 1 979 375/PT (CH2)3-, -(CH2)4-, (CH2)2-0(CH2)2-, - (CH2)2-S (CH2)2- OU -
(CH2)s-; OU R1 e R2 tomados em conjunto com o átomo de azoto adjacente representam uma porção piperazina que pode ser substituída na posição 4 por um substituinte selecionado a partir de: (a) alquilo (C1-C4) ; (b) cicloalquilo (C5-C7) ; (c) piridilo, (d) - (CH2) p-NR5R6 em que p representa um número inteiro de 1 a 8 e R5 e R6 representam independentemente hidrogénio ou alquilo(C1-C4); (e) piperidinilo; (f) piperidinilo substituído, em que o piperidinilo substituído possui um N-substituinte que é alquilo (C1-4) ; (g) benzilo; e (h) benzilo substituído, em que a porção fenilo possui 1 ou 2 substituintes selecionados a partir de cloro, bromo, nitro, alquilo (C1-C4) e alcoxi (C1-C4) .
Numa concretização, na fórmula -COR, R representa o grupo -NR2R2, em que R1 e R2 representam independentemente hidrogénio, um grupo da fórmula - (CH2) n-NR3R4, em que n representa um número inteiro de 2 a 8 e R3 e R4 representam independentemente hidrogénio ou alquilo (C1-C4) ou R3 e R4 tomados em conjunto representam um grupo -(CH2)3-, -(CH2)4-, (CH2) 2-0 (CH2) 2-, - (CH2) 2-S (CH2) 2- ou - (CH2) 5-, ou R1 e R2 tomados em conjunto com o átomo de azoto adjacente representam uma porção piperazina que pode ser substituída na posição 4 com um substituinte selecionado a partir de alquilo(C1-C4) , cicloalquilo(C5-C7) , piridilo, benzilo e benzilo substituído em que a porção fenilo possui 1 ou 2 substituintes selecionados a partir de cloro, bromo, nitro, alquilo(C1-C4) e alcoxi (C1-C4) .
Adicionalmente, um derivado pode incluir um composto no qual a função carboxi de uma cadeia lateral de um resíduo interno, por exemplo, aquela do resíduo Glull, é modificada a partir de -C00H para um grupo -C00R5 em que R5 representa hidrogénio, alquilo (C1-C4) ou alcoxi (C1-C4) alquilo (C2—C4) · 11
ΕΡ 1 979 375/PT
Os derivados N-terminais dos compostos do invento podem ser aqueles nos quais o grupo amino N-terminal -NH2 está em vez de um grupo -NHR6 em que R6 representa alquilo (C1-4) .
Numa concretização R é OH.
Numa concretização R1 e R2 do aminoácido no composto representam independentemente: (i) hidrogénio; (ii) um grupo de fórmula - (CH2) n-NR3R4, em que n representa um número inteiro de 2 a 8 e R3 e R4 representam independentemente hidrogénio ou alquilo(Ci-4) ·
Numa concretização o composto é selecionado a partir do grupo constituído por: N- [3-dimetilaminopropil]monocarboxamida de desoxiactagardina B; N- [1-(l-metil-4-piperidinil)piperazina]monocarboxamida de desoxiactagardina B; [1-(3-dimetilaminopropil)piperazina]monocarboxamida de desoxiactagardina B; desoxiactagardina B; D-Ala(0)desoxiactagardina B; L-Ile(0)desoxiactagardina B; L-Val(0)desoxiactagardina B; L-Phe(0)desoxiactagardina B; L-Lys(0)desoxiactagardina B; ou L-Trp(0)desoxiactagardina B. O termo "alquilo(C1-C4)" representa cadeias alquilo lineares ou ramificadas de 1 a 4 átomos de carbono, tais como: metilo, etilo, propilo, 1-metiletilo, butilo, 1- metilpropilo ou 1,1-dimetiletilo enquanto que o termo "alquilo(02-04) " representa cadeias alquilo lineares ou ramificadas de 2 a 4 átomos de carbono tais como: etilo, propilo, 1-metiletilo, butilo, 1-metilpropilo ou 1,1-dimetiletilo. O termo "cicloalquilo(C5-C7)" representa um grupo cicloalquilo selecionado a partir de ciclopentilo, ciclo-hexilo e ciclo-heptilo. 12
ΕΡ 1 979 375/PT Ο termo "alcoxi(C1-C4) " representa uma cadeia alcoxi linear ou ramificada de 1 a 4 átomos de carbono tal como metoxi, etoxi, propoxi, 1-metiletoxi, butoxi, 1-metilpropoxi e 1,1-dimetiletoxi.
Os derivados de acordo com o presente invento podem ser preparados de acordo com os métodos descritos para o fabrico de derivados de actagardina na EP-0195359, cuja descrição é aqui incorporada por referência.
Concretizações Adicionais
Quando o derivado é um composto no qual o C-terminal é da fórmula -COR, em que R representa o grupo -NR1R2, nalgumas concretizações, R1 é H e R2 representa um grupo de fórmula -(CH2) n_NR3R4, em que n representa um número inteiro de 2 a 8 e R3 e R4 representam independentemente hidrogénio ou alquilo (C1-C4) ou R3 e R4 tomados em conjunto representam um grupo -(CH2)3-, -(CH2)4-, (CH2) 2-0 (CH2) 2-, - (CH2) 2-S (CH2) 2- ou - (CH2) 5—. Nestas concretizações, R3 e R4 representam, de preferência, hidrogénio ou alquilo (C1-C4) . Mais preferivelmente, R3 e R4 representam alquilo (Ci~C2) , por exemplo, metilo. 0 número inteiro n pode ser de preferência de 2 a 5, e mais preferivelmente de 2 a 4, por exemplo 3.
Noutras concretizações, R1 e R2 tomados em conjunto com o átomo de azoto adjacente representam uma porção piperazina. 0 N-substituinte na posição 4 pode ser selecionado, de preferência, a partir de: (a) alquilo (Ci-C4) ; (b) cicloalquilo (C5-C7) ; (d) - (CH2) p-NR5R6 em que p representa um número inteiro de 1 a 8 e R5 e R6 representam independentemente hidrogénio ou alquilo(C1-C4) ; (e) piperidinilo; e (f) piperidinilo substituído, em que o piperidinilo substituído possui um Ν-substituinte que é alquilo (C1-4) ·
Os grupos piperidinilo e piperidinilo substituído têm, de preferência, o seu átomo de azoto na posição 4. 13 ΕΡ 1 979 375/ΡΤ Ο N-substituinte pode ser, mais preferivelmente, selecionado a partir de: (d) - (CH2) p-NR5R6 em que p representa um número inteiro de 1 a 8 e R5 e R6 representam independentemente hidrogénio ou alquilo (Ci-C4) ; e (f) piperidinilo substituído, em que o piperidinilo substituído possui um N-substituinte que é alquilo (Ci-4) .
Se o N-substituinte for - (CH2) P-NR5R6, então R5 e R6 podem ser, de preferência, alquilo(Ci-C4), mais preferivelmente, alquilo(Ci-C2), por exemplo, metilo. 0 número inteiro p é, de preferência, 1 a 4, por exemplo 3.
Se o N-substituinte for piperidinilo substituído, então o N-substituinte é, de preferência, alquilo(Ci~C2), por exemplo, metilo. Como acima mencionado, o N está, de preferência, na posição 4. 0 presente invento refere-se aos aglomerados de genes de SEQ ID NO:100 e SEQ ID NO:200 e aos polipéptidos codificados por estes aglomerados e suas variantes. O polipéptido de SEQ ID NO: 119 é a pré-pró-actagardina e o polipéptido de SEQ ID NO:212 é a pré-pró-actagardina B. Os restantes polipéptidos e suas variantes (como aqui definido) são aqui genericamente referidos como "polipéptidos aglomerados". Os polipéptidos aglomerados derivados de SEQ ID NO:100 são referidos como "polipéptidos lxx" e aqueles derivados de SEQ ID NO:200 são referidos como "polipéptidos 2xx". Os polipéptidos que são 100% idênticos quer na sequência quer no comprimento ao polipéptido aglomerado são referidos como polipéptidos de tipo selvagem. Um polipéptido aglomerado derivado de SEQ ID NO:100 ou SEQ ID NO:200 pode ser de tipo selvagem ou variante.
Um polipéptido pode estar na forma substancialmente isolada. Os polipéptidos isolados do invento serão aqueles como acima definido na forma isolada, isenta ou substancialmente isenta de material com o qual está naturalmente associado, tal como outros polipéptidos com os quais se encontra na célula. Por exemplo, os polipéptidos podem ser evidentemente formulados com diluentes ou adjuvantes e ainda, por questões práticas, ser isolados. 14
ΕΡ 1 979 375/PT
Um polipéptido do invento pode também estar numa forma substancialmente purificada, caso em que vai geralmente compreender o polipéptido numa preparação em que mais de 90%, por exemplo, 95%, 98% ou 99% do polipéptido na preparação é um polipéptido do invento.
Polipéptido Lantibiótico e Gene LantibioticA
No presente invento, a referência a um polipéptido lantibioticA ou lanA, o gene LantibioticA ou LanA refere-se genericamente a um polipéptido lantibiótico tipo B ou ao gene que codifica um tal péptido. Assim, a referência a estes inclui a referência a cinamicina, mersacidina, actagardina e actagardina B e aos genes que codificam estes produtos. A referência a uma célula hospedeira produtora de lantibiótico refere-se a uma qualquer célula hospedeira que na sua forma nativa produz um polipéptido LanA, como aqui a seguir definido abaixo.
Um polipéptido LanA é um polipéptido com atividade antimicrobiana. A atividade antimicrobiana pode ser examinada por determinação do valor de CIM contra um organismo de referência, por exemplo, Micrococcus luteus. Um polipéptido LanA é considerado exibir atividade antimicrobiana se tiver uma valor de CIM inferior ou igual a 16 vezes mais o da actagardina contra a mesma estirpe do microrganismo de referência. No presente invento, o gene LanA de A. garbadinensis é referido como actA e o gene LanA de A. liguriae é referido como LigA.
Outros Polipéptidos Lan
Como aqui utilizado, a referência a um polipéptido "LanM" é um polipéptido derivado de um aglomerado de genes Lantibióticos que tem um fator de modificação necessário para a conversão de um polipéptido precursor num composto lantibiótico. Os polipéptidos LanM incluem aqueles de SEQ ID NO: 120 (ActM) ou uma sua variante, SEQ ID NO: 213 (LigM) ou uma sua variante, um polipéptido cinM como definido na WO02/088367, um polipéptido mrsM como descrito em Altena et al, 2000, ou um polipéptido homólogo de um outro aglomerado de genes de uma bactéria que produz um lantibiótico tipo B. 15
ΕΡ 1 979 375/PT A referência a um polipéptido "LanR" é um polipéptido derivado de um aglomerado de genes Lantibióticos que é um fator regulador necessário para a regulação da produção de um polipéptido precursor. Os polipéptidos LanR incluem aqueles de SEQ ID NO: 122 (ActR) ou uma sua variante, SEQ ID NO: 216 (LigR) ou uma sua variante, um polipéptido cinRl como definido na WO02/088367, um polipéptido mrsRl como descrito em Altena et al, 2000, ou um polipéptido homólogo de um outro aglomerado de genes de uma bactéria que produz um lantibiótico tipo B. A referência a um polipéptido "LanT" é um polipéptido derivado de um aglomerado de genes Lantibióticos que é um fator transportador necessário para a produção de um polipéptido precursor para um composto lantibiótico. Os polipéptidos LanT incluem aqueles de SEQ ID NO:123 (ActT) ou uma sua variante, SEQ ID NO: 214 (LigT) ou uma sua variante, um polipéptido cinT como definido na WO02/088367, um polipéptido mrsT como descrito em Altena et al, 2000, ou um polipéptido homólogo de um outro aglomerado de genes de uma bactéria que produz um lantibiótico tipo B. A referência a um polipéptido "LanO" é um polipéptido derivado de um aglomerado de genes Lantibióticos que é um fator que se pensa estar envolvido na oxidação da forma desoxi de actagardina e dos compostos do invento para actagardina ou para compostos do invento nos quais Y é -S(0)-.
Os polipéptidos LanO incluem aqueles de SEQ ID NO:122 (Ato) ou uma sua variante, SEQ ID NO: 215 (LigO) ou uma sua variante, ou um polipéptido homólogo de um outro aglomerado de genes de uma bactéria que produz um lantibiótico tipo B.
Polipéptidos Aglomerados
Num aspeto, o invento proporciona um polipéptido aglomerado isolado selecionado a partir de qualquer uma das SEQ ID NOs : 101 , 102 , 103, , 104, . 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 201, 202, 203, 16
ΕΡ 1 979 375/PT 204, 205, 206, 207, 208, 209, 210, 211, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230 e 231. Num outro aspeto, o invento proporciona um polipéptido aglomerado que é uma variante de qualquer uma das sequências acima mencionadas.
Os polipéptidos aglomerados de interesse particular incluem polipéptidos lxx e 2xx que são polipéptidos LanM, LanR, LanT ou LanO.
Uma "variante", em relação a um polipéptido aglomerado, significa: um qualquer polipéptido tendo uma sequência de aminoácidos que é diferente, mas que mostra identidade de sequência de aminoácidos significativa com, a sequência de aminoácidos de um polipéptido de referência (neste caso um qualquer polipéptido aglomerado de tipo selvagem) ou um fragmento daquele polipéptido. A não ser que de outro modo especificado, a identidade de sequência de aminoácidos significativa é, de preferência, pelo menos, 80%, mais preferivelmente 85%, 90% ou 95%, ainda mais preferivelmente, 98% ou 99%. Uma variante é, de preferência, de um comprimento que seja o mesmo que, ou pelo menos 70%, de preferência, pelo menos 80%, mais preferivelmente, pelo menos 90% e mais preferivelmente, pelo menos 95% do comprimento do polipéptido aglomerado de tipo selvagem. A "percentagem (%) de identidade de sequência de aminoácidos" é definida como a percentagem de resíduos de aminoácidos numa sequência candidata que é idêntica aos resíduos de aminoácidos na sequência com a qual está a ser comparada, após alinhamento das sequências e introdução de intervalos, se necessário, para alcançar a percentagem máxima de identidade de sequência, e não considerando quaisquer substituições conservativas como parte da identidade da sequência. Os valores de % de identidade aqui utilizados são produzidos por BLAST-2 que foi obtido a partir de Altschul et al. (1996); http://blast. wustl/edu/blast/README. html. WU-BLAST2 utiliza vários parâmetros de pesquisa, a maioria dos quais são regulados com os valores por defeito. Os parâmetros ajustáveis são regulados com os valores seguintes: espaço de 17
ΕΡ 1 979 375/PT sobreposição = 1, fração de sobreposição = 0,125, limiar de palavra (T) = 11. Os parâmetros HSPS e HSPS2 são valores dinâmicos e são estabelecidos pelo próprio programa dependendo da composição da sequência particular e da composição da base de dados particular contra a qual a sequência de interesse está a ser pesquisada; no entanto, os valores podem ser ajustados para aumentar a sensibilidade. Uma % de valor de identidade de sequência de aminoácidos é determinada pelo número de resíduos idênticos correspondentes dividido pelo número total de resíduos da sequência "mais longa" na região alinhada, multiplicado por 100. A sequência "mais longa" é a que tem a maioria dos resíduos atuais na região alinhada (os intervalos introduzidos por WU BLAST-2 para maximizar a pontuação de alinhamento são ignorados).
Desejavelmente, uma variante vai reter uma função biológica do polipéptido de referência. No presente invento, a função biológica é retida quando a variante, quando presente numa célula hospedeira com os outros membros do seu aglomerado, é capaz de produzir um lantibiótico. Isto pode ser determinado, por exemplo, por fornecimento de uma célula hospedeira contendo SEQ ID NO:100 no caso da uma variante de polipéptido aglomerado lxx, ou SEQ ID NO: 200 no caso de uma variante de polipéptido 2xx, em que as células hospedeiras produzem actagardina ou actagardina B, respetivamente, modificando a sequência para codificar a variante e determinando se um polipéptido lantibiótico é ainda produzido.
Polípéptídos Precursores
Num outro aspeto, o invento proporciona polipéptidos, de preferência na forma isolada, que são precursores dos compostos do presente invento ou da actagardina. Os polipéptidos precursores incluem os polipéptidos de qualquer uma das SEQ ID NOs:l-4, SEQ ID NOs:ll-14, SEQ ID NOs:212, 22, 23 e 119, assim como suas variantes ou derivados que podem ser convertidos num polipéptido lantibiótico.
Uma variante de um polipéptido precursor de qualquer uma das SEQ ID NOs:l-4 é um polipéptido no qual um ou mais, por exemplo, de 1 a 5, tal como 1, 2, 3 ou 4 aminoácidos são 18
ΕΡ 1 979 375/PT 18 ΕΡ 1 979 375/PT substituídos por aminoácido está posições 2, 3, 4, SEQ ID NOs:1-4. um outro aminoácido. De preferência, o numa posição selecionada a partir das 5, 8, 10, 11, 13 ou 18 de qualquer uma das
Uma variante de um polipéptido precursor de qualquer uma das SEQ ID NOs:11-14 é um polipéptido no qual um ou mais, por exemplo, de 1 a 5, tal como 1, 2, 3 ou 4 aminoácidos são substituídos por um outro aminoácido. De preferência, o aminoácido está numa posição selecionada a partir das posições 3, 4, 5, 6, 9, 11, 12, 14 ou 19 de qualquer uma das SEQ ID NOs:11-14.
Uma variante de um polipéptido precursor de qualquer uma das SEQ ID NOs:212, 22, 23 e 119 é um polipéptido no qual um ou mais, por exemplo, de 1 a 5, tal como 1, 2, 3 ou 4 aminoácidos da região C-terminal (resíduos 46-64) correspondente a SEQ ID NOs:1-4, respetivamente, são substituídos por um outro aminoácido. De preferência, o aminoácido está numa posição selecionada a partir das posições correspondentes às posições 2, 3, 4, 5, 8, 10, 11, 13 ou 18 de qualquer uma das SEQ ID NOs: 1-4. Tais variantes podem incluir adicionalmente alterações na região N-terminal mantendo, pelo menos, 70%, por exemplo, pelo menos 80%, de preferência, pelo menos 90%, por exemplo, pelo menos 95% das regiões N-terminais (resíduos 1-45). Por exemplo, uma variante da região N-terminal de SEQ ID NO: 212 ou SEQ ID NO:119 pode compreender uma ou mais substituições (por exemplo, de 1 a 12, tal como de 1 a 5, por exemplo, 1, 2 ou 3 substituições nas posições 4, 5, 6, 8, 9, 12, 13, 17, 18, 19, 21 e 32) que os dados dos investigadores mostram variar entre as SEQ ID NO:212 e 119.
As substituições podem ser de um aminoácido por um outro aminoácido que ocorra naturalmente e podem ser substituições conservativas ou não conservativas. As substituições conservativas incluem aquelas apresentadas na tabela seguinte, em que os aminoácidos no mesmo bloco da segunda coluna e, de preferência, na mesma linha na terceira coluna podem ser substituídos uns pelos outros: 19
ΕΡ 1 979 375/PT
ALIFÁTICO Não polar G A > H Polar - não carregado C S T M N Q Polar - carregado D E K R AROMÁTICO H F W Y
Para SEQ ID NO: 212, as substituições podem ser de um aminoácido que difere do resíduo de aminoácido localizado na localização correspondente de SEQ ID NO:119, ou vice versa. Em qualquer caso, a substituição pode ser para introduzir o aminoácido de SEQ ID NO:119 em SEQ ID NO:212, ou vice versa (por exemplo, a Ile na posição 4 de SEQ ID NO: 212 pode ser substituída por Leu, etc.).
Um polipéptido precursor pode ser obtido por expressão de um ácido nucleico que codifica o polipéptido numa célula que é uma não-produtora de um lantibiótico. Ácido Nucleico
Um ácido nucleico do invento pode ser um ADN ou ARN, embora seja, de preferência, um ADN. Um ácido nucleico do invento pode ser de cadeia simples ou dupla. Num aspeto, o invento proporciona um ácido nucleico isolado que codifica um polipéptido aglomerado. Num outro aspeto, o invento proporciona um ácido nucleico isolado que codifica um polipéptido precursor ou sua variante ou fragmento.
Num outro aspeto, o invento proporciona um ácido nucleico isolado que pode compreender todo ou um fragmento de SEQ ID NO:100 ou SEQ ID NO:200, incluindo um fragmento compreendendo uma região intergénica aqui descrita. Tais regiões podem incluir um promotor ou um outro elemento regulador para a expressão de um polipéptido aglomerado ou de um polipéptido precursor do presente invento.
Vinte e cinco nucleótidos é reconhecido por aqueles peritos na arte como um número suficiente de nucleótidos a 20
ΕΡ 1 979 375/PT serem específicos para o gene particular ou aglomerado de genes ou sua sub-sequência, como aqui descrito. Assim, os fragmentos incluem fragmentos de SEQ ID NO:100 ou SEQ ID NO:200 ou suas variantes tendo identidade de sequência significativa, que têm, pelo menos, 25, por exemplo, pelo menos 30, por exemplo, pelo menos 50, por exemplo, pelo menos 100, por exemplo, pelo menos 250 nucleótidos de comprimento.
Os promotores que são variantes daquelas sequências intergénicas estão também incluídos sendo concretizações preferidas, as sequências intergénicas específicas (ou suas partes). Em todos os casos, quando uma concretização preferida de um orf, gene, ácido nucleico, polipéptido ou promotor é definida por referência a uma sequência específica, o invento no seu sentido mais amplo destina-se a incluir concretizações tendo variantes daquela sequência específica. O termo "variante" como aqui utilizado relativamente a um ácido nucleico particular (o ácido nucleico de referência) significa: um qualquer ácido nucleico tendo uma sequência que é diferente da do ácido nucleico de referência, mas que é o seu complemento ou mostra identidade de sequência de ácidos nucleicos significativa com, ou hibridação sob condições rigorosas para, o ácido nucleico de referência ou o seu complemento ou um fragmento do ácido nucleico de referência ou do seu complemento; ou qualquer ácido nucleico que codifique uma sequência de aminoácidos tendo identidade de sequência de aminoácidos significativa com a sequência de aminoácidos codificada pelo ácido nucleico de referência, ou um fragmento daquele ácido nucleico. O termo "variante" refere-se também a ácidos nucleicos que diferem uns dos outros devido apenas à degeneração do código genético e que por conseguinte codificam sequências de aminoácidos deduzidos idênticos. Os ácidos nucleicos variantes do invento são adicionalmente definidos como se segue. Se um ácido nucleico variante do invento for introduzido nos aglomerados de genes aqui identificados, em vez da sequência da qual é uma variante, e o fragmento recombinante for introduzido numa célula hospedeira adequada sob condições adequadas de produção de lantibióticos (por exemplo, como mostrado nos Exemplos), vai então resultar na produção de uma molécula 21
ΕΡ 1 979 375/PT tendo uma ou mais atividades de um lantibiótico (especialmente atividade antibiótica). De preferência, a produção será regulada para ocorrer a elevada densidade de células. A identidade de sequência de ácidos nucleicos significativa é, de preferência, pelo menos, 50%, mais preferivelmente 60%, 70%, 80% ou 90%, ainda mais preferivelmente 95%, 98% ou 99%. A identidade de sequência de ácidos nucleicos significativa é, de preferência, mostrada entre ácido nucleico variante (ou uma sua porção) e um fragmento de, pelo menos, 30 resíduos do ácido nucleico de referência, mais preferivelmente um fragmento de, pelo menos, 60, 90 ou 120 resíduos, ainda mais preferivelmente um fragmento de 180, 240 ou 300 resíduos, mais preferivelmente, o ácido nucleico de referência completo. A "percentagem (%) de identidade de sequência de ácidos nucleicos" é definida como a percentagem de resíduos de nucleótidos numa sequência candidata que são idênticos aos resíduos de nucleótidos na sequência em comparação. Os valores de identidade aqui utilizados são produzidos pelo módulo BLASTN de WU BLAST-2 regulado nos parâmetros por defeito, com espaço de sobreposição e fração de sobreposição reguladas para 1 e 0,125, respetivamente.
Relativamente às variantes dos promotores utilizados no presente invento, a identidade de sequência de ácidos nucleicos é, de preferência, avaliada sobre uma sequência de, pelo menos, 30 resíduos, mais preferivelmente 40 ou 50 resíduos, ainda mais preferivelmente 60 resíduos.
As "condições rigorosas" ou as "condições de elevado rigor", como aqui definido, podem ser identificadas como aquelas que: (1) utilizam baixa força iónica e elevada temperatura para lavagem, por exemplo, cloreto de sódio 0,015M/citrato de sódio 0,0015M/dodecilsulfato de sódio a 0,1%, a 50°C; (2) utilizam durante a hibridação um agente desnaturante, tal como formamida, por exemplo, formamida a 50% (v/v) com albumina de soro de bovino a 0,1%/Ficoll a 0,1%/polivinilpirrolidona a 0,1%/tampão de fosfato de sódio 50mM a pH 6,5 com cloreto de sódio 750mM, citrato de sódio 22
ΕΡ 1 979 375/PT 75mM, a 42°C: ou (3) utilizam formamida a 50%, 5x SSC (NaCl 0,75M, citrato de sódio 0,075M), fosfato de sódio 50mM (pH 6,8), pirofosfato de sódio a 0,1%, solução de Denhardt 5x, ADN de esperma de salmão submetido a ultrassons (50 g/ml, SDS a 0,1% e sulfato de dextrano a 10%, a 42°C, com lavagens a 42°C em 0,2x SSC (cloreto de sódio/citrato de sódio) e formamida a 50%, a 55°C, seguidos por lavagem de elevado rigor constituída por 0,lx SSC contendo EDTA a 55°C.
Quando um ácido nucleico de interesse é referido como estando em "associação operativa" com um promotor ou sequência reguladora, isto significa que o promotor/sequência reguladora é capaz de dirigir a transcrição do ácido nucleico de interesse num sistema de expressão adequado, com o ácido nucleico de interesse na estrutura de leitura correta para tradução. De preferência, quando um ácido nucleico de interesse está em associação operativa com um promotor/sequência reguladora, o transcrito do ácido nucleico de interesse contém um sítio de ligação a ribossoma adequadamente localizado para expressão num sistema de expressão adequado do polipéptido codificado pelo ácido nucleico de interesse. Ver, por exemplo, Sambrook et al. (1989) e Ausubel et al. 25 (1995).
Quando um ácido nucleico é referido como "isolado", isto pode significar substancial ou completamente isolado de algum ou de todo o outro ácido nucleico normalmente presente em A. garbadínensís e/ou A. liguriae, especialmente ácido nucleico do exterior dos segmentos de aglomerados de genes aqui identificados. À luz da descrição anterior, dever-se-á observar que este invento proporciona sequências nucleotídicas ou um conjunto de sequências nucleotídicas que codificam o aglomerado de genes biossintéticos de actagardina ou actagardina B. Por conseguinte, o aglomerado de genes completo ou suas porções de, pelo menos, vinte e cinco nucleótidos contíguos pode ser utilizado para uma ampla variedade de aplicações, incluindo, mas não limitado a: expressão de actagardina ou actagardina B; utilização como sondas para analisar outros organismos quanto a moléculas relacionadas e semelhantes; utilização para induzir o silenciamento de genes e semelhantes. 23 ΕΡ 1 979 375/ΡΤ
Construção de Expressão
Num outro aspeto do invento, é proporcionada uma construção de expressão compreendendo um ácido nucleico que codifica um polipéptido aglomerado ou um polipéptido lantibiótico do invento operativamente ligado a um promotor.
Num outro aspeto, é fornecido um conjunto de construções de expressão. Um conjunto de construções de expressão compreende dois ou mais polipéptidos que codificam sequências do presente invento e, pelo menos, um promotor adequado para a expressão das referidas sequências. 0(s) promotor(es) pode (m) ser um promotor com o qual o gene polipeptidico esteja naturalmente associado a (ou no caso de uma variante, o promotor do gene a partir do qual a variante é derivada) , ou pode ser um promotor constitutivo ou indutivel funcional na célula hospedeira. Assim, os promotores incluem regiões intergénicas de SEQ ID NO:100 ou SEQ ID NO:200 a montante de qualquer uma das estruturas de leitura aberta indicadas nas Tabelas 1 e 2. 0(s) promotor(es) será(serão) operativamente ligado(s) aos ácidos nucleicos do conjunto de construções de expressão. Por "operativamente ligado" deve-se entender que o promotor será capaz de dirigir a transcrição do ácido nucleico de interesse num sistema de expressão adequado, com o ácido nucleico de interesse na estrutura de leitura correta para tradução. De preferência, quando um ácido nucleico de interesse está em associação operativa com um promotor/sequência reguladora, o transcrito do ácido nucleico de interesse contém um sítio de ligação de ribossomas adequadamente localizado para expressão num sistema de expressão adequado do polipéptido codificado pelo ácido nucleico de interesse. Ver, por exemplo, Sambrook et al. (1989), Ausubel et al. (2002) e Kieser (2000).
Os conjuntos de construções de expressão do invento incluem numerosas permutas de genes que codificam polipéptidos precursores e aglomerados do invento, como acima definido. Nos vários aspetos do invento, o conjunto vai incluir, pelo menos, um gene LanA. Exemplos de tais conjuntos são descritos como "Conjunto 1" a "Conjunto 7", abaixo, 24
ΕΡ 1 979 375/PT embora estes conjuntos devam ser entendidos como meramente ilustrativos e não limitantes.
Conjunto 1: Um gene LanA que codifica um polipéptido precursor, de preferência um polipéptido precursor capaz de ser convertido num composto do invento, mais um gene LanM que codifica um polipéptido LanM. 0 polipéptido LanM é, de preferência, um LanM de SEQ ID NO:120 ou uma sua variante, ou de SEQ ID NO:213 ou uma sua variante.
Conjunto 2: Um gene LanA que codifica um polipéptido precursor, de preferência um polipéptido precursor capaz de ser convertido num composto do invento, mais um gene LanR que codifica um polipéptido LanR. O polipéptido LanR é, de preferência, um LanR de SEQ ID NO:122 ou uma sua variante, ou de SEQ ID NO:216 ou uma sua variante.
Conjunto 3: Um gene LanA que codifica um polipéptido precursor, de preferência um polipéptido precursor capaz de ser convertido num composto do invento, mais um gene LanM que codifica um polipéptido LanM, mais um gene LanR que codifica um polipéptido LanR. O polipéptido LanM é, de preferência, um LanM de SEQ ID NO: 120 ou uma sua variante, ou de SEQ ID NO:213 ou uma sua variante. O polipéptido LanR é, de preferência, um LanR de SEQ ID NO:122 ou uma sua variante, ou de SEQ ID NO:216 ou uma sua variante.
Conjunto 4: Os genes do Conjunto 3 juntamente com um gene LanO que codifica um polipéptido LanO. O polipéptido LanO é, de preferência, SEQ ID NO:122 ou uma sua variante, ou SEQ ID NO:215 ou uma sua variante.
Conjunto 5: Os genes do Conjunto 3 ou do Conjunto 4 juntamente com um gene LanT que codifica um polipéptido LanT. O polipéptido LanT é, de preferência, SEQ ID NO: 123 ou uma sua variante, ou SEQ ID NO:214 ou uma sua variante.
Conjunto 6: Os genes de SEQ ID NOs:116 a 127 ou suas variantes.
Conjunto 7: Os genes de SEQ ID NOs:206 a 220 ou suas variantes. 25
ΕΡ 1 979 375/PT
Num aspeto, um conjunto vai compreender sequências que codificam todas polipéptidos lxx ou que codificam todas polipéptidos 2xx. No entanto, os conjuntos que são constituídos por polipéptidos lxx e 2xx não são excluídos do presente invento.
Vetor de Expressão Recombinante
Num outro aspeto, é fornecido um vetor recombinante compreendendo uma ou mais construções de expressão do invento. Num aspeto alternativo, é fornecido um conjunto de vetores recombinantes que compreende um conjunto de construções de expressão do invento. Os vetores adequados que compreendem ácido nucleico para introdução em bactérias podem ser escolhidos ou construídos, contendo elementos reguladores adicionais adequados, se necessário, incluindo promotores adicionais, fragmentos terminadores, elementos intensificadores, genes marcadores e outros elementos, como adequado. Os vetores podem ser plasmídeos, virais, por exemplo, fagos ou fagemídeos, como adequado. Para mais detalhes ver, por exemplo, Sambrook et ai. (1989) Molecular Cloning, A Laboratory Manual, 2a. ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor. Muitas técnicas e protocolos conhecidos para manipulação de ácido nucleico, por exemplo, na preparação de construções de ácido nucleico, mutagénese, sequenciação, introdução de ADN em células e expressão de genes e análise de proteínas, são descritos em detalhe em Ausubel et ai. (1995) Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995). Muitos aspetos da utilização destas técnicas no contexto de Streptomyces spp. são descritos em detalhe em Hopwood et al. (1985) Genetic manipulation of Streptomyces a laboratory manual (Norwich: John Innes Foundation) e Practical
Streptomyces Genetics (2000) Kieser T. et al., The John Innes Foundation p.386. As descrições de Sambrook et al., Ausubel et al., Hopwood et al. e Kieser et al. são todas aqui incorporadas por referência para este e todos os outros fins.
Cassetes de Expressão
Num outro aspeto, os inventores desenvolveram um sistema de vetor útil para produção e análise de derivados 26
ΕΡ 1 979 375/PT lantibióticos de actagardina B. Isto é alcançado por introdução de um ou mais sítios de reconhecimento de endonuclease de restrição no gene LanA que codifica SEQ ID N0:1, 11 ou 212 de forma a produzir um sistema de cassete de expressão. Assim, num outro aspeto, o invento proporciona uma cassete de ADN recombinante que compreende uma sequência nucleotídica que codifica um polipéptido precursor de actagardina B, em que a referida sequência compreende um primeiro sítio de restrição na ou adjacente à região de codificação N-terminal da sequência de codificação; opcionalmente, um segundo sítio de restrição a jusante do primeiro sítio de restrição e na sequência de codificação; e um terceiro sítio de restrição na ou adjacente à região de codificação C-terminal da sequência de codificação, em que, pelo menos, um dos referidos sítios de restrição não ocorre na sequência de codificação de LanA mostrada como SEQ ID NO:200.
Num outro aspeto, é fornecida uma cassete de ADN recombinante que compreende uma sequência nucleotídica que codifica um polipéptido precursor de actagardina, em que a referida sequência compreende um primeiro sítio de restrição na ou adjacente à região de codificação N-terminal da sequência de codificação; opcionalmente, um segundo sítio de restrição a jusante do primeiro sítio de restrição e na sequência de codificação; e um terceiro sítio de restrição na ou adjacente à região de codificação C-terminal da sequência de codificação, em que, pelo menos, um dos referidos sítios de restrição não ocorre na sequência de codificação de LanA mostrada como SEQ ID NO:100.
Em geral, todos os dois ou três sítios serão diferentes uns dos outros. É também desejável que quando a cassete seja transportada por um vetor, os sítios sejam únicos para aquele vetor.
Num aspeto preferido, o sítio de enzima de restrição que não ocorre naturalmente é o segundo sítio de restrição e está localizado entre os codões 5 e 16, tal como entre 6 e 15, da sequência de codificação de SEQ ID NO:l ou SEQ ID NO:4. 27
ΕΡ 1 979 375/PT A cassete vai desejavelmente incluir uma sequência de comando LanA e um promotor LanA e pode incluir adicionalmente um ou mais genes aglomerados, particularmente quando um tal gene aglomerado é necessário para complementar a perda do gene de célula hospedeira equivalente. A cassete do invento acima descrita pode ser concebida numa variedade de formas. Por exemplo, o fragmento obtido por clivagem da cassete entre o primeiro e o segundo, o primeiro e o terceiro, ou o segundo e o terceiro, sitios de restrição pode ser substituído por uma sequência de codificação variante que codifica uma variante de lantibiótico A. Assim, o invento proporciona uma variante da cassete do invento em que a referida variante tem de 1 a 15 substituições de nucleótidos na região de codificação da sequência de codificação.
Como um intermediário para a produção de uma tal variante, a sequência entre o primeiro e o segundo, o primeiro e o terceiro ou o segundo e o terceiro sítios de restrição pode ser substituída por um fragmento de enchimento maior.
Num outro aspeto, a cassete que codifica um derivado lantibiótico pode ser utilizada para transformar uma célula hospedeira para expressar o derivado, por exemplo, para avaliar as suas propriedades antibacterianas.
Num aspeto, pode-se preparar uma multiplicidade de cassetes de expressão para proporcionar uma biblioteca de derivados diferentes, que podem depois ser analisados quanto à atividade.
Uma cassete de expressão do invento pode ser baseada num qualquer vetor de clonagem e expressão utilizado na arte para a expressão de genes em células hospedeiras. Tais vetores incluem uma ou mais origens de replicação, que podem ser sensíveis à temperatura. Os vetores podem incluir um marcador selecionável, tal como gene cloranfenicol-acetiltransferase, o gene de resistência à eritromicina, o gene de resistência à apramicina ou o gene de resistência à tetraciclina. 0 vetor pode também conter uma região alvo, sendo esta região 28
ΕΡ 1 979 375/PT homóloga a uma sequência genómica presente na célula hospedeira fora do aglomerado de gene LanA. Um tal vetor pode ser utilizado para integrar a cassete na sequência genómica homóloga à região alvo. A cassete de expressão pode também compreender um ou mais genes aglomerados adicionalmente ao gene LanA ou seu derivado. Quando a célula hospedeira é uma célula hospedeira ALanA em que o gene LanA foi inativado de uma forma que também inativa um tal gene aglomerado (por exemplo, na estirpe descrita em Altena et al., 2000), é desejável que este gene ou um gene equivalente seja fornecido na cassete de expressão.
Como aqui utilizado, por "na ou adjacente à região de codificação N-terminal" pretende-se dizer que a primeira base do sitio de restrição está localizada numa posição de seis resíduos a montante do codão ATG da sequência de comando LanA até não mais de seis codões a jusante do primeiro codão do pró-péptido. De preferência, a primeira base do sítio de restrição está localizada numa posição de doze, de preferência seis, resíduos a montante até seis resíduos a jusante do primeiro codão da sequência que codifica pró-péptido .
Num aspeto, o primeiro sítio de restrição é um sítio BglII.
Similarmente, por "na ou adjacente à região de codificação C-terminal" pretende-se dizer que a primeira base do sítio de restrição ou inclui, pelo menos, um dos nucleótidos do codão de terminação do pró-péptido ou o nucleótido 5' ou 3' do sítio de restrição não tem mais do que doze, de preferência seis, resíduos a jusante ou a montante, respetivamente, do codão de terminação.
Num aspeto, o terceiro sítio de restrição é um sítio Avrl I. O segundo sítio de restrição, quando presente, vai-se situar entre o primeiro e o terceiro sítios de restrição. De preferência, o sítio de restrição inclui, pelo menos, um 29 ΕΡ 1 979 375/ΡΤ nucleótido presente no codão 5 até ao codão 16, de preferência do codão 8 ao 16 da sequência que codifica pró-péptido. Nos exemplos acompanhantes, foi introduzido um sitio BsrGl alterando os codões 6 e 7 da sequência que codifica ActA. No entanto, estão também contempladas pelo presente invento outras alterações. É também possível introduzir mais de uma alteração de modo a que a cassete de expressão inclua dois ou mais sítios entre o primeiro e o terceiro sítios de restrição. A cassete pode incluir dois ou três sítios de restrição que não ocorrem naturalmente. No exemplo acompanhante, todos os três sítios não ocorrem normalmente na sequência ActA codificada por SEQ ID NO:100. A cassete de expressão simplifica a rápida produção de derivados lantibióticos, como adicionalmente aqui discutido abaixo.
Num aspeto, a região entre o primeiro e o segundo sítios, o primeiro e o terceiro ou o segundo e o terceiro sítios, pode ser substituída por um fragmento de enchimento (stuffer fragment) . Quando estão presentes dois ou mais sítios entre o primeiro e o terceiro sítios, a região entre um qualquer par de tais sítios pode também ser substituída por um fragmento de enchimento. Um fragmento de enchimento é um pedaço de ADN que é maior do que a sequência que substitui. 0 fragmento de enchimento pode ter de 50 a 5000 nucleótidos de tamanho, por exemplo, de cerca de 500 a 2000 nucleótidos de tamanho. 0 valor da introdução destes fragmentos de ADN de enchimento é que quando a região é substituída por um oligonucleótido que codifica lantibiótico, haja uma redução significativa no tamanho do plasmídeo. O plasmídeo resultante pode assim ser facilmente purificado de uma qualquer população menor de plasmídeo não restringido eliminando assim qualquer fundo.
Uma cassete do invento pode ser utilizada para introduzir alterações específicas na sequência ActA num vetor que pode então ser introduzido numa célula hospedeira para expressão de um lantibiótico. Para se alcançar isto, a 30
ΕΡ 1 979 375/PT sequência é, desejavelmente, operativamente ligada à sequência de comando LanA (por exemplo, ActA ou LigA) , que por seu lado é operativamente ligada ao promotor LanA (por exemplo, ActA ou LigA).
Adicionalmente, ou como alternativa, o vetor compreendendo a cassete pode também incluir um gene LanR. O gene LanR vai estar localizado a jusante de, e em série com, a sequência de codificação de lantibiótico A.
Bibliotecas de Expressão
As cassetes de expressão do invento podem ser utilizadas para proporcionar bibliotecas de genes que codificam lantibióticos. Tais bibliotecas podem ser preparadas por introdução na cassete, entre o primeiro e o segundo sítios de restrição, o primeiro e o terceiro sítios de restrição ou o segundo e o terceiro sítios de restrição, de uma multiplicidade de sequências cada uma das quais corresponde à sequência ActA ou LigA correspondente para além de ter de 1 a 15, por exemplo, de 1 a 10, de preferência, de 1 a 6, por exemplo, de 1 a 3 alterações de nucleótidos quando comparadas com a porção pró-péptido de SEQ ID N0s:100 ou 200. De preferência, tais alterações resultam numa alteração na proteína codificada pela sequência. No entanto, as alterações de não-codificação não são excluídas.
As bibliotecas formam um outro aspeto do invento. Tais bibliotecas podem compreender de 10 a 100000, tal como de 10 a 10000, por exemplo, de 10 a 1000 sequências de codificação diferentes que são variantes da sequência de codificação do lantibiótico A de uma cassete de expressão.
Uma cassete de expressão que codifica um derivado de lantibiótico A pode ser introduzida numa célula hospedeira para expressão do lantibiótico.
Numa concretização, a biblioteca pode ser transformada em células hospedeiras e as colónias isoladas e/ou analisadas quanto à atividade antibacteriana. Podem-se determinar as sequências do lantibiótico A expressas por colónias individuais que apresentam tal atividade. Quando o 31
ΕΡ 1 979 375/PT lantibiótico A apresenta atividade, o invento proporciona adicionalmente um lantibiótico obtido pelo método do invento. Célula Hospedeira São considerados pelo presente invento dois tipos principais de células hospedeiras. 0 primeiro tipo de célula hospedeira é uma célula hospedeira produtora de lantibiótico. Alternativamente, a célula hospedeira pode ser uma célula não produtora, i.e. não contém um gene LanA ou os seus genes aglomerados associados necessários para produzir um polipéptido LanA.
Numa concretização, o invento proporciona uma célula hospedeira transformada com um conjunto de construções de expressão do invento. 0 conjunto de construções pode ser qualquer um dos Conjuntos 1 a 7 como acima definido, ou um conjunto baseado numa qualquer outra combinação de ácidos nucleicos que codificam polipéptido precursor e aglomerado. Numa outra concretização, a célula hospedeira pode ser transformada com uma cassete de expressão do invento.
Numa outra concretização, é fornecida uma biblioteca de células hospedeiras, compreendendo cada uma uma cassete de expressão diferente do invento.
Uma Célula hospedeira produtora de lantibiótico
Numa concretização, a célula hospedeira pode ser uma célula hospedeira produtora de lantibiótico. Uma célula hospedeira produtora de antibiótico é aquela na qual uma construção de expressão compreendendo um gene LanA, se introduzida na célula na ausência de um qualquer gene aglomerado, vai ser expressa, produzindo um polipéptido LanA. Tais células incluem uma qualquer célula produtora de lantibiótico tipo B tal como uma qualquer estirpe de um bacilo, um actinomiceto ou um estreptomiceto (por exemplo, 5. lividans ou S. coelicolor) que produz um lantibiótico. Exemplos de tais células incluem uma célula hospedeira produtora de cinamicina (Streptomyces cinnamoneus cinnamoneus DSM 40005), ou uma Actinoplanes garbadinensis ou A. liguriae NCIMB 41362 produtoras de actagardina. 32
ΕΡ 1 979 375/PT
Quando o invento se refere às produções de compostos da fórmula (I) na qual -X1-X2- representa -Leu-Val-, a célula hospedeira pode ser A. liguriae NCIMB 41362 sem qualquer modificação adicional.
Num aspeto, uma célula hospedeira desta classe pode compreender uma mutação no seu gene LantibioticA endógeno de modo a que o gene não seja expresso ou o produto de gene seja inativo. Uma tal célula hospedeira pode ser obtida por recombinação homóloga alvo para delecionar ou mutar o gene LanA da célula hospedeira. Os métodos para alcançar isto são conhecidos como tal na arte e são ilustrados em Altena et ai., (2000) e na WO 2005/093069, cujas descrições são aqui incorporadas por referência. A célula hospedeira resultante é referida como célula hospedeira ALanA. Numa concretização particular, a célula hospedeira é uma célula hospedeira AlignA de A. liguriae NCIMB 41362 na qual o gene LigA foi inativado, por exemplo, por mutação ou deleção, por exemplo deleção causada por recombinação homóloga. Numa outra concretização, a célula hospedeira é uma célula hospedeira LActA de A. garbadinensis na qual o gene ActA foi inativado, por exemplo, por mutação ou deleção, por exemplo, deleção causada por recombinação homóloga. A transformação de uma célula hospedeira deste tipo com outros genes aglomerados é também contemplada pelo presente invento, embora quando a célula hospedeira proporciona genes aglomerados necessários para a produção de um LanA, o fornecimento de tais genes aglomerados seja opcional. Célula não produtora
Uma célula não produtora pode ser uma qualquer célula hospedeira na qual a expressão de um gene LanA que codifica um polipéptido precursor capaz de ser convertido em actagardina ou numa sua variante ou num composto do invento, pode produzir um tal produto desde que o gene LanA seja introduzido nas células como parte de um conjunto de construções de expressão que são capazes de converter um polipéptido precursor em actagardina ou numa sua variante, ou num composto do invento. 33
ΕΡ 1 979 375/PT
Uma célula hospedeira não produtora pode ser uma célula hospedeira bacteriana. As células hospedeiras bacterianas incluem um actinomiceto ou um estreptomiceto, por exemplo, S. lividans, S. coelicolor ou S. cinnamoneus.
As células hospedeiras podem ser aquelas nas quais o gene LanO é inativado por mutação ou deleção (ou no caso de células não produtoras, não presente) ou aquelas nas quais a expressão do gene LanO está aumentada, por exemplo, por fornecimento de duas ou mais cópias do gene ou por ligação do gene a um promotor que intensifica a expressão na célula hospedeira. A modulação do gene lanO desta forma pode ser desejável para alterar os níveis relativos de formas oxidadas (Y = —S (0) -) e reduzidas (Y = -S) de compostos do invento produzidos na célula hospedeira.
Produção de Compostos do Invento 0 invento proporciona também um método de preparação de um composto de fórmula: z
COOH na qual: -X1-X2- representa -Leu-Val-; -Y- é -S-; Z é Ala ou -NH2 em que o último representa o N-terminal da Ala na posição 1, método que compreende a expressão de um ácido nucleico que codifica uma sequência de SEQ ID N0:1 ou SEQ ID NO:11, e, opcionalmente, quando necessário, genes aglomerados associados necessários para conversão do 34 ΕΡ 1 979 375/ΡΤ polipéptido precursor no produto. 0 ácido nucleico pode ser expresso em A. liguriae. A A. liguriae pode ser a A. liguriae depositada conforme o Tratado de Budapeste sob o número de depósito NCIMB 41362.
Os compostos do invento podem ser produzidos por expressão de um ácido nucleico, por exemplo, na forma de uma construção de expressão que codifica um polipéptido precursor transportado num vetor de expressão recombinante, numa célula hospedeira que transporta um gene LanA em conjunto com, quando necessário, genes aglomerados associados necessários para conversão do polipéptido precursor no produto. Como acima indicado, quando o invento se refere à produção de compostos da fórmula (I) na qual -X1-X2- representa -Leu-Val-, a célula hospedeira pode ser A. liguriae NCIMB 41362 sem qualquer modificação adicional. A introdução da cassete de expressão, ou vetor(es) numa célula hospedeira pode (particularmente para a introdução in vitro) ser geralmente referida sem limitação como "transformação". Isto pode utilizar uma qualquer técnica disponível. Para células bacterianas, as técnicas adequadas podem incluir a transformação com cloreto de cálcio, a transformação assistida por polietilenoglicol, a eletroporação, a conjugação e a transfecção ou transdução utilizando bacteriófagos.
Num aspeto, o presente invento proporciona um método de expressão de ácido nucleico do invento, método que compreende proporcionar uma cultura de células hospedeiras (ou outro sistema de expressão) da célula hospedeira, de modo a expressar o ácido nucleico de interesse. 0 ácido nucleico de interesse estará numa cassete de expressão, de modo a que a cultura da célula hospedeira conduza à produção de um produto do invento.
De preferência, o ácido nucleico de interesse é substancialmente expresso apenas quando a cultura de células hospedeiras atinge uma elevada densidade de células, mais preferivelmente na ou próximo da fase estacionária da cultura de células hospedeiras. As culturas de células na ou próximo da fase estacionária podem ter valores de DO650 no intervalo 35
ΕΡ 1 979 375/PT de 1-20. Os métodos conhecidos de cultura de células são bem conhecidos na arte, por exemplo, Sambrook et ai. (1989), Ausubel et al. (2002), e (em particular para Streptomyces spp.) Kieser et al. (2000). Os produtos de expressão dos sistemas de expressão podem ser recolhidos e purificados. Os métodos de isolamento podem compreender a captura a partir do meio de fermentação utilizando técnicas de extração com solventes, resina de adsorção tais como resinas hidrofóbicas ou métodos de precipitação tais como precipitação com sulfato de amónio. Os métodos de purificação podem incluir técnicas de cromatografia tais como permuta iónica, interação hidrofóbica, extração em fase inversa, fase normal, fase sólida e HPLC, por exemplo, como descrito na US 5112806 para o isolamento de mersacidina.
Após cultura da célula, os compostos do invento podem ser recuperados a partir da cultura de células hospedeiras. Os compostos recuperados podem ser formulados na forma de uma composição farmacêutica, opcionalmente na forma de um sal farmaceuticamente aceitável.
Quando as células hospedeiras produzem uma mistura de compostos do invento, por exemplo, aqueles em que Y é -S- ou -S (0) - ou aqueles em que Z é NH2 ou Ala-, ou misturas dos quatro tipos, os produtos podem ser isolados utilizando técnicas de separação padrão tal como hplc, por exemplo, como descrito na US 6022851 para a produção de Actagardina e Ala-Actagardina.
Os compostos recuperados podem ser formulados na forma de uma composição farmacêutica, opcionalmente na forma de um sal farmaceuticamente aceitável.
Sal farmaceuticamente aceitável
Um "sal farmaceuticamente aceitável", pode ser um sal de adição de ácido no qual a base conserva a eficácia biológica e propriedades do composto e é fisiologicamente aceitável. Tais sais incluem aqueles formados com ácidos inorgânicos tais como ácido clorídrico, ácido bromídrico, ácido sulfúrico, ácido nítrico, ácido fosfórico e semelhante, e ácidos orgânicos tais como ácido acético, ácido propiónico, 36
ΕΡ 1 979 375/PT ácido glicólico, ácido pirúvico, ácido oxálico, ácido málico, ácido malónico, ácido succínico, ácido maleico, ácido fumárico, ácido tartárico, ácido cítrico, ácido benzoico, ácido cinâmico, ácido mandélico, ácido matanossulfónico, ácido etanossulfónico, ácido p-toluenossulfónico, ácido salicilico e semelhante.
Os sais incluem também sais básicos, tal como um sal de alcalino ou de metal alcalino-terroso, por exemplo um sal de sódio, potássio, cálcio ou magnésio.
Composições Farmacêuticas
Os lantibióticos do presente invento podem ser formulados em conjunto com um ou mais de outros ingredientes farmaceuticamente aceitáveis bem conhecidos daqueles peritos na arte, incluindo, mas não limitados a, veículos, adjuvantes, excipientes, diluentes, enchimentos, tampões, conservantes, antioxidantes, lubrificantes, estabilizantes, solubilizantes, tensioativos (por exemplo, agentes humectantes), agentes mascarantes, agentes corantes, agentes aromatizantes e agentes edulcorantes, farmaceuticamente aceitáveis. A formulação pode compreender adicionalmente outros agentes ativos, por exemplo, outros agentes terapêuticos ou profiláticos. Assim, o presente invento proporciona adicionalmente composições farmacêuticas, como acima definido, e métodos de preparação de uma composição farmacêutica compreendendo a mistura de, pelo menos, um composto ativo, como acima definido, juntamente com um ou mais de outros ingredientes farmaceuticamente aceitáveis bem conhecidos daqueles peritos na arte, por exemplo, veículos, adjuvantes, excipientes, etc. Se formulados como unidades descontínuas (por exemplo, comprimidos, etc.) cada unidade contém uma quantidade pré-determinada (dosagem) do composto ativo. 0 termo "farmaceuticamente aceitável" como aqui utilizado refere-se a compostos, ingredientes, materiais, composições, formas de dosagem, etc., que são, no âmbito do juízo médico, adequados para utilização em contacto com os tecidos do sujeito em questão (por exemplo, humano) sem toxicidade excessiva, irritação, resposta alérgica ou outros 37
ΕΡ 1 979 375/PT problemas ou complicações, proporcionados com uma relação beneficio/risco razoável. Cada veiculo, adjuvante, excipiente, etc. deve também ser aceitável no sentido de ser compatível com os outros ingredientes da formulação.
As composições podem ser formuladas para uma qualquer via e meio de administração, adequados. Os veículos ou diluentes farmaceuticamente aceitáveis incluem aqueles utilizados nas formulações adequadas para administração oral, retal, nasal, cutânea (incluindo bucal e sublingual), vaginal ou parentérica (incluindo subcutânea, intramuscular, intravenosa, intradérmica, intratecal e epidural). As formulações podem ser adequadamente apresentadas na forma de dose unitária e podem ser preparadas por um qualquer dos métodos bem conhecidos na arte de farmácia. Tais métodos incluem o passo de tornar em associação o ingrediente ativo com o veículo que constitui um ou mais ingredientes acessórios. Em geral, as formulações são preparadas formando uma associação uniforme e íntima do ingrediente ativo com veículos líquidos ou veículos sólidos finamente divididos ou ambos, e depois, se necessário, modelação do produto.
Para composições sólidas, podem ser utilizados veículos sólidos não tóxicos, convencionais, que incluem, por exemplo, graus farmacêuticos de manitol, lactose, celulose, derivados de celulose, amido, estearato de magnésio, sacarina sódica, talco, glucose, sacarose, carbonato de magnésio e semelhantes. 0 composto ativo como acima definido pode ser formulado como supositórios utilizando, por exemplo, polialquilenoglicóis, triglicéridos acetilados e semelhantes, como veículo. As composições líquidas farmaceuticamente administráveis podem, por exemplo, ser preparadas por dissolução, dispersão, etc., de um composto ativo como acima definido e adjuvantes farmacêuticos opcionais num veículo, tal como, por exemplo, água, dextrose em solução salina, glicerol, etanol e semelhantes, para formar assim uma solução ou suspensão. Se desejado, a composição farmacêutica a ser administrada pode também conter quantidades menores de substâncias auxiliares não tóxicas tais como agentes humectantes ou emulsionantes, agentes tamponantes de pH e semelhantes, por exemplo, acetato de sódio, monolaurato de sorbitano, acetato de sódio trietanolamina, oleato de 38
ΕΡ 1 979 375/PT trietanolamina, etc. Os métodos atuais de preparação de tais formas de dosagem são conhecidos, ou serão evidentes, para aqueles peritos na arte; por exemplo, ver "Remington: The Science and Practice of Pharmacy", 20a Edição, 2000, pub. Lippincott, Williams & Wilkins. A composição ou formulação a ser administrada vai, de qualquer forma, conter uma quantidade do(s) composto(s) ativo(s) numa quantidade eficaz para aliviar os sintomas do sujeito a ser tratado.
Podem-se preparar formas de dosagem ou composições contendo ingrediente ativo no intervalo de 0,25 a 95% com o equilíbrio feito a partir de veículo não tóxico.
Para administração oral, uma composição não tóxica farmaceuticamente aceitável é formada pela incorporação de qualquer um dos excipientes normalmente utilizados, tais como, por exemplo, graus farmacêuticos de manitol, lactose, celulose, derivados de celulose, croscarmelose sódica, amido, estearato de magnésio, sacarina sódica, talco, glucose, sacarose, magnésio, carbonato e semelhante. Tais composições tomam a forma de soluções, suspensões, comprimidos, pílulas, cápsulas, pós, formulações de libertação prolongada e semelhantes. Tais composições podem conter l%-95% de ingrediente ativo, mais preferivelmente 2-50%, ainda mais preferivelmente 5-8%. A administração parentérica é geralmente caracterizada por injeção, quer subcutânea, quer intramuscular quer intravenosa. Os injetáveis podem ser preparados em formas convencionais, quer como soluções ou suspensões líquidas, formas sólidas adequadas para solução ou suspensão em líquido antes da injeção, ou como emulsões. Os excipientes adequados são, por exemplo, água, solução salina, dextrose, glicerol, etanol ou semelhante. Adicionalmente, se desejado, as composições farmacêuticas a serem administradas podem também conter quantidades menores de substâncias auxiliares não tóxicas tais como agentes humectantes ou emulsionantes, agentes tamponantes de pH e semelhantes, tais como, por exemplo, acetato de sódio, monolaurato de sorbitano, oleato de trietanolamina, acetato de sódio trietanolamina, etc.
Para aplicações cutâneas, as composições farmaceuticamente aceitáveis podem ser formuladas numa pomada 39 ΕΡ 1 979 375/ΡΤ ou gel adequados contendo o componente ativo suspenso ou dissolvido num ou mais veículos. Os veículos para administração cutânea dos compostos deste invento incluem, mas não estão limitados a, óleo mineral, vaselina líquida, vaselina branca, propilenoglicol, polioxietileno, composto de polioxipropileno, cera emulsionante e água. Alternativamente, as composições farmaceuticamente aceitáveis podem ser formuladas numa loção ou creme adequados contendo os componentes ativos suspensos ou dissolvidos num ou mais veículos farmaceuticamente aceitáveis. Os veículos adequados incluem, mas não estão limitados a, óleo mineral, monostearato de sorbitano, polissorbato 60, cera de ésteres de cetilo, álcool cetearílico, 2-octildodecanol, álcool benzílico e água. A percentagem de composto ativo contida em tais composições parentéricas ou cutâneas está altamente dependente da sua natureza específica, assim como da atividade do composto e das necessidades do sujeito. No entanto, são utilizáveis percentagens de ingrediente ativo de 0,1% a 10% p/p, que serão superiores se a composição for um sólido que vai ser subsequentemente diluído nas percentagens acima indicadas. De preferência, a composição vai compreender 0,2-2% p/p do agente ativo em solução.
Ensinamentos adicionais relativos a veículos, adjuvantes, excipientes, etc., adequados, podem ser encontrados nos textos farmacêuticos padrão, por exemplo, Remington: The Science and Practice of Pharmacy", 20a Edição, 2000, pub. Lippincott, Williams & Wilkins; e Handbook of Pharmaceutical Excipients, 2a edição, 1994.
Administração de Compostos
Os compostos lantibióticos e as composições do invento podem ser administrados a um sujeito num método de tratamento médico ou de profilaxia. 0 sujeito pode ser um sujeito humano ou animal. O sujeito animal pode ser um mamífero ou um outro vertebrado.
Assim, é proporcionado um composto do invento para utilização num método de tratamento ou profilaxia de um 40
ΕΡ 1 979 375/PT sujeito. É também proporcionada a utilização de um composto do invento no fabrico de um medicamento para utilização num método de tratamento ou profilaxia de um sujeito. 0 método de tratamento pode ser de uma infeção bacteriana, incluindo infeção da pele, mucosas, entérica ou sistémica.
As variantes e a composição podem ser utilizadas para tratamento sistémico de bacterémia (incluindo bacterémia relacionada com catéter), pneumonia, infeções da pele e da estrutura da pele (incluindo infeções no local da cirurgia), endocardite e osteomielite. Estes e outros de tais tratamentos podem ser direcionados contra agentes causadores tais como estafilococos, estreptococos, enterococos. Os compostos do invento ou suas composições podem também ser utilizados para tratamento cutâneo de infeções da pele incluindo acne i.e. Propionibacterium acnes. As variantes e suas composições podem também ser utilizadas no tratamento de infeções oculares, tais como conjuntivite, e para tratamento oral da superinfeção dos intestinos, tal como aquela causada por Clostridium difficile incluindo C. difficile multiplamente resistente (colite pseudomembranosa) ou infeções do intestino associadas a Helicobacter pylori.
As variantes podem também ser utilizadas no tratamento ou prevenção da infeção da pele em feridas ou queimaduras. Adicionalmente, as variantes e suas composições podem ser utilizadas em métodos profiláticos, tais como para a depuração das narinas para prevenir a transmissão de MRSA. Isto pode ser praticado em sujeitos em risco de infeção (por exemplo, doentes que entram num hospital) ou em profissionais de saúde ou noutros prestadores de cuidados em risco de serem veículos de tais infeções. A depuração profilática da flora intestinal prévia à cirurgia abdominal está também contemplada.
Os compostos de acordo com o invento podem ser entérica (oralmente), parentérica (intramuscular ou intravenosamente) retal ou localmente (cutaneamente) administrados. Eles podem ser administrados na forma de soluções, pós (comprimidos, cápsulas incluindo microcápsulas) , pomadas (cremes ou geles) 41
ΕΡ 1 979 375/PT ou supositórios. Possíveis auxiliares para as formulações deste tipo são os enchimentos e extensores, solventes, emulsionantes, lubrificantes, corretores de aroma, corantes e/ou substâncias tampão, líquidos ou sólidos farmaceuticamente utilizados. Como dose adequada, administram-se 0,1-1000, de preferência, 0,2-100, mg/kg de peso corporal. Eles são adequadamente administrados em doses unitárias que contêm, pelo menos, a quantidade diariamente eficaz dos compostos de acordo com o invento, por exemplo, 30-3000, de preferência, 50-1000, mg. A base experimental do presente invento, incluindo o seu melhor modo, será agora adicionalmente descrito em detalhe, apenas como exemplo, com referência aos desenhos acompanhantes. EXEMPLO 1 - Clonagem de Aglomerados de Genes
Identificação e clonagem de aglomerados de genes biossintéticos de actagardina a partir de A. garbadinensis e A. liguriae. O/SBDIG-1 é um oligonucleótido degenerado marcado com digoxigenina (DIG) composto por 48 bases. Ele foi concebido por tradução da sequência de aminoácidos conhecida de actagardina e considerando a utilização do codão para Actinoplanes. A análise de hibridação Southern do ADN genómico isolado a partir de A. garbadinensis e digerido utilizando a enzima de restrição NcoI, identificou um fragmento de ~3kb que hibridou em O/SBDIG-1. Repetiu-se a digestão com NcoI do ADN genómico e isolaram-se os fragmentos de ADN de ~3kb que se clonaram em cortes de NcoI pLITMUS28 (NEB). Os plasmídeos resultantes foram introduzidos em células DH10B de E. coli e depois analisados por hibridação Southern utilizando a sonda O/SBDIG-1. Identificou-se um clone de hibridação que foi submetido para análise de sequência. A sequenciação revelou que este plasmídeo designado pLITAGOl consistia em ADN que codifica o gene estrutural LanA para biossíntese de actagardina (actA) juntamente com uma região a montante que se pensa codificar uma porção de um transportador de açúcar ABC e uma região a jusante que codifica parcialmente LanM (actM) . 42
ΕΡ 1 979 375/PT
Os iniciadores O/ACT08F e O/ACT09R foram concebidos com base na sequência de pLITAGOl. Utilizando estes iniciadores numa reação de PCR juntamente com os dNTPs marcados com DIG (Roche) e pLITAGOl como matriz, produziu-se um fragmento de ADN marcado com DIG de 2296 pb que foi designado SBDIG-2.
Produziram-se duas bibliotecas de cosmideos por clonagem de ADN genómico digerido com Sau3AI de A. garbadinensis ATCC 31049 e A. liguriae NCIMB 41362, no cosmideo SuperCosl (Stratagene) previamente digerido utilizando BamHI. Cada biblioteca de cosmideo foi analisada por hibridação Southern utilizando SBDIG-1. Vinte e cinco cosmideos de cada biblioteca que se pensa hibridarem em SBDIG-1 foram selecionados e reanalisados através de hibridação Southern utilizando as sondas O/SBDIG-1 e SBDIG-2. Nove cosmideos derivados de ADN genómico de A. garbadinensis e sete cosmideos derivados de ADN genómico de A. liguriae hibridaram nas duas sondas. O ADN foi isolado a partir de cada cosmideo e sequenciado utilizando os iniciadores T3 e T7. Os cosmideos CosAL02 e CosAG14 foram subsequente e completamente sequenciados (Instalação de sequenciação, Departamento de Bioquímica, Universidade de Cambridge).
Materiais e métodos
Estirpes
As estirpes bacterianas utilizadas no presente invento estão sumarizadas na Tabela 5.
Vetores O cosmideo SuperCosl foi obtido a partir de Stratagene. O palsmídeo pLITMUS foi obtido a partir de New England Biolabs. 43 ΕΡ 1 979 375/ΡΤ
Iniciadores
Nome do Iniciador SEQ. ID Sequência 5'-3' O/SBDIG-1 300 TGGGTSTGCACSCTSACSATCGARTGCGGNACSG TSATCTGCGCSTGC O/ACT08F 301 TCCAGCACGCGCGGGG O/ACT09R 302 GTTCGACCAGCCGCCC
Hibridação Southern
Marcação de sonda de ADN
As sondas de hibridação de ADN foram preparadas utilizando a marcação de ADN por PCR com Digoxigenina (DIG) e estojo de deteção fornecido por Roche, de acordo com as suas instruções.
Transferência de ADN para membranas de nylon 0 ADN de interesse foi inicialmente separado por eletroforese em gel de agarose e transferido para uma membrana de nylon (Hybond-N, Amersham Int., UK) utilizando um mata-borrão em vácuo (Q BIO gene). 0 tempo gasto para depurinação do ADN utilizando HC1 0,5M foi calculado pelo tempo gasto pela banda de marcador azul de bromofenol se tornar completamente amarela (tipicamente 15-20 min para um gel de agarose a 0,7%) . O ADN foi então sistematicamente desnaturado com NaCl 1,5M, NaOH 1,5M e depois neutralizado utilizando Tris 0,5M, NaCl 1,5M, pH 8,0 durante mais 15-20 min cada. A mancha completa do ADN foi facilitada por inundação com SSC 2 0x durante um mínimo de 60 min. Após remoção da membrana manchada do vácuo, esta foi deixada secar ao ar, à temperatura ambiente. 0 ADN foi reticulado colocando a membrana (ADN de face para baixo) num transiluminador de UV (UVP) e expondo este a UV a um comprimento de onda de 365 nm durante 5 min.
Elevações de colónias e hibridação
As colónias a serem analisadas por hibridação foram transferidas para uma membrana de nylon (Roche diagnostics). Isto foi alcançado colocando a membrana de nylon 44
ΕΡ 1 979 375/PT positivamente carregada sobre as colónias e premindo fortemente durante 1 min para assegurar a transferência efetiva. Os pontos de referência foram marcados na membrana para indicar a sua orientação relativamente às colónias. Após isto, a membrana foi removida e preparada para hibridação como indicado no manual do utilizador da Roche (manual de Aplicação DIG para hibridação por filtração).
Hibridação e desenvolvimento de membranas 0 ADN foi hibridado com a sonda preparada durante a noite (~16h) a 68°C numa estufa de hibridação HB-1000 (UVP) . Após hibridação, a membrana foi lavada durante 2 períodos de 5 min à temperatura ambiente utilizando sal de citrato de sódio (SSC) 2x + dodecilsulfato de sódio (SDS) a 0,1%. Estas lavagens foram seguidas por uma segunda série de lavagens de 2x15 min a 68°C utilizando SSC lx + SDS a 0,1% para a membrana hibridada na presença de SBDIG-1 e SSC 0,lx + SDS a 0,1% para a membrana analisada utilizando SBDIG-2. As membranas foram então desenvolvidas como recomendado no manual do utilizador da Roche (manual de Aplicação DIG para hibridação por filtração).
Software
As sequências de consenso foram analisadas utilizando FramePlot versão 2.3.2, editor de alinhamento de sequências BioEdit, ClustalW (EMBL-EBI) e Basic Local Alignment Search Tool (BLAST, NCBI).
Resultados e discussão
CosAG14
O cosmídeo, CosAG14, contém um fragmento de 38168 pb de ADN genómico isolado a partir de A. garbadinensis. A análise da sequência identificou ADN que codifica o comando e o pré-péptido actagardina, gene ao qual foi atribuído o nome actA. Os dois resíduos de alanina ficam imediatamente a montante do pré-péptido actagardina. Pensa-se que estes resíduos representem o sítio de reconhecimento para clivagem da protease do péptido de comando a partir de actagardina. A 45
ΕΡ 1 979 375/PT clivagem parcial nesta posição que resulta na retenção de uma alanina é considerada resultar na produção de ala-actagardina rotineiramente observada em caldos de fermentação de A. garbadinensis. A jusante do gene actA fica uma região de ADN de 3162 pb com forte similaridade de sequência para várias proteínas LanM, por exemplo, mrsM (identidade de 30%) a partir do aglomerado de genes mersacidina. Este gene putativo foi designado actM e é considerado estar envolvido na modificação do pré-péptido actagardina catalisando a desidratação e a formação de tioéter. Uma estrutura de leitura aberta designada actO, que está localizada 11 pb a jusante de actM codifica uma proteína com 341 aminoácidos com similaridade de sequência (identidade de ~39%) para várias monoxigenases tipo luciferase. Pensa-se que o papel da monoxigenase, ActO, seja catalisar a incorporação de oxigénio produzindo actagardina e desoxi-actagardina. Na orientação inversa para actO e localizada 62 pb a jusante está a estrutura de leitura aberta denominada actR. 0 produto de proteína deste orf mostra similaridade de sequência (identidade de ~37%) para vários reguladores de resposta de dois componentes. Posicionado a 789 pb a jusante e na mesma orientação de a ctR está uma proteína de 812 aminoácidos putativa que mostra similaridade de sequência (identidade de ~25%) para as permeases de transportador ABC. Esta proteína putativa designada actT é potencialmente responsável pela exportação do lantibiótico modificado a partir da célula. As sequências de aminoácidos do segundo e quarto orf a jusante de actT mostram similaridade (identidade de ~30%) para a resposta de quinases reguladoras e proteínas de ligação a penicilina, respetivamente. Um trabalho recente relativo ao aglomerado de genes biossintéticos nisina em histeria monocytogenes (Gravesen et al., 2004) demonstrou que a histidina-quinase em conjunto com uma proteína de ligação a penicilina e a proteína de função desconhecida estão envolvidos na atribuição de resistência à nisina. A presença de genes análogos com proximidade estreita a actA pode indicar que estes genes estão envolvidos no mecanismo de resistência à actagardina. 46
ΕΡ 1 979 375/PT
CosAL02
0 cosmídeo CosAL02 contém um fragmento de 40402 pb de ADN genómico isolado a partir de Actinoplanes liguriae. A análise da sequência identificou um gene lanA que codifica uma proteína de 64 aminoácidos com forte homologia de sequência (50 resíduos idênticos) para o gene actA identificado no cosmídeo CosAG14. Os investigadores denominaram esta espécie de gene lanA como ligA. A sequência de aminoácidos do pré-péptido deste lanA difere da da actagardina em dois resíduos indicados no alinhamento dos dois genes apresentados abaixo (SEQ. ID 119 e SEQ. ID 212): AG actA MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEBLREDRTIYAASSGWVCTLTIECGTVICAC 64
AL lanA MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEBLREDRTIYAASSGWVCTLTIECGTLVCAC 64 ***: : ;* . :**:.***: *-**********.***************************. .***
As mutações V15L e 116V podem produzir uma proteína com uma massa idêntica a actagardina e, por conseguinte, podem não ser distinguidas por análise com espectroscopia de massa (lc-ms). O produto potencial do gene lanA identificado em CosAL02 representa um lantibiótico novo. Uma estrutura de leitura aberta que fica 321 pb a montante de ligA codifica uma proteína de 286 aminoácidos putativa que mostra similaridade de sequência (identidade de 46%) à proteína StrR de Streptomyces glaucescens. A proteína StrR é um ativador de ligação de ADN específico de via envolvido na regulação da expressão do gene estreptomicina. A similaridade de sequência (identidade de 31%) do orf que fica a jusante de ligA sugere que ele codifica um polipéptido LanM de 1046 aminoácidos (denominado "ligM" abaixo) potencialmente envolvido na modificação do pré-péptido ligA. O codão de partida da estrutura de leitura aberta a jusante, seguinte, lanT (ligT) , sobrepõe-se ao codão de paragem de ligM. LigT é uma proteína de 575 aminoácidos com similaridade de sequência para vários transportadores ABC. As proteínas lanT são responsáveis pela secreção quer de produto maduro final quer de produto pós-traducionalmente modificado ainda ligado à sua sequência de comando. Como observado no cosmídeo, CosAG14, o orf seguinte a jusante de ligT codifica uma proteína de 347 aminoácidos 47
ΕΡ 1 979 375/PT com similaridade de sequência (identidade de ~38%) para monoxigenases tipo luciferase. Pensa-se que esta monoxigenase putativa (ligO) está envolvida na incorporação de oxigénio e formação de ligação sulfóxido. Posicionada a jusante de ligO e na orientação inversa fica uma proteína de 217 aminoácidos putativa que mostra similaridade de sequência (~37%) para vários reguladores de resposta de dois componentes. Este regulador putativo foi designado ligR.
Tabela 1 - Anotação de CosAG14 (fragmento de 38168 pb Isolado a partir de A. garbadlnensis. A sequência de estrutura de vetor SuperCosl é omitida)
Gene Descrição Posição (ADN) Estrutura Tamanho dos AAs (pb) Início - fim (3AA) orf 1 Proteína hipotética 482 - 42 -1 146 (441) MPR - RCG orf2 Proteína hipotética 2824 - 2375 -2 149 (450) VSV - ERA orf 3 ATPase AAA envolvida na divisão celular 4432 - 2876 -2 518 (1557) VER - TNR orf 4 Hidrolase de açúcar 6002 - 5391 -1 203 (612) VGE - NYS orf 5 Endoglucanase 6484 - 5825 -2 219 (660) MRR - TVR orf 6 Citosina/adenina-desaminase 6627 - 7112 +3 161 (486) MTI - PAQ orf 7 Desconhecida 7756 - 8997 + 1 413 (1242) VTT - YDK orf 8 Desconhecida 9586 - 8933 -2 217 (654) VGK - FRG orf 9 Piruvato-oxidase 11886 - 10108 -3 592 (1779) VSD - DPS orf 10 Hidrolase ou aciltransferase 12066 - 12866 +3 266 (801) VSR - SGT orf 11 Aldose-epimerase 13116 - 14306 +3 396 (1191) MTE - TAD orf 12 Componente periplásmico de transporte de açúcar ABC 14385 - 15521 +3 378 (1137) MPR - AHG orf 13 Permease de transporte de açúcar ABC 15514 - 16572 + 1 352 (1059) MDD - GRS orf 14 Proteína de transporte ABC. Ligação de ATP 16569 - 17330 +3 253 (762) MTA - RGR orf 15 Proteína hipotética. Metiltrans ferase 18102 - 17335 -3 255 (768) MES - RKR orf 16 Permease de transporte ABC 18962 - 18120 -1 280 (843) MPP - RKG 48
ΕΡ 1 979 375/PT
Gene Descrição Posição (ADN) Estrutura Tamanho dos AAs (pb) Início - fim (3AA) orf 17 Permease de transporte ABC 19896 - 18991 -3 301 (906) MSA - ESE orf 18 Ligação de substrato de transporte ABC 21236 - 19899 -1 445 (1338) MFI - SGR orf 19 actA, gene estrutural 21572 - 21766 +2 64 (195) MSA - CAC orf 2 0 actM, gene de modificação 21837 - 24998 +3 1053 (3162) MSP - PLT orf 21 actO, monoxigenase 25009 - 26034 + 1 341 (1026) MPE - PAA orf 22 actR, regulador de resposta 26791 - 26096 -2 231 (696) MRS - CLS orf23 actT, permease associada a transportador ABC 29323 - 26885 -2 812 (2439pb) MLA - LTR orf24 Proteína hipotética 29462 - 30196 +2 244 (735) MIV - RNR orf25 Quinase reguladora de resposta 30235 - 31338 + 1 367 (1104) VLR - ARA orf 2 6 Sensor regulador de resposta 31335 - 31997 +3 220 (663) MTR - AVG orf27 Proteína de ligação a penicilina 32138 - 34486 +2 782 (2349) MLI - PPR orf 2 8 Metiltrans ferase 35209 - 34448 -2 253 (762) MAP - DRR orf 2 9 Hidrolase 36030 - 35245 -3 261 (786) VPR - PPP orf 30 Regulador de Resposta 36086 - 36820 +2 244 (735) VSP - TGS orf 31 Frutose-bifosfato-aldolase 36844 - 37689 +1 281 (846) MKD - RAW orf 32 Hidrolase 37590 - 38168 +3 192 (579) MGS - DPA
Tabela 2 - Anotação de CosAL02 (fragmento de 40402 pb isolado a partir de A. liguriae. A sequência de estrutura de vetor SuperCosl é omitida)
Gene Descrição Posição (ADN) Estrutura Tamanho dos AAs (pb) Início -fim (3AA) orf 1 Proteína de sistema de secreção 1008 - 1 -2 335 (1008) VRL - VDI orf 2 Regulador de resposta 2198 - 1122 -3 358 (1077) MSE - LFP orf 3 Proteína hipotética 3088 - 2288 -1 266 (801) MRR - WR orf 4 Proteína hipotética 4410 - 3112 -2 432 (1299) MRR - RTG orf5 Ligação de ATP a regulador de resposta 5205 - 4795 -2 136 (411) MWK - SAR 49
ΕΡ 1 979 375/PT
Gene Descrição Posição (ADN) Estrutura Tamanho dos AAs (pb) Inicio -fim (3ΆΆ) orf 6 Transportador de açúcar ABC 5516 - 6607 +2 363 (1092) MFN - SAY orf 7 Ligação de ATP a transportador de açúcar ABC 6673 - 8178 + 1 501 (1506) MLL DEH orf 8 Permease de transporte ABC 8168 - 9127 +2 319 (960) MST - RTR orf 9 Proteína permease de transportador ABC 9130 - 10092 + 1 320 (963) MSI - RRS orf 10 Metalopeptidase 12046 - 10586 -1 486 (1461) MRT - PGS orf 11 Regulador tipo StrR putativo 12460 - 13320 + 1 286 (861) MDS - DAA orf 12 ligA 13641 - 13835 +3 64 (195) MSA - CAC orf 13 ligM 13907 - 17047 +2 1046 (3141) MSS - THV orf 14 ligT, Transportador ABC 17040 - 18767 +3 575 (1728) MSE - LLT orf 15 ligO, Monoxigenase tipo luciferase 18785 - 19828 +2 347 (1044) MLS - RRW orf 16 ligR, Regulador de resposta 20459 - 19806 -3 217 (654) MAD - ELA orf 17 Permease associada a transportador ABC 23069 - 20625 -3 814 (2445) MIF - LVR orf 18 Proteína de ligação a ATP de Transportador ABC 23788 - 23066 -1 240 (723) MVS - VTS orf 19 Histidina-quinase 23980 - 25068 + 1 362 (1089) VIA - AVP orf 2 0 Regulador de resposta 25065 - 25721 +3 218 (657) MTE - GPS orf 21 Proteína de membrana putativa 26673 - 25768 -2 301 (906) MPI - RFP orf 22 alfa-beta-hidrolase 26697 - 27569 +3 290 (873) MRN - ASR orf23 Regulador de transcrição 27574 - 28011 + 1 145 (438) VRL - RLG orf24 Arginina-descarboxilase dependente de piruvoílo 28102 - 28629 + 1 175 (528) MAD - GMN orf25 Diaminopimelato-descarboxilase putativa 30946 - 29626 -2 406 (1221) MTL - LYA orf 2 6 Quinase 31860 - 30931 -2 309 (930) VRS - PDL orf27 Regulador de transcrição 33248 - 32145 -3 367 (1104) WF - ANS orf 2 8 Glicosil-trans ferase 33600 - 34553 +3 317 (954) MPS - NAG orf 2 9 Glicosil-trans ferase 34543 - 35652 + 1 369 (1110) MPA - ARV orf 30 Di-hidrolipoamida- desidrogenase 36432 - 37811 +3 459 (1380) MGE - INF orf 31 Proteína de membrana putativa 37973 - 39019 +2 348 (1047) MTT - TPG 50
ΕΡ 1 979 375/PT EXEMPLO 2 - Cassete de Expressão Produção de uma Cassete de Expressão
Este exemplo ilustra a produção de uma cassete de expressão de acordo com o presente invento. Esta cassete de expressão, o plasmideo pAGvarX foi concebida para a produção eficaz de genes lanA variantes do presente invento que podem ser introduzidos numa célula hospedeira, tal como uma estirpe de A. garbadinensis na qual o actA de tipo selvagem foi removido (A. garbadinensis Δ actA) . Este plasmideo, um derivado do vetor pSET152 (Bierman et al. , 1992) vai-se integrar no cromossoma do hospedeiro através do sítio de ligação attP. A expressão do gene actA mutado pelo organismo hospedeiro juntamente com os genes de tipo selvagem restantes do aglomerado de genes biossintéticos actagardina deve produzir variantes de actagardina.
Construção do plasmideo pAGvarX A não ser que de outro modo referido, todas as posições indicadas referem-se a SEQ ID NO:100. O esquema para a construção do plasmideo pAGvarX é mostrado na Figura 3. A base adjacente a orf que fica a montante de actA na posição 21237 para o resíduo leucina na região de codificação de actA na posição 21672 foi amplificada por PCR utilizando os iniciadores O/AGvarOlbF e O/AGvar02bR (tabela de iniciadores) e pLITAGOl como uma matriz. Os iniciadores foram concebidos para introduzir um sítio XbaI de flanqueamento na extremidade 5' e um sítio BglII através de uma mutação silenciosa na região de leucina 3' que codifica actA. Este fragmento foi introduzido em pUC19 desfosforilado previamente digerido utilizando SmaI para dar pAGvarl. A região de ADN que abrange desde o C-terminal de actA a orf adjacente a montante (21758-21836 inclusivé) foi amplificada por PCR utilizando os iniciadores O/AGvar05F e O/AGvar06R e pLITAGOl como uma matriz. Os iniciadores foram concebidos para introduzir um sítio Avrll de flanqueamento na posição 5' e um sítio EcoRI na extremidade 3' . O produto de PCR resultante foi clonado em pUC19 desfosforilado 51
ΕΡ 1 979 375/PT previamente digerido utilizando Sma I para dar pAGvar2. Os plasmídeos pAGvarl e pAGvar2 foram então digeridos utilizando Xbal e o fragmento de PCR de pAGvarl recuperado e clonado em pAGvar2 digerido com Xbal desfosforilado, sendo a orientação correta do fragmento introduzido determinada por análise de restrição. 0 plasmideo resultante pAGvar3 foi subsequentemente digerido utilizando BglII e Avrll e ligado aos oligonucleótidos hibridados O/AGvar03F e O/AGvar04R produzindo pAGvar4. 0 plasmideo pAGvar4 foi subsequentemente digerido utilizando EcoRI e Xbal e o fragmento de ~620 pb resultante incluindo os oligonucleótidos hibridados introduzido em pSET152 previamente digerido utilizando EcoRI e Xbal dando o vetor pAGvarX. A região de pAGvarX construída por hibridação nos oligonucleótidos respetivos introduziu um sítio BsrGI através de uma mutação silenciosa nos aminoácidos 6 e 7 (C e T, respetivamente) relativamente ao péptido actagardina. Este sítio pode ser utilizado em conjunto com ou o sítio BglII a montante ou o sítio Avrll a jusante, para introduzir o ADN que codifica mutações alvo para qualquer dos aminoácidos codificados no péptido actA. EXEMPLO 3 - Célula Hospedeira
Este exemplo ilustra a produção de uma célula hospedeira produtora de lantibiótico na qual o gene lanA foi inativado. Neste exemplo, a célula hospedeira é A. garbadinensis em que o gene actA foi delecionado.
Construção da estirpe A. garbadinensis Δ actA A estirpe A. garbadinensis Δ actA é utilizada como um hospedeiro para expresser variantes do gene estrutural de actagardina actA. Esta estirpe foi produzida a partir de A. garbadinensis de tipo selvagem utilizando a tecnologia Redirect desenvolvida por Gust et al., 2002. Em primeiro lugar, a região de ADN do cosmídeo CosAG14 que codifica actA foi substituída pela cassete SBdel-1. SBdel-1 consiste no gene de resistência à apramicina (aac(3)IV) e em oriT flanqueado por sítios alvo de reconhecimento de FLP (FRT) e foi amplificado por PCR utilizando o plasmideo plJ773 como a 52
ΕΡ 1 979 375/PT matriz juntamente com os iniciadores O/SB50F e 0/SB51R que se ligam a 21536 e 21802 de SEQ ID NO: 100, respetivamente. Seguindo o protocolo Redirect (Gust et al. , 2004), actA de
CosAG14 foi substituída por SBdel-1 produzindo o cosmídeo CosAG14AA. A parte central da cassete SBdel-1 foi subsequentemente removida a partir de CosAG14AA por excisão mediada por FLP seguindo o passo 7 do protocolo Redirect produzindo CosAG14AB. A remoção desta região permite a produção de deleções na estrutura não marcadas, não polares, assim como a utilização repetida do mesmo marcador de resistência (Gust et al., 2003). O segundo passo de construção foi conceber o cosmídeo de modo a que este pudesse ser introduzido em A. garbadinensis através de conjugação. Isto começou em primeiro lugar por inserção de CosAG14AB na estirpe de E. coli BW25113/plJ790 por transformação. O gene ampicilina de CosAG14áB foi então substituído por SBdel-2 seguindo o protocolo Redirect (Gust et al. , 2004) produzindo o cosmídeo CosAG14áC. A cassete SBdel-2, tal como SBdel-1, aloja o gene de resistência à apramicina {aac(3)IV) e oriT flanqueado por sítios FRT, no entanto foi produzida utilizando os iniciadores 0/SB52F e 0/SB53R juntamente com a matriz plJ773.
CosAG14AC foi utilizado para transformar células eletrocompetentes de E. coli ET12567/pUZ8002 antes de serem conjugadas com A. garbadinensis seguindo o protocolo Redirect (Gust et al. , 2004; ver também o parágrafo seguinte) . A estirpe resultante na qual o gene actA foi removido a partir do cromossoma do produtor de tipo selvagem é A. garbadinensis Δ actA.
Com mais detalhe, para se obter a estirpe A. garbadinensis Δ actA, acima, utilizou-se CosAG14AC para transformar células eletrocompetentes de E. coli ET12567/pUZ8002 antes de serem conjugadas com A. garbadinensis. Obtiveram-se os exconjugantes resistentes à apramicina que foram sub-cultivados através de seis ciclos sucessivos de crescimento em TSB sem apramicina. As células da cultura 6 foram plaqueadas em meio 65 e incubadas a 30°C. Após 5 dias as colónias foram transferidas e adesivadas sobre uma área de aproximadamente 1 cm2 em meio 65. Após 3 dias de 53 ΕΡ 1 979 375/ΡΤ incubação a 30°C as células adesivadas foram transferidas para meio 65 contendo apramicina numa concentração final de 50 μg/ml. Após 72 h de incubação a 30°C, as células sensíveis à apramicina foram selecionadas e os respetivos adesivos utilizados para inocular balões de 50 ml contendo 10 ml de TSB e deixados crescer a 30°C, 250 rpm, durante 4 dias. O ADN genómico foi preparado a partir de cada cultura e analisado por PCR utilizando os oligonucleótidos O/AGvarOlbF e O/AGvar06r. Produziram-se produtos de PCR de um tamanho compatível com a deleção do gene actA. Em paralelo, a análise dos caldos de fermentação por hplc demonstrou que estas mesmas amostras não produziam actagardina. EXEMPLO 4 - Expressão Heteróloga
Este exemplo ilustra a expressão de actagardina a partir do aglomerado de genes de SEQ ID NO: 100 numa célula hospedeira que é uma célula não produtora, S. lividans. Tais células hospedeiras proporcionam um meio alternativo de produção de variantes ativas destes dois péptidos.
Os cosmídeos CosAG14 e CosAL02 contendo os aglomerados de genes biossintéticos que codificam a produção de actagardina e desoxi-actagardina B não possuem uma origem de transferência (oriT) necessária para facilitar a transferência conjugal para um hospedeiro heterólogo. Utilizando a tecnologia Redirect (Gust et al., 2002), pode-se introduzir um oriT juntamente com um sítio de ligação de fago attP e integrase (int) na estrutura SuperCosl de CosAG14 e CosAL02 substituindo o gene de resistência à neomicina, neo.
Construção de vetores para expressão heteróloga. 0 cosmídeo pMJCOSl (fornecido por JIC, Norwich) é um derivado de SuperCosl (Stratagene) em que o gene que codifica a resistência à neomicina foi substituído por uma cassete (HEapra) que inclui ADN que codifica um oriT, attP, integrase {int) e gene de resistência à apramicina (aac(3)IV). A cassete HEapra foi isolada por digestão de pMJCOSl com SspI e recuperação do ADN a partir de um gel de agarose. Esta cassete juntamente com CosAG14 e CosAL02 foi utilizada para produzir os cosmídeos CosAG14HEapra e CosAL02HEapra, 54
ΕΡ 1 979 375/PT respetivamente, seguindo o protocolo Redirect como descrito por Gust et al., 2004. O cosmídeo CosAG14HEapra foi subsequentemente introduzido em S. lividans através de conjugação. Isolaram-se os exconjugantes resistentes à apramicina de S. lividans/CosAGl4HEapra. Três exconjugantes foram utilizados para inocular meios semeados com TSB. S. lividans, A. garbadinensis e A. liguriae foram deixadas crescer em paralelo para proporcionar controlos. Após 48 h de incubação, as culturas semeadas foram utilizadas para inocular uma gama de quatro meios de produção diferentes, nomeadamente, AAS1, GM1, GM3 e TSB. Estas culturas foram incubadas durante um total de nove dias a 30°C com 1,5 ml de aliquotas a serem removidas de cada frasco após 5, 7 e 9 dias de incubação. As aliquotas foram centrifugadas a 14000 rpm (centrífuga IEC micromax benchtop) durante 10 minutos e os sobrenadantes então decantados e utilizados não diluídos para bioensaios e análise por HPLC-MS.
As zonas de inibição (auréolas) indicativas da presença de um(uns) composto(s) ativo(s) biológico(s) foram observadas à volta de todas as cavidades carregadas com sobrenadantes de S. lividans contendo o cosmídeo CosAG14HEapra (S. lividans/CosAG14HEapra) exceto para cavidades carregadas com sobrenadante das fermentações em TSB onde não foram produzidas quaisquer auréolas. Não se observou qualquer atividade biológica à volta das cavidades carregadas com sobrenadante de fermentações de S. lividans deixadas crescer em qualquer um dos quatro meios. As auréolas eram evidentes à volta de todas as cavidades carregadas com sobrenadantes de culturas de A. liguriae e A. garbadinensis onde o crescimento foi confirmado. Todas as auréolas eram consistentemente produzidas desde o primeiro dia de amostragem no dia 5 até ao dia 9, embora seja evidente uma redução geral no diâmetro das auréolas. A análise por HPLC-MS dos sobrenadantes das fermentações de S. lividans/CosAG14HEapra confirma a presença de picos com tempos de retenção e massas correspondentes a ala(O)actagardina. Estes mesmos picos estavam ausentes apenas dos sobrenadantes de S. lividans. A Tabela 3 sumariza as 55
ΕΡ 1 979 375/PT análises por HPLC-MS de sobrenadantes de fermentação de S. lividans, S. lividans/CosAG14HEapra, A. garbadinensis e A. liguriae após incubação durante 5 dias.
Tabela 3:
Amostra Meio de Concentração Tempo de Ião Identidade fermentação de produto Retenção molecular (pg/ml) (min) (m/z) S. lividans/ GM1 83 6,75 981 Ala(0)Actagardina CosAG14HEapra 991 (M+2H) +2 Ala(0) Actagardina (M+H+Na) +2 S. lividans/ GM3 33 6,75 981 Ala(0) Actagardina CosAG14HEapra 991 (M+2H) +2 Ala(0) Actagardina (M+H+Na) +2 S. lividans GM1 Não Detetada Não Não Não Detetada Detetado Detetado S. lividans GM3 Não Detetada Não Não Não Detetada Detetado Detetado A. garbadinensis GM1 58 6, 9 945 Actagardina (M+2H)+2 A. garbadinensis GM3 24 6, 8 981 Ala(0)Actagardina 991 (M+2H) +2 Ala(0) Actagardina (M+H+Na) +2 A. liguriae GM1 Não Detetada 7,06 937 Desoxi-actagardina B (M+2H) +2 A. liguriae GM3 Não Detetada 7,06 937 Desoxi-actagardina B (M+2H) +2 EXEMPLO 5 - Atividades Antibacterianas
Determinação de CIM
Uma seleção das variantes produzidas como aqui acima descrito foi adicionalmente testada quanto à atividade contra uma gama de bactérias. As concentrações inibitórias mínimas (CIMs) para todos os organismos com exceção do Streptococcus pneumoniae foram determinadas por séries de diluições de antibiótico de duas vezes em caldo de Mueller-Hinton (MHB) suplementado com cloreto de cálcio desidratado numa concentração final de cálcio de 400 μρ/πιΐ. As concentrações inibitórias mínimas (CIMs) para S. pneumoniae foram determinadas por séries de diluições de antibiótico de duas vezes em caldo de Brain Heart Infusion (BHI) suplementado com 56
ΕΡ 1 979 375/PT 400 μg/ml de cloreto de cálcio desidratado. As soluções de reserva de agente antimicrobiano foram preparadas e armazenadas de acordo com o padrão NCCLS M7-A6.
As culturas em caldo que cresceram ativamente foram diluídas para conter 105 a 106 UFC/ml por ajuste numa absorvância de 0,2 - 0,3 a 600 nm, equivalente ao padrão
McFarland 0,5. Elas foram então adicionalmente diluídas a 1:100 em caldo. Os testes foram realizados em duplicado em placas de microtitulação de 96 cavidades, estéreis, num volume total de 200 μΐ (160 μΐ de caldo, 20 μΐ de antibiótico, 20 μΐ de inoculo) num intervalo de concentrações de 64 μg/ml até 0,06 μg/ml. A 12a cavidade da placa de microtitulação não continha agente antimicrobiano. A vancomicina foi utilizada como o antibiótico de referência para controlo de qualidade. As placas foram aerobicamente incubadas, com agitação, durante 18 - 20 horas a 37°C com a CIM definida como a menor concentração de fármaco que não produziu crescimento visível. E. faecium E. faecalis S. auzeus 5. aureus S. epidezmidis S. pneumoniae 19579 29212 R33 SH1000 11047 R6 Actagardina 4, 4 <4, <4 16, 8 8, 8 8, 8 <4, <4 Actagardina 4, 4 <4, <4 16, 16 8, 8 8, 8 <4, <4 Ala(0)Actagardina 8, 8 4, 4 8, 8 8, 8 8, 4 <4, <4 Ala(0)Actagardine 32, 16 8, 8 <4, <4 8, 8 8, 8 <4, <4 Desoxiactardina B 16, 16 4, 4 16, 16 16, 16 16, 16 8, 8 Desoxiactardina B 16, 16 <4, <4 16, 16 16, 16 16, 16 <4, <4
EXEMPLO 6 - Análise de RMN
Estudos de RMN em Actagardlna e Desoxl-actagardlna A espectroscopia de RMN (COSY, TOCSY, HSQC e NOESY) foi sucessivamente utilizada para confirmar os resultados de sequenciação obtidos a partir dos produtores de actagardina (A. garbadinensis) e desoxiactagardina B (A. liguriae) . Embora os dados obtidos não permitam uma atribuição completamente inequívoca de todos os resíduos, tal era 57 ΕΡ 1 979 375/ΡΤ compatível com as estruturas mostradas na Figura 4 e suficiente para confirmar que a desoxi-actagardina B de A. liguriae tem nas posições 15 e 16 os resíduos Leu e Vai, respetivamente.
EXEMPLO 7 - SÍNTESE DE DERIVADOS
Prepararam-se os derivados seguintes de desoxi-actagardina B, em que os grupos Z e amida C-terminal eram os seguintes:
Estruturas de Compostos
Composto z Amida C-terminal I H ΗΝ'^^Ν^ II H 0 ò 1 III H / —z ί o x IV D-Ala H V L-Ile H VI L-Val H VII L-Phe H VIII L-Lys H IX L-Tryp H
A síntese dos compostos I - IX foi como se segue: Procedimento geral 1. Preparação dos compostos I - III A uma solução de desoxi-actagardina B (20 mg, 11 nmoles), a amina adequada (11 nmoles) e di-isopropiletilamina (7,2 μΐ, 70 nmoles) em dimetilformamida seca (0,8 ml) adicionaram-se 200 μΐ de uma solução de hexafluorofosfato de benzotriazol-l-il-oxi-tris-pirrolidino-fosfónio (PyBop) (70 mg, 134 nmoles) em dimetilformamida seca (1,0 ml). A mistura 58 ΕΡ 1 979 375/ΡΤ
foi analisada por HPLC para se seguir o progresso da reação, adicionando-se mais alíquotas da solução Pybop até todo o material de partida ter sido consumido. A análise por HPLC nesta fase mostrou também quantidades variáveis (5-20%) da diamida. Depois da reação estar completa, a mistura foi diluída com acetonitrilo a 30% em tampão de fosfato aquoso Kpi 20mM, pH 7 (10 ml) e a monoamida foi purificada por HPLC preparativa utilizando as condições descritas na Tabela 4. As frações adequadas foram concentradas até 25% do seu volume original e dessalinizadas por carregamento numa coluna C18 Bond Elut pré-acondicionada (500 mg) que foi subsequentemente lavada por eluição sequencial com dois volumes de coluna de metanol aquoso a 30, 40, 70 e 90%. A evaporação das frações adequadas deu os produtos desejados como sólidos brancos.
Composto I: N-[3-dimetllamlnopropll]monocarboxam±da de
Desoxi-Actacjardina B
Foi obtido a partir do acoplamento de desoxiactagardina B e 3-(dimetilamino)propilamina de acordo com o Procedimento Geral 1. Rendimento: 18 mg, rendimento 85%. [M+2H 2+] calculado 979,0, encontrado 980,2.
Composto II: N- [1- (l-metil-4-piperidiníl)píperazína]mono-
carboxamida de Desoxl-Actagardina B
Foi obtido a partir do acoplamento de desoxiactagardina B e 4-(piperidino)piperazina de acordo com o Procedimento Geral 1. Rendimento: 8 mg, rendimento 37%. [M+2H 2+] calculado 1019,5, encontrado 1020,0; [M+3H 3+] calculado 680,0, encontrado 680,0
Composto III: [1- (3-dimetilaminopropil)piperazina Jmono-
carboxamida de Desox±-Actagard±na B
Foi obtido a partir do acoplamento de Desoxi-actagardina B e 1-(3-dimetilaminopropil)piperazina de acordo com o Procedimento Geral 1. Rendimento: 10 mg, 46%. [M+2H 2+] calculado 1013,5, encontrado 1014,0. 59
ΕΡ 1 979 375/PT
Procedimento geral 2. Preparação dos compostos IV - IX
Uma solução do aminoácido protegido por Fmoc adequado (34 nmoles) em dimetilformamida seca (0,4 ml) foi tratada com uma solução de hexafluorofosfato de benzotriazol-l-il-oxi-tris-pirrolidino-fosfónio (PyBop) (11,4 mg, 22 nmoles) e di-isopropiletilamina (11 μΐ, 68 nmoles) em dimetilformamida seca (0,4 ml) . A mistura foi então adicionada a uma solução de Desoxi-actagardina B (2 mg, 11 nmoles) em dimetilformamida seca (0,5 ml) . A mistura foi deixada à temperatura ambiente durante 1 h, tempo após o qual a HPLC analítica (acetonitrilo a 30-65% em tampão de fosfato aquoso Kpi 20mM, pH 7) mostrou conversão completa do material de partida. A mistura reacional foi diluída com metanol aquoso a 40% (20 ml) e a mistura foi passada através de uma coluna C18 Bond Elut (500 mg) que tinha sido pré-acondicionada por lavagem com dois volumes de coluna de metanol a 100% seguido por dois volumes de coluna de água. A coluna foi sequencialmente eluída com dois volumes de coluna de metanol aquoso a 40, 50, 60, 70, 80, 90 e 100%. As frações foram analisadas por HPLC e as frações contendo o produto de acoplamento protegido por Fmoc foram evaporadas até à secura. O resíduo foi dissolvido em dimetilformamida (1 ml) e adicionou-se piperidina (50 μΐ) para remover o grupo protetor de Fmoc. O progresso da reação foi monitorizado por HPLC e depois do consumo completo do material de partida, a solução foi diluída em metanol aquoso a 30% (20 ml) . A mistura foi então eluída através de um cartucho C18 Bond Elut (500 mg) como previamente descrito e o produto obtido após evaporação das frações adequadas foi posteriormente purificado por HPLC preparativa utilizando as condições descritas na Tabela 4. As frações adequadas foram concentradas até 25% do seu volume original e dessalinizadas por carregamento numa coluna Cl8 Bond Elut pré-acondicionada (500 mg) que foi subsequentemente lavada por eluição sequencial com dois volumes de coluna de metanol aquoso a 30, 40, 70 e 90%. A evaporação das frações adequadas deu os produtos desejados como sólidos brancos.
Composto IV: D-Ala(0)desoxl-actagardlna B
Foi preparado de acordo com o Procedimento Geral 2, a partir de Desoxi-actagardina B e Fmoc-D-alanina com 60
ΕΡ 1 979 375/PT rendimento de 74%. [M+2H 2+] calculado 972,5, encontrado 973,0.
Composto V: L-Ile(0)desoxi-actagardina B
Foi preparado de acordo com o Procedimento Geral 2, a partir de Desoxi-actagardina B e Fmoc-L-isoleucina com rendimento de 27%. [M+2H 2+] calculado 993,5, encontrado 993, 8 .
Composto VI: L-Val(0) desoxi-actagardina B
Foi preparado de acordo com o Procedimento Geral 2, a partir de Desoxi-actagardina B e Fmoc-L-valina com rendimento de 55%. [M+2H 2+] calculado 986,5, encontrado 985,9.
Composto VII: L-Phe(0)desoxi-actagardina B
Foi preparado de acordo com o Procedimento Geral 2, a partir de Desoxi-actagardina B e Fmoc-L-fenilalanina com rendimento de 22%. [M+2H 2+] calculado 1010,5, encontrado 1010.9.
Composto VIII: L-Lys (0)desoxi-actagardina B
Foi preparado de acordo com o Procedimento Geral 2, a partir de Desoxi-actagardina B e Bis(Fmoc)-L-lisina com rendimento de 45%. [M+2H 2+] calculado 1001,0, encontrado 1001,6.
Composto IX: L-Tryp (0) desoxi-actagardina B
Foi preparado de acordo com o Procedimento Geral 2, a partir de Desoxi-actagardina B e Fmoc-L-triptofano com rendimento de 55%. [M+2H 2+] calculado 1030,0, encontrado 1029.9. 61
ΕΡ 1 979 375/PT
EXEMPLO 8 - DADOS ANTIBACTERIANOS ADICIONAIS
Determinação de CIM
Staphylococcus, Streptococcus, Enterococcus spp.
Determinaram-se as concentrações inibitórias mínimas (CIMs) e as soluções de reserva de agente antimicrobiano foram preparadas e armazenadas de acordo com o método de microdiluição em caldo de referência NCCLS para bactérias aeróbicas (M7-A6, 2003) . As CIMs foram determinadas por séries de diluições de antibiótico de duas vezes em caldo de Mueller-Hinton (MHB) ou em caldo de Brain Heart Infusion (BHI) (S. pneumoniae). As culturas em caldo que cresceram ativamente foram ajustadas em caldo estéril ou por suspensão de colónias direta (S. pneumoniae) até uma turvação equivalente ao padrão McFarland 0,5 (lxlO8 UFC/ml), em seguida, adicionalmente diluídas em caldo estéril para um inoculo final em placas de microtitulação de 96 cavidades, estéreis, de aproximadamente 5xl05 UFC/ml. Os testes foram realizados em duplicado com Enterococcus faecalis ATCC 29212 incluído como estirpe de controlo de referência e Vancomicina como um antibiótico de referência para controlo de qualidade. As placas foram aerobicamente incubadas, com agitação, durante 18 - 20 horas a 37°C com a CIM definida como a menor concentração de fármaco que não produziu crescimento visível.
Clostridium difficile
Determinaram-se as concentrações inibitórias mínimas (CIMs) para C. difficile e as soluções de reserva de agente antimicrobiano foram preparadas e armazenadas de acordo com o método de diluição em ágar de referência NCCLS para bactérias anaeróbicas (M11-A5, 2001). Prepararam-se séries de diluições de antibiótico de duas vezes em ágar Wilkens-Chalgren (WCA). Os organismos de teste foram selecionados a partir do crescimento de 48 horas em ágar Braziers (C.C.E.Y.), subcultivados em caldo Schaedler até uma densidade equivalente a um padrão McFarland 0,5 (lxlO8 UFC/ml), com um inoculo final em placas WCA de aproximadamente 105 UFC/local. O Bacteroides fragilis ATCC 25285 foi incluído como estirpe de controlo de referência e o Metronidazol foi utilizado como 62
ΕΡ 1 979 375/PT um antibiótico de referência para controlo de qualidade. Todas as manipulações foram realizadas em duplicado numa atmosfera ambiente em meios pré-reduzidos com apenas uma breve exposição a oxigénio. As placas foram anaerobicamente incubadas durante 48 horas a 37°C com a CIM definida como a concentração de fármaco que originou uma redução marcada no aparecimento de crescimento na placa de teste quando comparado com o crescimento na placa de controlo anaeróbico.
Propionibacterium acnes
Os organismos de teste foram selecionados a partir do crescimento de 3-7 dias em ágar Wilkens-Chalgren (WCA) suplementado com furazolidona (1-2 pg/ml). 0 caldo de
Wilkens-Chalgren (WCB) recente foi inoculado por suspensão direta de colónias com colónias únicas de P. acnes e ajustado até uma densidade equivalente ao padrão McFarland 0,5 (lxlO8 UFC/ml), em seguida posteriormente diluído em WCB estéril para um inoculo final em placas de microtitulação de 96 cavidades estéreis de aproximadamente 105 UFC/ml. Realizaram-se séries de diluições de antibiótico de duas vezes em água estéril com soluções de reserva preparadas e armazenadas de acordo com os padrões NCCLS (M11-A5, 2001). Os testes foram realizados em duplicado com Vancomicina e Clindamicina utilizados como antibióticos de referência para controlo de qualidade. As placas foram anaerobicamente incubadas durante 48-72 horas a 37°C com a CIM definida como a concentração de fármaco que originou uma redução marcada no aparecimento de crescimento na placa de teste quando comparado com o crescimento na placa de controlo anaeróbico. Todas as manipulações foram realizadas em duplicado em atmosfera ambiente em meios pré-reduzidos apenas com uma breve exposição a oxigénio.
Os meios de cultura foram suplementados com iões cálcio (como cloreto de cálcio) a 50 μg/ml exceto quando são indicadas concentrações superiores. Os valores de CIM em μg/ml são apresentados nas Tabelas seguintes: 63
ΕΡ 1 979 375/PT
Tabela 6: Valores de CIM contra Enterococosr Estreptococos e
Estafllococos
Organismo Ala(O)- desoxiactagardina-B Desoxiactagardina- B M. luteus 4698 +200 μg/ml Ca2+ 4 8 E. faecalis 29212 16 16 E. faecalis 29212 +200 gg/ml Ca2+ 4 8 E. faecalis 29212 +400 gg/ml Ca2+ 4 E. faecium 7131121 (VRE) >64 >64 E. faecium 7131121 (VRE) +200 gg/ml Ca2+ >64 >64 E. faecium 7131121 (VRE) +400 gg/ml Ca2+ 32 E. faecium 19579 >64 >64 E. faecium 19579 +200 gg/ml Ca2+ >64 >64 E. faecium 19579 +400 gg/ml Ca2+ 16 S. aureus R33 (MRSA) 32 32 S. aureus R33 (MRSA) +200 gg/ml Ca2+ 16 8 S. aureus R33 (MRSA) +400 gg/ml Ca2+ 16 S. aureus SH1000 16 16 S. aureus SH1000 +200 gg/ml Ca2+ 8 8 S. aureus SH1000 +400 gg/ml Ca2+ 16 S. epidermidis 11047 16 32 S. epidermidis 11047 +200 gg/ml Ca2+ 8 16 S. epidermidis 11047 +400 gg/ml Ca2+ 16 S. pneumoniae R6 16 16 S. pneumoniae R6 +200 gg/ml Ca2+ 32 6 S. pneumoniae R6 +400 gg/ml Ca2+ 4 S. aureus 12232 MRSA 16 S. aureus R36 (MRSA) 16 S. aureus R34 (MRSA) 16 S. aureus R39 (MRSA) >32 5. aureus R40 (MRSA) >32 S. aureus W71 (MRSA) >32 S. aureus W74 (MRSA) >32 S. aureus W96 (MRSA) >32 S. aureus W97 (MRSA) >32 S. aureus W98 (MRSA) >32 S. aureus W99 (MRSA) >32 S. epidermidis 7755298 (MRSE) >32 S. epidermidis 7865688 (MRSE) >32 64
ΕΡ 1 979 375/PT
Organismo Ala(0)- desoxiactagardina-B Desoxiactagardina- B S. epidermidis 7753921 (MRSE) >32 S. epidermidis GRL05011 (MRSE) >32
Tabela 7: Valores de CIM contra Staphylococcus aureus resistente ao ácido fusídico
Organismo Desoxi-Actagardina B S. aureus res. ácido fusídico 8325-4 8, 8 S. aureus res . ácido fusídico CS1116 32, 32 s. aureus res . ácido fusídico CS957 32, 32 s. aureus res . ácido fusídico CS767 32, 32 s. aureus res . ácido fusídico CS858 32, 32 s. aureus res . ácido fusídico CS741 32, 32 s. aureus res . ácido fusídico CS1145 16, 16 s. aureus res . ácido fusídico CS872 16, 16 s. aureus res . ácido fusídico CS 8 66 32, 32 s. aureus res . ácido fusídico CS607 64, 64 s. aureus res . ácido fusídico CS22 16, 16 s. aureus res . ácido fusídico 8325-4 +200 μμ/πύ. Ca2+ 4, 4 s. aureus res . ácido fusídico CS1116 +200 pg/ml Ca2+ KO t—1 16 s. aureus res . ácido fusídico CS957+200 pg/ml Ca2+ 16, 16 s. aureus res . ácido fusídico CS767 +200 μg/ml Ca2+ 16, 16 s. aureus res . ácido fusídico CS858 +200 μg/ml Ca2+ 16, 16 s. aureus res . ácido fusídico CS741+200 μς/ιηΐ Ca2+ 16, 16 s. aureus res . ácido fusídico CS1145 +200 μς/ιηΐ Ca2+ 8, 8 s. aureus res . ácido fusídico CS872 +200 μς/ιηΐ Ca2+ 8, 8 s. aureus res . ácido fusídico CS866 +200 μg/ml Ca2+ 8, 8 s. aureus res . ácido fusídico CS607 +200 μg/ml Ca2+ 32, 32 s. aureus res . ácido fusídico CS22 +200 μς/τη! Ca2+ 4, 4
Tabela 8: Valores de CIM contra Staphylococcus aureus resistente a mupirocina Organismo Desoxi-actagardina B 8325-4 8, 8 GISA-2 8, 8 LZ6 16, 16 LZ8 16, 16 LZ 9 16, 16 LZ10 8, 8 65
ΕΡ 1 979 375/PT
Organismo Desoxi-actagardina B 420 4, 4 1205 16, 16 1120 16, 16 1454 16, 16 1086 8, 8
Tabela 9: Valores de CIM contra Propionibacterium acnes
Organismo Desoxi-Actagardina B Propionibacterium acnes P37 (estirpe lab) 4, 4 P. acnes ATI 4, 4 P. acnes AT26 2, 2 P. acnes 101897d 2, 2 P. acnes PF284 (res tet) 2, 2 P. acnes PF286 (res eritro & clin) 2, 2 P. acnes PF289 (res clin e cotrimazol) 4, 8
Tabela 10: Valores de CIM contra C. difficile
Organismo Ala(0)-desoxiactagardina B Desoxiac tagardi na-B C. diffcile 37779 4 4 C. diffcile 19126 2 4 CIMso 10 Estirpes de C. difficile 2 Estirpes de C.difficile 4
Tabela 11: Valores de CIM contra C. difficile
Organismo I II III IV V VI VII VIII IX C. difficile 37779 >8 4 4 8 1 4 1 C. difficile 19126 >8 4 4 8 2 4 2 CIM5o de C. difficile 2 2 2 CIM90 de C. difficile 4 4 2
Materiais & Métodos
Os materiais e métodos utilizados nos Exemplos 2-7 acima sao como se segue: 66
ΕΡ 1 979 375/PT
Meios
Todos os tampões, soluções e meios foram preparados utilizando água em osmose inversa (OR) e continham por litro os ingredientes seguintes: AASl ABB13 Amido solúvel 10 g Peptona Soytone 5 g Glucose 10 g Tímido solúvel 5 g Peptona 5 g CaC03 3 g Licor de maceração de milho seco i g MOPS 2,1 g Extrato de levedura 2 g Ágar 20 g Ajustar o pH a 6,0 Ajustar o pH a 7,0 GM1 BHI Extrato de carne Lablemco 4 g Brain Heart Infusion 37 g Peptona 4 g NaCl 2,5 g GM3 Extrato de levedura i g Farinha de soja Arkasoy 20 g Farinha de soja 10 g Manitol 20 g Glucose 25 g Ajustar o pH a 7,0 CaC03 5 g Ajustar o pH a 7,6 LA Ágar Luria 40 g Mueller Hinton Caldo Mueller Hinton 21 g LB Para placas de ágar adicionar; Caldo Luria 25 g Ágar 10 g SFM SV2 Farinha de soja 20 g Glucose 15 g D-manitol 20 g Glicerol 15 g Ágar 16 g Peptona 15 g NaCl 3 g CaC03 i g Ajustar o pH a 7,0 Tampão TAE TSB Tris 48,44 g Caldo de soja tripsinico 30 g EDTA 3,72 g Ajustar o pH a 7,0 67
ΕΡ 1 979 375/PT
Ajustar o pH a 8,3 2TY "65" Triptona 16 g Glucose 4 g Extrato de levedura 10 g Extrato de levedura 4 g NaCl 5 g Extrato de malte 10 g Ajustar o pH a 6,5 - 7,0 CaC03 2 g Ágar 12 g Ajustar o pH a 7,2
Bioensaios 0 Micrococcus luteus foi inoculado a partir da reserva congelada em 10 ml de caldo Mueller-Hinton e deixado crescer durante a noite a 30°C com agitação a 200 rpm. 1 ml desta cultura foi utilizado para inocular 300 ml de ágar Mueller-Hinton que foi depois vertido em discos petri. Foram feitas cavidades (6 mm de diâmetro) equidistantes uma das outras utilizando um saca-rolhas e estas foram subsequentemente carregadas com 50 μΐ da respetiva amostra. A placa de bioensaio foi colocada num fluxo de ar laminar até as amostras carregadas terem difundido, ponto em que as placas foram transferidas para uma incubadora a 30°C e deixadas repousar durante a noite.
Digestões com endonuclease de restrição
As digestões de ADN com enzimas de restrição foram realizadas nos tampões fornecidos e de acordo com as normas dos fabricantes. Tipicamente, para digestões preparativas, 5 μg de ADN foram digeridos com 12 unidades de enzima durante 3 h à temperatura recomendada. Para digestões analíticas, 0,5 μg de ADN foi digerido com 2 unidades de enzima durante 2-3 h, de novo, à temperatura recomendada. O ADN digerido foi analisado por eletroforése em gel de agarose.
Sub-cultura de exconjugantes
Utilizaram-se tampões de ágar de exconjugantes adesivados para inocular balões de 50 ml contendo 8 ml de TSB e 2 pérolas de vidro. As culturas foram incubadas a 30°C, 250 68
ΕΡ 1 979 375/PT rpm, durante 10 dias, e, em seguida, removeram-se 100 μΐ e adicionaram-se a 10 ml de TSB num frasco de 50 ml contendo 2 pérolas de vidro. Os balões foram incubados durante 2 dias e, em seguida, removeu-se 1 ml e utilizou-se para inocular um frasco de 50 ml contendo 10 ml de TSB. Utilizando 1 ml de inoculo, realizaram-se seis ciclos sucessivos de crescimento, cada um incubado durante 2 dias a 30°C, 250 rpm. As células dos seis ciclos de subcultura foram transformadas em pelotas por centrifugação a 4000 rpm durante 20 minutos (Heraeus Sepatech Megafuge) , depois sofreram tratamento por ultrassons (MSE Sanyo Soniprep 150, amplitude 10-15 micra) durante 30 segundos em TSB para romper o micélio. Plaquearam-se diluições em série (1O^1 a 10~5 em TSB) das células que sofreram tratamento por ultrassons em meio 65 e incubaram-se a 3 0 ° C .
Fermentação para expressão heteróloga
Balões cónicos de 50 ml contendo cada 2 pérolas de vidro e 8 ml ou de TSB ou de meio AAS1 suplementado com ácido nalidixico e o antibiótico seletivo adequado foram inoculados utilizando tampões de ágar ou 250 μΐ de uma reserva de glicerol a -80°C. Após 2-4 dias de incubação a 30°C, 200 rpm, utilizaram-se 1,2 ml (3%) por cultura de sementes para inocular 40 ml do respetivo meio de produção em balões cónicos de 250 ml contendo 2 pérolas de vidro. Estas culturas foram incubadas a 30°C, 200 rpm, durante 9 dias. Removeram-se periodicamente 1,5 ml de aliquotas de caldo completo a partir de cada cultura para análise por bioensaio e/ou análise por HPLC-MS.
Fermentação de A. liguriae para o isolamento de desoxi-actagardlna B
Balões cónicos de 250 ml contendo cada 2 pérolas de vidro e 50 ml de meio SV2 foram inoculados com 500 μΐ (1%) de células A. liguriae de uma reserva em glicerol. Após 4 dias de incubação a 30°C, 250 rpm, utilizaram-se 12 ml (3%) por cultura de sementes para inocular 400 ml de GM3 em balões cónicos de 2L. Estas culturas foram incubadas a 30°C, 225 rpm, durante nove dias. O caldo de cultura foi colhido por centrifugação a 4000 rpm (Heraeus Sepatech Megafuge) durante 69 ΕΡ 1 979 375/ΡΤ 30 minutos após ο que ο sobrenadante foi decantado a partir da pelota de células.
Fermentação de A. garbadinensis para o isolamento de actagardina e Ala (0) -actagardina
Balões cónicos de 250 ml contendo cada 2 pérolas de vidro e 50 ml de meio AAS foram inoculados com 500 μΐ (1%) de células A. garbadinensis de uma reserva em glicerol. Após 9 dias de incubação a 30°C, 250 rpm, utilizaram-se 12 ml (3%) por cultura de sementes para inocular 400 ml de AAS em balões cónicos de 2L. Estas culturas foram incubadas a 30°C, 200 rpm, durante oito dias. O caldo de cultura foi colhido por centrifugação a 4000 rpm (Heraeus Sepatech Megafuge) durante 30 minutos após o que o sobrenadante foi decantado a partir da pelota de células.
Isolamento de Desoxi-actagardina B para estudos de CIM
Adicionou-se resina Diaion HP-20 (50 g/1) e misturou-se com sobrenadante isolado a partir de uma fermentação de A. liguriae deixando-se repousar durante a noite a 4°C. A suspensão foi separada em aliquotas em colunas Bond Elut (60 ml) e a resina sequencialmente lavada com quatro volumes de leito de água seguidos por três volumes de leito de metanol a 25, 50, 75 e 100%. A análise por HPLC confirmou a presença de Desoxi-actagardina B nas frações de metanol a 50, 75 e 100%.
Estas frações foram combinadas, depois concentradas até aproximadamente um quarto do volume do grupo de partida. O concentrado de 1 1 de caldo foi carregado em duas colunas Cl8 Bond Elut (5 g) que tinham sido pré-acondicionadas por lavagem com dois volumes de coluna de metanol a 100% seguidos por dois volumes de coluna de água. As colunas foram sequencialmente eluidas com dois volumes de coluna de metanol a 50, 60, 70, 80, 90% seguidos por dois volumes de coluna de metanol a 100%. A análise por HPLC confirmou a presença de Desoxi-actagardina B nas frações de metanol a 80, 90 e 100%, estas frações foram reunidas e concentradas até um terço do volume de partida. Adicionou-se um volume igual de fosfato de potássio 40mM, pH 2,5, em metanol a 50% e o concentrado foi uniformemente carregado em três colunas SCX Bond Elut pré-equilibradas (lg) . As colunas SCX foram inicialmente lavadas 70
ΕΡ 1 979 375/PT com fosfato de potássio 40mM, pH 2,5, em metanol a 50% e depois eluidas utilizando 1,5 volumes de coluna de fosfato de potássio 250mM, pH 7,0, em metanol a 50%. 0 eluente foi
dessalinizado por carregamento numa coluna C18 Bond Elut (5 g) gue tinha sido pré-acondicionada com dois volumes de coluna de metanol seguido por dois volumes de coluna de água. A coluna foi lavada com dois volumes de coluna de metanol a 50% e depois metanol a 60%. A Desoxi-actagardina B foi eluida depois da adição de dois volumes de coluna cada com metanol a 70, 80, 90 e 100%. As frações contendo Desoxi-actagardina B purificada confirmada por análises por HPLC e LC-MS foram reunidas e evaporadas até à secura.
Isolamento de Ala (0) -Desoxlactagardlna B a partir da fermentação de A. llgurlae A resina Diaion HP-20 (50 g/1) foi misturada com sobrenadante de uma fermentação de quatro litros de A. liguriae deixando-se repousar durante a noite a 4°C. A suspensão foi recolhida num funil de vidro sinterizado e a resina subsequentemente lavada com quatro volumes de leito de água seguidos por quatro volumes de leito de metanol a 50%. A Desoxi-actagardina B e a Ala(0)-desoxiactagardina B foram eluidas a partir da resina por lavagem com cinco volumes de leito de metanol a 100%. A fração de metanol a 100% foi concentrada até um terço do volume original e foi depois diluída por adição de água até uma concentração final de metanol a 60%. A solução resultante foi carregada em quatro colunas Cl 8 Bond Elut de 10 g antes da lavagem com dois volumes de coluna de metanol a 50%. Os componentes relacionados com a Desoxi-actagardina B foram eluídos a partir da coluna utilizando dois volumes de coluna de Metanol/Ácido Fórmico a 0,5%. O eluente resultante foi concentrado por evaporação até 40 ml e a Ala (0)-desoxi-actagardina B foi separada a partir de Desoxi-actagardina B por HPLC preparativa utilizando as condições descritas na tabela abaixo. 71
ΕΡ 1 979 375/PT
Coluna Capitol HPLC Ltd C18 - BDS - HL5 - 26052 15cm x 20mm Solvente A ACN a 30% em Fosfato de Potássio 20mM pH 5,0 Solvente B ACN 65% em Fosfato de Potássio 20mM pH 5,0 Deteção 210 nm Velocidade de fluxo 10 ml/min Tempo (T) =0 min 100% A T = 1 min 100% A T = 29 min 35% B T = 30 min 100% B T = 33 min 100% B T = 34 min 100% A T = 35 min 100% A Recolha Inicio 10 min; Fim 30 min; frações de 0,5 ou 0,25 minutos
As frações contendo Ala(0)-desoxi-actagardina B (como confirmado por análises por HPLC e LC-MS) foram dessalinizadas utilizando colunas C18 Bond Elut como acima descrito antes de serem evaporadas até à secura. A Ala(0)-desoxi-actagardina B foi eluida a partir da coluna ao Tempo de Retenção = 5,04 minutos. A análise por MS confirmou uma espécie de 972,2 m/z (M+2H)+2.
Isolamento de actagardina e Ala(0)-actagardina para estudos CIM A actagardina e a Ala(0)-actagardina foram purificadas utilizando o método descrito para a purificação de Desoxi-actagardina B de A. llgurlae com a exceção de ser necessária a HPLC preparativa para resolver Ala(0)actagardina e Actagardina seguindo o passo de SCX Bond Elut. 0 eluente da coluna SCX Bond Elut foi concentrado por evaporação rotativa a partir de 70 até 18 ml e o concentrado foi purificado por HPLC preparativa utilizando as condições descritas na Tabela 4. As frações respetivas contendo Actagardina e Ala(0)actagardina (como confirmado por análises por HPLC e LC-MS) foram dessalinizadas utilizando colunas C18 Bond Elut como previamente descrito antes de serem evaporadas até à secura. 72
ΕΡ 1 979 375/PT
Tabela 4: Condições de HPLC preparativa para a separação de Actagardina e Ala(0)actagardína.
Coluna Capitol HPLC Ltd C18 - BDS - HL5 - 26052 15cm x 2 0mm Solvente A Acetonitrilo a 30% em Fosfato de Potássio 20mM pH 7,0 Solvente B Acetonitrilo a 65% em Fosfato de Potássio 20mM pH 7,0 Deteção 2 68 nm Velocidade de fluxo 10 ml/min Tempo (T) =0 min 100% A T = 1 min 100% A T = 19 min 25% B T = 20 min 100% B T = 25 min 100% B T = 26 min 100% A T = 30 min 100% A Recolha Início 8 min; Fim 20 min; frações de 1 minuto
Eletroforese em gel de acjarose A eletroforese do ADN foi realizada como descrito por Sambrook et al., 1989. Os geles de agarose (0,7-1%) foram preparados em tampão TAE contendo uma concentração final de 0,1 μg/ml de brometo de etídio para permitir a visualização do ADN por luz UV. Misturaram-se com as amostras 0,1 volumes de solução de carga de gel de agarose lOx. As amostras foram carregadas no gel ao longo de escadas (ladders) de digestão de 100 pb, 1 kb ou lambda ADN-ífindIII (NEB) e corridas a 1-5 V/cm. O gel foi visualizado a λ = 300 nm e fotografado utilizando uma câmara de vídeo UVP.
Recuperação do ADN a partir de geles de agarose O ADN foi excisado a partir de geles de agarose e recuperado utilizando um estojo de extração Qiaquick (Qiagen) e eluído ou em água purificada por osmose inversa estéril, Tris-HCl (lOmM, pH 8,5) ou em tampão TE. 73 ΕΡ 1 979 375/ΡΤ
Enchimento final Ο enchimento dos terminais 3' embutidos criados por digestão do ADN com enzimas de restrição foi realizado utilizando fragmento Klenow de ADN-polimerase de E. coli. Numa reação típica, adicionou-se 1 unidade de enzima por μg de ADN juntamente com 250μΜ de cada dNTP. A reação foi
incubada a 25°C durante 15-30 min e parada por adição de EDTA até uma concentração final de lOmM.
Fosforilação do ADN
Os produtos de PCR foram tratados com polinucleótido-quinase T4 a 37°C durante 30 min, seguindo o método descrito por Sambrook et al., 1989. A enzima foi inativada por incubação a 65°C durante 20 min.
Desfosforilação de vetores linearizados
Para evitar a autoligação de vetores linearizados, os grupos 5'-fosfato foram removidos utilizando fosfatase alcalina de camarão (SAP) seguindo as normas do fabricante. Numa reação típica, adiciona-se 1 unidade de SAP à mistura de restrição durante a última hora da reação de restrição de ADN. A enzima foi inativada por incubação a 65°C durante 20 min.
Ligações
As ligações de ADN foram realizadas como descrito por Sambrook et al. , (1989) utilizando 1 unidade (U) de ADN- ligase T4 num volume total de 15 μΐ e incubação durante 12-16 h a 16°C.
Manutenção das culturas bacterianas
As células viáveis foram armazenadas como suspensões em glicerol congelando 0,5 ml da cultura respetiva a -80°C com glicerol numa concentração final de 10%. Obtiveram-se colónias simples de A. garhadinensis e A. liguriae fazendo riscos de 50 μΐ de um caldo de fermentação ou de reserva de glicerol ou em meio 65 ou em placas ABB13. 74
ΕΡ 1 979 375/PT
Reação em cadeia de polimerase
As reações em cadeia de polimerase (PCRs) foram realizadas num Stratagene Robocycler Gradiente 96. Numa reação tipica 100-200 ng de ADN de matriz foram misturados com 20 pmole de cada iniciador de oligonucleótido e dNTPs a 250 μΜ cada. O tampão de ADN-polimerase termofilica fornecido pelo fabricante e DMSO perfizeram 10% (v/v) cada de um volume final de 50 ou 100 μΐ de mistura reacional. Uma reação tipica começou com um ciclo inicial de 1 min de desnaturação (94°C), 1 min, Y°C (hibridação) e 30 segundos - 3 min de prolongamento (72°C), momento no qual se adicionaram 5 unidades de ADN-polimerase termofilica. Esta foi seguida por 30 ciclos de 94°C durante 1 min, Y°C (hibridação) durante 1 min e 72°C durante X min e um ciclo final de 72°C durante 2X min. 0 tempo de prolongamento X foi de 1 min por kb de produto quando se utilizou a Tag-polimerase e 2 min por kb de produto quando se utilizou a Pfu-polimerase. A temperatura de hibridação Y foi de 55°C e 49°C na produção de pAGvarl e pAGvar2, respetivamente. As condições utilizadas para a produção de SBdel-1 e SBdel-2 foram como descrito no protocolo Redirect (Gust et al., 2004).
Iniciadores
Nome do iniciador SEQ ID NO: Sequência 5'-3' O/AGvarOlbF 303 TTCTAGACGTTGTTCTCCCATTTTCAC O/AGvar02bR 304 AAGATCTTCGAAGGTGAGCTCGCCGAA O/AGvar03F 305 GATCTTCGCGAGGACCGCACCATCTACGCCGCCAGCA GCGGCTGGGTGTGTACACTGACGATCGAGTGCGGCAC CGTGATCTGCGCCTGCTGAC O/AGvar04R 306 CTAGGTCAGCAGGCGCAGATCACGGTGCCGCACTCGA TCGTCAGTGTACACACCCAGCCGCTGCTGGCGGCGTA GATGGTGCGGTCCTCGCGAA O/AGvar05F 307 GCCTGCTGACCTAGGTCGACGATCGT O/AGvar06r 308 TGAATTCGGCTGCTCCCCGCGCGAAAT O/SB50F 309 ATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCAT GATTCCGGGGATCCGTCGACC 75 ΕΡ 1 979 375/ΡΤ
Nome do iniciador SEQ ID NO: Sequência 5'-3' 0/SB51R 310 GGGCGATGCCCGCCCCGGGCCGGAAACGATCGTCGAT CATGTAGGCTGGAGCTGCTTC 0/SB52F 311 AAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATG ATTCCGGGGATCCGTCGACC 0/SB53R 312 GCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCA TGTAGGCTGGAGCTGCTTC
Preparação do ADN de plasmídeo 0 ADN de plasmídeo foi preparado numa pequena escala (menos de 20 μρ de preparação) por inoculação de 3 ml de 2TY ou LB, estéril, contendo o antibiótico adequado com as colónias simples colhidas a partir de placas de ágar 2TY (ou LA) . As culturas foram incubadas durante a noite (12-16 h) a 37°C e 250 rpm. As células foram recolhidas por centrifugação a 12000xg durante 1 min e o ADN de plasmídeo obtido utilizando estojos Wizard (Promega) Miniprep de acordo com as normas do fabricante. No caso de preparações maiores de até 100 μρ de ADN de plasmídeo, deixaram-se crescer 30 ml de culturas 2TY e o ADN de plasmídeo foi extratado utilizando-se o estojo Qiagen Midi-prep, seguindo as instruções do fabricante. Todas as preparações de plasmídeo foram verificadas por uma combinação de análise de restrição e/ou análise de sequência.
Preparação de ADN de cosmídeo O ADN de cosmídeo foi preparado por inoculação de 50 ml de 2TY ou LB, estéril, contendo o antibiótico adequado com as colónias simples colhidas a partir de placas de ágar 2TY (ou LA). As culturas foram incubadas durante a noite (12-16 h) a 37°C e 250 rpm. As células foram recolhidas por centrifugação a 4000xg (Heraeus sepatech Megafuge 2.0R) durante 20 min e o ADN de cosmídeo foi isolado utilizando-se o estojo Qiagen Midi-prep, de acordo com as normas do fabricante. 76
ΕΡ 1 979 375/PT
Preparação e transformação de células E. coli eletrocompetentes
As DH10B de E. coli eletrocompetentes foram preparadas pelo método de Dower et al. , (1988) . As alíquotas (60 μΐ) de
células competentes foram descongeladas em gelo e adicionou-se 1,8 μΐ da mistura de ligação ou ADN de plasmideo. A mistura foi colocada numa cuvete de eletroporação (Sigma 0,1 cm) e transferida para o eletroporador (eletroporador Stratagene 1000) . Aplicou-se uma diferença de potencial de 1,8 kV/mm (25 pF, 200 Ω) e adicionou-se subsequentemente 0,5 ml de meio 2TY ou LB. As células foram então incubadas a 37°C durante 45-60 min para permitir a expressão dos genes de resistência a antibiótico, antes do plaqueamento no meio seletivo adequado.
Preparação do ADN genómico A matriz de ADN genómico foi preparada utilizando o procedimento descrito por Kieser et ai. (2000).
Procedimento de conjugação para Actinoplanes sp. A conjugação intergenérica entre E. coli e Actinoplanes sp. foi realizada seguindo o procedimento descrito por Heinzelmann et al. (2003), com exceção para, a estirpe E. coli ET12567/pUB8002 (Kieser et al., 2000) que foi utilizada em vez da estirpe E. coli ET12567/pUB307 (Flett et ai., 1997). Os exconjugantes foram transferidos e adesivados sobre uma área de aproximadamente 1 cm2 em meio 65 ou ABB13 contendo 50 pg/ml de ácido nalidixico e o antibiótico seletivo relevante. Estas placas foram incubadas a 30°C durante 4-7 dias antes de serem utilizadas como inoculo para culturas de caldo.
Procedimento de conjugação para Streptomyces sp.
A conjugação intergenérica entre E. coli e Streptomyces sp. foi realizada seguindo o procedimento descrito por Kieser et al., 2000. Os exconjugantes foram transferidos e adesivados sobre uma área de aproximadamente 1 cm2 em SFM 77 ΕΡ 1 979 375/PT contendo 50 μg/πιl de ácido nalidixico e o antibiótico seletivo relevante. Estas placas foram incubadas a 30°C durante 4-7 dias antes de serem utilizadas como inoculo para culturas de caldo.
Tabela 5- Estirpes Bacterianas
Nome Descrição/Utilização Actinoplanes garbadinensis ATCC31049 Isolamento do aglomerado de genes biossintéticos para a produção de actagardina. Actinoplanes garbadinensis Δ Actinoplanes garbadinensis ATCC31049 em que o gene actA foi removido. actA Expressão de genes actA variantes Actinoplanes liguriae NCIMB 41362 Isolamento do aglomerado de genes biossintéticos para a produção de desoxi-actagardina B. Expressão de genes lígA variantes. Escherichia coli XLl-Blue MR Produção de uma biblioteca de cosmideos. Escherichia coli DH10B Acoplamento de rotina. Escherichia coli ET12567 Isolamento de ADN não-metilado. Escherichia coli ET125 67/pUZ8 0 02 Transferência intergénica de ADN através de conjugação. Escherichia coli BW2 5115/plJ7 90 Estirpe contendo o plasmídeo de recombinação lambda vermelho plJ790. Facilita a recombinação alvo de uma cassete flanqueada pelos sitios de reconhecimento FLP. Escherichia coli DH5ot/BT340 Estirpe contendo o plasmídeo BT340 que facilita a excisão mediada por FLP de cassetes de rutura. Mícrococcus luteus ATCC4698 Organismo de teste de bioensaio. Streptomyces lividans 1326 Organismo hospedeiro para a expressão heteróloga. Streptomyces coelicolor B75 7 Organismo hospedeiro para a expressão heteróloga. Streptomyces cinnamoneus DSM 40005 Organismo hospedeiro para a expressão heteróloga.
Antibióticos
As soluções de reserva de antibióticos foram preparadas em água (a não ser que de outro modo indicado) e esterilizadas por filtração por passagem através de um filtro 78
ΕΡ 1 979 375/PT
Millipore de 0,22 μιη. As soluções dissolvidas em etanol não foram esterilizadas (Sambrook et ai., 1989). Todos os antibióticos foram armazenados a -20°C. Nos meios nos quais se utilizou a apramicina, adicionou-se MgCl2 até uma concentração final de lOmM (a partir de uma reserva de 2,5M).
Solução de reserva Concentração de trabalho Ampicilina (amp) 100 mg/ml 100 μg/ml Apramicina (apra) 100 mg/ml 50 μg/ml Carbenicilina (car) 100 mg/ml 100 μg/ml Cloranfenicol (cm) 25 mg/ml em etanol 25 μg/ml Canamicina (kan) 50 mg/ml 50 μg/ml Ácido nalidixico (na) 25 mg/ml 25 μg/ml
Cassetes
Nome Tamanho (pb) Fonte Descrição/Utilização SBdel- 1 1462 PCR que utiliza os iniciadores O/SB50F e 0/SB51R e plJ773 como uma matriz. Contém uma origem de transferência (oríT) e gene de resistência à apramicina flanqueado por sítios alvo de reconhecimento FLP. As regiões 5' e 3' são homólogas ao ADN que flanqueia o gene actA de A. garbadinensis. SBdel- 2 1462 PCR que utiliza os iniciadores 0/SB52F e 0/SB53R e plJ773 como uma matriz. Contém uma origem de transferência (oríT) e gene de resistência à apramicina flanqueado por sítios alvo de reconhecimento FLP. As regiões 5' e 3' são homólogas ao ADN que flanqueia o gene de resistência à ampicilina de SuperCosl. HEapra 5247 pMJCOSl Fragmento SspI isolado a partir de pMJCOSl. A cassete consiste num gene de resistência à apramicina, origem de transferência {oríT), sítio de ligação (attP) e integrase 0C31. 79
ΕΡ 1 979 375/PT
Vetores
Nome Tamanho (kb) Marcador de resistência Fonte Descrição/Utilização pAGvarl 3,1 amp Este estudo. Fragmento de PCR de 449 pb produzido utilizando-se os iniciadores O/AGvarOlbF e O/AGvar02bR e a matriz pLITAGOl clonada em pUC19 previamente digerido utilizando Smal. pAGvar2 2,8 amp Este estudo. Fragmento de PCR de 91 pb produzido utilizando-se os iniciadores O/AGvar05F e O/AGvar06R e a matriz pLITAGOl clonado em pUC19 previamente digerido utilizando Smal. pAGvar3 3,2 amp Este estudo. Fragmento Xbal (-450 pb) clonado em pAGvar2 previamente digerido utilizando Xbal. pAGvar4 3,3 amp Este estudo. Oligonucleótidos hibridados O/AGvar03F, O/AGvar04R ligados a pAGvar3 previamente digerido utilizando Bgl/11 e Avrll. pAGvarX 6, 3 apra Este estudo. Fragmento Xbal - EcoRI (-650 pb) de pAGvar4 ligado a pSET152 previamente digerido utilizando EcoRI/Xbal. Os genes actagardina variantes podem ser reunidos e introduzidos nos cromossomas hospedeiros através do sítio de ligação attP. CosAL02 47,2 amp e neo. Este estudo. Fragmento de ADN Sau3AI de 40402 pb de A. liguriae clonado em SuperCosl previamente digerido utilizando BairRI. CosAL02HEapra 49,1 amp e apra. Este estudo. CosAL02 em que o gene que codifica neomicina foi substituído pela cassete HEapra. CosAG14 45 amp e neo. Este estudo. Fragmento de ADN Sau3AI de 38168 pb de A. garbadinensis clonado em SuperCosl previamente digerido utilizando BairRI. CosAG14AA 46,3 amp, neo e apra. Este estudo. CosAG14 em que o gene actA foi substituído pela cassete SBdel-1. 80
ΕΡ 1 979 375/PT
Nome Tamanho (kb) Marcador de resistência Fonte Descrição/Utilização CosAG14AB 44,9 amp e neo. Este estudo. CosAG14AA em que a cassete SBdel-1 foi removida por FLP-recombinase deixando uma cicatriz de 81 pb. CosAG14AC 45,5 neo e apra. Este estudo. CosAG14AB em que o gene de resistência à ampicilina foi substituído pela cassete SBdel-2. CosAG14HEapra 46, 9 amp e apra. Este estudo. CosAG14 em que o gene que codifica neomicina foi substituído pela cassete HEapra. plJ773 4,3 amp e apra. John Innes Centre (JIC), Norwich. Matriz Redirect (Gust et al., 2003) utilizada para produzir as cassetes SBdel-1 e SBdel-2. pLITAGOl 6,1 amp. Este estudo. Fragmento Ncol de 3263 pb isolado a partir de A. garbadinensis (19955-23217 CosAG14rc) clonado em pLITMUS28 previamente digerido utilizando Ncol. pLITMUS28 2,8 amp. New England Biolabs (NEB). Clonagem de rotina pMJCOSl 9,8 amp e apra. JIC, Norwich. SuperCos1 em que o gene que codifica a neomicina foi substituído por um fragmento SspI que consiste num gene de resistência à apramicina, oríT, attP e integrase 0C31. Fonte de cassete HEapra. pSET152 5,7 apra. NRRL B14792 Plasmídeo conjugativo que pode facilitar a introdução de ADN no cromossoma do hospedeiro através do sítio attP. SuperCos1 7,9 amp e neo. Stratagene. Regiões promotoras T3 e T7 que flanqueiam um sítio de clonagem único. pUC19 2,7 amp. NEB. Clonagem de rotina
Cromatografia líquida de elevada resolução
As análises por HPLC foram realizadas utilizando um sistema de HPLC Hewlett Packard série 1050 com os parâmetros descritos abaixo:
81 ΕΡ 1 979 375/PT
Coluna : Fase Móvel A: Fase Móvel B: Velocidade de fluxo: Gradiente: Tempo 10 min Tempo 11 min Tempo 11,2 min
Zorbax SB-C18, 4,6x150 mm, 5μ Acetonitrilo a 30% em tampão de fosfato de potássio 20mM pH 7,0 Acetonitrilo a 65% em tampão de fosfato de potássio 20mM pH 7,0 1 ml/min
Tempo 0 min 100% A 0% A 100% B 0% A 100% B 100% A 0% B
0% B
Tempo de ciclização 15 min
Volume de injeção: ίο μΐ Deteção: 210 nm
Croma togra fia_líquida de elevada resoluçãoespectrometria de massa (HPLC-MS)
As análises por HPLC-MS foram realizadas num sistema de HPLC Hewlett Packard série 1050 ligado a um Micromass Platform LC (operado com software MassLynx versão 3.5) com os parâmetros seguintes:
Coluna: Velocidade de fluxo: Fase móvel:
Comprimento de onda: Volume de injeção: Divisão de pós-coluna: Espectrómetro de massa: Modo: Velocidade de azoto: Voltagem capilar: Ressalto de lente skimmer:
Agilent Zorbax SB-C18 150x4,6 mm 5μ 1 ml/min A acetonitrilo a 10%, ácido fórmico a 0,1%, água a 90% B acetonitrilo a 90%, ácido fórmico a 0,1%, água a 90% Gradiente linear de A para B durante 10 minutos, manutenção 1 min, B-A 200 - 400 nm 10 μΐ 1:10 Micromass Platform LC Electrospray positivo 380 1/h 4 0V 5V
Depósito
NCIMB 41362 foi depositado conforme Budapeste a 7 de dezembro de 2005 em NCIMB o Tratado de Ltd, Aberdeen, AB21 9YA, Escócia, UK, pela Novacta Biosystems Limited. 82
ΕΡ 1 979 375/PT
Listagem de Sequências SEQ XD tf 0:1 Ac tagardina B:
SSGWVCTLTIECGTLVCAC SEQ XD NO: 2 variante W de Aotagardina B:
S 5 GWVCTLTIECGTVVCAC SE£? I£ NO:3 variante BI de Actagardina S:
SSGWVCTLTIECGTLICAC
SES XD NO: 4 Acfcagrardinaí SSGMVCTLTIECGTVICAC S3EG IB NO: 11 Ala-Aatagardina B: (Nulo) SBC XD NO: 11 Ala-Actagardln& B:
ASSGWVCTLTIECGTLVCAC
£££> IB NO: 12 variante W de Aia-Aotagardina B: ASSGWVCTLTIECGTWCAC ΒΒβ ΙΏ NO: 13 variante BI de Ala-Aatagardxna. B:
AS SGWVCTLTIECGTLICAC SEQ IB NO: 14 Ala~Actagazd±na.:
AS S GWVCTLTIECGTVICAC SEQ XD NO:15-SEQ XD NO:21 (tfnlo)
SEQ XD NO:22 variante W de prá-pro-Ac tagardina B; MSAITVETTWKNTDLREDLTAHPAGIiGFGELSFEDLREDRTIYAASSGWVCTLTIECGTWCAC SEQ XD NO:23 variante £1 de pré-pró-Acfcagardina B:
MS ALAIEKSWKDVDLRDGATS HPAGIiGFGELTFE DLREDRTIYAAS S GWVCTLTIECGTLTCAC SEQ XD NO:24-SEQ XD NO: 99 (Nulo) SEQ XD NO:100 ComAG14 {38168 pb) gatcggccgccgtcagctggagaagcgciggctggcgcggctcacccgcaacggccacccgcatccgacccgggcg ctggcgctgcggatgggcgcggtggagttcgcggggcagctggcgctgcagctcgccgacatgcgcaagcccggoa cgccgtcagcgacctgacccgctgctcgacgcagctcgctcgccggtcccgcgcggcgccgatcaactccggcagc acggcgcgagcttcaatcagccggcccggogcaccccctacgccggtgcgacgaggcatgcccgagaccagcgcgg ccgcagagggccggtcggcgccggaccggtcagcgcgcccgcaatcaggccggcaggcccgcccggagccggaccg gtcggcgcgcccgcaatcaggccgacaggcccgcccggggtcaggctggtcggctgcgccgggccggcaggccggc gagcagcgcgtcgagcgtctcggcatccgcccagccgttgactgacactgcgcctgccgccgtgaccgtgacctca aggcggtccggtgtcaccgccacgtcgatcggcgcgtcctcgatgcggtcgctcaagcggatgaactgctggttcg
TCGAGCCGACCCAGGGCCGCTCGTGGTCCAGCAGGTCCTGCCGGAAGGGGCCGGCCACCAGCAGGTCCGTGGCGTC
GAGCAGTGCGGCGACGTCGGCCCGGCCGTCCGCGGCGAGAGCGCGCAGACGGGCGTACTCGTAGCCGGTGAACGTC atgaccgagcgacccgcctgccgcaccccggcggccaccgcggcgagaccggccgcctgctcgaaçggctcgccgc
CGAGCAGGGTGACACCCGTGGTGCCCGTGGCGAGCACTCGGTCCACCAACTCGGCGGGTGCGGCCGGCACCCCACC gcgtacgccgaacaaatgcggattgaagcatccggcgcaccggatggtgcaaccctgcacccagatcgcggtccgc
TCGCCCGGTCCTTCGGCGGTGGTCCGGTCGAGGAACCGGGCCACCCGCACGAGCGGCGGCTCAGACATCGACTATC
CGACCGAAAGGCGTCTGGTTCGCTTGCGGCGGCGGCTCGCACGACAGCCGGTCCCGGACCGCGACGAACTCGTGTG 83 ΕΡ 1 979 375/PT gtgcgagcccggccacggccgcgaactcgccgagactggcgaatccgccccgcgcctgccgcgccgccacgacgtc
CGCCACCCGCTGCGGGGTGAGACCGGGCACGGCGGCCAACTGTTGCGCGTCCGCGGTGTTGACATCGAGCCGCTCG ggcgccggctccagcagcgagcccggcacacccccagccggcgagcccagcgcgggctccagcgggccgggcgcgg gcccagcgggccaggccgctgtgggctcagcctgccggccggctgcgggctcagcctgccagcccgctgccggctc
AGCCTGCCAGCCCGCTGCCGGCTCAGCCTGCCAGCCCGCTGCCGGCTCAGCGGGCCGGCCCGCCGCCGGCTCAGCC
AGCGGGCCCCTCGCGGGCTCAGGCCCGGGAGTCCCTCCGTAGAACTCTTGCGGCGAAGGAACGACACCCTGTAGTT
GCGGCGGCAGCGGAGTCGCCACGGGAGCGGGCGCGTTCGCCCACGGCGCCTGCTGGGGCTGCGCATACCACGGCAC
GTGAGCGGCACGCCAGCGCAGCCAGGAGGCGTTGATGACGAACGCGTGCGCGACGCTGATCGGCCACACCATGAAC
ATGATCGAGAACGCGAGGTTCTGCTGGAGCGAGTCCTCGGCGCCCTCACTGCCGAGAAAGAAGCAGAAGTTGGCCA
CGACGGTGTAGAGGATCCCGGCGATCCACCACACCGGCCGCCGGGCGCGGATGCCGACGTAGAGGAACCCGACCGC
GGAGAAACAGCTGAAGGGCACCATCGGCGCGATCACCCAGGCGCTGTGCGCGAGGCGCCACGACAGCCGCGCCGGC
CCGGTCCGCTTGCCCGGCTCGTGACCTGGATGCGGCGGATAGGACGGATACGGCTGCTGGTGAGCAGGCGGGAACG
GCGGCAGCGGCTGCTGACCGGAAGCAGGCGGGAACGGCGGCAGCGGCTGCTTGCCGAACGACGGCGGGTACGCCGG ctgcgaggcgggatacgggtcctggcccgggttaggcggtgtccacgtcacggttcacgatccgttcccgcgcggt gtgcgcctgacgcgtgtaatccgcggtgtacgcactgtgccgcacctgcccgccgacgagatcctccagaacggcc acgtagtccaggcagcgctcgccgagaatgtccacggtctcggcactgacctggcggtcgggaccgaccgtgacga cgatccgaggattctccgtcatgcccgctccctctccacctcgaagaccaggcgcacactggcgtcctggccgacc gactccgactccagccgcagcccggcctcgggcgcctgcgcgcgcagccgctccaggacggcctgctggacccgcc gcccgtacgcggtgtcgacggtcgtcatcaactcgacagcccctggctgatcgacgccggtgacgtgcgcggccca
GATGCCGTCCGCGCCGCGGGTGAACGTCGCGGCGCTCTGCGrCCAGGTCGCCGAGATCGTGTCGCCGGCGGCCGTC
ACGGTGGCTCCGGTGTCGCGCAGCGCCGCATCGAGCAGGGTGACATCGCGCATGCGGGTCTGCACCTGGCAGATCA gccggccgtcgtccatccggcccgcggcggcctgaaccgcggccgcgccggccatcgccaaoggcaccagcagcag
TGAAACGCTCACCATGCCCCCCGTTCTCGCTGTGGCCACACCCTATCGGCAGGGTGCGACAAATCATCGGTTGGTG aggtcccagtcgtcggtgccggtggccgacacggcgcgattgcgggcocagccgcgcagggcgtcgacccgctcgg cctgcgtcacgctgagcggcacgatgctcatcaccgcgcgtacgagatcgtcgcgccgcagtgggcggcgttcgga gaacgcgtcgaacagtcccgcaatgaccgcctgctctatctccgcgccggagtagccctcggtcagcccggccagc tcggtgagcagctcggcatcgacccgcagctcgccggcggcacgccggtgccgcagcgcccgcccgaggtgcaccc gccacaccgcgacccgctcggaccggctcggcagatccacgaagaacgtctcgtcgaagcgtcccttgcgcaacag ctccggcggcagcccgtcgaagtcgttggccgtcgcgatcacgaagaccggagtccgcttctcctgcatccaggtg aggaaggtgccgaagacccgggcaccggtgccggaatcacccccggtgccgccggcgaagcccttctcgatctcgt cgacccacaggacgcacggggcgaccgcctccgccgtacgcaatgcggtgcgcatgttgtgctcgctggaaccgac caggccggagaagacacggccgatgtcgaagcgcagcagaggcaggttccaggcggtcgcgaccgccttggcggtc agcgacttgccgcagcccggcacgccggtgatcagtacgccgcgcggcgcgggcaggccgtacccggccgcctcgt ccagccaggatccgttgcgtttgaccagccaggccttgaggttctocaggccgccgacgtcgtcgagcacggttcc ggcggccatgaactccagcacgcccgatttgcgtacggtctggcgcttctcctcgtgcacgatctccaggtcggcc agatcgagcacggcgtcgttcaccatggcccgggcgtacgcgttctccgcctcctgcatggtcaggccggccgcgg ccgtgacgaaccgctcccggctctgctcgtcgagctccacccgcagccgcccggacgcggtgttcccgcgcaccat ggcgtcgagcagagcgcgcaactccagctggccgggcagcgggaagtcgacgatcgtgacgtccttgctcagctcg accggcaggtccagtaccggcgagagcagcacgagtgtccgcgggctgcggccggcccggaacgcctgggcgatgt cgcgcaccagccggacgacctccgggctctgcgcgaacagcgggtgcaggtcgcggaagacgaagacagccggttc gtcgatgcgctgcaccgccctgagcgcgtcggtggcccgctgcgcgcccgagcgggcctcgccgttcggctggacc
AGACCGGCGGTCAGCGACCAGGTCCAGACGGCACGTGGCACGCGGACGAGGTCGGCGTCGCCGGCGATGCCGGCGA
GGTGGTGCAGCGCCCGCTGCTCCTCGTACGTCTCGAGGTGGAGCACCGGGAACCGGGCCTTCAACAGCTGCGCGAA
CGTCTCCGCGAACGACCTCTCCACCGGCGCATCCTACGGCCGCGCCGGCCGGCGTGTCAGAGCCCGGACGGGGTGC
CGGTGGCGTCGCGTGCCGTCCGGTCCTTCCCGCGCTCGACGGGTTCGTTGGGTTGATCGGTCATGGCATCCTCCTG
CTCAGTCCGGGCGGTAGACGGCGGTGTCCCCGGACACGGCGCCGGGGTCGTACCCCGAGCGGCCGGTTTCCTCCGT
GGTGTCCTGCTCGTCAGCGCCGGCGCCTGTCGACTCGCCGGGTTTGCGCAGTGACGCCGCGTATGCCGGGGTTCCG
TCCGGCTCGTCCGTGGGATGCCGCTGGAGTTGTTCTCGGTCATCGGTCATGAACGGCGGACTTCCCTGCAAGAGCG
CGGACAAACGTGGTCGTTTATCCCGCAGCCGGGCGGGCAGTCGTCCACCATGGAACCCATCGGTGACCCTGACGAG
CAGACCGGCGACTTCGCCGAAGAGCACGAACTGACCGAGGTGACAGCCGAGGAGGACGACGACGGCGAGCCGGAGA
GCCCGGATCGCTGGACCGGCGGCATGGACTCCGACGGTCCCCCGTGACCTGCGGCTACGATCCCTCACAGGTGCCC
GCCCCGCCGACGACCCGAGGTTCGTAGCCGTTGTCCTCCATCACCGAGCTGACCGAGTCCGTGCGTGCCTTCGCGC gcgagcgcaactgggagcagttccacacgccgaagaacctcgcgatggccctggccggcgaggtcggtgagcttct
GGCCGAGTTCCAGTGGCTGACGCCGGAACAATCAGCCGCGGTCATGCGCGATCCCGATCTCGGCCCGCGGGTCCGG gccgagatcggagacgtcacgatctatctcgtacgcctggcggacgtgctcggcatcgacctggtcgaggcggcca ccgacaagttggcggaagccggccgccgctacaccgtcgaagccgcccgcgactcgggcgccaagatcgatcagct gtagttcagcgagaagttgttgaccgtgaagttggactgaccggcggtgccgctgatctcgaagccgaactgcgcc tcgccgaccgtcacgtcaccccaccagccgttggtgcgcagccagttcaggatcgccaggatgtcgacggtgccgg agttcgtgttggtacggatgaacgagaagaccgcgttggcgccgttcgacccgcggtagacgttccaggtgtgccc
GCCGACGGACAGGTTGCGGACGTICGGCACCGCGCCGTTGGCGrCGTACTGTTCGGCGATCGGCCCGACCGCGCCC tgctggttggtccagatcatgacctcgtaggcgtggttgttcgcccagatgtcgtaggtcgtcgagtagtcgccgc 84
ΕΡ 1 979 375/PT
TGGACGGCACCGACACGTTGAAGGAGCTCGTCAGAGAATTGAGCGAGCTCAGCGTACGGTTGAGGGTCTTTCCGGT gttggggtaggacttgaccccgctggtgcgcgggtgattcgcgacgacgccccagttggtgccgctgcgcgcccag
ATGGTCTGGGTGCCGGCGCCCGAGCCCCAGATGTTGTTGTGAGGATGTATCCGTTGTTGGTCCAGTTCGCCCACTG
TCCCGAGTCGACCCAGACGGCGTCGCTCGGTACGCCGTTGGTGGGCGGCTGCGAGCTCGGGCTGGTGGGGCCAGCC
GATCCGGTGCAGGCGGTCCCGTTGAGCGTGAACGTGCCCGGTGCCGGGGTGGCGGCGCCGGAGCCGTTGAATCCGA
ACGACACGGTCGCGTTGGTGGCGACGGATCCGTTGTAGCCGGCGTTGCGGGCGGTGACCTGCGATCCGCTCTGGGT
CAGGCTGGTGTTCCAGGCCTGGGTGACGGTCTGCCCGCCGGAGTAGGACCAGACCAACGTCCAGTTCGTGAGCGGA
TCACCCAGGTTGGTGATGGTGACGTTGGCGCCGAAGCCGCCGGGCCACTGGCTGCTCACGGTGTAGGCGACGCGGC
AGCCGGCCGCGGCGGACGCCGGGAGCGCGGTGACGACGCCGGCACCGGCGATGAGGGCCGCCGAGGCGGCCAGGGA
GAGCGCGAGAGTACGTCTGCGCATGCCGTTCCAATCTCGGAGGGGGAACACACGACGCrCGTCGAAGCGCTTCGAT
AATGAAGGCTGGGGATCTACGAGTGTCGATGCGGGATGAGGCCGATGTTACGACCCGCCGCCGCGGCGAGGCAACC
GCTACCTTGGGCGCATGACGATCACCGAGACCGATCTCGCCCACCTGCGCCGATGCGTCGACCTGGCCCGCGAGGC
CCTCGACGACGGCGACGAGCCGTTCGGTTCCGTCCTGGTCTCCGCCGACGGCAAGGTGCTGTTCGAGGACCGCAAC
CGGGTGAGGCACGGCGACGCCACCCAGCACCCGGAGTTCGCGATCTCCCGCTGGGCGGCCGAGCACCTGACCCCGC
GGGAGCGCGCCAGCGCGACGGTCTACACCTCGGGCGAGCACTGCCCGATGTGCTCAGCGAGCCACGGCTGGGTCCG
CCTGGGCCGCATCGTGTACGCGGCGTCGAGCGCCCAGCTGACCGCCTGGTACAAGGAGTGGGGAATCCCGGCGGGC ccggtcgccccgctaccgatcaccacagtggtccccggcgccgtcgtggagggcccggtcccagccttcgaggccg
AGCTGCGGGAGCTACATCGCGCCCGCTTCACCCCAGCGCAGTAGCCGCCGGACGAAACCCGACCCTTCTCGCCAAT
GAACCGGACCTGCGAGCGTGTCTGGATTGACCGCGGAGGCCCGCAACGCCACAGGCTCGATCTCCGTCACCGTCGG
ACCTCAGGGGCAGGTCGAGGATCTGCGCCTTGACGACCGAGTGCATGACCTCCCATCCCAGGAACTGAGCCAGCAG
ATCCTGACAGTGATGCGAAAGGCTCAGTACCAGCTCACCGAGTACGTCTCGGCGCACATCCGTGACACCGTGGGCA tggattcggagaccggtcgcaatgtgctcgacgcgttcgcacagcgcttcccgctgccggagatgaccgatgagcg ttgagcaggtacagctgccgatcgacgtaatcaaccggcacaccactaccatcgccgcaaccgccgatgccgtacg gcaggcccgcgccgcggcaggtcaggcagccatggactcgoaagcgtacggccagttgtgtcagttcctgccgacc gcgttcagcgtcgtgttcgagagtgcgatcgtcgccatgaccggcagcgccgaagcgttgcaggaaaccaccttca acctgcaggatgccgtcacgacgttcagatacaccgacgagtcggccgctcgcaccatcgcctccgcaggttcgcc gccgtgaccacaccacttgtcgcccaagccggggactccaccacgggattgaccggtctggggctcgtggaggacg cccaccagatcgcagaagccatccgcgggaacagttgggtcgacggcgtcctcggcggagtcggggccagcctcga
CGGTCTGGCGCTGGCGATCGACCCGCTCGGCACCCTTGCCGCCTGGGGCGTCGCCTGGCTCATCGAGCACGTCCAA
CCGCTACAAGACGCCCTGGACTGGCTGGCCGGCGACGTCGACGAGATAGCCGCCCAAGCCGCCACCTGGCGCAACG
TCGCCGCCTTCACCGACAGCGCCCAGCAGGATTACGCCGATCGGCTCCGCACCGAGGTCGCCGGCTGGTTCGGCGC
CTCCGGCGACGCATACCGGGCCCATGCCAGCGAACACTTGGCCGCACTGAAAGGCATCAGCACCGCAGCCGGCGGC atttcgtccgccgtcgaaggcgccggcctgctcgtcagcctggtgcgcggaattgtccgcgacctgatcgcccagt
TCGTCGCCACTCTGGCCGTTCGGCTGCCACAATGGCTCGCCGCCGAAGGACTCACTCTGGGCCTCGCCACCCCCGT
TGTCGCGAGCCAAGTTGCCGCCCTCGTCGCCCGCGGGGTCAACAAGATCCAGCACTTCATACGGGCGCTGCTCAAC
AGCCTTCGACGGCTGATGCCCATGATCGACCGGCTGGGTGAAGTCCTGGAGCGGCTCCGCATGCTCACCGACCGGC
TCGCAAGGTCCAGCCCCTCCACCCGCCCGGAGCCGACACCCGGCCCCGCTACTCACGCCGGAACCGAGAACGCATC
GGGAAACAAGCCCGAGGGCGACCTCGAACCGAACGAACCGCGCCCGGCCGAGGCTGACGCCAGAGACAGTACGCCT
CAGGCGTTCGTGGACGAGGTCGTCAGCAACCCCCGGTCAGTCGCGGGACACTCCGCGCAGTCCATCGCGGACCAGT tcaacgccgccggatactctgcggtcgtcgagcagagcaccaggagcggcacctcggggaacgccatccaggtacg cattcacggccacccggatatcaccaacatccaggtgcatccgggaggaggacggcagacgccggaggggtccccg
TATTGGAAAATTTCGACGAATACGGTCGGGAAGATCTGGATCATCCCCGAAAATTTCCGGGGCGCCGATGAACTGC
GTGGGAATGTGGTGCGCTATGACAAATAAGATCATCAAAGTGGATCGGGTGGGATCCGCGGGGGAAGCTGCCACGC
TCGTCGCCCTGGGCGTCGACATCGTCGGGGTCGATCTTCGTCCTGATCCGCGATTCGTTGATGATCGCACGCTGGA
CGCCGAACAGGTTCGCCACATCCGCGAAGCGCTGCCGCACACGACGCTGGCCGTCACCATGGACACCGGCACCGAG ccggaccatgtcgtcgaactcgcaaggcgaatcggcgcggatctggtccagtcgatcaacggtgtcatcccgccgc tcccagtacgcgtcgccctgcgcaaggccgacatcgcgattgtctatgcgggcacagagatctcccaccacgacga
TCCCGGCTGGGTCTTCAGCGCGTACGACGACACTCCGGACCTGAACGCCGCCCTGTTTCAAGTGGAGGTGCTTCCG
GAGTACCTCGATTCCTGGGAGTTTCTGCGTGACCGCTCCCCGGAATATGCCGACGAGTTCCAGATCGAAGATCTCG
ACGACCTCGGACGCGCTCGCCCCTTGGTTGCCGGCCTGAATCTCACGGCTCAGAACCTCGACGAGATCAGGGCACG
GCTTCCCCACGTCCGCGGTCTGGCGCTCACCCTCGCGCACGAGGCCGCGAGGAGCGACGCGCGGTTCTTCATGTTT
CCCCACGTAGTGGACATCCTTTCGGGAGACTCGTCCGGGTGACCGGCATCGCGCGGGAGGGGGCTGGTGTCGCAGA
GTCAGGCTGACGGCATTCCGGCGGGCCTGACGGGAGGAACCTCATGACCGGGCTGTTCACCATGCGCAAGCACGAG
GAGGGCGCCGGGGAGGTTCGGATCGTCGTGAGCGGCGAGATCGACGGCGATGTCAGCGCGGCGCTCACCCTGTTCA tcgccaacgccgccgagcaggacggtgtccgatcggtgctggtggatctggagccggtgctgctgctggccgcagc cgggatccggtgcctgctgagcggccgtgaggcggctctgctgcagggctgctcctacgagctggtcaacgtccgg cacgaggtcgcggattcactgcacgccgccggcgtggcagatctgctgctcaccctgccggtccgctgagccggct cagctcgggtcgtcgaagccctcgtcggcgcgttcgcggcgcaggtgtgcctcggcccggcgcgcctggtcaccct tctccgctgccagcccggcgtacatggcctgcaccttctcgtacggctggccgggcggcagcagcgggatcgccgg atcgaccacggcctcgatcagcgtcgggcggtccgcggacagcgccgcctcccacgcgccggtcaggtcggacggg tcggtgatccgcactccgcgcaggccgagcagctcggcgtagcgcgcgtacgggacgtcgggcagttcctgcgacg 85
ΕΡ 1 979 375/PT
TGACGAAGCGCGGCTCGCCCTCGGTCTCGCGCTGCTCCCAGCTGACCTCGGCCAGGTCCCGGTTGTTCAGCACGCA
CACCACGAAGCGCGGGTCCGCCCAGTCGCGCCAGCGGGCGGCCACCGTGATCAGTTCCGCCATGCCCGCCATCTGC
ATCGCGCCGTCGCCGGCCAGCACCACGACCGGGCGTTGCGGCGCCGCCAGCTTGGCGGCGAGACCGTACGGCAACC
CGCACCCCATCGACGCCAGCGTGCTGGACAGATGCGCCGGGACACCGCGGGGCAGCCGCAGGTGCCGGGCGTACCA
GTAGACGACCGAGCCGACGTCGACCGCGACCTGCGCGTCCGCGGGCAGGTGGTCGGAGAGGGAGCGAATCACGTGC
TGCGGGTTGACCGGTTCGGCGGGCGCCGCGGCCCGGGCCGCGCTGATCAGGCGCCAGCGCTGCACCCATTCCTCCA
CGCGGGCGCCCCAGGCGCCGCTTGCCCGGCTGGGCAGCAGTCCGAGCAGCTCACGCAAGGTTTCCACGGCGTCGCC
CAGGAGCGGGACCTCAACCGGATACCGTACGCCCAGACGGCGCCCGTCCACGTCGATCTGTACGGCCCGCGCCTGC cccggccggggatagaactcggtccacgggtcgttcgtgccgatcagcagcagcgtgtcgcagtgccgcatcagct cggcgctggccgtggtgcccaggtgccccatgacgccggtgtggaacggcaggttctcgtcgaggaccggcttgcc gagcagcgaggtggtcacgccggcaccgagccgctgcgccagctcgacgatctcgcgctccgcgccgtacgctccc tgccccaccatgatcgccacccgctcgccggagcggagcacctcggccgcctcgcgcaggtcttccgggcggggca ccacccgggcggggcgcagccccgcgctcgtcgccagcacaccgtgctcatgcgcctgcgggtcgggcgccggggc cgtctgtacgtcgtgcggcaggaccacgcaggtcgggctgcgggtcgcgagcgcggtgcggaacgcgcggtcgagg agcatcggcacctgctcgctcgtgtgcgcggcctgcacgaactgggcgcacacgtcgccgaagagccgcaccaggt
CGATCTCCTGCrGGTACGCGCTGCCGAGCACCGTCGAGACCTGCTGGCCGACGATCGCGACGACCGGTTTGGAGTC
GAGTTTCGCGTCGTAGAGGCCGTTGAGCAGGTGCACCGCGCCGGGACCCTGGGTGGCGAGGCAGACTCCGGCACCA
CCGGTGTACTTGGCGTGGCCGACGGCCATGAACGCCGCGCCCTCCTCGTGCCGGGCCTGCACGAAGGTGGGCCGGC
CGGCCCGGCGCAGCGCTCCGATCACGCCGTCGATGCCGTCCCCGGAGTACCCGAAGACCCGTTCCACGTCCCACGC
GGTCAGACGCTCCACGACCACGTCCGACACGGTCCGCTCCGTCACCGCTGCCTCCTCACGTCACACCGGGGGCTAC
CCGCTCAGCCGCGCGGTACTCGCCTTGCGCGAAATGCGACTCGCGTGCACCTCACGGGCCGGGCGGACGCGGCACG
GATCTGAGCTGGTTCCCGCCCGGTTCTGATCCCCTGTGATCGGGGTACACACGTGCGGTGAGCAGGGACAAGACGT ACCGGCCGGTCCGTCCCGACGGGATCCGGACCACCTTCCACGACGGTGTACTCGGGCGCATGCGGATCCGGTGCCr gggcgagccgcgtccgggcgtaccggagatcgtgatgatccagggtatgaccgtgagtgactatctgctgccgggt
CTGGGCGCGCTCAGCGCCTGGACCCGGGTGCACCTGGTGGAGCTGCCGGGAGGCAGCGGCAGCGGCCGGCCGCCGC
ACGATCTCACGGTCGAGGAGTACGCGCGGGCCGCGGCCGACTGGCTGTGCGCCCAGCGCCTGGGCCGGATCGTGCT
GGCCGGCCATTCGAGCGGCACGCAGGTGGCGGCGGAGACCGCGCTGTTGTGCCCGGACGAGGTGGCCGGAGTGGTG
CTGGCCGGCCCGGCGATCGACCCGGTGGCCCGCGGCGGCCTGCGGGTCTTCGCGCGCTGGTGGATCGACCGGCGCG
GCGACCCGAAGAGCCTGGACGAGGTGCACAAACCCGAACGCGAGCAGGTCGGGTTCCGGCGGCTGTTCCAGGTGCT
GCGCGCCCACCTGCGTCACGACCTGGAGAAGCCGGTGGTCGGGCTCTGCGTGCCGGTGCTGGTCATCCGCGGCAGC
GAGGACCGGCTCGGCACCGCGCGGTGGGCCCGGCGGCTCGCCGATCTGGCTGCCGTGGGCGGCCGGTACGTCGAGG
TGCCGGGCACCCACTCGTTCTGCTGGCGTTACCCGCAGGCCTGGTCCGCGCCGATCCGTGAATTCGCCGGATGGTC
GGTATCGGTCTCCGGCACCTGAACGGACGTTTCGGTGGCATCGCCGCCACCGCGGGCCGGCGCATCCGCATCCACA
GTCCGGGGTGAGGGTCAGCGCCGTTCGGAGGCGGAGTGTCGATGATCGGTCAATTGACGTGCTTCCATGAGCCGCC
CTACGGTCCGACAGAGAAATCGTTATCCGGACCACCATCGACATCCGAATCGGTGGCCCCGGAGCCGATCATCGAC
CGACCCCGGGCCACCCCCGCTCTTGCCAGAGGGGGCGAGGCACATGACGGAAGCTGATCATCGTCCGACCGTTCTC
AGGAGAATCCTACGGCTGTGCGCCGTGCTTCTCATGGTGCTCGGAGTGGGCCTGGTCGGCGCCCCGACGTCGCACG
CCGGCGGCAAGCCGACCATCTCCAAGGAGGCGTTCGGCAGCGTCGGCGGCAAGGCCGTCGACCGGTACACCCTCAC
CAACGGGCGCCTGCAGGTGCGGATCCTCACCTACGGAGGCATCCTGCAGACCATCACGTTCCCCGACCACCGCGGC
CGCAGGGCCAACGTGACGCTCGGATTCAGGACCCTCGACGAGTACGTGACGACGAAGAACCCGGCGTACTTCGGCG
CCATCATCGGCCGCTACGGCAACCGGATTGCCGACGGCCGGTTCACCCTGGACGGCACGACCTACCAGCTGGCGAC
CAACAACGACCCGAACCACCTGCACGGCGGGGTCGTCGGCTTCGACAAGCGGGTGTGGGACGCCACGCCGATCCGC
GACGGCGACAGCGTCGGGCTGCGCCTGACCTACACCAGCCCGCACGGCGAGGAGAACTACCCCGGAACCCTGCGCG
TGACGATGACCTACACCGTCACCCGGCAGATGGGTATCCGGATGGACTACCGGGCGACGACCGACAGACCGACGAT
CGTCAACCTGACCAACCACGCGTACTGGAACCTCGGCGGCGAGGGCACCGGGACCATCGACGACCACCTGCTGAAG
CTCAACGCCAACCGCTACACGCCGGTCGACGCCACGCTGATCCCGACGGGGGCGATCGACGCGGrCGCCGGCACAC
CGATGGACTTCCGCCGGCCCACGCCGATCGGCGCGCGCAACCGCGACCCGTTCCAGCAACTGGTGTACGGGCGCGG
CTACGACCACAACTGGGTGCTGAACCGCGAGGACGGCCAGTTCCGGCGTCTCGAGTTCGCGGCCCGGGCGGTCGAC
CCGGACAGCGCGCGGCAGCTCACCATCTACACCACCGAGCCGGGCATCCAGTTCTACGGCGGCAACTTCCTCGACG
GCACCCTGTACGGCACCAGCGGCCGGGCCTACCGTCAGGGAGACGGTTTCGCCCTGGAGACACAGCACTTCCCGGA ttctccgaaccacgcgaacticccgtcgaccgtccttcgaocgggacagacctacaactcgacgaccatctaccag
TTCGGTACCGCCGACTGATCGCCTCAGGCCGGCCGCCGCGGGACGGCGCGCCGCGGCCGGCCGCACGGCAGTCAGC
GGCGGCGACTGGAGGCACACATGCCACGCATCCATCCGAAAGTCGAGGAGGCCGTCTCTACGCTCGACCTGAACCG
GACGACACGACGCCGGCTGTTGTCCGGAACCGGGTTGTTCAGCGCCTCGCTCGCCGCGGGCGCGCTGCTGAGCGCA
TGCAGCGACCAGAACGACGGCCAGAACCAGACCGAGGGCGCCGGTAACTTCCCGGACACCCCCGAGTGGCGGTTCA
CATTCGTCAACCACGTGACCACCAACCCGTTCTTCACCCCGACGCAGTACGGGATGGAGGACGCCGCGACGCTGCT cggcatcgccaagccgcagtggaccggctcgcagaactcgatcgtggccgaaatggtgaacgcgacgaacaccgcg gtcagcgcaaaggtggacggaatcgccatcgccgtggtcgacaaggacgcgttccgggggccggtcgaccaggctc tcaacgcggggataccggtggtgtcgtacaacgccgacggagcccggggcgcgccgggcacgaaccggctggccta tatcggacagggcctgtacgagtccgggtacgcgctgggccagcgggcgttgcaggtgctggactccggcgaggtg gccgccttcatcgccaccccgggcgcgctgaacatccagccgcgcatcgacggcgcgcaacaggcgttcaaggact 86 ΕΡ 1 979 375/PT ccggcaagccgatcacgttcaccgcggtcgccacgaacgccgacgtgacacgcggtctgtccatcatcgacgcgta
CGCCCAGGGGCACGCCAACCTGGCCGGCATGCTGGCGGTGGACGCCGGATCGACGTCGTCGGTGGGTCAGACCGTC
AAGAAGTACAACATGCGCGGCAAGGGGCTCAAGGTGGCCGGCGGGTTCGACCTGATCCCGGAGACGCTGACCGGGA tccaggagggcagcctcgactacaccatcgaccagcagccttatctgcagggattcctgcccgtgctggcgctgta
CTTCTACAAGGTGTCCGGCGGGCTGATCGCGCCGAGTGAGACGAACACCGGGCTGTTGTTCGTCACCAAGGACAAC gtcgccccgtaccagagcacgaagagccggtacgagggctccacgaccgacaaggttctcgtacctcgcagcgggc
CGATCGCCCATGGATGACCGGATCTCGCCTGCGCCCGCGCAGGCGCCTTCCCTCGAGGTCGAGCAACGCCGTGGCC
GGTGGCAGCCGGTCACGGCGGCCGGCCGGAAGGTCCTCGACGCCTTCCTGCGGCGGCGTGAGGCCAGCGTGCTGCT
CGTCGCGATCGGCCTGATGATCTACTTTCGGGCGTCCAGCCCGGTCTTCCTGAGCCGCGACAACCTGGTCAACATC gcccaggcgaccgcgcccgtcgcgatcatcgcggtcggcatcgtgctgctgctggtcagcggcgagatcgacctgt
CCGTCGGTATCGTGGCCGCGCTGGCGCCGTTCCTGTTCCACTTCGGGATCAACTTCTACTCGCTGCCGGTGGTGCC
CGCCTTCGTGGTGGCGCTGGCGATCGCGGCCGGAATCGGCCTGGTGAACGGGCTGATCGTCACGCAGCTGCACGTG ccctcgttcgtgacgacgctgggcacgttcttcgccgtgcagggcatcctgctgatcacgtcgcacgcctatccgg
TGCCGATCCCCGACGCGGCCAAGGGCACGTTCCAAACCTGGCTCGGCGCCGGGCCGTGGGCCAGCATCACCTGGGC
GCTGATCATCGTCGCGATCTTCCACACGGTGCTGACCCTGACCCGGTGGGGCCTGCACACCATCTCGGTCGGCGGC aacccggtcggcgccaccgaggccggcatccgcgcctcccgcatcaagatcggcaacttcgtgatcaccagcacgc
TGGGTGGGCTGGTCGGCATCATGGAGGCGTTGCGGATCAACACCATCGACCCGAACATCGGCGGCGGCACGACGCT
GACCTTCTACGCCATCTCGGCGGCGGTCATCGGCGGCACCGCGCTCGCCGGCGGCTCCGGCACCATCGTCGGCGCC
TTCCTGGGCGCCCTCGTGCTGGCCGAGCTGCAGAACGGGTTCAACCTCATCGGCTACAGCGCCAACACCATCTTCC
TCATCCTGGGCCTGGCCATCCTCGTCTCGATGATCGCCAACCAGTACCTCTCCCGACTGCGCCGGGCAGGCCGATC
ATGACCGCGGAAACCGTGTCCGACGCGCTGCGCGTACAGAACATCGCCAAGAGATTCGGCGCTCTCACCGCGCTGC
AGGACGTGACCCTGCGCGTCGCCGAAGGCGAGGTGCTGGGCCTGATCGGCGACAACGGCGCCGGCAAGTCGACCCT
CATCAAAATCATCTGCGGGTACCACCGGCCGGACGCCGGGCGCATCTTCGTCGGCGGCGAGGAGGTCACGCTGCGC
AGCGTCGACCACGCCCGCTCGGTCGGCATCGACGCCGTCTATCAGGACCTGGCCCTGGTCAACGAGCTGTCCGTCT
ACCACAACATGTTCCTCAACCGGGAGCTCGTACGGTGGCCGCTGCTGAACAACCGGGCGATGCGCCGCCGTGCCGA
GGAGCACCTGCGCGACATGGGAGTGAACCTGCCGGACGTCGGCGTCGAGGTGGCCAAGCTCTCCGGCGGCCAGCGC
CAGGCGATCGCGGTGGCCCGCTGCGTCTACTCCGACGCCCGCATCCTGCTGCTGGACGAGCCGCTAGCCGCGATGG gcgcgaaggagggcacgatgatcctcgacctgatccgcgacctgaaggcgcgcggcaacgtgtcgatcatcatcat
CGCGCACAACTACGCGCAGGTGCTCGACGTGTGCGACCGGGTGAACCTGCTGCAGCACGGCCGGATCACCTTCGAC
AAGAGGTCGGCGGACACGTCGCTGGCCGAACTGACCGAGCTGGTGGTCGCCGAGTACCGCACCGGCCGCGGGCGGT
GACGCCTCAGCGCTTGCGGCCGACTCCGCTGTACTGGCTCGCGCCGGTCGTCTCGTCGCCGGGGTCGGGATGCCAC
TGCGGGCTCGGCACGACGCCCGGCGGGACCAGGTCCAGTCCCTCGAAGAAGCCGGCGATCTCGTCGGGCGTATGCA
TCAGGTAGGGCACCGCACCGGAGGAGTTGTAGGCGTCCTGGGCCTGGTTGAGCGCCTCCTCCCCGGCGACGCGCAC
ACCGTCGTTGATCGACAGGTAGCTGCCGGGCGGCAGCCCGGCCATCAGCTGCCGGACGATGTCGCGGACCTCCGCG
GTGCTGGGGATGTGGCCGAGCACGCCGTTGAGGATCAGCGCCACCGGCCGGCCCATGTCGAGCTCGCGGGCGGCGA
CCGCCAGGATGTCCGCCGGTTTCTGCAGGTCACCCTCGAGGTAGACGTCGGACGACCCGGCCAGCAGCTCACGGCC gtgctccaccgcgtacgggtccttgtcgacgtagaggacccgggcgtcaggggcgacccgctgcgcgatctggtgc- gtgttgtcgacggtgggcaggcccgcgccgacgtcgaggaactggcgcacgccggcctcgccggcgaggtagcgca
CGGCACGCGACAGGTACCGCCGGGACTCGCGGGCGATCTCGTCGATGCcGGGGAACACGGCACGGTACTCGTCGCC ggcagcgcggtcgaccgggaggttgtcggtgccgccgagccagtagttccagatgcgggccgactggggcaccgag gcgccggactccatagtcacggatcgatagcctagcccttgcgcgcctgggtggcgacgccctcgacgaagtagcg ctggcacaggaagaacgcgatgatcatcggcaccgtggtgatcaccgcgccggccaggacgatctcccagcgggcc tcgcccgcctggccgaactggtcgaggatcgccttcatgccgcgcggcatggtgaacagcgccggatcccgcagat agatcagcggcttgagcaggtcggaccagctggcccgcagctcgaacacgaacgccacgatcagcgccggccggca cagcggcaccgcc-atgcgccagaacagccgccagtacccggcgccgtcgacgcgggccgcctcgaacagctcacgg ggcacgccgaggaagaactgccggatcaggaagatgtagaaggcgctgccgaacaggttgccggcccagagcggca cctgcgtggcggccaggccgagctcgttccagatcaggtacgtggggatcatggtgaccgcgccgggcagcatcat
CGTGCCGACGACCAGGGCGAACAACACGTTGCGCCCGGGGAAGCGGAAGTAGGCGAAGCCGAACGCCACGACCGCG
CTGGAGATCGTGACCGCGGCCGCGGCGGCGAGTGCCACCACGACGCTGTTGAACATCCAGGTCAGCACGGGCGCGG
CGTCCCAGATGGCGGTGTAGTTCCCCGGCGCCCACTCGGCGGGGAGCAGCCGGTTGTCGAAGACGTCGGGGCGGGG cttgagggaggcgctgaccagccagacgaacgggtagacgaagatcaccgcggcggcggccagggcggtccagagc
ACCCAGGGATGCGGGCCGCGCGAGGTGCGCGGTGGCATGGTCCTGTCCTCAGCCACAGCCACGGCCTÇACTCGCTC
TCGTAGTAGACGAATCGCCGGCTGAGCCGGACCTGCACGACCGTGATGATCACGATGATCAGGAACAGCAGCCAGG ccagcgccgaggcgtaccccatgtgcaggaactggaaggcctgctggaacaggtagaccacatagaacagggcggc gtcgttgccgtacgtctgctggttggcactgccgtagaaggcggtgtagacctcgtcgaaggtctgcagcgaggcg atcgtgttgatgatcagcgtgaagaagagcgcgccgctgatcatcgggacggtgaccgcgcggaaccgcgcccacg ccgacgcgccgtccatctcggcggcctcgtagaggtcgcggggcacgttctgcagcgccgccaggtagatgatgac cgtgctgccgaggctccaggcgccgatcagcaccaggccgggcttgatccacgggccgtcgacggtccagttcggc ccgtcgatgccgaccgtgcccagcgcctcgttcacgatgccgacctggccgttgaacagcagcaggaacagcacgc ccacggccaccttgggggtgatcgtcggcaggtagaagatcgtgcggaagaacccggcggagcggcgcccgacccg ggccagcagcatcgccagggccagggacacgatcatggtgaccggcacgtgcagcgccgtgtagatcagcgtgttg 87
ΕΡ 1 979 375/PT
GCGATGCTCGTACGCACCCGCGGGTCGGCGAGCATCTGCCGGTAGTTCTCGCCGCCGACGAAGTCGGTGCTGGTGA
GCACGTCGTAGTCGGTGAACGACAGGACGAGGCTGGCCACCATCGGCCCCGCCATGAAGACCGTGAAGCCGATGAG
CCACGGCGACAGGAAACCGAAGGCGGCCAGGGTCTCCCGCCGCCGCACGGCGGCACTCATCGTCAGCGTCCGCTGT
TGGCCTTGTCCAGCGCGGCCTGAGCCTGCTGCTGGGCCTCGGCCATGGCCTGGGCGGGTTTCTGCTTGCCTTCCAG gacccggttgaccgcgttctgccaggcggccttgaattcctcaccggcggcgagcgccggctccgagaagccggac
TCCTGGGTCTGCAGGACGATCTGCACGTTGGCGTCGGGTTTCACGACGTCTCTGAAGATCACTTCGTCGGCCTTCT tgttgccggtgtagacgccggcgaagggtttgttctccttcttgcgcagctcggcacgggccctcgcggcggcgat
CCAGGTCTCGCTCGCGGTCATCGTCTTGATCCACTTACAGGCCTGCCCAGGGTGCGCGCTGTTCGCCGGGATGGCC caggcgttgcccgtgatccagtcgatcggctgcccgtcgacgccgcggaacggcgccacggtcaccttgaccttcg gcgagttgtcggcgagcacgttgaggtagaagtcctccatcgggaaggcgccgagctggttgctggcgaactggtt cttggcgccgaagaagtcccacgagtcgcggaacgacttgaagttcgaccagccgccctgcgcgttgatcaggccg acggcgtattcgagggcctcgaccaccttcgggttgttcagctgggcggtgcgaccgtcgtcgctgaccagggcgg cgccgttcgcgcgcgcccagacgggcaggaactcgggcagcttcgggtcgaacccgatccgctggagcttgccgcc gctcatcctggtgagccgggccgtggccgtcgacagcgcctgccagtcccccgtgtcgaacccggcgggatccaag
TTGACCTCGGCGAACGCGGCGTCGTTGAGCATCAGGACGCGGTrGTTGTAGAAGTCCGGCAGGCCGTACAGCTGCC
CGTTCAGGGTCGCCTCGGTGACCGCGGCCTCGCGGAACTGGCTCATGTCGATCTTCTCCCGTTCGACGCAGTCGCC gagcggagtgagcgccttcttggccgcgtaggtgccgagcagccgccgttccatgtacaccaggtccggcggggtc
CTGGAGGCCACCGCGGACAGGAACGCCTGGGCGTCGAAGCTGCCCTCGGACGCCTTCGCCAGGCTGGGCGCGATCA
CGGCGTTGGCCGCGTCGAAGCGGGTCTTGGCGATCTCGTCGCCGGTGCCGAAACCCATCATGGTCAGCGTCACCGC
GGCGTTGCTGTCGGAGTCCGAATCGGATCCGCCCACGCCACCGCAGCCCGCCGCCAATGTCAGAACCAGGGCACCA
CCCACCACAAACCGGATCGATCGGATGAACATCGTTGTTCTCCCATTTTCACTTGTTCCCGTGGGCGAAGCATAAG
TTCACTTCGATGCCCGCGCACTCGGAGCGGCTGCTGTCAACCGCCGACCGGTTGGCGGATCACCACGATCGGGTGG
TGCGGCCGCTGCCGGGCCGCGCTCCTGCTCCCGCCGCCACGCGGGTGGGCAGATACCGATCGGCGTCGCTCTAATC
GATGGCAGGGATACCGACGGTGACACCGTTTCCTCCCGCCGCTTCATCCCGACGTAATCGCGGGCATGGCGCCGTG
GCCGCGTTTCGTCGAAATCGCCGGGCTATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCATGTCTGCTCTCG
CCATCGAGAAGTCCTGGAAGGACGTCGACCTCCGTGACGGGGCGACCAGCCACCCGGCCGGCCTCGGCTTCGGCGA
GCTCACCTTCGAGGACCTTCGCGAGGACCGCACCATCTACGCCGCCAGCAGCGGCTGGGTGTGCACCCTGACGATC
GAGTGCGGCACCGTGATCTGCGCCTGCTGATCGACGATCGTTTCCGGCCCGGGGCGGGCATCGCCCGCCCCGGGCC
ATCCATTTCGCGCGGGGAGCAGCCATGTCACCGGTTCCTTCACTCAATTCCACCTCGGTACGCGACAGCGCGTATC
TGCACGAACGAACGGTGACCGGAGAAGACCAGCCGGCACCGGCCGCGCAGGCGCGGATAGCGTCCTGGCGCGATIC
GGCGTTCCTCGACGACCGGGTTCTCGACATCCGGCTACGTCAATGGGGAATCGACCGTGCCACCTTCGGCCGGCTG
CTCACCGACGACGACTTCACCGTTCCCGGCCGGCTGCTCGCCTGGGCGGACGAGCTGGCCACGGTGCTGGCCACCG
ACACGACACCGGTCACCGGACTCGAGTTGTCCACCAAACTGTGGTCACAGGGATTCGACCGGCTGCTCTTCGCCGG
CCTGCTTCACCCGTTCCTCGCCCACTACGAACAGCGGCTGCACGAGCGCGTGCCCCGGCCGATCGCCGGCAGCCTG
CGCCGGCCGCTGCTGGAGTCGCTGGCCAACCGGCTGCTCGCCGTCGCGGCACGCACCCTGCTGCTGGAGCTCAACG tggcccgtgtgcacgggcggctgaccggcgacaccccgcagcagcgctacgacgactacgaccggcggctgotcac cgaccccgcctacctggccgccctcttcgaggaatacccggtgctcggccgttgcctggtcgaatgcggccggcgt
TGGGTGGACCACGCCGCCGAGCTGTTCAACCGGCTCCACGACGACGAGCCCGAACTGCGCGCGGCCGGTCTGCTGC cgccgtcggcggaagcgctgcgcagcgtacggctggacctcggggacccgcacaacggcggccggtcggtggtgca gctgaccttcgacgacggcaccgacctggtctacaagccgcggccggtcggatccgaacgcgcctacgccgagacg atggccgcgctggcccgccacgggctgccggtgccggtgaccgccccgcgcgtgctggaccgtggcgggcacggct ggtgcgagttcgtccggcccgcgccctgcgccgacgccgccgagctgtcccgcttctaccggcgcgccggatcggt gctggcggccatgctgctgctcggtggcgtcgacatgcacatggagaacgtcatcgccgcggggtcgtcgttcacc ccgatcgacctggagaccgtgctgcagtccggagagctcggcgacggcgccaccgacgcgtacgggcgggccctcg acctgctcaaccgcagcgtgctggcgatcggcatcctgcccgcccgcgcgttcggtggccggcagcgaaagagtgt
CGACGTCAGCGCCCTCGGCGGCGGCGAACCGCAGACCGCGCCCCGGCCGGICCCACGCATCGTCGACGCGTACACC gacacggcacggctggaagcggtcgaggccaccatggccggcgcccagaaccggccgagcctgcccggcgccgagg tccgcccgtgggagcacaccgctgacgtggtcgccgggttcaccgacgcctacgacatcatgctggcccaccgcgc cgacttcgaccggctgctgcgcggcttccacgacgtggaggtgcgctacctgccccggcccacccgtcgttacagc atcttcctgaccgagagctaccaccccgactacctgcgcgacgccagcgaccgggaccggctgctcgacaagctgt ggaccgccgcggacgcccgccccgagctgattccgatcatcgagtcggagaagcgacaactgctcgccggtgacat cccgtgcttccgcagcgtcgcgggaagccggcagatccgcaccgcctccggcccgctgcacccggagttcttcacc gcgccggccgtcaccgtactgacccgccggctcggcgagttcggaccggtgcaccgcgccgcccaggtacgcatca tccgcgactcgatggccacgatgcccggcccccggcccgccgcccagccgtcccccgaccgggcggcgggcccccg gccccgcgtcaccggcgccgacccggccacgctcgccgaccgcatcgcccgcaggctcgccgacgaggcgatcctc ggcgaccgcgacgtgtcctggatcggcgtcagcatcgaaggcgtcgcccaggagacctacagctacaagccgatgg cgaccggcctgtacgacggcgtggccggcctggcgctcaccttcgcgtacgcggcccgcaccctcggcgacgaccg ctacctggacctggcacaccgagcggcccgccccgtcgccggctacctgcgctacctcgccgagcaccgcatcgtc gagaccgtcggcgcctacagcggcaccgccgggctgctctacgccctggaccacgtggcccacgccaccggcgacg actcctacctcgacgcggtctcggaggcggtgccgiggctgcgcgaatgcgccacccgcgaggagtgccccgacct gatcgccgggctggccggctgcgccctgatcagcctggacctgcacgggcgccaccggatcgacgggctgcgcgag
ΕΡ 1 979 375/PT
GTGGCGGCCATCTGCGCCGAACGGCTCGCCGCCCTCGCCGTCGACGTCGACGGCGCCGCCGGATGGCCGGCCACTC cggacggaccgctgctcggcgggttctcccacggcgcggccggcatcgcctggccgctgcaccggctcgccaccga actcggcgacccctcgctgcgcgagctcgcccgccgcgcggtccagttcgaccgcgacctgtacgtgcccgccgcg
GGCGCCTGGCGTGACCTGCGCCCGGAGATGGCCGGCACCGACTCCTACCCCGCGCTGTGGTGCCACGGGGCCGCCG
GCATCGGCCTGTCCCGGCTGCTCATCGCGCAGCACGACCAGGACACGCGACTGGCCGCGGAGGCCACCGCCGCCCT
CGACCTGGTCGGCGCGCACGGCTTCGGCCACAACCACAGCATCTGCCACGGCGACTTCGGCGCCCTCGCCCTGTTC gacctggoggcacgaaccggcttcgaccccgggcgccacgacgcggccgccgcggccgtgaccgccgacatcgccg ccaacggagcccgttgtggcctggtcggcgacatccacatgccgggactcatgctcggcgccgccggcatctgcct
GAGCCTGCTGCGCATCGCCCACCCCGCGCAGGTGCCCGCGGTGGCCTGGCTGCAGCCGCCGCTGACCTGAGGAGGA
GCCCATGCCGGAAGAGATCGTGCTCAGCGTGCTGGACCAGGTGCCGGTGTTCCGTGACGGCAGCCCGGCGGAGGCG
GTGCGCGACGCGGTCGCGCTGGCCCGCAGCGCCGAACAGTACGGCTACCACCGCTTCTGGATCGCCGAGCACCACG gcagogcggccaacgcgtgcgccgcccccgaggtggtgacggccgcggtggccgccgccacgagccggatccgggt
GGGCAGCGGCGGCGTGCTGCTGCCGCACTACAGCCCGCTGAAGGTGGCCGAGACGTTCCGGGTGCTGGCGGCGCTG tatccgggccgcatcgacctcggtttcggccgggctcctggtgggccgccggcgatggccgagctgctcaacccgt acgcggtccgcaccgacgaggcgttcctggagcagatcggccggctgctggggttcctcggcgacacccgtacggt cagccgcgtgtcggtgacgccgcaggtggaagagcccccggtgccgtggatgctcggcgccgggaccggcagcgcc cggatggccggcatgctggggttgccgttctgtttcgcccagttcatcgcgaccgaggagtgcccggaggcgatcg aggcgtaccgggatgcgttccggccgtcgccctggctggagcgaccccagccgatgctcgccttgcgggtgctgtg cgccgactcggacgcggaggccgaggaactggccacgtgtttctggatgtcgtgcacgaccggctggcgtgcgcag gtgcagctcaccgacgactaccgtgggggcgcgcccaatctcgacgacgcacgccggtaccggctgaccgcggagg acctcgcgctgcgggagagccggccgttcctgcagatctccgggacgccggccgcggtgggcaaggagatccgcag gttgcaggcggtgtacggggtatccgaggtggtgctcaccacgaactgccccggcctgccggcgcggcgccgctcc tacgaactgctcgccggcgagttcgcatccccggcggcctgacggcctcaggtccgcggtagctccgcgtaggtcc cgcgcaatgccgcggacctgacggccgtgaggacaggcagacgtcgtcgctggacagacccgacgcatacgccagg
ACGGCGGCCTGCACGCGGTTGGCCACGCCGAGCTTGCrCAGGATCACGCTGACGTGCTCCTTCACCGTGGCGGCGC
TGAGGAACAGCTGCCGGCTGATCTCCGCGTTCGTGAGGCCGGCGCCGAGCAGGCGCAGAATGCTCTGCTCCCGGTC
GGACAGCTGTTTGACCCGCTCGCAGGCCGGTGACCCGGCCCCCGOGGCAGATCCCCGTGAGCCCGCACGCACGACC
ACCGACGACGCCTCGGGCGCCAGCACGATGCTGCCCTCGGCCAGCGCCCGCACGGCGGCGACCAGCTGTTCGGGCT
GGCTGTCGCGCAACAGGAAGCCGCAGGCCCCACCCCGCAGCGAGTCGAGCACCAGCTCGGGTGGGGCGAGAGTGGT
CAGCATCGCGATCGCCGGCGGGCTGCTCAGAGCCCGCAGCTGATCGAGCACCTCCAGCCCGTCGCTCTGGGCACTG
TGGCCGTCGAGCAGCACCACGGCAGGCCGGTGCTGCTCGACGGCCGATCTCAGGTTCTCCCGGTCCGTCGTGGCGA
CCGCGAAGCCGCCGGTGCTCTCCAGGATCATCTTGATGCCGATGCTGACCAGTGCTTCGCCGTCCACGACCAGTAC
GTCCGTCACGATCGGTCCCCCGCGAGCCGCCGAACGCATGCAACTTGCATCCGCATTCGTGACATTACTTCACTTA
TATGGTCGAATCAATCGATTTTTCGCGTATAGrCATTAACAACACACAGCGCGTCGTCAGCGGGTCAGACCCTCGG
CCGGGGCGACCCGCGCCGCCCGCCGCGCCGGCGCCAGACTGGCCACCACCCCGGTCAGCACCGCCACCACCAGCAC
GGCGGCCAGCTGGCCCCACGGCAGGCGGATCACCGGATCGGCGGTACGCCCCACGGCCGCCGCCACCGCGGCCAGC
CCCACCGGGACACCGACCACGAGGCCGGCCACCGTGCCGAGCAGCGTGATCACGACCGCCTCGACCGCGAGCATCG
CCCGCAGCCGCGCCCGGCGTGTGCCCAGCGCCCGCAACAGCGCCATCTCGCGTACCCGCTCGACGACCGACAGGCC caggagattcgcgatgccgagcagtgcgatcaccaccgtgaccgccagcatcgccagcgacagtcccaacaggatc
GACAGCACGTTCGCGATGTCACCGCCCTCGGTGACCCCGCCACCGACCTGCACCAGCGCGTCGCGGGCGGCCACCG
CGCCGACGGCGGCCGACAGCGCCTCCCGGTCGAAGCCGGGGTCAGCGACGCCCCACACCGTTGTCGGCACCGCCTC gatccggttcgccgccaggctccgcgcgctcaccacgcccagcagctgcccggtggtgtccgccac-ccgcgacgcc
CGGGCGATCAGGTTCACCCGGCGCTCGCCGACCTCGACGACGATCGGGGCGCTGTCCGGCAGGCCCAGCTCGGCCA
GATAGGTCGCCGGCACCAGCACCACCGGCTCCCCGGCGAGCTCCGGTGCCACCCGGGCCGCCAGTTCGTCGCCGGG
CGCGGCCAGCAGCCGCGGCGTCGCCTTGCCGCCGTCCGGGAAACGGGCCGCGACCGTGCCGACCGTGCCACTGGCC
GACAGCTGTGGCACCGCGGCGAAGGCCCCGGCGGTGGCACCGCTGATCGGCTCGCCGTCGGTGCGCAGGCCCGCCG
CCACCGGGTAGCGCGCCTCCAGGTCGGCGTTCACCGTGGCCCGCCCGCTGGTCGCCGCCACCGCCAGGCAGGTGAT
CAGCGCCGCGCCGACCACCACCGCCATCGCCGCCGAAGCCGTCCGGCGCGCGTTCTGGCTCAGGCTGGTCCCGGCC
AGGCCGGCGGCCACGCCGAAACGCTCCAGCAGCCGCGCCGCCGGCGCCAGGGACAACGCGATCAGCCGCGGCAACG
CCGCCAGCAACCCCGCCGCCAGCAGAAGCCCGCCCAGCAGCGCCAGGGGCAGCGACGCGCCGATCGCCGCCACCGC
GAGCGCGGCGGCGCCCACCACGGTCACCACGGTGCCCACGACGAGCCGGCGACCGCCGCGGACCGTGCCGGCCGGC ggctcgtcggccgcctgcaacgcccgcaccggggcgatcctggtggcacgccgggccggcgcccaggcggccacca
GCGTGGCCAGCACCCCGGCCAGCACACAGCCGGCCAGGGCGAACGGATTGACCCGCAGCCCGCCGCCGCTGATGTC
GAGCAGGTCGGCGCCGAGATAACCCAGCCCCACACCCGCCGCCGCGCCGACCAGGCCGCCGGCTGTTCCGGCGATC
GCCGCCTCGGCCAGCACGACCCGGCTCACCTGGGCACGATGACCGCCGACCAGCCGCAGCAGGGCGATCTGCCGGA
TCCGCTGGACGATCACCACGTGGAAGGTGTTCGCGATGACCAGCACCGCCGCGAGCAGGGCGACAGCCGCGAACGC
CAGCATGATCACGACCAGCTGGCCGTTGCCGCCGGCGAACCTCGCGGCGGCCTGATCCGCAGCCGCCGAGGCGTCG
GTCGCCGAGATGCCGGGGCCCATGCTGCGCCGCAACGCGTCAACGGTGCCGGTCAGCGAGGCGTCGTCGGCGACAG
TCAGCAGCGCGGCCGGCGGCACGTCACCGGCGAAGAACGACGCGTCGGCGTAGAACCGGAAGTCCGAGCCGGTCAG
CGGCCGGAAACCCAGGTCGGCGGCACCGGTCACGGTGACCGGCTGCGGCGCCGCCTCACCGTGGCGTACCGTCAGC
GTGGCCCCGACGTCGATGCCGAGGTCGTCGAGGGTGCGCTGGTCGGCGAOGAGCTGTCCGGGCCCGGXGGGCCACG 89
ΕΡ 1 979 375/PT
CGCCCCGGTCCAAGGTGAACCAGCGGACCTGCGGGGTGGCCGCGATGCTCTGCACGTTGGCCGAGCCGCGCCGCGA tccgccgaacacgctgaccgtgcgcgcgtactgcgcgtccaccgagcgcacccccggcaccgcggccgcggcctcg taccaggccgggtcgcggaccgtgtcgtcggcgtcgagcacgatgtcggcggtggtcaacggcgcggcggcggtac gccgcaggccctcacccgaggtggccgcgaaggtcgcggtcgcggccaggaaaccggtcgccagcatcaccgccgc gacgatcgcgaacagccgggccgggtaggcgcgcagctgggaccaggcaagcgcgaagatcatcgtcacaccgcca ccgacgccatcgccgcgaggatctgatcgcggccgggactgcgcagttcctcacggatccggccgtcggccatgac caggacccggtcggcgtacgtcgcggcgcccggatcgtgggtgaccatgatgatcgtctggccggagcggcgtgcc
GCGTCGCGCAGCCCGCCCAGCAGCGCGCGGCCGGTGGCGATGTCCAGCGCGCCGGTCGGCTCGTCGGCGAAGACCA
CCGACGGCTTGGCCAGCAGCGCCCGCGCCACCGCCACCCGCTGCTGCTGGCCGCCGGACAGCTCGGACGGACGATG
CCCCAGCCGGTCGGTGATCTGCAGTGAATCGGTGATCTTCCGCAGCTCGCCCGGATCCACCCGGCGGCCGGCGAGC
CGTAGCGGCAGCACGATGTTCTGCTCCGCCGTCAGCGTCGGCAGCAGGTTGAACGCCTGGAAGACGAAGCCGATCC ggtcgcggcgcaggtcggtcagggcccggtcgtccagaccggccaatgaccgcccggccaggctgaccgtgcccgc cgtcggtgtgtccaatccggccagcaggtgcatcagcgtcgtcttcccggaaccggacgggcccatgatcgcggtg aactggcccgcggagaagcccgcggacaccccgtcgacggctgtcacggcagccggccctgttccgtacgtcttgc tgacgtcccggcaactgaccatctcggcgtgtgtcgtctgcgttgtcaccgcacccacgctagaaatccgcgcgga ccggcacatcccaccacgggatcccggtcgggcggtggaccgataccttcgtatgacccgccggtatcgacctcgg gcgccgtgttcccgcaatcgatgatgtctgcttaggctgggaccgtggtgcgagggaaccgggtgctcaggatcga
CGCCCTCGTCGCCGCCGCGGTGGTCATCGGCTGTCTGCTCCTCGGGCTCGCCGGGCTGTCCGAGTGGTACTGGTCG
GCCGCGGTGGCCGTACCGTTGCTTCTCCGGCGCAGCGCTCCGCGCTGCTTCCTGGCGCTGGTCGCCGGCGTCTCCG gcctgcacctgctggcctcgcacagcttcatgttccccggcgatctggtcgctctggtcgcggtgcacgccgccgc ggcgcacgcgccgggccgtgcccgccacgccggactgctgctcggcgccgccggagctctcgtggtggccgcccag gccctgcaggaccagcgcctcggctcggcgctgcccgcggtgctgatcgtcgcgagcacgatggccgcctggtcga tcgggctgatgcagcgccagcagcgcagcgccgtgctcgacgccgagcaccgccgccggctggccgaacaggacag cgccatgcgcgcgcagctggccgtgcacgaggagcgcacccggatcagccaggagatgcacgacatcatcgcccac tcgctggcctcgatcatcgcccaggccgaaggcggccgggtcgccgcccgcgccgacgcgcggatcgccgggccgg tgttcgaccggatcgcgggcctcggccgtcaagccctcaccgacgtgaaacggctgctcaccgtcgtggaccacga cgacgaatggcacgacgacggactggagcggctgccggtgctgctcgccggagtcaccgaggccgggctggacgtg
ACCGTGGACAGCAGCGGGGCGCCGCAGCCGCTCGCCGCCGGGATGGACCTCGCCGrGTACCGGGTGATCCAGGAGT
CGCTGACCAACGTGCTCAAGCACGCGCCGGCGCGCCGGGCCTGCCTGCGGATGCGGTGGACGCCCGCGCTGCTCAC ggtcacggtgagcagcccgcttcccggtggccgcggcgcoggcctggtcgaggggcgcggcctgtccgggatccgg cagcgctgctcactgttcaacggcgactgcaccgtcaccgcgaccacggaactcaccgtcaccaccacctggcccc tcaccccggaaggagcgcgcgcatgacgcggccaccgatcgccgtgctgatcgccgacgatcaggagctggtacgc accggtttcgcgatggtcgtcgacgcggcgccggacatgcgggtcgtggccatcgccgcgagcgecgcggaggcga tcgagctggccgccgaacaccggccggacgtcatcctgatggacatccgcatgccgggcaccgacgggatcaccgc gaccagcgcgatcctggccgccggcggcgagcggccaccgaagatcatcgcgctgacgacgtacgacagcagcgac tacgcgacgcggatcctcaccgccggggccagcggctatctgctgaaggacgcgaccgcogagggcctgacggcgg
CGATCCGCAGCGCGTACCACGGCGGGTCGGTGATCGCCCCGACGACGACCCGGAACCrGGTCGCGGCCCGCGCCGA
GCCACCGCCGCCGGCTCGCGACCCGGCGCCGCTGGACACGTTCACCGCCCGGGAACGCGACGTGTTCGACCTGATC gtggcgggcgccaacaacgcggagatcgcggcccggctgoacctggccgaggtgacggtgaagacgcacgtcggcc gggtgctggccaagctcggggtacgcgaccggctcaacgtagtcgtctgggcgtaccgcaacggcgctgtcggctg atccgcaccctcaggcccttgacacggtgccacggtggcacggtgtgatagacccgggtcgtttcgcctcacactg gtggtggtgcggtgagttcctgggtacgccggcgcgatcacaacgtcttcgtcaacgcgttcaacatgctcatatg cggcctcatcgccggcgtcgtcgtggccgctgccgcgttcccgttcgccgcgatgtccggcctggccgccaaggcc ggccagcagacgttcgcgagcctgcccagcgagctgaaggcgttccggtcaccgcagatcagccggatctacgccg ccgacaacaggacccaggtcgcccagttctacgacgagttccgcagtgacgtcccgctcaaggagatgtcgccgtt catgcgcgacgccatggtcgcggccgaggaccggcagttctaccagcagcacggcgtggacctgaaaggcgcggcg cgtgcgctggtcaacaaccgcaacggcgggcagaaacagggcgcgtcgacgatcaccatgcagtgggtacggatct cgctggcctactcggcgaccaagccgcaggacgtcatcgacgccaccgaggacgccccgaagcgcaaggtcgccga gatgaagtacgcgctcgaggtggagaagcagctcagcaaggaccagatcctggagcggtacctgaacatcgtgccg ttcggcaagcagacgtacggcatctacgcggccagccgggtctacttcaacaagaagcccaaggacctcacgatcg gcgaggccgcgctgctggccgccatcgtgaaggcgccgtccgcgtacgaccccacggacccggacggttacgagct catccggcagcggcgcaacgcctatgtcatcccgggcatggtggagatgggcgccatcacccgggcgcaggccgac
GCGGCGCTCAAGGAGGCCATCCCGCGCAAGGTACGCCCGATGAGCAACGGCTGCGTGTCGGTGGCCAAGAACAACI ggggcttcttctgcgactacttctaccgctggtggatggagcgcaaggagttcgggcccacgccgtacgaccggga gcgccggctgaagagcggcggctaccggatcaccacgacactcgacgtcaaggcgcagaagcaggcccgggatcgg atcggcgacctgatctccgagaagaacaagaacgcgctgctgctggcagccgtcgagcccggcaccggcaaggtac
GCArGCTCGCCGCCAACCGCCGGTACAAGCTGGACGATCCGGATGATCCGCAGAACGCGATCTCCTCCGACCCGAG aaaggcgcgcaagggcatccgtggctcgtacccgaacacgacgaatcccctgctgaccggcggcggcgacatcacc ggctaccaggccggctcggtgatgaagatgttcaccatcgtcgccgcgctggagcagggctacccgctcgcctaca cgatcaggacgcagagccggtaccgctcccgctacatcatcgagagcagcaacgacgcggcctgccccggaacgca
CTTCTGGTGTCCCAGCAACGCCGGTGGCGGCGGCGAGGGTGTCTTCAACATGTGGACCGGCCTGGGCAGGTCGATC 90
ΕΡ 1 979 375/PT
AACACGTACTTCGTGCCGCTGGAGGAACGCGTCGGCGCGGAGAAGGTGGTCAGCGCCGCGAAACGCTTCGGCATCC
AGTTCCGGGAGCCGGACGACGCACTGCTGGCCGAACCGGGCAACGCACACCAGTGGGGCGCCTTCACCCTGGGCGT
CTCGGCCACCACCCCGCTGGACATGGCCAACGCCTACGCCACCCTGGCCGCCGACGGGATGTACTGCCCGCCGACC
CCGATCGAGCGGATCGCCACCCGTGACGGCGACCAGCTGGACGTCGGCCGGTCCCCGTGCGTACGGGCGACCGCCA aggacgtcgcccgcgccgccctcgacgcggcccgctgcccggtgggcgactccgcgcagctcggccggtgcggggg
AAGCACCGCCGGCATCACCCGGTCGGTGGTCGGGCATCCGGTGTTCGGCAAGACCGGCACCACCGACCGCGACCGG
ACCGCCTCGCTGATCGCCGGCACCACCGCGCTGGTGGTCGCCGGTTACCTGGTCAACCCCGACTACCAGAACCACC
GCGACCGGCTCGACCACGACCAGGTCAACCCGGCCGTCTACCGCACGCTCGCCGACTACATGGAGGGCAGGCCACG ggagtcgticaagcggccgtcgagcgggcggatcgcgttcggtgaccagcgctcgatcccggacgtcgagtgcgac
CCGATGCCCCGCGCCCGCGACCGTCTGGAGGATGCCGGCTTCGACGTCTGGCGAGGCCAGGAAGTGGAGTCGGACT
GTCCCGCGGGCACCGCGGCCGGCACCGAGCCGAGCGGCCGGACCGTCAAGAACGGCGTGGTGGTGATCCAGGTGAG caagggccgccggggcgcgtcaccgccgatottcccgccgatcgggccaccccgctgaccggctgacggcgtagac gtcgccggcgttcgcctcgtgcggcagcccggccaggtgcgcgagcatctcgtcgcgggcggcccaccggccgaag gtgcgggccatggtctcgcccagggagacgtcgaagccgtcgaagcccagctcgccggcacggtcgaggcagcgcc gggccacgtcccgggcgatcgtcgtgaactcgaacgacaacgcccggacaccgcggctcagaccggcgagcaccgc gtcctcgtacccttcgacgtcgatcttgatgaaggccggcaggccgaatcgctggacgagcgtgtccagggtgacc gcagggagggtgatctgctggtcccagacctcgttctcccagccgcgcgagccggtcgccgcggtcaggaagcgca ccgagttcgtggagaccgtcgggttcgccgagttgatgtagagcggcacgctcccgccggcgggcccgcacgcggc ctcgacgagcgccacccggtcgtcgtgggcgtagagcgcgcgcagcgcccgcatgcacagcggctgcggttcgacg gcgaccacgcgggcgccgagccgccggaagcaggcgacccggtcaccgacgtgcgcgccgatgtcgaagacgacgt cacccggccggacgaaacgccggtacatcgcgtccatcgcggcctcccggccggcgtcaccgtagtagtaacgcag cgaccgggtcagcggcgccatggccgggxcgactctcagtttgcgcaggtcatcggtcacggcgggggcattcccc cgatcaggcgatccatgcatcgccggcgcgtgcgcaggtaggcggcgatcgcccgggcggaacgcacgcccgaggt ggtcatgacgttgtgcgcggcggccgggacggtcaccgacacgccgccggtcatcgccgccacctcggcacgccag cgcagcggcgccaccggatcaagcgacccgccgagcaccagcgggggtacgggcaaccggcgcagatcctcctcga tcgcgttgcgtaccgagtggccgaccgtggccagaacccgccacggcttggcgtcggcgatgtcgcggaccagcac cggcgcctgccacggogcctcgatccacaggtccaccgcccaccggccgatcagcgcccgccgggaccgggccgcc gggtcggtggtcgggctggccagcacgacggcggcgaccaggtccggccgcagcaccgcgagacgggccgccacct
CGGCGCCGAACGAGTGCCCGGCGATGCAGGCCCGGGGCACGCCGAGCACGrcCAGCCAGGCCGCGAGGTGTTCGGC gtgccggcccacgtcgtacgcgcggcgcggcttgtcgctgaaccogaacccgggaaggtccggaacgaggaccgga tggcggcccgccagcgcgtgggcggtgggcatcaggtagcggtgcgagacggcgagcccgtgtaccagcaccaccg gaaggccgccggcgtggcacgcgtgccggtcgtgcgtacgcactccaccgaccgtcaccaggcggctgtcgaatcg
GGGCACCGCGGAGATGTACCCCGTCCTTCCGCAATCTTTCCCGCGCGGTTAGTrTCGAGTTGTGTCGCCGCCCTTC
CGGCTCGACGAGGCGGTCGCCGACGrCTACGGCGACCTGCGCCTGGCGCCCGTGCTGCGGCGGCTGCTGCGGCACA
GCGGCCGCCTGACCGGCTCGGTGGCCGGCAGCGTGTCGCTGATCGACGCGGACCGCGGCTGCTACGTCAAGGCCGC cgagtacggcgcgaactgccagctcggacgctctttcccgctcgacgagggcgccaccggccgcgccttcggcagc
CGCCGGCCCGTGGTGATCCCGGACTACGGTCAGCTGCGGGCCGGTCATCTCGCGGCGGCGCATCCGGCACGGAAGG gcccggccgtcgctgtgccgatctggtggcgcggcgacgtgatcgcggtgaacgtcgccttcgcgccggccttctc cctgggtggtgtcgacgaactggaggcgctgacccagtccgcggccgccgcgatcgtccgcagccggggtgtgcgg gtccgcgccgacccgccgtacgcggctccggccgcaccgttcaccccgcgcgaggccgaggtcctcgatctgctcc ggcagggtctgaccgaccgcgagatggcccgccggctcggcctgtccgcgaagaccgtggagaagcacgtcggcgc gatcaggcgcaagaccgggacctccaaccgtacggcggcggtcgtcacggccctggacaacgactgggtggggaat cttccccataccgcggagcacaccaccgggtcttgactggcggcatgcccgtcgtctccatgaaggacatcctoga ccgtgcgctggccgagcggtacggtgtggccgccttcaacatcgtcaacgacctgaccgtcgaggccgtgctcgcc gccgcggcggaggaacgcgccccggtcatcctgcagacctcggtcaagacggtccggatgtacggccgcccccggc tgtacgagatcgtccacgccttcgcccacgacgcgcccgtcccggtgaccctgcacctggaccactgccccgagcg gtcggtcatctccgactgcctcgccggcggctggaactccgtgctottcgacgcgcacgagctcgacgtggccgac aacctgcgccagaccaccgaggtggtggccgaggcccgtcgcgccggcgcccacgtcgagggcgagatcgagggca tccagggtgtcgaggacgacgtcggcaacgactacgccccgatggtgcagagcctggaggtggcggtcgacttcat caaacgcaccggcgtcgactgxttcgcgccggccatcggcaacgcgcacggccagtacaagcaggcgcccgtgctc
AACACCCGCCGGGTCAGCGACCTCGTTGCGGCCACCGGCATCCCGATGGCCCÍGCACGGCGGCACCGGCCTCTCCG
ACGAGCAGTTCACCGACCTCATCGCCCGTGGCTGCGCGAAGGTCAACATCTCCACGGCGCTCAAGGAGTCGTTCAT gaaatccggcctggagttcctgcgcgaggcogatgagcgcggcaaatgggatccgccgtcgctgttccggcatcag cgggcggcggtcgtagagatggcccggcagcacatccggctcttcggcggatcggggcgcgcgtggtgaaogccct ggtcttcgactgcgacggcgtgctggccgacaccgaacggcacggccacctgcccgcgttcaacgccacgttcgag cagttcgggctgcccgtgcggtggagcgaggaggaatacggcgagaagctgcgcatcggcggcggcaaggagcgga tggcgtcgctgttcgccgatcccgccttcgccgcggcggccggcgacaccgaccgtacggaactgctgcgaacctg gcaccgcgccaagaccgcggctttcacgaagctggtcgccgagggccggattccggcccgtccgggcacagoccgg atcatcagcgaggcactccgggcaggatggacggtcgcggtcgcttccacgtcggccgaggattcggtaogcgcag
TGCTCGTCAACGCCGTGGGAGCGACGACTGCCGAGCGGATCCCGGTGTTCGCCGGAGACGTCGTGCCCGCGAAGAA
ACCCGACCCGGCGATC 91
ΕΡ 1 979 375/PT SEQ ID NO: 101 ox£l Proteína. hipotética 146aa mprrstrcspacrpgaadqpdpgracrpdcgradrsgsgracrpdcgrad
RSGADRFSAAALVSGMPRRTGVGGAPGRXiIEARAVLPELIGAARDRRASC veqrvrsltachacaçrraaapaaprtpprpsaapapgsdaggrcg
SEQ ID NO:102 or£2 Proteína hipotética 149aa L
VSVSLLLVPLAMAGAAAVQAAAGRMDDGRLICQVQTRMRDVTLLDAALRD TGATVTAAGDTISATWTQSAATFTRGADGIWAAHVTGVDQPGAVELMTTV
DTAYGRRVQQAVLERLRAQAPEAGLRI.ESESVGQDASVRI.VFEVERERA SEQ ID NO: 103 or£3 AlPaae MAS, envolvida na dívia&o celular 518aa
VERSFAETFAQLLKARFPVLHLETYEEQRALHHLAGIAGDADLVRVPRAV WTWSLTAGLVQPNGEARSGAQRATDALRAVQRIDEPAVFVFRDIjHPIjFAQ SPEWRLVRDIAQAFRAGRSFRTLVLLSPVLDLPVELSKDVTIVDFPLPG QLELRALLDAMVRGNT ASGRLRVELDEQ S RERFVT AAAGLTMQEAENAYA RAMVN DAVLDLADLEIVHEEKRQ TVRKS GVLE FMAAGTVLDDVGGLENLK AWí, VKRNGSWLDEAAGYGLPAPRGVLirGVPGCGKSIiTAKAVATAWNX.pl. LRFDIGRVFSGLVGSSEHNMRTAIiRTAEAVAPCVLWVDEIEKGFAGGTGG DSGTGARVFGTFLTWMQEKRTPVFVIATANDFDGLPPELLRKGRFDETFF VDLP srservavwrvhlgralrhrraagelrvdaelltelagl t eg ysga
EIEQAVIAGLF DAFS 3RRPLRRD DLVRAVMS X VPL S VTQAERVDALRGWA RNRAVSATGTDDWDLTNR SEQ ID NO;104 ox£4 Bidrolase de açúcar 203aa
VGELDQQRXHPHNNIWGSGAGTQTIWARSGTNWGWANHPRTSGVKSYPtí TGKTLNRTLSSLNSLTSSFNVSVFSSGDYSTTYDIWAKNHAYEVMIWTNQ QGAVG PIAEQ Y DANGAVPNVRNL S VGGH TWNVYRG SNG ANAVFS FIRTNT NSGTVDILAILtíWLRTNGWWGDVTVGEAQFGFEISGTAGQSNFTVNNFSL NYS
SEQ ID NO: 105 or£5 Endoglvtcanase 219aa MRRRTLALSLAASAALIAGAGWTAIiPASAAAGCRVAYTVSSQWFGGFGA WTITNLGDPLTNWTLWSYSGGQTVTGAWNTSLTQSGSQVTAR.NAGYNG SVGTNATVSFGFNGSGAATPAPGTFTLHGTACTGSAGPTSPSSQPPTNGV PSDAVWVDSGQWANWTNNGYILTTTSGARAPAPRPSGRAAAPTGASSRIT RAPAGSSPTPTPERPSTVR or£6 Citosina/adenina-desaminase 161aa SEQ ID NO: 106
MT ITETDLAHLRRCVDLAREALDDGDEPFGSVLVS ADGKVLFE DRNRVRH GDATQHPEFAISRWAAEHLTPRERASATVYTSGEHCPMCSASHGWVRLGR IVY AAS SAQLTAW YKEWGI PAG P VAPLPITT WPGAWEGPVPAFEAELR ELHRARFTPAQ SEQ ID NO: 107 ' orf7 Desconhecida 413aa vttpi>vaqagdsttgltglglvedahqiaeairgnswvdgvlggvgaslp
GLALAIDPLGTLAAWGVAWLIEHVQPX,QnALDSJLAGDVDEIAAQAATWRN vaaftdsaqqdyadrlrtevagkfgasgdayrahasehiaalkgistaag GISSAVEGAGLLVSLVRGIVRDLIAQFVATIAVRLPQWLAAEGI.TLGLAT PWASQVAALVARGVNKIQHFIRALLNSLRRLMPMIDRLGEVLERLRMLT DRL ARS S P ST RPEPTPGPATHAG TENASGNKPE GDLE PNEPRPAEADARD STPQAFVDEWSNPRSVAGHSAQSIADQFNAAGYSAWEQSTRSGTSGNA iqvrihghpditniqvhpgggrhtpegspywkistntvgkiwiipenfrg
ADELRGNWRYDK
SEQ ID NO: 108 ox£8 Desconhecida 217aa vgkpcpdlvevlsreiqagnqgasaseweifdlelvgifrgavtqklpg lEVLRKHLHLKQGGVQVRSWVRAEDPAGIVWGDLCARIDNRbVGLAQG DAYWERRDDTVDRLDQIRADSPCEFDDMVRLGAGVHGDGQRRVRQRFADV 92
ΕΡ 1 979 375/PT
ANLFGVQRAIINESRIRTKIDPDDVDAQGDERGSFPRGSHPIHFDDLICH saphshavhrrpgnfrg SBQ XD NO: 109 ' orfâ Pxruvato-oxidaae 592a.s.
VSDVWERLTAWDVERVFGYSGDGIDGVIGALRRAGRPTFVQARHEEGAA FMAVGHAKYTGGAGVCLATQGPGAVHLLNGIjYDAKLDSKPWAIVGQQVS tvlgsayqqeidlvrlfgdvcaqfvqaahtseqvpmxldrafrtaiatrs PTCWLPHDVQTAPAPDPQAHEHGVLATSAGIRFARWPRFEDLREAAEV LRSGERVAXMVGQGAYGAEREIVEIiAQRLGAGVTTSLLGKPVLDENLPFH tgvmghlgttasaelmrhcdtlllxgtndpwtefyprpgqaravqidvdg RRLGVRYPVEVPLLGDAVETLREXiLGLLPSRASGAMGARVEEWVQRWRLI SAARAAAPAEPVNPQHVIRSLSDHLPADAQVAVDVGSWYWYARHLRLPR GVPAHLSSTLASMGCGLPYGLAAKLAAPQRPVWLAGDGAMQMAGMAELI TVAARWRDWADPRFWCVLNNRDLAEVSWEQRETEGSPRFVTSQELPDVP YARY AELLGLRGVRITDPS DLTGAWEAALSADRPTLIEAWDPAIPLLPP GQPYEKVQAMYAGLAAEKGDQARRAEAHLRRERADEGFDDPS
SEQ ID NO: 110 oxflO Sldrolame ou aczltranmfmxasm 26Saa VSRDKTYRPVRPDGIRTTFHDGVLGFMRIRCLGEPRPGVFEIVMIQGMTV SDYLLPGLGALSAWTRVBLVELPGGSGSGRPPHDLTVEEYARAAADWLCA QRLGRIVLAGHSSGTQVAAEXALLCPDEVAGWLAGPAIDPVARGGLRVF ARWWIDRRGDPKSLDEVHKPEREQVGFRRI.FQVLRAHIIRHDISEKPWGLC VPVLVIRGSEDRLGTARWARRLADLAAVGGRYVEVPGTHSFCWRYPQAWS APIREFAGWSVSVSGT SSQ ID NO: 111 oxfll Aldaa®~&p±mar&sa 396λά
MTEADKRPTVLRRILRLCAVLLMVLGVGLVGAPTSHAGGKPTISKEAFGS VGGKAVDRYTLTKGRLQVRXLTYGGILQTITFPDHRGRRANVTLGFRTLD EYVTTKNPAYEOAXIGRYGNRXADGRFTLDeTTYQIAINHDPNHLHGGVV GFDKRVWDATPIRDGDSVGIiRLTYTSPHGEE»YFGTI.RV!rMTYrVTRQMG IRMDYRATTDRPTIVNLTNHAYWNLGGEGTGTIDDHLLKLNANRYTFVDA TLIPTGAIDAVAG-PMDFRRPTPIGARNRDPFQQLVYGRGYDKNWVLNRE DGQFKRLEFAARAVDFDSGRQLTIYTTBPGIQFYGGNFLDGTLYGTSGRA YRQGDGFALETQHFPDSPNHANPP5TVLRPGQTYKSTTXYQFGTAD SEQ ID NO: 112 orflZ Coasponente periplá/naíao de transporte de açúcar ABC 378aa
MPRIHPKVEEAVSTLDLNRTTRRRLLSGTGLFSASLAAGALLSACSDQND
GQNQTEGAGNFPDTPEWRFTFVHÍHVTTNPFFTPTQYGMEDAATLLGXAKP
QWTGSQNSIVAEtWNATNTAVSAKVDGIAIAVVDKDAFRGPVDQALNAGI
PWSYNADGARGAPGTNRLAYIGQGLYESGYALGQRALQVLDSGEVAAFI
ATPGALNIQPRIDGAQQAFKDSGKPITFTAVATNADVTRGLSIXDAYAQG
HAHLAGMLAVDAGSTSSVGQTVKKYNMRGKGLKVAGGFDLIPETLTGIQE
GSLDYTIDQQPYLQGFItPVIALYFYKVSGGLIAPSETNTGLLFVTKDNVA
PYQSTKSRYEGSTTDKVLVPRSGPIAHG SEQ XD NO· 113 orf.lS Peratease de transporte de açúcar ABC 352aa
MDDRISPAPAQAPSLEVEQRRGRWQPVTAAGRKVLDAFLRRREASVLLVA IGLMIYFRASSPVFLSRDNLVMIAQATAPVAIIAVGIVLLLVSGEIDiSV GIVAAIiAPFLFHFGIHFYSLPWPAFWALAIAAGIGLVNGLIVTQLHVP SFVTTLGTFFAVQGILLITSHAYPVPIPDAAKGTFQTWLGAGPWASITWA I-IIVAIFHTVLTLTRWGLHTISVGGNPVGATEAGIRASRIKIGNFVITST LGGLVGIMEAFRINTIDPKIGGGTTLTFYAXSAAVIGGTALAGGSGTXVG AFLGALVIAELQKGFKLIGYSANTIFLILGLAILVSMIANQYLSRLRRAG RS SEQ XD NO: 114 orfl4 Ligação de ATP à proteína de transporte ABC 253aa
MTAETVSDALRVQNIAKRFGALTALQDVTLRVAEGEVLGLIGDNGAGKST
I.IKIICGYHRPDAGRIFVGGEEVTLRSVDHARSVGIDAVYQDLAI,VNEI.S 93 ΕΡ 1 979 375/ΡΤ
VYHHMFLNRELVRWPLLNNRAMRRRAEEHIjRDMGVNIiPDVGVEVAKLSGG QRQAÍAVARCVY S D ARI LEL DEPLAAMGAKEGTMI IiDLIRDLKARGNVS I 11IAHMYAQVLDVCDRVNLLQHGRITFDKRSADTSLAELTELWAEYRTG
RGR SEQ XD NO: 115 ' orflS Proteína hipotética.. Hatiltranaferaam Z55aa
MESGA SVPQ SARIKNYWLGGT DNLPVDRAAGDE YRAVFPGI DE IARESRR YLSRAVRYLAGEAGVRQFLDVGAGIPTVDNTHQIAQRVAPDARVIYVDKD PYAVEHGRELLAGSSDVYLEGDX.QKPADILAVAARELDMGRPVALILNGV XjGHIPSTAEVRDIVRQLMAGLPPGSYLSINDGVRVAGSEALNQAQDAYNS SGAVPYLMKIPDSIAGFFBGLDLVPPGWPS PQWHPDPGDETTGASQYSG VGRKR SEQ XD NO: 116 oxfl6 P&mease de transporte ABC 280aa
MPFRTSRGPHPWVLWTALAAAAVIFVYPFVWLVSASLKERPDVFDNRliLP AEWAPGNYTAIWDAAPVX.TWMFNSWVALAAAAAVTISSAWAFGFAYFR FPGRNVIíFALWGTMMLPGAVTMXPTYLIWNELGLAATQVPLWAGNLFGS ΑΕΥΙΡΒΙΚΟΓΓΙ,ΟνΡΚΕΙιΓΕΑΑΡνοΟΑΘΥν^ΒΕίϊΚΙΑνΡΧΟΚΡΑΒίνΑΡν FELRASWSDLLKPLIYLRDPALFTMPRGMKAILDQFGQAGEARWEIVLAG AVITTVPMIIAFFLCQRYFVEGVATQARKG SEQ ID NO: 117 oxfl7 Permeasse de transporte ABC 301aa
MSAAVRRRETLAAFGFLSPWLIGFTVFHAGPMVASLVIiSFTDYDVLTSTD FVGGEN YRQMLADPRVRT SIANTL X YTALHVP VTMIV3 LALAH1LARVGR RSAGFFRTIFYLPTITPKVAVGVLFLIiIiFNGQVGIVNEALGTVGIDGPNW TVDGPWIKPGLVtlGAWS LGSTVIIYLAALQNVPRDLYEAAEMDGASAWA RFRAVTVPMISGAXiFFTLIINTIASXjQTFDEVYTAFYGSANQQTYGHDAA LFYWYLFQQAFQFLHMGYASALAWLLFLXIVIIT WQVRLSRRFVYYES E 445aa
SEQ ID NO: 118 orflB Ligação de mnbatrato dm transporte ABC
MFIRSIRFWGGALVLTLAAGCGGVGGSDSDSDSNAAVTLTMMGFGTGDE iaktrfdaanaviapslakasegsfdaqaflsavasrtppdlvymerrll
GTYAAKKALTPLGDCVEREKIDMSQFREAAVYEATLNGQLYGLPDFYHNR
VLMLNDAAFAEVNLDFAGFDTGDWQALSTATAR1TRMSGGKBQRIGFDPK
LPEFLPVWARANGAALVSDDGRTAQLNNPKWEALEYAVGI.INAQGGWSN
FKSFRDSWDFFGAKNQFASNQLGAFPMEDFYLNVLADtqSPKVKVTVAFFR
GVDGQPIDWITGKAWAIPAKSAHPGQACKWIKTMTASETWXAAARARAEL
RKKENKPFAGVYYGNKKADEVIFRDWKPDANVQIVLQTQESGFSEPALA
AGEEFKAAWQNAVNRVLEGKQKPAQAMAEAQQQAQAALDKANSGR SEQ XD NO: 119 or£19 actA Gene estrutural lanA 64aa
MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASS GWV CTLTIECGTVICAC
SEQ XD NO: 120 ox£2G actM Gene de modificação laxM 1053aa mspvpslnstsvrdsaylhertvtgedqpapaaqarxaswrdsaflddrv LDXRLRQWGIDRAT FGRIYLT DDDFTVPGRLLAWADELATVLATDTTPVTG ΙαΕΙ,ΕΪΚΧΜΕΟΰΡΟΚΙ,Ι,ΓΑαΕΧΗΡΕΙΑΗΥΕΟΚΒΗΕΕνΡΗΡΙΑαΕΕΡΚΡΙ.ΙιΕ SLANRLLAVAARTIiLLEl.MVARVHGRLTGDTPQQRYDDYDRRLLTDPAYB
AAIiFEEYPVLGRCLVECGRRWVDHAAELFKRLHDDEPELRAAGliLPPSAE
ALRSVRLDLGDPHNGGRSWQLTFDDGTDLVYKPRPVG5ERAYAETMAAI. ARHGLPVPVTAPRVLDRGGHGWCEFVRPAPCADAAELSRFYRRAGSVLAA MLLLGGVDMKMENVIAAGSSFTPIDLETVLQSGELGDGATDAYGRALDLL NRSVLAIGIIiPARAFGGRQRKSVDVSA;LGGGEPQTAPRPVPRIVDAYTDT ARBEAVEATMAGAQNRPSLPGAEVRPWEHTADWAGFTDAYDIMLAHRAD FDRLI.RGFHDVEVRYLPRPTRRYSIFLTESYHPDYLRDASDRDRLLDKLW TAADARPELIPIIESEKRQLLAGDIPCFRSVAGSRQIRTASGPLHPEFFT APAVTVLTRRLGEFGPVHRAAQVRIIRDSMATMPGPRPAAQPS PDRAAGP 94
ΕΡ 1 979 375/PT
RFRVTGADPATLADRIARRLADEAILGDRDVSWIGVSIEGVAQETYSYKP
MATGLYDGVAGLALTFAYAARTLGDDRYLDLAHRAARPVAGYLRYLAEHR
IVETVGAYSGTAGLLYAIíDHVAHATGDDSYLDAVSEAVPWLRECATREEC
PDLIAGLAGCALISLDEHGRHRIDGLREVAAICAERLAALAVDVDGAAGW
PATPDGPLLGGFSHGAAGIAWPLHRLATELGDPSLRELARRAVQFDRDLY
VPAAGAWRDLRPEMAGTDSYPALWCHGAAGIGLSRLMAQHDQDTRLAAE ataaldlvgahgfghnhsichgdfgalalfdiaartgfdpgrhdaaaaav tadiaangarcglvgdihmpglmlgaagiclsllriahpaqvpavawlqp
PIíT SEQ XD NO: 121 ox£21 aatO Manoxigtmaee 34Xa.ii
MPEEIVItSVliDQVPVFRDGSPAEAVROAVALARSAEQYGYHRFWlAEHHG saanacaapewtaavaaatsrirvgsggvllphysplkvaetfrvlaal ΥΡσΡΙΟΙΛΡΟΚΑΡΟΟΡΡΑΜΑΕΙΛΝΡΥΑνΡΤΟΕΑΡΙιΕΰΙΘΚΙΛσΓΕΟΟΤΚΤ
VSRV5VTPQVEEPPVPWMLGAGTGSARMAGMLGLPFCFAQFIATEECPEA
IBAYRDAFRPSPWLERPGPMLALRVLCADSDAEAEELATCFWMSCTTGWR
AQVQLTDDYRGGAPNLDDARRYRLTAEDLALRESRPFLQISGTPAAVGKE
IRRLQAVYGVSEWLTTNCPGLPARRRSYELLAGEFASPAA SEQ XD NO: 122 ox£22 actB Rmgnladox d» Tempos ta 231aa
MRSAARGGPIVTDVLWDGEALVSIGIKMILE3TGGFAVATTDRENLRSA VEQeRPAWL·LDGHSAQSDG]JEVLDGL·RAL·SΞPPAIAMLTTL·APPELVLD SLRGGACGFLLRDSQPEQLVAAVRALAEGSIVLAPEASSWVRAGSRGSA AGAGSPACERVKQLSDREQSILRLLGAGLTKAEISRQLF.LSAATVKEHVS VILSKLGVARRVQAAVXiAYASGLSSDDVCLS
SEQ XD NO: 123 ox£23 actT Paxmoaae associada a txan.spoxta.dox ABC 812aa
MIFALAWSQLRAYPARLFAIVAAVMLATGFLAATATFAATSGEGLRRTAA APLTTADIVIiDADDTVRDPAWYEAAAAVPGVRSVDAQYARTVSVFGGSRR GSANVQSIAATPQVRWFTIiDRGAWPTGPGQLVADQRTLDDLGIDVGATLT VRHGEAAPQPVTVTGAADLGFRPLTGSDFRFYADASFFAGDVFPAAIiIiTV ADDASLTGTVDALRRSMGPGISATDASAAADQAAARFAGGNGGLWIMLA FAAVALLAAVLVXANTFHWXVQRIRQIALLRLVGGHRAQVSRVVLAEAA IAGTAGGLVGAAAGVGLGYLGADLLDISGGGLRVNPFALAGCVLAGVLAT LVAAWAPARRATRIAPVRALQAADEPPAGTVRGGRRLWGTWTWGAAA LAVAAXGASLPIiALLGGLLXiAAGLLAALPRIiIALSIAPAARLIjERFGVAA GLAGTSLSQNARRTASAAMAVWGAAIiXTCIiAVAATSGRATVNADLEARY PVAAGLRTDGEPISGATAGAFAAVPQGSASGTVGTVAARFPDGGKATPRL LAAPGDELAARVAPELAGEPWLVPATYLAELGLPDSAPIVVEVGERRVN LIARASRIiADTTGQLLGWSARTLAANRIEAVPTTVWGVADPGFDREM.S AAVGAVAARDALVQVGGGVTEGGDIANVLSILLGLSLAMLAVTWIALLG IANLLGLSVVERVREMALLRAIiGTRRARIiRAMIiAVEAVVITLIiGTVAGLV VGVPVGLAAVAAAVGRTAD P VIRL PWGQLAAVL WAVLTG WAS L APARR AARVAPAEGLTR SEQ XD NO: 124 ox£24 Pxot&ína hipotética 244a.a
MIVWPERRAASRSPPSSARPVAMSSAPVGSSAKTTDGLASSARATATRCC WPPDSSDGRCPSRSVICSESVIFRSSPGSTRRPASRSGSTMFCSAVSVGS RLNAWKTKPIRSRRRSVRARSSRPANDRPARLTVPAVGVSMPASRCISW FPEPDGPMIAVNWPAEKPADTPSTAVTAAGPVPYVLLTSRQI.TISACWC WT APT LE XRADRHIP PRDPGRAVDRYLRMTRRYRPRAPC SRNR SEQ XD NO:125 ox£25 Cnxnaee reguladora de resposta 3€7aa VLRIDAItVAAAWXGCL LLGLAG LS EW Y WSAAVAVPLIíLRRSAPRC FEAL vagvsglhllasesfmfpgdlvalvavhaaaahapgrarhaglllgaaga lwaaqalqdqrlgsalpavlivastmaawsiglmqrqqrsavldaehrr rlaeqdsamraglavheertrisqemhdiiahslasiiaqaeggrvaara
DARIAGPVFDRIAGLGRQALTDVKRLLTWDHDDEWHDDGLERLPVLLAG vteagldvtvdssgapqplaagmdlavyrviqesx.tnvlkhaparraclr 95 ΕΡ 1 979 375/ΡΤ
MRWTPALLTVTVSS PL PGGRGAGI.VEGRGL SGIRQRCSLFNGDCTVFATT ELTVTTTWPLTPEGARA SEQ ID NO: 12€ ox£Z6 Sensor regulador de rasposta 220aa
MTRP PIAVLIADDQELVRTG FAMWDAAPDMRWAIAAS GAEAIELAAEH RPDVILMDIRMPGTDGITATSAIIAAGGERPPKIIALlrTYDSSDYATRIL TAGASGYLLKDATAEGLTAAIRSAYHGGSVIAPTTTRKIiVAARAEPPPPA RDPAPLDrFTARERDVFDLIVAGANNAEIAARLHLAEVTVKTHVGRVLAK LGVRDRLNVWWAYRNGAVG SEQ ID NO: 127 or£27 Proteína de ligação a penicilina 782aa MLICGLIAGVVVAAAAFPFAAMSGLAAKAGQQTFASLPSELKAFRSPQIS RIYAADNRTQVAQFYDfíFRSDVpLKEMSPFMRDAMVAAEDRQFYQHHGVD LKGAARALVNNRNG GQKQGAS TITMQWVRISLAYSATKPQDVIDATEDAP KRKVAEMKYAEEVEKQLSKDQILERYLNIVPFGKQTYGIYAASRVYFNKK PKDLTIGEAALLAAIVKAPSAYDPTDPDGYEI.IRQRRNAYVIPGMVEMGA ITRAQADAALKEAIPRKVRPMSNGCVSVAKNNWGFFCDYFYRWWMERKEF GPTPYDRERRLKSGGYRITTT LDVKAQKQARDRIGDLIΞ EKNKNALLLAA VEPGTGKVRMLAANRRYKLDDPDDPQNAISSDPRKARKGIRGSYPNTTIsíP LLTGGGDITGYQAGSVMKMFTIVAALEQGYFLAYTIRTQSRYRSRYIIES SNDAACPGTHFWCPSNAGGGGEGVFNMWTGLGRSINTYFVPLEERVGAEK WSAAKRFGIQFREPDDAIiLAEPGRAHQWGAFTLGVSATTPLDMAKAYAT IAADGMYCPPTPIERIATRDGDQIiDVGRSPCVRATAKDVARAALDAARCP vgdsaqlgrcggstagitrswghpvfgktgttdrdrtasliagttalw agylvnpdyqnhrdrldhdqvepavyrtladymegrpresfkrpssgria fgdqrsipdvecdpmprardrledagfdvwrgqevesdcpagtaagteps
GRTVKNGWVIQVSKGRRGASPPIFPPIGPPR SEQ ID NO: 128 or£28 Metiltxansfera.se 253aa mapetrslryyygdagreaamdamyrrfvrpgdwfdigahvgdrvacfr ΕΙ16ΑΚννΑνΕΡ0ΡΚ:ΚβΑΙ1ΚΑΙ.ΥΑΪ100ΚνΑΙ,νΕΑΑασΡΑ063νΡΙ,ΥΙΝ3Α
NPTVSTNSVRFLTAATGSRGWSNEVHDGQITVPAVTLDTLVQRFGLPAFI kidvegyedavlagesrgvralsfefttiardvarrcldragelgfdgfd vslgetmartfgrwaardemlahlaglpheanagdvyavsrsagwpdrre
DRR SEQ ID NO:129 or£29 Mzdnolaae 261aa vprfdsrlvtvggvrthdrhachagglpwlvhglavshrylmptahaea grhpvlvpdlpgfgfsdkprraydvgrhaehlaamldvlgvpraciaghs
FGAEVAARLAVLRP DEVAAWLAS PT TD PAARSRRALIGRWAVDLWIEAP WQAPVLVRDIADAKPWRVLATVGHSVRNAIEEDLRREPVPPLVLGGSLDP vaplrwraevaamtggvsvtvpaaahnvmttsgvrsaraiaaylrtrrrc mdrligghppp SEQ ID NO: 130 · ox£30 Regraladox d@ resposta 244aa
VSPPFREDEAVADVYGDLRIiAPVIiRRLLRHSGRLTGSVAGSVSLIDADRG CYVKAAEYGANCQLGRSFPiDEGATGRAFGSRRPWIPDYGQLRAGHLAA AHPARKGPAVAVPIWWRGDVIAVNVAFAPAFSLGGVDELEALTQSAAAAI VRSRGVRVRADPPYAAPAAPFTPREAEVIjDLLRQGLTDREMARRLGLSAK tvekhvgairrktgtsnrtaawtaldndwvgnlphtabhtígs SEQ ID NO: 131 orf31 Fxratose~bi£oa£ato~aldolaB& 281aa mkdildralaerygvaafhivndltveavlaaaaeerapvilqtsvktvr
MY GRPRL YEIVHAF AHDAPVPVTLHLDHCPERS VIS DCLAGGWN S VJÚFDA HELDVADNLRQTTEWAEARRAGAHVEGEIEGIQGVEDDVGNDYAPMVQS LEVAVDFIKRTGVDCFAPAIGNAHGQYKQAPVLRTRRVSDLVAATGIPMA LHGGTGLSDEQFTDLIARGCAKVKISTALKESFMKSGLEFLREADERGKM DP P 8 LFRHQRAAWEMARQHIRLFGG S GP.AW 96 ΕΡ 1 979 375/ΡΤ SKQ ΙΌ ΗΟ: 132 οχ£32 Hldxolage» 192aa
MGSAVAVPASAGGGRRDGPAAHPALRRIGARVVNALVFDCDGVLADTERH GHLPAFNATFEQFGLPVRWSEEEYGEKLRIGGGKERMASLFADPAFAAAA GDTDRTELLRTWHRAKTAAFTKLVAEGRIPARPGTARIISEALRAGWTVA VASTSAEDSVRAVLVNAVGATTAERIPVFAGDVVPAKKPDPA SEQ ID NO: 133-SEQ XD NO: 199 {Nulo) SEQ ID NO:200: CosRJ.02 (40402pb)
GATCAGGTCGACCGCGGAGCTGATCTGGTCACGGATCGCGCGGATCGGCAGGTCCATGCCGGCCATCAG
CACCATCGTCTCCAGCCGGGACAGCGCGTCCCGCGGCGTGTTCGCGTGCAGGGTGGTCAGCGAGCCGTC
GTGGCCGGTGTTCATCGCCTGCAGCATGTCGAGCGCGGCGGCGTCACGGACCTCGCCGACGACGATCCG
GTCCGGGCGCATCCGCAGCGCGTTGCGGACCAGGTCGCGGGTGGTGATCGTGCCCCGGCCCTCGGAGTT
CGGCGGCCGGGACTCCAGGCGCACCACGTGGTCCTGGACCAGTTGCAGCTCGGCGGCGTCCTCGATGGT
CACGATGCGCTCGTCGGCCGGGACGAAGCTGGAGAGGACGTTCAGGATCGTGGTCTTGCCGGAGCCGGT
GCCGCCGCTGACCAGGATGGTGCGCCGGCCGCGCACGCACGCGTCCAGGAACTCGGCGGCCTGCCGGGT
GAGCGTGCCGTACTGCAGCAGGTCACCGACGGTGAGCGGGACCGCGGCGAACTTGCGGATGGTCAGCGT
CGAGCCGTCCAGCGCGATCGGCGGGACCACGGCGTTGACCCGGCTCCCGTCCGGCAGCCGGGCGTCGAC
GGTCGGGCTGGCCTCGTCCACGCGGCGGCCGACCCGCGAGCAGATCCGGTCGATGATCCGGCGCAGGTG
CTGCTCGTCGTCGAACTCGGCGGCGACCTTCTCGAGGCGGCCGAACCGCTCGAGGTAGACCGAGTACGG
CCCGTTCACCATCACCTCGGTCACCGACGGGTCGCGCAGCAGCGACTCGATCGGTCCGTGGCCGAGCAC ctcgtcggtcacctcgcgggtgatccgggcccggtccgcgccggagagcggggtctcctcccgggcgag
CAGGTCGTGGAGCGCGTCCCGGACCCGGGCGTCCAGGTCCTCGCTCTGGCCGGTGGTGTAGAGCGTCGG
CCCGAGCTCGTCGGCGAGCCGCCGCTGGATCCGCAGCCGCACCTCGCCGACCTGGTCCTGCGGCGGGCG
GCCGGCGGCCCGGTAGCGGTCGCCGCCGCGTGGCTCGGTGGGCGGTGGTGGGGGCGTGCCGGCGCCGCT
CAGGCGGCTGGAGAGGCTCACGGGAACAACCTCCCGAGGAACCCGCGGCGCCGCTGGGGTGTGGTGCCG
ACGCCGGCGATCCGGTCACCGAGCTCCCGGATCGCCCGGCTGACCGGGTGCAGCGGGTCGGTGACGGCG atcggctcgccgtggttgaccgagaccgtcacgtcccggctggccggcacctgcaccgcgaacggcatg
CCGGCCGCGACCTCCACCTCGGACGGGCTCAGGCCGACCTGGGCGCCGGCCCGGTTGAAGACCAGCAGC cgcttgtccttggggtagtcgagcaggtcgaacatctccgcggtgagccggaccgacttgagcgccgga
AGATCCGGGGTGACGATCGGGATGAACCAGTCGGACATGTCCAGCGCGGCCAGCACCTGGTCGGTGACC
ACGGACGGGGTGTCCACCACGATGAAGTCGTAGAGCGGGCGGGCCACGTCCAGCAGCTCGACGACGAAC
TCCCGGCGGACCTGCTCGCCCTCGGCCGGGCTGGCCGGCGCCAGGAGGGCGTCGAGACTTTGCCGGTAC
GTCGTGACGATCGACCGCAGCCCGGGCTCGTCCAGCCGACCGGCCATCTGCAGGCCCCCGGCGATGTTG
CGTTCCGGGGACAGCTTCATCATGATCGCCACGTCGCCGAACTGCAGGTCCAGGTCCATCAGCAGCACC
CGGCGTCCGGCACCGGCCAGCGCGACGGCCAGGTTCACCGCCACCACGCTGCGCCCGCAGCCGCCCTTG
CCGGCGAAGACCGTGACCACACTGGCGTACGGGGCGTTGTCGCCGGTCCCGCGCATGGTGGTGCTCAGC
GCCTTGGACAGGTCGACCGACCGGACCGTCGCGCTGCGGATGCCCTCCTCGTCCTCCTCGGCGACCAGG
TCCCGGATGCCGGACTGCAGGCAGCGCAGCACCACGCCGGCCTCGATCGCGTGGCGGATCAGCACCACC ccgatcaccgggcgctgcaaccgctggtacgccgtgaacatcagcgcctcgtccaggtccacgaccgcg
CCGATCACCACGAGCAGCGTCTCCGGGTAGCGGGGGAGATACGACTCCAGCTCGCTCATGCTCTTGAGC
ATCGTGCCGCCGATCGCCCGGAAGTCGTTGCCCCAGTGCGTGCGGCGCTCGTCGTCGGGCTCGACGTAC
ACATAGAGGCTCATCGCACGACCCAGCTCGTGTCGATCGCCGGGCCGGTGCTCGCGGTGGCGTTCGGGC cgagcagcgccaggtagagcgatccgctctgggcggcgtgcacgagtcgcagggcgtcggtgtcgccga
CGGCCAGGGTCACGACGTACCGCTGGATCTCCTTGACCGCGGCGGTGCTGTCGCCGGCCGAGGCGGACG
GACCGGGGGTGGGCGAGGGCGACGGCGTCACGGGGGCCTGACCCGGTTCCGCCTCCCCGATGGTGATCA
CCCGTGCCTTCGGCAGCAGGAGCTCGGTCATCGGGATGGTCTCGTGGTCCTCCGCCATCAGGACCTTCG cctggtacgtgtaatagaccgcgacctggtcgccgggcgtgatgttgccggctacctgcggggcgacgt
TGAGCGCCACCGAGACCGCGAGCGACCTACGGGGCACCGGGATCCGCCCGGTGTGCGACGGCGCCGGTG
ACGCCGGGACGAACAGCGTCCGCATGAGGAGCTGCCGGGGCTGCAGGTCCCCGCCGAGCCGGAGCGGGT
CGAGCGCGCTGTCCCAGGTGGTCAGCGCCCCGGCGGGCACGGTGACGGTGGGGACCAGGAGCCGCTCGG
TCAGGCCCCGGGCGCGGATCTCGGCGCCGCTGGTCCCGGACGGGATGTGCTGCCCGGCGACCAGGATCC aggtgccctcccgggcgctgagcgcgcgccggtcggccgaccgggcgtaggacaggacggccgccccgc tgatcccggccagcaccagcgcggccagcaggatcaggatgcggcggcgcatgacttcaccttctcagg caccggtcatcccgtacggccgatcaccatcgcgccgtaataccgcgaggtggcgaaccgcgtcggtac 97
ΕΡ 1 979 375/PT
GTGGTCCGTGACCAGCGCTCTGGTGAAGTAGCCGTAGAGGCAGGACTGCGCCGCGCACAGCGCTCTCTG
CGCCCCCGGCACGAGCGAGGGGACCGCGGATCCGGGTGACACCGGGCCGCTGACCGGGCTCTCGTAGCC
GGTGAGGACGAGCGGCGCGAAGCCGGCGATCCGGTAGTACGACGGCAGCGTGCCGATCACCGCCACCTG
CCTGTCGAAGATCGGCACCAGCACCGGCTGCCCCGAGGTGATCAGGACGTTCAGCCGGTCGAGGCAGGC
CGTGGCGGCGGAGGCGTTGCCGGGGCCGATGGTGAATCCGCCGACCCAGCTGTCCGCCGGCCCGTCGGT
CGCCGGGATGCCGGTCAGCTCGCAGGAGGCGTCCGGTGCGCTGACCGGCAGCAGGCCCGGCAGCGCCGG
CGGGCCGTCCGGCTGCCCGAGCCACGTGTAACCGGCGACGGTCTCGCCGGCGTCGGCCGGGCAGGACGT
GGCGAGGATGCCGTCGCTGATCGGGATGTAGCCGGCCGTCGGGTCGGAGAGGCCGAGCAGCGGGTGGAC
GCCGGTCTGCGGGTTCGGGCCGGTGGGCGGCGGCGGGGCGAAGAACCTCGTGTAGTCGCCGGTCAGCCG
CAGGAAGTCGCACCGGGAGACGCCGAGCGCGAGGACGTCGGTGACCGCCGGAGCTCCCCAGGCGACCCG
GCCGCAGGCGCCCATCTTCGCCCCGTGGTACGCCGACCCGGCCAGACCGCGCCCGAACAGCGGCGGCAC
CACCGAGGTGTTGTCGCTGTTGCGGGTGGACGTCCGGACCTCGACGTACCGGTACGGCCCGGAGGCGCT
CGGCGGCGCGGGGCACGTGACCGGGGTGTTCCAGGAGCTCGGGCAGCCGGCGTCGGCGGTGGTGACGCC
GGCGGCGGAGACGGTGGTGATGCAGAACTGGACGTCCGAGACGAGGTCCTTGGCGTTCCGGrCGGCGTA
CCGCTGCGCGTTGTCCCGCTGCGCGGCGACGGTGCAGGTGGCGGACGTCAGGTCCCGGCCGGCCGTGCC
GGCGCAGGCCTGCGCGACCTTCCACGACGCCGCGTCGGCCCCGCTCTGCAACTGCTCCCGCTCGGCGTA
GAGCGCGCCGATGTCGATCACCAGCGCCGCCATCCCGAGCAGGACGCCGGCGCCGGCCAGGACGGCGAC
CAGCGCGGTGATCACGCCGTGCTCGCCGCGGGGCGGGAACAGGGCGTGGATCAGCCGACGCATGACATC
ACGCCGGTCGCGCTCATCGTGATCGTGCCCATGGTCTGCCCGCCGACCAGCCTGACCAGCGCCACCATC
GGCGTGATCGGCTGGTACCGGCGGGTCAGCACGACCTCGGCGTCGGCGCCGGCGAGCGAGGTGGCCGAA
CAGGTCGTGACGGTCTGGGTCACCGACGGCGCCCCGGTGGCGCCGACGATGCCGTTGACCTTGGCGTGC accgccgcggccgtgccgttcagggcgccgagccgggcgccctcccgggccgcctcggtgagctggatg
TACTGCTGGAGCAGCCGGCCCATGTCGATGATCCCGAACAGGATCAGCAGCAGCACCGGCATCACGATG gcggtctccagcgccgcggcgccccggtcccggttatcgtgcggagctctccgctccctgggcgagaac
CGTACGCAACATCCCGGCCAGCCGGTCCGCCGTATACGGCTTCGCCACGAATGGCGACCCGGCACGGAT cagccctttcttgatggcgatctcctccgggaccccggagacgtagacgatcttcatgcccggccggac ctcggaggccgagcgggccagctccccgccggagactcccggcaggcccaggtcggtgagcagcacgtc gatcgctccgctgtgcacccggcacgtcatgatggcgctgaccgggtctttcgccacgaggacgacgaa cccgcgcatctccagcatctgtgcggcgagctcacgcaggtcctcgtcgtcctccaccaggagaacgac cggcccctgccgctcggttgctttccacatcattcctctcccggtgcacgaggaatccggcgacgactc ttcccgtcgctgcctctgctcacgctatccaccggcctgcctggcccggtggcattcgcggaaatgtcg atgccctcaaatcagcatttgtccggcggcactgtccgtgttaacgctcactacgttgcgctgacgtca cgtttcgtcccggtaacagttcggggtcttgacagatcacgagcgtcgatgggtgaatgtgttcaatcc tgatcggacgagtgcaggataaacaacgtttgcgtgtgaagccgtttggctttgagggggctccatgtt caattacgtcagtttcgtgcgccctaaaacctttgccgccaccttcgcggcagccgccctgctgctcgg ctcgggcgcctgcgcgaagagcgaggactccggggacaccgtggcggcgggtcccgccccgtcggcggc gcaggtggtccagtccgcctcggccggctccgcgacctgtgccttggatcagtacggcgcgtccaagct
CGACCrGAAGACCGCCTCCGTCGGCTTCTCCCAGTCGGAGAAGGAGGCGAACCCGTTGCGGATCGCCGA
GACGAAGTCCATCAAGGACGAGGCCGCGAAGCTGGGCATCACCAACCTCAAGACCTCGAACGCGAACTC
ACAATTCAACAAGCAGATCGCCGACGTCGAGCAGATGATCGATGCGGGCGTGCAGCTGCTGGTGATCGC
GCCGCTCAACTCGGACGGCTGGGACTCGGTGTTCGCCAAGGCGACGGCGAAGCACATCCCGATCATCAC
GATCGACCGGAAGATCAACGCGACCGCCTGCAAGGACTACCTGACCTTCATCGGCTCCGACTTCGCCGA
GCAGGGCAAGCGGGCCGCCGACGCGCTGGCCAAGTCGCTGGGCAACAAGGGCGAGGTGGCGATCCTGCT
GGGCGCTCCCGGCAACAACGTCACCACGCTGCGGACCAGCGGCTTCAAGGACGAGATCGCCAAGGTCGC
GCCGGACATCAAGATCACGTTCGAGCAGACCGGCAACTTCTCCCGGGAGGACGGGCAGAAGGTCGCCGA
GCAGCTGCTGCAGTCCAAGCCGAACATCAACGGCATCTACGGCGAGAACGACGAGATGGCGCTCGGCGC gatcaccgcgctcaagggcgccggcaagaaggccggcgacgtcaagatcgtctcgatcgacggcaccaa gggcgcggtgcagggcatcgtggacggctgggtctccgcggtgatcgagtccaacccgcgcttcgggcc gctggccttcgacaccgcgacgaagttcttcggcggcgagccggtcggccaggacatcgtcatccagga
CCGTGCCTACGACGAGTCGAACGCCAAGACCGACATCGGCAGCGCGTACTAGAGAGCGCTCCCAATCGG gtgtccggggatgaaccgggcacccgccggcacggaggagggcggctcatgctgctggaagtctccggc
GTCTCCAAGACCTTCCCCGGCGTACGCGCCCTGGACGGGGTGTCCTTCACCCTGAACCCGGGCGAGGTG cacgcgctggtgggggagaacggcgccggcaagtcgacgttgatcaaagtgctcaccggggtctaccag
CCGGACAGTGGCGAGCTGCGCTACCGCGGCGAGCCGGCCCGGTTCGCCACCCCGCTGGACGCCCAGCGG
GCCGGTATCTCGACCATCTATCAGGAGGTCAACCTCGTCCCGCTGATGAGCGTGGCGCACAACCTGTTC
CTCGGCCGGGAGCCGCGCAACCGGTTCGGGCTGCTGGACGAGGCCCGGATGGTCGCCGAGGCCACCGAG 98 ΕΡ 1 979 375/PT atcctggccggttacggcgtacgcaccgatgtccgccgccgcctcggcaccctggccctgggcgcgcag
CAGATGGTCGCGCTCGCCCGGGCCGTCATGGTCGACGCCCGGGTCGTGGTGATGGACGAGCCCACCTCG
TCGCTGGAGCCGCGCGAGGTGGAGACCCTGTTCGGGGTGATCCGCGAGCTGCACACCGCGGGCATCGGC
ATCGTCTACGTCTCGCACCGGCTGGACGAGCTCTACCGGGTGTGCGACGCGGTCACGATCCTGCGCGAC
GGCAAGCTCGTGCACACCGGCCGGATGGCCGATCTCGACCGGCGCACGCTGGTCTCGCTGATGCTCGGC
CGCGAGTTCGGGGCGGACTTCACCAGCTTCTCCGAGTCACCGCAGAGCACCCCGGAGGGCGAGCCGGTC
CTGCGGGTGTCCGGCCTGACCAGCCGCCCCCGGCTCGACGACATCAGCTTCGACGTGCGCCCCGGCGAG
GTGGTCGGCCTGGGCGGCCTGCTCGGCGCCGGCCGCAGCGAGACGATCAAGGCGATCGGCGGGGCGTAC
CCGATCGACTCCGGCGTGATCGAGGTCGGCGGCGTCCGGCTCGGCAGGCCCAGCACGGTACGGGCGGTC
CGCGCGGGCGTGGCCACCCAGCCGGAGGACCGCAAGGCCGAGGGGATCGTCCCCGGCCTGTCGATCCGG
GACAACATCGCGCTCGCGATCCTGCCGCGGATGGCCCGTTTCGGACTGGTCAGCGACAAGCGGATCGAC
AGCATCGTCGCCACGTACATGAGCCGGCTGCGGATCAAGGCGTCCGGTCCGGACCAGGCGGTCGGCGAT
CTCTCCGGTGGCAACCAGCAGAAGGTGCTGCTCGCGCGGCTGCTCGCCACCGGCCCGAAGGTGCTGCTG ctcgacgagccgacccggggcatcgatgtcggcgccaaggccgaggtgcaggcgctgatcgacgagctg gcgaaggaggggctcggtgtcgtgctggtctcctcggacgccgaggaactggtcgagggcgcggaccgg
GTGGTGGTGCTGCGCGACGGCGCGGTCGTCGGCACCCTCACCGGCGACCGGGTGACCACCGAGGCCCTG
ATGGCCACGATCGCGGAGGCCGCGGÁTGAGCACTGAGACCCTGACCCGCCCGCGGATGACGTTCAACCC
GGCGTGGGCGGCACGCTACGGCGTCTACGCGGCGATCGTTCTGCTGATCGTCGTCAACATCGCCTTCAC gccgtacttcctgaccctgagcaatctgcggatccagctgatccaggcggcgccggtggtgatcgtcgc
GCTCGGCATGGCCCTGGTCATCGGCACCGAGGGGATCGACCTCTCGGTGGGTTCGGTCATGGCGCTCGC
CGCGGCCTTCATACCCCTCTATCTGGGGTACGGCGTGACAGCCGCGATCCTCGTCTCGCTCCTCGCGGG
TGTGGCGGTCGGGCTGATCAACGGTGTCCTGGTCGCGAAGGCCGGCCTGCAGCCGATCGTGGCGACGCT
GGCCCTGTTCGTCGGCGGTCGCGGGCTGGCCGTGGTGATCTCCGGTGGACAGCTCAAGGACGTGCGCAA
CGCCGACCTGCTCTACCTGGGCTCCGGTGACCTGCTCGGCGTGCCGGTCCTGGTCTGGATCGCGGCGCT
GCTGGTGCTCGTGGTGGCGTTCGTGGTCCGGCGTACCGTCTTCGGCCGGCGCCTGCTGGCCGTCGGCGG
CAACCGGCCCGCCGCCGAGCTCGCCGGCCTCCCGGTCAAGCGGGTGCTGATCGGCGTCTACGTCTTCTG
CGCGGTGCTCGCCTCGATCGCCGGCCTGCTCTCGGTCGCGCGCATCCAGTCCAGCGACGCGTCCGCGGT
CGGCCTGCTGATCGAGCTCTCCGCGATCACCGCGGTGGTCGTCGGCGGCACCCCGCTCACCGGCGGCCG
GGTCCGGGTGCTCGGCACCGTGGCCGGGGCCCTGCTCATGCAACTGGTGGTCGCCACCATGATCAAACA
CGATCTCCCGCCGTCCACCACCGAGATGGTGCAGGCCGTGATCATCCTGGTCGCGGTCTACGTGGCCCG
GGAGAGGAGGACCCGGTGACCATGTCGATCCCCGTGCCCGCTTTCCGGAACGGCGGCTTCGTGCAGCGC
CAGGGCGCGCTCGCGGTGCTGGTCACCGTGGTGGCGATCAGCCTGGCCGCGTTCCCCGGCTTCCGCAGC
GCGGACAACGCCGGCACGATCCTGGTCGCCGCGGCGCCACCGATGCTGATCGCGCTCGGCATGACCTTC
GTGATCATCACGGGCGGGATCGACCTCTCGGTCGGCTCGCTCTACGTGCTCGGCGGGGTGGTCGCCGCC
TGGGCGTCGCAGTGGGGAGTCGTCGCGGCGCTGGCCGCGCCGTTGCTCCTGTGCGGGGCCATCGGCGTA
CTGAACGGGATCCTGATCTCGAGAACCGGGATGGCGCCCTTCATCGTCACCCTCGCCGCGCTGCTCGGC gcccgtggcctcatgcgcagcatcagcgatgagggctcgacgacgtacctggtcaggagcgacgtcttc cacgagctgggcacgggatccctgctcggcgxcggtctgccggtctggctggccgcggttctggtcggc
GCCGGGATCCTGGTGCTGAACCGGACCCGGTTCGGGCACGCCGTGCACGCCATCGGCGGGAGCGAGGAC
GCCGCCGCGCTGATGGGGCTGCCCGTACGGCGAATAAAGGTCTGGGTCTATCTCCTCTCCGGGCTGCTC
GCGGGACTCGCCGGTGCGATCAACGCGGCCAAGCTCGGCTCCGGGGTCACCGTGCTCGGCAGTGGCATG
GAGCTCGACGCCATCGCCGCCGTCGTGATCGGTGGCACGCTGCTCACCGGCGGCTCCGGGTCGATCGCC
GGCACGGTCGCGGGGGTGCTGCTGCTCGGCGTGATCCAGAACCTGATCAACCAGGTCGGCAACGTCAAC
AGCAACTGGCAGCAGGTGATCAGCGGTGGGTTCCTCGCCGCTGTGGTCGTGGCGCAGACAACTCTCGTA
CGCGCAAGAAGATCTTGACGTGGAGGCCCGCCCGGGGACCCTGCCGCGGGCGGGCAGGCGTAGGTTGCC
CGCATGACGGAGCATCGGGTCTCCCCGGCCGGGCGGGCGCTCGCGTGGCTGATGCTGGTCTCCGGGTTC gccgcggtcgtcgggtcgttcctgccgtgggcctgggtcgacttcccggagcagggcagcagccaggtg tccgggagcctcgtgtccgacctgttcaccgcgttcttcggggtcgtgctcgccgggtacgcggtgccc gccgtgcgcggcgagcgcctgcccggcctcgagacgttcttctcggtcggcgccgggctggtgctgttc acgctcggggcctgggacagccggcacctgacctcgatgaccgccgccctggtcgcggccgacaccggc acgaccatcgggcccggtctctggctgtgcatgatcggcggcctgctgggcgcgctcgcggcggcggcc ctcgccgtccggggacgccggccggtcgtcagctcccgggtgtgaccacccagtccgggtggttcggca tcggaggggtcgtgacgccgaggagccaggaggtcaggaacggccgcagatcctggcgggcgacccgcg aggcgagcgtgatgaagtcaccggtcgaggcggagcggccgcggtacgtcgtcagccaggcgcgttcga cccgctggaacgtcgccgcgccgatcttctgccggagcgcgtagaggaccagcgcgccgccggcgtaga cgttcgggttgaagacgtcccacgtggtcgccgcgtcgagcggggcggcgaccggaccgtacctggcgc 99
ΕΡ 1 979 375/PT
GGAAGATGTCGCCGGCGGCGTAGACGGCCTTGAAGAACGCCTCGCGGTCGGCCAGGCCGGTGTACTGCG
GGAACCCGCCGGTCTCCTCCGACCAGAGCATCTCGTACCAGGTGGCGTGGCCCTCGTTGAGCCAGACGT
CGCTCCACGAGAACGGCGAGACGCTGTCGCCGAACCACTGGTGGGCCAGCTCGTGGGTCATCGACGGGC
CGCGGGTGGTCTCGGGGCCGGTGAACAGGGCGGCGCCGTACAGCGAAAGGGTCTGGGTCTCCAGGGCGT
AGCCCAGGTCGTCGTCGATCACCAGGGAGCCGTAGTCCTCGAACGGATAGGGCCCGGCCTGCTTCTCCA tccaggcgagctgctcgcgttccccggcgatcgcgggcagcagcgtgccggcgaggcgtcgcggcacca
CGTCGCGGATCGGGGTGCCGCCGGCCGCCGGGCGGCGCTCGACCACGAAGTCGCCGACGGCCGTCTGCA
CCAGCTCGGTGGCCATCGGGGCGGACTCGCGGTAGACCGAGCTGACGTGGCCGTCGTGCTCGGTCGTGC
TCACCAGCGTGCCGTTGGCCGTCCCGGTCCAGCCGGCCGGCACGGTGAGCGTGATCGTGAAGGTCGCCT
TGTCCCGTGGATGGTCGTrGCCGGGGAACAGCAGGTGCGCCGAGCCGGGCTGGGCAGCGAGCACCGTCC
CGTCCGGCGTCGCCACGAGAGCGGCCGGGGCGGCGGTGAAGTTCGCGACCGTGACCCGGAACAGCCGCC
CCCGGGGAAGGGGGCGCCGCGGGATGACGGTCAGCTCGTCGCCGTCCCGGGCGGCCCGCGCGGGCTGCC
CGTCGACCGAGACGCGCCCGATCGAGGCGCCGCCGAAGTCGAGGTCGAAGCGGGACAGGCTCTGCCCGG
CGACGGCGGTGATCGTCACATCGCCGGATACGACCTGCTTCGGGTCCTTCTCCGGGTAGCGCAGGCGGA
GGTCGTAGTCGAGCACGTCGTAGCCGCCGTTGCCGAGCAGCGGGTAGAGGCGGTCGCCGAGGCCGGCGG
ACCCGGGTGACGGCGAGGGCCCGGCCTGCGCCGGTGCGGCGGCTGCGGCCAGGGCGAGGACGACGGTGG
CGCCGACGGTGAGGACGCGGGTGCCCGCGGACGTTCGCATGGCTTCCGACGCTAGGCGACACCACCGGA
AGCCATCGACCCATGGGCATGTATGAAATCCCACAATCTCCGATGTGGACGGACGGATGGTGCGCAGTA
TGCAACTTGCAGATTTCGGGACATTCCCTAGCCCGGCGGTTGCCGTGTGCACCCGTTCGACCACTGTCC
GGAACCGCGTGGTGAGCAGGGTGAACGTTCATGCGGCCCGGGCCGCCGGAGGTCCCGTGACCGTTCGCA
TTGCCGTGCGCCGGTGAATCACTCCGCTTTACGACTTCGCGACAAGTGGTTAATGTCGGCGAAGCGATA
TATCGTCCAGTTATTCGGGGGACTGCGGTGCATGAGCAAAAAATCACTCCGGCGATTGCCAGCGGATCA
CCGCAAATTGAATTGCTGCCCGTCAATTCCCTGCGAGTGATGGATTCGCCGCGACTGAACGGTGAGGAC
CCGCGGCACACCGAGGTGCTCGCCGGCTTCGGGGCGGAGCTCCCGCCGATCGTCGTGCACCGGGCGACC
ATGCGGGTCATCGACGGCGCGCACCGGCTGAGCGCGGCCCGGCTGCGCGGCGACGACCGGATCAGGGCG
GTGCTGTTCGACGGCACCGAGCAGGAGGCCTACGTGCTGAGCGTCAAGGCCAACGTGACGCACGGGCTG
CCGCTGTCCGCCGCCGAGCGCACCCGTGCGGCGGAGCGCATCATCACGATGCATCCTGACTGGTCGGAC
CGGATGATCGCGGCGTCCAGCGGGCTGGGCGCGCGGACCGTCGGCGGCCTCCGCCGGCGGCGCGCGGCC
TCCGGCGAGAGCCCGGCGGGCCTCCGCTCGCGCGCCGGCCGGGACAGCCGCGTCCGGCCGGCCGGCAGC
ACCGCGGGCCGGCTGAAAGCGGTCGACTACCTCCAGGACCGGCCGGACGCCTCACTGCGGGAGATCGCC
CGGCACGCCGGCGTCTCTCCGrCGACCGCCCGTGACGTCCGGGACCGGCTGCACCGCGGCGAGGACCCG
ATCCCCGCCACGCAACGCGCGGCGGCACGCCCCGGAAACGATTCCCCGCCGCTGCGGTCGCTGGTCCAG
GGCTTGGCGAGCGACCCGTCGTTGCGATTCAGCGAGTCCGGGCGCGATCTGCTGCGCTGGTTGATTGCC
CACGCCGTTCAGGACGGCGAATGGAAAGGGCTGGTCGACACTATTCCGGCGCATTCCGCGCAGGCGCTG
GCGAAAATCGCGCGCCATTGTTCGCGGGAATGGCGTGAGTTCGCGGACATCCTGGAGAAGGACGCCGCG
TAGGCCACCGGCATTTCTTCCGGCACCCGGTCCGCCCTCCGTCACGCACAGGTCAGAGTACTGATGGCG
GCTGTCAACCCGCCGATCTGCGGGTAGGTGCCGACGTCCTTCCGCCGACCGTCTGCCGAACGCATCCGG
TCGGTGCCCGATGTGCGGGTAGGCATTCACCGATCAGGGTTGCTCCAATGTCTCTCGTCGATACCGCGG
CTGATACCTCCGCGGTACTCGGCAGAACACTCCGTGGCTATGGCGCCGTGGTCCCGGAGCCTTTCCTGA
AGTACTTCGGACGTACCTGTCCGGAGTCCCCCACAGAAGGAGACATCATGTCGGCCATCACCGTGGAAA
CCACCTGGAAGAACACCGACCTCCGGGAGGACCTCACCGCTCACCCGGCCGGCCTCGGCTTCGGCGAGC
TGAGCTTCGAGGACCTGCGTGAGGACCGCACCATCTACGCGGCCAGCAGCGGCTGGGTCTGCACCCTGA
CCATCGAGTGCGGCACGCTCGTCTGCGCCTGCTGACCAACGGTCATCGCACTGCCGGGACCGGGGCTGA
CCCCGGTCCCGGCACCCTCTCCCCGGCAGGAGCCTGCATGTCATCCTTTGCGATCGCCGCTTCGCCGGC
CAGCGCGTACCTGCACGAGCGCTCCGCCGGCCCCGGCGGCGACCCCGTGGCGGAGCACGAGCGGGTCGA
GTCGTGGCGCGAGTCCGCGTTCCTGGACGACCCGGTCCTGGACATCCGCCTGCGCGAGCTCGGACTCAG
CCGGGCCGAGTTCGGCCGGCTGCTGACCGACGGCGCGTACGACGCCGGGAGCACGGCCCTCGACTGGGC
CGGCGAGCTGGCCGCCGTGCTGGCGACCGGGACCGGCGCGGTCACCGGACTCGCCCGGTCGACCAAGCT
GTGGGCGCAGGGCTTCGACCGGCTGCCGTTCGCCGGGCTGATCGAGAGGTTCCTCGCGTACTACGAGCC
GCGGGTGCCGCGCACCGCCGGGACCGTCCGGGTGTCCCTGCTGGAGAGCCTCGCGAACCGCCTGCTCAC
GGTCGCGACCCGGACCCTGCTGCTGGAACTGAACGTGGCCCGGGTGCACGGCCGCCTGACCGGCGCCAC
CCCCGGGGAACGCTACGACCACTACGACCGGGTCCTGCTGACCGACCCGGACTACCTGCGCTCGCTCTT
CGGCGAGTACCCGGTGCTCGGCCGGGCCATGGTCGAGTGCGGCCGCCGCTGGGCGTCGGCGATGGCCGA
GCTGTTCCAGCGCCTGGACGCCGACCGTCCCGCCCTGCACGCCGCCGGGCTGCTGCCGGCCGGCGCGGG
CGAGGTCACCGCGCTCCGGCCCGACCTCGGAGACCCGCACAACAGCGGCCGCGCGGTCGCGATCCTGAC
CTTCCGGTCCGGTGCCCAGCTGGTGTACAAGCCCCGGCCGGTCGGGCCGGAGCGCGCGTACGCCGAGAC 100 ΕΡ 1 979 375/PT cgccgcggccctgaaccggcacggcctgagcctgccgctgaccgccgtggacgtgctcgaccgcggcgc
CTACGGCTGGTGCGAGCTGGTCCGGCACGAGCCGTGCGCCGACCGCGCCGACCTGGACCGCTTCTACCG
GCGTACCGGCGCGGTCCTGGCCACCACTCTGCTGCTCGGCGCCGTCGACGTGCACATGGAGAACGTCAT
CGCGGCCGGCTCGTCCTGCATGCCCATCGACCTGGAGACGCTGCTGCAGCCCGGGGTCCCGTCCGGTGA
CGCGACGGACGCCTACACCCGGGCGCTCGACCTGCTCAACCAGAGCGTGCTGGCGATCGGGATCCTGCC
CGCCCGGGCGTTCGGCGGCCGGGAGCGCAAGAGCGTCGACGTCAGCGCGATCGGCGGCGGCGAGGCACA gaccgcgccccggccggtgccgatggtcgtggagccgttcaccgacgtggcccggatcgaggcggtgga agcgaccatgctgggcgcgcagaaccggccggtgctggtcggcgccgaggtgcggcccgaggagcacac cgaggcggtggtggccggcttcaccgaggcgtacgacctgatcgtccggcaccgcgaggacttcgccga cctgctggccggcttcggtgacgtcgaggtgcgctacctgccccgcccgacccgccggtacagcatgtt cctgaccgagagctaccacccggactacctgcgcgacgcgcgtgaccgcgaccggctgctcgacaagct gtggaccgccgcgggcgcccgtcccgacctgatccccatcatcgagtcggagaagcgccagctgctggc
CGGCGACATCCCGTGCTTCCGCGCGCTGGCCGGCGACCGGGCGATCCGCACCGCGTCCGCCCCGGTGGC gccggacttcttcgacgcccccggcatcgaggtgctggccggccgcctgcggcagttcgggccggtgca ccgggctgcccagctgcggatcatccgcgagtcgatgggaaccatgcccgcgcccggcccgatcgccgg gacacccgcgccatcctccgagcggcgtggcggcctcgacccccgtgaggccgccacgctcggggaccg gctcgtgcgggagctcgcggacgaggcgatcctcggggccgacgacgccggctggatcggagtcagcat cgagggcctcgaccaggagacgttcagctacaagccgatggcgaccgggctgtacgacggcatcgcggg aatggcgctgacgtacgcgtacgccgcccgcacgctcggcgacgagcgctacctcgacctgacccgccg taccgtcaagctggtctccggctatctgcggtacctcgccgagcaccggatcgtggagacggtcggggc
GTACAGCGGGATGGCCGGCCTGCTCTACACGCTGGATCACGTCGCCCATGCCACCGGCGACGCGTCGCT gctgggcgagatcgaggccgcgctgccctggctgcgggagtgcgctacccgcgaggagtgcccggacct
GATCGCCGGCCTGGCCGGTTGCGCCGTCGTCGCGCTGTCGCTGTACCGGCGGCACGGCATCGCCGGTTA
CCGCGAGGTCGCGGAGATCTGCGGCCGGCGACTGGCCGGCACCGCGGTCGACGTCGAGGGCGCCGCGGG
CTGGGCCGCGACCCGGACCGGCGTGATCCTCGGCGGTTTCTCGCACGGCTCGGCCGGGATCGCCTGGGC
CCTGCACGAGCTCGCCGCCGAGTTCGGTGACCGGGACCTGCGCGAGCTGGCCGACCGGGCGGTCGAGTT
CGACCGGCGGCTGTACGTTCCGGCCGCCGGCGCCTGGCGCGACCTGCGGCCCGAGATGGCCGGCACCGA
CGGTTACCCGGCGCTCTGGTGTCACGGCGCCGCCGGCATCGGCCTGTCCCGGCTGCTGATCCACCGGAT
CCGGCCGGACGAGCGGCTCGCCGAGGAGGCCCGCGCCGCGGTGGCGCTGGTCCGGCGGCACGGCTTCGG
CCACAATCACAGCCTCTGCCACGGCGACTTCGGCGCGCTGGCCCTGCTCGGCCTGGCCGACCGCGCGTG
GCCCGGGTCGGGCGGCCACGACGAGCGTGCCGGCGCGGTCGTGCGGGACATCGGCGAGACCGGTCTGCG
CTGCGGGCTGGGCAACGGCATCCGGATGCCGGGTCTGATGCTCGGCGCCGCGGGCGCCGGACTGAGCCT
GCTCCGGCTGGCCGCGCCCGCCGACGTGCCCGCGGTCACCTGGCTGGAACCGCCGCGGGGCACGCATGT
CTGAGACGGCCGGGCTGCTGCGGCGGAGCCTGCTCGATCACCGGGGCAAGCTCGCCGCCGTGGCCGGTC
TCGCCGTCGCCGGGGTCGGCTGCCAGCTGGGCCAGCCGTTCCTCATCCGGCGCGTGCTCACGGCGGTGC
AGTCCGCACAGCCGTACCGCCAATTGGCTCTCGCCGTTCTGGCGGTCATGGTCGTCGGCGCGGCGCTGG
GCGCCGTCCAGCAGTTCCTGCTGCAGCGCACCGGGGAGGCGATGGTCTTCACGGTGCGCCGCACGCTCG
TCGCGCACCTGCTGCGGCTGCCGGTCGCGGCCTACGACGAGCGGCAGTCCGGCGATCTGGTGTCCCGGG tcggcgccgacaccgcccaggtgcgctcggtgatcacgtccggggtggtcgacctggccgggggcgtcc tgctcgtcggcggctcgatcgccggcatgatcatcattgatccggtcctgctcggcgtcagcctggcgc cggtgctgtgcggcgccgccggggtccggctggtcggccgtcggctgcgcccgctcagctcggcggtcc aggagtcgatcggcgcgctcaccgcctcgaccacccgggccctcggcgcgatccgcacgatccgggtcg
CCGGCGCCACCGAGCGCGAGACCGCCCTGATCGTCGCCGAGGCCGACCGCGCCCGGGCGGCGGGCGTCC
GGCTCGCCCTGGTCGCGGCCCAGGCCGGCCCGATCGTCCGGCTCGCCCTGCAGGGCGCGTTCGTCGCGG
TGATCGGCTTCGGCGGCTACCGGGTCGCGAACGGCGCGGTGTCGGTCGGCGACCTGGTCGCGTTCACGC
TGCTGCTGTTCACGCTGGCGCTGCCCCTGGCCCAGCTCGCCGAGGCGGCCACCCGGATCCAGACCGGGC
TGGGCGCGCTGACCCGGATCGAGGAGATCCTGGCCCTGCCGGACGAGGACAGCGCGCTCGGCGTCCGTG
CGAGGACGCCCGCCACGGTCCGGCACGATCCGGTGCTGCTGGAGTTCGATCACGTGTCGTTCCGCTATC
CCACCGGCGGGGAGATCCTGCGCGACGTCAGCTTCCGGGTGCCGGCCGGCAGCACCACCGCGCTCGTCG
GGCCGTCCGGGGCCGGCAAGTCGACGATCCTGGCACTGATCGCCCGGCTCTACGAGGTCCACGGTGGCC
GGATCCTGCTGCACGGCCGCGACATCCGCGACTACCCGCTCGCCGAGCTGCGGGCCGCCCTCGGCTACG
TCGAGCAGGAGGCCCCGGTGCTGGCCGGCACCGTCCGGGACAACCTGACACTGGCCGCGCCGGACGTCG
CGGAACACGCGATCCGCCACGTCACCGCATCGGTCAACCTCGACGACCTGCTCGCCCGTGACCCGGCCG gcctggacgcgccggtcggggacggcggcgtgctgttctccggcggtgaacggcaacggctcgccgtcg
CCCGGACCCTGCTCGCCCCGGGCGAACTGCTGCTCTTCGACGAGCCGACCGCCCACCTGGACGCCCGCA
ACGAGCAGGCGCTGCAGCACGGCCTGACCGCGCACGCCGCCGGCCGGACGCTGGTGGTGGTCGCGCACC 101
ΕΡ 1 979 375/PT
GCCTGGCGACCGTCGCGCACGCCGACCAGATCCTGGTGATCGACGACGGTCGTTCGGTCGCCGCCGGGC
GGCACGAGGAGCTGCTCGTCCGCGACCCGACCTACCGCGAGTTCGCCACCCGTCAACTGCTGACCTGAA
TCCCGAGGTGTACGCCATGCTCAGTGTCCTGGACCAGGTGCCCGTGTTCCGTGGCGACGACCCCGCCGA
GGCGGTCCGCGAGGCCGTCGGGCTCGCCCGGGCCGCCGAGTCGCTCGGCTATCACCGGTTCTGGATCGC
CGAGCATCACGGCAGCGCCGCCAACGCGTGCGCGGCGCCGGAGATCGTGGCGGCGGCCGTCGCCGGAGC
CACCGAACGGATCCGGGTGGGCACCGGGGGAGTGCTGCTGCCGTACTACAGCCCGCTCAAGGTGGCGGA
GGCCTTCCGGGTGCTGGCGGCGCTGTATCCGGGGCGGATCGACCTCGGGTTCGGGCGGGGCAGGGGCGG
GCCGGCGGTGATGGCCGAGCTGCTCAACCCGTACGCGATCGCGACCGAGGAGGCGTACGCCGAGCAGGT
CGGCCGGCTTCXCGCGTTCCTGGGCGACGCGCGGACCGTCAGCCGGGTGTCGGTCACGCCGGCGGTGCA
GGACCCGCCGTTGCCGTGGCTGCTCGGCTCCGGCGTCGGCAGCGCCCGCCTCGCCGGGAIGCTCGGCGT
GCCGTICTGCTTCGCGCAGTTCATCGCGACCGAGGAGTGCCCGGAGGCGATCGCGGCGTACCAGGAGTC
GTTCCGGAGCTCGCCGTGGCTGGACGAGCCGCAGGCGATGCTGGCGTTGCGGGTGCTCGCGGCCGGCAC
CGCCGAGGACGCCGAGGAGCTGGCCACCGGCTTCTGGATGTCGTGCACCACCGGATGGCGGGCCCAGGT
CCGGCCGGACGACGACTACCGGGGTGGCGTGCCGAACCTGGCGGACGCCCAGCGGTACACGCTGACCGA
GGAGGACCTGGCGATGCGCGCGAGCCGGCCGTACCTGCAGATCTCCGGCACGGCGGAGACGGTCGGCGA
GGAGATCCGGCGACTGCGCAAGGTGTACGACGTGGCCGAGGTCATGCTCACCACGAACTGTCCCGGGGC
GGCCGCCCCGGCGCCGGTCCTACGAGCTGCTGGCCGCCGAGCTCGGGCTGACCGCGCCGGCGTGACCCG
GGTCAGGCCAGCTCGTCGGTGGTGAGGCCGGCGGCGTACGCCAGCACGGCGGCCTGCACCCGGTTGGCC
ACACCGAGCTTGCGCAGGATGACGCTGACGTACTCCTTGACCGTGGAGTCGCTGATGAACAGGCGCCCG
GCGATCTCCGCGTTGGTCAGCCCCTGCCCGATCAACCCCAGAACGGCCTGTTCCCGGTCGGAGAGCTGT
TTGACCTCGTCGACCGCGTTCTCGGCGGCCGGAGTGCCCCGGCAGGCCGCGCCCAGCATGATCGACGAG
GCCTCCGGCGCCAGCACGGTCACCCCGGACGCCAGCGCGCGGACCGCCGCGACCAGTTGCTCCGGCTGA
CTGTCCTTGAGCAGGAAGCCGCAGGCGCCACCGCGCAGCGACTCCAGCACGGTGCTGGACGCCGCCAGC
GTGGCCAGCACCGCCAGCGCCGGCCCGGACTCCAGGrCGCGCAGCCGGGTCAGCAGCGGCACGCTCTCC
GGCAGGGrCGCGTGCGCGTCCAGCAGGACGACCGCGGGCCGGTGCTCGCTGACCGCGGCGAGCGCGCTG
TCGCGGTCAGCGGCGACGACGGAGAAGCCACCCATCGTCTCCAGGATCATCTTGATGCCGATCGAGACC
AGGGCCTCCTCGGCCACCACCAGTACGTCCGCCATGCCTCCCCCGGGCAATGTAGCCGTACGAGATTTG
ATAGTGCACAAAAACCATCGAATTACTGCTCTTTCGAATCATACATGTATTTATGCAAATTTCTGGTCA
GGAAACGGGGACGATCCGAGACGCCCGGGCCGGCGTCTCGGATCGTCCTTCACCGCGCACGGCTATCGC
ACGAGCCCTTCCGCGGGGGCGATCCGCGTGGCTCGCCGAGCCGGCGCCAGGCTGGCCAGCACACCGGTG
ACCGCGGCGGCCACCAGCACGAGACCCAGCTGCGGCCACGCCAGCATGATCACCGGTTCGGCCTGCCGG
CCCACGGCCGCGATCACGCCGACCAGCCCGACCGGCACCCCGATGACGATGCCGGCCACCGTGCCGACC
AGCGTGATCGTGACCGCCTCGACGGCGACCATCGCGCGCAGCCGGCTCCGGCGGGTGCCGAGCGCCCGC
AGCAGGGCCATCTCCCGGGTTCGTTCGATCACCGAGAGGCCGAGCAGGTTGGCGATGCCGAGCAGCGCG
ATCACCACGGTGACCGCCAGCATGCCCAGCGACAGTCCGAGCAGGATGGACAGGACGTTCATGATGTCG
CCGCCCTCGGTGACACCGCCGCCGACCTCCACACCGGCGTCGCGTGCCGCCACCGCGTTGACGTCGGCG
GCCAGCGTCTCCCGGTCGAAGCCGCCCGGCGCGGTGCCCCAGACCGTGGTCGGCACGGTCCGGACCCCG
GCGGCGGTCAGGACGTCACCGGTGGTGACGCCGAGCAGCTGCCCGGTCGTGTCGGCCAGCCGCGAGCCC
CGGGCGGTGAACCGCAGGTCCCGCCCGCCGGCCGTGACCGTGAGCGGAGCACCGTCCGTCAGCCCGCGC
GCCGTCAGGTAGGAGGCCGGCACCAGCAGCACCGGGTCCCCGGTGGACGCGCTCAGCTCCGGCGCGAGG
CGCCCGGCCACGTCGGTGGGGAGCGCCGCGATCCGGGCCGGCGTGGGTTTGCCCGCGGCCGGGAACGTC
GCCGCGCTCGTCGCCACGGTGGCCGTGGTCAGCCCGGTGATCCCGGACAGCGCCCGGACCGTGCGGTCG
TCGATCGCCGCGCCGTCGGTGTGCACGCTGACCGCCACCGGATAGCGCGCCTCCAGGTCGGCCTCCACC
GTGGCCCGCCCGCTCGCCGAGGCCACGGCCAGGCCGGTGATCAGCGCGGCCCCGACGACCACGGCCATC
GTCGCCGACGCCGTCCGGCGCGCGTTCTGCCGGAGGTTGCTGCCGGCCAGGCTCGCCGCCACCCCGAAC
CGTTCCAGGCCGCGCGCCGCCGGCGGCAACAGCAGGGCGATGCCCAGCGGCAGCGCGGTCAGCAGCCCG
GCGGCGAGCAGCACCCCGCCGACCAGCGCGAGCGGCAGGGAGGTGCCGATCGCGGCGAGACCCAGCACG
CCCACGGCCAGGCCGATCAGGATCAGCCCGGCGACCAGGCGGCGCCCGCCGCGGACCTGTGCGGGAAGA
GCGTCCGGCACCTCCTGCAGCGCGCGCACCGGGGGAACCCGGGTCGCACGGCGGGCCGGCGCCCAGGCC
GCGACGACCGTGGCGCCCACCCCGGTGAGCACACACAGCGCCAGCACGATCGGGTTGACCGCCAGGCCG
CCGCCGTTGATGTCGAGCAGGCCGGCCCCGAGATAGCCGAGCCCGACACCGGCGACCGCGCCGATCACC
GCGCCGATGCTCCCGGCGATCGCCGCCTCCGCCAGCACCACCCGGCTCACCTGGCGGCGGTGCCCGCCG
ACCAGCCGCAGCAACGCGACCTGGCGGACCCGCTGGGAGACGATCACCTGGAAGGTGTTCGCGATGACC
AGGATCGACGCGAGCAGCGCCACCGCGGCGAACGCCAGCATCAGCACGACCAGCTGGGTGTTGCCACCG
GCGAACCGGCCGGCGGCCGCGTCGGCGGCCGCCGACGCGTCGGTCGCGGTCGCCCCCGGCGGCAGGGCC
CGGCCGACCGCGTCGACGGTCTCGGCCAGCCGGTCCCGGTCCGTGACGGTGAGCAGCGCGGCCGGCGGC 102 ΕΡ 1 979 375/PT gtgtccccggcgaagaacgacgcggcggcgtagaaccggtagtccgagccggtcagcgggcggaagccg agatcggccgagccgaccacggtcaccggcaccggggcggccgtgccctgccggaagtcgaggtgggcg
CCGACCCCGACGCCGAGGTCGGTGAGGGTCCGCCGGTCGGCGACGACCTGCCCGGCCGCGCTCGGCCAG
GTGCCCTCGTCGACGGTGAACCAGCGCACCGACGCGGTCGCCGGGATGCTCTGCACGTTGGCCGAGCCG
CGCCGGTCGCCGCCGAAGACGCTGACCGTCCGTGCGTACTGCGGGTCGACGCTCCGCACGCCCCGCACC
CCGGCGGCCGCCTGGTACCACTGCGGGTCGTGCACCGTGTCGTCGGCGTCGAGCACGATGTCCGCCGTG
GTCAACGGGGCCGCGGCGGTGAGCCGCAGACCCTCGTCCGAGGTGCTCGCGAACGTGGCCGTGGCGGCC aggaagccggtggccagcacgaccgcggcgacgatcgcgagcagccggccggggtgcgaccggacctgc gaccaggccagcgtgaagatcatgacgtcaccgtcaccgacgccatgaccgacatgatcgactccagtg tgggcgctcggagctcgtcccagagccgcccgtcggccatgatcaagacccgatcggcgtacgtcgcgg cggcagcgtcatgcgtcaccatgatgatcgtctggctggcctgccgggcggcgttctgcagcccggcga gcagcgcccggccggtggcgatgtccagcgcgccggtcggctcgtcggcgaacaccaccgacggctcgg tgagcagcgcgcgtgccaccgcgacccgctgctgctggccaccggacagctcggcgggccgatggccga gccggtcgccgatctgcagcgacgcggcgatgcgctgcagccggtcgcggtccaccggacggccggcca gccgcagcggcagcacgatgttctgctcggcggtcagcgtgggcagcaggttgaacgcctggaagatga agccgacccggtcccggcgcaggtcggtgagcgcgcggtcgtccagcccggcgagcgcggtgccggcca ggctgacctcgccctcggtcggtgtgtccagcccggcgagcaggtgcatcagcgtggtcttgccggagc cggaggggcccatgatcgcggtgaactcgccggccgcgaaggaggtcgacaccccgtcgacggcgacca ccgcggcgtccccggttccgtaccgtttacgcaggttgcggcaactgaccatggagctgctcttcgtct gcatcatcacggttgcgacgttagggaagtggcgggccgcccacatccgtccggggcatcgccgcgacc gataccaaggtatcgacctggcgtgcggatggtgccgcgagcgctcgcggtccctactctgagagcgtg ggaagctgggacaggagaacgctgacggtcgatacggtgatcgccggcgccgcggtcatggtgtgcctg ctgctcgggttggccggtctggacgagtggtactggtcggccgcgctctgcgtccccctggtgatccgg cgctcggctccggtggtcttcctcgcgctggtogcggtgctctccggcatccacatgatctactccggc agcttcgcgttccccggtgacctggtcgatctggtcgccgtgcacgccgtcgccggttacggcccggcc cgggtccggcacctgggcctgctgctcggcgtggccggcagcctggtggtgaccgcccgggcgctgcac
GACGGGCTGCCGTCGTCCGCGACGCTGCCCGCCGCGCTGATCGTCGCCGCGACCCTGGCCGCCTGGTCG
ACCGGCCTGATGCAACGCCGGCAGCGGGCCGACGTGATCGAGGCCGATCACCGCCGCCGGCTCGCCGAG
CAGGACAGCGCGATGCGTGCCCGGCTCGCGGCGATCGAGGAGCGCACCCGGATCAGTCAGGAGATGCAC
GACATCATCGCCCACTCGCTGGCCTCGGTGATCGCCCAGGCCGAGGGCGGCCGGGTCGCCGCGCGCGCC
GACGCGGTCGTCGCCGGCCCGCTGTTCGACCGCATCGCGCAGATCGGCCGGGAGGCCCTCAACGACGTG
AAGCGGCTGCTGAACTCGATCGACGGCGACACGCCGGACGACTTCGCGCAGGGCCTGCCCGACCTGCCG
GGCCTGCTGGCCGGGGTCTCCGCCGCCGGCCTCGACGTGACGTTCGAGGTGGCCGGCCCGGAGCAGCCG
CTCGCGTCCGGCATGGACCTGGCGGTGTACCGGGTGATCCAGGAGTCACTGACCAACGTGCTCAAACAC
GCCACGCAGCGGCAGGCCCGGCTCAGCCTGGTGTGGACGCCGGCGTGGCTCGAGGTCAGCGTGACCAGC
CCGCTGACCTTCGCCGGCGCGCTCCGCGAGGGTCGCGGGCTGTCCGGCATCCGGCAGCGGTGCTCGTTG
TTCAACGGCGACTGCGAGATCGTGGCCGGGCAGACCTTCAGCGTGATCACCCGCTGGCCGCTCGCCCGT
CCGGAGGTTGCCGTCCCATGACCGAGCCGCAGATCGACGTGGTGATCGCCGACGATCAGGACCTCGTCC
GGACGGGCTTCGCCCTGGTCGTCGACTCGGCCCCGGACATGCGGGTGGTCGCGACCGCGGCGGACGGCG
CCGAGGTGGTGCGGCTGGCCGCGGAGTTCCGCCCCGACGTGGTGCTGATGGACATCCGGATGCCCCGGG
TCGACGGCATCACCGCGGCCCGGGCGATCCTGGAGGGCAACGCTCAGCCGCCGAAGATCGTCGCGCTGA
CCACCTACGACAACGATGAGTACGCCAGCCGGATCCTGGCCGCCGGCGCCAGTGGGTACCTGTTGAAGG
ACACCACCGCCGAGGGCCTGACCGCGGCGATCCGGACGGTGCACCGCGGCGGCTCGGTGCTGGCCCCGT
CCACCACCCACCGCCTGGTGACCGCGCACCGTCAGCATCCGGCACGCCCGTCCGCGCTGCTGGATTCCT
TCACCACCCGGGAGCGCGAGGTCTTCGACCTGATCGTGGCCGGCGCCAGCAACGCGGAGATCGCCGACC
GCCTGAACCTGGCGGAGGTCACGATCAAGACCCACGTCGGCCGGGTGCTGGCCAAGATCGGCGTCCGCG
ACCGGGTGAACGTCGTGATCTGGGCCTACCGGAACGGCGCCGGGCCGAGCTGAGCAGGGGCCAGGCCGC gctcgcactcggccgaatcccgaaaagcggctaggggaagcggatctcggcggccagcggcaggtggtc actgccggtccgggggagggccgtcagccgcgtgaccgtcatcgatcgcgccagcacctggtcgatccg ggcgaccggcgtccgcgccggccaggtgaacgcgaagtccgcgggcgaatcgatcatcacttgccggat cggccgcagcccgcggtcgtccaccgacgtgttcaggtccccgatcacgaccagccgcggàaccgggtc
GGCGGCGAGCAGCGCGCCGAGCTTCCGGGCGCTCTCGTCCCGCCGTGCCGAGGTGAGTCCCGCCGCGGT gacccgcaccgacggcagatgcgcgacgtacaccgcggtgtccccgcccggcgtccgggccaccgcccg cagcccccggttccagtcctcgcccaggtcatgcggccggatgtcgatcgcctccgcgccggtcagcgg atagcgcgaccacagcgccacggtcccctgcacggtgtggaacggaagctccgcgtcgagcacaccccg gtaggcggccaccgcctccggcagcacctcctccagcccgaccaggtccggatgtgccgcgagcagcgc 103 ΕΡ 1 979 375/PT ccgggcggtccccgccgggtccgggttctcgtcgctcacgttgtgctgcacgacgatcagatccggcgt
GCCGGTGTCCCGGTCGACCACGTAGCCGCCGAAATGGATCAGCCACGCGCCCAGCGGCAGCAGCACCGC
GGCGAGGCCGGTCAGCGATCGCCGCATCAGCGCCAGCAGGAGCAGGACCGGCACGGCCAGCCCGAACCA
CGGCAAAAACGCCTCGATCAGGCTGCCCGCGTTGCCGACCGCGTTGGGGACCAGACGGTGACCGAGAAT
GACCGCCCCGGCCAGAACAGCGGTCCACAAGATCGGCATCGGGAGATGTTATCTTATTTCGCATGCGAA ataatgagacggtacggatcccggtagcgaccggcggcgccgtcacggccacgctgttcgcgcccgagt
CCGCGCGTGCCGTGCTGGTCGTGCACCCGGCGACCGCGACTCCGCAGGGCTTCTACGCGTCGTTCGCCA
CCTACCTGGCGGAGAACGGGATCGCCACGGTCACCTACGACTACCGTGGCACCGGCCGTTCCGGCTCCC
CGCGCGACCACCGTGACCTGGGCATGCGCGACTGGATCGGCGCCGACGCCCCGGCCGTCGCGGCGTGGG
CCGCCGACCGCTTCCCGGGCCTGCCCCGGCTCGCCGCCGGTCACAGCCTCGGCGGGCACGTGATCGCGC
TCGGCGCGGCCGGCCCGGATCTGGCCGCCTCGGTGATCGTCGCCTCGCACATCGCCGCGCTGCGCACCA
TCCCGAGCCGGCTGGAGCGGTTCCGCGTGCGAATCATGCTTCACATCCTGGGTCCGGCCCTCGGGCGGC
TGCTGGGCTACGTGCCGGCCAGAAGTCTGGGCCTCGGCGAGGACCTGCCGGCCGCCGCGATGTTGGAGT
GGGGCGGCTGGGCGCGCAGGGACAACTACTTCTTCGACGACCCGTCGATGCGCGCCGCCGAGCGCGCCG
CCACCCTGACCGGCCCGGTCCTGGCCGTCGGCACCACGGAOGACCCGTGGTCCACGCCGCGCCAGATGG
ACGCCCTCACCGTGCACCTGACCAGCGCATCCGTGGAGCGGCGAACCTACTCACCGGCCGCCGCCGGGG
TCCCGGTGATCGGGCACCACGGCCTGTTCCGGCGCGCCGTGCGCGACACCGTCTGGCCGGAACTGCTGG
CCTGGTTGCACGCCCACTCGGAGAAGGCGTCAAGATGACCGCGTGCGCCTGCCTCGCCTGATCTTCCTG
CTCTTCAACGCCGACCGCGCGGTCCGGCGCTGGATCGACGCCCGTTCCGGTGACACCGGGATCGGCGCG
TCCGGCGCCGGCGTGCTGTTCTACCTCGCCGGTCACGAGAACGCCCTCATCGGCGACGTGACCGCGGCC
CTGGGTGCGTCACCATCCGGCATGAGCGGCCTGGTGAACCGCCTGGAGCGTGGCGGTTGCCTGACCCGC
TCGCAGGACCCGGCCGACGCCCGCGCGGTGCGGCTCGCCCTGACCCCGCGCGGACACCAGGTGGTGATC cacgcccgcgggctggtcgacgacctgaacgagcagctcacggccggtttcgacgacgccgagatagcg gtcgtccaacgctggctggagcacgtgacccgggtgtccgtgcaacgtgaggagcgactcggttagcgt ccggtgatcagctaaacctccgggacgggccgccgaagtgaggtgtcgcaaggcaccaccgcttccgat ccgcccttgaggagacccatggctgactccgtcgtcttcgaccagatccccgtcgtccgcgccatcggc cgaggcaccacctcgctgagcgccttccacgacgcgctggtgaccatggagtgcggtttctacaacctt
GTCCGGCTCTCCAGCGTCATCCCGCCGGGCACCGCCGTCGACCCCAGCGGCAAGGCTCCGGTCCCGGTC
GGGGCGTGGGGCGACAAGCTGTACTGCGTCTACGCCGAGCAGCACGCCAGCCAGCCGGGCGAGGAGGCG
TGGGCCGGCATCGGCTGGGTGCAGCGCCGCGACGGCCAGGGCGGCCTGTTCGTCGAGCACGAGGGCACC
AGCGAGTCGTTCGTCCGCGAGGCGATCAAGGCCAGCCTCCGCGACCTGGTCAAGGGCCACGAGGACGAC
TTCGACGGCCCGGACTTCGTCGTCCACGGCGTGGTCTCCGACGGCGAGCCGGTCTGCGCGATGGTGCTC
GCCCCCTACGAGACCGCCCCGTGGCGCGGCGTCCGTGCCACCGACCCGCCCGGCATGAACTGACCTGTC
ACCACGAGAGCCTCGCCTCGCACGTCGGGGCGAGGCTTTCGGCATTCGCTTTTCACTTCGACAACCCCC
TCCGTACCGAAGAAATCGAAGATCAAATTCTTCATTGCCTATCTCCGCTGTGGTCCAGATCGTCGCTCC
CGCGGGGACCCTTCCGGTCTGAGCAGGGCCGTAACCGGCCCAGAACGCTCAGCCCGAAAGGGCGACCTC
CGTGGCGGGGCACGGTCAGGGCAAAATTCCGTCGCCGGTCGCCAGGGATTCGCCGCCGGTTGCTGCGGG tggggtgcggcggtccgccggaggtatgggttgccgctacgctcggctagctttcgaccaccggtaacg tgtaattccccttcggtccacctacgcccgttgtgatctccttatggtgggctcgcttatcctcgtcct gtgcatctgggccgcatcggccgcgatgttcttccggctgtcctctccggcccggacgccgggcacccg
TGCCTGGCGTTTCGCCCCGATCCTGACCGCCGGTTTCGCGATTCCGCTCGCCGCCGCCTACGGTCGGCA ggactggtccaccttcgggtcgctgctggtcgccggcctggccgccttcgcggtcctgctctacctgct
CCGTCCCGTCCGCCTCTGATCCATACTCGGTCGTTGTGACGACCCGGATGCCCCGCCTCGAGATCGAAT
ACTGCACACAGTGCCGCTGGCTGGTCCGCGCCGCGTGGCTGGCGCAGGAGCTGCTCACCACATTCCCCC gcgatctcggcgaggttgccctggtccccgggatcggcggcgtcttcgaggtccgcctcgacggcgaga
TCCTCTGGAACCGCAAGCCGGACGGCTTCCCCGACCTCGCCCAGCTCAAGCGCCTGGTCCGCGACCGGG
TCGCCCCGGGCCGCGACCTCGGCCACTCCGACCGCGCCGCCACCGACTCCTAGCCCACACGTCCTCCTC caccgctccggccgcgggacgcgtctacgcgtacaggatccggtcgatcgtctcgcgggggagcagcgt
GCGGGCCCGCCCACCGCAGACGGCGACCACCGCCGGCCGCCCGACATAGACATCGCGCCGCTGGTGGTA
CGCCCCGGTACCGGACAGCGCCACCAGATCACCGGCCGCCATGTCACCCGGCAGCTCCGCCACCGCCAC
CGTCGCGTCCCCGCAGCGAACCGTGATCGACCGGCCCGGCGCCGGCGACGCCCGGCCGATCAGCGCTGC
CGTGTGCAGGCCGGCGCAGTCCGCCCCGGGCAGGCAGTCCGGGACGTCCCCGTCCAGCTCGATCACGCC
GTCCCCGGCGGCCACCACTCGGTGCACCGTGATCCCGGCACGACCCAGCAGCGCACGCCCGGGCGACAC
GTGCACCTCGGGCGGCTCAATGCCGTACCCCTCGGAAGTGACCTGCGCGACCGCCCGCAACCTGGCAGC
GAAAATGCCCACCGGGAGATCGGCGGCATGGCCGCCGCCGAGGTTGAGCACGGGCACCGTCGTCCGCAG
TCGCGCGACGAACCCGATCGCCTCACGCAGGCAACTCTCGTAGGTGCCGAAGCGGTTCAGCCGGTGCCC 104
ΕΡ 1 979 375/PT
GAGCGAGCAGTCCAGCCCGGCCAGCACCAGCCTCCGCGACCGGGTCACCGTGGCGACGGCGGCGAGCGC
GGCCGAGCTGTTCAGCCGCACCCCGTAGCCGCGCTGTGCGCTGCCCGGCCGGACCCTCAGCAGGACGCG
CTGCCCCGGCCGGGACCGCGCCGCGACCACTTCCGCCTCGGAGGCCGAGCCGATCACGACGGCGGCGCC
GCAGGACAGTGCCGCCTCCAGATCCGCCACGGACTTCCCGCTCCCGAACAGCGCCAGCGACTCCGGGCG
GATCCCCGCGTCGAGCGCCGTCCGCAGTTCGGCGGCCGAGCGGCAGTAGCAGCCCAGCCCGTCCCGCGC
GATCCACCGCGCGGCACCCCTGAGCAGGCCGCCCTTGGCGCTGCAGCACACCGCGCCCGGCCCGAACGC
CGCGACGTACTCCGCGCAGCGACTGTGCACATCGGTCTCGTCGATCACGTGCACCGGAGTGCCGTGGGC
CGCGGCGATCCGGGTCACCGGCACCCCGCCGACGGTGAGGTCACCGGGCTCGGTCCAGCGTGCGGTGAG
CGGCCAGTTCGCGGGGTCGAGGCGCGGGCGGAGCGACGCGCCCAGTGAGGGCAGAATCTCGGACAACGT
CATACCGCGAGCCTGCTCGCCGGCCCGTGCCCGAGAAGATCCGGATACGCCACGTTGACGATCGACGTG
CCGTTGTTGACGTGTCGCCTACAGGTCGGGGCTGTCGGCGGGAGCCATGATCCGCAGCGCGTTCGGGTC
GATCGCGATCCGCATCGGCGTCGTGCCCCGAGGCTCGCCGTCGACCTCGACGGCCACCGGCCGATCCGT
CTCCAGCCAGAGTTCCCGGACCGCGATGAAAGGGCGTTCATGCAGGGTACGGCGATGCCCGGTGGCCGC
GTTCCGGGCCGTCTCGCGCAGCAGCTCCCGCCGGCTCGCCCCGCCCACCGGATAGGCGACCAGCAGCCG
GTCGTCGGCGTGCGCGTCCGCGGTGATCGGCCGGCCGGCGTGGAAACCGCCGTTCGCGACGTACACCTG
ATGGGTGTGGAACCGCAGCTCCCGCCCCTCGGCCCGGATCACCGCGCGGACCGGCCGGTGCCGGGCGAG
CAGCCCGAGCGCGGTCATCGGATACGCCAGCCGCCCCACGGCCCGTTTCAACCGCGGCGGCGCGCTGAT
CATCACCTCGCCGGAGAGCCCGATCCCGACGTGGTTGGTGAACGGCACGTCCCCGGCGACGCCCAGGTC
CACGTCGATGACTTTGCCGTCCACCAGGGTCGCGATGGCGGCTTCGAGGTCCGGCTCGATCCGCACGGT
CCGGGCGAAGTTGTTGGTGGTGCCGAGCGGCAGCACCCCGAGCGCCACGTCCCGGTGTGCCAGCATCCG ccccgcggtgctgatcgtcccgtccccgcccccggcgatcagcaggtcgggctctttcctgagcgcttc
GGAGATCAGCCCGTCCAGCCCGCCGGACTGCTCCAGCGCATACGTCCCGAGCAGCTCGAACCCGGCCTC
GACAAGCCGCCGCCGCGCCTCTTCGTAGAGGAGCCGCCCCCGCCGGGACCGCGTGTTGACAACAAGAAC
CGCCCGCCGCCCTCGCCGGATGTCAGCACTGTGCTCCCGCTTACTACGCACCCGCCGACCCTATCCGCC
CCAACCCACCCAACGCCCACGCCTCGTTCCCGCCCGCCCGGTCCCGAGCCGTGATCACCAGCCGCAAGG
CCTCAGCTGGCGTTGACGGCTGATTTCGGCCCGGTTTTGCGCCGTAGGCGCCAGCCGCGAGGTGTCGGC
TGGCGTTCAGGGCTGGATTCGGCTCGGTTTTGAGCCGTGGGTGCCAGCTGGGGGCTGCGGCCGGAAGGG
GGTGGATGTGGGGATGCCCCGGGGCCGTAGGCCTCGGGGCACCGAAAAAGCGAACCAGCTCAGCTGTTG
GCGATGAACGCCGGATGCGACAGCAGGAACGTGTCGATCTGGTCCTTCTTGATCGACTTCAGCAGGTCC
ATGCTGTCGTCGCTCAGGAGCTCGACGCTGCCGGAGCCCGGCACGTTCTCCGAGTTCAGCTTGCCGGCG
TTGGTCTTGATGGTGAGGAGCTTGTCCGGCTXGAGGCTGCGCATCGCGAGCGCCCAGTCGGCCAGGTCG
ATGCCACCGTCGTCGACCGTCATCGCCTTGCCGAACGCGCTGAGCAGCTTCGGCAGCTTGGTCGGCGAG
TCGAGGCCGTCCTTCAGCGCCTGGTTGATGATCGCCTTGAAGAACTGCTGCTGGTGCCGCTGGCGACCG
TAGTCGAGCGAGTTGTCGGCGAGCAGGTCACGCTGGCGGACGAAGTCGAGCGCCTGGCCGGGGGTGAAG
CAGTGGTCGCCCTTGGTGTACGTGTTCGGCGTCACGCCCGAGATCTTGCTCTTCAGCGTGCCGTCCGGG
TTGATCACGAACGGCTTGGCGGTCTTGCCGTTCTGGTCCTTGCCCAGGTGGATCGACTTGGTCGTGGTG
TCCACGTACATGCAGACCTTGCCGAGCACGTTCACCACGTCGCGGAAGCCCTGGAAGTCGATGATCGCC
CCGGCGTCCGGCGTGATGCCGGrCAGTTCCTTGACGGTCATGGTGAGCAACTCGAAGCCGTGCTGCAGC
GCCTCGTTGCCCTTGAGCCCGCGGGTGCCGAACGCGAACGCGGCGTTGATCTTCGTCTTGCCGCCGGCC
CACTTCTGCTTCCCGTTGTCGTACGCCGGGATGTAGACGTAGCTGTCCCGGGGGAGCGAGATCATGTAA
CCGCTGCTGTGGTCCTTGTTGATGTGCAGCAGGATGATCGAGTCCGACCGGAGGGGCTCGCCGTTGGTC
TGCGTGGGCCGCTGGTCGATGCCGACGAGCAGGAGATTCTTCGCCCCGTCGAGGTTCGCGTTCTTCTTC
TCCTCGGCGGGTTTCGCCGAGCCGAGCAGCGACTCCTGCCCGACCGAGGAGGTGGCCGCGGCCACCGTC
GCGTTCAGCCCGATCGCGCCACCGCCACCGCCGACCAGCAGCAGTGAGCCGAAGACCACGGTCCAGAAA
GCCCAGCGGGGTGTGCGGCGTCGGCGCTTGCTGGTCCTACGCAAGGGGTCTCCTCTAATCGGGGCGGTC
GTTCCGCCCCAGGACAATCTAGGACGGTCGTTCCACCCATGAAGACGGGCGCCGCGAGCGAAAAGATTG cctgcggaacattgaattttcctgagcgtcaggtagctacaagctgaacgtcgcgctcgtgccccgtgg cgtcgcggaacgttgcttccctgttactccccaacgcgacgtctggtgttaaccatcgcaccaccaagg cgacctaggttctgcacggccccgggcccccgaggttccgacaaagttgcccaaagcgagtcgccatgc cctcagagccggatgtcagtgtcgtcattccgacgtgtaaccggccggagttggccgtccgcgcggtgc gcagcgccctcgggcagacgcaccggaacctcgaggtgatcgtcgtcgtcgacggtcccgacgaggcga ccgtgacggcgctgggcgaggtcggtgacccgcgactcagcgxgatcgtgctgccggagcgtggcaagg ccccgaacgcgcggaacactggcgcccgggccgcccgcggccgctggacggcgatgctcgacgacgacg acgagtggctgcccaccaagatcgaacggcagctggagacggccgcggcggcgaccgtggagcgcccgg tggtggcctgccggatgatcagccggacgccgcgggccgacacgatcatgccgcgccggctgcccgagc cgggtgagccgatcagtgaatacctgctggtccgccgcggtctgttctacggcgacggcttcgtgcaga 105
ΕΡ 1 979 375/PT
CGTCCTGCATCATGGCGCCGACCGAGCTGTGGCGGAAGGTGCCGTTCACCGTCGGCCTGCGCCGCGCGC
AGGAGCTGGACTGGACGCTGCGGGCGATGCGCGAGCCGGGCACCGCGCTGATCTACGCCGAGGAGCCGC
TGGTCCTCTGGCACCAGGACGAGAACCGTGACCGGATCAGCCTGCAGAACCCGTGGCGCGAGCAACTGG
AGTGGCTGCGCGGCAACCGGGAGCTGTTCACGCCGCGTGCCTACGCCGCGTTCACGCTGAGTGTGCTGA
GCTCGATGGCCGCGCCGACCCGGGACACCGGGCTCTTCCGTGAGCTGCTCGCCGAGGCCCGCACGCACG
GCGACCCGGGCACCGTCGACTACCTTACGCACATGCAGATCTGGGCCCTCCCGCCGAGCGTCCGGCACC
GCCTGCGTGACGTCGTGGTGGGCCGCGGCAAGACGAGCAGCAATGCCGGCTGAGCGCCGGGTCGCGATC
TGGCGCAGTTCGATGCTGCCCGGCTCCGAGACGTTCGTCCGCAATCAGGCCGACGCGCTGACCCGCTGG
ACCCCGGCCTATGTCGGCGCGGTCCGGCACGAGTCGGTGCTGTCCCGCCCCGACGACGTGATCGCCTTC
CCGGGCGGCAAGGGGTTCCTGCGACTGCGGCTGACCGGGGCGTCTCCCCAGCTGCAGAAGACGATTTCC
GCCGTACGGCCGAATCTGGTTCATGCCCATTTCGGTGGTGACGGATGGCTGGTGAGCCACTCCGCCCAG
CAGCTGGGGGTGCCGCTGGCCGTCACCGTGCACGGGCACGACGTGACCCGTCAGCCGTCCAGCCCGGGC
GCGAAGGGCGTGCGCTACCGCCGCAACCTGCAGACCGTTTTCACGCGGGCGTCGCTGGTCATCGCGGTC
TCGGAGGTGATCCGCGGCCAGGCGATCAGGTGGGGCGCCGACCCGGCGAAGGTGAAGGTGCACTACACC
GGCATCGCGGTTCCCCCGGAGCAGCCGGAGGAGGTGCCGAAGCGGTGGGACGTGGTGTTCATCGGCCGT
TTCGTCGCCAAGAAGGGCGTCGACGACCTGCTCACCGCGCTCGCCGCGGTCGAGTCGCGCCCGCGCGCG ctgctcatcggcgacggcgagctgatgacggcgatgcgtgcccgtgccgagcagctgggcgtggacgtc
ACGTTCGCCGGCAGCCGGACCCCCGAGCAGGTGCGGCGCCACCTGCTGGAGTCGCGGCTGCTGGCCTGC
CCGTCGAAGACCGCGCCGGACGGGGACACCGAGGGCCTGCCGACCACGATCCTGGAGGCGGCCGCGCTC
GGCCTGCCGGTGGTCGCAACCCGGCACAGCGGCATCCCGGAGGCCGTGATCGACGGTGAGACCGGCCTG
CTCAGCCCGGAGGCGGACCCGGCGGCGCTGGCGGTGTCGCTGACCCGGCTGCTCGGTGACGAGGATCTC
CAGCGCCGGCTCGGTGCGCGGGCGCGGCGGCACGTCACGGCACACTTCGATCTCGTGGAGCAGACCAGG
CGGCTGGAGGACCTGTATGACGAGGTCGTGGCGGGCGCTAGGGTCTAGGCCTGCCTGTCCGGCTTCCTG
GGGGAAATCATGATCTGCACGCACTGCGGCTCACCGGCGGCGCCGACCGTCGGCCCGTGCCCGGGCTGC
GGCCGTCCGGTCTCCGCCCCGGCCGGGGTGTTCCCGGACCCGCTGGCCGCGCCGGCCGAGCGGTCGCTC
CCCACGTCGGCGTACAGCGTGCCGGTCGATCCGTACACCGGCCCGACCACCGGTGACCCGTTCGCCGGC
GACTCGTTCCACACCCCGCCGCCGGCGTCCCCGATGCCGCCGCCGGTGACCGAGCCGATCACGCCGACG
CCGCCCCCGCCGGCCTACGCCCCGCCCCCGCAGTACAGCCCGCCGCCGTATGCGGGGGCGCCCGGTCAG
CCCTATCCGGGTCAGCCTTACCCAGGTCAGCCCTACCCGGGACAGCCCTACCCCGGGCAGCAGCCGTAT
CCCGGCCAGCAGCCCTACCCCGGATACGGCCAGTCGAACAGCCAGGCCCTGACCATCGTCGCCTACGTC
CTCGGCGGCTTCGGTCTCCTGACCATGACCCCGCTCATCGGCGTCGTCGGCCTGGTCCTGGCGAACTTC
GCGAAGCGCCGTCACGAGCGCAATGCCTCGATCGCGGTCAAGATCGTCGCCGGCCTGGTGATCGCCGCT
TTGGTGCrGAGCATCGTGGACCGCATCGTTTAAGGCCTGCCCTGCCGATCACTCAGGGCGGCGACTTCT
GGGCGGCGGGGGTGCTCCCCTCGCCGGAAAGGATGTCCGGTTCCCGGGATGGTCAGTACTGTCGGCTCA
TGGGCGAACATTTCGATCTTGTCGTGCTGGGCGCCGGTCCGGGTGGATATGTCGCGGCGATCCGCGGCG
CTCAACTGGGCCTGACCACCGCGATCGTCGAGGACAAGTACTGGGGCGGCGTCTGCCTCAACGTCGGCT
GCATCCCGTCGAAAGCGCTGCTGCGCAACGCGGAGCTGGCGCACATCTTCCACCACCAGGCGCAGACCT
TCGGCATCGAGGGGAAGGTCACCITCGACTTCGCCGTCGCCCACCAGCGCAGCCGCAGCGTCGCCGACG
GCCGCGTCAAGGGCGTGCACTTCCTGATGAAGAAGAACGGGATCACCGAGATCCAGGGGCGTGGCGAGT
TCACCGACGCGCACACGCTGCGGGTCGGCGACCGGACGGTCACGTTCGACAACTGCATCCTGGCGACCG
GCGCGAGCACCCGGATGATTCCCGGCACGAGCGTCTCGAAGCGGGTCGTGACGTACGAGGAGCAGATCC
TCGACCCCGACCTGCCGGACAGCATCGTGATCGTCGGCGCCGGCGCGATCGGCGTCGAGTTCGCGTATG
TGCTGCGCAACTACGGCGTCGACGTGACCATCGTGGAGTTCCTCGACCGGATGCTGCCGCTGGAGGACG
AGGAGGTCTCCAAGGAGCTGCTCCGGCAGTACCGCAAGCTCGGCGTCGACGTGCGGGTCGGCACCCGGG
TGGAGGGCATCGAGGAGGGCGCCGACTCGGTCCGCGTCACCGTCTCCAAGAACGGGAAGACCGAGGTCC
TCGAGGCCGACAAGGTGATGCAGGCGATCGGCTTCAAGCCCAACGTGGAGGGCTACGGGCTGGAGACCA
CCGGCGTCACGGTGTCCGACCGCGGCGCGGTCGAGATCGACGACTTCTGCCGTACGAACGTGCCCGGCA
TCTACGCCATCGGCGACGTCACCGCGAAGCTGATGCTGGCGCACGCCGCCGAGGCGATGGGCATCGTGG
CGGCCGAGACGATCGCCGGCGCCGAGACGATGGCCCTCGACTACCGGATGATCCCGCGCGCGACTTTCT
GCCAGCCGCAGGTCGCCAGCTTCGGGTGGACCGAGGCGCAGGCCCGCGAGCAGGGCTTCGACGTCAAGG
TGGCCAAGTTCCCGTTCACCGCGAACGGCAAGGCGCACGGCCTCGGCGACGCGACCGGGTTCGTGAAGA
TCCTCAGTGACGCGAAGTACGGGGAGCTGCTCGGCGCGCACCTGATCGGGCCGGACGTGACCGAGCTGC
TACCCGAGCTGACCCTGGCCCAGCAGTGGGACCTGACCGTCCACGAGGTCGGGCGCAACGTGCACGCGC
ATCCGACGCTCGCCGAGGCGGTCAAGGAGGCGATCCACGGCCTGGCCGGCCACATGATCAACTTCTGAG
TCCGCCGCTCGGCCGACGGGTCCGCCGCTCGGCCGACGGGTCCGCCGCTCGGCCGACGGGTCCGCTGTC
CGGCCGACGAGTCCGCCGCCCGGCTGACGCCCGGGGGAGTAGCCGGAGCCGCCCGTACCGCGCCTGCGG 106
ΕΡ 1 979 375/PT
TAGCCCGAATACCTACGCGGGGATGACGACTCCGCCCCGCCGGTCGGGAACGCTGAGCCTTGTGACCCT
GACCGTCGAGCCTCCGATCGCCCCGGCGCCGCCCGCCGCCCCGGGGCGATCCCGGCGGCGCAGGCTGGG
CTATCTGGCGTTCGTGCTGGTCGCGGTGGTGGCGGTGGTGACGCTGCGCGACCGGCTGCCGGATCCGGG
GGAGTTCCTCGACGCGCTGCGAGCGGCCGACTGGCGGTGGGCGGCGCTCGCGGTGGGGGCCGGGGTGCT
GTCCCAGATCGCGTACGCCGAGCAGCAGCGCCGGCTTCTCGCCGCGTTCGGAGTGCGCGTGCCGGCCCG
GCGGGCGATCGCGATGACGTACGTCCGGTCGGCGCTGAGCATGGCGCTGCCGGCCGGGTCGGCGGCCTC
CGCGGCGTACGCCTTCCAGGTCTATCGICGCCACGGCGCCACCGCGGCGATCTCCGCGACGGCGACCCT
GATCTCGACGGTCGTGACCGTGATGTCGCTGGGCCTGCTCTACGCCGCGACCTGGTCGCTGACCGCCAC
CGTCGTGGCCGGCCTGGCCGTTCTCCTGCTGTGGATCTACCGGACCGTGCGGGGCCCGGTCCCCGCGCG tgccggcgtgccgcgccgtctgagggtCgccccgatcgcccgcctgctccagcggcccgccgtggccca
GGCGCTCCGGGGTGCACGGTCCGTCCCGGCCCGGACGTGGCTCACGGTGACCCTGGCCGGCGTGATCAA
CTGGCTGCTGGACATGGCCTGCCTGCTCCTCGCGGCCGACGCGCTGCACGCCGGGCTCGGCTGGAGCCG gctcgcgctgatctacctggccgtccaggtggtccggcagatcccgctcacccccggcggcatcggcct
GATCGAGACCAGCATGCTCGCCGGCCTGATCGCCGCGGGCGCCCCGCAGGTCACCGCCGCCGGGATCGT
CCTGATCTACCGGCTGATCTCGTTCTGGCTGATCCTGCCCAGCGGGCTGGCCGCCCACCTGACCCTGCG
CCGGGGGACCGTGCCGCCGGTGACTCCGGGCTGACCGCCGGGGCTCAGGCGCGGTCGAACTGCTGGAGG acggcgccgaggccgagcgtcagggccgggccgggcagtcgtgagtccagcccgtaccgcoggccgggg
TTCTCCCGATCGACCAGGTCCTGCCAGAGCCCGGTCACCGGATCGCCCKGCCCCGGCAGGTCGTGCCCG
GCCGCCCGGAGCAGCTCGGCCAGGTCGTTCTGCTGGCGCAGCCGCTGCTCCTCGAAGATCTGGCTCCAC
TGCATCAGCGAGATCGACGCCTCCAGTGTGTCCGGCACCGTCTCGTCCAGCATCGGCAGCGGTCGCGCC
GCGGCCCACGCCGCGAGCTGCGCCCCGGTCACCGTGCCGGGATCGTCGTCGCGGCTGCGCGCCAGCGCG tacgacagcagcgccgtggtctccaccagcaggtgctgcaccgggacgcgcgccggcgggtccagccac
CAGTGGTCCGCCTCGAGCAGGGCCGCGGCGTGCCGGGTCGCCGCCCGCCACCAGCCGTCGTCGCCGCCG gccagggcgtcggtgtaggaccacaggaaggtcacccttccgtgcctaccaggggcacttgacacgagt caatcacgcgaacgcgtggcgacgaccgcgatcgcttcgacggagatcagcagcccgtgcgggagaacc acgccggcgggcgcggaccgggccggcggcgggtcgggcatgtgccgcgccagcacctggttgatcacc gggaagtcctcgacgtgcgtgtagaagacggtcagcttcaccagcgcgtccagcccgtccagcccggag ccggccgccgccagcaccgccccgaggttgcacagcgcctgctcggtctgcgcctcgatgccgtccacc ggcttcccggtcgcggggtcgatcccgggcatcccggagcagaacacgaacccgccggcgacgatcgcc tggctgtagggccgcagcgccgtgggggcccgctcactcgtcaccgcgatgcgatccatcgggcgagtc tcccgcaccgggcatcgatggtctttcggctttatgacacgggtgggagcttgacagccgtacatcgtt tatcgattatcaatatatcgaaaaacgataagggggtacgtcgtgaagaccgactggttgacggagttc caccaggtgctgctggtcgccgcgctgggcgccggggccgccgccgtcctcgggaccgtcgggctcgtg gtgcaggacgaggtcgtcgtcccgggcggcacgtcggctccggcgagcgtggtcagcgacccgagcgtc acccagctcctgctcgccgtggcggccgccgtgccgacgtacctgctggcgaccgccatgctggtgctg ctgtaccggttggtcggcgccgcgcgtcgcggggatc
SEQ ZD NO: 201 ox£l Proteína do sistema He aeexeção 334a.a VRLRIQRRAADEIíGPTLYTTGQSEDLDARVRDALHDLLAREETPLSGADR aritrevtdevlghgpiesllrdpsvtevmvngpysvyverfgrlekvaa
EFDDEQHLRRIIDRICSRVGRRVDEASPTVDARLPDGSRVÍJAWPPIALD GSTI.TIRKPAAVPLTVGDLLQYGTLTRQAAEFLDACVRGRRTILVSGGTG SGKTTILNVLSSFVPADERIVTIEDAAEIjQLVQDHWRIiESRPPNSEGRG T X TTRDLVRN ALRMRPDRIWGEVRDAAAL DMLQAMNTGHDGS LTTLHAN T PRDAIiSRLETMVLMAGMDLPIRAIRDQIS S AVD
SEQ ID NO: 202 ox£2 Regulador de resposta 358λλ MSELESYXiPRYPETLLWIGAVVDLDEALMFTAYQRLQRPVIGWLIRHA IEAGWLRCLQSGIRDLVAEEDEEGIRSATVRSVDLSKALSTTMRGTGDN APYASVVTVFAGKGGCGRSVVAVNIiAVALAGAGRRVIiIjMDLDLQFGDVA X mmklsperniagglqmagrldepglrsivttyrqsldallapaspaegeq νΕΚΕΡννΕΕΙιΒνΑΚΡΙιΥΕΡίννοΤΡΕννΤΟΟνίιΑΑΙίΟΜδονίΡΙΡίνΤΡΟΕ
FALKSVRLTAEMFDLLDYPKDKRLLVFNRAGAQVGLSPSEVEVAAGMPFA vqvpasrdvtvsvnhgepiavtdplhpvsrairelgdriagvgttpqrrr
GFLGRIjFP 107
ΕΡ 1 979 375/PT SEQ ID NO: 203 ox£3 Proteína hxpotétíaa 266aa
MRRRILILLAALVLAGISGAAVLSYARSADRRALSGKEGTWILVAGQHIP SGTSGAEIRARGLTSRLLVFTVTVPAGALTTWDSALDPLRLGGDLQPRQL LMRTLFVPASFAPSHTGRIPVPRRSLAVSVALNVAPQVAGNITPGDQVAV YYTYQAKVLMAEDHETIPMTELLLPKARVITIGEAEPGQAPVTPSPSPTF GPSASAGDSTAAVKEIQRYWTLAVGDTDALRLVHAAQSGSLYLALLGPN ATASTGPAIDTSWVVR SEQ ID NO:204 or£4 Proteína hipotética 432&a
MRRLIHALFPPRGEHGVITALVAVLAGAGVLLGMAALVIDIGALYAEREQ LQSGADAASWKVAQACAGTAGRDLTSATCTVAAQRDNAQRYADRNAKDLV SDVQFCITTVSAAGVTTADAGCPSSWNTPVTCPAPPSASGPYRYVEVRTS trnsdntswpplfgrglagsayhgakmgacgrvawgapavtdvlalgvs
RCDFLRLTGDYTRFFAPPPPTGPNPQTGVHPLLGLSDPTAGYIPISDGIL ATSCPADAGETVAGYTWLGQPDGPPALPGLLPVSAPDASCELTGIPATDG ' PADSWVGGFTIGPGNASAATACLDRLNVLITSGQPVLVPIFDRQVAVIGT LPSYYRIAGFAPLVLTGYESFVSGPVSPGSAVPSLVPGAQRALCAAQSCL YGYFTRALVTDHVPTRFATSRYYGAMVIGRTG SEQ ID NO:20S ; or£3 Ligaç&o ote A TF a regulador de resposta 13£a.a.
MWKATERQGPVVLLVEDDEDLRELAAQMLEMRGFWLVAKDPVSAIMTCR vhsgaidvlltdlglpgvsggelarsasevrpgmkivyvsgvpeeiaikk
GLIRAGSPFVAKPYTADRLAGMLRTVLAQGAESSAR SEQ ID NO' 206 <**£6 Transportador de açúcar ABC 363*a
MFNYVSFVRPKTFAATFAAAALLLGSGACAKSEDSGDTVAAGPAPSAAQV VQSASAGSATCALDQYGASKLDLKTASVGFSQSEKEANPFRIAETKSIKD EAAKLG1TNLKTSNANSQFNKQIADVEQMIDAGVQLLVIAPLNSDGWDSV FAKATAKH I PI I TI DRKINATACKDYLT FIGS DFAEQGKRAADALAKSLG NKGEVAILLGAPGNNVTTLRTSGFKDEIAKVAPDIKITFEQTGNFSREDG qkvaeqllqskpningiygendemalgaitalkgagkkagdvkivsidgt kgavqgivdgwvsaviesnprfgplafdtatkffggepvgqdiviqdray
DESNAKTDIGSAY SEQ ID NO:207 or£7 Ligação de ATP a transportador de açúcar ABC 501aa
MLLEVSGVSKTFPGVRALDGVSFTLNPGEVHALVGENGAGKSTLIKVLTG VYQPDSGELRYRGEPARFATPLDAQRAGISTIYQEVNLVPLMSVAHNLFL GRE PRNRFGLLDEARMVAEATEILAGY GVRT DVRRRLGT L ALGAQQMVAL ARAVMVDARV WMDEPTS SLEPREVETLFGVIRELKTAGIGIVYVS HRLD EL YRVCDAVT ILRDGKLVHTGRMADLDKRTLVSLMLGRE FGADFTS FSES PQSTPEGEPVLRVSGLTSRPRLDDISFDVRPGEVVGLGGLLGAGRSETIK AIGGAYPIDSGVIEVGGVRLGRPSTVRAVRAGVATQPEDRKAEGIVPGLS IRDNIALAI LPRMARFGLVS DKRIDSIVAT YMSRLRIKASGPDQAVGDLS GGNQQKVLLAKLLATG PKVLLLDE PTRGIDVGAKAEVQALIDELAKEGLG WLVSSDAEELVEGADRWVLRDGAWGTLTGDRVTTEALMATIAEAADE H SEQ ID NO:208 or£8 Peaaaaase da transporta ABC 3l9aa MSTETLTRPRMTFNPAWAARYGVYAAIVLLIWNIAFTPYFLTLSNLRIQ LIQAAPVVIVALGMALVIGTEGIDLSVGSVMALAAAFIPLYLGYGVTAAI lvsllagvavglingvlvakaglqpivatlalfvggrglawisggqlkd vrnadllylgsgdllgvpvlvwiaallvlwafwrrtvfgrrllavggn rpaaelaglpvkrvligvyvfcavlksiagllsvariqssdasavgllie lsaixavwggtpltggrvrvlgtvagallmqlvvatmikhdlppsttem
VQAVIILVAVYVARERRTR 108 ΕΡ 1 979 375/ΡΤ
3EQ ΙΌ ΙϋΟ: 209 οχ£9 Proteína permease d® transportador ABC 320aa MSI PVPAFRNGG FVQRQGALAVLVTWAISLAAFPGFRS ADNAGTILVAA AP PMLIALGMT FV11TGGIDLSVGS LYVAGGVVAAWASQWGVVAALAAPL ELCGAIGVLNGILISRTGMAPFIVTIíAALLGARGLMRSISDEGSTTYEVR SDVFHELGTGSLLGVGLPVWLAAVLVGAGILVLNRTRFGHAVHAIGGSED AAAliMGLPVRRIKVViÍVYLLSGLLAGIiAGAINAAKIiGSGVTVLGSGMELDA iaavviggtlltggsgsiagtvagvlllgviqnlinqvgnvnsnwqqvis
GGFLAAVWAQTTLVRARRS 3EQ ID NO:210 ox£10 Metalapeptidaae 486&a mrtsagtrvltvgatwlalaaaaapaqagpspspgsaglgdri.ypi.lgn ggydvldydlrlrypekdpkqwsgdvtitavagqslsrfdldfggasig rvsvdgqparaardgdeltviprrplprgrlfrvtvanftaapaalvatp dgtvlaaqpgsahllfpgndhprdkatftitltvpagwtgtangtlvstt
EHDGHVSSVYRESAPMATELVQTAVGDFWERRPAAGGTPIRDWFRRLA GTLLPAIAGEREQLAWMEKQAGPYPFEDYGSLVIDDDLGYALETQTLSI.Y GAALFTG PETTRGPSMTH ELAHQWFGDSVSPFS WS DVWLNE GHATWYEML WSEETGGFPQYTGLADREAFFKAVYAAGDIFRARYGPVAAPLDAATTWDV FNPNVYAGGALVLYALRQKIGAATFQRVERAWLTTYRGRSASTGDFITLA SRVARQDLRPFLTSWLLGVTTPPMPNHPD5ÍVVTPGS SEO JD NO:211 oxfll Rsgul&dox tipo StxR putatxw 286aa
MDS PRLNGED PRH TE VLÂGFGAEItPPI WHRAYMRVIDGAHRLSAARLRG DDRIRAVLFDGTEQEAYVLSVKANVTHGLPIjSAAERTRAAERIITMHPDW S DRMIAAS SGLGARTV GGLRRRRAASGES P AGLRSRAGRDSRVRPAG ST A GRLKAVDYLQ DRP DAS I>R£ IARHAGVS P STARDVRDRLHRGE DPI PATQR AAARPGNDSPPLRSLVQGLASDPSLRFSESGRDLLRWLIAHAVQDGEWKG LVDTIPAHSAQALAKIARtlCSREWREFADILEKDAA
SEQ ΧΏ NO: 212 oxfl2 lanA 64aa MSAITVETTWKNTDLREDLTAH PAGLGFGELSFEDLREDRTIYAAS SGWV CTLTIECGTLVCAC SEQ ID NO: 213 oz£13 lanM 1046aa
MS S FAI AAS P AS AYLHERSAGPGGDPVAEHERVESWRES AFLDDPVLDIR LREXjGLSRAEFGRLLTDGAYDAGSTAIjDWAGELAAVLATGTGAVTGLARS ΤΚΕΜΑΟΰΓΟΚΕΡΓΑαΕΙΕΚΓΕΑΥΥΕΡΕνΡΡΤΑΟΤνκνδΕΑΕΒΙΑΝΕΕΕτν ATRTLLLELNVARVHGRLTGATPGERYDHYDRVLLTDPDYI.RSLFGEYPV LGRAMVECGRRWA s amaelfqrldadrp alhaag llp agagevt alr pdl GDPHNSGRAVAILTFRSGAQLVYKPRPVGPERAYAETAAALNRHGLSLPL TAVDVLDRGAYGWCELVRHEPCADRADLDRFYRRTGAVLATTLLLGAVDV hmenviaagsscmpidletllqpgvpsgdatdaytraldllnqsviaxgi lparafggrerksvdvsaigggeaqtaprpvpmwepftdvarieaveat
MLGAQNRPVLVGAEVRPEEHTEAWAGFTEAYDLIVRHREDFADLLAGFG DVEVRYLPRPTRRYSMFLTESYHPDYLRDARDRDRLLDKLWTAAGARPDL IPIIESEKRQLLAGDIPCFRALAGDRAIRTASAPVAPDFFDAPGIEVLAG RLRQFGPVHRAAQLRIIRESMGTMPAPGPIAGTPAPS SERRGGLDPREAA tlgdrlvreladeailgaddagwigvsiegldqetfsykpmatglydgia
GMALTYAYAARTLGDERYLDLTRRTVKIíVSGYLRYI*AEHRIVETVGAYSG MAGLLYTL DH VAH ATGDAS LLGEIE AALPWLRECATREECPDLIAGLAGC A WALS L YRRHGI AG YRE VAEICGRRLAGTAVDVEGA AGWAATRTGVILG gfshgsagiawalhelaaefgdrdireladravefdrrlyvpaagawrdl
RPEMAGTDGYPALWCHGAAGIGLSRLLIHRIRPDERLAEEARAAVALVRR hgfghnhslchgdfgalallgladrawpgsgghderagawrdigetglr cglgngirmfglmlgaagaglsllrlaapadvpavtwlepfrgthv 109
ΕΡ 1 979 375/PT £££ XD NO: 214 οκ£14 lati? S7Saa
Hsmmhhv(kshmmoκhTAvmL·AVΆ.GVGcQL·ΰQB^ιtτBRVL·τAVQS&
Q P YEQLALAV Là VMVVGAAX»S AVQQFELQRTGE AM V PT VRRT LVAH likRL· PWlAYD£RQSGDLVSRVGADTAQYT<SVÃTSGWDUM3GVLVvGGSIAGMI 1 lEtpVLX.GVSLA-PVI.CGAAGVRLVGPALRPLSSAVQES IGAt-T ASTTRAÍ» <aiRTIR¥AGATERBmX^VftEAnRASAAGVSSAWAAQAGFIVREAI>QG ArVAVIQFGGÍRVAHGAVSVGOLVAFf&ltBBtiABPLAQIAJSAAmXQTG X,GÁl,mXEE2LALPD£DSAI<GVaARTPAWRHDpVÍ,r,EFDHVSFRY&TGG SXX,RDySFRVPAGSTTALVGPSGAGKSTILALIARGYEVHGGRILI,HGRB IROYPitaBI.RAALGyVBQBAPVLAGTVRjaíBT&AAPPVAKBAIRHVmSV SXíDDLIiARPPAGLDftPVGDGGVIjFSGGERQ-RlaAVARTLLAPGELlil.FDE? TMILDAKNEQALQRGÍjTAHAAGRTXVWAHAEATVAKADQXLVIDDGPvSV AASRHEELBVRDPTYRSFATRQIíLT SSQ XD XfQ;2í$ ox£í$ laaO (Hosaoxigsm&aa tá#*» 347&a
MLSVLPQVPVFSGOPPASAVRaAVGX.aRAAESLGyHRFSSXÁSRBSSAIU3A CÃAPEIVAAAVÃGATER1RVSTGGVÍAPYYS PLKAViEAFRVLAÃLYPGRX OJ^PGmÇRGGPAVmELLNPYASATEBAYAEQVGSÍ.MP^GDAROTSBVS
VrPAVQDppAPWBAGSGVGSÍiKLAGMLGVPPCFAQFXATEECPS&IAAYQ
ESFRSSPWL-DEPOAMI-AliRVLAAGTASDASELATGFWKSCTTGSíRAQVRP
DDDYRGGVPNLADAORY-n.lREmAMRARRPYLQISGTAETVGSEIRBLR
KVYDVAEVHÍ.,’rTNCPÔAAAPAPV.IíRAAG8RASADKAGVXRVRPaRRR SSQ JP NO:21g axfiS laaK 4a x&sp&stst} StTsta
MADVRWASSAI.VSIGXKSíXAETfíGGFSWAADBOSAUvAVSERRPAWX. LDAHATLPESVPWjTRl)RÍ)ii£SGPALAVIATP&ASSTVI>ESLSSGâCGFL LSDSQPEQiVAAVRAXlAS<3\,TVRAPEASSIMLGAACP.GTPAA«MAV0EVK ÇGSDREQAVBSLIGQGBTN&EIAGRBFXSDSWKEYPSVIX.RKI.GVASRV QAAVLAY AAGLTTDELA
SEQ IP NO: 217 ox£i7 ass&aàada st Í£$xwp>oxt&dnx SBC 814aa MIFXAKWSQVjRSHPGRUAI VAAVVLATGFLAATATFA5FSDEGLRLTAA APLTTADIVBD&D 0T VRO PQW Y QAAAGVRG VRS VE*PQ YAJRXV SVFGSDRR GSAHVQSXPATASVRWFTVDBGTSÍPSAAGQWADRCTLTDAGVGVSAHLD FRQGTA A P V P VT WG S A O LG FR PL TGS DYR FYAAÂS PFA GDTPP AA&BTV tdrorlaetvdavg&aíppgatatdasaaadaragrfaggmtqlwlmaa PAAVAIiliASnjVIANTFQVtVSQRVBQVAXíliRLVÇGHRKQVSKVVAAEAA JAGSÍGAVXSAVAGVGBGYACSAâlLDXNGGGLAVKPXVX.ALCVÍiíGVGAT V"vIASKAPARR7iTRV?PVRALQEVPDAT,PAQVR6Gl;íB.LVAGj3IL‘IGt>AVGV'
LGIA& 1GT S LPLAIiVG GVBLAAS LI>T ALPI.G IALLL ? PAARG LS KFGVAA SIAGSNLRQ1íAERTA5ATMAWVGAAI!ITGLAVASASGRATVEADJ^:ARY P V A VS V HT OSA AID DKYVRÂL S G X TGLTTAT VATSAATFPAAGK ? T PARI ARI.PTDVí.GRLAPEIS&STGDPVLLVPASYLTABGLTDGAPLTVTAGGRD
ÍíKFTARGBBLADTTSQIiÍíGVTTGDVLTAAGVKTVPTTWGXAPGGFDKET lAADVRAVAARDAGVEVGGGVTEGGrJlWtiVLSILLGLSLGMLAVTWIAI.
LGIARIIíGASVIEKYRBMAEI-RAAGTRRSRLRAMVAVEAVTXTBVGTVAG
XVIGVPVGLVGVXAAVGAQAEPVIMLAWPQEGLVI.VAAAVTGVI^SAAPA
RRRTRIAPAEGIiVR SSQ XP 130;218 ox£í8 Pxotaíxta 4a ligação m Α3Τ 4» txa&qpoxtadox SB 240aa
MVSCRHLAKSYGTGDAAWAVDGVSTSFAAGEFmXMGFSGSGKTtLMHL EAGIjDTPTEGEVS ÍiAGTAXjAGLDDRALTDLRRDRVGFI FQAFNIjLPTI/TA EQS2VAPX,R1«&GRPVDB.DRAQRIAAS1íQIG0H1GBRPAEASGGQQQRVAV 110
ΕΡ 1 979 375/PT
ARALLTEPSWFADEPTGALDIATGRALLAGLQNAARQASQTIIMVTHDA
AAATYADRVLIMADGRLWSELRAPTLESIMSVMASVTVTS SEQ ID N0:2Í9 ot£19 8isfcxdina-qn£nms& 3S2aa.
VIAGAAVMVCLLIiGLAGtiDEWYWSAALCVPLVIRRSAPVVFLALVAVLSG IHMIYSGSFAFPGDLVDLVAVHAVAGYGPARVRHIiGLLLGVAGSLWTAR ALHDGLPSSATLPAALIVAATLAAWSTGLMQRRQRADVIEADHRRRLAEQ DSAMRARLAAIEERTRISQEMHDIXAHSLASVIAQAEGGRVAARADAWA GPLFDRIAQIGREALNDVKRLLNSIDGDTPDDFAQGLPDLPGLLAGVSAA GLDVTFEVAGPEQPLASGMDLAVYRVIQESLTNVLKHATQRQARLSLVWT PAWREVSVTSPLTFAGALREGRGX.SGIRQRCSLF1SGDCEIVAGQTFSVXT RWPLARPEVAVP SEQ ID NO: 220 ox£20 Regulador de resposta, 21 Saa
MTEPQIDWXADDQDLVRXGFALWDSAPDMRWATAADGAEVVRLAAEF RPDWLMDIRMPRVDGITAARAILEGNAQPPKIVALTTYDNDEYASRILA AGASGYLLKDTTAEGLTAAIRTVERGGSVLAPSTTHRLVTAHRQHPARPS ALLDSFTTREREVFDLIVAGASNAEIADRLNLAEVTIKTHVGRVLAKIGV RDRVNWIWAYRNGAGPS SEQ ID NO:221 ox£21 Proteína de membraixa. pi3.tati.va 302âa. mpilwtavlagavxlghrlvpnavgnagslieaflpwfglavpvllllal
MRRSLTGLAAVLLPLGAWLIHFGGYWDRDTGTPDLXWQHNVSDENPDP AGTARALLAAHPDLVGLEEVLPEAVAAYRGVLDAEIiPFHTVQGTVALWSR YPLTGAEAIDIRPEDLGEDWNRGLRAVARTPGGDTAVYVAHLPSVRVTAA GLTEARRDESARKLGALLAADPVPRLWIGDLNTSVDDRGLRPIRQVMID SPADFAFTWPARTPVARIDQVLARSMTVTRLTALPRTGSDHLPLAAEIRF P SEQ ID NO:222 or£22 ALfa-beta hi.dxola.ss 290aa
ΜΚΚΚΕΤνΗΙΡνΑΤεΟΑνΤΑΤΕΓΑΡΕΕΑΗΑνΕννΗΡΑΤΑΤΡααΡΥΑΕΡΑΤΥ LAENGIATVTYDYRGTGRSGS PRDHRDLGMRDWIGADAPAVAAWAADRFP GLiPRLAAGHSLGGHVIALGAAGPDIjAASVIVASHXAALRTIPSRLERFRV RIMLHILGPALGRLLGYVPARSLGEGEDLPAAAMLEWGGWARRDNYFFDD PSMRAAERAATLTGPVLAVGTTDDPWSTPRQMDALTVHLTSASVERRTYS PAAAGVPVIGHHGLFRRAVRDTVWPELLAWLHAHSEKASR SEQ ID NO: 223 1 ox£23 S@gnla.dor de traneariçâo 14Saa
VRX.PRLIFLLFNADRAVRRWIDARSGDTGIGASGAGVLFYLAGHENALIG DVTAALGASPSGHSGLVNRLERGGCLTRSQDPADARAVRLALTPRGHQW IHARGLVDDLNEGLTAGFDDAEIAWORWLEHVTRVSVQREERLG SEQ ID NO:224 ' ox£24 Âxg±oâjia."d0aaaxboxilas@ dapetideiite de pxxuvoxlo 175aa
MADS WFDQIPWRAIGRGTTSLS AFHDALVTMECGFYNLVRLS SVI PPG TAVDPSGKAPVPVGAWGDKLYCVYAEQHASQFGEEAWAGIGWVQRRDGQG GLFVEHEGTSESFVREAXKASLRDLVKGHEDDFDGPDFWHGWSDGEPV CAMVLAPYETAPWRGVRATDPPGMN SEQ ID NO:225 : 0x£25 DiamiztapxB^lato-daaaajdsoxilase putativa 406aa
MÍLSEILPSLGASLRPRLDPANWPLTARWTEPGDLTVGGVPVTRIAAAHG
TPVHVIDETDVHSRCAEYVAAFGPGAVCCSAKGGLLRGAARWIARDGLGC
YCRSAAELRTALDAGIRPESLALFGSGKSVADLEAALSCGAAWIGSASE
AEWAARSRPGQRVLLRVRPGSAQRGYGVRLMSSAAEAAVATVtRSRRLV
LAGLDCSLGHRLNRFGTYESCLREAIGFVARLRTTVPVLNLGGGHAADLP 111 ΕΡ 1 979 375/ΡΤ
VGIFAARLRAVAQVTSEGYGIEPPEVHVSPGRALLGRAGITVKRWAAGD GVΙΕLDGDVPDCLPGADCAGLHTAALIGRAS PAPGRSITVRCG DATVAVA ELPGDMAAGDLVALSGTGAYHQRRDVYVGRPAVVAVCGGRARTLLPRETI DRILYA SEQ XD NO: 226 ox£26 fíninase 309ma
VRSKREHSADIRRGRRAVLWNTRSRRGRLLYEEARRRLVEAGFELLGTY
AI-EQSGGLDGIjISEALRKEPDLLIAGGGDGTISTAGRMLAHRDVALGVLP
LGTTNNFARTVRIEPDLEAAIATLVDGKVIDVDLGVAGDVPFTNHVGIGL
SGEVMISAPPRLKRAVGRLAYPMTALGLLARHRPVRAVIRAEGRELRFHT hqvyvanggfhagrpixadahaddrllvaypvggasrrellretarnaat
GHRRTLHERPFIAVRELWLSTDRPVAVEVDGEPRGTTPMRIAIDPNALRI
MAPADSPDL SEQ XD NO: 227 ox£27 Ragaladox da txaxiecxição 367as
VVFGSLLLVGGGGGAIGLNATVAAATSSVGQESL;LGSAKPAEEKKNAN;LD GAKNLLLVGIDQRPTQTNGEPLRSDSIILLHINKDHS SGYMI SXjPRDSYV YIPAYDNGKQKWAGGKTKINAAFAFGTRGLKGNEAAQHGFELLT&JTVKEL TGITPDAGAIIDFQGFRDWNVLGKVCMYVDTTTKS1HLGKDQWGKTAKP FVINPDGTLKSKISGVTPNTYTKGDHCFTPGQAADFVRQRDLLADNSLDY ακΟΚΗΟΟΩΕΡΚΑΙΙΝΟΑΕΚΟΘΕΟβΡΤΚΕΡΚΕΑΗΑΓΟΚΑΜΤνΟϋβσίΟΙιΑΟ MALAMRSLKPDKLLTIKTNAGKLNSENVPGSGSVEELSDDSMDLLKSIKK dqidtfllshpafians SEQ XD NO:228 1 ox£28 GJAaosil-txzme£es:aa& 317ma
MPSEPDVSWIPTCNRPELAVRAVRSALGQTHRNIJEVIVVVDGPDEATVT ALGEVGDPRLSVIVLPERGKAPNARNTGARAARGRWTAMLDDDDEWLPTK IERQLETAAAATVERPVVACRMISRTPRADT1MPRRLPEPGEPISEYLAV RRGLFYGDGFVQTSClMAPTELWRKVPFTVGLRRAQELDWrLRAMREPGT ALIYAEEPLVLWHQDENRDRISLQNPWREQLEWLRGNRELFXPRAYAAFT LSVLSSMAAPTRDTGLFRELLAEARTHGDPGTVDYLTHMQIWALPPSVRH RLRDVWGRGKTSSNAG SEQ XD NO:229 1 ox£29 Gl±aosíl-txaxie£axaB& 369ma
MPAERRVAIWRS SMLPGSEXFVRNQADALTRWX P AY VG AVRHESVL3RPD DVI AFPGGKGFLRIíRLTGAS PQLQKTISAVRPNLVHAHFGGDGWLV SHSA QQLGVPLAVTVHGHDVTRQPSSPGAKGVRYRRNLQTVFTRASLVIAVSEV IRGQAIRWGADPAKVKVHYTGIAVPFEQPEEVPKRWDWFIGRFVAKKGV DDLLTALAAVESRPRAX.LIGDGELMTAMRARAEQLGVDVTFAGSRTPEQV RRHLLESRLLACPSKTAPDGDTEGIiPTTILEAAALGLPWATRHSGIPEA VIDGETGLLSPEADPAALAVSLTRLLGDEDLQRRLGARARRHVTAHFDLV EQTRRLEDLYDEVVAGARV 459aa SEQ XD NO:230 ox£30 D±-hxdxolípoamídaL-daBÍdxo^aximaa
MGEHFDLVVLGAGPGGYVAAIRGAQLGLTTAIVEDKYWGGVCLNVGCIPS kallrnaelahifhhqaqtfgiegkvtfdfavahqrsrsvadgrvkgvhf
LMKKNGITEIQGRGEFTDAHTLRVGDRTVXFDNCILATGASTRMIPGTSV SKRWT YEEQILDPDLPDSIVI VG AG AI GVEFAYVUR.NY GVDVTIVEFLD RMLPLEDEEVSKELLRQYRKLGVDVRVGTRVEGIEEGADSVRVTVSKNGK xevleadkvmqaigfkpnvegyglextgvxvsdrgaveiddfcrtnvpgi yaigbvtaklmlahíuveamgivaaetiagaetmaldyrmifratfcqpqv asfgwteaqareqgfdvkvakfpftangkahglgdatgfvkilsdakyge
LLGAHLIGPDVTELLPELILAQQWDLXVHEVGRNVHAHFTLAEAVKEAIH glaghminf 112
ΕΡ 1 979 375/PT SEQ XD NO: 231 ox£31 Proteína da membrana pnfcafcxva 34Saa
MTTPPRRS GTLS LVT LT VEPPI APAPPAAPGRSRRRRItGYLAFVLVA WA WTLRDRLPDPGEFLDALRAADWRWAALAVGAGVLSQIAYAEQQRRLLAA FGVRVPARRAIAMTYVRSALSMALPAGSAASAAYAFQVYRRHGATAAISA TATLISTWTVMSLGLLYAATWSLTATWAGLAVIjLLWIYRTVRGPVPAR AGVPRRLRVAPIARLLQRPAVAQALRGARSVPARTWLTVTLAGVINWLRD MACLLLAADALHAGLGWSRLALIYLAVQWRQIPLTPGGIGLISTSlyiLAG LXAAGAPQVTAAGIVLIYRLISFWLILPSGLAAHLTLRRGTVPPVTPG SEQ ID NO:232-SEQ ID NO:299 (Nulo) SEQ ID NO:300 O/SBDIG-1
TGGGTSTGCACSCTSACSATCGARTGCGGNACSGTSATCTGCGCSTGC
SEQ ID NO:301 O/ACT08F
TCCAGCACGCGCGGGG
SEQ ID NO:302 O/ACT09R
GTTCGACCAGCCGCCC
SEQ ID NO:303 O/AGvarOlbF
TTCTAGACGTTGTTCTCCCATTTTCAC
SEQ ID NO:304 O/AGvar02bR
AAGATCTTCGAAGGTGAGCTCGCCGAA
SEQ ID NO: 305 0/AGva.r03F
GATCTTCGCGAGGACCGCACCATCTACGCCGCCAGCAGCGGCTGGGTGTGTACACTGACGATCGAGTGC
GGCACCGTGATCTGCGCCTGCTGAC
SEQ ID NO: 306 O/A<3var04R
CTAGGTCAGCAGGCGCAGATCACGGTGCCGCACTCGATCGTCAGTGTACACACCCAGCCGCTGCTGGCG
GCGTAGATGGTGCGGTCCTCGCGAA
SEQ ID NO:307 O/AGvar05F
GCCTGCTGACCTAGGTCGACGATCGT SEQ ID NO:308 O/AGvar06r
TGAATTCGGCTGCTCCCCGCGCGAAAT
SEQ ID NO:309 O/SB50F
ATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCATGATTCCGGGGATCCGTCGACC SE2 ID NO:310 O/SBSIR
GGGCGATGCCCGCCCCGGGCCGGAAACGATCGTCGATCATGTAGGCTGGAGCTGCTTC SEQ ID NO:311 0/SB52F
AAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGATTCCGGGGATCCGTCGACC SEQ ID NO:312 0/SB53R
GCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCATGTAGGCTGGAGCTGCTTC
Lisboa, 2012-02-22

Claims (15)

  1. ΕΡ 1 979 375/PT 1/4 REIVINDICAÇÕES : 1. Composto da fórmula: z
    na qual: -X1-X2- representa -Leu-Val; -Y é -S; Z é ou um aminoácido ou -NH2 em que o último representa o N-terminal da Ala na posição 1; R representa -OH ou -NR1R2, em que R1 e R2 representam independentemente: (i) hidrogénio; (ii) um grupo de fórmula - (CH2) n-NR3R4, em que n representa um número inteiro de 2 a 8 e R3 e R4 representam independentemente hidrogénio ou alquilo (Ci~4) ou R3 e R4 tomados em conjunto representam um grupo - (CH2)3-, -(CH2)4-, (CH2)2-0(CH2)2-, - (CH2)2-S (CH2)2 ou - (CH2) 5-; ou R1 e R2 tomados em conjunto com o átomo de azoto adjacente representam uma porção piperazina que pode ser substituída na posição 4 por um substituinte selecionado a partir de: (a) alquilo (C1-4) ; (b) cicloalquilo (C5-7) ; (c) piridilo, (d) - (CH2) p-NR5R6 em que p representa um número inteiro de 1 a 8 e R5 e R6 representam independentemente hidrogénio ou alquilo (C1-4) ; (e) piperidinilo; (f) piperidinilo substituído, em que o piperidinilo substituído possui um N-substituinte que é alquilo (C1-4) ; (g) benzilo; e (h) benzilo substituído, em que a porção fenilo possui 1 ΕΡ 1 979 375/PT 2/4 ou 2 substituintes selecionados a partir de cloro, bromo, nitro, alquilo (Ci_4) e alcoxi (Ci_4) , ou um seu sal farmaceuticamente aceitável.
  2. 2. Composto de acordo com a reivindicação 1, caracterizado por Z ser um aminoácido.
  3. 3. Composto de acordo com a reivindicação 2, caracterizado por o aminoácido ser Ala.
  4. 4. Composto de acordo com a reivindicação 1, caracterizado por Z ser -NH2.
  5. 5. Composto de acordo com qualquer uma das reivindicações 1 a 4, caracterizado por R ser OH.
  6. 6. Composto de acordo com qualquer uma das reivindicações 1 a 4, caracterizado por R1 e R2 representarem independentemente: (i) hidrogénio; (ii) um grupo de fórmula - (CH2) n-NR3R4, em que n representa um número inteiro de 2 a 8 e R3 e R4 representam independentemente hidrogénio ou alquilo (Ci-4) .
  7. 7. Composto de acordo com a reivindicação 1, caracterizado por o composto ser selecionado a partir do grupo constituído por: N- [3-dimetilaminopropil]monocarboxamida de desoxiactagardina B; N-[1-{l-metil-4-piperidinil)piperazina]monocarboxamida de desoxiactagardina B; [1-(3-dimetilaminopropil)piperazina]monocarboxamida de desoxiactagardina B; desoxiactagardina B; D-Ala(0)desoxiactagardina B; L-Ile(0)desoxiactagardina B; L-Val(0)desoxiactagardina B; L-Phe(0)desoxiactagardina B; e L-Lys(0)desoxiactagardina B; L-Trp(0)desoxiactagardina B. ΕΡ 1 979 375/PT 3/4
  8. 8. Composição farmacêutica compreendendo um composto como definido em qualquer uma das reivindicações 1 a 7, em conjunto com um veiculo farmaceuticamente aceitável.
  9. 9. Composição farmacêutica de acordo com a reivindicação 8, para administração oral.
  10. 10. Composto como definido em qualquer uma das reivindicações 1 a 7, para utilização num método de tratamento.
  11. 11. Composto como definido em qualquer uma das reivindicações 1 a 7, para utilização num método de tratamento de uma infeção bacteriana.
  12. 12. Utilização de um composto como definido em qualquer uma das reivindicações 1 a 7, na preparação de um medicamento para utilização no tratamento de uma infeção bacteriana.
  13. 13. Método de preparação de um composto de fórmula:
    na qual: -X1-X2- representa -Leu-Val; -Y é -S; Z é Ala ou -NH2 em que o último representa o N-terminal da Ala na posição 1, compreendendo o método a expressão de um ácido nucleico que codifica uma sequência de SEQ ID NO:l ou SEQ ID NO:11, e, opcionalmente quando necessário, genes aglumerados associados necessários para conversão do polipéptido precursor no produto. ΕΡ 1 979 375/PT 4/4
  14. 14 . Método de acordo com a reivindicação 13, caracterizado por o ácido nucleico ser expresso em A. liguriae.
  15. 15. Método de acordo com a reivindicação 14, caracterizado por a A. liguriae estar depositada conforme o Tratado de Budapeste sob o número de depósito NCIMB 41362. Lisboa, 2012-02-22
PT07704921T 2006-01-17 2007-01-17 Aglomerados de genes biossintéticos lantibióticos de a. garbadinensis e a. liguriae PT1979375E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GBGB0600928.6A GB0600928D0 (en) 2006-01-17 2006-01-17 Improvements relating to lantibiotics

Publications (1)

Publication Number Publication Date
PT1979375E true PT1979375E (pt) 2012-03-06

Family

ID=35998187

Family Applications (1)

Application Number Title Priority Date Filing Date
PT07704921T PT1979375E (pt) 2006-01-17 2007-01-17 Aglomerados de genes biossintéticos lantibióticos de a. garbadinensis e a. liguriae

Country Status (20)

Country Link
US (3) USRE45003E1 (pt)
EP (2) EP2189472A1 (pt)
JP (1) JP5219837B2 (pt)
KR (1) KR101573536B1 (pt)
CN (1) CN101389641B (pt)
AT (1) ATE534659T1 (pt)
AU (1) AU2007206769B2 (pt)
BR (1) BRPI0706525A2 (pt)
CA (1) CA2637315A1 (pt)
CY (1) CY1112559T1 (pt)
DK (1) DK1979375T3 (pt)
ES (1) ES2378090T3 (pt)
GB (1) GB0600928D0 (pt)
IL (1) IL192446A0 (pt)
MX (1) MX2008009047A (pt)
NZ (1) NZ569486A (pt)
PL (1) PL1979375T3 (pt)
PT (1) PT1979375E (pt)
SI (1) SI1979375T1 (pt)
WO (1) WO2007083112A2 (pt)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0600928D0 (en) 2006-01-17 2006-02-22 Novacta Biosystems Ltd Improvements relating to lantibiotics
GB0714029D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd Lantibiotic-based compounds having antimicrobial activity
GB0714030D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd The use of type-B lantibiotic-based compounds having antimicrobial activity
CN102348718B (zh) * 2009-01-14 2015-06-03 诺瓦克塔生物系统有限公司 去氧阿肽加定衍生物
GB0900599D0 (en) 2009-01-14 2009-02-18 Novacta Biosystems Ltd Treatment
EP2393829A1 (en) 2009-02-04 2011-12-14 Novacta Biosystems Limited Actagardine derivatives
CA2789164A1 (en) * 2010-02-02 2011-08-11 Novacta Biosystems Limited Lantibiotic salts
GB201001688D0 (en) 2010-02-02 2010-03-17 Novacta Biosystems Ltd Compounds
CN103052383A (zh) * 2010-07-14 2013-04-17 诺瓦克塔生物系统有限公司 含有b型羊毛硫抗生素的制剂
GB201013507D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
GB201013513D0 (en) * 2010-08-11 2010-09-22 Novacta Biosystems Ltd Formulations
GB201013508D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
GB201013509D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
WO2014085637A1 (en) * 2012-11-30 2014-06-05 Sentinella Pharmaceuticals, Inc. New lantibiotic derivatives and a process for their preparation
CN103483433B (zh) * 2013-09-10 2015-05-27 中国科学院微生物研究所 一种新型高效的羊毛硫细菌素cerecidin及其应用
CN106188253B (zh) * 2016-08-26 2020-08-18 上海交通大学 抗菌肽Lexapeptide及其制备方法和用途

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3710795A (en) 1970-09-29 1973-01-16 Alza Corp Drug-delivery device with stretched, rate-controlling membrane
GB8507528D0 (en) 1985-03-22 1985-05-01 Lepetit Spa Basis monocarboxyamide derivatives
US5304540A (en) 1988-06-22 1994-04-19 Applied Microbiology, Inc. Pharmaceutical bacteriocin compositions and methods for using the same
IN167138B (pt) 1988-08-17 1990-09-01 Hoechst India
GB8926639D0 (en) 1989-11-24 1990-01-17 Agricultural & Food Res Delayed release formulations
KR0166088B1 (ko) 1990-01-23 1999-01-15 . 수용해도가 증가된 시클로덱스트린 유도체 및 이의 용도
US5376645A (en) 1990-01-23 1994-12-27 University Of Kansas Derivatives of cyclodextrins exhibiting enhanced aqueous solubility and the use thereof
IT1260505B (it) 1992-06-01 1996-04-09 Poli Ind Chimica Spa Sistemi farmaceutici orali a cessione ritardata per il rilascio specifico nel colon
IL107887A (en) 1992-12-08 2003-07-06 Ambi Inc Stabilized lanthionine containing bacteriocin compositions
US5512269A (en) 1993-06-09 1996-04-30 Burroughs Wellcome, Co. Method of treating retained pulmonary secretions
EP0700998B1 (en) 1994-09-12 2003-11-26 Aventis Pharma Deutschland GmbH Recombinant mersacidin and a method for production
DE69629691T2 (de) 1995-06-23 2004-02-26 Ambi, Inc. Verfahren zur kontrolle von antibiotikaresistenten grampositiven bakterien und behandlung von infektionen
GB9711643D0 (en) 1997-06-05 1997-07-30 Janssen Pharmaceutica Nv Glass thermoplastic systems
US5985823A (en) 1997-06-09 1999-11-16 Ambi Inc. Method for the treatment of diarrheal disease and for eliminating particular bacterial populations from the colon
US5958873A (en) 1997-06-09 1999-09-28 University Of Cincinnati Oral formulation for treatment of bacteria-induced diseases of the colon
DE19745583A1 (de) * 1997-10-15 1999-04-22 Hoechst Marion Roussel De Gmbh Neues Lantibiotikum verwandt mit Actagardine, Verfahren zur Herstellung und Verwendung derselben
US6569830B1 (en) 1999-03-05 2003-05-27 Ambi, Inc. Compositions and methods for treatment of staphylococcal infection while suppressing formation of antibiotic-resistant strains
HU230396B1 (hu) 2000-06-28 2016-04-28 Smithkline Beecham Plc Nedves őrlési eljárás
GB0110432D0 (en) * 2001-04-27 2001-06-20 Plant Bioscience Ltd Lantibiotic production
WO2002103010A1 (en) 2001-06-14 2002-12-27 Plant Bioscience Limited Methods and materials for targeted gene disruption in actinomycete bacteria
US6861236B2 (en) 2002-05-24 2005-03-01 Applied Nanosystems B.V. Export and modification of (poly)peptides in the lantibiotic way
US7199230B2 (en) 2002-10-10 2007-04-03 Molichem Medicines, Inc. Nucleic acids encoding duramycin
US7351687B2 (en) 2003-07-18 2008-04-01 Vicuron Pharmaceuticals, Inc. Antibiotic 107891, its factors A1 and A2, pharmaceutically acceptable salts and compositions, and use thereof
ATE356143T1 (de) 2003-07-18 2007-03-15 Vicuron Pharm Inc Antibiotikum 107891, dessen faktoren a1 und a2, pharmazeutisch unbedenkliche salze und zusammensetzungen, und anwendung davon
US20050271650A1 (en) * 2004-02-17 2005-12-08 Cellmatrix, Inc. Method and composition for angiogenesis inhibition
GB0406870D0 (en) 2004-03-26 2004-04-28 Novacta Biosystems Ltd Improvements relating to the production of lantibiotics
JP2009509519A (ja) 2005-09-27 2009-03-12 ノヴァクタ バイオシステムズ リミティッド ランチビオティックメルサシジンの変種およびそれらの使用
GB0600928D0 (en) 2006-01-17 2006-02-22 Novacta Biosystems Ltd Improvements relating to lantibiotics
ES2895666T3 (es) 2006-10-27 2022-02-22 Capsugel Belgium Nv Cápsulas duras de hidroxipropilmetilcelulosa y proceso de fabricación
US20110150917A1 (en) 2007-06-12 2011-06-23 The University Of British Columbia Small Cationic Antimicrobial Peptides
GB0714030D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd The use of type-B lantibiotic-based compounds having antimicrobial activity
GB0714029D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd Lantibiotic-based compounds having antimicrobial activity
KR20110086582A (ko) 2008-11-24 2011-07-28 센티넬라 파마세티컬즈, 인크. 항균활성이 강화된 란티바이오틱 카르복시아미드 유도체
CN102348718B (zh) 2009-01-14 2015-06-03 诺瓦克塔生物系统有限公司 去氧阿肽加定衍生物
GB0900599D0 (en) 2009-01-14 2009-02-18 Novacta Biosystems Ltd Treatment
EP2393829A1 (en) 2009-02-04 2011-12-14 Novacta Biosystems Limited Actagardine derivatives
EP2216937A1 (en) 2009-02-10 2010-08-11 Alcatel Lucent Alarm notification between customer premises equipment and a remote management server

Also Published As

Publication number Publication date
US20100048459A1 (en) 2010-02-25
EP1979375B9 (en) 2012-05-09
US8465947B2 (en) 2013-06-18
US20110306091A1 (en) 2011-12-15
JP5219837B2 (ja) 2013-06-26
AU2007206769B2 (en) 2013-06-20
MX2008009047A (es) 2008-12-18
WO2007083112A3 (en) 2008-05-08
US7989416B2 (en) 2011-08-02
EP2189472A1 (en) 2010-05-26
BRPI0706525A2 (pt) 2011-03-29
AU2007206769A1 (en) 2007-07-26
EP1979375B1 (en) 2011-11-23
DK1979375T3 (da) 2012-03-19
USRE45003E1 (en) 2014-07-08
CN101389641B (zh) 2013-06-05
CN101389641A (zh) 2009-03-18
KR20080086517A (ko) 2008-09-25
EP1979375A2 (en) 2008-10-15
CY1112559T1 (el) 2016-02-10
GB0600928D0 (en) 2006-02-22
IL192446A0 (en) 2008-12-29
CA2637315A1 (en) 2007-07-26
JP2009523777A (ja) 2009-06-25
PL1979375T3 (pl) 2012-04-30
ES2378090T3 (es) 2012-04-04
NZ569486A (en) 2011-07-29
ATE534659T1 (de) 2011-12-15
SI1979375T1 (sl) 2012-03-30
KR101573536B1 (ko) 2015-12-11
WO2007083112A2 (en) 2007-07-26

Similar Documents

Publication Publication Date Title
PT1979375E (pt) Aglomerados de genes biossintéticos lantibióticos de a. garbadinensis e a. liguriae
Spohn et al. Overproduction of ristomycin A by activation of a silent gene cluster in Amycolatopsis japonicum MG417-CF17
Bender et al. Characterization of the genes controlling the biosynthesis of the polyketide phytotoxin coronatine including conjugation between coronafacic and coronamic acid
TUCKMAN et al. Mutations in the interdomain loop region of the tetA (A) tetracycline resistance gene increase efflux of minocycline and glycylcyclines
JP4913588B2 (ja) ファルネシルベンゾジアゼピノンの製造方法及び薬剤としての使用
US11858967B2 (en) Compositions and methods for enhanced production of enduracidin in a genetically engineered strain of streptomyces fungicidicus
JP2010535492A (ja) ランチビオティック107891の生合成のための遺伝子およびタンパク質
PT98428B (pt) Clonagem da via de biossintese para formacao de clortetraciclina e tetraciclina a partir de streptomyces aureofaciens e sua expressao em streptomyces lividans
EP2327789B1 (en) Signamycin, method for production thereof, and use thereof
BR112019011603A2 (pt) isolados de streptomyces fungicidicus modificados e seu uso
US20050079498A1 (en) Novel Molecules
CA3232763A1 (en) Kynurenine aminotransferase and products thereof for the treatment of inflammatory bowel diseases
Bell Analysis and manipulation of “actagardine” gene clusters from Actinoplanes
WO2006111743A2 (en) Identifying lantibiotic gene clusters and novel lantibiotic genes
CA2538147A1 (en) Farnesyl dibenzodiazepinone, processes for its production and its use as a pharmaceutical
Hucul et al. Brad Haltli,* Ying Tan, 2 Nathan A. Magarvey, 4, 5 Melissa Wagenaar, Xihou Yin, 2 Michael Greenstein