BRPI0706525A2 - grupamentos genéticos biossintéticos de lantiobióticos de a. garbadinensis e a. liguriae - Google Patents

grupamentos genéticos biossintéticos de lantiobióticos de a. garbadinensis e a. liguriae Download PDF

Info

Publication number
BRPI0706525A2
BRPI0706525A2 BRPI0706525-6A BRPI0706525A BRPI0706525A2 BR PI0706525 A2 BRPI0706525 A2 BR PI0706525A2 BR PI0706525 A BRPI0706525 A BR PI0706525A BR PI0706525 A2 BRPI0706525 A2 BR PI0706525A2
Authority
BR
Brazil
Prior art keywords
seq
variant
nucleic acid
polypeptide
sequence
Prior art date
Application number
BRPI0706525-6A
Other languages
English (en)
Inventor
Steven Boakes
Jesus Cortes Bargallo
Michael John Dawson
Original Assignee
Novacta Biosystems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novacta Biosystems Ltd filed Critical Novacta Biosystems Ltd
Publication of BRPI0706525A2 publication Critical patent/BRPI0706525A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/365Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinoplanes (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/045Actinoplanes

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Virology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

GRUPAMENTOS GENéTICOS BIOSSINTéTICOS DE LANTIBIOTICOS DE A. GARBADINENSIS E A. LIGURIAE. Esta invenção refere-se à caracterização do grupamento genético biossintético para o lantibiático actagardina, identificação de uma nova variante de actagardina e seu grupo biossintético e a métodos de produção e uso de actagardina, uma nova variante de actagardina, sendo aqui referida como actagardina B, e variantes de ambos produzidos de acordo com esta invenção, utilizando genes dos grupamentos genéticos biossintéticos caracterizados.

Description

"GRUPAMENTOS GENÉTICOS BIOSSINTÉTICOS DELANTIBIÓTICOS DE A. GARBADINENSIS E A. LIGURIAE"
Campo da Invenção
Esta invenção refere-se à caracterização doagrupamento genético biossintético para o lantibióticoactagardina, identificação de uma nova variante deactagardina e seu agrupamento biossintético, e métodos deprodução e uso de actagardina·, uma nova variante deactagardina produzida numa cepa de A. Iiguriae e variantesde ambos produzidas de acordo com esta invenção, utilizandogenes dos agrupamentos genéticos biossintéticoscaracterizados.
Fundamentos da Invenção
Lantibióticos são peptideos com atividades deantibiótico e outras atividades, produzidos por bactériaGram-positiva. Eles contém dentre outros resíduosmodificados, os aminoácidos de tioéter lantionina emetilantionina, que reticulam a cadeia peptídica numaestrutura policíclica. . Eles foram classificados em doistipos, tipo-A e tipo-B embora essa classificação não sejadestituída de problemas. Lantibióticos tipo-A são em geral,anfifilos alongados, capazes de formar poros em membranasbacterianas e outras membranas plasmáticas. São exemplosnisina e subtilina. Lantibióticos tipo-B, em contraste, sãopeptideos globulares, com conformação definida que inibem asfunções enzimáticas. São exemplos cinamicina e duramicina.
As atividades devidas aos lantibióticos tipo-Btais como cinamicina incluem atividade antimicrobiana,(propiciando aplicação potencial como antibióticos),inibição de enzima conversora em angiotensina (propiciandouma ap potencial na regulação da pressão sangüínea),imunomodulação via inibição de fosfolipase A2 (propiciandouma aplicação potencial como antiinflamatório) einterferência com a biossíntese de prostaglandina e leucotrieno.
Lantibióticos tipo-B parecem exercer suaatividade, interferindo com as atividades enzimáticasmediante bloqueio dos respectivos substratos. Por exemplo,lantibióticos tipo B tais como mersacidina e actagardinaforam vistos como inibidores da biossíntese depeptidoglican, a transglicosilação foi identificada como areação alvo. 0 substrato para esta reação é o lipídio IIprecursor da parede celular encontrada em lipídios. Emboraisto seja um alvo para o lantibiótico vancomicina, o sítiode ação é diferente, tratando-se de um novo sítio de ligaçãoalvo não usado por qualquer fármaco antibacteriano atual.
Para a classe de cinamicina dos lantibióticos tipoB a atividade antibacteriana foi observada, em particularcom cepas de Bacillus, com efeitos descritos na função damembrana, translocação de próton dependente de ATP eabsorção de CA++ e em ATPases. Adicionalmente, relatou-se aformação de poros definidos em membranas planares contendofosfatidiletanolamina . Esses efeitos podem ser atribuídos àligação específica desses lantibióticos tipo B parafosfatidiletanolamina.
Os lantibióticos demonstraram ter eficácia eutilidade como aditivos alimentares e agentesantibacterianos contra Propionibacterium acnes e patógenosproblemáticos, por exemplo, Staphylococcus aureus resistenteà metilcilina (MRSA) que tem ou está desenvolvendoresistência a muitos antibióticos comumente usados, eStreptococcus pneumoniae. Para pesquisas ver Sahl e Bierbaum(1998) Annual Rev. Microbiol 52:41-79; Jack e SAhl (1995)TIBTECH 13:268 278; Gasson (1995) Capitulo 10, Lantibiotics,in Vining and Suttard (eds. Biotechnology Series: Geneticsand Biochemistry of Antibiotic Production, BiotechnologicalI 30 Series 28, páginas 283-306.
Dentro do campo dos antibióticos, há umanecessidade continua para a provisão de novos compostosantibióticos, para superar problemas tais como resistência,biocompatibilidade, toxicidade e semelhantes. Portanto, sãodesejáveis métodos de produção de lantibióticos e a produçãodas formas variantes dos lantibióticos (os quais podem terum diferente perfil de atividade comparado com as formasnativas).
Actagardina é um lantibiótico tetraciclico do tipoB conhecido, de 19 aminoácidos em comprimento (1890 Da). Eletem potente atividade contra patógenos Gram-positivosimportantes tais como Staphyloeoceus aureus e Streptoeoeeuspyogenes tanto in vitro como in vivo em modelos animais. Aestrutura de actagardina é mostrada na Figura 4. O compostoé produzido de um pré-pró-peptideo, a parte c-terminal daqual tem a seqüência polipeptidica SSGWVCTLTIECGTVICAC (SEQID NO: 4). O polipeptideo da SEQ ID NO: 4 é modificado pelasseguintes reticulações, criando estrutura secundária eterciária: CROSSLINK 1-6, Lantionina (Ser-Cys) ; CROSSLINK 7-12, beta-metilantionina (Thr-Cys); CROSSLINK 9-17, beta-metilantionina (Thr-Cys); CROSSLINK 14-19, sulfóxido debeta-metillantionina (Thr-Cys).
Actagardina foi descrita por ser produzida porduas espécies de Actinoplanes; A.garbadinensis e A.Liguriae. Também é co-produzido um análogo em que oCROSSLINK 14-19 não é oxidado ou seja, é um beta-metilantionina não sulfóxido de beta-metilantionina que éaqui denominado desoxi-actagardina.
A US 6.022.851 descreve o isolamento deactagardina de cepas isoladas de A. garbadinensis e A.liguriae.
Apresentação da Invenção
A presente invenção refere-se a informaçãoclonada, seqüenciada e explicada em sua estrutura eregulação relevante ao agrupamento genético biossintéticopara o lantibiótico tipo B actagardina de Actinoplanesgarbadinensis e A. Iiguriae.
Descobriu-se, ainda surpreendentemente, que, em umisolado de A. Iiguriae denominado aqui como A. IiguriaeNCIMB 41362, uma nova forma de actagardina é produzida aqual denominamos actagardina B ou, na forma não oxidada,desoxi-actagardina B. Essas formas têm atividadeantimicrobiana similar para actagardina e são geradas daseqüência polipeptidica primária da SEQ ID NO: 1 que passapor reticulação similar à actagardina. As variantespropiciam novas e úteis alternativas para actagardina. Alémdisso, a identificação dos resíduos em actagardina B que sãodiferentes de actagardina, conduz à provisão de antibióticosadicionais com base nessas diferenças.
Foram isolados ainda, agrupamentos genéticos de,tanto A. garbadinensis produtora de actagardina e A.Iiguriae NCIMB 41362 que compreende os genes para a produçãode actagardina e actagardina B.
Em um aspecto, a presente invenção proporciona anova actagardina B e suas variantes, incluindo variantes combase nas seqüências polipeptídicas primárias de SEQ ID NO: 2e SEQ ID NO: 3, bem como suas variantes.
Num aspecto ulterior, a invenção propicia ácidosnucléicos codificando actagardina B e suas variantes,conjuntos de ácidos nucléicos e suas variantes derivadas dosgrupamentos genéticos supracitados, métodos de produção deactagardina B e suas variantes, e métodos de geração denovas variantes de actagardina B.
Descrição dos Desenhos
A Figura 1 propicia um mapa de um agrupamentogenético regulador codificando actagardina isolado de A.garbadinensis.
A Figura 2 propicia um mapa do agrupamentogenético regulador e codificador isolado de A. Iiguriae quecodifica uma nova variante de actagardina, aqui referidacomo actagardina B.
A Figura 3 é uma figura esquemática mostrando ummétodo aqui apresentado para geração de variantes deactagardina utilizando seqüências de ácido nucléico isoladasde A. garbadinensis ou de A. liguriae.
A Figura 4 é uma representação da estruturaprimária de actagardina madura onde X1-X2 representa Val-Ile, Y é -S(O)- e Z é NH2. "Desoxi-actagardina B" é avariante Vall5Leu Ilel6Val com uma ponte metilantionina nãooxidada entre AbuS14 e AlaS19.
Descrição das Seqüências
Para conveniência do leitor, as seqüências do ·presente pedido, foram enumeradas de forma não seqüencial,como segue:
SEQ ID NO: lê a seqüência polipeptidica primáriade Actagardina B:
SSGWVCTLTIECGTLVCAC.
SEQ ID NO: 2 é a seqüência polipeptidica primáriade Actagardina B variante VV:
S SGWVCTLTIECGTVVCAC.
SEQ ID NO: 3 é a' seqüência polipeptidica primáriade Actagardina B variante LI:
SSGWVCTLTIECGTLICAC.
SEQ ID NO: 4 é a seqüência polipeptidica primáriade Actagardina: SSGWVCTLTIECGTVICAC.
SEQ ID NO: 11 é a seqüência polipeptidica primáriade Ala-Actagardina B:
ASSGWVCTLTIECGTLVCAC.
SEQ ID NO: 12 é a seqüência polipeptidica primáriade Ala-Actagardina B variante VV:
ASSGWVCTLTIECGTVVCAC.SEQ ID NO: 13 é a seqüência polipeptidica primáriade Ala-Actagardina B variante LI:ASSGWVCTLTIECGTLICAC.
SEQ ID NO: 14 é a seqüência polipeptidica primáriade Ala-Actagardina:
ASSGWVCTLTIECGTVICAC.
SEQ ID NO: 212 é a seqüência polipeptidicaprimária de pré-pró-Actagardina B:
MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTLVCAC.
SEQ ID NO: 22 é a seqüência polipeptidica primáriade pré-pró-Actagardina B variante VV:
MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTVVCAC.
SEQ ID NO: 23 é a seqüência polipeptidica primáriade pré-pró-Actagardina B variante LI.:
MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTLICAC.
SEQ ID NO: 119 é a seqüência polipeptidicaprimária de pré-pró-Actagardina
MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTVICAC.
SEQ ID NO: 100 é um não-vetor. seqüência denucleotideo derivada de A. garbadinensis do cosmideoCosAG14.
SEQ ID NO: 101 - 132 são as seqüênciaspolipeptidicas dos quadros de leitura abetos orfl - orf32 daSEQ ID NO: 100, respectivamente.SEQ ID NO: 200 é o não-vetor. Seqüência denucleotídeo derivada de A. Iiguriae do cosmideo CosA102.
SEQ ID NOs: 201 - 231 são as seqüênciaspolipeptidicas dos quadros de leitura abertos orfl - orf31da SEQ ID NO: 200, respectivamente.
SEQ ID NOs: 300-312 são seqüências do iniciadoraqui descritas.
Descrição Detalhada da Invenção
A presente invenção refere-se a agrupamentosgenéticos de SEQ ID NO: 100 e SEQ ID NO: 200 e aospolipeptideos codificados por esses agrupamentos e suasvariantes. O polipeptideo da SEQ ID NO: 119 é um pré-pró-actagardina e o polipeptideo da SEQ ID NO: 212 é pré-pró-actagardina B. Os polipeptideos restantes e suas variantes(como indicado no presente) são referidos aqui genericamentecomo "polipeptideos em grupo". Polipeptideos em grupoderivados da SEQ ID NO: 100 são referidos como"polipeptideos lxx" e os derivados da SEQ ID NO: 200 sãoaqui referidos como "polipeptideos 2xx". Polipeptideos quesão 100% idênticos em ambas as seqüências e unem-se a umpolipeptideo do grupo são referidos como polipeptideos "tiposelvagem". Um polipeptideo em grupo derivado da SEQ ID NO:100 ou SEQ ID NO: 200 podem ser do tipo selvagem ou umavariante.
Um polipeptideo pode estar na formasubstancialmente isolada. Polipeptideos isolados da invençãoserão aqueles indicados supra na forma isolada, isentos ousubstancialmente isentos de material com o qual ele ficanaturalmente associado tal como outros polipeptideos com osquais ele é encontrado na célula. Por exemplo, ospolipeptideos podem, naturalmente, ser formulados comdiluentes ou adjuvantes e ainda assim, por finalidadespráticas, serem isolados.
Um polipeptideo da invenção pode ainda estar naforma substancialmente purificada, em cujo caso, elecompreenderá em geral, o polipeptideo numa preparação em quemais de 90%, por exemplo, 95%, 98% ou 99% do polipeptideo napreparação, é um polipeptideo da invenção.
Polipeptideo Lantibiótico e gene Lantibiótico A
Na presente invenção, é feita referência a umlantibiótico ou polipeptideo LanA, o LantibióticoA ou geneLanA refere-se, em geral, a um tipo de polipeptideo delantibiótico tipo B ou o gene codificando esse peptideo.Assim, a referência a estes, inclui referência a cinamicina,mersacidina, actagardina, e actagardina B e aos genescodificando esses produtos. Referência a uma célulahospedeira codificando produtora de lantibiótico refere-se aqualquer célula hospedeira que em sua foram nativa produz umpolipeptideo LanA como definido mais tarde no presente.
Um polipeptideo LanA é um polipeptideo com atividade antimicrobiana. A atividade antimicrobiana podeser examinada por determinação do valor MIC contra umorganismo de referência, por exemplo, Micrococcus luteus. Umpolipeptideo LanA é considerado apresentando atividadeantimicrobiana, caso ele tenha um valor MIC inferior a ouigual a 16 vezes mais do que o valor de actagardina contra amesma cepa do microrganismo de referência. Na presenteinvenção, o gene LanA A. garbadinensis é referido como actAe o gene LanA A. Iiguriae é referido como LigA.
Outros Polipeptideos Lan
Conforme aqui empregado, a referência a umpolipeptideo "LanM" é um polipeptideo derivado de umagrupamento genético de Lantibiótico que é um fator demodificação necessário para a conversão de um polipeptideoprecursor em um composto lantibiótico. Polipeptideos LanMincluem os da SEQ ID NO: 120 (ActM) ou uma sua variante, SEQID NO: 213 (LigM) ou uma variante desta um polipeptideo cinMcomo indicado em W002/088367, um polipeptideo mrsM conformedescrito em Altena et al., 2000 ou um polipeptideo homólogode um outro agrupamento genético de uma bactéria que produzum lantibiótico tipo B.
Referência a um polipeptideo "LanR" é umpolipeptideo derivado de um agrupamento genético deLantibiótico que é um fator regulador necessário para aregulação da produção de um polipeptideo precursor.Polipeptideos LanR incluem os da SEQ ID NO: 122 (ActR) ouuma variante desta, SEQ ID NO: 216 (LigR) ou uma variantedesta, um polipeptideo cinRl ocnforme indicado em WO02/088367, um polipeptideo mrsRl conforme descrito em Altenaet al. 2000, ou um polipeptideo homólogo de um outroagrupamento genético de uma bactéria que produz umlantibiótico tipo B.
Referência a um polipeptideo "LanT"é umpolipeptideo derivado de um agrupamento genético deLantibiótico que é um fator de transporte necessário para aregulação da produção de um polipeptideo precursor para umcomposto lantibiotico. Polipeptideos LanT incluem os da SEQID NO: 123 (ActT) ou uma variante desta, SEQ ID NO: 214(LigT) ou uma variante desta, um polipeptideo cinT conformeindicado em WO 02/088367, um polipeptideo mrsT conformedescrito em Altena et al. 2000, ou um polipeptideo homólogode um outro agrupamento genético de uma bactéria que produzum lantibiótico tipo B.
Referência a um polipeptideo "LanO" é umpolipeptideo derivado de um agrupamento genético deLantibiótico que é um fator que se acredita estar envolvidona oxidação da forma desoxi de actagardina e os compostos dainvenção em actagardina ou a compostos da invenção em que Yé -S(O)-. Polipeptideos LanO incluem os da SEQ ID NO: 122(ActO) ou uma variante desta, SEQ ID NO: 215 (LigO) ou umavariante desta, um polipeptideo homólogo de um outroagrupamento genético de uma bactéria que produz umlantibiótico tipo B.
Polipeptídeos do agrupamento
Num aspecto, a invenção propicia um polipeptideode agrupamento isolado selecionado de quaisquer SEQ ID NOs:101, 102, 103, 10, 105, 106, 107, 108, 109, 110, 111, 112,113, 114, 115, 116, 117, 118, 120, 212, 122, 123, 124, 125,126, 127, 128, 129, 130, 131, 132, 201, 202, 203, 204, 205,206, 207, 208, 209, 210, 211, 213, 214, 215, 216, 217, 218,219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230 e231. Num outro aspecto, a invenção propicia um polipeptideode agrupamento que é uma variante de quaisquer seqüênciassupracitadas.
Polipeptideos de agrupamento de interesseparticular, incluem polipeptideos Ixx e 2xx que sãopolipeptideos LanM, LanR, LanT ou LanO.
Uma "variante" em relação a um polipeptideo deagrupamento, indica qualquer polipeptideo com uma seqüênciade aminoácido que é diferente de, porém que mostraidentidade de seqüência de aminoácido significativa com aseqüência de aminoácido de um polipeptideo de referência(neste caso qualquer polipeptideo de agrupamento do tiposelvagem) ou um fragmento daquele polipeptideo.
A menos que de outro modo indicado, identidade deseqüência de aminoácido significativa é preferivelmente pelomenos de 80%, mais pref erivelmente 85%, 90% ou 95%, aindamais preferivelmente 98% ou 99%. Uma variante épreferivelmente de uma extensão que é igual ou pelo menos70%, preferivelmente pelo menos 80%, mais preferivelmentepelo menos 90% e mais preferivelmente pelo menos 95% daextensão do polipeptideo de agrupamento do tipo selvagem.
"identidade de seqüência de aminoácidopercentual(%)" é indicado como a percentagem dos resíduos deaminoácido numa seqüência candidato idênticos aos resíduosde aminoácido na seqüência com a qual ele está sendocomparado, após alinhamento das seqüências e introdução deintervalos, caso necessário, para se conseguir umaidentidade de seqüência percentual máxima, não considerandoquaisquer substituições conservadoras como parte daidentidade da seqüência. Os valores de identidadepercentuais aqui usados são gerados por BLAST -2 que foiobtido de Altschul et al (1996);
http://blast.wust/edu/blast/README./html.WU-BLAST-2 usavários parâmetros de pesquisa a maioria dos quais sãoajustados aos valores de default. Os parâmetros ajustáveissão ajustados com os seguintes valores: extensão sobreposta= 1, fração sobreposta = 0,125, limite de palavra (T) = 11.
Os parâmetros HSPS e HSPS2 são valores dinâmicos e sãoestabelecidos pelo próprio programa dependendo da composiçãoda seqüência e composição particular dos dados de baseparticulares contra os quais a seqüência de interesse estasendo pesquisada/ contudo, os valores podem ser ajustadospara aumentar a sensibilidade. Um valor de identidade deseqüência de aminoácido percentual é determinado pelo númerode resíduos idênticos que se combinam dividido pelo númerototal de resíduos da seqüência "maior" na região alinhada,multiplicado por 100. A seqüência "maior" é uma que tem osresíduos mais reais na região alinhada (intervalosintroduzidos por WU BLAST-2 para maximizar a contagem dealinhamento são ignorados).
Convenientemente, uma variante terá uma funçãobiológica do polipeptídeo de referência. Na presenteinvenção, a função biológica é retida onde a variante,quando presente numa célula hospedeira com os outros membrosde seu agrupamento, é capaz de produzir um lantibiótico.Isto pode ser determinado, e,g por provisão de uma célulahospedeira contendo a SEQ ID NO: 100 no caso de uma variantede polipeptídeo do agrupamento lxx, ou SEQ ID NO: 200 nocaso de uma variante do polipeptídeo 2xx, onde as célulashospedeiras produzem actagardina ou actagardina B,respectivamente, modificando a seqüência para codificar avariante e determinando se ainda foi produzido umpolipeptídeo de lantibiótico.
Polipeptídeo precursores
Num outro aspecto, a invenção propiciapolipeptídeos, preferivelmente na forma isolada, os quaissão precursores dos compostos da presente invenção ou deactagardina. Os polipeptídeos precursores incluem ospolipeptídeos de quaisquer SEQ ID NOs: 1-4, SEQ ID NOs: 11-14, SEQ ID NOs: 212, 22, 23 e 119, bem como variantes ouderivados destas, que podem ser convertidos num polipeptídeode lantibiótico.
Uma variante de um polipeptídeo precursor dequaisquer SEQ ID NOs: 1-4, é um polipeptídeo em que um oumais, por exemplo, de 1 a 5 tal como 1, 2, 3, ou 4aminoácidos são substituídos por um outro aminoácido.Preferivelmente, o aminoácido está numa posição selecionadadas posições 2, 3, 4, 5, 8, 10, 11, 13, ou 18, de quaisquerSEQ ID NO: 1-4.
Uma variante de um polipeptídeo precursor dequaisquer SEQ ID NOs: 11-14 é um polipeptídeo em que um oumais, por exemplo, de 1 a 5, tal como 1, 2, 3, ou 4aminoácidos são substituídos por um outro aminoácido.Preferivelmente, o aminoácido está numa posição selecionadade posições 3, 4, 5, 6, 9, 11, 12, 14, ou 19 de quaisquerSEQ ID NOs: 11-14.
Uma variante de um polipeptídeo precursor dequaisquer SEQ ID NOs: 212, 22, 23 e 119 é um polipeptídeo emque um ou mais, por exemplo, de 1 a 5, tal como 1, 2, 3, ou4 aminoácidos da região C-terminal (resíduos 46-64)correspondentes à SEQ ID NOs: 1-4, respectivamente, sãosubstituídos por um outro aminoácido. Preferivelmente, oaminoácido está numa posição selecionada de posiçõescorrespondentes "as posições 3, 4, 5, 8, 10, 11, 13, ou 18de quaisquer SEQ ID NOs: 1-4. Tais variantes podem aindaincluir alterações na região N-terminal que retém pelo menos70%, por exemplo, pelo menos 80%, preferivelmente pelo menos90%, por exemplo, pelo menos 95% das regiões N-terminais(resíduos 1-45) . Por exemplo, uma variante da região N-terminal da SEQ ID NO: 212 ou SEQ ID NO: 119 podemcompreender uma ou mais substituições (por exemplo, 1 a 12,tal como de 1 a 5, por exemplo, 1, 2 ou 3 substituições nasposições, 4, 5, 6, 8, 9, 12, 13, 17, 18, 19, 21 e 31, que osdados da requerente mostram variam entre SEQ ID NO: 212 e119.
As substituições podem ser de um aminoácido por umoutro aminoácido de ocorrência natural e podem sersubstituições conservadoras ou não conservadoras.Substituições conservadoras incluem aqueles dadas na tabelaa seguir, onde os aminoácidos no mesmo bloco na segundacoluna e preferivelmente na mesma linha na terceira colunapodem ser substituídos entre si.<table>table see original document page 17</column></row><table>
Para a SEQ ID NO: 212, as substituições podem serde um aminoácido que é diferente do resíduo de aminoácidolocalizado no local correspondente à SEQ ID NO: 119, ouvice-versa. Em qualquer caso, a substituição pode ser paraintroduzir o aminoácido da SEQ ID NO: 119 para a SEQ ID NO:212, ou vice-versa (por exemplo, Ile na posição 4 da SEQ IDNO: 212 pode ser substituído por Leu, e assim por diante).
Um polipeptídeo precursor pode ser obtido porexpressão de um ácido nucléico codificando o polipeptídeonuma célula que é um não produtor de um lantibiótico.
Compostos
Num aspecto a presente invenção propicia umcomposto de fórmula (I):
<formula>formula see original document page 17</formula>-Χ1-Χ2- representam -Leu-Val-, -Val-Val- ou -Leu-Ile;
Y é -S- ou -S(O)-; eZ é ou NH2 ou Ala-,
ou um sal farmaceuticamente aceitável destes. Numaspecto adicional, a invenção propicia variantes e derivadosbiologicamente ativos desses compostos.
Onde -X1-X2- representam -Leu-Val-, Y é -S(O)-; eZ é NH2 o composto da invenção também é referidocomo actagardina B.
Onde -X1-X2- representam -Leu-Val-, Y é -S(O)-; eZ é Ala o composto da invenção também é referidocomo ala-actagardina B.
Onde -X1-X2- representam -Leu-Val-, Y é -S-; eZ é NH2 o composto da invenção também é referidocomo desoxi-actagardina B.
Onde -X1-X2- representam -Leu-Val-, Y é -S-; eZ é Ala o composto da invenção também é referidocomo ala-desoxi-actagardina B.
Ficará entendido que, por referência a Z como umgrupo H2N-, esta fração representa o N-terminal do resíduoalanina na posição 1 do composto supra. Por referência aogrupo Z sendo Ala-, ficará entendido que, esta fraçãorepresenta uma alanina, convencionalmente referida natécnica como Ala (O), ligado a alanina na posição 1 via umaligação amida.
VariantesUma variante de um composto de fórmula (I) é umcomposto em que um ou mais, por exemplo, 1 a 5, tal como 1,2, 3 ou 4 aminoácidos são substituídos por um outroaminoácido. Preferivelmente, o aminoácido está numa posiçãoselecionada das posições 2, 3, 4, 5, 8, 10, 11, 13, ou 18 docomposto de fórmula (I).
Uma variante também pode compreender umasubstituição na posição 15 ou 16, contanto que, quando ambasas posições 15 e 16 são substituídas e nenhuma das outrasposições sal alterações, 15 e 16 não sejam Val e lie,respectivamente.
Onde Z é Ala-, as variantes dos compostos dainvenção incluem as em que Ala- é substituída por um outroaminoácido (particularmente, um aminoácido de ocorrêncianatural, codificado pelo código genético ou sua isoforma D).
Mais particularmente um aminoácido selecionado do grupo Ile-Lys-, Phe-, Vai-, Glu-, Asp-, His-, Leu, Arg-, Ser- e Trp-. Num aspecto, o aminoácido pode ser selecionado do grupoIle,-, Lys-, Phe-, Vai-, Glu-, Asp-, His-, Leu-, Arg- e Ser-. Tais variantes podem ser produzidas por adição química dosresíduos aos compostos onde Z = H2N, como descrito em US6.022.851. Será considerado que, a adição química de umaminoácido permite ao aminoácido estar na configuração L- ouD. Isto inclui D-Ala, além das formas D de outrosaminoácidos tais como os mencionados supra.
Derivados
Os derivados dos compostos da invenção (incluindoas variantes) são os em que uma ou mais cadeia lateral deaminoácido do composto da invenção foi modificada, porexemplo, por esterificação, amidação, ou oxidação.
Derivados dos compostos da invenção podem serderivados monoamida em uma das funções carbóxi deactagardina, particularmente no C-terminal. Maisparticularmente, um derivado pode ser um composto em que oC-terminal do composto da invenção é de fórmula -COR, em queR representa o grupo -NR1R2, onde R1 e R2 representam,independentemente:
(i) hidrogênio,
(ii) um grupo de fórmula - (CH2) n-NR3R4, em que ηrepresenta um inteiro de 2 a 8 e R3 e R4 representamindependentemente , hidrogênio ou Ci_4 alquila, ou R3 eR4 considerados juntos representam um grupo - (CH2) 3-,(CH2)4-, (CH2)2-O-(CH2)2",-(CH2)2-S-(CH2)2- ou -(CH2)5",
ou Ri e R2 considerados juntos com o átomo denitrogênio adjacente, representam uma fração piperazina quepode ser substituída na posição 4 com um substituinteselecionado de:
(a) C1-4 alquila,
(b) C5-7 cicloalquila,
(c) piridila,
(d) -CH2) ρ -NR5R6, em que ρ representa um inteiro de1 a 8 e R5 e R6 representam, independentemente , hidrogênioou C1-4 alquila;
(e) piperidinila;
(f) piperidinila substituído, onde o piperidinilasubstituído porta um N-substituinte que é C1-4 alquila;(g) benzila, e
(h) benzila substituído, onde a fração fenilaporta 1 ou 2 substituintes selecionados dentre cloro, bromo,nitro, Ci-4 alquila e Ci_4 alcóxi.
Numa modalidade, na fórmula -COR, R representa ogrupo -NR1R2, onde R1 e R2 representam,, independentemente,hidrogênio, um grupo de fórmula -(CH2)n-NR3R4, em que ηrepresenta um inteiro de 2 a 8 e R3 e R4 representamindependentemente, hidrogênio ou Ci_4 alquila, ou R3 eR4 considerados juntos representam um grupo - (CH2) 3-,(CH2)4-, (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- ou -(CH2)5-, ou R1.e R2 considerados juntos com o átomo de nitrogênioadjacente, representam uma fração piperazina que pode sersubstituída na posição 4 com um substituinte selecionado de:C1-4 alquila, C5_7 cicloalquila, piridila, benzila, e benzilasubstituído, onde a fração fenila porta 1 ou 2 substituintesselecionados dentre cloro, bromo, nitro, Ci_4 alquila e Ci_4alcóxi.
Ainda, um derivado pode incluir um composto em quea função carbóxi de uma cadeia lateral de um resíduo internopor exemplo, do resíduo Glull é modificada de -COOH para umgrupo -COOR5 em que R5 representa hidrogênio, C1-4 alquila ouC1-4 alcóxi (C2-4) alquila.
Os derivados N-terminais dos compostos da invençãopodem ser os em que o grupo amino N-terminal -NH2 é,diferentemente, um grupo -NHR6 onde R6 representa Ci_4alquila.
0 termo "C1-4 alquila" representa cadeias alquilalineares ou ramificadas de 1-4 átomos de carbono, comometila, etila, propila, 1-metiletila, butila, 1-meitlpropilaou 1,1-dimetiletila enquanto o termo "C2-4 alquila"representa cadeias alquila lineares ou ramificadas de 2-4átomos de carbono como etila, propila, 1-metiletila, butila,1-metilpropila ou 1,1-dimetiletila. 0 termo "C5-7)cicloalquila representa um grupo cicloalquila selecionadodentre ciclopentila, cicloexila, e cicloeptila.
0 termo Ci_4 alcóxi" representa uma cadeia alcóxilinear ou ramificada de 1-4 átomos de carbono, como metóxi,etóxi, propóxi, 1-metiletóxi, butóxi, 1-metilpropóxi e 1,1-dimetiletóxi.
Os derivados de acordo com a presente invençãopodem ser produzidos de acordo com os métodos descritos paraa manufatura dos derivados de actagardina em EP-0195359,cuja descrição está ora incorporada a titulo de referência.
Modalidades Adicionais
Onde o derivado for um composto em que o C-terminal é de fórmula -COR, em que R representa o grupo -NR1R2, em algumas modalidades, R1 é H e R2 representa umgrupo de fórmula -(CH2)n-NR3R4, em que η representa uminteiro de 2 a 8 e R3 e R4 representam, independentemente ,hidrogênio ou Ci_4 alquila ou R3 e R4 considerados juntosrepresentam um grupo - (CH2) 2-, -(CH2)4-, (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- ou -(CH2)5-. Nessas modalidades, R3 e R4representam, preferivelmente hidrogênio ou Ci_4 alquila. Maispreferivelmente R3 e R4 representam Ci-2 alquila, por exemplo,metila, 0 inteiro η pode ser preferivelmente, de 2-5 e maispreferivelmente, 2-4 por exemplo, 3.
Em outras modalidades, R1 e R2 considerados untoscom o átomo de nitrogênio adjacente, representam uma fraçãopiperazina. 0 substituinte N na posição 4 podepreferivelmente, ser selecionado de:
(a) Ci_4 alquila,
(b) C5-7 cicloalquila,
(c) -CH2) ρ -NR5R6, em que ρ representa um inteiro de1 a 8 e R5 e R6 representam, independentemente , hidrogênioou C1-4 alquila;
(e) piperidinila; e
(f) piperidinila substituído, onde o piperidinilasubstituído porta um N-substituinte que é Ci_4 alquila;
Os grupos piperidinila e piperidinila substituídotêm seu átomos de nitrogênio, preferivelmente na posição 4.
0 N-substituinte pode mais preferivelmente, serselecionado de:
(d) -CH2) ρ -NR5R6, em que ρ representa um inteiro de1 a 8 e R5 e R6 representam, independentemente , hidrogênioou C1-4 alquila;
e
(f) piperidinila substituído, onde o piperidinilasubstituído porta um N-substituinte que é Ci_4 alquila;
Caso o substituinte N seja -CH2) p -NR5R6, então R5 eR6 podem, preferivelmente, ser C1-4 alquila, maispreferivelmente Ci_2 alquila, por exemplo, metila. O inteiroρ é preferivelmente 1 a 4, por exemplo, 3.
Caso o N substituinte seja piperidinilasubstituído, então o N-substituinte é preferivelmente Ci-2alquila, por exemplo, metila. Como mencionado acima, o Nestá de preferência, na posição 4.
Ácido nucléíco
Um ácido nucléico da invenção pode ser um DNA ouRNA, embora, preferivelmente, seja um DNA. Um ácido nucléicoda invenção pode ser de fita simples ou dupla. Num aspecto,a invenção propicia um ácido nucléico isolado codificando umpolipeptídeo de agrupamento. Num outro aspecto, a invençãopropicia um ácido nucléico isolado codificando umpolipeptídeo precursor ou uma variante ou fragmento deste.
Num aspecto posterior, a invenção propicia umácido nucléico isolado o qual pode compreender toda ou umfragmento da SEQ ID NO: 100 ou SEQ ID NO: 200, incluído umfragmento compreendendo uma região intergênica aquirevelada. Tais regiões, podem incluir um promotor ou outroelemento regulador para expressão de um polipeptídeo deagrupamento ou um polipeptídeo precursor da presenteinvenção.
Vinte e cinco nucleotídeos são reconhecidos pelosversados na técnica como um número suficiente denucleotídeos para especificidade ao gene ou agrupamentogenético particular ou uma sub-seqüência destes, como aquirevelado.
Assim, os fragmentos incluem fragmentos da SEQ IDNO: 100 ou SEQ ID NO: 20, ou variantes destes com identidadede seqüência significativa, que são pelo menos 25, porexemplo, pelo menos 30, por exemplo, pelo menos 50, porexemplo, pelo menos 100, por exemplo, pelo menos 250nucleotídeos em comprimento.
Os promotores que são variantes das seqüênciasintergênicas também estão incluídos e as seqüênciasintergênicas específicas (ou partes destas) são modalidadespreferidas. Em todos os casos, onde uma modalidade preferidade um orf, gene, ácido nucléico, polipeptídeo ou promotorfor definido por referência a uma dada seqüência, a invençãoem seu sentido mais amplo, pretende incluir modalidades comas variantes daquela seqüência específica.
0 termo "variante" conforme aqui empregado, emrelação a um dado ácido nucléico (a referência ácidonucléico) indica: qualquer ácido nucléico com uma seqüênciaque é diferente daquela do ácido nucléico de referência, masque se trata de seu complemento ou que mostra identidade deseqüência ao ácido nucléico significativa com ouhibridização sob condições rigorosas, ao ácido nucléico dereferência ou seu complemento ou um fragmento do ácidonucléico de referência ou seu complemento; ou qualquer ácidonucléico que codifique uma seqüência de aminoácido comidentidade de seqüência de aminoácido significativa com aseqüência de aminoácido codificada pelo ácido nucléico dereferência, ou um fragmento daquele ácido nucléico. 0 termo"variante" também se refere aos ácidos nucléicos quediferenciam-se entre si, devido apenas à degeneração docódigo genético, e que, portanto, codificam seqüências deaminoácido deduzidas idênticas. Ácidos nucléicos variantesda invenção são ainda indicados como a seguir. Caso um ácidonucléico variante da invenção seja introduzido aosagrupamentos genéticos aqui identificados, no lugar daseqüência da qual ele é uma variante, e o fragmentorecombinante é introduzido à célula hospedeira adequada sobcondições adequadas para produção de lantibiótico, (porexemplo, como se vê nos Exemplos) então resultará naprodução de uma molécula com uma ou mais atividades de umlantibiótico, (especialmente atividade de antibiótico).Preferivelmente, a produção será regulada para ocorrer a umaalta densidade celular.
A identidade da seqüência de ácido nucléico épreferivelmente pelo menos de 50%, mais preferivelmente 60%,70%, 80%, ou 90%, ainda mais preferivelmente 95% , 98%, ou99%. A identidade da seqüência de ácido nucléicosignificativa, é de preferência, mostrada entre o ácidonucléico variante ( ou uma parte deste) e um fragmento depelo menos 30 resíduos do ácido nucléico de referência, maispreferivelmente um fragmento de pelo menos 60, 90 ou 120resíduos, ainda mais preferivelmente um fragmento de 180,240 ou 300 resíduos, mais preferivelmente todo o ácidonucléico de referência.
"Identidade da seqüência de ácido nucléicopercentual (%)"é tida como a percentagem dos resíduos denucleotídeos numa seqüência candidata que são idênticos aosresíduos de nucleotídeo na seqüência sob comparação. Osvalores de identidade aqui empregados foram gerados pelomódulo BLASTN de WU BLAST-2 ajustado para os parâmetros dedefault, com medida sobreposta e fração sobreposta ajustadoem 1 e 0,125, respectivamente.
Em relação a variantes dos promotores usados napresente invenção, a identidade da seqüência de ácidonucléico é preferivelmente avaliada sobre uma seqüência depelo menos 30 resíduos, mais preferivelmente 40 ou 50resíduos, ainda mais preferivelmente 60 resíduos.
"Condições rigorosas" ou "condições de altarigorosidade" como aqui empregado, pode ser identificadopelos que: (1) empregam baixa resistência iônica e altatemperatura para lavagem, por exemplo, 0,015 M de cloreto desódío/0,0015 citrato de sódio/ 0,1% de dodecil sulfato desódio a 50"C; (2) empregam durante a hibridização um agentedesnaturante tal como formamida, por exemplo, 50% (v/v) deformamida com 0,1% de soro de albumina bovino/0,1% deFicoll/0.1% de polivinilpirrolidona/50 mM de tampão defosfato de soído a pH 6,5 com 750 mM de cloreto de sódio, 75mM de citrato de sódio a 42 0C ou (3) empregam 50% deformamida, 5 χ SSC (NaCl 0,75 M, citrato de sódio 0,075 Μ),fosfato de sódio 50 mM, (pH 6,8), pirofosfato de sódio a0,1%, solução de Denhard χ 5, esperma de salmão submetido atratamento de som em 0,2 χ SSC (cloreto de sódio/citrato desódio) e 50% de formamida a 55 °C seguido pr uma lavagem dealta rigorosidade consistindo de 0,1 χ SSC contendo EDTA a55 ° C.
Quando um ácido nucléico de interesse é tido comoestando em "associação operativa" com um promotor ouseqüência reguladora, isto significa que, a seqüênciapromotora/reguladora é capaz de direcionar a transcrição doácido nucléico de interesse num sistema de expressãoapropriado, com o ácido nucléico de interesse no corretoquadro de leitura para tradução. Preferivelmente, quando umácido nucléico de interesse está em associação operativa comum promotor/seqüência reguladora, o transcripto do ácidonucléico de interesse contém um sitio de ligação aoribossomo localizado apropriadamente para expressão numsistema de expressão adequado do polipeptideo codificadopelo ácido nucléico de interesse. Ver por exemplo, Sambrooket al., (1989) e Ausubel et al. 25 (1995).
Quando um ácido nucléico é referido como "isolado"isto pode significa substancialmente ou completamenteisolado de algum ou de todo o ácido nucléico normalmentepresente em A. garbadinensis e/ou A. liguriae, especialmenteácido nucléico de fora dos segmentos do agrupamento genéticoaqui identificados.
À luz da descrição precedente, será consideradoque, esta invenção propicia seqüências de nucleotideo ou umconjunto de seqüências de nucleotideo codificando oagrupamento genético biossintético de actagardina ouactagardina B. Portanto, todo o agrupamento genético oupartes deste de pelo menos vinte e cinco nucleotideosadjacentes pode ser usado para uma ampla variedade deaplicações, incluindo, sem limitação, a expressão deactagardina ou actagardina B, uso como sondas genéticas paraseleção de outros organismos para moléculas relacionadas esimilar, uso para induzir silenciamento genético esemelhante.Construtor de Expressão
Num aspecto ulterior da invenção, é proporcionadoum construtor de expressão compreendendo um ácido nucléicocodificando um polipeptideo de agrupamento ou umpolipeptideo lantibiotico da invenção, operavelmente ligadoa um promotor.
Num aspecto adicional, é proporcionado um conjuntode construtores de expressão. Um conjunto de construtoresder expressão consiste de duas ou mais seqüências decodificação de polipeptideo da presente invenção e pelomenos de um promotor adequado para expressão dessasseqüências. 0(s) promotor(es) pode(m) ser um promotor com oqual o gene do polipeptideo está naturalmente associado com(ou no caso de uma variante, ou promotor do gene do qual avariante é derivada) ou pode ser um promotor constitutivo oupromotor indutor funcional na célula hospedeira. Promotoresassim, incluem região intergênica da SEQ ID NO: 1OO ou SEQID NO: 200, a jusante de quaisquer quadros de leituraabertos relacionados nas Tabelas 1 e 2.
0(s) promotor (es) será(ao) operavelmente ligadosaos ácidos nucléicos do conjunto dos construtores deexpressão. Por "operavelmente ligado" será entendido que, opromotor será capaz de direcionar a transcrição do ácidonucléico de interesse num sistema de expressão apropriado,com o ácido nucléico de interesse no correto quadro deleitura para tradução. Preferivelmente, quando um ácidonucléico de interesse está em associação operativa com umpromotor/ seqüência reguladora, o transcripto do ácidonucléico de interesse contém um sitio de ligação aoribossomo apropriadamente localizado para expressão numsistema de expressão apropriado do polipeptideo codificadopelo ácido nucléico de interesse Ver por exemplo, Sambrooket al., (1989), Ausubel et al., (2002) e Kieser (2000).
Conjuntos de construtores de expressão de acordocom a invenção incluem numerosas permutações de genescodificando o precursor e polipeptideos de agrupamento dainvenção conforme indicado supra. Em vários aspectos dainvenção, o conjunto incluirá pelo menos um gene LanA.
Exemplos desses conjuntos são dados como "Set l"a "Set 7"abaixo, embora esses conjuntos sejam entendidos comomeramente ilustrativos e não limitantes da invenção.
Conjunto 1: Um gene LanA codificando umpolipeptideo precursor, preferivelmente um polipeptideoprecursor capaz de ser convertido num composto da invenção,mais um gene LanM codificando um polipeptideo LanM. 0polipeptideo LanM é pref erivelmente um LanM da SEQ ID NO:120 ou uma variante desta, ou SEQ ID NO: 213 ou uma variantedesta.
Conjunto 2: Um gene LanA codificando umpolipeptideo precursor, preferivelmente um polipeptideoprecursor capaz de ser convertido num composto da invenção,mais um gene LanR codificando um polipeptideo LanR. 0polipeptideo LanR é pref erivelmente um LanR da SEQ ID NO:122 ou uma variante desta, ou SEQ ID NO: 216 ou uma variantedesta.
Conjunto 3: Um gene LanA codificando umpolipeptídeo precursor, preferivelmente um polipeptideoprecursor capaz de ser convertido num composto da invenção,mais um gene LanM codificando um polipeptideo LanM, mais umgene LanR codificando um polipeptideo LanR. 0 polipeptideoLanM é pref erivelmente um LanM da SEQ ID NO: 120 ou umavariante desta, ou SEQ ID NO: 213 ou uma variante desta. 0polipeptideo LanR é pref erivelmente um LanR da SEQ ID NO:122 ou uma variante desta ou SEQ ID NO: 216 ou uma variantedesta.
Conjunto 4: Os genes do conjunto 3 juntamente comum gene LanO codificando um polipeptideo LanO. 0
polipeptideo LanO é pref erivelmente SEQ ID NO: 122 ou umavariante desta, ou SEQ ID NO: 215 ou uma variante desta.
Conjunto 5: Os genes do conjunto 3 ou Conjunto 4juntamente com um gene LanT codificando um polipeptideoLanT. 0 polipeptideo LanT é preferivelmente SEQ ID NO: 123ou uma variante desta, ou SEQ ID NO: 214 ou uma variantedesta.
Conjunto 6: Os genes das SEQ ID NOs: 116 a 127 ouvariantes destas.
Conjunto 7: Os genes das SEQ ID NOs: 206 a 220 ouvariantes destas.
Num aspecto, um conjunto compreenderá seqüências,todas as quais codificam polipeptideos Ixx ou todascodificando polipeptideos 2xx. Contudo, conjuntos que sãoproduzidos de, tanto polipeptideos Ixx como 2 xx não estãoexcluídos da presente invenção.Vetor de Expressão Recombinante
Num outro aspecto, é proporcionado um vetorrecombinante compreendendo um ou mais construtores deexpressão da invenção. Num aspecto alternativo, éproporcionado um conjunto de vetores recombinantescompreendendo um conjunto de construtores de expressão dainvenção. Vetores adequados compreendendo ácido nucléicopara introdução às bactérias podem ser escolhidos ouconstruídos, os quais contém elementos reguladoresadicionais apropriado, se for necessário, incluindopromotores adicionais, fragmentos de terminação, elementosincrementadores, genes marcadores e outros elementosconforme o caso. vetores podem ser plasmídeos, virais, porexemplo, bacteriófago, ou fagemídeo conforme apropriado.Para mais detalhes ver, por exemplo, Sambrook et al., (1989)Molecular Cloning, A Laboratory Manual 2a. ed. Cold SpringHarbor Laboratory Press, Cold Spring Harbor. Muitas técnicasconhecidas e protocolos para manipulação do ácido nucléico,por exemplo, na preparação de construtores de ácidonucléico, mutagênese, seqüenciamento, introdução do DNA paraas células e expressão genética, bem como análise deproteínas, estão descritos em detalhe em Ausubel et al.,(1995) Current Protocols in Molecular Biology, WileyInterscience Publisher, (1995) . Muitos aspectos do empregodessas técnicas no contexto de Streptomyces spp estãodescritos em detalhe em Hopwood et al., (1985) GeneticManipulation of Streptomyces a Laboratory Manual (Norwich:John Innes Foundation) and Practical Streptomyces Genetics(2000) Kieser Τ. et al., The John Innes Foundation pág. 386.Os relatos de Sambrook et al., Ausubel et al, Hopwwod etal., e Kieser et al., estão todos ora incorporados porreferência para este e todos os outros fins.
Cassetes de Expressão
Num outro aspecto, os inventores desenvolveram umsistema vetor útil para produção e seleção de derivados delantibióticos de actagardina B. Consegue-se isto porintrodução de um ou mais sítios de reconhecimento deendonuclease de restrição ao gene LanA que codifica a SEQ IDNO: 1, 11 ou 212, de modo a produzir um sistema de cassetede expressão. Assim, num outro aspecto, a invenção propiciaum cassete de DNA recombinante compreendendo uma seqüênciade nucleotídeo codificando um polipeptídeo precursor deactagardina B, onde essa seqüência compreende
um primeiro sítio de restrição na, ou adjacente àregião de codificação N-terminal da seqüência decodificação;
opcionalmente, um segundo sítio de restrição ajusante do primeiro sítio de restrição e dentro da seqüênciade codificação, e
um terceiro sítio de restrição na ou adjacente àregião de codificação C-terminal da seqüência decodificação,
onde pelo menos um de tais sítios de restrição nãoocorre dentro da seqüência de codificação LanA mostrada comoSEQ ID NO: 200.
Num aspecto ulterior, é proporcionado um cassetede DNA recombinante compreendendo uma seqüência denucleotideo codificando um polipeptideo precursor deactagardina, onde essa seqüência compreende:
um primeiro sitio de restrição na, ou adjacente àregião de codificação N-terminal da seqüência decodificação;
opcionalmente, um segundo sitio de restrição ajusante do primeiro sitio de restrição e dentro da seqüênciade codificação, e
um terceiro sitio de restrição na ou adjacente àregião de codificação C-terminal da seqüência decodificação,
onde pelo menos um de tais sítios de restrição nãoocorre dentro da seqüência de codificação LanA mostrada comoSEQ ID NO: 100.
Geralmente, todos os dois ou três sítios serãodiferentes entre si. É também desejável que, quando ocassete é realizado por um vetor, os sítios sejamindividuais para aquele vetor.
Num aspecto preferido, o sítio da enzima derestrição que não ocorre naturalmente seja o segundo sítiode restrição e esteja localizado entre os códons 5 e 16, talcomo entre 6 e 15, da seqüência de codificação de SEQ ID NO:1 ou SEQ ID NO: 4.
0 cassete incluirá, também uma seqüência líderLanA e um promotor LanA e pode incluir além disso, um oumais genes de agrupamento, particularmente onde um tal genede agrupamento seja necessário para complementar a perda dogene da célula hospedeira equivalente.
0 cassete da invenção descrito acima pode serengenheirado numa série de formas. Por exemplo, o fragmentoobtido por clivagem do cassete entre os primeiro e segundo,primeiro e terceiro ou segundo e terceiro, sítios derestrição podem ser substituídos com uma seqüência decodificação variante codificando uma variante delantibiótico A. Assim, a invenção propicia uma variante docassete da invenção onde essa variante tem de 1-15substituições de nucleotídeo dentro da região de codificaçãoda seqüência de codificação.
Como um intermediário para a produção de uma talvariante, a seqüência dentre os primeiro e segundo, primeiroe terceiro, ou segundo e terceiro, sítios de restrição podemser substituídos por um fragmento de maior estofo.
Num outro aspecto, o cassete codificando umderivado de lantibiótico pode ser usado para transformar umacélula hospedeira para expressão do derivado, por exemplo,para avaliar suas propriedades antibacterianas.
Num aspecto, uma multiplicidade de cassetes deexpressão podem ser produzidos para propiciar uma bibliotecade diferentes derivados, os quais podem então serselecionados para atividade.
Um cassete de expressão da invenção pode serbaseado em qualquer vetor de clonagem e expressão usado natécnica para expressão dos genes nas células hospedeiras.Tais vetores incluirão uma ou mais origens de replicação,que podem ser sensíveis à temperatura. Os vetores podemincluir um marcador seleiconável, tal como o genecloranfenicol acetil transferase, o gene de resistência paraeritromicina, o gene resistente à apramicina ou o generesistente à tetraciclina. 0 vetor também pode conter umaregião alvo, sendo esta região homóloga a uma seqüênciagenômica presente na célula hospedeira fora do agrupamentodo gene LanA. Um tal vetor pode ser usados para integrar ocassete na seqüência genômica homóloga para a região alvo.
0 cassete de expressão também pode compreender umou mais genes de agrupamento além do gene de LanA ou um seuderivado. Onde uma célula hospedeira for uma célulahospedeira ALanA em que o gene LanA foi inativado num modoque também inativa um tal gene de agrupamento (por exemplo,na cepa apresentada em Altena et al., 2000) é desejável queeste gene ou um gene equivalente será proporcionado nocassete de expressão.
Conforme aqui empregado, por "na, ou adjacente"região de codificação N-terminal" quer-se dizer que, aprimeira base do sitio de restrição está localizada numaposição de seis resíduos a montante do códon ATG daseqüência líder LanA em não mais que seis códons a jusantedo primeiro códon do pró-peptídeo. Preferivelmente, aprimeira base do sítio de restrição está localizada numaposição de doze, preferivelmente seis resíduos a montante aseis resíduos a jusante do primeiro códon da seqüência decodificação do pró-peptídeo.
Num aspecto o primeiro sítio de restrição é umsítio Bg/II.Similarmente, por "na ou adjacente à região decodificação C-terminal" quer-se dizer que, a primeira basedo sitio de restrição inclui ou pelo menos um dosnucleotideos do códon de terminação do pró-peptideo donucleotideo 5' ou 3' do sitio de restrição não é mais quedoze, prf seis resíduos a jusante ou a montante,respectivamente, do códon de terminação.
Num aspecto, o terceiro sítio de restrição é umsítio AvrII.
0 segundo sítio de restrição, quando presente,ficará entre os primeiro e terceiros sítios de restrição.Preferivelmente, o sítio de restrição inclui pelo menos umnucleotideo presente do códon 5 ao códon 16, preferivelmentecódon 8 a 16 da seqüência de codificação do pró-peptídeo.Nos exemplos anexos, um sítio BsrGl foi introduzido poralteração dos códons 6 e 7 da seqüência de codificação ActA.Contudo, outras mudanças são também abrangidas pelaspresente invenção.
é também possível introduzir mais de umaalteração, de modo que o cassete de expressão inclua dois oumais sítios entre os primeiro e terceiros sítios derestrição.
0 cassete pode incluir dois ou três sítios derestrição de ocorrência não natural. No exemplo anexo, todosos três sítios não ocorrem normalmente na seqüência ActAcodificada pela SEQ ID NO: 100.
0 cassete de expressão simplifica a produçãorápida dos derivados de !antibióticos, conforme descritoaqui mais adiante.
Num aspecto, a região que fica entre os primeiro esegundo sítios, os primeiro e terceiro, ou o segundo eterceiro sítios, pode ser substituída por um fragmento deestofo. Onde dois ou mais sítios entre os primeiro eterceiro sítios estão presentes, a região entre qualquer pardesses sítios também pode ser substituída por um fragmentode estofo. Um fragmento de estofo é uma peça de DNA que émaior do que a seqüência que ele substitui. 0 fragmento deestofo pode ser de 50 a 5000 nucleotídeos em tamanho, porexemplo, de cerca de 500 a 2000 nucleotídeo em tamanho. Odesafio em se introduzir esses fragmentos de DNA de estofo éque quando a região é substituída por um oligonucleotídeocodificando um lantibiótico há uma diminuição significativano tamanho do plasmídeo. O plasmídeo resultante pode assim,ser rapidamente purificado distante de qualquer populaçãosecundária de plasmídeo não restrito, eliminando assim,qualquer substrato.
Um cassete da invenção pode ser usado paraintroduzir alterações específicas para a seqüência ActA numvetor que pode então ser introduzido a uma célula hospedeirapara expressão de um lantibiótico. Para se conseguir isto, aseqüência é convenientemente operavelmente ligada àseqüência líder de LanA (por exemplo, ActA ou LigA), que porsua vez, é operavelmente ligada ao promotor LanA (porexemplo, ActA ou LigA).
Além disso ou como uma alternativa, o vetorcompreendendo o cassete também pode incluir um gene LanR. Ogene LanR será localizado a jusante de, e um atrás do outro,da seqüência de codificação do lantibiótico A.
Bibliotecas de expressão
Os cassetes de expressão da invenção podem serusados para propiciar bibliotecas de genes codificando olantibiótico. Tais bibliotecas podem ser produzidas porintrodução ao cassete, entre os primeiro e segundo sítios derestrição, os primeiro e terceiro sítios de restrição, ou osegundo e terceiro sítios de restrição, de umamultiplicidade de seqüências cada uma das quaiscorrespondendo à seqüência ActA ou LigA correspondente alémde terem de 1 a 15, por exemplo, de 1 a 10, preferivelmente1 a 6, por exemplo, 1 a 3 alterações de nucleotídeo,comparado com a parte do pró-peptídeo das SEQ ID NOs: 100 ou200. Preferivelmente, tais alterações resultam numaalteração da proteína codificada pela seqüência. Entretanto,alterações de não codificação não estão excluídas.
Bibliotecas formam um aspecto adicional dainvenção. Tais bibliotecas podem compreender de 10 a 100.000tal como de 10 a 10.000, por exemplo, de 10 a 1.000diferentes seqüências de codificação diferentes que sãovariantes da seqüência de codificação do lantibiótico A deum cassete de expressão.
Um cassete de expressão codificando um derivado delantibiótico A pode ser introduzido a uma célula hospedeirapara expressão do lantibiótico.
Numa modalidade, a biblioteca pode sertransformada em células hospedeiras, e colônias isoladase/ou selecionadas para atividade antibacteriana. Asseqüências do lantibiótico A expressadas pelas colôniasindividuais demonstrando tal atividade podem serdeterminadas. Onde um lantibiótico A demonstre atividade, ainvenção propicia ainda um lantibiótico obtido pelo métododa invenção.
Célula hospedeira
Dois tipos principais de células hospedeiras sãotratadas pela presente invenção. 0 primeiro tipo de célulahospedeira é uma célula hospedeira produtora delantibiótico. Alternativamente, a célula hospedeira pode seruma célula não produtora, ou seja, não contém um gene LanAou seus genes de agrupamento associados, necessários paraprodução de um polipeptideo LanA.
Numa modalidade, a invenção providencia uma célulahospedeira transformada com um conjunto de construtores deexpressão da invenção. O conjunto de construtores pode serquaisquer 4 dos Conjuntos 1 a 7 conforme indicado supra, ouum conjunto baseado em quaisquer outras combinações deácidos nucléicos codificando polipeptideo precursor eagrupado. Numa outra modalidade, a célula hospedeira podeser transformada com um cassete de expressão da invenção.
Numa outra modalidade é proporcionada umabiblioteca de células hospedeiras cada qual compreendendo umdiferente cassete de expressão da invenção.
Célula hospedeira produtora de Lantibiótico ANuma modalidade, a célula hospedeira pode ser umacélula hospedeira produtora de lantibiótico. Uma célulahospedeira produtora de lantibiótico é uma em que umconstrutor de expressão compreendendo um gene LanAr casointroduzido na célula na ausência de qualquer gene deagrupamento, seria expressado e seria produzido umpolipeptideo LanA. Tais células incluem qualquer célulaprodutora de lantibiótico tipo B, tal como qualquer cepa deum bacillus, um actinomiceto, ou um estreptomiceto (porexemplo, S. Iividans ou S. coelicolor), que produz umlantibiótico. Exemplos de tais células incluem uma célulahospedeira produtora de cinamicina (Streptomyces cinnamoneuscinnamoneus DSM 4 0005), ou um Actinoplanes garbadineneis ouA. Iiguriae NCIMB 41362 produtora de actagardina.
Onde a invenção se ligue à produção dos compostosde fórmula (I) em que -X1-X2 representam -Leu-Val-, a célulahospedeira pode ser A liguriae NCIMB 41362 sem qualqueroutra modificação.
Num aspecto, uma célula hospedeira desta classepode compreender uma mutação em seu gene LantibióticAendógeno, tal que o gene não é expressado ou o produtogenético é inativo. Tal célula hospedeira pode ser obtidapor recombinação homóloga alvejada a deletar ou sofrermutação do gene LanA da célula hospedeira. Métodos para seconseguir isto são do conhecimento como tal na técnica eestão ilustrados em Altena et al., (2000) e W02005/093069,cuja descrição está ora incorporada por referência. A célulahospedeira resultante é referida como uma célula hospedeiraALanA. Numa modalidade particular, a célula hospedeira é umacélula hospedeira ALigA A. liguriae NCIMB 41362 em que ogene IigA foi inativado, por exemplo, por mutação oudeleção, por exemplo, deleção ocasionada por recombinaçãohomóloga. Numa outra modalidade a célula hospedeira é umacélula hospedeira AActA A. garbadinensis, em que o gene ActAfoi inativado, por exemplo, por mutação ou deleção, porexemplo, deleção ocasionada por recombinação homóloga.
A transformação de uma célula hospedeira destetipo com outros genes de agrupamentos também é consideradapela presente invenção, embora onde a célula hospedeiraprovidencie genes de agrupamento necessários para a produçãode um LanA a provisão de tais genes de agrupamento éconsiderada opcional.
Célula Não produtora
Uma célula não produtora pode ser qualquer célulahospedeira em que a expressão de um gene LanA codificando umpolipeptideo precursor capaz de ser convertido emactagardina ou uma variante desta ou num composto dainvenção, pode produzir um tal produto, contanto que o geneLanA seja introduzido à célula como parte de um conjunto deconstrutores de expressão que são capazes de converter umpolipeptideo precursor em actagardina ou uma variante destaou num composto da invenção.
Uma célula hospedeira não produtora pode ser umacélula hospedeira bacteriana. Células hospedeirasbacterianas incluem um actinomiceto, ou um estreptomicetopor exemplo, S. Iividans, S. coelicolor ou S. cinnamoneus.
As célula hospedeira podem ser aquelas em que ogene IanO é inativado por mutação ou deleção (ou no caso decélulas não produtoras não estando presentes) ou aquelas emque a expressão do gene IanO é aumentada, por exemplo, porprovisão de duas ou mais copias do gene ou por ligação dogene a um promotor que intensifica a expressão na célulahospedeira. A modulação do gene IanO deste modo pode serconveniente para alterar os niveis relativos de formasoxidadas (Y = -S(O)) e reduzidas (Y = -S-) dos compostos dainvenção produzidos na célula hospedeira.
Produção dos Compostos da Invenção
Os compostos da invenção podem ser produzidos porexpressão de um ácido nucléico, por exemplo, na forma de umconstrutor de expressão codificando um polipeptideoprecursor portado num vetor de expressão recombinante, numacélula hospedeira que porta um gene LanA juntamente com,genes de agrupamento associados, onde for necessário, paraconversão do polipeptideo precursor ao produto. Comoobservado acima, onde a invenção referir-se à produção doscompostos de fórmula (I), em que X1-X2 representam -Leu-Val-a célula hospedeira pode ser A. Iiguriae NCIMB 41361 semqualquer outra modificação.
A introdução do cassete de expressão ou vetor(es)numa célula hospedeira (particularmente para introdução invitro) pode ser referida em geral, sem limitação como"transformação". A isto emprega-se qualquer técnicadisponível. Para as células bacterianas, técnicas adequadaspodem incluir transformação de cloreto de cálcio,transformação auxiliada por polietileno glicol,eletroporação, conjugação e transfecção ou transdução usandobacteriófagos.
Num aspecto, a presente invenção propicia ummétodo de expressão do ácido nucléico da invenção,compreendendo o método a providencia de uma célulahospedeira (ou outro sistema de expressão) cultura da célulahospedeira de modo a expressar o ácido nucléico deinteresse. 0 ácido nucléico de interesse estará num cassetede expressão, tal que a cultura da célula hospedeira conduzà produção de um produto da invenção.
Preferivelmente, o ácido nucléico de interesse éexpressado substancialmente, apenas quando a cultura dacélula hospedeira atinge alta densidade celular, maispreferivelmente na ou próximo da fase estacionária dacultura da célula hospedeira. As culturas celulares na oupróximo da fase estacionária podem ter valores OD650 nafaixa de 1-20. Métodos conhecidos de células de cultura sãodo conhecimento da técnica por exemplo, de Sambrook et al(1989), Ausubel et al., (2002) e (em particular paraStreptomyces spp). Kieser et al., (2000). Os produtos deexpressão dos sistemas de expressão podem ser coletados epurificados. Métodos de isolamento podem compreender acaptura do meio de fermentação usando técnicas de extraçãocom solvente, resina de adsorção tal como resinashidrofóbicas ou métodos de precipitação tais comoprecipitação com sulfato de amônio. Métodos de purificaçãopodem incluir técnicas de cromatografia tais comocromatografia de troca iônica, interação hidrofóbica,extração de fase reversa, de fase normal, de fase sólida eHPLC, por exemplo, conforme descrito na US 5.112.806 paraisolamento de mersacidina.
Seguinte à cultura da célula, os compostos dainvenção podem ser recuperados da cultura da célulahospedeira. Os compostos recuperados podem ser formulados naforma de uma composição farmacêutica, opcionalmente na formade um sal farmaceuticamente aceitável.
Onde as células hospedeiras produzirem uma misturados compostos da invenção, por exemplo, as em que Y ;e -S-ou -S(O)- ou aquelas em que Z é NH2 ou Ala-, ou misturas detodos os quatro tipos, os produtos podem ser isolados usandotécnicas de separação padrão, tais como HPLC, por exemplo,conforme descrito na US 6.022.851 para produção deActagardina e Ala-Actagardina.
Os compostos recuperados podem ser formulados naforma de uma composição farmacêutica, opcionalmente na formade um sal farmaceuticamente aceitável.
Sal farmaceuticamente aceitável
Um "sal farmaceuticamente aceitável" pode ser salde adição de ácido em que a base retém a eficácia biológicae propriedades dos compostos e que seja fisiologicamenteaceitável. Esses sais incluem os formados com ácidosinorgânicos, tais como ácido clorídrico, ácido bromídrico,ácido sulfúrico, ácido nítrico, ácido fosfórico e similares,e os ácidos orgânicos como ácido acético, ácido propiônico,ácido glicólico, ácido pirúvico, ácido oxálico, ácidomálico, ácido malônico, ácido succínico, ácido maléico,ácido fumárico, ácido tartárico, ácido cítrico, ácidobenzóico, ácido cinâmico, ácido mandélico, ácidometanossulfônico, ácido etanossulfônico e ácido para-toluenossulfônico, ácido salicilico entre outros.
Os sais incluem ainda sais básicos, como um sal demetal alcalino ou alcalino terroso, por exemplo, sal desódio, potássio, cálcio ou magnésio.
Composições farmacêuticas
Os lantibióticos da presente invenção podem serformulados juntamente com um ou mais ingredientesfarmaceuticamente aceitáveis do conhecimento dos versados natécnica, incluem, sem limitação, veículos farmaceuticamenteaceitáveis, adjuvantes, excipientes, diluentes, cargas,tampões, conservantes, antioxidantes, lubrificantes,estabilizantes, solubilizantes, tensoativos (por exemplo,agentes de umectação), agentes de mascaramento, agentescolorantes, flavorizantes, e agentes adoçantes. A formulaçãopode ainda compreender outros agentes ativos, e, outrosagente terapêutico ou profilático. Assim, a presenteinvenção propicia ainda composições farmacêuticas, conformeindicado acima e métodos de produção de uma composiçãofarmacêutica compreendendo em mistura pelo menos um compostoativo, juntamente com um ou mais ingredientesfarmaceuticamente aceitáveis conhecidos dos versados natécnica, por exemplo, veículos, adjuvantes, excipientes,etc. Caso sejam formulados como unidades separadas (porexemplo, comprimidos, etc), cada unidade contém umaquantidade predeterminada (dosagem) do composto ativo.
0 termo "farmaceuticamente aceitável" conformeaqui empregado, é pertinente a compostos ingredientes,materiais, composições, formas de dosagem, etc, que são noescopo do julgamento médico adequados para uso em contatocom os tecidos do indivíduo em questão (por exemplo, serhumano) sem toxicidade excessiva, irritação, respostaalérgica, ou outro problema ou complicação, comensurável comuma relação beneficio/risco razoável. Cada veículo,adjuvante, excipiente, etc, deve ser também "aceitável" nossentido de serem compatíveis com os outros ingredientes daformulação.
Composições podem ser formuladas por qualquer viaadequada e meios de administração. Veículosfarmaceuticamente aceitáveis ou diluentes encubem os usadosnas formulações adequadas para administração oral, retal,nasal, tópica (incluindo bucal e sublingual) vaginal ouparenteral (incluindo subcutânea, intramuscular,intravenosa, intradérmica, intratecal e epidural). Asformulações podem se apresentar convenientemente, na formade dosagem unitária e podem ser preparadas por qualquer dosmétodos do conhecimento da técnica na farmácia. Tais métodosincluem a etapa de formar associação do ingrediente ativocom o veículo que constitui um ou mais ingredientesacessórios. Em geral, as formulações são preparadas porassociação uniforme e íntima do ingrediente ativo comveículos líquidos ou veículos sólidos finamente divididos ouambos, e a seguir, e se necessário, conformar o produto.
Para composições sólidas, veículos sólidos nãotóxicos convencionais por exemplo, de grau farmacêutico demanitol, lactose, celulose, derivados de celulose, amido,estearato de magnésio, sacarina sódica, talco, glicose,sacarose, carbonato de magnésio, e similares, podem serempregados. 0 composto ativo conforme supra pode serformulado como supositórios usando, por exemplo,polialquileno glicóis, triglicérides acetilados, esimilares, como o veiculo. Composições líquidasfarmaceuticamente aceitáveis por exemplo, podem serpreparadas por dissolução, dispersão, etc, de um compostoativo conforme acima e adjuvantes farmacêuticos opcionaisnum veículo tal como por exemplo, água, dextrose aquosasalina, glicerol, etanol e similar, para assim, formar umasolução ou suspensão. Caso desejado, a composiçãofarmacêutica para administração pode conter aindaquantidades secundárias de substâncias auxiliares nãotóxicas tais como agentes de umectação ou emulsificação,agentes de tamponamento de pH e similar, por exemplo,acetato de sódio, monolaurato de sorbitan, acetato detrietanolamina de sódio, monolaurato de sorbitan, oleato detrietanolamina, etc. Métodos reais de preparação dessasformas de dosagem são conhecidas ou serão evidentes aosversados na técnica, por exemplo, ver "Remington: TheScience and Practice of Pharmacy" 20a. Edição, 2000 pub.Lippincott, Williams & Wilkins. A composição ou formulação aser administrada irá conter, em qualquer caso uma quantidadedo(s) composto(s) ativo(s) numa quantidade eficaz paraaliviar os sintomas do indivíduo em tratamento.
Podem ser preparadas formas de dosagem oucomposições contendo o ingrediente ativo na faixa de 0,25 a95% com o equilíbrio composto de veículos não tóxicos.
Para administração oral, uma composiçãofarmaceuticamente aceitável não tóxica é formada pelaincorporação de quaisquer excipientes normalmenteempregados, tal como por exemplo, graus farmacêuticos demanitol, lactose, celulose, derivados de celulose,croscarmelose de sódio, amido, estearato de magnésio,sacarina sódica, talco, glicose, sacarose, carbonato demagnésio e similar. Tais composições podem ter a forma desoluções, suspensões, comprimidos, pílulas, cápsulas,pós,formulações de liberação prolongada e similar. Essascomposições podem conter 1-95% do ingrediente ativo, maispreferivelmente 2-50%, e mais preferivelmente 5-8%.
A administração parenteral é em geralcaracterizada por injeção, seja subcutânea, intramuscular ouintravenosa. Injetáveis podem ser preparados nas formasconvencionais, seja como soluções líquidas ou comosuspensões, formas sólidas adequadas para solução oususpensão em líquido antes da injeção ou como emulsões.
Excipientes adequados, são, por exemplo, água, soluçãosalina, dextrose, glicerol, etanol ou similar. Além disso,caso desejado, as composições farmacêuticas praadministração também podem conter quantidades secundárias desubstâncias auxiliares não tóxicas como agentes de umectaçãou de emulsificação, agentes de tamponamento de pH e similar,tal como exemplo acetato de sódio monolaurato de sorbitan,oleato de trietanolamina, acetato de trietanolamina desódio, etc.
Para aplicações tópicas, as composiçõesfarmaceuticamente aceitáveis podem ser formuladas numungüento ou gel adequados contendo o componente ativosuspenso ou dissolvido em um ou mais veículos. Veículos paraadministração tópica dos compostos desta invenção, incluem,sem limitação,a óleo mineral, vaselina líquida, vaselinabranca, propileno glicol, polioxietileno, composto depolioxipropileno, cera emulsificante e água.
Alternativamente, as composições farmaceuticamenteaceitáveis podem ser formuladas numa loção ou creme adequadocontendo os componentes ativos suspensos ou dissolvidos emum ou mais veículos farmaceuticamente aceitáveis. Veículosaceitáveis incluem, sem limitação, óleo mineral,monoestearato de sorbitan, polisorbato 60, cera de ésterescetilicos, álcool cetearílico, 2-octildodecanol, álcoolbenzílico e água.
A percentagem do composto ativo contido nessascomposições parenterais ou tópicas é altamente dependente danatureza específica do mesmo, bem como da atividade docomposto e das necessidades do indivíduo. Contudo, aspercentagens do ingrediente ativo de 0,1% a 10% p/pempregável, será maior caso a composição seja um sólido queserá a seguir diluído nas percentagens adequadas supra.Preferivelmente, a composição irá compreender 0,2-2% p/p doagente ativo em solução.
Veículos, adjuvantes e excipientes adequadosconcernentes a ensinamentos adicionais podem ser encontradosem textos farmacêuticos padrão, por exemplo, Remington: TheScience and Practice of Pharmacy" 20a. Edição 2000, pub.Lippincott, Williams & Wilkins; and Handbook ofPharmaceutical Excipients, 2a. ed., 1994.
Administração dos Compostos
Os compostos e composições de lantibiótico dainvenção podem ser administrados a um indivíduo num métodode tratamento ou profilaxia médica. 0 indivíduo pode ser umhumano ou animal. 0 animal pode ser um mamífero ou outrovertebrado.
Assim, é proposto um composto da invenção paraemprego num método de tratamento ou profilaxia de umindivíduo. É também proporcionado o emprego de um compostoda invenção para manufatura de um medicamento para uso nummétodo de tratamento ou profilaxia de um indivíduo.
0 método de tratamento pode ser de uma infecçãobacteriana, incluindo uma infecção de pele, rtiucosa entéricaou sistêmica.
As variantes e composições podem ser empregadaspara tratamento sistêmico de bacteremia (incluindobacteremia relacionada a cateter), pneumonia, infecções depele e estrutura epidérmica (incluindo infecções de localcirúrgico), endocardite e osteomielite. Esses e outrostratamentos podem ser direcionados contra os agentescausadores tais como estafilococos, estreptococos,enterococos. Os compostos da invenção ou composições dosmesmos, também podem ser usados para tratamento tópico deinfecções de pele incluindo acne, por exemplo,Propionibacterium acnes. As variantes e composições destastambém podem ser usadas no tratamento de infecções ocularestais como conjuntivite e para tratamento oral de infecção notrato superior do intestino, tal como a ocasionada porClostridium difficile incluindo C. difficile com resistênciamúltipla (colite pseudomembranosa) , ou infecções dointestino associadas com Helicobacter pylori.
As variantes podem também ser usadas no tratamentoou prevenção de infecção da pele em ferimentos ouqueimaduras. Além disso as variantes e composições destaspodem ser usadas em métodos prof iláticos, tal como paralimpeza das narinas para prevenção de transmissão de MRSA.Iso pode ser praticado em indivíduos em risco de infecção(por exemplo, pacientes que dão entrada em um hospital) ouem profissionais da saúde ou outros profissionais em riscode serem portadores dessas infecções. A limpeza profiláticada flora intestinal antes de cirurgia abdominal também éconsiderada aqui.
Os compostos de acordo com a invenção podem seradministrados enteralmente (oralmente), parenteralmente(intramuscularmente ou intravenosamente) , ao reto oulocalizado (topicamente). Eles podem ser administrados naforma de soluções, pós (comprimidos, cápsulas incluindomicrocápsulas), ungüentos (cremes ou gel) ou supositórios.Auxiliares possíveis para formulações deste tipo são ascargas e extensores , solventes, emulsificantes,lubrificantes, mascaradores de sabor, colorantes e/ousubstâncias tampão na forma líquida ou sólidafarmaceuticamente aceitáveis. Como uma dose conveniente, 0,1- 100, preferivelmente 0,2-100, mg/kg de peso corpóreo sãoadministrados. São convenientemente administrados em dosesunitárias contendo pelo menos a quantidade diária eficaz doscompostos de acordo com a invenção, por exemplo, 30-3000,preferivelmente 50-1000, mg.
A base experimental da presente invenção incluindoseu melhor modo, será agora descrita em detalhe, à guisa deexemplo apenas, com referência aos desenhos anexos.
Exemplo 1 - Clonagem de Agrupamentos Genéticos
Identificação e clonagem dos agrupamentosgenéticos biossintéticos de actagardina de A. garbadinensise A. Iiguriae.
O/SBDIG-1 é um oligonucleotideo degeneradorotulado com digoxigenina (DIG) composto por 48 bases. Elefoi projetado por tradução da seqüência de. aminoácidoconhecida de actagardina e considerando o uso do códon paraActinoplanes. A análise de hibridização Southern do DNAgenômico isolado de A. garbadinensis e digerido usando aenzima de restrição NcoI identificou um fragmento de ~3kbque hibridizou para O/SBDIG-1. O digesto NcoI do DNAgenômico foi repetido e fragmentos de DNA de ~3kb foramisolados e clonados em pLITMUS28 com corte AfcoI (NEB). Osplasmideos resultantes foram introduzidos em células DH10Bde E. coli sendo a seguir analisados por hibridizaçãoSouthern usando a sonda genética O/SBDIG-1. Um clone dehibridização foi identificado e submetido a análise daseqüência. 0 seqüenciamento revelou que este plasmideodenominado pLITAGOl consiste de DNA codificando o geneestrutural IanA para biossintese de actagardina (actA)juntamente com uma região a montante que se acreditacodificar uma parte de um transportador de açúcar ABC e umaregião a jusante codificando parcialmente Ian M (actM) .
Os indicadores 0/ACT08F e 0/ACT09R foramdenominados com base na seqüência de pLITAGOl . Usando essesiniciadores numa região da PCR juntamente com dNTPsrotulados DIG (Roche) e pLITAGOl como uma matriz, foi geradoum fragmento de DNA rotulado de DIG de 22 96 pb denominadoSBDIG-2.
Duas bibliotecas de cosmideo foram geradas porclonagem do DNA genômico digerido com Sau3AI de A.garbadinensis ATCC 31049 e A. Iiguriae NCIMB 41362 aocosmideos SuperCos 1 (Stratagene) previamente digeridousando BamHI. Cada biblioteca do cosmideo foi analisada porhibridização Southern usando SBDIG-I. Vinte e cincocosmideos de cada biblioteca que se acredita hibridizar paraSBDIG-I foram selecionados e novamente analisados viahibridização Southern usando as sondas O/SBDIG-1 e SBDIG-2Nove cosmideos derivados de dNA genômico de A. garbadinensise onze cosmideos derivados de DNA genômico de A. Iiguriaehibridizaram para ambas as sondas. DNA foi isolado de cadacosmideo e seqüenciado usando os iniciadores T3 e T7. Oscosmideos CosAL02 e CosAG14 foram a seguir seqüenciados porcompleto (Instalação de Seqüenciamento, Departamento deBioquímica, Universidade de Cambridge).
Materiais e MétodosCepas
Cepas bacterianas usadas na presente invençãoestão resumidas na Tabela 5.
Vetores
O cosmideo SuperCosl foi obtido de Stratagene.
O plasmídeo pLITMUS foi obtido de New EnglandBiolabs.
Iniciadores
Nome do iniciador SEQ. ID Seqüência 5'-3'0/SBDIG-I 300 TGGGTSTGCACSCTSACSATCGARTGCGGNAC SGTSATCTGCGCSTGC0/ACT08F 301 TCCAGCACGCGCGGG0/ACT09R 302 GTTCGACCAGCCGCCC
Hibridização SouthernRotulação de sonda de DNA
Sondas de hibridização de DNA foram preparadas
usando o kit de rotulação e detecção de DNA por PCR dedigoxigenina (DIG) fornecido por Roche, de acordo com asinstruções do fabricante.
Transferência de DNA para membrana de náilon
O DNA de interesse foi separada inicialmente poreletroforese de gel de agarose e transferido para umamembrana de náilon (Hybond-N, Amersham Int UK) , usando ummanchamento a vácuo (Q BIO gene). O tempo necessária paradepuração do DNA usando HCl 0,5M foi julgado pelo temponecessário para a faixa do marcador azul de bromofenoltornar-se completamente amarelo (tipicamente 15-20 minutospara um gel de agarose a 0,7%). 0 DNA foi então desnaturadosistematicamente com NaCl 1,5M, NaOH 1,5 M e a seguirneutralizado usando Tris 0,5M, NaCl 1,5M, pH 8,0 para mais15-20 minutos cad. O manchamento completo do DNA foifacilitado por submersão com 20 χ SSCV por um mínimo de 60minutos, sapos remover a membrana manchada do vácuo deixou-se secar ao ar a temperatura ambiente. O DNA foi reticuladocolocando-se a membrana (DNA virado para baixo) numtransiluminador de UV (UVP) e expondo-o a UV a umcomprimento de onda de 365 nm por 5 minutos.
Surgimento de colônia e hibridização
As colônias para seleção por hibridização foramtransferidas para uma membrana da náilon (RocheDiagnostics). Conseguiu-se isto colocando-se a membrana denáilon positivamente carregada sobre as colôniaspressionando-se firmemente por 1 minuto para garantir aeficácia de transferência. Pontos de referência forammarcados na membrana indicando sua orientação com relação ascolônias. A seguir, a membrana foi removida e preparada porhibridização conforme instruções no manual do usuário daRoche (Manual de Aplicação de DIG para hibridização comfiltro).
Hibridização e Desenvolvimento das Membranas
0 DNA foi hibridizado com a sonda preparadadurante a noite 16 horas) a 68 °C num forno dehibridização HB-1000 (UVP). Seguinte à hibridização amembrana foi lavada por 2 períodos de 5 minutos atemperatura ambiente usando citrato de sal de sódio 2X (SSC)+ dodecil sulfato de sódio a 0,1% (SDS). Essas lavagensforam seguida com uma segunda série de lavagens de 2 χ 15minutos a 68 0C usando 1 χ SSC _ 0,1% de SDS para a membranahibridizada na presença de SBDIG-I e 0,1 χ SSC + SDS a 0,1%para a membrana selecionada usando SBDIG-2. As membranasforam a seguir desenvolvidas conforme recomendado no manualdo usuário da Roche (Manual de Aplicação de DIG parahibridização com filtro).
Software
As seqüências de consenso foram analisadas usandoo editor de alinhamento da seqüência BioEdit FramePlotversão 2.3.2 , ClustaIW (EMGL-EBI) e a Basic Local AlignmentSearch Tool (BLAST NCBI).
Resultados e Debate
CosAGl4
0 cosmídeo, CosAG14, contém um fragmento de 38168pares de base do DNA genômico isolado doe A. garbadinensis.
A análise da seqüência identificou DNA codificando o pré-peptídeo líder e de actagardina, a este gene foi atribuído onome actA. Dois resíduos de alanina ficam imediatamente amontante do pré-peptídeoi actagardina. Esses resíduos sãotidos como representando o sítio de reconhecimento paraclivagem de protease do peptídeo líder de actagardina. Aclivagem parcial nesta posição resultante na retenção de umaalanina é tida como resultante da produção de ala-actagardina rotineiramente observada em caldos defermentação de A. garbadineneis. A jusante do gene actA ficauma região de 3162 pb de DNA com forte similaridade deseqüência para varias proteínas IanM, por exemplo, mrsM (30%de identidade) do agrupamento genético mersacidina. estegene putativo foi indicado actM e pensa-se estar envolvidona modificação do pré-peptideo actagardina, catalisando adesidratação e formação de tioéter. Um quadro de leituraaberto indicado de actO, que está localizado 11 pares debase a jusante de actM codifica uma proteína de 341aminoácidos com similitude de seqüência ( ~39% deidentidade) para várias monooxigenases do tipo luciferase.
0 papel da monooxigenase, actO, é tida porcatalisar a incorporação de actagardina com geração deoxigênio de desoxi-actagardina. Na orientação contrária aactO e localizado 62 pb a jusante está o quadro de leituraaberto denominado actR. 0 produto protéico deste orf mostrasimilitude de seqüência (~37% de identidade) para váriosreguladores de resposta de dois componentes. Posicionado 789pb a jusante e na mesma orientação a actR fica uma proteínade 812 aminoácidos atributiva, que demonstra similitude deseqüência (-25% de identidade) para permeases ABCtransportadoras. Esta proteína putativa indicada como actT épotencialmente responsável pela exportação do lantibióticomodificado da célula As seqüência de aminoácido dos segundoe quartos orf a jusante de actT mostra similitude (~30% desimilitude) para quinases reguladoras de resposta eproteínas de ligação a penicilina respectivamente. Trabalhosrecentes neste agrupamento genético biossintético de nisinaem Listeria monocytogenes (Gravesen et al. , 2004)demonstrou, que uma histidina quinase juntamente com umaproteína de ligação à penicilina e proteína de funçãodesconhecida estão envolvidas em conferir resistência ànisina. A presença de genes análogos em proximidade estreitacom actA pode indicar que, esses genes estão envolvidos nummecanismo de resistência sa actagardina.
CosAL02
0 cosmideo CosAL02 contém um fragmento de 40402pares de base de DNA genômico isolado de Actinoplanesliguriae. A análise da seqüência identificou um gene IanAcodificando uma proteína de 64 aminoácidos com fortehomologia de seqüência (50 resíduos idênticos) ao gene actAidentificação no cosmideo CosAG14. Denominamos estasespécies de gene IanA como IigA. A seqüência de aminoácidodo pré-peptídeo desta IanA difere daquele da actagardina emdois resíduos indicados no alinhamento de dois genesmostrados abaixo (SEQ ID NO: 119 e SEQ ID NO: 212):
AG actA MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWCTLTIECGTVICAC64
AL IanA MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTLVCAC64
As mutações V15L e I16V gerariam uma proteína comuma massa idêntica à da actagardina e não seriam portanto,distinguidas por análise de espectroscopia de massa (LC-EM).
O produto potencial do gene IanA identificado em CosAL02representa um novo lantibiótico. Um quadro de leitura abertoque fica 321 pares de base a montante de IigA codifica umaproteína reputada de 286 aminoácidos que demonstrasimilitude de seqüência (4 6% de identidade com a proteínaStrR de Streptomyces glaucescens. A proteína StrR é umativador da ligação ao Dna especifico para passo envolvidona regulação da expressão genética de estreptomicina. Asimilitude de seqüência (31% de identidade) do orf (quadrode leitura aberto) que fica a jusante de IigA sugere que elecodifica um polipeptideo IanM de 104 6 aminoácidos(denominado "ligM" abaixo) que está potencialmente envolvidona modificação do pré-peptideo IigA. O códon inicial doquadro de leitura aberto a jusante a seguir IanT (IigT),superpõem-se ao códon de interrupção de ligM. LigT é umaproteína de 575 aminoácidos com similitude de seqüência avários transportadores ABC. As proteínas LanT sãoresponsáveis pela secreção de, ou o produto maduro final ouo produto pós-traducionalmente modificado ainda ligado a suaseqüência líder.
Como observado no cosmídeo, CosAG14 opróximo orf a jusante de IigT codifica uma proteína de 347aminoácidos com similitude de seqüência (~ 38% deidentidade) para monooxigenases do tipo luciferase. Estamonooxigenase putativa (IigO) é tida estar envolvida naincorporação de oxidação e formação de ponte sulfóxido.Posicionado a jusante de IigO e em orientação contrária ficauma proteína reputada de 217 aminoácidos que mostrasimilitude de seqüência ( -37%) a vários reguladores daresposta de dois componentes. Este regulador putativo foiindicado como IigR.
Tabela 1 - Anotação de CosAG14 (fragmento de 38168pb isolado de A. garbadinensis.
Foi omitida a seqüência estrutural do vetorSuperCoslGene Descrição Posiçã o (DNA) Quadro Tamanho do AAS (pb) Inicio- f im (3 AA)orfl proteína hipotética 482-42 -1 146 (441) MPR-RCGorf 2 proteína hipotética 2824- 2375 -2 149 (450) VSV-ERAorf 3 AAA de ATPase envolvidos na divisão celular 4432- 2876 -2 518 (1557) VER-TNRorf 4 hidrolase de açúcar 6002- 5391 -1 203(612) VGE-NYSorf 5 endoglucanase 6484- 5825 -2 219 (660) MRR-TVRorf 6 citosina/adenin a desaminase 6627- 7112 + 3 161(486) MTI-PAQorf 7 desconhecida 7756- 8997 + 1 413 (1242) VTT-YDKorf 8 desconhecida 9586- 8399 -2 217 (654) VGK-FRGorf 9 piruvato oxidase 11886- 10108 -3 592(1779) VSD-DPSorf 10 hidrolase de aciltransferase 12066- 12866 + 3 266(801) VSR-SGTorf 11 aldose epimerase 13116- 14306 + 3 396 (1191) TEM-TADorf 12 componente ABC periplasmático 14385- 15521 + 3 378 (1137) MPR-AHG<table>table see original document page 62</column></row><table><table>table see original document page 63</column></row><table>Tabela 2 - Anotação de CosAL02 (fragmento de 40402pb isolado de A. líguríae. Foi omitida a seqüênciaestrutural do vetor SuperCosl
<table>table see original document page 64</column></row><table><table>table see original document page 65</column></row><table><table>table see original document page 66</column></row><table><table>table see original document page 67</column></row><table>
EXEMPLO 2 - Cassete de Expressão
Geração de um cassete de expressão
Este exemplo ilustra a produção de um cassete deexpressão de acordo com a presente invenção. Este cassete deexpressão, plasmideo pABvarX foi indicado para geraçãoeficiente ddos genes IanA variantes da presente invenção osquais podem ser introduzido numa célula hospedeira, tal comouma cepa de A. garbadinensis na qual foi removido o actA dotipo selvagem (A. garbadinensis Δ actA). Este plasmideo, umderivado do vetor pSET152 (Bierman et Ia., 1992) seintegrará ao cromossomo do hospedeiro via sitio de ligaçãoattP. A expressão do gene actA mutacionado pelo organismohospedeiro juntamente com os genes do tipo selvagemrestantes do agrupamento genético biossintético deactagardina devem gerar variantes de actagardina.
Construção do plasmideo pAGvarX
A menos que de outro modo indicado, todas asposições citadas referem-se a SEQ ID NO: 100. O esquema paraa construção do plasmideo pAGvarX é demonstrado na Figura 3.A base adjacente ao orf que fica a montante de actA naposição 21237 ao resíduo leucina dentro da região decodificação de actA na posição 21672 foi amplificada por PCRusando os iniciadores O/AGvarOlbF e 0/AGvar02bR (tabela deiniciador) e pLITAGOl como uma matriz. Os iniciadores foramdestinados a introduzir um sítio Xbal de flanco naextremidade 5' e um sítio Bg/II via uma mutação silenciosana região de leucina 3' codificando a actA. Este fragmentofoi introduzido ao pUC19 desfosforilado previamente digeridousando SmaI para produzir pAGvarl.
A região do DNA que mede do C-terminal de actA aoorf a jusante adjacente (21758-21836 inclusive) foiamplificada por PCR usando os iniciadores 0/AGvar05F e0/AGvar06R e pLITAGOl como uma matriz. Os iniciadores foramdestinados a introduzir um sítio AvrII de flanco na posição5' e um sítio EcoRI na extremidade 3'. 0 produto da PCRresultante foi clonado em pUC19 desfosforilado previamentedigerido usando SmaI para dar pAGvar2. Os plasmídeos pAGvarle pAGvar2 foram então digeridos usando XfoaI e o fragmento daPcR de pAGvarl recuperado e clonado ao pAGvar2 digerido comXfoaI desfosforilado, sendo determinada a correta orientaçãodo fragmento de entrada por análise de restrição. 0plasmídeo resultante pAGvar3 foi a seguir digerido usandoBg/II e AvrII e ligado aos oligonucleotídeos anelados0/AGvar03F e 0/AGvar04R gerando pAGvar4. 0 plasmídeo pAGvar4foi subseqüentemente digerido usando EcoRI e XfoaI e ofragmento resultante -620 pb incluindo os oligonucleotídeosanelados introduzidos ao pSET152 previamente digerido usandoEcoRI e Xbal rendendo o vetor pAGvarX.
A região do pAGvarX construída por anelamento dosrespectivos oligonucleotideos introduz um sítio BsrGI viauma mutação silenciosa nos aminoácidos 6 e 7 (CeTrespectivamente) com relação ao peptídeo actagardina. Estesítio pode ser usado em conjunto com, ou o sítio Bg/II amontante ou o sítio AvrII a jusante para introduzir o DNAcodificando mutações alvejadas para quaisquer aminoácidoscodificados dentro do peptídeo actA.
EXEMPLO 3- Célula hospedeira
Este exemplo ilustrará a produção de uma célulahospedeira produtora de lantibiótico em que o gene IanA foiinativado. Neste exemplo, a célula hospedeira é A.garbadinensis em que o gene actA foi deletado.
Construção da cepa A. garbadinensis A actAA cepa A. garbadinensis Δ actA é utilizada comoum hospedeiro para expressar variantes do gene actAestrutural de actagardina. Esta cepa foi gerada de Agarbadinensis tipo selvagem usando a tecnologia Redirectdesenvolvida por Gust et al., 2002. Primeiramente, a regiãodo DNA do cosmídeo CosAG14 codificando actA foi substituídacom o cassete SBdel-I. SBdel-I consiste do gene resistente àapramicina (aac(3)IV) e oriT flanqueado por sítio alvo (FRT)de reconhecimento FLP sendo amplificado por PCR usando oplasmídeo pIJ773 como a matriz, juntamente com osiniciadores 0/SB50F e 0/SB51R que se ligam a 21536 e 21802da SEQ ID NO: 100, respectivamente. Seguindo o protocoloRedirect (Gust et al., 2004), actA de CosAGl4 foisubstituído com SBdel-I gerando o cosmídeo CosAG14. A partecentral do cassete sBdel-1 foi removida a seguir doCosAG14AA por excisão mediada por FLP seguindo a etapa 7 doprotocolo Redirect gerando o CosAG14AA. A remoção destaregião permite a geração de deleções em alinhamento, nãomarcadas, não polares, bem como o uso repetido do mesmomarcador de resistência (Gus et al., 2003).
O segundo estágio de construção foi engenheirar ocosmídeo de modo a poder ser introduzido a A. garbadinensisvia conjugação. Isto começou primeiro, por inserção doCosAG14AA à cepa de E. coli BW25113/pIJ790 portransformação. O gene de ampicilina de CosAG14AA foi entãosubstituído com SBdel-2 seguindo o protocolo REdirect (Guset al., 2004) geando o cosmídeo CosAG14AC. O cassete SBdel-2, como SBdel-1, abriga o gene resistente à apramicina(aac(3)IV) e oriT flanqueado por sítios FRT, mas foi geradousando os iniciadores 0/SB52F e 0/SB53R juntamente com amatriz pIJ773.
O CosAG14AC foi usado para transformar célulaseletrocompetentes de E. coli ET12567/pUZ8002 antes de seremconjugadas com A. garbadinensis. Exconjugantes resistentes àapramicina foram obtidos e sub-cultivados por meio de seisturnos sucessivos de crescimento em TSB sem apramicina. Ascélulas da cultura 6 foram depositadas em meio 65 eincubadas a 30°C. Após 5 dias as colônias foram transferidase colocadas sobre uma área de aproximadamente 1 cm2 em meio65. Após 3 dias de incubação a 30 °C as células fragmentadasforam transferidas para meio 65 contendo apramicina a umaconcentração final de 50 μς/πΛ. Seguinte 72 horas deincubação a 30°C as células sensíveis à apramicina foramselecionadas e os respectivos fragmentos usados parainocular frascos de 50 mL contendo 10 mL de TSB e cultivadasa 30°C, 250 rpm durante 4 dias. DNA genômico foi preparadade cada cultura e analisado por PCR usando oligonucleotídeosO/AGvarOIBf e 0/AGvar06r. Foram gerados os produtos da PCRde um tamanho coerente com a deleção do gene actAParalelamente, a análise dos caldos de fermentação por HPLCdemonstrou que, essas mesmas amostras nao produziramactagardina.
EXEMPLO 4 = Expressão Heteróloga
Este exemplo ilustra a expressão de actagardina doagrupamento genético da SEQ ID NO: 100 numa célulahospedeira que é uma célula não produtora, S. Iividans. Taiscélulas hospedeiras propiciam um meio alternativo de geraçãode variantes ativas desses dois peptídeos.
Os cosmídeos CosAG14 e CosAL02 contendo osagrupamentos genéticos biossinteticos codificando a produçãode actagardina e desoxi-actagardina B não possuem uma origemde transferência (oriT) necessária a facilitar atransferência conjugai para um hospedeiro heterólogo. Usandotecnologia Redirect (Gust et al., 2002) um oriT junto com umsítio de ligação a bacteriófago attP e integrase (int) podemser introduzidos à cadeia central SueprCoslde CosAG14 eCosAL02 substituindo o gene resistente para neomicina, neo.
Construção dos vetores para expressão heteróloga
0 cosmídeo pMJCOSl (fornecido por JIC, Norwich) éum derivado de supercosl (Stratagene) em que o genecodificando para resistência à neomicina foi substituído porum cassete (HEapra) que inclui DNA codificando um oriT,attP, integrase (int) e o gene resistente à apramicina(aac(3)IV). 0 cassete HEapra foi isolado por digestão depMJCOS 1 com SspI e recuperação do DNA de um gel de agarose.Este cassete junto com CosAG14 e CosAL02 foram usados paragerar os cosmídeos CosAG14HEapra e CosAL02HEaprarespectivamente, seguinte ao protocolo REdirect conformedescrito por Gust et al., 2004.
O cosmídeo CosAG14HEapra foi introduzido a seguirpara S. Iividans via conjugação. Exconjugantes resistentes àapramicina de S. Iividans/ CosAG14HEapra foram isolados.Três ex-conjungantes foram usados para inocular meio semeadocom TSB. S. Iividans, A. garbadinensis e A. Iiguriae foramcultivados em paralelo para proporcionar os controles.Seguinte a 48 h de incubação as sementes de cultura foramusadas para inocular uma faixa de quatro meios de produçãodiferentes, ou seja, AAS1, GMl, GM 3 e TSB. Essas culturasforam incubadas por um total de nove dias a 300C com 1,5 mLde alíquotas removidas de cada frasco a cada 5, 7 e 9 diasde incubação. As alíquotas foram centrifugadas a 14.000 rpm(centrífuga de bancada IEC micromax) por 10 minutos sendo ossobrenadantes decantados e usados sem diluição parabioensaios e análise HPLC-EM.
Zonas de inibição (haloes) indicativas da presençade um composto biologicamente ativo foram observadas emtorno de todos os poços carregados com os sobrenadantes deS. Iividans contendo o cosmídeo CosAG14HEapra (S.Iividans/CosAG14HEapra) para os poços carregados comsobrenadante dos caldos de fermentação em TSB onde não foigerado nenhum haloes. Não se observou nenhuma atividadebiológica em torno dos poços carregados com sobrenadante defermentações de S. Iividans cultivada em qualquer dos quatromeios. Haloes ficou evidente em torno de todos os poçoscarregados com sobrenadantes das culturas de A. Iiguriae eA. garbadinensis onde o desenvolvimento foi apoiado. Todosos haloes foram coerentemente gerados desde o primeiro diada amostragem no dia 5 até dia 9 embora uma redução geral nodiâmetros dos haloes ficasse evidente.
A análise HPLC-EM dos sobrenadantes dasfermentações de S. Iividans/ CosAG14HEapra confirma apresença de poços com tempos de retenção e massascorrespondentes a ala (O)actagardina. Esses mesmos picosestavam ausentes dos sobrenadantes de 5. Iividans apenas. Atabela 3 resume a análise de HPLC-EM de sobrenadantes dafermentação de S. Iividans, S. Iividans/ CosAG14HEapra, A.garbadinensis e A. Iiguriae seguinte incubação por 5 dias.
Tabela 3
<table>table see original document page 73</column></row><table><table>table see original document page 74</column></row><table>
EXEMPLO 5 - Atividades Antibacterianas
Determinação MIC
Uma seleção de variantes produzidas como aquidescrito foram testadas adicionalmente para atividade contrauma gama de bactérias. Concentrações inibidoras mínimas(MICs) para todos os organismos com exceção de Streptococcuspneumoniae foram determinada por diluições de antibióticoseriais duplas em caldo Mueller-Hinton (MHB) suplementadocom cloreto de cálcio desidratado a uma concentração decálcio final de 400 μς/πΛ. As concentrações inibidorasmínimas (MICs) para S. pneumoniae foram determinadas pordiluições de antibiótico seriais duplas em caldo de InfusãoCérebro-Coração (BHI) suplementado com 400 μg/ml de cloretode cálcio desidratado. Soluções de estoque do agenteantimicrobiano forma preparadas e armazenadas de acordo comNCCLS padrão M7-A6.
Culturas do caldo ativamente desenvolvidas foramdiluídas para conter 105 a 126 CFU/mL por ajuste de umaabsorbância de 0,2 - 0,3 a 600 nm, equivalente ao padrãoMCFarland 0,5. Eles foram a seguir diluídas adicionalmente1:100 em caldo. Os ensaios foram realizados em duplicata emplacas de microtítulo de 96 poços num volume total de 200 μΐ(160 μΐ caldo, 20 μΐ antibiótico, 20 μΐ inoculo) numa faixade concentração de 64 μg/ml a 0, 06 6g/ml. 0 12° poço daplaca de microtítulo não continha agente antimicrobiano.Usou-se vancominica como um antibiótico de referência paracontrole de qualidade. As placas foram incubadasaerobicamente, agitando-se por 18 - 20 horas a 37°C com oMIC definido como a mais baixa concentração de fármaco quenão produziu crescimento visível.
<table>table see original document page 75</column></row><table><table>table see original document page 76</column></row><table>
EXEMPLO 6 = Análise RMN
Testes de RMN em Actagardina e Desoxi-actagardinaa Espectroscopia de RMN (COSY, TOCSY, HSQC eNOESY) foi usada com sucesso para confirmar os resultados doseqüenciamento obtido dos produtores de actagardina (A.garbadinensis) e desoxi-actagardina B {A. liguriae). Emboraos dados obtidos não permitissem uma avaliação completamentesegura de todos os residuos, estes foram coerentes com asestruturas mostradas na Figura 4 e suficientes paraconfirmar que, desoxi-actagardina B de A. liguriae tem nasposições 15 e 16 os residuos Leu e Vai, respectivamente.
EXEMPLO 7 - Síntese dos Derivados
Os derivados a seguir de desoxi-actagardina Bforam produzidos, em que os grupos amina Z e C-terminaisforam como segue:
Estruturas do Composto
<table>table see original document page 77</column></row><table>
A síntese dos compostos I-XI foi como segue:
Procedimento Geral 1. Preparação dos compostos I - III
Para uma solução de desoxi-actagardina B (20 mg,11 nmol), a amina apropriada (11 nmol) ediisopropiletilamina (7,2 μΐ) , 70 nmol) em dimetilformamidaseco (0,8 ml) foi adicionado 200 μΐ de uma solução dehexafluorfosfato de benzotriazol-l-il-oxi-tris-pirrolidino-fosfonio ((PyBop) (70 mg, 134 nmol) em dimetilformamida seco(1,0 mL). A mistura foi analisada por HPLC para seguir oprogresso da reação, adicionando-se mais alíquotas dasolução de PyBop até que todo o madeiral de partida tivessesido consumido. A análise de HPLC neste estágio tambémdemonstrou quantidades variáveis (5-20%) da diamida. Após otérmino da re, a mistura foi diluída com 30% de acetonitrilaem 20 mM de tampão de fosfato aquoso 20 mM Kpi, -H 7 (10 ml)e a monoamida foi purificada por HPLC preparativa usando ascondições descritas na Tabela 4. As frações apropriadasforam concentradas a 25% de seu volume original edessalgadas por introdução' numa coluna C18 Bond Elut pré-condicionada (500 mg) que foi a seguir lavada por eluição emseqüência com dois volumes de coluna de 30, 40, 70 e 90% demetanol aquoso. A evaporação das frações apropriadasconferiu os produtos desejados como sólidos brancos.
Composto_I:_Desoxi-Actagardina_B_N- [3-dimetilaminopropil monocarboxamida
Foi obtido do acoplamento de desoxi-actagardina Be 3-(dimetilamino)propilamina de acordo com o ProcedimentoGeral 1. Rendimento: 18 mg, 85% . [M+2H 2+] calculado:979,0, encontrado: 980,2
Composto II: Desoxi-Actagardina B N- [1 (l-metil-4-piperidinilJpiperazina monocarboxamida
Foi obtido do acoplamento de desoxi-actagardina Be 4-(piperidino)piperazina de acordo com o ProcedimentoGeral 1. Rendimento: 8 mg, 37% . [M+2H 2 + ] calculado:1019,5; encontrado: 1020,0
[M+3H 3+] calculado: 680,0; encontrado: 680,0
Composto_III:_Desoxi-Actagardina B_1 - [3-dimetilaminopropil piperazina]monocarboxamida
Foi obtido do acoplamento de desoxi-actagardina Be 1-(3-dimetilaminopropil)piperazina de acordo com oProcedimento Geral 1. Rendimento: 10 mg, 46%. [M+2H 2+]calculado: 1013,5, encontrado: 1014,0
Procedimento Geral 2: Preparação dos compostos IV- IX
Uma solução do aminoácido protegido com Fmoc (34nmol) em dimetilformamida seco (0,4 ml) foi tratada com umasolução de hexafluorfosfato de benzotriazol-l-il-oxi-tris-pirrolidino-fosfônio (PyBop) (11,4 mg, 22 nmol) ediisopropiletilamina (11 μΐ, 68 nmol) em dimetilformamidaseco (0,4 ml). A mistura foi então adicionada para umasolução de Desoxi-Actagardina B (2 mg, 11 nmol) emdimetilformamida seco (0,5 ml). A mistura foi deixada atemperatura ambiente por 1 hora após esse tempo, a HPLCanalítica (30-65% acetonitrila em tampão de fosfato aquoso20 mM Kpi, pH7) demonstrou completa conversão do material departida. A mistura de reação foi diluída com 40% de metanolaquoso (20 ml) e a mistura foi passada através de uma colunaBondE lute C18 (500 mg) que tinha sido pré-condicionada porlavagem com dois volumes da coluna de metanol a 100% seguidopor dois volumes de coluna de água. A coluna foi eluídaseqüencialmente com dois volumes de coluna de 40, 50, 60,70, 80, 90 e 100% de metano aquoso. As frações foramanalisadas por HPlC e as frações contendo o produto deacoplamento protegido com Fmoc- foram evaporadas até secura.0 resíduo foi retirado em dimetilformamida (1 ml) epiperidina (50 μΐ) foi adicionado para remover o grupoprotetor Fmoc. O progresso da reação foi monitorado por HPLCe após consumo completo do material de partida a solução foidiluída em 30% de metanol aquoso (20 ml) A mistura foi entãoeluída através de um cartucho Bond Elut C18 (500 mg) comopreviamente descrito, e o produto obtido após evaporaçãodas frações apropriadas foi ainda purificado por HPLCpreparativa usando as condições descritas na Tabela 4. Asfrações apropriadas foram concentradas a 25% de seu volumeoriginal e dessalgadas por introdução numa coluna pré-condicionada C18 Bond Elut (500 mg) que foi a seguir lavadacom eluição seqüencial com dois volumes da coluna de 30, 40,70 e 90% de metanol aquoso. A evaporação das fraçõesapropriadas deu os produtos desejados como sólidos brancos.
Composto IV: D-Ala (0)desoxi-actagardina B
O composto foi preparado de acordo com oprocedimento geral 2 de desoxi-actagardina B e Fmoc-D-alanina com 74% de rendimento [M+2H 2+]. Calculado: 972,5,encontrado: 973,0043/188
Composto V: L-Ile (0)desoxi-actagardina B
0 composto foi preparado de acordo com oprocedimento geral 2 de desoxi-actagardina B e Fmoc-L-isoleucina com 27% de rendimento [M+2H 2+]. Calculado:993,5, encontrado: 993,8
Composto VI: L-Val (0) desoxi-actagardina B
0 composto foi preparado de acordo com oprocedimento geral 2 de desoxi-actagardina B e Fmoc-L-valinacom 55% de rendimento [M+2H 2 + ] . Calculado: 986, 5,encontrado: 985,9Composto VII: L-Phe(0)desoxi-actagardina B
O composto foi preparado de acordo com oprocedimento geral 2 de desoxi-actagardina B e Fmoc-L-fenilalanina com 22% de rendimento [M+2H 2 + ] . Calculado:1010,5 encontrado: 1010,9
Composto VIII: L-Lys (0)desoxi-actagardina B
O composto foi preparado de acordo com oprocedimento geral 2 de desoxi-actagardina B e Bis(Fmoc)-L-lisina com 45% de rendimento [M+2H 2+]. Calculado: 1001,0,encontrado: 1001,6
Composto IX: L-Tryp(0)desoxi-actagardina B
O composto foi preparado de acordo com oprocedimento geral 2 de desoxi-actagardina B e Fmoc-L-triptofano com 55% de rendimento [M+2H 2+] . Calculado:1030,0, encontrado: 1029,9
EXEMPLO 8 - DADOS ANTIBACTERIANOS ADICIONAISDeterminação MIC
Staphylococcus, Streptococcus, Enterococcus, spp.As concentrações inibidoras mínimas (MICs) foramdeterminadas e prepararam-se soluções de estoque do agenteantimicrobiano sendo armazenadas de acordo com o método decaldo de micro-diluição de referência NCCLS para bactériasaeróbicas (M7-A6,2003). MICs foram determinadas pordiluições de antibiótico seriais duplas em caldo deMueller-Hinton (MHB) ou caldo de Infusão Cérebro-Coração(BHI) (S. pneumoniae) . As culturas do caldo de crescimentoativo foram ajustadas em caldo estéril ou por suspensãodireta da colônia (S. pneumoniae) a uma turgidez equivalenteao padrão 0,5 de McFarland ( 1 χ IO8 CFU/mL) , a seguirdiluída uma vez mais em caldo estéril para um inoculo finalem placas microtituladas de 96 poços de aproximadamente 5 χIO5 CFU/mL. Os ensaios foram realizados em duplicada comEnterococcus faecalis ATCC 29212 incluídos como uma cepa decontrole de referência e vancomicina como um antibiótico dereferência para controle de qualidade. As placas foramincubadas aerobicamente, agitando-se por 18 - 20 horas a37°C com MiC definida como a concentração mais baixa dofármaco que não produziu crescimento visível.
Clostridium difficile
As concentrações inibidoras mínimas (MICs) para C.difficile foram determinadas sendo preparadas soluções deestoque do agente antimicrobiano sendo armazenadas de acordocom o método de diluição em agar-agar de referência NCCLSpara bactérias anaeróbicas (M11-A5-1001). Foram preparadasdiluições de antibiótico seriais duplas preparadas em ágarWilkens-Chalgren (WCA). os organismos de teste foramselecionados de crescimento de 48 horas em placas ágarBraziers (C.C.E.Y), sub-cultivadas em caldo Schaedler a umadensidade equivalente a um padrão 0,5 de McFarland (1 χ IO8CFU/ml) com um inoculo final sobre placas WCA deaproximadamente IO5 CFU/poço. Bacteróides fragilis ATCC25285 foi incluída com uma cepa de controle de referência,sendo usado metronidazol como um antibiótico de referênciapara controle de qualidade. Todas as manipulações foramrealizadas em duplicata em atmosfera ambiente em meio pré-reduzido com apenas breve exposição ao oxigênio. As placasforam incubadas anaerobicamente por 48 horas a 37°C com oMIC definido como a concentração do fármaco onde ocorreu umaredução acentuada na aparência do crescimento na placa deteste comparado ao crescimento na placa de controleanaeróbica.
Propionibacterium acnes
Os organismos de teste foram selecionados de 3-7dias de crescimento em ágar Wilkens-Chalgren (WCA)suplementado com furazolidona (1-2 μg/mL). Caldo Wilkens-Chalgren fresco (WCB) foi inoculado por suspensão direta dacolônia com colônias simples de P. acnes e ajustado a umadensidade equivalente ao padrão 0,5 de McFarland (1 χ IO8CFU/mL). sendo então diluídas em WCB estéril para um inoculofinal em placas de microtítulo de 96 poços deaproximadamente IO5 CFU/ml). Foram realizadas diluições deantibiótico seriais' duplas em água estéril com soluções deestoque preparadas e armazenadas de acordo com padrões NCCLS(M11-A5, 2001). Os ensaios foram realizados em duplicada comVancomicina e Clindamicina usado como antibióticos dereferência para controle de qualidade. As placas foramincubadas anaerobicamente por 48-72 horas a 37°C com o MiCdefinido como a concentração do fármaco onde ocorreu umaredução acentuada na aparência do crescimento da placa deteste comparado ao crescimento na placa de controleanaeróbica. Todas as manipulações foram realizadas emduplicata em atmosfera ambiente em meio pré-reduzido comapenas breve exposição ao oxigênio.
Os meios de cultura foram suplementados com íonscálcio (como cloreto de cálcio) a 50 μς/πΛ, exceto ondemaiores concentrações são indicadas. Os valores de MIC emμς/πΛ são mostrados nas Tabelas a seguir:
Tabela 6 - Valores MIC contra Enterococci,
Streptococci e Staphylococci
Organismo Ala(O) Desoxi-
Desoxi- Actagardina
Actagardina B B_
M. Iuteus 4698 +200 μς/ml Ca2+ 4 8
E. faeealis 29212 16 16
E. faeealis 29212 +200 μς/ml Ca2+ 4 8
E. faeealis 29212 +400 μς/πιΐ Ca2+ 4
E. faeeium 7131121 (VRE) >64 >64
E. faeeium 7131121 (VRE) +200 >64 >64μς/ιαΐ Ca 2+
Ε. faeeium 7131121 (VRE) +400 32μς/ml Ca2+
Ε. faeeium 19579 >64 >64
Ε. faeeium 19579 +200 μς/ml Ca2+ >64 >64
E. faeeium 19579 +400 μς/ml Ca2+ 16
S.aureus R33 (MRSA) 32 32
S.aureus R33 (MRSA) +200 μς/ml 16 8Ca2+
S.aureus R33 (MRSA) +400 //g/ml 16Ca2+
S. aureus SHlOOO 16 16
S. aureus SHlOOO +200 μς/πιΐ Ca2+ 8 8
S. aureus SHlOOO +400 μς/ml Ca2+ 16<table>table see original document page 85</column></row><table>
Tabela 7: Valores MIC contra Staphylococcus aureusresistente ao ácido fusidico
<table>table see original document page 85</column></row><table><table>table see original document page 86</column></row><table><table>table see original document page 87</column></row><table>
Tabela 8: Valores MIC contra Staphylococcus aureusresistente à mupirocina
<table>table see original document page 87</column></row><table>
Tabela 9 - Valores MIC contra Propionibacteriuma enes
<table>table see original document page 87</column></row><table>Tabela 10 - Valores MIC contra C. difficile
<table>table see original document page 88</column></row><table>Materiais e Métodos
Os materiais e métodos empregados nos Exemplo 2-7acima são como segue:
Meio
Todos os tampões, soluções e meios foramproduzidos usando osmose reversa (OR), água e continham (porlitro) os seguintes ingredientes:
<table>table see original document page 89</column></row><table><table>table see original document page 90</column></row><table>
Micrococcus luteus foi inoculado de estoquecongelado em caldo Mueller-Hinton 10 mL e crescido durante anoite a 30°C com agitação a 200 rpm. 1 mL desta cultura foiusada para inocular 300 mL de ágar Mueller-Hinton que foientão despejado era discos Petri. Os poços (6 mm de diâmetro)colocados eqüidistantes foram feitos usando um saca-rolhas ea seguir carregados com 50 μΐ da respectiva amostra. A placade bioensaio foi colocada em um fluxo de ar laminar até asamostras introduzidas serem difundidas, em cujo ponto, asplacas foram transferidas para um incubador a 30°C edeixadas durante a noite.
Digestões de endonuclease de restrição
Digestões de DNA com enzimas de restrição foramfeitas em tampões fornecidos e de acordo com as linhas dereferência do fabricante. Tipicamente, para digestospreparativos 5 μg de DNA foi digerido com 12 unidades deenzima por 3 horas à temperatura recomendada. Para digestosanalíticos 0,5 μg de DNA foi digerido com 2 unidades daenzima por 2-3 horas novamente na temperatura recomendada. 0DNA digerido foi analisado por eletroforese de gel deagarose.
Exconjugantes de sub-cultura
Tampões de ágar de exconjugantes fragmentadosforam usados para inocular frascos de 50 mL contendo 8 mL deTSB e 2 pérolas de vidro. As culturas foram incubadas a30°C, 250 rpm por 10 dias, então 100 μL foram removidos eadicionados para 10 mL de TSB num frasco de 50 mL contendo 2pérolas de vidro. Os frascos foram incubados por 2 dias, aseguir 1 mL foi removido e usado para inocular um frasco de50 mL contendo 10 mL de TSB. Usando 1 mL de inoculo um totalde seis sucessivos turnos de crescimento foram realizadoscada qual incubado por 2 dias a 30°C, 250 rpm. As célulasdos seis turnos da sub-cultura foram peletizadas porcentrifugação a 4000 rpm durante 20 minutos (HeraeusSepatech Megafuge) a seguir tratadas com som (MSE SanyoSniprep 150 amplitude de 10-15 μ) por 30 segundos em TSBpara romper o micélio. Diluições seriais (10_1 a IO"5 em TSB)das células tratadas com som foi colocado em meio 65 eincubado a 30°C.
Fermentação para expressão heteróloga
Frascos cônicos de 50 mL cada qual contendo 2contas de vidro e, ou 8 mL de TSB ou meio AASl suplementadocom ácido nalidixico e o apropriado antibiótico seletivoforam inoculados usando tampões de ágar ou 250μ1 de umestoque de glicerol a -80°C. Seguinte a 2-4 dias deincubação a 30°C, 200 rpm, 1,2 ml (3% por cultura semeadafoi usado para inocular 40 mL do respectivo meio de produçãoem frascos cônicos de 250 mL contendo 2 pérolas de vidro.
Essas culturas foram incubadas a 30°C, 200 rpm por 9 dias.Alíquotas de caldo completo de 1,5 mL foram removidasperiodicamente de cada cultura para análise por bioensaioe/ou análise de HPLC-EM.
Fermentação de A. Iiguriae para isolamento dedesoxi-actagardina B
Frascos cônicos de 250 mL cada qual contendo 2pérolas de vidro e 50 mL de meio SV2 foram inoculados com500 μΐ (1%) de células de A. Iiguriae de um estoque deglicerol. Seguinte a 4 dias de incubação a 30°C, 250 rpm, 12ml (3%) por cultura semeada foi usado para inocular 400 mLde GM3 em frascos cônicos de 2 L. Essas culturas foramincubadas a 30°C, 225 rpm por nove dias. O caldo de culturafoi coletado por centrifugação a 4000 rpm (Heraeus SepatechMegafuge) por 30 minutos após o que, o sobrenadante foidecantado da pelota de células.
Fermentação de A.garbadinensis para isolamento deactagardina e Ala (O)-actagardina
Frascos cônicos de 250 mL cada qual contendo 2pérolas de vidro e 50 mL de meio AAS foram inoculados com500 μl (1%) de células de A. garbadinensis de um estoque deglicerol. Seguinte a 4 dias de incubação a 30°C, 250 rpm, 12ml (3%) por cultura semeada foi usado para inocular 400 mLde AAS em frascos cônicos de 2 L. Essas culturas foramincubadas a 30°C, 225 rpm por oito dias. O caldo de culturafoi coletado por centrifugação a 4000 rpm (Heraeus SepatechMegafuge) por 30 minutos após o que, o sobrenadante foidecantado da pelota de células.
Isolamento de Desoxi-actagardina B para Testes MIC
Resina Diaion HP-20 (50 g/L) foi adicionado emisturada com o sobrenadante isolado de uma fermentação deA. Iiguriae e deixado durante a noite a 4°C. A suspensão foifeita em alíquotas em colunas Bond Elut (60 mL) e a resinalavada seqüencialmente com quatro volumes de água seguidopor três volumes assentados de 25, 50, 75 e 100% de metanol.A análise HPlC confirmou a presença de Desoxi-actagardina Bnas frações de 50, 75 e 100% de metanol. Essas frações foramcombinadas, a seguir concentradas a aproximadamente umquarto do volume do agrupamento de partida. O concentrado de1 L do caldo foi carregado em duas colunas C18 Bond Elut (5g) que tinham sido pré-condicionadas por lavagem com doisvolumes de coluna de metanol a 100% seguido por dois volumesda coluna de água. As colunas foram purificadasseqüencialmente com dois volumes de coluna de 50, 60, 70,80, 90% de metanol, seguido por dois volumes de coluna demetanol a 100%. A análise de HPLC confirmou a presença deDesoxi-actagardina B nas frações de 80, 90 e 100% demetanol, sendo essas frações agrupadas e concentradas a umterço do volume de partida. Um volume igual de 4 0 mM defosfato de potássio pH 2,5 em metanol a 50% foi adicionado eo concentrado carregado uniformemente sobre três colunaspré-equilibradas SCX Bond Elut (1 g). As colunas SCX foramlavadas, inicialmente, com fosfato de potássio 40 mM pH 2,5em metanol a 05% e a seguir purificada usando 1,5 volumes decoluna de fosfato de potássio a 250 mM pH 7,0 em metanol a50%. O eluente foi dessalgado por introdução sobre umacoluna C18 Bond Elut (5 g) que tinha sido pré-condicionadacom dois volumes de coluna de metanol seguido por doisvolumes de coluna de água. A coluna foi lavada com doisvolumes de coluna de metanol a 50 5 e 60%. Desoxi-actagardina B foi purificada seguinte adição de dois volumesde coluna cada qual de 70, 80, 90 e 100% de metanol. Asfrações contendo Desoxi-actagardina B purificada conforme seconfirmou por HPLC e análises LC-EM foram agrupadas eevaporadas até secura.
Isolamento de Ala (0)-desoxiactagardina B dafermentação de A. IiguriaeResina Diaion HP-20 (50 g/L) foi misturada comsobrenadante de uma fermentação de quatro litros de A.liguriae e deixada durante a noite a 4°C. A suspensão foicoletada em um funil de sinterização de vidro e a resina foilavada seqüencialmente com quatro volumes assentados de águaseguido por quatro volumes assentados de metanol a 50%.Desoxi-actagardina B e Ala(0)desoxiactagardina B forampurificados da resina por lavagem com cinco volumesassentados de metanol a 100%. A fração de 100% de metanolfoi concentrada a um terço do volume original e foi entãodiluída por adição de água te uma concentração final de 60%de metanol. A solução resultante foi introduzida em quatrocolunas C18 Bond Elut de 10 g antes da lavagem com doisvolumes de coluna de metanol a 50%. Os componentesrelacionados a desoxi-actagardina B foram eluídos da colunausando dois volumes de coluna de metanol/ácido fórmico a0,5%. O eluente resultante foi concentrado por evaporação a40 mL e Ala(0)desoxi-actagardina B foi separado de Desoxi-actagardina B por HPLC preparativa usando as condiçõesdescritas na tabela a seguir:
<table>table see original document page 95</column></row><table><table>table see original document page 96</column></row><table>
Frações contendo Ala(0)desoxi-actagardina B(conforme se confirmou por HPLC e análises LC-EM foramdessalgadas usando colunas C18 Bond Elut ocnforme descritosupra antes de serem evaporada até secura.
Ala (O)-desoxi-actagardina B foi eluida da coluna aum Tempo de retenção = 5,04 minutos.
Análises EM confirmaram uma espécie de 972,2 m/z(M+2H)++
Isolamento de actagardina e Ala (0)-actagardinapara testes MIC
Actagardina e Ala(0)-actagardina foram purificadausando o método descrito para a purificação de Desoxi-actagardina B de A. Iiguriae com a exceção de que foinecessário HPLC preparativa para resolver Ala(0)actagardinae Actagardina seguinte a etapa de SCX Bond Elut. 0 eluenteda coluna SCX Bond Elut foi concentrado por evaporaçãorotativa de 70 a 18 mL e o concentrado resultante foipurificado por HPLC preparativa usando as condiçõesdescritas na Tabela 4. As respectivas frações contendoActagardina e Ala(0)actagardina (conforme confirmado porhPLC e análises de LC-EM) foram dessalgadas usando colunasC18 Bond Elut como descrito previamente antes de seremevaporadas até secura.
Tabela 4 = Condições HPlC Preparativa paraseparação de Actagardina e Ala (0) actagardina_
<table>table see original document page 97</column></row><table><table>table see original document page 98</column></row><table>
Eletroforese de Gel de Agarose
A eletroforese de DNA foi feita conforme descritopor Sambrook et al., 1989. Geles de agarose (0,7 - 1%) forampreparados em tampão TAE contendo uma concentração final d;e0,1 μς/πιΐ de brometo de etidio para permitir a visualizaçãodo DNA por luz UV. 0,1 volumes de solução de carga de gel deagarose IOX foi misturada com as amostras. AS amostras foramintroduzidas no gel com um comprimento de 100 pares de base,1 kb ou escalonamento do digesto HindIII-ΏΝΆ lambda eoperado a 1,5 V/cm. 0 gel foi visualizado a λ = 300 nm efotografado usando uma câmera de video UVP.
Recuperação do DNA dos geles de agarose
Excisou-se o DNA dos geles de agarose e recuperou-se usando um kit de extração de gel Qiaquick (Qiagen) sendoeluido em, ou água purificada por osmose reversa estéril,TRis-HCl (10 mM, pH 8,5)( ou tampão de TE.
Suprimento final
0 suprimento da cavidade 3'terminal criada pordigestão do DNA com enzimas de restrição foi feito usandofragmentos Klenow de DNA polimerase de E. coli. Numa reaçãotípica 1 unidade de enzima foi adicionada por μg de Dnajunto com 250 μΜ cada de dNTP. A reação foi incubada a 25°Cpor 15-30 minutos e interrompida por adição de eDTA a umaconcentração final de 10 mM.Fosforilação de DNA
Produtos da PCR foram tratados com polinucleotídeoquinase T4 a 37°C por 30 minutos, seguindo o método descritopor Sambrook et al., 1989. A enzima foi inativada porincubação a 65°C durante 20 minutos.
Desfosforilação de vetores linearizados
Para evitar auto-ligação dos vetores linearizadosgrupos 5'-fosfato foram removidos usando fosfatase alcalinade camarão (SAP) seguindo as instruções do fabricante. Numareação típica, 1 unidade de SAP foi adicionado para amistura de restrição pela última hora da reação de restriçãodo DNA. A enzima foi inativada por incubação a 65°C durante20 minutos.
Ligações
Ligações de DNA foram feitas ocnforme descrito porSambrook et al., (1989) usando 1 unidade (U) de DNA ligaseT4 num volume total de 15 μΐ e incubação por 12-16 horas a16°C.
Manutenção das culturas bacterianas
Células viáveis foram armazenada como suspensõesde glicerol por congelamento de 0,5 mL da respectiva culturaa -80°C com glicerol a uma concentração final de 10%.Colônias simples de A. garbadinensis e A. Iiguriae foramobtidas por um traço de 50 μΐ de um caldo de fermentação ouestoque de glicerol sobre ou meio 65 ou placas ABB13.
Reação em Cadeia da Polimerase
Reações em Cadeia da Polimerase (PCRs) foramfeitas em um Robocycler Gradient96 de Stratagene. Numareação típica 100-200 ng de matriz de DNA foi misturada com20 pmol de cada iniciador de oligonucleotídeo e dNTP's a 250μΜ cada. Tampão de polimerase de DNA termofílico conformesuprido pela fabricante e DMSO composto até 10% (v/v) cadade um volume final de 50 ou 100 μΐ da mistura de reação .
Uma reação típica começou com um ciclo inicial de 1 minutode desnaturação (94°C), 1 minuto, Y°C (anelamento) por 1minuto e 72°C por X min. e um ciclo final de 72°C por 2 Xminutos. O tempo de prolongamento X foi de 1 minuto por kbdo produto, quando se usou Taq polimerase e 2 minutos por kbdo produto quando se usou Pfu polimerase. A temperatura deanelamento Y foi de 55°C e 4 9°C na geração de pAGvar 1 epAGvar2, respectivamente. As condições usadas para a geraçãode SBdel-I e SBdel-2 foram como descritas no protocoloRedirect (Gust et al., 2004).
Iniciadores<table>table see original document page 101</column></row><table>
Preparação do DNA de plasmídeo
DNA de plasmídeo foi preparado em pequena escala(menos de 20 μg de preparação) por inoculação de 3 mL de 2TYestéril ou LB contendo o apropriado antibiótico com colôniassimples coletadas de placas ágar 2TY (ou LA) . As culturasforam incubadas durante a noite (12-16 horas) a 37°C e 250rpm. As células foram coletadas por centrifugação a 12.000xg por 1 minuto e o DNA de plasmídeo obtido usando kitsMiniprep Wizard (Promega) de acordo com as instruções dofabricante. No caso de preparações maiores de até 100 μg doDNA de plasmídeo, 30 mL de culturas 2TY foram cultivadas e oDNA de plasmídeo extraído usando um kit Midi-prep de Qiagen,seguindo as instruções do fabricante, todas as preparaçõesde plasmídeo foram verificadas por uma combinação de análisede restrição e/ou análise da seqüência.
Preparação de DNA de Cosmldeo
DNA de cosmídeo foi preparado por inoculação de 50mL de 2TY estéril ou LB contendo o apropriado antibióticocom colônias simples coletadas de placas ágar 2TY (ou LA).
As culturas foram incubadas durante a noite (12-16 horas) a37°C e 250 rpm. As células foram coletadas por centrifugaçãoa 4.000 rpm (Heraeus Sepatech Megafuge 2,0R) por 20 minutose o DNA de cosmideo isolado usando um kit Midi-prep deQiagen, seguindo as instruções do fabricante.
Preparação e transformação de células de E. colieletro-competentes
Células DH10B de E. coli eletro-competentes forampreparadas pelo método de Dower et al., (1988) Alíquotas de60 61 de células competentes foram descongeladas e 1,8 μΐ damistura de ligação ou DNA de plasmídeo adicionado. A misturafoi colocada em Civita de eletroporação (Sigma 0,1 cm) etransferida pra um eletroporador (eletroporador - 1000 daStratagene). Uma diferença de potencial de l,8kV/mm (25 μΕ,200Ω) foi aplicada e 0,5 mL de meio 2TY ou LB foi adicionadoa seguir. As células foram então incubadas a 37°C por 45-60minutos permitindo a expressão dos genes resistentes aantibiótico, antes de depositar no apropriado meio seletivo.
Preparação do DNA genômico
Matrizes de DNA genômico foram preparadas usando oprocedimento descrito por Kieser et al., (2000).
Procedimento de conjugação para Actlnoplanes sp.
A conjugação intergenérica entre E. coli eActinoplanes sp. foi realizada seguindo o procedimentodescrito por Heinzelmann et al., (2003) exceto a linhagem deE. coli ET12567/pUB8002 ( Kieser et al. 2000) foi usada nolugar da linhagem de E. coli ET1256/pUB307 (Flett et al.,1997). Os exconjugantes foram transferidos e colocados numaárea de aproximadamente 1 cm2 em meio 65 ou ABB 13 contendo50 μg/ml de ácido nalidixico e do relevante antibióticoseletivo. Essas placas foram incubadas a 30°C por 4-7 diasantes de serem usadas como inoculo para caldos de cultura.
Tabela 5 - Cepas Bacterianas
<table>table see original document page 103</column></row><table><table>table see original document page 104</column></row><table>
Antibióticos
Soluções de estoque de antibiótico forampreparadas em água (a menos que de outro modo indicado) eesterilizadas por filtragem passando através de um filtroMillipore de 0,22 μπι. A soluções dissolvidas em etanol nãoforam esterilizadas (Sambrook et al., 1989). Todos osantibióticos foram armazenados a -20°C. No meio onde se usouapramicina, adicionou-se MgCl2 até uma concentração final de10 mM (de um estoque de 2,5 M).
Solução de estoque concentração de uso
<table>table see original document page 104</column></row><table><table>table see original document page 105</column></row><table><table>table see original document page 106</column></row><table><table>table see original document page 107</column></row><table><table>table see original document page 108</column></row><table><table>table see original document page 109</column></row><table><table>table see original document page 110</column></row><table>Cromatografia Líquida de Alto desempenhoEspectrometria de massa (HPLC-EM)
AS análises HPLC-EM foram realizada num sistemaHPLC da série 1050 de Hewlett Packard ligado a um MicromassPlatform LC (operado com software versão 3.5 de MassLynx)com os seguintes parâmetros:
Coluna: Agilent Zorbax SB-C18 150 χ 4,6 mm 5 μ Velocidadede fluxo: 1 ml/minutos
Fase móvel: A 10% acetonitrila, 0,1% ácido fórmico, 90% águaB 90% acetonitrila, 0,1% ácido fórmico, 90% águaGradiente linear AaB durante 10 minutos, manter 1 minutos,B-A
Comprimento de onda: 200 - 400 nmVolume da injeção: 10 μΐDivisão pós-coluna: 1:10
Espectrômetro de massa: Plattform Micromass LCModo: Eletropulverização positivaFluxo de nitrogênio: 380 1/hrVoltagem do capilar: 40 VDesvio superficial das lentes: 5VDepósito
NCIMB 41362 foi depositada sob o Tratado deBudapeste em 7 de dezembro de 2005 em NCIMB Ltd. Aberdeen,AB21 9YA, Escócia, Reino Unido, por Novacta BiosystemsLimited.
Referências
Altena, K., Guder, A., Cramer, C. and Bierbaum, G.(2000), Biosynthesis of the lantibiotic mersacidin:organization of a type B lantibiotic gene clustes. AppliedEnvironmental Microbiology 66(6): 2565-71.
Ausubel, F. M. Brent, R. Kingston, R. E. Moore,D.D., seidman, J. G. Smith, J. A and Struhl, K. (2002).Current Protocols in Molecular Biology (5a edition. WileyInterscienee Publishers.
Bierman, M., Logan, R., 0'Brien, K. Seno, E. T.Nagaraja Rao, R and Sehoner, B.E. (1992). Plasmid cloningveetors for the conjugai transfer of DNA from Escherichiacoli to Streptomyces spp. Gne 116(1):43-49./
Chatterjee, S., Chatterjee, S., Ganguli, Β. N.Chatterj ee, D.K. Jani, R.K. H., Rupp, R.H, Fehlhaber, H-W.,Kogler, H., Siebert, G and Teetz,m V. (1992) Antibiotic,mersacidin, a process for the preparation thereof and theuse thereof as a pharmaceutical US Patent 5.112.806.
Dower, W.J. Miller, J.F and Ragsdale, C.W (1988).High efficiency transf ormation of E. Coli by high voltageelectroporation. Nucleic Acid Research 16(13):6127-614 5.
Flett, F., Mersinias, V. and Smith, C.P (1997).High efficiency intergeneric conjugai transfer of plasmid NAfrom Escherichia coli to methyl DNA-restrictingStreptomycetes. FEMS Microbiology Letters 155(2): 223-229.
Gravesen A., Kallipolitis, B., Holmstr0m, K.,K0iby, iP.E., Ramnath, M. and Knochelf S. (2004) pbp2229-Mediated nisin resistance mechanism in Listeriamonocytogenes confers cross-protection to class IIabacteriocins and affects virulence gene expression. Appliedand Environmental Microbiology 70(3): 1669-1679.Gust, Β. Challis, G.L. Fowler, Κ. Kieser, Τ. andChater, Κ.F. (2003). PCR-targeted Streptomyces genereplacements identifies a protein domain needed forbiosynthesis of the sesquiterpene soil odor geosmin . PNAS100(4): 1541-1546
Gust, B., Chandra, G., Jakimowiez, D. Yuqing, T.Bruton, c. J and Chater, K. F. (2004). A Red-mediatedgenetic manipulation of antibiotic-producing Streptomyces.Advances in applied microbiology 54:107-128.
Gust, B., Chater, K.F and Kieser, T. E (2002).Methods and materiais for targeted gene disruption inactinomycete bactéria. Patent Application WO 02/103010A1.
Heinzelmann, E., Berger, S., Puk, 0.,reichenstein, B., Wohlleben, W. nd Schwartz, D. (2002). Aglutamate mutase is involved in the biosynthesis of thelipopeptide antibiotic friulimicin in Actinoplanesfriuliensis. Antimicrobial Agents and Chemotherapy 47(2):447-457.
Kieser, T., Bibb, M. J. Buttner, M. J., Chater,K.F and Hopwwod, D. A (2000).
Practical Streptomyees Geneties Norwich, JohnInnes Foundation.
Sambrook, J. Fritseh, E. F. and Maniatis, T.(1989). Molecular Cloning: A laboratory Manual. New York,Cold Spring Harbor Laboratory Press.
Vertesy, L. Herbet, L., Sciell, M. and Wink, J.(2000). Lantibiotie related to aetargardine, and processesfor the preparation e use thereof. US Patent 6.022.851.Listagem da Seqüência
SEQ ID NO : 1 Actagaxdina B:
SSGWVCTLTIECGTLVCAC
SEQ ID NO: 2 Actagaxdina B vaxianteW:
SSGWVCTLTIECGTVVCAC
SEQ ID NO:3 Actagaxdina B varianteLI
SSGWVCTLTIECGTLICAC
SEQ ID NO:4 Actagaxdine:
SSGWVCTLTIECGTVICAC
SEQ ID NO:5 - SEQ ID NO: 10
(Null)
SEQ ID NO: 11 Ala-Actagaxdina B:
ASSGWVCTLTIECGTLVCAC
SEQ ID NO: 12 Ala-Aetagaxdina B vaxianteW:
ASSGWVCTLTIECGTWCAC
SEQ ID NO: 13 Ala-Aetagaxdina B vaxianteLI
ASSGWVCTLTIECGTLICAC
SEQ ID NO: 14 Ala-Aetagaxdina:
ASSGWVCTLTIECGTVICAC
SEQ ID NO: 15-SEQ ID NO:21
(Null)
SEQ ID NO:22 pxé-pxó-Actagaxdina B vaxianteW:
MSAITVETTWKNTDLREDLTAHPAGLGFGELSPEDLREDRTIYAASSGWVCTLTIECGTWCAC
SEQ ID NO:23 pxé-pxó-Actagaxdina B vaxianteLI
MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTLICAC
SEQ ID NO:24-SEQ ID NO: 99
(Null)
SEQ ID NO:100 CosAGl4 (3B168bp)
GATCGGCCGCCGTCAGCTGGAGAAGCGCTGGCTGGCGCGGCTCACCCGCAACGGCCACCCGCATCCGACÇCGGGCGCTGGCGCTGCGGATGGGCGCGGTGGAGTTCGCGGGGCAGCTGGCGCTGCAGCTCGCCGACATGCGCAAGCCCGGCACGCCGTCAGCGACCTGACCCGCTGCTCGACGCAGCTCGCTCGCCGGTCCCGCGCCGCGCCGATCAACTCCGGCAGCACGGCGCGAGCTTCAATCAGCCGGCCCGGCGCACCCCCTACGCCGGTGCGACGAGGCATGCCCGAGACCAGCGCGGCCGCAGAGGGCCGGTCGGCGCCGGACCGGTCAGCGCGCCCGCAATCAGGCCGGCAGGCCCGCCCGGAGCCGGACCGGTCGGCGCGCCCGCAATCAGGCCGACAGGCCCGCCCGGGGTCAGGCTGGTCGGCTGCGCCGGGCCGGCAGGCCGGCGAGCAGCGCGTCGAGCGTCTCGGCATCCGCCCAGCCGTTGACTGACACTGCGCCTGCCGCCGTGACCGTGACCTCAAGGCGGTCCGGTGTCACCGCCACGTCGATCGGCGCGTCCTCGATGCGGTCGCTCAAGCGGATGAACTGCTGGTTCGTCGAGCCGACCCAGGGCCGCTCGTGGTCCAGCAGGTCCTGCCGGAAGGGGCCGGCCACCAGCAGGTCCGTGGCGTCGAGCAGTGCGGCGACGTCGGCCCGGCCGTCCGCGGCGAGAGCGCGCAGACGGGCGTACTCGTAGCCGGTGAACGTCATGACCGAGCGACCCGCCTGCCGCACCCCGGCGGCCACCGCGGCGAGACCGGCCGCCTGCTCGAAÇGGCTCGCCGCCGAGCAGGGTGACACCCGTGGTGCCCGTGGCGAGCACTCGGTCCACCAACTCGGCGGGTGCGGCCGGCACCCCACCGCGTACGCCGAACAAATGCGGATTGAAGCATCCGGCGCACCGGATGGTGCAACCCTGCACCCAGATCGCGGTCCGCTCGCCCGGTCCTTCGGCGGTGGTCCGGTCGAGGAACCGGGCCACCCGCACGAGCGGCGGCTCAGACATCGACTATCCGACCGAAAGGCGTCTGGTTCGCTTGCGGCGGCGGCTCGCACGACAGCCGGTCCCGGACCGCGACGAftCTCGTGTGGTGCGAGCCCGGCCACGGCCGCGAACTCGCCGAGACTGGCGAATCCGCCCCGCGCCTGCCGCGCCGCCACGACGTC
CGCCACCCGCTGCGGGGTGAGACCGGGCACGGCGGCCAACTGTTGCGCGTCCGCGGTGTTGACATCGAGCCGCTCG
GGCGCCGGCTCCAGCAGCGAGCCCGGCACACCCCCAGCCGGCGAGCCCAGCGCGGGCTCCAGCGGGCCGGGCGCGG
GCCCAGCGGGCCAGGCCGCTGTGGGCTCAGCCTGCCGGCCGGCTGCGGGCTCAGCCTGCCAGCCCGCTGCCGGCTC
AGCCTGCCAGCCCGCTGCCGGCTCAGCCTGCCAGCCCGCTGCCGGCTCAGCGGGCCGGCCCGCCGCCGGCTCAGCC
AGCGGGCCCCTCGCGGGCTCAGGCCCGGGAGTCCÇTCCGTAGAACTCTTGCGGCGAAGGAACGACACCCTGTAGTT
GCGGCGGCAGCGGAGTCGCCACGGGAGCGGGCGCGTTCGCCCACGGCGCCTGCTGGGGCTGCGCATACCACGGCAC
GTGAGCGGCACGCCAGCGCAGCCAGGAGGCGTTGATGACGAACGCGTGCGCGACGCTGATCGGCCACACCATGAAC
ATGATCGAGAACGCGAGGTTCTGCTGGAGCGAGTCCTCGGCGCCCTCACTGCCGAGAAAGAAGCAGAAGTTGGCCA
CGACGGTGTAGAGGATCCCGGCGATCCACCACACCGGCCGCCGGGCGCGGATGCCGACGTAGAGGAACCCGACCGC
GGAGAAACAGCTGAAGGGCACCATCGGCGCGATCACCCAGGCGCTGTGCGCGAGGCGCCACGACAGCCGC GCCGGC
CCGGTCCGCTTGCCCGGCTCGTGACCTGGATGCGGCGGATAGGACGGATACGGCTGCTGGTGAGCAGGCGGGAACG
GCGGCAGCGGCTGCTGACCGGAAGCAGGCGGGAACGGCGGCAGCGGCTGCTTGCCGAACGACGGCGGGTACGCCGG
CTGCGAGGCGGGATACGGGTCCTGGCCCGGGTTAGGCGGTGTCCACGTCACGGTTCACGATCCGTTCCCGCGCGGT
GTGCGCCTGACGCGTGTAATCCGCGGTGTACGCACTGTGCCGCACCTGCCCGCCGACGAGATCCTCCAGAACGGCC
ACGTAGTCCAGGCAGCGCTCGCCGAGAATGTCCACGGTCTCGGCACTGACCTGGCCGTCGGGACCGACCGTGACGA
CGATCCGAGGATTCTCCGTCATGCCCGCTCCCTCTCCACCTCGAAGACCAGGCGCACACrGGCGTCCTGGCCGACC
GACTCCGACTCCAGCCGCAGCCCGGCCTCGGGCGCCTGCGCGCGCAGCCGCTCCAGGACGGCCTGCTGGACCCGCC
GCCCGTACGCGGTGTCGACGGTCGTCATCAACTCGACAGCCCCTGGCTGATCGACGCCGGTGACGTGCGCGGCCCA
GATGCCGTCCGCGCCGCGGGTGAACGTCGCGGCGCTCTGCGTCCAGGTCGCCGAGATCGTGTCGCCGGCGGCCGTC
ACGGTGGCTCCGGTGTCGCGCAGCGCCGCATCGAGCAGGGTGACATCGCGCATGCGGGTCTGCACCTGGCAGATCA
GCCGGCCGTCGTCCATCCGGCCCGCGGCGGCCTGAACCGCGGCCGCGCCGGCCATCGCCAACGGCACCAGCAGCAG
TGAAACGCTCACCATGCCCCCCGTTCTCGCTGTGGCCACACCCTATCGGCAGGGTGCGACAAÂTCATCGGTTGGTG
AGGTCCCAGTCGTCGGTGCCGGTGGCCGACACGGCGCGATTGCGGGCCCAGCCGCGCAGGGCGTCGACCCGCTCGG
CCTGCGTCACGCTGAGCGGCACGATGCTCATCACCGCGCGTACGAGATCGTCGCGCCGCAGTGGGCGGCGTTCGGA
GAACGCGTCGAACAGTCCCGCAATGACCGCCTGCTCTATCTCCGCGCCGGAGTAGCCCTCGGTCAGCCCGGCCAGC
TCGGTGAGCAGCTCGGCATCGACCCGCAGCTCGCCGGCGGCACGCCGGTGCCGCAGCGCCCGCCCGAGGTGCACCC
GCCACACCGCGACCCGCTCGGACCGGCTCGGCAGATCCACGAAGAACGTCTCGTCGAAGCGTCCCTTGCGCAACAG
CTCCGGCGGCAGCCCGTCGAAGTCGTXGGCCGTCGCGATCACGAAGACCGGAGTCCGCTTCTCCTGCATCCAGGTG
AGGAAGGxGCCGAAGACCCGGGCACCGGTGCCGGAATCACCCCCGGTGCCGCCGGCGAAGCCCTTCTCGATCTCGT
CGACCCACAGGACGCACGGGGCGACCGCCTCCGCCGTACGCAATGCGGTGCGCATGTTGTGCTCGCTGGAACCGAC
CAGGCCGGAGAAGACACGGCCGATGTCGAAGCGCAGCAGAGGCAGGTTCCAGGCGGTCGCGACCGCCTTGGCGGTC
AGCGACTTGCCGCAGCCCGGCACGCCGGTGATCAGTACGCCGCGCGGCGCGGGCAGGCCGTACCCGGCCGCCTCGT
CCAGCCAGGATCCGTTGCGTTTGACCAGCCAGGCCTTGAGGTTCTCCAGGCCGCCGACGTCGTCGAGCACGGTTCC
GGCGGCCATGAACTCCAGCACGCCCGATTTGCGTACGGTCTGGCGCTTCTCCTCGTGCACGATCTCCAGGTCGGCC
AGATCGAGCACGGCGTCGTTCACCATGGCCCGGGCGTACGCGTTCTCCGCCTCCTGCATGGTCAGGCCGGCCGCGG
CCGTGACGAACCGCTCCCGGCTCTGCTCGTCGAGCTCCACCCGCAGCCGCCCGGACGCGGTGTTCCCGCGCACCAT
GGCGTCGAGCAGAGCGCGCAACTCCAGCTGGCCGGGCAGCGGGAAGTCGACGATCGTGACGTCCTTGCTCAGCTCG
ACCGGCAGGTCCAGTACCGGCGAGAGCAGCACGAGTGTCCGCGGGCTGCGGCCGGCCCGGAACGCCTGGGCGATGT
CGCGCACCAGCCGGACGACCTCCGGGCTCTGCGCGAACAGCGGGTGCAGGTCGCGGAAGACGAAGACAGCCGGTTC
GTCGATGCGCTGCACCGCCCTGAGCGCGTCGGTGGCCCGCTGCGCGCCCGAGCGGGCCTCGCCGTTCGGCTGGACC
AGACCGGCGGTCAGCGACCAGGTCCAGACGGCACGTGGCACGCGGACGAGGTCGGCGTCGCCGGCGATGCCGGCGA
GGTGGTGCAGCGCCCGCTGCTCCTCGTACGTCTCGAGGTGGAGCACCGGGAACCGGGCCTTCAACAGCTGCGCGAA
CGTCTCCGCGAACGACCTCTCCACCGGCGCATCCTACGGCCGCGCCGGCCGGCGTGTCAGAGCCCGGACGGGGTGC
CGGTGGCGTCGCGTGCCGTCCGGTCCTTCCCGCGCTCGACGGGTTCGTTGGGTTGATCGGTCATGGCATCCTCCTG
CTCAGTCCGGGCGGTAGACGGCGGTGTCCCCGGACACGGCGCCGGGGTCGTACCCCGAGCGGCCGGTTTCCTCCGT
GGTGTCCTGCTCGTCAGCGCCGGCGCCTGTCGACTCGCCGGGTTTGCGCAGTGACGCCGCGTATGCCGGGGTTCCG
TCCGGCTCGTCCGTGGGATGCCGCTGGAGTTGTTCTCGGTCATCGGTCATGAACGGCGGACTTCCCTGCAAGAGCG
CGGACAAACGTGGTCGTTTATCCCGCAGCCGGGCGGGCAGTCGTCCACCATGGAACCCATCGGTGACCCTGACGAG
CAGACCGGCGACTTCGCCGAAGAGCACGAACTGACCGAGGTGACAGCCGAGGAGGACGACGACGGCGAGCCGGAGA
GCCCGGATCGCTGGACCGGCGGCATGGACTCCGACGGTCCCCCGTGACCTGCGGCTACGATCCCTCACAGGTGCCC
GCCCCGCCGACGACCCGAGGTTCGTAGCCGTTGTCCTCCATCACCGAGCTGACCGAGTCCGTGCGTGCCTTCGCGC
GCGAGCGCAACTGGGAGCAGTTCCACACGCCGAAGAACCTCGCGATGGCCCTGGCCGGCGAGGTCGGTGAGCTTCT
GGCCGAGTTCCAGTGGCTGACGCCGGAACAATCAGCCGCGGTCATGCGCGATCCCGATCTCGGCCCGCGGGTCCGG
GCCGAGATCGGAGACGTCACGATCTATCTCGTACGCCTGGCGGACGTGCTCGGCATCGACCTGGTCGAGGCGGCCA
CCGACAAGTTGGCGGAAGCCGGCCGCCGCTACACCGrCGAAGCCGCCCGCGACTCGGCCGCCAAGATCGATCAGCT
GTAGTTCAGCGAGAAGTTGTTGACCGTGAAGTTGGACTGACCGGCGGTGCCGCTGATCTCGAAGCCGAACTGCGCC
TCGCCGACCGTCACGTCACCCCACCAGCCGTTGGTGCGCAGCCAGTTCAGGATCGCCAGGATGTCGACGGTGCCGG
AGTTCGTGTTGGTACGGATGAACGAGAAGACCGCGTTGGCGCCGTTCGACCCGCGGTAGACGTTCCAGGTGTGCCC
GCCGACGGACAGGTTGCGGACGTTCGGCACCGCGCCGTTGGCGTCGTACTGTTCGGCGATCGGCCCGACCGCGCCC
TGCTGGTTGGTCCAGArCATGACCTCGTAGGCGTGGTTGTTCGCCCAGATGTCGTAGGTCGTCGAGTAGTCGCCGCTGGACGGCACCGACACGTTGAAGGAGCTCGTCAGAGAATTGAGCGAGCTCAGCGTACGGTTGAGGGTCTTTCCGGT
GTTGGGGTAGGACTTGACCCCGCTGGTGCGCGGGTGATTCGCGACGACGCCCCAGTTGGTGCCGCTGCGCGCCCAG
ATGGTCTGGGTGCCGGCGCCCGAGCCCCAGATGTTGTTGTGAGGATGTATCCGTTGTTGGTCCAGTTCGCCCACTG
TCCCGAGTCGACCCAGACGGCGTCGCTCGGTACGCCGTTGGTGGGCGGCTGCGAGCTCGGGCTGGTGGGGCCAGCC
GATCCGGTGCAGGCGGTCCCGTTGAGCGTGAACGTGCCCGGTGCCGGGGTGGCGGCGCCGGAGCCGTTGAATCCGA
ACGACACGGTCGCGTTGGTGCCGACGGATCCGTTGTAGCCGGCGTTGCGGGCGGTGACCTGCGATCCGCTCTGGGT
CAGGCTGGTGTTCCAGGCCTGGGTGACGGTCTGCCCGCCGGAGTAGGACCAGACCAACGTCCAGTTCGTGAGCGGA
TCACCCAGGTXGGTGATGGTGACGTTGGCGCCGAAGCCGCCGGGCCACTGGCTGCTCACGGTGTAGGCGACGCGGC
AGCCGGCCGCGGCGGACGCCGGGAGCGCGGTGACGACGCCGGCACCGGCGATGAGGGCCGCCGAGGCGGCCAGGGA
GAGCGCGAGAGTACGTCTGCGCATGCCGTTCCAATCTCGGAGGGGGAACACACGACGCTCGTCGAAGCGCTTCGAT
AATGAAGGCTGGGGATCTACGAGTGTCGATGCGGGATGAGGCCGATGTTACGACCCGCCGCCGCGGCGAGGCAACC
GCTACCTTGGGCGCATGACGATCACCGAGACCGATCTCGCCCACCTGCGCCGATGCGTCGACCTGGCCCGCGAGGC
CCTCGACGAÇGGCGACGAGCCGTTCGGTTCCGTCCTGGTCTCCGCCGACGGCAAGGTGCTGTTCGAGGACCGCAAC
CGGGTGAGGCACGGCGACGCCACCCAGCACCCGGAGTTCGCGATCTCCCGCTGGGCGGCCGAGCACCTGACCCCGC
GGGAGCGCGCCAGCGCGACGGTCTACACCTCGGGCGAGCACTGCCCGATGTGCTCAGCGAGCCACGGCTGGGTCCG
CCTGGGCCGCATCGTGTACGCGGCGTCGAGCGCCCAGCTGACCGCCTGGTACAAGGAGTGGGGAATCCCGGCGGGC
CCGGTCGCCCCGCTACCGATCACCACAGTGGTCCCCGGCGCCGTCGTGGAGGGCCCGGTCCCAGCCTTCGAGGCCG
AGCTGCGGGAGCTACATCGCGCCCGCTTCACCCCAGCGCAGTAGCCGCCGGACGAAACCCGACCCTXCTCGCCAAT
GAACCGGACCTGCGAGCGTGTCTGGATTGACCGCGGAGGCCCGCAACGCCACAGGCTCGATCTCCGTCACCGTCGG
ACCTCAGGGGCAGGTCGAGGATCTGCGCCTTGACGACCGAGTGCATGACCTCCCATCCCAGGAACTGAGCCAGCAG
ATCCTGACAGXGATGCGAAAGGCTCAGTACCAGCTCACCGAGTACGTCTCGGCGCACATCCGTGACACCGTGGGCA
TGGATTCGGAGACCGGTCGCAATGTGCTCGACGCGTTCGCACAGCGCTTCCCGCTGCCGGAGATGACCGATGAGCG
TTGAGCAGGTACAGCTGCCGATCGACGTAATCAACCGGCACÁCCACTACCATCGCCGCAACCGCCGATGCCGTACG
GCAGGCCCGCGCCGCGGCAGGTCAGGCAGCCATGGACTCGCAAGCGTACGGCCAGTTGTGTCAGTTCCTGCCGACC
GCGTTCAGCGTCGTGTTCGAGAGTGCGATCGTCGCCATGACCGGCAGCGCCGAAGCGTTGCAGGAAACCACCTTCA
ACCTGCAGGATGCCGTCACGACGTTCAGATACACCGACGAGTCGGCCGCTCGCACCATCGCCTCCGCAGGTTCGCC
GCCGTGACCACACCACTTGTCGCCCAAGCCGGGGACTCCACCACGGGATTGACCGGTCTGGGGCTCGTGGAGGACG
CCCACCAGATCGCAGAAGCCATCCGCGGGAACAGTTGGGTCGACGGCGTCCTCGGCGGAGTCGGGGCCAGCCrCGA
CGGTCTGGCGCTGGCGATCGACCCGCTCGGCACCCTTGCCGCCTGGGGCGTCGCCTGGCTCATCGAGCACGTCCAA
CCGCTACAAGACGCCCTGGACTGGCTGGCCGGCGACGTCGACGAGATAGCCGCCCAAGCCGCCACCTGGCGCAACG
TCGCCGCCTTCACCGACAGCGCCCAGCAGGATTACGCCGATCGGCTCCGCACCGAGGTCGCCGGCTGGTTCGGCGC
CTCCGGCGACGCATACCGGGCCCATGCCAGCGAACACTTGGCCGCACTGAAAGGCATCAGCACCGCAGCCGGCGGC
ATTTCGTCCGCCGTCGAAGGCGCCGGCCTGCTCGTCAGCCTGGTGCGCGGAATTGTCCGCGACCTGATCGCCCAGT
TCGTCGCCACTCTGGCCGTTCGGCTGCCACAATGGCTCGCCGCCGAAGGACTCACTCTGGGCCTCGCCACCCCCGT
TGTCGCGAGCCAAGTTGCCGCCCTCGTCGCCCGCGGGGTCAACAAGATCCAGCACTTCATACGGGCGCTGCTCAAC
AGCCTTCGACGGCTGATGCCCATGATCGACCGGCTGGGTGAAGTCCTGGAGCGGCTCCGCATGCTCACCGACCGGC
TCGCAAGGTCCAGCCCCTCCACCCGCCCGGAGCCGACACCCGGCCCCGCTACTCACGCCGGAACCGAGAACGCATC
GGGAAACAAGCCCGAGGGCGACCTCGAACCGAACGAACCGCGCCCGGCCGAGGCTGACGCCAGAGACAGTACGCCT
CAGGCGTTCGTGGACGAGGTCGTCAGCAACCCCCGGTCAGTCGCGGGACACTCCGCGCAGTCCATCGCGGACCAGT
TCAACGCCGCCGGATACTCTGCGGTCGTCGAGCAGAGCACCAGGAGCGGCACCTCGGGGAACGCCATCCAGGTACG
CATTCACGGCCACCCGGATATCACCAACATCCAGGTGCATCCGGGAGGAGGACGGCACACGCCGGAGGGGTCCCCG
TATTGGAAAATTTCGACGAATACGGTCGGGAAGATCTGGATCATCCCCGAAAATTTCCGGGGCGCCGATGAACTGC
GTGGGAATGTGGTGCGCTATGACAAATAAGATCATCAAAGTGGATCGGGTGGGATCCGCGGGGGAAGCTGCCACGC
TCGTCGCCCTGGGCGTCGACATCGTCGGGGTCGATCTTCGTCCTGATCCGCGATTCGTTGATGATCGCACGCTGGA
CGCCGAACAGGTTCGCCACATCCGCGAAGCGCTGCCGCACACGACGGTGGCCGTCACCATGGACACCGGCACCGAG
CCGGACCATGTCGTCGAACTCGCAAGGCGAATCGGCGCGGATCTGGTCCAGTCGATCAACGGTGTCATCCCGCCGC
TCCCAGTACGCGTCGCCCTGCGCAAGGCCGACATCGCGATTGTCTATGCGGGCACAGAGATCTCCCACGACGACGA
TCCCGGCTGGGTCTTCAGCGCÍ3TACGACGACACTCCGGACCTGAACGCCGCCCTGTTTCAAGTGGAGGTGCTTCCG
GAGTACCTCGATTCCTGGGAGTTTCTGCGTGACCGCTCCCCGGAATATGCCGACGAGTTCCAGATCGAAGATCTCG
ACGACCTCGGACGCGCTCGCCCCTTGGTTGCCGGCCTGAATCTCACGGCTCAGAACCTCGACGAGATCAGGGCACG
GCTTCCCCACGTCCGCGGTCTGGCGCTCACCCTCGCGCACGAGGCCGCGAGGAGCGACGCGCGGTTCTTCATGTTT
CCCCACGTAGTGGACATCCTTTCGGGAGACTCGTCCGGGTGACCGGCATCGCGCGGGAGGGGGCTGGTGTCGCAGA
GTCAGGCTGACGGCATTCCGGCGGGCCTGACGGGAGGAACCTCATGACCGGGCTGTTCACCATGCGCAAGCACGAG
GAGGGCGCCGGGGAGGTTCGGATCGTCGTGAGCGGCGAGATCGACGGCGATGTCAGCGCGGCGCTCACCCTGTTCA
TCGCCAACGCCGCCGAGCAGGACGGTGTCCGATCGGTGCTGGTGGATCTGGAGCCGGTGCTGCTGCTGGCCGCAGC
CGGGATCCGGTGCCTGCTGAGCGGCCGTGAGGCGGCTCTGCTGCAGGGCTGCTCCTACGAGCTGGTCAACGTCCGG
CACGAGGTCGCGGATTCACTGCACGCCGCCGGCGTGGCAGATCTGCTGCTCACCCTGCCGGTCCGCTGAGCCGGCT
CAGCTCGGGTCGTCGAAGCCCTCGTCGGCGCGTTCGCGGCGCAGGTGTGCCTCGGCCCGGCGCGCCTGGTCACGCT
TCTCCGCTGCCAGCCCGGCGTACATGGCCTGCACCTTCTCGTACGGCTGGCCGGGCGGCAGCAGCGGGATCGCCGG
ATCGACCACGGCCTCGATCAGCGTCGGGCGGTCCGCGGACAGCGCCGCCTCCCACGCGCCGGTCAGGTCGGACGGG
TCGGTGATCCGCACTCCGCGCAGGCCGAGCAGCTCGGCGTAGCGCGCGTACGGGACGTCGGGCAGTTCCTGCGACGTGACGAAGCGCGGCTCGCCCTCGGTCTCGCGCTGCTCCCAGCTGACCTCGGCCAGGTCCCGGTTGTTCAGCACGCA
CACCACGAAGCGCGGGTCCGCCCAGTCGCGCCAGCGGGCGGCCACCGTGATCAGTTCCGCCATGCCCGCCATCTGC
ATCGCGCCGTCGCCGGCCAGCÁCCACGACCGGGCGTTGCGGCGCCGCCAGCTTGGCGGCGAGACCGTACGGCAACC
CGCACCCCATCGACGCCAGCGTGCTGGACAGATGCGCCGGGACACCGCGGGGCAGCCGCAGGTGCCGGGCGTACCA
GTAGACGACCGAGCCGACGTCGACCGCGACCTGCGCGTCCGCGGGCAGGTGGTCGGAGAGGGAGCGAATCACGTGC
TGCGGGTTGAÇCGGTTCGGCGGGCGCCGCGGCCCGGGCCGCGCTGATCAGGCGCCAGCGCTGCACCCATTCCTCCA
CGCGGGCGCCCCAGGCGCCGCTTGCCCGGCTGGGCAGCAGTCCGAGCAGCTCACGCAAGGTTTCCACGGCGTCGCC
CAGGAGCGGGACCTCAACCGGATACCGTACGCCCAGACGGCGCCCGTCCACGTCGATCTGTACGGCCCGCGCCTGC
CCCGGCCGGGGATAGAACTCGGTCCACGGGTCGTTCGTGCCGATCAGCAGCAGCGTGTCGCAGTGCCGCATCAGCT
CGGCGCTGGCCGTGGTGCCCAGGTGCCCCATGACGCCGGTGTGGAACGGCAGGTTCTCGTCGAGGACCGGCTTGCC
GAGCAGCGAGGTGGTCACGCCGGCACCGAGCCGCTGCGCCAGCTCGACGATCTCGCGCTCCGCGCCGTACGCTCCC
TGCCCCACCATGATCGCCACCCGCTCGCCGGAGCGGAGCACCTCGGCCGCCTCGCGCAGGTCTTCCGGGCGGGGCA
CCACCCGGGCGGGGCGCAGCCCCGCGCTCGTCGCCAGCACACCGTGCTCATGCGCCTGCGGGTCGGGCGCCGGGGC
CGTCTGTACGTCGTGCGGCAGGACCACGCAGGTCGGGCTGCGGGTCGCGAGCGCGGTGCGGAACGCGCGGTCGAGG
AGCATCGGCACCTGCTCGCTCGTGTGCGCGGCCTGCACGAACTGGGCGCACACGTCGCCGAAGAGCCGCACCAGGT
CGATCTCCTGCTGGTACGCGCTGCCGAGCACCGTCGAGACCTGCTGGCCGACGATCGCGACGACCGGTTTGGAGTC
GAGTTTCGCGTCGTAGAGGCCGTTGAGCAGGTGCACCGCGCCGGGACCCTGGGTGGCGAGGCAGACTCCGGCACCA
CCGGTGTACTTGGCGTGGCCGACGGCCATGAACGCCGCGCCCTCCTCGTGCCGGGCCTGCACGAAGGTGGGCCGGC
CGGCCCGGCGCAGCGCTCCGATCACGCCGTCGATGCeGTCCCCGGAGTACCCGAAGACCCGTTCCACGTCCCACGC
GGTCAGACGCTCCACGACCACGTCCGACACGGTCCGCTCCGTCACCGCTGCCTCCTCACGTCACACCGGGGGCTAC
CCGCTCAGCCGCGCGGTACTCGCCTTGCGCGAAATGCGACTCGCGTGCACCTCACGGGCCGGGCGGACGCGGCACG
GATCTGAGCTGGTTCCCGCCCGGTTCTGATCCCCXGTGATCGGGGTACACACGTGCGGTGAGCAGGGACAAGACGT
ACCGGCCGGTCCGTCCCGACGGGATCCGGACCACCTTCCACGACGGTGTACTCGGGCGCATGCGGATCCGGTGCCT
GGGCGAGCCGCGTCCGGGCGTACCGGAGATGGTGATGATCCAGGGTATGACCGTGAGTGACTATCTGCTGCCGGGT
CTGGGCGCGCTCAGCGCCTGGACCCGGGTGCACCTGGTGGAGCTGCCGGGAGGCAGCGGCAGCGGCCGGCCGCCGC
ACGATCTCACGGTCGAGGAGTACGCGCGGGCCGCGGCCGACTGGCTGTGCGCCCAGCGCCTGGGCCGGATCGTGCT
GGCCGGCCATTCGAGCGGCACGCAGGTGGCGGCGGAGACCGCGCTGTTGTGCCCGGACGAGGTGGCCGGAGTGGTG
CTGGCCGGCCCGGCGATCGACCCGGTGGCCCGCGGCGGCCTGCGGGTCTTCGCGCGCTGGTGGATCGACCGGCGCG
GCGACCCGAAGAGCCTGGACGAGGTGCACAAACCCGAACGCGAGCAGGTCGGGTTCCGGCGGCTGTTCCAGGTGCT
GCGCGCCCACCTGCGTCACGACCTGGAGAAGCCGGTGGTCGGGCTCTGCGTGCCGGTGCTGGTCATCCGCGGCAGC
GAGGACCGGCTCGGCACCGCGCGGTGGGCCCGGCGGCTCGCCGATCTGGCTGCCGTGGGCGGCCGGTACGTCGAGG
TGCCGGGCACCCACTCGTTCTGCTGGCGTTACCCGCAGGCCTGGTCCGCGCCGATCCGTGAATTCGCCGGATGGTC
GGTATCGGTCTCCGGCACCTGAACGGACGTTTCGGTGGCATCGCCGCCACCGCGGGCCGGCGCATCCGCATCCACA
GTCCGGGGTGAGGGTCAGCGCCGTTCGGAGGCGGAGTGTCGATGATCGGTCAATTGACGTGCTTCCATGAGCCGCC
CTACGGTCCGACAGAGAAATCGTTATCCGGACCACCATCGACATCCGAATCGGTGGCCCCGGAGCCGATCATCGAC
CGACCCCGGGCCACCCCCGCTCTTGCCAGAGGGGGCGAGGCACATGACGGAAGCTGATCATCGTCCGACCGTTCTC
AGGAGAATCCTACGGCTGTGCGCCGTGCTTCTCATGGTGCTCGGAGTGGGCCTGGTCGGCGCCCCGACGTCGCACG
CCGGCGGCAAGCCGACCATCTCCAAGGAGGCGTTCGGCAGCGTCGGCGGCAAGGCCGTCGACCGGTACACCCTCAC
CAACGGGCGCCTGCAGGTGCGGATCCTCACCTACGGAGGCATCCTGCAGACCATCACGTTCCCCGACCACCGCGGC
CGCAGGGCCAACGTGACGCTCGGATTCAGGACeCTCGÃCGAGTACGTGACGACGAAGAACCCGGCGTACTrCGGCG
CCATCATCGGCCGCTACGGCAACCGGATTGCCGACGGCCGGTTCACCCTGGACGGCACGACCTACCAGCTGGCGAC
CAACAACGACCCGAACCACCTGCACGGCGGGGTCGTCGGCTTCGACAAGCGGGTGTGGGACGCCACGCCGATCCGC
GACGGCGACAGCGTCGGGCTGCGCCTGACCTACACCAGCCCGCACGGCGAGGAGAACTACCCCGGAACCCTGCGCG
TGACGATGACCTACACCGTCACCCGGCAGATGGGTATCCGGATGGACTACCGGGCGACGACCGACAGACCGACGAT
cgtcaacctgaccaaccacgcgtactggaacctcggcggcgagggcaccgggaccatcgacgaccacctgctgaag
CTCAACGCCAACCGCTACACGCCGGTCGACGCCACGCTGATCCCGACGGGGGCGATCGACGCGGTCGCCGGCACAC
cgatggacttccgccggcccacgccgatcggcgcgcgcaaccgcgacccgttccagcaactggtgtacgggcgcgg
ctacgaccacaactgggtgctgaaccgcgaggacggccagttccggcgtctcgagttcgcggcccgggcggtcgacccggacagcgggcggcagctcaccatctacaccaccgagccgggcatccagttctacggcggcaacttcctcgacggcaccctgtacggcaccagcggccgggcctaccgtcagggagacggtttcgccctggagacacagcacttcccggattctccgaaccacgcgaacttcccgtcgaccgtccttcgaccgggacagacctacaactcgacgaccatctaccagttcggtaccgccgactgatcgcctcaggccggccgccgcgggacggcgcgccgcggccggccgcacggcagtcagcggcggcgactggaggcacacatgccacgcatccatccgaaagtcgaggaggccgtctctacgctcgacctgaaccggacgacacgacggcggctgttgtccggaaccgggttgttcagcgcctcgctcgccgcgggcgcgctgctgagcgcatgcagcgaccagaacgacggccagaaccagaccgagggcgccggtaacttcccggacacccccgagtggcggttcacattcgtcaaccacgtgaccaccaacccgttcttcaccccgacgcagtacgggatggaggacgccgcgacgctgctcggcatcgccaagccgcagtggaccggctcgcagaactcgatcgtggccgaaatggtgaacgcgacgaacaccgcggtcagcgcaaaggtggacggaatcgccatcgccgtggtcgacaaggacgcgttccgggggccggtcgaccaggctctcaacgcggggataccggtggtgtcgtacaacgccgacggagcccggggcgcgccgggcacgaaccggctggcctatatcggacagggcctgtacgagtccgggtacgcgctgggccagcgggcgttgcaggtgctggactccggcgaggtggccgccttcatcgccaccccgggcgcgctgaacatccagccgcgcatcgacggcgcgcaacaggcgttcaaggactccggc aagccgatcacgttcaccgcggtcgccacgaacgccgacgtgacacgcggtctgtccatcatcgacgcgta
cgcccaggggcacgccaacctggccggcatgctggcggtggacgccggatcgacgtcgtcggtgggtcagaccgtc
aagaagtacaacatgcgcggcaaggggctcaaggtggccggcgggttcgacctgatcccggagacgctgaccggga
tccaggagggcagcctcgactacaccatcgaccagçagccttatctgcagggattcctgcccgtgctggcgctgta
cttctacaaggtgtccggcgggctgatcgcgccgagtgagacgaacaccgggctgttgttcgtcaccaaggacaac
gtcgccccgtaccagagcacgaagagccggtacgagggctccacgaccgacaaggttctcgtacctcgcagcgggc
cgatcgcccatggatgaccggatctcgcctgcgcccgcgcaggcgccttccctcgaggtcgagcaacgccgtggcc
ggtggcagccggtcacggcggccggccggaaggtcctcgacgccttcctgcggcggcgtgaggccagcgtgctgct
cgtcgcgatcggcctgatgatctactttcgggcgtccagcccggtcttcctgagccgcgacaacctggtcaacatc
gcccaggcgaccgcgcccgtcgcgatcatcgcggtcggcatcgtgctgctgctggtcagcggcgagatcgacctgt
ccgtcggtatcgtggccgcgctggcgccgttcctgttccacttcgggatcaacttctactcgctgccggtggtgcc
cgccttcgtggtggcgctggcgatcgcggccggaatcggcctggtgaacgggctgatcgtcacgcagctgcacgtg
ccctcgttcgtgacgacgctgggcacgttcttcgccgtgcagggcatcctgctgatcacgtcgcacgcctatccgg
tgccgatccccgacgcggccaagggcacgttccaaacctggctcggcgccgggccgtgggccagcatcacctgggc
gctgatcatcgtcgcgatcttccacacggtgctgaccctgacccggtggggcctgcacaccatctcggtcggcggc
aacccggtcggcgccaccgaggccggcatccgcgcctcccgcatcaagatcggcaacttcgtgatcaccagcacgc
tgggtgggctggtcggcatcatggaggcgttccggatcaacaccatcgacccgaacatcggcggcggcacgacgct
gaccttctacgccatctcggcggcggtcatcggcggcaccgcgctcgccggcggctccggcaccatcgtcggcgcc
ttcctgggcgccctcgtgctggccgagctgcagaacgggttcaacctcatcggctacagcgccaacaccatcttcc
tcatcctgggcctggccatcctcgtctcgatgatcgccaaccagtacctctcccgactgcgccgggcaggccgatc
atgaccgcggaaaccgtgtccgacgcgctgcgcgtacagaacatcgccaagagattcggcgctctcaccgc gctgc
aggacgtgaccctgcgcgtcgccgaaggcgaggtgctgggcctgatcggcgacaacggcgccggcaagtcgaccct
catcaaaatcatctgcgggtaccaccggccggacgccgggcgcatcttcgtcggcggcgaggaggtcacgctgcgc
agcgtcgaccacgcccgctcggtcggcatcgacgccgtctatcaggacctggccctggtcaacgagctgtccgtct
accacaacatgttcctcaaccgggagctcgtacggtggccgctgctgaacaaccgggcgatgcgccgccgtgccga
ggagcacctgcgcgacatgggagtgaacctgccggacgtcggcgtcgaggtggccaagctctccggcggccagcgc
caggcgatcgcggtggcccgctgcgtctactccgacgcccgcatcctgctgctggacgagccgctagccgcgatgg
gcgcgaaggagggcacgatgatcctcgacctgatccgcgacctgaaggcgcgcggcaacgtgrcgatcatcarcat
cgcgcacaactacgcgcaggtgctcgacgtgtgcgaccgggtgaacctgctgcagcacggccggatcaccttcgac
aagaggtcggcggacacgtcgctggccgaactgaccgagctggtggtcgccgagtaccgcaccggccgcgggcggt
gacgcctcagcgcttgcggccgactccgctgtactggctcgcgccggtcgtctcgtcgccggggtcgggatgccac
tgcgggctcggcacgacgcccggcgggaccaggtccagtccctcgaagaagccggcgatctcgtcgggcgtatgca
tcaggtagggcaccgcaccggaggagttgtaggcgtcctgggcctggttgagcgcctcctccccggcgacgcgcac
accgtcgttgatcgacaggtagctgccgggcggcagcccggccatcagctgccggacgatgtcgcggacctccgcg
gtgctggggatgtggccgagcacgccgttgaggatcagcgccaccggccggcccatgtcgagctcgcgggcggcga
ccgccaggatgtccgccggtttctgcaggtcaccctcgaggtagacgtcggacgacccggccagcagctcacggcc
gtgctccaccgcgtacgggtccttgtcgacgtagaggacccgggcgtcaggggcgacccgctgcgcgatctggtgg
gtgttgtcgacggtgggcaggcccgcgccgacgtcgaggaactggcgcacgccggcctcgccggcgaggtagcgca
cggcacgcgacaggtaccgccgggactcgcgggcgatctcgtcgatgccggggaacacggcacggtactcgtcgcc
ggcagcgcggtcgaccgggaggttgtcggtgccgccgagccagtagttccagatgcgggccgactggggcaccgag
gcgccggactccatagtcacggatcgatagcctagcccttgcgcgcctgggtggcgacgccctcgacgaagtagcg
ctggcacaggaagaacgcgatgatcatcggcaccgtggtgatcaccgcgccggccaggacgatctcccagcgggcc
tcgcccgcctggccgaactggtcgaggatcgccttcatgccgcgcggcatggtgaacagcgccggatcccgcagat
agatcagcggcttgagcaggtcggaccagctggcccgcagctcgaacacgaacgccacgatcagcgccggccggca
cagcggcaccgcgatgcgccagaacagccgccagtacccggcgccgtcgacgcgggccgcctcgaacagctcacgg
ggcacgccgaggaagaactgccggatcaggaagatgtagaaggcgctgccgaacaggttgccggcccagagcggca
cctgcgtggcggccaggccgagctcgttccagatcaggtacgtggggatcatggtgaccgcgccgggcagcatcat
cgtgccgàcgaccagggcgaacaacacgttgcgcccggggaagcggaagtaggcgaagccgaacgccacgaccgcg
ctggagatcgtgaccgcggccgcggcggcgagtgccaccacgacgctgttgaacatccaggtcagcacgggcgcgg
cgtcccagatggcggtgtagttccccggcgcccactcggcggggagcagccggttgtcgaagacgtcggggcgggg
cttgagggaggcgctgaccagccagacgaacgggtacacgaagatcaccgcggcggcggccagggcggtccagagc
acccagggatgcgggccgcgcgaggtgcgcggtggcatggtcctgtcctcagccacagccacggcctcactcgctc
tcgtagtagacgaatcgccggctgagccggacctgcacgaccgtgatgatcacgatgatcaggaacagcagccagg
ccagcgccgaggcgtaccccatgtgcaggaactggaaggcctgctggaacaggtagaccacatagaacagggcggc
gtcgttgccgtacgtctgctggttggcactgccgtagaaggcggtgtagacctcgtcgaaggtctgcagcgaggcg
atcgtgttgatgatcagcgtgaagaagagcgcgccgctgatcatcggcacggtgaccgcgcggaaccgcgcccacg
ccgacgcgccgtccatcrcggcggcctcgtagaggtcgcggggcacgttctgcagcgccgccaggtagatgatgac
cgtgctgccgaggctccaggcgccgatcagcaccaggccgggcttgatccacgggccgtcgacggtccagttcggc
ccgtcgatgccgaccgtgcccagcgcctcgttcacgatgccgacctggccgttgaacagcagcaggaacagcacgc
ccacggccaccttgggggtgatcgtcggcaggtagaagatcgtgcggaagaacccggcggagcggcgcccgacccg
ggccagcagcatcgccagggccagggacacgatcatggtgaccggcacgtgcagcgccgtgtagatcagcgtgttggcgatgcicgtacgcacccgcgggtcggcgagcaxcxgccggiagxtctcgccgccgacgaagicggxgcxggxgagcacgtcgiagxcggxgaacgacaggacgaggciggccaccaicggccccgccaxgaagaccgigaagccgatgagccacggcgacaggaaaccgaaggcggccagggtctcccgccgccgcacggcggcactcatcgtcagcgtccgctgtxggcctxgxccagcgcggccxgagccxgcxgcxgggccicggccaxggccxgggcgggxxtcxgciigccxiccaggacccggxxgaccgcgxxcigccaggcggccxxgaaixccxcaccggcggcgagcgccggcxccgagaagccggactcctgggtctgcaggacgatctgcacgttggcgtcgggtttcacgacgtctctgaagatcacttcgtcggccttctxgxxgccggxgiagacgccggcgaagggxixgxxcxccxtcxxgcgcagcxcggcacgggcccxcgcggcggcgat
ccaggtctcgcxcgcggxcaxcgxcxxgaxccacitacaggccxgcccagggxgcgcgcigxxcgccgggaxggcccaggcgttgcccgtgatccagtcgatcggctgcccgtcgacgccgcggaacggcgccacggtcaccttgaccttcggcgagtxgicggcgagcacgxxgaggxagaagxccxccaxcgggaaggcgccgagciggttgcxggcgaactggxicxxggcgccgaagaagicccacgagtcgcggaacgacxtgaagtxcgaccagccgcccxgcgcgxxgaicaggccg
acggcgiaxtcgagggccxcgaccaccixcgggxxgxxcagctgggcggtgcgaccgxcgtcgcxgaccagggcgg
cgccgttcgcgcgcgcccagacgggcaggaactcgggcagcttcgggtcgaacccgatccgctggagcttgccgccgctcatcctggtgagccgggccgtggccgtcgacagcgcctgccagtcccccgtgtcgaacccggcgggatccaagxxgaccxcggcgaacgcggcgtcgtxgagcatcaggacgcggttgtxgtâgaagtccggcaggccgtacagcigcccgttcagggtcgcctcggtgaccgcggcctcgcggaactggctcatgtcgatcttctcccgttcgacgcagtcgccgagcggagtgagcgccttcttggccgcgtaggtgccgagcagccgccgttccatgtacaccaggtccggcggggtccxggaggccaccgcggacaggaacgccxgggcgxcgaagcxgcccxcggacgccixcgccaggcxgggcgcgaxcacggcgttggccgcgtcgaagcgggtcttggcgatctcgtcgccggtgccgaaacccatcatggtcagcgtcaccgcggcgttgctgtcggagtccgaatcggatccgcçcacgccaccgcagcccgccgccaatgtcagaaccagggcaccacccaccacaaaccggaxcgaicggaigaacaicgxigxxcxcccaitxxcacxxgtxcccgxgggcgaagcataagttcacttcgatgcccgcgcactcggagcggctgctgtcaaccgccgaccggttggcggatcaccacgatcgggtggxgcggccgcxgccgggccgcgcxccxgcicccgccgccacgcgggxgggcagaxaccgaicggcgtcgctctaatcgatggcagggataccgacggtgacaccgtttcctcccgccgcttcatcccgacgtaatcgcgggcatggcgccgtggccgcgxticgicgaaaicgccgggcxaiicgcccgggaagiccaccgaaaggaagacacaccaxgicxgcxcxcgccaicgagaagicciggaaggacgxcgacciccgxgacggggcgaccagccacccggccggccxcggcxxcggcgagctcaccttcgaggaccttcgcgaggaccgcaccatctacgccgccagcagcggctgggtgtgcaccctgacgatcgagtgcggcaccgtgatctgcgcctgctgatcgacgatcgtttccggcccggggcgggcatcgcccgccccgggccaiccaixtcgcgcggggagcagccaxgicaccggxiccixcactcaaixccaccxcggxacgcgacagcgcgxatctgcacgaacgaacggtgaccggagaagaccagccggcaccggccgcgcaggcgcggatagcgtcctggcgcgattcggcgttcctcgacgaccgggttctcgacatccggctacgtcaatggggaatcgaccgtgccaccttcggccggctgctcaccgacgacgacttcaccgttcccggccggctgctcgcctgggcggacgagctggccacggtgctggccaccgacacgacaccggtcaccggactcgagttgtccaccaaactgtggtcacagggattcgaccggctgctcttcgccggcctgcttcacccgttcctcgcccactacgaacagcggctgcacgagcgcgtgccccggccgatcgccggcagcctgcgccggccgctgctggagtcgctggccaaccggctgctcgccgtcgcggcacgcaccctgctgcxggagctcáacgtggcccgtgxgcacgggcggctgaccggcgacaccccgcagcagcgctacgacgactacgaccggcggctgctcaccgaccccgcciacciggccgcccxcitcgaggaaiacccggxgcxcggccgixgcciggicgaaigcggccggcgtxgggtggaccacgccgccgagcxgxxcaaccggciccacgacgacgagcccgaacxgcgcgcggccggxcigcxgccgccgicggcggaagcgcxgcgcagcgiacggctggacctcggggacçcgcacaacggcggccggtcggtggigcagctgaccticgacgacggcaccgacciggtciacaagccgcggccggxcggaxccgaacgcgccxacgccgagacgaiggccgcgciggcccgccacgggcxgccggxgccggigaccgccccgcgcgxgciggaccgiggcgggcacggcrggxgcgagxxcgxccggcccgcgccctgcgccgacgccgccgagctgtcccgcrrctaccggcgcgccggatcggtgctggcggccaigcigcigcxcggiggcgicgacaigcacaxggagaacgxcaicgccgcggggxcgtcgixcaccccgatcgacciggagaccgxgcxgcagxccggagagcxcggcgacggcgccaccgacgcgiacgggcgggcccxcg
accxgcicaaccgcagcgtgcxggcgaxcggcatccxgcccgcccgcgcgtxcggtggccggcagcgaaagagigi
cgacgxcagcgccctcggcggcggcgaaccgcagaccgcgccccggccggxgccacgcaicgtcgacgcgiacacc
gacacggcacggcxggaagcggicgaggccaccaiggccggcgcccagaaccggccgagccigcccggcgcçgagg
xccgcccgxgggagcacaccgcigacgxggtcgccgggixcaccgacgcciacgacatcatgcxggcccaccgcgc
cgacttcgaccggcigcxgcgcggcitccacgacgiggaggxgcgcxaccxgccccggcccacccgtcgxiacagcaxcxiccxgaccgagagcxaccaccccgacxaccigcgcgacgccagcgaccgggaccggcxgcxcgacaagcxgiggaccgccgcggacgcccgccccgagcxgaxxccgatcaicgagtcggagaagcgacaacigctcgccggxgacatcccgxgctxccgcagcgtcgcgggaagccggcagaxccgcaccgcciccggcccgcxgcacccggagxxcxicaccgcgccggccgxcaccgtacxgacccgccggcxcggcgagxxcggaccggxgcaccgcgccgcccaggxacgcatcaiccgcgacxcgaxggccacgaxgcccggcccccggcccgccgcccagccgxcccccgaccgggcggcgggcccccggccccgcgxcaccggcgccgacccggccacgcxcgccgaccgcatcgcccgcaggcxcgccgacgaggcgatccicggcgaccgcgacgxgtccxggaxcggcgicagcaicgaaggcgicgcccaggagaccxacagcxacaagccgaxggcgaccggcctgiacgacggcgxggccggccxggcgcxcaccxxcgcgxacgcggcccgcacccxcggcgacgaccgctacctggacciggcacaccgagcggcccgccccgicgccggcxaccigcgcxaccxcgccgagcaccgcaxcgxcgagaccgxcggcgccxacagcggcaccgccgggcxgcxcxacgcccxggaccacgxggcccacgccaccggcgacgacxccxacctcgacgcggxcicggaggcggxgccgtggcigcgcgaaxgcgccacccgcgaggagtgccccgaccxgatcgccgggctggccggcxgcgccctgatcagçctggacctgcacggíscgccaccggatcgacgggctgcgcgagGTGGCGGCCATCTGCGCCGAACGGCTCGCCGCCCTCGCCGTCGACGTCGACGGCGCCGCCGGATGGCCGGCCACTC
CGGACGGACCGCTGCTCGGCGGGTTCTCCCACGGCGCGGCCGGCATCGCCTGGCCGCTGCACCGGCTCGCCACCGA
ACTCGGCGACCCCTCGCTGCGCGAGCTCGCCCGCCGCGCGGTCCAGTTCGACCGCGACCTGTACGTGCCCGCCGCG
GGCGCCTGGCGTGACCTGCGCCCGGAGATGGCCGGCACCGACTCCTACCCCGCGCTGTGGTGCCACGGGGCCGCCG
GCATCGGCCTGTCCCGGCTGCTCATCGCGCAGCACGACCAGGACACGCGACTGGCCGCGGAGGCCACCGCCGCCCr
CGACCTGGTCGGCGCGCACGGCTTCGGCCACAACCACAGCATCTGCCACGGCGACTTCGGCGCCCTCGCCCTGTTC
GACCTGGCGGCACGAACCGGCTTCGACCCCGGGCGCCACGACGCGGCCGCCGCGGCCGTGACCGCCGACATCGCCG
CCAACGGAGCCCGTTGTGGCCTGGTCGGCGACATCCACATGCCGGGACTCATGCTCGGCGCCGCCGGCATCTGCCT
GAGCCTGCTGCGCATCGCCCACCCCGCGCAGGTGCCCGCGGTGGCCTGGCTGCAGCCGCCGCTGACCTGAGGAGGA
GCCCATGCCGGAAGAGATCGTGCTCAGCGTGCTGGACCAGGTGCCGGTGTTCCGTGACGGCAGCCCGGCGGAGGCG
GTGCGCGACGCGGTCGCGCTGGCCCGCAGCGCCGAACAGTACGGCTACCACCGCTTCTGGATCGCCGAGCACCACG
GCAGCGCGGCCAACGCGTGCGCCGCCCCCGAGGTGGTGACGGCCGCGGTGGCCGCCGCCACGAGCCGGATCCGGGT
GGGCAGCGGCGGCGTGCTGCTGCCGCACTACAGCCCGCTGAAGGTGGCCGAGACGTTCCGGGTGCTGGCGGCGCTG
TATCCGGGCCGCATCGACCTCGGTTTCGGCCGGGCTCCTGGTGGGCCGCCGGCGATGGCCGAGCTGCTCAACCCGT
ACGCGGTCCGCACCGACGAGGCGTTCCTGGÃGCAGATCGGCCGGCTGCTGGGGTTCCTCGGCGACACCCGTACGGT
CAGCCGCGTGTCGGTGACGCCGCAGGTGGAAGAGCCCCCGGTGCCGTGGATGCTCGGCGCCGGGACCGGCAGCGCC
CGGATGGCCGGCATGCTGGGGTTGCCGTTCTGTTTCGCCCAGTTCATCGCGACCGAGGAGTGCCCGGAGGCGATCG
AGGCGTACCGGGATGCGTTCCGGCCGTCGCCCTGGCTGGAGCGACCCCAGCCGATGCTCGCCTTGCGGGTGCTGTG
CGCCGACTCGGACGCGGAGGCCGAGGAACTGGCCACGTGTTTCTGGATGTCGTGCACGACCGGCTGGCGTGCGCAG
GTGCAGCTCACCGACGACTACCGTGGGGGCGCGCCCAATCTCGACGACGCACGCCGGTACCGGCTGACCGCGGAGG
ACCTCGCGCTGCGGGAGAGCCGGCCGTTCCTGCAGATCTCCGGGACGCCGGCCGCGGTGGGCAAGGAGATCCGCAG
GTTGCAGGCGGTGTACGGGGTATCCGAGGTGGTGCTCACCACGAACTGCCCCGGCCTGCCGGCGCGGCGCCGCTCC
TACGAACTGCTCGCCGGCGAGTTCGCATCCCCGGCGGCCTGACGGCCTCAGGTCCGCGGTAGCTCCGCGTAGGTCC
CGCGCAATGCCGCGGACCTGACGGCCGTCAGGACAGGCAGACGTCGTCGCTGGACAGACCCGACGCATACGCCAGG
ACGGCGGCCTGCACGCGGTTGGCCACGCCGAGCTTGCTCAGGATCACGCTGACGTGCTCCTTCACCGTGGCGGCGC
TGAGGAACAGCTGCCGGCTGATCTCCGCGTTCGTGAGGCCGGCGCCGAGCAGGCGCAGAATGCTCTGCTCCCGGTC
GGACAGCTGTTTGACCCGCTCGCAGGCCGGTGACCCGGCCCCCGCGGCAGATCCCCGTGAGCCCGCACGCACGACC
ACCGACGACGCCTCGGGCGCCAGCAÇGATGCTGCCCTCGGCCAGCGCCCGCACGGCGGCGACCAGCTGTTCGGGCT
GGCTGTCGCGCAACAGGAAGCCGCAGGCCCCACCCCGCAGCGAGTCGAGCACCAGCTCGGGTGGGGCGAGAGTGGT
CAGCATCGCGATCGCCGGCGGGCTGCTCAGAGCCCGCAGCTGATCGAGCACCTCCAGCCCGTCGCTCTGGGCACTG
TGGCCGTCGAGCAGCACCACGGCAGGCCGGTGCTGCTCGACGGCCGATCTCAGGTTCTCCCGGTCCGTCGTGGCGA
CCGCGAAGCCGCCGGTGCTCTCCAGGATCATCTTGATGCCGATGCTGACCAGTGCTTCGCCGTCCACGACCAGTAC
GTCCGTCACGATCGGTCCCCCGCGAGCCGCCGAACGCATGCAACTTGCATCCGCATTCGTGACATTACTTCACTTA
TATGGTCGAATCAATCGATTTTrCGCGTATAGTCATTAACAACACACAGCGCGTCGTCAGCGGGTCAGACCCTCGG
CCGGGGCGACCCGCGCCGCCCGCCGCGCCGGCGCCAGACTGGCCACCACCCCGGTCAGCACCGCCACCACCAGCAC
GGCGGCCAGCTGGCCCCACGGCAGGCGGATCACCGGATCGGCGGTACGCCCCACGGCCGCCGC CACCGC GGCCAGC
CCCACCGGGACACCGACCACGAGGCCGGCCACCGTGCCGAGCAGCGTGATCACGACCGCCTCGACCGCGAGCATCG
CCCGCAGCCGCGCCCGGCGTGTGCCCAGCGCCCGCAACAGCGCCATCTCGCGTACCCGCTCGACGACCGACAGGCC
CAGCAGATTCGCGAIGCCGAGCAGTGCGATCACCACCGTGACCGCCAGCATCGCCAGCGACAGTCCCAACAGGATC
GACAGCACGTTCGCGATGTCACCGCCCTCGGTGACCCCGCCACCGACCTGCACCAGCGCGTCGCGGGCGGCCACCG
CGCCGACGGCGGCCGACAGCGCCTCCCGGTCGAAGCCGGGGTCAGCGACGCCCCACACCGTTGTCGGCACCGCCTC
GATCCGGTTCGCCGCCAGGGTCCGCGCGCTCACCACGCCCAGCAGCTGCCCGGTGGTGTCCGCCAGCCGC GACGCC
CGGGCGATCAGGTTCACCCGGCGCTCGCCGACCTCGACGACGATCGGGGCGCTGTCCGGCAGGCCCAGCTCGGCCA
GATAGGTCGCCGGCACCAGCACCACCGGCTCCCCGGCGAGCTCCGGTGCCACCCGGGCCGCCAGTTCGTCGCCGGG
CGCGGCCAGCAGCCGCGGCGTCGCCTTGCCGCCGTCCGGGAAACGGGCCGCGACCGTGCCGACCGTGCCACTGGCC
GACAGCTGTGGCACCGCGGCGAAGGCCCCGGCGGTGGCACCGCTGATCGGCTCGCCGTCGGTGCGCAGGCCCGCCG
CCACCGGGTAGCGCGCCTCCAGGTCGGCGTTCACCGTGGCCCGCCCGCTGGTCGCCGCCACCGCCAGGCAGGTGAT
CAGCGCCGCGCCGACCACCACCGCCATCGCCGCCGAAGCCGTCCGGCGCGCGTTCTGGCTCAGGCTGGTCCCGGCC
AGGCCGGCGGCCACGCCGAAACGCTCCAGCAGCCGCGCCGCCGGCGCCAGGGACAACGCGATCAGCCGCGGCAACG
CCGCCAGCAACCCCGCCGCCAGCAGAAGCCCGCCCAGCAGCGCCAGGGGCAGCGACGCGCCGATCGCCGCCACCGC
GAGCGCGGCGGCGCCCACCACGGTCACCACGGTGCCCACGACGAGCCGGCGACCGCCGCGGACCGTGCCGGCCGGC
GGCTCGTCGGCCGCCTGCAACGCCCGCAOCGGGGCGArcCTGGTGGCACGCCGGGCCÇGCGCCCAGGCGGCCACCA
GCGTGGCCAGCACCCCGGCCAGCACACAGCCGGCCAGGGCGAACGGATTGACCCGCAGCCCGCCGCCGCTGATGTC
GAGCAGGTCGGCGCCGAGATAACCCAGCCCCACACCCGCCGCCGCGCCGACCAGGCCGCCGGCTGTTCCGGCGATC
GCCGCCTCGGCCAGCACGACCCGGCTCACCTGGGCACGATGACCGCCGACCAGCCGCAGCAGGGCGATCTGCCGGA
TCCGCTGGACGATCACCACGTGGAAGGTGTTCGCGATGACCAGCACCGCCGCGAGCAGGGCGACAGCCGCGAACGC
CAGCATGATCACGACCAGCTGGCCGTTGCCGCCGGCGAACCTCGCGGCGGCCTGATCCGCAGCCGCCGAGGCGTCG
GTCGCCGAGATGCCGGGGCCCATGCTGCGCCGCAACGCGTCAACGGTGCCGGTCAGCGAGGCGTCGTCGGCGACAG
TCAGCAGCGCGGCCGGCGGCACGTCACCGGCGAAGAACGACGCGTCGGCGTAGAACCGGAAGTCCGAGCCGGTCAG
CGGCCGGAAACCCAGGTCGGCGGCACCGGTCACGGTGACCGGCTGCGGCGCCGCCTCACCGTGGCGTACCGTCAGC
GTGGCCCCGACGTCGATGCCGAGGTCGTCGAGGGTGCGCTGGTCGGCGACGAGCTGTCCGGGCCCGGTGGGCCACGcgccccggtccaaggtgaaccagcggacctgcggggtggccgcgatgctctgcacgttggccgagccgcgccgcgatccgccgaacacgctgaccgtgcgcgcgtactgcgcgtccaccgagcgcacccccggcaccgcggccgcggcctcgtaccaggccgggtcgcggaccgtgtcgtcggcgtcgagcacgatgtcggcggtggtcaacggcgcggcggcggtacgccgcaggccctcacccgaggtggccgcgaaggtcgcggtcgcggccaggaaaccggtcgccagcatcaccgccgcgacgatcgcgaacagccgggccgggtaggcgcgcagctgggaccaggcaagcgcgaagatcatcgtcacaccgccaccgacgccatcgccgcgaggatctgatcgcggccgggactgcgcagttcctcacggatccggccgtcggccatcaccaggacccggtcggcgtacgtcgcggcgcccggatcgtgggtgaccatgatgatcgtctggccggagcggcgtgccgcgtcgcgcagcccgcccagcagcgcgcggccggtggcgatgtccagcgcgccggtcggctcgtcggcgaagaccaccgacggcttggccagcagcgcccgcgccaccgccacccgctgctgctggccgccggacagctcggacggacgatgccccagccggtcggtgatctgcagtgaatcggtgatcttccgcagctcgcccggatccacccggcggccggcgagccgtagcggcagcacgatgttctgctccgccgtcagcgtcggcagcaggttgaacgcctggaagacgaagccgatccggtcgcggcgcaggtcggtcagggcccggtcgtccagaccggccaatgaccgcccggccaggctgaccgtgcccgccgtcggtgtgtccaatccggccagcaggtgcatcagcgtcgtcttcccggaaccggacgggcccatgatcgcggtgaactggcccgcggagaagcccgcggacaccccgtcgaçggctgtcacggcagccggccctgttccgtacgtcttgctgacgtcccggçaactgaccatctcggcgtgtgtcgtctgcgttgtcaccgcacccacgctagaaatccgcgcggaccggcacatcccaccacgggatcccggtcgggcggtggaccgataccttcgtatgacccgccggtatcgacctcgggcgccgtgttcccgcaatcgatgatgtctgcttaggctgggaccgtggtgcgagggaaccgggtgctcaggatcgacgccctcgtcgccgccgcggtggtcatcggctgtctgctcctcgggctcgccgggctgtccgagtggtactggtcggccgcggtggccgtaccgttgcttctccggcgcagcgctccgcgctgcttcctggcgctggtcgccggcgtctccggcctgcacctgctggcctcgcacagcrtcatgtrccccggcgatctggtcgctctggtcgcggtgcacgccgccgcggcgcacgcgccgggccgtgcccgccacgccggactgctgctcggcgccgccggagctctcgtggtggccgcccaggccctgcaggaccagcgcctcggctcggcgctgcccgcggtgctgatcgtcgcgagcacgatggccgcctggtcgatcgggctgatgcagcgccagcagcgcagcgccgtgctcgacgccgagcaccgccgccggctggccgaacaggacagcgccatgcgcgcgcagctggccgtgcacgaggagcgcacccggatcagccaggagatgcacgacatcatcgcccactcgctggcctcgatcatcgcccaggccgaaggcggccgggtcgccgcccgcgccgacgcgcggatcgccgggccggtgttcgaccggatcgcgggcctcggccgtcaagccctcaccgacgtgaaacggctgctcaccgtcgtggaccacgacgacgaatggcacgacgacggactggagcggctgccggtgctgcrcgccggagtcaccgaggccgggctggacgtgaccgtggacagcagcggggcgccgcagccgctcgccgccgggatggacctcgccgtgtaccgggtgatccaggagtcgctgaccaacgtgctcaagcacgcgccggcgcgccgggcctgcctgcggatgcggtggacgcccgcgct.gctcacggtcacggtgagcaggccgcttcccggtggccgcggcgccggcctggtcgaggggcgcggcctgtccgggatccggcagcgctgctcactgttcaacggcgactgcaccgtcaccgcgaccacggaactcaccgtcaccaccacctggcccctcaccccggaaggagcgcgcgcatgacgcggccaccgatcgccgtgctgatcgccgacgatcaggagctggtacgcaccggtttcgcgatggtcgtcgacgcggcgccggacatgcgggtcgtggccatcgccgcgagcggcgcggaggcgarcgagctggccgccgaacaccggccggacgtcatcctgatggacatccgcatgccgggcaccgacgggatcaccgcgaccagcgcgatcctggccgccggcggcgagcggccaccgaagatcatcgcgctgacgacgtacgacagcagcgactacgcgacgcggatcctcaccgccggggccagcggctatctgctgaaggacgcgaccgccgagggcctgacggcgg
cgatccgcagcgcgtaccacggcgggtcggtgatcgccccgacgaçgacccggaacctggtcgcggcccgcgccga
gccaccgccgccggctcgcgacccggcgccgctggacacgttcaccgcccgggaaggcgacgtgttcgacctgatcgtggc gggcgccaacaacgcggagatcgcggcccggctgcacctggccgaggtgacggtgaagacgcacgtcggccgggtgctggccaagctcggggtacgcgaccggctcaacgtagtcgtctgggcgtaccgcaacggcgctgtcggctgatccgcaccctcaggcccttgacacggtgccacggtggcacggtgtgatagacccgggtcgtttcgcctcacactggtggtggtgcggtgagttcctgggtacgccggcgcgatcacaacgtcttcgtcaacgcgttcaacatgctcatatgcggcctcatcgccggcgtcgtcgtggccgctgccgcgttcccgttcgccgcgatgtccggcctggccgccaaggccggccagcagacgttcgcgagcctgcccagcgagctgaaggcgttccggtcaccgcagatcagccggatctacgccgccgacaacaggacccaggtcgcccagttctacgacgagttccgcagtgacgtcccgctcaaggagatgtcgccgttcatgcgcgacgccatggtcgcggccgaggaccggcagttctaccagcaccacggcgtggacctgaaaggcgcggcgcgtgcgctggtcaacaaccgcaacggcgggcagaaacagggcgcgtcgacgatcaccatgcagtgggtacggatctcgctggcctactcggcgaccaagccgcaggacgtcatcgacgccaccgaggacgccccgaagcgcaaggtcgccgagatgaagtacgcgctcgaggtggagaagcagctcagcaaggaccagatcctggagcggtacctgaacatcgtgccgttcggcaagcagacgtacggcatctacgcggccagccgggtctacttcaacaagaagcccaaggacctcacgatcggcgaggccgcgctgctggccgccatcgtgaaggcgccgtccgcgtacgaccccaccgacccggacggttacgagctcatccggcagcggcgcaacgcctatgtcatcccgggcatggtggagatgggcgccatcacccgggcgcaggccgacgcggcgctcaaggaggccatcccgcgcaaggtacgcccgatgagcaacggctgcgtgtcggtggccaagaacaactggggcttcttctgcgactacttctaccgctggtggatggagcgcaaggagttcgggcccacgccgtacgaccgggagcgccggctgaagagcggcggctaccggatcaccacgacactcgacgtcaaggcgcagaagcaggcccgggatcggatcggcgacctgatctccgagaagaacaagaacgcgctgctgctggcagccgtcgagcccggcaccggcaaggtacgcatgctcgccgccaaccgccggtacaagctggacgatccggatgatccgcagaacgcgatctcctccgacccgagaaaggcgcgcaagggcatccgtggctcgtacccgaacacgacgaatcccctgctgaccggcggcggcgacatcaccggctaccaggccggctcggtgatgaagatgttcaccatcgtcgccgcgctggagcagggctacgcgctcgcctacacgatcaggacgcagagccggtaccgctcccgctacatcatcgagagcagcaacgacgcggcctgccccggaacgcacttctggtgtcccagcaacgccggtggcggcggcgagggtgtcttcáacatgtggaccggcctgggcaggtcgatcAACACGTACTTCGTGCCGCTGGAGGAACGCGTCGGCGCGGAGAAGGTGGTCAGCGCCGCGAAACGCTTCGGCATCCAGTTCCGGGAGCCGGACGACGCACTGCTGGCCGAACCGGGCAAÇGCACACCAGTGGGGCGCCTTCACCCTGGGCGTCTCGGCCACCACCCCGCTGGACATGGCCAACGCCTACGCCACCCTGGCCGCCGACGGGATGTACTGCCCGCCGACCCCGATCGAGCGGATCGCCACCCGTGACGGCGACCAGCTGGACGTCGGCCGGTCCCCGTGCGTACGGGCGACCGCCAAGGACGTCGCCCGCGCCGCCCTCGACGCGGCCCGCTGCCCGGTGGGCGACTCCGCGCAGCTCGGCCGGTGCGGGGGAAGCACCGCCGGCATCACCCGGTCGGTGGTCGGGCATCCGGTGTTCGGCAAGACCGGCACCACCGACCGCGACCGGACCGCCTCGCTGATCGCCGGCACCACCGCGCTGGTGGTCGCCGGTTACCTGGTCAACCÇCGACTACCAGAACCACCGCGACCGGCTCGACCACGACCAGGTCAACCCGGCCGTCTACCGCACGCTCGCCGACTACATGGAGGGCAGGCCACGGGAGTCGTTCAAGCGGCCGTCGAGCGGGCGGATCGCGTTCGGTGACCAGCGCTCGATCCCGGACGTCGAGTGCGACCCGATGCCCCGCGCCCGCGACCGTCTGGAGGATGCCGGCTTCGACGTCTGGCGAGGCCAGGAAGTGGAGTCGGACTGTCCCGCGGGCACCGCGGCCGGCACCGAGCCGAGCGGCCGGACCGTCAAGAACGGCGTGGTGGTGATCCAGGTGAGCAAGGGCCGCCGGGGCGCGTCACCGCCGATCTTCCCGCCGATCGGGCCACCCCGCTGACCGGCTGACGGCGTAGACGTCGÇCGGCGTTCGCCTCGTGCGGCAGCCCGGCCAGGTGCGCGAGCATCTCGTCGCGGGCGGCCCACCGGCCGAAGGTGCGGGCCATGGTCTCGCCCAGGGAGACGTGGAAGCCGTCGAAGCCCAGCTCGCCGGCACGGTCGAGGCAGCGCCGGGCCACGTCCCGGGCGATCGTCGTGAACTCGAACGACAACGCCCGGACACCGCGGCTCAGACCGGCGAGCACCGCGTCCTCGTACCCTTCGACGTCGATCTTGATGAAGGCCGGCAGGCCGAATCGCTGGACGAGCGTGTCCAGGGTGACCGCAGGGACGGTGATCTGCTGGTCCCAGACCTCGTTCTCCCAGCCGCGCGAGCCGGTCGCCGCGGTCAGGAAGCGCACCGAGTTCGTGGAGACCGTCGGGTTCGCCGAGTTGATGTAGAGCGGCACGCTCCCGCCGGCGGGCCCGCACGCGGCCTCGACGAGCGCCACCCGGTCGTCGTGGGCGTAGAGCGCGCGCAGCGCCCGCATGCÁCAGCGGCTGCGGTTCGACGGCGACCACGCGGGCGCCGAGCCGCCGGAAGCAGGCGACCCGGTCACCGACGTGCGCGCCGATGTCGAAGACGACGTCACCCGGCCGGACGAAACGCCGGTACATCGCGTCCATCGCGGCCTCCCGGCCGGCGTCACCGTAGTAGTAACGCAGCGACCGGGTCAGCGGCGCCATGGCCGGGTCGACTCTCAGTTTGCGCAGGTCATCGGTCACGGCGGGGGCATTCCCCCGATCAGGCGATCCATGCATCGCCGGCGCGTGCGCAGGTAGGCGGCGATCGCCCGGGCGGAACGCACGCCCGAGGTGGTCATGACGTTGTGCGCGGCGGCCGGGACGGTCACCGACACGCCGCCGGTCATCGCCGCCACCTCGGCACGCCAGCGCAGCGGCGCCACCGGATCAAGCGACCCGCCGAGCACCAGCGGGGGTACGGGCAACCGGCGCAGATCCTCCTCGATCGCGTTGCGTACCGAGTGGCCGACCGTGGCCAGAACCCGCCACGGCTTGGCGTCGGCGATGTCGCGGACCAGCACCGGCGCCTGCCACGGCGCCTCGATCCACAGGTCCÁGCGCCCACCGGCCGATCAGCGCCCGCCGGGACCGGGCCGCCGGGTCGGTGGTCGGGCTGGCCAGCACGACGGCGGCGACCAGGTCCGGCCGCAGCACCGCGAGACGGGCCGCCACCTCGGCGCCGAACGAGTGCCCGGCGATGCAGGCCCGGGGCACGCCGAGCACGTCCAGCCAGGCCGCGAGGTGTTCGGCGTGCCGGCCCACGTCGTACGCGCGGCGCGGCTTGTCGCTGAACCCGAACCCGGGAAGGTCCGGAACGAGGACCGGATGGCGGCCCGCCAGCGCGTGGGCGGTGGGCATCAGGTAGCGGTGCGAGACGGCGAGCCCGTGTACCAGCACCACCGGAAGGCCGCCGGCGTGGCACGCGTGCCGGTCGTGCGTACGCACTCCACCGACCGTCACCAGGCGGCTGTCGAATCGGGGCACCGCGGAGATGTACCCCGTCÇTTCCGCAATCTTTCCCGCGCGGTTAGTTTCGAGTTGTGTCGCCGCCCTTCCGGCTCGACGAGGCGGTCGCCGACGTCTACGGCGACCTGCGCCTGGCGCCCGTGCTGCGGCGGCTGCTGCGGCACAGCGGCCGCCTGACCGGCTCGGTGGCCGGCAGCGTGTCGCTGATCGACGCGGACCGCGGCTGCTACGTCAAGGCCGCCGAGTACGGCGCGAACTGCCAGCTCGGACGCTCTTTCCCGCTCGACGAGGGCGCCACCGGCCGCGCCTTCGGCAGCCGCCGGCCCGTGGTGATCCCGGACTACGGTCAGCTGCGGGCCGGTCATCTCGCGGCGGCGCATCCGGCACGGAAGGGCCCGGCCGTCGCTGTGCCGATCTGGTGGCGCGGCGACGTGATCGCGGTGAACGTCGCCTTCGCGCCGGCCTTCTCCCTGGGTGGTGTCGACGAACTGGAGGCGCTGACCCAGTCCGCGGCCGCCGCGATCGTCCGCAGCCGGGGTGTGCGGGTCCGCGCCGACCCGCCGTACGCGGCTCCGGCCGCACCGTTCACCCCGCGCGAGGCCGAGGTCCTCGATCTGCTCCGGCAGGGTCTGACCGACCGCGAGATGGCCCGCCGGCTCGGCCTGTCCGCGAAGACCGTGGAGAAGCACGTCGGCGCGATCAGGCGCAAGACCGGGACCTCCAACCGTACGGCGGCGGTCGTCACGGCCCTGGACAACGACTGGGTGGGGAATCTTCCCCATACCGCGGAGCACACCACCGGGTCTTGACTGGCGGCATGCCCGTCGTCTCCATGAAGGACATCCTCGACCGTGCGCTGGCCGAGCGGTACGGTGTGGCCGCCTTCAACATCGTCAACGACCTGACCGTCGAGGCCGTGCTCGCCGCCGCGGCGGAGGAACGCGCCCCGGTCATCCTGCAGACCTCGGTCAAGACGGTCCGGATGTACGGCCGCCCCCGGCTGTACGAGATCGTCCACGCCTTCGCCCACGACGCGCCCGTCCCGGTGACCCTGCACCTGGACCACTGCCCCGAGCGGTCGGTCATCTCCGACTGCCTCGCCGGCGGCTGGAACTCCGTGCTCTTCGACGCGCACGAGCTCGACGTGGCCGACAACCTGCGCCAGACCACCGAGGTGGTGGCCGAGGCCCGTCGCGCCGGCGCCCACGTCGAGGGCGAGATCGAGGGCATCCAGGGTGTCGAGGACGACGTCGGCAACGACTACGCCCCGATGGTGCAGAGCCTGGAGGTGGCGGTCGACTTCATCAAACGCACCGGCGTCGACTGTTTCGCGCCGGCCATCGGCAACGCGCACGGCCAGTACAAGCAGGCGCCCGTGCTCAACACCCGCCGGGTCAGCGACCTCGTTGCGGCCACCGGCATCCCGATGGCCCTGCACGGCGGCACCGGCCTCTCCGACGAGCAGTTCACCGACCTCATCGCCCGTGGCTGCGCGAAGGTCAACATCTCCACGGCGCTCAAGGAGTCGTTCATGAAATCCGGCCTGGAGTTCCTGCGCGAGGCCGATGAGCGCGGCAAATGGGATCCGCCGTCGCTGTTCCGGCATCAGCGGGCGGCGGTCGTAGAGATGGCCCGGCAGCACATCCGGCTCTTCGGCGGATCGGGGCGCGCGTGGTGAACGCCCTGGTCTTCGACTGCGACGGCGTGGTGGCCGACACCGAACGGCACGGCCACCTGCCCGCGTTCAACGCCACGTTCGAGCAGTTCGGGCTGCCCGTGCGGTGGAGCGAGGAGGAATACGGCGAGAAGCTGCGCATCGGCGGCGGCAAGGAGCGGATGGCGTCGCTGTTCGCCGArCCCGCCrrCGCCGCGGCGGCCGGCGACACCGACCGTACGGAACTGCTGCGAACCTGGCACCGCGCCAAGACCGCGGCTTTCACGAAGCTGGTCGCCGAGGGCCGGATTCCGGCCCGTCCGGGCACAGCCCGGATCATCAGCGAGGCACTCCGGGCAGGATGGACGGTCGCGGTCGCTTCCACGTCGGCCGAGGATTCGGTACGCGCAGTGCTCGTCAACGCCGTGGGAGCGACGACTGCCGAGCGGATCCCGGTGTTCGCCGGAGACGTCGTGCCCGCGAAGAAACCCGACCCGGCGATCSEQ ID NO: 101 orfl proteína hipotética 146aa
mprrstrcspacrpgaadqpdpgracrpdcgradrsgsgracrpdcgrad
rsgadrpsaaalvsgmprrtgvggapgrliearavlpeligaardrrascveqrvrsltacracacrraaapaaprtpprpsaapapgsdaggrcg
SEQ ID NO: 102 or£2 proteína hipotética 149aa
vsvslllvplamagaaavqaaagrmddgrlicqvqtrmrdvtlldaalrdtgatvt aagdtisatwtqsaatftrgadgiwaahvtgvdqpgave lmttvdtaygrrvqqa vlerl raqapeaglrlesesvgqdasvrlvfevere ra
seq id no: 103 or£3 atpase aaa envolvido na divisão celular52 Saa
versfaetfaqllkarfpvlhletyeeqralhhlagiagdadlvrvpravwtws ltagl vqpngearsgaqratdalravqride pavfvfrdlhplfaqspewrlvrdiaqafragrsprtlvllspvldlpvelskdvtivdfplpgqlelralldamvrgntasgrlrveldeqsrerfvtaaagltmqeaenayaramvndavldladleivheekrqtvrksgvlefmaagtvlddvgglenlkawlvkrngswldeaagyglpaprgvlitgvpgcgksltakavatawnlpllrfdigrvfs glvgs s ehnmrtalrt ae avapc vl wvdeiekgfaggtggdsgtgarvfgtfltwmqekrtpvfvxatandfdglppellrkgrfdetffvdlpsrservavwrvhlgralrhrraagelrvdaelltelagltegysgaeieqavxaglfdafserrplrrddlvravmsivplsvtqaervdalrgwarnravsatgtddwdltnr
SEQ ID NO: 104 or£4 hídrolase de açúcar 203aa
vgeldqqrihphnniwgsgagtqtiwarsgtnwgvvanhprtsgvksyfntgktlnrtlsslnsltssfnvsvpssgdysttydiwannhayevmiwtnqqgavgpiaeqydangavpnvrnlsvgghtwnvyrgsnganavfsfirtntnsgtvdilailnwlrtngwwgdvtvgeaqfgfeisgtagqsnftvnnfslnys
SEQ ID NO: 105 orf5 endoglucanase 219aa
mrrrtlalslaasaaliagagwtalpasaaagcrvaytvssqwpggfganvtitnlgdpltnwtlvwsysggqtvtqawntsltqsgsqvtarnagyngsvgtnatvsfgfngsgaatpapgtftlngtactgsagptspssqpptngvpsdavwvdsgqwanwtnngyiltttsgarapaprpsgraaaptgassrxtrapagssptptperpstvr
seq ID no: 106 or£6 citosina/adenina desaminase i6iaa
mtitetdlahlrrcvdlarealddgdepfgsvlvsadgkvlfedrnrvrhgdatqhpefaisrwaaehltprerasatvytsgehcpmcsashgwvrlgrivyaassaqltawykewgipagpvaplpittwpgawegpvpafeaelrelhrarft paq
SEQ ID NO: 107 orf 7 desconhecido 413aa
vttplvaqagdsttgltglglvedahqiaeairgnswvdgvlggvgasldglalaidplgtlaawgvawliehvqplqdaldjhlagdvdeiaaqaatwrnvaaftdsaqqdyadrlrtevagwfgasgdayrahasehlaalkgistaaggissavegagllvslvrgivrdliaqfvatlavrlpqwlaaegltlglatpwasqvaalvargvnkiqhfirallnslrrlmpmidrlgevlerlrmltdrlarsspstrpeptpgpathagtenasgnkpegdlepneprpaeadardstpqafvdewsnprsvaghsaqsiadqfnaagysaweqstrsgtsgnaiqvrihghpditniqvhpgggrhtpegspywkistntvgkiwiipenfrgade lrgnwry dk
SEQ ID NO: 108 orf8 desconhecido 217aa
vgkpcpdlvevlsreiqagnqgasaseweifdlelvgifrgavtqklpgievlrkhlhlkqggvqvrsvwraedpagiwvgdlcaridnrdvglaqgdaywe rrd dtvdrldqiradspcefddmvrlgagvhgdgqrrvrqrfadvANLFGVQRAIINESRIRTKIDPDDVDAQGDERGSFPRGSHPIHFDDLICHSAPHSHAVfiRRPGNFRG
SEQ ID NO: 109 or£9 píruvatO OXÍdase 592aa
VSDWVERLTAWDVERVFGYSGDGIDGVIGALRRAGRPTFVQARHEEGAAFMAVGHAKYTGGAGVCLATQGPGAVHLLNGLYDAKLDSKPVVAIVGQQVSTVLGSAYQQEIDLVRLFGDVCAQFVQAAHTSEQVPMLLDRAFRTALATRSPTCWLPHDVQTAPAPDPQAHEHGVLATSAGLRPARWPRPEDLREAAEVLRSGERVAIMVGQGAYGAEREIVELAQRLGAGVTTSLLGKPVLDENLPFHTGVMGHLGTTASAELMRHCDTLLLIGTNDPWTEFYPRPGQARAVQIDVDGRRLGVRYPVEVPLLGDAVETLRELLGLLPSRASGAWGARVEEWVQRWRLISAARAAAPAEPVNPQHVIRSLSDHLPADAQVAVDVGSWYWYARHLRLPRGVPAHLS S TLASMGC GLP YGLAAKLAAPQRP WVLAGDGAMQHAGMAELITVAARWRDWADPRFWCVLNNRDLAEVSWEQRETEGEPRFVTSQELPDVPYARYAELLGLRGVRITDPSDLTGAWEAALSADRPTLXEAWDPAIPLLPPGQPYEKVQAMYAGLAAEKGDQARRAEAHLRRERADEGFDDPS
seq id no:no oxfio hidrolase ou aciltransferase 266aa
VSRDKTYRPVRPDGIRTTFHDGVLGRMRXRCLGEPRPGVPEIVMIQGMTVSDYLLPGLGALSAWTRVHLVELPGGSGSGRPPHDLTVEEYARAAADWLCAQRLGRIVLAGHSSGTQVAAETALLCPDEVAGWLAGPAIDPVARGGLRVFARWWIDRRGDPKSLDEVHKPEREQVGFRRLFQVLRAHLRHDLEKPWGLCVPVLVIRGSEDRLGTARWARRLADLAAVGGRYVEVPGTHSFCWRYPQAWSAPIREFAGWSVSVSGT
SEQ ID NO: 111 orfll aldose epímerase 396aa
MTEADHRPTVLRRILRLCAVLLMVLGVGLVGAPTSHAGGKPTISKEAFGSVGGKAVDRYTLTNGRLQVRILTYGGILQTITFPDHRGRRANVTLGFRTLDEYVTTKNPAYFGAIIGRYGNRIADGRFTLDGTTYQLATNNDPNHLRGGWGFDKRVWDATPIRDGDSVGLRLTYTSPHGEENYPGTLRVTMTYTVTRQMGIRMDYRATTDRPTIVNLTNHAYWNLGGEGTGTIDDHLLKLNANRYTPVDATLIPTGAIDAVAGTPMDFRRPTPIGARNRDPFQQLVYGRGYDHNWVLNREDGQFRRLEFAARAVDPDSGRQLTIYTTEPGIQFYGGNFLDGTLYGTSGRAYRQGDGFALETQHFPDSPNHANFPSTVLRPGQTYNSTTIYQFGTAD
seq id no: 112 orfi2 abc componente periplasmático de transporte de açúcar
378aa
MPRIHPKVEEAVSTLDLNRTTRRRLLSGTGLFSASLAAGALLSACSDQND
GQNQTEGAGNFPDTPEWRFTFVNHVTTNPFFTPTQYGMEDAATLLGIAKP .
QWTGSQNSIVAEMVNATNTAVSAKVDGIAIAWDKDAFRGPVDQALNAGI
PWSYNADGARGAPGTNRLAYIGQGLYESGYALGQRALQVLDSGEVAAFI
ATPGALNIQPRIDGAQQAFKDSGKPITFTAVATNADVTRGLSIIDAYAQG
HANLAGMLAVDAGSTSSVGQTVKKYNMRGKGLKVAGGFDLIPETLTGIQE
GSLDYTXDQQPYLQGFLPVLAIiYFYKVSGGLIAPSETNTGLLFVTKDNVA
PYQSTKSRYEGSTTDKVLVPRSGPIAHG
seq id no : 113 oxfi3 ABC o rfl 3 permease de transporte de açúcar352aa
MDDRISPAPAQAPSLEVEQRRGRWQPVTAAGRKVLDAFLRRREASVLLVAIGLMIYFRASSPVFLSRDNLVNIAQATAPVAIIAVGIVLLLVSGEIDLSVGIVAALAPFLFHFGINFYSLPWPAFWALAIAAGIGLVNGLIVTQLHVPSFVTTLGTFFAVQGILLITSHAYPVPIPDAAKGTFQTWLGAGPWASITWALIIVAIFHTVLTLTRWGLHTISVGGNPVGATEAGIRASRIKIGNFVITSTLGGLVGIMEAFRINTIDPNIGGGTTLTFYAISAAVIGGTALAGGSGTIVGAFLGAL VLAELQNGFNLIGYSANTIFLILGLAILVSMIANQ YLSRL RRAGRS
seq ID no: 114 orfi4 ABC proteína de transporte de ligação
253aa
MTAETVSDALRVQNIAKRFGALTALQDVTLRVAEGEVLGLIGDNGAGKSTXiIKI ICGYHRPDAGRIFVGGEEVTLRSVDHARSVGIDAVYQDLAL VNELSVYHNMFLNRELVRWPLLNNRAMRRRAEEHLRDMGVNLPDVGVEVAKLSGGQRQAIAVARCVYSDARILLLDEPLAAMGAKEGTMILDLIRDLKARGNVSIIIIAHNYAQVLDVCDRVNLLQHGRITFDKRSADTSLAELTELWAEYRTGRGR
sec ίο no: 115 orfis proteína hipotética. Metiltransferase
255aa
MESGASVPQSARIWNYWLGGTDNLPVDRAAGDEYRAVFPGIDEIARESRRYLSRAVRYLAGEAGVRQFLDVGAGLPTVDNTHQIAQRVAPDARVL YVDKDPYAVEHGRELLAGSSDVYLEGDLQKPADILAVAARELDMGRPVALILNGVLGHIPSTAE VRDIVRQLMAGLPPGSYLSINDGVRVAGEEALNQAQDAYNSSGAVP YLMHTPDEIAGFFEGLDLVPPGWPSPQWHPDPGDETTGASQYSGVGRKR
SEQ ID no: 116 orfis RBC permease de transporte 280aa
MPPRTSRGPHPWVLWTALAAAAVIFVYPFVWLVSASLKPRPDVFDNRLLPAEHAPGNYTAIWDAAPVLTWMFNSVWALAAAAAVTISSAWAFGFAYFRFPGRNVLFALWGTMMLPGAVTMIPTYLIWNELGLAATQVPLWAGNLFGSAFYIFLIRQFFLGVPRELFEAARVDGAGYWRLFWRIAVPLCRPÁLIVAFVFELRASWSDLLKPLIYLRDPALFTMPRGMKAILDQFGQAGEARWEIVLAGAVXTTVPMIXAFFLCQRYFVEGVATQARKG
seq JD no: 117 orfi 7 ABC permease de transporte 30iaa
MSAAVRRRETLAAFGFLSPWLIGFTVFMAGPMVASLVLSFTDYDVLTSTDEVGGENYRQMLADPRVRTSIANTLIYTALHVPVTMIVSLALAMLLARVGRRS AGFFRTIFYLPTITPKVAVGVLFLLLFNGQVGIVNEALGTVGIDGPNWTVDGPWIKPGLVLIGAWSLGSTVIIY1AA1QNVPRDLYEAAEMDGASAWARFRA VTVPMISGALFFTLIINTIASLQTFDEVYTAFYGS ANQQTYGNDAALFYWYLFQQAFQFLHMGYASALAWLLFLIIVIITWQVRLSRRFVYYESE
seq id no: 118 orfi8 abc ligação ao substrato de transporte 44saa
MFIRSIRFWGGALVLTLAAGCGGVGGSDSDSDSNAAVTLTMMGFGTGDEIAKTRFDAANAVIAPSLAKASEGSFDAQAFLSAVASRTPPDLVYMERRLLGTYAAKKALTPLGDCVEREKIDMSQFREAAVTEATLNGQLYGLPDFYNNRVLMLNDAAFAEVNLDPAGFDTGDWQALSTATARLTRMSGGKLQRIGFDPKLPEFLPVWARANGAALVSDDGRTAQLNNPKVVEALEYAVGLINAQGGWSNFKSFRDSWDFFGAKNQFASNQLGAFPMEDFYLNVLADNSPKVKVTVAPFRGVDGQPIDWITGNAWAIPANSAHPGQACKWIKTMTASETWIAAARARAELRKKENKPFAGVYTGNKKADEVIFRDVVKPDANVQIVLQTQESGFSEPALAAGEEFKAAWQNAVNRVLEGKQKPAQAMAEAQQQAQAALDKANSGR
seq id no: 119 orfi9 gene estrutural IanA actA Maa
MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTVICAC
seq id no: 120 or£2o gene de modificação IanM actM io53aa
MSPVPSLNSTSVRDSAYLHERTVTGEDQPAPAAQARIASWRDSAFLDDRVLDIRLRQWGIDRATFGRLLTDDDFTVPGRLLAWADELATVLATDTTPVTGLELSTKLWSQGFDRLLFAGLLHPFLAHYEQRLHERVPRPIAGSLRRPLLESLANRLLAVAARTLLLELNVARVHGRLrGDTPQQRYDDYDRRLLTDPAYLAALFEE YPVLGRCLVECGRRWVDHAAELFNRLHDDEPELRAAGLLPPS AEALRSVRLDLGDPHNGGRSWQLTFDDGTDLVYKPRPVGSERAYAETMAALARHGLPVPVTAPRVLDRGGHGWCEFVRPAPCADAAELSRFYRRAGSVLAAMLLLGGVDMHMENVIAAGSSFTPIDLETVLOSGELGDGATDAYGRAIiDLIiNRSVLAIGILPARAFGGRQRKSVDVSALGGGEPQTAPRPVPRIVDAYTDTARLEAVEATMAGAQNRPSLPGAEVRPWEHTADWAGFTDAYDIMLAHRADFDRLLRGFHDVEVRYLPRPTRRYSIFLTESYHPDYLRDASDRDRLLDKLWTAADARPELIPIIESEKRQLLAGDIPCFRSVAGSRQIRTASGPLHPEFFTAPAVTVLTRRLGEFGPVHRAAQVRIIRDSMATMPGPRPAAQPSPDRAAGPRPRVTGADPATLADRIARRLADEAILGDRDVSWIGVSIEGVAQETYSYKPMATGLYDGVAGLAlTFAyAARTLGDDRyiDLAHRAARPVAGYLRYLAEHRIVETVGAYSGTAGLLYALDHVAHATGDDSYLDAVSEAVPWLRECATREECPDLIAGLAGCALISLDLHGRHRIDGLREVAAICAERLAALAVDVDGAAGWPATPDGPLLGGFSHGAAGIAWPLHRLATELGDPSLRELARRAVQFDRDLYVPAAGAWRDLRPEMAGTDSYPALWCHGAAGIGLSRLLIAQHDQDTRLAAEATAALDLVGAHGFGHNHSICHGDFGALALFDLAARTGFDPGRHDAAAAAVTADIAANGARCGLVGDIHMPGLMLGAAGICLSLLRIAHPAQVPAVAWLQPPLT
SEQ ID NO: 121 or£21 monOOXÍgenase actO 341aa
MPEEIVLSVLDQVPVFRDGSPAEAVRDAVALARSAEQYGYHRFWIAEHHGSAANACAAPEWTAAVAAATSRIRVGSGGVLLPHYSPLKVAETFRVLAALYPGRl DLGFGRAPGGPPAMAELLNPYAVRTDEAFLEQIGRLLGFLGDTRTVSRVSVTPQVEEPPVPWMLGAGTGSARMAGMLGLPFCFAQFIATEECPEAIEAYRDAFRPSPWLERPQPMLALRVLCADSDAEAEELATCFWMSCTTGWRAQVQLTDDYRGGAPNLDDARRYRLTAEDLALRESRPFLQISGTPAAVGKEIRRLQAVYGVSEWLTTNCPGLPARRRSYELLAGEFASPAA
seq ID no : 122 orf22 regulador de resposta actR 23iaa
MRSAARGGPIVTDVLWDGEALVSIGIKMILESTGGFAVATTDRENLRSAVEQHRPAWLLDGHSAQSDGLEVLDQLRALSSPPAIAMLTTLAPPELVLDSLRGGACGFLLRDSQPEQLVAAVRALAEGSXVLAPEASSWVRAGSRGSAAGAGSPACERVKQLSDREQSILRLLGAGLTNAEISRQLFLSAATVKEHVSVILS KLGVANRVQAAVLAYASGL SS DDVCLS
seq ID no: 123 orf23 permease associada ao transportador ABC actT
812aa
MXFALAWSQLRAYPARLFAIVAAVMLATGFLAATATFAATSGEGLRRTAAAPLTTADIVLDADDTVRDPAWYEAAAAVPGVRSVDAQYARTVSVFGGSRRGSANVQSIAATPQVRWFTLDRGAWPTGPGQLVADQRTLDDLGIDVGATLTVRHGEAAPQPVTVTGAADLGFRPLTGSDFRFYADASFFAGDVPPAALLTVADDASLTGTVDALRRSMGPGISATDASAAADQAAARFAGGNGQLWIMLAFAAVALLAAVLVIANTFHWIVQRIRQIALLRLVGGHRAQVSRWLAEAAIAGTAGGLVGAAAGVGLGYLGADLLDISGGGLRVNPFAIAGCVLAGVLATLVAAWAPARRATRIAPVRALQAADEPPAGTVRGGRRLWGTWTWGAAALAVAAIGASIPLALLGGLLLAAGLLAALPRIIALSLAPAARLLERFGVAAGLÁGTSLSQNARRTASAAMAVWGAALITCLAVAATSGRATVNADLEARYPVAAGLRTDGEPISGATAGAFAAVPQLSASGTVGTVAARFPDGGKATPRLLAAPGDELAARVAPELAGEPWLVPATYLAELGLPDSAPIWEVGERRVNLXARASRLADTTGQLLGWSARTLAANRIEAVPTTVWGVADPGFDREALSAAVGAVAARDALVQVGGGVTEGGDIANVLSILLGLSLAMLAVTWIALLGIANLLGLSWERVREMALLRALGTRRARLRAMLAVEAWITLLGTVAGLVVGVPVGLAAVAAAVGRTADPVIRLPWGQLAAVLWAVLTGWAS LAPARRAARVAPAEGLTR
SEQ ID NO: 124 or£24 proteína hipotética 244aa
MIVWPERRAASRS PPSSARPVAMSSAPVGSSAKTTDGLASSARATATRCCWPPDSSDGRCPSRSVICSESVIFRSSPGSTRRPASRSGSTMFCSAVSVGSRLNAWKTKPIRSRRRSVRARSSRPANDRPARLTVPAVGVSNPASRCISWFPEPDGPMIAVNWPAEKPADTPSTAVTAAGPVPYVLLTSRQLTISACWCWTAPTLEIRADRHIPPRDPGRAVDRYLRMTRRYRPRAPCSRNR
seq ID no: 125 orf25 quinase reguladora de resposta 3S7aa
VLRI DAL VAAAWIGCLL LGLAGL S E W YWS AA VAVPLLLRRS APRCFLALVAGVSGLHLLASHSFMFPGDLVALVAVHAAAAHAPGRARHAGLLLGAAGAL WAAQALQ DQRL G S AL PAVLIVAS TMAAWSIGLMQRQQRS AVLDAEHRRRL AEQDS AMRAQLAVHEERTRISQEMHD11AHSLAS11AQAEGGRVAARADARIAGPVFDRIAGLGRQALTDVKRLLTWDHDDEWHDDGLERLPVLLAGVTEAGLDVTVDSSGAPQPLAAGMDLAVYRVIQESLTNVLKHAPARRACLRMRWTPALLTVTVSSPLPGGRGAGLVEGRGLSGIRQRCSLFNGDCTVTATTELTVTTTWPLTPEGARA
seq ίο no: 12β orf26 sensor regulador de resposta 220aa
MTRPPIAVLIADDQELVRTGFAMWDAAPDMRWAIAASGAEAIELAAEHRPDVILMDIRMPGTDGITATSAILAAGGERPPKIIALTTYDSSDYATRILTAGASGYLLKDATAEGLTAAIRSAYHGGSVIAPTTTRNLVAARAEPPPPARDPAPLDTFTARERDVFDLIVAGANNAEIAARLHLAEVTVKTHVGRVLAKLGVRDRLNWVWAYRNGAVG
seq id no: 127 orf27 proteína de ligação a penicilina 782aa
MLICGLIAGVVVAAAAFPFAAMSGLAAKAGQQTFASLPSELKAFRSPQISRIYAADNRTQVAQFYDEFRSDVPLKEMSPFMRDAMVAAEDRQFYQHHGVDLKGAARALVNNRNGGQKQGASTITMQWVRISLAYSATKPQDVIDATEDAPKRKVAE MKYALEVEKQLSKDQILERYLNIVPFGKQTYGIYAASRVY FNKKPKDLTIGEAALLAAIVKAPSAYDPTDPDGYELIRQRRNAYVIPGMVEMGAITRAQADAALKEAIPRKVRPMSNGCVSVAKNNWGFFCDYFYRWWMERKEFGPTPYDRERRLKSGGYRITTTLDVKAQKQARDRIGDLISEKNKNALLLAAVE PGTGKVRMLAANRRYKLDDPDDPQNAIS S DPRKARKG XRGS YPNTTNPLLTGGGDI TGYQAGSVMKMFTIVAAIiEQGYPLAYTIRTQSRYRSRYI XESSNDAACPGTHFWCPSNAGGGGEGVFNMWTGLGRSINTYFVPLEERVGAEKWSAAKRFGIQFREPDDALLAEPGNAHQWGAFTLGVSATTPLDMANAYATLAADGMYCPPTPIERIATRDGDQLDVGRSPCVRATAKDVARAALDAARCPVGDSAQLGRCGGSTAGITRSWGHPVFGKTGTTDRDRTASLIAGTTALWAGYLWPDYQNHRDRLDHDQVNPAVYRTLADYMEGRPRESFKRPSSGRIAFGDQRS IPDVECDPMPRARDRLEDAGFDVWRGQEVF.SDCPAGTAAGTEPSGRTVKNGWVIQVSKGRRGASPPIFPPIGPPR
SEQ ID NO: 128 orf28 metiltransferase 253aa
MAPLTRSLRYYYGDAGREAAMDAMYRRFVRPGDVVFDIGAHVGDRVACFRRLGARWAVEPQPLCMRALRALYAHDDRVALVEAACGPAGGSVPLYINSANP TVS TMS VRFLTAATGSRG WENEVWDQQITVPAVTL DTLVQRFGLPAFIKIDVEGYEDAVLAGLSRGVRALSFEFTTIARDVARRCLDRAGELGFDGFDVSLGETMARTFGRWAARDEMLAHLAGLPHEANAGDVYAVSRSAGWPDRREDRR
SEQ ID NO: 129 orf29 hídrolase 261aa
VPRFDSRLVTVGGVRTHDRHACHAGGLPWLVHGLAVSHRYLMPTAHALAGRHP VLVP DL PGFGF S DKPRRAY DVGRHAEHLAAWLDVLGVPRACIAGH SFGAEVAARL AVLRP DLVAAWL AS PTTD PAARSRRALIGRWAVDL WIEAPWQAPVL VRDIADAKPWRVLATVGHSVRNAIEEDLRRLPVPP1VLGGSLDPVAPLRWRAEVAAMTGGVSVTVPAAAHNVMTTSGVRSARAIAAYLRTRRRCMDRLIGGMPPP
SEQ ID NO: 130 orf30 regulador de resposta 244aa
VSPPFRLDEAVADVYGDLRLAPVLRRLLRHSGRLTGSVAGSVSLIDADRGCYVKAAEYGANCQLGRSFPLDEGATGRAFGSRRPWIPDYGQLRAGHLAAAHPARKGPAVAVPIWWRGDVIAVNVAFAPAFSLGGVDELEALTQSAAAAIVRSRGVRVRADPPYAAPAAPFTPREAEVLDLLRQGLTDREMARRLGLSAKTVEKHVGAIRRKTGTSNRTAAVVTALDNDWVGNLPHTAEHTTGS
SEQ ID NO: 131 orf31 aldolase frutose bifosfato 281aa
MKDILDRALAERYGVAAFNIVNDLTVEAVLAAAAEERAPVILQTSVKTVRMYGRPRLYEIVHAFAHDAPVPVTLHLDHCPERSVISDCLAGGWNSVLFDAHELDVADNLRQTTEWAEARRAGAHVEGEIEGIQGVEDDVGNDYAPMVQSLEVAVDFIKRTGVDCFAPAXGNAHGQYKQAPVLNTRRVSDLVAATGIPMALHGGTGLSDEQFTDLIARGCAKVNISTALKESFMKSGLEFLREADERGKWDP PS LFRHQRAAWEMARQHIRLFGGSGRAWSEQ ID NO: 132 or£32 hídrolase 192aa
MGSAVAVPASAGGGRRDGPAAHPALRRIGARVVNALVFDCDGVL ADTERHGHLPAFNATFEQFGLPVRWSEEEYGEKLRIGGGKERMASLFADPAFAAAAGDTDRTELLRTWHRAKTAAFTKL VAEGRIPARPGTARIXSEAL RAGWTVAVASTSAEDSVRAVLVNAVGATTAERIPVFAGDWPAKKPDPA
SEQ ID NO:133-SEQ ID NO:199
(Null)
SEQ ID NO:200: CosAL02 (40402bp)
GATCAGGTCGACCGCGGAGCTGATCTGGTCACGGATCGCGCGGATCGGCAGGTCCATGCCGGCCATCAG
CACCATCGTCTCCAGCCGGGACAGCGCGTCGCGCGGCGTGTTCGCGTGCAGGGTGGTCAGCGAGCCGTC
GTGGCCGGTGTTCATCGCCTGCAGCATGTCGAGCGCGGCGGCGTCACGGACCTCGCCGACGACGATCCG
GTCCGGGCGCATCCGCAGCGCGTTGCGGACCAGGTCGCGGGTGGTGATCGTGCÇCCGGCCCTCGGAGTT
CGGCGGCCGGGACTCCAGGCGCACCACGTGGTCCTGGACCAGTTGCAGCTCGGÇGGCGTCCTCGATGGT
CACGATGCGCTCGTCGGCCGGGACGAAGCTGGAGAGGACGTTCAGGATCGTGGTCTTGCCGGAGCCGGT
GCCGCCGCTGACCAGGATGGTGCGCCGGCCGCGCACGCACGCGTCCAGGAACTCGGCGGCCTGCCGGGT
GAGCGTGCCGTACTGCAGCAGGTCACCGACGGTGAGCGGGÁCCGCGGCGAACTTGCGGATGGTCAGCGT
CGAGCCGTCCAGCGCGATCGGCGGGACCACGGCGTTGACCCGGCTCCCGTCCGGCAGCCGGGCGTCGAC
GGTCGGGCTGGCCTCGTCCACGCGGCGGCCGACCCGCGAGCAGATCCGGTCGATGATCCGGCGCAGGTG
CTGCTCGTCGTCGAACTCGGCGGCGACCTTCTCGAGGCGGCCGAACCGCTCGACGTAGACCGAGTACGG
CCCGTTCACCATCACCTCGGTCACGGACGGGTCGCGCAGCAGCGACTCGATCGGTCCGTGGCCGAGCAC
CTCGTCGGTCACCTCGCGGGTGATCCGGGCCCGGTCCGCGCCGGAGAGCGGGGTCTCCTCCCGGGCGAG
CAGGTCGTGGAGCGCGTCCCGGACCCGGGCGTCCAGGTCCTCGCTCTGGCCGGTGGTGTAGAGCGTCGG
CCCGAGCTCGTCGGCGAGCCGCCGCTGGATCCGCAGCCGCACCTCGCCGACCTGGTCCTGCGGCGGGCG
GCCGGCGGCCCGGTAGCGGTCGCCGCCGCGTGGCTCGGTGGGCGGTGGTGGGGGCGTGCCGGCGCCGCT
CAGGCGGCTGGAGAGGCTCACGGGAACAACCTCCCGAGGAACCCGCGGCGCCGCTGGGGTGTGGTGCCG
ACGCCGGCGATCCGGTCACCGAGCTCCCGGATCGCCCGGCTGACCGGGTGCAGÇGGGTCGGTGACGGCG
ATCGGCTCGCCGrGGTTGACCGAGACCGTCACGTCCCGGCTGGCCGGCACCTGCACCGCGAACGGCATG
CCGGCCGCGACCTCCACCTCGGACGGGCTCAGGCCGACCTGGGCGCCGGCCCGGTTGAAGÁCCAGCAGC
CGCTTGTCCTTGGGGTAGTCGAGCAGGTCGAACATCTCCGCGGTGAGCCGGACCGACTTGAGCGCCGGA
AGATCCGGGGTGACGATCGGGATGAACCAGTCGGACATGTCCAGCGCGGCCAGbACCTGGTCGGTGACC
ACGGACGGGGTGTCCACCACGATGAAGTCGTAGAGCGGGCGGGCCACGTCCAGÇAGCTCGACGACGAAC
TCCCGGCGGACCTGCTCGCCCTCGGCCGGGCTGGCCGGCGCCAGGAGGGCGTCGAGACTTTGCCGGTAC
GTCGTGACGATCGACCGCAGCCCGGGCTCGTCCAGCCGACCGGCCATCTGCAGGCCCCCGGCGATGTTG
CGTTCCGGGGACAGCTTCATCATGATCGCCACGTCGCCGAACTGCAGGTCCAGiSTCCATCAGCAGCACC
CGGCGTCCGGCACCGGCCAGCGCGACGGCCAGGTTCACCGCCACCACGCTGCGfiCCGCAGCCGCCCTTG
CCGGCGAAGACCGTGACCACACTGGCGTACGGGGCGTTGTCGCCGGTCCCGCGCATGGTGGTGCTCAGC
GCCTTGGACAGGTCGACCGACCGGACCGTCGCGCTGCGGATGCCCTCCTCGTCCTCCTCGGCGACCAGG
TCCCGGATGCCGGACTGCAGGCAGCGCAGCACCACGCCGGCCTCGATCGCGTGGCGGATCAGCACCACC
CCGATCACCGGGCGCTGCAACCGCTGGTACGCCGTGAACATCAGCGCCrCGTCCAGGTCCACGACCGCG
CCGATCACCACGAGCAGCGTCTCCGGGTAGCGGGGGAGATACGACTCCAGCTCGCTCATGCTCTTGAGC
ATCGTGCCGCCGATCGCCCGGAAGTCGTTGCCCCAGTGCGTGCGGCGCTCGTCGTCGGGCTCGACGTAC
ACATAGAGGCTCATCGCACGACCCAGCTCGTGTCGATCGCCGGGCCGGTGCTCGGGGTGGCGTTCGGGC
CGAGCAGCGCCAGGTAGAGCGATCCGCTCTGGGCGGCGTGCACGAGTCGCAGGGCGTCGGTGTCGCCGA
CGGCCAGGGTCACGACGTACCGCTGGATCTCCTTGACCGCGGCGGTGCTGTCqCCGGCCGAGGCGGACG
GACCGGGGGTGGGCGAGGGCGACGGCGTCACGGGGGCCTGACCCGGTTCCGCCTCCCCGATGGTGATCA
CCCGTGCCTTCGGCAGCAGGAGCTCGGTCATCGGGATGGTCTCGTGGTCCTCCGCCATCAGGACCTTCG
CCTGGTACGTGTAATAGACCGCGACCTGGTCGCCGGGCGTGÁTGTTGCCGGCTACCTGCGGGGCGACGT
TGAGCGCCACCGAGACCGCGAGCGACCTACGGGGCACCGGGATCCGCCCGGTGTGCGACGGCGCCGGTG
ACGCCGGGACGAAOAGCGTCCGCATGAGGAGCTGCCGGGGCTGCAGGTCCÇCdcCGAGCCGGAGCGGGT
CGAGCGCGCTGTCCCAGGTGGTCAGCGCCCCGGCGGGCACGGTGACGGTGGGGACCAGGAGCCGCTCGG
TCAGGCCCCGGGCGCGGATCTCGGCGCCGCTGGTCCCGGACGGGATGTGCTGCCCGGCGACCAGGATCC
AGGTGCCCTCCCGGCCGCTGAGCGCGCGCCGGTCGGCCGACCGGGCGTAGGACAGGACGGCCGCCCCGC
tgatcccggccagcáccagcgcggccagcaggatcaggatgcggcggcgcatgacttgaccttctcagg
CACCGGTCATCCCGTACGGCCGATCACCATCGCGCCGTAATACCGCGAGGTGGCGAACCGCGTCGGTACGTGGTCCGTGACCAGCGCTCTGGTGAAGTAGCCGTiyGAGGCAGGACTGCGCCGCGCACAGCGCTCTCTG
CGCCCCCGGCACGAGCGAGGGGACCGCGGATCCGGGTGACACCGGGCCGCTGACCGGGCTCTCGTAGCC
GGTGAGGACGAGCGGCGCGAAGCCGGCGATCCGGTAGTACGACGGCAGCGTGCCGATCACCGCCACCTG
CCTGTCGAAGATCGGCACCAGCACCGGCTGCCCCGAGGTGATCAGGACGTTCAGCCGGTCGAGGCAGGC
CGTGGCGGCGGAGGCGTTGCCGGGGCCGATGGTGAATCCGCCGACCCAGCTGTCCGCCGGCCCGTCGGT
CGCCGGGATGCCGGTCAGCTCGCAGGAGGCGTCCGGTGCGCTGÀCCGGCAGCAGGCCCGGCAGCGCCGG
CGGGCCGTCCGGCTGCCCGAGCCACGTGTAACCGGCGACGGTCTCGCCGGCGTCGGCCGGGCAGGACGT
GGCGAGGATGCCGTÇGCTGATCGGGATGTAGCCGGCCGTCGGGTCGGAGAGGCCGAGCAGCGGGTGGAC
GCCGGTCTGCGGGTTCGGGCCGGTGGGCGGCGGCGGGGCGAAGAACCTCGTGTAGTCGCCGGTCAGCCG
CAGGAAGTCGCACCGGGAGACGCCGAGCGCGAGGACGTCGGTGACCGCCGGAGCTCCCCAGGCGACCCG
GCCGCAGGCGCCCATCTTCGCCCCGTGGTACGÇCGACCCGGCCAGACÇGCGCCCGAACAGCGGCGGCAC
CACCGAGGTGTTGTCGCTGTTGCGGGTGGACGTCCGGACCTCGACGTACCGGTACGGCCCGGAGGCGCT
CGGCGGCGCGGGGCACGTGACCGGGGTGTTCCAGGAGCTCGGGCAGCCGGCGTCGGCGGTGGTGACGCC
GGCGGCGGAGACGGTGGTGATGCAGAACTGGACGTCCGAGACGAGGTCCTTGGCGTTCCGGTCGGÇGTA
CCGCTGCGCGTTGTCCCGCTGCGCGGCGACGGTGCAGGTGGCGGACGTCAGGTCCCGGCCGGCCGTGCC
GGCGCAGGCCTGCGCGACCTTCCACGACGCCGCGTCGGCCCCGCTCTGCAACTGCTCCCGCTCGGCGTA
GAGCGCGCCGATGTCGATCACCAGCGCCGCCATCCCGAGCAGGACGCCGGCGCCGGCCAGGACGGCGAC
CAGCGCGGTGATCACGCCGTGCTCGCCGCGGGGCGGGAACAGGGCGTGGATCAGCCGACGCATGACATC
ACGCCGGTCGCGCTCATCGTGATCGTGCCCATGGTCTGCCCGCCGACCAGCCTGACCAGCGCCACCATC
GGCGTGATCGGCTGGTACCGGCGGGTCAGCACGACCTCGGCGTCGGCGCCGGCGAGCGAGGTGGCCGAA
CAGGTCGTGACGGTCTGGGTCACCGACGGCGCCCCGGTGGCGCCGACGATGCCGTTGACCTTGGCGTGC
ACCGCCGCGGCCGTGCCGTTCAGGGCGCCGAGCCGGGCGCCCTCCCGGGCCGCCTCGGTGAGCTGGATG
TACTGCTGGAGCAGCCGGCCCATGTCGATGATCCCGAACAGGATCAGCAGCAGCACCGGCATCACGATG
GCGGTCTCCAGCGCCGCGGCGCCCCGGTCCCGGTTATCGTGCGGAGCTGTCCGCTCCCTGGGCGAGAAC
CGTACGCAACATCCCGGCCAGCCGGTCCGCCGTATACGGCTTCGCCACGAATGGCGACCCGGCACGGAT
CAGCCCTTTCTTGATGGCGATCTCCTCCGGGACCCCGGAGAGGTAGACGATCTTCATGGCCGGCCGGAC
CTCGGAGGCCGAGCGGGCCAGCTCCCCGCCGGAGACTCCCGGCAGGCCCAGGTCGGTGAGCAGCACGTC
GATCGÇTCCGCTGTGCACCCGGCACGTCATGATGGCGCTGACCGGGTCTTTCGCCACGAGGACGACGAA
CCCGCGCATCTCCAGCATCTGTGCGGCGAGCTCACGCAGGTCCTCGTCGTCCTCCACCAGGAGAACGAC
CGGCCCCTGCCGCTCGGTTGCTTTCCACATCATTCCTCTCCCGGTGCACGAGGAATCCGGCGACGACTC
TTCCCGTCGCTGCCTCTGCTCACGCTATCCACCGGCCTGCÇTGGCCCGGTGGCATTCGCGGAAATGTCG
ATGCCCTCAAATCAGCATTTGTCCGGCGGCACTGTCCGTGTTAACGCTCACTACGTTGCGCTGACGTCA
CGTTTCGTCCCGGTAACAGTTCGGGGTCTTGACAGATCACGAGCGTCGATGGGTGAATGTGTTCAATCC
TGATCGGACGAGTGCAGGATAAACAACGTTTGCGTGTGAAGCCGTTTGGCTTTGAGGGGGCTCCATGTT
CAATTACGTCAGTTTCGTGCGCCCTAAAACCTTTGCCGCCACCTTCGCGGCAGCCGCCCTGCTGCTCGG
CTCGGGCGCCTGCGCGAAGAGCGAGGACXCCGGGGACACCGTGGCGGCGGGTCCCGCCCCGTCGGCGGC
GCAGGTGGTCCAGTCCGCCTCGGCCGGCTCCGCGACCTGTGCCTTGGATCAGTACGGCGCGTCCAAGCT
CGACCTGAAGACCGCCTCCGTCGGCTTCTCCCAGTCGGAGAAGGAGGCGAACCCGTTCCGGATCGCCGA
GACGAAGTCCATCAAGGACGAGGCCGCGAAGCTGGGCATCACCAACCTCAAGACCTCGAACGCGAACTC
ACAATTCAACAAGCAGATCGCCGACGTCGAGCAGATGATCGATGCGGGCGTGCAGCTGCTGGTGATCGC
GCCGCTCAACTCGGACGGCTGGGACTCGGTGTTCGCCAAGGCGACGGCGAAGCACATCCCGATCATCAC
GATCGACCGGAAGATCAACGCGACCGCCTGCAAGGACTACCTGACCTTCATCGGCTCCGACTTCGCCGA
GCAGGGCAAGCGGGCCGCCGACGCGCTGGCCAAGTCGCTGGGCAACAAGGGCGAGGTGGCGATCCTGCT
GGGCGCTCCCGGCAACAACGTCACCACGCTGCGGACCAGCGGCTTCAAGGACGAGATCGCCAAGGTCGC
GCCGGACATCAAGATCACGTTCGAGCAGACCGGCAACTTCTCCCGGGAGGACGGGCAGAAGGTCGCCGA
GCAGCTGCTGCAGTCCAAGCCGAACATCAACGGCATCTACGGCGAGAACGACGAGATGGCGCTCGGCGC
GATCACCGCGCTCAAGGGCGCCGGCAAGAAGGCCGGCGACGTCAAGATCGTCTCGATCGACGGCACCAA
GGGCGCGGTGCAGGGCATCGTGGACGGCTGGGTCTCCGCGGTGATCGAGTCCAÁCCCGCGCTTCGGGCC
GCTGGCCTTCGACACCGCGACGAAGTTCTTCGGCGGCGAGCCGGTCGGCCAGGACATCGTCATCCAGGA
CCGTGCCTACGACGAGTCGAACGCCAAGACCGACATCGGCAGCGCGTACTAGAGAGCGCTCCCAATCGG
GTGTCCGGGGATGAACCGGGCACCCGCCGGCACGGAGGAGGGCGGCTCATGCTGCTGGAAGTCTCCGGC
GTCTCCAAGACCTTCCCCGGCGTACGCGCCCTGGACGGGGTGTCCTTCACCCTGAACCCGGGCGAGGTG
CACGCGCTGGTGGGGGAGAACGGCGCCGGCAAGTCGACGTTGATCAAAGTGCTCACCGGGGTCTACCAG
CCGGACAGTGGCGAGCTGCGCTACCGCGGCGAGCCGGCCCGGTTCGCCACCCCGCTGGACGCCCAGCGG
GCCGGTATCTCGACCATCTATCAGGAGGTCAACCTCGTCCCGCTGATGAGCGTGGCGCACAACCTGTTC
CTCGGCCGGGAGCCGCGCAACCGGTTCGGGCTGCTGGACGAGGCCCGGATGGTCGCCGAGGCCACCGAGaxccxggccggtxacggcgxacgcaccgaxgtccgccgccgccxcggcaccctggcccigggcgcgcag
cagatggxcgcgcxcgcccgggccgxcatggxcgacgcccgggicgxggigaxggacgagcccacctcg
tcgcxggagccgcgcgaggiggagacccigxxcggggtgaxccgcgagcxgcacaccgcgggcaxcggc
axcgictacgictcgcaccggcxggacgagcicxaccgggxgigcgacgcggxcacgaiccxgcgcgac
ggcaagctcgtgcacaccggccggatggccgatctcgaccggcgcacgctggtctcgctgatgctcggc
cgcgagxicggggcggacxxcaccagcxxciccgagxcaccgcagagcaccccggagggcgagccggtc
cigcgggtgxccggccigaccagccgcccccggcxcgacgacaxcagcttcgacgtgcgccccggcgag
gxggxcggccxgggcggccxgctcggcgccggccgcagcgagacgatcaaggcgatcggcggggcgtac
ccgatcgactccggcgtgatcgaggtcggcggcgtccggctcggcaggcccagcacggtacgggcggtc
cgcgcgggcgtggccacccagccggaggaccgcaaggccgaggggaicgxccccggcctgtcgatccgg
gacaacaxcgcgctcgcgaxccxgccgcggaxggcccgtticggactggxcagcgacaagcggatcgac
agcatcgtcgccacgtacatgagccggctgcggatcaaggcgtgcggtccggaccaggcggtcggcgat
cxcxccggxggcaaccagcagaaggxgctgcxcgcgcggcigctcgccaccggcccgaaggxgctgctg
ctcgacgagccgacccggggcatcgatgtcggcgccaaggccgaggtgcaggcgctgarcgacgagctg
gcgaaggaggggctcggtgtcgtgctggtctcctcggacgccgaggaactggtcgagggcgcggaccgg
gtggtggtgctgcgcgacggcggggtcgtcggcaccctcaccggcgaccgggtgaccaccgaggccctg
atggccacgatcgcggaggccgcggátgagcactgagaccctgacccgcccgcggatgacgttcaaccc
ggcgtgggcggcacgctacggcgtctacgcggcgatcgttctgctgatcgtcgtcaacatcgccttcac
gccgtacttcctgaccctgagcaatctgcggatccagctgatccaggcggcgccggtggtgatcgtcgc
gctcggcatggcgctggtcatcggcaccgaggggatcgacctctcggtgggttcggtcatggcgctcgc
cgcggccttcatácccctctatctggggtacggcgtgacagccgcgatcctcgtctcgctcctcgcggg
igtggcggxcgggcigatcaacggxgicciggtcgcgaaggccggcctgcagccgatcgtggcgacgci
ggccctgttcgtcggcggtcgcgggctggccgtggtgatctccggtggacagctcaaggacgtgcgcaa
cgccgacctgctctacctgggctccggtgacctgçtcggcgtgccggtcctggtctggatcgcggcgct
gctggtgctcgtggtggcgttcgtggtccggcgtaccgtcttcggccggcgcctgctggccgtcggcgg
caaccggcccgccgccgagctcgccggcgtcccggtcaagcgggtgctgatcggcgtctacgtcttctg
cgcggxgctcgcctcgatcgccggccxgctctcggtcgcgcgcatccagtccagcgacgcgtccgcggt
cggcctgctgatcgagctctccgcgatcaccgcggtggtcgtcggcggcaccccgctcaccggcggccg
ggxccgggxgcxcggcaccgxggccggggccctgcxcaxgcaactggiggicgccaccatgaxcaaaca
cgatcxcccgccgiccaccaccgagaiggtgcaggccgtgatcaicciggicgcggtcxacgxggcccg
ggagaggaggacccggtgaccatgtcgatccccgtgcccgctttccggaacggcggcttcgtgcagcgc
cagggcgcgctcgcggtgctggtcaccgtggtggcgatcagcctggccgcgttccccggcttccgcagc
gcggacaacgccggcacgatcctggtcgccgcggcgccaccgatgctgatcgcgctcggcatgaccttc
gtgatcatcacgggcgggatcgacctctcggtcggctcgctctacgtgctcggcggggtggtcgccgcc
tgggcgtcgcagtggggagtcgtcgcggcgctggccgcgccgttgctcctgtgcggggccatcggcgta
ctgaacgggatcctgatctcgagaaccgggatggcgcccttcatcgtcaccctcgccgcgctgctcggc
gcccgtggcctcatgcgcagcatcagcgatgagggctcgacgacgtacctggtcaggagcgacgtcttc
cacgagcxgggcacgggaicccigcicggcgtcggtctgccggxctggcxggccgcggxicxggxcggc
gccgggaxcciggigcxgaaccggacccggxtcgggcacgccgxgcacgccatcggcgggagcgaggac
gccgccgcgctgatggggcxgcccgtacggcgaataaaggtcigggxcxaxcxccxcxccgggcxgcxc
gcgggactcgccggxgcgaxcaacgcggccaagctcggctccggggxcaccgxgcxcggcagtggcaxg
gagcxcgacgccaicgccgccgxcgxgaxcggtggcacgcxgcxcaccggcggctccgggtcgatcgcc
ggcacggicgcgggggxgcxgçigcxcggcgtgaxccagaaccxgaxcaaccaggicggcaacgicaac
agcaactggcagcaggtgaxcagcggxgggttcctcgccgcxgiggicgiggcgcagacaacxcxcgta
cgcgcaagaagaicxtgacgtggaggcccgcccggggacccxgccgcgggcgggcaggcgtaggiigcc
cgcatgacggagcatcgggicxccccggccgggcgggcgcxcgcgxggcxgaigcxggxctccgggttcgccgcggxcgtcgggxcgxxccxgccgxgggccxgggxcgacitcccggagcagggcagcagccaggtgtccgggagcctcgxgxccgaccxgxxcaccgcgxtcttcggggxcgxgcicgccgggiacgcggtgccc
gccgxgcgcggcgagcgccxgcccggccicgagacgxtcxxcxcggxcggcgccgggctggtgctgttc
acgctcggggccxgggacagccggcaccxgaccxcgaigaccgccgcccxggtcgcggccgacaccggc
acgaccaxcgggcccggxcicxggctgxgcatgatcggcgggcxgctgggcgcgctcgcggcggcggcc
cxcgccgxccggggacgccggccggxcgtcagcxcccgggxgtgaccacccagxçcgggtggxtcggca
tcggaggggxcgxgacgccgaggagccaggaggtcaggaacggccgcagatcctggcgggcgacccgcgaggcgagcgxgaxgaagxcaccggxcgaggcggagcggccgcggxacgxcgtcagccaggcgcgttcgacccgcxggaacgxcgccgcgccgaxctxctgccggagcgcgxagaggaccagcgcgccgccggcgtagacgttcgggttgaagacgtcccacgtggtcgccgcgtcgagcggggcggcgaccggaccgtacctggcgcGGÍ^AGATGTCGCCGGCGGCGTAGACGGCCTTGAAGAACGCCTCGCGGTCGGCCAGGCCGGTGTACTGCG
GGAACCCGCCGGTCTCCTCCGACCAGAGCATCTCGTACCAGGTGGCGTGGCCCTCGTTGAGCCAGACGT
CGCTCCACGAGAACGGCGAGACGCTGTCGCCGAACCACTGGTGGGCCAGCTCGTGGGTCATCGACGGGC
CGCGGGTGGTCTCGGGGCCGGTGAACAGGGCGGCGCCGTACAGÇGAAAGGGTCTGGGTCTCCAGGGCGT
AGCCCAGGTCGTCGTCGATCACCAGGGAGCCGTAGTCCTCGAACGGATAGGGCCCGGCCTGCTTCTCCA
TCCAGGCGAGCTGCTCGCGTTCCCCGGCGATCGCGGGCAGCAGCGTGCCGGCGAGGCGTCGCGGCACCA
CGTCGCGGATCGGGGTGCCGCCGGCCGCCGGGCGGCGCTCGACCACGAAGTCGCCGACGGCCGTCTGCA
CCAGCTCGGTGGCCATCGGGGCGGACTCGCGGTAGACCGAGCTGACGTGGCCGTCGTGCTCGGTCGTGC
TCACCÁGCGTGCCGTTGGCCGTCCCGGTCCAGÇCGGCCGGCACGGTGAGCGTGATCGTGAAGGTCGCCT
TGTCCCGTGGATGGTCGTTGCCGGGGAACAGCAGGTGCGCÇGAGCCGGGCTGGGCAGCGAGCACCGTCC
CGTCÇGGCGTCGCCACGAGAGCGGCCGGGGCGGCGGTGAAGTTCGCGACCGTGACCCGGAACAGCCGCC
CCCGGGGAAGGGGGCGCCGCGGGATGACGGTCAGCTCGTCGCCGTCCCGGGCGGCCCGCGCGGGCTGCC
CGTCGACCGAGACGCGCCCGATCGAGGCGCCGCCGAAGTCGAGGTCGAAGCGGGACAGGCTCTGCCCGG
CGACGGCGGTGATCGTCACATCGCCGGATACGACCTGCTTCGGGTCCTTCTCCGGGTAGCGCAGGCGGA
GGTCGTAGTCGAGCACGTCGTAGCCGCCGTTGCCGAGCAGCGGGTAGAGGCGGTCGCCGAGGCCGGCGG
ACCCGGGTGACGGCGAGGGCCCGGCCTGCGCCGGTGCGGCGGCTGCGGCCAGGGCGAGGACGACGGTGG
CGCCGACGGTGAGGACGCGGGTGCCCGCGGACGTTCGCATGGCTTCCGACGCTAGGCGACACCACCGGA
AGCCATCGACCCATGGGCATGTATGAAATCCCACAATCTCCGATGTGGACGGACGGATGGTGCGCAGTA
TGCAACTTGCAGATTTCGGGACATTCCCTAGCCCGGCGGTTGCCGTGTGCACCCGTTCGACCACTGTCC
GGAACCGCGTGGTGAGCAGGGTGAACGTTCATGCGGCCCGGGCCGCCGGAGGTCCCGTGACCGTTCGCA
TTGCCGTGCGCCGGTGAATCACTCCGCTTTACGACTTCGCGACAAGTGGTTAATGTCGGCGAAGCGATA
TATCGTCCAGTTATTCGGGGGACTGCGGTGCATGAGCAAAAAATCACrCCGGCGATTGCCAGCGGATCA
CCGCAAATTGAATTGCTGCCCGTCAATTCCCTGCGAGTGATGGATTCGCCGCGACTGAACGGTGAGGAC
CCGCGGCACACCGAGGTGCTCGCCGGCTTCGGGGCGGAGCTCCCGCCGATCGTCGTGCACCGGGCGACC
ATGCGGGTCATCGACGGCGCGCACCGGCTGAGCGCGGCÇCGGCTGCGCGGCGACGACCGGATCAGGGCG
GTGCTGTTCGACGGCACCGAGCAGGAGGCCTACGTGCTGAGCGTCAAGGCCAACGTGACGCACGGGCTG
CCGCTGTCCGCCGCCGAGCGCACCCGTGCGGCGGAGCGCATCATCACGATGCATCCTGACTGGTCGGAC
CGGATGATCGCGGCGTCCAGCGGGCTGGGCGCGCGGACCGTCGGCGGCCTCCGCCGGCGGCGCGCGGCC
TCCGGCGAGAGCCCGGCGGGCCTCCGCTCGCGCGCCGGCCGGGACAGCCGCGTCCGGCCGGCCGGCAGC
ACCGCGGGCCGGCTGAAAGCGGTCGACTACCrCCAGGACCGGCCGGACGCCTCACTGCGGGAGATCGCC
CGGCACGCCGGÇGTCTCTCCGTCGACCGCCCGTGACGTCCGGGACCGGCTGCACCGCGGCGAGGACCCG
ATCCCCGCCACGCAACGCGCGGCGGCACGCCCCGGAAACGATTCCCCGCCGCTGCGGTCGCTGGTCCAG
GGCTTGGCGAGCGACCÇGTCGTTGCGATTCAGCGAGTCCGGGCGCGATCTGCTGCGCTGGTTGATTGCC
CACGCCGTTCAGGACGGCGAATGGAAAGGGCTGGTCGACACTATTCCGGCGCATTCCGCGCAGGCGCTG
GCGAAAATCGCGCGCCATTGTTCGCGGGAATGGCGTGAGTTCGCGGACATCCTGGAGAAGGACGCCGCG
TAGGCCACCGGCATTTCTTCCGGCACCCGGTCCGCCCTCCGTCACGCACAGGTCAGAGTACTGATGGCG
GCTGTCAACCCGCCGATCTGCGGGTAGGTGCCGACGTCCTTCCGCCGACCGTCTGCCGAACGCATCCGG
TCGGTGCCCGATGTGCGGGTAGGCATTCACCGATCAGGGTTGCTCCAATGTCTCTCGTCGATACCGCGG
CTGATACCTCCGCGGTACTCGGCAGAACACTCCGTGGCTATGGCGCCGTGGTCCCGGAGCCTTTÇCTGA
AGTACTTCGGACGTACCTGTCCGGAGTCCCCCACAGAAGGAGACATCATGTCGGCCATCACCGTGGAAA
CCACCTGGAAGAACACCGACCTCCGGGAGGACCTCACCGCTCACCCGGCCGGCCTCGGCTTCGGCGAGC
TGAGCTTCGAGGACCTGCGTGAGGACCGCACCATCTACGCGGCCAGCAGCGGCTGGGTCTGCACCCTGA
CCATCGAGTGCGGCACGCTCGTCTGCGCCTGCTGACCAACGGTCATCGCACTGCCGGGACCGGGGCTGA
CCCCGGTCCCGGCACCCTCTCCCCGGCAGGAGCCTGCATGTCATCCTTTGCGATCGCCGCTTCGCCGGC
CAGCGCGTACCTGCACGAGCGCTCCGCCGGCCCCGGCGGCGACCCCGTGGCGGAGCACGAGCGGGTCGA
GTCGTGGCGCGAGTCCGCGTTCCTGGACGACCCGGTCCTGGACATCCGCCTGCGCGAGCTCGGACTCAG
CCGGGCCGAGTTCGGCCGGCTGCTGACCGACGGCGCGTACGAÇGCCGGGAGCACGGCCCTCGACTGGGC
CGGCGAGCTGGCCGCCGTGCTGGCGACCGGGACCGGCGCGGTCACCGGACTCGCCCGGTCGACCAAGCT
GTGGGCGCAGGGCTTCGACCGGCTGCCGTTCGCCGGGCTGATCGAGAGGTTCCTCGCGTACTACGAGCC
GCGGGTGCCGCGCACCGCCGGGACCGTCCGGGTGTCCCTGCTGGAGAGCCTCGCGAACCGCCTGCTCAC
GGTCGCGACCCGGACCCTGCTGCTGGAACTGAACGTGGCCCGGGTGCACGGCCGCCTGACCGGCGCCAC
CCCCGGGGAACGCTACGACCACTACGACCGGGTCCTGCTGACCGACCCGGACTACCTGCGCTCGCTCTT
CGGCGAGTACCCGGTGCTCGGCCGGGCCATGGTCGAGTGCGGCCGCCGCTGGGCGTCGGCGATGGCCGA
GCTGTTCCAGCGCCTGGACGCCGACCGTCCCGCCCTGCACGCCGCCGGGCTGCTGCCGGCCGGCGCGGG
CGAGGTCACCGCGCTCCGGCCCGACCTCGGAGACCCGCACAACAGCGGCCGCGCGGTCGCGATCCTGAC
CTTCCGGTCCGGTGCCCAGCTGGTGTACAAGCCCCGGCCGGTCGGGCCGGAGCGCGCGTACGCCGAGACcgccgcggccctgaaccggcacggcctgagcctgccgctgaccgccgtggacgtgctcgaccgcggcgcctacggctggtgcgagctggtccggcacgagccgtgcgccgaccgcgccgacctggaccgcttctaccggcgtaccggcgcggtcctggccaccactctgctgctcggcgccgtcgacgtgcacatggagaacgtcatcgcggccggctcgtcctgcatgcccatcgacctggagacgctgctgcagcccggggtcccgtccggtgacgcgacggacgcctacacccgggcgctcgacctgctcaaccagagcgtgctggcgatcgggatcctgcccgcccgggcgttcggcggccgggagcgcaagagcgtcgacgtcagcgcgatcggcggcggcgaggcacagaccgcgccccggccggtgccgatggtcgtggagccgttcaccgacgtggcccggatcgaggcggtggaagcgaccatgctgggcgcgcagaaccggccggtgctggtcggcgccgaggtgcggcccgaggagcacaccgaggcggtggtggccggcttcaccgaggcgtacgacctgatcgtccggcaccgcgaggacttcgccgacctgctggccggcttcggtgacgtcgaggtgcgctacctgccccgcccgacccgccggtacagcatgttcctgaccgagagctaccacccggactacctgcgcgacgcgcgtgaccgcgaccggctgctcgacaagctgtggaccgccgcgggcgcccgtcccgacctgatccccatcatcgagtcggagaagcgccagctgctggccggcgacatcccgtgcttccgcgcgctggccggcgaccgggcgatccgcaccgcgtccgccccggtggcgccggacttcttcgacgcccccggcatcgaggtgctggccggccgcctgcggcagttcgggccggtgcaccgggctgcccagctgcggatcatccgcgagtcgatgggaaccatgcccgcgcccggcgcgatcgccgggacacccgcgccatcctccgagcggcgtggcggcctcgacccccgtgaggccgccacgctcggggaccggctcgtgcgggagctcgcggacgaggcgatcctcggggccgacgacgccggctggatcggagtcagcatcgagggcctcgaccaggagacgttcagctacaagccgatggcgaccgggctgtacgacggcatcgcgggaatggcgctgacgtacgcgtacgccgcccgcacgctcggcgacgagcgctacctcgacctgacccgccgtaccgtcaagctggtctccggctãtctgcggtacctcgccgagcaccggatcgtggagacggtcggggcgtacagcgggatggccggcctgctctacacgctggatcacgtcgcccatgccaccggcgacgcgtcgctgctgggcgagatcgaggccgcgctgccctggctgcgggagtgcgctacccgcgaggagtgcccggacctgatcgccggcctggccggttgcgccgtcgtcgcgctgtcgctgtaccggcggcacgggatcgccggtta
ccgcgaggtcgcggagatctgcggccggcgactggccggcaccgcggtcgacgtcgagggcgccgcggg
ctgggccgcgacccggaccggcgtgatcctcggcggtttctcgcacggctcggccgggatcgcctgggccctgcacgagctcgccgccgagttcggtgaccgggacctgcgcgagctggccgaccgggcggtcgagttcgaccggcggctgtacgttccggccgccggcgcctggcgcgacctgcggcccgagatggccggcaccgacggttacccggcgctctggtgtcacggcgccgccggcatcggcctgtcccggctgctgatccaccggatccggccggacgagcggctcgccgaggaggcccgcgccgcggtggcgctggtccggcggcacggcttcggccacaatcacagcctctgccacggcgacttcggcgcgctggccctgctcggcctggccgaccgcgcgtggcccgggtcgggcggccacgacgagcgtgccggcgcggtcgtgcgggacatcggcgagaccggtctgcgctgcgggctgggcaacggcatccggatgccgggtctgatgctcggcgccgcgggcgccggactgagcctgctccggctggccgcgcccgccgacgtgcccgcggtcacctggctggaaccgccgcggggcacgcatgtctgagacggccgggctgctgcggcggagcctgctcgatcaccggggcaagctcgccgccgtggccggtctcgccgtcgccggggtcggctgccagctgggccagccgttcctcatccggcgcgtgctcacggcggtgcagtccgcacagccgtaccgccaattggctctcgccgttctggcggtcatggtcgtcggcgcggcgctgggcgccgtccagcagttcctgctgcagcgcaccggggaggcgatggtcttcacggtgcgccgcacgctcgtcgcgcacctgctgcggctgccggtcgcggcctacgacgagcggcagtccggcgatctggtgtcccgggtcggcgccgacaccgcccaggtgcgctcggtgatcacgtccggggtggtcgacctggccgggggcgtcctgctcgtcggcggctcgatcgccggcatgatcatcattgatccggtcctgctcggcgtcagcctggcgccggtgctgtgcggcgccgccggggtccggctggtcggccgtcggctgggcccgctcagctcggcggtccaggagtcgatcggcgcgctcaccgcctcgaccacccgggccctcggcgcgatccgcacgatccgggtcgccggcgccaccgagcgcgagaccgccctgatcgtcgccgaggccgaccgcgcccgggcggcgggcgtccggctcgccctggtcgcggcccaggccggcccgatcgtccggctcgccctgcagggcgcgttcgtcgcggtgatcggcttcggcggctaccgggtcgcgaacggcgcggtgtcggtcggcgacctggxcgcgttcacgctgctgctgttcacgctggcgctgcccctggcccagctcgccgaggcggccacccggatccagaccgggctgggcgcgctgacgcggatcgaggagatcctggccctgccggacgaggacagcgcgctcggcgtccgtgcgaggacgcccgccacggtccggçacgatccggtgctgctggagttcgatcacgtgtcgttccgctatcccaccggcggggagatcctgcgcgacgtcagcttccgggtgccggccggcagcaccaccgcgctcgtcgggccgtccggggccggcaagtcgacgatcctggcactgatcgcccggctctacgaggtccacggtggccggatcctgctgcacggccgcgacatccgcgacracccgctcgccgagctgcgggccgccctcggctacgtcgagcaggaggccccggtgctggccggcaccgtccgggacaacctgacactggccgcgccggacgtcgcggaacacgcgatccgccacgtcaccgcatcggtcaacctcgacgacctgctcgcccgtgacccggccggcctggacgcggcggtcggggacggcggcgtgctgttctccggcggtgaacggcaacggctcgccgtcgcccggaccctgctcgccccgggcgaactgctgctcttcgacgagccgaccgcccacctggacgcccgcaacgagcaggcgctgcagcacggcctgaccgcgcacgccgccggccggacgctggtggtggtcgcgcaccGCCTGGCGACCGTCGCGCACGCCGACCAGÂTCCTGGTGATCGACGACGGTCGTTCGGrCGCCGCCGGGC
GGCACGAGGAGCTGCTCGTCCGCGACCCGACCTACCGCGAGTTCGCCACCCGTCAACTGCTGACCTGAA
TCCCGAGGTGTACGCCATGCTCAGTGTCCTGGACCAGGTGCCCGTGTTCCGTGGCGACGACCCCGCCGA
GGCGGTCCGCGAGGCCGTCGGGCTCGCCCGGGCCGCCGAGTCGCTCGGCTATCACCGGTTCTGGATCGC
CGAGCATCACGGCAGCGCCGCCAACGCGTGCGCGGCGCCGGAGATCGTGGCGGCGGCCGTCGCCGGAGC
CACCGAACGGATCCGGGTGGGCACCGGGGGÁGTGCTGCTGCCGTACTACAGCCCGCTCAAGGTGGCGGA
GGCCTTÇCGGGTGCTGGCGGCGCTGTATCCGGGGCGGATCGACCTCGGGTTCGGGCGGGGCAGGGGCGG
GCCGGCGGTGATGGCCGAGCTGCTCAACCCGTACGCGATCGCGACCGAGGAGGCGTACGCCGAGCAGGT
CGGCCGGCTTCTCGCGTTCCTGGGCGACGCGCGGACCGTCAGCCGGGTGTCGGTCACGCCGGCGGTGCA
GGACCCGCCGTTGCCGTGGCTGCTCGGCTCCGGCGTCGGCAGCGCCCGCCTCGCCGGGATGCTCGGCGT
GCCGTTCTGCTTCGCGCAGTTCATCGCGACCGAGGAGTGCCCGGAGGCGATCGCGGCGTACCAGGAGTC
GTTCCGGAGCTCGCCGTGGCTGGACGAGCCGCAGGCGATGCTGGCGTTGCGGGTGCTCGCGGCCGGCAC
CGCCGAGGACGCCGAGGAGCTGGCCACCGGCTTCTGGATGTCGTGCACCACCGGATGGCGGGCCCAGGT
CCGGCCGGACGACGACTACCGGGGTGGCGTGCCGAACCTGGCGGACGCCCAGCGGTACACGCTGACCGA
GGAGGACCTGGCGATGCGCGCGAGCCGGCCGTACCTGCAGATCTCCGGCACGGCGGAGACGGTCGGCGA
GGAGATCCGGCGACTGCGCAAGGTGTACGACGTGGCCGAGGTCATGCTCACCACGAACTGTCCCGGGGC
GGCCGCCCCGGCGCCGGrCCTACGAGCTGCTGGCCGCCGAGÇTCGGGCTGACCGCGCCGGCGTGACCCG
GGTCAGGCCAGCTCGTCGGTGGTGAGGCCGGCGGCGTACGCCAGCACGGCGGCCTGCACCCGGTTGGCC
ACACCGAGCTTGCGCAGGATGACGCTGACGTACTCCTTGACCGTGGAGTCGCTGATGAACAGGCGCCCG
GCGATCTCCGCGTTGGTCAGCCCCTGCCCGATCAACCCCAGAACGGCCTGTTCCCGGTCGGAGAGCTGT
TTGACCTCGTCGACCGCGTTCTCGGCGGCCGGAGTGCCCCGGCAGGCCGCGCCCAGCATGATCGACGAG
GCCTCCGGCGCCAGCACGGTCACCCCGGACGCCAGCGCGCGGACCGCCGCGACCAGTTGCTCCGGCTGA
CTGTCCTTGAGCAGGAAGCCGCAGGCGCCACCGCGCAGCGACTCCAGCACGGTGCTGGACGCCGCCAGC
GTGGCCAGCACCGCCAGCGCCGGCCCGGACTCCAGGTCGCGCAGCCGGGTCAGCAGCGGCACGCTCTCC
GGCAGGGTCGCGTGCGCGTCCAGCAGGACGACCGCGGGCCGGTGCTCGCTGACCGCGGCGAGCGCGCTG
TCGCGGTCAG.CGGCGACGACGGAGAAGCCACCCATCGTCTCCAGGATCATCTTGATGCCGATCGAGACC
AGGGCCTCCTCGGCCACCACCAGTACGTCCGCCATGCCTCCCCCGGGCAATGTAGCCGTACGAGATTTG
ATAGTGCACAAAAACCATCGAATTACTGCTCTTTCG2\ATCATACATGTATTTATGCAAATTTCTGGTCA
GGAAACGGGGACGATCCGAGACGCCCGGGCCGGCGTCTCGGATCGTCCTTCACCGCGCACGGCTATCGC
ACGAGCCCTTCCGCGGGGGCGATCCGCGTGGCTCGCCGAGCCGGCGCCAGGCTGGCCAGCACACCGGTG
ACCGCGGCGGCCACCAGCACGAGACCCAGCTGCGGCCACGCCAGCATGATCACCGGTTCGGCCTGCCGG
CCCACGGCCGCGATCACGCCGACCAGCCCGACCGGCACCCCGATGACGATGCCGGCCACCGTGCCGACC
AGCGTGATCGTGACCGCCTCGACGGCGACCATCGCGCGCAGCCGGCTCCGGCGGGTGCCGAGCGCCCGC
AGCAGGGCCATCTCCCGGGTTCGTTCGATCACCGAGAGGCCGAGCAGGTTGGCGATGCCGAGCAGCGCG
ATCACCACGGTGACCGCCAGCATGCCCAGCGACAGTCCGAGCAGGATGGACAGGACGTTCATGATGTCG
CCGCCCTCGGTGACACCGCCGCCGACCTCCACACCGGCGTCGCGTGCCGGCACCGCGTTGACGTCGGCG
GCCAGCGTCTCCCGGTCGAAGCCGCCCGGCGCGGTGCCCCAGACCGTGGTCGGCACGGTCCGGACCCCG
GCGGCGGTCAGGACGTCACCGGTGGTGACGCCGAGCAGCTGCCCGGTCGTGTCGGCCAGCCGCGAGCCC
CGGGCGGTGAACCGCAGGTCCCGCCCGCCGGCCGTGACCGTGAGCGGAGCACCGTCCGTCAGCCCGCGC
GCCGTCAGGTAGGAGGCCGGCACCAGCAGCACCGGGTCCCCGGTGGACGCGCTCAGCTCCGGCGCGAGG
CGCCCGGCCACGTCGGTGGGGAGCGCCGCGATCCGGGCCGGCGTGGGTTTGCCCGCGGCCGGGAACGTC
GCCGCGCTCGTCGCCACGGTGGCCGTGGTCAGCCCGGTGATCCCGGACAGCGCCCGGACCGTGCGGTCG
TCGATCGCCGCGCCGTCGGTGTGCACGCTGACCGCCACCGGATAGCGCGCCTCCAGGTCGGCCTCCACC
GTGGCCCGCCCGCTCGCCGAGGCCACGGCCAGGCCGGTGATCAGCGCGGCCCCGACGACCACGGCCATC
GTCGCCGACGCCGTCCGGCGCGCGTrCTGCCGGAGGTTGCTGCCGGCCAGGCTCGCCGCCACCCCGAAC
CGTTCCAGGCCGCGCGCCGCCGGCGGCÂACAGCAGGGCGATGCCCAGCGGCAGCGCGGTCAGCAGCCCG
GCGGCGAGCAGCACCCCGCCGACCAGCGCGAGCGGCAGGGAGGTGCCGATCGCGGCGAGACCCAGCACG
CCCACGGCCAGGCCGATCAGGATCAGCCCGGCGACCAGGCGGCGCCCGCCGCGGACCTGTGCGGGAAGÁ
GCGTCCGGCACCTCCTGCAGCGCGCGCACCGGGGGAACÇCGGGTCGCACGGCGGGCCGGCGCCCAGGCC
GCGACGACCGTGGCGÇCCACCCCGGTGAGCACACACAGCGCCAGCACGATCGGGTTGACCGCCAGGCCG
CCGCCGTTGATGTCGAGCAGGCCGGCCCCGAGATAGCCGAGCCCGACACCGGCGACCGCGCCGATCACC
GCGCCGATGCTCCCGGCGATCGCCGCCTCCGCCAGCACCACCCGGCTCACCTGGCGGCGGTGCCCGCCG
ACCAGCCGCAGCAACGCGACCTGGCGGACCCGCTGGGAGACGATCACCTGGAAGGTGTTCGC GATGACC
AGGATCGACGCGAGCAGCGCCACCGCGGCGAACGCCAGCATCAGCACGACCAGCTGGGTGTTGCCACCG
GCGAACCGGCCGGCGGCCGCGTCGGCGGCCGCCGACGCGTCGGTCGCGGTCGCCCCCGGCGGCAGGGCC
CGGCCGACCGCGTCGACGGTCTCGGCCAGCCGGTCCCGGTCCGTGACGGTGAGCAGCGCGGCCGGCGGCgtgtccccggcgaagaacgacgcggcggcgtagaaccggtagtccgagccggtcagcgggcggaagccgagatcggccgagccgaccacggtcaccggcaccggggcggccgtgccctgccggaagtcgaggtgggcgccgaccccgacgccgaggtcggtgagggtccgccggtcggcgacgacctgcccggccgcgctcggccaggtgccctcgtcgacggtgaaccagcgcaccgacgcggtcgccgggatgctctgcacgttggccgagccgcgccggtcgccgccgaagacgctgaccgtccgtgcgtactgcgggtcgacgctccgcacgccccgcaccccggcggccgcctggtaccactgcgggtcgtgcaccgtgtcgtcggcgtcgagcacgaxgtccgccgtggtcaacggggccgcggcggtgagccgcagaccctcgtccgaggtgctcgcgaacgtggccgtggcggccaggaagccggtggccagcacgaccgcggcgacgatcgcgagcagccggccggggtgcgaccggacctgcgaccaggccagcgtgaagatcatgacgtcaccgtcaccgacgccatgaccgacatgatcgactccagtgtgggcgctcggagctcgtcccagagccgcccgtcggccatgatcaagacccgatcggcgtacgtcgcggcggcagcgtcatgcgtcaccatgatgatcgtctggctggcctgccgggcggcgttctgcagcccggcgagcagcgcccggccggtggcgatgtccagcgcgccggtcggctcgtcggcgaacaccaccgacggctcggtgagcagcgcgcgtgccaccgcgacccgctgctgctggccaccggacagctcggcgggccgatggccgagccggtcgccgatctgcagcgacgcggcgatgcgctgcagccggtcgcggtccaccggacggccggccagccgcagcggcagcacgatgttctgctcggcggtcagcgtgggcagcaggttgaacgcctggaagatgaagccgacccggtcccggcgcaggtcggtgagcgcgcggtcgtccagcccggcgagcgcggtgccggccaggctgacctcgccctcggtcggtgtgtccagcccggcgagcaggtgcatcagcgtggtcttgccggagccggaggggcccatgatcgcggtgaactcgccggccgcgaaggaggtcgacaccccgtcgacggcgaccaccgcggcgtccccggttccgtaccgtttacgcaggttgcggcaactgaccatggagctgctcttcgtctgcatcatcacggttgcgacgttagggaagtggcgggccgcccacatccgtccggggcatcgccgcgaccgataccaaggtatcgacctggcgtgcggatggtgccgcgagcgctcgcggtccctactctgagagcgtgggaagctgggacaggagaacgctgacggtcgatacggtgatcgccggcgccgcggtcatggtgtgcctgctgctcgggttggccggtctggacgagtggtactggtcggccgcgctctgcgtccccctggtgatccggcgctcggctccggtggtcttcctcgcgcxggtcgcggtgctctccggcatccacatgatctactccggc
agcttcgcgttccccggtgacctggtcgatctggtcgccgtgcacgccgtcgccggttAcggcccggcc
cgggtccggcacctgggcctgctgctcggcgtggccggcagcctggtggtgaccgcccgggcgctgcac
gacgggctgccgtcgtccgcgacgctgcccgccgcgctgatcgtcgccgcgaccctggccgcctggtcg
accggcctgatgcaacgccggcagcgggccgacgtgatcgaggccgatcaccgccgccggctcgccgagcaggacagcgcgatgcgtgcccggctcgcggcgatcgaggagcgcacccggatcagtcaggagatgcac' gacatcatcgcccactcgctggcctcggtgatcgcccaggccgagggcggccgggtcgccgcgcgcgccgacgcggtcgtcgccggcccgctgttcgaccgcatcgcgcagatcggccgggaggccctcaacgacgtgaagcggctgctgaactcgatcgacggcgacacgccggacgacttcgcgcagggcctgcçcgacctgccgggcctgctggccggggtctccgccgccggcctcgacgtgacgttcgaggtggccggcccggagcagccgctcgcgtccggcatggacctggcggtgtaccgggtgatccaggagtcactgaccaacgtgctcaaacacgccacgcagcggcaggcccggctcagcctggtgtggacgccggcgtggctcgaggtcagcgtgaccagcccgctgaccttcgccggcgcgctccgcgagggtcgcgggctgtccggcatccggcagcggtgctcgttgttcaacggcgactgcgagatcgtggccgggcagaccttcagcgtgatcacccgctggccgctcgcccgtccggaggttgccgtcccatgaccgagccgcagatcgacgtggtgatcgccgacgatcaggacctcgtccggacgggcttcgccctggtcgtcgactcggccccggacatgcgggtggtcgcgaccgcggcggacggcgccgaggtggtgcggctggccgcggagttccgccccgacgtggtgctgatggacatccggatgccccgggtcgacggcatcaccgcggcccgggcgatcctggagggcaacgcxcagccgccgaagatcgtcgcgctgaccacctacgacaacgatgagtacgccagccggatcctggccgccggcgccagtgggtacctgttgaaggacaccaccgccgagggcctgaccgcggcgatccggacggtgcaccgcggcggctcggtgctgggcccgt
ccaccacccaccgcctGgtgaccgcgcaccgtcagcatccggcacgcccgtccgcgctgctggattcgt
tcaccacccgggagcgcgaggtcttcgacctgatcgtggccggcgccagcaacgcggagatcgccgaccgcctgaacçtggcggaggtcacgatcaagacccacgtcggccgggtgctggccaagatcggcgtccgcgaccgggtgaacgtcgtgatctgggcctaccggáacggcgccgggccgagctgagcaggggccaggccgcgctcgcactcggccgaatcccgaaaagcggctaggggaagcggatctcggcggccagcggcaggtggtcactgccggtccgggggagggccgtcagccgcgtgaccgtcatcgatcgcgccagcacctggtcgatccgggcgaccggcgtccgcgccggccaggtgaacgcgaagtccgcgggcgaatcgatcatcacttgccggatcggccgcagcccgcggtcgtccaccgacgtgttcaggtccccgatcacgaccagccgcggãaccgggtcggcggcgagcagcgcgccgagcttccgggcgctctcgtcccgccgtgccgaggtgagtcccgccgcggtgacccgcaccgacggcagatgcgcgacgtacaccgcggtgtccccgcccggcgtccgggccaccgcccgcagcccccggttccagtcctcgcccaggtcatgcggccggatgtcgatcgcctccgcgccggtcagcggatagcgcgaccácagcgccacggtcccctgcacggtgtggaacggaagctccgcgtcgagcacaccccggtaggcggccaccgcctccggcagcacctcctccagcccgaccaggtccggatgtgccgcgagcagcgcCCGGGCGGTCCCCGCCGGGTCCGGGTTCTCGTCGCTCACGTTGTGCTGCACGACGATCAGATCCGGCGT
GCCGGTGTCCCGGTCGACCACGTAGCCGCCGAAATGGATCAGCCACGCGCCCAGCGGCAGCAGCACCGC
GGCGAGGCCGGTCAGCGATCGCCGCATCAGCGCCAGCAGGAGCAGGACCGGCACGGCCAGCCCGAACCA
CGGCAAAAACGCCTCGATCAGGCTGCCCGCGTTGCCGACCGCGTTGGGGACCAGACGGTGACCGAGAAT
GACCGCCCCGGCCAGAACAGCGGTCCACAAGATCGGCATCGGGAGATGTTATCTTATTTCGCATGCGAA
ATAATGAGACGGTACGGATCCCGGTAGCGACCGGCGGCGCCGTCACGGCCACGCTGTTCGCGCCCGAGT
CCGCGCGTGCCGTGCTGGTCGTGCACCCGGCGACCGCGACTCCGCAGGGCTTCTACGCGTCGTTCGCCA
CCTACCTGGCGGAGAACGGGATCGCCACGGTCACCTACGACTACCGTGGCACCGGCCGTTCCGGCTCCC
CGCGCGACCACCGTGACCTGGGCATGCGCGACTGGATCGGCGCCGACGCCCCGGCCGTCGCGGCGTGGG
CCGCCGACCGCTTCCCGGGCCTGCCCCGGCTCGCCGCCGGTCACAGCCTCGGCGGGCACGTGATCGCGC
TCGGCGCGGCCGGCCCGGATCTGGCCGCCTCGGTGATCGTCGGCTCGCACATCGCCGCGCTGCGCACCA
TCCCGAGCCGGCTGGAGCGGTTCCGCGTGCGAATCATGCTTCACATCCTGGGTCCGGCCCTCGGGCGGC
TGÇTGGGCTACGTGCCGGCCAGAAGTCTGGGCCTCGGCGAGGACCTGÇCGGCCGCCGCGATGTTGGAGT
GGGGCGGCTGGGCGCGCAGGGACAACTACTTCTTCGACGACCCGTCGATGCGCGCCGCCGAGCGCGCCG
CCACCCTGACCGGCCCGGTCCTGGCCGTCGGCACCACGGACGACCCGTGGTCCACGCCGCGCCAGATGG
ACGCCCTCACCGTGCACCTGACCAGCGCATCCGTGGAGCGGCGÀACCTACTCACCGGCCGCCGCCGGGG
TCCCGGTGATCGGGCACCACGGCCTGTTCCGGCGCGCCGTGCGCGACACCGXCTGGCCGGAACTGCTGG
CCTGGTTGCACGCCCACTCGGAGAAGGCGTC2\AGATGACCGCGTGCGCCTGCCTCGCCTGATCTTCCTG
CTCTTCAACGCCGACCGCGCGGTCCGGCGCTGGATCGACGCCCGTTCCGGTGACACCGGGATCGGCGCG
TCCGGCGCCGGCGTGCTGITCTACCTCGCCGGTCACGAGAACGCCCTCATCGGCGACGTGACCGCGGCC
CTGGGTGCGTCACCATCCGGCATGAGCGGCCTGGTGAACCGCCTGGAGCGTGGCGGTTGCCTGACCCGC
TCGCAGGACCCGGCCGACGCCCGCGCGGTGCGGCTCGCCCTGACCCCGCGCGGACACCAGGTGGTGATC
CACGCCCGCGGGCTGGTCGACGACCTGAACGAGCAGCTCACGGCCGGTTTCGACGACGCCGAGATAGCG
GTCGTCCAACGCTGGCTGGAGCACGTGACCCGGGTGTCCGTGCAACGTGAGGAGCGÁCTCGGTTAGCGT
CCGGTGATCAGCTAAACCTCCGGGACGGGCCGCCGAAGTGAGGTGTCGCAAGGCACCACCGCTTCCGAT
CCGCCCTTGAGGAGACCCATGGCTGACTCCGTCGTCTTCGACCAGATCCCCGTCGTCCGCGCCATCGGC
CGAGGCACCACCTCGCTGAGCGCCTTCCACGACGCGCTGGTGACCATGGAGTGCGGTTTCTACAACCTT
GTCCGGCTCTCCAGCGTCATCCCGCCGGGCACCGCCGTCGACCCCAGCGGCAAGGCTCCGGTCCCGGTC
GGGGCGTGGGGCGACAAGCTGTACTGCGTCTACGCCGAGCAGCACGCCAGCCAGCCGGGCGAGGAGGCG
TGGGCCGGCATCGGCTGGGTGCAGCGCCGCGACGGCCAGGGCGGCCTGTTCGTCGAGCACGAGGGCACC
AGCGAGTCGTTCGTCCGCGAGGCGATCAAGGCCAGCCTCCGCGACCTGGTCAAGGGCCACGAGGACGAC
TTCGACGGCCCGGACTTCGTCGTCCACGGCGTGGTCTCCGACGGCGAGCCGGTCTGCGCGATGGTGCTC
GCCCCCTACGAGACCGCCCCGTGGCGCGGCGTCCGTGCCACCGACCCGCCCGGCATGAACTGACCTGTC
ACCACGAGAGCCTCGCCTCGCACGTCGGGGCGAGGCTTTCGGCATTCGCTTTTCACTTCGACAACCCCC
TCCGTACCGAAGAAATCGAAGATCAAATTCTTGATTGCCTATCTCCGCTGTGGTCCAGATCGTCGCTCC
CGCGGGGACCCTTCCGGTCTGAGCAGGGCCGTAACCGGCCCAGAACGCTCAGCCCGAAAGGGCGACCTC
CGTGGCGGGGCACGGTCAGGGCAAAATTCCGTCGCCGGTCGCCAGGGATTCGCCGCCGGTTGCTGCGGG
TGGGGTGCGGCGGTCCGCCGGAGGTATGGGTTGCCGCTACGCTCGGCTAGCTTTCGACCACCGGTAACG
TGTAATTCCCCTTCGGTCCACCTAGGCCCGTTGTGATCTCCTTATGGTGGGCTCGCTTATCCTCGTCCT
GTGCATCTGGGCCGCATCGGCCGCGATGTTCTTCCGGCTGTCCTCTCCGGCCCGGACGCCGGGCACCCG
TGCCTGGCGTTTCGCCCCGATCCTGACCGCCGGTTTCGCGATTCCGCTCGCCGCCGCCTACGGTCGGCA
GGACTGGTCCACCTTCGGGTCGCTGCTGGTCGCCGGCCTGGCCGGCTTCGCGGTCCTGCTCTACCTGCT
CCGTCCCGTCCGCCTCTGATCCATACTCGGTCGTTGTGACGACCCGGATGCCCCGCCTCGAGATCGAAT
ACTGCACACAGTGCCGCTGGCTGCTCCGCGCCGCGTGGCTGGCGCAGGAGCTGCTCACCACATTCCCCC
GCGATCTCGGCGAGGTTGCCCTGGTCCCCGGGATCGGCGGCGTCTTCGAGGTCCGCCTCGACGGCGAGA
TCCTCTGGAACCGCAAGCCGGACGGCTTCCCCGACCTCGCCCAGCTCAAGCGCCTGGTCCGCGACCGGG
TCGCCCCGGGCCGCGACCTCGGCCACTCCGACCGCGCCGCCACCGACTCCTAGCCCACACGXCCTCCTC
CACCGCTCCGGCCGCGGGACGCGTCTACGCGTACAGGATCCGGTCGATCGTCTCGCGGGGGAGCAGCGT
GCGGGCCCGCCCACCGCAGACGGCGACCACCGCCGGCCGCCCGACATAGACATCGCGCCGCTGGTGGTA
CGCCCCGGTACCGGACAGCGCCACCAGATCACCGGCCGCCATGTCACCCGGCAGCTCCGCCACCGCCAC
CGTCGCGTCCCCGCAGCGAACCGTGATCGACCGGCCCGGCGCCGGCGACGCCCGGCCGATCAGCGCTGC
CGTGTGCAGGCCGGCGCAGTCCGCCCCGGGCAGGCAGTCCGGGACGTCCCCGTCCAGCTCGATCACGCC
GTCCCCGGCGGCCACCACTCGGTGCACCGTGATCCCGGCACGACCCAGCAGCGCACGCCCGGGCGACAC
GTGCACCTCGGGCGGCTCAATGCCGTACCCCTCGGAAGTGACCTGCGCGACCGCCCGCAACCTGGCAGC
GAAAATGCCCACCGGGAGATCGGCGGCATGGCCGCCGCCGAGGTTGAGCACGGGCACCGTCGTCCGCAG
TCGCGCGACGAACCCGATCGCCTCACGCAGGCAACTCTCGTAGGTGCCGAAGCGGTTCAGCCGGTGCCCGAGCGAGCAGTCCAGCCCGGCCAGCACCAGCCTCCGCGACCGGGTCACCGTGGCGACGGCGGCGAGCGC
GGCCGAGCTGTTCAGCCGCACCCÇGTAGCCGCGCTGTGCGCTGCCCGGCCGGACCCTCAGCAGGACGCG
CTGCCCCGGCCGGGACCGCGCCGCGACCACTrCCGCCTCGGAGGCCGAGCCGATCACGACGGCGGCGCC
GCAGGACAGTGCCGCCTCCAGATCCGCCACGGACTTCCCGCTCCCGAACAGCGCCAGCGACTCCGGGCG
GATCCCCGCGTCGAGCGCCGTCCGÇAGTTCGGCGGCCGAGCGGCAGTAGCAGCCCAGCCCGTCCCGCGC
GATCCACCGCGCGGCACCCCTGAGCAGGCCGCCCTTGGCGCTGCAGCACACCGCGCCCGGCCCGAACGC
CGCGACGTACTCCGCGCAGCGACTGTGCACATCGGTCTCGTCGATCACGTGCACCGGAGTGCCGTGGGC
CGCGGCGATCCGGGTCACCGGCACCCCGCCGACGGTGAGGTCACCGGGCTCGGTCCAGCGTGCGGTGAG
CGGCCAGTTCGCGGGGTCGAGGCGCGGGCGGAGCGACGCGCCCAGTGAGGGCAGAATCTCGGACAACGT
CATACCGCGAGCCTGCTCGCCGGCCCGTGCCCGAGAAGATCCGGATACGCCACGTTGACGATCGACGTG
CCGTTGTTGACGTGTCGCCTACAGGTCGGGGCTGTCGGCGGGAGCCATGATCCGCAGCGCGTTCGGGTC
GATCGCGATCCGCATCGGCGTCGTGCCCCGAGGCTCGCCGTCGACCTCGACGGCCACCGGCCGATCCGT
CTCCAGCCAGAGTTCCCGGACCGCGATGAAAGGGCGTTCATGCAGGGTACGGCGATGÇCCGGTGGCCGC
GTTCCGGGCCGTCTCGCGCAGCAGCTCCCGCCGGCTCGCCCCGCCCACCGGATAGGCGACCAGCAGCCG
GTCGTCGGCGTGCGCGTCCGCGGTGATCGGCCGGCCGGCGTGGAAACCGCCGTTCGCGACGTACACCTG
ATGGGTGTGGAACCGCAGCTCCCGCCCCTCGGCCCGGATCACCGCGCGGACCGGCCGGTGCCGGGCGAG
CAGCCCGAGCGCGGTCATCGGATACGCCAGCCGCCCCACGGCCCGTTTGAACCGCGGCGGCGCGCTGAT
CATCACCTCGCCGGAGAGCCCGATCCCGACGTGGTTGGTGAACGGCACGTCCCCGGCGACGCCCAGGTC
CACGTCGATGACTTTGCCGTCCACCAGGGTCGCGATGGCGGCTTCGAGGTCCGGCTCGATCCGCACGGT
CCGGGCGAAGTTGTTGGTGGTGCCGAGCGGCAGCACCCCGAGCGCCACGTCCCGGTGTGCCAGCATCCG
CCCCGCGGTGCTGATCGTCCCGTCCCCGCCCCCGGCGATCAGCAGGTCGGGCTCTTTCCTGAGCGCTTC
GGAGATCAGCCCGTCCAGCCCGCCGGAÇTGCTCCAGCGCATACGTCCCGAGCAGCTCGAACCCGGCCTC
GACAAGCCGCCGCCGCGCCTCTTCGTAGAGGAGCCGCCCCCGCCGGGACCGCGTGTTGACAACAAGAAC
CGCCCGCCGCCCTCGCCGGATGTCAGCACTGTGCTCCCGCTTACTACGCACCCGCCGACCCTATCCGCC
CCAACCCACCCAACGCCCACGCCTCGTTCCCGCCCGCCCGGTCCCGAGCCGTGATCACCAGCCGCAAGG
CCTCAGCTGGCGTTGACGGCTGATTTCGGCCCGGTTTTGCGCCGTAGGCGCCAGCCGCGAGGTGTCGGC
TGGCGTTCAGGGCTGGATTCGGCTCGGTTTTGAGCCGTGGGTGCCAGCTGGGGGCTGCGGCCGGAAGGG
GGTGGAXGTGGGGATGCCCCGGGGCCGTAGGCCTCGGGGCACCGAAAAAGCGAACCAGCTCAGCTGTTG
GCGATGAACGCCGGATGCGACAGCAGGAACGTGTCGATCTGGTCCTTCTTGATCGACTTCAGCAGGTCC
ATGCTGTCGTCGCTCAGGAGCTCGACGCTGCCGGAGCCCGGCACGTTCTCCGAGTTCAGCTTGCCGGCG
TTGGTCTTGATGGTGAGGAGCTTGTCCGGCTTGAGGCTGCGCATCGCGAGCGCCCAGTCGGCCAGGTCG
ATGCCACCGTCGTCGACCGTCATCGCCTTGCCGAACGCGCTGAGCAGCTTCGGCAGCTTGGTCGGCGAG
TCGAGGCCGTCCTXCAGCGCCTGGTTGATGATCGCCTTGAAGAACTGCTGCTGGTGCCGCTGGCGACCG
TAGTCGAGCGAGTTGTCGGCGAGCAGGTCACGCTGGCGGACGAAGTCGAGCGCCTGGCCGGGGGTGAAG
CAGTGGTCGCCCTTGGTGTACGTGTTCGGCGTCACGCCCGAGATCTTGCTCTTCAGCGTGCCGTCCGGG
TTGATCACGAACGGCTTGGCGGTCTTGCCGTTCTGGTCCTTGCCCAGGTGGATCGACTTGGTCGTGGTG
TCCACGTACATGCAGACCTTGCCGAGCACGTTCACCACGTCGCGGAAGCCCTGGAAGTCGATGATCGCC
CCGGCGTCCGGCGTGATGCCGGTCAGTTCCTTGACGGrCATGGTGAGCAACTCGAAGCCGTGCTGCAGC
GCCTCGTTGCCCTTGAGCCCGCGGGTGCCGAACGCGAACGCGGCGTTGATCTTCGTCTTGCCGCCGGCC
CACTTCTGCTTCCCGTTGTCGTÁCGCCGGGAXGTAGACGTAGCTGTCCCGGGGGAGCGAGATCATGTAA
CCGCTGCTGTGGTCCTTGTTGATGTGCAGCAGGATGATCGAGTCCGACCGGAGGGGCTCGCCGTTGGTC
TGCGTGGGCCGCTGGTCGATGCCGACGAGCAGGAGATTCTTCGCCCCGTCGAGGTTCGCGTTCTTCTTC
TCCTCGGCGGGTTTCGCCGAGCCGAGCAGCGACTCCTGCCCGACCGAGGAGGTGGCCGCGGCCACCGTC
GCGTTCAGCCCGATCGCGCCACCGCCACCGCCGACCAGCAGCAGTGAGCCGAAGACCACGGTCCAGAAA
GCCCAGCGGGGTGTGCGGCGTCGGCGCTTGCTGGTCCTACGCAAGGGGTCTCCTCTAATCGGGGCGGTC
GTTCCGCÇCCAGGACAATCTAGGACGGTCGTTCCACCCATGAAGACGGGCGCCGCGAGCGAAAAGATTG
CCTGCGGAACATTGAATTTTCCTGAGCGTCAGGTAGCTACAAGCTGAACGTCGCGCTCGTGCCCCGTGG
CGTCGCGGAACGTTGCTTCCCTGTTACTCCCCAACGCGACGTCTGGTGTTAACCATCGCACCACCAAGG
CGACCTAGGTTCTGCACGGCCCCGGGCCCCCGAGGTTCCGACAAAGTTGCCCAAAGCGAGTCGCCATGC
CCTCAGAGCCGGATGTCAGTGTCGTCATTCCGACGTGTAACCGGCCGGAGTTGGCCGTCCGCGCGGTGC
GCAGCGCCCTCGGGCAGACGCACCGGAACCTCGAGGTGATCGTCGTCGTCGACGGTCCCGACGAGGCGA
CCGTGACGGCGCTGGGCGAGGTCGGTGACCCGCGACTCAGCGTGATCGTGCTGCCGGAGCGTGGCAAGG
CCCCGAACGCGCGGAACACTGGCGCCCGGGCCGCCCGCGGCCGCTGGACGGCGATGCTCGACGACGACG
ACGAGTGGCTGCCCACCAAGATCGAACGGCAGCTGGAGACGGCCGCGGCGGCGACCGTGGAGCGCCCGG
TGGTGGCCTGCCGGATGATCAGCCGGACGCCGCGGGCCGACACGATCATGCCGCGCCGGCTGCCCGAGC
CGGGTGAGCCGATCAGTGAATÁCCTGCTGGTCCGCCGCGGTCTGTTCTACGGCGACGGCTTCGTGCAGACGTCCTGCATCATGGCGCCGACCGAGCTGTGGCGGAAGGTGCCGTTCACCGTCGGCCTGCGCCGCGCGC
AGGAGCTGGACTGGACGCTGCGGGCGATGCGCGAGCCGGGCACCGCGCTGATCTACGCCGAGGAGCCGC
TGGTCCTCTGGCACCAGGACGAGAACCGTGACCGGATCAGCCTGCAGAACCCGTGGCGCGAGCAACTGG
AGTGGCTGCGCGGCAACCGGGAGCTGTTCACGCCGCGTGCCTACGCCGCGTTÇACGCTGAGTGTGCTGA
GCTCGATGGCCGCGCCGACCCGGGACACCGGGCTCTTCCGTGAGCTGCTCGCCGAGGCCCGCACGCACG
GCGACCCGGGCACCGTCGACTACCTTACGCACATGCAGATCTGGGCCCTCCCGCCGAGCGTCCGGCACC
GCCTGCGTGACGTCGTGGTGGGCCGCGGCAAGACGAGCAGCAATGCCGGCTGAGCGCCGGGTCGCGATC
TGGCGCAGTTCGATGCTGCCCGGCTCCGAGACGTTCGTCCGCAATCAGGCCGACGCGCTGACCCGCTGG
ACCCCGGCCTATGTCGGCGCGGTCCGGCACGAGTCGGTGCTGTCCCGCCCCGACGACGTGATCGÇCTTC
CCGGGCGGCAAGGGGTTCCTGCGACTGCGGCTGACCGGGGCGTCTCCCCAGCTGCAGAAGACGATTTCC
GCCGTACGGCCGAATCTGGTTCATGCCCATTTCGGTGGTGACGGATGGCTGGTGAGCCACTCCGCCCAG
CAGCTGGGGGTGCCGCTGGCCGTCACCGTGCACGGGCACGACGTGACCCGTCAGCCGTCCAGCCCGGGC
GCGAAGGGCGTGCGCTACCGCCGCAACCTGCAGACCGTTTTCACGCGGGCGTCGCTGGTCATCGCGGTC
TCGGAGGTGATCCGCGGCCAGGCGATCAGGTGGGGCGCCGACCCGGCGAAGGTGAAGGTGCACTACACC
GGCATCGCGGTTCCCCCGGAGCAGCCGGAGGAGGTGCCGAAGCGGTGGGACGTGGTGTTCATCGGCCGT
TTCGTCGCCAAGAAGGGCGTCGACGACCTGCTCACCGCGCTCGCCGCGGTCGAGTCGCGCCCGCGCGCG
CTGCTCATCGGCGACGGCGAGCTGATGACGGCGATGCGTGCCCGTGCCGAGCAGCTGGGCGTGGACGTC
ACGTTCGCCGGCAGCCGGACCCCCGAGCAGGTGCGGCGCCACCTGCTGGAGTCGCGGCTGCTGGCCTGC
CCGTCGAAGACCGCGCCGGACGGGGACACCGAGGGCCTGCCGACCACGATCCTGGAGGCGGCCGCGCTC
GGCCTGCCGGTGGTCGCAACCCGGCACAGCGGCATCCCGGAGGCCGTGATCGACGGTGAGACCGGCCTG
CTCAGCCCGGAGGCGGACCCGGCGGCGCTGGCGGTGTCGCTGACCCGGCTGCTCGGTGACGAGGATCTC
CAGCGCCGGCTCGGTGCGCGGGCGCGGCGGCACGTCACGGCACACTTCGATCTCGTGGAGCAGACCAGG
CGGCTGGAGGACCTGTATGACGAGGTCGTGGCGGGCGCTAGGGTCTAGGCCTGCCTGTCCGGCTTCCTG
GGGGAAATCATGATCTGCACGCACTGCGGCTCACCGGCGGCGCCGACCGTCGGCCCGTGCCCGGGCTGC
GGCCGTCCGGTCTCCGCCCCGGCCGGGGTGTTCCCGGACCCGCTGGCCGCGCCGGCCGAGCGGTCGCTC
CCCACGTCGGCGTACAGCGTGCCGGTCGATCCGTACACCGGCCCGACCACCGGTGACCCGTTCGCCGGC
GACTCGTTCCACACCCCGCCGCCGGCGTCCCCGATGCCGCCGCCGGTGACCGAGCCGATCACGCCGACG
CCGCCCCCGCCGGCCTACGCCCCGCCCCCGCAGTACAGCCCGCCGCCGTATGCGGGGGCGCCCGGTCAG
CCCTATCCGGGTCAGCCTTACCCAGGTCAGCCCTACCCGGGACAGCCCTACCCCGGGCAGCAGCCGTAT
CCCGGCCAGCAGCCCTACCCCGGATACGGCCAGTCGAACAGCCAGGCCCTGACCATCGTCGCCTACGTC
CTCGGCGGCTTCGGTCTCCTGACCATGACCCCGCTCATCGGCGTCGTCGGCCTGGTCCTGGCGAACTTC
GCGAAGCGCCGTCACGAGCGCAATGCCTCGATCGCGGTCAAGATCGTCGCCGGCCTGGTGATCGCCGCT
TTGGTGCTGAGCATCGTGGACCGCATCGTTTAAGGCCTGCCCTGCCGATCACTCAGGGCGGCGACTTCT
GGGCGGCGGGGGTGCTCCCCTCGCCGGAAAGGATGTCCGGTTCCCGGGATGGTCAGTACTGTCGGCTCA
TGGGCGAACATTTCGATCTTGTCGTGCTGGGCGCCGGTCCGGGTGGATATGTCGCGGCGATCCGCGGCG
CTCJ^ACTGGGCCTGACCACCGCGATCGTCGAGGAÇAAGTACTGGGGCGGCGTCTGCCTCAACGTCGGCT
GCATCCCGTCGAAAGCGCTGCTGCGCAACGCGGAGCTGGCGCACATCTTCCACCACCAGGCGCAGACCT
TCGGCATCGAGGGGÁAGGTCACCrrCGACTTCGCCGrCGCCCACCAGCGCAGCCGCAGCGTCGCCGACG
GCCGCGTCAAGGGCGrGCACTTCCTGATGAAGAAGAACGGGATCACCGAGATCCAGGGGCGTGGCGAGT
TCACCGACGCGCACACGCTGCGGGTCGGCGACCGGACGGTCACGTTCGACAACTGCATCCTGGCGACCG
GCGCGAGCACCCGGATGATTCCCGGCACGAGCGTCTCGAAGCGGGTCGTGACGTACGAGGAGCAGATCC
TCGACCCCGACCTGCCGGACAGCATCGTGATCGTCGGCGCCGGCGCGATCGGCGTCGAGTTCGCGTATG
TGCTGCGCAACTACGGCGTCGACGTGACCATCGTGGAGTTCCTCGACCGGATGCTGCCGCTGGAGGACG
AGGAGGTCTCCAAGGAGCTGCTCCGGCAGTACCGCAAGCTCGGCGTCGACGTGCGGGTCGGCACCCGGG
TGGAGGGCATCGAGGAGGGCGCCGACTCGGTCCGCGTCACCGTCTCCAAGAACGGGAAGACCGAGGTCC
TCGAGGCCGACAAGGTGATGCAGGCGATCGGCTTCAAGCCCAACGTGGAGGGCTACGGGCTGGAGACCA
CCGGCGTCACGGTGTCCGACCGCGGCGCGGTCGAGATCGACGACTTCTGCCGTACGAACGTGCCCGGCA
TCTACGCCATCGGCGACGTCACCGCGAAGCTGATGCTGGCGCACGCCGCCGAGGCGATGGGCATCGTGG
CGGCCGAGACGATCGCCGGCGCCGAGACGATGGCCCTCGACTACCGGATGATCCCGCGCGCGACTTTCT
GCCAGCCGCAGGTCGCCAGCTTCGGGTGGACCGAGGCGCAGGCCCGCGAGCAGGGCTTCGACGTCAAGG
TGGCCAAGTTCCCGTTCACCGCGAACGGCAAGGCGCACGGCCTCGGCGACGCGACCGGGTTCGTGAAGA
TCCTCAGTGACGCGAAGTACGGGGAGCTGCTCGGCGCGCACCTGATCGGGCCGGACGTGACCGAGCTGC
TACCCGAGCTGACCCTGGCCCAGCAGTGGGACCTGACCGTCCACGAGGTCGGGCGCAACGTGCACGCGC
ATCCGACGCTCGCCGAGGCGGTCAAGGAGGCGATCCACGGCCTGGCCGGCCACATGATCAACTTCTGAG
TCCGCCGCTCGGCCGACGGGTCCGCCGCTCGGCCGACGGGTCCGCCGCTCGGCCGACGGGTCCGCTGTC
CGGCCGACGAGTCCGCCGCCCGGCTGACGCCÇGGGGGAGTAGCCGGAGCCGCCCGTACCGCGCCTGCGGiagcccgaatacciacgcggggaigacgacxccgccccgccggicgggaacgctgagccttgtgaccctGACCGTCGAGCCTCCGATCGCCCCGGCGCCGCCCGCCGCCCCGGGGCGATCCCGGCGGCGCAGGCTGGGcxatciggcgttcgtgctggtcgcggtggiggcggtggigacgcigcgcgaccggctgccggatccgggggagttcctcgacgcgcigcgagcggccgactggcggtgggcggcgctcgcggtgggggccggggtgctgtcccagatcgcgtacgccgagcagcagcgccggcttctcgccgcgttcggagtgcgcgtgccggcccg
gcgggcgatcgcgatgacgtacgtccggtcggcgctgagcatggcgctgccggccgggtcggcggcctccgcggcgtacgccttccaggtctatcgtcgccacggcgccaccgcggcgatctccgcgãcggcgaccctgatctcgacggtçgtgaccgtgatgtcgctgggcctgctctacgccgcgacctggtcgctgaccgccaccgtcgtggccggcctggccgttcxcctgcigiggatctaccggaccgtgcggggcccggtccccgcgcgxgccggcgtgccgcgccgtcigagggtcgccccgatcgcccgcctgctccagcggcccgccgtggcccaggcgctccggggtgcacggtccgtcccggcccggacgtggctcacggtgaccctggccggcgtgatcaactggcigciggacatggcctgccigctccicgcggccgacgcgcigcacgccgggcxcggctggagccggctcg.cgctgaictacctggccgtccaggiggtccggcagatcccgcicacccccggcggcaicggccigatcgagaccagcatgctcgccggccigaicgccgcgggcgccccgcaggicaccgccgccgggatcgicctgatctaccggctgatctcgttctggctgatcctgcccagcgggctggccgcccacctgaccctgcgccgggggaccgigccgccggtgaciccgggctgaccgccggggctcaggcgcggtcgaactgctggagg
ACGGCGCCGAGGCCGAGCGTCAGGGCCGGGCCGGGCAGTCGTGAGTCCAGCCCGTACCGCCGGCCGGGG
ttctcccgatcgaccaggtccigccagagcccggtcaccggatcgcccagccccggcaggicgtgcccggccgcccggagcagctcggccaggtcgttctgctggcgcagccgctgctcctcgaagatctggctccactgcatcagcgagatcgacgcctccagtgtgtccggcaccgtctcgtccagcatcggcagcggtcgcgccgcggcccacgccgcgagctgcgccccggtcaccgtgccgggatcgtcgtcgcggctgcgcgccagcgcgtacgacagcagcgccgtggtctccaccagcaggtgctgcaccgggacgcgcgccggcgggtccagccac
cagtggxccgcctcgagcagggccgcggcgtgccgggtcgccgcccgccaccagccgtcgxcgccgccg
gccagggcgxcggxgxaggaccacaggaaggicacccxiccgigcciaccagcggcacxxgacacgagxcaaxcacgcgaacgcgiggcgacgaccgcgaicgciicgacggagaicagcagcccgxgcgggagaaccacgccggcgggcgcggaccgggccggcggcgggxcgggcaxgtgccgcgccagcacctggttgatcaccgggaagxccxcgacgxgcgxgiagaagacggxcagcxxcaccagcccgxccagcccgiccagcccggagccggccgccgccagcaccgcçccgaggxxgcacagcgcctgcxcggxctgcgccxcgaxgccgxccaccggctxcccggtcgcggggtcgatcccgggcatcccggagcagaacacgaacccgccggcgacgatcgccxggcxgxagggccccagcgccgtgggggçccgctcacxcgtcaccgcgatgcgatccatcgggcgagtctcccgcaccgggcatcgatggxciiicggctxtaigacacgggtgggagctigacagccgtacatcgxttatcgattatcaatatatcgaaaaacgataagggggtacgxcgtgàagaccgacxggitgacggagxtccaccaggigcigcxggicgccgcgcxgggcgccggggccgccgccgxccxcgggaccgicgggcicgtggxgcaggacgaggxcgxcgxcccgggcggcacgxcggcxccggcgagcgxggicagcgacccgagcgxcacccagcxccxgcxcgccgxggcggccgccgtgccgacgxaccigcxggcgaccgccaigcxggxgctgctgtaccggttggtcggcgçcgcgcgxcgcggggaxc
seq ID no: 201 orfi proteína do sistema de secreção 334aa
Vrlriqrrladelgptlyixgqsedldarvrdalhdllareetplsgadr
aritrevtdevlghgpiesllrdpsvtevmvngpysvyverfgrlekvaaefddeqhlrriidricsrvgrrvdeasptvdarlpdgsrvnavvppialdgstltirkfaavpltvgdllqygxltrqaaefldacvrgrrtxlvsggtgsgkttilnvlssfvpaderivtiedaaelqlvqdhwrlesrppnsegrgtixtrdlvrnalrmrpdriwgevrdaaaldmlqamnighdgsliilhantprdalsrletmvlmagmdlpirairdqissavd
SEQ ID NO: 202 orf2 regulador de resposta 358aa
mselesylprypetllwigavvdldealmfxayqrlqrpvigwlirhaieagwlrclqsgirdlvaeedeegirsatvrsvdlskalsximrgtgdnapyas vvtvfagkggcgrs wavn lavalagagrrvllmdldlqfgdvaimmkls perniagglqmagrldepglrsivtxyrqsldallap as paegeqvrre fwelldvarplydfiwdtps wtdq vlaaldms dwfipivtpdlpalks vrlxaemfdlldypkdkrllvfnragaqvglspsevevaagmpfavqvpasrdvivsvnhgepiavtdplhpvsrairelgdriagvgttpqrrrgflgrlepSEQ ID NO:203 or£3 proteína hipotética 266sa
MRRRILIL LA AL VL AGIS GA AVLS YARS ADRRAL S GREG Γ WIL VAGQHIPSGTSGAEIRARGLTERLLVPTVTVPAGALTTWDSALDPLRLGGDLQPRQLLMRTLFVPASPAPSHTGRIPVPRRSLAVSVALNVAPQVAGNITPGDQVAVYYTYQAKVLMAEDHETIPMTELLLPKARVITIGEAEPGQAPVTPSPSPTPGPSASAGDSTAAVKEIQRYWTLAVGDTDALRLVHAAQSGSLYLALLGPNATASTGPAIDTSWWR
SEQ ID NO:204 orf4 proteína hipotética 432aa
MRRLIHALFPPRGEHGVITALVAVLAGAGVLLGMAALVIDIGALYAEREQLQSGADAASWKVAQACAGTAGRDLTSATCTVAAQRDNAQRYADRNAKDLVSDVQFCITTVSAAGVTTADAGCPSSWNTPVTCPAPPSASGPYRYVEVRTSTRNSDNTSWPPLFGRGLAGSAYHGAKMGACGRVAWGAPAVTDVLALGVSRCDFLRLTGDYTRFFAPPPPTGPNPQTGVHPLLGLSDPTAGYIPISDGILÃTSCPADAGETVAGYTWLGQPDGPPALPGLLPVSAPDASCELTGIPATDGPADSWVGGFTIGPGNASAATACLDRLNVLITSGQPVLVPIFDRQVAVIGTLPSYYRIAGFAPLVLTGYESPVSGPVSPGSAVPSLVPGAQRALCAAQSCLYGYFTRALVTDHVPTRFATSRYYGAMVIGRTG
seq id no:205 orf5 ligação a ATP regulador de resposta i36aa
MWKATERQGPWLLVEDDEDLRELAAQMLEMRGFWLVAKDPVSAIMTCRVHSGAIDVLLTDLGLPGVSGGELARSASEVRPGMKIVYVSGVPEEIAIKKGLIRAGS P FVAKP YrADRLAGMLRT VL AQGAES S AR
seq id no: 206 orf β transportador de açúcar 363aa
MFNYVSFVRPKTFAATFAAAALLLGSGACAKSEDSGDTVAAGPAPSAAQVVQS ASAGSATCALDQYGASKLDLKTASVGFSQSEKE ANPFRÍAE TKSIKDEAAKLGITNLKTSNANSQFNKQIADVEQMIDAGVQLL VIAPLNS DGWDSVFAKÁT AKHIP11TIDRKINATACKD YLTFIGS DFAEQGKRAADALAKSLGNKGEVAILLGAPGNNVTTLRTSGFKDEIAKVAPDIKITFEQTGNFSREDGQKVAEQLLQSKPNINGIYGENDEMALGAITALKGAGKKAGDVKIVSIDGTKGAVQGIVDGWVSAVIESNPRFGPLAFDTATKFFGGEPVGQDIVIQDRAYDESNAKTDIGSAY
seq íd no:207 oxf7 abc ligação a ATP transportador de açúcar
5 0 Iaa
MLLEVSGVSKTFPGVRALDGVSFTLNPGEVHALVGENGAGKSTLIKVLTGVYQPDSGELRYRGEPARFATPLDAQRAGISTIYQEVNLVPLMSVAHNLFLGREPRNRFGLLDEARMVAEATEILAGYGVRTDVRRRLGTLALGAQQMVALARAVMVDARVWMDEPTSSLEPREVETLFGVIRELHTAGIGIVYVSHRLDELYRVCDAVTILRDGKLVHTGRMADLDRRTLVSLMLGREFGADFTSFSESPQSTPEGEPVLRVSGLTSRPRLDDISFDVRPGEVVGLGGLLGAGRSETIKAIGGAYPIDSGVIEVGGVRLGRPSTVRAVRAGVATQPEDRKAEGIVPGLSIRDNIALAILPRMARFGLVSDKRIDSIVATYMSRLRIKASGPDQAVGDLSGGNQQKVLLARLLATGPKVLLLDEPTRGIDVGAKAEVQALIDELAKEGLGWLVS SDAEE LVEGADRVWLRDGAWGTLTGDRVTTE ALMATIAEAADE
H
seq id no: 208 orf 8 permease de transporte ABC 3i9aa
MSTETLTRPRMTFNPAWAARYGVYAAIVLLIWNIAFTPYFLTLSNLRIQLIQAAPVVIVALGMALVIGTEGIDLSVGSVMALAAAFIPLYLGYGVTAAILVSLLAGVAVGLINGVLVAKAGLQPIVATLALFVGGRGLAWISGGQLKDVRNADLLYLGSGDLLGVPVLVWIAALLVLWAFWRRTVFGRRLLAVGGNRPAAELAGLPVKRVLIGVYVFCAVLASIAGLLSVARIQSSDASAVGLLIELSAITAVWGGTPLTGGRVRVLGTVAGALLMQLWATMIKHDLPPSTTEMVQAVIILVAVYVARERRTRGXGXCCCCGGCGAAGAACGACGCGGCGGCGTAGAACCGGTAGXCCGAGCCGGTCAGCGGGCGGAAGCCGAGATCGGCCGAGCCGACCACGGTCACCGGCACCGGGGCGGCCGTGCCCTGCCGGAAGTCGAGGTGGGCGCCGACCCCGACGCCGAGGXCGGIGAGGGTCCGCCGGTCGGCGACGACCTGCCCGGCCGCGCICGGCCAGGTGCCCTCGTCGACGGTGAACCAGCGCACCGACGCGGXCGCCGGGAIGCTCXGCACGXIGGCCGAGCCGCGCCGGTCGCCGCCGAAGACGCTGACCGTCCGTGCGTACTGCGGGTCGACGCTCCGCACGCCCCGCACCCCGGCGGCCGCCXGGXACCACTGCGGGTCGXGCACCGIGTCGICGGCGTCGAGCACGATGTCCGCCGTGGTCAACGGGGCCGCGGCGGXGAGCCGCAGACCCICGTCCGAGGIGCXCGCGAACGXGGCCGTGGCGGCCAGGAAGCCGGTGGCCAGCACGACCGCGGCGACGATCGCGAGCAGCCGGCCGGGGTGCGACCGGACCTGCGACCAGGCCAGCGXGAAGAXCAXGACGICACCGTCACCGACGCCATGACCGACATGATCGACICCAGTGTGGGCGCTCGGAGCTCGTCCCAGAGCCGCCCGTCGGCCATGATCAAGACCCGATCGGCGTACGXCGCGGCGGCAGCGXCATGCGTCACCATGAXGATCGXCTGGCTGGCCTGCCGGGCGGCGTXCTGCAGCCCGGCGAGCAGCGCCCGGCCGGTGGCGATGTCCAGCGCGCCGGTCGGCTCGTCGGCGAACACCACCGACGGCTCGGXGAGCAGCGCGCGXGCCACCGCGACCCGCXGCTGCIGGCCACCGGACAGCTCGGCGGGCCGATGGCCGAGCCGGTCGCCGATCTGCAGCGACGCGGCGATGCGCTGCAGCÇGGTCGCGGTCCACCGGACGGCCGGCCAGCCGCAGCGGCAGCACGATGXXCXGCICGGCGGTCAGCGTGGGCAGCAGGTTGAACGCCTGGAAGATGAAGCCGACCCGGTCCCGGCGCAGGTCGGTGAGCGCGCGGTCGTCCAGCCCGGCGAGCGCGGTGCCGGCCAGGCTGACCTCGCCCXCGGXCGGTGIGXCCAGCCCGGCGAGCAGGXGCATCAGCGXGGXCTXGCCGGAGCCGGAGGGGCCCAIGATCGCGGXGAACXCGCCGGCCGCGAAGGAGGXCGACACCCCGXCGACGGCGACCACCGCGGCGICCCCGGTTCCGTACCGTTTACGCAGGTXGCGGCAACIGACCATGGAGCIGCXCIXCGTCIGCATCATCACGGTTGCGACGTTAGGGAAGTGGCGGGCCGCCCACATCCGTCCGGGGCATCGCCGCGACCGATACCAAGGTAXCGACCTGGCGTGCGGATGGTGCCGCGAGCGCTCGCGGXCCCTACTCTGAGAGCGTGGGAAGCXGGGACAGGAGAACGCXGACGGTCGAXACGGTGATCGCCGGCGCCGCGGTCATGGTGTGCCTGCXGCTCGGGXIGGCCGGTCXGGACGAGIGGTACTGGTCGGCÇGCGCICIGCGTCCCCCTGGXGAICCGGCGCTCGGCTCCGGTGGTCTTCCTCGCGCTGGTCGCGGTGCTCTCCGGCATCCACATGATCTACTCCGGCAGCTTCGCGTTCCCCGGTGACCTGGTCGATCTGGTCGCCGTGCACGCCGTCGCCGGTTACGGCCCGGCCCGGGTCCGGCACCTGGGCCTGCTGCXCGGCGXGGCCGGCAGCCTGGTGGIGACCGCCCGGGCGCXGCACGACGGGCTGCCGTCGTCCGCGACGCTGCCCGCCGCGCTGATCGTCGCCGCGACCCTGGCCGCCTGGTCGACCGGCCXGAIGCAACGCCGGCAGCGGGCCGACGXGAICGAGGCCGAXCACCGCCGCCGGCTCGCCGAGCAGGACAGCGCGAIGCGXGCCCGGCXCGCGGCGAXCGAGGAGCGCACCCGGATCAGXCAGGAGAIGCAC' GACATCATCGCCCACXCGCTGGCCTCGGTGATCGCCCAGGCCGAGGGCGGCCGGGXCGCCGCGCGCGCCGACGCGGTCGICGCCGGCCCGCXGTXCGACCGCAXCGCGCAGAXCGGCCGGGAGGCCCTCAACGACGTGAAGCGGCTGCTGAACTCGATCGACGGCGACACGCCGGACGACTTCGCGCAGGGCCTGCCCGACCTGCCGGGCCTGCTGGCCGGGGTCTCCGCCGCCGGCCTCGACGTGACGTTÇGAGGTGGCCGGCCCGGAGCAGCCGCTCGCGTCCGGCATGGACCTGGCGGTGTACCGGGTGATCCAGGAGTCACTGACCAACGTGCTCAAACACGCCACGCAGCGGCAGGCCCGGCTCAGCCTGGTGTGGACGCCGGCGTGGCTCGAGGTCAGCGTGACCAGCCCGCTGACCTTCGCCGGCGCGCTCCGCGAGGGTCGCGGGCTGTCCGGCATCCGGCAGCGGTGCTCGTTGTTCAACGGCGACTGCGAGATCGTGGCCGGGCAGACCTrCAGCGTGATCACCCGCTGGCCGCTCGCCCGTCCGGAGGTTGCCGTCCCATGACCGAGCCGCAGATCGACGTGGTGATCGCCGACGATCAGGACCTCGTCCGGACGGGCTTCGCCCTGGTCGTCGACTCGGCCCCGGACATGCGGGTGGTCGCGACCGCGGCGGACGGCGCCGAGGTGGTGCGGCXGGCCGCGGAGTTCCGCCCCGACGTGGXGCTGATGGACATCCGGATGCCCCGGGTCGACGGCATCACCGCGGCCCGGGCGATCCTGGAGGGCAACGCTCAGCCGCCGAAGATCGTCGCGCTGACCACCTACGACAACGATGAGTACGCCAGCCGGATCCTGGCCGCCGGCGCCAGTGGGTACCTGTTGAAGGACACCACCGCCGAGGGCCTGACCGCGGCGATCCGGACGGTGCACCGCGGCGGCTCGGTGCTGGGCCCGTCCACCACCCACCGCCTGGTGACCGCGCACCGTCAGCATCCGGCACGCCCGTCÇGCGCTGCTGGATTCGTTCACCACCCGGGAGCGCGAGGTCTTCGACCTGATCGTGGCCGGCGCCAGCAACGCGGAGATCGCCGACCGCCTGAACCTGGCGGAGGTCACGATCAAGACCCACGTCGGCCGGGTGCTGGCCAAGATCGGCGTCCGCGACCGGGTGAACGTCGTGATCTGGGCCTACCGGAACGGCGCCGGGCCGAGCTGAGCAGGGGCCAGGCCGCGCTCGCACTCGGCCGAATCCCGAAAAGCGGCTAGGGGAAGCGGATCTCGGCGGCCAGCGGCAGGTGGTCACTGCCGGTCCGGGGGAGGGCCGTCAGCCGCGTGACCGTCATCGATCGCGCCAGCACCTGGTCGATCCGGGCGACCGGCGTCCGCGCCGGCCAGGTGAACGCGAAGTCCGCGGGCGAATCGATCATCACTTGCCGGATCGGCCGCAGCCCGCGGTCGTCCACCGACGTGTTCAGGTCCCCGATCACGACCAGCCGCGGÁACCGGGTCGGCGGCGAGCAGCGCGCCGAGCTTCCGGGCGCTCTCGTCCCGCCGTGCCGAGGTGAGTCCCGCCGCGGTGACCCGCACCGACGGCAGATGCGCGACGTACACCGCGGTGTCCCCGCCCGGCGTCCGGGCCACCGCCCGCAGCCCCCGGTTCCAGTCCTCGCCCAGGTCATGCGGCCGGATGTCGATCGCCTCCGCGCCGGTCAGCGGATAGCGCGACCÁCAGCGCCACGGTCCCCTGCACGGTGTGGAACGGAAGCTCCGCGTCGAGCACACCCCGGTAGGCGGCCACCGCCXCCGGCAGCACCTCCTCCAGCCCGACCAGGTCCGGATGTGCCGCGAGCAGCGCSEQ ID NO: 214 or£14 IanT 575aa
Msetagllrrslldhrgklaavaglavagvgcqlgqpplirrvltavqsa
qpyrqlalavlavmwgaalgavqqfllqrtgeamvftvrrtlvahllrlpvaayderqsgdlvsrvgadtaqvrsvitsgwdlaggvllvggsiagmiiϊ dpvllgvslapvlcgaagvrlvgrrlrpls savqesigaltasttralgairtirv ag atere tal ivae adraraag vrl al vaaq ag pivrl alqgafvavigfggyrvangavsvgdlvaftlllftlalplaqlaeaatriqtglgaltrieeilalpdedsalgvrartpatvrhdpvllefdhvsfryptggeilrdvsfrvpagsttalvgpsgagkstilaliarlyevhggrillhgrdirdyplaelraalgyveqeapvlagtvrdnltlaapdvaehairhvtasvnlddllardpagldapvgdggvlfsggerqrlavartllapgelllfdeptahldarneqalqhgltahaagrtlvwahrlatvahadqilviddgrsvaagrheellvrdptyrefatrqllt
seq ίο no:215 orfis lano (monooxigeiiasedo tipo Luciferase)
347aa
mlsvl dqvpvfrgddpaeavreavglaraaeslgyhrfwiaehhgsaanacaapeivaaavagaterirvgtggvllpyysplkvaeafrvlaalypgridlgfgrgrggpavmaellnpyaiateeayaeqvgrllaflgdartvsrvsvtpavqdpplpwllgsgvgsarlagmlgvpfcfaqfiateecpe aiaayqesfrs spwldepqamlalrvlaagtaedaeelatgfwmscttgwraqvrpdddyrggvpnladaqrytlteedlamrasrpylqisgtaetvgeeirrlrkvydvaevmlttncpgaaapapvlraagrraradragvtrvrparrw
SEQ ID NO:216 or£16 IaxiR (regulador de resposta) 217aa
madvl waeealvsigikmiletmggfswaadrdsalaavsehrpawlldahatlpesvplltrlrdlesgpalavlatlaasstvleslrggacgfllkds q peqlvaavralasgvt vl ape as simlgaacrgt paaenavdevkqlsdreqavlgligqgltnaeiagrlfisdstvkeyvsvilrklgvanrvqaavlayaaglttdela
seq id no:217 orfi7 permease associada ao transportador ABC
814aa
miftlawsqvrshpgrllaivaawlatgflaatatfastsdeglrltaaaplttadivldaddtvhdpqwyqaaagvrgvrsvdpqyartvsvfggdrrgs anvqsipatasvrwftvdegtwps aagqwadrrtltdlgvgvgahldfrqgt aap vp vt wgs adlg frpltgs dyrfyaâas ffagdtppaallt vt drd rlae t vdavgral p pgatat dasaaadaaagrfaggntql wlml afaavallasilviantfqvivsqrvrqvallrlvgghrrqvsrwlaeaaiagsigavigavagvglgylgaglldinggglavnpivlalcvltgvgatwaawa p arratrvp pvralq ev p dalp aqvrggrrlvagliliglavgvlglaaigtslplalvggvllaaglltalplgialllppaarglerfgvaaslagsnlrqnarrtasatmavwgaalitglavasasgratveadlearypvavsvhtdgaaiddrtvralsgitglttatvatsaatfpaagkptpariaalptdvagrlapelsastgdpvllvpasyltargltdgapltvtaggrdlrftargsrladttgqllgvttgdvltaagvrtvpttvwgtapggfdretlaadvna vaardagvevgggvteggdimnvlsillglslgmlavtwiallgianllgls viertremallralgtrrsrlramvaveavtitlvgtvagivigvpvglvgviaa vgrqae pvimlawpqlglvlvaaavtgvlaslaparratriapaeglvr
seq id no: 218 orfis proteína de ligação a ATP transportador ABC
2 4 Oaa
mvscrnlrkrygtgdaawavdgvstsfaageftaimgpsgsgkttlmhllagldtptegevslagtalaglddraltdlrrdrvgfifqafnllptltaeqnivlplrlagrpvdrdrlqriaaslqigdrlghrpaelsggqqqrvavARALLTEPSWFADEPTGALDIATGRALLÁGLQNAARQASQTIIMVTHDAAAATYADRVLIMADGRLWDELRAPTLESIMSVMASVTVTS
SEQ ID NO:219 orfl9 histídina quinase 362aa
VIAGAAVMVCLLLGLAGLDEWYWSAALCVPLVIRRSAPWFLALVAVLSGIHMIYSGSFAFPGDLVDLVAVHAVAGYGPARVRHLGLLLGVAGSLWTARALHDGLPSSATLPAALIVAATLAAWSTGLMQRRQRADVIEADHRRRLAEQDSAMRARLAAIEERTRISQEMHDIIAHSLASVIAQAEGGRVAARADAWAGPLFDRIAQIGREALNDVKRLLNSIDGDTPDDFAQGLPDLPGLLAGVSAAGLDVTFEVAGPEQPLASGMDLAVYRVIQESLTNVLKHATQRQARLSLVWTPAWLEVSVTSPLTFAGALREGRGLSGIRQRCSLFNGDCEIVAGQTFSVITRWPLARPEVAVP
seq ID no:220 orf20 regulador de resposta 2i8aa
MTE PQIDWIADDQDLVRTGFALWDSAPDMRWATAADGAE WRLAAE FRPDVVLMDIRMPRVDGITAARAILEGNAQPPKIVALTTYDNDEYASRILAAGASGYLLKDTTAEGLTAAIRTVHRGGSVLAPSTTHRLVTAHRQHPARPSALLDS FTTRE REVFDLIVAGASNAEIADRLNLAEVTIKTHVGRVLAKIGVRDRVNWIWAYRNGAGPS
seq ID no:221 oxf 21 proteína de membrana atributíva 30iaa
MPILWTAVLAGAVILGHRLVPNAVGNAGSLIEAFLPWFGLAVPVLLLLALMRRSLTGLAAVLLPLGAWLIHFGGYWDRDTGTPDLIWQHNVSDENPDPAGTARALLAAHPDLVGLEEVLPEAVAAYRGVLDAELPFHTVQGTVALWSRYPLTGAEAIDIRPHDLGEDWNRGLRAVARTPGGDTAVYVAHLPSVRVTAAGLTSARRDESARKLGALLAADPVPRLWIGDLNTSVDDRGLRPIRQVMIDSPADFAFTWPARTPVARIDQVLARSMTVTRLTALPRTGSDHLPLAAEIRFP
seq id no:222 or£22 aífa-beta hídroíase 25Oaa
MRffltfE TVRIPVATGGAVTATLFAPESARA VL WHPATATPQGFYASFATYlAENGIATVTYDYRGTGRSGSPRDHRDLGMRDWIGADAPAVAAWAADRFPGLPRLAAGHSLGGHVIALGAAGPDLAASVIVASHIAALRTIPSRLERFRVRIMLHILGPALGRLLGYVPARSLGLGEDLPAAAMLEWGGWARRDNYFFDDPSMRAAERAATLTGPVLAVGTTDDPWSTPRQMDALTVHLTS ASVE RRTYSPAAAGVPVIGHHGLFRRAVRDTVWPELLAWLHAHSEKASR
seq id no:223 oxf23 regulador transcripcíonal usaa
VRLPRLIFLLFNADRAVRRWIDARS GDTGIGASGAGVLFYLAGHENALIGDVTAALGASPSGMSGLVNRLERGGCLTRSQDPADARAVRLALTPRGHQWIHARGLVDDLNEQLTAGFDDAEIAWQRWLEHVTRVSVQREERLG
seq id no:224 or£24 descarboxilase argínina dependente de piruvofla
MADSWFDQIPWRAIGRGTTSLSAFHDALVTMECGFYNLVRLSSVIPPGTAVDPSGKAPVPVGAWGDKLYCVYAEQHASQPGEEAWAGIGWVQRRDGQGGLFVEHEGTSESFVREAIKASLRDLVKGHEDDFDGPDFWHGWSDGEPVCAMVLAPYETAPWRGVRATDPPGMN
seq id no:225 or£25 descarboxilasediaminopimelato atríbutívo
406aa
MTLSEILPSLGASLRPRLDPANWPLTARWTEPGDLTVGGVPVTRIAAAHGTPVHVIDETDVHSRCAEYVAAFGPGAVCCSAKGGLLRGAARWIARDGLGCYCRSAAELRTALDAGIRPESLALFGSGKSVADLEAALSCGAAWIGSASEAEWAARSRPGQRVLLRVRPGS AQRGY GVRLNSSAAL AA VATVTRSRRLVLAGLDCSLGHRLNRFGTYESCLREAIGFVARLRTTVPVLNLGGGHAADLPVGIFAARLRAVAQVT SEGYGIE P PEVHVS PGRALLGRAGITVHRWAAGDG VIE L DGDVP DCL PGADCAGLHTAALIGRAS PAPGRSITVRCG DATVA VAELPGDMAAGDLVALSGTGAYHQRRDVYVGRPAVVAVCGGRARTLLPRETIDRILYA
SEQ ID NO:226 or£26 qilinase 309aa
VRS KREH S ADIRRGRRAVLVVNTRS RRGRLLYEEARRRLVEAGFELLGT YALEQSGGLDGLISEALRKEPDLLIAGGGDGTISTAGRMLAHRDVALGVLPLGTTNNFARTVRIEPDLEAAIATLVDGKVIDVDLGVAGDVPFTNHVGIGLSGEVMIS APPRLKRAVGRLAYPMTALGLLÁRHRPVRAVIRAEGRELRFHTHQVYVANGGFHAGRPITADAHADDRLLVAYPVGGASRRELLRETARNAATGHRRTLHERPFIAVRELWLET DRP VAVEVDGE PRGT T PMRIAIDPNALRIMAPADSPDL
seq id no:227 or£27 reguladortranscripcional 367aa
WFGSLLLVGGGGGAIGLNATVAAATSSVGQESLLGSAKPAEEKKNANLDGAKNLLLVGIDQRPTQTNGEPLRSDSIILLHINKDHSSGYMISLPRDSYVYIPAYDNGKQKPfAGGKTKINAAFAFGTRGLKGNEALQHGFELLTMTVKELTGITPDAGAIIDFQGFRDWNVLGKVCMYVDTTTKSIHLGKDQNGKTAKPFVINPDGTLKSKISGVTPNTYTKGDHCFTPGQALDFVRQRDLLADNSLDYGRQRHQQQFFKAIINQALKDGLDSPTKLPKLLSAFGKAMTVDDGGIDLADWALAMRS LKPDKLLTIKTNAGKLNSENVPGSGSVELLSDDSMDLLKSIKKDQIDTFLLSHPAFIANS
SEQ ID NO: 228 or£28 glíCOSll transferase 317aa
MPSEPDVSWIPTCNRPELAVRAVRSALGQTHRNLEVIVWDGPDEATVTALGEVGDPRLSVIVLPERGKAPNARNTGARAARGRWTAMLDDDDEWLPTKIERQLETAAAATVERPWACRMIS RT PRADTIMP RRL PEPGEPISEYLLVRRGLFYGDGFVQT SCIMAPTELWRBCVPFT VGLEIRAQELDWTLRAMREPGTALIYAEEPLVLWHQDENRDRISLQNPWREQLEWLRGNRELFTPRAYAAFTLSVLSSMAAPTRDTGLFRELLAEARTHGDPGTVDYLTHMQIWALPPSVRHRLRDWVGRGKTSSNAG
SEQ ID NO:229 orf29 gÜCOSÍl transferase 369aa
MPAERRVAIWRSSMLPGSETFVRNQADALTRWTPAYVGAVRHESVLSRPDDVIAFPGGKGFLRLRLTGASPQLQKTISAVRPNLVHAHFGGDGWL VSHSAQQLGVPLAVTVHGHDVTRQPSSPGAKGVRYRRNLQTVFTRASLVIAVSEVIRGQAIRWGADPAKVKVHYTGIAVPPEQPEEVPKRWDWFIGRFV AKKGVDDLLTALAAVESRPRALLIGDGELMTAMRARAEQLGVDVTFAGSRTPEQVRRHLLESRLLACPSKTAPDGDTEGLPTTILEAAALGLPWATRHSGIPEAVIDGETGLLSPEADPAALAVSLTRLLGDEDLQRRLGARARRHVTAHFDLVEQTRRLEDLYDEWAGARV
seq id no:230 orf30 desidrogenasediidrolipoamida 459aa
MGEHFDLWLGAGPGGYVAAIRGAQLGLTTAIVEDKYWGGVCLNVGCIPSKALLRNAE LAHIFHHQAQTFGIEGKVTFDFAVAHQRSRSVADGRVKGVHFLMKKNGITEIQGRGEFTDAHTLRVGDRTVTFDNCILATGASTRMIPGTSVSKRWTYEEQILDPDLPDSIVIVGAGAIGVEFAYVL RNY GVDVTIVEFLDRMLPLE DEE VS KE LLRQYRKLGVDVRVGTRVEGIEEGADS VRVT VS KNGKTE VLE ADKVMQAIGFKPNVEG YGLETTGVTVS DRGAVEIDDFCRTNVPGIYAIGD VT AKLMLAHAAEAMGIVAAE TIAGAETMALDYRMIPRATFCQPQVASFGWTEAQAREQGFDVKVAKFPFTANGKAHGLGDATGFVKILSDAKYGELLGAHLIGPDVTELLPELTLAQQWDLTVHEVGRNVHAHPTLAEAVKEAIHGLAGHMINFseq ιό no:231 ox£3i proteína de membrana atributiva 348aa
MTTPPRRSGTLSLVTLTVEPPIAPAPPAAPGRSRRRRLGYLAFVLVAWAWTLRDRL P D PGE FIj DALRAA DWRWAAL A VGAG VL S QIAYAEQQRRLLAAFGVRVPARRAIAMTYVRSALSMALPAGSAASAAYAFQVYRRHGATAAISATATLIS ΓWTVMS LGLL Y AATWS LTAT WAGLA VLLLWIYRTVRGPVPARAGVPRRLRVAPIARLLQRPAVAQALRGARSVPARTWLTVTLAGVINWLLDMACLLLAADALHAGLGWSRLALIYLAVQWRQIPLTPGGIGLIETSMLAGLIAAGAPQVTAAGIVLIYRLISFWLILPSGLAAHLTLRRGTVP PVTPG
SEQ ID NO:232-SEQ ID NO.-299
(Null)
O/SBDIG-I
0/ACT08F
0/ACT09R
O/AJSvarOlbF
TTCTAGACGTTGTTCTCCCATTTTCAC
SEQ ID NO:304 0/AGvar02bR
ÁAGATCTTCGAAGGTGAGCTCGCCGAA
SEQ ID NO:305 0/AGvar03F
GATCTTCGCGAGGACCGCACCATCTACGCCGCCAGCAGCGGCTGGGTGTGTACACTGACGATCGAGTGCGGCACCGTGATCTGCGCCTGCTGAC
SEQ ID NO: 306 O/AGvaxOAR
CTAGGTCAGCAGGCGCAGATCACGGTGCCGCACTCGATCGTCAGTGTACACACCCAGCCGCTGCTGGCGGCGTAGATGGTGCGGTCCTCGCGAA
SEQ ID NO: 307 0/AGvar05F
GCCTGCTGACCTAGGTCGACGATCGT
SEQ ID NO:308 0/ASvaxOBr
TGAATTCGGCTGCTCCCCGCGCGAAAT
SEQ ID NO:309 0/SB50F
ATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCATGATTCCGGGGATCCGTCGACC
SEQ ID NO:310 0/SB51R
GGGCGATGCCCGCCCCGGGCCGGAAACGATCGTCGATCATGTAGGCTGGAGCTGCTTC
SEQ ID NO:311 0/SB52F
AAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGATTCCGGGGATCCGTCGACC
SEQ ID NO:312 0/SB53R
GCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCATGTAGGCTGGAGCTGCTTC
SEQ ID NO:300
TGGGTSTGCACSCTSACSATCG
SEQ ID NO:301
TCCAGCACGCGCGGGG
SEQ ID NO:302
GTTCGACCAGCCGCCC
SEQ ID NO:303

Claims (43)

1. Composto de fórmula: <formula>formula see original document page 145</formula> CARACTERIZADO por-X1-X2- representar -Leu-Val-, -Val-Val- ou -Leu-Ile;Y é -S- ou -S(O)-; eZ é ou NH2 ou Ala-,ou um sal farmaceuticamente aceitável destes.
2. Composto de fórmula:CARACTERIZADO por-X1-X2- representar -Leu-Val-, -Val-Val- ou -Leu-Ile;Y é -S- ou -S(O)-; eZ é ou NH2 ou Ala-,ou uma variante biologicamente ativa do mesmo, ou um deriva-do desse composto ou variante, ou um sal farmaceuticamenteaceitável de tais compostos, variante ou derivado.
3. Composto, de acordo com a reivindicação 2,CARACTERIZADO pela variante ser um composto em que Z é umaminoácido.
4. Composto, de acordo com a reivindicação 3,CARACTERIZADO pela aminoácido ser selecionado do grupo Ala,lie-, Lys-, Phe-, Vai-, Glu-, Asp-, His-, Leu-, Arg-, Ser- eTrp e tais aminoácidos estão na configuração D- ou L-.
5. Composto, de acordo com a reivindicação 3,CARACTERIZADO pela variante ser um composto em que Z é umaminoácido selecionado do grupo lie, Lys, Phe, Vai, Glu,Asp-, His-, Leu-, Arg- e Ser-.
6. Composto, de acordo com quaisquer reivindica-ções 2 a 5 CARACTERIZADO pelo referido derivado ser um com-posto compreendendo um C-terminal de fórmula -COR, em que Erepresenta o grupo- NR1R2, onde R1 e R2 representam, indepen-dentemente :(i) hidrogênio,(ii) um grupo de fórmula -(CH2)n-NR3R4, em que η representaum inteiro de 2 a 8 e R3 e R4 representam independentementehidrogênio ou Ci_4 alquila, ou R3 e R4 considerados juntosrepresentam um grupo -(CH2)3-, -(CH2)4-, (CH2) 2-0- (CH2) 2-, -(CH2)2-S-(CH2)2- ou -(CH2)5-,ou R1 e R2 considerados juntos com o átomo de nitrogênio ad-jacente, representam uma fração piperazina que pode sersubstituída na posição 4 com um substituinte selecionado de:(a) C1-4 alquila,(b) C5-7 cicloalquila ,(c) piridila,(d) -CH2Jp -NR5R6, em que ρ representa um inteiro de 1 a 8 eR5 e R6 reresentam, independentemente , hidrogênio ou C1-4 al-quila;(e) piperidinila;(f) piperidinila substituído, onde o piperidinila substituí-do porta um N-substituinte que é C1-4 alquila;(g) benzila, e(h) benzila substituído, onde a fração fenila porta 1 ou 2substituintes selecionados dentre cloro, bromo, nitro, C1-4alquila e C1-4 alcóxi.
7. Composto, de acordo com quaisquer reivindica-ções 2 a 6 CARACTERIZADO pelo referido derivado ser um com-posto compreendendo um C-terminal de fórmula -COR, em que Rrepresenta o grupo -NR1R2, onde R1 e R2 representam, indepen-dentemente, hidrogênio, um grupo de fórmula -(CH2)n-NR3R4, emque η representa um inteiro de 2 a 8 e R3 e R4 representamindependentemente, hidrogênio ou C1-4 alquila, ou R3 eR4 considerados juntos representam um grupo -(CH2)3-,(CH2)4", (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- OU -(CH2)5-,ou Ri e R2 considerados juntos com o átomo de nitrogênio ad-jacente, representam uma fração piperazina que pode sersubstituída na posição 4 com um substituinte selecionado de:C1-4 alquila, C5_7 cicloalquila, piridila, benzila, e benzilasubstituído, onde a fração fenila porta 1 ou 2 substituintesselecionados dentre cloro, bromo, nitro, C1-4 alquila e C1-4alcóxi.
8. Composto, de acordo com quaisquer reivindica-ções 2-7 CARACTERIZADO pelo composto compreender uma modifi-cação numa função carbóxi de uma cadeia lateral de um resi-duo interno tal que essa função é modificada de -COOH paraum grupo -COOR5 em que R5 representa hidrogênio, C1-4 alquilaou C1-4 alcóxi (C2-4) alquila .
9. Composto, de acordo com quaisquer reivindica-ções 2-8 CARACTERIZADO pelo composto compreender uma modifi-cação no grupo amino N-terminal tal que este grupo -NH2 é,diferentemente, um grupo -NHR6 onde R6 representa C1-4 alquila.
10. Ácido nucléico isolado, CARACTERIZADO por co-dificar um polipeptideo selecionado de quaisquer do gruposdas SEQ ID NOs: 1-4, SEQ ID NOs: 11-14, SEQ ID NOs: 212, 22,- 23 e 119.
11. Ácido nucléico isolado, CARACTERIZADO por co-dificar um polipeptideo selecionado de quaisquer do grupoconsistindo de SEQ ID NOs: 1-4, SEQ ID NOs: 11-14, SEQ IDNOs: 212, 22, 23 e 119 ou uma variante biologicamente ativado mesmo.
12. Polipeptideo isolado, CARACTERIZADO por com-preender uma seqüência selecionada de quaisquer SEQ ID NOs:- 101-132, ou uma variante tendo pelo menos 90% de identidadede seqüência para a mesma.
13. Polipeptideo isolado, CARACTERIZADO por com-preender uma seqüência selecionada de quaisquer SEQ ID NOs:- 201-231, ou uma variante tendo pelo menos 90% de identidadede seqüência para a mesma.
14. Construtor de expressão, CARACTERIZADO porcompreender o ácido nucléico de acordo com a reivindicação-10 ou 11.
15. Conjunto de construtores de expressão,CARACTERIZADOS por compreender um primeiro ácido nucléico deacordo com a reivindicação 10 ou reivindicação 11 e um se-gundo ácido nucléico codificando um polipeptideo LanM com-preendendo a SEQ ID NO: 120 ou SEQ ID NO: 213 ou uma varian-te tendo pelo menos 90% de identidade para a SEQ ID NO: 120ou SEQ ID NO: 213.
16. Conjunto de construtores de expressão,CARACTERIZADOS por compreender um primeiro ácido nucléico deacordo com a reivindicação 10 ou reivindicação 11, ou umprimeiro e segundo ácido nucléico de acordo com a reivindi-cação 7, e um terceiro ácido nucléico codificando um poli-peptideo LanR compreendendo SEQ ID NO: 122 ou SEQ ID NO: 216ou uma variante tendo pelo menos 90% de identidade para aSEQ ID NO: 122 ou SEQ ID NO: 216.
17. Conjunto de construtores de expressão, de a-cordo com a reivindicação 15 ou 16, CARACTERIZADO por com-preender ainda, um ácido nucléico codificando um polipepti-deo LanT da SEQ ID NO: 123 ou uma variante da mesma, ou SEQID NO: 214 ou uma variante da mesma.
18. Conjunto de construtores de expressão, de a-cordo com a reivindicação 15, 16 ou 17, CARACTERIZADO porcompreender ainda um ácido nucléico codificando um polipep-tideo IanO da SEQ ID NO: 122 ou uma sua variante ou SEQ IDNO: 215 ou uma sua variante.
19. Vetor ou vetores recombinantes, CARACTERIZADOSpor compreenderem os construtores de expressão de acordo comas reivindicações 14 a 17.
20. Célula hospedeira, CARACTERIZADA por sertransformada com o vetor ou vetores de acordo com a reivin-dicação 19.
21. Célula hospedeira, de acordo com a reivindica-ção 20, CARACTERIZADA por ser um actinomiceto.
22. Actinomiceto, de acordo com a reivindicação 21, CARACTERIZADO por não ser um produtor de polipeptideolantibiótico.
23. Actinomiceto, de acordo com a reivindicação 21ou 22, CARACTERIZADO por ser selecionado do grupo consistin-do de Streptomyces Lividans, S. coelícolor e S. cinnamoneus.
24. Método de produção de um composto, de acordocom quaisquer reivindicações 1 a 9, CARACTERIZADO por com-preender a expressão de um ácido nucléico codificando um po-lipeptideo compreendendo uma seqüência selecionada do grupode SEQ ID NOs: 1, 2, 3, 11, 12, 13, 212, 22 e 23, ou uma va-riante de quaisquer dessas seqüências, numa célula hospedei-ra produtora de lantibiótico.
25. Método, de acordo com a reivindicação 24,CARACTERIZADO pela célula hospedeira possuir uma mutação emseu gene endógeno LanAr de modo que o gene não é expressadoou o produto genético é inativo.
26. Método, de acordo com a reivindicação 24 ou 25, CARACTERIZADO pela célula hospedeira ser A. garbadinen-sis ou Α. Iiguriae.
27. Método, de acordo com quaisquer reivindicações-24 a 26, CARACTERIZADO pela célula hospedeira ser A. Iiguri-ae NCIMB 41362.
28. Método, de acordo com a reivindicação 24,CARACTERIZADO pela célula hospedeira ser um actinomiceto quenão produz um lantibiótico e onde a célula hospedeira étransformada com SEQ ID NO: 100 ou SEQ ID NO: 200, ou umfragmento ou variante dessas seqüências, onde o fragmento ouvariante confere à célula a capacidade de produzir um lanti-biótico.
29. Método, de acordo com a reivindicação 28,CARACTERIZADO pela célula hospedeira ser transformada comácido nucléico codificando as SEQ ID NOs: 116-127 ou uma va-riante destas, onde tal ácido nucléico codifica polipeptí-deos com pelo menos 90% de identidade para cada uma das SEQID NOs: 116-127.
30. Método, de acordo com a reivindicação 28,CARACTERIZADO pela célula hospedeira ser transformada comácido nucléico codificando SEQ ID NOs: 206-220, ou uma vari-ante destas, onde tal ácido nucléico codifica polipeptideostendo pelo menos 90% de identidade para cada SEQ ID NOs:-206-220.
31. A. Iiguriae , CARACTERIZADA pelo NCIMB ser 41362.
32. Derivado de A. Iiguriae NCIMB 41361,CARACTERIZADO por compreender uma mutação em seu gene LigAtal que o gene não é expressado ou o produto genético é ina-tivo.
33. Cassete de DNA recombinante, CARACTERIZADO porcompreender uma seqüência de nucleotídeo codificando o pré-pro-peptideo LigA lantibiótico da SEQ ID NO: 212, onde talseqüência compreende:um primeiro sitio de restrição na ou adjacente à região co-dificando o N-terminal da seqüência de codificação;opcionalmente, um segundo sitio de restrição a jusante doprimeiro sitio de restrição e dentro da seqüência de codifi-cação; eum terceiro sitio de restrição na ou adjacente à região decodificação C-terminal da seqüência de codificação,onde pelo menos um de tais sítios de restrição não ocorredentro da seqüência de codificação IigA da SEQ ID NO: 200.
34. Cassete de DNA recombinante, CARACTERIZADO porcompreender uma seqüência de nucleotídeo codificando o pré-pro-peptídeo LanA lantibiótico da SEQ ID NO: 119, onde essaseqüência compreende:um primeiro sitio de restrição na ou adjacente à região co-dificando o N-terminal da seqüência de codificação;opcionalmente, um segundo sítio de restrição a jusante doprimeiro sítio de restrição e dentro da seqüência de codifi-cação; eum terceiro sítio de restrição na ou adjacente à região decodificação C-terminal da seqüência de codificação,onde pelo menos um de tais sítios de restrição não ocorredentro da seqüência de codificação IanA da SEQ ID NO: 100.
35. Método de produção de uma biblioteca de se-qüências genéticas codificando lantibiótico, CARACTERIZADOpor compreender:propiciar um cassete de expressão de acordo com a reivindi-cação 33 ou 34,introduzir ao cassete, entre os primeiro e segundo sítios derestrição, os primeiro e terceiro sítios de restrição, ou osegundo e terceiro sítios de restrição, ou o segundo e ter-ceiro sítios de restrição, uma multiplicidade de seqüências,cada uma das quais correspondendo à correspondente seqüênciacodificando lantibiótico além de terem de 1 a 15 alteraçõesde nucleotídeo; erecuperar uma biblioteca de expressão codificando uma multi-plicidade de seqüências variantes de lantibiótico.
36. Método, CARACTERIZADO por compreender:propiciar uma biblioteca de expressão produzida de acordocom a reivindicação 35;introduzir um ou mais elementos da referida biblioteca paraas células hospedeiras capazes de expressão de um lantibió-tico; eselecionar essas células hospedeiras para atividade de lan-tibiótico.
37. Método, de acordo com a reivindicação 36,CARACTERIZADO por compreender ainda, a recuperação do lanti-biótico.
38. Método, de acordo com a reivindicação 36 ou 37, CARACTERIZADO por compreender adicionalmente, o isola-mento de uma célula hospedeira compreendendo um elemento dabiblioteca.
39. Ácido nucléico isolado, CARACTERIZADO por com-preender as SEQ ID NO: 100 ou SEQ ID NO: 200, ou um fragmen-to ou variante de tais seqüências, onde o fragmento ou vari-ante confere à célula hospedeira de actinomiceto a capacida-de de produzir um lanbitiótico.
40. Ácido nucléico isolado, de acordo com a rei-vindicação 39, CARACTERIZADO pelo ácido nucléico codificaras SEQ ID NOs: 116-127 ou uma variante destas, onde tal áci-do nucléico codifica polipeptideos tendo pelo menos 90% deidentidade para cada uma das SEQ ID NOs: 116-127.
41. Ácido nucléico isolado, de acordo com a rei-vindicação 39, CARACTERIZADO pela célula hospedeira sertransformada com ácido nucléico codificando as SEQ ID NOs:-206-220 ou uma variante destas onde tal ácido nucléico codi-fica polipeptideos com pelo menos 90% de identidade para ca-da SEQ ID NOs: 206-220.
42. Composição farmacêutica, CARACTERIZADA porcompreender um composto de acordo com quaisquer reivindica-ções 1 a 9, juntamente com um veiculo ou diluente farmaceu-ticamente aceitável.
43. Método de tratamento ou profilaxia de uma in-fecção bacteriana num indivíduo, CARACTERIZADO por compreen-der a administração ao indivíduo, de um composto de acordocom quaisquer reivindicações 1 a 9, ou uma composição de a-cordo com a reivindicação 42.
BRPI0706525-6A 2006-01-17 2007-01-17 grupamentos genéticos biossintéticos de lantiobióticos de a. garbadinensis e a. liguriae BRPI0706525A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0600928.6 2006-01-17
GBGB0600928.6A GB0600928D0 (en) 2006-01-17 2006-01-17 Improvements relating to lantibiotics
PCT/GB2007/000138 WO2007083112A2 (en) 2006-01-17 2007-01-17 Lantibiotic biosynthetic gene clusters from a. garbadinensis and a. liguriae

Publications (1)

Publication Number Publication Date
BRPI0706525A2 true BRPI0706525A2 (pt) 2011-03-29

Family

ID=35998187

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0706525-6A BRPI0706525A2 (pt) 2006-01-17 2007-01-17 grupamentos genéticos biossintéticos de lantiobióticos de a. garbadinensis e a. liguriae

Country Status (20)

Country Link
US (3) USRE45003E1 (pt)
EP (2) EP2189472A1 (pt)
JP (1) JP5219837B2 (pt)
KR (1) KR101573536B1 (pt)
CN (1) CN101389641B (pt)
AT (1) ATE534659T1 (pt)
AU (1) AU2007206769B2 (pt)
BR (1) BRPI0706525A2 (pt)
CA (1) CA2637315A1 (pt)
CY (1) CY1112559T1 (pt)
DK (1) DK1979375T3 (pt)
ES (1) ES2378090T3 (pt)
GB (1) GB0600928D0 (pt)
IL (1) IL192446A0 (pt)
MX (1) MX2008009047A (pt)
NZ (1) NZ569486A (pt)
PL (1) PL1979375T3 (pt)
PT (1) PT1979375E (pt)
SI (1) SI1979375T1 (pt)
WO (1) WO2007083112A2 (pt)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0600928D0 (en) 2006-01-17 2006-02-22 Novacta Biosystems Ltd Improvements relating to lantibiotics
GB0714029D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd Lantibiotic-based compounds having antimicrobial activity
GB0714030D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd The use of type-B lantibiotic-based compounds having antimicrobial activity
CN102348718B (zh) * 2009-01-14 2015-06-03 诺瓦克塔生物系统有限公司 去氧阿肽加定衍生物
GB0900599D0 (en) 2009-01-14 2009-02-18 Novacta Biosystems Ltd Treatment
EP2393829A1 (en) 2009-02-04 2011-12-14 Novacta Biosystems Limited Actagardine derivatives
CA2789164A1 (en) * 2010-02-02 2011-08-11 Novacta Biosystems Limited Lantibiotic salts
GB201001688D0 (en) 2010-02-02 2010-03-17 Novacta Biosystems Ltd Compounds
CN103052383A (zh) * 2010-07-14 2013-04-17 诺瓦克塔生物系统有限公司 含有b型羊毛硫抗生素的制剂
GB201013507D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
GB201013513D0 (en) * 2010-08-11 2010-09-22 Novacta Biosystems Ltd Formulations
GB201013508D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
GB201013509D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
WO2014085637A1 (en) * 2012-11-30 2014-06-05 Sentinella Pharmaceuticals, Inc. New lantibiotic derivatives and a process for their preparation
CN103483433B (zh) * 2013-09-10 2015-05-27 中国科学院微生物研究所 一种新型高效的羊毛硫细菌素cerecidin及其应用
CN106188253B (zh) * 2016-08-26 2020-08-18 上海交通大学 抗菌肽Lexapeptide及其制备方法和用途

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3710795A (en) 1970-09-29 1973-01-16 Alza Corp Drug-delivery device with stretched, rate-controlling membrane
GB8507528D0 (en) 1985-03-22 1985-05-01 Lepetit Spa Basis monocarboxyamide derivatives
US5304540A (en) 1988-06-22 1994-04-19 Applied Microbiology, Inc. Pharmaceutical bacteriocin compositions and methods for using the same
IN167138B (pt) 1988-08-17 1990-09-01 Hoechst India
GB8926639D0 (en) 1989-11-24 1990-01-17 Agricultural & Food Res Delayed release formulations
KR0166088B1 (ko) 1990-01-23 1999-01-15 . 수용해도가 증가된 시클로덱스트린 유도체 및 이의 용도
US5376645A (en) 1990-01-23 1994-12-27 University Of Kansas Derivatives of cyclodextrins exhibiting enhanced aqueous solubility and the use thereof
IT1260505B (it) 1992-06-01 1996-04-09 Poli Ind Chimica Spa Sistemi farmaceutici orali a cessione ritardata per il rilascio specifico nel colon
IL107887A (en) 1992-12-08 2003-07-06 Ambi Inc Stabilized lanthionine containing bacteriocin compositions
US5512269A (en) 1993-06-09 1996-04-30 Burroughs Wellcome, Co. Method of treating retained pulmonary secretions
EP0700998B1 (en) 1994-09-12 2003-11-26 Aventis Pharma Deutschland GmbH Recombinant mersacidin and a method for production
DE69629691T2 (de) 1995-06-23 2004-02-26 Ambi, Inc. Verfahren zur kontrolle von antibiotikaresistenten grampositiven bakterien und behandlung von infektionen
GB9711643D0 (en) 1997-06-05 1997-07-30 Janssen Pharmaceutica Nv Glass thermoplastic systems
US5985823A (en) 1997-06-09 1999-11-16 Ambi Inc. Method for the treatment of diarrheal disease and for eliminating particular bacterial populations from the colon
US5958873A (en) 1997-06-09 1999-09-28 University Of Cincinnati Oral formulation for treatment of bacteria-induced diseases of the colon
DE19745583A1 (de) * 1997-10-15 1999-04-22 Hoechst Marion Roussel De Gmbh Neues Lantibiotikum verwandt mit Actagardine, Verfahren zur Herstellung und Verwendung derselben
US6569830B1 (en) 1999-03-05 2003-05-27 Ambi, Inc. Compositions and methods for treatment of staphylococcal infection while suppressing formation of antibiotic-resistant strains
HU230396B1 (hu) 2000-06-28 2016-04-28 Smithkline Beecham Plc Nedves őrlési eljárás
GB0110432D0 (en) * 2001-04-27 2001-06-20 Plant Bioscience Ltd Lantibiotic production
WO2002103010A1 (en) 2001-06-14 2002-12-27 Plant Bioscience Limited Methods and materials for targeted gene disruption in actinomycete bacteria
US6861236B2 (en) 2002-05-24 2005-03-01 Applied Nanosystems B.V. Export and modification of (poly)peptides in the lantibiotic way
US7199230B2 (en) 2002-10-10 2007-04-03 Molichem Medicines, Inc. Nucleic acids encoding duramycin
US7351687B2 (en) 2003-07-18 2008-04-01 Vicuron Pharmaceuticals, Inc. Antibiotic 107891, its factors A1 and A2, pharmaceutically acceptable salts and compositions, and use thereof
ATE356143T1 (de) 2003-07-18 2007-03-15 Vicuron Pharm Inc Antibiotikum 107891, dessen faktoren a1 und a2, pharmazeutisch unbedenkliche salze und zusammensetzungen, und anwendung davon
US20050271650A1 (en) * 2004-02-17 2005-12-08 Cellmatrix, Inc. Method and composition for angiogenesis inhibition
GB0406870D0 (en) 2004-03-26 2004-04-28 Novacta Biosystems Ltd Improvements relating to the production of lantibiotics
JP2009509519A (ja) 2005-09-27 2009-03-12 ノヴァクタ バイオシステムズ リミティッド ランチビオティックメルサシジンの変種およびそれらの使用
GB0600928D0 (en) 2006-01-17 2006-02-22 Novacta Biosystems Ltd Improvements relating to lantibiotics
ES2895666T3 (es) 2006-10-27 2022-02-22 Capsugel Belgium Nv Cápsulas duras de hidroxipropilmetilcelulosa y proceso de fabricación
US20110150917A1 (en) 2007-06-12 2011-06-23 The University Of British Columbia Small Cationic Antimicrobial Peptides
GB0714030D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd The use of type-B lantibiotic-based compounds having antimicrobial activity
GB0714029D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd Lantibiotic-based compounds having antimicrobial activity
KR20110086582A (ko) 2008-11-24 2011-07-28 센티넬라 파마세티컬즈, 인크. 항균활성이 강화된 란티바이오틱 카르복시아미드 유도체
CN102348718B (zh) 2009-01-14 2015-06-03 诺瓦克塔生物系统有限公司 去氧阿肽加定衍生物
GB0900599D0 (en) 2009-01-14 2009-02-18 Novacta Biosystems Ltd Treatment
EP2393829A1 (en) 2009-02-04 2011-12-14 Novacta Biosystems Limited Actagardine derivatives
EP2216937A1 (en) 2009-02-10 2010-08-11 Alcatel Lucent Alarm notification between customer premises equipment and a remote management server

Also Published As

Publication number Publication date
US20100048459A1 (en) 2010-02-25
EP1979375B9 (en) 2012-05-09
US8465947B2 (en) 2013-06-18
US20110306091A1 (en) 2011-12-15
JP5219837B2 (ja) 2013-06-26
AU2007206769B2 (en) 2013-06-20
MX2008009047A (es) 2008-12-18
WO2007083112A3 (en) 2008-05-08
US7989416B2 (en) 2011-08-02
EP2189472A1 (en) 2010-05-26
AU2007206769A1 (en) 2007-07-26
PT1979375E (pt) 2012-03-06
EP1979375B1 (en) 2011-11-23
DK1979375T3 (da) 2012-03-19
USRE45003E1 (en) 2014-07-08
CN101389641B (zh) 2013-06-05
CN101389641A (zh) 2009-03-18
KR20080086517A (ko) 2008-09-25
EP1979375A2 (en) 2008-10-15
CY1112559T1 (el) 2016-02-10
GB0600928D0 (en) 2006-02-22
IL192446A0 (en) 2008-12-29
CA2637315A1 (en) 2007-07-26
JP2009523777A (ja) 2009-06-25
PL1979375T3 (pl) 2012-04-30
ES2378090T3 (es) 2012-04-04
NZ569486A (en) 2011-07-29
ATE534659T1 (de) 2011-12-15
SI1979375T1 (sl) 2012-03-30
KR101573536B1 (ko) 2015-12-11
WO2007083112A2 (en) 2007-07-26

Similar Documents

Publication Publication Date Title
BRPI0706525A2 (pt) grupamentos genéticos biossintéticos de lantiobióticos de a. garbadinensis e a. liguriae
Boakes et al. Generation of an actagardine A variant library through saturation mutagenesis
US11548916B2 (en) Anti-infective compound
AU2007357462B2 (en) Genes and proteins for the biosynthesis of the lantibiotic 107891
CA2446010A1 (en) Production of the lantibiotic cinnamycin with genes isolated from streptomyces cinnamoneus
CN106754608A (zh) 生产米尔贝霉素的重组链霉菌及其制备方法和应用
PT98428B (pt) Clonagem da via de biossintese para formacao de clortetraciclina e tetraciclina a partir de streptomyces aureofaciens e sua expressao em streptomyces lividans
JP7086984B2 (ja) Streptomyces fungicidicusの遺伝子組換え株におけるエンデュラシジンの産生を増強するための組成物及び方法
EP2308970A1 (en) Antibiotic compositions, methods for providing the same and Streptomyces coelicolor mutants for use in such methods
YOU-YOUNG et al. Isolation and characterization of kasugamycin biosynthetic genes from Streptomyces kasugaensis KACC 20262
Bell Analysis and manipulation of “actagardine” gene clusters from Actinoplanes
Zhang et al. Identification and characterization of the anti-MRSA WAP-8294A2 biosynthetic gene cluster from Lysobacter enzymogenes OH11
RU2441915C9 (ru) Гены и белки для биосинтеза лантибиотика 107891
Spohn Exploiting gene regulation as an approach to identify, analyze and utilize the biosynthetic pathways of the glycopeptide ristomycin A and the zincophore [S, S]-EDDS in Amycolatopsis japonicum
WO2006111743A2 (en) Identifying lantibiotic gene clusters and novel lantibiotic genes
Aboshanab Cloning, Expression and Knock-out of ribE gene involved in the Biosynthesis of Ribostamycin in Streptomyces ribosidificus NRRL B-11466
WO2007014971A2 (es) Genes involucrados en la biosíntesis de tiocoralina y producción heteróloga de la misma

Legal Events

Date Code Title Description
B07D Technical examination (opinion) related to article 229 of industrial property law [chapter 7.4 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 10A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]
B07E Notification of approval relating to section 229 industrial property law [chapter 7.5 patent gazette]