BRPI0609140A2 - celulases, ácidos nucléicos que codificam eles e métodos para a produção e uso deles - Google Patents

celulases, ácidos nucléicos que codificam eles e métodos para a produção e uso deles Download PDF

Info

Publication number
BRPI0609140A2
BRPI0609140A2 BRPI0609140-7A BRPI0609140A BRPI0609140A2 BR PI0609140 A2 BRPI0609140 A2 BR PI0609140A2 BR PI0609140 A BRPI0609140 A BR PI0609140A BR PI0609140 A2 BRPI0609140 A2 BR PI0609140A2
Authority
BR
Brazil
Prior art keywords
seq
polypeptide
nucleic acid
sequence
cellulase
Prior art date
Application number
BRPI0609140-7A
Other languages
English (en)
Inventor
David Blum
Joslin Gemsch
Mark Dycaico
Original Assignee
Verenium Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Verenium Corp filed Critical Verenium Corp
Publication of BRPI0609140A2 publication Critical patent/BRPI0609140A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/14Prodigestives, e.g. acids, enzymes, appetite stimulants, antidyspeptics, tonics, antiflatulents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C10PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
    • C10LFUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
    • C10L1/00Liquid carbonaceous fuels
    • C10L1/02Liquid carbonaceous fuels essentially based on components consisting of carbon, hydrogen, and oxygen only
    • CCHEMISTRY; METALLURGY
    • C10PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
    • C10LFUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
    • C10L1/00Liquid carbonaceous fuels
    • C10L1/02Liquid carbonaceous fuels essentially based on components consisting of carbon, hydrogen, and oxygen only
    • C10L1/023Liquid carbonaceous fuels essentially based on components consisting of carbon, hydrogen, and oxygen only for spark ignition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • CCHEMISTRY; METALLURGY
    • C10PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
    • C10LFUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
    • C10L2200/00Components of fuel compositions
    • C10L2200/04Organic compounds
    • C10L2200/0407Specifically defined hydrocarbon fractions as obtained from, e.g. a distillation column
    • C10L2200/0415Light distillates, e.g. LPG, naphtha
    • C10L2200/0423Gasoline
    • CCHEMISTRY; METALLURGY
    • C10PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
    • C10LFUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
    • C10L2200/00Components of fuel compositions
    • C10L2200/04Organic compounds
    • C10L2200/0461Fractions defined by their origin
    • C10L2200/0469Renewables or materials of biological origin
    • CCHEMISTRY; METALLURGY
    • C10PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
    • C10LFUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
    • C10L2290/00Fuel preparation or upgrading, processes or apparatus therefore, comprising specific process steps or apparatus units
    • C10L2290/26Composting, fermenting or anaerobic digestion fuel components or materials from which fuels are prepared
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

CELULASES, áCIDOS NUCLéICOS QUE CODIFICAM ELES E MéTODOS PARA A PRODUçãO E USO DELES. A presente invenção refere-se a bioquímica e biologica molecular e celular. Estrutura de celobiose Em um aspecto, a invenção provê polipeptídeos tendo atividade de celulase, por exemplo, atividade de endoglucanase, celobioidrolase, manase e/ou beta-glicosidase, polinucleotídeos que codificam estes polipeptídeos, e métodos de produção e uso destes polinucleotídeos e polipeptídeos. Em um aspecto, a invenção refere-se a atividade de celulase de polipeptídeds, por exemplo, atividade de endoglucanase, celobjoidrolase, manase e/ou beta-glicosidase, incluindo atividade termoestável e termotolerante, e polinucleotídeos que codifica estas enzimas, e produção e uso destes polinucleotídeos e polipeptídeos. Os polipeptídeos da invenção podem ser usados em uma variedade de processamento farmacêutico, agrícola, alimento e comida e contextos industriais.

Description

Relatório Descritivo da Patente de Invenção para "CELULASES, ÁCIDOS NUCLÉICOS QUE CODIFICAM ELES E MÉTODOS PARA A PRODUÇÃO E USO DELES".
Suporte do governo
A presente invenção foi produzida com o suporte do governo dos
Estados Unidos sob contrato nes DE-FG03-02ER83395 e DE-FG02-03ER83865 concedido pelo Departamento de Energia. O governo tem certos direitos nesta invenção.
Campo da Invenção
A presente invenção refere-se a biologia molecular e celular e
bioquímica. Em um aspecto, a invenção prove polipeptídeos tendo atividade de celulase, por exemplo, atividade de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, polinucleotídeos que codificam estes polipeptídeos, e métodos de produção e uso destes polinucleotídeos e
polipeptídeos. Em um aspecto, a invenção refere-se a polipeptídeos tendo atividade de celulase, por exemplo, atividade de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, incluindo atividade termoestável e termotolerante, e polinucleotídeos que codificam essas enzimas, e produção e uso destes polinucleotídeos e polipeptídeos. Os
polipeptídeos da invenção podem ser usados em uma variedade de contextos farmacêuticos, agrícolas e industriais. Antecedentes
Celulose é a fonte mais abundante renovável na terra. Ela é constituída de uma cadeia linear de 1 -4 unidades de
beta-glicose com a unidade de repetição sendo celobiose, que é
um dímero de glicose tendo uma estrutura como mostrada na figura 5. O polímero é degradado por um conjunto de enzimas que incluem endoglucanases (EG) que aleatoriamente hidrolisam o polímero de celulose, e celobioidrolases (CBH) que removem resíduos de celobiose terminais a
partir de celulose. Celobiose e celo-oligossacarídeos são hidrolisados para dar glicose por betaglicosidases (BG). Todas as três enzimas são necessárias para decomposição química completa de celulose para dar-glicose. Pacada cada uma das três enzimas de variantes estruturais diferentes existem que realizam a mesma função. Além disso, fungos e bactérias são conhecidas para produzir múltiplas formas das mesmas variantes estruturais além das variantes estruturais diferentes. Complicação ulterior deste sistema é o fato de que algumas
bactérias ou fungos são conhecidos como produzindo essas enzimas em complexos de múltiplas enzimas que contêm múltiplas enzimas todas ligadas a uma armação de enzima com pesos moleculares acima de 2 milhões de dáltons. Por que tal sistema complexa de enzimas é necessário
para tal molécula simples? Alguns pesquisadores acreditam que esta complexidade seja devido à natureza recalcitrante do substrato. As cadeias de celulose formam microfibrilas que acondicionam em uma matriz cristalina através de ligação de hidrogênio de cadeias adjacentes. Esta estrutura é altamente resistente a degradação química ou enzimática. Esta estrutura é
altamente resistente a degradação química ou enzimática.
CBHs são pensadas serem a enzima chave na degradação desta celulose cristalina por causa da natureza de seu ataque enzimática na celulose. EGs ao contrário de CBHs têm uma fenda aberta que ataca a cadeia de celulose a um ângulo perpendicular. CBHs atacam a cadeia
diretamente através de um túnel contendo o sítio ativo. A corrente pensada é que as cadeias de celulose entram no túnel e ao mesmo tempo, ligação de hidrogênio adjacente é rompida. Uma vez que celobioidrolase estabeleceu esta "base" no substrato, as EGs podem então entrar e mais rapidamente atacam o substrato.
Uma deficiência principal de CBHs conhecidas em sua baixa
atividade catalítica. Alguns grupos demonstram que baixa atividade se origina do fato de que energia oriunda de hidrólise é transferida para energia cinética para romper ligações de hidrogênio e permitem que a enzima se mova ao longo do substrato. CBHs são enzimas de ação èxo e são
encontradas em 6 das 90 famílias de hidrolases de glicosila. Elas incluem famílias 5, 6, 7, 9, 10 e 48. Família 5 contém muitos tipos diferentes de hidrolases de glicosila incluindo celulases, manases e xilanases. Embora amaioria das celulases nesta família sejam endoglucanases, são exemplos de celobioidrolases, mas notavelmente CelO oriundo de Clostrídium thermocellum. Família 6 contém endoglucanases ou celobioidrolases com mais membros de celobioidrolase do que endoglucanases. As enzimas têm 5 um mecanismo de inversão e estudos cristalográficos sugerem que a enzima tem uma estrutura barril alfa/beta distorcida contendo sete, não oito filamentos beta paralelos. Família 7 enzimas são também constituídas de tanto endoglucanases quanto celobioidrolases com mais celobioidrolases e apenas membros conhecidos são oriundos de fungos. A enzima tem um
mecanismo de retenção e a estrutura de cristal sugere uma estrutura "na forma de saduíche ("(3-JellyRou"). Família 9 contém endoglucanases, celobioidrolases e betaglicosidases com um preponderância de endoglucanases. No entanto, Thermobifida fusca produz uma endo/exo-1,4-glucanase, cuja estrutura de cristal sugere um envoltório cilíndrico
"(alfa/alfa)6. A enzima tem características tanto de CBHs de endo quanto exo-glucanases CBHs. Família 10 contém apenas 2 membros descritos como celobioidrolases com principalmente o resto descrito como xilanases. Celobioidrolases e xilanases oriundas da família 10 têm atividade sobre celobiosídeo de metil-umbeliferila. Família 48 contém principalmente
celobioidrolases e endoglucanases de fungo bacteriano e anaeróbico. A estrutura é envoltório de barril de (alfa/alfa)6 similar a família 9.
Há uma necessidade de fontes menos dispendiosas e renováveis de combustível para veículos de estrada. Novas fontes de combustíveis serão mais atraentes se elas produzam produtos finais não
prejudiciais depois da combustão. Etanol oferece uma alternativa atraente a combustíveis à base de petróleo e pode ser obtido através da fermentação de açúcares monoméricos derivados de amido ou lingocelulose. No entanto, a economia atual não suporta o uso difundido de etanol devido ao alto custo de geração dele. Uma área de pesquisa visava na diminuição de custos é
melhoramento da eficácia técnica das enzimas que podem ser usadas para gerar açúcares fermentáveis a partir de lignocelulose. O desenvolvimento de enzimas que mais eficazmente digerem carga de alimentação traduzirá emcustos de produção de etanol dimimuídos. Processos mais eficientes diminuirá confiança nos Estados Unidos sobre óleo estanho e as flutuações de preço que podem estar relacionados com aquela confiança. Acredita-se que o uso de combustíveis limpadores para o transporte como bioetanol 5 também pode diminuir rede de emissões de C02 sejam parcialmente responsáveis pelo aquecimento global. Sumário
A invenção prove celulases, por exemplo, endoglucanases, celobioidrolases e/ou betaglicosidase (betaglicosidases), e métodos para a
produção e uso deles. Em um aspecto, as enzimas da invenção têm uma taxa cataiítica aumentada para aperfeiçoar o processo de hidrólise de substrato. Esta eficácia aumentada em taxa catalítica leva a uma eficácia aumentada na produção de açúcares, que pode ser útil em aplicações industriais, por exemplo, os açúcares assim produzidos podem ser usados
por microorganismos para a produção de etanol. Em um aspecto, a invenção prove celobioidrolases, endoglucanases e betaglicosidase altamente ativas (por exemplo, tendo uma taxa catalítica aumentada). A invenção prove aplicações industriais (por exemplo, biomassa para dar etanol) usando-se enzimas da invenção tendo custos de enzima diminuídos, por exemplo,
custos diminuídos nos processos de biomassa para dar etanol. Assim, a invenção prove processos eficientes para a produção de bioetanol e composições compreendendo bioetanol, incluindo combustíveis compreendendo bioetanol, a partir de qualquer biomassa. Em um aspecto, as enzimas da invenção têm uma atividade de glucanase, por exemplo,
endoglucanase, por exemplo, catalisação de hidrólise de ligações de endo-beta-1,4- e/ou beta-1,3-glucanase internas. Em um aspecto, a atividade de endoglucanase (por exemplo, atividade de hidrolase de endo-1,4-beta-D-glucano 4-glucanoo) compreende hidrólise de ligações de 1,4- e/ou beta-1,3-beta-D-glicosídicas em celulose, derivados de celulose (por exemplo, carbóxi
metil celulose e hidróxi etil celulose) liquenina, ligações de beta-1,4 em beta-1,3 glucanoos mistos, tais como beta-D-glucanoos ou xiloglucanoos de cereais e outros materiais de planta contendo partes celulósicas.Em um aspecto, as enzimas da invenção têm atividade de endoglucanase (por exemplo, endo-beta- 1,4-glucanases, EC 3.2.1.4; endo-beta-1,3(1)-glucanases, EC 3.2.1.6; endo-beta-1,3- glucanases, EC 3.2.1.39) e podem hidrolisar ligações de beta-1,4- e/ou beta-1,3- glucosídicas internas em cellulose e glucanoo para produzir oligômeros de glicose ou glicose de peso molecular menor. A invenção prove métodos para a produção de oligômeros de glicose e glicose de peso molecular menor usando-se essas enzimas da invenção.
Em um aspecto, as enzimas da invenção são usados para gerar
glucanos, por exemplo, polissacarídeos formados a partir de D-glucopiranose ligada a 1,4-beta- e/ou 1,3-glicosídeo. Em um aspecto, as endoglucanases da invenção são usadas na indústria alimentícia, por exemplo, para assamento e processamento de fruta e vegetal, decomposição química de resíduo agrícola, na fabricação de ração de
animal, produção de polpa e papel, fabricação têxtil e agentes de limpeza industrial e doméstico. Em um aspecto, as enzimas, por exemplo, endoglucanases, da invenção são produzidas por um microorganismo, por exemplo, por um fungo e/ou bactéria.
Em um aspecto, as enzimas, por exemplo, endoglucanases, da
invenção são usadas para hidrolisar beta-glucanos (beta-glucanos) que são principais polissacarídeos de não amido de cereais. O teor de glucano de um polissacarídeo pode variar significativamente dependenda da variedade e das condições de crescimento. As propridades físicas deste polissacarídeo são tal que ele origina soluções viscosas ou ainda géis sob condições
oxidativas. Além disso glucanos têm alta capacidade de ligação. Todas estas características apresentam problemas para várias indústrias incluindo fermentação, assamento, nutrição de animal. Em aplicações de fermentação, a presença de glucano resulta em questões de filtrabilidade de mosto e construção de nêvoa. Nas aplicações de assamento (especialmente
para biscoitos e bolachas), glucanos podem criar massas de farinha pegajosas que são difíceis para processar à máquina e reduzem o tamanho do biscoito. Assim, as enzimas, por exemplo, endoglucanases, da invençãosão usadas para diminuir a quantidade de beta-glucano em uma composiçãocompreendendo beta-glucano, por exemplo, enzimas da invenção sãousadas em processos para diminuir a viscosidade de soluções ou géis; paradiminuir a capacidade de ligação de água de uma composição, por exemplo, uma composição compreendendo beta-glucano; em processos defermentação (por exemplo, para aumentar a filtrabilidade de mosto e diminuira construção de nêvoa), para diminuir a viscosidade de massas de farinha,por exemplo, aqueles para a produção de bolinhos, pães, biscoitos esimilares.
Além disso, carboidratos (por exemplo, beta-glucano) são
implicados em reidratação rápida de produtos assados que resulta na perdade aspecto cocrante e semivida reduzida. Assim, as enzimas, por exemplo,endoglucanases, da invenção são usadas para reter aspecto crocante,aumentar aspecto crocante, ou reduzir a taxa de perda de aspecto crocante,
e para aumentar a semivida de qualquer comida, alimento ou bebidacompreendendo carboidrato, por exemplo, um comida, alimento ou bebidacompreendendo beta-glucano.
Enzimas, por exemplo, endoglucanases, da invenção sãousadas para diminuir a viscosidade do conteúdo do intestino (por exemplo,
em animais, tais como animais ruminantes ou seres humanos), por exemplo,aqueles com dietas de cereais. Assim, em aspectos alternativos, enzimas,por exemplo, endoglucanases, da invenção são usadas para positivamenteafetar a digestibilidade de uma comida ou alimento e taxa de crescimento deanimal (por exemplo, ser humano ou animal doméstico), e em um aspecto,
são usadas para gerar eficácias de conversão mais altas. Para as aplicaçõesde ração de animal monogástrico com dietas de cereal, beta-glucano é umfator de contribuição para viscosidade de conteúdo de intestino e dessemodo adversamente afeta a digestibilidade do alimento e a taxa decrescimento de animal. Para amimais ruminantes, estes beta-glucanos
representam componentes substanciais de entrada de fibra e digestão maiscompleta de glucanos que poderiam facilitar o aumento da eficiência deconversão de alimentação.) Conseqüentemente, a invenção prove rações ealimentos animais compreendendo endoglucanases da invenção, e em umaspecto, essas enzimas são ativas em um trato digestivo de animal, porexemplo, em um estômago e/ou intestino.
Enzimas, por exemplo, endoglucanases, da invenção são usadas para digerir celulose ou qualquer material natural ou sintéticocompreendendo beta-1,4-glucano-ligado compreendendo, incluindo aquelasem qualquer material de planta. Enzimas, por exemplo, endoglucanases, dainvenção são usadas como enzimas comerciais para digerir celulose, porexemplo, no processamento de madeira, indústria de polpa e/ou papel, em
fabricação de têxtil e em agentes de limpeza industriais e domésticos, e/ouem processamento de resíduo de biomassa.
Em um aspecto da invenção prove composições (por exemplo,composições farmacêuticas, alimentos, comidas, fármacos, suplementos dedieta) compreendendo as enzimas, polipeptídeos ou polinucleotídeos da
invenção. Nestas composições podem ser formuladas em uma variedade deformas, por exemplo, como comprimidos, géis, pílulas, implantes, líquidos,sprays, pós, alimento, péletes de comida ou como qualquer tipo de formaencapsulada.
A invenção prove ácidos nucléicos recombinantes ou isolados compreendendo uma seqüência de ácido nucléicos tendo pelo menos cercade 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%,75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%,88%, 89%; 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou25 mais, ou identidade seqüência completa (100%) com um ácido nucléicoexemplar da invenção, incluindo SEQ ID NO:1, SEQ ID NO: 3, SEQ ID NO:5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ IDNO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23,SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID30 NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41,SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ IDNO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59,SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ IDNO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77,SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ IDNO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95,SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ IDNO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO:113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121,SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ IDNO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO:147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155,SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163 eSEQ ID NO: 165; ver também as tabelas 1, 2, e 3, Exemplos 1 e 4, abaixo, elistagem de seqüência, sobre uma região de pelo menos 10, 15, 20, 25, 30,35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600,650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250,1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850,1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500,ou mais resíduos; e em aspectos alternativos, esses ácidos nucléicoscodificam pelo menos polipeptídeo tendo uma atividade celulase, porexemplo, atividade endoglucanase, celobioidrolase, manase e/oubetaglicosidase, ou codificam um polipeptídeo capaz de gerar um anticorpoque pode especificamente se ligar a um polipeptídeo da invenção, ou, essesácidos nucléicos podem ser usdos como sondas para a identificação ouisolamento de ácidos nucléicos de codificação de celulase, ou para inibir aexpressão dos ácidos nucléicos de expressão de celulase (todos estesaspectos chamados dos "ácidos nucléicos da invenção"). Em um aspecto, asidentidades de seqüência são determinadas por análise com um algoritmode comparação de seqüência ou por uma inspeção visual.
Ácidos nucléicos da invenção também incluem ácidos nucléicosrecombinantes ou isolados que codificam uma enzima exemplar dainvenção, incluindo um polipeptídeo tendo uma seqüência cono indicada naSEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO:10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO:28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO:46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO:64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO:
82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO:100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 1065 SEQ ID NO: 108,SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQID NO: 1185 SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID
NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO:134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142,SEQ ID NO: 143, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ IDNO: 160, SEQ ID NO: 162, SEQ ID NO: 164 e SEQ ID NO: 166, ver também
as tabelas 1, 2, e 3, Exemplos 1 e 4, abaixo, e a listagem de seqüência, esuas subseqüências e suas variantes. Em um aspecto, o polipeptídeo temuma atividade celulase, por exemplo, atividade endoglucanase,celobioidrolase, manase e/ou betaglicosidase.
Em um aspecto, a invenção prove ácido nucléicos de codificação
de celulase, por exemplo, ácidos nucléicos de codificação deendoglucanase, celobioidrolase e/ou betaglicosidase tendo uma novidadecomum pelo fato de que eles são derivados de culturas mistas. A invençãoprove ácidos nucléicos de codificação de enzima de degradação de celuloseisolados de culturas mistas compreendendo um polinucleotídeo da invenção,
por exemplo, uma seqüência tendo pelo menos cerca de 10%, 15%, 20%,25%, 30%, 35%, 40%, 45%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%,58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%,71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%,97%, 98%, 99%, ou mais, ou identidade seqüência completa (100%) com umácido nucléico exemplar da invenção, por exemplo, SEQ ID NO: 1, SEQ ID5 NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 95 SEQ ID NO: 11, SEQID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO:21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO:39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ
ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO:57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO:75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO:
93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ IDNO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: -117, SEQ IDNO:119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO:127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135,
SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ IDNO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO:161, SEQ ID NO: 163 e SEQ ID NO: 165, e ver as tabelas 1, 2, e 3,Exemplos 1 e 4, abaixo, e listagem de seqüência, sobre uma região de pelo
menos 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650,700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, ou mais.
Em um aspecto, a invenção prove ácidos nucléicos decodificação de enzima de celulase, por exemplo, ácidos núcleicos decodificação de enzima de endoglucanase, de enzima de celobioidrolase e/ou
de enzima glicosidase, incluindo seqüências de polinucleotídeos exemplaresda invenção, ver também as tabelas 1 , 2, e 3, Exemplos 1 e 4, abaixo, elistagem de seqüência, e os polipeptídeos codificados por elas, incluindoenzimas da invenção, por exemplo, polipeptídeos exemplares da invenção,por exemplo, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8,SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ IDNO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ IDNO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44,SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ IDNO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62,SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID
NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80,SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ IDNO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98,SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID
NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO:124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132,SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQID NO: 142, SEQ ID NO: 143, SEQ ID NO: 146, SEQ ID NO: 148, SEQ IDNO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164 ou SEQ ID NO:166, ver também a tabela 1 e listagem de seqüência, tendo uma novidadecomum pelo fato de que eles são derivado de uma fonte comum, porexemplo, uma fonte ambiental. Em um aspecto, a invenção também proveácidos nudéicos de codificação de enzima de celulase, por exemplo, ácidos
nudéicos de codificação de enzima endoglucanase, enzima decelobioidrolase e/ou enzima de betaglicosidase com uma novidade comumpelo fato de que eles são derivados de fontes ambientais, por exemplo,fontes ambientais mistas.
Em um aspecto, o algoritmo de comparação de seqüência é um
algoritmo BLAST versão 2.2.2 onde um conjunto de filtração é ajustado parablastall-p blastp-d "nr pataa" -F F, e todas as outras opções são ajustadaspara padronizar.Um outro aspecto da invenção é um ácido nucléico recombinanteou isolado incluindo pelo menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100,150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450,1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050,2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500, ou mais basesconsecutivas de uma seqüência de ácidos nucléicos da invenção,seqüências substancialmente idênticas aos mesmos, e as seqüênciascomplementares ao mesmo.
Em um aspecto, o ácido nucléico recombinante ou isolado
codifica um polipeptídeo tendo uma atividade celulase, por exemplo,atividade endoglucanase, celobioidrolase, manase e/ou betaglicosidase, queé termoestável. O polipeptídeo pode reter uma atividade celulase sobcondições compreendendo uma faixa de temperatura de entre cerca de 37°Ca cerca de 95°C; entre cerca de 55°C a cerca de 85°C, entre cerca de 70°Ca cerca de 95°C, ou, entre cerca de 90°C a cerca de 95°C. O polipeptídeopode reter uma atividade celulase em temperaturas na faixa entre cerca de1°C a cerca de 5°C, entre cerca de 5°C a cerca de 15°C, entre cerca de15°C a cerca de 25°C, entre cerca de 25°C a cerca de 37°C, entre cerca de 37°C a cerca de 95°C, 96°C, 97°C, 98°C ou 99°C, entre cerca de 55°C acerca de 85°C, entre cerca de 70?G a cerca de 75°C, ou entre cerca de 90°Ca cerca de 99°C, ou 95°C, 96°C, 97°C, 98°C ou 99°C, ou mais.
Em um outro aspecto, o ácido nucléico recombinante ou isoladocodifica um polipeptídeo tendo uma atividade celulase, por exemplo, atividade endoglucanase, celobioidrolase, manase e/ou betaglicosidase, queé termotolerante. O polipeptídeo pode reter uma atividade celulase depois daexposição a uma temperatura na faixa de mais do que 37°C a cerca de 95°Cou qualquer lugar na faixa de mais do que 55°C a cerca de 85°C. Opolipeptídeo pode reter uma atividade celulase depois da exposição a uma temperatura na faixa entre cerca de 1°C a cerca de 5°C, entre cerca de 5°Ca cerca de 15°C, entre cerca de 15°C a cerca de 25°C, entre cerca de 25°Ca cerca de 37°C, entre cerca de 37°C a cerca de 95°C, 96°C, 97°C, 98°C ou99°C, entre cerca de 55°C a cerca de 85°C, entre cerca de 70°C a cerca de75°C, ou entre cerca de 90°C a cerca de 95°C, ou mais. Em um aspecto, opolipeptídeo retém uma atividade celulase depois da exposição a umatemperatura na faixa de mais do que 90°C a cerca de 99°C, ou 95°C, 96°C, 97°C, 98°C ou 99°C, at cerca de pH 4,5, ou mais.
A invenção prove ácidos nucléicos recombinantes ou isoladoscompreendendo uma seqüência que hibridiza sob condições rigorosas paradar um ácido nucléico da invenção, incluindo uma seqüência exemplar dainvenção, por exemplo, uma seqüência cono indicada na SEQ ID NO: 1,SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO:29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID nB 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ IDNO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65,SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ IDNO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83,SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ IDNO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101,SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ IDNO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO:127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135,SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ IDNO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO:161, SEQ ID NO: 163 ou SEQ ID NO: 165 (ver também as tabelas 1, 2, e 3,Exemplos 1 e 4, abaixo,), ou fragmentos ou suas subseqüências. Em umaspecto, o ácido nucléico codifica um polipeptídeo tendo uma atividadecelulase, por exemplo, atividade endoglucanase, celobioidrolase, manasee/ou betaglicosidase. O ácido nucléico pode ser pelo menos cerca de 10, 15,20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500,550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200ou mais resíduos de comprimento ou do comprimento total do gene outranscrito. Em um aspecto, as condições rigorosas compreendem uma etapade lavagem compreendendo uma lavagem em 0,2X SSC a uma temperaturade cerca de 65°C por cerca de 15 minutos.
A invenção prove uma sonda de ácido nucléico para aidentificação ou isolamento de um ácido nucléico que codifica umpolipeptídeo tendo uma atividade celulase, por exemplo, atividade
endoglucanase, celobioidrolase, manase e/ou betaglicosidase, em que asonda compreende pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50,55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450,500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 ou mais, basesconsecutivas de uma seqüência compreendendo uma seqüência da
invenção, ou fragmentos ou suas subseqüências, em que a sonda identificao ácido nucléico por ligação ou hibridização. A sonda pode compreender umoligonucleotídeo compreendendo pelo menos cerca de 10 a 50, cerca de 20a 60, cerca de 30 a 70, cerca de 40 a 80, ou cerca de 60 a 100 basesconsecutivas de uma seqüência compreendendo uma seqüência da
invenção, ou fragmentos ou suas subseqüências.
A invenção prove um ácido nucléico probe para a identificaçãoou isolamento de um ácido nucléico que codifica um polipeptídeo tendo umaatividade celulase, por exemplo, atividade endoglucanase, celobioidrolase,manase e/ou betaglicosidase, em que a sonda compreende um ácido
nucléico compreendendo uma seqüência pelo menos cerca de 10, 15, 20,30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550,600, 650, 700, 750, 800, 850, 900, 950, 1000 ou mais resíduos de um ácidonucléico da invenção, por exemplo, um polinucleotídeo tendo pelo menoscerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%,
61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%,ou mais, ou identidade seqüência completa (100%) com um ácido nucléicoexemplar da invenção. Em um aspecto, as identidades de seqüência sãodeterminadas por análise com um algoritmo de comparação de seqüência oupor inspeção visual. Em aspectos alternativos, a sonda pode compreenderum oligonucleotídeo compreendendo pelo menos cerca de 10 a 50, cerca de20 a 60, cerca de 30 a 70, cerca de 40 a 80, ou cerca de 60 a 100 basesconsecutivas de uma seqüência de ácidos nucléicos da invenção, ou umasua subseqüência.
A invenção prove um par de iniciador de ampliação para a
ampliação (por exemplo, por PCR) de um ácido nucléico que codifica umpolipeptídeo tendo uma atividade celulase, por exemplo, atividadeendoglucanase, celobioidrolase, manase e/ou betaglicosidase, em que o pariniciador é capaz de ampliar um ácido nucléico compreendendo umaseqüência da invenção, ou fragmentos ou suas subseqüências. Um ou cada
membro do par de seqüência de iniciador de ampliação pode compreenderum oligonucleotídeo compreendendo pelo menos cerca de 10 a 50, ou mais,bases consecutivas da seqüência, ou cerca de 10, 11,12, 13, 14, 15, 16, 17,18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 oumais bases consecutivas da seqüência. A invenção prove pares de iniciador
de ampliação, em que o par iniciador compreende um primeiro membrotendo uma seqüência como indicada por cerca da primeira (a 5') 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,35, 36 ou mais resíduos de um ácido nucléico da invenção, e um segundomembro tendo uma seqüência como indicada por cerca da primeira (a 5') 12,
13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,33, 34, 35, 36 ou mais resíduos do filamento complementar do primeiromembro.
A invenção prove ácidos nucléicos de codificação de celulase,por exemplo, ácidos nucléicos de codificação de endoglucanase, celobioidrolase e/ou betaglicosidase gerados por ampliação, por exemplo,reação de cadeia de polimerase (PCR), usando-se um par de iniciador deampliação da invenção. A invenção prove ácidos nucléicos de codidificaçãode celulase, por exemplo, ácidos nucléicos de codificação deendoglucanase, celobioidrolase e/ou betaglicosidase gerados por ampliação,por exemplo, reação de cadeia de polimerase (PCR), usando-se um par deiniciador de ampliação da invenção. A invenção prove métodos de produçãode uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase,manase e/ou betaglicosidase por ampliação, por exemplo, reação de cadeiade polimerase (PCR), usando-se um par de iniciador de ampliação dainvenção. Em um aspecto, o par de iniciador de ampliação amplifica umácido nucléico a partir de uma biblioteca, por exemplo, uma biblioteca de gene, tal como um uma biblioteca ambiental.
A invenção prove métodos de ampliação de um ácido nucléicoque codifica um polipeptídeo tendo uma atividade celulase, por exemplo,atividade endoglucanase, celobioidrolase, manase e/ou betaglicosidasecompreendendo ampliação de um ácido nucléico de modelo com um par deseqüência de iniciador de ampliação capaz de ampliar uma seqüência deácidos nucléicos.da invenção, ou fragmentos ou suas subseqüências.
A invenção prove cassetes de expressão compreendendo umácido nucléico da invenção ou uma sua subseqüência. Em um aspecto, umcassete de expressão pode compreender o ácido nucléico que é operavelmente ligado a um promotor. O promotor pode ser um promotorviral, bacteriano, de mamífero ou de planta. Em um aspecto, o promotor deplanta pode ser um promotor de batata, arroz, milho, trigo, tabaco oucevada. O promotor pode ser um promotor constitutivo. O promotorconstitutivo pode compreender CaMV35S. Em um outro aspecto, o promotorpode ser um promotor induzível. Em um aspecto, o promotor pode ser umpromotor específico de tecido ou um promotor ambientalmente regulado oudesenvolvimentalmente regulado. Assim, o promotor pode ser, por exemplo,um promotor específico de semente, específico de folha, específico de raiz,específico de tronco ou promotor induzido por abscisão. Em um aspecto, um cassete de expressão pode ulteriormente compreender um vetor deexpressão de vírus de planta ou planta.
A invenção prove veículos de clonagem compreendendo umcassete de expressão (por exemplo, um vetor) da invenção ou um ácidonucléico da invenção. O veículo de clonagem pode ser um vetor viral, umplasmídio, um fago, um fagomídeo, um cosmídio, um fosmídio, umbacteriofago ou um cromossoma artificial. O vetor viral pode compreender um vetor de adenovírus, um vetor retroviral ou um vetor viral adeno-associado. O veículo de clonagem pode compreender um cromossomabacteriano (BAC), um plasmídio, um vetor derivado de bacteriofago PI(PAC), um cromossoma artificial de levedura (YAC), ou um cromossomaartificial de mamífero (MAC).
A invenção prove célula transformada compreendendo um ácido
nucléico da invenção ou um cassete de expressão (por exemplo, um vetor)da invenção, ou um veículo de clonagem da invenção. Em um aspecto, acélula transformada pode ser uma célula bacteriana, uma célula demamífero, uma célula fúngica, uma célula de levedura, uma célula de inseto
ou uma célula de planta. Em um aspecto, a célula de planta pode ser umacélula de soja, de semente de colza, de semente olesosa, de tomate, decana-de-açúcar, de cereal, de batata, de trigo de aroz, de tabaco ou decevada.
A invenção prove animais não humanos transgênicoscompreendendo um ácido nucléico da invenção ou um cassete de expressão(por exemplo, um vetor) da invenção. Em um aspecto, o animal é umcamundongo, um rato, um porco, uma cabra ou um carneiro.
A invenção prove plantas transgênicas compreendendo um ácidonucléico da invenção ou um cassete de expressão (por exemplo, um vetor) da invenção. A planta transgênica pode ser uma planta de cereal, umaplanta de milho, uma planta de batata, uma planta de tomate, uma planta detrigo, uma planta de semente oleosa, uma planta de semente colza, umaplanta de arroz, uma planta de cevada ou uma planta de tabaco.
A invenção prove sementes trangênicas compreendendo um ácido nucléico da invenção ou um cassete de expressão (por exemplo, umvetor) da invenção. A semente transgênica pode ser uma planta de cereal,uma semente de milho, uma semente de trigo, uma selente oleosa, umasemente de colza, uma semente de soja, uma semente de palma, umsemente de girassol, uma semente de gergelim, uma semente de planta detabaco ou amendoim.
A invenção prove um oligonucleotídeo anti-sentido compreendendo uma seqüência de ácidos nucleicos complementar a oucapaz de hibridizar sob condições rigorosas para dar um ácido nucléico dainvenção. A invenção prove métodos de inibição da tradução de umacelulase, por exemplo, mensagem de enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase em uma célula
compreendendo administração à célula ou expressão na célula de umoligonucleotídeo anti-sentido compreendendo uma seqüência de ácidosnucleicos complementar a ou capaz de hibridizar sob condições rigorosaspara dar um ácido nucléico da invenção. Em um aspecto, o oligonucleotídeoanti-sentido está entre cerca de 10 a 50, cerca de 20 a 60, cerca de 30 a 70,
cerca de 40 a 80, ou cerca de 60 a 100 bases de comprimento, por exemplo,10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 oumais bases de comprimento. A invenção prove métodos de inibição datradução de uma enzima de celulase, por exemplo, enzima de mensagem deendoglucanase, celobioidrolase, manase e/ou betaglicosidase em uma
célula compreendendo administração à célula ou expressão na célula de umoligonucleotídeo anti-sentido compreendendo uma seqüência de ácidosnucleicos complementar a ou capaz de hibridizar sob condições rigorosaspara dar um ácido nucléico da invenção.
A invenção prove moléculas de RNA inibitório de filamento duplo
(RNAi, ou interferência de RNA) (incluindo RNA, ou siRNAs de interferênciapequena, para a inibição de transcrição, e microRNAs, ou miRNAs, para ainibição de tradução) compreendendo uma subseqüência de uma seqüênciada invenção. Em um aspecto, o siRNA está entre cerca de 21 a 24 resíduos,ou, cerca de pelo menos 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27,
28, 29, 30, 31, 32, 33, 34, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95,100 ou mais nucleotídeos dúplex de comprimento. A invenção provemétodos de inibição da expressão de uma enzima de celulase, por exemplo,enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase emuma célula compreendendo administração à célula ou expressão na célula aRNA inibitório de filamento duplo (siRNA ou miRNA), em que o RNAcompreende uma subseqüência de uma seqüência da invenção. A invenção prove polipeptídeos recombinantes ou isolados
compreendendo uma seqüência de aminoácidos tendo pelo menos cerca de50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%,63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%,76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ouidentidade seqüência completa (100%) a um polipeptídeo ou peptídeoexemplar da invenção sobre uma região de pelo menos 10, 15, 20, 25, 30,35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200,225, 250, 275, 300, 325, 350 ou mais resíduos, ou sobre o comprimento total
do polipeptídeo. Em um aspecto, as identidades de seqüência sãodeterminadas por análise com um algoritmo de comparação de seqüência oupor uma inspeção visual. Seqüências polipeptídeos ou peptídeosexemplares da invenção incluem SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO:6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID
NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24,SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ IDNO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42,SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ IDNO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60,
SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ IDNO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78,SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ IDNO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96,SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ
ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ IDNO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO:122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130,SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQID NO: 140, SEQ ID NO: 142, SEQ ID NO: 143, SEQ ID NO: 146, SEQ IDNO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO:156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164e SEQ ID NO: 166 (ver também as tabelas 1, 2, e 3, Exemplos 1 e 4, abaixo,e listagem de seqüência), e suas subseqüências e suas variantes.Polipeptídeos exemplares também incluem fragmentos de pelo menos cercade 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85, 90, 95, 100, 150, 200, 250,300, 350, 400, 450, 500, 550, 600 ou mais resíduos de comprimento, ou
sobre o comprimento total de uma enzima. Seqüências polipeptídeos oupeptídeos da invenção incluem seqüência codificada por um ácido nucléicoda invenção. Seqüências polipeptídeos ou peptídeos da invenção incluempolipeptídeos ou peptídeos especificamente ligados por um anticorpo dainvenção (por exemplo, epítopos), ou polipeptídeos ou peptídeos que podem
gerar um anticorpo da invenção (por exemplo, um imunógeno).
Em um aspecto, um polipeptídeo da invenção tem pelo menosenzima de celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase. Em aspectos alternativos, umpolinucleotídeo da invenção codifica um polipeptídeo que tem pelo menos
enzima de celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase.
Em um aspecto, a celulase, por exemplo, atividade enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase étermoestável. O polipeptídeo pode reter uma celulase, por exemplo,
atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase sob condições compreendendo uma faixa de temperatura deentre cerca de 1°C a cerca de 5°C, entre cerca de 5°C a cerca de 15°C,entre cerca de 15°C a cerca de 25°C, entre cerca de 25°C a cerca de 37°C,entre cerca de 37°C a cerca de 95°C, entre cerca de 55°C a cerca de 85°C,
entre cerca de 70°C a cerca de 75°C, ou entre cerca de 90°C a cerca de95°C, ou mais. Em um outro aspecto, a celulase, por exemplo, atividadeenzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidasepode ser termotolerante. O polipeptídeo pode reter uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase depois da exposição a uma temperatura na faixa de mais doque 37°C a cerca de 95°C, ou na faixa de mais do que 55°C a cerca de 85°C. Em um aspecto, o polipeptídeo pode reter uma celulase, por exemplo,atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase depois da exposição a uma temperatura na faixa de mais doque 90°C a cerca de 95°C a pH 4,5.
Um outro aspecto da invenção prove um polipeptídeo ou
peptídeo recombinante ou isolado compreendendo pelo menos 10, 15, 20,25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150 oumais bases consecutivas de uma seqüência de polipeptídeos ou peptídeosda invenção, seqüências substancialmente idênticas ao mesmo, e asseqüências complementares ao mesmo. O peptídeo pode ser, por exemplo,
um fragmento imunogênico, um motivo (por exemplo, um sítio de ligação),uma seqüência de sinal, uma pré-pró seqüência ou um sítio ativo.
A invenção prove ácidos nucléicos recombinantes ou isoladoscompreendendo uma seqüência que codifica um polipeptídeo tendo umacelulase, por exemplo, atividade enzima de endoglucanase, celobioidrolase,
manase e/ou betaglicosidase e uma seqüência de sinal, em que o ácidonucléico compreende uma seqüência da invenção. A seqüência de sinalpode ser derivada de uma outra celulase, por exemplo, enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase ou umaenzima de não celulase, por exemplo, enizima de não endoglucanase, de
não celobioidrolase e/ou de não betaglicosidase (uma heteróloga). Ainvenção prove ácidos nucléicos recombinantes ou isolados compreendendouma seqüência que codifica um polipeptídeo tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase, em que a seqüência não contém uma seqüência de sinal e
o ácido nucléico compreende uma seqüência da invenção.
Em um aspecto, a invenção prove um polipeptídeo recombinanteou isolado compreendendo um polipeptídeo da invenção que carece datotalidade ou parte de uma seqüência de sinal. Em um aspecto, opolipeptídeo recombinante ou isolado pode compreender o polipeptídeo dainvenção compreendendo uma seqüência de sinal heteróloga, tal como umacelulase heteróloga, por exemplo, seqüência de sinal de enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase ou nãocelulase, por exemplo, seqüência de enzima de sinal de não endoglucanase,não celobioidrolase e/ou não betaglicosidase. Em um aspecto, a invenção prove proteínas quiméricascompreendendo um primeiro domínio compreendendo uma seqüência de sinal da invenção e pelo menos um segundo domínio. A proteína pode seruma proteína de fusão. O segundo domínio pode compreender uma enzima.A enzima pode ser uma não enzima. A invenção prove polipeptídeos quiméricos compreendendo pelomenos um primeiro domínio compreendendo peptídeo de sinal (SP), uma pré-pró seqüência e/ou um domínio catalítico (CD) da invenção e pelomenos um segundo domínio compreendendo um polipeptídeo ou peptídeoheterólogo, em que o polipeptídeo ou peptídeo heterólogo não énaturalmente associada ao peptídeo de sinal (SP), pré-pró seqüência e/ oudomínio catalítico (CD). Em um aspecto, o polipeptídeo ou peptídeo heterólogo não é uma celulase, por exemplo, enzima de endoglucanase,. celobioidrolase, manase e/ou betaglicosidase. O polipeptídeo ou peptídeoheterólogo pode ser amino terminal a, carbóxi terminal a ou em ambas asextremidades do peptídeo de sinal (SP), pré-pró seqüência e/ou domíniocatalítico (CD). A invenção prove ácidos nucléicos recombinantes ou isolados que codificam um polipeptídeo quimérico, em que o polipeptídeo quiméricocompreende pelo menos um primeiro domínio compreendendo peptídeo desinal (SP), um pré-pró domínio e/ou um domínio catalítico (CD) da invençãoe pelo menos um segundo domínio compreendendo um polipeptídeo ou peptídeo heterólogo, em que o polipeptídeo ou peptídeo heterólogo não énaturalmente associada ao peptídeo de sinal (SP), pré-pró domínio e/ oudomínio catalítico (CD).A invenção prove seqüências de sinal recombinantes ou isoladas(por exemplo, peptídeos de sinal) que consiste em ou compreendendo umaseqüência cono indicada na resíduos 1 a 14,1 a 15, 1 a 16, 1 a 17, 1 a 18, 1a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a40, 1 a 41, 1 a 42, 1 a 43, 1 a 44, 1 a 45, 1 a 46 ou 1 a 47, de umpolipeptídeo da invenção, por exemplo, a SEQ ID NO: 2, SEQ ID NO: 4,SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO:14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO:32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO:50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO:86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO:104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ IDNO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO:138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 143, SEQ ID NO: 146,SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ IDNO: 164 ou SEQ ID NO: 166 exemplar (ver as tabelas 1, 2, e 3, Exemplos 1e 4, abaixo, e listagem de seqüência). Em um aspecto, a invenção provesignal seqüências compreendendo os primeiros 14, 15, 16, 17, 18, 19, 20,21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40,41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60,61, 62, 63, 64, 65, 66, 67, 68, 69, 70 ou mais resíduos amino terminais deum polipeptídeo da invenção. Em um aspecto, a celulase, por exemplo,atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase compreende uma atividade específica de cerca de 37°C nafaixa de cerca de 1 a cerca de 1200 unidades por miligrama de proteína, ou,cerca de 100 a cerca de 1000 unidades por miligrama de proteína. Em umoutro aspecto, a celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase compreende uma atividadeespecífica de cerca de 100 a cerca de 1000 unidades por miligrama deproteína, ou, de cerca de 500 a cerca de 750 unidades por miligrama deproteína. Alternativamente, a celulase, por exemplo, atividade enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase compreendeuma atividade específica de 37°C na faixa de cerca de 1 a cerca de 750unidades por miligrama de proteína, ou, de cerca de 500 a cerca de 1200unidades por miligrama de proteína. Em um aspecto, a celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase compreende uma atividade específica de 37°C na faixa decerca de la cerca de 500 unidades por miligrama de proteína, ou, de cercade 750 a cerca de 1000 unidades por miligrama de proteína. Em um outroaspecto, a celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase compreende uma atividade específica de 37°C na faixa de cerca de 1 a cerca de 250 unidades pormiligrama de proteína. Alternativamente, a celulase, por exemplo, atividadeenzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidasecompreende uma atividade específica de 37°C na faixa de cerca de 1 acerca de 100 unidades por miligrama de proteína.
Em um outro aspecto, a termotolerância compreende retençãode pelo menos metade da atividade específica da celulase, por exemplo,enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase a37°C depois de ser aquecida para a temperatura elevada. Alternativamente,a termotolerância pode compreender retenção de atividade específica a37°C na faixa de cerca de 1 a cerca de 1200 unidades por miligrama deproteína, ou, de cerca de 500 a cerca de 1000 unidades por miligrama deproteína, depois de ser aquecida para a temperatura elevada. Em um outroaspecto, a termotolerância pode compreender retenção de atividadeespecífica a 37°C na faixa de cerca de 1 a cerca de 500 unidades pormiligrama de proteína depois de ser aquecida para a temperatura elevada.
A invenção prove o polipeptídeo recombinante ou isolado da invenção, em que o polipeptídeo compreende pelo menos sítio deglicolisação. Em um aspecto, glicolisação pode ser glicolisação N-ligada. Emum aspecto, o polipeptídeo pode ser glicosilado depois de ser expresso emum P. pastoris ou a S. pombe.
Em um aspecto, o polipeptídeo pode reter celulase, por exemplo,
atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase sob condições compreendendo cerca de pH 6,5, pH 6, pH5,5, pH 5, pH 4,5 ou pH 4 ou mais ácido. Em um outro aspecto, opolipeptídeo pode reter uma celulase, por exemplo, atividade enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase sob condições compreendendo cerca de pH 7, pH 7.5 pH 8.0, pH 8,5, pH 9, pH 9,5, pH 10,pH 10,5 ou pH 11 ou mais pH básico. Em um aspecto, o polipeptídeo podereter uma celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase depois da exposição acondições compreendendo cerca de pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5 ou
pH 4 ou mais ácido pH. Em um outro aspecto, o polipeptídeo pode reter umacelulase, por exemplo, atividade enzima de endoglucanase, celobioidrolase,manase e/ou betaglicosidase depois da exposição a condiçõescompreendendo cerca de pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10,pH 10,5 ou pH 11 ou mais pH básico.
Em um aspecto, a celulase, por exemplo, enzima de
endoglucanase, celobioidrolase, manase e/ou betaglicosidase da invençãotem atividade sob condições alcalinas, por exemplo, as condições alcalinasdo intestino, por exemplo, o intestino delgado. Em um aspecto, opolipeptídeo pode reter atividade depois da exposição ao ácido pH do
estômago.
A invenção prove preparações de proteína compreendendo umpolipeptídeo (incluindo peptídeos) da invenção, em que a preparação deproteína compreende um líquido, um sólido ou um gel. A invenção proveheterodímeros compreendendo um polipeptídeo da invenção e uma segundaproteína ou domínio. O segundo membro do heterodímero pode ser umacelulase diferente, por exemplo, enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase, uma enzima diferente ou uma outra proteína.Em um aspecto, o segundo domínio pode ser um polipeptídeo e oheterodímero pode ser uma proteína de fusão. Em um aspecto, o segundodomínio pode ser um epitopo ou uma etiqueta. Em um aspecto, a invençãoprove homodímeros compreendendo um polipeptídeo da invenção.
A invenção prove polipeptídeos imobilizados (incluindo
peptídeos) tendo celulase, por exemplo, atividade enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase, em que opolipeptídeo imobilizado compreende um polipeptídeo da invenção, umpolipeptídeo codificado por um ácido nucleico da invenção, ou um
polipeptídeo compreendendo um polipeptídeo da invenção e um segundodomínio. Em um.aspecto, o. polipeptídeo pode ser imobilizado sobre umacélula, um metal, uma resina, um polímero, uma cerâmica, um vidro, ummicroeletrodo, uma partícula grafítica, uma conta, um gel, uma placa, umconjunto ou um tubo capilar.
A invenção também prove conjuntos compreendendo um ácido
nucleico imobilizado da invenção, incluindo, por exemplo, sondas dainvenção. A invenção também prove conjuntos compreendendo umanticorpo da invenção.
A invenção prove anticorpos recombinantes ou isolados que
especificamente se liga a um polipeptídeo da invenção ou a um polipeptídeocodificado por um ácido nucleico da invenção, estes anticorpos da invençãopode ser um anticorpo monoclonal ou policlonal. A invenção provehibridomas compreendendo um anticorpo da invenção, por exemplo, umanticorpo que especificamente se liga a um polipeptídeo da invenção ou a
um polipeptídeo codificado por um ácido nucleico da invenção. A invençãoprove ácidos nucléicos que codificam estes anticorpos.
A invenção prove método de isolamento ou identificação de umpolipeptídeo tendo celulase, por exemplo, atividade enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidasecompreendendo as etapas de: (a) provisão de um anticorpo da invenção; (b)provisão de uma amostra compreendendo polipeptídeos; e (c) contato da amostra da etapa (b) com o anticorpo da etapa (a) sob condições em que oanticorpo pode especificamente se ligar ao polipeptídeo, desse modoisolamento ou identificação de um polipeptídeo tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase. A invenção prove métodos de produção de uma anticelulase, por
exemplo, anticorpo de enzima de antiendoglucanase, anticelobioidrolasee/ou antibetaglicosidase compreendendo administração a um animal nãohumano de um ácido nucléico da invenção ou um polipeptídeo da invençãoou suas subseqüências em uma quantidade suficiente para gerar uma resposta imune humoral, desse modo produzindo uma enzima deanticelulase, por exemplo, anticorpo de enzima de antiendoglucanase,anticelobioidrolase e/ou antibetaglicosidase. A invenção prove métodos de-.produção de uma-resposta imune de anticelulase, por exemplo, respostaimune de antiendoglucanase, anticelobioidrolase e/ou antibetaglicosidase (celular ou humoral) compreendendo a administração a um animal nãohumano de um ácido nucléico-da invenção ou um polipeptídeo da invençãoou suas subseqüências em uma quantidade suficiente para gerar umaresposta imune (celular ou humoral).
A invenção prove métodos de produção de um polipeptídeo recombinante compreendendo as etapas de: (a) provisão de um ácidonucléico da invenção operavelmente ligado a um promotor; e (b) expressãodo ácido nucléico da etapa (a) sob condições que permitem a expressão dopolipeptídeo, desse modo produzindo um polipeptídeo recombinante. Em umaspecto, o método pode ulteriormente compreender transconstrução de uma
célula hospedeira com o ácido nucléico da etapa (a) seguido por expressãodo ácido nucléico da etapa (a), desse modo produzindo um polipeptídeorecombinante em uma célula transformada.A invenção prove métodos para identificação de um polipeptídeotendo celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase compreendendo as seguintesetapas: (a) provisão de um polipeptídeo da invenção; ou um polipeptídeo codificado por um ácido nucléico da invenção; (b) provisão de celulase, porexemplo, substrato de enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase; e (c) contato do polipeptídeo ou um fragmento ou suavariante da etapa (a) com o substrato da etapa (b) e detecção de umadiminuição na quantidade substrato ou um aumento na quantidade um
produto de reação, em que uma diminuição na quantidade do substrato ouum aumento na quantidade do produto de reação detecta um polipeptídeotendo uma celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase. Em um aspecto, o substrato éum composto compreendendo celulose.
A invenção prove métodos para identificação de celulase, por
exemplo, substrato de enzima,de_endoglucanase, celobioidrolase, manasee/ou betaglicosidase compreendendo as seguintes etapas: (a) provisão deum. polipeptídeo: da invenção; ou um polipeptídeo codificado por um ácidonucléico da invenção; (b) provisão de um substrato de teste; e (c) contato do polipeptídeo da etapa (a) com o substrato de teste da etapa (b) e detecçãode uma diminuição na quantidade, substrato ou um aumento na quantidadedo produto de reação, em que uma diminuição na quantidade do substratoou um aumento na quantidade um produto de reação identifica o substratode teste como uma celulase, por exemplo, substrato de enzima de
endoglucanase, celobioidrolase, manase e/ou betaglicosidase.
A invenção prove métodos da determinação de se um compostode teste especificamente se liga a um polipeptídeo compreendendo asseguintes etapas: (a) expressão de um ácido nucléico ou um vetorcompreendendo o ácido nucléico sob condições permissivas para a tradução
do ácido nucléico em um polipeptídeo, em que o ácido nucléico compreendeum ácido nucléico da invenção, ou, provisão de um polipeptídeo dainvenção; (b) provisão de um composto de teste; (c) contato do polipeptídeocom o composto de teste; e (d) determinação de se o composto de teste daetapa (b) especificamente se liga a o polipeptídeo.
A invenção prove métodos para identificação de um moduladorde uma celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase compreendendo as seguintesetapas: (a) provisão de um polipeptídeo da invenção ou um polipeptídeocodificado por um ácido nucléico da invenção; (b) provisão de um compostode teste; (c) contato do polipeptídeo da etapa (a) com o composto de testeda etapa (b) e medição de uma atividade da celulase, por exemplo, enzima
de endoglucanase, celobioidrolase, manase e/ou betaglicosidase, em queuma mudança em uma atividade enzima de celulase, por exemplo,endoglucanase, celobioidrolase, manase e/ou betaglicosidase medida napresença do composto de teste em comparação com a atividade naausência do composto de teste prove uma determinação que o composto de
teste modula a celulase, por exemplo, atividade enzima de endoglucanase,-celobioidrolase, manase e/ou betaglicosidase. Em um aspecto, a celulase,por exemplo, atividade enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase pode ser- medida por provisão de-uma celulase, porexemplo, substrato de enzima de endoglucanase, celobioidrolase, manase
e/ou betaglicosidase e detecção de uma diminuição na quantidade dosubstrato ou um aumento na quantidade um produto de reação, ou, umaumento na quantidade do substrato ou uma diminuição na quantidade umproduto de reação. Uma diminuição na quantidade do substrato ou umaumento na quantidade do produto de reação com o composto de teste
quando em comparação com uma quantidade substrato ou produto dereação sem o composto de teste identifica o composto de teste como umativador de celulase, por exemplo, atividade enzima de endoglucanase,celobioidrolase, manase e/ou beta- glicosidase. Um aumento na quantidadedo substrato ou uma diminuição na quantidade do produto de reação com o
composto de teste quando em comparação com uma quantidade substratoou produto de reação sem o composto de teste identifica o composto deteste como um inibidor de celulase, por exemplo, atividade enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase.
A invenção prove sistemas de computador compreendendo umprocessador e um dispositivo de armazenagm de dados armazenou nosmesmos uma seqüência de polipeptídeos ou uma seqüência de ácidosnucléicos da invenção (por exemplo, um polipeptídeo ou peptídeo codificadopor um ácido nucléico da invenção). Em um aspecto, o sistema decomputador pode ulteriormente compreender um algoritmo de comparaçãode seqüência e um dispositivo de armazenagem de dados tendo pelo menosseqüência de referência armazenada no mesmo. Em um outro aspecto, oalgoritmo de comparação de seqüência compreende um programa decomputador que indica polimorfismos. Em um aspecto, o sistema decomputador pode ulteriormente compreender um identificador que identificauma ou mais características na dita seqüência. A invenção prove meiolegível em computador tendo armazenado no mesmo uma seqüência depolipeptídeos ou uma seqüência de ácidos nucléicos da invenção. Ainvenção prove métodos para identificação-de-uma característica em umaseqüência compreendendo as etapas de: (a) leitura da seqüência usando-se- um programa de computador que identifica uma ou mais características emuma seqüência, em que a seqüência compreende um seqüência depolipeptídeos ou uma seqüência de ácidos nucléicos da invenção; e (b)identificação de uma ou mais características na seqüência com o programade computador. A invenção prove métodos para a comparação de umaprimeira seqüência com uma segunda seqüência compreendendo as etapasde: (a) leitura da primeira seqüência e a segunda seqüência através do usode um programa de computador que compara seqüências, em que aprimeira seqüência compreende um seqüência de polipeptídeos ou umaseqüência de ácidos nucléicos da invenção; e (b) determinação dediferenças entram na primeira seqüência e a segunda seqüência com oprograma de computador. A etapa de determinação de diferenças entram naprimeira seqüência e a segunda seqüência pode ulteriormente compreendera etapa de identificação de polimorfismos. Em um aspecto, o método podeulteriormente compreender um identificador que identifica uma ou maiscaracterísticas em uma seqüência. Em um outro aspecto, o método podecompreender leitura da primeira seqüência usando-se um programa decomputador e identificação de uma ou mais características na seqüência.
A invenção prove métodos para o isolamento ou recuperação de um ácido nucléico que codifica um polipeptídeo tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase de uma amostra ambiental compreendendo as etapas de:(a) provisão de um par de seqüência de iniciador de ampliação para aampliação de um ácido nucléico que codifica um polipeptídeo tendo uma
celulase, por exemplo, atividade enzima de endoglucanase, celobioidrolase,manase e/ou betaglicosidase, em que o par iniciador é capaz de ampliar umácido nucléico da invenção; (b) isolamento de um ácido nucléico da amostraambiental ou tratamento da amostra ambiental tal que ácido nucléico naamostra é acessível para a hibridização para dar o par de iniciador de
ampliação; e, (c) combinação do ácido nucléico da etapa (b) com o par de_Jniciador.de. ampliação da etapa (a) e ampliação de ácido nucléico daamostra ambiental, desse modo isolando ou recuperando um ácido nucléicoque -codifica um polipeptídeo tendo uma celulase, por exemplo, atividadeenzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase de
uma amostra ambiental. Um ou cada membro de par de seqüência de-iniciador de ampliação pode - compreender um oligonucleotídeocompreendendo um par de seqüência de iniciador de ampliação dainvenção, por exemplo, tendo pelo menos cerca de 10 a 50 basesconsecutivas de uma seqüência da invenção.
A invenção prove métodos para o isolamento ou recuperação de
um ácido nucléico que codifica um polipeptídeo tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase de uma amostra ambiental compreendendo as etapas de:(a) provisão de uma sonda de polinucleotídeo compreendendo um ácido
nucléico da invenção ou uma sua subseqüência; (b) isolamento de um ácidonucléico da amostra ambiental ou tratamento da amostra ambiental tal queácido nucléico na amostra é acessível para a hibridização para dar umasonda de polinucleotídeo da etapa (a); (c) combinação do ácido nucléicoisolado ou a amostra ambiental tratada da etapa (b) com a sonda depolinucleotídeo da etapa (a); e (d) isolamento de um ácido nucléico queespecificamente hibridiza com a sonda de polinucleotídeo da etapa (a),desse modo isolando ou recuperando um ácido nucléico que codifica umpolipeptídeo tendo uma celulase, por exemplo, atividade enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase de umaamostra ambiental. A amostra ambiental pode compreender uma amostra deágua, uma amostra de líquido, uma amostra de solo, uma amostra de ar ou
uma amostra biológica. Em um aspecto, a amostra biológica pode serderivada de uma célula bacteriana, uma célula de protozoário, uma célula deinseto, uma célula de levedura, uma célula de planta, uma célula fúngica ouuma célula de mamífero.
A invenção prove métodos de geração de uma variante de um
ácido nucléico que codifica um polipeptídeo tendo uma celulase, porexemplo,.atividade.enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase compreendendo as etapas de: (a) provisão de um ácidonucléico- de modelo-compreendendo um ácido nucléico da invenção; e (b)modificação, deleção ou adição de um ou mais nucleotídeos na seqüência
de modelo, ou uma sua combinação, para gerar uma variante do ácidonucléico de modelo. Em um - aspecto, o método pode ulteriormentecompreender expressão do ácido nucléico de variante para gerar a variantecelulase, por exemplo, enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase polipeptídeo. As modificações, adições ou deleções
podem ser introduzidas por um método compreendendo PCR propenso aerro, embaralhamento, mutagênese oligonucleotídeo-dirigida, PCR deconjunto, mutagêse de PCR sexual, mutagêse in vivo, mutagêse de cassete,mutagêse de conjunto repetida, mutagêse de conjunto exponencial,mutagêse de sítio-específico, reagrupamento de gene, mutagênese de
saturação de sítio de gene (GSSM), reagrupamento de ligação sintética(SLR), mutagênese de saturação cromossomal (CSM) ou uma suacombinação. Em um outro aspecto, as modificações, adições ou deleçõessão introduzidas por um método compreendendo recombinação,recombinação de seqüência repetida, mutagênese de DNA modificada porfosfotioato, mutagênese de modelo contendo uracila, mutagênese dúplex delacuna, mutagênese de reparo de desemparelhamento de ponto, mutagênese de cepa hospedeira deficiente de reparo, mutagênese química,mutagênese radiogênica, mutagênese de deleção, mutagênese de seleçãode restrição, mutagênese de purificação de restrição, síntese de geneartificial, mutagênese de conjunto, criação de multímero de ácido nucléicoquimérico e uma sua combinação. Em um aspecto, o método pode ser interativamente repetido até
que uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase,manase e/ou betaglicosidase tendo uma atividade alterada ou diferente ouum estabilidade alterada ou diferentes daquela de um polipeptídeocodificado pelo ácido nucléico de modelo seja produzido. Em um aspecto, a celulase de variante, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase polipeptídeo é termotolerante,e retém alguma atividade depois de ser exposta a uma temperatura elevada.Em um outro aspecto, a celulase de variante, por exemplo, enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase polipeptídeo tem aumentado a glicolisaçao quando comparada com a celulase, porexemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase codificado por um ácido nucléico de modelo.Alternativamente, a celulase de variante, por exemplo, endoglucanase,celobioidrolase, manase e/ou betaglicosidase polipeptídeo tem uma celulase, por exemplo, atividade enzima de endoglucanase, celobioidrolase,manase e/ou betaglicosidase sob um alta temperatura, em que a celulase,por exemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase codificado pelo ácido nucléico de modelo não é ativo sob aalta temperatura. Em um aspecto, o método pode ser interativamente repetido até que uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase que codifica seqüência tendoum uso de códon alterado a partir do qual o ácido nucléico de modelo sejaproduzido. Em um outro aspecto, o método pode ser interativamenterepetido até que uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase gene tendo nível mais alto oumais baixo de expressão de mensagem ou estabilidade daquela do ácido nucléico de modelo seja produzido.
A invenção prove métodos para a modificação códons em umácido nucléico que codifica um polipeptídeo tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase para aumentar sua expressão em uma célula hospedeira, o método compreendendo as seguintes etapas: (a) provisão de um ácidonucléico da invenção que codifica um polipeptídeo tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase; e, (b) identificação de um códon não preferido ou menospreferido no ácido nucléico da etapa (a) e substituição dele com um códonpreferido ou naturalmente usado que codifica o mesmo aminoácido que ocódon substituído, em que um códon preferido é um códon ultra-representado nas seqüências de codificação em genes na célula hospedeirae_um códon não preferido ou menos preferido é um códon sob-representadonas seqüências de codificação em genes na célula hospedeira, desse modo modificando o ácido nucléico para aumentar sua expressão em uma célulahospedeira. -
A invenção prove métodos para os códons de modificação emum ácido nucléico que codifica um polipeptídeo tendo uma celulase, porexemplo; atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase; o método compreendendo as seguintes etapas: (a) provisãode um ácido nucléico da invenção; e, (b) identificação de um códon no ácidonucléico da etapa (a) e substituição dele com um códon diferente quecodifica o mesmo aminoácido que o códon substituído, desse modomodificando códons em um ácido nucléico que codifica uma celulase, porexemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase.
A invenção prove métodos para códons de modificação em umácido nucléico que codifica um polipeptídeo tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase para aumentar sua expressão em uma célula hospedeira, ométodo compreendendo as seguintes etapas: (a) provisão de um ácido
nucléico da invenção que codifica uma celulase, por exemplo,endoglucanase, celobioidrolase, manase e/ou beta- glicosidase de enzimapolipeptídeo; e, (b) identificação de um códon não preferido ou menospreferido no ácido nucléico da etapa (a) e substituição dele com um códonpreferido ou naturalmente usado que codifica o mesmo aminoácido que o
códon substituído, em que um códon preferido é um códon ultra-representado nas seqüências de codificação em genes na célula hospedeirae um códon não preferido ou menos preferido é um códon sob-representadonas seqüências de codificação em genes na célula hospedeira, desse modomodificando o ácido nucléico para aumentar sua expressão em uma célula
hospedeira.
A invenção prove métodos para a modificação um códon em umácido nucléico que codifica um polipeptídeo tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase para diminuir sua expressão em uma célula hospedeira, o
método compreendendo as seguintes etapas: (a) provisão de um ácidonucléico da invenção; e (b) identificação de pelo menos códon preferido noácido nucléico da etapa (a) e substituição dele com um códon não preferidoou menos preferido que codifica o mesmo aminoácido que o códonsubstituído; em que um códon preferido é um códon ultra-representado nas
seqüências de codificação em genes em uma célula hospedeira e um códonnão preferido ou menos preferido é um códon sob-representado nasseqüências de codificação em genes na célula hospedeira, desse modomodificando o ácido nucléico para diminuir sua expressão em uma célulahospedeira. Em um aspecto, a célula hospedeira pode ser uma célula
bacteriana, uma célula fúngica, uma célula de inseto, uma célula delevedura, uma célula de planta ou uma célula de mamífero.
A invenção prove métodos para a produção de uma biblioteca deácidos nucléicos que codifica uma pluralidade de celulase modificada, porexemplo, sítios ativos ou sítios de ligação de substrato de enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase, em que ossítios ativos modificados ou sítios de ligação de substrato são derivados de um primeiro ácido nucleico compreendendo uma seqüência que codifica umprimeiro sítio ativo ou um primeiro sítio de ligação de substrato o métodocompreendendo as seguintes etapas: (a) provisão de um primeiro ácidonucleico codificando um primeiro sítio ativo ou primeiro sítio de ligação desubstrato, em que o primeiro ácido nucleico seqüência compreende uma
seqüência que hibridiza sob condições rigorosas para dar um ácido nucleicoda invenção, e o ácido nucleico codifica uma celulase, por exemplo, enzimade endoglucanase, celobioidrolase, manase e/ou betaglicosidase sítio ativoou uma celulase, por exemplo, substrato de enzima de sítio de ligação deendoglucanase, celobioidrolase, manase e/ou betaglicosidase; (b) provisão
de um conjunto de oligonucleotídeos mutagenicos que codificam variantesde aminoácido de ocorrência natural a uma pluralidade de códonsdirecionados no primeiro ácido nucleico; e, (c) usando-se o conjunto deoligonucleotídeos mutagenicos para gerar um conjunto de ácido nucléicos devariante de codificação de sítio de ligação de substrato ou de condificação
de sítio ativo que codifica uma faixa de variações de aminoácidos a cadacódon de aminoácido que foi mutagenizado, desse modo produzindo umabiblioteca de ácidos nucléicos que codifica uma pluralidade de celulasemodificada, por exemplo, sítios ativos ou sítios de ligação de substrato deenzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase.
Em um aspecto, o método compreende mutagenesação do primeiro ácidonucleico da etapa (a) por um método compreendendo um sistema deevolução direcionado otimizado, mutagênese de saturação de sítio de gene(GSSM), conjunto de ligação sintético (SLR), PCR propenso a erro,embaralhamento, mutagênese oligonucleotídeo-dirigida, PCR de conjunto,
mutagêse de PCR sexual, mutagêse in vivo, mutagêse de cassete,mutagêse de conjunto repetida, mutagêse de conjunto exponencial,mutagêse de sítio-específico, conjunto de gene, e uma sua combinação. Emum outro aspecto, o método compreende mutagenisação do primeiro ácidonucléico da etapa (a) ou variantes por um método compreendendorecombinação, recombinação de seqüência repetida, mutagênese de DNAmodificada por fosfotioato, mutagênese de modelo contendo uracila, mutagênese dúplex de lacuna, mutagênese de reparo dedesemparelhamento de ponto, mutagênese de cepa hospedeira deficientede reparo, mutagênese química, mutagênese radiogênica, mutagênese dedeleção, mutagênese de seleção de restrição, mutagênese de purificação derestrição, síntese de gene artificial, mutagênese de conjunto, criação de
multímero de ácido nucléico quimérico e uma sua combinação.
A invenção prove métodos para a produção de uma moléculapequena compreendendo as seguintes etapas: (a) provisão de umapluralidade de enzimas biossintéticas capaz de sintetizar ou modificar umamolécula pequena, em que uma das enzimas compreende uma celulase, por
exemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase codificada por um ácido nucléico da invenção; (b) provisãode a substrato por pelo menos das enzimas da etapa (a); e (c) reação do■ - substrato da etapa (b) com as enzimas sob condições que facilitam umapluralidade de reações biocatalíticas para gerar uma molécula pequena por
uma série de reações biocatalíticas. A invenção prove métodos para amodificação uma molécula-pequena compreendendo as seguintes etapas:(a) provisão de uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase, em que a enzima compreendeum polipeptídeo da invenção, ou, um polipeptídeo codificado por um ácido
nucléico da invenção, ou uma sua subseqüência; (b) provisão de umamolécula pequena; e (c) reação da enzima da etapa (a) com a moléculapequena da etapa (b) sob condições que facilitam uma reação enzimáticacatalisada pela celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase, desse modo modificando uma
molécula pequena por uma celulase, por exemplo, reação enzimática deendoglucanase, celobioidrolase, manase e/ou betaglicosidase. Em umaspecto, o método pode compreender uma pluralidade de substratos demolécula pequena para a enzima da etapa (a), desse modo gerando umabiblioteca de moléculas pequenas modificadas produido por pelo menosreação enzimática catalisada pela celulase, por exemplo, enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase. Em um aspecto, o método pode compreender uma pluralidade de enzimasadicionais sob condições que facilitam uma pluralidade de reaçõesbiocatalíticas pelas enzimas para formar uma biblioteca de moléculaspequenas modificadas produzida pela pluralidade de reação enzimáticas.Em um outro aspecto, o método pode ulteriormente compreender a etapa de testagem da biblioteca para determinar se uma molécula pequenamodificada particular que exibe uma atividade desejada está presente dentroda biblioteca. A etapa de testagem da biblioteca pode ulteriormentecompreender as etapas de eliminação sistemática todas exceto uma dasreações biocatalíticas usada para produzir uma porção da pluralidade dasmoléculas pequenas modificadas dentro da biblioteca por testagem daporção da molécula pequena modificada quanto a presença ou ausência damolécula pequena modificada particular com uma atividade desejada, e-identificação de pelo menos reação biocatalítica específica que produz amolécula pequena modificada particular da atividade desejada.
A invenção prove métodos para a determinação de um
fragmento funcional de uma -celulase, por exemplo, enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidasecompreendendo as etapas de: (a) provisão de uma celulase, por exemplo,enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase, em que a enzima compreende um polipeptídeo da invenção, ou umpolipeptídeo codificado por um ácido nucléico da invenção, ou uma suasubseqüencia; e (b) deleção uma pluralidade de resíduos de aminoácidos daseqüência da etapa (a) e testagem da subseqüencia restante para umacelulase, por exemplo, atividade enzima de endoglucanase, celobioidrolase,manase e/ou betaglicosidase, desse modo determinando um fragmentofuncional de uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase. Em um aspecto, a celulase,39
por exemplo, atividade enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase é medida por provisão de uma celulase, por exemplo,substrato de enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase e detecção de uma diminuição na quantidade do substrato ou um aumento na quantidade um produto de reação.
A invenção prove métodos para engenheiramento de célulainteira de fenótipos novos ou modificados por uso de análise de fluxometabólico de tempo real, o método compreendendo as seguintes etapas:(a) produção de uma célula modificada por modificação da composição
10 genética de uma célula, em que a composição genética é modificada poradição à célula de um ácido nucléico da invenção; (b) cultivo da célulamodificada para gerar uma pluralidade de células modificadas; (c) mediçãode pelo menos parâmetro metabólico da célula por monitoração da culturade célula da etapa (b) em tempo real; e, (d) análise dos dados da etapa (c)
para determinar se o parâmetro medido difere de uma medição comparávelem uma célula não modificada sob condições similares, desse modoidentificando um fenótipo engenheirado na célula usando-se análise de fluxometabólico de tempo real. Em um aspecto, a composição genética da célulapode ser modificada por um método compreendendo deleção de uma
seqüência ou modificação de uma seqüência na célula, ou, inativação daexpressão de um gene. Em um aspecto, o método pode -ulteriormentecompreender seleção de uma célula compreendendo um fenótiporecentemente engenheirado. Em um outro aspecto, o método podecompreender cultivo da célula selecionada, desse modo gerando uma nova
cepa de célula compreendendo um fenótipo recentemente engenheirado.
A invenção prove métodos de aumento de termotolerância outermoestabilidade de uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase polipeptídeo, o métodocompreendendo glicosilação de uma celulase, por exemplo, polipeptídeo de
enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase,em que o polipeptídeo compreende pelo menos trinta aminoácido contíguosde um polipeptídeo da invenção; ou um polipeptídeo codificado por umaseqüência de ácidos nucléicos da invenção, desse modo aumentando umatermotolerancia ou termoestabilidade da celulase, por exemplo, polipeptídeode endoglucanase, celobioidrolase, manase e/ou betaglicosidase. Em umaspecto, a celulase, por exemplo, atividade específica de enzima deendoglucanase, celobioidrolase, manase e/ou beta- glicosidase pode sertermoestável ou termotolerante a uma temperatura na faixa de mais do quecerca de 37°C a cerca de 95°C.
A invenção prove métodos para ultra-expressão de uma celulaserecombinante, por exemplo, polipeptídeo de endoglucanase, celobioidrolase,manase e/ou betaglicosidase em uma célula compreendendo expressão deum vetor compreendendo um ácido nucléico compreendendo um ácidonucléico da invenção ou uma seqüência de ácidos nucléicos da invenção,em que as identidades de seqüência são-determinadas por análise com umalgoritmo de comparação de seqüência ou por inspeção visual, em que ultra- expressão é efetuada por uso de um promotor de alta atividade, um vetordicistrônico ou por ampliação de gene do vetor.
A invenção prove métodos de produção de uma plantatransgênica compreendendo as. seguintes etapas: (a) introdução de umaseqüência de ácidos nucléicos heteróloga para dentro da célula, em que aseqüência nucléica heteróloga compreende uma seqüência de ácidosnucléicos da invenção, desse modo produzindo uma célula de plantatransformada; e (b) produção de uma planta transgênica a partir da célulatransformada. Em um aspecto, a etapa (a) pode ulteriormente compreenderintrodução da seqüência de ácidos nucléicos heteróloga por eletroporaçãoou microinjeção de protoplastos de célula de planta. Em um outro aspecto, aetapa (a) pode ulteriormente compreender introdução da seqüência deácidos nucléicos heteróloga diretamente para tecido de planta porbombardeamento de partículas de DNA. Alternativamente, a etapa (a) podeulteriormente compreender introdução da seqüência de ácidos nucléicosheteróloga para dentro da célula de planta DNA usando-se um hospedeirode Agrobacterium tumefaciens. Em um aspecto, a célula de planta pode seruma célula de cana-de-açúcar, beterraba, soja, tomate, batata, milho, arroz,trigo, tabaco ou cevada.
A invenção prove métodos de expressão de uma seqüência deácidos nucléicos heterologa em uma célula de planta compreendendo asseguintes etapas: (a) transconstrução da célula de planta com uma seqüência de ácidos nucléicos heterologa operavelmente ligada a umpromotor, em que a seqüência nucléica heterologa compreende um ácidonucléico da invenção; (b) desenvolvimento da planta sob condições em queseqüência de ácidos nucléicos heterologa é expressa na célula de planta. Ainvenção prove métodos de expressão de uma seqüência de ácidos
nucléicos heterologa em uma célula de planta compreendendo as seguintesetapas: (a) transconstrução da célula de planta com uma seqüência deácidos nucléicos heterologa operavelmente ligada a um promotor, em que aseqüência nucléica heterologa compreende uma seqüência da invenção; (b)desenvolvimento da planta sob condições em que seqüência de ácidos
nucléicos heterologa é expressa na célula de planta.
A invenção prove alimentos ou comidas compreendendo umpolipeptídeo da invenção, ou um polipeptídeo codificado por um ácidonucléico da invenção.- Em um aspecto, a invenção prove uma comida, umalimento, um líquido, por exemplo, uma bebida (tal como suco de fruta ou
cerveja), um pão ou um bolinho ou um produto de pão, ou um precursor debebida (por exemplo, um mosto), compreendendo um polipeptídeo dainvenção. A invenção prove alimento ou suplementos nutricionais para umanimal compreendendo um polipeptídeo da invenção, por exemplo, umpolipeptídeo codificado pelo ácido nucléico da invenção.
Em um aspecto, o polipeptídeo no alimento ou suplemento
nutricional pode ser glicosilado. A invenção prove matrizes de fornecimentode enzima cosmetível compreendendo um polipeptídeo da invenção, porexemplo, um polipeptídeo codificado pelo ácido nucléico da invenção. Emum aspecto, a matriz de fornecimento compreende um pélete. Em um
aspecto, o polipeptídeo pode ser glicosilado. Em um aspecto, a celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase é termotolerante. Em um outro aspecto, a celulase, porexemplo, atividade de enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase é termoestável.
A invenção prove uma comida, um alimento ou a suplementonutriconal compreendendo um polipeptídeo da invenção. A invenção prove métodos para a utilização de uma celulase, por exemplo, enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase como umsuplemento nutriconal em uma dieta de animal, o método compreendendo:preparação de um suplemento nutriconal contendo uma celulase, porexemplo, enzima de endoglucanase, celobioidrolase, manase e/ou
betaglicosidase compreendendo pelo menos trinta aminoácidos contíguos deum polipeptídeo da invenção; e administração do suplemento nutriconal aum animal. O animal pode ser um ser humano, um ruminante ou um animalmonogástrico. A celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase pode ser preparada por
expressão de um polinucleotídeo que codifica a celulase, por exemplo,enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase emum organismo selecionado do grupo que consiste em uma bactéria, umalevedura, uma planta, um inseto, um fungo e um animal. O organismo podeser selecionado do grupo que consiste em um S. pombe, S. cerevisiae,
Pichia pastoris, E. coli, Streptomyces sp., Bacillus Sp. e Lactobacillus sp.
A invenção prove matriz de fornecimento de enzima comestívelcompreendendo uma celulase recombinante termoestável, por exemplo,enzima de endoglucanase, celobioidrolase, manase e/ou beta- glicosidase,por exemplo, um polipeptídeo da invenção. A invenção prove métodos para
o fornecimento de uma celulase, por exemplo, suplemento de enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase a um animal,o método compreendendo: preparação de uma matriz de fornecimento deenzima comestível na forma de péletes compreendendo um veículocosmetível granulado e uma celulase recombinante termoestável, porexemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase, em que a péletes prontamente dispersam a celulase, porexemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase contidas ali no meio aquoso, e administração da matriz defornecimento de enzima comestível ao animal. A celulase recombinante, porexemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase pode compreender um polipeptídeo da invenção. A celulase,por exemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase pode ser glicosilada para promover termoestabilidade nascondições de transconstrução em péletes. A matriz de fornecimento podeser formada por transconstrução em péletes de uma misturacompreendendo um germe de grão e uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase. As condiçõesde transconstrução em péletes podem incluir aplicação de vapor. Ascondições de transconstrução em péletes pode compreender aplicação deuma temperatura em excesso de cerca de 80°C por cerca de 5 minutos e aenzima retém uma atividade específica de pelo menos 350 a cerca de 900 unidades por miligrama de enzima. Em um aspecto, invenção prove umcomposição farmacêutica compreendendo uma celulase, por exemplo,enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase dainvenção, ou um polipeptídeo codificado por um ácido nucléico da invenção.Em um aspecto, a composição farmacêutica age como um auxiliar digestivo. Em certos aspectos, um composto contendo celulose é posto em
contanto com um polipeptídeo da invenção tendo uma celulase, porexemplo, atividade enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase a um pH na faixa de entre cerca de pH 3,0 a 9,0, 10,0, 11,0ou mais. Em outros aspectos, um composto contendo celulose é posto em contato com a celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase a uma temperatura de cercade 55°C, 60°C, 65°C, 70°C, 75°C, 80°C, 85°C, 90°C, ou mais.
Os detalhes de um ou mais aspectos da invenção são indicadosnos desenhos anexos e na descrição abaixo. Outras características, objetivos, e vantagens da invenção serão evidentes a partir da descrição edos desenhos, e a partir das reivindicações.
Todas as publicações, patentes, pedidos de patente, seqüências44
de GenBank e depósitos de ATCC, citados aqui são aqui expressamentoincorporados por referência para todas as finalidades.Breve Descrição dos Desenhos
Os seguintes desenhos são ilustrativos de aspectos da invenção e destinam a limitar o escopo da invenção como incluído pelasreivindicações.
Figura 1 é um diagrama de bloco de um sistema de computador.
Figura 2 é um diagrama de fluxo que ilustra um aspecto de umprocesso para a comparação de uma nova seqüência de proteínas ou de10 nucleotídeos com uma base de dados das seqüências a fim de determinaros níveis de homologia entre a nova seqüência e as seqüências na base dedados.
Figura 3 é um diagrama de fluxo que ilustra um aspecto de umprocesso em um computador para a determinação de se duas seqüências15 são homólogas. Figura 4 é um diagrama de fluxo que ilustra um aspecto de umprocesso identificdor 300 para a detecção da presença de uma característicana seqüência.
Figura 5 é uma ilustração da estrutura de celobiose. Figuras 6 e 7 ilustram os resultados de análise de TLC de
produtos de reação a partir de celoexose, como discutido em detalhes noExemplo 1, abaixo.
Figura 8 ilustra nos dados de forma gráfica que mostram aliberação de celobiose a partir de PASC pela enzima exemplar 22/22a (uma CBH) da invenção, como discutida em detalhes no Exemplo 2, abaixo.
Figura 9 ilustra nos dados de forma gráfica que mostram aliberação de celobiose a partir de AVIGEL® MCC pela enzima exemplar22/22a (a CBH) da invenção, como discutida em detalhes no Exemplo 2,abaixo.
Figura 10 ilustra em dados de forma gráfica que mostram um
surto GIGAMATRIX® típico, onde clones ativos que expressam enzimacapazes de hidrolisar metilumbeliferil celobioside são identificados, comodiscutido em detalhes no Exemplo 4, abaixo.
Figura 11 ilustra nos dados de forma gráfica que mostram aatividade de enzimas selcionadas contra celulose inchada por ácido (PASC)por análise de eletroforese capilar (CE), como discutida em detalhes no Exemplo 4, abaixo.
Figura 12 ilustra nos dados de forma gráfica de ensaios de umaenzima exemplar da invenção e de variantes de subclone em AVICEL®Celulose microcristalina (MCC), onde os produtos de reação foramanalisados pelo ensaio de açúcar de redução BCA, como discutido em detalhes no Exemplo 4, abaixo.
Figura 13 ilustra nos dados de forma gráfica a partir de ensaiosde GSSM primários, como discutido em detalhes no Exemplo 4, abaixo.
Figura 14 ilustra nos dados de forma gráfica a partir de ensaiosde triagem GSSM secundários, como discutidos em detalhes no Exemplo 4, abaixo.
Figura 15 ilustra nos dados de forma gráfica a partir de ensaiosde triagem GSSM mistos ou "combinados", como discutidos em detalhes no
Exemplo 4, abaixo. ______ .
Como símbolos de referência nos vários desenhos indicam elementos semelhantes.
Descrição Detalhada
A invenção prove polipeptídeos com celulase, por exemplo,atividade de endoglucanase, celobioidrolase, manase e/ou betaglicosidase,polinucleotídeos que codificam eles, e métodos de produção e uso destes
polinucleotídeos e polipeptídeos. A invenção também prove enzimas decelulase, por exemplo, enzimas de endoglucanase, celobioidrolase, manasee/ou betaglicosidase, polinucleotídeos que codificam estas enzimas, o usode tais polinucleotídeos e polipeptídeos.
Em um aspecto, a invenção prove a celulase, por exemplo,
endoglucanase, celobioidrolase, manase e/ou betaglicosidase, com umataxa catalística aumentada, aperfeiçoamento do processo de hidrólise desubstrato. Essa eficácia catalítica em taxa catalítica leva uma eficáciaaumentada na produção de açúcares que subseqüentemente seriam usadospor microorganismos para a produção de etanol. Em um aspecto,microorganismos que geram enzima da invenção são usados commicroorganismos produtores de etanol. Assim, a invenção prove métodos para a produção de etanol e produção de "combustíveis limpos" à base deetanol, por exemplo, para o transporte usando-se bioetanol.
Em um aspecto a invenção prove composições (por exemplo,preparações de enzima, alimentos, fármacos, suplementos de dieta)compreendendo as enzimas, polipeptídeos ou polinucleotídeos da invenção. Estas composições podem ser formuladas em uma variedade de formas, porexemplo, como líquidos, géis, pílulas, comprimidos, sprays, pós, comida,péletes de alimento ou formas encapsuladas, incluindo formas nãocapsuladas.
Ensaios para a medição de atividade de celulase, por exemplo,
atividade de endoglucanase, celobioidrolase, manase e/ou betaglicosidase,por exemplo, para a determinação de se um polipeptídeo tem atividade decelulase, por exemplo, atividade de endoglucanase, celobioidrolase, manasee/ou betaglicosidase, são bem cohecidos na técnica e estão dentro doescopo da invenção; ver, por exemplo, Baker WL, Tecidow A, Estimation of
cellulase activity using a glucose-oxidase-Cu(ll) reducing assay for glucose,J Biochem Biophys Methodos. 1991 Dec, 23(4):265-73; Sharrock KR,Cellulase assay métodos: a review, J Biochem Biophys Methodos. Emoutubro de 1988, 17(2):81-105; Carder JH, Detection e quantitation ofcellulase by Congo red staining of substrates in a cup-plate diffusion assay,
Anal Biochem. 1986 Feb 15, 153(l):75-9; Canevascini G., A celulase assaycoupled to cellobiose dehydrogenase, Anal Biochem. em junho de 1985,147(2):419-27; Huang JS, Tang J, Sensitive assay for cellulase edextranase. Anal Biochem. em junho de 1976, 73(2):369-77.
O pH de condições de reação utilizados pela invenção é um
outro parâmetro variável para o qual a invenção prove. Em certos aspectos,o pH da reação é conduzido na faixa de cerca de 3,0 a cerca de 9,0. Emoutras aspectos, o pH é cerca de 4,5 ou o pH é cerca de 7,5 ou o pH é cercade 9. Condições de reação conduzidas sob condições alcalinas tambémpodem ser vantajosas, por exemplo, em algumas aplicações industriais oufarmacêuticas de enzimas da invenção.
A invenção prove celulase, por exemplo, endoglucanase,celobioidrolase, manase e/ou betaglicosidase polipeptídeos da invenção emuma variedade de formas e formulações. Nos métodos da invenção,celulase, por exemplo, endoglucanase, celobioidrolase, manase e/oubetaglicosidase polipeptídeos da invenção são usadas em uma variedade deformas e formulações. Por exemplo, celulase purificada, por exemplo, endoglucanase, celobioidrolase, manase e/ou betaglicosidase polipeptídeospode ser usada em preparações de enzima empregadas em produção debioetanol ou em aplicações farmacêuticas ou auxiliares de dieta.Alternativamente, as enzimas da invenção podem ser usadas diratamente noprocesso para produzir bioetanol, tornar combustíveis limpos, biorresíduos de processo, alimentos de processo, líquidos ou alimentos, e similares.
Alternativamente, a celulase, por exemplo, endoglucanase,celobioidrolase, manase e/ou betaglicosidase polipeptídeos da invençãopode ser expressa em um microorganismo usando-se procedimentosconhecidos na técnica. Em outros aspectos, a celulase, por exemplo,endoglucanase, celobioidrolase, manase e/ou betaglicosidase polipeptídeosda invenção pode ser imobilizada sobre um suporte antes do uso nosmétodos da invenção. Métodos para a imobilização de enzimas sobresuportes sólidos são comumente conhecidos na técnica, por exemplo J. Mol.Cat. B: Enzymatic 6 (1999) 29-39; Chivata e outros Biocatalysis: Immobilizedcells e enzymes, J Mol. Cat. 37 (1986) 1-24: Sharma e outros, ImmobilizedBiomaterials Techniques e Applications, Angew. Chem. Int. Ed. Engl. 21(1982) 837- 54: Laskin (Ed.), Enzymes e Immobilized Cells in Biotechnology.Ácidos nucléicos, Sondas e Moléculas inibitóriasA invenção prove ácidos nucléicos recombinantes e isolados, porexemplo, ver as tabelas 1, 2, e 3, Exemplos 1 e 4, abaixo, e Listagem deSeqüência; ácidos nucléicos que codificam polipeptídeos, incluindo asseqüências de polinucleotídeos exemplares da invenção, por exemplo, ver atabela 1 e Listagem de seqüência; incluindo cassetes de expressão taiscomo vetores de expressão e vários veículos de clonagem compreendendoácidos nucléicos da invenção. A invenção também inclui métodos para arevelação, identificação ou novas celulases isoladas, por exemplo, seqüências de polipeptídeos de endoglucanase, celobioidrolase, manasee/ou betaglicosidase usando-se os ácidos nucléicos da invenção. A invençãotambém inclui métodos para a inibição da expressão de celulase, porexemplo, endoglucanase, celobioidrolase, manase e/ou betaglicosidase quecodificam genes e transcritos usando-se os ácidos nucléicos da invenção. 1. Também providos são métodos para a modificação dos
ácidos nucléicos da invenção, incluindo produzindovariantes de ácidos nucléicos da invenção, por, porexemplo, reagrupamento de ligação sintética, sistema deevolução dirigida otimizada e/ou mutagênese de saturação tal como sítio de de mutagênese de saturação
(GSSM). O termo "mutagênese de saturação",Mutagênese de saturação de sítio de gene, ou "GSSM"inclui um método que usa iniciadores de oligonucleotídeodegenerados para introduzir mutações de ponto para dentro de um polinucleotídeo, como descrito em detalhes,
abaixo. O termo "sistema de evolução dirigida otimizada"ou "evolução direcionada otimizada" inclui um métodopara reagrupar fragemtentos de seqüências de ácidosnucléicos correlacionadas, por exemplo, genes relacionados, e explicados em detalhes, abaixo. O termo
"reagrupamento de ligação sintética" ou "SLR" inclui ummétodo de ligação de fragmentos de oligonucleotídeo emuma forma não estocástica, e explicada em detalhes,abaixo. O termo "variante" refere-se a polinucleotídeos ou polipeptídeos da invenção modificados em um ou mais
pares de base, códons, íntrons, éxons, ou resíduos deaminoácidos (respectivamente) ainda reterá a atividadebiológica da celulase, por exemplo, endoglucanase,celobioidrolase, manase e/ou betaglicosidase dainvenção. Variantes podem ser produzids por qualquernúmero de meios incluídos métodos tais como, por exemplo, PCR propenso a erro, embaralhamento,
mutagênese oligonucleotídeo-dirigida, PCR de conjunto,mutagêse de PCR sexual, mutagêse in vivo, mutagêse decassete, mutagêse de conjunto repetida, mutagêse deconjunto exponencial, mutagêse de sítio-específico, reagrupamento de gene, reagrupamento de gene, GSSM
e qualquer sua combinação.Os ácidos nucléicos da invenção podem ser produzidos, isoladose/ou manipulados por, por exemplo, clonagem e expessão de bibliotecas decDNA, ampliação de DNA genômico ou mensageiro por PCR, e similares. Por exemplo, seqüências exemplares da invenção eram inicialmentederivadas de fontes ambientais. Assim, em um aspecto, a invenção provecelulase, por exemplo, enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase que codifica ácidos nucléicos, e os polipeptídeoscodificados por eles, tendo uma novidade comum pelo fato de qu eles são derivados de uma fonte comum, por exemplo, uma fonte ambiental, culturamista, ou bacteriana.
Na prática dos métodos da invenção, genes homólogos podemser modificados por manipulação de um ácido nucléico de modelo, comodescrito aqui. A invenção pode ser praticada em combinação com qualquer método ou protocolo ou dispositivo conhecido na técnica, que são bem-descritos na literatura de patente e específica.
As frases "ácido núcleico" ou "seqüência de ácidos nucléicos"como usados aqui referem-se a um oligonucleotídeo, nucleotídeo,polinucleotídeo, ou a um fragmento de qualquer um destes, a DNA ou RNA de origem genômica ou sintética que pode ser de filamento duplo ou defilamento único e pode representar um filamento de sentido ou sem sentido(complementar), para ácido núcleico de peptídeo (PNA), ou para qualquermaterial de tipo DNA ou de RNA, de origem sintético ou natural. As frases"ácido núcleico" ou "seqüência de ácidos núcleicos" inclui oligonucleotídeo,nucleotídeo, polinucleotídeo, ou um fragmento de qualquer um destes, umDNA ou RNA (por exemplo, mRNA, rRNA, tRNA, iRNA) de origem genômica ou sintética que pode ser de filamento duplo ou de filamento único e poderepresentar um filamento sentido ou sem sentido, para ácido núcleico depeptídeo (PNA), ou para qualquer material de tipo DNA ou RNA, de origemsintética ou natural, incluindo, por exemplo, iRNA, ribonucleoproteínas (porexemplo, por exemplo, iRNAs de filamento duplo, por exemplo, iRNPs). O
termo inclui ácidos núcleicos, isto é, oligonucleotídeos, contendo análogosconhecidos de nucleotídeos naturais. O termo também inclui estruturas detipo ácido nucléico com cadeias principais sintéticas, ver, por exemplo, Mata(1997) Toxicol. Appl. Pharmacol. 144:189-197; Strauss- Soukup (1997)Biochemistry 36:8692-8698; Samstag (1996) Antisense Nucleic Acid Drug
Dev 6:153-156. "Oligonucleotídeo" inclui ou um polidessoxinucleotídeo defilamento único ou dois filamentos de polidesoxinucleotídeo complementaresque podem ser quimicamente sintetizados. Tais oligonucleotídeos sintéticosnão têm fosfato 5' e assim não se ligará a um outro oligonucleotídeo semadição de um fosfato com uma ATP na presença de uma cinase. Um
oligonucleotídeo sintético pode se ligar a um fragmento que não foidesfosforilado.
Uma "seqüência de codificação de ou uma "seqüência denucleotídeos que codifica" um polipeptídeo ou uma proteína particular, éuma seqüência de ácidos núcleicos que é transcrita ou traduzida para dentro
de um polipeptídeo ou proteína quando colocada sob o controle deseqüências reguladoras apropriadas. O termo "gene" significa o segmentode DNA envolvido na produção de uma cadeia de polipeptídeo; ele incluiregiões precedentes e seguintes da região de codificação (líder e tardia)bem como, onde aplicáveis seqüências de intervenção (íntrons) entre
segmentos de codificação individuais (éxons). Uma seqüência de promotor é"operavelmente ligada a" uma seqüência de codificação quando polimerasede RNA que inicia transcrição no promotor transcreverá uma seqüência decodificação em mRNA. "Operavelmente ligado" como usado aqui refere-se auma relação funcional entre dois ou mais segmentos de functional ácidonúcleico (por exemplo, DNA). Ele pode referir-se à relação funcional deseqüência reguladora transcritiva a uma seqüência transcrita. Por exemplo,
um promotor é operavelmente ligado a uma seqüência de codificação, talcomo um ácido núcleico da invenção, se estimula ou modula a transcriçãode uma seqüência de codificação em uma célula hospedeira apropriada ououtro sistema de expressão. Em geral, seqüências reguladoras transcritivasde promotor que são operavelmente ligadas a uma seqüência trasncrita são
fisicamente contíguas à seqüência transcrita, isto é, elas são de ação eis. Noentanto, algumas seqüências reguladoras transcritivas, tais comoaumentadores, não necessitam ser fisicamente contíguos ou localizado naproximidade próxima das seqüência de codificação cuja transcrição elasaumentam.
O termo "cassete de expressão" como usado aqui refere-se a
uma seqüência de nucleotídeos que é capaz de afetar expessão de um geneestrutural (isto é, uma seqüência de codificação de proteínas, tal como umacelulase, por exemplo, enzima de endoglucanase, celobioidrolase, Manasee/ou betaglicosidase da invenção) em uma hospedeiro compatível com tais seqüências. Cassetes de expressão incluem pelo menos um promotoroperavelmente ligado com a seqüência de codificação de polipeptídeo; e,opcionalmente, com outras seqüências, por exemplo, sinais de terminaçãode transcrição. Fatores adicionais necessários ou úteis no efeito deexpressão podem ser usados, por exemplo, aumentadores, alfa-fatores.
Assim, cassetes de expressão também incluem plasmídios, vetores deexpressão, vírus recombinantes, qualquer forma de vetor de "DNA nu"recombinante, e similares. Um "vetor" compreende um ácido núcleico quepode infectar, transfectar, traduzir trasitória ou permanentemente traduziruma célula. Será reconhecido que um vetor pode ser um ácido núcleico nu,
ou um ácido núcleico complexado com proteína ou lipídio. O vetoropcionalmente compreende ácidos nucléicos e/ou proteínas virais oubacterianos, e/ou membranas (por exemplo, uma membrana celular, umenvelope de lipídio viral, etc). Vetores incluem, mas não são limitados aréplicons (por exemplo, replicans de RNA réplicons, bacteriófagos) aos quaisfragmentos de DNA podem estar ligados e se tornarem replicados. Vetoresassim incluem, mas não são limitados a RNA, DNA ou RNA linear oucircuitar de auto-replicação autônomo (por exemplo, plasmídios, vírus, esimilares, ver, por exemplo, a patente U.S. nQ 5.217.879), e incluem tantoplasmídio de expessão quanto de não expessão. Onde um microorganismoou cultura de célula recombinante é descrita como hospedeiro de um "vetorde expressão" isto inclui tanto DNA linear quanto circular extracromossomale DNA que foi incorporado no cromossoma(s) hospedeiro(s). Onde um vetorestá sendo manipulado por uma célula hospedeira, o vetor pode ou serestavelmente replicado pelas células durante a mitose como uma estruturaautônoma, ou é incorporado para dentro do genoma do hospedeiro
Como usados aqui, o termo "recombinante" inclui ácidosnucleicos adjacentes a um ácido núcleico de "cadeia principal" ao qual elenão é adjacente em seu ambiente natural. Em um aspecto, a serem"enriquecidos os ácidos nucleicos representarão cerca de 5% ou ou mais donúmero de insertos de ácido núcleico em uma população de moléculas decadeia principal de ácido núcleico. Moléculas de cadeia principal de acordocom a invenção incluem ácidos nucleicos tais como vetores de expressão,ácidos nucleicos auto-replicantes, vírus, ácidos nucleicos de integraçãooutros vetors ou ácidos nucleicos usados para manter ou manipular uminserto de ácido núcleico de interesse. Em um aspecto, os ácidos nucleicosenriquecidos representam cerca de 15% ou ou mais do número de insertos de ácido núcleico na população de moléculas de cadeia principalrecombinantes. Em um aspecto, os ácidos nucleicos enriquecidosrepresentam cerca de 50% ou ou mais do número de insertos de ácidonúcleico na população de moléculas de cadeia principal recombinantes. Emum aspecto, os ácidos nucleicos enriquecidos representam cerca de 90% ou ou mais do número de insertos de ácido núcleico na população de moléculasde cadeia principal recombinantes.
Um aspecto da invenção é um ácido núcleico recombinante ouisolado compreendendo uma das seqüências da invenção, ou um fragmentocompreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150,200, 300, 400, ou 500 ou mais bases consecutivas de um ácido núcleico dainvenção. Os ácidos nucléicos recombinantes ou isolados podem' compreender DNA, incluindo cDNA, DNA genômico e DNA sintético. O DNApode ser de filamento duplo ou de filamento único e se de filamento únicopode ser o filamento de codificação ou o filamento de não codificação (anti-sentido). Alternativamente, os ácidos nucléicos recombinantes ou isoladoscompreendem RNA.
Os ácidos nucléicos recombinantes ou isolados da invenção
podem ser usados para preparar uma dos polipeptídeos da invenção, oufragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75,100, ou 150 ou aminoácidos mais consecutivos de um dos polipeptídeos dainvenção. Correspondentemente, um outros aspecto da invenção é um ácido
núcleico recombinante ou isolado que codifica um dos polipeptídeos dainvenção, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30,35, 40, 50, 75, 100, ou 150 ou aminoácidos mais consecutivos de um dospolipeptídeos da invenção. As seqüências de codificação destes ácidosnucléicos podem ser idênticas a uma das seqüências de codificação de um
dos ácidos nucléicos da invenção ou pode ser seqüências de codificaçãodiferentes que codificam um dos da invenção tendo pelo menos 5, 10, 15,20, 25, 30, 35, 40, 50, 75, 100, ou 150 ou aminoácidos mais consecutivos deum dos polipeptídeos da invenção, como um resultado da redundância oudegeneração do código genético. O código genético é bem-conhecido por
aqueles versados na técnica e pode ser obtido, por exemplo, na page 214 ofB. Lewin, Genes VI, Oxford University Press, 1997.
Os ácidos nucléicos que codificam polipeptídeos da invençãoincluem mas não são limitados a: seqüência de codificação de um ácidonúcleico da invenção e seqüências de codificação adicionais, tais como
seqüências de não codificação e seqüências de pró-proteínas ou seqüênciaslíder, tais como íntrons ou seqüências de não codificação 5' e/ou 3' daseqüência de codificação. Assim, como usados aqui, o termo"polinucleotídeo que codificam um polipeptídeo" inclui um polinucleotídeoque inclui a seqüência de codificação para o polipeptídeo bem como umpolinucleotídeo que inclui seqüência de codificação e/ou de não codificaçãoadicional.
Em um aspecto, as seqüências de ácidos núcleicos da invençãosão mutagenizados usando-se técnicas convencionais, tal comomutagênese de sítio-dirigida, ou outras técnicas familiares àqueles versadosna técnica, para introduzir mudanças silenciosas nos polinucleotídeos dainvenção. Como usados aqui, "mudanças silenciosas" incluem, por exemplo,mudanças que não alteram a seqüência de aminoácidos codificada pelopolinucleotídeo. Tais mudanças podem ser desejáveis a fim de aumentar onível do polipeptídeo produzido por células hospedeiras contendo um vetorque codifica o polipeptídeo por introdução de códons ou pares de códon queocorrem freqüentemente no organismo do hospedeiro.
A invenção também refere-se a polinucleotídeos que têmmudanças de nucleotídeo que resultam em substituições, adições, deleções,fusões e truncações de aminoácido nos polipeptídeos da invenção. Taismudanças de nucleotídeo podem ser introduzidos usando-se técnicas taiscomo técnicas de mutagênese de sítio-dirigida, mutagênes químicaaleatória, deleção de éxonuclease III e outras técnicas de DNArecombinantes. Alternativamente, tais mudanças de nucleotídeo podem servariantes alélicas de ocorrência naturalque são isoladas por identificação deácidos nucléicos que especificamente hibridizam para dar sondascompreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150,200, 300, 400, ou 500 bases consecutivas de uma das seqüências dainvenção (ou as seqüências complementares às mesmas) sob condiçõesseveridade alta, moderada ou baixa como providas aqui.
. Técnicas Gerais
Os ácidos nucléicos usados para praticar esta invenção, se RNA,siRNA, miRNA, ácido núcleico, anti-sentido cDNA, DNA genômico, vetores,vírus ou seus híbridos, podem ser isolados de uma variedade de fontes,geneticamente engenheirados, ampliados, e/ou expressos/recombinantemente gerados. Polipeptídeos recombinantes (por exemplo,celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, manasee/ou betaglicosidase) gerados a partir destes ácidos nucléicos podem serindividualmente isolados ou clonados e testados quanto a uma atividade
desejada. Qualquer sistema de expressão recombinante pode ser usado,incluindo sistemas de expressão de célula bacteriana, de mamífero, delevedura, de inseto ou de planta.
Alternativamente, esses ácidos nucléicos podem ser sintetizadosin vitro por técnicas de síntese química bem-conhecidas, como descritas em,
por exemplo, Adams (1983) J. Am. Chem. Soe. 105:661; Belousov (1997)Ácidos nucléicos Res. 25:3440-3444; Frenkel (1995) Free Radie. Biol. Med.19:373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang (1979)Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109; Beaucage(1981) Tetra. Lett. 22:1859; a patente U.S. n9 4.458.066.
Técnicas para a manipulação de ácidos nucléicos, tais como, por
exemplo, subclonagem, sondas de marcação (por exemplo, marcação deiniciador aleatório usando-se polimerase de Klenow, tradução de corte,ampliação), seqüenciação, hibridização e similares são bem-descritos naliteratura de patente e específica, ver, por exemplo, Sambrook, ed.,
MOLECULAR CLONAGEM: A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, (1989); CURRENT PROTOCOLS INMOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., New York(1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY E MOLECULARBIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Parte I.
Theory e Ácido núcleico Preparation, Tijssen, ed. Elsevier, N. Y. (1993).
Um outro meio útil de obtenção e manipulação de ácidosnucléicos usados para praticar os métodos da invenção é clonar para formaramostras genômicas, e, se desejado, triar e reclonar insertos isolados ouampliados de, por exemplo, clones genômicos ou clones de cDNA.
Fontes de ácido núcleico usadas nos métodos da invenção
incluem bibliotecas genômicas ou de cDNA continham em, por exemplo,cromossomas artificial de mamífero (MACs),` ver, por exemplo, nas patentesU.S. nõs 5.721.118; 6.025.155; cromossomas artificiais, ver, por exemplo,Rosenfeld (1997) Nat. Genet. 15:333-335; cromossomas artificiais delevedura (YAC); cromossomas artificiais bacterianos (BAC); cromossomasartificiais de PI, ver, por exemplo, Woon (1998) Genomics 50:306-316; vetores derivados de PI (PACs), ver, por exemplo, Kern (1997)Biotechniques 23:120- 124; cosmídios, vírus recombinantes, fagos ouplasmídios.
Em um aspecto, um ácido núcleico que codifica um polipeptídeoda invenção é montado em fase apropriada com uma seqüência líder capaz de dirigir secreção do polipeptídeo traduzido ou seu fragmento.
A invenção prove fusão de proteínas e ácidos nucléicos quecodificam-os. Um polipeptídeo da invenção pode ser fundido a umpolipeptídeo ou peptídeo heterólogo, tais como peptídeos de identificação N-terminais que provêem características desejadas, tal como estabilidade aumentada ou purificação simplificada. Peptídeos e polipeptídeos dainvenção podem também ser sintetizados ou expressos como proteínas defusão com um ou mais domínios adicionais ligados aos mesmos por, porexemplo, produção de um peptídeo mais imunogênico, para isolar maisprontamente um peptídeo recombinantemente sintetizado, para identificar e isolar anticorpos e células B de expressão de anticorpo, e similares.Detecção e purificação que facilitam domínios incluem, por exemplo,peptídeos de quelação de metal tais como tratos de poliistidina e módulos dehistidina-triptofano que permitem purificação em metais imobilizados,domínios de proteína A que permitem purificação e imonoglobulinaimobilizada, o domínio utilizado no sistema de purificação porafinidade/extensão de FLAGS (Immunex Corp, Seattle WA). A inclusão deseqüências ligantes cliváveis tal como Fator Xa ou enterocinase (Invitrogen,San Diego CA) entre um domínio de purificação e o peptídeo ou polipeptídeocompreendendo motivo para facilitar a purificação. Por exemplo, um vetor de expessão pode incluir uma seqüência de ácidos núcleicos de codificaçãoepitopo ligada a seis resíduos de histidina seguido por uma tioredoxina e umsítio de clivagem de enterocinase (ver, por exemplo, Williams (1995)Biochemistry 34:1787-1797; Dobeli (1998) Proteína Expr. Purif. 12:404-414).Os resíduos de histidina facilitam direção e purificação enquanto o sítio declivagem de enterocinase prove um meio para a purificação de epitopo dorestante da proteína de fusão. A tecnologia que pertence a vetores que
codificam proteínas de fusão e aplicação de proteínas de fusão são bem-descritos na literatura de patente e científica, ver, por exemplo, Kroll (1993)DNA Cell. Biol., 12:441-53.
Seqüências de controle transcritivas e de tradução.
A invenção prove ácido núcleico (por exemplo, DNA) das
seqüências da invenção operavelmente ligadas a expessão (por exemplo,seqüência(s) de controle transcritivas ou de tradução, por exemplo,promotores ou aumentadores, para dirigir ou modular expressão/síntese deRNA. A seqüência de controle de expressão pode ser um vetor deexpressão. Promotores bacterianos exemplares incluem lacl, lacZ, T3, T7,
gpt, lambda PR, PL e tip. Promotores eucarióticos exemplares incluem CMVprecoce imediato, HSV timidina cinase, SV40 tardio ou precoce, LTRsoriundo de retrovírus, e metalotioneína I de camundongo.
Como usados aqui, o termo "promotor" inclui todas asseqüências capazes de dirigir transcrição da seqüência de codificação em
uma célula, por exemplo, uma célula de planta ou de animal. Assim,promotores usados nos construtos da invenção incluem elementos decontrole transcritivos de ação de eis e seqüências reguladoras que estãoenvolvidos na regulação ou modulação do timing e/ou da taxa de transcriçãode um gene. Por exemplo, um promotor pode ser um elemento de controle
transcritivo de ação de eis, incluindo um aumentador, um promotor, umterminador de transcrição, uma origem de replicação, uma seqüência deintegração cromossomal, regiões não traduzidas 5' e 3', ou uma seqüênciaintrônica, que estão envolvidas na regulação transcritiva. Essas seqüênciasde ação eis podem interagir com proteínas ou outras biomolécular para
realizar trasnerição (acionar/impedir, regular, modular, etc). Promotores"constitutivos" são aqueles que dirigem expessão continuamente sob amaioria das condições ambientais e estados de desenvolvimento oudiferenciação celular. Promotores "induzíveis" ou "reguláveis" dirigemexpessão do ácido núcleico da invenção sob a influência das condiçõesambientais ou condições em desenvolvimento. Exemplos de condiçõesambientais que podem afetar transcrição por promotores induzíveis incluem condições anaeróbicas, temperaturas elevadas, secas, ou a presença de luz.
Promotores "específicos de tecido" são elementos de controletranscritivos que são apenas ativos em células ou tecidos ou órgãosparticulares, por exemplo, em plantas ou animais. Regulação específica detecido pode ser alcançada por certos fatores intrínsicos que assegram fatores que asseguram que genes que codificam proteínas específicas a umdado tecido são expressos. Tais fatores são conhecidos como existindo emmamífero e plantas de modo a permitir que tecidos específicos sedesenvolvam.
Promotores adequados para a expressão de um polipeptídeo em
bactérias incluem os promotores de lac ou tip de E. coli, o promotor de lacl, opromotor de lacZ promotor, o promotor de T3, o promotor de T7, o promotorde gpt, o promotor de lambda PR, o promotor de lambda PL, promotoresoriundos de óperons que codificam enzimas glicolíticas tais como cinase de3-fosfoglicerato (PGK), e o promotor de fosfatase ácida. Promotores
eucarióticos incluem o promotor precoce imediato de CMV, o promotor decinase de timidina de HSV, promotores de choque térmico, o promotor deSV40 precoce e tardio, LTRs oriundo de retrovírus, e o promotor demetalotioneína-l de camundongo.
Outros promotores conhecidos como controlando expessão de
genes em células procarióticas ou eucarióticas ou seus vírus podem tambémser usados. Promotores adequados para a expressão do polipeptídeo ou seufragmento em bactérias incluem os promotores de lac ou trp de E. coli, opromotor de lacl, o promotor de lacZ, o promotor de T3, o promotor de T7, opromotor de gpt, o promotor lambda PR, o promotor de lambda PL,
promotores oriundos de óperons que codificam enzimas glicolíticas tal comocinase de 3-fosfoglicerato (PGK) e promotor de fosfatase ácida. Promotoresfúngicos incluem o promotor de fator alfa. Promotores eucarióticos incluem opromotor precoce imediato de CMV, o promotor de cinase de timidina deHSV, promotores de choque térmico, o promotor de SV40 precoce e tardio,LTRs oriundos retrovírus e o promotor de metalotioneína-l de camundongo.Outros promotores conhecidos como controlando expressão de genes em células procarióticas ou eucarióticas ou seus vírus podem também serusados.
Promotores de planta específicos de tecidoA invenção prove cassetes de expressão que podem serexpressos de um modo específico de tecido, por exemplo, que podem expressar uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase da invenção de um modoespecífico de tecido. A invenção também prove plantas ou sementes queexpressam uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase da invenção de um modo específico de tecido. A especificidade de tecido pode ser específica desemente, específica de tronco, específica de folha, específica de raiz,específica de fruta e similares.
O termo "planta" inclui plantas inteiras, partes de planta (porexemplo, folhas, troncos, flores, raízes, etc), protoplastos de planta, sementes e células de planta e progênie de mesma. A classe de plantas quepodem ser usadas no método da invenção é em geral tão ampla quanto umaclasse de plantas superiores receptíveis a técnicas de transconstrução,incluindo angiospermas (plantas monocotiledôneas e dicotiledôneas), bemcomo gimnospermas. Ele inclui plantas de uma variedade de níveis plóides, incluindo estados poliplóides, diplóides, haplóides e hemizigósticos. Comousado aqui, o termo "planta transgênica" inclui plantas ou células de plantaem que uma seqüência de ácidos nucléicos heteróloga foi inserida, porexemplo, os ácidos nucléicos e vários construtos recombinantes (porexemplo, cassetes de expressão) da invenção.
Em um aspecto, um promotor constitutivo tal como o promotor deCaMV 35S pode ser usado para a expressão em partes específicas daplanta ou semente ou através de toda a planta. Por exemplo, para ultra-expressão, um fragmento de promotor de planta pode ser empregado quedirigirá expressão de um ácido nucléico em alguns ou as totalidades detecidos da planta, por exemplo, uma planta regenerada. Tais promotores sãochamados aqui de promotores "constitutivos" e são ativos sob a maioria das condições ambientais e estados de desenvolvimento ou diferenciaçãocelular. Exemplos promotores constitutivos incluem a região de iniciação detranscrição de 35S de vírus de mosaico de couve-flor (CaMV) 35S, opromotor 1' ou 2' derivado de T-DNA de Agrobacterim tumefaciens, e outrasregiões de iniciação de transcrição oriundas de vários genes de planta
conhecidos por aqueles versados. Tais genes incluem, por exemplo, ACT11oriundo de Arabidopsis (Huang (1996) Planta Mol Biol. 33:125-139); Cat3oriundo de Arabidopsis (GenBank n9 U43147, Zhong (1996) Mol Gen. Genet.251:196-203); o gene que codifica denaturase de proteína veículo de acilade estearoíla oriundo de Brassica napus (Genbank n9 X74782, Solocombe
(1994) Plant Physiol. 104:1167-1176); GPc1 oriundo de milho (GenBankNo.X15596; Martinez (1989) J. Mol. Biol 208:551-565); o Gpc2 oriundo de milho(GenBank n9 U45855, Manjunath (1997) Plant Mol. Biol. 33:97-112);promotores de planta descritos nas patentes U.S. n9s 4.962.028; 5.633.440.
A invenção usa promotores constitutivos ou específicos de tecido
derivados de vírus que podem incluir, por exemplo, o promotor subgenômicotobamovírus (Kumagai (1995) Proc. Natl. Acad. Sei. USA 92:1679-1683; ovírus de tungro bacilliform (RTBV), que se replica apenas nas células dofloema, em plantas de arroz infectadas, com seu promotor que dirige forteexpressão de gene repórter específico de Floema; o promotor de vírus de
mosaico de nervura mandioca (CVMV), com atividade mais alta emelementos vasculares, em células de mesofilia de folha, e em extremidadesde raiz (Verdaguer (1996) Plant Mol. Biol. 31:1129-1139).
Em um aspecto, o promotor de planta dirige expressão decelulase, por exemplo, ácido nucléico de expressão de enzima de expressão
de endoglucanase, celobioidrolase, manase e/ou betaglicosidase em um tipotecido, órgão ou célula específico (isto é, promotores específicos de tecido)ou pode ser de outro modo sob ambiente mais preciso ou controle emdesenvolvimento ou sob o controle de um promotor induzível. Exemplos decondições ambientais que podem afetar transcrição incluem condiçõesanaeróbicas, temperatura elevada, a presença de luz, ou borrifadas comprodutos químicos/hormônios. Por exemplo, a invenção incorpora o promotor induzível seco de milho (Busk (1997) supra); o promotor induzível de altoteor de sal, seco e frio oriundo de batata (Kirch (1997) Plant Mol. Biol. 33:897909).
Em um aspecto, promotores específicos de tecido promovemtranscrição apenas dentro de um certa quadro de tempo de estágio
ambiental dentro daquele tecido. Ver, por exemplo, Blazquez (1998) PlantCell 10:791-800, caracterização de promotor de gene de ArabidopsisLEAFY. Ver também Cardon (1997) Plant J 12:367-77, descrição do fator detranscrição SPL3, que reconhece um motivo de seqüência conservada naregião de promotor do gene de identidade floral de meristema A. thaliana
AP1; and Mandei (1995) Planta Molecular Biology, Vol. 29, pp 995-1004,descrição de promotor de meristema elF4. Os promotores específicos detecido que são ativos através de todo ciclo de vida de um tecido particularpode ser usado. Em um aspecto, os ácidos nucléicos da invenção sãooperavelmente ligados a um promotor principalmente ativo apenas em
células de fibra de algodão. Em um aspecto, os ácidos nucléicos dainvenção são operavelmente ligados a um promotor principalmente ativodurante os estágios de alongamento de célula de fibra de algodão, porexemplo, como descrito por Rinehart (1996) supra. Os ácidos nucléicospodem ser operavelmente ligados ao promotor de gene de Fbl2A a serem de
preferência expressos em células de fibra de algodão (Ibid) . Ver também,John (1997) Proc. Natl. Acad. Sei. USA 89:5769-5773; John, e outros, aspatentes U.S. nes 5.608.148 and 5.602.321, descrevendo promotoresespecíficos de fibra de algodão e métodos para a construção de plantas dealgodão transgênicas. Promotores específicos de raiz podem também ser
usados para expressar os ácidos nucléicos da invenção. Exemplospromotores específicos de raiz incluem o promotor oriundo do gene dedesidrogenase de álcool (DeLisle (1990) Int. Rev. Cytol. 123:39-60). Outrospromotores que podem ser usado para expressar os ácidos nucléicos dainvenção incluem, por exemplo, promotores específicos de óvulo,específicos de embrião, específicos de endosperma, específicos deinvólucro, específicos de revestimento de semente, ou alguma sua combinação; um promotor específico de folha (ver, por exemplo, Busk (1997)Plant J. 11:1285 1295, descrição de um promotor específico de folha emmilho); o promotor de ORF1 oriundo de Agrohacterium rhizogenes (queexibe alta atividade em raízes, ver, por exemplo, Hansen (1997) supra); umpromotor específico de pólen de milho (ver, por exemplo, Guerrero (1990)
Mol. Gen. Genet. 224:161 168); um promotor de tomate ativo durante oamadurecimento de fruta, evelhecimento e absissão de folhas e, em umaextensão menor, de flores pode ser usado (ver, por exemplo, Blume (1997)Plant J. 12:731 746); um promotor específico de pestílio oriundo do gene deSK2 de batata (ver, por exemplo, Ficker (1997) Plant Mol. Biol. 35:425 431);
o gene de Blec4 oriundo de ervilha, que é ativo no tecido epidérmico de apexde broto vegetativo e floral de alfafa transgência produzindo-o umaferramenta útil para direcionar a expressão de genes estranhos para acamada epidérmica de fibras ou brotos em desenvolvimento ativo para acamada epidérmica de fibras ou broto em desenvolvimento ativo; o gene de
BEL1 específico de óvulo (ver, por exemplo, Reiser (1995) cell 83:735-742,GenBank ne U39944); e/ou, o promotor em Klee, a patente U.S. n55.589.583, descrevendo uma planta região de promotor que é capaz deconferir altos níveis de transcrição em células de divisão rápida e/ou tecidomeristemático.
Em um aspecto, promotores de planta que são induzíveis na
exposição a hormônios de planta, tais como auxins, são usados paraexpressar os ácidos nucléicos da invenção. Por exemplo, a invenção podeusar o fragmento de promotor de E1 de elementos de resposta de auxina(AuxREs) na soja (Glycine max L.) (Liu (1997) Plant Physiol. 115:397-407); o
promotor de GST6 de Arabidopsis responsável de auxina (tambémresponsável por ácido salicílico e peróxido de hidrogênio) (Chen (1996) PlantJ. 10: 955-966); o promotor de parC induzível por auxina oriundo de tobaco(Sakai (1996) 37:906-913); um elemento de resposta de biotina de planta(Streit (1997) Mol. Plant Microbe Interact. 10:933-937); e, o promotorresponsável pelo ácido abscísico de hormônio de tensão (Sheen (1996)Science 274:1900-1902).
Os ácidos nucléicos da invenção podem também seroperavelmente ligados a promotores de planta que são induzíveis naexposição a reagentes químicos que podem ser aplicados à planta, taiscomo herbicidas ou antibióticos. Por exemplo, o promotor de ln2-2 de milho,ativado por antídotos de herbicida de benzenossulfonamida, pode ser usado (De Veylder (1997) Plant Cell Physiol. 38:568-577); aplicação de antídotosde herbicida diferentes induz padrões de expressão de gene, incluindoexpressão na raiz, hidatóides, e o meristema apical de broto. Seqüência decodificação pode estar sob o controle de, por exemplo, um promotorinduzível por tetraciclina, por exemplo, como descrito com plantas de tabacotransgência contendo o gene de descarboxilase de arginina de Avena sativaL. (aveia) (1997) Plant J. 11:465-473); ou, um elemento responsável porácido salicíclico (Stange (1997) Plant J. 11:1315-1324). Usando-sepromotores induzidos quimicamente por (por exemplo, hormônio oupesticida, isto é, promotor responsável por um produto químico o qual pode ser aplicado à planta trangênica no campo, expressão de um polipeptídeo daiv pode ser induzida a um estágio particular de desenvolvimento da planta.Assim, a invenção também prove plantas transgênicas contendo um geneinduzível que codifica polipeptídeos da invenção cuja faixa de hospedeiro élimitada a espécie de planta alvo, tais como colheitas de milho, arroz, cevada, soja, tomate, trigo, batata ou outras colheitas, induzíveis emqualquer estágio de desenvolvimento da colheita.
Aquele versado reconhece que um promotor de planta específicode tecido pode dirigir expressão de seqüências operavelmente ligadas é umque dirige expressão de preferência no tipo de célula ou tecido alvo, mastambém leva também a alguma expressão em outros tecidos.
Ácidos nucléicos da invenção podem também ser operavelmenteligados a promotores de planta que são induzíveis na exposição a reagentesquímicos. Estes reagentes incluem, por exemplo, herbicidas, auxinassintéticas, ou antibióticos que podem ser aplicados, por exemplo, borrifados,sobre plantas transgênicas. Expressão induzível da celulase, por exemplo,ácidos nucléicos de produção de enzima de endoglucanase, celobioidrolase,
manase e/ou betaglicosidase da invenção permitirá o cultivador selecionarplantas com a ótima celulase, por exemplo, expressão e/ou atividade deenzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase. Odesenvolvimento de partes de planta pode assim ser controlado. Destemodo a invenção prove o meio para facilitar a coleta de plantas e partes de planta. Por exemplo, em várias concretizações, o promotor de ln-2 de milho,ativiado por antídotos de herbicida de benzenossulfonamida, é usado (DeVeylder (1997) Plant Cell Physiol. 38:568-577); aplicação de diferentesantídotos de herbicida induz padrões de expressão de gene distintos,incluindo expressão na raiz, hidatóides, e meristema aplicai de broto.
Seqüências de codificação da invenção estão também sob o controle de umpromotor induzível por tetraciclina, por exemplo, como descrito com plantasde tabaco transgênicas contendo o gene de descarboxilase de arginina deAvena sativa L (aveia) (Masgrau (1997) Plant J. 11 :465-473); ou, umelemento responsável por ácido salicíclico (Stange (1997) Plant J. 11 :1315-
1324).
Em alguns aspectos, expressão de polipeptídeo adequada podeexigir região de poliadenilação na extremidade 3' da região de codificação. Aregião de poliadenilação pode ser derivada do gene natural, de umavariedade de outros genes de planta (ou animal ou outro), ou de genes no T- DNA Agrobacterial.
Vetores de expressão e veículos de clonagemA invenção prove vetores de expressão e veículos de clonagemcompreendendo ácidos nucléicos, por exemplo, seqüências que codificamcelulase, por exemplo, enzimas de endoglucanase, celobioidrolase, manase e/ou betaglicosidase da invenção. Vetores de expressão e veículos declonagem da invenção podem compreender partículas virais, baculovírus,fago, plasmídios, fagomídeos, cosmidios, fosmídios, cromossoma artificialbacteriano, DNA viral (por exemplo, vacínia, adenovírus, vírus de epiteliomacontagioso, pseudo-raiva e derivados de SV40), cromossomas artificiais combase em P1, plasmídios de levedura, cromossomas artificiais de levedura, eoutros vetores específicos para hospedeiros específicos de interesse (tais como bacillus, Aspergillus e levedura). Vetores da invenção podem incluirseqüências de DNA sintéticas, cromossomais e não cromossomais.Números grandes de vetores adequados são conhecidos por aquelesversados na técnica, e estão comercialmente disponíveis. Vetoresexemplares incluem: bacterianos: vetores de pQE® (Qiagen), plasmídios de
pBLUESCRIPT®, vetores de pNH, vetores de (lambda-ZAP (Stratagene);ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); Eucariótica: pXT1, pSG5(Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). No entanto,qualquer plasmídio ou outro vetor pode ser usado contanto que eles sejamreplicáveis e viáveis no hospedeiro. Vetores de baixo número de cópias ou
de alto número de cópias podem ser empregados com â presente invenção."Plasmídios" podem estar comercialmente disponívies, publicamentedisponíveis em uma base não restrita, ou podem ser construídos a partir deplasmídios disponíveis de acordo com os procedimentos publicados.Plasmídios equivalentes àqueles descritos aqui são conhecidos na técnica e
estarão evidentes pelo técnico normalmente versado.
O vetor de expressão pode compreender um promotor, um sítiode ligação de ribossoma para a iniciação de tradução e um terminador detranscrição. O vetor pode também incluir seqüências apropriadas paraampliação • de expressão. Vetores de expressão de mamífero podem
compreender uma origem de replicação, quaisquer sítios de ligação deribossoma necessários, um sítio de poliadenilação, sítios aceitantes oudoadores de união, seqüências de terminação transcritivas, e seqüênciasnão transcritas de flaqueamento 5'. Em alguns aspectos, seqüências deDNA derivadas da união de SV40 e sítios de poliadenilação podem ser
usados para prover os elementos genéticos não transcritos necessários.
Em um aspecto, os vetores de expresão contêm um ou maisgenes marcadores selecionáveis para permitir seleção de célulashospedeiras que codificam genes ou redutase de diidrofolato que conferemresistência a cultura de célula eucariótica, genes que conferem resistência atetraciclina ou ampicilina em gene de TRP1 de S. cerevisiae e E. coli.Regiões de promotor podem ser selecionadas de qualquer gene desejado ' usando-se vetores de transferase de cloranfenicol (CAT) ou outros vetorescom marcadores selecionáveis. Em um aspecto, vetores para a expressão do polipeptídeo ouseu fragmento nas células eucarióticas contêm aumentadores paraaumentar níveis de expressão. Aumentadores são elementos de ação de eis de DNA que podem ser encontrados de cerca de 10 a cerca de 300pb decomprimento. Eles podem agir sobre um promotor para aumentar suatranscrição. Aumentadores exemplares incluem o aumentador de SV40 nolado próximo do fim da origem de replicação depb 100 a 270, o aumentadorde promotor precoce de citomegalovírus, o aumentador de polioma no lado próxima de fim da origem de replicação, e os aumentadores de adenovírus. Uma seqüência de ácidos nucléicos pode ser inserida em umvetor por uma variedade de procedimentos. Em geral, a seqüência é ligada àposição desejada no vetor após a digestão do inserto e do vetor comendonucleases apropriadas. Alternativamente, extremidades abruptas tanto no inserto quanto no vetor podem ser ligadas. Uma variedade de técnicas declonagem são conhecidas na técnica, por exemplo, como descritas emSambrook. Tais procedimentos e outros são considerados estarem dentro doescopo daqueles versados na técnica. O vetor pode estar na forma de um plasmídio, uma partícula viral ou um fago. Outros vetores incluem seqüências de DNA cromossomais, nãocromossomais e sintéticas, derivados de SV40; plasmídios bacterianos, DNAde fago, baculovírus, plasmídios de levedura, vetores derivados decombinações de plasmídio e DNA de fago, DNA viral tais como vacínia,adenovírus, vírus de epitelioma contagioso, pseudo-raiva. Uma variedade de clonagem e vetores de expressão para o uso com hospedeiros procarioticose eucarióticos são descritos por, por exemplo, Sambrook. Vetores bacterianos particulares que podem ser usados incluemplasmídios comercialmente disponíveis compreendendo elementosgenéticos do vetor de clonagem bem-conhecido pBR322 (ATCC 37017),pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Sweden), Gemi (PromegaBiotec, Madison, Wl, USA) pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174 pBLUESCRIPT II KS, pNH8A, pNH16a, pNHI 8A, pNH46A (Stratagene),ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8 epCM7. Vetores eucarióticos particulares incluem pSV2CAT, pOG44, pXT1,pSG (Stratagene) pSVK3, pBPV, pMSG, e pSVL (Pharmacia). No entanto,qualquer outro vetor pode ser usado contanto que ele seja replicável e viável na célula hospedeira.
Os ácidos nucléicos da invenção podem ser expressos emcassetes de expressão, vetores ou vírus e expressos transitório ouestavelmente em sementes e células de planta. Um sistema de expressãotransitório exemplar usa sistemas de expressão epissomal, por exemplo, RNA viral de vírus de mosaico de couve-flor (CaMV) gerado no núcleo detranscrição de um minicromossoma epissomal contendo DNA super-enrolado, ver, por exemplo, Covey (1990) Proc. Natl. Acad. Sei. USA87:1633-1637. Alternativamente, seqüências de codificação, isto é, atotalidade ou subfragmentos de seqüências da invenção podem serinseridos para dentro de um genoma de célula hospedeira de planta setornando uma parte integral do DNA cromossomal de hospedeiro.Transcritos de sentido ou anti-sentido podem ser expressos desta maneira.Um vetor compreendendo as seqüências (por exemplo, promotores ouregiões decodificação) de ácido nucléicos da invenção podem compreender um gene marcador que confere um fenótipo selecionável em uma sementeou célula de planta. Por exemplo, o marcador pode codificar resistência abiocida, por exemplo, resistência a antibiótico, tal como resistência acanamicina, G418, bleomicina, higromicina ou resistência a herbicida, talcomo resistência a clorossulfuron ou Basta.
Vetores de expressão capazes de expressar ácidos nucléicos eproteína em plantas são bem-conhecidos na técnica, e podem incluir, porexemplo, vetores oriundos de Agrobacterium spp., vírus X de batata (ver, porexemplo, Angell (1997) EMBO J. 16:3675-3684), vírus de mosaico de tabaco(ver, por exemplo, Casper (1996) Gene 173:69-73), vírus de enfezamentovermelho de tomate (ver, por exemplo, Hillman (1989) Virology 169:42-50),vírus etch do tabaco (ver, por exemplo, Dolja (1997) Virology 234:243-252), vírus de mosaico dourado do feijoeiro (ver, por exemplo, Morinaga (1993)Microbiol Immunol. 37:471-476), vírus de mosaico de couve-flor (ver, porexemplo, Cecchini (1997) Mol. Plant Microbe Interact. 10:1094-1101),elemento transportável de Ac/Ds de milho (ver, por exemplo, Rubin (1997)Mol. Cell. Biol. 17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194), e elemento transportável mutador-supressor de milho (Spm)(ver, por exemplo, Schlappi (1996) Plant Mol. Biol. 32:717-725); e seusderivados.
Em um aspecto, o vetor de expressão pode ter dois sistemas dereplicação para permitir que ele seja mantido em dois organismos, por exemplo, em células de mamífero ou de inseto para a expressão e em umhospedeiro procariótico para clonagem e ampliação. Além do mais, vetoresde expressão de integração, o vetor de expressão pode conter pelo menosuma seqüência homóloga ao genoma de célula hospedeira. Ele pode conterduas seqüências homólogas que flanqueiam o construto de expressão. O vetor de integração pode ser dirigido para um local específico na célulahospedeira por seleção da seqüência homóloga apropriada para a inclusãono vetor. Construtos para integração de vetores são bem-conhecidos natécnica.
Vetores de expressão da invenção podem também incluir um gene marcador selecionavel para permitir a seleção de cepas bacterianasque foram transformadas, por exemplo, genes que tornam as bactériasresistentes a fármacos tais como ampicilina, clorofenical, eritromicina,canamicina, neomicina e tetraciclina. Marcadores adequados podemtambém incluir genes biossintéticos, tais como aqueles nas trajetórias biossintéticas de histidina, triptofano e leucina.
A seqüência de DNA no vetor de expressão é operavelmenteligada a um promotor de seqüência(s) de controle de expressão apropriadopara dirigir síntese de RNA. Promotores bacterianos particularmentechamados incluem laCI, lacZ, T3, T1, gpt, lambda Pr, Pl e trp. Promotoreseucarióticos incluem CMV precoce imediato, cinase de timidina de HSV,SV40, LTRs tardio ou precoce oriundos de retrovírus e metalotioneína-l de camundongo. Seleção do vetor e promotor apropriado está bem dentro donível de habilidade normal na técnica. O vetor de expressão também contémum sítio de ligação de ribossoma para iniciação de tradução e um terminadorde transcrição. O vetor pode também incluir seqüências apropriadas para aampliação de expressão. Regiões de promotor podem ser selecionadas de
10 qualquer gene desejado usando-se vetores de transferase de clorofenicol(CAT) ou outros vetores com marcadores selecionáveis. Além disso, osvetores de expressão em um aspecto contém um ou mais genes demarcador selecionáveis para prover uma característica fenotípica paraseleção de células hospedeiras transformadas tal como redutase de
diidrofolato ou resistência a neomicina para cultura de célula eucariótica, outal como resistência a tetraciclina ou ampicilina em E. coli.
Vetores de expressão de mamífero podem tambémcompreender uma origem de replicação, quaisquer sítios de ligação deribossoma necessários, um sítio de poliadenilação, sítios aceitantes ou
doadores de união, seqüências de terminação transcritivas e seqüências nãotranscritas de flanqueamento de 5'. Em alguns aspectos, seqüências deDNA derivadas dos sítios de poliadenilação e união de SV40 podem serusados para prover elementos genéticos não transcritos exigidos.
Vetores para a expressão do polipeptídeo ou seu fragmento em
células eucarióticas podem também conter aumentadores para aumentarníveis de expressão. Aumentadores são elementos de ação eis de DNA,usualmente de cerca de 10 a cerca de 300pb de comprimento que agemsobre um promotor para aumentar sua transcrição. Exemplos incluem oaumentador de SV40 no lado próximo do fim da origem de replicação depb
100 a 270, o aumentador de promotor precoce de citomegalovírus, oaumentador de polioma no lado próximo do fim da origem de replicação e osaumentadores de adenovírus.Além disso, os vetores de expressão podem conter um ou maisgenes de marcador selecionáveis para permitir seleção de célulashospedeiras contendo o vetor. Tais marcadores selecionáveis incluem genesque codificam redutase de diidrofolato ou genes que conferem resistência a neomicina para cultura de célula eucariótica, genes que conferem resistênciaa tetraciclina ou ampicilina em gene de TRP1 de S. cerevisiae ou E. coli.
Em alguns aspectos, o ácido nucléico que codifica um dospolipeptídeos da invenção, ou fragmentos compreendendo pelo menos cercade 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 ou mais seusaminoácidos consecutivos é montado em fase apropriada com umaseqüência líder capaz de dirigir secreção de um polipeptídeo traduzido ouseu fragmento. Em um aspecto, o ácido nucléico pode codificar umpolipeptídeo de fusão em que um dos polipeptídeos da invenção, oufragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75,100, ou 150 ou mais seus aminoácidos consecutivos é fundido apolipeptídeos ou peptídeos heteróíogos, tais como peptídeos de identificaçãoN-terminais que provêem características desejadas, tal como umaestabilidade aumentada ou purificação simplificado.
A seqüência de DNA apropriada pode ser inserida para dentrodo vetor por uma variedade de procedimentos. Em geral, a seqüência deDNA é ligado à posição desejada no vetor após digestão do inserto e o vetorcom endonucleases de restrição apropriadas. Alternativamente,extremidades abruptas tanto no inserto quanto no vetor podem ser ligadas.Uma variedade de técnicas de clonagem são reveladas em Ausubel e outrosCurrent Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997 andSambrook e outros, Molecular Cloning: A Laboratory Manual 2nd Ed., ColdSpring Harbor Laboratory Press (1989. Tais procedimentos e outros sãojulgados estarem dentro do escopo daqueles versados na técnica.
O vetor pode ser, por exemplo, na forma de um plasmídio, umapartícula viral, ou um fago. Outros vetores incluem seqüências de DNAcromossomais, não cromossomais e sintéticas, derivados de SV40;plasmídios bacterianos, DNA de fago, baculovírus, plasmídios de levedura,vetores derivados de combinações de plasmídios e DNA de fago, DNA viraltais como vacínia, adenovírus, vírus de epitelioma contagioso e pseudo-raiva. Uma variedade vetores de expressão e clonagem para o uso comhospedeiros procarióticos e eucarióticos são descritos por Sambrook, e outros, Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold SpringHarbor, N.Y., (1989).
Células hospedeiras e células transformadasA invenção também prove uma célula transformadacompreendendo uma seqüência de ácidos nucléicos da invenção, por
exemplo, uma seqüência que codifica uma celulase, por exemplo, enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase da invenção.A célula hospedeira pode ser qualquer uma das células hospedeirasfamiliares àqueles versados na técnica, incluindo células procarióticas,células eucarióticas, tais como células bacterianas, células fúngicas, células
de levedura, células de mamífero, células de inseto ou células de planta.Células bacterianas exemplares incluem qualquer espécie de Streptomycis,staphylococcus ou Bacillus, ou as espécies exemplares E. coli, Bacillus subtilis, Bacillus cereus, Salmonella ty phimurium Células bacterianasexemplares incluem qualquer espécie de Spodoptera ou Drosophila,
incluindo Drosophila S2 e Spodoptera Sf9. Células animais exemplaresincluem CHO, COS ou melanoma de Bowes ou qualquer linha de célulahumana ou de camundongo. A seleção de um hospedeiro apropriado estádentro das capacidades daqueles versados na técnica. Técnicas para atransconstrução de uma ampla variedade de espécie de planta superior são
conhecidas e descritas na literatura técnica e científica. Ver, por exemplo, ,Weising (1988) Ann. Rev. Genet. 22:421-477; a patente U.S. ne 5.750.870.
O vetor pode ser introduzido para dentro das célulashospedeiros usando-se qualquer de uma variedade de técnicas, incluindotranconstrução, transfecção, transduçao, infecção viral, pistola de gene ou
transferência de gene mediada por Ti. Métodos particulares incluemtransfecção de fosfato de cálcio, transfecção mediada por DEAE-Dextrano,lipofecção ou eletroporação (Davis, L, Dibner, M., Battey, L, Basic Methodsin Molecular Biology, (1986)).
Em um aspecto, os ácido nucléicos ou vetores da invenção sãointroduzidos para dentro das células para triagem, assim, os ácidosnucléicos entram nas células de um modo adequado para expressão
1 subseqüente do ácido nucléico. O método de introdução é grandementeditado pelo tipo de célula direcionado. Métodos exemplares incluemprecipitação de CaP04, fusão de lipossoma, lipofecção (por exemplo,LIPOFECTIN®), eletroporação, infecção viral etc. Os ácidos nucléicoscandidatos podem estavelmente se integrar no genoma da célula hospedeira
(por exemplo, com introdução retroviral) ou podem existir ou transitória ouestavelmente no citoplasma (isto é, através do uso de plasmídiostraducionais, utilizando-se seqüências reguladoras padrão, marcadores deseleção, etc). Como triagens farmaceuticamente importantes exigem alvosde célula de mamífero de modelo ou seres humanos, vetores retrovirais
capazes de transfectar tais alvos podem ser usados.
Quando apropriado, as células hospedeiras engenheiradaspodem ser cultivadas em meios de nutriente convencionais quandoapropriados para ativação de promotores, seleção de transformantes ouampliação dos genes da invenção. Após a transconstrução de uma cepa
hospedeira adequada e crescimento da cepa de hospedeiro para umadensidade de célula apropriada, o promotor selecionado pode ser induzidopor meio apropriado (por exemplo, deslocamento de temperatura ou induçãoquímica) e as células podem ser cultivadas por um período adicional parapermitir que elas produzam o polipeptídeo desejado ou seu fragmento.
Células podem ser coletadas por centrifugação, rompidas por
meio físico ou químico, e o extrato bruto resultante para outra purificação.Células microbianas empregadas para expressão de proteínas podem serrompidas por qualquer método conveniente, incluindo ciclização decongelamento-descongelamento, sonicação, rompimento mecânico ou uso
de agentes de lise de célula. Tais métodos são bem-conhecidos por aquelesversados na técnica. O polipeptídeo expresso ou seu fragmento pode serrecuperado e purificado a partir de culturas de células recombinantes pormétodos incluindo precipitação de etanol ou sulfato de amônio, extração deácido, cromatografia de troca de cátions ou ânions, cromatografia defosfocelulose, cromatografia de interação hidrofóbica, cromatografia porafinidade, cromatografia de hidroxilpatita e cromatografia de lectina. Etapas de redobramento de proteína podem ser usadas, quando necessário, naconfiguração de terminação do polipeptídeo. Se desejado, cromatografia delíquida de alto desempenho (HPLC) pode ser empregada para etapas depurificação finais.
Os construtos em células hospedeiros podem ser usados de um modo convencional para produzir o produto de gene codificado pelaseqüência recombinante. Dependendo do hospedeiro empregado em umprocedimento de produção recombinante, os polipeptídeos produzidos porcélula hospedeiras contendo o vetor podem ser glicosilados ou podem sernão glicosilados. Polipeptídeos da invenção podem ou não podem incluir um resíduo de aminoácido de metionina inicial.
Sistemas de tradução livres de célula podem também serempregados para produzir um polipeptídeo da invenção. Sistemas detradução livres de célula podem usar mRNAs transcritos de um construto deDNA compreendendo um promotor operavelmente ligado a um ácidonucléico que codifica o polipeptídeo ou seu fragmento. Em alguns aspectos,o construto de DNA pode ser linearizado antes da condução de uma reaçãode transcrição in vitro. O mRNA transcrito é então incubado com um extratode tradução livre de célula apropriado, tal como extrato de reticulócito decoelho, para produzir o polipeptídeo desejado ou seu fragmento.
Os vetores de expressão podem conter um ou mais genes demarcador selecionáveis para prover uma característica fenotípica paraseleção de células hospedeiras transformadas tal como redutase dediidrofolato ou resistência a neomicina para cultura de célula eucariótica, talcomo resistência a tetraciclina ou ampicilina em E. coli.
Células hospedeiras contendo polinucleotídeos de interesse, porexemplo, ácidos nucleicos da invenção, podem ser cultivadas em meio denutriente convencional modificado como apropriado para ativação depromotores, seleção de transformantes ou ampliação de genes. Ascondições de cultura, tal como temperatura, pH e similares, são aquelasanteriormente usadas com a célula hospedeira selecionada para aexpressão e será evidente pelo técnico normalmente versado. Os clones que
são identificados como tendo uma atividade de enzima especificada podementão ser seqüenciados para identificar a seqüência de polinucleotídeos quecodifica uma enzima tendo a atividade aumentada.
A invenção prove um método para ultra-expressão de umacelulase recombinante, por exemplo, enzima de endoglucanase,
celobioidrolase, manase e/ou betaglicosidase em uma célulacompreendendo expressão de um vetor compreendendo um ácido nucléicoda invenção, por exemplo, um ácido nucléico compreendendo umaseqüência de ácidos nucléicos com pelo menos cerca de 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,
66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais identidade deseqüência com uma seqüência exemplar da invenção sobre uma região depelo menos cerca de 100 resíduos, em que as identidades de seqüência são
determinadas por análise com um algoritmo de comparação de seqüência oupor inspeção visual, ou, um ácido nucléico que hibridiza sob condiçõesrigorosas para dar uma seqüência de ácidos nucléicos da invenção. A ultra-expressão pode ser efetuada por qualquer meio, por exemplo, uso de umpromotor de alta atividade, um vetor dicistrônico ou por ampliação de gene
do vetor.
Os ácidos nucléicos da invenção podem ser expressos, ou ultra-expressos, em qualquer sistema de expressão in vitro ou in vivo. Quaisquersistemas de cultura de célula podem ser empregados para expressar ouultra-expressar, proteína recombinante, incluindo culturas bacterianas, de inseto, de levedura, fúngicas ou de mamífero. A ultra-expressào pode serefetuada por escolha apropriada de promotores, aumentadores, vetores (porexemplo, uso de vetores de réplicon, vetores discistrônicos (ver, porexemplo, Gurtu (1996) Biochem. Biophys. Res. Commun. 229:295-8), meios,sistemas de cultura e similares. Em um aspecto, amplificação de geneusando-se marcadores de seleção, por exemplo, sintetase de glutamina (ver,por exemplo, Sanders (1987) Dev. Biol. Stand. 66:55-63), em sistemas de célula são usados para ultra-expressar os polipeptídeos da invenção. Acélula hospedeira pode ser qualquer uma das células hospedeiras familiarespor aqueles versados na técnica, incluindo célula eucarióticas, célulasprocarióticas, células de mamífero, células de inseto ou células de planta. Aseleção de um hospedeiro apropriado está dentro das capacidades daqueles
versados na técnica.
O vetor pode ser introduzido para dentro das célulashospedeiras usando-se qualquer de uma variedade de técnicas, incluindotransconstrução, transfecção, transdução, infecção viral, pistolas de gene, outransferência de gene mediada por Ti. Métodos Particulares incluem
transfecção de fosfato de cálcio, transfecção mediada por DEAE-Dextrano,lipofecção, ou eletroporação (Davis, L, Dibner, M., Battey, I, Basic Methodsin Molecular Biology, (1986)).
Onde apropriadas, as células hospedeiras engenheiradaspodem ser cultivadas em meio de nutriente convencional modificado quando
apropriado para a ativação de promotores, seleção de transformantes, ouampliação do genes da invenção. Após a transconstrução de uma cepahospedeiro e crescimento da cepa hospedeira para uma densidade de célulaapropriada, o promotor selecionado pode ser induzido por meio apropriado(por exemplo, deslocamento de temperatura ou indução química) e as
células podem ser cultivadas por um período adicional para permitir que elasproduzam o polipeptídeo desejado ou seu fragmento.
Células podem ser coletadas por centrifugação, rompidas pormeio físico ou químico e o extrato bruto resultante para outra purificação.Células microbianas empregadas para expressão de proteínas podem ser
rompidas por qualquer método convencional, incluindo ciclização decongelamento-descongelamento, rompimento mecânico, ou uso de agentesde lise de célula ou seu fragmento pode ser recuperado e purificado a partirde culturas de células recombinantes por métodos incluindo precipitação deetanol e sulfato de amônio, extração de ácido, cromatografia de troca decátions ou ânions, cromatografia de fosfocelulose, cromatografia deinteração hidrofóbica, cromatografia por afinidade, cromatografia de hidroxilpatita e cromatografia de lectina. Etapas de redobramento deproteína podem ser usadas, quando necessário, na configuração determinação do polipeptídeo. Se desejado, cromatografia de líquida de altodesempenho (HPLC) pode ser empregada para estapas de purificaçãofinais.Vários sistemas de cultra de célula de mamífero podem também
ser empregados para expressar proteína recombinante. Exemplos desistemas de expressão de mamífero incluem as linhas de COS-7 defibroblastos de rim de macaco (descrito por Gluzman, Cell, 23_:175, 1981) eoutras linhagens de células capazes de expressar proteínas a partir de um vetor compatível, tais como linhagens de células de C127, 3T3, CHO, HeLae BHK.
Os construtos em células hospedeiras podem ser usados demodo convencional para produzir o produto de gene codificado pelaseqüência recombinante. Dependendo do hospedeiro empregado em um procedimento de produção recombinante, os polipeptídeos produzidos porcélulas hospedeiros contendo o vetor podem ser glicosilados ou podem sernão glicosilados. Polipeptídeos da invenção podem ou não podem tambémincluir um resíduo de aminoácido de metionina adicional.
Alternativamente, os polipeptídeos da invenção, ou fragmentoscompreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou150 ou mais seus aminoácidos consecutivos podem ser sinteticamenteproduzidos por sintetizadores de peptídeo convencionais, por exemplo,como discutido abaixo. Em outros aspectos, fragmentos ou porções dospolipeptídeos podem ser empregados para a produção de polipeptídeo decomprimento total correspondente por síntese de peptídeo; portanto, osfragmentos podem ser empregados como intermediários para a produçãodos polipeptídeos de comprimento total.Sistemas de tradução livres de célula podem também serempregados para produzir um dos polipeptídeos da invenção, os fragmentoscompreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou150 ou mais seus aminoácidos consecutivos usando-se mRNAs transcritos5 de um construto de DNA compreendendo um promotor operavelmente ligadoa um ácidos nucléico que codifica o polipeptídeo ou seu fragmento. Emalguns aspectos, o construto de DNA pode ser linearizado antes dacondução de uma reação de transcrição in vitro. O mRNA transcrito é entãoincubado com um extrato de tradução livre célula apropriado, tal comoextrato de reticulócito de coelho, para produzir o polipeptídeo desejado ouseu fragmento.
Ampliação de ácidos nucléicos
Na prática da invenção, ácido nucléicos da invenção e ácidosnucléicos que codificam a celulase, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção, ou ácidos nucléicos modificados da invenção, podem serreproduzidos por ampliação, por exemplo, PCR. Ampliação pode ser usadapara clonar ou modificar os ácidos nucléicos da invenção. Assim, a invençãoprove ampliação de pares de seqüência de iniciador para a ampliação deácidos nucléicos da invenção. Aquele versado na técnica podem projetarampliação de pares de seqüência de iniciador para qualquer parte de ou ocomprimento total dessas seqüências.
Em um aspecto a invenção prove um ácido nucléico ampliadopor uma ampliação de par de iniciador da invenção, por exemplo, um par deiniciador como indicado por cerca do primeiro (o 5') 12, 12, 13, 14, 15, 16,17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou mais resíduos de um ácido nucléicoda invenção, e cerca do primeiro (o 5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,ou 25 ou mais resíduos do filamento complementar. A invenção proveampliação de pares de seqüência de iniciador para ampliação de um ácidonucléico que codifica um polipeptídeo tendo uma celulase, por exemplo,atividade de enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase, em que o par de iniciador é capaz de ampliar um ácidonucléico compreendendo uma seqüência da invenção, ou seus fragmentos ou subseqüências. Um ou cada membro da ampliação de par de seqüência de iniciador pode compreender um oligonucleotídeo compreendendo pelo menos cerca de 10 a 50 ou mais bases consecutivas da seqüência, ou cerca de 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou mais bases consecutivas da seqüência. A invenção prove ampliação de pares de iniciador, em que o par iniciador compreende um primeiro membro tendo uma seqüência indicada por cerca da primeiro (o 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou mais resíduos de um ácido nucléico da invenção, e um segundo membro tendo uma seqüência indicada por cerca de do primeiro (o 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou mais resíduos do filamento complementar do primeiro membro.
A invenção prove celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, manase e/ou betaglicosidase gerada por ampliação, por reação de cadeia de polimerase (PCR), usando-se uma ampliação de par de iniciador da invenção. A invenção prove métodos de produção de uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase por ampliação, por exemplo, PCR, usando-se um par de iniciador de ampliação da invenção. Em umaspecto, a ampliação de par de iniciador amplifica um ácido nucléico a partir de um biblioteca, por exemplo, um biblioteca de gene, tal como um biblioteca ambiental.
Reações de ampliação podem também ser usadas para quantificar a quantidade de ácido nucléico em uma amostra (tal como a quantidade de mensagem em uma amostra de célula), marcar o ácido nucléico (por exemplo, para aplicá-lo a um conjunto ou uma mancha), detectar o ácido nucléico, ou quantificar a quantidade de um ácido nucléico em uma amostra. Em um aspecto da invenção, mensagem isolada de uma célula ou um biblioteca de cDNA é ampliada.
O técnico versado pode selecionar e projetar iniciadores deampliação de oligonucleotídeo. Métodos de ampliação são também bem-conhecidos na técnica, e incluem, por exemplo, reação de cadeia depolimerase, PCR (ver, por exemplo, PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, N. Y. (1990) and PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y., reação de cadeia de ligase (LCR) (ver, por exemplo, Wu (1989) Genomics 4:560; 5 Landegren (1988) Science 241:1077; Barringer (1990) Gene 89: 117); ampliação por transcrição (ver, por exemplo, Kwoh (1989) Proc. Natl. Acad. Sei. USA 86:1173); e, replicação de seqüência auto-sustentada (ver, por exemplo, Guatelli (1990) Proc. Natl. Acad. Sei. USA 87:1874); ampliação de replicase de Q Beta (ver, por exemplo, Smith (1997) J. Clin. Microbiol.
35:1477-1491), ensaio de ampliação de replicase de Q-beta automatizado (ver, por exemplo, Burg (1996) Mol. Cell. Probes 10:257-271) e outras técnicas mediadas por polimerase de RNA (por exemplo, NASBA, Cangene, Mississauga, Ontario); ver também Berger (1987) Methods Enzymol. 152:307-316; Sambrook; Ausubel; as patentes U.S. nQs 4.683.195 e
4.683.202; Sooknanan (1995) Biotechnology 13:563-564.
Determinação de identidade de seqüência nos ácidos nucléicos e polipeptídeos.
A invenção prove ácidos nucléicos compreendendo seqüências tendo pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%,
58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ou identidade de seqüência completa (100%) (homologia) a um ácido nucléico exemplar da invenção (ver também as
tabelas 1, 2, e 3, Exemplos 1 e 4, abaixo, e Listagem de seqüência) sobre uma região de pelo menos cerca de 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550 ou mais, resíduos. A invenção prove polipeptídeos compreendendo seqüências tendo
pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ou identidade de seqüência completa (100%) (homologia) a um ácido nucléico exemplar da invenção (ver também as tabelas 1, 2, e 3, Exemplos 1 e 4, abaixo, e Listagem de seqüência). A
extensão de identidade de seqüência (homologia) pode ser determinada usando-se qualquer programa de computador e parâmetros padrão, incluindo aqueles descritos aqui, tal como BLAST 2.2.2. ou FASTA versão 3.0t78, com os parâmetros de omissão.
Seqüências de ácidos nucléicos da invenção podem
1.0 compreender pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 ou mais nucleotídeos consecutivos de uma seqüência exemplar da invenção e seqüências substancialmente idênticas às mesmas. Seqüências homólogas e fragmentos de seqüências de ácidos nucléicos da invenção podem referir-se a uma seqüência tendo pelo menos cerca de
50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais identidade de seqüência (homologia) a estas seqüências. Homologia
(identidade de seqüência) pode ser determinada usando-se qualquer um dos programas de computador descritos aqui, incluindo FASTA versão 3.0t78 com os parâmetros padrão. Seqüências homólogas também incluem seqüências de RNA em que uridinas subsitutem as timinas na seqüências de ácidos nucléicos da invenção. As seqüências homólogas podem ser obtidas
usando-se qualquer um dos procedimentos descritos aqui e podem resultar da correção de um erro de seqüenciação. Será apreciado que as seqüências de ácidos nucléicos da invenção podem ser representadas no formato de caráter simples tradicional (Ver o revestimento da parte posterior intena de Stryer, Lubert. Biochemistry, 3rd Ed., W. H Freeman & Co., New York.) ou
em qualquer outro formato que registra a identidade dos nucleotídeos em uma seqüência.
Em vários aspectos, programas de comparação de seqüênciaidentificados aqui são usados neste aspecto da invenção, isto é, para determinar se uma seqüência de ácidos nucléicos ou polipeptídeos está dentro do escopo da invenção. No entanto, identidades de seqüência de proteínas e/ou ácidos nucléicos (homologias) podem ser avaliadas usando- se qualquer programa ou algoritmo de comparação de seqüência conhecido na técnica. Tais algoritmos e programas incluem, mas são por nenhum meio limitados a, TBLASTN, BLASTP, FASTA, TFASTA e CLUSTALW (ver, por exemplo, Pearson and Lipman, Proc. Natl. Acad. Sei. USA 85(8):2444-2448, 1988; Altschul e outros, J. Mol. Biol. 215(3):403-410, 1990; Thompson
Nucleic Acids Res. 22(2):4673-4680, 1994; Higgins e outros, Methods Enzymol. 266:383-402, 1996; Altschul e outros, J. Mol. Biol. 215(3):403-410, 1990; Altschul e outros, Nature Genetics 3:266-272, 1993).
Em um aspecto, homologia ou identidade é medida usando-se software de análise de seqüência (por exemplo, Sequence Analysis Software
Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wl 53705). Tal software satisfaz seqüências similares por apontar graus de homologia a várias deleções, substituições e outras modificações. Em um aspecto, o termos "homologia" e "identidade" no contexto de duas ou mais seqüências
de ácidos nucléicos ou polipeptídeos, referem-se a duas ou mais seqüências ou subseqüências que são iguais ou têm uma percentagem especificada de resíduos de aminoácidos ou nucleotídeos que são iguais quando comparados e alinhados para a correspondência máxima sobre uma janela de compração ou região designada como medida usando-se qualquer
número de algoritmos de comparação de seqüência ou por alinhamento manual e inspeção visual. Em um aspecto, para a comparação de seqüência, uma seqüência age como uma seqüência de referência, a qual seqüências testes são comparadas. Quando usando-se um algoritmo de comparação de seqüência, seqüências de teste e de referência são entradas
em um computador, coordenadas de subseqüência são designadas, se necesário e parâmetros de algoritmo de seqüência são designados. Parâmetros de programa padrão podem ser usados, ou parâmetrosalternativos podem ser designados. O algoritmo de comparação de seqüência então calcula a percentgem de identidades de seqüência para as seqüências de teste em relação à seqüência de referência, com base nos parâmetros de programa.
Uma "janela de comparação", como usada aqui, inclui referência a um segmento de qualquer um do número de posições contíguas selecionadas do grupo que consiste em desde 20 a 600, usualmente cerca de 50 a cerca de 200, mais usualmente cerca de 100 a cerca de 150 em que uma seqüência pode ser comparada com uma seqüência de referência do mesmo número de posições contíguas, depois das duas seqüências são otimamente alinhadas. Métodos de alinhamento de seqüência para a comparação são bem-conhecidos na técnica. Alinhamento ótimo das seqüências para a comparação pode ser conduzido, por exemplo, pelo algoritmo de homologia local de Smith & Waterman, Adv. Appl. Math. 2:482,1981, pelo aloritmo de alinhamento de homologia de Needleman & Wunsch, J. Mol. Biol 48:443, 1970, pela pesquisa de método de similaridade de person & Lipman, Proc. Natl Acad. Sei. USA 85:2444, 1988, por implementações computadorizadas destes algoritmos (GAP, BESTFIT, FASTA e TFASTA in the Wisconsin Genetics Software Package, GeneticsComputer Group, 575 Science Dr., Madison, Wl), ou por alinhamento manual e inspeção visual. Outros algoritmo para a determinação de homologia ou identidade incluem, por exemplo, além de um programa BLAST (Basic Local Alignment Search Tool at the National Center for Biological Information), ALIGN, AMAS (Analysis of Multiply Aligned Sequences), AMPS (Protein Multiple Sequence Alignment), ASSET (Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node), BLIMPS (BLocks IMProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman algorithm, DARWIN, LasVegas algorithm, FNAT (Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequence Analysis Package), GAP (Global Alignment Program), GENAL, GIBBS, GenQuest,ISSC (Sensitive Sequence Comparison), LALIGN (Local Sequence Alignment), LCP (Local Content Program), MACAW (Multiple Alignment Construction & Analysis Workbench), MAP (Multiple Alignment Program), MBLKP, MBLKN, PIMA (Pattern-lnduced Multi- sequence Alignment), SAGA (Sequence Alignment by Genetic Algorithm) e WHAT- IF. Tais programas de alinhamento podem também ser usados para triar bases de dados de triar para identificar seqüências de nucleotídeos tendo seqüências substancialmente idênticas. Numerosas bases de dados de genoma estão disponíveis, por exemplo, uma porção substancial do genoma humano está disponível comp parte do Human Genome Sequencing Prcject (Gibbs, 1995). Pelo menos vinte e um outros genomas já foram seqüenciados, incluindo, por exemplo, M. genitalium (Fraser e outrost, 1995), M. jannaschii (Bult e outros, 1996), H. influenzae (Fleischmann e outros, 1995), E. coli (Blattner e outros, 1997) e levedura (S. cerevisiae) (Mewes e outros, 1997) e D. melanogaster (Adams e outros, 2000). Progresso significativo foi também produzido na seqüenciação dos genomas do organismo modelo, tais como camundongo, C. elegans e Arabadopsis sp. Várias bases de dados contendo inconstrução genômica anotada com alguma inconstrução funcional são mantidas por diferentes organizações e podem ser acessíveis através da internet.
Em um aspecto, BLAST e BLAST 2.0 algoritmos são usados, que são descritos em Altschul e outros, Nuc. Acids Res. 25:3389-3402, 1977 e Altschul e outros, J. Mol. Biol. 215:403-410, 1990, respectivamente. Software para realização de análises de BLAST é publicamente disponível através da National Center for Biotechnology Information. Este algoritmo envolve primeira identificação de pares de seqüências de classificação alta (HSPs) por indentificação de palavras curtas de comprimento W na seqüência em questão, que ou emparelham ou satisfazem alguma classificação de limiar de valor positivo T quando alinhado com uma palavra do mesmo comprimento em uma seqüência de base de dados. T é chamado do limiar de classificção de palavra vizinha (Altschul e outros, supra). Esta palavra vizinha inicial impacta agindo como sementes para o início debuscas para encontrar HSPs mais longos contendo eles. Os impactos de palavra são prolongados tanto em direções ao longo de cada seqüência para tanto quanto a classificação de alinhamento cumulativo pode ser aumentado. Classificações cumulativas são calculadas usando-se, para seqüências de nucleotídeos, os parâmetros M (classificação de prêmio para um par de resíduos de emparelhamento; sempre >0). Para as seqüências de aminoacidos, uma matriz de classificação é usada para calcular a classificação cumulativa. Extensão dos impactos de palavra em cada direção são parados quando: a classificação de alinhamento cumulativo diminui pela quantidade X de seu valor máximo alcançado; a classificação cumulativa vai de zero ou abaixo, devido ao acúmulo de um ou mais alinhamentos de resíduo de classificação negativa; no final qualquer seqüência é alcançada.
Os parâmetros de algoritmo de BLAST W, T e X determinam a sensibilidade e velocidade do alinhamento. O programa de BLASTN (para seqüências de nucleotídeos) usa como padrões um comprimento de palavra (W) de 11, uma expectativa (E) de 10, M = 5, N = -4 e uma comparação de ambos os filamentos. Para as seqüências de aminoacidos, o programa de BLASTP usa como padrões um comprimento de palavra de 3 e expectativas (E) de 10 e a matriz de classificação de BLOSUM62 (ver Henikoff & Henikoff,Proc. Natl. Acad. Sei. USA 89:10915, 1989) alinhamentos (B) de 50, expectativa (E) de 10, M=5, N= -4 e uma comparação de ambos os filamentos.
O algoritmo de BLAST também realiza uma análise estatítica de similaridade entre duas seqüências (ver, por exemplo, , Karlin & Altschul, Proc. Natl. Acad. Sei. USA 90:5873, 1993). Uma medida de similaridade provida por algoritmo de BLAST é a menor probabilidade de soma (P(N)), que prove uma indicação da probabilidade pela qual um emparelhamento entre duas seqüências de aminoacidos e de nucleotídeos ocorreriam por mudança. Por exemplo, um ácido nucléico é considerado similar a uma seqüência de referência se ao menos probabilidade de soma em uma comparação do ácido nucléico de teste com o ácido nucléico de refernecia é menos do que cerca de 0,2, mais em um aspecto menos do que cerca de0,01 e mais em um aspecto menos do que cerca de 0,001.
Em um aspecto, homologias de seqüência de ácidos nucléicos e proteínas são avaliadas usando-se a ferramenta de alinhamento local básica ("BLAST"). Em particular, cinco programas de BLAST específicas são 5 usados para realizar a seguinte tarefa:
(1) BLASTP e BLAST3 comparam uma seqüência em questão de aminoácidos contra um base de dados de seqüência de proteínas;
(2) BLASTN compara seqüência em questão de aminoácidos contra base de dados de seqüência de nucleotídeos;
(3) BLASTX compara os produtos de tradução conceituai de seis
quadros de uma seqüência de nucleotídeos de em questão (ambos os filamentos) contra um base de dados de seqüência de proteínas;
(4) TBLASTN compara um seqüência de proteína em questão contra base de dados de seqüência de nucleotídeos traduzidos em todos os
seis quadros de leitura (ambos os filamentos); e
(5) TBLASTX compara as traduções de seis quadros de seqüência de em questão de uma seqüência de em questão de nucleotídeos contra as traduções de seis quadros de bases de dados de seqüência de nucleotídeos.
Os progrmas BLAST identificam seqüências homólogas por
identificação de segumentos similares, que são chamados aqui de "pares de segmento de classificação alta", entre uma seqüência de aminoácidos ou de ácidos nucléicos e uma seqüência de teste que é em um aspecto obtida a partir de uma base de dados de seqüência de ácidos nucléicos ou
aminoácidos em questão e uma seqüência de teste que é em um aspecto a partir de base de dados de seqüência de ácidos nucléicos ou de proteínas. Pares de segmento de classificação alta são em um aspecto identificados (isto é, alinhados" por meio de uma matriz de classificação, muitos dos quais são conhecidos na técnica. Em um aspecto, a matriz de classificação usada
é a matriz BLOSUM62 (Gonnet (1992) Science 256:1443-1445; Henikoff and Henikoff (1993) Proteins 17:49-61). Menos em um aspecto, as matrizes PAM ou PAM250 podem também ser usadas (ver, por exemplo, Schwartz andDayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Programas BLAST são acessíveis através da U.S. National Library of Medicine.
' Os parâmetros usados com os algoritmos acima podem ser
adaptados dependendo do comprimento de seqüência e do grau de homologia estudado. Em alguns aspectos, os parâmetros podem ser parâmetros padrão usados pelo algoritmos na ausência de instruções do usuário.
Sistemas de computador e produtos de progama de computador
A invenção prove computadores, sistemas de computador, meios legíveis de computador, produtos de programa de computador e similares registrados ou armazenados nos mesmos as seqüências de polipeptídeos e de ácidos nucléicos da invenção. Adicionalmente, na prática
dos métodos da invenção, por exemplo, determinar e identificar identidades de seqüência (para determinar se um ácido nucléico está dentro do escopo da invenção), homologias estruturais, motivos e similares in silico, uma seqüência de polipeptídeos ou de ácidos nucléicos da invenção pode ser armazenada, registrada, e manipulada sobre qualquer meio que pode ser
lido e acessado por um computador.
Como usados aqui, as palavras "registradas" e "armazenadas" referem-se a um processo para a armazenagem de inconstrução em um meio de computador. Um técnico versado pode prontamente adotar quaisquer métodos conhecidos para o registro de inconstrução em um meio
de computador legível para gerar fabricações compreendendo uma ou mais das seqüências de ácidos nucléicos e/ou polipeptídeos da invenção. Como usado aqui, os termos "computador", "programa de computador" e "processador" são usados em seus contextos gerais mais amplos e incorporam todos os tais dispositivos como descritos em detalhes abaixo.
Uma "seqüência de codificação de" ou uma "seqüência codifica" um polipeptídeo ou uma proteína particular, é uma seqüência de ácido nucléico que é transcrita e é traduzida em uma polipeptídeo ou uma proteína quandocolocado sob o controle de seqüências reguladoras apropriadas.
Os polipeptídeos da invenção incluem seqüências exemplares da invenção e seqüências substancialmente idências ao mesmos, e subseqüências (fragmentos) de qualquer uma das seqüências precedentes. 5 Em um aspecto, seqüências de polipeptídeos substancialmente idênticas ou homólogas referem-se a uma seqüência de polipeptídeos tendo pelo menos 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ou identidade de seqüência completa (100%) (homologia) a uma seqüência exemplar da invenção.
Homologia (identidade de seqüência) pode ser determinada usando-se qualquer um dos programas de computador e parâmetros
descritos aqui. Uma seqüência de ácidos nucléicos ou polipeptídeos da invenção pode ser armazenada, registrada, e manipulada ou qualquer meio que possa ser lido e acessado por um computador. Como usados aqui, as palavras "registrados" e "armazenados" referem-se a um processo de armazenagem de inconstrução em um meio de computador. Um técnico
versado pode prontamente adotar qualquer um dos métodos presentemente conhecidos para registar a inconstrução em um meio legível de computador para gerar fabricações compreendendo um ou mais das seqüências de ácidos nucléicos da invenção, ou uma ou mais das seqüências de polipeptídeos da invenção. Um outro aspecto da invenção é um meio legível
de computador tendo registrado no mesmo pelo menos 2, 5, 10, 15, ou 20 ou mais seqüências de ácidos nucléicos ou de polipeptídeos da invenção.
Um outro aspecto da invenção é um meio legível de computador tendo registrado no mesmo uma ou mais das seqüências de ácidos nucléicos da invenção. Um outro aspecto da invenção é um meio legível de
computador tendo registrado no mesmo uma ou mais das seqüências de polipeptídeos da invenção. Um outro aspecto da invenção é um meio legível de computador tendo registrado no mesmo pelo menos 2, 5, 10, 15, ou 20ou mais das seqüências de ácidos nucléicos ou de polipeptídeos como indicadas acima.
Meios legíveis de computador incluem meio magneticamente legível, meio oticamente legível, meio eletronicamente legível e meiomagnético e/ou ótico. Por exemplo, o meio legível de computador pode ser um disco rígido, um disco mole, uma fita mgnética, CD-ROM, disco versátil digital (DVD), memória de acesso aleatório (RAM), ou memória apenas para leitura (ROM) bem como outras tipos de outros meios conhecidos por aqueles versados na técnica.
Aspectos da invenção incluem sistemas (por exemplo, sistemasbaseados na internet), por exemplo, sistemas de computador que armazenam e manipulam inconstrução de seqüência descrita aqui. Um exemplo de um sistema de computador 100 é ilustrado em forma de diagrama por blocos na figura 1. Como usado aqui, "um sistema de computador" refere-se aos componentes de hardware, componentes de software e componentes de armazenagem de dados usados para analisar uma seqüência de nucleotídeos de uma seqüência de ácidos nucléicos da invenção, uma seqüência de polipeptídeos da invenção. Em um aspecto, o sistema de computador 100 inclui um processador para o processamento, acesso e manipulação dos dados de seqüência. O processor 105 pode ser qualquer tipo conhecido de unidade de processamento central, tal como, por exemplo, o Pentium III from Intel Corporation, o processador similar da Sun, Motorola, Compaq, AMD ou International Business Machines. Em um aspecto, o sistema de computador 100 em um sistema de finalidade geral que compreende o processor 105 e um ou mais componentes de armazenagem de dados internos 110 para a armazenagem de dados e um ou mais dispositivos de reaver dados para reaver os dados armazenados nos componentes de armazenagem de dados. Um técnico versado pode prontamente apreciar que qualquer um dos sistemas correntemente disponíveis são adequados.
Em um aspecto particular, o sistema de computador 100 inclui um processador 105 ligado a um barramento que é ligado a uma memóriaprincipal 115 (em um aspecto implementado como RAM) e um ou mais dispositivos de armazenagem de dados internos 110, tal como um disco rígido e/ou outro meio legível de computador tendo dados registados no mesmo. Em alguns aspectos, o sistema de computador 100 ulteriormente inclui um ou mais dispositivo de recobrar dados 118 para a leitura dos dados armazenados nos dispositivos de armazenagem de dados internos 110.
O dispositivo de recobrar dados 118 pode representar, por exemplo, um drive de disco mole, um drive de disco compacto, um drive de fita magnética, ou um modem capaz de ligar ligação a um sistema de
armazenagem de dados remoto (por exemplo, através da internet) etc. Em alguns aspectos, o dispositivo de armazenagem de dados interno 110 é um meio legível de computador removível tais como um disco mole, um disco compacto, uma fita magnética, etc. contendo dados e/ou lógicos de controle registados no mesmo. O sistema de computador 100 pode vantajosamente
incluir ou ser programado por software apropriado para a leitura do dados e/ou lógico de controle a partir dos componente de armazenagem de dados uma vez inserido no dispositivo de recobrar dados.
O sistema de computador 100 inclui um display 120 que é usado para exibir saída para um usuário de computador. Deve também ser
observado que o sistema de computador 100 pode ser ligado a outros sistemas de computador 125a-c em uma rede ou uma rede de área ampla para prover acesso centralizado versão sistema de computador 100.
Software para o acesso e o processamento das seqüências de nucleotídeos de uma seqüência de ácidos núcleicos da invenção, ou uma
seqüência de polipeptídeos da invenção, (tais como ferramentas de busca, ferramentas e ferramentas de apresentação etc.) pode residir em memória principal 115 durante execução.
Em alguns aspectos, o sistema de computador 100 pode ulteriormente compreender um algoritmo de comparação de seqüência para
a comparação de uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção, armazenada em um meio legível de computador a uma(s) seqüência(s) de polipeptídeos ou de nucleotídeosde referência armazenadas em um meio legível de computador. Um "algoritmo de comparação de seqüência" refere-se a um ou mais programas que são implementados (local ou remotamente) no sistema de computador 100 para comparar uma seqüência de nucleotídeos com outras seqüências
' de nucleotídeos e/ou compostos armazenados dentro de um meio de armazenagem de dados. Por exemplo, o algoritmo de comparação de seqüência pode comparar as seqüências de nucleotídeos de uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção, armazendo em um meio legível de computador para seqüências
de referência armazenados em um meio legível de computador para identificar homologias ou motivos estruturais.
Figura 2 é um diagrama de fluxo que ilustra um aspecto de um processo 200 para a comparação de uma nova seqüência(s) de nucleotídeos ou proteínas com uma base de dados de seqüências a fim de
determinar os níveis de homologia entre a(s) nova(s) seqüência e seqüências na base de dados. A base de dados de seqüências pode ser uma base de dados armazenadas dentro do sistema de computador 100, ou uma base de dados públicos tal como GENBANK que está disponível através da Internet.
O processo 200 começa em um estado inicial 201 e então se
move para um estado 202 em que a nova seqüência a ser comparada é armazenada para uma memória em um sistema de computador 100. Como discutido acima, a memória poderia ser qualquer tipo de memória, incluindo RAM ou um dispositivo de armazenagem interno.
O processo 200 então se move para um estado 204 em que uma
base de dados de seqüências são abertas para análise e comparação. O processo 200 então se move para um estado 206 em que a primeira seqüência armazenada na base de dados é lida em uma memória no computador. Uma comparação é então realizada em um estado 210 para se
determinar se a primeira seqüência é a mesma que a segunda seqüência.
É importante observar que esta etapa não é limitada a realização de uma comparação exata entre a nova seqüência e a primeira seqüênciana base de dados. Métodos bem-conhecidos são conhecidos por aqueles versados na técnica para a comparação de duas seqüências de nucleotídeos ou proteínas, ainda que elas não sejam idênticas. Por exemplo, lacunas podem ser introduzidas para dentro de uma seqüência a fim de aumetar o nível de homologia entre as duas seqüências testadas. Os parâmetros que controlam se lacunas ou outras características são introduzidas para dentro de uma seqüência durante a comparação são normalmente entradas pelo usuário do sistema de computador.
Uma vez que uma comparação das duas seqüências foi realizada no estágio 210, uma determinação é produzida em um estado de decisão 210 se as duas seqüências são as mesmas. Naturalmente, o termo "igual" não é limitado a seqüências que são absolutamente idênticas. Seqüências que estão dentro dos parâmetros de homologia entrados pelo usuário serão marcados como "iguais" no processo 200. Se uma determinação é produzida que as duas seqüências são
as mesmas, o processo 200 se move para um estado 214 em que o nome da seqüência oriunda da base de dados é exibida para o usuário.
Este estado notifica o usuário que a seqüência com o nome exibido realiza os constrangimentos de homologia que foram entrados. Uma vez que o nome da armazenada seqüência é exibida para o usuário, o processo 200 se move para um estado de decisão 218 em que uma determinação é produzida se mais seqüências existem na base de dados. Se não mais seqüências existem na base de dados, então o processo 200 termina em um estado final 220. No entanto, se mais seqüências existem na base de dados, então o processo 200 se move para um estado 224 em que um indicador é movido para a próxima seqüência na base de dados de modo que ela possa ser comparada com a nova seqüência. Deste modo, a nova seqüência é alinhada e é comparada com qualquer seqüência na base de dados. Seria observado que se uma determinação tiver sido produzida
no estado de decisão 212 que as seqüências não eram homólogas, então o processo 200 se moveria imediatamente para o estado de decisão 218 a fimde determinar se quaisquer outras seqüências estavam disponíveis na base de dados para a comparação.
Correspondentemente, um aspecto da invenção é um sistema de computador compreendendo um processador, um dispositivo de armazenagem de dados tendo armazenados no mesmo uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção, um dispositivo de armazenagem de dados tendo reparavelmente armazenados no mesmo seqüências de nucleotídeos ou seqüências de polipeptídeos de referência a serem comparadas com uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção e um comparador de seqüência para a condução da comparação. O comparador de seqüência pode indicar um nível de homologia entre as seqüências comparadas ou identificar motivos estruturais no ácido nucléico descritos acima codificando uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção, ou pode identificar motivos estruturais em seqüências que são comparados com estes códigos de ácido nucléico e códigos de polipeptídeo. Em alguns aspectos, o dispositivo de armazenagem de dados pode ser armazendo no mesmo as seqüências de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácidos núcleicos da invenção, ou das seqüências de polipeptídeos da invenção.
Um outro aspecto da invenção é um método para a determinação do nível de homologia entre a seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção e uma seqüência de nucleotídeos de referência. O método incluindo leitura do código de ácido nucléico ou do código de polipeptídeo e seqüência de polipeptídeos ou de nucleotídeos de referência através do uso de um programa de computador que determina níveis de homologia e determinação de homologia entre o código de ácido nucléico ou o código de polipeptídeo e seqüência de polipeptídeos ou de nucleotídeos de referência com o programa de computador. O programa de computador pode ser qualquer um de numerosos programas de computador para a determinação de níveis dehomologia, incluindo aqueles especificamente enumerados aqui, (por exemplo, BLAST2N com os parâmetros padrão ou com quaisquer parâmetros modificados). O método pode ser implementado usando-se os sistemas de computador descritos acima. O método pode também ser realizado por leitura de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácidos nucléicos descritas acima da invenção, ou as seqüências de polipeptídeos da invenção através do uso do programa de computador e determinação de homologia entre o código de ácido nucléicos ou códigos de polipeptídeo e seqüências de nucleotídeos ou seqüências de polipeptídeos de referência. A figura 3 é um diagrama de fluxo que ilustra um aspecto de um processo 250 em um computador para a determinação de se duas seqüências são homólogas. O processo 250 começa em um estado inicial 252 e então se move para um estado 254 em que uma primeira seqüência a ser comparada é armazenada para uma memória. A segundaseqüência a ser comparada é então armazenada para uma memória em um estado 256. O processo 250 então se move para um estado 260 em que um primeiro caráter na primeira seqüência é lido e então para um estado 262 em que um primeiro caráter da segunda seqüência é lido. Seria entendido que se a seqüência for uma seqüência de nucleotídeos, então o caráternormalmente seria ou A, T, C, G ou U. Se a seqüência for uma seqüência de proteínas, então ela está em um aspecto no código de aminoácido de lentra minúscula de modo que as primeira e segunda seqüências pode(m) ser facilmente comparada(s).
Uma determinação é então produzida em um estado de decisão264 se os dois caracteres são iguais. Se eles forem iguais, então o processo 250 se move para um estado 268 em que os próximos caracteres nas primeira e segunda seqüências são lidas. Uma determinação é então produzida se os próximos caracteres são iguais. Se eles são, então o processo 250 continua neste laço até que dois caracteres não sejam os mesmos. Se uma determinação for produzida que os próximos dois caracteres não são iguais, o processo 250 se move para um estado de decisão 274 para determinar se há quaisquer mais caracteres ou seqüênciapara ler.
Se não há quaisquer mais caracteres para ler, então o processo 250 se move para um estado 276 em que o nível de homologia entre as primeira e segunda seqüências é exibido para o usuário. O nível de
' homologia é determinado por cálculo da proporção de caracteres entre as seqüências que as mesmas foram do número total de seqüências na primeira seqüência. Assim, se cada caracter em uma primeira seqüência de nucleotídeos 100 alinhada com cada caracter em uma segunda seqüência, o nível de homologia seria 100%.
Alternativamente, o programa de computador pode ser um
programa de computador que compara as seqüências de nucleotídeos de uma seqüência de ácidos núcleicos como indicada na invenção, com uma ou mais seqüências de nucleotídeos de referência a fim de determinar se o código de ácido nucléico da invenção, difere de uma seqüência de ácidos
núcleicos de referência a uma ou mais posições. Opcionalmente tal programa registra o comprimento e identidade de nucleotídeos inseridos, deletados ou substituídos com relação à seqüência ou de uma seqüência de ácidos núcleicos ou polinucleotídeos de referência da invenção. Em um aspecto, o programa de computador pode ser um programa que determina
se uma seqüência de ácidos núcleicos da invenção contém um polimorfismo de nucleotídeo simples (SNP) com relação a um seqüência de nucleotídeos de referência.
Correspondentemente, um outro aspecto da invenção é um método para a determinação de se uma seqüência de ácidos núcleicos da
invenção difere a um ou mais nucleotídeos de uma seqüência de nucleotídeos de referência compreendendo as etapas de leitura do código de ácido nucléico e a seqüência de nucleotídeos de referência através do uso de um programa de computador que identifica diferenças entre seqüências de ácidos nucléicos e identificação de diferenças entre o código
de ácido nucléico e a seqüência de nucleotídeos de referência com o programa de computador. Em alguns aspectos, o programa de computador é um programa que identifica polimorfismos de nucleotídeos simples. Ométodo pode ser implementado pelos sistemas de computador descritos acima e o método ilustrado na Figura 3. O método pode também ser realizado por leitura de pelo menos 2, 5, 10, 15, 20, 25, 30, ou 40 ou mais das seqüências de ácidos nucléicos da invenção e as seqüências de 5 nucleotídeos de referência através do uso do programa de computador e identificação de diferenças entre o código de ácido nucléicos e as seqüências de nucleotídeos de referência com o programa de computador.
Em outros aspectos o sistema com base no computador pode ulteriormente compreender um identificador para a identificação de características dentro de uma seqüência de ácidos nucléicos da invenção ou uma seqüência de polipeptídeos da invenção. Um "identificador" refere-se a um ou mais programas que identifica certas características dentro de uma seqüência de ácidos nucléicos da invenção, ou uma seqüência de polipeptídeos da invenção. Em um aspecto, o identificador pode compreender um programa que identifica um quadro de leitura aberta em uma seqüência de ácidos nucléicos da invenção.
Figura 4 é um diagrama de fluxo que ilustra um aspecto de um processo de identificador 300 para a detecção da presença de uma característica em uma seqüência. O processo 300 começa em um estadoinicial 302 e então se move para um estado 304 em que uma primeira seqüência que não deve ser checada para as características é armazenada para uma memória 115 no sistema de computador 100. O processo 300 então se move para um estado 306 em que uma base de dados de seqüência características é aberta. Tal base de dados incluiria uma lista decada atributos de característica juntamente com o nome da característica. Por exemplo, um nome de característica poderia ser "Códon de iniciação" e o atributo seria "ATG". Um outro exemplo seria o nome de característica "Caixa TAATAA " e o atributo de característica seria "TAATAA". Um exemplo de tal base de dados é produzido pela University of Wisconsin Genetics
Computer Group. Alternativamente, as características podem ser motivos de polipeptídeo estruturais tais como alfa hélices, beta folhas, ou motivos de polipeptídeo funcionais de tais sítios ativos enzimáticos, motivos de hélice-volta-hélice ou outros motivos conhecidos por aqueles versados na técnica.
Uma vez que a base de dados de características é aberta no estágio 306, o processo 300 se move para um estado 308 em que a primeira característica é lida oriunda da base de dados. Uma comparação do atributo
da primeira característica com a primeira seqüência é então produzida em um estado 310. Uma determinação é então produzida em um estado de decisão 316 se o atributo da característica foi encontrado na primeira seqüência. Se o atributo fosse encontrado, então o processo 300 se move para um estado 318 em que o nome da característica encontrada é exibida
para o usuário.
O processo 300 então se move para um estado de decisão 320 em que uma determinação é feita se características móveis existem na base de dados. Se não mais características existissem, então o processo 300 termina em um estado final 324. No entanto, se mais características
existissem na base de dados, então o processo 300 lê a próxima seqüência característica em um estado 326 e retro-laços para o estado 310 em que o atributo da próxima característica é comparada com a primeira seqüência. Seria observado, que se o atributo de característica não for encontrado na primeira seqüência no estado de decisão 316, o processo 300 se move
diretamente para a taxa de decisão 320 a fim de determinar se quaisquer mais características existem na base de dados. Correspondentemente, um outro aspecto da invenção é um método de identificação da característica dentro de uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção, compreendendo leiturado(s)
código(s) de ácido nucléico ou código(s) de polipeptídeo através do uso de um programa de computador que identifica características ali e identificação de características dentro do(s) código(s) de ácido nucléico com o programa de computador. Em um aspecto, programa de computador compreende um programa de computador que identifica quadros de leitura abertos. O método
pode ser realizado por leitura de uma seqüência simples ou pelo menos 2, 5, 10, 15, 20, 25, 30, ou 40 ou mais das seqüências de ácidos nucléicos da invenção, ou as seqüências de polipeptídeos da invenção, através do uso doprograma de computador e identificação de características dentro dos códigos de ácido nucléicos ou códigos de polipeptídeo com o programa de computador.
Uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção, pode ser armazenada e manipulada em uma varidade de programas de processador de dados em variedade de formatos. Por exemplo, uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção, pode ser armazenada como texto em um arquivo de processamento de word, tal como Microsoft WORD® ou WORDPERFECT® ou como um arquivo de ASCII em variedade de programas de base de dados familiares àqueles de versado na técnica, tal como DB2®, SYBASE®, ou ORACLE®. Além disso, muitos programas de computador e bases de dados podem ser usados como algoritmo de comparação de seqüências, identificadores, ou fontes de seqüências de nucleotídeos de ou seqüências de polipeptídeos referência a ser comparada com uma seqüência de ácidos núcleicos da invenção, ou uma seqüência de polipeptídeos da invenção. A seguinte lista destina-se a limitar a invenção para prover direção a programas e bases de dados que são úteis com as seqüências de ácidos nucléicos da invenção, ou as seqüências de polipeptídeos da invenção.
Os programas e bases de dados que podem ser usados incluem, mas não são limitados: MACPATTERN (EMBL), DISCOVERYBASE® (Molecular Applications Group), GENEMINE® (Molecular Applications Group), LOOK® (Molecular Applications Group), MACLOOK® (Molecular Applications Group), BLAST e BLAST2 (NCBI), BLASTN e BLASTX (Altschul e outros, J. Mol. Biol. 215: 403, 1990), FASTA (Pearson and Lipman, Proc. Natl. Acad. Sei. USA, 85: 2444, 1988), FASTDB (Brutlag e outros Comp. App. Biosci. 6:237-245, 1990), CATALYST® (Molecular Simulations Inc.), Catalyst/SHAPE® (Molecular Simulations Inc.), Cerius2.DB Access® (Molecular Simulations Inc.), HYPOGEN® (Molecular Simulations Inc.), INSIGHT II®, (Molecular Simulations Inc.), DISCOVER® (Molecular Simulations Inc.), CHARMm® (Molecular Simulations Inc.), FELIX®(Molecular Simulations Inc.), DELPHI®, (Molecular Simulations Inc.),QuanteMM®, (Molecular Simulations Inc.), Homologia (MolecularSimulations Inc.), MODELER® (Molecular Simulations Inc.), ISIS®(Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations
' Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer(Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.),SeqFold (Molecular Simulations Inc.), a base de dados de MDL AvailableChemicals Directory, a base de dados de MDL Drug Data Report, a base dedados de Comprehensive Medicinal Chemistry, a base de dados de
. Derwents's World Drug Index, a base de dados de BioByteMasterFile, abase de dados de Genbank e a base de dados de Genseqn. Muitos outrosprogramas e bases de dados estariam evidente para aquele versado natécnica dada a presente descrição.
Motivos que podem ser detectados usando-se os programas
acima incluem seqüências que codificam fechos de leucina, motivos dehelix-turn-helix, sítios de glicolisação, sítios de ubiquitinação, alfa hélices ebeta folhas, seqüências de sinal que codificam peptídeos de sinal quedirigem a secreção das proteína codificadas, seqüências implicadas naregulação de transcrição tais como homeoboxes, extensões ácidas, sítios
ativos enzimáticos, sítios de ligação de substrato e sítios de clivagemenzimática.
Hibridização de ácidos nucléicos
A invenção prove ácidos nucléicos recombinantes ou isoladosque hibridizam sob condições rigorosas para dar uma seqüência exemplar
da invenção (por exemplo, SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5,SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO:15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO:33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ
ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO:51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO:69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113,SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ IDNO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO:139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147,
SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163 ou SEQ IDNO: 165 (ver também as tabelas 1, 2, e 3, exemplos 1 e 4, abaixo, elistagem de seqüência). As condições rigorosas podem ser condiçõesaltamente rigorosas, condições rigorosas médias e/ou condições rigorosas
15 baixas, incluindo as condições rigorosas altas e reduzidas descritas aqui. Emum aspecto, é a severidade das condições de lavagem que indica ascondições que determinam se um ácido nucléico está dentro do escopo dainvenção, como discutido abaixo.
"Hibridização" refere-se ao processo pelo qual um filamento de
ácido nucléico se une com um filamento complementar através deemparelhamento de base. Reações de hibridização podem ser sensíveis eseletivas de modo que uma seqüência particular de interesse pode seridentificada mesmo em amostras em que está presente concentraçõesbaixas. Condições adequadamente rigorosas podem ser definidas por, por
exemplo, as concentrações de sal ou formamida na pré-hibridização esoluções de hibridização, ou pela temperatura de hibridização e são bem-conhecidas na técnica. Em aspectos alternativos, severidade pode seraumentada por redução da concentração de sal, aumento da concentraçãode formamida, ou elevação da temperatura de hibridização. Em aspectos
alternativos, ácidos nucléicos da invenção são definidos por sua capacidadede hibridizar sob várias condições rigorosas (por exemplo, alta, média ebaixa), como indicada aqui.Em um aspecto, hibridização sob altas condições rigorosascompreendem cerca de 50% de formamida a cerca de 37°C a 42°C. Em umaspecto, condições de hibridização compreendem condições rigorosasreduzidas em cerca de 35% a 25% de formamida a cerca de 30°C a 35°C.
Em um aspecto, condições de hibridização compreendem altas condiçõesrigorosas, por exemplo, a 42°C em 50% de formamida, 5X SSPE, 0,3% deSDS e 200 n/ml de DNA de esperma de salmão desnaturado ou cisalhado.Em um aspecto, condições de hibridização compreendem essas condiçõesrigorosas reduzidas, mas em 35% de formamida a uma temperatura
reduzida de 35°C. A faixa de temperatura que corresponde a um nívelparticular de severidade pode ser ulteriormente estreitada por cálculo darazão de purina para pirimidina do ácido nucléico de interesse e ajuste datemperatura correspondentemente. Variações sobre as faixas acima econdições são bem-conhecidas na técnica.
Em aspectos alternativos, ácidos nucléicos da invenção como
definidos por sua capacidade de hibridizar sob condições rigorosas podemestar entre cerca de cinco resíduos e o comprimento total de ácido nucléicoda invenção; por exemplo, eles podem ser pelo menos 5, 10, 15, 20, 25, 30,35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450,
500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, ou mais, resíduosde comprimento. Ácidos nucléicos mais curtos do que de comprimento totalsão também incluídos. Estes ácidos nucléicos podem ser úteis como, porexemplo, sondas de hibridização, sondas de marcação, sondas deoligonucleotídeos de PCR, siRNA ou miRNA (de filamento único ou duplo),
anti-sentido ou seqüências que codificam peptídeo de ligação de anticorpo(epítopos), motivos, sítios ativos e similares.
Em um aspecto, ácidos nucléicos da invenção são definidos porsua capacidade de hibridizar sob alta severidade que compreende condiçõesde cerca de 50% de formamida a cerca de 37°C a 42°C. Em um aspecto, ácidos nucléicos da invenção são definidos por sua capacidade de hibridizarsob severidade reduzida compreendendo condições em cerca de 35% a25% de formamida a cerca de 30°C a 35°C.Alternativamente, ácidos nucléicos da invenção são definidos porsua capacidade de hibridizar sob alta severidade compreendendo condiçõesa 42°C em 50% de formamida, 5X SSPE,0,3% de SDS, e um seqüência derepetição que bloqueia ácido nucléico, tal como cot-1 ou DNA de esperma de salmão (por exemplo, 200 n/ml de DNA de esperma de salmãodesnaturado ou cisalhado). Em um aspecto, ácidos nucléicos da invençãosão definidos por sua capacidade de hibridizar sob condições rigorosasreduzidas compreendendo 35% ou 40% de formamida a uma temperaturareduzida de 35°C ou 42°C.
Em reações de hibridizâção de ácido nucléico, as condiçõesusadas para alcançar um nível particular de severidade variará, dependendoda natureza dos ácidos nucléicos sendo hibridizados. Por exemplo, ocomprimento, o grau de complementaridade, composição de seqüência denucleotídeos (por exemplo, GC v. teor de AT) e tipo de ácido nucléico (porexemplo, RNA v. DNA) das regiões de hibridizâção dos ácidos nucléicospodem ser considerados na seleção de condições de hibridizâção. Umaconsideração adicional é se um dos ácidos nucléicos é imobilizado, porexemplo, sobre um filtro.
Hibridizâção pode ser realizada sob condições de baixa severidade, severidade moderada ou alta severidade. Como um exemplo dehibridizâção de ácido nucléico, uma membrana de polímero contendo ácidosnucléicos desnaturados imobilizados é primerio pré-hibridizada por 30minutos a 45°C em uma solução que consiste em NaCI a 0,9 M, NaH2P04 a50 mM, pH 7,0, Na2EDTA a 5,0 mM, 0,5% de SDS, 10X Denhardfs e 0,5 mg/ml de ácido polirriboadenílico. Cerca de 2 X 107 cpm (atividadeespecífica 4-9 X IO8 cpm/ug) de sonda de oligonucleotídeo marcado deextremidade com 32P são então adicionados à solução. Depois de 12-16horas de incubação, a membrana é lavada por 30 minutos a temperaturaambiente em 1X SET (NaCI a 150 mM, cloridrato de Tris a 20 mM, pH 7,8, Na2EDTA a 1 mM) contendo 0,5% de SDS, seguido por uma lavagem de 30minutos em 1X SET fresco a Tm -10°C para a sonda de oligonucleotídeo. Amembrana é então exposta a película auto-radiográfica para detecção desinais de hibridização. Todas as hibridizações expostas acima seriamconsideradas a estarem sob condições de alta severidade.
Após a hibridização, o filtro pode ser lavado para removerqualquer sonda detectável não especificamente ligada. A severidade usadapara lavar os filtros podem também ser variadas dependendo da naturezados ácidos nucléicos sendo hidrolisados, o comprimento dos ácidosnucléicos sendo hidrolisados, o grau de complementaridade, umacomposição de seqüência de nucleotídeos (por exemplo, GC v. teor de AT) eo tipo de ácido nucléico (por exemplo, RNA v. DNA). Exemplos de condiçõesde lavagem com severidade progressivamente elevada são como se segue:2X SSC, 0,1% de SDS a temperatura ambiente por 15 minutos (baixaseveridade); 0,1X SSC, 0,5% de SDS a temperatura ambiente por 30minutos a 1 hora (severidade moderada); 0,1 X SSC, 0,5% de SDS por 15 a30 minutos a entre a temperatura de hibridização e 68°C (alta severidade); eNaCI a 0,15M por 15 minutos a 72°C (severidade muito alta). Uma lavagemde baixa severidade final pode ser conduzida em 0,1X SSC a temperaturaambiente. Os exemplos acima são meramente ilustrativos de um conjunto decondições que podem ser usadas para filtros de lavagem. Um versado natécnica conheceria que há numerosas receitas para lavagens severasdiferentes. Alguns outros exemplos são dados abaixo.
Em um aspecto, condições de hibridização compreendem umaetapa de lavagem compreendendo uma lavagem por 30 minutos atemperatura ambiente em uma solução compreendendo 1X NaCI a 150 mM,cloridrato de Tris a 20 mM, pH 7,8, Na2EDTA a 1 mM, 0,5% de SDS,seguido por 30 minuto lavagem em solução fresca.
Ácidos nucléicos que hibridizaram para dar a sonda sãoidentificados por auto-radiografia ou outras técnicas convencionais.
Os procedimentos acima podem ser modificados para identificarácidos nucléicos tendo níveis decrescentes da identidade de seqüência(homologia) à seqüência de sonda. Por exemplo, para se obter ácidosnucléicos de identidade de seqüência descrescente (homologia) à sondadetectável, condições menos rigorosas podem ser usadas. Por exemplo, atemperatura de hibridização pode ser diminuída nos aumentos de 5°C de68°C a 42°C em um tampão de hibridização tendo uma concentração deNa+ de cerca de 1 M. Após a hibridização, o filtro pode ser lavado com 2XSSC, 0,5% de SDS na temperatura of hibridização. Essas condições são consideradas serem condições "moderadas" acima de 50°C e "baixas"condições abaixo de 50°C. Um exemplo específico de condições"moderadas" de hibridização é quando a hibridização acima é conduzida a55°C. Um exemplo específico de "baixa severidade" condições dehibridização é quando a hibridização acima é conduzida a 45°C.
Alternativamente, a hibridização pode ser realizada em tampões,
tal como 6X SSC, contendo formamida a uma temperatura de 42°C. Nestecaso, a concentração de formamida no tampão de hibridização pode serconduzida em aumentos de 5% de 50% a 0% para identificar clones tendoníveis decrescentes de homologia à sonda. Após a hibridização, o filtro pode
ser lavado com 6X SSC, 0,5% de SDS a 50°C. Essas condições sãoconsideradas serem condições "moderadas" acima de 25% de formamida e"baixas" condições abaixo de 25% de formamida. Um exemplo específico decondições "moderadas" de hibridização é quando a hibridização acima éconduzida a 30% de formamida. Um exemplo específico de "baixa
severidade" condições de hibridização é quando a hibridização acima éconduzida a 10% de formamida.
No entanto, a seleção de um formato de hibridização pode nãoser crítica - é a severidade das condições de lavagem que indicavam ascondições que determinam se um ácido nucléico está dentro do escopo da
invenção. Condições de lavagem usadas para identificar ácidos nucléicosdentro do escopo da invenção incluem, por exemplo: uma concentração desal de cerca de 0,02 molar a pH 7 e uma temperatura de pelo menos cercade 50°C ou cerca de 55°C a cerca de 60°C; ou, uma concentração de sal decerca de NaCI a 0,15 M a 72°C por cerca de 15 minutos; ou, uma
concentração de sal de cerca de 0,2X SSC a uma temperatura de pelomenos cerca de 50°C ou cerca de 55°C a cerca de 60°C por cerca de 15 acerca de 20 minutos; ou, o complexo de hibridização é lavado duas vezescom uma solução com uma concentração de sald e cerca de 2X SSCcontendo 0,1% de SDS a temperatura ambiente por minutos e então élavado duas vezes por 0,1X SSC contendo 0,1% de SDS a 68°C por 15minutos; ou, condições equivalentes. Ver Sambrook, Tijssen and Ausubel para uma descrição de tampão de SSC e condições equivalentes.
Estes métodos podem ser usadas para isolar ou identificarácidos nucléicos da invenção. Por exemplo, os métodos precedentes podemser usados para isolar ou identificar ácidos nucléicos tendo a seqüência compelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%,
59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, ou mais identidade de seqüência (homologia) a uma seqüênciade ácidos nucléicos selecionada do grupo que consiste em uma das
seqüências da invenção, ou fragmentos compreendendo pelo menos cercade 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 suasbases consecutivas e as seqüências identificar os mesmos. Identidade deseqüência (homologia) pode ser medida usando-se o algoritmo dealinhamento. Por exemplo, os polinucleotídeos homólogos podem ter uma
seqüência de codificação que é uma variantee alélica de ocorrência naturalde uma das seqüências de codificação descritas aqui. Tais varianteesalélicas podem ter uma substituição, deleção ou adição de um ou maisnucleotídeos quando comparados com os ácidos nucléicos da invenção.Adicionalmente, os procedimentos acima podem ser usados para isolar
ácidos nucléicos que codificam polipeptídeos tendo pelo menos cerca de99%, 95%, pelo menos 90%, pelo menos 85%, pelo menos 80%, pelomenos 75%, pelo menos 70%, pelo menos 65%, pelo menos 60%, pelomenos 55%, ou pelo menos 50% de identidade de seqüência (homologia)para um polipeptídeo da invenção, ou fragmentos compreendendo pelo
menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 seus aminoácidosconsecutivos como determinados usando-se um algoritmo de alinhamentode seqüência (por exemplo, tal como o algoritmo FASTA versão 3.0t78 comos parâmetros padrão).
Sondas de oligonucleotídeo e métodos para o uso delasA invenção também prove sondas de ácido nucléico que podemser usadas, por exemplo, para a identificação, ampliação, ou isolamento deácidos nucleicos que codificam um polipeptídeo tendo uma celulase, porexemplo, atividade de enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase ou seus fragmentos ou para a identificação de celulase,por exemplo, genes de enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase. Em um aspecto, a sonda compreende pelo menos
cerca de 10 bases consecutivas de um ácido nucléico da invenção.Alternativamente, uma sonda da invenção pode ser pelo menos cerca de 5,6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,21,22,23, 24, 25, 30, 35,40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 ou cerca de 10 to 50,cerca de 20 a 60 cerca de 30 a 70, bases consecutivas de uma seqüência
como indicada em um ácido nucléico da invenção. A sondas identificam umácido nucléico por ligação e/ou hibridização. As sondas podem ser usadasem conjunto da invenção, ver discussão abaixo, incluindo, por exemplo,conjuntos capilares. A sondas da invenção podem também ser usadas paraisolar outros ácidos nucleicos ou polipeptídeos.
Os ácidos nucleicos recombinantes ou isolados da invenção, as
seqüências complementares aos mesmos, ou um fragmentocompreendendo pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 50, 75, 100,150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências dainvenção, ou as seqüências complementares aos mesmos podem também
ser usadas como sondas para determinar se uma amostra biológica, talcomo uma amostra de solo, contém um organismo tendo uma seqüência deácidos nucleicos da invenção ou um organismo a partir do qual o ácidonucléico foi obtido. Em tais procedimentos, uma amostra biológicapotencialmente abrigando o organismo a partir do qual o ácido nucléico foi
isolado é obtido e ácidos nucleicos são obtidos a partir da amostra. Osácidos nucleicos são postos em contato com a sonda sob condições quepermitem que a sonda especificamente hibridize para dar quaiserseqüências complementares a partir das quais estão presentes ali.
Onde necessário, condições que permitem que a sondaespecificamente hibridize para dar seqüências complementares podem serdeterminadas por colocação da sonda em contato com seqüências complementares a partir de amostras conhecidas como contendo aseqüência complementar bem como controlar seqüências que não contém aseqüência complementar. Condições de hibridização, tais como aconcentração de sal do tampão de hibridização, a concentração deformamida do tampão de hibridização, ou a temperatura de hibridização, podem ser variadas para identificar condições que permite que a sondahibridize especificamente para dar ácidos nucléicos complementares.
Se a amostra contiver o organismo a partir do qual o ácidonucléico foi isolado, hibridização específica da sonda é então detectada.Hibridização pode ser detectada por marcação da sonda com um agentedetectável tal como um isótopo radioativo, um corante fluorescente ou umaenzima capaz de ligar catalisação da construção de um produto detectável.
Muitos métodos para o uso das sondas marcadas para detectara presença de ácidos nucléicos complementares em uma amostra sãofamiliares por aqueles versados na técnica. Estes incluem Southern Blots,Northern Blots, procedimentos de hibridização de colônia e manchas porponto. Protocolos para cada um destes procedimentos são providos emAusubel e outros Current Protocolos in Molecular Biology, John Wiley 503Sons, Inc. (1997) e Sambrook et al, Molecular Cloning: A Laboratory Manual2nd Ed., Cold Spring Harbor Laboratory Press (1989).
Alternativamente, mais do que uma sonda (pelo menos uma daqual é capaz de ligar especificamente hibridização para dar quaisquerseqüências complementares que estão presentes na amostra de ácidonucléico), podem ser usadas em uma reação de ampliação para determinarse a amostra contém um organismo contendo a seqüência de ácidos nucléicos da invenção (por exemplo, um organismo a partir do qual o ácidonucléico foi isolado). Em um aspecto, as sondas compreendemoligonucleotídeos. Em um aspecto, a reação de ampliação podecompreender uma reação de PCR. Protocolos de PCR são descritos emAusubel and Sambrook, supra. Alternativamente, a ampliação podecompreender uma reação de cadeia de ligase, 3SR, ou reação dedeslocamento de filamento. (Ver Barany, F., "The Ligase Chain Reaction in a PCR World", PCR methods and Applications 1:5-16, 1991; E. Fahy e outros,"Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR Methods andApplications 1:25-33, 1991; and Walker G.T. e outros, "Strand DisplacementAmplification-an Isothermal in vitro DNA Amplification Technique", Nucleic
Acid Research 20:1691-1696, 1992). Em tais procedimentos, os ácidosnucléicos na amostra são postos em contato com as sondas, a reação deampliação é realizada e qualquer produto de ampliação resultante édetectado. Um produto de ampliação pode ser detectado por realização deeletroforese de gel nos produtos de reação e manchamento do gel com um
intercalador tal como brometo de etídio. Alternativamente, uma ou mais dasondas podem ser marcadas com isótopo radioativo e a presença de umproduto de ampliação ratioativo pode ser detectado por auto-radiografiadepois de eletroforese de gel.
Sondas derivadas das seqüências próximas da extremidade das
seqüências da invenção, podem também ser usdas nos procedimentos deintinerantes de cromossoma para identificar clones contendo seqüênciasgenômicas localizadas adjacentes às seqüências da invenção. Tais métodospermitem o isolamento dos genes que codificam proteínas adicionais doorganismotiospedeiro.
Em um aspecto, os ácidos nucléicos recombinantes ou isolados
da invenção, as seqüências complementares aos mesmos, ou um fragmentocompreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150,200, 300, 400, ou 500 ou mais bases consecutivas de uma das seqüênciasda invenção, ou as seqüências complementares aos mesmos são usadas
como sondas para identificar e isolar ácidos nucléicos relacionados. Emalguns aspectos, os ácidos nucléicos relacionados podem ser cDNAs ouDNAs genômicos oriundos de organismos outros que não aquele a partir doqual o ácido nucleico foi isolado. Por exemplo, os outros organismos podemser organismos relacionados. Em tais procedimentos, uma amostra de ácidonucleico é posta em contato com a sonda sob condições que permitem asonda especificamente hibridizar para dar seqüências relacionadas. Hibridização da sonda para dar ácidos nucléicos do organismo relacionado éentão detectada usando-se qualquer um dos métodos descritos acima.
Por variação da severidade das condições de hibridizaçãousadas para identificar ácidos nucléicos, tais como cDNAs ou DNAsgenômicos, que hibridizam para dar uma sonda detectável, ácidos nucléicos tendo níveis diferentes de homologia à sonda podem ser identificados eisolados. Severidade pode ser variada por condução da hibridização atemperatura variáveis abaixo das temperaturas de fusão das sondas. Atemperatura de fusão, Tm é a temperatura (sob concentração iônica e pHdefinidos) a qual 50% da seqüência alvo hibridiza para dar uma sonda perfeitamente complementar. Condições muito rigorosas são selecionadas aserem iguais a ou cerca de 5°C mais baixas do que a Tm para a sondaparticular. A temperatura de fusão da sonda pode ser calculada usando-se aseguir as fórmulas: —
Para sondas entre 14 e 70 nucleotídeos de comprimento a temperatura de fusão ® é calculada usando-se a fórmula: Tm = 81,5+16,6(log[Na+])+0,41 (fração G+C)-(600/N) onde Néo comprimento da sonda.
Se a hibridização for realizada em uma solução contendoformamida, a temperatura de fusão pode ser calculada usando-se aequação: Tm = 81,5+16,6(log [Na+])+0,41 (fração G+C)-(0,63% de formamida)-(600/N) onde Néo comprimento da sonda.
Pré-hibridização pode ser realizada em 6X SSC, 5X de reagentede Denhardt, 0,5% de SDS, 100 u.g de DNA de esperma de salmãofragmentado ou desnaturado ou 6X SSC, 5X reagente de Denhardt, 0,5% deSDS, 100 \ig DNA de esperma de salmão fragmentado desnaturado, 50% de formamida. As fórmulas para SSC e soluções de Denhardt são listados emSambrook e outros, supra.
Em um aspecto, hibridização é conduzida por adição da sondadetectável para dar as soluções de prehibridização listadas acima. Onde asonda compreende DNA de filamento duplo, é desnaturada antes da adiçãoà solução de hibridização. Em um aspecto, o filtro é posto em contato com asolução de hibridização por um período suficiente de tempo para permitirque a sonda hibridize para dar cDNAs ou DNAs genômicos contendoseqüências complementares aos mesmos ou homólogos aos mesmos. Parasondas acima de 200 nucleotídeos de comprimento, a hibridização pode serrealizada a 15-25°C abaixo da Tm. Para sondas mais curtas, tais comosondas de oligonucleotídeo, a hibridização pode ser conduzida a 5-10°C
abaixo da Tm. Em um aspecto, para a hibridizaçãos em 6X SSC, ahibridização é conduzida a cerca de 68°C. Usualmente, para hibridizaçõesem 50% de formamida contendo soluções, a hibridização é conduzida acerca de 42°C.
Inibição de Expressão de Enzimas de celulase
A invenção prove ácidos nucléicos complementares (por
exemplo, seqüências anti-sentido a) aos ácidos nucléicos da invenção, porexemplo, ácidos nucléicos de codificação de enzima de celulase, porexemplo, ácidos nucléicos compreendendo anti-sentido, siRNA, miRNA,ribozimas. Ácidos nucléicos da invenção compreendendo seqüências anti-
sentido podem ser capazes de ligar inibição do transporte, união outanscrição de enzima de genes de codificação de celulase. A inibição podeser efetuada através do direcionamento de DNA genômico ou RNAmensageiro. A tanscrição ou função de ácido nucléico direcionado pode serinibida, por exemplo, por hibridização e/ou clivagem. Um conjunto exemplar
de inibidores providos pela presente invenção inclui oligonucleotídeos quesão capazes de ou ligar celulase, por exemplo, gene de enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase oumensagem, em qualque caso prevenção ou inibição da produção ou funçãode uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase,
manase e/ou betaglicosidase. A associação pode ser através de seqüênciade hibridização específica. Uma outra classe útil de inibidores incluioligonucleotídeos que causam inativação ou clivagem de celulase, porexemplo, mensagem de enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase. O oligonucleotídeo pode ter atividade de enzima quecausa tal clivagem, tais como ribozimas. O oligonucleotídeo pode serquimicamente modificado ou conjugado a uma enzima ou composição capaz de ligar clivagem do ácido nucléico complementar. A união deigonucleodídeos muito diferente pode ser classificada quanto aqueles daatividade desejada. Assim, a invenção prove várias composições para ainibição de celulase, por exemplo, endoglucanase, expressão de enzima decelobioidrolase, manase e/ou betaglicosidase sobre um nível de ácido nucléico e/ou proteína, por exemplo, anti-sentido, siRNA, miRNA e ribozimascompreendendo celulase, por exemplo, seqüências de enzimas deendoglucanase, celobioidrolase, manase e/ou beta- glicosidase da invençãoe a anticelulase, por exemplo, anticorpos de antiendoglucanase,anticelobioidrolase e/ou antibetaglicosidase da invenção.
Inibição de celulase, por exemplo, expressão de enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase pode ter umavariedade de aplicações industriais. Por exemplo, inibição de celulase, porexemplo, expressão de enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase pode diminuir ou prevenir danificação. Em um aspecto,uso de composições da invenção que inibem a expressão e/ou atividade decelulase, por exemplo, enzimas de endoglucanase, celobioidrolase, manasee/ou betaglicosidase, por exemplo, anticorpos, ribozimas, siRNA , miRNA eoligonucleotídeos anti-sentido são usados para diminuir ou preventirdanificação. Assim, em um aspecto, a invenção prove métodos e composições compreendendo aplicação sobre uma planta ou um produto deplanta (por exemplo, um cereal, um grão, uma fruta, semente, raiz, folha,etc.) anticorpos, oligonucleotídeos anti-sentido, ribozimas, siRNA e miRNAda invenção para diminuir ou prevenir danificação. Estas composiçõestambém podem ser expressas pela planta (por exemplo, um planta transgênica) ou um outro organismo (por exemplo, uma bactéria ou outromicroorganismo transformado com uma celulase, por exemplo, gene deenzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase dainvenção).
As composições da invenção para a inibição de celulase, porexemplo, expressão de enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase (por exemplo, anti-sentido, iRNA, ribozimas, anticorpos)5 podem ser usadas como composições farmacêuticas, por exemplo, comoagentes antipatógeno ou em outras terapias, por exemplo, comoantimicrobianos para, por exemplo, Salmonella.Oligonucleotídeos anti-sentido
A invenção prove oligonucleotídeos anti-sentido capaz de ligar
ligação de celulase, por exemplo, mensagem de enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase que, em um aspecto, podeinibir celulase, por exemplo, atividade de enzima de endoglucanase,celobioidrolase, manase e/ou betaglicosidase por direcionamento de mRNA.Estratégias para o projeto de oligonucleotídeos anti-sentido são bem-
descritas na literatura científica ou de patente, e o técnico versado pode- projetar -tal- -celulase, -por--exemplo, oligonucleotídeos de enzima deendoglucanase, celobioidrolase, manase e/ou betaglicosidase usando-se osnovos reagentes da invenção. Por exemplo, protocolos de mapeamento deRNA/andamento de gene para triar quanto a oligonucleotídeos anti-sentido
eficazes são bem-conhecidas na técnica, ver, por exemplo, Ho (2000)Methods Enzymol. 314:168-183, descrevendo um ensaio de mapeamento deRNA, que é baseado nas técnicas moleculares padrão para prover umamétodo fácil e de confiança para prover um método fácil e de confiança paraseleção de seqüência anti-sentido potente. Ver também Smith (2000) Eur. J.
Pharm. Sei. 11:191-198.
Ácidos nucléicos de ocorrência natural são usados comooligonucleotídeos anti-sentido. Os oligonucleotídeos anti-sentido podem serde qualquer comprimento; por exemplo, em aspectos alternativos, osoligonucleotídeos anti-sentido estão entre cerca de 5 a 100, cerca de 10 a
80, cerca de 15 a 60, cerca de 18 a 40. O ótimo comprimento pode serdeterminado por triagem rotineira. Os oligonucleotídeos anti-sentido podemestar presentes a qualquer concentração. A ótima concentração pode serdeteminada por triagem rotineira. Uma ampla variedade de análogos deácido nucléico e nucleotídeo sintéticos ou de ocorrência natural são bem-conhecidos que podem levar em conta este problema potencial. Porexemplo, ácidos nucléicos de peptídeo (PNAs) contendo cadeias principaisnão-iônicas, tais como unidades de N-(2-aminoetil) glicina podem serusadas. Oligonucleotídeos anti-sentido tendo ligações de fosforo-tiloatopodem ser também usados, como descrito na WO 97/03211; WO 96/39154;Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics,ed. Agrawal (Humana Press, Totowa, NJ., 1996). Oligonucleotídeos anti- sentido tendo análogos de cadeia principal de DNA sintéticos providos pelainvenção podem também incluir ácidos nucléicos de fosforo-ditioato,metilfosfonato, fosforamidato, alquil fosfotriéster, sulfamato, 3'-tioacetal,metileno(metiliminó), 3'-N-carbamato, e morfolino carbamato, como descritoacima.
Metodologia de química combinatória pode ser usada para criarvastos números-de oligonucleotídeos que podem ser rapidamente triadosquanto oligonucleotídeos específicos que têm afinidades e especificidade deligação apropriadas em relação a qualquer alvo, tal como celulase de sentidoe anti-sentido, por exemplo, seqüências de enzimas de endoglucanase, celobioidrolase, manase e/ou beta- glicosidase da invenção (ver, porexemplo, Gold (1995) J. of Biol. Ghem. 270:13581-13584).Ribozimas inibitórias
A invenção prove ribozimas capazes de ligar ligação de celulase,por exemplo, mensagem de enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase. Estas ribozimas podem inibir celulase, porexemplo, atividade de enzima de endoglucanase, celobioidrolase, manasee/ou betaglicosidase por, por exemplo, direcionamento de mRNA.Estratégias para o projeto de ribozimas e seleção da celulase, por exemplo,seqüência anti-sentido específica de enzima endoglucanase, celobioidrolase, manase e/ou betaglicosidase para o direcionamento alvo são bem descritasna literatura científica e de patente, e o técnico versado pode projetar taisribozimas usando-se os novos reagentes da invenção. Ribozimas agem porligação um um RNA alvo através da porção de ligação de RNA alvo de umaribozima que é mantida na proximidade próxima a uma porção enzimática doRNA que cliva o RNA alvo. Assim, a ribozima reconhece e liga um RNA alvoatravés do emparelhamento de base compelementar, e uma vez que ligado ao sítio correto, age enzimaticamente para clivar e inativar o RNA alvo.Clivagem de um RNA alvo de tal modo destruirá sua capacidade de dirigirsíntese de uma proteína codificada se a clivagem ocorrer na seqüência decodificação. Depois de uma ribozima ter ligado e clivado seu RNA alvo, elapode ser liberada a partir do RNA para ligar e clivar novos alvos repetidamente.
Em algumas circunstâncias, a natureza enzimática de umaribozima pode ser vantajosa sobre outras tecnologias, tal como tecnologiaanti-sentido (onde uma molécula de ácido nucléico simplesmente se liga aum ácido nucléico alvo para bloquear sua tanscrição, tradução ou associação com um outra molécula) como a concentração eficaz de ribozimanecessária para efetuar um tratamento terapêutico pode ser mais baixo doque aquela de um oligonucleotídeo anti-sentido. Esta vantagem potencialreflete a capacidade da ribozima de agir enzimaticamente. Assim, umamolécula de ribozima única é capaz de clivar muitas moléculas de RNA alvo.
Em um aspecto, a ribozima é um inibidor altamente específico, com aespecificidade de inibição dependendo não apenas do mecanismo deemparelhamento de base de ligação, mas também no mecansimo pelo quala molécula inibe a expressão do RNA ao qual ele liga. Isto é, a inibição écausada por clivagem do alvo de RNA e assim especificidade é definida como a razão da taxa de clivagem do RNA direcionado sobre a taxa declivagem de RNA não direcionado. Este mecanismo de clivagem édependente de fatores adicionais àqueles envolvidos no emparelhamento debase. Assim, a especificidade de ação de uma ribozima pode ser maior doque aquela de ligação de oligonucleotídeo anti-sentido do mesmo sítio de
RNA.
A ribozima da invenção, por exemplo, uma molécula de RNA deribozima enzimática, pode ser formada em uma motivo de cabeça demartelo, um motivo de grampo de cabelo, como um motivo de vírus dehepatite delta, um motivo de íntron de grupo I e/ou um RNA de tipo RnasePem associação com uma seqüência guia de RNA. Exemplos de motivos decabeça de martelo são descritos por, por exemplo, Rossi (1992) Aids Research and Human Retroviruses 8:183; motivos de grampo de cabelo porHampel (1989) Biochemistry 28:4929, e Hampel (1990) Nuc. Acids Res.18:299; o motivo de vírus de hepatite delta por Perrotta (1992) Biochemistry31:16; o motivo de RNaseP por Guerrier-Takada (1983) Cell 35:849; e oíntrom de grupo I por Cech a patente U.S. nQ 4.987.071. A recitação destes
motivos específicos não é destinado a ser limitante. Aqueles versados natécnica reconhecerão que uma ribozima da invenção, por exemplo, umamolécula de RNA enzimática desta invenção, pode ter um sítio de ligação desubstrato específico complementar a uma ou mais das regiões de RNA degene alvo. Uma ribozima da invenção pode ter uma seqüência de
nucleotídeos dentro de ou envolvendo que sítio de ligação de substrato que
prove uma atividade de-clinagem de RNA à molécula. ---------
Interferência de RNA (RNAi)
Em um aspecto, a invenção prove uma molécula inibitória deRNA, uma molécula assim chamada "RNAi", compreendendo uma celulase,
por exemplo, seqüência de enzimas de endoglucanase, celobioidrolase,manase e/ou betaglicosidase da invenção. A molécula de RNAi podecompreender uma molécula de RNA de filamento duplo (dsRNA), porexemplo, siRNA e/ou miRNA. A molécula de RNAi, por exemplo, siRNA e/oumiRNA, pode inibir expressão de uma celulase, por exemplo, gene de
enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase.Em um aspecto, a molécula de RNAi, por exemplo, siRNA e/ou miRNA, écerca de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 ou mais nucleotídeosdúplex de comprimento. Enquanto a invenção não é limitada por qualquermecanismo particular de ação, o RNAi pode entrar em uma célula e causar a
degradação de um RNA de filamento único (ssRNA) de seqüências similaresou idênticas, incluindo mRNAs endógenos. Quando uma célula é exposta aRNA de filamento duplo (dsRNA), mRNA a partir do gene homólogo éseletivamente degradado por um processo chamado de Interferência deRNA (RNAi). Um mecanismo básico possível atrás de RNAi é o rompimentode emparelhamento de RNA de filamento duplo (dsRNA) de uma seqüênciade genes específica em motivos curtos chamados RNA de inteferencia curto,que disparam a degradação de mRNA que emparelha sua seqüência. Emum aspecto, os RNAi' s da invenção são usados em produtos terapêuticosde sileciamento de gene, ver, por exemplo, Shuey (2002) Drug Discov.Today 7: 1040-1046. Em um aspecto, a invenção prove métodos paraseletivamente degradar RNA usando-se as moléculas de RNAi, por exemplo,siRNA e/ou miRNA, da invenção. O processo pode ser praticado in vitro, exvivo ou in vivo. Em um aspecto, as moléculas de RNAi da invenção podemser usadas para gerar uma mutação de perda de função em uma célula, umórgão ou um animal. Métodos para a produção e uso de moléculas de RNAi,por exemplo, siRNA e/ou miRNA, para seletivamente degradar RNA sãobem-conhecidos na técnica, ver, por exemplo, as patentes U.S. n56.506.559; 6.511.824; 6.515.109; 6.489.127.
Modificação de ácidos nucléicos - Produção de enzimasvariantees da invenção -
A invenção prove métodos de geração de variantes dos ácidosnucléicos da invenção, por exemplo, aquelas que codificam uma celulase,por exemplo, enzima de endoglucanase, celobioidrolase, manase e/oubetaglicosidase. Estes métodos podem ser repetidos ou usados em váriascombinações para gerar celulase, por exemplo, enzimas de endoglucanase,celobioidrolase, manase e/ou betaglicosidase tendo uma atividade alteradaou diferente ou uma estabilidade alterada ou diferente a partir da qual deuma celulase, por exemplo, enzima de endoglucanase, celobioidrolase,manase e/ou betaglicosidase codificada pelo ácido nucléico de modelo.Estes métodos também podem ser repetidos ou usados em váriascombinações, por exemplo, para gerar variações em gene/expressão de mensagem, tradução de mensagem ou estabilidade de mensagem. Em umoutro aspecto, a composição genética de uma célula é alterada por, porexemplo, modificação de um gene homólogo ex vivo, seguido por suareinserção para dentro da célula.
Por exemplo, em um aspecto, a invenção prove ácidos nucléicosrecombinantes ou isolados tendo uma seqüência compreendendo pelomenos uma modificação de resíduo de base de nucleotídeo de SEQ ID NO:163, em que a modificação compreende uma ou mais das seguintesmudanças: um nucleotídeo a qualquer uma das posições 265 a 267 émodificado em CGT, CGC, CGA, CGG, AGA ou AGG; um nucleotídeo aqualquer uma das posições 307 a 309 é modificado em GGT, GGC, GGA ouGGG; um nucleotídeo a qualquer uma das posições 328 a 330 é modificado
em GGT, GGC, GGA ou GGG; um nucleotídeo a qualquer uma das posições340 a 342 é modificado em TTA, TTG, CTT, CTC, CTA ou CTG; umnucleotídeo a qualquer uma das posições 469 a 471 é modificado em TCT,TCC, TCA, TCG, AGT ou AGC; um nucleotídeo a qualquer uma dasposições 1441 a 1443 é modificado em TTT ou TTC; um nucleotídeo a
qualquer uma das posições 1648 a 1650 é modificado em AAT ou A AC; ou,um nucleotídeo a qualquer uma das posições 1768 to 1770 é modificado emCGT, CGC, CGA, CGG, AGA ou AGG. Em um outro aspecto, a invençãoprove polipeptídeos recombinantes ou isolados tendo uma seqüênciacompreendendo pelo menos uma modificação de resíduo de aminoácido de
SEQ ID NO: 164, em que a modificação compreende uma ou mais dasseguintes mudanças: uma metionina na posição de aminoácido 89 émodificada em arginina; uma fenilalanina na posição de aminoácido 103 émodificada em glicina; uma prolina na posição de aminoácido 110 émodificada em glicina; uma tirosina na posição de aminoácido 114 é
modificada em leucina; uma alanina na posição de aminoácido 157 émodificada em serina; um triptofano na posição de aminoácido 481 émodificado em fenilalanina; uma prolina na posição de aminoácido 550 émodificada em asparagina; ou uma glicina na posição de aminoácido 590 émodificada em arginina.
Em um outro aspecto, a invenção prove ácidos nucléicos
recombinantes ou isolados tendo uma seqüência compreendendo ummodificação de seqüência de resíduo de nucleotídeo de uma seqüênciaexemplar da invenção (por exemplo, SEQ ID NO:1, SEQ ID NO:3, SEQ IDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO: 11, etc.) em que amodificação compreende uma ou mais das seguintes mudanças: umnucleotídeo no equivalente de qualquer uma de posições 265 a 267 de SEQ ID NO: 163 são mudadas em CGT, CGC, CGA, CGG, AGA ou AGG; umnucleotídeo no equivalente de qualquer uma de posições 307 a 309 de SEQID NO: 163 são mudadas em GGT, GGC, GGA ou GGG; um nucleotídeo noequivalente de qualquer uma de posições 328 a 330 de SEQ ID NO: 163 sãomudadas em GGT, GGC, GGA ou GGG; um nucleotídeo no equivalente de qualquer uma de posições 340 a 342 de SEQ ID NO: 163 são mudadas emTTA, TTG, CTT, CTC, CTA ou CTG; um nucleotídeo no equivalente dequalquer uma de posições 469 a 471 de SEQ ID NO: 163 são mudadas emTCT, TCC, TC A, TCG, AGT ou AGC; um nucleotídeo no equivalente deposições 1441 a 1443 de SEQ ID NO: 163 são mudadas em TTT ou TTC; um nucleotídeo no equivalente de qualquer uma de posições 1648 a 1650 deSEQ ID NO:163 são mudadas em AAT ou AAC; ou um nucleotídeo noequivalente de qualquer uma de posições 1768 a 1770 de SEQ ID NO: 163são mudadas em CGT, CGC, CGA, CGG, AGA ou AGG.
Em um outro aspecto, a invenção prove ácidos nucléicos recombinantes ou isolados tendo uma seqüência compreendendo ummodificação de seqüência de resíduo de nucleotídeo de qualquer ácidonucléico da invenção, em que a modificação compreende uma ou mais dasseguintes mudanças: um nucleotídeo no equivalente de qualquer uma deposições 265 a 267 de SEQ ID NO: 163 são mudadas em CGT, CGC, CGA, CGG, AGA ou AGG; um nucleotídeo no equivalente de qualquer uma deposições 307 a 309 de SEQ ID NO: 163 são mudadas em GGT, GGC, GGAou GGG; um nucleotídeo no equivalente de qualquer uma de posições 328 a330 de SEQ ID NO: 163 são mudadas em GGT, GGC, GGA ou GGG; umnucleotídeo no equivalente de qualquer uma de posições 340 a 342 de SEQID NO: 163 são mudadas em TTA, TTG, CTT, CTC, CTA ou CTG; umnucleotídeo no equivalente de qualquer uma de posições 469 a 471 de SEQID NO: 163 são mudadas em TCT, TCC, TC A, TCG, AGT ou AGC; umnucleotídeo no equivalente de posições 1441 a 1443 de SEQ ID NO: 163 sãomudadas em TTT ou TTC; um nucleotídeo no equivalente de qualquer umade posições 1648 a 1650 de SEQ ID NO:163 são mudadas em AAT ou AAC;ou, um nucleotídeo no equivalente de qualquer uma de posições 1768 a 1770 de SEQ ID NO: 163 são mudadas em CGT, CGC, CGA, CGG, AGA ouAGG.
Em um outro aspecto, a invenção prove polipeptídeosrecombinantes ou isolados tendo uma seqüência compreendendo umamodificação de resíduo de aminoácido de uma seqüência exemplar da
invenção (por exemplo, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ IDNO:8, SEQ ID NO:10, etc.) em que a modificação compreende uma ou maisdas seguintes mudanças: uma aminoácido no equivalente da metionina naposição de aminoácido 89 de SEQ ID NO: 164 é mudada em uma arginina;uma aminoácido no equivalente da fenilalanina na posição de aminoácido
103 de SEQ ID NO: 164 é mudada em uma glicina; uma aminoácido noequivalente da prolina na posição de aminoácido 110 de SEQ ID NO: 164 émudada em uma glicina; uma aminoácido no equivalente da tirosina naposição de aminoácido 114 de SEQ ID NO: 164 é mudada em uma leucina;uma aminoácido no equivalente da alanina na posição de aminoácido 157 de
SEQ ID NO: 164 é mudada em uma serina; uma aminoácido no equivalentedo triptofano na posição de aminoácido 481 de SEQ ID NO: 164 é mudadaem uma fenilalanina; uma aminoácido no equivalente da prolina na posiçãode aminoácido 550 de SEQ ID NO: 164 é mudada em uma asparaginae; ouuma aminoácido no equivalente da glicina na posição de aminoácido 590 de
SEQ ID NO: 164 é mudada em um arginina.
Em um outro aspecto, a invenção prove polipeptídeosrecombinantes ou isolados tendo uma seqüência compreendendo umamodificação de resíduo de aminoácido de qualquer polipeptídeo dainvenção, em que a modificação compreende uma ou mais das seguintes
mudanças: uma aminoácido no equivalente da metionina na posição deaminoácido 89 de SEQ ID NO: 164 é mudada em uma arginina; umaaminoácido no equivalente da fenilalanina na posição de aminoácido 103 deSEQ ID NO: 164 é mudada em uma glicina; uma aminoácido no equivalenteda prolina na posição de aminoácido 110 de SEQ ID NO : 164 é mudada emuma glicina; uma aminoácido no equivalente da tirosina na posição deaminoácido 114 de SEQ ID NO: 164 é mudada em uma leucina; uma aminoácido no equivalente da alanina na posição de aminoácido 157 deSEQ ID NO: 164 é mudada em uma serina; uma aminoácido no equivalentedo triptofano na posição de aminoácido 481 de SEQ ID NO: 164 é mudadaem uma fenilalanina; uma aminoácido no equivalente da prolina na posiçãode aminoácido 550 de SEQ ID NO: 164 é mudada em uma asparagina; ou uma aminoácido no equivalente da glicina na posição de aminoácido 590 deSEQ ID NO: 164 é mudada em uma arginina.
Um ácido nucléico da invenção pode ser alterado por qualquermeio. Por exemplo, métodos aleatórios e estocáticos, ou, métodos nãoestocásticos, ou "evolução dirigida,", ver, por exemplo, a patente U.S. n9 6.361.974. Métodos para mutação aleatória de genes são bem-conhecidosna técnica, ver, por exemplo, a patente U.S. ne 5.830.696. Por exemplo,mutágenos podem ser usados para aleatoriamente mutar um gene.Mutágenos incluem, por exemplo, irradiação gama e luz ultravioleta, ou ummutágeno químico, por exemplo, mitomicina, ácido nitroso, psoralénos
fotoativados, sozinhos ou em combinação, para induzir rompimentos de DNAinduzíveis para reparar por recombinação. Outros mutágenos químicosincluem, por exemplo, bissulfito de sódio, ácido nitroso, hidroxilamina,hidrazina ou ácido fórmico. Outros mutágenos são análogos de precursoresde nucleotídeo, por exemplo, nitrosoguanidina, 5-bromouracila, 2-
aminopurina, ou acridina. Estes agentes podem ser adicionados a umareação de PCR no lugar do precursor de nucleotídeo desse modo mutando aseqüência. Agentes de intercalação tais como proflavina, acriflavina,quinacrina e similares podem também ser usados.
Qualquer técnica em biologia molecular pode ser usada, porexemplo, mutagênese de PCR aleatória, ver, por exemplo, Rice (1992) Proc.Natl. Acad. Sei. USA 89:5467-5471; ou, mutagêse de cassete múltiplocombinatorial, ver, por exemplo, Crameri (1995) Biotechniques 18:194-196.Alternativamente, ácidos nucléicos, por exemplo, genes, podem serreagrupados depois da fragmentação "aleatória" ou "estocásticas", ver, porexemplo, as patentes U.S. nQs 6.291.242; 6.287.862; 6.287.861; 5.955.358;5.830.721; 5.824.514; 5.811.238; 5.605.793. Em aspectos alternativos, modificações, adições ou deleçãos são introduzidos por PCR propenso aerro, embaralhamento, mutagenese direcionada para oligonucleotídeo, PCRde conjunto, mutagenese de PCR sexual, mutagenese in vivo, mutagenesede cassete, mutagenese de conjunto repetido, mutagenese de conjuntoexponencial, mutagenese de específico de sítio, reagrupamento de gene,
mutagenese de saturação de sítio de gene(GSSM), reagrupamento deligação sintético (SLR), recombinação, recombinação de seqüência repetida,mutagêse de DNA modificada por fosfotioato, mutagêse de modelo contendouracila, mutagenese dúplex formada por lacuna, mutagenese de reparo dedesemparelhamento de ponto, mutagenese de cepa hospedeira deficiente
de reparo, mutagenese química, mutagenese radiogênica, mutagenese dedeleção, mutagenese de restrição-seleção, mutagenese de restrição-purificação, síntese de gene artificial, mutagenese de conjunto, criação demultímero de ácido nucléico quimérico, mutagenese de saturaçãocromossomal (CSM) e/ou uma combinação destes e outros métodos.
A seguir as publicações descrevem uma variedade de
procedimentos de recombinação repetidos e/ou métodos que podem serincorporados nos métodos da invenção: Stemmer (1999) "Molecularbreeding of viruses for targeting and other clinicai properties" TumorTargeting 4:1-4; Ness (1999) Nature Biotechnology 17:893-896; Chang
(1999) "Evolution of a cytokine usando-se DNA family shuffling" NatureBiotechnology 17:793-797; Minshull (1999) "Proteína evolution by molecularbreeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999)"Directed evolution of thymidine kinase for AZT phosphorlation using DNAfamily shuffling" Nature Biotechnology 17:259-264; Crameri (1998) "DNA
shuffling of a family of genes from diverse species accelerates directedevolution" Nature 391:288-291; Crameri (1997) "Molecular evolution of anarsenate detoxification pathway by DNA shuffling," Nature Biotechnology:436-438; Zhang (1997) "Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sei. USA 94:4504-4509; Patten e outros (1997) "Applications of DNA Shuffling to Pharmaceuticals and Vaccines" Current Opinion in Biotechnology 8:724-733; 5 Crameri e outros (1996) "Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2:100-103; Gates e outros (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor 'headpiece dimer' Journal of Molecular Biology 255:373-386; Stemmer (1996) "Sexual PCR and Assembly PCR" In: The Encyclopedia of
Molecular Biology. VCH Publishers, New York, pp.447-457; Crameri and Stemmer (1995) "Combinatorial multiple cassete mutagenesis creates ali the permutations of mutant and wildtype cassettes" BioTechniques 18:194-195; Stemmer e outros (1995) "Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides" Gene, 164:49-53;
Stemmer (1995) "The Evolution of Molecular Computation" Science 270: 1510; Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling " Nature 370:389-391; and Stemmer (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution". Proc. Natl. Acad. Sei. USA 91:10747-10751.
Métodos mutacionais de geração de diversidade incluem, por exemplo, mutagênese dirigido por sítio (Ling e outros (1997) "Approaches to DNA mutagenesis: an overview" Anal Biochem. 254(2): 157-178; Dale e outros (1996) "Oligonucleotide-directed random mutagenesis using the
phosphrotioate method" Method Mol. Biol. 57:369-374; Smith (1985) "In vitro mutagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985) "Strategies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter (1986) "Site-directed mutagenesis" Biochem. J. 237:1-7; and Kunkel (1987) "The efficiency of oligonucleotide directed mutagenesis" in Nucleic
Acids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds., Springer Verlag, Berlin)); mutagênese usando-se modelos contendo uracila (Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypicselection" Proc. Natl. Acad. Sei. USA 82:488-492; Kunkel e outros (1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Methods in Enzymol. 154, 367-382; and Bass e outros (1988) "Mutant Trp repressors With new DNA-binding specificities" Science 242:240-245); 5 mutagênese direcionada para oligonucleotídeo (Methods in Enzymol. 100: 468-500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucleotide-directed mutagenesis using M13- derived vectors: an efficient and general procedure for the produetion of point mutations in any DNA fragment" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983)
"Oligonucleotide-directed mutagenesis of DNA fragmentos cloned into M13 vectors" Methods in Enzymol. 100:468-500; and Zoller (1987) Oligonucleotide-directed mutagenisis: a simple methods usando-se two oligonucleotide primers and a single-stranded DNA template" Methods in Enzymol. 154:329-350); phosphorothioate-modified DNA mutagenesis
(Taylor (1985) "The uso de phsphrothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764; Taylor (1985) "The rapid generation of oligonucleotide-directed mutations at high frequency using phspgrotioate-modified DNA" Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986) "Inhibition de restriction endonuclease
Nci I clivagem by phosphorotioate groups and its application to oligonucleotide directed mutagenesis" Nucl. Acids Res. 14: 9679-9698; Sayers (1988) "Y-T Éxonucleases in oligonucleotide phosphorotioate-based directed mutagenisis" Nucl. Acids Res. 16:791-802; and Sayers e outros (1988) "Strand specific cleavage of phosphorothioate-containing DNA by
reaction with restriction endonucleases in the presence of ethidium bromide" Nucl. Acids Res. 16: 803-814); muagênese usando-se DNA dúplex formado por lacuna (Kramer e outros (1984) "The gapped dúplex DNA approach to oligonucleotide-directed mutation construetion" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "Oligonucleotide-directed
construetion of mutations através de lacunaped dúplex DNA" 154:350-367; Kramer (1988) "Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construetion of mutations" Nucl.Acids Res. 16: 7207; and Fritz (1988) "Oligonucleotide-directed construction of mutations: a lacunaped dúplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999).
Protocolos adicionais que podem ser usados para praticar a invenção incluem reparo de desemparelhamento por ponto (Kramer (1984) "Point Mismatch Repair" Cell 38:879-887), mutagênese usando-se cepas hospedeiras deficientes de reparo (Carter e outros (1985) "Improved oligonucleotide site- directed mutagenesis usando-se M13 vectors" Nucl. Acids Res. 13: 4431-4443; and Carter (1987) "Improved oligonucletide
directed mutagenesis using M13 vectors" Methods in Enzymol. 154: 382-403), mutagênese de deleção (Eghtedarzadeh (1986) "Use of oligonucleotide to generate large deletions" Nucl. Acids Res". 14: 5115), seleção por restrição e seleção por restrição e purificação por restrição (Wells e outros (1986) "Importance of hydrogen-bond formation in stabilizing
the transition state of subtilisin" Phil. Trans. R. Soe. Lond. A 317: 415-423), mutagênese por síntese de gene total (Nambiar e outros (1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223: 1299-1301; Sakamar and Khorana (1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine
nucleotide- binding proteína (transducin)" Nucl. Acids Res. 14: 6361-6372; Wells e outros (1985) "Cassette mutagenesis s: an efficient methodo for generation of multiple mutations at defined sites" Gene 34:315-323; and Grundstrom e outros (1985) "Oligonucleotide-directed mutagenesis by microscale (shot-gun' gene synthesis" Nucl. Acids Res. 13: 3305-3316),
double-strand break repair (Mandecki (1986); Arnold (1993) "Protein engineering for unusual environments" Current Opinion in Biotechnology 4:450-455. "Oligonucleotide- directed double-strand break repair in plasmids of Escherichia coli: a method for site- specific mutagenesis " Proc. Natl. Acad. Sei. USA, 83:7177-7181). Detalhes adicionais em muitos dos métodos
acima podem ser encontrados em Methods in Enzymology Volume 154, que também descreve controles úteis para a investigação de problemas com vários métodos de mutagênese.Protocolos que podem ser usados para praticar a invenção são descritos, por exemplo, na patente U.S. nQ 5.605.793 por Stemmer (Feb. 25, 1997), "Methods for In Vitro Recombination;" a patente U.S. n- 5.811.238 por Stemmer e outros (Sep. 22, 1998)" Methods for Gerating de Polynucleotides 5 having Desired Characteristics by Iterative Selection and Recombination;" a patente U.S. nQ 5.830.721 por Stemmer e outros (Nov. 3, 1998), "DNA mutagenesis by Random Fragmentoation and Reassembly;" a patente U.S. nQ 5.834.252 por Stemmer, e outros (Nov. 10, 1998) "End-Complementary Polymerase Reaction;" a patente U.S. ne 5.837.458 por Minshull, e outros
(Nov. 17, 1998), "Methods and Compositions for Cellular and Metabolic Engineering;" WO 95/22625, Stemmer and Crameri, "Mutagenesis por Random Fragmentoation and Reassembly;" WO 96/33207 por Stemmer and Lipschutz "End Complementary Polymerase Chain Reaction;" WO 97/20078 por Stemmer and Crameri "Methods for Geration Polynucleotides
havindDesired Characteristics by Iterative Selection and Recombination;" WO 97/35966 by Minshull and Stemmer, "Methods and Compositions for Cellular and Metabolic Engineering;" WO 99/41402 por Punnonen e outros "Targeting of Genetic Vaccine Vectors;" WO 99/41383 por Punnonen e outros "Antigen Library Immunization;" WO 99/41369 por Punnonen e outros
"Genetic Vaccine Vector Engineering;" WO 99/41368 por Punnonen e outros "Optimization of Immunomodulatory Properties of Genetic Vaccines;" EP 752008 por Stemmer and Crameri, "DNA Mutagenesis by Random Fragmentation and Reassembly;" EP 0932670 por Stemmer "Evolving Cellular DNA Uptake by Recursive Sequence Recombination;" WO 99/23107
por Stemmer e outros, "Modificação of Virus Tropism and Host Range by Viral Genome Shuffling;" WO 99/21979 por Apt e outros, "Human Papillomavirus Vectors;" WO 98/31837 por dei Cardayre e outros "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination;" WO 98/27230 por Patten and Stemmer, "Methods and Composition for
Polypeptide Engineering;" WO 98/27230 por Stemmer e outros, "Mehods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection," WO 00/00632, "Methods for generating Highly Diverse Libraries,"WO 00/09679, "Métodos for Obtaining in Vitro Recombined polynucleotide sequence Banks and Resulting Sequences," WO 98/42832 by Arnold e outros, "Recombination of Polynucleotide Sequences Using Random or Defined Primers," WO 99/29902 por Arnold e outros, "Method for Creating Polynucleotide and Polypeotide Sequence," WO 98/41653 por Vind, "An in Vitro Method for Construction of a DNA Library," WO 98/41622 por Borchert e outros, "Method for Constructing a Library using DNA Shuffling," e WO 98/42727 por Pati and Zarling, "Sequence Alterations using Homologous Recombination". Protocolos que podem ser usados para praticar a invenção
(provisão de detalhes em relação a várias geração de diversidade de métodos) são descritos, por exemplo, no pedido de patente n9 de série (USSN) 09/407.800, "SHUFFLING OF CODON ALTERED GENES" por Patten e outros depositado Sep. 28, 1999; "EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION" por dei Cardayre e outros, patente U.S. n9 6,379,964; "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION" por Crameri e outros, patentes U.S. n9s 6.319.714; 6.368.861; 6.376.246; 6.423.542; 6.426.224 e PCT/US00/01203; "USE OF CODON-VARIED OLIGONUCLEOTIDE
SYNTH ESIS FOR SYNTH ETIC SHUFFLING" por Welch e outros, patente U.S. n9 6.436675; "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLIPEPTIDES HAVING DESIRED CHARACTERISTICS" por Selifonov e outros, depositado Jan. 18, 2000, (PCT/USOO/01202) e, por exemplo "MÉTODOS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" por Selifonov e outros, depositado Jul. 18, 2000 (patente U.S. n9 de série 09/618.579); "METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS" por Selifonov and Stemmer, depositado em Jan. 18, 2000 (PCT/USOO/01138); e
"SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION" por Affholter, depositado Sep. 6, 2000 (U.S. Ser. n9 09/656.549); e as patentesU.S. nes 6.177.263; 6.153.410)
Evolução não estocática , ou "evolução dirigida," métodos incluem, por exemplo, mutagêse de saturação, tais como mutagênese de saturação de sítio de gene (GSSM), reagrupamento de ligação sintético 5 (SLR), ou uma sua combinação são usados para modificar os ácidos nucléicos da invenção para gerar celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, manase e/ou betaglicosidase com propriedades novas ou alteradas (por exemplo, atividade sob condições altamente ácidas ou alcalinas, temperaturas alta ou baixa, e similares).
Polipeptídeos codificados pelos ácidos nucléicos modificados podem ser triados quanto a uma atividade antes da testagem quanto a hidrólise de glucano ou outra atividade. Qualquer modalidade de testagem ou protocolo pode ser usado, por exemplo, usando-se uma plataforma de conjunto capilar. Ver, por exemplo, as patentes U.S. n9s 6.361.974; 6.280.926;
5.939.250.
Mutagênese de saturação de sítio de gene, ou, GSSM A invenção também prove métodos para a produção de uma ensima usando-se mutagênese de saturação de sítio de gene, ou, GSSM, como descrito aqui, e também nas patentes U.S. nes 6.171.820 e 6.579.258.
Em um aspecto, iniciadores de códon contendo uma seqüência de N,N,G/T degenerada são usados para introduzir mutações de ponto para dentro de um polinucleotídeo, por exemplo, uma celulase, por exemplo, anticorpo ou enzima de endoglucanase, celobioidrolase, manase e/ou betaglicosidase da invenção, de modo a gerar um conjunto de polipeptídeos de progênie em
que uma faixa total de substituições de aminoácidos simples é representada a cada posição de aminoácido, por exemplo, um resíduo de aminoácido em um sítio ativo de enzima ou sítio de ligação de ligante direicionado a ser modificado. Estes oligonucleotídeos podem compreender uma primeira seqüência homóloga contígua, uma seqüência de N,N,G/T degenerada, e,
opcionalmente, uma segunda seqüência homóloga. Os produtos de tradução de progênie a jusante a partir do uso de tais oligonucleotídeos incluem todas as possíveis mudanças de aminoácido em cada sítio de aminoácido aolongo do polipeptídeo, uma vez que a degeneração da seqüência de N,N,G/T inclui códons para todos os 20 aminoácidos. Em um aspecto, um tal oligonucleotídeo degenerado (constituído de, por exemplo, um cassete de N,N,G/T degenerado) é usado para submissão de cada códon original em um modelo de polinucleotídeo original a uma ampla faixa total de substituições de códon. Em um outro aspecto, pelo menos dois cassetes degenerados são usados - ou no mesmo oligonucleotídeo ou não, para a submissão de pelo menos dois códons originais em modelo de polinucleotídeo de origem a uma faixa total de substituições de códon. Por
exemplo, mais do que uma seqüência de N,N,G/T pode ser contida em um oligonucleotídeo para introduzir mutações de aminoácido a mais do que um sítio. Esta pluralidade de seqüências de N,N,G/T podem ser diretamente contígua, ou separadas por uma ou mais seqüência(s) adicional(is) de nucieotídeos. Em um outro aspecto, oligonucleotídeos úteis para a introdução de adições e deleçãos podem ser usados ou sozinhos ou em combinação com os códons contendo seqüência de N,N,G/T, para introduzir qualquer combinação e permutação de adições, deleções, e/ou substituições de aminoácido.
Em um aspecto, mutagênese simultânea de duas ou mais 20 posições de aminoácido contíguas é feita usando-se um oligonucleotídeo que contém tripletos de N,N,G/T contíguos, isto é, uma seqüência de (N,N,G/T) degenerada.
Em um outro aspecto, cassetes degenerdos tendo menos degeneração do que a seqüência de N,N,G/T são usados. Por exemplo, pode ser desejável em alguns casos para usar (por exemplo, em um oligonucleotídeo) uma seqüência tripleto degenerado constituída de apenas um N, onde o dito N pode estar em uma primeira, segunda ou terceira posição do tripleto. Quaisquer outras bases incluindo quaisquer suas combinações e permutações podem ser usadas nas duas posições restantes do tripleto. Alternativamente, pode ser desejável em alguns casos para usar (por exemplo em um oligo) uma seqüência tripleto de N,N,N degenerada. Em um aspecto, uso de tripletos degenerados (por exemplo, tripletos deN,N,G/T) permite geração sistemática e fácil de uma faixa total de aminoácidos possíveis naturais (para um total de 20 aminoácidos) em cada e toda posição de aminoácido em um polipeptídeo (em aspectos alternativos, os métodos também incluem gerações de menos do que todas 5 as substituições possíveis por resíduo de aminoácido, ou códon, posição). Por exemplo, para um polipeptídeo de 100 aminoácidos, 2000 espécies distintas (isto é, 20 aminoácidos possíveis por posição X posições de 100 aminoácidos) pode ser gerado. Através do uso de um oligonucleotídeo ou conjunto de oligonucleotídeos contendo um tripleto de N,N,G/T degenerado,
32 seqüências individuais podem codificar todos os 20 aminoácidos naturais possíveis. Assim, em um recipiente de reação em que uma seqüência de polinucleotídeos de origem é submetida a mutagênese de saturação usando-se pelo menos um tal oligonucleotídeo, são gerados 32 polinucleotídeos de progênie distintos que codificam 20 polipeptídeos distintos. Em constraste
com isso, o uso de um oligonucleotídeo não degenerado em mutagênese de sítio-dirigida leva a apenas um produto de polipeptídeo de progênie por recipiente de reação. Oligonucleotídeos não degenerados podem opcionalmente ser usados em combinação com iniciadores degenerados descritos; por exemplo, oligonucleotídeos não degenerados podem ser
usados para gerar mutações de ponto específicas em um polinucleotídeo de trabalho.-Isto prove um meio para gerar mutações de ponto silenciosas específicas, mutações de ponto que levam a mudanças de aminoácido correspondentes, e mutações de ponto que causam a geração de códons de parada e a expressão correspondente de fragmentos de polipeptídeo.
Em um aspecto, cada recipiente de reação de mutagênese de
saturação contém polinucleotídeos que codificam pelo menos 20 polipeptídeo de progênie (por exemplo, celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, manase e/ou betaglicosidase) moléculas tal que todos os 20 aminoácidos naturais são representados em uma posição
de aminoácido específica que corresponde à posição de códon mutageneizados no polinucleotídeo de origem (outros aspectos usam menos do que 20 combinações naturais). Os polipeptídeos de progênie 32 vezesdegenerados gerados a partir de cada recipiente de reação de mutagênese de saturação podem ser submetidos a ampliação clonal (por exemplo, clonados em um hospedeiro adequado, por exemplo, hospedeiro de E. coli, usando-se, por exemplo, um vetor de expessão) e submetidos a triagem de expressão. Quando um polipeptídeo de progênie individual é identificado por triagem para exibir uma mudança favorável na propriedade (quando comparado com o polipeptídeo de origem, tal como atividade de hidrólise de glucano aumentada sob condições alcalinas ou ácidas), ele pode ser sequenciado para identificar a substituição de aminoácido
correspondentemente favorável contida ali.
Em um aspecto, na mutageneização cada e toda a posição de aminoácido em um polipeptídeo de origem usando-se mutagênese de saturação são descritas aqui, mudanças de aminoácido favoráveis podem ser identificadas a mais do que uma posição de aminoácido. Uma ou mais
novas moléculas de progênie podem ser geradas que contêm uma combinação da totalidade ou parte destas substituições de aminóácidos favoráveis. Por exemplo, se 2 mudanças de aminoácido favoráveis específicas são identificadas em cada uma de 3 posições de aminoácido em um polipeptídeo, as permutações incluem 3 possibilidades em cada posição
(nenhuma mudança do aminoácido original, e cada uma de duas mudanças favoráveis) e 3 posições. Assim, há 3 x 3 x 3 ou 27 possibilidades totais, incluindo 7 que foram anteriormente examinadas - 6 mutações de ponto simples (isto é, 2 a cada uma das três posições) e nenhuma mudança em qualquer posição.
Em ainda um outro aspecto, mutagênese de saturação de sítio
pode ser usada jutamente com embaralhamento, quimerização, recombinação e outros processos de mutageneização, juntamente com triagem. Esta invenção prove para o uso de qualquer (quaisquer) processo(s) de mutageneização, incluindo mutagênese de saturação, de um
modo interativo. Em uma exemplificação, o uso iterativo de qualquer (quaisquer) processo(s) de mutageneização é usado em combinação com triagem.A invenção também prove para o uso de iniciadores de códon proprietários (contendo uma seqüência de N,N,N degenerada) para introduzir mutações de ponto para dentro de um polinucleotídeo, a fim de gerar um conjunto de polipeptídeos de progênie em que uma faixa total de substituições de aminoácido simples é representada em cada posição de aminoácido (mutagênese de saturação de sítio de gene (GSSM)). Os oligos usados são compreendidos contiguamente de uma primeira seqüência homóloga , a seqüência de N,N,N degenerada e em um aspecto mas não necessariamente uma segunda seqüência homóloga. Os produtos transcritivos de progênie a jusante oriundos do uso de tais oligos incluem todas as possíveis mudanças de aminoácido em cada sítio de aminoácido ao longo do polipeptídeo, uma vez que a degeneração da seqüência de N,N,N inclui códons para todos os 20 aminoácidos.
Em um aspecto, um tal oligo degenerado (constituído de um cassete de N,N,N degenerado) é usado para submissão de cada códon original em um modelo de polinucleotídeo de origem a uma faixa total de substituições de códon. Em um outro aspecto, pelo menos dois cassetes de N,N,N degenerados são usados - ou no mesmo oligo ou não, para submissão de pelo menos dois códons originais em um modelo depolinucleoídeo de origem a uma faixa total de substituições de códon. Assim, mais do que uma seqüência de N,N,N pode estar contida em um oligo para introduzir mutações de aminoácidos em mais do que um sítio. Esta pluralidade de seqüência de N,N,Ns pode ser diretamente contígua ou separada por uma ou mais seqüência adicional de nucleotídeos(s). Em um outro aspecto, oligos úteis para introdução adições e deleções podem ser usados ou sozinhos ou em combinação com os códons contendo uma seqüência de N,N,N, para introduzir qualquer combinação ou permutação de adições de aminoácido, deleções e/ou substituições.
Em um aspecto, é possível simultaneamente mutageneizar duasou mais posições de aminoácido contíguas usando-se um oligo que contém tripletos de N,N,N contíguos, isto é, uma seqüência de (N,N,N)n degenerada. Em um outro aspecto, a presente invenção prove para o uso de cassetesdegenerados tendo menos degeneração do que a seqüência de N,N,N. Por exemplo, pode ser desejável em alguns casos usar (por exemplo, em um oligo) uma seqüência tripleto degenerada constituída de apenas um N, onde o N pode estar em uma primeira, segunda ou terceira posição do tripleto. 5 Quaisquer outras bases incluindo quaisquer combinações e suas permutações podem ser usados nas duas posições restantes do tripleto. Alternativamente, pode ser desejável em alguns casos usar (por exemplo, em um oligo) uma seqüência tripleto de N5N5N degenerada, N,N,G/T, ou uma seqüência tripleto de G/C, N,N.
Em um aspecto, uso de uma seqüência tripleto degenerada (tal
como seqüência tripleto de N,N,G/T ou N,N, G/C) é vantajosa por várias razões. Em um aspecto, esta invenção prove um meio sistemática e, razoável e facilmente de gerar a substituição da faixa total de possíveis aminoácidos (para um total de 20 aminoácidos) em cada e toda a posição de
aminoácido em um polipeptídeo. Assim, para um polipeptídeo de 100 aminoácidos, a invenção prove um meio de sistemática, razoável e facilmente gerar 2000 espécies distintas (isto é, 20 possíveis aminoácidos por tempos de posição 100 posições de aminoácido). É apreciado que é provido, através do uso de um oligo contendo uma seqüência tripleto de
N,N,G/T ou an N5N, G/C degenerada, 32 seqüências individuais que codificam 20 possíveis aminoácidos. Assim, em um recipiente de reação em que uma polisseqüência de nucleotídeos de origem é submetida a mutagênese de saturação usando-se um tal oligo, são gerados 32 polinucleotídeos de progênie distintos que codificam 20 polipeptídeos
distintos. Em constraste com isso, o uso de um oligo não degenerado em mutagênese de sítio-dirigida leva a apenas um produto de polipeptídeo de progênie por recipiente de reação.
Esta invenção também prove para o uso de oligos não degenerados, que podem opcionalmente ser usados em combinação com
iniciadores degenerados descritos. É apreciado que em algumas situações, é vantajoso usar oligos não degenerados para gerar mutações de ponto específicas em um polinucleotídeo de trabalho. Isto prove um meio paragerar mutações de ponto silenciosos específicos, mutações de ponto que levam a mudanças de aminoácido correspondentes e mutações de ponto que causam a geração de códons de parada e a expressão correspondente de fragmentos de polipeptídeo. 5 Assim, em um aspecto desta invenção, cada recipiente de
reação de mutagênese de saturação contém polinucleotídeos que codificam pelo menos 20 moléculas de polipeptídeo de progênie tais que todos os 20 aminoácidos são representados em uma posição de aminoácido específica que corresponde à posição de códon mutageneizado no polinucleotídeo de origem. Os polipeptídeos de progênies 32 vezes degenerados gerados a partir de cada recipiente de reação de mutagênese de saturação podem ser submetidos a ampliação clonal (por exemplo, clonados em um hospedeiro de E. coli adequado usando-se um vetor de expessão) e submetidos a triagem de expressão. Quando um polipeptídeo de progênie individual éidentificado por triagem para exibir uma mudança favorável na propriedade (quando comparado com os polipeptídeo de origem), ele pode ser sequenciado para identificar a substituição de aminoácido correspondentemente favorável contida ali.
Em um aspecto, na mutageneização cada e toda a posição de aminoácido em um polipeptídeo de origem usando-se mutagênese de saturação são descritas aqui, as mudanças de aminoácido favoráveis são identificadas a mais do que uma posição de aminoácido. Uma ou mais novas moléculas de progênie podem ser geradas que contêm uma combinação da totalidade ou parte destas substituições de aminoácidos favoráveis. Porexemplo, se 2 mudanças de aminoácido favoráveis específicas são identificadas em cada uma de 3 posições de aminoácido em um polipeptídeo, as permutações incluem 3 possibilidades em cada posição (nenhuma mudança do aminoácido original e cada uma de duas mudanças favoráveis) e 3 posições. Assim, há 3 x 3 x 3 ou 27 possibilidades totais,incluindo 7 que foram anteriormente examinadas - 6 mutações de ponto simples (isto é, 2 a cada uma das três posições) e nenhuma mudança em qualquer posição.A invenção prove para o uso de mutagênese de saturação em combinação com processos de mutageneizaçao adicionais, tal como processo onde dois ou mais polinucleotídeos relacionados são introduzidos para dentro de uma célula hospedeira adequado tal que um polinucleotídeo híbrido é gerado para a recombinação e reagrupamento redutivo.
Além da realização de mutagênese ao longo da seqüência inteira a seqüência total de um gene, a presente invenção prove que mutagênese pode ser usada para substituir cada um de qualquer número de bases em uma polisseqüência de nucleotídeos, em que o número de bases a ser
mutageneizado é em um aspecto todo número inteiro de 15 a 100,000. Assim, ao invés de mutageneizaçao de cada posição ao longo de uma molécula, pode-se submeter todas ou um número discreto de bases (em um aspecto um subconjunto que totaliza de 15 a 100.000) a mutagênese. Em um aspecto, um nucleotídeo separado é usado para mutageneizaçao de
cada posição ou grupo de posições ao longo de uma polisseqüência de nucleotídeos. Um grupo de 3 posições a serem mutageneizado pode ser um códon. As mutações podem ser introduzidas usando-se um iniciador mutagênico, contendo um cassete heterólogo, também chamado de cassete mutagênico. Cassetes exemplares podem ter de 1 a 500 bases. Cada
posição de nucleotídeo em tais cassetes heterólogos são N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G, ou E, onde E é qualquer base que não é A, C, G, ou T (E pode ser chamado de um projetista oligo).
Em um aspecto, mutagênese de saturação é constituída de mutageneizaçao de um conjunto completo de cassetes mutagênicos (em que cada cassete é em um aspecto cerca de 1-500 bases de comprimento) em polisseqüência de nucleotídeos definida a ser mutageneizada (em que a seqüência a ser mutageneizada é em um aspecto de cerca de 15 a 100.000 bases de comprimento). Assim, um grupo de mutações (variando de 1 a 100 mutações) é introduzido em cada cassete a ser mutageneizado. Um agrupamento de mutações a serem introduzidas para dentro de um cassete podem ser diferentes ou iguais de um segundo agrupamento de mutações aserem introduzidas para dentro de um segundo cassete durante a aplicação de um ciclo de mutagênese de saturação. Tais agrupamentos são exemplificados por deleções, adições, agrupamentos códons ou agrupamentos particulares de cassetes de nucleotídeos particulares. 5 Em um aspecto, seqüências definidas a serem mutageneizadas
incluem um gene inteiro, trajetória, cDNA, um quadro de leitura aberta total (ORP) e promotor total, aumentador, repressor/transativador, origem de replicação, íntron, operador ou qualquer grupo funcional de polinucleotídeo. Em geral, as "seqüências definidas" para esta finalidade pode ser qualquer
polinucleotídeo que uma polisseqüência de nucleotídeos de 15 bases e polisseqüencias de nucleotídeos de comprimentos entre 15 bases e 15.000 bases (esta invenção especificamente chada cada número inteiro no meio). Considerações na escolha de agrupamentos de códons incluem tipos de aminoácidos codificador por um cassete mutagênico degenerado.
Em um aspecto, um agrupamentos de mutações que podem ser
introduzidas para dentro de um cassete mutagênico, esta invenção especificamente prove substituições de códon degeneradas (usando-se oligos degenerados) que codificam 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 e 20 aminoácidos a cada posição e uma biblioteca de
polipeptídeos codificada desse modo.
Reagrupamento de ligação sintética (SLR) A invenção prove uma sistema de modificação de gene nao estocástico chamado "reagrupamento de ligação sintético," ou simplismente "SLR," um "processo de evolução dirigido," para gerar polipeptídeos, por
exemplo, celulase, por exemplo, enzimas ou anticorpos de endoglucanase, celobioidrolase, manase e/ou betaglicosidase da invenção, com propriedades novas ou alteradas.
SLR é um método de ligação de fragmentos de oligonucleotídeo entre si não estocasticamente. Este método difere de oligonucleotídeo
estocástico que embaralha pelo fato de que os blocos de construção de ácido nucléico não são embaralhados, são concatenados ou são quimerizados aleatoriamente, mas ao invés são agrupados nãoestocasticamente. Ver, por exemplo, as patentes U.S. nes 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776. Em um aspecto, SLR compreende a seguir as etapas: (a) provisão de um polinucleotídeo de modelo, em que o polinucleotídeo de modelo compreende seqüência que 5 codifica um gene homólogo; (b) provisão de uma pluralidade de construção de polinucleotídeos por blocos, em que a construção de polinucleotídeos por blocos são projetados para cruzar reagrupamento com o polinucleotídeo de modelo a uma seqüência predeterminada, e uma construção de polinucleotídeo por blocos compreende uma seqüência que é uma variante do gene homólogo e uma seqüência homóloga ao polinucleotídeo de modelo que flanqueia a seqüência de variante; (c) combinação de uma construção de polinucleotídeo por blocos com um polinucleotídeo de modelo tal que a construção de polinucleotídeo por blocos que cruza reagrupamentos com o polinucleotídeo de modelo para gerar polinucleotídeos compreendendo variações de seqüência de gene homólogo.
SLR não depende da presença de altos níveis de homologia entre polinucleotídeos a serem reagrupados. Assim, este método pode ser usado para não estocasticamente gerar bibliotecas (ou conjuntos) de moléculas de progênie compreendia de mais de 10100 quimeras diferentes.
SLR pode ser usado para gerar bibliotecas constituídas de mais
de io1000 quimeras de progênie diferentes. Assim, aspectos da presente invenção incluem métodos não estocásticos de produção de um conjunto de molécula quimérica finalizada de ácido nucléico que raspa uma ordem de conjunto total que é escolhodo pelo projeto. Este método inclui as etapas de geração por projeto de uma pluralidade de blocos de construção de ácido nucléico específicos tendo extremidades ligáveis mutualmente úteis compatíveis útis, e o conjunto destes blocos de construção de ácido nucléico, tal que uma ordem de conjunto total projetado é alcançado.
As extremidades ligáveis mutualmente compatíveis dos blocos de construção de ácido nucléico a serem agrupados são consideradas serem "úteis" para este tipo de conjunto ordenado se eles permitir os blocos de construção a serem acoplados em ordens predeterminadas. Assim, aordem de conjunto total em que os blocos de construção de ácido nucleico podem ser acoplados é específica pelo projeto das extremidades ligáveis. Se mais do que uma etapa de conjunto deve ser usada, então a ordem de conjunto total em que os blocos de construção de ácido nucleico podem ser acoplados é especificado pela ordem seqüencial da(s) etapa(s) de conjunto. Em um aspecto, a construção anelada de motivos são tratados com uma enzima, tal como uma ligase (por exemplo, ligase de T4 D NA), para alcançar ligação covalente dos motivos de construção.
Em um aspecto, o projeto dos blocos de construção de oligonucleotídeo é obtido por análise de um conjunto de modelos de seqüência de ácidos núcleicos projenitores que servem como uma base para a produção de um conjunto de progênie de polinucleotídeos quiméricos finalizados. Estes modelos de oligonucleotídeo de origem assim servem como uma fonte de inconstrução de seqüência que auxilia no projeto dos blocos de construção de ácido nucleico que devem ser mutageneizados, por exemplo, quimerizadas ou embaralhadas. Em um aspecto deste método, as seqüências de uma pluralidade de modelos de ácido nucleico de origem são alinhados a fim de selecionar um ou mais pontos de demarcação. Os pontos de demarcação podem ser localizados a uma área de homologia, e são constituídos de um ou mais nucleotídeos. Estes pontos de demarcação são em um aspecto partilhados por pelo menos dois dos modelos progenitores. Os pontos de demarcação podem desse modo ser usados para delinear os limites de blocos de construção de oligonucleotídeo a serem gerados a fim de reagrupar os polinucleotídeos de origem. Os pontos de demarcação identificados e selecionados nas moléculas progenitoras servem como pontos de quimierização potenciais no conjunto das moléculas de progênie quiméricas finais. Um ponto de demarcação pode ser uma área de homologia (constituída de pelo menos uma base de nucleotídeo homóloga) partilhada por pelo menos duas polisseqüências de nucleotídeos de origem.Alternativamente, um ponto de demarcação pode ser uma área de homologia que é partilhada por pelo menos metade das polisseqüências de nucleotídeos de origem, ou, pode ser uma área de homologia que épartilhada por pelo menos dois terços das polisseqüencias de nucleotídeos de origem. Ainda mais em um aspecto pontos de demarcação úteis são uma área de homologia que é partilhada por pelo menos três quartos das polisseqüencias de nucleotídeos de origem, ou, pode ser partilhada por quase todas as polisseqüencias de nucleotídeos de origem. Em um aspecto, um ponto de demarcação é uma área de homologia que é partilhada por todas as polisseqüencias de nucleotídeos de origem.
Em um aspecto, um processo de reagrupamento de ligação é realizado exaustivamente a fim de gerar uma biblioteca exaustiva de polinucleotídeos quiméricos de progênie. Em outras palavras, todas as combinações ordenadas possíveis de blocos de construção de ácido nucléico são representados no conjunto de molécula de ácido nucléico quiméricas finalizadas. Ao mesmo tempo, em um outro aspecto, a ordem de conjunto (isto é, a ordem de conjunto de cada bloco de construção na seqüência 5' a 3' de cada ácido nucléico quimérico finalizado) em cada combinação é por projeto (ou não estocástico) como descrito acima. Por causa da natureza não estocástica desta invenção, a possibilidade de produtos colaterais indesejáveis é grandemente reduzida.
Em um outro aspecto, o método de reagrupamento de ligação é realizado sistematicamente. Por exemplo, o método é realizado a fim de gerar uma biblioteca sistematicamente compartimentalizada por moléculas de progênie, com compartimentos que podem ser triados sistematicamente, por exemplo, um por um. Em outros palavras esta invenção prove que, através do uso seletivo e judicioso de blocos de construção de ácido nucléico específicos, acoplado com o uso seletivo e judicioso de reações de conjunto seqüencialmente escalonadas, um projeto pode ser alcançado onde conjuntos específicos de produtos de progênie são produzidos em cada um dos vários recipientes de reação. Isto permite um procedimento de triagem ou exame sistemático a ser realizado. Assim, estes métodospermitem que um número potencialmente muito grande de moléculas de progênie a serem examinadas sistematicamente em grupos menores. Por causa de sua capacidade de realizar quimerizações de um modo que sejaaltamente flexível ainda também exaustiva e sistemática, particularmente quando há um nível baixo de homologia entre as moléculas progenitoras, estes métodos provêem a geração de uma biblioteca (ou conjunto) constituída de um grande número de moléculas de progênie. Por causa da 5 natureza não estocástica da presente invenção de reagrupamento de ligação, as moléculas de progênie geradas em um aspecto compreendem uma biblioteca de moléculade ácido nucléico quiméricas finalizadas tendo uma ordem de conjunto total que é escolhido pelo projeto. A mutagênese de saturação e métodos de evolução dirigidos otimizados também podem ser
usados para gerar espécie moleuclar de progênie diferente. É apreciado que a invenção prove liberdade de escolha e controle referente a seleção dos pontos de demarcação, do tamanho e do número dos blocos de construção de ácido nucléico, e do tamanho e projeto dos acoplamentos. É apreciado, além do mais, que a exigência para homologia intermolecular é altamente
relaxada para a operabiliade desta invenção. De fato, pontos de demarcação podem ainda ser escolhidos em áreas de pouco ou nenhuma homologia intermolecular. Por exemplo, por causa da oscilação de códon, isto é, degeneração de códons, substituições de nucleotídeo podem ser introduzidos para dentro de blocos de construção de ácido nucléico sem
alterar o aminoácido originalmente codificado no modelo de progenitor correspondente. Alternativamente, um códon pode ser alterado tal que a codificação de um aminoácido original é alterada. Esta invenção prove que tais substituições podem ser introduzidas para dentro do bloco de construção de ácido nucléico a fim de aumentar a incidência de pontos de
demarcação homólogos intermolecular e assim permitir que um numero aumentado de acoplamentos serem alcançados entre os blocos de construção, que por sua vez permite um número maior de moléculas quiméricas de progênie a serem geradas.
Agrupamento de gene sintético
Em um aspecto, a presente invenção prove um método não
estocástico chamado reagrupamento de gene sintético, isto é, quantidade é relacionada com o embaralhamento estocástico, evitam que os blocos deconstrução de ácido nucléico não sejam embaralhados ou concatenados ou quimerizados aleatoriamente, mas um pouco são agrupos não estocasticamente. Ver, por exemplo, a patente U.S. nQ 6.537.776.
O método de reagrupamento de gene sintético não depende da presença de um alto nível de homologia entre polinucleotídeos a serem embaralhados. A invenção pode ser usada para bibliotecas geradas não estocasticamente (ou conjuntos) de moléculas de progênie constituídas de mais de 10100 quimeras diferentes. Reagrupamento de gene sintético, concebível pode ainda ser usado para gerar bibliotecas constituídas de mais de 101000 quimeras de progênie diferentes.
Assim, em üm aspecto, a invenção prove um método não estocástico de produção de um conjunto de moléculas de ácido nucléico quiméricas finalizadas tendo uma ordem de conjunto total que é escolhida, método esse que é constituído das etapas de geração por projeto de uma pluralidade de blocos de construção de ácido nucléico específicos tendo agrupamentos e extremidades ligáveis mutualmente compatíveis úteis estes blocos de construção de ácido nucléico, tal que uma ordem de conjunto total projetada é alcançada.
Extremidades ligáveis mutualmente compatíveis dos blocos de construção de ácido nucléico a serem agrupados são considerados serem "úteis" para este tipo de conjunto ordenado se eles permitirem que os blocos de construção sejam acoplados em ordens predeterminadas. Assim, em um aspecto, a ordem de conjunto total em que os blocos de construção de ácido nucléico podem ser acoplados é especificado pelo projeto das extremidades ligáveis e, se mais do que uma etapa de conjunto devesse ser usada, então a ordem de conjunto total em que os blocos de construção de ácido nucléico podem ser acoplados é também especificado pela ordem seqüencial da(s) etapa(s) de conjunto. Em um aspecto da invenção, os motivos de construção anelados são tratados com enzima, tal como uma ligase (por exemplo, ligase de T4 DNA) para alcançar ligação covalente dos motivos de construção.
Em um outro aspecto, o projeto de blocos de construção de ácido nucléico é obtido na análise das seqüências de um conjunto demodelos de ácido nucleico de progenitor que servem como uma base para a produção de um conjunto de progêneie de moléculas de ácido nucleico quiméricas finalizadas. Estes modelos de ácido nucleico progenitores assim servem como uma fonte de inconstrução de seqüência que auxilia no projeto dos blocos de construção de ácido nucleico que devem ser mutageneizados, isto é, quimerizados ou embaralhados.
Em uma exemplificação, a invenção prove a quimerização de uma família de genes relacionados e sua família codificada de produtos relacionados. Em uma exemplificação particular, os produtos codificados são
enzimas. A celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase da presente invenção podem ser mutageneizada de acordo com os métodos descritos aqui.
Assim de acordo com um aspecto da invenção, as seqüências de uma pluralidade de modelos de ácido nucleico progenitor (por exemplo,
polinucleotídeos da invenção) são alinhados a fim de selecionar uma ou mais pontos de demarcação, pontos de demarcação esses que podem ser localizados em uma área de homologia. Os pontos de demarcação podem ser usados para delinear os limites de blocos de construção de ácido nucleico a serem gerados. Assim, os pontos de demarcação identificadas e
selecionadas nas moléculas progenitoras servem como pontos de quimerização potenciais no conjunto das moléculas de progênie.
Em um aspecto, um ponto de demarcação útil é uma área de homologia (constituída de pelo menos uma base de nucleotídeo homóloga) partilhado por pelo menos dois modelos progenitores, mas o ponto de
demarcação pode ser uma área de homologia que é partilhada por pelo menos metade dos modelos progenitores, pelo menos dois terços dos modelos progenitores, pelo menos três quartos dos molelos progenitores e em um aspecto em quase todos os modelos progenitores. Ainda mais em um aspecto ainda um ponto de demarcação útil é uma área de homologia
que é partilhada por todos os modelos progenitores.
Em um aspecto, o processo de reagrupamento de gene é realizado exaustivamente a fim de gerar uma biblioteca exaustiva. Em outraspalavras, todas as combinações ordenadas possíveis dos blocos de construção de ácido nucléico são representados no conjunto de moléculas de ácido nucléico quiméricas finalizadas. Ao mesmo tempo, a ordem de conjunto (isto é, a ordem de conjunto de cada bloco de construção na 5 seqüência a 3' de cada ácido nucléico quimérico finalizado) em cada combinação é por projeto (ou não estocástico). Por causa da natureza não estocástica do método, a possibilidade de produtos colaterais indesejáveis é grandemente reduzida.
Em um outro aspecto, o método prove que processo de reagrupamento de gene é realizado sistematicamente, por exemplo, para gerar uma biblioteca compartimentalizada sistematicamente, com compartimentos que podem ser triados sistematicamente, isto é, um por um. Em outras palavras a invenção prove que, através do uso seletivo e judicioso de blocos de construção de ácido nucléico, acoplados com o uso seletivo ou judicioso de reações de conjunto escalonadas seqüencialmente, um projeto experimental pode ser alcançado onde conjuntos específicos de produtos de progênie são produzidos em cada um dos vários recipientes de reação. Isto permite um procedimento de triagem e exame sistemático a serem realizados. Assim, permite que um número potencialmente muito grande dmoléculas de progênie sejam examinadas sistematicamente em grupos menores.
Por causa de sua capacidade de realizar quimerizações de um modo que é altamente flexível ainda também exaustivo e sistemático, particularmente quanod há um nível baixo de homologia entre as moléculas progenitoras, a presente invenção prove a geração de uma biblioteca (ou cojunto) constituídas de um grande número de moléculas de progênie. Por causa da natureza estocástica da presente invenção de conjunto de gene, as moléculas de progênie geradas em um aspecto compreedem uma biblioteca de moléculas de ácido nucléico quiméricas finalizadas tendo uma ordem de conjunto total que é escolhida por projeto. Em uma aspecto particular, tal biblioteca gerada é constituída de mais do que 103 a mais do que 101000 de espécies moleculares de progênie diferentes.Em um aspecto, um conjunto de moléculas de ácido nucléico quimericas finalizadas, produzido como descrito é constituído de uma polinucleotídeo que codifica um polipeptídeo. De acordo com um aspecto, este polinucleotídeo é um gene, que pode ser um gene produzido pelo homem. De acordo com um outro aspecto, este polinucleotídeo é uma trajetória de gene, que pode ser uma trajetória de gene produzida pelo homem. A invenção prove que um ou mais genes produzidos pelo homem gerados pela invenção podem ser incorporados para dentro de uma trajetória de gene produzida pelo hormônio, tal como uma trajetória operável
em um organismo eucariótico (incluindo uma planta).
Em uma outra exemplificação, a natureza sintética da etapa em que os blocos de construção são gerados permite o projeto e introdução de nucleotídeos (por exemplo, um ou mais nucleotídeos, que podem ser, por exemplo, códons ou nítrons ou seqüências reguladoras) que podem mais
tarde ser opcionalmente removidos em um processo in vitro (por exemplo, por mutagênese) ou em um processo in vivo (por exemplo, por utilização da capacidade de união de gene de um organismo hospedeiro). É apreciado que em muitos casos a introdução destes nucleotídeos pode também ser desejável para muitas outras razões além do benefício potencial de criação
de um ponto de demarcação útil.
Assim, de acordo com um outro aspecto, a invenção prove que um bloco de construção de ácido nucléico pode ser usado para introduzir um íntron. Assim, a invenção prove que níntrons funcionais podem ser introduzidos para dentro de um gene produzido pelo homem da invenção. A
invenção também prove que íntrons funcionais podem ser introduzidos para dentro de uma trajetória de gene produzido pelo homem da invenção. Correspondentemente, a invenção prove para a geração de um polinucleotídeo quimérico que é um gene produzido pelo homem contendo um (ou mais) íntron(s) artificialmente introduzido(s).
A invenção também prove para a geração de um polinucleotídeo
quimérico que é uma trajetória de gene produzido pelo homem contendo um (ou mais) íntron(s) artificialmente introduzido(s). Em um aspecto, os íntronsartificialmente introduzido(s) são funcionais em uma ou mais células hospedeiras para a união de gene muito no modo que íntrons de ocorrência natural servem funcionalmente na união de gene. A invenção prove um processo de produção de polinucleotídeos contendo íntron produzido pelo homem a serem introduzidos para dentro de organismos hospedeiros para a recombinação e/ou união. Um gene produzido pelo homem produzido usando-se a invenção pode também servir como um substrato para recombinação com um outro ácido nucléico. Do mesmo modo, uma trajetória de gene produzido pelo homem produzida usando-se a invenção pode também servir como um substrato para a recombinação com um outro ácido nucléico. Em um aspecto, a recombinação é facilitada por, ou ocorre a, áreas de homologia entre ácido nucléico e gene contendo íntron produzido pelo homem, que serve como um par de recombinação. Em um aspecto, um par de recombinação pode também ser um ácido nucléico gerado pelainvenção, incluindo um gene produzido pelo homem ou uma trajetória de gene produzido pelo homem. Recombinação pode ser facilitada por ou pode ocorrer a áreas de homologia que existe no um (ou mais) íntrons artificialmente introduzido(s) no gene produzido pelo homem.
Em um aspecto, o método de reagrupamento de gene sintético da invenção utiliza uma pluralidade de blocos de construção de ácido nucléico, cada um dos quais em um aspecto tem duas extremidades ligáveis. As duas extremidades ligáveis em cada bloco de construção de ácido nucléico pode ter duas extremidades abruptas (isto é, cada um tendo uma projeção de zero nucleotídeos), ou em um aspecto uma extremidade abrupta e uma projeção, ou mais em um aspecto ainda duas projeções. Em um aspecto, uma projeção útil para esta finalidade pode ser uma projeção 3' ou uma projeção 5'. Assim, um bloco de construção de ácido nucléico pode ter uma projeção 3' ou alternativamente uma projeção 5' ou alternativamente duas projeções 3' ou alternativamente duas projeções 5'. A ordem total em que os blocos de construção de ácido nucléico são agrupados para formar uma molécula de ácido nucléico quimérica finalizada é determinada por projeto experimental intencional e não é aleatório.Em um aspecto, um bloco de construção de ácido nucléico é gerado por síntese química de dois ácidos nucléicos de filamento único (também chamado de oligos de filamento único) e contato deles de modo a permiti-los para anelar para formar um bloco de construção de ácido 5 nucléico de filamento duplo. Um bloco de construção de ácido nucléico de filamento duplo pode ser de tamanho variável. Os tamanhos destes blocos de construção podem ser pequenos ou grandes. Tamanhos exemplares para o bloco de construção que variam de 1 par de base (não incluindo quaisquer projeções) a 100.000 pares de bases (não incluindo quaisquer projeções).
10 Outras faixas de tamanho exemplar são também providos, que têm limites menores de desde 1pb a 10.000pb (incluindo cada valor de número inteiro no meio) e limites superiores de desde 2pb a 100.000pb (incluindo cada valor de número inteiro no meio).
Muitos métodos existem pelos quais um bloco de construção de
ácido nucléico de filamento duplo pode ser gerado que é útil para a invenção; e estes são conhecidos na técnica e podem ser prontamente realizados pelo técnico versado. De acordo com um aspecto, um bloco de construção de ácido nucléico de filamento duplo é gerado em primeiro lugar gerando dois ácidos nucléicos de filamento único e permitindo-os para
construção de ácido nucléico de filamento duplo podem ser complementares a cada nucleotídeo A parte de qualquer que forme uma projeção; assim não contendo desemparelhamentos, à parte de qualquer(quaisquer) projeção(ões). De
acordo com um outro aspecto, os dois filamentos de um bloco de construção de ácido nucléico de filamento duplo são complementares em menos do que cada nucleotídeo à parte de qualquer que forme uma projeção. Assim, de acordo com este aspecto, um bloco de construção de ácido nucléico de filamento duplo pode ser usado para introduzir degeneração de códon. Em
um aspecto a degeneração de códon é introduzida usando-se a mutagênese de saturação de sítio descrito aqui, usando-se um ou mais cassetes de N,N,G/T ou alternativamente usando-se um ou mais cassetes de N,N,N.O método de recombinação in vivo da invenção pode ser realizado cegamente em uma combinação de híbridos ou alelos desconhecidos de uma seqüência ou polinucleotídeo específicos. No entanto, não é necessário saber a seqüência específica real de DNA ou RNA do polinucleotídeo. A abordagem de uso de recombinação dentro de uma população mista de genes pode ser útil para a geração de quaisquer proteínas úteis, por exemplo, uma celulase da invenção ou uma sua variante. Esta abordagem pode ser usada para gerar proteínas tendo atividade ou especificidade alterada. A abordagem pode também ser útil para a geração de seqüências de ácidos nucléicos híbridas, por exemplo, regiões promotoras, íntrons, éxons, seqüências aumentadoras, 31 regiões não traduzidas ou 51 regiões não traduzidas de genes. Assim esta abordagem pode ser usada para gerar genes tendo taxas aumentadas de expressão. Esta abordagem pode também ser útil no estudo de seqüências de DNA repetitivas. Finalmente, esta abordagem pode ser útil para produzir ribozimas ou aptâmeros da invenção.
Em um aspecto a invenção descrito aqui refere-se ao uso de ciclos repetidos de reagrupamento redutivo, recombinação e seleção que permitem a evolução molecular dirigida de seqüências lineares altamente complexas, tais como DNA, RNA ou proteínas através da recombinação. Sistema de evolução dirigida otimizada
A invenção prove um sistema de modificação de não estocástico chamado "sistema de evolução dirigido otimizado" para gerar polipeptídeos, por exemplo, celulase, por exemplo, anticorpos ou enzimas de endoglucanase, celobioidrolase, manase e/ou betaglicosidase da invenção, com propriedades novas ou alteradas. Em um aspecto, evolução dirigida otimizada refere-se ao uso de ciclos repetidos de reagrupamento redutivo, recombinação e seleção que permitem a evolução molecular dirigida de ácido nucléicos através de recombinação.
Evolução dirigida otimizada permite geração de uma grande população de seqüências quiméricas desenvolvidas, em que a população gerada é significativamente enriquecida para seqüências que têm umnúmero predeterminado de eventos de cruzamento. Um evento de cruzamento é um ponto em uma seqüência quimérica onde um deslocamento na seqüência ocorre a partir de uma variante de origem para uma outra variante de origem. Tal ponto é normalmente na junção de onde 5 oligonucleotídeos oriundos de duas origens são ligados entre si para formar uma seqüência única. Este método permite cálculo das concentrações corretas de seqüências de oligonucleotídeos de modo que a população quimérica final de seqüências é enriquecida para o número escolhido de eventos de cruzamento. Isto prove mais controle sobre escolha de variantes
quiméricas tendo um número predeterminado de eventos de cruzamento.
Além disso, este método prove um meio conveniente para explorar uma quantidade tremenda do espaço de variante de proteína possível em comparação com outros sistemas. Anteriormente, se um gerado, por exemplo, 1013 moléculas quiméricas durante uma reação, seria
extremamente difícil de testar, tal como um alto número de variantes quiméricas para uma atividade particular. Além do mais, uma porção significativa da população de progênie teria um número muito alto de eventos de cruzamento que resultou em proteínas que foram menos prováveis de ter níveis aumentados de uma atividade particular. Por uso
destes métodos, a população de moléculas quiméricas podem ser enriquecidas para aquelas variantes que têm um número particular de eventos de cruzamento. Assim, embora possa-se ainda gerar 10 moléculas quiméricas durante uma reação, cada uma das moléculas escolhidas para outra análise mais provavelmente tem, por exemplo, apenas três eventos de
cruzamento. Uma vez que a população de progênie resultante pode ser movida para ter um número predeterminado de eventos de cruzamento, os limites na variedade funcional entre as moléculas quiméricas é reduzida. Isto prove um número mais maleável de variáveis quando o cálculo do qual oligonucleotídeo oriundo do polinucleotídeos de origem original podem ser
responsáveis por afetar uma característica particular.
Um método para a criação de uma seqüência de polinucleotídeos de progênie quimérica é para criar oligonucleotídeos quecorrespondem a fragmentos ou porções de cada seqüência de origem. Cada oligonucleotídeo em um aspecto inclui uma única região de sobreposição de modo que misturação dos oligonucleotídeos juntos resulte em uma nova variante que tem cada fragmento de oligonucleotídeo agrupado na ordem correta. Alternativamente protocolos para a prática destes métodos da invenção podem ser encontrados nas patentes U.S. nes 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974.
O número de oligonucleotídeos gerados para cada variante de origem porta uma relação ao número total que resulta das passagens na molécula quimérica que é finalmente criada. Por exemplo, três pacientes de seqüência nulceotídeo de origem pode ser provido para sofrer uma reação de ligação a fim de encontrar uma vairante quimérica a fim de encontrar uma variante quimérica tendo, por exemplo, atividade maior a alta temperatura. Como um exemplo, um conjunto de 50 seqüências de oligonucleotídeos pode ser gerada que correspondendo a cada uma das porções de cada variante de origem. Correspondentemente, durante a ligação processo de reagrupamento poderia ter até 50 eventos de passagem dentro de cada uma das seqüências quiméricas. A probabilidade que cada dos polinucleotídeos gerados conterá oligonucleotídeos oriundos de cada variante de origem na ordem de alteração é muito baixa. Se cada fragmento de oligonucleotídeo está presente na reação de ligação na mesma quantidade molar é provável que algumas posições de oligonucleotídeos oriundos do mesmo polinucleotídeo de origem-se ligará a seguir a um outro e assim não resultando em um evento de cruzamento. Se a concentração de cada oligonucleotídeo oriundo de cada origem é mantida constante durante qualquer etapa de ligação neste exemplo, há uma mudança de 1/3 de chance (assumindos 3 origens) que um oligonucleotídeo da mesma variante de origem ligará dentro da seqüência quimérica e não produzir passagem.
Correspondentemente, uma probabilidade de função de densidade (PDF) pode ser determinada para prever a população de eventos de cruzamento que estão apropriados a ocorrer durante cada etapa em uma ligação de reação dada a um número de conjunto de variantes de origem,numerosos de oligonucleotídeos que correspondem a cada variante, e as concentrações de cada variante durante cada etapa na reação de ligação. As estatísticas e matemáticas atrás da determinação do PDF é descrito abaixo. Por utilização destes métodos, pode-se calcular tal probabilidade de função de densidade, e assim enriquecem a população de progênie quimérica para um número predeterminado de eventos de cruzamento que resulta de uma reação particular. Além do mais, um número alvo de eventos de cruzamento pode ser determinado, e o sistema então programado para calcular as quantidades de partida de cada oligonucleotídeo original durante
cada etapa na reação de ligação para resultar em uma probabilidade de função de densidade que centraliza no número predeterminado de eventos de cruzamento. Estes métodos referem-se ao uso de ciclos repetidos de reagrupamento redutivo, recombinação e seleção que permitem para a evolução molecular dirigida de um ácido nucléico que codifica um
polipeptídeo através de recombinação. Este sistema permite geração de uma grande população de seqüências quiméricas desenvolvidas, em que a população gerada é significativamente enriquecida para seqüências que têm um número predeterminado de eventos de cruzamento. Um evento de cruzamento é um ponto em uma seqüência quimérica onde um
deslocamento em seqüência ocorre de uma variante de origem para uma outra variante de origem. Tal ponto é normalmente na junção de onde oligonucleotídeos oriundos de duas origens são ligados entre si para formar uma seqüência única. O método permite cálculo das concentrações corretas de seqüências de oligonucleotídeos de modo que a população quimérica
final de seqüências seja enriquecida para o número escolhido de eventos de cruzamento. Isto prove mais controle sobre escolha de variantes quiméricas tendo um número predeterminado de eventos de cruzamento.
Além disso, estes métodos proveêm um meio conveniente para explorar uma quantidade tremenda do espaço de variante de proteína
possível em comparação com outros sistemas. Por uso dos métodos descritos aqui, a população de moléculas quiméricas podem ser enriquecidas para aquelas variantes que têm um número particular deeventos de cruzamento. Assim, embora possa-se ainda gerar 10 moléculas quiméricas durante uma reação, cada uma das moléculas escolhidas para outra análise mais provavelmente tem, por exemplo, apenas três eventos de cruzamento. Uma vez que a população de progênie resultante pode ser movida para ter um número predeterminado de eventos de cruzamento, os limites na variedade funcional entre as moléculas quiméricas é reduzida. Isto prove um número mais maleável de variáveis quando o cálculo cujo oligonucleotídeo dos polinucleotídeos de origem original podem ser responsáveis por afetar uma característica particular.
Em um aspecto, o método cria uma seqüência depolinucleotídeos de progênie quimérica por criação de oligonucleotídeos que correspondem a fragmentos ou porções de cada seqüência de origem. Cada oligonucleotídeo em um aspecto inclui uma única região de sobreposição de modo que misturação dos oligonucleotídeos juntos resulte em uma nova variante que tem cada fragmento de oligonucleotídeo agrupado na ordem correta. Ver também U.S. Patente nes 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974.
Determinação de eventos de passagem
Aspectos da invenção incluem um sistema e software que recebem uma função de densidade de probabilidade cruzada (PDF), o número de genes de origem a ser agrupado, e o número de fragmentos no reagrupamento nas entradas. A entrada deste programa é um "PDF de fragmento" que pode ser usada para determinar um receptor para a produção de genes regrupados, e o PDR de cruzamento PDF destes genes. O processamento descrito aqui é em um aspecto realizado em MATLAB® (The Mathworks, Natick, Massachusetts) uma programação de liguagem e desenvolvimento ambiental para computação técnica. Processo interativo
Qualquer processo da invenção pode ser interativamente repetido, por exemplo, um ácido nucléico que codifica um fenótipo de celulase alterado ou novo, por exemplo, enzima de endoglucanase, celobioidrolase, mannanase e/ou betaglicosidase da invenção, pode seridentificada, ou re-isolado, novamente modificada, retestada quanto a atividade. Este processo pode ser interativamente repetido até um fenótipo desejado ser engenheirado. Por exemplo, uma trajetória anabólica ou catabolica bioquíica pode ser engenheirada em uma célula, incluindo, por 5 exemplo, celulase, por exemplo, atividade de enzima de endoglucanase, celobioidrolase, mannanase e/ou betaglicosidase.
Similarmente, se é determinado que um oligonucleotídeo particular não tem que afetar a totalidade na característica desejada (por exemplo, uma nova celulase, por exemplo, fenótipo de enzima de
endoglucanase, celobioidrolase, mannanase e/ou betaglicosidase), pode ser removido como uma variável por síntese maior de oligonucleotídeos de origem maior que incluem a seqüência a ser removida. Como a incorporação da seqüência dentro de uma seqüência maior previne quaisquer eventos de passagem, não haverá mais qualquer variação desta seqüência nos
polinucleotídeos de progênie. Esta prática interativa de determinação das quais oligonucleotídeos estão mais relacionados com a característica desejada, e que não não relacionados, permitem exploração mais eficaz da totalidade as variantes de proteína possíveis que estão não relacionadas, permitem exploração mais eficazes a totalidade das variantes possíveis que
podem ser providas uma característica particular ou atividade. Embaralhamento in vivo
Em vários aspectos, embaralhamento in vivo de é usado em métodos da invenção para prover variantes de polipeptídeos da invenção, por exemplo, anticorpos da invenção ou celulases da invenção, por exemplo,
enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, e similares. Embaralhamento In vivo pode ser realizada utilizando-se a propriedade natural de células para recombinar multímeros. Enquanto recombinação in vivo proveu a rota natural principal a diversidade molecular, recombinação genética permanece um processo relativamente
complexo que envolve 1) o reconhecimento de homologias; 2) clivagem de filamento, invasão de filamento, e etapas metabólicas que leva à produção de quiasma recombinante; e finalmente 3) a resolução de quiasma emmoléculas recombinadas discretas. A formação do quiasma exige o reconhecimento de seqüências homólogas.
Em um outro aspecto, a invenção inclui um método para a produção de um polinucleotídeo híbrido a partir de pelo menos um primeiro
' polinucleotídeo e um segundo polinucleotídeo. A invenção pode ser usada para produzir um polinucleotídeo híbrido por introdução de pelo menos um primeiro polinucleotídeo e um segundo polinucleotídeo (por exemplo, um, ou ambos, sendo uma celulase exemplar, por exemplo, seqüência de codificação de enzima endoglucanase, celobioidrolase, mananase e/ou
betaglicosidase da invenção) que partilham pelo menos uma região de homologia de seqüência parcial em uma célula hospedeira adequada. Os processos promotores de regiões de homoligia de seqüência parciais que resultam em reconhecimento de seqüência que produz um polinucleotídeo híbrido. O termo "polinucleotídeo híbrido", como usado aqui, é qualquer
seqüência de nucletídeos que resulta do método da presente invenção e contém de pelo menos duas seqüências de polinucleotídeos. Tais polinucleotídeos híbridos podem resultar de eventos de recombinação intermolecular que promovem integração de seqüência entre as moléculas de DNA moléculas. Além disso, tais polinucleotídeos híbridos podem resultar
de processos de reagrupamento redutivos intramoleculares que utilizam seqüências repetidas para alterar a seqüência de nucletídeos dentro de uma molécula de DNA.
Em um aspecto, reagrupamento vivo focaliza processos "intermoleculares" coletivamente chamados de "recombinação"; que em
bactérias, é em geral visto como um fenômeno dependente de "RecA ". A invenção pode contar com processos de recombinação de uma célula hospedeira para recombinar seqüências de agrupamento, ou as células' capacidade de mediar processos redutivos para diminuir a complexidade de seqüências quase-repetidas na célula por deleção. Este processo de
"reagrupamento redutivo" ocorre por um processo independente de ReCA, "intramolecular".
Em um outro aspecto da invenção, novos polinucleotídeospodem ser gerados pelo processo de reagrupamento redutivo. O método envolve a geração de construtos contendo seqüências consecutivas (seqüências de codificação original), sua inserção para dentro de um vetor apropriado e sua introdução subseqüente para dentro de uma célula hospedeira apropriada. O reagrupamento das identidades moleculares individuais ocorre por processos combinatórios entre as seqüências consecutivas nas regiões de processamento de construto de homologia, ou entre unidades quase-repetidas. O processo de reagrupamento recombina e/ou reduz a complexidade e extensão das seqüências repetidas e resulta
na proução de novas espécies moleculares. Vários tratamentos podem ser aplicados para aumentar a taxa de reagrupamento. Estes poderiam incluir o tratamento com luz ultravioleta, ou produtos químicos de danificação de DNA e/ou o uso de linhagens de célula hospedeira que exibe níveis aumentados de "instabilidade genética". Assim o processo de reagrupamento pode envolver recombinação homóloga ou uma propriedade natural de seqüências quase-repetidas para dirigir sua própria evolução.
Seqüências repetidas ou "quase-repetidas" desempenham um papel em instabilida de genética. Em um aspecto, "quase-repetidas" são repetidas que não são restritas para sua estrutura de unidade original.
Unidades quase-repetidas podem ser apresentadas como um conjunto de seqüências em um construto; unidades consecutivas de seqüências similares. Uma vez ligada, as junções entram nas seqüências consecutivas se tornam essencialmente invisíveis e a natureza quase-repetida do construto resultante é agora contínua no nível molecular. O processo de deleção da célula realiza reduzir a complexidade do construto resultante opera as seqüências quase-repetidas. As unidades quase-repetidas provêem um repertório praticamente ilimitado de modelos nos quais eventos de deslizamento podem ocorrer. Em um aspecto, os construtos contendo as quase-repetidas assim eficazmente provêem elasticidade molecular suficiente que eventos de eção (e potencialmente inserção) podem ocorrer virtualmente em qualquer lugar dentro ds unidades quase-repetidas.
Quando as seqüências quase-repetidas são todas ligadas namesma orientação, por exemplo, de topo à calda ou vice versa, a célula não pode distinguir unidades individuais. Conseqüentemente, o processo redutivo pode ocorrer através de todas as seqüências. Em contrate com isso, quando, por exemplo, as unidades são apresentaas de topo a topo, ao invés do que de topo a calda, a inversão delinea os pontos finais da unidade auxiliar de modo que a construção de deleção favorecerá a perda de unidades discretas. Assim, é preferível com o presente método que as seqüências estão na mesma orientação. Orientação aleatória de seqüências quase-repetidas resultará na perda de eficácia de reagrupamento, enquanto orientação consistente das seqüências oferecerá a eficácia mais alta. No entanto, enquanto tendo menos das seqüências contíguas na mesma orientação diminui a eficácia, pode ainda prover elasticidade suficiente para a recuperação eficaz, pode ainda prover elasticidade suficiente para a recuperação eficaz das novas moléculas. Construtos podem ser produzidos com as seqüências quase-repetidas na mesma orientação para permitir eficácia mais alta.
Seqüências podem ser agrupadas em uma orientação de topo a calda usando-se qualquer uma variedade de métodos, incluindo os seguintes: a) Iniciadores que incluem um topo de poly-A e calda de poly-T
que quando produzidos de filamento único proveria orientação pode ser utilizados. Isto é realizado por ter as primeiras poucas bases dos iniciadores produzidos a partir de RNA e portanto RNaseH facilmente removido.
' b) Iniciadores que incluem sítios de clivagem de restrição únicos 25 podem ser utilizados. Sítios múltiplos, uma bateria de seqüências únicas e etapas de ligação e síntese repetida seriam exigidas.
c) A base menos interna do iniciador poderia ser tiolada e uma éxonuclease usada para produzir molécula adequadamente adaptadas.
Em um aspecto, a recuperação das seqüências de agrupamento conta com a identificação de vetores de clonagem com um índice repetitivo reduzido (RI). Seqüências de codificação reagrupadas podem ser então recuperadas por ampliação. Os produtos são reclonados e são expressos. Arecuperação de vetores de clonagem com RI reduzido pode ser efetuada por:
1) O uso de vetores apenas estavelmente mantido quando o ocnstruto é reduzido na complexidade. 5 2) A recuperação física de vetores encurtados por procedimentos
físicos. Neste caso, o vetor de clonagem seria recuperado usando-se procedimentos de isolamento de plasmídio padrão e tamanho fracionado ou em um gel de agarose ou coluna com um corte de baixo peso utilizando-se procedimentos padrão. 10 3) A recuperação de vetores contendo genes interrompidos que
pode ser selecionado quando tamanho de inserto diminui.
4) O uso de técnicas de seleção diretas com uma vetor de expressão e a seleção apropriada.
Seqüências de codificação (por exemplo, genes) oriundos de organismos relacionados podem demonstrar um alto grau de de homologia e codificam totalmente produtos de proteína diversas. Estes tipos de seqüências são particularmente úteis na presente invenção como quase-repetidas. No entanto, enquanto os exemplos ilustrados abaixo demonstram o reagrupamento de seqüências de codificação original proximamente idências (quase-repetidas), esse processo não é limitado a tais repetições quase idências.
O seguinte exemplo demonstra um método exemplar da invenção. Codificação de seqüências de ácidos nucléicos (quase repetida) derivada de três espécies únicas (3)são descritas. Cada seqüência codifica
uma proteína com um conjunto distinto de propriedades. Cada uma das seqüências difere por um único ou poucos pares de base a uma única posição na seqüência. As seqüências quase-repetidas são separadamente ou coletivamente ampliadas e ligadas em conjuntos aleatórios tais que todas as combinações e permutações possíveis em conjuntos aleatórios tais que
todas as permutações e combinações estão disponíveis na população de moléculas ligadas. O número de unidades quase-repetidas pode ser controlado pelas condições de conjunto. O número médio de unidadesquase-repetidas em um construto é definido como o índice repetitivo (RI). Uma vez formado, os construtos podem, ou não podem ser de tamanho fracionado em um gel de agarose de acordo com protocolos publicados, inserido em um vetor de clonagem e transfectado em uma célula ' hospedeira apropriada. As células são então propagadas e "reagrupamento redutivo" é efetuado. A taxa do processo de reagrupamento redutivo pode ser estimulada pela introdução de dano de DNA é desejado. Se a redução em RI for mediada por construção de deleção entre seqüências repetidas por um mecanismo "intramolecular", ou mediadas por eventos de tipo de recombinação através dos mecanismos "intramolecular" é imaterial. O resultado de extremidade é um reagrupamento das moléculas em todas as combinações possíveis. Opcionalmente, o método compreende a etapa adicional da triagem dos membros de biblioteca da combinação embaralhada para identificar membros de biblioteca individuais tendo a capacidade de ligar ou de outra maneira interagir ou catalisar uma reação particular (por exemplo, tal como domínio catalítico de uma enzima) com uma macromolécula predeterminada, tal como, por exemplo, um receptor proteináceo, um oligossacarídeo, vírion ou outro composto ou estrutura predeterminado. Os polipeptídeos que são identificados de tais bibliotecas podem ser usados para finalidades terapêuticas, diagnosticas, pesquisa e relacionadas (por exemplo, catalisadores, solutos para aumento da osmolaridade de uma solução aquosa e similares) e/ou podem ser submetidos a um ou mais ciclos adicionais de embaralhamento e/ou seleção. Em um outro aspecto, é previsto que antes de ou durante recombinação ou reagrupamento, polinucleotídeos gerados pelo método da invenção podem ser submetidos a agentes ou processos que promovem a introdução de mutações para dentro de polinucleotídeos original. A introdução de tais mutações aumentaria a diversidade de polinucleotídeos híbridos resultantes e polipeptídeos codificados a partir das mesmas. Os agentes ou processos que promovem mutagenese podem incluir, mas nãosão limitados a: (+)-CC-1065, ou um análogo sintético, tais como (+)-CC-1065-(N3-Adenina (Ver Sun and Hurley, (1992); um produto de adição de 4'-fluro-4-aminobifenila N-acetilado ou deacerilado capaz de inibir síntese de DNA (Ver, por exemplo, van de Poli e outros (1992)); ou um produto de adição de uma 4-aminobifenila N-acetilado ou deacetilado capaz de inibir síntese de DNA (Ver also, van de Poli e outros (1992), pp. 751-758); cromo trivalente, um sal de cromo trivalente, um hidrocarboneto aromático policíclico (PAH) produtos de adição de DNA capaz de inibir replicação de DNA, tais como 7-bromometil-benz[alfa]antraceno ("BMA"), tris(2,3-
dibromopropil)fosfato ("Tris-BP"), l,2-dibromo-3-cloroprotecido ("DBCP"), 2-bromoacroleína (2BA), benzo[alfa]pireno-7,8-diidrodiol-9-10-epóxido ("BPDE"), um sal de halogênio de platinam(ll), N-hidróxi-2-amino-3-metilimidazo[4,5,f]-quinolina ("N-hidróxi-IQ") e N-hidróxi-2-amino-1-metil-6-fenilimidazo[4,5-f]-piridina ("N-hidróxi-PhlP"). Meio exemplar para diminuir ou
deter ampliação de PCR consiste em luz UV (+)-CC-1065 e (+)-CC-1065-(N3 Adenine). Meios particularmente incluídos são produtos de adição de DNA ou polinucleotídeos compreendendo os produtos de adição de DNA dos polinucleotídeos ou combinação de polinucleotídeos, que podem ser liberados ou removidos por um processo incluindo aquecimento a solução
compreendendo os polinucleotídeos antes de outro processamento. Em um outro aspecto a invenção refere-se a um método de produção de proteínas recombinantes tendo atividade biológica por tratamento de uma amostra compreendendo polinucleotídeos de modelo de filamento duplo que codifica uma proteína de tipo selvagem sob condições de acordo com a invenção
que provêem a produção de polinucleotídeos híbridos ou reagrupados. Produção de variantes de seqüência
A invenção também prove métodos adicionais para a produção de variantes de seqüência do ácido nucleico (por exemplo, celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase) seqüências da invenção. A invenção também prove métodos adicionais para o isolamento de celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase usando-seos ácidos nucléicos e polipeptídeos da invenção. Em um aspecto, a invenção prove para variantes de uma celulase, por exemplo, seqüência de codificação de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase (por exemplo, um gene, cDNA ou mensagem) da invenção,
que podem ser alteradas por qualquer meio, incluindo, por exemplo, métodos aleatórios ou estocásticos, ou, métodos não estocásticos, ou métodos de "evolução dirigida,", como descritos acima.
As variantes isoladas podem ser de ocorrência natural. Variante pode também ser criada in vitro. Variantes podem ser criadas usando-se
técnicas de engenheiramenteo genético, tais como mutagênese de sítio-dirigida, mutagênese aleatória, mutagênese química, procedimentos de deleção de Éxonuclease III, e técnicas de clonagem padrão. Alternativamente, tais variantes, fragmentos, análogos ou derivados podem ser criados usando-se procedimentos de modificação ou síntese química.
Outros métodos de produção de variantes são também familiares àqueles versados na técnica. Estes incluem procedimentos em que seqüências de ácidos nucléicos obtidas a partir de isolados naturais são modificadas para gerar ácidos nucléicos que codificam polipeptídeos tendo características que aumentam seu valor em aplicações industriais ou de laboratório. Em tais
procedimentos, um grande número de seqüências variantes tendo uma ou mais diferenças de nucleotídeo com relação à seqüência obtida a partir do isolado natural são geradas e caracterizadas. Essas diferenças de nucleotídeo podem resultar em mudanças de aminoácidos com relação aos polipeptídeos codificados pelos ácidos nucléicos dos isolados naturais.
Por exemplo, variantes podem ser criadas usando-se PCR
propensa a erro. Em um aspecto de PCR propenso a erro, a PCR é realizada sob condições onde a fidelidade de cópia da polimerase de DNA é baixa, tal uma alta taxa de mutações de ponto é obtida ao longo do comprimento total do produto de PCR. PCR propensa a erro é descrita, por
exemplo, em Leung (1989) Technique 1:11-15) and Caldwell (1992) PCR Methods Applic. 2:28-33. Resumidamente, em tais procedimentos, ácidos nucléicos a serem mutageneizados são misturados com iniciadores de PCR,tampão de reação, MgCI2> MnCI2, Polimerase de Taq e uma concentração apropriada de dNTPs para alcançar uma alta taxa de mutação de ponto ao longo do comprimento total do produto de PCR. Por exemplo, a reação pode ser realizada usando-se 20 imoles de ácido nucléico a serem 5 mutageneizados, 30 pmoles de cada iniciador de PCR, um tampão de reação compreendendo KCI A 50 mM, Tris HCI a 10 mM (pH 8,3) e 0,01% de gelatina, MgCI2 a 7 mM, MnCI2 a 0,5 mM, unidades de polimerase de Taq, dGTP a 0,2 mM, dATP a 0,2 mM, dCTP a 1mM, e dTTP a 1 mM. PCR pode ser realizada para 30 ciclos de 94°C por 1 min, 45°C por 1 min, e 72°C por 1 min. No entanto, será apreciado que estes parâmetros podem ser variados quando apropriados. Os ácidos nucléicos mutageneizados são clonados em um vetor apropriado e as atividades dos polipeptídeos codificados pelos ácidos nucléicos mutageneizados são avaliadas.
Em um aspecto, variantes são criadas usando-se mutagenesede oligonucleotídeo-dirigida para gerar mutações específicas de sítio de qualquer DNA clonado de interesse. Mutagenese de oligonucleotídeo é descrita, por exemplo, em Reidhaar-Olson (1988) Science 241:53-57. Resumidamente, em tais procedimentos uma pluralidade de oligonucleotídeos de filamento duplo que portam uma ou mais mutações a serem introduzidas para dentro do DNA clonado são sintetizadas e inseridas para dentro do DNA clonado a serem mutageneizado. Em um aspecto, clones contendo o DNA mutageneizados são recuperados, são expressos e as atividades do polipeptídeo codificado ali são avaliadas.
Um outro método para a geração de variantes é PCR de cojunto.PCR de conjunto envolve o conjunto de um produto de PCR oriundo de uma mistura de pequenos fragmentos de DNA. Um grande número de reações de PCR diferentes ocorrem em paralelo no mesmo frasco, com os produtos de uma reação de inicialização dos produtos de uma outra reação. PCR de conjunto é descrita na por exemplo, patente U.S. n- 5.965.408.
Em um aspecto, mutagenese de PCR sexual é um métodoexemplar de geração de variantes da invenção. Em um aspecto de recombinação homóloga forçada por mutagenese sexual ocorre entre DNAmoléculas de seqüência de DNA in vitro diferente mas altamente relacionada, como um resultado de fragmentação aleatória da molécula de DNA com base na homologia de seqüência, seguida por fixação do cruzamento por extensão de iniciador em uma reação de PCR. Mutagênese
de PCR sexual é descrita, por exemplo, em Stemmer (1994) Proc. Natl. Acad. Sei. USA 91:10747- 10751. Resumidamente, em tais procedimentos uma pluralidade de ácidos nucléicos a serem recombinados são digeridos com DNase para gerar fragmentos tendo um tamanho médio de 50-200 nucleotídeos. Fragmentos do tamanho médio desejado são purificados e são
ressuspensos em uma mistura de PCR. PCR é conduzida sob condições que facilitam recombinação entre os fragmentos de ácido nucléico. Por exemplo, PCR pode ser realizada por ressuspensão dos fragmentos purificados a uma concentração de 10-30 ng/(il em uma solução de 0,2 mM de cada dNTP, MgCI2 2,2 mM, KCL a 50 mM, Tris HCI a 10 mM, pH 9,0, e
0,1% de Triton X-100. 2,5 Unidades de polimerase de Taq por 100:1 de mistura de reação são adicionadas e PCR é realizada usando-se os seguintes regime: 94°C por 60 segundos, 94°C por 30 segundos, 50-55°C por 30 segundos, 72°C por 30 segundos (30-45 vezes) e 72°C por 5 minutos. No entanto, será apreciado que estes parâmetros podem ser
variados quando apropriado. Em alguns aspectos, oligonucleotídeos podem ser incluídos nas reações de PCR. Em outros aspectos, o fragmento de Klenow de polimerase I de DNA pode ser usado em um primeiro conjunto de reações de PCR e polimerase de Taq pode ser usada em um conjunto subseqüente de reações de PCR. Seqüências recombinantes são isoladas e
as atividades dos polipeptídeos que eles codificam são avaliadas.
Em um aspecto, variantes são criadas por mutagênese in vivo. Em alguns aspectos, mutações aleatórias em uma seqüência de interesse são geradas por propagação da seqüência de interesse em uma cepa bactérias na tal como uma cepa de E. coli, que porta mutações em uma ou
mais das trajetórias de reparo de DNA. Tais cepas "mutadoras" têm uma taxa de mutação aleatória mais alta do que aquela de uma origem de tipo selvagem. Propagação do DNA em uma dessas cepas finalmente gerarãomutações aleatórias dentro do DNA. Cepas mutadoras adequadas para o uso para mutagênese in vivo são descritas na publicação de PCT ne WO 91/16427, publicada em 31 de outubro de 1991, entitulado "Métodos for Fenotype Creation from Multiple Gene Populations". Variantes podem também ser geradas usando-se mutagênese
de cassete. Em mutagênese de cassete uma pequena região de uma molécula de DNA de filamento duplo é substituída com um "cassete" de oligonucleotídeo sintético que difere da seqüência nativa. O oligonucleotídeo freqüentemente contém seqüência nativa totalmente e/ou parcialmente aleatorizada.
Mutagênese de conjunto repetida pode também ser usada para gerar variantes. Mutagênese de conjunto repetida é um algoritmo para engenheiramento de proteína (mutagênese de proteína) desenvolvida para produzir populações diversas de mutantes fenoticamente relacionados cujos membros diferem em seqüência de aminoácidos. Este método usa um mecanismo de feedback para controlar ciclos sucessivos de mutagênese de cassete combinatoriais. Mutagênese de conjunto repetida é descrita, por exemplo, in Arkin (1992) Proc. Natl. Acad. Sei. USA 89:7811-7815.
Em alguns aspectos, variantes são criadas usando-se mutagênese de conjunto exponencial. Mutagênese de conjunto exponencial é um proceso para a geração de bibliotecas combinatoriais com uma alta porcentagem de mutantes simples ou funcionais, em que grupos pequenos de resíduos são aleatorizados em paralelo para identificar, a cada posição alterada, aminoácidos que levam a proteínas funcionais. Mutagênese de conjunto exponencial é descrita, por exemplo, em Delegrave (1993) Biotechnology Res. 11:1548-1552. Mutagênese de sítio-dirigida e aleatória são descritas, por exemplo, in Arnold (1993) Current Opinion in Biotechnology 4:450-455.
Em alguns aspectos, as variantes são criadas usando-se procedimentos de embaralhamento em que porções de uma pluralidade de ácidos nucléicos que codificam polipeptídeos distintos são fundidos entre si para criar seqüências de ácidos nucléicos quiméricas que codificampolipeptídeos quiméricos como descritos na patente U.S. n9 5.965.408, depositada em 9 de julho de 1996, entitulada, "Method of DNA Reassembly by Interrupting Synthesis" e na patente U.S. nQ 5.939.250, depositada em 22 de maio de 1996, entitulada, "Production of Enzymes Having Desired Activities by Mutagenesis".
As variantes dos polipeptídeos da invenção podem ser variantes em que um ou mais resíduos de aminoácido dos polipeptídeos das seqüências da invenção estão substituídas com um resíduo de aminoácido conservado ou não conservado (em um aspecto um resíduo de aminoácido
conservado) e tal resíduo de aminoácido substituído pode ou pode não ser um codificado pelo código genético.
Em um aspecto, substituições conservadoras são aquelas que substituem um dado aminoácido em um polipeptídeo por um outro aminoácido de características semelhantes. Em um aspecto, substituições
conservadoras da invenção compreendem as seguintes substituições: substituições de um aminoácido alifático, tais como Alanina, Valina, Leucina e Isoleucina com um outro aminoácido alifático; substituição de uma Serina com uma Treonina ou vice-versa; substituição de um resíduo ácido, tais como Ácido aspártico e Ácido glutâmico com um outro resíduo ácido;
substituição de um resíduo que porta um grupo amida, tais como Asparagina e Glutamina, com um outro resíduo que porta um grupo amida troca de um resíduo básico tais como lisina e arginina com um outro resíduo básico; e substituição de um resíduo aromático, tal como Fenilalanina, Tirosina com um outro resíduo aromático.
Outras variantes são aquelas em que um ou mais dos resíduos
de aminoácidos de um polipeptídeo da invenção inclui um grupo substituinte. Em um aspecto, outras variantes são aquelas em que o polipeptídeo está associado um outro composto, tal como um composto para aumentar a semivida do polipeptídeo (por exemplo, polietileno glicol). Variantes
adicionais são aquelas em que aminoácidos adicionais são fundidos ao polipeptídeo, tal como uma seqüência líder, uma seqüência secretória, uma seqüência de pró-proteína ou uma seqüência que facilita purificação,162
enriquecimento ou estabilização do polipeptídeo.
Em alguns aspectos, os fragmentos, derivados e análogos retêm a mesma atividade ou função biológica como os polipeptídeos da invenção. Em outros aspectos, o fragmento, derivado, ou análogo inclui uma pró-
proteína, tal que o fragmento, derivado, ou análogo pode ser ativado por clivagem da porção de pró-proteína para produzir um polipeptídeo ativo.
Otimização de códons para alcançar altos níveis de expressão de proteína em células hospedeiras.
A invenção prove métodos para a modificação de celulase, por
exemplo, ácidos nucléicos de codificação de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, para modificar (por exemplo, otimizar) uso de códon. Em um aspecto, a invenção prove métodos para a modificação de códons em um ácido nucléico que codifica uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase,
mananase e/ou betaglicosidase para aumentar ou diminuir sua expressão em uma célula hospedeira. A invenção também prove ácidos nucléicos que codificam uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase modificada para aumentar sua expressão em uma célula hospedeira, celulase, por exemplo, enzima de
endoglucanase, celobioidrolase, mananase e/ou betaglicosidase assim modificada, e métodos de produção de celulase modificada, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. O método compreende identificação de um códon "não preferido" ou um códon "menos preferido" em celulase, por exemplo,
endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, ácido nucléico de codificação de enzima que codifica e substituição de um ou mais de destes códons não preferidos ou menos preferidos com um "códon preferido" que codifica o mesmo aminoácido que o códon substituído e pelo menos um códon não preferido ou códon menos preferido no ácido nucléico
foi substituído por um códon preferido que codifica o mesmo aminoácido. Um códon preferido é um códon ultra-representado em seqüências de codificação em genes na célula hospedeira e um códon não preferido oucódon menos preferido é um códon sub- representados de seqüências de codificação na célula hospedeira.
Células hospedeiras para a expressão dos ácidos nucléicos, cassetes de expressão e vetores da invenção incluem bactérias, levedura, 5 fungos, células de planta, células de insetos e células de mamíferos (ver descrição acima). Assim, a invenção prove métodos para a otimização do uso de códon em todas estas células, ácidos nucléicos alterados por códon e polipeptídeos produzidos pelos ácidos nucléicos alterados por códon. Células hospedeiras exemplares incluem bactérias gram negativas, tal como
Escherichia coli; bactérias gram positivas, tais como Streptomyces sp., Lactobacillus gasseri, Lactococcus lactis, Lactococcus cremoris, Bacillus subtilis, Bacillus cereus. Células hospedeiras exemplares também incluem organismos eucarióticos, por exemplo, várias leveduras, tal como Saccharomyces sp., incluindo Saccharomyces cerevisiae,
Schizosaccharomyces pombe, Pichiapastoris, e Kluyveromyces lactis, Hansenula polymorpha, Aspergillus niger, e células de mamíferos e linhagens de células e células de insetos e linhagens de células. Logo, a invenção também inclui ácidos nucléicos e polipeptídeos otimizados para expressão nestes organismos e espécies.
Por exemplo, os códons de um ácido nucléico que codifica uma
celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase isolada de uma célula bacteriana são modificados tal que o ácido nucléico é otimamente expresso em uma célula bacteriana diferente das bactérias a partir das quais a celulase, por exemplo,
enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase foi derivada, uma levedura, fungos, uma célula de planta, uma célula de inseto ou uma célula de mamífero. Métodos para a otimização de códons são bem-conhecidos na técnica, ver, por exemplo, a patente U.S. nQ 5.795.737; Baca (2000) Int. J. Parasitol. 30:113-118; Hale (1998) Proteína
Expr. Purif. 12:185-188; Narum (2001) Infect. Immun. 69:7250-7253. Ver also Narum (2001) Infect. Immun. 69:7250-7253, descrevendo otimização de códons em sistemas de camundongo; Outchkourov (2002) Protein Expr.Purif. 24:18-24, descrevendo otimização de códons em levedura; Feng (2000) Biochemistry 39:15399-15409, descrevendo otimização de códons W.E. coli; Humphreys (2000) Protein Expr. Purif. 20:252- 264, descrevendo otimização de uso de códon que afeta secreção em E. coli. Animais não humanos transgênicos
A invenção prove animais não humanos transgênicos compreendendo um ácido nucléico, um polipeptídeo (por exemplo, uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase), um cassete de expressão ou vetor ou uma célula transfectada ou transformada da invenção. A invenção também prove - métodos de produção e uso destes animais não humanos transgênicos.
Os animais não humanos transgênicos podem ser, por exemplo,cachorros, bodes, coelhos, carneiro, porcos (incluindo todos os porcos, suínos e animais relacionados), vacas, ratos e camundongos, compreendendo os ácidos nucléicos da invenção. Estes animais podem ser usados, por exemplo, como modelos in vivo para estudar celulase, por exemplo, atividade de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, ou, como modelos para triar agentes que mudam a celulase, por exemplo, atividade de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase in vivo. As seqüências de codificação para os polipeptídeos a serem expressos nos animais não humanos transgênicos podem ser projetadas serem constitutivas, ou, sob o controle de fatores reguladores transcritivos induzíveis ou específico de desenvolvimento, específico de tecido.
Animais não humanos transgênicos podem ser designados egerados usando-se qualquer método conhecido na técnica; ver, por exemplo, as patentes U.S. nes 6.211.428; 6.187.992; 6.156.952; 6.118.044; 6.111.166; 6.107.541; 5.959.171; 5.922.854; 5.892.070; 5.880.327; 5.891.698; 5.639.940; 5.573.933; 5.387.742; 5.087.571, descrevendoproduzindo e usando ovos e células transformadas e camundongos, ratos, coelhos, carneiro, porcos e vacas transgênicos. Ver também, por exemplo, Pollock (1999) J. Immunol. Métodos 231:147-157, descrevendo a produçãode proteínas recombinantes no leite de animais leteiros transgênicos; Baguisi (1999) Nat. Biotechnol. 17:456-461, demonstrando a produção de bodes transgênicos. A patente U.S. n9 6.211.428, descreve a produção e uso de mamíferos não humanos transgênicos que expressam em seu 5 cérebros um construto de ácido nucléico compreendendo uma seqüência de DNA. A patente U.S. n9 5.387.742, descreve injeção de seqüências de DNA sintéticas ou recombinante clonadas em ovos de camundongos fertilizados, implantação dos ovos injetados em fêmeas pseudo-gràvidas, e desenvolvimento a termo de camundongos transgênicos. A patente U.S. n9 6.187.992, descreve a produção e uso de um camundongo transgênico.
"Animais knockout" podem também ser usados para praticar os métodos da invenção.
í
Por exemplo, em um aspecto, os animais transgênicos ou modificados da invenção compreendem um "animal de knockout", por exemplo, um "camundongo knockout," engenheirado não expresam um gene endógeno, que é substituído com um gene que expressa uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase da invenção, ou, uma proteína de fusão compreendendo a celulase, por exemplo, enzima de endoglucanase, celobioidrolase, 20 mananase e/ou betaglicosidase da invenção.
Sementes e plantas transgênicas
A invenção prove sementes e plantas transgênicas compreendendo um ácido nucléico, um polipeptídeo (por exemplo, uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase,
mananase e/ou betaglicosidase), um cassete de expressão ou vetor ou uma célula transfectada ou transformada da invenção. A invenção também prove produtos de planta, por exemplo, óleos, sementes, folhas, extratos e similares, compreendendo um ácido nucléico e/ou um polipeptídeo (por exemplo, uma celulase, por exemplo, enzima de endoglucanase,
celobioidrolase, mananase e/ou betaglicosidase) da invenção. A planta transgênica pode ser dicotiledônea (uma dicot) ou monocotiledônea (uma monocot). A invenção também prove métodos de produção e uso destassementes e plantas transgênicas. A planta transgênica ou célula de planta que expressa um polipeptídeo da presente invenção pode ser construída de acordo com qualquer método conhecido na técnica. Ver, por exemplo, a patente U.S. nQ 6.309.872.
' Ácidos nucléicos e construtos de expressão da invenção podem
ser introduzidos para dentro de uma célula de planta por qualquer meio. Por exemplo, ácidos nucléicos ou construtos de expressão podem ser introduzidos para dentro do genoma de um hospedeiro de planta desejada, ou, os ácidos nucléicos ou construtos de expressão podem ser epissomas.
Introdução para dentro do genoma de uma planta desejada pode ser tal que a celulase do hospedeiro, por exemplo, produção de enzima de endoglucanase, celobioidrolase, mananase e/ou beta- glicosidase é regulado por elementos de controle de tradução ou transcritivos endógenos. A invenção também prove "plantas knockout" onde inserção de seqüência de
genes por, por exemplo, recombinação homóloga, rompeu a expressão do gene endógeno. Meios para gerar plantas de " knockout" são bem-conhecidos na técnica, ver, por exemplo, Strepp (1998) Proc Natl. Acad. Sei. USA 95:4368-4373; Miao (1995) Plant J 7:359- 365. Ver descrição sobre plantas transgênicas, abaixo.
Os ácidos nucléicos da invenção podem ser usados para conferir
características desejadas sobre essencialmente qualquer planta, por exemplo, sobre plantas de produção de amido, tais como batata, tomate, soja, beterrabas, milho, trigo, arroz, cevada e similares. Ácidos nucléicos da invenção podem ser usados para manipular trajetórias metabólicas de uma
planta a fim de otimizar ou alterar expressão de hospedeiro de celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. A pode mudar celulase, por exemplo, atividade de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase em uma planta. Alternativamente, uma celulase, por exemplo, enzima de
endoglucanase, celobioidrolase, mananase e/ou betaglicosidase da invenção pode ser usada na produção de uma planta transgênica para produzir um composto não produzido naturalmente pela planta. Isto podedimuir os custos de produção ou criam um novo produto.
Em um aspecto, a primeira etapa na produção de uma planta transgênica envolve produção de um construto de expressão para a expressão em uma célula de planta. Estas técnicas são bem-conhecidos na 5 técnica. Elas podem incluir seleção e clonagem de um promotor, uma seqüência de codificação para a facilitação de ligação eficiente de ribossomas a mRNA e seleção das seqüências terminadoras de gene apropriadas. Um promotor constitutivo exemplar é CaMV35S, oriundo do vírus de mosaico de couve-flor, que em geral resulta em um alto grau de
expressão em plantas. Outros promotores são mais específicos e respondem a sugestões no ambiente externo ou interno da planta. Um promotor induzível leve exemplar é o promotor oriundo do gene cabe, que codifica a principal proteína de ligação de clorofila a/b.
Em um aspecto, o ácido nucléico é modificado para alcançar
expressão maior em uma célula de planta. Por exemplo, uma seqüência da invenção é provável ter uma percentagem mais alta de pares de nucleotídeo A-T em comparação com aquela vista em uma planta, algumas das quais preferem pares de nucleotídeo G-C. Portanto, nucleotídeos A-T na seqüência de codificação podem ser substituídos com nucleotídeos G-C sem
significativamente mudar a seqüência de aminoácidos para aumentar a produção do produto de gene em células de planta.
Gene marcador selecionável pode ser adicionado ao construto de gene a fim de identificar células ou tecidos de planta que sucessivamente integraram o transgene. Isto pode ser necessariamente uma vez que
alcaçando incorporação e expressão de genes em células de planta é um evento raro, ocorrendo em extamente pouca percentagem das células ou tecidos direcionados. Gene marcador selecionáveis codificam proteínas que provêem resistência a agentes que são normalmente tóxicos a plantas, tais como antibióticos ou herbicidas. Apenas células de planta que integraram o
gene marcador selecionável sobreviverão quando desenvolvidas sobre um meio contendo o herbicida ou antibiótico apropriado. Quanto a outros genes inseridos, genes marcadores também exigem seqüências de terminação epromtoras para uma função adequada.
Em um aspecto, produção de planta transgênicas ou sementes compreende incorporação de seqüências da invenção e, opcionalmente, genes marcadores em um construto de expressão alvo (por exemplo, um
plasmídio), juntamente com o posicionamento das seqüências terminadoras e promotoras. Isto pode envolver transferência do gene modificado na planta através de um método adequado. Por exemplo, um construto pode ser introduzido diretamente para dentro do DNA genômico da célula de planta usando-se técnicas, tais como eletroporação e microinjeção de protoplastas
de célula de planta, ou os construtos podem ser introduzidos diretamente para tecido de planta usando-se métodos balísticos, tal como bombardeamento de partículas de DNA. Por exemplo, ver, por exemplo, Christou (1997) Plant Mol. Biol. 35:197-203; Pawlowski (1996) Mol. Biotechnol. 6:17-30; Klein (1987) Nature 327:70-73; Takumi (1997) Genes
Genet. Syst. 72:63-69, discutindo o uso de bombardeamento de partículas para introduzir transgenes para dentro de trigo; and Adam (1997) supra, para o uso de bombardeamento de partículas to introduce YACs into células de planta. Por exemplo, Rinehart (1997) supra, usou bombardeamento de partículas para gerar plantas de algodão transgênico. Aparelho para a
aceleração de partículas é descrito na patente U.S. n9 5.015.580; e, a BioRad comercialmente disponível (Biolistics) intrumento de aceleração de partícula PDS-2000; ver também, John, a patente U.S. n9 5.608.148; and Ellis, A patente U.S. n9 5.681.730, descrevendo transconstrução medidada por partícula de gimnoespermas.
Em um aspecto, protoplastos podem ser imobilizados e injetados
com ácidos nucleicos, por exemplo, um construto de expressão. Embora regeneração de planta a partir de protoplastos não seja fácil com cereais, regeneração de planta é possível em legumes usando-se embriogênese somática a partir de calo derivado de protoplasto. Tecidos organizados
podem ser transformados com DNA nu usando-se técnica de pistola de gene, onde DNA é revestido sobre microprojéteis de tungstênio, tiro 1/centésimo do tamanho de células, que portam o DNA profundo para dentrodas célula e organelas. Tecido transformado é então introduzido para regenerar, usualmente por embriogênese somática. Esta técnica foi bem-sucedida em várias espécies de cerais incluindo milho e arroz.
Ácidos nucléicos, por exemplo, construtos de expressão, podem 5 também ser introduzidos para dentro de células de planta usando-se vírus recombinantes. Células de planta podem ser transformadas usando-se vetores virais, tais como, por exemplo, vetores derivados de vírus de mosaico de tabaco (Rouwendal (1997) Plant Mol. Biol. 33:989- 999), ver Porta (1996) "Use of viral replicons for the expression of genes in plants,"
Mol. Biotechnol. 5:209-221.
Alternativamente, ácidos nucléicos, por exemplo, um construto de expressão, podem ser combinados com regiões de flanqueamento de T-DNA adequadas e introduzidos para dentro de um vetor hospedeiro de Agrobacterium tumefaciens convencional. As funções de virulência do
hospedeiro de Agrobacterium tumefaciens dirigirá a inserção do construto e marcador adjacente no DNA de célula de planta quando uma célula é infectada pelas bactérias. Técnicas de transconstrução mediada por Agrobacterium tumefaciens, incluindo desarmamento e uso de vetores binários, são bem-descritos na literatura científica. Ver, por exemplo, Horsch
(1984) Science 233:496-498; Fraley (1983) Proc. Nalfatl. Acalfad. Sei. USA 80:4803 (1983); Gene Transfer to Plants, Potrykus, ed. (Springer- Verlag, Berlin 1995). O DNA em uma célula de A. tumefaciens está contido no cromossoma bacteriano, bem como em uma outra estrutura conhecida como um plasmídio de Ti (indução de tumor). O plasmídio de Ti contém uma
extensão de DNA chamado T-DNA (-20 kb de comprimento) que é transferido para a célula de planta no processo de infecção e uma série de genes vir (virulência) que dirigem o processo de infecção A. tumefaciens pode apenas infectar uma planta através dos ferimentos: quando uma raiz ou tronco de planta é ferida ele desprende certos sinais químicos, em
resposta àquilo, os genes de semente de A. tumefaciens se tornam ativados e dirigem uma série de eventos necessários para a transfencia do T-DNA do plasmídio de Ti para o cromossoma da planta. O T-DNA então entra nacélula de planta através do ferimento. Uma especulação é que o T-DNA espera até que o DNA de planta esteja sendo replicada ou transcrita, então os próprios insertos no DNA de planta exposto. A fim de usar A. tumefaciens como um vetor de transgene, a seleção de indução a tumor de T-DNA tem
' de ser removida, enquanto retendo as regiões de borda de T-DNA e os genes vir. O transgene é então inserido entre as regiões de borda de T-DNA, onde ele é transferido para a célula de planta e se torna integrado nos cromossomas de planta.
A invenção prove para a transconstrução de plantas de
monocotiledônea plants usando-se os ácidos nucléicos da invenção, incluindo cereais importantes, ver Hiei (1997) Plant Mol. Biol. 35:205-218. Ver also, por exemplo, Horsch, Science (1984) 233:496; Fraley (1983) Proc. Natl. Acad. Sei USA 80:4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32: 1135-1148, discussão de integração de T-DNA em DNA genômico.
Ver also D'Halluin, a patente U.S. nQ 5.712.135, descrevendo um processo para a integração estável de um DNA compreendendo um gene que é funcional em uma célula de um cereal, ou outra planta monocotiledônea. Em um aspecto, a terceira etapa envolve seleção e regeneração de plantas inteiras capaz de transmitir o gene alvo incorporado para a próxima geração.
Tais técnicas de regeneração pode usar manipulação de certos fitohormônios em um meio de crescimento de cultura de tecido. Em um aspecto, o método usa um marcador de biocida e/ou herbicida que foi introduzido juntamente com as seqüências de nucleotídeos desejadas. Regeneração de planta de protoplastos cultivados é descrita em Evans e
outros, Protoplasts Isolation and Culture, Handbook of Cell de planta Culture, pp. 124-176, MacMillilan Publishing Company, New York, 1983; and Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. Regeneração pode também ser obtida a partir de calo, explantes, órgãos ou suas partes de planta. Tais técnicas de regeneração
são descritas em geral em Klee (1987) Ann. Rev. of Plant Phys. 38:467-486. Para se obter plantas inteiras a partir de tecidos transgênicos tais como embriões imaturos, eles podem ser desenvolvidos sob condições ambientaiscontroladas em um série de meio contendo nutrientes e hormônios, um processo conhecido como cultura de tecido. Uma vez que plantas inteiras são geradas e produzem semente, avaliação do progênie se inicia.
Em um aspecto, depois do cassete de expressão é estavelmente incorporado em plantas transgênicas, pode ser introduzido para dentro de outras plantas por cruzamento sexual. Qualquer de numerosas técnicas de reprodução padrão podem ser vistas, dependendo da espécie a ser cruzada. Uma vez que a expressão transgência dos ácidos nucléicos da invenção leva a mudanças fenotípicas, plantas compreendendo os ácidos nucléicos
recombinantes da invenção podem ser sexualmente cruzados com uma segunda planta para se obter um produto final. Assim, a semente da invenção pode ser derivada de um cruzamento entre duas plantas transgênicas da invenção, ou um cruzamento entre uma plant da invenção e uma outra planta. Os efeitos desejados (por exemplo, expressão dos polipeptídeos da invenção para produzir uma planta em que o comportamento de floração é alterado) podem ser aumentados quando ambas as plantas de origem expressam os polipeptídeos (por exemplo, a celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase) da invenção. Os efeitos desejados podem podem ser passados para gerações de planta futuras por meio de propagação padrão.
Em um aspecto, os ácidos nucléicos e polipeptídeos da invenção são expressos em ou são inseridos em qualquer planta ou semente. Plantas transgênicas da invenção podem ser dicotiledônea ou monocotiledônea .
Examplos de plantas de monocot transgênicas da invenção são capins, tais como capim do prado (blue grass, Poa), capim de forragem, tais como festuca, lolium, capim temperado, tais como Agrostis, e cereais, por exemplo, trigo, aveias, centeio, cevada, arroz, sorgo, e milho (milho). Exemplos de plantas transgênicas dicot da invenção são tabaco, legumes, tais como lupins, batata, beterraba açucareira, ervilha, feijão e soja, e plantas crucíferas (família Brassicaceae), tais como couve-flor, semente de colza, e o organismo de modelo proximamente relacionado Arabidopsisthaliana. Assim, as plantas e sementes transgênicas da invenção incluem uma ampla faixa de plantas, incluindo, mas não limitadas a, espécies oriundos dos gêneros Anacardium, Arachis, Asparagus, Atropa, Avena, Brassica, Citrus, Citrullus, Capsicum, Carthamus, Cocos, Coffea, Cucumis,
' Cucurbita, Daucus, Elaeis, Fragaria, Glycine, Gossypium, Helianthus, Heterocallis, Hordeum, Hyoscyamus, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Mains, Manihot, Majorana, Medicago, Nicotiana, Olea, Oryza, Panieum, Pannisetum, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Primus, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanum, Sorgo, Theobromus,
Trigonella, Triticum, Vicia, Vitis, Vigna, e Zea.
Em concretizações alternativas, os ácidos nucléicos da invenção são expressos em plantas que contêm células fibrosas, incluindo, por exemplo, algodão, árvore de paina (Kapok, Ceiba pentandra), "desert willow" (chilopsis gelatinosa), creosote bush "Larrea tridentada), winterfat (Eucolia
lanata), pau-de-balsa, rami, "kenaf" (Hibiscus cannabinus), cânhamo, vinagueira (hipiscus sabdariffa), juta, sisal abaca e linho. Em concretizações alternativas, as plantas transgênicas da invenção podem ser membros do gênero Gossypium, incluindo membros de quaisquer espécies de Gossypium, tais como G. arboreum;. G. herbaceum, G. barbadense, and G.
hirsutum.
A invenção também prove plantas transgênicas a serem usadas para a produção de grandes quantidades dos polipeptídeos (por exemplo, uma celulase, por exemplo, anticorpo ou enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase) da invenção. Por exemplo,
ver Palmgren (1997) Trends Genet. 13:348; Chong (1997) Transgenic Res. 6:289-296 (produção de beta-caseína de proteína de leite humano em plantas de batata transgênicas usando-se um promotor sintase de manopina bidirecional, induzível por auxina (mas1,2') com métodos de transconstrução de disco de folha mediados por Agrobacterium tumefaciens).
Usando-se procedimentos conhecidos, aquele versado pode triar
quanto a plantas da invenção por detecção do aumento ou diminuição de proteína ou mRNA de transgene em plantas transgênicas. Meios paradetecção e quantificação de mRNAs ou proteínas são bem conhecidos na técnica.
Polipeptídeos e peptídeos
Em um aspecto, a invenção prove polipeptídeos recombinantes ou isolados tendo uma identidade de seqüência (por exemplo, pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%,
1ou mais, ou complete (100%) identidade de seqüência, ou homologia) a uma seqüência exemplar da invenção, por exemplo, proteínas tendo uma seqüência como indicada em SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO.H4, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 26, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 34, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 42, SEQ ID NO: 143, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 50, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164 ou SEQ ID NO: 166 (ver também as tabelas 1, 2, e 3, Exemplos 1 e 4, abaixo, e listagem de seqüência)). A percentagem de identidade deseqüência pode ser acima do comprimento total do polipeptídeo, ou, a identidade pode ser acima de uma região de pelo menos cerca de 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 ou mais resíduos.
' Polipeptídeos da invenção podem também ser mais curtos do
que o comprimento total dos polipeptídeos exemplares. Em aspectos alternativos, a invenção prove polipeptídeos (peptídeos, fragmentos) que variam em tamanho entre cerca de 5 e o comprimento total de um polipeptídeo, por exemplo, uma enzima, tais como uma celulase, por
exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase; tamanhos exemplares sendo de cerca de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, ou mais resíduos, por exemplo, resíduos contíguos de uma celulase exemplar, por exemplo,
enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase da invenção. Peptídeos da invenção (por exemplo, uma subseqüência de um polipeptídeo exemplar da invenção) podem ser úteis como, por exemplo, sondas de marcação, antígenos (imunógenos), tolerágenos, motivos, celulase, por exemplo, sítios ativos de enzima de endoglucanase,
celobioidrolase, mananase e/ou beta- glicosidase (por exemplo, "domínios cataiíticos"), seqüências de sinal e/ou pré-pró domínios.
Em aspectos alternativos, polipeptídeos da invenção tendo atividade de celulase, por exemplo, atividade de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase são membros de um gênero
de polipeptídeos que partilham elementos estruturais específicos, por exemplo, resíduos de aminoácidos, que se correlacionam com atividade de celulase, por exemplo, atividade de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. Estes elementos estruturais partilhados podem ser usados para a geração rotineira de celulase, por exemplo,
variantes de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. Estes elementos estruturais partilhados de celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase da invenção podem ser usados como orientação para a geração rotineira de celulase, por exemplo, variantes de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase dentro do escopo do gênero de polipeptídeos da invenção. Como usado aqui, os termos "celulase, por exemplo,
endoglucanase, celobioidrolase, mananase e/ou betaglicosidase" incluem quaisquer polipeptídeo ou enzimas capaz de catalisar a decomposição química e/ou hidrólise completa ou parcial de celulose (por exemplo, polipeptídeos exemplares da invenção, ver também As tabelas 1, 2, e 3, Exemplos 1 e 4, abaixo), ou qualquer modificação de uma celulose ou material lignocelulótico, por exemplo, um material de biomassaa compreendendo lignocelulose.
Em alguns aspectos, um polipeptídeo da invenção pode ter uma atividade enzimática alternativa, por exemplo, como indicada na tabela 3, abaixo. Por exemplo, o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 164, codificada, por exemplo, por SEQ ID NO: 163, pode ter atividade de celulase/ endoglucanase alcalina; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 110, codificada, por exemplo, por SEQ ID NO: 109, pode ter atividade de xilanase; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 12, codificada, por exemplo, por SEQ ID NO: 11 , pode ter atividade de oxidorredutase de ligação de NAD; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 118, codificada, por exemplo, por SEQ ID NO: 117, pode ter atividade de desidrogenase de cadeia curta; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 14, codificada, por exemplo, por SEQ ID NO: 13, pode ter atividade de desidrogenase dependente de NADH; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 138, codificada, por exemplo, por SEQ ID NO: 137, pode ter atividade de peptidase; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 162, codificada, por exemplo, por SEQ ID NO: 161, pode ter atividade endoglucanase alcalina, além da atividade de celulase; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 42, codificada, por exemplo,por SEQ ID NO: 41, pode ter atividade de sintetase de tRNA de cisteínila; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 32, codificada, por exemplo, por SEQ ID NO: 31, pode ter atividade de fosforilase de celodextrina; o polipeptídeo tendo uma seqüência comoindicada em SEQ ID NO:50, codificada, por exemplo, por SEQ ID NO: 49, pode ter atividade de oxidorredutse de fdhd/narq; o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 54, codificada, por exemplo, por SEQ ID NO:53, pode ter uma atividade de S-adenosilmetionina de radical (SAM); o polipeptídeo tendo uma seqüência como indicada em SEQ ID NO: 58, codificada, por exemplo, por SEQ ID NO: 57, pode ter uma atividade de protease de tipo subtilisina; etc, como indicado abaixo:<formula>formula see original document page 0</formula>SEQID
NO: Atividade enzimática 119, 120 ORF 002 - oxidorredutase
ORF 004-família 5 121, 122 (celulase)
ORF 006-família 1 (B-123, 124 glicosidase)
ORF 009-família 1 (B-125, 126 glicosidase)
ORF 004 - desidrogenase de 127,128 cadeia curta
ORF 010 - desidrogenase de 129, 130 cadeia curta
ORF 005 - desidrogenase 13, 14 dependente de NADH
ORF 007-família 5 131, 132 (celulase)
ORF 006-família 1 (B-133, 134 glicosidase)
ORF 001 - celulase (família 135, 136 de hidrolase de glicosila 5)
137, 138 ORF 001 - peptidase_M37
ORF 001 - desidrogenase de 139, 140 treonina
Sítio de clivagem de Signalp
Sinal de seqüência
1-19
MPKVMLVTGGSRGIGAAVA
Número
Fonte de EC
Desconhecido 1,4,3,16
Desconhecido 3,2,1,4
Desconhecido 3,2,1,21
Desconhecido 3,2,1,21
Desconhecido 1,1,1,100
Desconhecido 1„,
Desconhecido 1,1,1,18
Desconhecido 3,2,1,4
Desconhecido 3,2,1,21
Desconhecido 3,2,1,4
Desconhecido 3,5,1,
Desconhecido 1,,,SEQID
NO: Atividade enzimática
ORF 005-família 1 (Í3-141, 142 glicosidase)
ORF 003-família 1 (I3-143, 144 glicosidase)
ORF 002-família 1 (Í3-145, 146 glicosidase)
147, 148 família 10 (xilanase)
149, 150 família 5 (celulase)
ORF 007-família 1 (6-15,16 glicosidase)
151, 152 família 5 (celulase)
153, 154 família 5 (celulase)
155, 156 família 5 (celulase)
157, 158 família 5 (celulase)
159, 160 família 10 (xilanase)
celulase/endoglucanase 161,162 alcalina
165,166 xilanase
17, 18 ORF 005 - B-lactamase
Sítio de clivagem de
Signalp Sinal de seqüência
Fonte
Número de EC
1-26
MLKVLRKPIISGLALALLLPAGAAGA
1-30
1-23
MSCRTLMSRRVGWGLLLWGGLFLRTGSVTG
MRYVLISCLALASLCAQPLPVST
Desconhecido 3,2,1,21
Desconhecido 3,2,1,21
Desconhecido 3,2,1,21
Desconhecido 3,2,1,8
Desconhecido 3,2,1,4
Desconhecido Desconhecido Desconhecido Desconhecido Desconhecido Desconhecido
Desconhecido
3,2,1,21
3,2,1,4
3,2,1,4
3,2,1,4
3,2,1,4
3,2,1,8
CO
Desconhecido 3,5,2,6SEQ ID
NO:
19, 20 21,22 23, 24 25,26 27, 28 29, 30 3,4 31,32 33, 34 35, 36 37, 38
Atividade enzimática
ORF 008-família 10
(xilanase) 1-20
ORF 001 - família 5 (celulase)
ORF 003 - Família 16 + CBM 1-26
ORF 001 - família 1 (B-glicosidase)
ORF 002-família 1 (B-glicosidase)
ORF 004-família 1 (B-glicosidase)
ORF 008-família 1 (B-glicosidase)
ORF 002 - celodextrina fosforilase
ORF 006-família 1 (B-glicosidase)
Sítio de clivagem de
Signalp Sinal de seqüência
ORF 007-família 5 (celulase)
ORF 011 - família 1 (B-glicosidase)
1-23
MPVLFALFLVASSCAAQSLA
MYKRLLSSVLIIMLLLSAWSPISVQA
MNKILKLFSSLLLFAGICPALQA
Fonte
Desconhecido
Clostrídium thermocellum
Clostrídium thermocellum
Clostrídium thermocellum
Número de EC
3,2,1,8 3,2,1,4 3,2,1, 3,2,1,21
Desconhecido 3,2,1,21
Desconhecido 3,2,1,21
Desconhecido 3,2,1,21
Desconhecido 2,4,1,20
Desconhecido 3,2,1,21
Desconhecido 3,2,1,4Desconhecido 3,2,1,21SEQID
NO: Atividade enzimatica
ORF 004 -oxidorredutase 39,40 putativa
ORF 004 - ORF 004 - tRNA 41, 42 de cisteínila
43,44 ORF 011 -
ORF 006-família 1 (Í3-45,46 glicosidase)
ORF 002-família 1 (Í3-47,48 glicosidase)
ORF 006 - oxidorredutase de 49,50 fdhd/narq
ORF 012-família 6 5,6 (celulase)
ORF 001 - família 5 51,52 (celulase)
ORF 002 - Radical SAM 53,54 família
ORF 004-família 1 (Í3-55,56 glicosidase)
ORF 001 - protease de tipo 57,58 subtilisina
59, 60 família 5 (celulase)
Sítio de clivagem de Signalp
Sinal de seqüência
Fonte
Número de EC
1-29
1-20
MTRRSIVRSSSNKWLVLAGAALLACTALG
MSRGILILVMLSVLSGAALA
Desconhecido 4,1,1,
Desconhecido 6,1,1,16 Desconhecido
Desconhecido 3,2,1,21
Desconhecido 3,2,1,21
Desconhecido
Desconhecido 3,2,1,91
Desconhecido 3,2,1,4
Desconhecido 1„,
Desconhecido 3,2,1,21
Desconhecido
Desconhecido 3,2,1,4<formula>formula see original document page 183</formula>SEQID
NO: Atividade enzimatica
89, 90 família 5 (celulase)
ORF 004-família 10 9,10 (xilanase)
91, 92 ORF 001 - família 3
93, 94 ORF 002 - alfa-ramnosidase
95, 96 ORF 001 - família 3
ORF003-beta-97,98 glucuronidase
ORF 012-família 1 (Í3-99,100 glicosidase)
Sítio de clivagem de Signalp
1-29
1-26
Sinal de seqüência
MKRSVSIFIACLLMTVLTISGVAAPEASA MRSVRIVTFALAAALAVPLVTSTATA
Fonte
Desconhecido Desconhecido Desconhecido Desconhecido
Número de EC
Desconhecido 3,2,1,4
3,2,1,8 3,2,1,52
3,2,1,21
Desconhecido 3,2,1,31
Desconhecido 3,2,1,21
oo co"Aminoácido" ou "seqüência de aminoácidos" como usado aqui referem-se a um oligopeptídeo, peptídeo, polipeptídeo, ou seqüência de proteínas, ou a um fragmento, porção, ou subunidade de qualquer um destes e a moléculas sintéticas ou de ocorrência natural. "Aminoácido" ou
"seqüência de aminoácidos" incluem um oligopeptídeo, peptídeo, polipeptídeo, ou seqüência de proteínas, ou a um fragmento, porção, ou subunidade de qualquer um destes, e a moléculas sintéticas ou de ocorrência natural. O termo "polipeptídeo" como usado aqui, refere-se a aminoácidos unidos entre si por ligações de peptídeo ou ligações de
peptídeo modificadas, isto é, isoésteres de peptídeo e podem conter aminoácidos modificados outros que não os 20 aminoácidos codificados por gene. Os polipeptídeos podem ser modificados por quaisquer processos naturais, tal como processamento pós-traducional, ou por técnicas de modificação química que são bem-conhecidos na técnica. Modificações
podem ocorrer em qualquer lugar no polipeptídeo, incluindo a cadeia principal de peptídeo, as cadeias laterais de aminoácido e os terminais amino ou carboxila. Será apreciado que o mesmo tipo de modificação pode estar presente nos mesmos graus ou graus variáveis em vários sítios em um dado polipeptídeo. Também um dado polipeptídeo pode ter muitos tipos de
modificações. Modificações incluem acetilação, acilação, ribosilação de ADP, amidação, ligação covalente de flavina, ligação covalente de uma porção de heme, ligação covalente de um nucleotídeo ou derivado de nucleotídeo, ligação covalente de um lipídio ou derivado de lipídio, ligação covalente de um fosfatidilinositol, ciclização de reticulação, construção de
ligação de dissulfeto, demetilação, construção de ligações cruzadas covalentes, construção de cisteína, construção de piroglutamato, formilação, gamma-carboxilação, glicosilação, construção de âncora de GPI, hidroxilação, iodinação, metilação, miristoliação, oxidação, pegilação, processamento de hidrolase de glucano, fosforilação, prenilação,
racemização, selenoilação, sulfação e adição mediada por transferencia de RNA de aminoácidos a proteína, tal como arginilação. (Ver Creighton, T.E., Proteins - Structure and Molecular Properties 2nd Ed., W.H. Freeman andCompany, New York (1993); Posttraducional Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)). Os peptídeos e polipeptídeos da invenção também incluem todas as formas "miméticas" e "peptidomiméticas", como descritos em outros detalhes, abaixo.
Como usado aqui, o termo "isolado" significa que o material (por exemplo, uma proteína ou ácido nucléico da invenção) é removido a partir de seu ambiente original (por exemplo, o ambiente natural se ele for de ocorrência natural). Por exemplo, polinucleotídeo ou polipeptídeo de ocorrência natural presente em um animal vivo não é isolado, mas o mesmo polinucleotídeo ou polipeptídeo, separado de alguns ou a totalidade dos materais coexistentes no sistema natural, é isolado. Tais polinucleotídeos poderiam ser parte de um vetor e/ou tais polinucleotídeos ou polipeptídeos poderiam ser parte de uma composição e ainda ser isolado naquele tal vetor ou composição não é parte de seu ambiente natural. Como usado aqui, o termo "purificado" não exige pureza absoluta; pelo contrário, destina-se como uma definição relativa. Ácidos nucléicos individuais obtidos a partir de uma biblioteca foram convencionalmente purificados para homogeneidade eletroforética. As seqüências obtidas a partir destes clones não poderiam ser obtidos diretamente a partir da biblioteca ou a partir do DNA humano total, os ácidos nucléicos purificados da invenção foram purificados do restante do DNA genômico no organismo por pelo menos 104-106 vezes. Em um aspecto, o termo "purificado" inclui ácidos nucléicos que foram purificados do restante do DNA genômico ou de outras seqüências em uma biblioteca ou outro ambiente por pelo menos uma ordem de magnitude, por exemplo, em um aspecto, duas ou três ordens, ou quatro ou cinco ordens de magnitude.
Proteínas ou polipeptídeos "recombinantes" referem-se a polipeptídeos ou proteínas produzidos por técnicas de DNA recombinante; isto é, produzidos a partir de células transformadas por um construto de DNA exógeno que codifica o polipeptídeo ou proteína desejado. Polipeptídeos ou proteína "sintéticos" são aqueles preparados por síntese química, métodos de síntese de peptídeo químicos de fase sólida podem também ser usadospara sintetizar o polipeptídeo ou fragmentos da invenção. Tal método era conhecido na técnica desde o início de 1960 (Merrifield, R. B., J. Am. Chem. Soe, 85:2149-2154, 1963) (Ver também Stewart, J. M. and Young, J. D., Solid Fase Síntese de peptídeo, 2nd Ed., Pierce Chemical Co., Rockford, IU., pp. 11-12)) e foi recentemente empregado no projeto de peptídeo de laboratório comercialmente disponível e kits de síntese (Cambridge Research Bioprodutos químicos). Tais kits de laboratório comercialmente disponíveis em geral utilizavam os ensinamentos de H. M. Geysen e outros, Proc. Natl. Acad. ScL, USA, 81:3998 (1984) e provêem sintetização de peptídeos nas extremidades de uma multidão de "barras" ou "pinos" todos os quais estão ligados a uma placa única. A frase "substancialmente idêntica" no contexto de dois ácidos nucléicos ou polipeptídeos, refere-se a duas ou mais seqüências que têm, por exemplo, pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais identidade de resíduo de aminoácido ou nucleotídeo (seqüência), quando comparada e alinhada para correspondência máxima, como medida usando-se um dos algoritmos de comparação de seqüência conhecidos ou por inspeção visual. Em aspectos alternativos, a identidade substancial existe acima de uma região de pelo menos cerca de 100 ou mais resíduos e mais comumente as seqüências obtidas são substancialmente idênticas acima de pelo menos cerca de 150 a 200 ou mais resíduos. Em alguns aspectos, as seqüências obtidas são substancialmente idênticas acima do comprimento total das regiões de codificação. Adicionalmente uma seqüência de aminoácidos "substancialmente idêntica" é uma seqüência que difere de uma seqüência de referência por uma ou mais substituições, deleções, ou inserções de aminoácido não conservador ou conservador. Em um aspecto, a substituição ocorre em um sítio que não é o sítio ativo da molécula, ou, alternativamente a substituição ocorre em um sítio que é o sítio ativo da molécula, com acondição de que o polipeptídeo essencialmente retêm suas propriedades funcionais (enzimáticas). Uma substituição de aminoácido conservadora, por exemplo, substitui um aminoácido para um outra da mesma classe (por exemplo, substituição de um aminoácido hidrofóbico, tal como isoleucina, valina, leucina, ou metionina, para uma outra, ou substituição de um aminoácido polar para uma outra, tal como substituição de arginina para lisina, ácido glutâmico para ácido aspártico ou glutamina). Um ou mais aminoacidos podem ser deletados, por exemplo, de uma celulase, por exemplo, polipeptídeo de endoglucanase, celobioidrolase, mananase e/ou
betaglicosidase, que resultam na modificação da estrutura do polipeptídeo, sem alteração significativa de sua atividade biológica. Por exemplo, aminoacidos amino- ou carboxila-terminais que não são exigidos para celulase, por exemplo, atividade biológica de enzima de endoglucanase, celobioidrolase, mananase e/ou beta- glicosidase podem ser removidos.
Seqüências de polipeptídeos modificadas da invenção podem ser analisadas quanto a celulase, por exemplo, atividade biológica de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase por qualquer número de métodos, incluindo o contato da seqüência de polipeptídeos modificada com um substrato e determinação de se o
polipeptídeo modificado diminui a quantidade de substrato específico no ensaio ou aumenta os bioprodutos da reação enzimática de uma celulase funcional, por exemplo, polipeptídeo de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase com o substrato.
"Fragmentos" como usado aqui são uma porção de uma proteína de ocorrência natural que pode existir em pelo menos duas conconstruções diferentes. Fragmentos podem ter a mesma ou substancialmente a mesma seqüência de aminoacidos que a proteína de ocorrência natural. Fragmentos que têm estruturas tridimensionais como a proteína de ocorrência natural estão também incluídos. Um exemplo deste, é uma molécula de "pró-forma", tal como uma pró-proteína de baixa atividade que pode ser modificada por clivagem para produzir uma enzima madura com atividade significativamente mais alta.Em um aspecto, a invenção prove estruturas de cristal (tridimensionais) de proteínas e peptídeos, por exemplo, celulases, da invenção; que podem ser produzidos e analisados usando-se os protocolos rotineiros bem-conhecidos na técnica, por exemplo, como descrito em MacKenzie (1998) Crystal structure of the family 7 endoglucanase I (Cel7B) from Humicola insolens at 2.2 A resolution and identificação of the catalytic nucleófilo by trapping of the covalent glicosyl-enzima intermediate, Biochem. J. 335:409-416; Sakon (1997) Structure and mechanism of endo/exocelulase E4 from Thermomonospora fusca, Nat. Struct. Biol 4:810-818; Varrot (1999)
Crystal structure of the.catalytic core domínio of the family 6 celobioidrolase II, Cel6A, from Humicola insolens, at 1.92 A resolution, Biochem. J. 337:297-304; ilutração e identificação de elementos estruturais específicos como orientação para a geração rotineira de variantes de celulase da invenção, e como orientação para a identificação de espécie de enzima dentro do escopo da invenção.
Polipeptídeos e peptídeos da invenção podem ser isolados de fontes naturais, ser sintéticos ou ser polipeptídeos recombinamente gerados. Peptídeos e proteínas podem ser recombinantemente expressos in vitro ou in vivo. Os peptídeos e polipeptídeos da invenção podem ser produzidos e isolados usando-se qualquer método conhecido na técnica. Polipeptídeo e peptídeos da invenção can também ser sintetizados, inteiro ou em parte, usando-se métodos químicos bem-conhecidos na técnica. Ver por exemplo, Caruthers (1980) Ácidos nucléicos Res. Symp. Ser. 215-223; Hom (1980) Ácidos nucléicos Res. Symp. Ser. 225-232; Banga, A.K., Therapeutic
Peptídeos and Proteínas, Formulação, Processing and Delivery Sistemas (1995) Technomic Publishing Co., Lancaster, PA. Por exemplo, síntese de peptídeo pode ser realizada usando-se várias técnicas de fase sólida (ver por exemplo, Roberge (1995) Science 269:202; Merrifield (1997) Métodos Enzymol. 289:3-13) e síntese automatizada pode ser alcançada, por exemplo, usando-se o sintetizador de peptídeo ABI 43 1A (Perkin Elmer) de acordo com as intruções providas pelo fabricante.
Os peptídeos e polipeptídeos da invenção podem também serglicosilados. A glicosilação pode ser adicionada pós-traducionalmente ou quimicamente ou por mecanismos biossintéticos celulares, em que o último incorpora o uso de motivos de glicosilação conhecidos, que podem ser nativos à seqüência ou pode ser adicionada como um peptídeo ou adicionado na seqüência de codificação de ácidos nucléicos. A glicosilação pode ser O-ligada ou N-ligada.
Os peptídeos e polipeptídeos da invenção, como definidos acima, incluem todas as formas "miméticas" e "peptidomiméticas". Os termos "miméticas" e "peptidomiméticas" referem-se a um composto químico sintético que tem substancialmente as mesmas caracaterísticas estruturais e/ou funcionais dos polipeptídeos da invenção. Os miméticos podem ser ou totalmente constituídos de análogos sintéticos, não naturais de aminoácidos, ou, é uma molécula quimérica de aminoácidos de peptídeo parcialmente naturais e análogos parcialmente não naturais de aminoácidos. Osmiméticos podem também incorporar qualquer quantidade de substituições conservadoras de aminoácido naturais contanto que tais substituições também não substancialmente alterem a atividade e/ou estrutura mimética. Como com polipeptídeos da invenção que são membros ou variantes conservadores de um gênero de polipeptídeos da invenção (por exemplo, tendo cerca de 50% ou mais identidade de seqüência a uma seqüência exemplar da invenção), experimentação rotineira determinará se miméticos está dentro do escopo da invenção, isto é, que sua estrutura e/ou função não é substancialmente alterada. Assim, em um aspecto, uma composição mimética está dentro do escopo da invenção se ela tiver uma celulase, por exemplo, atividades de enzima de endoglucanase, de celobioidrolase, mananase e/ou betaglicosidase.
Composições miméticas de polipeptídeo da invenção podem conter qualquer combinação de componentes estruturais não naturais. No aspecto alternativo, composições miméticas da invenção incluem um ou a totalidade dos seguintes três grupos estruturais: a) grupos de ligação de resíduo outros que não ligações de ligação de amida natural ("ligação de peptídeo"); b) resíduos não naturais no lugar de resíduos de aminoácidos deocorrência natural; ou c) resíduos que induzem imitação estrutural secundária, isto é, para induzir ou estabilizar uma estrutura secundária, por exemplo, uma conconstrução de giro beta, giro gama, folha beta, hélice alfa, e similares. Por exemplo, um polipeptídeo da invenção pode ser
' caracterizado como um mimético quando todos ou alguns de seus resíduos são unidos por meio químico outro que não ligações de peptídeo naturais. Resíduos peptidomiméticos individuais podem ser unidos por ligações de peptídeo, outras ligações químicas ou meio de acoplamento, tal como, por exemplo, glutaraldeído, N-ésteres de hidroxissuccinimida, maleimidas
bifuncionais, N,N'-dicicloexilcarbodiimida (DCC) ou N,N'-diisopropilcarbodiimida (DIC). Grupos de ligação que podem ser um alternativo às ligações de ligação de amida tradicionais ("ligação de peptídeo") incluem, por exemplo, cetometileno (por exemplo, -C(=0)-CH2-para -C(=0)-NH-), aminometileno (CH2-NH), etileno, olefina (CH=CH), éter
(CH2-0), tioéter (CH2-S), tetrazol (CN4-), tiazol, retroamida, tioamida, ou éster (ver, por exemplo, Spatola (1983) in Chemistry and Biochemistry of Amino Acid, Peptides and Proteins, Vol. 7, pp 267-357, "Peptide Backbone Modification," Marcell Dekker, NY).
Um polipeptídeo da invenção pode também ser caracterizado
como um mimético por conter a totalidade ou alguns dos resíduos não naturais no lugar de resíduos de aminoácidos de ocorrência natural. Resíduos não naturais são bem-descritos na literatura de patente e científica; algumas composições não naturais exemplares úteis como miméticos de resíduos de aminoácidos naturais e diretrizes são descritos
abaixo. Miméticos de aminoácidos aromáticos podem ser gerados por substituição por, por exemplo, D- ou L-nafilalanina; D- ou L-fenilglicina; D- ou L-2 tieneilalanina; D- ou L-1, -2, 3-, ou 4- pireneilalanina; D- ou L-3 tieneilalanina; D-ou L-(2-piridinil)-alanina; D- ou L-(3-piridinil)-alanina; D- ou L-(2-pirazinil)-alanina; D- ou L-(4-isopropil)-fenilglicina; D-(trifluorometil)-
fenilglicina; D-(trifluorometil)-fenilalanina; D-p-fluoro-fenilalanina; D- ou L-p-bifenilfenilalanina; D- ou L-p-metóxi-bifenilfenilalanina; D- ou L-2-indol(alquil)alaninas; e, D- ou L-alquilaininas, onde alquila pode serisopentila, sec-isotila, iso-butila, isopropila, pentila, butila, hexila, propila,etila, metila substituída ou não substituída, ou aminoácidos não ácidos.Anéis aromáticos de um aminoácido não natural incluem, por exemplo, anéisaromáticos de tiazolila, tiofenila, pirazolila, benzimidazolila, naftila, furanila, pirrolila, e piridila.
Mimeticos de aminoácidos ácidos podem ser gerados por, porexemplo, aminoácidos não carboxilato enquanto mantendo uma carganegativa; (fosfono)alanina; treonina sulfatada. Grupos laterais de carboxila(por exemplo, aspartila ou glutamila) podem também ser seletivamente modificados por reação com carbodiimidas (R1 -N-C-N-R') tal como, porexemplo, 1- cicloexil-3(2-morfolinil-(4-etil) carbodiimida ou 1-etil-3(4-azonia-4,4- dimetolpentil) carbodiimida. Aspartila ou glutamila podem também serconvertidos em resíduos de asparaginila e glutaminila por reação com íonsde amônio. Mimeticos de aminoácidos básicos podem ser gerados porsubstituição com, por exemplo, (além de lisina e arginina) os aminoácidosornitina, citrulina, ou ácido (guanidino)-acético, ou ácido (guanidino)alquil-acético, onde alquila é definida acima. Derivado de nitrila (por exemplo,contendo a porção de CN no lugar de COOH) pode ser usado comosubstituto de asparagina ou glutamina. Resíduos de asparaginila eglutaminila podem ser desaminados para dar os resíduos de aspartila ouglutamila correspondentes; Mimeticos de resíduo de arginina podem sergerados por reação de arginila com, por exemplo, um ou mais reagentesconvencionais, incluindo, por exemplo, fenilglioxal, 2,3-butanodiona, 1,2-ciclo- hexanodiona, ou ninhidrina, em um aspecto sob condições alcalinas. Mimeticos de resíduo de tirosina podem ser gerados por reação de tirosilacom, por exemplo, compostos de diazônio aromáticos ou tetranitrometano.N-acetilimidizol e tetranitrometano podem ser usados para formar espécie deO-acetil tirosila e derivados de 3-nitro, respectivamente. Mimeticos deresíduo de cisteína podem ser gerados por reação de resíduos de cisteínila com, por exemplo, alfa-haloacetatos, tais como ácido 2-cloroacético oucloroacetamida e aminas correspondentes; para dar derivados decarboximetila ou carboxiamidometila. Mimeticos de resíduo de cisteínapodem também ser gerados por reação de resíduos de cisteínila com, porexemplo, bromo-trifluoroacetona, ácido alfa-bromo-beta-(5-imidozoil)propiônico; cloroacetil fosfato, N-alquilmaleimidas, dissulfeto de 3-nitro-2-piridila; dissulfeto de metil 2-piridila; p-cloromercuribenzoato; 2-
cloromercuri-4 nitrofenol; ou, cloro-7-nitrobenzo-oxa-1,3-diazol. Miméticos delisina podem ser gerados (e resíduos amino-terminais podem ser alterados)por reação de lisinila com, por exemplo, anidridos de ácido succínico ououtro anidridos de ácido carboxílico. Lisina e outros miméticos de resíduocontendo alfa-amino podem também ser gerados por reação com
imidoésteres, tais como reações catalisadas por transamidase, metilpicolinimidato, piridoxal fosfato, piridoxal, cloroboroidreto, ácido trinitro-benzenossulfônico, O-metilisouréia, e 2,4, pentanodiona com glioxilato.Miméticos de metionina podem ser gerados por reação com, por exemplo,sulfóxido de metionina. Miméticos de prolina incluem, por exemplo, ácido
pipecólico, ácido tiazolidina carboxílico, 3- ou 4- hidróxi prolina,desidroprolina, 3- ou 4-metilprolina, ou 3,3,-dimetilprolina. Miméticos deresíduo de histidina podem ser gerados por reação de histidila com, porexemplo, dietilprocarbonato ou brometo de para-bromofenacila. Outrosmiméticos incluem, por exemplo, aqueles gerados por hidroxilação de prolina
e lisina; fosforilação dos grupos hidroxila de resíduos de serila ou treonila;metilação dos grupos alfa-amino de lisina, arginina e histidina; acetilação daamina N-terminal; metilação de resíduos de amida da cadeia principal ousubstituição com N-metil aminoácidos; ou amidação de grupos carboxila C-terminais.
Em um aspecto, um resíduo, por exemplo, um aminoacido, de
um polipeptídeo da invenção pode também ser substituído por umaminoacido (ou resíduo peptidomimético) da quiralidade oposta. Em umaspecto, qualquer aminoacido de ocorrência natural na configuração L (quepode também ser chamado de R ou S, dependendo da estrutura da entidade
química) pode ser substituído com o aminoacido do mesmo tipo estruturalquímico ou um peptidomimético, mas da quiralidade oposta, chamado do D-aminoácido, mas também pode ser chamado da forma R ou S.A invenção também prove métodos para a modificação dospolipeptídeos da invenção ou por processos naturais, tais comoprocessamento pós-traducionais (por exemplo, fosforilação, acilação, etc),ou por modificação de técnicas químicas, e os polipeptídeos modificados resultantes. Modificações podem ocorrer em qualquer lugar no polipeptídeo,incluindo uma cadeia principal de peptídeo, as cadeias laterais deaminoácido e os terminais amino ou carboxila. Será apreciado que o mesmotipo de modificação pode estar presente nos mesmos graus ou grausvariáveis em vários sítios em um dado polipeptídeo. Também um dado polipeptídeo pode ter muitos tipos de modificações. Em um aspecto,modificações incluem acetilação, acilação, ADP-ribosilação, amidação,ligação covalente de flavina, ligação covalente de uma porção de heme,ligação covalente de um nucleotídeo ou derivado de nucleotídeo, ligaçãocovalente de um lipídio ou derivado de lipídio, ligação covalente de um fosfatidilinositol, ciclização de reticulação, construção de ligação dedissulfeto, demetilação, construção de ligações cruzadas covalentes,construção de cisteína, construção de piroglutamato, formilação, gama-carboxilação, glicosilação, construção de âncora de GPI, hidroxilação,iodinação, metilação, miristoliação, oxidação, pegilação, processamento proteolítico, fosforilação, prenilação, racemização, selenoilação, sulfação, eadição mediada por transferencia de RNA de aminoácidos para proteína talcomo arginilação. Ver, por exemplo, Creighton, T.E., Proteins - Structure andMolecular Properties 2nd Ed., W.H. Freeman and Company, New York(1993); Posttraducional Covalent Modification of Proteínas, B.C. Johnson,
Ed., Academic Press, New York, pp. 1-12(1983).
Métodos de síntese de peptídeo químicos de fase sólida podemtambém ser usados para sintetizar o polipeptídeo ou fragmentos dainvenção. Tal método era conhecido na técnica desde o início de 1960(Merrifield, R. B., J. Am. Chem. Soe, 85:2149-2154, 1963) (Ver também
Stewart, J. M. and Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed.,Pierce Chemical Co., Rockford, IU., pp. 11-12)) e foi recentementeempregado em kits de síntese e projeto de peptídeo de laboratóriocomercialmente disponíveis (Cambridge Research Bioprodutos químicos).Tais kits de laboratório comercialmente disponíveis em geral utilizavam osensinamentos de H. M. Geysen e outros, Proc. Natl. Acad. ScL, USA,81:3998 (1984) e provêem sintetização de peptídeos nas extremidade de uma multidão de "barras" ou "pinos" todos os quais estão ligados a umaplaca única. Quando um sistema é utilizado, uma placa de barras ou pinos éinvertida e é inserida em uma segunda placa de reservatórios ou cavidadescorrespondentes, que contêm soluções para a ligação ou ancoragem de umaminoácido apropriado às extremidades da barra ou do pino. Por repetição de tal etapa de processo, isto é, inversão e inserção das extremidades dopino e da barra em soluções apropriadas, aminoácidos são introduzidos empeptídeos desejados. Além disso, numerosos sistemas de síntese depeptídeo FMOC disponíveis estão disponíveis. Por exemplo, conjunto de umpolipeptídeo ou fragmento pode ser realizado sobre um suporte sólido usando-se um sintetizador de peptídeo automatizado Applied Biosistemas,Inc. Modelo 431 A®. Tal equipamento prove pronto acesso aos peptídeos dainvenção, ou por síntese direta ou por síntese de uma serie de fragmentosque podem ser acoplados usando-se outras técnicas conhecidas.
Os polipeptídeos da invenção incluem celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidaseem uma forma ativa ou inativa. Por exemplo, os polipeptídeos da invençãoincluem pró-proteínas antes da "maturação" ou processamento de pré-próseqüências, por exemplo, por uma enzima de processamento de pró-proteína, tal como uma convertase de pró-proteína para gerar uma proteína madura "ativa". Os polipeptídeos da invenção incluem celulase, por exemplo,enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidaseinativas por outras razões, por exemplo, antes da "ativação" por um eventode processamento pós-traducional, por exemplo, uma endo- ou exo-peptidase ou ação de proteinase, um evento de fosforilação, uma amidação, uma glicosilação ou uma sulfação, um evento de dímeroização, e similares.Os polipeptídeos da invenção incluem todas as formas ativas, incluindosubseqüências ativas, por exemplo, domínios catalíticos ou sítios ativos, daenzima.
A invenção inclui celulase imobilizada, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase,anticelulase, por exemplo, anticorpos e seus fragmentos de antiendoglucanase, anticelobioidrolase e/ou antibetaglicosidase. A invençãoprove métodos para a inibição de celulase, por exemplo, atividade de enzimade endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, porexemplo, usando-se mutantes negativos dominantes ou anticelulase, porexemplo, anticorpos de antiendoglucanase, anticelobioidrolase e/ou
antibetaglicosidase da invenção. A invenção inclui heterocomplexos, porexemplo, proteínas de fusão, heterodímeros, etc, compreendendo acelulase, por exemplo, enzimas de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase da invenção.
Polipeptídeos da invenção podem ter uma celulase, por
exemplo, atividade de enzima de endoglucanase, celobioidrolase, mananasee/ou betaglicosidase sob várias condições, por exemplo, extremos em pHe/ou temperatura, agentes de oxidação, e similares. A invenção provemétodos que levam a celulase alternativa, por exemplo, preparações deenzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase
com eficácias e estabilidades catalíticas diferentes, por exemplo, em relaçãoa temperatura, agentes de oxidação e mudança das condições de levagem.Em um aspecto, celulase, por exemplo, variantes de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase pode serproduzida usando-se técnicas de mutagênese de sítio-dirigida e/ou
mutagênese aleatória. Em um aspecto, evolução dirigida pode ser usadapara produzir uma grande variedade de celulase, por exemplo, variantes deenzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidasecom especificidades e estabilidades alternativas.
As proteínas da invenção são também úteis como pesquisareagentes para identificar celulase, por exemplo, moduladores de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase, porexemplo, activatores ou inibidores de celulase, por exemplo, atividade deenzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase.Resumidamente, amostras de teste (compostos, caldos, extratos, esimilares) são adicionados a celulase, por exemplo, ensaios de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase para
determinar sua capacidade de inibir clivagem de substrato. Inibidoresidentificados deste modo podem ser usados na indústria e pesquisa parareduzir ou prevenir proteólise indesejada. Como com celulase, por exemplo,enzimas de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase, inibidores podem ser combinados para aumentar o espectro
de atividade.
As enzimas da invenção são também úteis como reagentes depesquisa para dirigir proteínas ou em seqüenciação de proteína. Porexemplo, a celulase, por exemplo, enzimas de endoglucanase,celobioidrolase, mananase e/ou betaglicosidase podem ser usadas para
romper polipeptídeos em fragmentos menores para seqüenciação usando-se, por exemplo, um seqüenciador automatizado.
A invenção também prove métodos de revelação de novacelulase, por exemplo, enzimas de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase usando-se os ácidos nucléicos,
polipeptídeos e anticorpos da invenção. Em um aspecto, bibliotecas defagemídio são tríadas quanto a revelação baseada na expressão decelulase, por exemplo, enzimas de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase. Em um outro aspecto, bibliotecas de fagolambda são tríadas quanto a revelação baseada na expressão de celulase,
por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase. Triagem das bibliotecas de fago ou de fagemídio podepermitir a detecção de clones tóxicos; acesso aperfeiçoado a substrato;necessidade reduzida para o engenheiramento de um hospedeiro, porpassagem do potencial para quaisquer tendências que resultem de
extirpação de massa da biblioteca; e, crescimento mais rápido a baixasdensidades de clone. Triagem de bibliotecas de fago ou de fagemídio podeestar na fase líquida ou na fase sólida. Em um aspecto, a invenção provetriagem em fase líquida. Isto dá maior flexibilidade nas condições de ensaio;flexibilidade de substrato adicional; sensibilidade mais alta para clonesfracos; e facilidade de automação sobre triagem de fase sólida.
A invenção prove triagem métodos usando-se as proteínas e ácidos nucléicos da invenção e automação robótica para permitir a execuçãode muitas milhares de reações biocatalíticas e ensaios de triagem em umperíodo de tempo curto, por exemplo, por dia, bem como assegurando umalto nível de precisão e reprodutibilidade (ver discussão de ensaios, abaixo).Como um resultado, uma biblioteca de compostos derivados pode ser
produzida em uma questão de semanas. Para outros ensinamentos namodificação de moléculas, incluindo moléculas pequenas, verPCT/US94/09174; patente U.S. n9 6.245.547.
Em um aspecto, polipeptídeos ou fragmentos da invenção sãoobtidos através de enriquecimento bioquímico ou procedimentos de
purificação. A seqüência de polipeptídeos potencialmente homólogos oufragmentos podem ser determinados por celulase, por exemplo, ensaios deenzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase(ver, por exemplo, Exemplos 1, 2 e 3, abaixo), eletroforese de gel e/oumicrosseqüenciação. A seqüência do polipeptídeos esperada ou fragmento
da invenção pode ser comparado com um polipeptídeo exemplar dainvenção, ou um fragmento, por exemplo, compreendendo pelo menos cercade 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 ou mais seusaminoácidos consecutivos usando-se qualquer um dos programas descritosacima.
Um outro aspecto da invenção é um ensaio para a identificação
fragmentos ou variantes da invenção, que retêm a função enzimatica dospolipeptídeos da invenção. Por exemplo os fragmentos ou variantes dosditos polipeptídeos, podem ser usados para catalisar reações bioquímicas,que indicam que o fragmento ou variante retém a atividade enzimatica de um
polipeptídeo da invenção. Um ensaio exemplar para a determinação de sefragmentos de variantes retêm a atividade enzimatica dos polipeptídeos dainvenção inclui as etapas de: o contato da polipeptídeo fragmento ouvariante com um substrato molécula sob condições que permitem que opolipeptídeo fragmento ou variante funcione e detecte ou uma diminuição nonível do substrato ou an increase no nível do produto de reação específicoda reação entre o polipeptídeo e substrato.
A presente invenção explora as propriedades catalíticas simplesde enzimas. Enquanto que o uso de biocatalisadores (isto é, purificado ouenzimas brutas, células vivas ou mortas) em transconstruções químicasnormalmente exige a identificação de um biocatalisador particular que reagecom um composto de partida específico, a presente invenção usa biocatalisadores selecionados e condições de reação que são específicaspara grupos funcionais que estão presentes em muitos compostos departida, tais como moléculas pequenas. Cada biocatalisador é específicopara um grupo funcional, ou vários grupos funcionais relacionados e podemreagir com muitos compostos de partida contendo seu grupo funcional.
Em um aspecto, as reações biocatalíticas produzem umapopulação de derivados de um único composto de partida. Esses derivadospodem ser submetidos a um outro ciclo de reações biocatalíticas paraproduzir uma segunda população de compostos derivados. Milhares devariações da molécula pequena original ou composto pode ser produzidocom cada iteração de derivatização biocatalítica.
Enzimas reagem em sítios específicos de um composto departida sem afetar o resto da molécula, um processo que é muito difícil dealcançar usando-se métodos químicos tradicionais. Este alto grau deespecificidade biocatalítica prove o meio para identificar um composto ativosimples dentro da biblioteca. A biblioteca é caracterizada pela série dereações biocatalíticas usadas para produzi-la, uma "história biossintética"assim chamada. Triagem da biblioteca quanto a atividades biológicas e traçoda história biossintética identifica a seqüência de reação específica queproduz o composto ativo. A seqüência de reação é repetida e a estrutura do composto sintetizado é determinada. Este modo de identificação, aocontrário de outras abordagens de triagem e síntese, não exige tecnologiasde immobilização e compostos podem ser sintetizados e testados livres emsolução usando-se virtualmente qualquer tipo de ensaio de triagem. Éimportante observar, que alto grau de especificidade de reações de enzimanos grupos funcionais permite a "localização" de reações enzimáticasespecíficas que formam a biblioteca biocataliticamente produzida. Em um aspecto, etapas processuais são realizadas usando-se
automação robótica que permite a execução de muitas milhares de reaçõesbiocatalíticas e/ou ensaios de triagem por dia bem como assegurando umalto nível de precisão e reprodutibilidade. Automação robótica pode tambémser usada para triar quanto a atividade de celulase para determinar se um polipeptídeo estiver dentro do escopo da invenção. Como um resultado, emum aspecto, uma biblioteca de compostos derivados pode ser produzida emuma questão de semanas que levaria anos para produzir usando-semétodos de triagem enzimáticos ou químicos "tradicionais".
Em um aspecto particular, a invenção prove um método para a modificação moléculas pequenas, compreendendo o contato de umpolipeptídeo codificado por um polinucleotídeo descrito aqui ou seusfragmentos enzimaticamnete ativos com uma molécula pequena paraproduzir uma molécula pequena modificada. A biblioteca de moléculaspequenas modificadas é testada para determinar se uma molécula pequena modificada estiver presente dentro da biblioteca, que exibe uma atividadedesejada. Uma reação biocatalítica específica que produz a moléculapequena modificada de atividade desejada é identificada por eliminaçãosistemática de cada uma das reações biocatalíticas usada para produzir umaporção da biblioteca e então testagem das moléculas pequenas produzidas na porção da biblioteca quanto a presença ou ausência da moléculapequena modificada com a atividade desejada. As reações biocatalíticasespecíficas que produzem a molécula pequena modificada de atividadedesejada é opcionalmente repetida. As reações biocatalíticas sãoconduzidas com um grupo de biocatalisadores que reagem com porções estruturais distintas dentro da estrutura de uma molécula pequena, cadabiocatalisador é específico para uma porção estrutural ou um grupo deporções estruturais relacionadas; e cada biocatalisador reage com muitasmoléculas pequenas diferentes que contêm a porção estrutural distinta.
Celulase, por exemplo, seqüências de sinal de enzima deendoglucanase, celobioidrolase e/ou betaglicosidase, prépró domínios edomínios catalíticos.
A invenção prove celulase, por exemplo, seqüências de sinal de
enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase(por exemplo, peptídeos de sinal (SPs)), pré-pró domínios e domínioscatalíticos (CDs). Os SPs, pré-pró domínios e/ou CDs da invenção podemser isolados ou peptídeos recombinantes ou pode ser parte de uma proteína
de fusão, por exemplo, como um domínio heterólogo em uma proteínaquimérica. A invenção prove ácidos nucléicos que codificam estes domínioscatalíticos (CDs), pré-pró domínios e seqüências de sinal (SPs, por exemplo,um peptídeo tendo uma seqüência compreendendo/ que consiste emresíduos amino-terminais de um polipeptídeo da invenção).
A invenção prove seqüências de sinal recombinantes ou
isoladas (por exemplo, peptídeos de sinal) que consiste em ou quecompreende uma seqüência como indicada em resíduos 1 a 14, 1 a 15, 1 a
16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a
20 36, 1 a 37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1 a 43, 1 a 44, 1 a 45, 1 a 46, ou 1a 47, ou mais, de um polipeptídeo da invenção, por exemplo, polipeptídeosexemplares da invenção, ver também a Tabela 3, Exemplos 1 e 4, abaixo, elistagem de seqüência. Por exemplo, Tabela 3, acima, indica seqüências desinal exemplares (líder) da invenção, por exemplo, como no polipeptídeo
25 tendo uma seqüência como indicada em SEQ ID NO: 164, codificada, porexemplo, por SEQ ID NO: 163, tem uma seqüência de sinal compreendendo(ou que consiste em) 30 resíduos amino-terminais, ou,MSCRTLMSRR VGWGLLLWGGLFLRTGSVTG. Seqüências de sinaladicionais são similarmente indicada na Tabela 3. Em um aspecto, a
invenção prove seqüências de sinal compreendendo os primeiros 14, 15, 16,
17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36,37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56,57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 ou resíduos de amino-terminais de um polipeptídeo da invenção.
A invenção inclui polipeptídeos com ou sem uma seqüência desinal e/ou a prépró seqüência. A invenção inclui polipeptídeos com seqüências de sinal heterólogas e/ou pré-pró seqüências. A pré-próseqüência (incluindo uma seqüência da invenção usada como um pré-pródomínio heterólogo) pode ser localizada na extremidade amino terminal ouextremidade carbóxi terminal da proteína. A invenção também incluiseqüências de sinal recombinantes ou isoladas, pré-pró seqüências edomínios catalíticos (por exemplo, "sítios ativos") compreendendoseqüências da invenção. O polipeptídeo compreendendo uma seqüência desinal da invenção pode ser uma celulase, por exemplo, enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção ou uma outra celulase, por exemplo, enzima de endoglucanase,
celobioidrolase, mananase e/ou betaglicosidase ou uma outra enzima ououtro polipeptídeo. Métodos para a identificação "pré-pró" seqüências dedomínio e seqüências de sinal são bem-conhecidas na técnica, ver, porexemplo, Van de Ven (1993) Crit. Rev. Oncog. 4(2): 115-136. Por exemplo,para identificar uma pré-pró seqüência, a proteína é purificada do espaço extracelular e a seqüência de proteínas N-terminal é determinada e écomparada com a forma não processada. A celulase, por exemplo,seqüências de sinal (SPs) de enzima endoglucanase, celobioidrolase,mananase e/ou betaglicosidase e/ou pré-pró seqüências da invenção podeser peptídeos isolados ou recombinantes, ou, seqüências unida a uma outra
celulase, por exemplo, enzima de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase ou uma não celulase, por exemplo,polipeptídeo de não endoglucanase, não celobioidrolase e/ou nãobetaglicosidase, por exemplo, como uma proteína de fusão (quimérica). Emum aspecto, a invenção prove polipeptídeos compreendendo celulase, por
exemplo, seqüências de sinal de enzima de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase da invenção. Em um aspecto, polipeptídeoscompreendendo celulase, por exemplo, seqüências de sinal SPs de enzimade endoglucanase, celobioidrolase, mananase e/ou betaglicosidase e/oupré-pró da invenção compreendem seqüências heterólogas a uma celulase,por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase da invenção (por exemplo, uma proteína de fusãocompreendendo uma SP e/ou pré-pró da invenção e seqüências de umaoutra celulase, por exemplo, enzima de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase ou a não celulase, por exemplo, proteína denão endoglucanase, não celobioidrolase e/ou não betaglicosidase). Em umaspecto, a invenção prove celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção com SPs heterólogas e/ou pré-pró seqüências, por exemplo,seqüências com uma seqüência de sinal de levedura. Uma celulase, porexemplo, enzima de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase da invenção pode compreender um SP heteróloga e/ou pré- pró em um vetor, por exemplo, um vetor de série pPIC (Invitrogen, Carlsbad,CA).
Em um aspecto, SPs e/ou pré-pró seqüências da invenção sãoidentificadas após a identificação de nova celulase, por exemplo,polipeptídeos de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. As trajetórias pelas quais proteínas são classificadsa e sãotransportadas para sua própria localização celular são freqüentementechamadas de trajsetorias de direcionamento de proteína. Um dos elementosmais importantes em todos estes sistemas de direcionamento em seqüênciade aminoácidos curta no terminal amino de um polipeptídeo recentemente sintetizado chamada a seqüência de sinal. Esta seqüência de sinal dirigeuma proteína para sua localização apropriada na célula e é removidadurante ou quanto a proteína alcança seu destino final. A maioria dasproteínas lisossomais, de membrana ou secretadas têm uma seqüência desinal amino-terminal que a marca para translocação no lúmen do retículo endoplásmico. As seqüências de sinal podem variar no comprimento decerca de 10 a 65, ou mais, resíduos de aminoácidos. Vários métodos dereconhecimento de seqüências de sinal são conhecidos por aquelesversados na técnica. Por exemplo, em um aspecto, nova celulase, porexemplo, peptídeos de sinal de enzima de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase são identificados por um método chamadode SignalP. SignalP usa uma rede neural combinada que reconhece tnato peptídeos quanto seus sítios de clivagem. (Nielsen (1997) "Identification ofprokaryotic and eukaryotic signal peptides and prediction of their clivagemsítios". Proteína Engineering 10:1-6.
Em alguns aspectos celulase, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase da
invenção não têm SPs e/ou pré-pró seqüências ou "domínios". Em umaspecto, a invenção prove a celulase, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção carecendo a totalidade ou parte de um domínio de SP e/ou um pré-pró domínio. Em um aspecto, uma invenção prove uma seqüência de ácidos
nucléicos que codifica uma seqüência de sinal (SP) e/ou pré-pró de umacelulase, por exemplo, enzima de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase operavelmente ligada a um seqüência deácidos nucléicos de uma celulase diferente, por exemplo, enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase ou,
opcionalmente, uma seqüência de sinal (SPs) e/ou pré-pró domínio from anão celulase, por exemplo, não endoglucanase, não celobioidrolase e/ounão betaglicosidase proteína pode ser desejada.
A invenção também prove polipeptídeos recombinantes ouisolados compreendendo seqüências de sinal (SPs), pré-pró domínio e/ou
domínios catalíticos (CDs) da invenção e seqüências heterólogas. Asseqüências heterólogas são seqüências não naturalmente associadas (porexemplo, a uma enzima) com a SP, pré-pró domínio e/ou CD. A seqüência aqual a SP, pré-pró domínio e/ou CD estão naturalmente associadas nasSP's, pré-pró domínio e/ou extremidade amino terminal de CD's e,
extremidade de carbóxi-terminal, e/ou em ambas as extremidades da SPe/ou CD. Em um aspecto, a invenção prove um polipeptídeo recombinanteou isolado compreendendo (ou que consiste em) um polipeptídeocompreendendo uma seqüência de sinal (SP), pré-pró domínio e/ou domíniocataiítico (CD) da invenção com a condição de que ele não esteja associadoa qualquer seqüência a qual está naturalmente associada (por exemplo, umacelulase, por exemplo, seqüência de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase). Similarmente em umaspecto, a invenção prove ácidos nucléicos isolados ou recombinantes quecodificam estes polipeptídeos. Assim, em um aspecto, o ácido nucléicoisolado ou recombinante da invenção compreende seqüência de codificaçãopara uma seqüência de sinal (SP), pré-pró domínio e/ou domínio catalítico (CD) da invenção e uma seqüência heteróloga (isto é, uma seqüência nãonaturalmente associada à uma seqüência de sinal (SP), pré-pró domínioe/ou domínio catalítico (CD) da invenção). A seqüência heteróloga podeestar na extremidade terminal 3', na extremidade terminal 5', e/ou em ambasas extremidades da seqüência de codificação de CD, pré-pró domínio, e/ou SP.
Celulose híbrida (quimérica), por exemplo, bibilotecas peptídeose enzimas de endoglucanase, celobioidrolase e/ou betaglicosidase
- Em um aspecto, a invenção - prove celulase híbrida, porexemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase e proteínas fusão, incluindo bibliotecas de peptídeos,compreendendo seqüências da invenção. As bibliotecas de peptídeos dainvenção podem ser usadas para isolar moduladores de peptídeo (porexemplo, ativadores ou inibidores) de alvos, tal como celulase, por exemplo,enzimas, receptores, substrato de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. As bibliotecas de peptídeosda invenção podem ser usadas para identificar pares de ligação formais dealvos, tais como ligantes, por exemplo, citocinas, hormones e similares. Emum aspecto, a invenção prove proteínas quiméricas compreendendo umaseqüência de sinal (SP), pré-pró domínio e/ou domínio catalítico (CD) da invenção ou uma sua combinação e uma seqüência heteróloga (ver acima).
Em um aspecto, as proteínas de fusão da invenção (porexemplo, a porção de peptídeo) estão conformacionalmente estabilizadas(com relação a peptídeos lineares) para permitir a afinidade de ligação maisalta para alvos. A invenção prove fusões de celulase, por exemplo, enzimasde endoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção e outros peptídeos, incluindo peptídeos conhecidos e aleatórios. Eles podem ser fundidos de tal modo que a estrutura da celulase, porexemplo, enzimas de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase não seja significativamente perturbada e o peptídeo émetabolicamente ou estruturalmente conformacionalmente estabilizado. Istopermite a criação de uma biblioteca de peptídeo que é facilmente monitorada tanto quanto a sua presença dentro das células quanto a sua quantidade.
Variantes de seqüência de aminoácidos da invenção podem sercaracterizadas por uma natureza predeterminada da variação, umacaracterística que se ajusta a elas apesar de uma forma de ocorrêncianatural, por exemplo, uma variação alélica ou interespécies de uma celulase, por exemplo, seqüência de enzimas de endoglucanase, celobioidrolase,-mananase e/ou betaglicosidase. Em um aspecto, as variantes da invençãoexibem a atividade biológica qualitativa como o análogo de ocorrêncianatural. Alternativamente, as variantes podem ser selecionadas para tercaracterísticas modificadas. Em um aspecto, enquanto o sítio ou a região para a introução de uma variação de seqüência de aminoácidos épredeterminada, a mutação per se não necessariamente predeterminada.Por exemplo, a fim de otimizar o desempenho de uma mutação em um dadosítio, mutagênese aleatória pode ser conduzida na região ou no códon alvo ea celulase expressa, por exemplo, variantes de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase tríadas quanto a ótimacombinação da atividade desejada. Técnicas para produção de mutaçõespor substituição em sítios predeterminados em DNA tendo uma seqüênciaconhecida são bem-conhecidas, como discutido aqui. por exemplo,mutagênese de iniciador de M13 e mutagênese de PCR. Triagem dos mutantes pode ser feita usando-se, por exemplo, ensaios de hidrólise deglucano. Em aspectos alternativos, substituições de aminoácido podem serde resíduos simples; inserções podem ser na ordem de desde cerca de 1 aaminoácidos, embora inserções consideravelmente grandes podem serfeitas. Deleções podem variar de cerca de 1 a cerca de 20, 30, 40, 50, 60, 70resíduos ou mais. Para se obter um derivado final com as ótimaspropriedades, substituições, deleções, inserções ou qualquer sua combinação podem ser usadas. Em geral, essas mudanças são feitas sobrepoucos aminoácidos para minimizar a alteração da molécula. No entanto,mudanças maiores podem ser toleradas em certas circunstâncias.
A invenção prove celulase, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase eram a
estruturta da cadeia principal de polipeptídeo, a estrutura secundária outerciária, por exemplo, uma estrutura de folha beta ou helicoidal alfa, foimodificada. Em um aspecto, a carga ou hidrofobicidade foi modificada. Emum aspecto, o tamanho de uma cadeia lateral foi modificado. Mudançassubstanciais na função ou didentidade imunológica são produzidas por
seleção de substituições que são menos conservadoras. Por exemplo,substituições_podem ser .produzidas que mais significativamente afetam: aestrutura da cadeia principal de polipeptídeo na área da alteração, porexemplo uma estrutura helicoidal alfa e de folha beta; uma carga ou um sítiohidrofóbico da molécula, que pode estar em um sítio ativo; ou uma cadeia
lateral. A invenção prove substituições no polipeptídeo da invenção onde (a)resíduos hidrofílicos,^por exemplo, serila ou treonila, é usada como substitutode (ou por) um resíduo hidrofóbico, por exemplo leucila, isoleucila,fenilalanila, valila ou alanila; (b) uma cisteína ou prolina é usada comosubstituto de (ou por) qualquer outro resíduo; (c) um resíduo tendo uma
cadeia lateral eletropositiva, por exemplo, lisila, arginila, ou histidila, é usadacomo substituto de (ou por) um resíduo eletronegativo, por exemploglutamila ou aspartila; ou (d) um resíduo tendo um tamanho de cadeialateral, por exemplo fenilalanina, é usada como substituto de (ou por) nãotendo tendo uma cadeia lateral, por exemplo, glicina. As variantes podem
exibir a mesma atividade biológica qualitativa (isto é, uma celulase, porexemplo, atividade de enzima de endoglucanase, celobioidrolase, mananasee/ou betaglicosidase) embora variantes possam ser selecionadas paramodificar as características da celulase, por exemplo, enzimaa deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase quandonecessárias.
Em um aspecto, celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção comprendem epítopos ou etiquetas de purificação, seqüências desinal ou outras seqüências de fusão, etc. Em um aspecto, a celulase, porexemplo, enzimas de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase da invenção pode ser fundida a um peptídeo aleatório para
formar um polipeptídeo de fusão. Por "fundido" ou "operavelmènte ligado"aqui quer se dizer que o peptídeo aleatório e a celulase, por exemplo,enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidasesão ligadas entre si, de tal modo que para minimizar o rompimento para aestabilidade da celulase, por exemplo, estrutura de enzima de
endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, por- exemplo, -retém—celulase, por exemplo, atividade—de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase. O-polipeptídeo de fusão (ou polinucleotídeo de fusão que codifica opolipeptídeo de de fusão) pode também compreender outros componentes,
incluindo múltiplos peptídeos nos múltiplos laços. ._ ._
Em um aspecto, os peptídeos e ácidos-nucléieos que oscodificam são aleatorizados, ou totalmente aleatorizados ou eles sãoenviesados em sua aleatorização, por exemplo, nucleotídeo/freqüência deresíduo em geral ou pela posição. "Aleatorizado" significa que cada ácido
nucléico e peptídeo consiste em nucleotídeos e aminoácidos essencialmentealeatórios, respectivamente. Em um aspecto, os ácidos nucléieos queoriginam os peptídeos podem ser quimicamente sintetizados, e assim podemincorporar qualquer nucleotídeo em qualquer posição. Assim, quando osácidos nucléieos são expressos para formar peptídeos, qualquer resíduo de
aminoácido pode ser incorporado em qualquer posição. O processo sintéticopode ser projetado para gerar ácidos nucléieos aleatorizados, para permitir aconstrução da totalidade ou da maioria das combinações possíveis sobre ocomprimento do ácido nucléico, assim formando uma biblioteca de ácidosnucléicos aleatorizados. A biblioteca pode prover uma populaçãosuficientemente estruturalmente diversa de produtos de expressãoaleatorizados para afetar uma faixa probabilisticamente suficiente de respostas de celular para prover um ou mais células que exibem umaresposta desejada. Assim, a invenção prove uma biblioteca de interaçãogrande embora de modo que pelo menos um de seus membros tivesse umaestrutura que dá sua afinidade para alguma molécula, proteína, ou outrofator.
Em um aspecto, uma celulase, por exemplo, enzima de
endoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção é uma enzima de multidomínio que compreende um peptídeo desinal, um módulo de ligação de carboidrato, uma celulase, por exemplo, umdomínio cataiítico de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, um ligador e/ou um outro domínio catalítico.
-----A-invenção-prove métodos e seqüências-para-a geração de
polipeptídeos quiméricos que podem codificar polipeptídeos híbridosbiologicamente ativos (por exemplo, celulase híbrida, por exemplo, enzimasde endoglucanase, celobioidrolase, mananase e/ou betaglicosidase). Em um aspecto, os polinucleotídeos originais (por exemplo, uma ácido nucléicoexemplar da invenção) codificam polipeptídeos biologicamente ativos. Emum aspecto, um método da invenção produz novos polipeptídeos híbridospor utilização de processos celulares que integram a seqüência dospolinucleotídeos originais tal que polinucleotídeo híbrido resultante codifica um polipeptídeo que demonstra atividades derivadas, mas diferentes, dospolipeptídeos biologicamente ativos originais (por exemplo, celulase ouanticorpo da invenção). Por exemplo, os polinucleotídeos originais podemcodificar uma enzima particular (por exemplo, celulase) de ou encontradosem microorganismos diferentes. Uma enzima codificada por uma primeiro polinucleotídeo de um organismo ou variante pode, por exemplo, funcionareficazmente sob uma condição ambiental particular, por exemplo, altasalinidade. Uma enzima codificada por um segundo polinucleotídeo de umdiferente organismo ou variante pode funcionar eficazmente sob umadiferente condição ambiental, tal como temperaturas extremamente altas.Um polinucleotídeo híbrido contendo seqüências do primeiro e segundopolinucleotídeos originais podem codificar uma enzima que exibe características de ambas as enzimas codificada pelospolinucleotídeosoriginais. Assim, a enzima codificada pelo polinucleotídeo híbrido dainvenção pode funcionar eficazmente sob condições ambientais partilhadaspor cada uma das enzimas codificada pelo primeiro e segundopolinucleotídeos, por exemplo, alta salinidade e temperaturas extremas.
Em um aspecto, um polipeptídeo híbrido gerado por um método
da invenção pode exibir atividade de enzima especializada não exibida nasenzimas originais. Por exemplo, a seguir recombinação e/ou reagrupamentoredutivo de polinucleotídeos que codifica celulase, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase, o
polipeptídeo híbrido resultante codificado por um polinucleotídeo híbrido„_pDde ser triado quanto, a não celulase especializada, por exemplo, atividadesde enzima de não endoglucanase, não celobioidrolase e/ou nãobetaglicosidase, por exemplo, atividades de hidrolase.peptidase, fosforilase,etc, obtidas a partir de cada uma das enzimas originais.
________ Em um aspecto, o polipeptídeo híbrido é triado para determinar
aquelas funcionalidades químicas que distinguem o polipeptídeo híbrido dospolipeptídeos de origem originais, tal como a temperatura, pH ouconcentração de sal em que as funções de polipeptídeo híbrido. Em umaspecto, a invenção refere-se a um método para a produção de um
polipeptídeo híbrido biologicamente ativo e triagem de tal polipeptídeo para aatividade aumentada por:
1) introdução de pelo menos um primeiro polinucleotídeo naligação operável e um segundo polinucleotídeo na ligação operável, os pêlomenos primeiro polinucleotídeo e segundo polinucleotídeo que partilham
pelo menos uma região de homologia de seqüência parcial, em uma célulahospedeira adequada;
2) desenvolvimento da célula hospedeira sob condições quepromovem reorganização de seqüência que resulta em um polinucleotídeohíbrido na ligação operável;
3) expressão de um polipeptídeo híbrido codificado pelopolinucleotídeo híbrido; 4) triagem do polipeptídeo híbrido sob condições que promovem
identificação de atividade biológica aumentada; e
5) isolamento de um polinucleotídeo que codifica o polipeptídeo
híbrido.
Isolamento e revelação das enzimas de celulase
A invenção prove métodos para o isolamento e revelação decelulases, por exemplo, enzimas de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase e os ácidos nucléicos que as codificam.Polinucleotídeos oü enzimas podem ser isolados de organismos individuais("isolados"), coleções de organismos que foram desenvolvidos em meiosdefinidos ("culturas de enriquecimento"), ou, organismos não cultivados("amostras -ambientais"). Os organismos—podem ser- isolados por, porexemplo, biogarimpamento in vivo (ver discussão, abaixo). O uso de- abordagem independente de cultura para originar polinucleotídeos quecodificam novas bioatividades de amostras ambientais é mais preferível uma vez que permite novas bioatividades de amostra ambientais é mais preferíveluma vez que permite-se acessar recursos de biodiversidade sem derivação.Polinucleotídeos ou enzimas também podem ser isolados de qualquer um denumerosos organismos, por exemplo bactérias. Além de células inteiras,polinucleotídeos ou enzimas também podem ser isolados de preparações deenzima brutas derivadas de culturas destes organismos, por exemplo,bactérias.
"Bibliotecas ambientais" são geradas a partir de amostrasambientais e representam os genomas coletivos de organismos deocorrência natural alcançados em vetores de clonagem que podem ser propagados em hospedeiros procarióticos adequados. Uma vez que o DNAclonado é inicialmente extraído diretamente de amostras ambientais, asbibliotecas não são limitadas à fração pequena de procariotas que podemser desenvolvidas em cultura pura. Adicionalmente, uma normalização doDNA ambiental presente nestas amostras poderia permitir representaçãomais igual do DNA a partir de todas as espécies presentes na amostraoriginal. Isto pode dramaticamente aumentar a eficácia de encontrar genesde interesse de constituintes secundários da amostra que pode estar sob-representada por várias ordens de magnitude comparada com a espéciedominante.
Em um aspecto, bibliotecas de genes geradas a partir de um oumais microorganismos não cultivados são tríadas quanto a uma atividade deinteresse. Trajetórias potenciais que codificam moléculas de interesse sãoprimeiramente capturadas em células procarióticas na forma de bibliotecasde expressão de gene. Em um aspecto, atividades de codificação depolinucleotídeos de interesse são isoladas de tais bibliotecas e sãointroduzidas para dentro da célula hospedeira. A célula hospedeira é desenvolvida sob condições que promovem recombinação e/ou—reagrupamento-redutivo- criando -biomoléculas potencialmente- ativas comatividades novas ou aumentadas.
"Biopanning" in vivo pode ser realizado por ultização demáquinas com base não óticas (por exemplo, magnéticas) e com base emFACS. Em um aspecto, bibliotecas de genes complexas são construídascom vetores que contêm elementos que estabilizam RNA transcrito. Porexemplo, a inclusão de seqüências que resulta em estruturas secundárias,tais como grampos que são projetados para flanquear as regiões transcritasdo RNA serveriam para aumentar sua estabilidade, assim aumentando sua semivida dentro da célula. As moléculas de sonda usadas no processo de"biopanning" consistem em oligonucleotídeos marcados com moléculasrepórter que apenas fluorescem na ligação da sonda a uma molécula alvo.Estas sondas são introduzidas para dentro das células recombinantes apartir da biblioteca usando-se um dos vários métodos de transconstrução. As moléculas de sonda se ligam ao mRNA alvo transcrito que resulta emmoléculas heteroduplex de DNA/RNA. Ligação da sonda a um alvofornecerá um sinal fluorescente que é detectado e é classificado pelamáquina FACS durante o processo de triagem.
Em um aspecto, subclonagem é realizada para ulteriormenteisolar seqüências de interesse. Na subclonagem, uma porção de DNA éampliada, é digerida, em geral por enzimas de restrição, para cortar a seqüência desejada, a seqüência desejada é ligada em um vetor de receptore é ampliada. A cada etapa na subclonagem, a porção é examinada quantoà atividade de interesse, a fim de se assegurar que DNA que codifica aproteína estrutural não foi excluído. O inserto pode ser purificado emqualquer etapa da subclonagem, por exemplo, por eletroforese de gel antes
da ligação em um vetor ou onde células contendo o vetor de receptor ecélulas não contendo o vetor de receptor são colocadas em meio seletivocontendo, por exemplo, um antibiótico, que matarão as célula não contendoo vetor de receptor. Métodos específicos de insertos de cDNA desubclonagem em vetores- são bem-conhecidos na técnica (Sambrook e
outros., Molecular Clonagem: A Laboratory Manual, 2nd Ed., Cold SpringHarbor Laboratory Press (1.989.))._Em um .outro aspecto,-as enzimas dainvenção são subclones. Tais subclones podem diferir do clone de origempor, por exemplo, comprimento, uma mutação, uma etiqueta ou um rótulo.
Os microorganismos oriundos dos quais o polinucleotídeo pode
ser revelado, isolado ou preparado incluem microorganismos procarióticos,tais como Eubacteria, and Archaebaeteria e microorganismos-eucaríoticosinferiores tais como, fungos, algumas algas e protozoários. Polinucleotídeospodem ser revelados, isolado sou preparados a partir de amostrasambientais caso esse em que o ácido nucléico pode ser recuperado sem
cultivo de um organismo ou recuperado de um ou mais organismoscultivados. Em um aspecto, tais microorganismos podem ser extremófilos,tais como hipertermófilos, psicrófilos, psicrotrófos, halófilos, barófilos eacidófilos. Polinucleotídeos que codificam enzimas isoladas demicroorganismos extremofílicos podem ser usados. Enzimas desta invenção
podem funcionar a temperaturas acima 100°C, por exemplo, como aquelasencontradas fontes quentes terrestres e ventilações térmicas de mar aberto,ou a temperaturas abaixos de 0°C, por exemplo, como aquelas encontradasem águas árticas, em um ambiente de sal saturado, por exemplo, comoaquelas encontradas no mar aberto, a valores de pH por volta de 0, porexemplo, como aquelas encontradas em depósitos de carvão e fontes ricasde enxofre geotérmicas, ou a valores de pH maior do que 11, por exemplo, como aquelas encontradas em lama de água servida. Em um aspecto,enzimas da invenção têm alta atividade através de toda uma ampla faixa detemperaturas e pHs.
Polinucleotídeos selecionados e isolados aqui mais acimadescritos são introduzidos para dentro de uma célula hospedeira adequada.
A célula hospedeira adequada é qualquer célula que é capaz de promover arecombinação e/ou reagrupamento redutivo. Os polinucleotídeosselecionados são em um aspecto já em um vetor que inclui seqüências decontrole apropriados. A célula hospedeira pode ser uma célula eucarióticasuperior, tal como uma célula de mamífero, ou uma célula eucariótica
inferior, tal como uma célula de levedura, ou em um aspecto, a célula
—hospedeira pode.....ser uma célula procariótica,- tal como uma célula
bacteriana. Introdução do construto para dentro da célula hospedeira podeser efetuada por transfecção de fosfato de cálcio, transfecção mediada porDEAE-Dextrano, ou electroporação.
Hospedeiros exemplares incluem células bacterianas, tais como
E. coli, Streptomyees, Salmonella typhimurium; células fúngicas, tal comolevedura; células de inseto, tais como Drosofila S2 e Spodoptera Sf9; célulasanimais, tais como CHO, COS ou Bowes melanoma; adenovírus; e célulasde planta; ver a descrição, acima. A seleção de um hospedeiro apropriado é
considerado estar dentro do escopo daqueles versados na técnica a partirdos ensinamentos aqui.
Vários sistemas de cultura de célula de mamífero podem serempregados para expressar proteína recombinante, exemplos de sistemasde expressão de mamífero incluem as linhagens de COS-7 de fibroblastos
de rim de macacos, descritas em "células de símios transformadas por SV40suportam a replicação de mutantes SV40 precoces" (Gluzman, 1981) eoutras linhagens de células capazes de expressar um vetor biocompatível,por exemplo, as linhagens de células de C127, 3T3, CHO, HeLa e BHK.Vetores de expressão de mamífero podem compreender uma origem dereplicação, um promotor e aumentador adequado e também quaisquer sítiosde ligação de ribossoma, sítio de poliadenilação, sítios doadores e aceitante de união, seqüências de terminação transcritivas e seqüências nãotranscritas de flanqueamento 5'. Seqüências de DNA derivadas da união deSV40 e de sítios de poliadenilação podem ser usados para prover oselementos genéticos não transcritos exigidos.
Em um outro aspecto, ácidos nucléicos, polipeptídeos e métodos da invenção são usados em trajetórias bioquímicas, ou para gerarnovos polinucleotídeos que codificam trajetórias bioquímicas a partir de umou mais clusters de gene ou suas porções. Por exemplo, bactérias e muitoseucariotos têm um mecanismo coordenado para genes resultantes cujos-produtos são estão envolvidos em processos relacionados. Os genes são agrupados, em estruturas chamadas de clusters de gene, em umcromossoma-simples e são transformados, juntos-sob o controle de umaseqüência reguladora simples, incluindo um promotor simples que inicia
- -transcrição docluster total. Assim, um cluster de gene é um grupo de genesadjacentes que são idênticas ou relacionadas, usualmente quanto a sua função (um exemplo de uma trajetória bioquímica codificada por clusters de
gene são policetídeos), -------------
Em um aspecto, DNA de cluster de gene é isolado de diferentesorganismos e é ligado em vetores, por exemplo, vectores contendoseqüências reguladoras de expressão que podem controlar e regular a produção de uma atividade de ensaio relacionada a proteína ou proteínadetectável a partir dos clusters de gene ligados. Uso de vetores que têmuma capacidade excepcionalmente grande para introdução de DNA exógenopode ser apropriada para o uso com tais clusters de gene e são descritos atítulo de exemplo aqui por incluir o fator f (ou fator de fertilidade) de E. coli. Este fator f de E. coli é um plasmídio que afeta a sua transferência de altafreqüência durante a conjugação e é ideal para alcançar e estavelmentepropagar fragmentos de DNA grandes, tais como clusters de gene oriundosde amostras microbianas mistas. Um aspecto é usasr vetores de clonagem,chamados de "fosmídios" ou vetores de cromossoma artificiais bacterianos(BAC). Esses são derivados de fator f de E. coli que é capaz deestavelmente integrar segmentos grande de DNA genômico. Quando integrados com DNA de uma amostra ambiental não cultivada mista, istotorna possível conseguir fragmentos genomicos grandes na forma de uma"biblioteca de DNA ambiental". Um outro tipo de vetor para o uso napresente invenção é um vetor de cosmídio. Vetores de cosmídio foramoriginalmente projetados para clonar e propagar segmentos grandes de DNA genômico. Clonagem em vetores de cosmídio é descrita em detalhes emSambrook e outros, Molecular Clonagem: A Laboratory Manual, 2nd Ed.,Cold Spring Harbor Laboratory Press (1989). Uma vez ligado em um vetorapropriado, dois ou mais vetores contendo clusters de gene de sintase depolicetídeo diferente podem ser intrudizido para dentro de uma célula hospedeira adequada. Regiões de homologia de seqüência parcial—partilhadas pelo clusters.de gene promoverão processos que resultam emreorganização de seqüência que resulta em um cluster de gene híbrido. Onovo—cluster -de gene híbrido pode então ser triado para -atividadesaumentadas não encontradas nos clusters de gene originais.
Métodos para a triagem para várias atividades de enzima são conhecidos por aqueles versados na técnica e são discutidos através detodo o presente relatório, ver, por exemplo, Exemplos 1, 2 e 3, abaixo. Taismétodos podem ser empregados quando o isolamento dos polipeptídeos edos polinucleotídeos da invenção.
Em um aspecto, a invenção prove métodos para a revelação e
isolamento de celulases, por exemplo, endoglucanase, celobioidrolase,mananase e/ou betaglicosidase, ou compostos para modificar a atividadedessas enzimas, usando-se uma abordagem de célula inteira (ver discussão,abaixo). Clones putativos que codificam celulase, por exemplo, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase debiblioteca de DNA genômico podem ser triados.
Metologias de triagem e dispositivos de monitoramento "On-line"Na prática dos métodos da invenção, uma variedade deaparelhos e metodologias podem ser usados para em combinação com ospolipeptídeos e os ácidos nucleicos da invenção, por exemplo, para triarpolipeptídeos quanto a celulase, por exemplo, atividade de enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, para triarcompostos como moduladores potenciais, por exemplo, ativadores ouinibidores, de uma celulase, por exemplo, atividade de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase, paraanticorpos que se ligam a um polipeptídeo da invenção, para ácidos nucleicos que hibridizam para dar um ácido nucleico da invenção, para triarquanto a células que expressam um polipeptídeo da invenção e similares.Além dos formatos de ensaio descritos em detalhes abaixo para triagem deamostras, formatos alternativos podem também ser usados para praticar osmétodos da invenção. Tais formatos incluem, por exemplo, espectrômetros de massa, cromatografos, por exemplo, HPLC de alta capacidade e outras_fo.rmas._de c.ro.matografia_líq.uid.a,_e_-fo.r.mato .menores.,, tais-como placas de1536 cavidades, placas de 384 cavidades e assim por diante. Aparelho de-triagem, de alta capacidade pode ser-adaptado e usado para praticar osmétodos da invenção, ver, por exemplo, os pedidos de patente U.S. nes 20020001809;20050272044.
Ensaios de capilar
Ácidos nucleicos ou polipeptídeos da invenção podem serimobilizados a ou aplicados a um ensaio. Ensaios podem ser usados paratriar quanto a ou monitorar bibliotecas de composições (por exemplo,
moléculas pequenas, anticorpos, ácidos nucleicos, etc.) quanto a suacapacidade de se ligar a ou de modular a atividade de um ácido nucleico ouum polipeptídeo da invenção. Ensaios de capilar, tais como oGIGAMATRIX®, Diversa Corporation, San Diego, CA; e ensaios descritosno, por exemplo, pedido de patente U.S. n9 20020080350 Al; WO 0231203
A; WO 0244336 A, provêem um aparelho alternativo para manter e triaramostras. Em um aspecto, o ensaio de capilar inclui uma pluralidade decapilares transformados em um ensaio de capilares adjacentes, em quecada capilar compreende pelo menos uma paredel que define um lúmenpara a retenção de uma amostra. O lúmen pode ser cilíndrico, quadrado,hexagonal ou qualquer outra forma geométrica contanto que as paredesformem um lúmen para a retenção de um líquido ou amostra. Os capilares do ensaio de capilar podem ser mantidos juntos em proximidade próximapara formar uma estrutura planar. Os capilares podem ser ligados entre si,por serem fundidos (por exemplo, onde os capilares são produzidos devidro), colados, ligados ou grampeados lada a lado. Adicionalmente, oensaio de capilar pode incluir material intesticial disposto entre capilares adjacentes no ensaio, desse modo formando um dispositivo planar sólidocontendo uma pluralidade de furos com saída.
Um ensaio de capilar pode ser formado de qualquer número decapilares individuais, por exemplo, uma faixa de 100 a 4.000,000 capilares.Além disso, um ensaio de capilar tendo cerca de 100.000 ou mais capilaresindividuais pode ser transformado na forma e tamanho padrão de uma placade microtitulação (R) para o ajustamento em-equipamento de laboratóriopadrão. Os lúmens são enchidos manualmente ou automaticamente usando-se ou ação de capilar ou microinjeção usando-se uma agulha fina. Amostrasde interesse podem ser subseqüentemente removidas dos capilaresindividuais para outra análise ou characterização. Por exemplo, uma sonda-de tipo agulha fina é posicionada em comunição com fluido com um capilarselecionado ou para adicionar ou retirar material do lúmen.
Em um ensaio de triagem de um único vaso, os componentesde ensaio são misturados fornecendo uma solução de interesse, antes da inserção no ensaio de capilar. O lúmen é enchido por ação de capilarquando pelo menos uma porção do ensaio está imersa em uma solução deinteresse. Atividade e/ou reações biológicas ou químicas em cada capilarsão monitoradas quanto a eventos detectáveis. Um evento detectável éfreqüentemente chamado de um "impacto", que pode usualmente ser distinguido de "não impacto" produzindo capilares por detecção ótica. Assim,ensaios de capilar permitem a detecção maciçamente paralela de"impactos".Em um ensaio de triagem de múltiplos vasos, um polipeptídeoou um ácido nucleico, por exemplo, um ligante, pode ser introduzido paradentro de um primeiro componente, que é introduzido para dentro de pelomenos uma porção de um capilar de um ensaio de capilar. Uma bolha de arpode então ser introduzida para dentro do capilar atrás do primeirocomponente. Um segundo componente pode então ser introduzido paradentro do capilar, em que o segundo componente é separado do primeirocomponente pelo bolha de ar. Os primeiro e segundo componentes podementão ser misturados por alicação de pressão hidroestática a ambos os
lados do ensaio de capilar para entrar em colapso a bolha. O ensaio decapilar é então monitorado quanto a um evento detectavel que resulta dareação ou não reação dos dois componentes.
Em um ensaio de triagem de ligação, uma amostra de interessepode ser introduzida como um primeiro líquido marcado com uma partícula
detectavel para dentro de um capilar de um ensaio de capilar, em que olúmen do capilar-é~revestido com um material de ligação para a ligação dapartícula detectavel ao lúmen. O primeiro líquido pode então ser removido dotubo de capilar, em que a partícula detectavel ligada é mantida dentro docapilar, e um segundo líquido pode ser introduzido para dentro do tubo de
capilar. O capilar é então monitorado quanto a um evento detectavel queresulta da reação ou não reação da partícula com o segundo líquido.Ensaios, ou "Biochips"
Ácidos nucléicos ou polipeptídeos da invenção podem serimobilizados a ou aplicados a um ensaio. Ensaios podem ser usados para
triar quanto a ou monitor bibliotecas de composições (por exemplo,moléculas pequenas, anticorpos, ácidos nucléicos, etc.) quanto a suacapacidade de se ligar a ou modular a atividade de um ácido nucleico ou umpolipeptídeo da invenção. Por exemplo, em um aspecto da invenção, umparâmetro monitorado é expressão de transcrito de uma celulase, por
exemplo, enzima de gene de endoglucanase, celobioidrolase, mananasee/ou betaglicosidase. Uma ou mais, ou, totalidades dos transcritos de umacélula podem ser medidas por hibridização de uma amostra compreendendotranscritos da célula, ou, ácidos nucléicos representativos de oucomplementares a transcritos de uma célula, por hibridização para darácidos nucléicos imobilizados em um ensaio, ou "biochip". Por uso de um"ensaio" de ácidos nucléicos em um microchip, alguns ou a totalidade dos transcritos de uma célula pode ser simultaneamente quantificadas.Alternativamente, ensaios compreendendo ácido nucléico genômico podemtambém ser usados para determinar o genótipo de uma cepa precocementeengenheirada produzida pelos métodos da invenção.
Ensaios de polipeptídeo" podem também ser usados
simultaneamente para quantificar uma pluralidade de proteínas. A presenteinvenção pode ser praticada com qualquer "ensaio" conhecido tambémchamado de "microensaio" ou "ensaio de ácido nucléico" ou "ensaio depolipeptídeo" ou "ensaio de anticorpo" ou "biochip," ou sua variação. Ensaiossão geneticamente uma pluralidadede "manchas" ou "elementos alvo", cada
elemento alvo compreendendo uma quantidade definida de uma ou mais-moléculas-biológicas, por exemplo, oligonucleotídeos, imobilizadas sobreuma área definida de uma superfície de substrato para a ligação específica auma molécula de amostra, por exemplo, transcritos de mRNA. •
Os termos "ensaio" ou "microensaio" ou "biochip" ou "chip"
como usado aqui é uma pluralidade de elementos alvo, cada elemento alvocompreendendo uma quantidade definida de um ou mais polipeptídeos(incluindo anticorpos) ou ácidos nucléicos imobilizados sobre uma áreadefinida de uma superfície de substrato, como discutido em outros detalhes,abaixo.
Na prática os métodos da invenção, quaisquer ensaio e/ou
método conhecidos da produção e uso de ensaios podem ser incorporadosna totalidade ou em parte, ou suas variações, como descrito, por exemplo,nas patentes U.S. n5s 6.277.628; 6.277.489; 6.261.776; 6.258.606;6.054.270; 6.048.695; 6.045.996; 6.022.963; 6.013.440; 5.965.452;
5.959.098; 5.856.174; 5.830.645; 5.770.456; 5.632.957; 5.556.752;5.143.854; 5.807.522; 5.800.992; 5.744.305; 5.700.637; 5.556.752;5.434.049; ver também, por exemplo, WO 99/51773; WO 99/09217; WO97/46313; WO 96/17958; ver também, por exemplo, Johnston (1998) Curr.Biol. 8:R171-R174; Schummer (1997) Biotechniques 23:1087-1092; Kern(1997) Biotechniques 23:120-124; Solinas-Toldo (1997) Genes,Chromosomes & Câncer 20:399-407; Bowtell (1999) Nature Genetics Supp. 21 :25-32. Ver também os pedidos de patente publicados U.S. n-s20010018642; 20010019827; 20010016322; 20010014449; 20010014448;20010012537; 20010008765.
Anticorpos e métodos de triagem à base de anticorpo
A invenção prove anticorpos recombinantes ou isolados queespecificamente se ligam a uma celulase, por exemplo, enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção. Esses anticorpos podem ser usados para isolar, identificar ouquantificar a celulase, por exemplo, enzimas de endoglucanase,celobioidrolase, mananase e/ou betaglicosidase da invenção oupolipeptídeos relacionados. Esses anticorpos podem ser usados para isolar. outros^.polip.eptídeos. .dentro do escopo a invenção ou outra celulaserelacionada, por exemplo, enzimas de endoglucanase, celobioidrolase,. mananase e/ou betaglicosidase.-Os anticorpos podem ser projetados parase ligar a um sítio ativo de uma celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. Assim, ainvenção prove métodos de inibição de celulase, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase usando-seos anticorpos da invenção (ver discussão acima com relação a applicaçõespara anticelulase, por exemplo, composições de enzima deantiendoglucanase, anticelobioidrolase e/ou antibetaglicosidase dainvenção). O termo "anticorpo" inclui um peptídeo ou um polipeptídeoderivado de, modelado depois de ou substancialmente codificado por umgene de immunoglobulina ou genes de imunoglobulina, ou seus fragmentos,capaz de especificamente ligar um antígeno ou epitopo, ver, por exemplo Fundamental Imunology, Tird Edition, W.E. Paul, ed., Raven Press, N. Y.(1993); Wilson (1994) J. Imunol. Methods 175:267-273; Yarmush (1992) J.Biochem. Biophys. Methods 25:85-97. O termo anticorpo inclui porções deligação de antígeno, isto é, "sítios de ligação de antígeno" (por exemplo,fragmentos, subseqüências, regiões de determinação de complementaridade(CDRs)) que retêm a capacidade de ligar antígeno, incluindo (i) umfragmento de Fab, um fragmento monovalente que consiste nos domínios de VL, VH, CL e CH1; (ii) um fragmento de F(ab')2, um fragmento bivalentecompreendendo dois fragmentos de Fab ligados por uma ponte de dissulfetona região principal; (iii) um fragmento de Fd que consiste nos domínios deVH e CH1; (iv) a Fv fragmento que consiste nos domínios de VL e VH de umbraço simples de um anticorpo, (v) um fragmento de dAb (Ward e outros., (1989) Nature 341 :544-546), que consiste em um domínio de VH; e (vi) umaregião de determinação de complementaridade isolada (CDR). Anticorpos decadeia simples são também incluídos por referência no termo "anticorpo".
A invenção prove fragmentos das enzimas da invenção (porexemplo, peptídeos) incluindo fragmentos imunogênicos (por exemplo, subseqüências) de um polipeptídeo da invenção. A invenção prove-composições compreendendo um polipeptídeo-ou um peptídeo da invençãoe auxiliares ou veículos e similares.
Os anticorpos podem ser usados em colunas deimunoprecipitação, manchamento, imunoafinidade, e similares. Se desejado, seqüências de ácidos nucléicos que codificam antígenos específicos podemser gerados por immunização seguido por isolamento de polipeptídeo ou deácido nucléico, amplificação ou clonagem e immobilização de polipeptídeosobre um ensaio da invenção. Alternativamente, os métodos da invençãopodem ser usados para modificar a estrutura de um anticorpo produzido por uma célula a ser modificada, por exemplo, uma afinidade de anticorpo podeser aumentada ou diminuída. Além do mais, a capacidade de produzir oumodificar anticorpos pode ser um fenótipo engenheirado em uma célulapelos métodos da invenção. Métodos de immunização, produção eisolamento de anticorpos (policlonal e monoclonal) são conhecidos por aqueles versados na técnica e descritos na literatura de patente e científica,ver, por exemplo, Coligan, CURRENT PROTOCOLS IN IMUNOLOGY,Wiley/Greene, NY (1991); Stites (eds.) BASIC AND CLINICAL IMUNOLOGY(7th ed.) Lange Medicai Publications, Los Altos, CA ("Stites"); Goding,MONOCLONAL ANTIBODIES: PRINCIPLES AND PRACTICE (2d ed.)Academic Press, New York, NY (1986); Kohler (1975) Nature 256:495;Harlow (1988) ANTIBODIES, A LABORATORY MANUAL, Cold SpringHarbor Publications, New York. Anticorpos também podem ser gerados invitro, por exemplo, usando-se sítio de ligação de anticorpo recombinante queexpressa bibliotecas de exibição de fago, além dos métodos in vivotradicionais usando-se animais. Ver, por exemplo, Hoogenboom (1997)Trends Biotechnol. 15:62-70; Katz (1997) Annu. Rev. Biophys. Biomol. Struct. 26:27-45.
Os polipeptídeos da invenção ou fragmentos compreendendopelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 seusaminoacidos consecutivos, podem também ser usados para gerar anticorposque se ligam especificamente aos polipeptídeos ou fragmentos. Osanticorpos resultantes podem ser usados em procedimentos decromotografiapor imunoafinidade para isolar ou purificar o polipeptídeo oupara determinar se o polipeptídeo está presente em uma amostra biológica.Em tais procedimentos, uma preparação de proteína, tal como um extrato,ou uma amostra biológica é posta em contato com um anticorpo capaz de especificamente se ligar a um dos polipeptídeos da invenção, ou fragmentoscompreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou150 seus aminoacidos consecutivos.
Em procedimentos de imunoafinidade, o anticorpo é ligado a umsuporte sólido, tal como uma matriz de conta ou outra matriz de coluna. A preparação de proteína é colocada em contato com o anticorpo sobcondições em que o anticorpo especificamente se liga a um dospolipeptídeos da invenção, ou seu fragmento. Depois de uma lavagem pararemover proteína não especificamente ligadas, os polipeptídeosespecificamente ligados são eluídos. A capacidade de proteínas em uma amostra biológica para se
ligar ao anticorpo pode ser determinada usando-se qualquer uma devariedade de procedimentos familiares àqueles versados na técnica. Porexemplo, ligação pode ser determinada por marcação do anticorpo com umrótulo detectável tal como um agente fluorescente, um rótulo enzimático, ouum radioisótopo. Alternativamente, ligação do anticorpo à amostra pode serdetectada usando-se um anticorpo secundário tendo tal rótulo detectável no mesmo. Ensaios particulares, incluem ensaios de ELISA, ensaiosintercalados, rádio-imunoensaios e Western Blots.
Anticorpos policlonais gerados contra os polipeptídeos dainvenção, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30,35, 40, 50, 75, 100, ou 150 seus aminoacidos consecutivos podem ser
obtidos por injeção direta dos polipeptídeos para dentro de um animal ou poradministração dos polipeptídeos a um animal, por exemplo, um não humano.O anticorpo assim obtido pode ligar o próprio polipeptídeo. Deste modo,mesmo uma seqüência que codifica apenas um fragmento do polipeptídeopode ser usada para gerar anticorpos que podem se ligar ao polipeptídeo
nativo inteiro. Tais anticorpos podem então ser usados para isolar o-polipeptídeo de células que expressam aquele polipeptídeo.
Para a preparação de anticorpos monoclonais, qualquer técnicaque prove anticorpos produzidos por culturas de linha de célula contínuapode ser usada. Exemplos incluem a técnica de hibridoma (Kohler and
Milstein, Nature, 256:495-497, 1975), a técnica de trioma, a técnica dehibridoma de célula B humana (Kozbor e outros, Imunology- Today 4:72,1983) e a técnica de hibridoma de EBV (Cole, e outros, 1985, in MonoclonalAntibodies and Câncer Therapy, Alan R. Liss, Inc., pp. 77-96).
Técnicas descritas para a produção de anticorpos de cadeia
simples (a patente U.S. n9 4.946.778) podem ser adaptadas para produziranticorpos de cadeia simples para os polipeptídeos da invenção, oufragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75,100, ou 150 seus aminoacidos consecutivos. Alternativamente,camundongos transgênicos podem ser usados para expressar anticorpos
humanizados para estes polipeptídeos ou seus fragmentos.
Anticorpos gerados contra os polipeptídeos da invenção, oufragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75,100, ou 150 seus aminoácidos consecutivos podem ser usados na triagemquanto a polipeptídeos similares de outros organismos e amostras. Em taistécnicas, polipeptídeos oriundos do organismo são postos em contato com oanticorpo e aqueles polipeptídeos que especificamente ligam o anticorpo são detectados. Qualquer um dos procedimentos descritos acima pode serusado para detectar ligação de anticorpo. Um tal ensaio de triagem édescrito em "Methods for Measuring Celulase Activities", Methods inEnzymology, Vol 160, pp. 87-116.Kits
A invenção prove kits compreendendo as composições, porexemplo, ácidos nucléicos, cassetes de expressão, vetores, células,sementes, plantas ou partes de planta transgênicas, polipeptídeos (porexemplo, uma enzima de celulase) e/ou anticorpos da invenção. Os kitstambém podem conter ensinamento de ensinamento de material instrucionalas metodologias e usos industriais, médicos e de dieta da invenção, como
descrito aqui. ______ ...... .
Engenheiramento de célula inteira e medição de parâmetrosmetabólicos
Os métodos da invenção provêem evolução de célula inteira, ou engenheiramento de célula inteira, de uma célula para desenvolver umanova cepa de célula tendo um novo fenótipo, por exemplo, uma novacelulose ou celulose modificada, por exemplo, atividade de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase, pormodiificação da composição genética da célula. Ver o pedido de patente U.S. ne 20040033975.
A composição genética pode ser modificada por adição à célulade um ácido nucléico da invenção, por exemplo, uma seqüência decodificação para uma enzima da invenção. Ver, por exemplo, WO0229032;WO 0196551.
Para detectar o novo fenótipo, pelo menos um parâmetrometabólico de uma célula modificada é monitorado na célula em um "temporeal" ou quadro de tempo "on-line". Em um aspecto, uma pluralidade decélulas, tal como cultura de célula, é monitorada em "tempo real" ou "on-line". Em um aspecto, uma pluralidade de parâmetros metabólicos sãomonitorados em "tempo real" ou "on-line". Parâmetros metabólicos podemser monitorados usando-se a celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção.
Análise de fluxo metabólico (MFA) é baseado com umaestrutura bioquímica conhecida. Uma matriz metabólica linearmenteindependente é construída com base na lei de conservação de massa e umhipótese de estado pseudo-constante (PSSH) nos metabólitos intracelulares.Na prática os métodos da invenção, redes metabólicas são estabelecidas,incluindo a:
- identidade de todos subratos de trajetória, produtos emetabólitos intermediários
- identidade de todas as reações químicas que interconvergem
_jOs metabólitos de trajetória, a estequiometria das reações de trajetória,
- identidade de todas as enzimas que catalisam as reações,uma cinética de reação de enzima,
- as interações reguladoras entre componentes de trajetória, por exemplo, interações aloestérica, interações de enzima-enzima etc,
- compartimentalização intracelular de enzimas ou qualqueroutra organização supramolecular das enzimas, e,
- a presença de quaisquer gradientes de concentração demetabólitos, enzimas ou moléculas efetoras ou barreiras de difusão a seu
movimento.
Uma vez que a rede metabólita para uma dada cepa é formada,apresentação matemática por noção de matriz pode ser introduzida paraestimar os fluxos metabólicos intracelulares e se os dados de metabolomaonline estivessem disponíveis. Fenótipo metabólico conta com as mudanças da rede metabólica inteira dentro de uma célula. Fenótipo metabólico contacom a mudança de utilização de trajetória com relação a condiçõesambientais, regulação genética, estado em desenvolvimento e o genótipo,etc. Em um aspecto dos métodos da invenção, depois do cálculo de MFAon-line, o comportamento dinâmico das células, seus fenótipo e outraspropriedades são analisados por investigação da utilização de trajetória. Porexemplo, sé o fornecimento de glicose for aumentado e o oxigêniodiminuísse durante a fermentação por levedura, a utilização de trajetóriasrespiratórias serão reduzidas e/ou paradas, e a utilização de trajetóriasfermentativas dominará. Controle de estado fisiológico de cultura de célulastornará possível depois da anallise de trajetória. Os métodos da invençãopodem auxiliar a determinar de que maneira manipular a fermentação por determinação de como mudar o fornecimento de substrato, temperatura, usode indutores, etc. para controlar o estado fisiológico de células para moverao longo da direção desejável. Na prática os métodos da invenção, osresultados de MFA podem também ser comparados com dados detranscriptoma e proteoma para projetar experiências e protocolos paraengenheiramento metabólico ou embaralhamento de gene, etc. Na práticaos métodos da invenção, qualquer novo fenótipo ou fenótipo modificadopode ser conferido ou deletado, incluindo novas características oucaracterísticas aperfeiçoadas na célula. Qualquer aspecto do metabolismoou crescimento pode ser monitorado.Monitoração de expressão de um transcrito mRNA
Em- um aspecto da invenção, o fenótipo engenheiradocompreende aumento ou diminuição da expressão de um transcrito demRNA (por exemplo, uma celulase, por exemplo, mensagem de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase) ou geração de novos transcritos (por exemplo, celulase, por exemplo, enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase) em umacélula. Esta expressão aumentada ou diminuída pode ser traçada portestagem quanto à presença de uma celulase, por exemplo, enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção ou por celulase, por exemplo, ensaios de atividade de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase. Transcritosde mRNA, ou mensagens, também podem ser detectados e quantificadospor qualquer método conhecido na técnica, incluindo, por exemplo, Northernblots, reações de ampliação quantitativas, hibridização para dar ensaios, esimilares. Reações de ampliação quantitativas incluem, por exemplo, PCRquantitativa, incluindo, por exemplo, reação de cadeia de polimerase de transcrição reversa, ou RT-PCR; RT-PCR de tempo real quantitatia, ou " RT-PCR cinético de tempo real" (ver, por exemplo, Kreuzer (2001) Br. J.Haematol. 114:313-318; Xia (2001) Transplantation 72:907-914).
Em um aspecto da invenção, o fenótipo engenheirado é geradopor inativação expression de gene homólogo. A seqüência de codificação de gene ou um ou mais elementos de controle transcritivos podem serinativados, por exemplo, promotores ou aumentadores. Assim, a expressãode um transcrito pode ser totalmente removida ou apenas diminuída.
Em um aspecto da invenção, o fenótipo engenheiradocompreende aumento da expressão de gene homólogo. Isto pode ser efetuado por inativação de um elemento de controle negativo, incluindo um-elemento regulador transcritivo que aciona em. eis- ou trans- , ou,mutageneização de um elemento de controle positivo. Um ou mais, ou, atotalidade dos transcritos de uma célula podem ser medidos por hibridizaçãode uma amostra compreendendo transcritos da célula, ou, ácidos nucléicos representativos de ou complementares a transcritos de uma célula, porhibridização para dar ácidos nucléicos imobilizados em um ensaio.
Monitoração de expressão de polipeptídeos, peptídeos e
aminoácidos
Em um aspecto da invenção, o fenótipo engenheirado compreende aumento ou diminuição da expressão de um polipeptídeo (porexemplo, uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, mananase e/ou betaglicosidase) ou geração de novospolipeptídeos em uma célula. Esta expressão aumentada ou diminuída podeser traçada por determinação da quantidade de celulase, por exemplo, enzima de endoglucanase, celobioidrolase, mananase e/ou betaglicosidasepresentes ou por celulase, por exemplo, ensaios de atividade de enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase.Polipeptídeos, peptídeos e aminoácidos também podem serdetectados ou quantificados por qualquer método conhecido na técnica,incluindo, por exemplo, ressonância magnética nuclear (RMN),espectrofotometria, radiografia (radiomarcação de proteína), eletroforese,eletroforese capilar, cromatografia líquida de alto desempenho (HPLC),cromatografia de camada fina (TLC), cromatografia de hiperdifusão, váriosmétodos imunológicos, por exemplo imunoprecipitação, imunodifusão,imuno-eletroforese, radioimunoensaios (RIAs), ensaios imunosorventesligados à enzima (ELISAs), ensaios imunofluorescentes, eletroforese de gel(por exemplo, SDS-PAGE), manchamento com anticorpos, classificador decélula ativado fluorescente (FACS), espectrometria de massa de pirólise,espectrometria de infravermelho de Fourier-Transform, espectrometria deRaman, Eletrospray de GC-MS, e espectrometrias de massa de eletrspraytandem de LC e cap-LC tandem, e similares. Novas bioatividades podem sertríadas usando-se métodos, ou suas variações, descritos na patente U.S. n96.057.103. Além do mais, como discutido abaixo em detalhes, um ou mais,ou, a totalidade dos polipeptídeos de uma célula podem ser medidosusando-se um ensaio de proteína.-------------------
Aplicações industriais, de energia, farmacêuticas e outrasaplicações
Polipeptídeos da invenção (por exemplo, tendo celulase, porexemplo, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase)podem catalisar a decomposição química de celulose. As enzimas dainvenção podem ser catalisadores altamente seletivos. A invenção prove processos industriais usando-se enzimas da invenção, por exemplo, naindústria farmacêutica ou de suplemento de nutriente (dieta), a indústria deenergia (por exemplo, tornar biocombustíveis "limpos"), nas indústrias dealimento e ração, por exemplo, nos métodos para produção de de produtosalimentícios e de ração e aditivos alimentícios e de ração. Em um aspecto, ainvenção prove processos usando-se enzimas da invenção na indústriamédica, por exemplo, para produzir produtos farmacêuticas ou auxiliare dedieta ou suplementos, aditivos ou sumplementos alimentícios. Além disso, ainvenção prove métodos para o uso das enzimas da invenção em bioetanol,incluindo produção de combustível "limpo".
As enzimas da invenção podem catalisar reações com estéreo-,regio- e quimioseletividades agudas. A celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção podem ser engenheiradas para funcionar em vários solventes,operar a pHs extremos (por exemplo, pHs altos e pHs baixos) temperaturasextremas (por exemplo, altas temperaturas e baixas temperaturas), níveis desalinidade extremos (por exemplo, alta salinidade e baixa salinidade) e
catalisar reações com compostos que estão estruturalmente nãorelacionados com seus substratos fisiológicos, naturais.
Conversão e produção de biomassaa de biocombustíveis limposA invenção prove enzimas e métodos para a conversão debiomassa (por exemplo, materiais lignocelulósicos) em combustíveis (por
exemplo, bioetanol) e produtos químicos. Assim, as composições e métodos-da invenção provêem alternativos eficazes e sustentáveis para usar produtosà base de petróleo. A invenção prove organismos que expressam enzimasda invenção para-a participação -em—ciclos químicos que envolvemconversão de biomassa natural. Em um aspecto, enzimas e métodos para a
conversão são usados em conjuntos de enzima para a despolimerizaçãoeficiente de polímeros celulosicos e hemicelulósicos para metabolizarporções de carbono. Como discutido acima, a invenção prove métodos paraa revelação e impelementação da maioria das enzimas eficazes parapermitir que esses processos industriais de energia e nova "conversão de
biomassa".
Em um aspecto, os polipeptídeos da invenção, por exemplo,proteínas tendo atividade de celulase, por exemplo, atividade deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase, sãousados em processos para a conversão de biomassa lignocelulósica em etanol. A invenção também prove processos para a produção de etanol("bioetanol") a partir de composições compreendendo biomassalignocelulósica. O material de biomassa de lignocelulose pode ser obtido apartir de colheitas agrícolas, como um subproduto de alimento ou produçãoalimentício, ou como produtos de resíduo lignocelulósicos, tais comoresíduos de planta e papel de resíduo. Exemplos de resíduos de plantaadequados para o tratamento com polipeptídeos da invenção incluem troncos, folhas, cascas, palhas de milho, sabugos e similares, bem comomadeira, lascas de madeira, polpa de madeira, e serragem. Exemplos deresíduo de papel adequados para o tratamento com polipeptídeos dainvenção incluem papel de fotocópia de descarte, papel de impressora decomputador, papel de notebook, papel de notepad, papel para máquina de
escrever, e similares, bem como papéis de jornal, revistas, papelão emateriais de embalagem à base de papel.
Em um aspecto, as enzimas e métodos da invenção podem serusados em combinação com meios "tradicionais" de produção de etanol apartir de biomassa, por exemplo, como métodos compreendendo
hidrolisação de materiais lignocelulósicos por submissão de materiallignocelulósico seco em um reator a um catalisador constituído de umasolução diluída de um ácido forte e um sal de metal; isto pode diminuir aenergia de activação, ou a temperatura, de hidrólise de celulose para seobter fornecimentos de açúcar mais altos; ver, por exemplo, as patentes U.S.
n9s 6.660.506; 6.423.145.
Umoutro método exemplar que incorporou o uso de enzimas dainvenção compreende material de hidrolisação lignocelulósico contendohemicelulose, celulose e lignina por submissão do material a um primeiroestágio da etapa de hidrólise em um meio aquoso a uma temperatura e uma
pressão escolhidas para efetuar principalmente despolimerização dehemicelulose sem despolimerização principal de celulose em glicose. Estaetapa resulta em uma pasta em que a fase aquosa líquida contémmonossacarídeos dissolvidos que resultam de despolimerização dehemicelulose e uma fase sólida contendo celulose e lignina. Um segundo
estágio de etapa de hidrólise pode compreender condições tais que pelomenos uma porção principal da celulose é despolimerizada, tal etapa queresulta em uma fase aquosa líquida contendo produtos de despolimerizaçãodissolvidos/solúveis de. Ver, por exemplo, a patente U.S. n- 5.536.325.Enzimas da invenção podem ser adicionadas a qualquer estágio desteprocesso exemplar.
Um outro método exemplar que incorporou o uso de enzimas da invenção compreende o processamento de um material de biomassacontendo lignocelulose por um ou mais estágios de hidrólise de ácido diluídocom cerca de 0,4% a 2% de ácido forte; e tratamento de um componentelignocelulósico sólido não reagido do material de biomassa hidrolisado ácidopor deslignificação alcalina para produzir precursores para termoplásticos biodegradáveis e derivados. Ver, por exemplo, a patente U.S. ne 6.409.841.Enzimas da invenção podem ser adicionadas a qualquer estágio desteprocesso exemplar.
Um outro método exemplar que incorporou o uso de enzimas dainvenção compreende pré-hidrolisação de material lignocelulósico em um reator de pré-hidrólise; adição de um líquido ácido ao material lignocelulósicosólido para- produzir uma mistura; aquecimento da mistura para atemperatura de reação; manutenção da temperatura de reação por temposuficiente para fracionar o material lignocelulósico em uma porçãosolubilizada contendo pelo menos cerca de 20% da lignina oriunda do material lignocelulósico e uma fração sólida, contendo celulose; remoção deuma porção solubilizada a partir da fração sólida enquanto a ou próxima atemperatura de reação em que a celulose na fração sólida é tornada maisreceptiva a digestão enzimática; e recuperação de uma porção solubilizada.Ver, por exemplo, a patente U.S. n9 5.705.369. Enzimas da invenção podem ser adicionadas a qualquer estágio deste processo exemplar.
A invenção prove métodos para a produção de composições decombustível de motor (por exemplo, para motores de ignição de centelha)com base nos hidrocarborietos líquidos combinados com um álcool de graude combustível produzido por uso de uma enzima ou um método da invenção. Em um aspecto, os combustíveis produzido por uso de umaenzima da invenção compreendem, por exemplo, combinações de etanollíquido de gás natural ou líquido de gás de carvão. Em um aspecto, um co-solvente é 2-metiltetraidrofurano derivado de biomassa (MTHF). Ver, porexemplo, a patente U.S. n9 6.712.866.
Métodos da invenção para a degradação enzimática delignocelulose, por exemplo, para a produção de etanol a partir de materiallignocelulósico, pode também comrpeender o uso de tratamento ultrassônicodo material de biomassa; ver, por exemplo, a patente U.S. n9 6.333.181.
Um outro processo exemplar para produção de umbiocombustível compreendendo etanol usando-se enzimas da invençãocompreende pré-tratamento de um material de partida compreendendo uma carga de alimentação lingocelulósica compreendendo pelo menoshémicelulose e celulose. Em um aspecto, o material de partida compreendebatatas, soja (semente de colza), cevada, centeio, milho, aveias, trigo,beterrabas ou cana-de-açúcar ou um componente ou resíduo ou subprodutode produção de alimento ou comida. O material de partida ("carga de alimentação") é reagido a condições que rompem a estrutura de fibra daplanta para efetuar pelo menos uma hidrólise parcial da hémicelulose ecelulose. Condições disruptivas podem compreender, por exemplo,submissão do material de partida a uma temperatura média de 180°C a270°C a pH 0,5 a 2.5 por um período de cerca de 5 segundos a 60 minutos; ou, temperatura de 220°C a 270°C, a pH 0,5 a 2,5 por um período de 5segundos a 120 segundos, ou equivalente. Isto gera uma carga dealimentação com acessibilidade aumentada a ser digerida por uma enzima,por exemplo, uma enzima de celulase da invenção. A patente U.S. n96,090,595. Condições exemplares para hidrólise de celulose de material
lignocelulósico incluem reações a temperaturas entre cerca de 30°C e 48°C,e/ou um pH entre cerca de 4,0 e 6.0. Outras condições exemplares incluema temperatura entre cerca de 30°C e 60°C e um pH entre cerca de 4,0 e 8,0.Alimento e rações de animal ou aditivos de ração Além de prover auxiliares ou suplementos de dieta, ou aditivos e
suplmentos alimentícios para o uso humano, a invenção também provecomposições e métodos para o tratamento com aditivos de ração oualimento e alimentos e rações de animal usando-se um polipeptídeo dainvenção, por exemplo, uma proteína tendo atividade de celulase, porexemplo, enzimas de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase da invenção, e/ou os anticorpos da invenção. A invenção prove aditivos, alimentos e rações de animal compreendendo celulase, porexemplo, enzimas de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase da invenção e/ou anticorpos da invenção. O animal pode serqualquer animal da fazendo ou qualquer animal.
O aditivo de reação de animal da invenção pode ser um produto de enzima granulado que pode prontamente ser misturado com oscomponentes de ração. Alternativamente, aditivos de ração da invençãopodem formar um componente de um pré-mistura. O produto de enzimagranulado da invenção pode ser revestido ou não revestido. O tamanho departícula dos granulaados de enzima pode ser compatível com aquele de componentes de reação e componentes de pré-mistura. Isto prove um meioseguro e conveniente de incorporação de enzimas em rações.Alternativamente, o aditivo de ração animal da invenção pode ser umacomposição líquida estabilizada. Esta pode ser uma pasta à base de óleo ouaquosa. Ver, por exemplo, a patente U.S. ne 6.245.546.
Celulase, por exemplo, enzimas de endoglucanase,celobioidrolase, mananase e/ou betaglicosidase da presente invenção, namodificação de um alimento ou ração de animal, pode processar o alimentoou ração ou in vitro (por modificação componentes da ração ou alimento) ouin vivo. Polipeptídeos da invenção podem ser adicionados a compostos de alimento ou ração de animal.
Em um aspecto, uma enzima da invenção é adicionada emcombinação com uma outra enzima, por exemplo, beta-galactosidases,catalases, lacases, outras celulases, endoglicosidases, endo-beta-1,4-lacases, amiloglicosidases, outras glicosidases, isomerases de glicose, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-1acases,endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, glicoamilases,pectinases, reductases, oxidases, descarboxilases, fenoloxidases,ligninases, pululanases, arabinanases, hemicelulases, mananases,xilolacases, xilanases, estearases de acetila de pectina, estearases deacetila de ramnogalacturonana, proteases, peptidases, proteinases,poligalacturonases, ramnogalacturonases, galactanases, liases de pectina, transglutaminases, metilesterases de pectina, outras celobioidrolases e/outransglutaminases. Estes produtos de digestão de enzima são maisdigeríveis pelo animal. Assim, celulase, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção podem contribuir para a energia disponível da ração ou alimento,
para a digestabilidade do alimento ou ração por ruptura da celulose.
Em um outro aspecto, celulase, por exemplo, enzima deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção pode ser fornecida por expressão das enzimas diretamente emcolheitas de alimento transgênico (como, por exemplo, plantas transgênicas,
sementes e similares), tais como grãos, cereais, milho, soja, semente decolza, lupin e similares. Como discutido acima, a invenção prove plantas,partes de planta e células de planta transgênicas compreendendo umaseqüência de ácidos nucléicos que codifica um polipeptídeo da invenção.Em um aspecto, o ácido nucléico é expresso tal que ae celulase, por
exemplo, enzima de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase da invenção é produzido em quantidades recuperáveis. Acelulase, por exemplo, enzima de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase pode ser recuperada a partir de qualquerplanta ou parte de planta. Alternativamente, a planta ou parte de planta
contendo o polipeptídeo recombinante pode ser usada como tal para oaperfeiçoamento da qualidade de um alimento ou uma ração, por exemplo,aperfeiçoamento do valor nutricional, palatabilidade, etc.
Em um aspecto, uma matriz de fornecimento de enzima dainvenção está na forma de partículas, péletes ou grânulos plurais discretos.
Por "grânulos" querem se dizer partículas que são comprimidas ou sãocompactadas, tal como transconstrução em péletes, extrusão, oucompactação similar para remover água a partir da matriz. Tal compressãoou compactação das partículas também promove coesão de intrapartículadas partículas. Por exemplo, os grânulos podem ser preparados portransconstrução em péletes de substrato à base de grão em um moinho depélete. Os péletes preparados desse modo são moídas e são esmigalhados para dar um tamanho de grânulo adequado para o uso como um auxiliar naração de animal. Uma vez que a matriz é por si mesmo aprovada para o usona ração de animal, ela pode ser usada como um diluente para ofornecimento de enzimas na ração de animal.
Em um aspecto, a celulase, por exemplo, enzima de
endoglucanase, celobioidrolase, mananase e/ou betaglicosidase contida nosmétodos e matriz de fornecimento de enzima da invenção é uma celulasetermoestável, por exemplo, enzima de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase, como descrita aqui, de modo a resistirinativação da celulase, por exemplo, enzima de endoglucanase,
celobioidrolase, mananase e/ou betaglicosidase durante a fabricação ondetemperaturas e/ou vapor elevados podem ser empregados para preparar amatriz de fornecimento de enzima transformada em péletes. Durante adigestão de alimento-contendo uma matriz de fornecimento de enzima dainvenção, fluidos digestivos aquosos causarão liberação da enzima ativa.
Outros tipos de enzimas termoestáveis e suplementos nutricionais que sãotermoestáveis podem também ser incorporados na matriz de fornecimentopara liberação sob qualquer tipo de condições aquosas.
Em um aspecto, um revestimento é aplicado às partículas dematriz de enzima para muitas finalidades diferentes, tal como adicionar um
suplmento de nutrição ou de sabor a uma ração de animal, para retardar aliberação de suplementos de ração de animal e enzimas em condiçõesgástricas, e similares. Em um aspecto, o revestimento é aplicado paraalcançar um objetivo funcional, por exemplo, sempre que é desejáveldiminuir a liberação da enzima a partir da matriz partículas ou para controlar
as condições sob as quais a enzima será liberada. A composição do materialde revestimento pode ser tal que ela é seletivamente rompida por um agenteao qual ela é suscetível (tais como calor, ácido ou base, enzimas ou outrosprodutos químicos). Alternativamente, dois ou mais revestimentossuscetíveis a diferentes tais agentes de decomposição química podem serconsecutivamente aplicados às partículas de matriz.
A invenção também refere-se a um processo para a preparaçãode uma matriz de liberação de enzima. De acordo com a invenção, oprocesso compreende provisão de partículas plurais discretas de umsubstrato à base de grão em um tamanho de partícula adequado para o usocomo uma matriz de liberação de enzima, em que as partículascompreendem uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, mananase e/ou betaglicosidase codificada por umaseqüência de aminoácidós da invenção. Em um aspecto, o processo incluicompactação ou compressão das partículas de matriz de liberação deenzima para formar grânulos, que na maior parte em um aspecto é realizadopor transconstrução em péletes. O agente de natureza coesiva e inibidor de molde, quando usados, podem ser adicionados em qualquer hora adequada,e em um aspecto são misturados com o substrato à base de grão nasproporções desejadas antes da transconstrução em péletes do substrato àbase de grão. Teor de umidade no alimento no moinho de pélete em umaspecto está na faixa indicada acima com relação ao teor de umidade no produto acabado, e em um aspecto é cerca de 14-15%. Em um aspecto,umidade é adicionada à carga de alimentação na forma de uma preparaçãoaquosa da enzima para levar a carga de alimentação para este teor deumidade. A temperatura no moinho de pélete em um aspecto é levada paracerca de 82°C com vapor. O moinho de pélete poderá operar sob quaisquercondições que provêem trabalho suficiente para a carga de alimentação paraprover péletes. O próprio processo de transconstrução em péletes é umprocesso de custo eficaz para a remoção de água a partir de umacomposição contendo enzima.
As composições e métodos da invenção podem ser praticadasem combinação com administração de prebióticos, que são açúcares de altopeso molecular, por exemplo, fructo- oligossacarídeos (FOS); galacto-oligossacarídeos (GOS), material de GRAS (em geral reconhecido comoseguro). Estes prebioticos podem ser metabolizados por algumas bactériaslácticas probióticas (LAB). Elas não são digeríveis pela maioria dosmicróbios intestinais.
Tratamento de alimentos e processamento de alimentoA invenção prove alimentos e rações compreendendo enzimas
da invenção, e métodos para o uso de enzimas da invenção noprocessamento de alimentos e rações. Celulases, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção têm numerosas aplicações na indústria de processamento de alimento. A invenção prove métodos para a hidrolisação de composiçõescompreendendo celulose, incluindo, por exemplo, uma célula de planta, umacélula bacteriana, uma célula de levedura, uma célula de inseto ou umacélula de animal ou qualquer parte de planta ou planta, ou qualquer alimentoou ração, um produto de resíduo e similares.
Por exemplo, a invenção prove rações ou alimentoscompreendendo uma celulase, por exemplo, enzima de endoglucanase,celobioidrolase, mananase e/ou betaglicosidase, a invenção, por exemplo,em uma ração, um líquido, por exemplo, uma bebida (tal como suco de frutaou cerveja), um pão ou uma massa de bolo ou um produto de pão, ou uma bebida (por exemplo, a cerveja) ou um precursor de bebida (por exemplo,um mosto de cerveja).
Os processos de tratamento alimentício da invenção podemtambém incluir o uso de qualquer combinação de outras enzimas tais comotriptofanases ou descarboxilases de tirosina, lacases, catalases, lacases,outras celulases, endoglicosidases, endo-beta-1,4-lacases,amiloglicosidases, outras glicosidases, isomerases de glicose,glicosiltransfe rases, lipases, fosfolipases, lipooxigenases, beta-1 acases,endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, glicoamilases,pectinases, reductases, oxidases, descarboxilases, fenoloxidases,ligninases, pululanases, arabinanases, hemicelulases, mananases,xilolacases, xilanases, estearases de acetila de pectina, estearases deacetila de ramnogalacturonana, proteases, peptidases, proteinases,poligalacturonases, ramnogalacturonases, galactanases, liases de pectina,transglutaminases, metilesterases de pectina, outras celobioidrolases e/outransglutaminases.
Em um aspecto, a invenção prove enzimas e processos para a hidrolisação de amido granular e líquido (liqüefeito). Tal amido pode serderivado de qualquer fonte, por exemplo, beterraba, cana-de-açúcar, batata,milho, trigo, milo, sorgo, centeio ou bulgher. A invenção se aplica a qualquerfonte de amido de planta, por exemplo, uma fonte de amido em grão, que éútil em liqüefação (por exemplo, para produzir bioetanol), incluindo qualquer
outra fonte vegetal ou grão conhecido para produzir amido adequado paraliqüefação. Os métodos da invenção compreendem liqüefação de amido (porexemplo, produção de bioetanol) a partir de qualquer material natural, taiscomo arroz, arroz germinado, milho, cevada, milo, trigo, legumes, batata,beterraba, cana-de-açúcar e batata doce. O processo de liqüefação pode
substancialmente hidrolisar o amido para produzir um xarope. A faixa detemperatura da liqüefação pode ser qualquer temperatura de liqüefação queé conhecida como sendo eficaz na liqüefação de amido. Por exemplo, atemperatura do amido pode estar entre cerca de 80°C a cerca de 115°C,entre cerca de 100°C a cerca de 110°C, e de cerca de 105°C a cerca de
108°C. Os bietanóis produzidos usando-se as enzimas e processos dainvenção podem ser usados como combustíveis ou em combustíveis (porexemplo, auto-combustíveis), por exemplo, como discutidos acima abaixo,além de seu uso em rações e alimentos (ou para produção), incluindobebidas alcoólicas.
Tratamento de resíduo
A invenção prove enzimas para o uso no tratamento de resíduo.Celulases, por exemplo, enzimas de endoglucanase, celobioidrolase,mananase e/ou betaglicosidase da invenção podem ser usadas em umavariedade de tratamento de resíduo ou aplicações industriais relacionadas,
por exemplo, no tratamento de resíduo relacionado com conversão debiomassa para gerar combustíveis. Por exemplo, em um aspecto, a invençãoprove um processo de digestão de resíduo líquido/sólido usando-se celulase,por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/oubetaglicosidase da invenção. Os métodos podem compreender redução damassa e volume de resíduo sólido substancialmente não tratado. Resíduosólido pode ser tratado com um processo digestivo enzimático na presença de uma solução enzimática (incluindo celulase, por exemplo, enzimas deendoglucanase, celobioidrolase, mananase e/ou betaglicosidase dainvenção) a uma temperatura controlada. Isto resulta em uma reação semfermentação bacteriana de microorganismos adicionados. O resíduo sólido éconvertido em um resíduo liqüefeito e qualquer resíduo sólido residual. O resíduo liqüefeito resultante pode ser separado do dito resíduo solidificadoresidual. Ver por exemplo, a patente U.S. n- 5.709.796. Em um aspecto, ascomposições e os métodos da invenção são usados para a remoção deodor, prevenção de dor odor ou redução de odor, por exemplo, em lagos deresíduo de animal, por exemplo, nas fazendas de suíno, em outros sitemas de controle de resíduo de animal, ou em qualquer aplicação deprocessamento de alimento ou industrial.
As enzimas e os métodos para a conversão de biomassa (porexemplo, materiais lignocelulósicos) em combustíveis (por exemplo,bioetanol) podem incorporar o tratamento/reciclagem de material de resíduo sólido municipal, incluindo resíduo obtido diretamente a partir de um resíduosólido municipal ou municipalidade que foi anteriormente enchido na terra esubseqüentemente recuperado, lama de água de esgoto, por exemplo, naforma de torta de lama de água de esgoto que contém quantidadessubstanciais de material celulósico. Uma vez que tortas de lama de água de esgoto normalmente conterão quantidades substanciais de materiaisrecicláveis (alumínio, vidro, plásticos, etc), eles podem ser diretamentetratados com ácido sulfúrico concentrado (para reduzir o teor de metalpesado do componente celulósico do resíduo) e processados no sistema deprodução de etanol. Ver, por exemplo, as patentes U.S. nes 6.267.309; 5.975.439.
Um outro método exemplar usando-se enzimas da invençãopara a recuperação de material orgânico ou inorgânico a partir do materialde resíduo compreende esterilização de um material orgânico sólido eamolecimento dele por submissão dele a calor e pressão. Este processoexemplar pode ser realizado por primeiramente agitação do material deresíduo e então submissão dele a calor e pressão, que esteriliza-o e amolece o material orgânico contido ali. Em um aspecto, depois doaquecimento de sob pressão, a pressão pode ser subitamente liberada apartir de uma câmara perfurada para forçar o material orgânico amolecidopara fora através de perfurações do recipiente, assim separação do materialorgânico do material inorgânico sólido. O material orgânicos, esterilizado amolecido é então fermentado na câmara de fermentação, por exemplo,usando-se enzimas da invenção, por exemplo, para formar uma mistura. Amistura pode ser submetida a processamento ulterior por centrífuga , colunade destilação e/ou digestor anaeróbico para recuperar combustíveis taiscomo etanol e metano, e suplementos de ração de animal. Ver, por exemplo, a patente U.S. ne 6.251.643.
Enzimas da invenção podem também ser usadas em processos,por exemplo, pré-treatmentos, para reduzir o odor de um resíduo industrial,ou um resíduo gerado a partir de uma instalação de produção, e similares.Por exemplo, enzimas da invenção podem ser usadas para tratar um resíduo de animal em uma instalação de ocupação de resíduo para aumentardegradação eficaz de grandes quantidades de material orgânico com odorreduzido. O processo pode também incluir inoculação com bactérias deutilização de sulfeto e bactérias de digestão orgânicas e enzimas líticas(além de uma enzima da invenção). Ver, por exemplo, a patente U.S. n9 5.958.758.
Enzimas da invenção podem também ser usadas em sistemasmóveis, por exemplo, reatores de tipo batelada, para biorremediação deaquosos, resíduos perigosos, por exemplo, como descrito na patente U.S. n25.833.857. Reatores de tipo batelada podem ser recipientes grandes tendo capacidade circulatória em que bactérias (por exemplo, expressão de umaenzima da invenção) são mantidos em estado eficiente por nutrientes sendointroduzidos para dentro do reator. Tais sistemas podem ser usados ondeefluente pode ser fornecido ao reator ou o reator é desenvolvido em um sistema de tratamento de água servida. Enzimas da invenção podem também ser usadas no tratamento de sistemas para o uso em localizações remotas temporárias ou pequenas, por exemplo, sistemas de tratamento de água servida versáteis, altamente eficazes, de volume alto, portáteis.
Os processos de tratamento de resíduo da invenção podem incluir o uso de qualquer combinação de outras enzimas tais como outra celulase, por exemplo, enzimas de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase, catalases, lacases, outras celulases, endoglicosidases, endo-beta-1,4-lacases, amiloglicosidases, outras glicosidases, isomerases de glicose, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-1acases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, glicoamilases, pectinases, reductases, oxidases, descarboxilases, fenoloxidases, ligninases, pululanases, fitases, arabinanases, hemicelulases, mananases, xilolacases, xilanases, estearases de acetila de pectina, estearases de acetila de ramnogalacturonana, proteases, peptidases, proteinases, poligalacturonases,
ramnogalacturonases, galactanases, liases de pectina, transglutaminases, metilesterases de pectina, outras celobioidrolases e/ou transglutaminases.
Composições detergentes
A invenção prove composições detergentes compreendendo um ou mais polipeptídeos da invenção (por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase) e métodos de produção e uso destas composições. A invenção incorpora todos os métodos de produção e uso de composições detergentes, ver, por exemplo, as patentes U.S. nes 6,413.928; 6.399.561; 6.365.561; 6.380.147. As composições detergentes podem ser uma e duas partes de composição aquosa, uma composição líquida não aquosa, um sólido um sólido fundido, uma forma granular, uma forma em partículas, um comprimido comprimido, um gel e/ou uma pasta e uma forma de pasta. A invenção também prove métodos capazes de uma remoção rápida de sujeiras de alimentos grossas, películas de resíduo de alimento e outras composições alimentíciassecundárias usando-se estas composições detergentes. Enzimas da invenção podem facilitar a remoção de manchas de amido por meio de hidrólise catalística do polissacarídeo de amido. Enzimas da invenção podem ser usadas em detergentes de máquina de lavar louça em detergentes de lavanderia de têxtil.
O teor de enzima ativa real depende do método da fabricação de uma composição de detergente e não é crítica, assumindo que a solução de detergente tem a atividade enzimática desejada. Em um aspecto, a quantidade de glicosidase presente na solução final varia de cerca de 0,001mg a 0,5 mg por grama da composição de detergente. A enzima particular escolhida para o uso no processo e produtos desta invenção depende das condições de ultilidade final, incluindo da forma de produto física, do pH de uso, da temperatura de uso, e dos tipos de sujeira a serem degradados ou alterados. A enzima pode ser escolhida para prover ótima atividade e estabilidade para um dado conjunto de condições de utilidade. Em um aspecto, os polipeptídeos da presente invenção são ativos nas faixa de pH de desde cerca de 4 a cerca de 12 e em uma faixa de temperatura de desde cerca de 20°C a cerca de 95°C. Os detergentes da invenção podem compreender tensoativos catiônico, não iônicos semipolares ou zwitteriônicos; ou, suas misturas.
Enzimas da presente invenção (por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase) podem ser formuladas em detergentes em pó e líquidos tendo pH entre 4,0 e 12,0 a níveis de cerca de 0,01 a cerca de 5% (de preferência de 0,1% a 0,5%) em peso. Estas composições detergentes podem também incluir outras enzimas tais como proteases, celulases, lipases ou endoglicosidases conhecidas, bem como builders e estabilizadores. A adição de enzimas da invenção a composições de limpeza convencionais não cria qualquer limitação de uso especial. Em outraspalavras, qualquer temperatura e pH adequado para o detergente é também adequado para as presentes composições contanto que o pH esteja dentro da faixa acima, e a temperatura está abaixo da temperatura de desnaturaçãoda enzima descrita. Além disso, os polipeptídeos da invenção podem ser usados em uma composição de limpeza sem detergentes, novamente ou sozinhos ou em combinação com builders e estabilizadores.
A presente invenção prove composições de limpeza incluindo composições detergentes para a limpeza de superfícies duras, composições detergentes para a limpeza de tecidos, composições de lavagem de louça, composições de limpeza oral, composições de limpeza de dentadura, e soluções de limpeza de lente de contato.
Em um aspecto, a invenção prove um método para a lavagem
de um objeto compreendendo o contato do objeto com um polipeptídeo da invenção sob condições suficientes para a lavagem. Um polipeptídeo da invenção pode ser incluído como um aditivo detergente. A composição de detergente da invenção pode, por exemplo, ser formulada como uma composição de detergente de roupa para lavar na máquina ou manual
compreendendo um polipeptídeo da invenção. Um aditivo de lavanderia adequado para o pré-tratamento de tecidos manchados podem compreender um polipeptídeo da invenção. Uma composição amaciante de tecido pode compreender um polipeptídeo da invenção. Alternativamente, um polipeptídeo da invenção pode ser formulado como uma composição de
detergente para o uso em operações de limpeza de superfície dura dosméticas gerais. Em aspectos alternativos, aditivos de detergentes e composições detergentes da invenção podem compreender uma ou mais outras enzimas tais como uma protease, uma lipase, uma cutinase, uma outra glicosidase, uma carboidrase, uma outro celulase, uma pectinase, uma
mananase, uma arabinase, uma galactanase, uma xilanase, uma oxidase, por exemplo, uma lactase, e/ou uma peroxidase. As propriedades da(s) enzima(s) da invenção são ecolhidas como sendo compatíveis com o detergente selecionado (isto é, ótimo pH, compatibilidade com outros ingredientes enzimáticos e não enzimáticos, etc.) e a(s) enzima(s) está(ão)
presentes em quantidades eficazes. Em um aspecto, enzimas da invenção são usadas para remover materiais de malcheiro a partir de tecidos. Várias composições detergentes e métodos para produção delas que podem serusados na prática da invenção são descritos nas, por exemplo, patentes U.S. nes 6.333.301; 6.329.333; 6.326.341; 6.297.038; 6.309.871; 6.204.232; 6.197.070;5.856.164.
Os detergentes e processos relacionados da invenção podem também incluir o uso de qualquer combinação de outras enzimas tais como triptofanases ou descarboxilases de tirosina, lacases, catalases, lacases, outras celulases, endoglicosidases, endo-beta-1,4-lacases, amiloglicosidases, outras glicosidases, isomerases de glicose, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-1acases,
endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, glicoamilases, pectinases, reductases, oxidases, descarboxilases, fenoloxidases, ligninases, pululanases, arabinanases, hemicelulases, mananases, xilolacases, xilanases, estearases de acetila de pectina, estearases de acetila de ramnogalacturonana, proteases, peptidases, proteinases,
poligalacturonases, ramnogalacturonases, galactanases, liases de pectina, transglutaminases, metilesterases de pectina, outras celobioidrolases e/ou transglutaminases.
Tratamento de tecidos e têxteis
A invenção prove métodos de tratamento de tecidos e têxteis usando-se um ou mais polipeptídeos da invenção, por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. Os polipeptídeos da invenção podem ser usados em qualquer método de tratamento de tecido, que são bem-conhecidos na técnica, ver, por exemplo, a patente U.S. ns 6.077.316. Por exemplo, em um 25 aspecto, a sensação e aparência de um tecido é aperfeiçoada por um método compreendendo o contato da tecido com uma enzima da invenção em uma solução. Em um aspecto, o tecido é tratado com a solução sob pressão.
Em um aspecto, as enzimas da invenção são aplicadas durante ou depois da tecelagem de têxteis, ou durante o estágio de desengomamento, ou uma ou mais etapas de processamento de tecido adicionais. Durante a tecelagem de têxteis, os filamentos são expostos aesforço mecânico considerável. Antes da tecelagem nos teares mecânicos, filamentos de urdidura são freqüentemente revestidos com amido de engomação ou derivados de amido a fim de aumentar sua resistência à tração e para prevenir rompimento. As enzimas da invenção podem ser aplicadas para remover estes derivados de amido ou amido de desengomamento. Depois que os têxteis foram tecidos, um tecido pode prosseguir para um estágio de desengomamento. Isto pode ser seguido por uma ou mais etapas de processamento de tecido adicionais. Desengomamento é a ação de remoção de goma de têxteis. Depois de tecelagem, o revestimento de goma pode ser removido antes de outro processamento o tecido a fim de se assegurar um resultado homogêneo e impermeável à lavagem. A invenção prove um método de desengomamento compreendendo hidrolise enzimática da goma pela ação de uma enzima da invenção.
As enzimas da invenção (por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase) podem ser usadas para desengomar tecidos, incluindo tecidos contendo algodão, como aditivos de detergente, por exemplo, em composições aquosas. A invenção prove métodos para a produção de uma aparência de lavado na pedra sobre roupas de baixo e tecido de denim tingido com índigo. Para a fabricação de roupas, o tecido pode ser cortado e costurado para formar roupas ou roupas de baixo, que é posteriormente acabado. Em particular, para a fabricação de jeans denim, métodos de acabamento enzimático diferentes foram desenvolvidas. O acabamento de roupas de baixo de denim normalmente é iniciado com uma etapa de desengomamento enzimático, durante que roupas de baixo são submetidas à ação de enzimas amilolíticas a fim de prover maciez ao tecido e produzir o algodão mais acessível às etapas de acabamento enzimáticas subseqüentes. A invenção prove métodos de acabamento de roupas de baixo de denim (por exemplo, um processo "bioapedrejamento"), desengomamento enzimático e provisão de maciez a tecidos usando-se as enzimas da invenção. A invenção prove métodos para rapidamente amaciarroupas de baixo de denim em um processo de desengomamento e/ou de acabamento.
A invenção também prove desinfectantes compreendendo enzimas da invenção (por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase).
Os processos de tratamento de tecido ou têxtil da invenção podem também incluir o uso de qualquer combinação de outras enzimas tais como triptofanases ou descarboxilases de tirosina, lacases, catalases, lacases, outras celulases, endoglicosidases, endo-beta-1,4-lacases, amiloglicosidases, outras glicosidases, isomerases de glicose, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-1acases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, glicoamilases, pectinases, reductases, oxidases, descarboxilases, fenoloxidases, ligninases, pululanases, arabinanases, hemicelulases, mananases, xilolacases, xilanases, estearases de acetila de pectina, estearases de acetila de ramnogalacturonana, proteases, peptidases, proteinases, poligalacturonases, ramnogalacturonases, galactanases, liases de pectina, transglutaminases, metilesterases de pectina, outras celobioidrolases e/ou transglutaminases.
Tratamento de polpa e papel
As enzimas da invenção (por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase) podem estar no tratamento de polpa e de papel ou descoloração de papel. Por exemplo, em um aspecto, a invenção prove um um processo de tratamento de papel usando-se enzimas da invenção. Em um aspecto, as enzimas da invenção podem ser usadas para modificar amido no papel desse modo convertendo-o em uma forma liqüefeita. Em um outro aspecto, componentes de papel de papel fotocopiados reciclados durante processos de descoloração químicos e enzimáticos. Em um aspecto, Enzimas da invenção podem ser usados em combinação com outras enzimas, incluindo outras celulases (incluindo outras endoglucanases, celobioidrolases e/ou betaglicosidases). Uma madeira, papel, produto depapel ou polpa pode ser tratado pelos seguintes três processos: 1) desintegração na presença de uma enzima da invenção, 2) desintegração com a descoloração química e uma enzima da invenção, e/ou 3) disintegração depois de encharcamento com uma enzima da invenção. O papel reciclado tratado com uma enzima da invenção pode ter um brilho superior devido a remoção de partículas de toner quando comparado com o papel tratado com exatamente celulase. Embora a invenção não seja limitada por qualquer mecanismo particular, o efeito de uma enzima da invenção pode ser devido a seu comportamento como agentes tensoativos em suspensão de polpa.
A invenção prove métodos de tratamento de papel e polpa de papel usando-se um ou mais polipeptídeos da invenção. Os polipeptídeos dã invenção podem ser usados em qualquer tratamento de papel ou polpa do método, que são bem-conhecidos na técnica, ver, por exemplo, as patentes U.S. n9 6.241.849; 6.066.233; 5.582.681. Por exemplo, em um aspecto, a invenção prove um método para a descoloração e descoloração de um papel impresso contendo um corante, compreendendo transconstrução em polpa um papel impresso para se obter uma pasta de polpa, e expulsando uma tinta da pasta de polpa na presença de uma enzima da invenção (outras enzimas podem também ser adicionadas). Em um outro aspecto, a invenção prove um método para o aumento da liberalidade de polpa, por exemplo, polpa produzida a partir de fibra secundária, por adição de uma mistura enzimática compreendendo uma enzima da invenção (pode também incluir outras enzimas, por exemplo, enzimas de pectinase) à polpa e tratamento de sob condições de causar uma reação para produzir uma polpa enzimaticamente tratada. A liberalidade da polpa enzimaticamente tratada é aumentada da liberalidade inicial de polpa de fibra secundária sem um perda em bilho.
Os processos de reciclagem ou tratamento de papel, madeira 30 ou polpa da invenção podem também incluir o uso de qualquer combinação de outras enzimas tais como triptofanases ou descarboxilases de tirosina, lacases, catalases, lacases, outras celulases, endoglicosidases, endo-beta-1,4-lacases, amiloglicosidases, outras glicosidases, isomerases de glicose, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-1acases, endo-beta- l,3(4)-lacases, cutinases, peroxidases, amilases, gíicoamilases, pectinases, reductases, oxidases, descarboxilases, fenoloxidases, 5 ligninases, pululanases, arabinanases, hemicelulases, mananases, xilolacases, xilanases, estearases de acetila de pectina, estearases de acetila de ramnogalacturonana, proteases, peptidases, proteinases, poligalacturonases, ramnogalacturonases, galactanases, liases de pectina, transglutaminases, metilesterases de pectina, outras celobioidrolases e/ou 10 transglutaminases.
Retransconstrução em polpa: tratamento de materiais lignocelulósicos
A invenção também prove um método para o tratamento de fibras lignocelulósicas, em que as fibers são tratadas com um polipeptídeo
da invenção (por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase), em uma quantidade que é eficaz para o aperfeiçoamento das propriedades de fibra. As enzimas da invenção podem também ser usadas na produção ou reciclagem de materiais lignocelulósicos tais como polpa, papel e papelão, a
partir de papel e papelão de resíduo reforçado com amido, especialmente onde retransconstrução em polpa ou reciclagem ocorre a pH acima de 7 e onde as enzimas da invenção podem facilitar a desintegração do material de resíduo através da degradação do reforço de amido. As enzimas da invenção podem ser úteis em um processo para a produção de um polpa de
construção em papal a partir de papel impresso revestido com amido. O processo pode ser realizado como descrito na, por exemplo, WO 95/14807. Um processo exemplar compreende desintegração do papel para produzir uma polpa, tratamento de com uma enzima de degradação de amido antes, durante ou depois da desintegração, e separação de partículas de tinta da
polpa depois da desintegração e tratamento de enzima. Ver também a patente U.S. ne 6.309.871 e outras patentes US citadas aqui. Assim, a invenção inclui um método para a descoloração enzimática de polpa depapel reciclada, em que o polipeptídeo é aplicado em uma quantidade que é eficaz para descoloração eficaz da superfície de fibra. Preparação fermentada e fermentação
A invenção prove métodos de preparação fermentada de cerveja (por exemplo, fermentação) compreendendo uma enzima da invenção, por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. Em um processo exemplar, matérias primas contendo amido são desintegradas e são processadas para formar um malte. Uma enzima da invenção é usada em qualquer ponto no processo de fermentação. Por exemplo, enzimas da invenção podem ser usadas no processoamento de malte de cevada. A principal matéria-prima da preparação fermentada de cerveja é o malte de cevada. Este pode ser um processo de três estágios. Em primeiro lugar, o grão de cevada pode ser macerado para aumentar o teor de água, por exemplo, por volta de cerca de 40%. Em segundo lugar, o grão pode ser germinado por incubação a 15-25°C por 3 a 6 dias quando síntese de enzima é estimulada sob o controle de giberelinas. Durante este tempo níveis de enzima aumentam significativamente. Em um aspecto, enzimas da invenção são adicionadas neste (ou qualquer outro) estágio do processo. Aação da enzima resulta em um amento em açúcares de redução fermentáveis. Isto pode ser expresso como o poder diastático, DP, que pode se originar por volta de 80 a 190 em 5 dias a 12°C.
Enzimas da invenção podem ser usadas em qualquer processo de produção de cerveja, como descrito, por exemplo, nas patentes U.S. n9s 5.762.991; 5.536.650; 5.405.624; 5.021.246; 4.788.066.
Aumento do fluxo de fluidos de produção de construção
subterrânea
A invenção também inclui um método usando-se uma enzima da invenção (por exemplo, enzimas tendo atividade de celulase, endoglucanase, celobioidrolase, mananase e/ou betaglicosidase), em que o método aumenta o fluxo de fluidos de produção de uma construção subterrânea por remoção de fluidos prejudiciais, contendo amido, viscososformados durante as operações de produção; estes fluidos podem ser encontrados dentro da construção subterrânea que envolve uma completa perfuração de poço. Assim, este método da invenção resulta na produção de fluidos sendo capazes de fluir da perfuração de poço. Este método da invenção também leva em conta o problema de fluidos prejudicais reduzindo a fluxo de fluidos de produção de uma construção abaixo das taxas de fluxo esperadas. Em um aspecto, a invenção prove formulação de um tratamento com enzima (usando-se uma enzima da invenção) por combinar entre si de um fluido aquoso e um polipeptídeo da invenção; bombear o tratamento com
enzima para uma localização desejada dentro da perfuração de poço; permitir um tratamento com enzima para degradar o fluido prejudicial, contendo amido, viscoso, desse modo o fluido pode ser removido da construção subterrânea para a superfície de poço; e em que um tratamento com enzima é eficaz para atacar as ligações alfa glucosídicas no fluido
contendo amido.
Os processos de tratamento com enzima de construção subterrânea da invenção podem também incluir o uso de qualquer combinação de outras enzimas tais como triptofanases ou descarboxilases de tirosina, lacases, catalases, lacases, outras celulases, endoglicosidases,
endo- beta-1,4-lacases, amiloglicosidases, outras glicosidases, isomerases de glicose, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, glicoamilases, pectinases, reductases, oxidases, descarboxilases, fenoloxidases, ligninases, pululanases, arabinanases, hemicelulases,
mananases, xilolacases, xilanases, estearases de acetila de pectina, estearases de acetila de ramnogalacturonana, proteases, peptidases, proteinases, poligalacturonases, ramnogalacturonases, galactanases, liases de pectina, transglutaminases, metilesterases de pectina, outras celobioidrolases e/ou transglutaminases.
Composições farmacêuticas e suplementos de dieta
A invenção também prove composições farmacêuticas e suplementos de dieta (por exemplo, auxiliares de dieta) compreendendouma celulase da invenção (por exemplo, enzimas tendo atividade de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase). A atividade de celulase compreende atividade de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase. Em um aspecto, as composições farmacêuticas e suplementos de dieta (por exemplo, auxiliares de dieta) são formulados para a ingestão oral, por exemplo, para aperfeiçoar a digestibilidade de alimentos e rações tendo componente lingocelulósico ou de alto teor de celulose.
Compostos de tratamento periodontais podem compreender
uma enzima da invenção, por exemplo, como descrita na patente U.S. ne 6.776.979. Composições e métodos para o tratamento ou profilaxia de síndrome de intestino ácido podem compreender uma enzima da invenção, por exemplo, como descrita na patente U.S. nQ 6.468.964.
Em um outro aspecto, curativos de ferimento, implantes e
similares compreendem enzimas antimicrobianas (por exemplo, ação de antibiótico), incluindo uma enzima da invenção (incluindo, por exemplo, seqüências exemplares da invenção). Enzimas da invenção podem também ser usadas em curativos com alginato, curativos com barreira antimicrobiana, curativos de queimadura, bandagens de compressão,
ferramentas de dsagnósticos, curativos de gel, curativos hidrosseletivos, curativos hidrocelular (espuma), curativos hidrocolóides, curativos de LV, campos cirúrgicos de incisão, curativos de baixa aderência, curativos de absorção de odor, bandagens com pasta, curativos pós-operatório, controle de escara, cuidado de pele, curativos com película transparente e/ou
fechamento de ferida. Enzimas da invenção podem ser usados em limpeza de ferimento, preparação de leito de ferido, para tratar pressure úlceras, úlceras na perna, queimaduras, úlceras no pé diabético, escaras, fixação IV, ferimentos cirúrgicos e ferimentos secundários. Enzimas da invenção podem ser usadas para composições de desbridamento enzimaticas, por exemplo,
pomadas. Em vários aspectos, a celulase é formulada como um comprimido, gel, pílula, implante, líquido, spray, pó, alimento, pélete de ração ou como uma formulação encapsulada.Aplicações de biodefesa
Em outros aspectos, celulases da invenção (por exemplo, enzimas tendo atividade de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase) podem ser usadas na biodefesa (por exemplo, destruição
' de esporos ou bactérias compreendendo um material lignocelulósico). Uso de celulases da invenção nas aplicações de biodefesa oferecem um benefício significativo, pelo fato de quel elas podem ser muito rapidamente desenvolvidas contra quaisquer agentes atualmente desconhecidos ou de guerra biológica do futuro. Além disso, celulases da invenção podem ser
usadas para descontaminação de ambientes infectados. Em aspecto, a invenção prove um agente de biodefesa ou bio-destoxificação compreendendo um polipeptídeo tendo uma atividade de celulase, em que o polipeptídeo compreende uma seqüência da invenção (incluindo, por exemplo, seqüências da invenção exemplares), ou um polipeptídeo
codificado por um ácido nucléico da invenção (incluindo, por exemplo, seqüências exemplares da invenção), em que opcionalmente o polipeptídeo tem atividade compreendendo atividade de endoglucanase, celobioidrolase, mananase e/ou betaglicosidase.
Lista de referência
1. Sambrook, J. and Russell, D.W. 2001. Molecular Cloning: A
Laboratory Manual. Third Edition. Cold Spring Harbor Laboratory Press, New York.
2. Benhar, I. Biotechnological applications of phage and cell display. Biotechnology Advances 19, 1-13. 2001. 3. Coutinho, P. M. and Henrissat, B. Carbohydrate-Active
Enzymes server at URL: http://afrnb.cnrs-mrs.rr/~cazy/CAZY/index.html. 1999.
4. Felix, C. R. and L. G. Ljungdahl. 1993. The cellulosome: the exocelmlar organelle of Clostridium. Annu. Rev. Microbiol 47:791 -819.:791-
819.
5. Gray, K. A., T. H. Richardson, K. Kretz, J. M. Short, F. Bartnek, Knowles R., L. Kan, Swanson P.E., and Robertson D.E. 2001.Rapid evolution of reversible denaturation and elevated meiting temperature in a microbial haloalkane dehalogenase. Advanced Synthesis and Catalysis 343:607-617.
6. Guttman, A., F. T. Chen, R. A. Evangelista, and N. Cooke. 1996. High-resolution capillary gel electrophoresis of reducing oligosaccharides labeled with 1-aminopyrene-3,6,8-trissulfonate. Anal. Biochem 233:234-242.
7. Harjunpaa, V., A. Teleman, A. Koivula, L. Ruohonen, T. T. Teeri, O. Teleman, and T. Drakenberg. 1996. Cello-oligosaccharide hydrolysis by cellobiohydrolase II from Trichoderma reesei. Association and rate constants derived from an analysis of progress curves. Eur. J Biochem 240:584-591.
8. Himmel, M. E., M. F. Ruth, and C. E. Wyman. 1999. CelMase for commodity products from cellulosic biomass. Curr. Opin. Biotechnol 10:358-364.
9. Kerr, R. A. 1998. GEOLOGY:The Next Oil Crisis Looms Large-and Perhaps Close. Science 281 : 1128.
10. Kerr, R. A. 2000. OIL OUTLOOK:USGS Optimistic on World Oil Prospects. Science 289:237.
11. King, R. W., K. D. Lustig, P. T. Stukenberg, T. J. McGarry,
and M. W. Kirschner. 1997. Expression cloning in the test tube. Science 277:973-974.
12. Kuritz, T. 1999. An easy colorimetric assay for screening and qualitative assessment of deiodination and dehalogenation by bacterial cultures. Lett. Appl Microbiol 28:445-447.
13. Lundberg, K. S., P. L Kretz, G. S. Provost, and J. M. Short. 1993. The use of selection in recovery of transgenic targets for mutation analysis. Mutat. Res. 301 :99- 105.
14. MacKenzie, L. F., G. Sulzenbacher, C. Divne, T. A. Jones, H. F. Woldike, M. Schulein, S. G. Withers, and G. J. Davies. 1998. Crystal
structure of the family 7 endoglucanase I (Cel7B) from Humicola insolens at 2.2 A resolution and identification of the catalytic nucleophile by trapping ofthe covalent glycosyl-enzyme intermediate. Biochem J 335:409-416.
15. Richardson, T. H., X. Tan, G. Frey, W. Callen, M. Cabell, D. Lam, J. Macomber, J. M. Short, D. E. Robertson, and C. Miller. 2002. A novel, high performance enzyme for starch liquefaction. Discovery and
optimization of a low pH, thermostable alpha-amylase. J Biol Chem 277:26501-26507.
16. Sakon, J., D. Irwin, D. B. Wilson, and P. A. Karplus. 1997. Structure and mechanism of endo/exocellulase E4 from Thermomonospora fusca. Nat. Struct. Biol 4:810-818.
17. Short, J. M., J. M. Fernandez, J. A. Sorge, and W. D. Huse.
1988. Lambda ZAP: a bacteriophage lambda expression vector with in vivo excision properties. Nucleic Acids Res. 16:7583-7600.
18. Snustad, D. P., J. P. Hunsperger, B. M. Chereskin, and J. Messing. 1988. Maize glutamine synthetase cDNAs: isolation by direct
genetic selection in Escherichia coli. Genetics 120: 1111 -1123.
19. Varrot, A., S. Hastrup, M. Schulein, and G. J. Davies. 1999. Crystal structure of the catalytic core domain of the family 6 cellobiohydrolase II, Cel6A, from Humicola insolens, at 1.92 A resolution. Biochem J 337:297-304.
20. Yano, T., S. Oue, and H. Kagamiyama. 1998. Directed
evolution of an aspartate aminotransferase with new substrate specificities. Proc. Natl. Acad. Sei U. S. A 95:5511 -5515.
21. Zverlov, V. V., G. A. Velikodvorskaya, and W. H. Schwarz. 2002. A newly described cellulosomal cellobiohydrolase, CelO, from Clostridium thermocellum: investigation of the exo-mode of hydrolysis, and binding capacity to crystalline cellulose. Microbiology 148:247-255.
Os seguintes exemplo são oferecidos para ilustrar, mas não limitar a invenção reivindicada. EXEMPLOS
Exemplo 1: Triagem de GIGAMATRIX®
Em um aspecto, os métodos da invenção usam plataforma Diversa Corporation's proprietary GIGAMATRIX®; ver publicação de patentePCT n9 WO 01/38583; o pedido de patente U.S. ns 20050046833; 20020080350; a patente U.S. ne 6,918,738; Patente n9 D480,814 de projeto. Por exemplo, em um aspecto, GIGAMATRIX® é usado em métodos para determinar se um polipeptídeo tiver atividade de celulase e está dentro do 5 escopo da invenção, ou, para identificar e isolar um polipeptídeo tendo atividade de celulase.
Uma plataforma GIGAMATRIX® pode incluir uma triagem de quantidade produzida ultra-alta com base em uma microplaca de 100.000 cavidades com as dimensões de uma placa de 96 cavidades convencionais.
Neste exemplo, a triagem de GIGAMATRIX® foi implementada usando-se 2 substratos com base em atividade anteriormente mostrada por CBHs. Metil-umbeliferil celobiosídeo (MUC) e metilumbeliferil lactosídeo (MUL) foram testados. Versões de fagemídeo dos clones diferentes foram triados uma vez que o substrato se difunde em células e fluorescência foi pensada ser
mais facilmente detectável. Uma cela hospedeira carecendo de, beta-galactosidase foi usada a fim de diminuir atividade no substrato de lactosídeo. O substrato de lactosídeo resultou em ataques menores e foi considerado mais específico do que o substrato de celobiose. Além disso, o substrato de lactosídeo resultou em ataques de betaglicosidase menores. A
fim de testar a possiblidade de uso destes substratos em uma triagem, 14 bibliotecas foram escolhidas para a triagem com base no fato de que estas bibliotecas forneceram ataques de endoglucanase de um programa de triagem anterior. Das bibliotecas tríadas, havia um total de 50 ataques primários de 11 das bibliotecas tríadas. Triagem secundária consistia de
laminação dos clones sobre placas ágar e então a captação da colônia em placas de 384 cavidades contendo meios e MUL. Clones ativos contra MUL são diferenciados de uma base de clones inativos. Clones individuais foram então desenvolvidos da noite para o dia e fluorescência foi medida and os ataques mais ativos foram selecionados para a seqüenciação. Insertos de
clone genômico de AU oriundos de ataques foram seqüenciados. Em geral, os ataques eram oriundos de várias famílias de hidrolase de glicosila diferentes incluindo 1, 2, 5, 6, 10 e 16. Vários outros ataques foramrevelados onde o quadro de leitura aberto não era homólogo a quaisquer famílias de hidrolase de glicosila conhecidas. Além disso, alguns dos ataques codificaram genes de cicloidrolase de GTP.
Tabela 1 .Sumário de ataques de GIGAMATRIX®
<table>table see original document page 257</column></row><table><table>table see original document page 258</column></row><table><table>table see original document page 259</column></row><table>Abreviações: CBM - módulo de ligação de carboidrato
Atividade de substrato de enzima de caracterização
Os 39 ataques (ver a Tabela 1, acima) revelados na triagem GIGAMATRIX® foram primeiramente triados contra celoexaose para determinar o padrão de ação em um oligômero de celulose. Clones genômicos são definidos como clones que têm um inserto de DNA total potencialmente contendo múltiplos quadros de leitura abertos. Por exemplo, na Tabela 1, acima, um tal cone genômico contém dois quadros de leitura abertos anotados como Enzimas n9 22 e 22a, com os ditos quadros de
leitura abertos tendo as seqüências como mostradas na SEQ ID NO:37 e SEQ ID NO:35, respectivamente. Um outro tal clone genômico contém três quadros de leitura abertos, que são anotados como Enzimas 27, 27a e 27b. Subclones são derivados de clones genômicos e podem conter apenas um único quadro de leitura aberto. Clones genômicos foram desenvolvidos da
noite para o dia em meio de TB contendo antibiótico, células foram lisadas e lisados foram clarificados por centrifugação. Subclones são desenvolvidos para um OD600=0,5 induzidos com um indutor apropriado e então desenvolvidos por um adicional de 3 h antes da lise das células eclarificação do lisado. Clones genômicos em geral terão menos atividade do que um subclone, mas são um meio mais fácil de avaliar atividade em uma grande faixa de clones. Estudos iniciais foram realizados usando-se cromatografia de camada fina (TLC) para reações de ponto final usualmente transcorreram por 24 h. Enzimas foram também testadas sobre celulose inchada com ácido fosfórico (PASC), que é celulose cristalina que é produzida mais amorfa através do inchamento por tratamento com ácido. Numerosas celulases que foram clonadas para formar bibliotecas ambientais eram ativas contra PASC, mas celobiose liberada bem como celtriose e/ou glicose, os clones genômicos oriundos da esforço de revelação GIGAMATRIX® foram também testados contra PASC e sobre substratos celulósicos tal como celoexaose (Seikagaku, Japão). Experiências de cromatografia de camada fina (TLC) mostravam que vários clones genômicos eram capazes de hidrolisar a celoexaose, como ilustrada nas figuras 6 e 7. Destes clones, muitos eram capazes de gerar glicose como o produto final que é consistente com o fato de que eles têm identidade de seqüência a família 1 de hidrolase de glicosila, que inclui betaglicosidases. Vários enzimas produzidas de celobiose e/ou fragmentos maiores, mas a natureza exata do padrão de produto poderia ser perceptível das experiências de TLC, assim um método de eletroforese de capilar (CE) foi desenvolvido.
Exemplo 2: Eletroforese de capilar
Em alguns aspectos, Eletroforese de capilar (CE) é usada em ensaios para triar quanto a atividade de enzima, por exemplo, CE é usada em métodos para determinar se um polipeptídeo tiver atividade de celulase e está dentro do escopo da invenção, ou, para identificar e isolar um polipeptídeo tendo atividade de celulase. Eletroforese de capilar (CE) oferece a vantagem de tempo de passagem mais rápido e sensibilidade de ensaio maior. O método de CE usado l-aminopireno-3,6,8- trissulfonato (APTS) como o fluoroforo e foi otimizado para o uso com açúcares e oligômeros de açúcar (Guttman (1996). Eletroforese de gel de capilar de alta resolução de redução de oligossacarídeos marcados com l-aminopireno-3,6,8-trissulfonato. Anal. Biochem 233:234- 242). Enzimas que demonstraram ser ativas sobre celoexaose foram submetidas a testes sobre celulose inchada com ácido fosfórico bem como celoexaose. Genes foram subclonados, foram expressos e foram parcialmente purificados usando-se
uma coluna de quelação de níquel. Enzimas foram incubadas com substrato por 1 h e os produtos foram analisados usando-se um capilar de 10 cm ou de 48 cm. Celoexaose elui a 2 e 9 minutos para os capilares de 10 e 48 cm respectivamente. O capilar de 48 cm dá melhor separação de produtos no caso há quantidades baixas de açúcar ou se houver contaminantes na
mistura. O método de CE foi implementado para estudos nas enzimas da revelação GIGAMATRIX® que mostrou boa atividade na celoexaose com detecção de TLC. Enzima 22/22a (ver a Tabela, 1 acima) mostrou bom desempenho no PASC (dados sumarizados na forma de gráfico na Figura 8), liberando principalmente celobiose. Além disso, enzima 22/22a era capaz
de liberar celobiose de Celulose Microcristalina (MCC) AVICEL® (FMC Corporation, Philadelphia, PA) (dados sumarizados na forma de gráfico na Figura 9). Análise de seqüência mostrava que enzima 22 e enzima 21 são -92% idênticas e pertencem a família 5 de hidrolase de glicosila. Família 5 contém principalmente endoglucanases, mas são exemplos de
celobioidrolases. CelO oriunda de Clostridium thermocellum foi caracterizada como uma celobioidrolase com base na atividade na liberação de apenas celobiose de celulose amórfica e cristalina (Zverlov (2002). Uma nova celobioidrolase celulossomal, CelO, oriunda de Clostridium thermocellum: investigação do exo-modo de hidrólise e capacidade de ligação a celulose
cristalina. Microbiology 148:247-255).
Todas as três destas, quando comparadas com a endoglucanase oriunda Acidothermus cellulolyticus têm uma inserção que está em proximidade próxima ao sítio de ligação de substrato. Esta inserção poderia formar um laço que encerra o sítio de ligação de substrato assim a
conversão desta enzima de uma endoglucanase e uma celobioidrolase. Quando essas enzimas foram testadas na celoexaose elas produziam principalmente celobiose com uma quantidade menor de celotriose. Estesresultados são explicados pelo fato de que celobioidolases têm a capacidade de produzir tanto celobiose quanto celotriose a partir de um substrato de celoexaose (Harjunpaa (1996) hidrólise de Celo-oligossacarídeo por celobioidrolase II de Trichoderma reesei. Associação e taxas constantes 5 derivadas de uma análise de curvas de progresso. Eur. J Biochem 240:584-591).
Exemplo 3: Revelação baseada na seqüência A invenção prove métodos para a identificação e isolamento de celulases, por exemplo, celobioidrolases, usando-se seqüências da
invenção. Em um método exemplar, iniciadores que foram homólogos a regiões conservadas de três famílias de hidrolase de glicosila que contêm celobioidrolases foram usadas para triar ou bibliotecas de polinucleotídeo ou DNA derivados de amostras fúngicas. Iniciadores foram projetados em relação a 48 regiões conservadas de família e 96 bibliotecas foram tríadas
resultando no 1 ataque cofirmado. Além disso, iniciadores foram pojetados em relação à família 6 e família 7. Bibliotecas fúngicas foram tríadas com esses iniciadores, resultando em 1 ataque para a família 6 e 56 ataques para a família 7. Um dos ataques da família 7 foi escolhido para estudos para extrair a seqüência de comprimento total. A seqüência de comprimento total
foi obtida com sucesso e foi mostrada 73% de identidade a exo-celobioidrolase I de Penicilliiim janthinellum.
Exemplo 4: Engenheiramento genético de uma enzima com atividade celobioidrolase
Este exemplo descrevia o engenheiramento genético de uma
enzima exemplar da invenção. Esta enzima pode ser usada na conversão de biomassa em combustíveis e produtos químicos, e para a produção de alternativos eficazes e sustentáveis para produtos à base de petróleo. Esta enzima pode ser expressa em organismos (por exemplo, microorganismos, tais como bactérias) para a sua participação em ciclos químicos que
envolvem conversão de biomassa natural. Em um aspecto, esta enzima é usada em "conjuntos de enzima" para a despolarização eficiente de polímero celulósicos e hemicelulósicos para metabolizar porções de carbono. Comodiscutido acima, a invenção prove métodos para a revelação e implementação da maioria de enzimas eficazes para permitir esses processos industriais de energia alternativa e "conversão de biomassa".
Usando-se revelação metagenômica e um método não
estocástico de evolução dirigida (chamada "DIRECTEVOLUTION®, como descrito, por exemplo, na patente U.S. n9 6.939.689, que inclui Mutagênes de saturação de sítio de gene (GSSM) (como discutido acima, ver também as patentes U.S. nes 6.171.820 e 6.579.258) e tecnologias de Tunable GeneReassembly (TGR) (ver, por exemplo, a patente U.S. nQ 6.537.776).
Este esforço focalizou a revelação e otimização de um componente de enzima importante para redução de celulose a glicose, celobioidrolase.
Uma triagem de revelação de enzima foi implementada usando-se plataforma de triagem de expressão de alta quantidade produzida Diversa Corporation's GIGAMATRIX® (discutido acima) para identificar
celobioidrolases usando-se metilumbeliferil celobiosídeo como substrato. Um total de 100 bibliotecas ambientais complexas foram tríadas resultando em 25 ataques de celobioidrolase confirmadas principalmente de famílias 5 e 10 de hidrolase de glicosila. Estes ataques foram caracterizados para a atividade contra Microcelulose cristalina (MCC) AVICEL® (FMC Corporation,
Philadelphia, PA). Com base neste desempenho características, uma enzima, SEQ ID NO: 162 (codificada por, por exemplo, SEQ ID NO: 161) foi escolhida como um candidato para a otimização usando-se tecnologia de Mutagênes de saturação de sítio de gene (GSSM). No entanto, antes que a evolução de GSSM fosse realizada, a seqüência de sinal (aminoácidos de 1
até 30) foi removida de SEQ ID NO: 162 e uma metionina de partida foi adicionada. Esta seqüência livre de sinal, aqui em seguida chamado o "tipo selvagem" e representada por SEQ ID NO: 164 (codificada por, por exemplo, SEQ ID NO: 163), era a seqüência de origem que foi otimizada usando-se tecnologia de GSSM. Como discutido acima, tecnologia de GSSM pode
rapidamente transformar todos os aminoácidos na proteína para os 19 outros aminoácidos em uma forma seqüencial. Mutantes foram triados usando-se um ensaio à base de fibra e upmutantes potenciais querepresentam mudanças de aminoácido simples foram identificados. Esses upmutantes foram combinados em uma nova biblioteca que representa combinações dos upmutantes. Esta biblioteca foi triada resultando na identificação de várias enzimas de candidato para comercialização. Sumário de pesquisa triagem GIGAMATRIX®
A plataforma de triagem GIGAMATRIX® (GMx) é um método de ultra-alta quantidade produzida com base em uma microplaca de 100.000 cavidades com as dimensões de uma placa de 96 cavidades convencionais (ver a aplicação de Fase II para detalhes). A triagem trabalha com substratos
fluorescentes. A triagem de GMx screen foi implementada usando-se 2 substratos com base em atividade anteriormente mostrada por celulases. Metilumbeliferil celobiosídeo (MUC) foi usado com um substrato de triagem. Além disso, resorufin-beta-glicopiranosídeo estava também incluído em uma triagem a fim de eliminar clones que têm atividade tanto nos substratos
quanto são presumidos serem betaglicosidases.
Fago ampliado ou versões de fagemídeo das bibliotecas alvo foram triados. Duas cepas hospedeiras (CEH6 & GAL631) que necessitam de genes beta-galactosidase foram usados a fim de diminuir atividade de hospedeiro endógena nos substratos. 100 bibliotecas foram escolhidas para
a triagem com base no fato de que essas bibliotecas forneceram ataques de celulase de um programa de triagem anterior. Das bibliotecas tríadas, havia um total de 355 ataques primários de 69 das bibliotecas tríadas.
Triagem secundária consistia de laminação dos clones sobre placas ágar e então a captação de colônia em placas de 384 cavidades
contendo meios e metilumbeliferil celobiosídeo (MUC) chamados de um "surto". Figura 10 ilustra na forma de gráfico dados que mostram um surto típico GIGAMATRIX® (GMx). Para gerar esses dados, clones ativos contra MUC (isto é, capazes de hidrolisar metilumbeliferil celobiosídeo) são diferenciados de uma base de clones inativos. Clones individuais foram
então desenvolvidos da noite para o dia e fluorescência foi medida e os ataques mais ativos foram selecionados para a seqüenciação. Na Figura 10, o eixo de X mostra o nome da amostra; o eixo Y é unidades fluorescentesrelativas. "Ataques" positivos foram laminados sobre placas de ágar e então a colônia captada em placas de 384 cavidades contendo LB + antibiótico mais 50 fim de MUC e desenvolvida da noite para o dia. Tabela 2. Sumário de ataques GIGAMATRIX® (GMx)
Enzima ns Caracterização de família
Quadro de leitura aberto SEQ IP NO: de clone
40 SEQ ID NO: 104 (codificada por, por exemplo, SEQ
IDNO:103) família 5 (celulase)
41 SEQ ID NO:108 (codificada por, por exemplo, SEQ
IDNO:107) família 5 (celulase)
42 SEQ ID NO:112 (codificada por, por exemplo, SEQ
IDNO:111) família 5 (celulase)
H7 SEQ ID NO:60 (codificada por, por exemplo, SEQ
ID NO:59) família 5 (celulase)
43 SEQ ID NO:82 (codificada por, por exemplo, SEQ
IDNO:81) família 5 (celulase)
44 SEQ ID NO:78 (codificada por, por exemplo, SEQ
ID NO:77) família 5 (celulase)
45 SEQ ID NO:68 (codificada por, por exemplo, SEQ família 5 (celulase)- ORF ID NO:67) 2
45a SEQ ID NO:70 (codificada por, por exemplo, SEQ família 26 (mananase) -
ID NO:69) ORF4
46 SEQ ID NO:74 (codificada por, por exemplo, SEQ
ID NO:73) família 10 (xilanasej
47 SEQ ID NO:110 (codificada por, por exemplo, SEQ
IDNO:109) família 10 (xylanase)
48 SEQ ID NO:106 (codificada por, por exemplo, SEQ
ID NO: 105) família 5 (celulase)
49 SEQ ID NO:66 (codificada por, por exemplo, SEQ
ID NO:65) família 10 (xylanase)
50 SEQ ID NO:72 (codificada por, por exemplo, SEQ
IDNO:71) família 5 (celulase)
51 SEQ ID NO:80 (codificada por, por exemplo, SEQ
ID NO:79) família 5 (celulase)
H8 SEQ ID NO:62 (codificada por, por exemplo, SEQ família 5 (celulase) ORF
IDNO:61) 1
H8a SEQ ID NO:64 (codificada por, por exemplo, SEQ família 5 (celulase) ORF
ID NO:63) 4
52 SEQ ID NO:76 (codificada por, por exemplo, SEQ família 5 (celulase)ID NO:75)
53 SEQ ID NO:160 (codificada por, por exemplo, SEQ IDNO:159) família 10 (xylanase)
54 SEQ ID NO:88 (codificada por, por exemplo, SEQ ID NO:87) família 5 (celulase)
55 SEQ ID NO:148 (codificada por, por exemplo, SEQ ID NO:147) família 10 (xylanase)
56 SEQ ID NO:90 (codificada por, por exemplo, SEQ ID NO:89) família 5 (celulase)
57 SEQ ID NO:152 (codificada por, por exemplo, SEQ IDNO:151) família 5 (celulase)
58 SEQ ID NO:150 (codificada por, por exemplo, SEQ ID NO:149) família 5 (celulase)
59 SEQ ID NO:154 (codificada por, por exemplo, SEQ IDNO:153) família 5 (celulase)
H6 SEQ ID NO:158 (codificada por, por exemplo, SEQ ID NO:157) família 5 (celulase)
60 SEQ ID NO:156 (codificada por, por exemplo, SEQ IDNO:155) família 5 (celulase)
Todos os insertos de clone genômico oriundos de ataques foram seqüenciados. Como com a Tabela 1 acima, alguns clones genômicos continham mais do que um quadro de leitura aberto. Por exemplo, um tal cone genômico contém dois quadros de leitura abertos anotados como Enzimas n9 H8 e H8a, com os ditos quadros de leitura abertos tendo as seqüências como mostradas na SEQ ID NO: 67 e SEQ ID NO: 69, respectivamente. Havia um total de 25 ataques de hidrolase de glicosila de 17 das bibliotecas tríadas. Em geral, os ataques eram oriundos de várias famílias de hidrolase de glicosila diferentes incluindo 5 e 10. A Tabela 2 (acima) lista os ataques e suas identidades. Vários outros ataques foram revelados onde o quadro de leitura aberto não era homólogo a quaisquer famílias de hidrolase de glicosila conhecidas. Além disso, alguns dos ataques codificaram Genes de cicloidrolase de GTP que são conhecidos falsos positivos neste sistema uma vez que eles criam fluorescência independentemente da degradação de substrato. Além de tudo a triagem foi bem-sucedida na identificação de enzimas que eram ativas no MUC. CaracterizaçãoGenes revelados na triagem GIGAMATRIX® foram seqüenciados e os dados foram analisados. Quadros de leitura abertos (ORFs) foram anotados usando-se um sistema de software. Os ORFs foram subclonados no(s) vetor(es) apropriado(s) com a introdução de DNA que
' codifica etiquetas His C-terminais. DNA de construto foi transformado no(s) hospedeiro(s) de E. coli apropriado(s) e expresso(s) para estudos de caracterização. Os produtos de gene foram triados contra celulose inchada com ácido fosfórico (PASC). PASC é uma celulose cristalina que é produzida mais amorfa através de inchamento por tratamento com ácido. PASC foi
preparado a partir de Microcelulose cristalina (MCC) AVICEL®. Subclones foram desenvolvidos, foram expressos e foram lisados. Usados foram incubados com PASC e os produtos de reação foram analisados usando-se o ensaio de açúcar de redução de ácido bicinconínico (BCA). A maior parte dos subclones ativos foram selecionados para purificação e crescimento em
escala maior. A atividade específica desses subclones foi determinada no PASC.
Os subclones foram também analisados por eletroforese de capilar (CE). Lisados foram incubados com substrato por 30 horas. Os produtos de reação foram derivatizados com o fluoroforo l-aminopireno-
3,6,8-trissulfonato (APTS). Os produtos foram analisados usando-se um capilar de 48 cm. Celobiose elui a 6 minutos. A Figura 11 ilustra na forma de gráfico dados que mostram a atividade de enzimas selecionadas contra PASC por análise de eletroforese de capilar (CE). Amostras de H9 até Hl são clones individuais. Na Figura 11, numerosas amostras tinham perfis de
produto de reação representativos de enzimas processivas. Uma enzima pocessiva é definida como tendo uma razão de celobiose/(glicose + celotriose) 10. Duas enzimas processivas potenciais que foram as mais ativas tinhas atividades específicas no PASC de 0,35 e 0,04 U/mg, respectivamente.
CBHs fúngicos em Pichia
Genes de celobioidrolases fúngicas da família 6 & 7 recentemente revelados foram transformados em R pastoris e astransconstruções foram espalhadas sobre placas de ágar sólidas. 160 colônias foram selecionadas para cada construto. As amostras foram desenvolvidos e foram induzidas e os sobrenadantes foram incubados com PASC na presença de uma betaglicosidase. Os produtos de reação foram 5 analisados usando-se o ensaio de glicose-oxidase. Uma celobioidrolase da família 6 de hidrolase de glicosila foi expressa com sucesso heterologamente em P. pastoris.
Celulase de ação exo-endo
A enzima de tipo selvagem enzima, uma hidrolase de glicosila
da família 9 revelada em uma triagem de enzima, é uma homóloga de Thermomonosporafusca E4. E4 demonstrou ter tanto atividade endo quanto exo. Testes iniciais da enzima de tipo selvagem mostrou-a ser ativa tanto em PASC quanto em Microcelulose cristalina (MCC) AVICEL®. Análise de HPLC dos produtos de reação demonstrou que os produtos primários serem
glicose e celobiose. A enzima de tipo selvagem é uma proteína de múltiplos domínios que inclui um domínio catalítica da família 9 de hidrolase de glicosila, um domínio de ligação de celulose da família 3, e três domínios de tipo Ig bacteriana que acreditam-se estarem envolvidos na adesão celular. Três variantes de subclone adicionais da enzima de tipo selvagem foram
testados para determinar os efeitos dos domínios sobre atividade. A enzima de tipo selvagem foi subclonada com: 1) o domínio catalítico sozinho (CD); 2) o domínio catalítico e de carboidrato (CCD); e 3) domínio de ligação catalítico e de carboidrato mais os 11 aminoácidos a jusante (CCD+11). A proteína de comprimento total e as 3 variantes de subclone foram analisadas
em Microcelulose cristalina (MCC) AVICEL® e os produtos de reação foram analisados pelo ensaio de açúcar de redução de BCA, e os dados são sumarizados na forma de gráfico na figura 12. Os dados ilustrados na figura 12 foram gerados por BCA da enzima de tipo selvagem e mutantes de truncação foram incubados com a Microcelulose cristalina (MCC) AVICEL®
por 74 horas, 37°C, pH 5. CBHI é um controle positivo. O controle negativo é o hospedeiro sem inserto.
A enzima de tipo selvagem, a proteína de comprimento total(SEQ ID NO: 164, codificada por, por exemplo, SEQ ID NO: 163), era a mais ativa. The proteína de comprimento total foi selecioanada para a evolução de GSSM. O domínio de ligação catalítico e de carboidrato foram desenvolvidos.
Triagem de GSSM
Tecnologia de GSSM (discutida acima) foi usada para rapidamente e seqüencialmente mutar os aminoácidos do domínio de ligação catalítico e de carboidrato da proteína alvo para formar os 19 outros aminoácidos. O objetivo da triagem de GSSM era para identificar mutantes
que aumentaram a extensão de hidrólise na microcelulose cristalina insolúvel. Um método de triagem robótica foi desenvolvido para facilitar o processo de triagem de GSSM.
DNA oriundo dos construtos de mutação foi transformado em células hospedeiras de DH10b. Colônicas individuais foram captadas em
placas de 96 cavidades (superficiais) contendo 150 uL de LB/Ampicilina usando-se o sistema de captação de colônia automático. As placas foram incubadas por 24 horas a 37°C, 400 rpm. 15 uL de cultura foram transferidas de cada cavidade para dentro de cada cavidade para dentro de uma placa de indução. Cada cavidade da placa de indução continha 135 uL de
LB/Ampicilina com IPTG a 1,1 mM. As placas de indução foram incubadas por 24 horas a 37°C, 400 rpm. As placas foram centrifugadas e o sobrenadante foi descartado.
A porção automatizada do ensaio começou neste ponto. As células foram lisadas e foram ressuspensas pelo robô. 150 uL de tampão de
lise (125 uL de água mais 25 uL de BPER contendo 0,2 mg/ml de lisozima e 20 unidades/ml de DNase I) foram adcionados a cada cavidade. 15 uL de lisado foram transferidos de cada cavidade para uma placa de reação. Cada cavidade da placa de reação continha 185 uL de uma mistura de reação (1% de Microcelulose cristalina (MCC) AVICEL®, tampão de acetato de sódio a
50 mM pH 5,0). As placas de reação foram incubadas a 37°C por 30 horas com 95% de umidade. Depois da incubação, as placas foram centrifugadas e 15 uL sobrenadante foram adicionados a placas de BCA. As placas deBCA continham 50 uL de reagente A, 50 uL de reagente B, e 80 uL de tampão de carbonato a 400 mM, pH 10 por cavidade. As placas foram cobertas com selos de borracha e foram incubadas a 80°C por 30 minutos, então foram resfriadas por centrifugação e a leitura de absorbância a A560. Resultados
Pelo menos 80 colônias de mutação aleatórias foram tríadas quanto a cada sítio de aminoácido. Um exemplo dos dados de triagem de GSSM® primários são graficamente ilustrados na figura 13. Colinha 6 continha as amostras de tipo selvagem e coluna 12 continha controles
negativos de vetor/hospedeiro. Depois de uma incubação por 30 horas com Mie roce lulose cristalina (MCC) AVICEL®, o sinal produzido a partir das amostras de tipo selvagem era por volta de 0,53, com um desvio padrão a 0,07. O controle negativo tinha um sinal méido a 0,29. Amostras com sinal mais alto do que a média de controles positivos mais 2 vezes o desvio
padrão foram considerados ataques primários. A partir da placa de triagem, cerca de dez ataques primários foram selecionados para a triagem de confirmação secundária.
Ataques primários foram reconfirmados em um ensaio secundário. Este ensaio era o mesmo que a triagem primária. No entanto,
amostras foram realizadas em quadruplicata. Um exemplo dos dados de triagem de GSSM secundários são graficamente representados na figura 14. Amostras in cavidades E3-H3, A4-D4, A7-D7 em média, tinham atividade mais alta do que o tipo selvagem. Estas 12 cavidades correspondem a 3 ataques uma vez que as amostras foram realizadas em quadruplicata. Essas amostras eram os ataques primários mostrados nas cavidades E4, G2, e H3 na figura 13 (placa 29805-AA89 BCA placa). Havia 77 ataques oriundos da triagem secundária. Essas amostras foram seqüenciadas. Trinta e cinco das amostras tinham mudanças de aminoácido, 22 tinham inserções de transposon insertions, e o resto eram de tipo selvagem ou tinha deleções.
Ataques orindos da triagem secundária foram ulteriormente
analisados. Os upmutantes dé GSSM foram mapeados sobre a estrutura de cristal de T. fusca E4. Amostras foram priorizadas com base na localizaçãode aminoácido, mudança de aminoácido e a classificação de aperfeiçoamento de vezes. Oito upmutantes foram selecionados da triagem de GSSM e selecionados para a evolução de reagrupamento de gene, isto é, Tunable GeneReassembly (TGR), discutido acima, e também ver, por ' 5 exemplo, patente U.S. n9 6,537,776.
Tabela 2. Up-mutantes selecionados para conjunto de mutagênese dirigido.<table>table see original document page 271</column></row><table>Combinação de upmutantes
Usando-se tecnologia de reagrupamento de gene (Tunable GeneReassembly (TGR)), os upmutantes mostrados na Tabela 2, acima,
foram combinados a fim de identificar o candidato com a melhor atividade. Ensaios de atividade eram os mesmos que para a triagem de GSSM exceto que reações foram ulteriormente diluídas para para representar atividade aumentada de upmutantes sobre a enzima de tipo selvagem. A Figura 15 ilustra que os dados em forma de gráfico foram misturados, ou
"combinados", ensaios de triagem de GSSM®.
Em resumo, a invenção prove enzimas tendo atividade de celulase tendo as seguintes seqüências com base na SEQ ID NO: 164 (codificada por, por exemplo, SEQ ID NO: 163):Resíduo Aminoácido Códons que original codificam
aminoácido original
89 M ATG
103 F TTT, TTC
110 P CCA, CCC, CCG,
CCT
114 Y TAT, TAC
89 M ATG
103 F TTT, TTC
110 P CCA, CCC, CCG,
CCT
114 Y TAT, TAC
157 A GCT, GCC, GCA,
GCG
481 W TGG
550 P CCA, CCC, CCG,
CCT
590 G GGT, GGC, GGA,
GGG
Novo aminoácido Códons que
(depois da codificam novo
evolução de aminoácido
GSSM)
R CGT, CGC, CGA,
CGG, AGA, AGG
G GGT, GGC, GGA,
GGG
G GGT, GGC, GGA,
GGG
L TTA, TTG, CTT,
CTC, CTA, CTG
R CGT, CGC, CGA,
CGG, AGA, AGG
G GGT, GGC, GGA,
GGG
G GGT, GGC, GGA,
GGG
L TTA, TTG, CTT,
CTC, CTA, CTG
S TCT, TCC, TCA,
TCG, AGT, AGC
F TTT, TTC
N AAT, AAC
R CGT, CGC, CGA,
CGG, AGA, AGG
Numerosos aspectos da invenção foram descritos. No entanto, será entendido que várias modificações podem ser feitas sem se afastar do espírito e scopo da invenção. Correspondentemente, outros aspectos estão dentro do escopo das seguintes reivindicações.Listagem de Seqüência
<110> DIVERSA CORPORATION BLUM, David GEMSCH, Joslin DYCAICO, Mark
<120> CÉLULASES, ÁCIDOS NUCLÉICOS QUE CODIFICAM ELES E MÉTODOS PARA A PRODUÇÃO E USO DELES
<130> 564462014240
<140> Not Yet Assigned <141> Filed Herewith
<150> US 60/662,224 <151> 2005-03-15
<160> 166
<170> Patentln versão 3.1
<210> 1
<211> 1323
<212> DNA
<213> Desconhecido
<220>
<223>. Obtido a partir de uma amostra ambiental <400> 1
atgtcaacct ataaatttcc gcacaacttt ttttggggag ccgcaaccgc gtcttatcag 60
atcgaaggcg catggaacga ggatggcaaa ggcgaatcca tttgggatcg cttcagccat 120
acgcccggaa aggtcaccaa tgccgatacc ggtgacatcg cctgtgacca ctatcaccgt 180
tgggaggaag atatcgccct tatgcgccaa cttgggttga aggcgtaccg cttttccact 240
tcatggcccc gtgtgatccc ggcgggccgc agacgggtga atgtcaaagg gctggatttc 300
tacgatcgcc tggtggatgg tctgtgcgcc gcgaacatcg aaccgttcct caccctgtat 360
cactgggacc tgccgcaggc tcttcaagac gaaggcggct gggataatcg caacaccgcc 420
catgcctttg ccgattatgc cgcattgatg gtgaaacgac ttggcgaccg tatccgctat 480
tggacgacgt tcaacgaacc cagcgttgtg gcgttcaatg gtcattactc aggctcgcac 540
gccccgggca ttcaagatgc ccgtgttacc cgccaggtgg tgcatcattt gctggtggcg 600
catgggttgg ctgtgcaggc gatccgcggc gcaaactcca aagtggatgt gggcatcgtg 660
cttaatttat ggcccgccga acccgattcg gactcccccg aagatgccgc cgccgccgaa 720
gccgcctgga accggcacga gaccctgttc cttgacccca tctttaaggc gcattatccc 780
gtatctgccc ttgatgcgat tggggaggat atgccccgca tccacgacgg cgatctggcg 840
ttgatctctc aggaattgga ttttgtcggc atcaactatt actcccgcca tgtggtcagt 900
gccacaaaag aaataggcag gcttcccgaa tcggaataca ctgaaatggg ctgggaagta 960
tgcgcccccg cactccgccg cctgctggtc aagatccata acgattaccg tttgccgccc 1020atctatatca ccgaaaacgg atcggcattc aaggacgaag ttaacgcaga cggaaaggtt 1080
catgacccgc ggcggttgga ttacctgaaa caacacctga ttcaactttg ccttgccatg 1140
caggacggcg tggatgtgcg cggctacatg gcttggtccc tgctggataa tttcgagtgg 1200
ggtcacggct tttccaagcg ctttggcttg gtccatgtgg attacgagag ccagaagcgg 1260
attattaaag actcgggtga atggtatgca agtgtgatac ggaagaacga ggttgttgaa 1320
taa 1323
<210> 2<211> 440<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> Domínio<222> (2) . . .(438)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (10)...(24)
<223> Assinatura N. Terminal da Família Glicosil hidrolase 1. Pró-s<220>
<221> SÍTIO
<222> (351)...(354)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 2
Met Ser Thr Tyr Lys Phe Pro His Asn Phe Phe Trp Gly Ala Ala Thr15 10 15
Ala Ser Tyr Gln lie Glu Gly Ala Trp Asn Glu Asp Gly Lys Gly Glu20 25 30
Ser lie Trp Asp Arg Phe Ser His Thr Pro Gly Lys Vai Thr Asn Ala35 40 45
Asp Thr Gly Asp lie Ala Cys Asp His Tyr His Arg Trp Glu Glu Asp50 55 60
lie Ala Leu Met Arg Gln Leu Gly Leu Lys Ala Tyr Arg Phe Ser Thr65 70 75 80
Ser Trp Pro Arg Vai lie Pro Ala Gly Arg Arg Arg Vai Asn Vai Lys85 90 95
Gly Leu Asp Phe Tyr Asp Arg Leu Vai Asp Gly Leu Cys Ala Ala Asn100 105 110
lie Glu Pro Phe Leu Thr Leu Tyr His Trp Asp Leu Pro Gln Ala Leu115 120 125Gln Asp Glu Gly Gly Trp Asp Asn Arg Asn Thr Ala His Ala Phe Ala130 135 140
Asp Tyr Ala Ala Leu Met Vai Lys Arg Leu Gly Asp Arg lie Arg Tyr145 150 155 160
Trp Thr Thr Phe Asn Glu Pro Ser Vai Vai Ala Phe Asn Gly His Tyr165 170 175
Ser Gly Ser His Ala Pro Gly lie Gln Asp Ala Arg Vai Thr Arg Gln180 185 190
Vai Vai His His Leu Leu Vai Ala His Gly Leu Ala Vai Gln Ala lie195 200 205
Arg Gly Ala Asn Ser Lys Vai Asp Vai Gly lie Vai Leu Asn Leu Trp210 215 220
Pro Ala Glu Pro Asp Ser Asp Ser Pro Glu Asp Ala Ala Ala Ala Glu225 230 235 240
Ala Ala Trp Asn Arg His Glu Thr Leu Phe Leu Asp Pro lie Phe Lys245 250 255
Ala His Tyr Pro Vai Ser Ala Leu Asp Ala lie Gly Glu Asp Met Pro260 265 270
Arg lie His Asp Gly Asp Leu Ala Leu lie Ser Gln Glu Leu Asp Phe275 280 285
Vai Gly lie Asn Tyr Tyr Ser Arg His Vai Vai Ser Ala Thr Lys Glu290 295 300
lie Gly Arg Leu Pro Glu Ser Glu Tyr Thr Glu Met Gly Trp Glu Vai305 310 315 320
Cys Ala Pro Ala Leu Arg Arg Leu Leu Vai Lys lie His Asn Asp Tyr325 330 335
Arg Leu Pro Pro lie Tyr lie Thr Glu Asn Gly Ser Ala Phe Lys Asp340 345 350
Glu Vai Asn Ala Asp Gly Lys Vai His Asp Pro Arg Arg Leu Asp Tyr355 360 365
Leu Lys Gln His Leu lie Gln Leu Cys Leu Ala Met Gln Asp Gly Vai370 375 380
Asp Vai Arg Gly Tyr Met Ala Trp Ser -Leu Leu Asp Asn Phe Glu Trp385 390 395 400
Gly His Gly Phe Ser Lys Arg Phe Gly Leu Vai His Vai Asp Tyr Glu405 410 415
Ser Gln Lys Arg lie lie Lys Asp Ser Gly Glu Trp Tyr Ala Ser Vai420 425 430
lie Arg Lys Asn Glu Vai Vai Glu
<210> 3<211> 1389<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 3
atgagcgctc cgagtcccgc ccgccccgtg tcctttcctc cccgcttcgt gtggggagcc 60
gcggccgcat cctatcaaat cgagggcgcc gtccgggagg acggcaaggg cccttcggtg 120
tgggacatgt tctgcgagaa gccgggagcc gtcttcgagg ggcacgacgg ggcggtggct 180
tgcgatcact accaccgtta ccgggaagac gtggccctga tgcggcagat tgggctccag 240
gcttaccgcc tgagcgtgtg ctggcccagg gtgctgcccg aggggaccgg gcagcccaac 300
gagaaggggc tcgacttcta ctcccggctc gtcgacgcct tgctcgaggc ggggatcacg 3 60
ccttgggtca ccctttttca ctgggactac ccactagccc tatatcaccg gggaggctgg 420
ctcaatcggg atagctcaga ctggttcggc gagtacgcgg gtctgattgc ggagcgcctc 480
tccgatcggg tgagccactt cttcacccag aacgagcccc aggtgtacat cggcttcggg 540
cacctcgagg ggaaacacgc gccgggcgat acccttcccc tgtcgcagat gctgctggcc - 600
ggtcaccaca gcctgctcgc ccatggaaag gccgtgcagg cgctgcgcgc ccacggcaag 660
cagcagctgc gggttggata cgctccggtg gggatgccgc tgcatccggt cagcgagtcc 720
gccgaagacg ,tggcggctgc acgcaccgcc actttccgcg tccgagagaa gaattcctgg 780
aacaacgctt ggtggatgga cccggtgtac ctcggtgagt accccgccca agggctcgag 840
ttctacgggc gagacgtccc cgcgatccgg tccggagaca tggaactcat ccggcaaccc 900
ttggactttt tcggcgtcaa catctaccag agcacgcccg tgcgcgccgc gggggcgccc 960
caggggttcg aggtcgtccg gcatccgacg ggccacccca tcaccgcgtt caactggccg 1020
gttacgccac aggccttgta ttgggggccg cggttcttct acgagcgcta tggcaagccc 1080
atcgtcatta cggaaaacgg gctttcctgc cgagacgtga tcgcccttga cggcaaggtg 1140
cacgatccgt cccgcatcga cttcaccacg cgctacctgc gcgagctcca ccgcgccatc 1200
gccgaaggca acgaggtgga gggctacttc cactggtcca tcatggacaa cttcgaatgg 1260
gctgccggat accgagaacg cttcgggctc gttcacgtgg attacgagac cctggtgagg 1320acacccaagg actctgcggc gtggtaccgc caggtcatcc agagcaacgg ggccgtgctg 1380
ttcgattga 1389
<210> 4
<211> 462
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (8) . . . (458)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (16) . ..(30)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<220>
<221> SÍTIO
<222> (366) . .. (374)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572<400> 4
Met Ser Ala Pro Ser Pro Ala Arg Pro Vai Ser Phe Pro Pro Arg Phe1 5 10 15
Vai Trp Gly Ala Ala Ala Ala Ser Tyr Gln lie Glu Gly Ala Vai Arg20 25 30
Glu Asp Gly Lys Gly Pro Ser Vai Trp Asp Met Phe Cys Glu Lys Pro35 40 45
Gly Ala Vai Phe Glu Gly His Asp Gly Ala Vai Ala Cys Asp His Tyr50 55 .60
His Arg Tyr Arg Glu Asp Vai Ala Leu Met Arg Gln lie Gly Leu Gln65 70 75 80
Ala Tyr Arg Leu Ser Vai Cys Trp Pro Arg Vai Leu Pro Glu Gly Thr85 90 95
Gly Gln Pro Asn Glu Lys Gly Leu Asp Phe Tyr Ser Arg Leu Vai Asp100 105 110
Ala Leu Leu Glu Ala Gly lie Thr Pro Trp Vai Thr Leu Phe His Trp115 120 125
Asp Tyr Pro Leu Ala Leu Tyr His Arg Gly Gly Trp Leu Asn Arg Asp130 135 140
Ser Ser Asp Trp Phe Gly Glu Tyr Ala Gly Leu lie Ala Glu Arg Leu145 150 155 160
Ser Asp Arg. Vai Ser His Phe Phe Thr Gln Asn Glu Pro Gln Vai Tyr165 170 175
lie Gly Phe Gly His Leu Glu Gly Lys His Ala Pro Gly Asp Thr Leu180 185 190
Pro Leu Ser Gln Met Leu Leu Ala Gly His His Ser Leu Leu Ala His195 200 205
Gly Lys Ala Vai Gln Ala Leu Arg Ala His Gly Lys Gln Gln Leu Arg210 215 220
Vai Gly Tyr Ala Pro Vai Gly Met Pro Leu His Pro Vai Ser Glu Ser225 230 235 240
Ala Glu Asp Vai Ala Ala Ala Arg Thr Ala Thr Phe Arg Vai Arg Glu245 250 255
Lys Asn Ser Trp Asn Asn Ala Trp Trp Met Asp Pro Vai Tyr Leu Gly260 265 270
Glu Tyr Pro Ala Gln Gly Leu Glu Phe Tyr Gly Arg Asp Vai Pro Ala275 280 285
lie Arg Ser Gly Asp Met Glu Leu lie Arg Gln Pro Leu Asp Phe Phe290 295 300
Gly Vai Asn lie Tyr Gln Ser Thr Pro Vai Arg Ala Ala Gly Ala Pro305 310 315 320
Gln Gly Phe Glu Vai Vai Arg His Pro Thr Gly His Pro -He Thr Ala325 330 335
Phe Asn Trp Pro Vai Thr Pro Gln Ala Leu Tyr Trp Gly Pro Arg Phe, 340 345 350
Phe Tyr Glu Arg Tyr Gly Lys Pro lie Vai lie Thr Glu Asn Gly Leu355 360 365
Ser Cys Arg Asp Vai lie Ala Leu Asp Gly Lys Vai His Asp Pro Ser370 375 380
Arg lie Asp Phe Thr Thr Arg Tyr Leu Arg Glu Leu His Arg Ala lie385 390 395 400
Ala Glu Gly Asn Glu Vai Glu Gly Tyr Phe His Trp Ser lie Met Asp405 410 415Asn Phe Glu Trp Ala Ala Gly Tyr Arg Glu Arg Phe Gly Leu Vai His420 425 430
Vai Asp Tyr Glu Thr Leu Vai Arg Thr Pro Lys Asp Ser Ala Ala Trp435 440 445
Tyr Arg Gln Vai lie Gln Ser Asn Gly Ala Vai Leu Phe Asp450 455 460
<210> 5
<211> 1098
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 5
atgactcgga ggtctatcgt gcgttcttct tccaacaagt ggcttgtcct tgccggtgcg 60
gcgctgctcg cctgcaccgc cctcgggtgc aagaaaaaag gcgagagcgg tgacgtcgcc 120
tcggccccgg ggcaggccca ggcgggcggc aagcagccgt ttcccgacga tgcgccgatc 180
accgaaccgc ccgctccgcc ccctcgtagc ggcaatcctc tggtgggcgc caagctcttc 240
gtcgacccgg aatctttggc catgttgcag gcgaacaagc tgcggcgcac cgacccggag 300
aaggcggcga ttttggatcg catcgcccag cagccccagg ctttgtggat gggcgagtgg 360
aacacgaaca tcttccgcgc ggtcgagcat ttcgtggctc gcgccaaggc ggagggcgcc 420
gtgcccgtca tgatcgccta caacatcccc caccgcgact gcgggcagta ctctcagggt 480
gggctttcct ccaaggaggc ttaccagcgc tggattcgga acgtcgccgc ggggattggc 540
agcgatgcag cggtcgtcgt gctcgagccc gacgcgctcg gccacttcca ggagtgtttg 600
accgaggagc agagcgccga gcgcatgttc ctgctcagcg acgccgtcaa ggtgctgcgc 660
caaaatccga agacggccgt gtacctggat gccgggcacg cgcgctgggt gccggtggag 720
gagatggccg agcgcctcaa gctcgcgggc atcgagcacg cccatggctt ttcgctcaac 780
acctcgaact acgtgggcac cgaggagaac gccgcttacg gccacaagct cgtcgaggcc 840
ctgggtggga acgtgcgctt cgtcatcgac acgagccgca atggggcggg cccctacgag 900
gaggccaaga acgccgagga gagctggtgc aacccgcccg gtcgcaagat cggcaagccg 960
ccgaccaccg agacggggga tcccctcatc gacggattcc tttggctgaa gcgcccgggc 1020
gagtcggacg gtcagtgcaa cggcgggccc aaggccggtg tgttctggct ggagcaggct 1080
ctccagcagg cccagtaa 1098
<210> 6<211> 365<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL<222> (1) . . . (29)
<220>
<221> DOMÍNIO<222> (81) . . . (358)
<223> Família glicosil hidrolase 6<220>
<221> SÍTIO
<222> (187)...(196)
<223> Assinatura 2 da família glicosil hidrolase 2. Pró-sitio id = PS00656<220>
<221> SÍTIO
<222> (263)...(266)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 6
Met Thr Arg Arg Ser lie Vai Arg Ser Ser Ser Asn Lys Trp Leu Vai15 10 15
Leu Ala Gly Ala Ala Leu Leu Ala Cys Thr Ala Leu Gly Cys Lys Lys20 25 30
Lys Gly Glu Ser Gly Asp Vai Ala Ser Ala Pro Gly Gln Ala Òln Ala35 40 45
Gly Gly Lys Gln Pro Phe Pro Asp Asp Ala Pro lie Thr Glu Pro Pro50 55 60
Ala Pro Pro Pro Arg Ser Gly Asn Pro Leu Vai Gly Ala Lys Leu Phe65 70 75 80
Vai Asp Pro Glu Ser Leu Ala Met Leu Gln Ala Asn Lys Leu Arg Arg85 90 95
Thr Asp Pro Glu Lys Ala Ala lie Leu Asp Arg lie Ala Gln Gln Pro100 105 110
Gln Ala Leu Trp Met Gly Glu Trp Asn Thr Asn lie Phe Arg Ala Vai115 120 125
Glu His Phe Vai Ala Arg Ala Lys Ala Glu Gly Ala Vai Pro Vai Met130 135 140
lie Ala Tyr Asn lie Pro His Arg Asp Cys Gly Gln Tyr Ser Gln Gly145 150 155 160
Gly Leu Ser Ser Lys Glu Ala Tyr Gln Arg Trp lie Arg Asn Vai Ala165 170 175
Ala Gly lie Gly Ser Asp Ala Ala Vai Vai Vai Leu Glu Pro Asp Ala180 185 190Leu Gly His Phe Gln Glu Cys Leu Thr Glu Glu Gln Ser Ala Glu Arg195 200 205
Met Phe Leu Leu Ser Asp Ala Vai Lys Vai Leu Arg Gln Asn Pro Lys210 215 220
Thr Ala Vai Tyr Leu Asp Ala Gly His Ala Arg Trp Vai Pro Vai Glu225 230 235 240
Glu Met Ala Glu Arg Leu Lys Leu Ala Gly lie Glu His Ala His Gly245 250 255
Phe Ser Leu Asn Thr Ser Asn Tyr Vai Gly Thr Glu Glu Asn Ala Ala260 265 270
Tyr Gly His Lys Leu Vai Glu Ala Leu Gly Gly Asn Vai Arg Phe Vai275 280 285
lie Asp Thr Ser Arg Asn Gly Ala Gly Pro Tyr Glu Glu Ala Lys Asn290 295 . 300
Ala Glu Glu Ser Trp Cys Asn Pro Pro Gly Arg Lys lie Gly Lys Pro305 310 315 320
Pro Thr Thr Glu Thr Gly Asp Pro Leu lie Asp Gly Phe Leu Trp Leu325 330 335
Lys Arg Pro Gly Glu Ser Asp Gly Gln Cys Asn Gly Gly Pro Lys Ala340 345 350
Gly Vai Phe Trp Leu Glu Gln Ala Leu Gln Gln Ala Gln355 360 365
<210> 7<211> 2649<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 7
atgcaaggaa agaaaattga tttcattaac tcaaggttgt tagttcctga ttatccaatc 60
gttcccttca ttgagggaga tggtaccggc cctgatatct ggcgtgcttc agtcagggtg 120
ctggatgttg ctgttgacag ggcatattcc ggcaagcgaa aacttctctg gaaagaggtg 180
ctggctggcg aaaaggcatt tacaaatacc gggtcctggc ttccggagga aactcttaga 240
gcatttcgtg aatatcatgt tggaattaaa gggccactca ctacgccagt tggtggggga 300
attcgttctc tcaatgtagc cctcaggcaa gagcttgact tgtatgtttg cctgaggcca 360
gtcaaatggt, „ttaagggtgt accaagtcct ctaaaagatc cttccaaagt ggatatgcat 420attttccgcg aaaacactga agatatttat gcaggtattg aatttatgca tggtgaaccg 480
gaggccctga aagttaagaa atttcttacc gaagaaatgg gaatcaagaa gtttcggttt 540
cccgatacat cctccattgg tatcaagcct atctcactcg aaggaacaga gcgtcttgta 600
agagcttcca ttcaatatgc acttgacagg aagttgcctt ccgtaacatt ggttcataaa 660
ggcaatatca tgaaattcac cgagggggca ttcaaaaaat ggggttatga acttgccgaa 720
agagaatttg gcgacagggt ttttacatgg tcaatgtatg accgtatcgc cgatgaacat 780
ggaacggaag aagctggcaa agtgcaatcc gaagcgattg caaaaggtaa actcctgata 840
aaggatgtga ttgctgatgc ttttctgcág caaatactac tcaggcctgc cgagtacagc 900
gttatcgcaa ccatgaacct gaatggcgat tatatcagcg atgcactggc agctatggtg 960
gggggtatag gaattgctcc cggagccaat attaaccatc aaactggcca tgcagtcttt 1020
gaagcaacac acggcacggc tcccaaatat gccaaccttg atcaggtaaa ccctggctca 1080
gtaatactaa gtggcgcgct gatgctcgaa tacatgggct ggaacgaagc cgctcagctc 1140
attaccaatg gattggaggc taccattcaa cagaaactgg taacctatga tttccatcgc 1200
ttaatggaag gtgctacaaa gttgaagact tcagaatttg gcgatgctgt gatccggccg 1260
gcacgttccg cctgggcgga cacggctgcc gatgccctct ccgggcggcg gcgtcgtgcg 1320
cggaacggcg ggcttgttgc cccgcccgcg gcctgtcgcc gggggcgggt acgggactca 1380
gcgcttgcgc gcctccttca gggtggactg cagggcgaag aaggccggct tgcggacgaa 1440
cttctccgtc atgaccgtgg cgctgccctc accctcgaag aagaccggca cccacgagta 1500
cttgtcggtg aagccccaga tggtgaagga gttgcagtcg ttcacggcca ggcaggccga 1560
cagtgcctgc tggtagtagt cggcctgctg ccgcagctgc tccttggtgg gcttgccgct 1620
cgccgggagg tccatgcgga cgtcgatctc ggtgatggcg gtctccagac cgaggtcggc 1680
gaaccgctgc aggttctgct gcaggtcgcc cgggaagccg tagcgggtgc tcaggtggcc 1740
ctgggcgccg aatccgtgga gcggcacgcc ctgctccagc atctcctggg cgagctcgta 1800
gtaggcgtcg ctcttggcgt tgatgccctc gacgttgtag tcgttgagga acagcttggc 1860
ctcggggtcg gcctcgtggg cccagcggaa ggcgtccgcg acgatctccg ggccgagctc 1920
acgtatccag atgttctcgt cggtgcgcag ctcggcctgg tcgttgaaga tctcgttggc 1980
cacgtcccac tgctggatct tgccggcgta gcggccgacg accgtgtcga tgtggtcctt 2040
gaggatggcg cgcagttcct ccttggtgaa gtcgccctcc tccagccatt cggggttctg 2100gctgtgccac aggagggtgt gcccgcgcac ggcctggcgg ttccgctggg cgaactcgac 2160
gatggcgtcg gcctcctcga agcggtactg gtcgcgctcg gggtggatga actcccactt 2220
catctggttc tcggcggaga ccgagttgaa ctgctggccc aggatcttcc ggtacttctt 2280
gtcgaaggtg aaggggtccg ggtagtcctg ttcgaggtgg tggccgccgc cggccgccgc 2340
ggagcctatg aagaaccctt cgggggcggc ccagcgcagg cggtcgaact tggcgttgga 2400gtggggcgcg gcctcgtggt cggcggacgg cttggccgtg gccgtcgacg tcaccagcgg 2460
gacggccagc gcggcggcga gagcaaaggt gacgatgcgg acggatctca tcagaggtcc 2520
ctcattcgat cgcggctccg aaagttttcg gaggattacc ggaatgtttc agggacctta 2580
aggcgcccgg agccgggtcg tcaacggttt ggcccggccc ggtcgaagct tctcccgacc 2640
aggcgttga 2649
<210> 8
<211> 882
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (20)...(417)
<223> Isocitrato/isopropilmalato desidrogenase<220>
<221> SÍTIO
<222> (310)...(329)
<223> Assinatura isocitrato e isopropilmalato desidrogenase. Pró-sitio idPS00470
<220>
<221> SÍTIO
<222>. (868) . . . (871)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<400> 8
Met Gln Gly Lys Lys lie Asp Phe lie Asn Ser Arg Leu Leu Vai Pro1 5 10 15
Asp Tyr Pro lie Vai Pro Phe lie Glu Gly Asp Gly Thr Gly Pro Asp20 25 30
lie Trp Arg Ala Ser Vai Arg Vai Leu Asp Vai Ala Vai Asp Arg Ala35 40 45
Tyr Ser Gly Lys Arg Lys Leu Leu Trp Lys Glu Vai Leu Ala Gly Glu50 55 60
Lys Ala Phe Thr Asn Thr Gly Ser Trp Leu Pro Glu Glu Thr Leu Arg65 70 75 80
Ala Phe Arg Glu Tyr His Vai Gly lie Lys Gly Pro Leu Thr Thr Pro85 90 95
Vai Gly Gly Gly lie Arg Ser Leu Asn Vai Ala Leu Arg Gln Glu Leu100 105 110
Asp Leu Tyr Vai Cys Leu Arg Pro Vai Lys Trp Phe Lys Gly Vai Pro115 120 125Ser Pro Leu Lys Asp Pro Ser Lys Vai Asp Met His lie Phe Arg Glu130 135 140
Asn Thr Glu Asp lie Tyr Ala Gly lie Glu Phe Met His Gly Glu Pro145 150 155 160
Glu Ala Leu Lys Vai Lys Lys Phe Leu Thr Glu Glu Met Gly lie Lys165 170 175
Lys Phe Arg Phe Pro Asp Thr Ser Ser lie Gly lie Lys Pro lie Ser180 185 190
Leu Glu Gly Thr Glu Arg Leu Vai Arg Ala Ser lie Gln Tyr Ala Leu195 200 205
Asp Arg Lys Leu Pro Ser Vai Thr Leu Vai His Lys Gly Asn lie Met210 215 220
Lys Phe Thr Glu Gly Ala Phe Lys Lys Trp Gly Tyr Glu Leu Ala Glu225 230 235 240
Arg Glu Phe Gly Asp Arg Vai Phe Thr Trp Ser Met Tyr Asp Arg lie245 250 255
Ala Asp Glu His Gly Thr Glu Glu Ala Gly Lys Vai Gln Ser Glu Ala260 265 270
lie Ala Lys Gly Lys Leu Leu lie Lys Asp Vai lie Ala Asp Ala Phe275 280 285
Leu Gln Gln lie Leu Leu Arg Pro Ala Glu Tyr Ser Vai lie Ala Thr290 295 300
Met Asn Leu Asn Gly Asp Tyr lie Ser Asp Ala Leu Ala Ala Met Vai305 310 315 320
Gly Gly lie Gly lie Ala Pro Gly Ala Asn lie Asn His Gln Thr Gly325 330 335
His Ala Vai Phe Glu Ala Thr His Gly Thr Ala Pro Lys Tyr Ala Asn340 345 350
Leu Asp Gln Vai Asn Pro Gly Ser Vai lie Leu Ser Gly Ala Leu Met355 360 365
Leu Glu Tyr Met Gly Trp Asn Glu Ala Ala Gln Leu lie Thr Asn Gly370 375 380
Leu Glu Ala Thr lie Gln Gln Lys Leu Vai Thr Tyr Asp Phe His Arg385 390 395 400Leu Met Glu Gly Ala Thr Lys Leu Lys Thr Ser Glu Phe Gly Asp Ala405 410 415
Vai lie Arg Pro Ala Arg Ser Ala Trp Ala Asp Thr Ala Ala Asp Ala420 425 430
1 Leu Ser Gly Arg Arg Arg Arg Ala Arg Asn Gly Gly Leu Vai Ala Pro
435 440 445
Pro Ala Ala Cys Arg Arg Gly Arg Vai Arg Asp Ser Ala Leu Ala Arg450 455 460
Leu Leu Gln Gly Gly Leu Gln Gly Glu Glu Gly Arg Leu Ala Asp Glu465 470 475 480
Leu Leu Arg His Asp Arg Gly Ala Ala Leu Thr Leu Glu Glu Asp Arg485 490 495
His Pro Arg Vai Leu Vai Gly Glu Ala Pro Asp Gly Glu Gly Vai Ala500 505 510
Vai Vai His Gly Gln Ala Gly Arg Gln Cys Leu Leu Vai Vai Vai Gly515 520 525
Leu Leu Pro Gln Leu Leu Leu Gly Gly Leu Ala Ala Arg Arg Glu Vai530 535 540
His Ala Asp Vai Asp Leu Gly Asp Gly Gly Leu Gln Thr Glu Vai Gly545 550 555 560
Glu Pro Leu Gln Vai Leu Leu Gln Vai Ala Arg Glu Ala Vai Ala Gly565 570 575
Ala Gln Vai Ala Leu Gly Ala Glu Ser Vai Glu Arg His Ala Leu Leu580 585 590
Gln His Leu Leu Gly Glu Leu Vai Vai Gly Vai Ala Leu Gly Vai Asp595 600 605
Ala Leu Asp Vai Vai Vai Vai Glu Glu Gln Leu Gly Leu Gly Vai Gly610 615 620
Leu Vai Gly Pro Ala Glu Gly Vai Arg Asp Asp Leu Arg Ala Glu Leu625 630 635 640
Thr Tyr Pro Asp Vai Leu Vai Gly Ala Gln Leu Gly Leu Vai Vai Glu645 650 655
Asp Leu Vai Gly His Vai Pro Leu Leu Asp Leu Ala Gly Vai Ala Ala660 . 665 670Asp Asp Arg Vai Asp Vai Vai Leu Glu Asp Gly Ala Gln Phe Leu Leu675 680 685
Gly Glu Vai Ala Leu Leu Gln Pro Phe Gly Vai Leu Ala Vai Pro Gln690 695 700
Glu Gly Vai Pro Ala His Gly Leu Ala Vai Pro Leu Gly Glu Leu Asp705 710 715 720
Asp Gly Vai Gly Leu Leu Glu Ala Vai Leu Vai Ala Leu Gly Vai Asp725 730 735
Glu Leu Pro Leu His Leu Vai Leu Gly Gly Asp Arg Vai Glu Leu Leu740 745 750
Ala Gln Asp Leu Pro Vai Leu Leu Vai Glu Gly Glu Gly Vai Arg Vai755 760 765
Vai Leu Phe Glu Vai Vai Ala Ala Ala Gly Arg Arg Gly Ala Tyr Glu770 775 780
Glu Pro Phe Gly Gly Gly Pro Ala Gln Ala Vai Glu Leu Gly Vai Gly785 790 795 800
Vai Gly Arg Gly Leu Vai Vai Gly Gly Arg Leu Gly Arg Gly Arg Arg805 810 815
Arg His Gln Arg Asp Gly Gln Arg Gly Gly Glu Ser Lys Gly Asp Asp820 825 830
Ala Asp Gly Ser His Gln Arg Ser Leu lie Arg Ser Arg Leu Arg Lys835 840 845
Phe Ser Glu Asp Tyr Arg Asn Vai Ser Gly Thr Leu Arg Arg Pro Glu850 855 860
Pro Gly Arg Gln Arg Phe Gly Pro Ala Arg Ser Lys Leu Leu Pro Thr865 870 875 880
Arg Arg
<210> 9
<211> 1134
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental
<4t00> 9atgagatccg tccgcatcgt cacctttgct ctcgccgccg cgctggccgt cccgctggtg 60
acgtcgacgg ccacggccaa gccgtccgcc gaccacgagg ccgcgcccca ctccaacgcc 120
aagttcgacc gcctgcgctg ggccgccccc gaagggttct tcataggctc cgcggcggcc 180
ggcggcggcc accacctcga acaggactac ccggacccct tcaccttcga caagaagtac 240
cggaagatcc tgggccagca gttcaactcg gtctccgccg agaaccagat gaagtgggag 300
ttcatccacc ccgagcgcga ccagtaccgc ttcgaggagg ccgacgccat cgtcgagttc 360
gcccagcgga accgccaggc cgtgcgcggg cacaccctcc tgtggcacag ccagaacccc 420
gaatggctgg aggagggcga cttcaccaag gaggaactgc gcgccatcct caaggaccac 480
atcgacacgg tcgtcggccg ctacgccggc aagatccagc agtgggacgt ggccaacgag 540
atcttcaacg accaggccga gctgcgcacc gacgagaaca tctggatacg tgagctcggc 600
ccggagatcg tcgcggacgc cttccgctgg gcccacgagg ccgaccccga ggccaagctg 660
ttcctcaacg actacaacgt cgagggcatc aacgccaaga gcgacgccta ctacgagctc 720
gcccaggaga tgctggagca gggcgtgccg ctccacggat tcggcgccca gggccacctg 7 80
agcacccgct acggcttccc gggcgacctg cagcagaacc tgcagcggtt cgccgacctc 840
ggtctggaga ccgccatcac cgagatcgac gtccgcatgg acctcccggc gagcggcaag 900
cccaccaagg agcagctgcg gcagcaggcc gactactacc agcaggcact gtcggcctgc 960
ctggccgtga acgactgcaa ctccttcacc atctggggct tcáccgacaa gtactcgtgg 1020
gtgccggtct tcttcgaggg tgagggcagc gccacggtca tgacggagaa gttcgtccgc 1080
aagccggcct tcttcgccct gcagtccacc ctgaaggagg cgcgcaagcg ctga 1134
<210> 10<211> 377<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL<222> (1) . . . (26)
<220>
<221> DOMÍNIO<222> (44) ... (371)
<223> Família glicosil hidrolase 10<400> 10
Met Arg Ser Vai Arg lie Vai Thr Phe Ala Leu Ala Ala Ala Leu Ala15 10 15
Vai Pro Leu Vai Thr Ser Thr Ala Thr Ala Lys Pro Ser Ala Asp His20 25 30
Glu Ala Ala Pro His Ser Asn Ala Lys Phe Asp Arg Leu Arg Trp Ala35 40 45Ala Pro Glu Gly Phe Phe lie Gly Ser Ala Ala Ala Gly Gly Gly His50 55 60
His Leu Glu Gln Asp Tyr Pro Asp Pro Phe Thr Phe Asp Lys Lys Tyr65 70 75 80
Arg Lys lie Leu Gly Gln Gln Phe Asn Ser Vai Ser Ala Glu Asn Gln85 90 95
Met Lys Trp Glu Phe lie His Pro Glu Arg Asp Gln Tyr Arg Phe Glu100 105 110
Glu Ala Asp Ala lie Vai Glu Phe Ala Gln Arg Asn Arg Gln Ala Vai115 120 125
Arg Gly His Thr Leu Leu Trp His Ser Gln Asn Pro Glu Trp Leu Glu130 135 140
Glu Gly Asp Phe Thr Lys Glu Glu Leu Arg Ala lie Leu Lys Asp His145 150 155 160
lie Asp Thr Vai Vai Gly Arg Tyr Ala Gly Lys lie Gln Gln.Trp Asp165 170 175
Vai Ala Asn Glu lie Phe Asn Asp Gln Ala Glu Leu Arg Thr Asp Glu180 185 190
Asn lie Trp lie Arg Glu Leu Gly Pro Glu lie Vai Ala Asp Ala Phe195 200 205
Arg Trp Ala His Glu Ala Asp Pro Glu Ala Lys Leu Phe Leu Asn Asp210 215 220
Tyr Asn Vai Glu Gly lie Asn Ala Lys Ser Asp Ala Tyr Tyr Glu Leu225 230 235 240
Ala Gln Glu Met Leu Glu Gln Gly Vai Pro Leu His Gly Phe Gly Ala245 250 255
Gln Gly His Leu Ser Thr Arg Tyr Gly Phe Pro Gly Asp Leu Gln Gln260 265 270
Asn Leu Gln Arg Phe Ala Asp Leu Gly Leu Glu Thr Ala lie Thr Glu275 280 285
lie Asp Vai Arg Met Asp Leu Pro Ala Ser Gly Lys Pro Thr Lys Glu290 295 300
Gln Leu Arg Gln Gln Ala Asp Tyr Tyr Gln Gln Ala Leu Ser Ala Cys305 310 315 320Leu Ala Vai Asn Asp Cys Asn Ser Phe Thr lie Trp Gly Phe Thr Asp325 330 335
Lys Tyr Ser Trp Vai Pro Vai Phe Phe Glu Gly Glu Gly Ser Ala Thr340 345 350
Vai Met Thr Glu Lys Phe Vai Arg Lys Pro Ala Phe Phe Ala Leu Gln355 360 365
Ser Thr Leu Lys Glu Ala Arg Lys Arg370 375
<210> 11
<211> 1080
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 11 ..
atgccctgga gctcatcaac gggacctgca cctatgacga gtaacccgcc cctcaaacgc 60
cccctgcgta tcggtctggt cggcacgggc atcggctcac tgcacgccgc cggaatttcc 120
cggatgcctc agcttgccac gctgggggcc atctgtgggc ttgataccca cgccgtgaat 180
gccctagcca cacgctacgg ggtagaaaaa accacatctc gctatgagga tttactgaac 240
gatcccggcc ttgatgtcat cgatctgtgc gttcctcacg atgaacacat gcccatggcc 300
attgccgccg cccgggccgg aaaacatctc ctcatcgaaa aacctttggc ccgcaccctg 360
gaagaggccg atgcaatcct cgaggccgtg aaaagcgccg gtgtaacgct gatgatggga 420
cacaaccagc gttactacgc ccatcacgcc agggctaaag cattggtcga cgccggggtc 480
atcggaaaac cctacatgat cgtagcttcg gttcatgtgc acgggcagat tgatggtttt 540
cgccgctttc ttaagcacgc cgggggtggc acgttgatcg attcgggagt gcaccgcttc 600
gacctcattc gctggatcat gggtgaagtc gagaccgtct tcgctcaaac gggtcgcttc 660
ctccagatgc aaatggaagg agaagactgc gcggtggtca ccctccgctt ccgcagcgga 720
gccatcggga gcttctcatg cagctggagc gccaaaggcc ctgttccaga agaaacattg 780
caaattttcg gcccctatgg ttcgatttat accgaagacc acacccgcac cttacgcctt 840
tacaccgaaa gacccacccc cgaactggaa gacgtaaggc agtttgtctt cccggtcgat 900
caggctgagt ccatccgccg catgattgaa gcgcacttca ccagcctgca acaggggtta 960
ccccctccga tcaccggtat ggacggacgc gcttcccttg agctcagcat ggcctcctat 102 0
cgctcggctc aaaccggcca gcctgttcat cttccccttc agagaggaaa ccagaaatga 1080
<210> 12<211> 359<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (22)...(141)
<223> Família oxidorredutade, dobra Rossmann ("Rossmann fold") ligadas aoNAD
<220>
<221> DOMÍNIO<222> (153)...(260)
<223> Família oxidorreductase, Domínio alfa/beta c-terminal<400> 12
Met Pro Trp Ser Ser Ser Thr Gly Pro Ala Pro Met Thr Ser Asn Pro15 10 15
Pro Leu Lys Arg Pro Leu Arg lie Gly Leu Vai Gly Thr Gly lie Gly20 25 30
Ser Leu His Ala Ala Gly lie Ser Arg Met Pro Gln Leu Ala Thr Leu35 40 45
Gly Ala lie Cys Gly Leu Asp Thr His Ala Vai Asn Ala Leu Ala Thr50 55 60
Arg Tyr Gly Vai Glu Lys Thr Thr Ser Arg Tyr Glu Asp Leu Leu Asn65 70 75 80
Asp Pro Gly Leu Asp Vai lie Asp Leu Cys Vai Pro His Asp Glu His85 90 95
Met Pro Met Ala lie Ala Ala Ala Arg Ala Gly Lys His Leu Leu lie100 105 110
Glu Lys Pro Leu Ala Arg Thr Leu Glu Glu Ala Asp Ala lie Leu Glu115 120 125
Ala Vai Lys Ser Ala Gly Vai Thr Leu Met Met Gly His Asn Gln Arg130 135 140
Tyr Tyr Ala His His Ala Arg Ala Lys Ala Leu Vai Asp Ala Gly Vai145 150 155 160
lie Gly Lys Pro Tyr Met lie Vai Ala Ser Vai His Vai His Gly Gln165 170 175
lie Asp Gly Phe Arg Arg Phe Leu Lys His Ala Gly Gly Gly Thr Leu180 185 190
lie Asp Ser Gly Vai His Arg Phe Asp Leu lie Arg Trp lie Met Gly195 200 205Glu Vai Glu Thr Vai Phe Ala Gln Thr Gly Arg Phe Leu Gln Met Gln210 215 220
Met Glu Gly Glu Asp Cys Ala Vai Vai Thr Leu Arg Phe Arg Ser Gly225 230 235 240
Ala lie Gly Ser Phe Ser Cys Ser Trp Ser Ala Lys Gly Pro Vai Pro245 250 255
Glu Glu Thr Leu Gln lie Phe Gly Pro Tyr Gly Ser lie Tyr Thr Glu260 265 270
Asp His Thr Arg Thr Leu Arg Leu Tyr Thr Glu Arg Pro Thr Pro Glu275 280 285
Leu Glu Asp Vai Arg Gln Phe Vai Phe Pro Vai Asp Gln Ala Glu Ser290 295 300
lie Arg Arg Met lie Glu Ala His Phe Thr Ser Leu Gln Gln Gly Leu305 310 315 320
Pro Pro Pro lie Thr Gly Met Asp Gly Arg Ala Ser Leu Glu Leu Ser325 330 335
Met Ala Ser Tyr Arg Ser Ala Gln Thr Gly Gln Pro Vai His Leu Pro340 345 350
Leu Gln Arg Gly Asn Gln Lys355
<210> 13
<211> 1038
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 13
atgagcccgg tgcgcgttgc tgtcatcggc gccgggcaaa ttgcccagcg cgggcattta 60
cccgggcttc tggaagctgg cgccgaaatt accgttctgt gcgataattc ccttcctcag 120
cttgaagaaa ttggggccaa atttcacgtt caccgggtct accgcgactg gcacgccatg 180
ctggatgccg gcggattcga agccgtcacc atttgtaccc cgcccttcct ccatgccgag 240
atggccatcg aatgtgcccg cagagggttg catgtactgg tagaaaaacc catggctgta 300
aatctccaac aatgcgatca aatgatcgcc gcgtctgaac aggccggaac catcttaatg 360
gtctcgcata accag;cgctt tatggaggca catcgtctgg ccaaagaaat ccttgatgcc 420
ggcctcctcg gcaggctcta cctggcgcac ggggtctttg gccacggcgg cccggaggtt 480
tggagcccaa cccagcaatg gtacttccga cctgaccgcg ccggcgctgg cgtgatcgct 540gacctggggt atcataaact tgacctgatc cgctggctca ccgggcaaga aattaccgcg 600
gtgggagcac tgggcgccac ctttgaaaag caaacctcgc ttgaagactc tgctgtgatg 660
ctggttcacc tttcggaggg tactctcgcc accatccagg taagctgggt gttcaggcct 720
gactgggaaa acagcctggt ccttcgagga gaacgggggg tgctcgccat ccccactgat 780
gcctcgcaac ccctgcgggt ctcttacata tcttcttcgg gtcaggtcat tgaaagtacg 840
catcgttgcg actccggcga tacctccggc tggttcggag cgatccgggc atttctcacc 900
gcgatcgaaa aaagcgctcc cgctcccatt gacggaaaag aagggcgtgc tgtcatggcg 960
gcagttctgg cggccacacg ctccattcaa aaacatacga tcatttctat aaccgaggta 1020
gaaaccatcc atgactga 1038
<210> 14 <2Í1> 345 <212> PRT <213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (4)...(123)
<223> Família oxidorredutase, Dobra Rossmann ("Rossmann fold) ligada ao NAD)<220>
<221> DOMÍNIO<222> (135) . . . (248)
<223> Família oxidorredutase, domínio alfa/beta c-terminal<400> 14
Met Ser Pro Vai Arg Vai Ala Vai lie Gly Ala Gly Gln lie Ala Gln15 10 15
Arg Gly His Leu Pro Gly Leu Leu Glu Ala Gly Ala Glu lie Thr Vai20 .25 30
Leu Cys Asp Asn Ser Leu Pro Gln Leu Glu Glu lie Gly Ala Lys Phe35 40 45
His Vai His Arg Vai Tyr Arg Asp Trp His Ala Met Leu Asp Ala Gly50 55 60
Gly Phe Glu Ala Vai Thr lie Cys Thr Pro Pro Phe Leu His Ala Glu65 70 75 80
Met Ala lie Glu Cys Ala Arg Arg Gly Leu His Vai Leu Vai Glu Lys85 90 95
Pro Met Ala Vai Asn Leu Gln Gln Cys Asp Gln Met lie Ala Ala Ser100 105 110
Glu Gln Ala115
Gly Thr lie Leu Met Vai Ser His Asn120
Gln Arg Phe Met125Glu Ala His Arg Leu Ala Lys Glu lie Leu Asp Ala Gly Leu Leu Gly130 135 140
Arg Leu Tyr Leu Ala His Gly Vai Phe Gly His Gly Gly Pro Glu Vai145 150 155 160
Trp Ser Pro Thr Gln Gln Trp Tyr Phe Arg Pro Asp Arg Ala Gly Ala165 170 175
Gly Vai lie Ala Asp Leu Gly Tyr His Lys Leu Asp Leu lie Arg Trp180 185 190
Leu Thr Gly Gln Glu lie Thr Ala Vai Gly Ala Leu Gly Ala Thr Phe195 200 205
Glu Lys Gln Thr Ser Leu Glu Asp Ser Ala Vai Met Leu Vai His Leu210 215 220
Ser Glu Gly Thr Leu Ala Thr lie Gln Vai Ser Trp Vai Phe Arg Pro225 230 235 240
Asp Trp Glu Asn Ser Leu Vai Leu Arg Gly Glu Arg Gly Vai Leu Ala245 250 255
lie Pro Thr Asp Ala Ser Gln Pro Leu Arg Vai Ser Tyr lie Ser Ser260 265 270
Ser Gly Gln Vai lie Glu Ser Thr His Arg Cys Asp Ser Gly Asp Thr275 280 285
Ser Gly Trp Phe Gly Ala lie Arg Ala Phe Leu Thr Ala lie Glu Lys290 295 300
Ser Ala Pro Ala Pro lie Asp Gly Lys Glu Gly Arg Ala Vai Met Ala305 310 315 320
Ala Vai Leu Ala Ala Thr Arg Ser lie Gln Lys His Thr lie lie Ser325 330 335
lie Thr Glu Vai Glu Thr lie His Asp340 345
<210> 15<211> 1347<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental
<400> 15atgactgacc atcgttttcc aaaaggattc atctggggaa ccgctacggc gtctttccag 60
attgaaggcg ccacccgcga agatggccgg ggcgaatcca tctgggaccg cttctgcgcc 120
acgccgggga aaattgtcac gggcgaaacc ggcgatcctg cctgcgactc ctatcatcgt 180
taccctgaag acatcgccct gatgaaggct atgtcgctca atggttaccg cttttcaatc 240
gcctggcctc gcgtcattcc tgacggagac ggtaaagtct gtcaggccgg gctcgactac 300
tacgatcgtg tggtagatgc tctcctggcg gagaatatcc aaccttttat caccctgtac 3 60
cactgggacc tgccccaggc attacaggat cggggtggct ggggcaaccg tgccacggtt 420
gaggcgttca ctcgctacgt agatattgtg gtttctcgcc tgggtgaccg cgtaaagtac 480
tggatgacac acaacgaacc"ctggtgtgta tccattttga gccatgagct tggtgaacat 540
gcccccgggt tgaaggaccg aaaactggcc ctccaggtgg cgcaccatgt cctcgtttct 600
cacggcctgg ccgtgcccat catccgccag cgttgtaaag aggcgcaggt tggcatcgtg 660
ttgaattttt cacctgctta cccggccacc gatagcctgg ccgaccagat ggccacccgt 720
cagcaccacg cccggtttaa cctctggttc ctcgatccca tcgccgggcg cggctacccg 780
caggatgcct gggaagggta cggagccgat gttcccgcca tgaggcctga tgacatgcag 840
atcatcgccg cccccatcga cttcctgggc gtcaatttct acagtcgggc ggtctgccac 900
gatccggccg ggggcgaagg ttcccgggtg ctcaatgtgc gcagtaaaac cgaggccacc 960
gatcgagact gggagattta ccctcaggcg ctctacgatt tactcatctg gatccacaat 1020
ggataccagt tcagagatat ttacattacc gagaatggcg cctcatacaa cgatgtggtc 1080
tccccggatg ggaaagtgca cgatcctaaa cgtctggact atctgaaacg ccatctggcc 1140
atggctctgc gggccatcga agcgggcgtt ccactgcgtg gttatttctg ctggagcttg 1200
atggacaact tcgaatgggc catgggcacc agcagccgat tcgggttggc ctacaccgac 1260
ttcactaccc agaagcgtat tctcaaagac agtgggctct ggtttggcga agtggcacgg 1320
gcaaacgcct taatcgacct tccctga 1347
<210> 16
<211> 448
<212> PRT ?.
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (2)...(444)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222>. (10) . . . (24)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<220>
<221> SÍTIO<222> (352) . . . (360)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572<400> 16
Met Thr Asp His Arg Phe Pro Lys Gly Phe lie Trp Gly Thr Ala Thr15 10 15
Ala Ser Phe Gln lie Glu Gly Ala Thr Arg. Glu Asp Gly Arg Gly Glu20 25 30
Ser lie Trp Asp Arg Phe Cys Ala Thr Pro Gly Lys lie Vai Thr Gly35 40 45
Glu Thr .Gly Asp Pro Ala Cys Asp Ser Tyr His Arg Tyr Pro Glu Asp50 55 60
lie Ala Leu Met Lys Ala Met Ser Leu Asn Gly Tyr Arg Phe Ser lie65 70 75 80
Ala Trp Pro Arg Vai lie Pro Asp Gly Asp Gly Lys Vai Cys Gln Ala85 90 95
Gly Leu Asp Tyr Tyr Asp Arg Vai Vai Asp Ala Leu Leu Ala Glu Asn100 105 110
lie Gln Pro Phe lie Thr Leu Tyr His Trp Asp Leu Pro Gln Ala Leu115 120 125
Gln Asp Arg Gly Gly Trp Gly Asn Arg Ala Thr Vai Glu Ala Phe Thr130 135 140
Arg Tyr Vai Asp lie Vai Vai Ser Arg Leu Gly Asp Arg Vai Lys Tyr145 150 155 160
Trp Met Thr His Asn Glu Pro Trp Cys Vai Ser lie Leu Ser His Glu165 170 175
Leu Gly Glu His Ala Pro Gly Leu Lys Asp Arg Lys Leu Ala Leu Gln180 185 190
Vai Ala His His Vai Leu Vai Ser His Gly Leu Ala Vai Pro lie lie195 200 205
Arg Gln Arg Cys Lys Glu Ala Gln Vai Gly lie Vai Leu Asn Phe Ser210 215 220
Pro Ala Tyr Pro Ala Thr Asp Ser Leu Ala Asp Gln Met Ala Thr Arg225 230 235 240
Gln His His Ala Arg Phe Asn Leu Trp Phe Leu Asp Pro lie Ala Gly245 250 255Arg Gly Tyr Pro Gln Asp Ala Trp Glu Gly Tyr Gly Ala Asp Vai Pro260 265 270
Ala Met Arg Pro Asp Asp Met Gln lie lie Ala Ala Pro lie Asp Phe275 280 285
Leu Gly Vai Asn Phe Tyr Ser Arg Ala Vai Cys His Asp Pro Ala Gly290 295 300
Gly Glu Gly Ser Arg Vai Leu Asn Vai Arg Ser Lys Thr Glu Ala Thr305 310 315 320
Asp Arg Asp Trp Glu lie Tyr Pro Gln Ala Leu Tyr Asp Leu Leu lie325 330 335
Trp lie His Asn Gly Tyr Gln Phe Arg Asp lie Tyr lie Thr Glu Asn340 345 350
Gly Ala Ser Tyr Asn Asp Vai Vai Ser Pro Asp Gly Lys Vai His Asp355 360 365
Pro Lys Arg Leu Asp Tyr Leu Lys Arg His Leu Ala Met Ala Leu Arg370 375 380
Ala lie Glu Ala Gly Vai Pro Leu Arg Gly Tyr Phe Cys Trp Ser Leu385 390 395 400
Met Asp Asn Phe Glu Trp Ala Met Gly Thr Ser Ser Arg Phe Gly Leu405 410 415
Ala Tyr Thr Asp Phe Thr Thr Gln Lys Arg lie Leu Lys Asp Ser Gly420 425 430
Leu Trp Phe Gly Glu Vai Ala Arg Ala Asn Ala Leu lie Asp Leu Pro435 440 445
<210> 17 <211> 1215 <212> DNA <213> Desconhecido
<220> <223> Obtido a partir de uma amostra ambiental
<400> 17 atgcggtacg tgctgatttc ctgccttgcg ctggcttccc tgtgcgcgca gcctcttcct 60
gtttccacgc ctgaaaaaga gggcttctcg gcggagcgcc tcgggcggat gcaccggtat 120
ttcgagaacc tgacgaaaac cggagagcgg cctggcgcga tcacgctgat cgtgcgcaac 180
gggcgcatcg tggactggcg cacgttcggg ctgcgcgacg tcgagaacaa tctgccgatg 240
gagaaggaca cgatcgtcca catctactcg atgacgaagc cggtgacgtc cgtggccgtg 300atgatgctgg tggaggaggg caggctggcg ctggacgacc gggtggacaa gttcattccc 360
gagttcaagg ggatgaaggt gtacaagggc ggcacggtgg agcggccgga gctggaggac 420
gcggcgcggc cgatcacggt gaagcatctg ctgacgcaca cgagcgggct gagctacggc 480
tggggcaacg acaacgtctc cgcgatgtac cgcaaggccg acccgctcgg cgcgccgagc 540
ctgaaagagt ttatcgacag gctggtgaaa ctgccgctgg cattccaccc gggcgagcgt 600
tacgagtatt cgatgtcgat cgacgtgctg ggctacctgg tggaggctgt ctccggcgag 660
ccgttcgatc agttcgtgga gaagcggatc acggggccgc tgaagatgaa cgacacgcat 720
ttcagactgc cggaggcgaa gcgggcgcgg ctggcgaaga tctactcgcg gcgcgagggg 780
aagctgacgg cgcagcgcgg cctgcagacg ggaggcgttc cgtacggcgg catggggctg 840
tactcgacga tcggcgacta tgcgcggttc gcgcagatgc tgttgaacgg cggccatctc 900
gacggagtgc gcctgctggg gcggaagacg gtggatctga tgatgatgaa ccatctgggc 960
ggactgtcga agccgacgat cggcggcgat gattcagcgg gattcggact gggcggagcg 1020
gtgcggatcg atccggcgaa atcgggccgt ccgggcacgg aaggactctt cggctgggac 1080
ggggcggctt cgacgtattt ccgggtggac cggaaagaga agctggcgat gctgctgttc 1140
ctgcaatgga tgccgtttga tcaggggacg ctgaacctgt acgagacgct ggtctaccaa 1200
gctctggtgg actga 1215
<210> 18<211> 404<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (37)...(400)<223> Beta-lactamase
<220>
<221> SÍTIO<222> (43)...(46)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001
<220>
<221> SÍTIO
<222> (167)...(170)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (240)...(243)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001
<400> 18
Met Arg Tyr Vai Leu lie Ser Cys Leu Ala Leu Ala Ser Leu Cys Ala1 5 10 15
Gln Pro Leu Pro Vai Ser Thr Pro Glu Lys Glu Gly Phe Ser Ala GluArg Leu Gly Arg Met His Arg Tyr Phe Glu Asn Leu Thr Lys Thr Gly35 40 45
Glu Arg Pro Gly Ala lie Thr Leu lie Vai Arg Asn Gly Arg lie Vai50 55 60
Asp Trp Arg Thr Phe Gly Leu Arg Asp Vai Glu Asn Asn Leu Pro Met65 70 75 80
Glu Lys Asp Thr lie Vai His lie Tyr Ser Met Thr Lys Pro Vai Thr85 90 95
Ser Vai Ala Vai Met Met Leu Vai Glu Glu Gly Arg Leu Ala Leu Asp100 105 110
Asp Arg Vai Asp Lys Phe lie Pro Glu Phe Lys Gly Met Lys Vai Tyr115 ■ 120 125
Lys Gly Gly Thr Vai Glu Arg Pro Glu Leu Glu Asp Ala Ala Arg Pro130 135 140
ile Thr Vai Lys His Leu Leu Thr His Thr Ser Gly Leu Ser Tyr Gly145 150 155 160
Trp Gly Asn Asp Asn Vai Ser Ala Met Tyr Arg Lys Ala Asp Pro Leu165 170 175
Gly Ala Pro Ser Leu Lys Glu Phe Ile Asp Arg Leu Vai Lys Leu Pro180 185 190
Leu Ala Phe His Pro Gly Glu Arg Tyr Glu Tyr Ser Met Ser Ile Asp195 200 205
Vai Leu Gly Tyr Leu Vai Glu Ala Vai Ser Gly Glu Pro Phe Asp Gln210 , 215 220
Phe Vai Glu Lys Arg Ile Thr Gly Pro Leu Lys Met Asn Asp Thr His225 230 235 240
Phe Arg Leu Pro Glu Ala Lys Arg Ala Arg Leu Ala Lys Ile Tyr Ser245 250 255
Arg Arg Glu Gly Lys Leu Thr Ala Gln Arg Gly Leu Gln Thr Gly Gly260 265 270
Vai Pro Tyr Gly Gly Met Gly Leu Tyr Ser Thr Ile Gly Asp Tyr Ala275 280 285Arg Phe Ala Gln Met Leu Leu Asn Gly Gly His Leu Asp Gly Vai Arg
290 295 300
Leu Leu Gly Arg Lys Thr Vai Asp Leu Met Met Met Asn His Leu Gly
305 310 315 320
Gly Leu Ser Lys Pro Thr lie Gly Gly Asp Asp Ser Ala Gly Phe Gly
325 330 335 .
Leu Gly Gly Ala Vai Arg lie Asp Pro Ala Lys Ser Gly Arg Pro Gly
340 - 345 350
Thr Glu Gly Leu Phe Gly Trp Asp Gly Ala Ala Ser Thr Tyr Phe Arg
355 360 365
Vai Asp Arg Lys Glu Lys Leu Ala Met Leu Leu Phe Leu Gln Trp Met
370 375 380
Pro Phe Asp Gln Gly Thr Leu Asn Leu Tyr Glu Thr Leu Vai Tyr Gln
385 390 395 400
Ala Leu Vai Asp
<210> 19
<211> 1794
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 19
atgcccgttt tgttcgccct gtttcttgtt gcctcgtcct gcgcggcgca gtcgctggcc 60
gggccggttt ccctgcttgg cggagatgcg ggcgcggcgt tccgctatac cgggccatcg 120
gcgggcgcgg cgagcggctc ggccgaatgg gtggcggtgg agaacatgcc gttcacgcac 180
gcctggcggc tgcgcacgaa tccgctgccg gagagcggcg gcaacgaatg ggacctgcgc 240
atccgcgccc gcggagcggc ggctgtttcg gcaggggaca agatcctggc cgagttctgg 300
atgcgctgcg tggagcccga aaacggcgac tgcattctgc gcctgaacgt ggagcgcgac 3 60
gggtcgccgt ggaccaaatc catcagcaac ccctacccgg tgggccggga gtggcggcgg 420
ttccgcgtgc tgttcgagat gcgggagagc tacgccgccg gcggctacat gatcgatttc 480
tggatgggcc agcaggtgca gacggcggaa gtgggcggga tttccctgct gaattacggt 540
ccgcaggcca cggccgagca gcttggcctg gaccggtttt atgagggcgc ggcggcggac 600
gccgcgtggc ggcaggcggc cgagcagcgg atcgaggaga tccggaaagc gggcatgatc 660
atcgtggcgg tgacgccgga cggcgagccg atcgagggcg ctgaaatccg ggcgaagctg 720
aagcggcacg cgttcgggtg gggcacggct gtggcggcat cacggcttct ggggacggga 780acggacagcg agcgctaccg caacttcatc cgcgagaact tcaacatggc ggtgctcgag 840
aacgacctga aatggggccc gttcgaagag aaccgcaacc gcgcgatgaa cgcgctgcgc 900
tggctgcatg agaacgggat cacgtggatc cgcgggcaca atctcgtctg gccgggctgg 960
cggtggatgc cgaacgacgt gcgcaacctg gcgaacaatc ccgaggcgct gcggcagcgg 1020
attctggacc gcatccggga cacggccacg gccacgcgcg ggctggtggt gcactgggac 1080
gtcgtcaacg agccggtggc cgagcgcgac gtgctgaaca ttctgggcga cgaggtgatg 1140
gcggactggt tccgcgccgc gaaggagtgc gatcccgagg cgaggatgtt catcaatgag 1200
tacgacattc tggcggcgaa cggggccaat ctgcggaagc agaacgcgtá ttaccgcatg 1260
atcgagatgc tgttgaagct cgaggcgccg gtggagggca tcggcttcca gggccacttc 1320
gacacggcca cgccgccgga gcggatgctg gagatcatga accggtacgc ccggctcggg 1380
ctgccgatcg ccatcaccga gtacgatttc gccacggcgg acgaggagct gcaggcgcag 1440
ttcacgcgcg acctgatgat tctcgccttc agccatccgg cggtttcgga cttcctgatg 1500
tggggcttct gggaagggag ccactggaag ccgctgggcg ccatgatccg gcgcgactgg 1560
agcgagaagc cgatgtaccg cgtctggcgc gagctgatct tcgagcgctg gcagacggat 1620
gaaacaggcg tgacgccgga gcacggtgcc atctacgtgc ggggcttcaa gggcgactac 1680
gagatcacgg tgaaggcggg cgggcaggaa gtccgggtgc cgtacacgct gaaagaagac 1740
ggccaggtgc tgtgggtgac ggtgggcggg gcttctgaag agcgcgtgca gtaa 1794
<210> 20<211> 597<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL<222> (1)...(20)
<220>
<221> DOMÍNIO<222> (235),. . . (533)
<223> Família glicosil hidrolase 10<220>
<221> SÍTIO
<222> (467)...(477)
<223> Família glicosil hidrolase 10 active sítio. Pró-sitio id = PS00591<400> 20
Met Pro Vai Leu Phe Ala Leu Phe Leu Vai Ala Ser Ser Cys Ala Ala15 10 15
Gln Ser Leu Ala Gly Pro Vai Ser Leu Leu Gly Gly Asp Ala Gly Ala20 25 30
Ala Phe Arg Tyr Thr Gly Pro Ser Ala Gly Ala Ala Ser Gly Ser Ala35 40 45Glu Trp Vai Ala Vai Glu Asn Met Pro Phe Thr His Ala Trp Arg Leu50 55 60
Arg Thr Asn Pro Leu Pro Glu Ser Gly Gly Asn Glu Trp Asp Leu Arg65 70 75 80
lie Arg Ala Arg Gly Ala Ala Ala Vai Ser Ala Gly Asp Lys lie Leu85 90 95
Ala Glu Phe Trp Met Arg Cys Vai Glu Pro Glu Asn Gly Asp Cys lie100 105 110
Leu Arg Leu Asn Vai Glu Arg Asp Gly Ser Pro Trp Thr Lys Ser lie115 120 125
Ser Asn Pro Tyr Pro Vai Gly Arg Glu Trp Arg Arg Phe Arg Vai Leu130 135 140
Phe Glu Met Arg Glu Ser Tyr Ala Ala Gly Gly Tyr Met lie Asp Phe145 150 155 160
Trp Met Gly Gln Gln Vai Gln Thr Ala Glu Vai Gly Gly lie Ser Leu165 170 175
Leu Asn Tyr Gly Pro Gln Ala Thr Ala Glu Gln Leu Gly Leu Asp Arg180 185 190
Phe Tyr Glu Gly Ala Ala Ala Asp Ala Ala Trp Arg Gln Ala Ala Glu195 200 205
Gln Arg lie Glu Glu lie Arg Lys Ala Gly Met lie lie Vai Ala Vai210 215 220
Thr Pro Asp Gly Glu Pro lie Glu Gly Ala Glu lie Arg Ala Lys Leu225 230 235 240
Lys Arg His Ala Phe Gly Trp Gly Thr Ala Vai Ala Ala Ser Arg Leu245 250 255
Leu Gly Thr Gly Thr Asp Ser Glu Arg Tyr Arg Asn Phe lie Arg Glu260 265 270
Asn Phe Asn Met Ala Vai Leu Glu Asn Asp Leu Lys Trp Gly Pro Phe275 280 285
Glu Glu Asn Arg Asn Arg Ala Met Asn Ala Leu Arg Trp Leu His Glu290 295 300
Asn Gly lie Thr Trp lie Arg Gly His Asn Leu Vai Trp Pro Gly Trp305 310 315 320
Arg Trp Met Pro Asn Asp Vai Arg Asn Leu Ala Asn Asn Pro Glu Ala325 330 335
Leu Arg Gln Arg lie Leu Asp Arg lie Arg Asp Thr Ala Thr Ala Thr340 345 350
Arg Gly Leu Vai Vai His Trp Asp Vai Vai Asn Glu Pro Vai Ala Glu355 360 365
Arg Asp Vai Leu Asn lie Leu Gly Asp Glu Vai Met Ala Asp Trp Phe370 375 380
Arg Ala Ala Lys Glu Cys Asp Pro Glu Ala Arg Met Phe lie Asn Glu385 390 395 400
Tyr Asp lie Leu Ala Ala Asn Gly Ala Asn Leu Arg Lys Gln Asn Ala405 410 415
Tyr Tyr Arg Met lie Glu Met Leu Leu Lys Leu Glu Ala Pro Vai Glu420 425 430
Gly lie Gly Phe Gln Gly His Phe Asp Thr Ala Thr Pro Pro Glu Arg435 440 445
Met Leu Glu lie Met Asn Arg Tyr Ala Arg Leu Gly Leu Pro lie Ala450 455 460
lie Thr Glu Tyr Asp Phe Ala Thr Ala Asp Glu Glu Leu Gln Ala Gln465 470 475 480
Phe Thr Arg Asp Leu Met lie Leu Ala Phe Ser His Pro Ala Vai Ser485 490 495
Asp Phe Leu Met Trp Gly Phe Trp Glu Gly Ser His Trp Lys Pro Leu. 500 505 510
Gly Ala Met lie Arg Arg Asp Trp Ser Glu Lys Pro Met Tyr Arg Vai515 520 525
Trp Arg Glu Leu lie Phe Glu Arg Trp Gln Thr Asp Glu Thr Gly Vai530 535 540
Thr Pro Glu His Gly Ala lie Tyr Vai Arg Gly Phe Lys Gly Asp Tyr545 550 555 560
Glu lie Thr Vai Lys Ala Gly Gly Gln Glu Vai Arg Vai Pro Tyr Thr565 570 575Leu Lys Glu Asp Gly Gln Vai Leu Trp Vai Thr Vai Gly Gly Ala Ser580 585 590
Glu Glu Arg Vai Gln595
<210> 21<211> 1032<212> DNA
<213> Clostridium thermocellum<400> 21
atggtgagtt ttaaagcagg tataaattta ggcggatgga tatcacaata tcaagttttc 60
agcaaagagc atttcgatac attcattacg gagaaggaca ttgaaactat tgcagaagca 120
gggtttgacc atgtcagact gccttttgat tatccaatta tcgagtctga tgacaatgtg 180
ggagaatata aagaagatgg gctttcttat attgaccggt gccttgagtg gtgtaaaaaa 240
tacaatttgg ggcttgtgtt ggatatgcat cacgctcccg ggtaccgctt tcaagatttt 300
aagacaagca ccttgtttga agatccgaac cagcaaaaga gatttgttga catatggaga 360
tttttagcca agcgttacat aaatgaacgg gaacatattg cctttgaact gttaaatgaa 420
gttgttgagc ctgacagtac ccgctggaac aagttgatgc ttgagtgtgt aaaagcaatc 480
agggaaattg attccaccag gtggctttac attgggggca ataactataa cagtcctgat 540
gagcttaaaa accttgcaga tattgatgat gattacatag tttacaattt ccatttttac 600
aatccttttt tctttacgca tcagaaagcc cactggtcgg aaagtgccat ggcgtacaac 660
aggactgtaa aatatccggg acaatatgag ggaattgaag agtttgtgaa aaataatcct 720
aagtacagtt ttatgatgga attgaataac ctgaagctga ataaagagct tttgcgcaaa 780
gatttaaaac cagcaattga gttcagggaa aagaaaaaat gcaaactata ttgcggggag 840
tttggcgtaa ttgccattgc tgacctggag tccaggataa aatggcatga agattatata 900
agtcttctag aggagtatga tatcggcggc gcggtgtgga actacaaaaa aatggatttt 960
gaaatttata atgaggatag aaaacctgtc tcgcaagaat tggtaaatat actggcgaga 1020
agaaaaactt ga 1032
<210> 22<211> 343<212> PRT
<213> Clostridium thermocellum
<220>
<221> DOMÍNIO<222> (1)...(323)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO<222> (15)...(32)
<223> Assinatura de proteínas de ligação de ácidos graxos citossólicos pró-sítio id=PS00214
<220><221> SITIO
<222> (135)...(144)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659<220>
<221> SÍTIO
<222> (223) . . . (226)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 22
Met Vai Ser Phe Lys Ala Gly lie Asn Leu Gly Gly Trp lie Ser Gln15 10 15
Tyr Gln Vai Phe Ser Lys Glu His Phe Asp Thr Phe lie Thr Glu Lys20 25 30
Asp lie Glu Thr lie Ala Glu Ala Gly Phe Asp His Vai Arg Leu Pro35 40 45
Phe Asp Tyr Pro lie lie Glu Ser Asp Asp Asn Vai Gly Glu Tyr Lys50 55 60
Glu Asp Gly Leu Ser Tyr lie Asp Arg Cys Leu Glu Trp Cys Lys Lys65 70 75 80
Tyr Asn Leu Gly Leu Vai Leu Asp Met His His Ala Pro Gly Tyr Arg85 90 95
Phe Gln Asp Phe Lys Thr Ser Thr Leu Phe Glu Asp Pro Asn Gln Gln100 105 110
Lys Arg Phe Vai Asp lie Trp Arg Phe Leu Ala Lys Arg Tyr lie Asn115 120 125
Glu Arg Glu His lie Ala Phe Glu Leu Leu Asn Glu Vai Vai Glu Pro130 135 140
Asp Ser Thr Arg Trp Asn Lys Leu Met Leu Glu Cys Vai Lys Ala lie145 150 155 160
Arg Glu lie Asp Ser Thr Arg Trp Leu Tyr lie Gly Gly Asn Asn Tyr165 170 175
Asn Ser Pro Asp Glu Leu Lys Asn Leu Ala Asp Ile.Asp Asp Asp Tyr180 185 190
lie Vai Tyr Asn Phe His Phe Tyr Asn Pro Phe Phe Phe Thr His Gln195 200 205
Lys Ala His Trp Ser Glu Ser Ala Met Ala Tyr Asn Arg Thr Vai Lys210 215 220
Tyr Pro Gly Gln Tyr Glu Gly lie Glu Glu Phe Vai Lys Asn Asn Pro225 230 235 240
Lys Tyr Ser Phe Met Met Glu Leu Asn Asn Leu Lys Leu Asn Lys Glu245 250 255
Leu Leu Arg Lys Asp Leu Lys Pro Ala lie Glu Phe Arg Glu Lys Lys260 265 270
Lys Cys Lys Leu Tyr Cys Gly Glu Phe Gly Vai lie Ala lie Ala Asp275 280 285
Leu Glu Ser Arg lie Lys Trp His Glu Asp Tyr lie Ser Leu Leu Glu290 295 300
Glu Tyr Asp lie Gly Gly Ala Vai Trp Asn Tyr Lys Lys Met Asp Phe305 310 315 320
Glu lie Tyr Asn Glu Asp Arg Lys Pro Vai Ser Gln Glu Leu Vai Asn325 330 335
lie Leu Ala Arg Arg Lys Thr340
<210> 23<211> 3966<212> DNA
<213> Clostridium thermocellum<400> 23
atgtataaaa gattattgtc gtcagtactg ataattatgc tgttattatc agcctggtcg 60
ccaatatccg tacaagcttc tgatggaatc aatgacatta gaggtcattg ggctgaagaa 120
gacttgaaca aatggatgga aaaaggtatt ttggtgggct accaggatgg gacgataagg 180
cccgataata atatcacaag agccgaattt gtcacattaa ttaacaaggt tttcgggctt 240
tatgaattaa gccgggagca attcgcagat gttgaagact caaaatggta ttcccgtgaa 300
atattaaaag ccagggctgc gggatatatt gcaggttatg gaagcaatgt tttcaaacct 360
gacaattata ttacaagaca agaagccgtt gttataatcg cgaaagtttt tgaacttcaa 420
agcggcagca attatacaag caagtttaaa gatggaagtc tggtaaagga atacgcaaaa 480
gattccgtta gcgcgttggt tgaaaaaggc tacatagcag gttatgaaga tggcactttc 540
aggccggaca actacattac ccgtgcagaa acaataaaaa ttctgaataa aattattcct 600
tccttgtata acgagaaagg agattataaa aatgaagaag tagccggaaa cgctctgatt 660
aacaccgaag gagttatttt aaaagatacc gtaataaacg gggatttgta tcttgctcag 720
ggaattcaga acggcgatgt tacccttgac ggtgtgaatg taaaaggaac ggttttcgta 780
aatggtggag gaagcgacag catacatttt ataaatacga aaataaacag ggttgttgtc 840
aataaaacag gagttagaat tgtaacttcc ggcaatacct cggttgaaag tgttgtcgtt 900aaatccggtg caaaacttga agaaaaagaa ttgacgggcg acggctttaa aaacgttaca 960
gtcgattctc aactttcagc cggcaatgaa ataatatttg tcggggattt tgaacaggtc 1020
gatgttctgg cggatgatgc cttgctggaa accaaagagg caaaaatgaa actgagaata 1080
ttcggccaaa ggattaaagt aaatggaaag gcaatagaaa aatcatcaaa gaactatatt 1140
gtaaacgggg aacttatatc aactgaggaa gaacccggtc cttccgacgc acccggtgcg 1200
gaagacgatc aaaattcagg tagtccgggc tcatcgacta atcctgcacc aaccaagaat 1260
ccgaatgaag agtggcgtct ggtttggagc gatgagttta acggttctga aataaatatg 1320
gctaattgga gctatgacga cccgaccaac ggaagatgga acggggaagt acaatcctac 13 80
acacaaaaca atgcctatat caaagacggc gcgttggtta ttgaagcaag aaaagaagac 1440
attacggaac caagcggtga gacttatcat tatacatcgt caaagctgat taccaaaggc 1500
aaaaagtcat ggaagtacgg aaaatttgaa ataagggcaa aaatgccaca gggacaaggt 1560
atatggcctg caatctggat gatgccggaa gacgaaccct tctacggaac atggccaaag 1620
tgcggcgaaa tagatattat ggagcttttg ggccacgagc ctgataaaat ttatggaacg 1680
atccattttg gagagcctca taaagaatcc cagggaacgt ataccttgcc ggaaggccag 1740
acttttgctg atgatttcca cgtttattcg attgaatggg aaccgggaga aatacgctgg 1800
tatatagacg gcaagctgta tcatgtcgct aatgactggt actcgaggga cccgtacctt 1860
gccgatgact acacttatcc cgcacctttt gaccagaatt tcttcttgat tctcaatata 1920
tccgttggtg gcggctggcc gggatatcct gacgaaacga cagttttccc gcagcaaatg 1980
gttgtggact atgtgagagt atatcaaaaa gataaatatc ctcacaggga aaaaccggca 2 040
aaggaagaag tgaagccaag agagcctctt gaggacggca attatatcta taacggcggt 2100
tttgatgtgg atgattctgc agcagttggt gtggacggtg ttccctatac gtcttactgg 2160
acattcttaa cagcatccgg tggagctgcg acagtcaatg tagaggaagg tgttatgcac 2220
gtacagatag aaaacggagg gacaaccgac tacggcgtac aattgcttca agctccgatt 2280
catcttgaaa aaggcgcaaa atataaagca tcttttgaca tgaaagctga aaatccaagg 2340
caggtaaaac .tgaaaatagg cggagacggc gacaggggat ggaaagatta tgcggctatt 2400
ccaccgttta cggtctcaac agagatgacc aactatgagt ttgagtttac tatgaaagat 2460
gataccgatg ttaaggcacg gtttgagttt aatatgggtt tggacgataa tgatgtctgg 252 0
attgacaatg ttaaactgat taaaacagaa gatgcgccgg ttatagatcc ttccgaaata 2580
gcaagacctc cgcttctttc cggcaactat atatacaacg gtacctttga ccaaggtccg 2640
aacagaatgg gattctggaa ttttgttgtg gatagcactg caaaggctac atactatatt 2700
ggaagcgatg ttaatgagcg caggtttgaa acaagaatag aaaaaggcgg aacatcgagg 2760
ggagccataa gattggttca gccgggaatt aacattgaaa acggcaaaac atacaaggtt 2820
agcttcgaag ccagtgcggc aaatacaaga actattgagg tggaaattgc aagcaatctt 2880
cacaacagca gcatttttgc gacaactttt gaaataagca aagagagcaa gatatacgaa 2940tttgagttta caatggacaa agattcggac aagaacggag aacttaggtt caatctgggc 3000
ggaagcaacg tgaacgtcta tattgataat gtcgttatga aaagagtaag taccgatgaa 3060
gttgaaggaa acctgatttt aaacggcgta tttaacggcc tggcaggctg gggatatgga 3120
gcgtatgaac ctggatcggc agattttgaa agtcatgagg aacaatttag ggcaattatt 3180
agctctgtcg gtaatgaagg ttggaatgta cagttgtatc aggataatgt tccgctggaa 3240
caagggcaaa cctacgaagt ttcttttgat gcaaaatcaa cgattgacag aaagataatt 3300
gttcagctgc aaaggaacgg tacttcggat aataattggg actcctattt ctatcaagaa 3360
gttgaactta ctaatgaact taaaacattc aaatatgaat ttacaatgag taaacctaca 3420
gattcggcgt caagatttaa ttttgctttg ggtaatactg aaaacaaaac ttatgctcct 3480
catgaaataa taattgacaa tgttgtagta agaaaagttg cgactccttc tgcgctgata 3540
ttgaacggaa cctttgacga tggaatggat cattggctgc tatactgggg agacggtgaa 3600
ggcaattgcg atgtaactga cggagagctt gaaattaaca ttaccaaggt aggtaccgcg 3660
gattacatgc cgcagattaa acaggaaaac atagcgttgc aagagggtgt gacgtatact 3720
ttgtctctta aagcgagagc gcttgaggca agaagtatta aagtggacat attggattct 3780
tcttataact ggtatggcgg aactattttc gatttaacaa cggaagatgc cgtatacacg 3840
tttacatttã cccaaagcaa gtcgataaat aacggtgtct taactataaa tttaggtacc 3900
atagaaggta agacatccgc cgcaactact gtctatcttg atgatatttt gctggaacaa 3960
cagtaa 3966
<210> 24<211> 1321<212> PRT
<213> Clostridium thermocellum<220>
<221> SIGNAL '<222> (1)...(26)
<220>
<221> DOMÍNIO
<222> (30)...(71)
<223> Domínio de homologia da camada S<220>
<221> DOMÍNIO
<222> (88)...(130)
<223> Domínio de homologia da camada S<220>
<221> DOMÍNIO
<222> (149)...(192)
<223> Domínio de homologia da camada S<220>
<221> DOMÍNIO
<222> (445)...(666)
<223> Família glicosil hidrolase 16<220><221> DOMÍNIO<222> (693)...(849)
<223> Domínio de ligação de carboidrato<220>
<221> DOMÍNIO
<222> (868)... (1016)
<223> Domínio de ligação de carboidrato<220>
<221> DOMÍNIO
<222> (1023) ... (1173)
<223> Domínio de ligação de carboidrato<220>
<221> DOMÍNIO
<222> (1177)...(1321)
<223> Domínio de ligação de carboidrato
<220>
<221> SÍTIO
<222> (146)...(149)
<223> Sítio de N-glicosilação
Pró-sitio id
PS00001
<220>
<221> SÍTIO
<222> (285) .. . (288) '
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001
<220>
<221> SÍTIO
<222> (296)...(299)
<223> Sítio de N-glicosilação
Pró-sitio id = PS00001
<220>
<221> SÍTIO
<222> (322)...(325)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001
<220>
<221> SÍTIO
<222> (440)...(443)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO -<222> (448).. .(451)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (648)...(651)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001
<220>
<221> SÍTIO
<222> (886)...(889)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001
<220>
<221> SÍTIO
<222> (976)...(979)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001
<220>
<221> SÍTIO<222> (1123)
(1126)<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (1172) . . . (1175)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (1200) . . . (1203)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (1231) ... (1234)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 24
Met Tyr Lys Arg Leu Leu Ser Ser Vai Leu lie lie Met Leu Leu Leu1 5 10 15
Ser Ala Trp Ser Pro lie Ser Vai Gln Ala Ser Asp Gly lie Asn Asp20 25 30
lie Arg Gly His Trp Ala Glu Glu Asp Leu Asn Lys Trp Met Glu Lys35 40 45
Gly lie Leu Vai Gly Tyr Gln Asp Gly Thr lie Arg Pro Asp Asn Asn50 55 60
lie Thr Arg Ala Glu Phe Vai Thr Leu lie Asn Lys Vai Phe Gly Leu65 70 75 80
Tyr Glu Leu Ser Arg Glu Gln Phe Ala Asp Vai Glu Asp Ser Lys Trp85 90 95
Tyr Ser Arg Glu lie Leu Lys Ala Arg Ala Ala Gly Tyr lie Ala Gly100 105 110
Tyr Gly Ser Asn Vai Phe Lys Pro Asp Asn Tyr lie Thr Arg Gln Glu115 120 125
Ala Vai Vai lie lie Ala Lys Vai Phe Glu Leu Gln Ser Gly Ser Asn130 135 140
Tyr Thr Ser Lys Phe Lys Asp Gly Ser Leu Vai Lys Glu Tyr Ala Lys145 150 155 160
Asp Ser Vai Ser Ala Leu Vai Glu Lys Gly Tyr lie Ala Gly Tyr Glu165 170 175
Asp Gly Thr Phe Arg Pro Asp Asn Tyr lie Thr Arg Ala Glu Thr lie180 185 190
Lys lie Leu Asn Lys lie lie Pro Ser Leu Tyr Asn Glu Lys Gly Asp195 200 205
Tyr Lys Asn Glu Glu Vai Ala Gly Asn Ala Leu lie Asn Thr Glu Gly210 215 220
Vai lie Leu Lys Asp Thr Vai lie Asn Gly Asp Leu Tyr Leu Ala Gln225 230 235 240
Gly lie Gln Asn Gly Asp Vai Thr Leu Asp Gly Vai Asn Vai Lys Gly245 250 255
Thr Vai Phe Vai Asn Gly Gly Gly Ser Asp Ser lie His Phe lie Asn260' 265 270
Thr Lys lie Asn Arg Vai Vai Vai Asn Lys Thr Gly Vai Arg lie Vai275 280 285
Thr Ser Gly Asn Thr Ser Vai Glu Ser Vai Vai Vai Lys Ser Gly Ala290 295 300
Lys Leu Glu Glu Lys Glu Leu Thr Gly Asp Gly Phe Lys Asn Vai Thr305 310 315 320
Vai Asp Ser Gln Leu Ser Ala Gly Asn Glu lie lie Phe Vai Gly Asp325 330 335
Phe Glu Gln Vai Asp Vai Leu Ala Asp Asp Ala Leu Leu Glu Thr Lys340 345 350
Glu Ala Lys Met Lys Leu Arg lie Phe Gly Gln Arg lie Lys Vai Asn355 360 365
Gly Lys Ala lie Glu Lys Ser Ser Lys Asn Tyr lie Vai Asn Gly Glu370 375 380
Leu lie Ser Thr Glu Glu Glu Pro Gly Pro Ser Asp Ala Pro Gly Ala385 390 395 400
Glu Asp Asp Gln Asn Ser Gly Ser Pro Gly Ser Ser Thr Asn Pro Ala405 410 415
Pro Thr Lys Asn Pro Asn Glu Glu Trp Arg Leu Vai Trp Ser Asp Glu420 425 430
Phe Asn Gly Ser Glu lie Asn Met Ala Asn Trp Ser Tyr Asp Asp Pro435 440 445
Thr Asn Gly Arg Trp Asn Gly Glu Vai Gln Ser Tyr Thr Gln Asn Asn450 455 460Ala Tyr lie Lys Asp Gly Ala Leu Vai lie Glu Ala Arg Lys Glu Asp465 470 475 480
lie Thr Glu Pro Ser Gly Glu Thr Tyr His Tyr Thr Ser Ser Lys Leu485 490 495
lie Thr Lys Gly Lys Lys Ser Trp Lys Tyr Gly Lys Phe Glu lie Arg500 505 510
Ala Lys Met Pro Gln Gly Gln Gly lie Trp Pro Ala lie Trp Met Met515 520 525
Pro Glu Asp Glu Pro Phe Tyr Gly Thr Trp Pro Lys Cys Gly Glu lie530 535 540
Asp lie Met Glu Leu Leu Gly His Glu Pro Asp Lys lie Tyr Gly Thr545 550 555 560
lie His Phe Gly Glu Pro His Lys Glu Ser Gln Gly Thr Tyr Thr Leu565 570 575
Pro Glu Gly Gln Thr Phe Ala Asp Asp Phe His Vai Tyr Ser lie Glu580 585 590
Trp Glu Pro Gly Glu lie Arg Trp Tyr lie Asp Gly Lys Leu Tyr His595 .600 605
Vai Ala Asn Asp Trp Tyr Ser Arg Asp Pro Tyr Leu Ala Asp Asp Tyr610 615 620
Thr Tyr Pro Ala Pro Phe Asp Gln Asn. Phe Phe Leu lie Leu Asn lie625 630 635 640
Ser Vai Gly Gly Gly Trp Pro Gly Tyr Pro Asp Glu Thr Thr Vai Phe645 650 655
Pro Gln Gln Met Vai Vai Asp Tyr Vai Arg Vai Tyr Gln Lys Asp Lys660 665 670
Tyr Pro His Arg Glu Lys Pro Ala Lys Glu Glu Vai Lys Pro Arg Glu675 680 685
Pro Leu Glu Asp Gly Asn Tyr lie Tyr Asn Gly Gly Phe Asp Vai Asp690 695 700
Asp Ser Ala Ala Vai Gly Vai Asp Gly Vai Pro Tyr Thr Ser Tyr Trp705 710 715 720
Thr Phe Leu Thr Ala Ser Gly Gly Ala Ala Thr Vai Asn Vai Glu Glu725 730 735Gly Vai Met His Vai Gln lie Glu Asn Gly Gly Thr Thr Asp Tyr Gly740 745 750
Vai Gln Leu Leu Gln Ala Pro lie His Leu Glu Lys Gly Ala Lys Tyr755 760 765
Lys Ala Ser Phe Asp Met Lys Ala Glu Asn Pro Arg Gln Vai Lys Leu770 775 780
Lys lie Gly Gly Asp Gly Asp Arg Gly Trp Lys Asp Tyr Ala Ala lie785 790 795 800
Pro Pro Phe Thr Vai Ser Thr Glu Met Thr Asn Tyr Glu Phe Glu Phe805 810 815
Thr Met Lys Asp Asp Thr Asp Vai Lys Alá Arg Phe Glu Phe Asn Met820 825 830
Gly Leu Asp Asp Asn Asp Vai Trp lie Asp Asn Vai Lys Leu lie Lys835 840 845
Thr Glu Asp Ala Pro Vai lie Asp Pro Ser Glu lie Ala Arg Pro Pro850 855 860
Leu Leu Ser Gly Asn,Tyr lie Tyr Asn Gly Thr Phe Asp Gln Gly Pro865 870 875 880
Asn Arg Met Gly Phe Trp Asn Phe Vai Vai Asp Ser Thr Ala Lys Ala885 890 895
Thr Tyr Tyr lie Gly Ser Asp Vai Asn Glu Arg Arg Phe Glu Thr Arg900 905 910
lie Glu Lys Gly Gly Thr Ser Arg Gly Ala lie Arg Leu Vai Gln Pro915 920 925
Gly lie Asn lie Glu Asn Gly Lys Thr Tyr Lys Vai Ser Phe Glu Ala930 935 940
Ser Ala Ala Asn Thr Arg Thr lie Glu Vai Glu lie Ala Ser Asn Leu945 950 955 960
His Asn Ser Ser lie Phe Ala Thr Thr Phe Glu lie Ser Lys Glu Ser965 970 975
Lys lie Tyr Glu Phe Glu Phe Thr Met Asp Lys Asp Ser Asp Lys Asn980 985 990
Gly Glu Leu Arg Phe Asn Leu Gly Gly Ser Asn Vai Asn Vai Tyr lie995 1000 1005Asp Asn Vai Vai Met Lys Arg Vai Ser Thr Asp Glu Vai Glu Gly1010 1015 1020
Asn Leu lie Leu Asn Gly Vai Phe Asn Gly Leu Ala Gly Trp Gly1025 1030 1035
Tyr Gly Ala Tyr Glu Pro Gly Ser Ala Asp Phe Glu Ser His Glu1040 1045 1050
Glu Gln Phe Arg Ala lie lie Ser Ser Vai Gly Asn Glu Gly Trp1055 1060 1065
Asn Vai Gln Leu Tyr Gln Asp Asn Vai Pro Leu Glu Gln Gly Gln1070 1075 1080
Thr Tyr Glu Vai Ser Phe Asp Ala Lys Ser Thr lie Asp Arg Lys1085 1090 1095
lie lie Vai Gln Leu Gln Arg Asn Gly Thr Ser Asp Asn Asn Trp1100 1105 1110
Asp Ser Tyr Phe Tyr Gln Glu Vai Glu Leu Thr Asn Glu Leu Lys1115 1120 1125
Thr Phe Lys Tyr Glu Phe Thr Met Ser Lys Pro Thr Asp Ser Ala1130 1135 1140
Ser Arg Phe Asn Phe Ala Leu Gly Asn Thr Glu Asn Lys Thr Tyr1145 1150 1155
Ala Pro His Glu lie lie lie Asp Asn Vai Vai Vai Arg Lys Vai1160 1165 1170
Ala Thr Pro Ser Ala Leu lie Leu Asn Gly Thr Phe Asp Asp Gly1175 1180 1185
Met Asp His Trp Leu Leu Tyr Trp Gly Asp Gly Glu Gly Asn Cys1190 1195 1200
Asp Vai Thr Asp Gly Glu Leu Glu lie Asn lie Thr Lys Vai Gly1205 1210 1215
Thr Ala Asp Tyr Met Pro Gln lie Lys Gln Glu Asn lie Ala Leu1220 1225 1230
Gln Glu Gly Vai Thr Tyr Thr Leu Ser Leu Lys Ala Arg Ala Leu1235 1240 1245
Glu Ala Arg Ser lie Lys Vai Asp lie Leu Asp Ser Ser Tyr Asn1250 1255 1260
Trp Tyr Gly Gly Thr lie Phe Asp Leu Thr Thr Glu Asp Ala Vai1265 1270 1275
Tyr Thr Phe Thr Phe Thr Gln Ser Lys Ser lie Asn Asn Gly Vai1280 1285 1290
Leu Thr lie Asn Leu Gly Thr lie Glu Gly Lys Thr Ser Ala Ala1295 1300 1305
Thr Thr Vai Tyr Leu Asp Asp lie Leu Leu Glu Gln Gln
<210> 25<211> 1347<212> DNA
<213> Clostridium thermocellum<400> 25
atgtcaaaga taactttccc aaaagatttc atatggggtt ctgcaacagc agcatatcag 60
attgaaggtg catacaacga agacggcaaa ggtgaatcta tatgggaccg tttttcccac 120
acgccaggaa atatagcaga cggacatacc ggcgatgttg catgcgacca ctatcatcgt 180
tatgaagaag atatcaaaat aatgaaagaa atcggtatta aatcatacag gttttccatc 240
tcatggccca gaatctttcc tgaaggaaca ggtaaattaa atcaaaaggg actggatttt 300
tacaaaaggc tcacaaatct gcttctggaa aacggaatta tgcctgcaat cactctttat 360
cactgggacc ttccccaaaa gcttcaggat aaaggcggat ggaaaaaccg ggacaccacc 420
gattatttta cagaatactc tgaagtaata tttaaaaatc tcggagatat cgttccaata 480
tggtttactc acaatgaacc cggtgttgtt tctttgcttg gccacttttt aggaattcat 540
gcccctggga taaaagacct ccgcacttca ttggaagtct cgcacaatct tcttttgtcc 600
cacggcaagg ccgtgaaact gtttagagaa atgaatattg acgcccaaat tggaatagct 660
ctcaatttat cttaccatta tcccgcatcc gaaaaagctg aggatattga agcagcggaa 720
ttgtcatttt ctctggcggg aaggtggtat ctggatcctg tgctaaaagg ccggtatcct 780
gaaaacgcat tgaaacttta taaaaagaag ggtattgagc tttctttccc tgaagatgac 840
ctgaaactta tcagtcagcc aatagacttc atagcattca acaattattc ttcggaattt 900
ataaaatatg atccgtccag tgagtcaggt ttttcacctg caaactccat attagaaaag 960
ttcgaaaaaa cagatatggg ctggatcata tatcctgaag gcttgtatga tctgcttatg 1020
ctccttgaca gggattatgg aaagccaaac attgttatca gcgaaaacgg agccgccttc 1080
aaagatgaaa taggtagcaa cggaaagata gaagacacaa agagaatcca atatcttaaa 1140
gattatctga cccaggctca cagggcaatt caggacggtg taaacttaaa agcatactac 1200
ttgtggtcgc ttttggacaa ctttgaatgg gcttacgggt acaacaagag attcggaatc 1260gttcacgtaa attttgatac gttggaaaga aaaataaagg atagcggcta ctggtacaaa 1320
gaagtaatca aaaacaacgg tttttaa 1347
<210> 26<211> 448<212> PRT
<213> Clostridium thermocellum<220>
<221> DOMÍNIO<222> (2)...(448)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (10)...(24)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<220>
<221> SÍTIO
<222> (225)...(228)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (299)...(302)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221>. SÍTIO
<222> (356)...(364)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572
<400> 26
Met Ser Lys lie Thr Phe Pro Lys Asp Phe lie Trp Gly Ser Ala Thr15 10 15
Ala Ala Tyr Gln lie Glu Gly Ala Tyr Asn Glu Asp Gly Lys Gly Glu20 25 30
Ser lie Trp Asp Arg Phe Ser His Thr Pro Gly Asn lie Ala Asp Gly35 40 45
His Thr Gly Asp Vai Ala Cys Asp His Tyr His Arg Tyr Glu Glu Asp50 55 60
lie Lys lie Met Lys Glu lie Gly lie Lys Ser Tyr Arg Phe Ser lie65 70 75 80
Ser Trp Pro Arg lie Phe Pro Glu Gly Thr Gly Lys Leu Asn Gln Lys85 90 95
Gly Leu Asp Phe Tyr Lys Arg Leu Thr Asn Leu Leu Leu Glu Asn Gly. 100 105 110
lie Met Pro Ala lie Thr Leu Tyr His Trp Asp Leu Pro Gln Lys Leu115 120 125Gln Asp Lys Gly Gly Trp Lys Asn Arg Asp Thr Thr Asp Tyr Phe Thr130 135 140
Glu Tyr Ser Glu Vai lie Phe Lys Asn Leu Gly Asp lie Vai Pro lie145 150 155 160
Trp Phe Thr His Asn Glu Pro Gly Vai Vai Ser Leu Leu Gly His Phe165 170 175
Leu Gly lie His Ala Pro Gly lie Lys Asp Leu Arg Thr Ser Leu Glu180 185 190
Vai Ser His Asn Leu Leu Leu Ser His Gly Lys Ala Vai Lys Leu Phe195 200 205
Arg Glu Met Asn lie Asp Ala Gln lie Gly lie Ala Leu Asn Leu Ser210 215 220
Tyr His Tyr Pro Ala Ser Glu Lys Ala Glu Asp lie Glu Ala Ala Glu225 230 235 240
Leu Ser Phe Ser Leu Ala Gly Arg Trp Tyr Leu Asp Pro Vai Leu Lys245 250 255
Gly Arg Tyr Pro Glu Asn Ala Leu Lys Leu Tyr Lys Lys Lys Gly lie260 265 270
Glu Leu Ser Phe Pro Glu Asp Asp Leu Lys Leu lie Ser Gln Pro lie275 280 285
Asp Phe lie Ala Phe Asn Asn Tyr Ser Ser Glu Phe lie Lys Tyr Asp290 295 300
Pro Ser Ser Glu Ser Gly Phe Ser Pro Ala Asn Ser lie Leu Glu Lys305 310 315 320
Phe Glu Lys Thr Asp Met Gly Trp lie lie Tyr Pro Glu Gly Leu Tyr325 330 335
Asp Leu Leu Met Leu Leu Asp Arg Asp Tyr Gly Lys Pro Asn lie Vai340 345 350
lie Ser Glu Asn Gly Ala Ala Phe Lys Asp Glu lie Gly Ser Asn Gly355 360 365
Lys lie Glu Asp Thr Lys Arg lie Gln Tyr Leu Lys Asp Tyr Leu Thr370 375 380
Gln Ala His Arg Ala lie Gln Asp Gly Vai Asn Leu Lys Ala Tyr Tyr385 390 395 400Leu Trp Ser Leu Leu Asp Asn Phe Glu Trp Ala Tyr Gly Tyr Asn Lys
405 410 415
Arg Phe Gly lie Vai His Vai Asn Phe Asp Thr Leu Glu Arg Lys lie420 425 430
Lys Asp Ser Gly Tyr Trp Tyr Lys Glu Vai lie Lys Asn Asn Gly Phe
<210> 27<211> 1362<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 27
atggcaaaca agataacctt tcctgaaaat tttctgtggg gcgcggcaac ggcttcgtac 60
cagatcgaag gcgcctggaa caaacatggt aaaggcgaat ccacctggga tcgcttttca 120
cacacgcccg gtaagatcag gaacaacgat acgggcgatg tagcaaatga ccattatcgc 180
ctctggaaaa aagacattgg cttgatgaag aagatcgggt tgaaggctta tcgattttcc 240
atttcgtggc cgcgtattct tcctgctgga agaggcaagg tcaatcaaag agggctggat 300
ttttacaaca agatcgtaga tgagctgctg aaagcagata tcatcccatt tgttactctc 360
aatcactggg acctgcccca aaaactggaa gatgagggcg gctggccggc ccgttctact 420
gccgatgctt ttattgaata cacagatgtg atcacccgct cccttggcga ccgcgcaaag 480
aattggatca ctcacaatga acctgccgtc gttgcctgga tgggatactc cactggccaa 540
cacgcacccg gactgaagga ctatgggctt ggtgcccgcg ccgcgcatca cctgttgctc 600
tcacatggac aggctgtacc ggtcattcgc agcaatagcg cgggggcaga agtgggaatt 660
acgctcgata ttagctggcg gatcgctgcc tcaaacagcc gcgccgaccg ggagctggtc 720
cgtgaggatg atgggaggtg gttccgctgg tttgccgacc cgctttacgg gcgcggâtat 780
ccctccgata aggtgtctga tttcactaag ttgggagcac tgcccaacgg acttgatttt 840
gtgcaggcag gcgacatgga cacgatcgcg acaccgactg attttatggg gctaaactac 900
tactcccgaa atgtctaccg cgcggacggt gcagataatg atccgcaaac tgttttccca 960
caaccgaaga tgcccgaaca ctggaccgag atgggctggg aaatttaccc ggatgggctg 1020
accaacattc tgggacgcgt ctatttcaac tatcagccgc gcaaactata cgtcacagaa 1080
aacggcgcca gttactccac gcctcctgat gataagggga atgtcgcgga tgaactccgc 1140
atccattatc tgaggacaca ttttgcagct gcctatcggg ccattcaaat gggcgtgcct 1200
ctggcaggat acttcgtctg gtccctcatg gacaactttg agtggtcatg gggctatatg 1260
caacgctttg gactcatctg ggtggattat gagacccaaa aacgcacttt aaaggatagc 1320gcaaaatggt ataagcgcgt gatcaagaag aatgggctct aa 1362
<210> 28
<211> 453
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (3) . .. (453)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (11)...(25)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<220>
<221> SÍTIO<222> (49)...(52)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (361)...(369)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572<400> 28
Met Ala Asn Lys lie Thr Phe Pro Glu Asn Phe Leu Trp Gly Ala Ala15 10 15
Thr Ala Ser Tyr Gln lie Glu Gly Ala Trp Asn Lys His Gly Lys Gly20 25 30
Glu Ser Thr Trp Asp Arg Phe Ser His. Thr Pro Gly Lys lie Arg Asn35 40 45
Asn Asp Thr Gly Asp Vai Ala Asn Asp His Tyr Arg Leu Trp Lys Lys50 55 60
Asp lie Gly Leu Met Lys Lys lie Gly Leu Lys Ala Tyr Arg Phe Ser65 70 75 80
lie Ser Trp Pro Arg lie Leu Pro Ala Gly Arg Gly Lys Vai Asn Gln85 90 95
Arg Gly Leu Asp Phe Tyr Asn Lys lie Vai Asp Glu Leu Leu Lys Ala100 105 110
Asp lie lie Pro Phe Vai Thr Leu Asn His Trp Asp Leu Pro Gln Lys115 120 125
Leu Glu Asp Glu Gly Gly Trp Pro Ala Arg Ser Thr Ala Asp Ala Phe130 135 140lie Glu Tyr Thr Asp Vai lie Thr Arg Ser Leu Gly Asp Arg Ala Lys145 150 155 160
Asn Trp lie Thr His Asn Glu Pro Ala Vai Vai Ala Trp Met Gly Tyr165 170 175
Ser Thr Gly Gln His Ala Pro Gly Leu Lys Asp Tyr Gly Leu Gly Ala180 185 190
Arg Ala Ala His His Leu Leu Leu Ser His Gly Gln Ala Vai Pro Vai195 200 205
lie Arg Ser Asn Ser Ala Gly Ala Glu Vai Gly lie Thr Leu Asp lie210 215 220
Ser Trp Arg lie Ala Ala Ser Asn Ser Arg Ala Asp Arg Glu Leu Vai225 230 235 240
Arg Glu Asp Asp Gly: Arg Trp Phe Arg Trp Phe Ala Asp Pro Leu Tyr245 250 255
Gly Arg Gly Tyr Pro Ser Asp Lys Vai Ser Asp Phe Thr Lys Leu Gly260 265 270
Ala Leu Pro Asn Gly Leu Asp Phe Vai Gln Ala Gly Asp Met Asp Thr275 280 285
lie Ala Thr Pro Thr Asp Phe Met Gly Leu Asn Tyr Tyr Ser Arg Asn290 295 300
Vai Tyr Arg Ala Asp Gly Ala Asp Asn Asp Pro Gln Thr Vai Phe Pro305 310 315 320
Gln Pro Lys Met Pro Glu His Trp Thr Glu Met Gly Trp. Glu lie Tyr325 330 335
Pro Asp Gly Leu Thr Asn lie Leu Gly Arg Vai Tyr Phe Asn Tyr Gln340 345 350
Pro Arg Lys Leu Tyr Vai Thr Glu Asn Gly Ala Ser Tyr Ser Thr Pro355 360 365
Pro Asp Asp Lys Gly Asn Vai Ala Asp Glu Leu Arg lie His Tyr Leu370 375 380
Arg Thr His Phe Ala Ala Ala Tyr Arg Ala lie Gln Met Gly Vai Pro385 390 395 400
Leu Ala Gly Tyr Phe Vai Trp Ser Leu Met Asp Asn Phe Glu Trp Ser405 410 415Trp Gly Tyr Met Gln Arg Phe Gly Leu lie Trp Vai Asp Tyr Glu Thr420 425 430
Gln Lys Arg Thr Leu Lys Asp Ser Ala Lys Trp Tyr Lys Arg Vai lie
Lys Lys Asn Gly Leu450
<210> 29
<211> 1362
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 29
atggcgaaca aaattacctt tcccgaaaat tttctttggg gcgcggcaac agcctcctac 60
cagatcgaag gtgcgtggga caaacatggc aagggtgaat ccatctggga tcgcttttcg 120
catacccctg gcaagatcag aaataatgat acgggcgatg ttgccaatga tcattatcgt 180
ctctggaaaa aagacattgg cttgatgaag aagatcggct tgaaggcata tcgtttttcc 240
atttcgtggc cgcgtgttct tcccgccgga cgcggcaaag tcaatcagaa gggactggat 300
ttctataaca ggctggtaga tgctctgttg aaagaagata tcatcccatt tgtgactctc 360
aatcactggg acctgcccca aaagctggag gaggaaggcg gttggccggt tcgctccacc 420
gcagatgcct ttgtggaata cacagacgtg gtcacacgtt ccctcggcga ccgcgtaaag 480
aattggatca cgcataatga gcctgccgtc gttgcctgga tgggatattc cacaggtcaa 540
cacgcacccg gtttgaagga ctatgggctt ggtgtgcgcg ccgcgcatca tctgctgctc 600
tcccacgggc aggcggtgcc agtcatccgc agtaacagcg ccgatgcaga agtgggcatt 660
acgctggata ttagctggcg gattcctgcc tccaatagcc gagcagaccg ggaattggtc 720
cgtaaagatg acggactatg gttccgctgg ttcgccgatc cgctttatgg gcgcggatac 780
ccctcggata aagtcaccga ttttacaaag atcggcgcgc tgcccaatgg tctggacttt 840
atgcaagccg gtgatatgga tgcgatcgcc acgccaaccg atttcatggg gctgaactat 900
tatttccgaa atgtctaccg cgcgaatggc gaagacaatg atccgcaggt cgttttccca 960
caaccaaaga tgcccgaaca ctggacggag atgggctggg aaatctatcc ggatggactg 1020
acgaacatcc tgggacgcgt ttatttcaat taccagccac ataaactgta tatcacagag 1080
aacggcgcga gctactccac cccgcccgat gaaaagggga atgtcgccga tgagctccgc 1140
actcattatt tacggacaca cttcgcggct gcctaccggg cgattcagat gggcgtgcct 1200
ctggcaggat actttgtctg gtccctcatg gacaactttg agtggtcctg gggatatatg 1260
cagcgctttg ggctcatctg ggtggactac gagacacaga aacgcaccct gaaggatagc 1320gccaagtggt acaaacgtgt gatcaggaag aatgggtttt ag 1362
<210> 30
<211> 453
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (3) . . . (453)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (11)...(25)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<220>
<221> SÍTIO
<222> (49) . . . (52)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (361)...(369)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572
<400> 30
Met Ala Asn Lys lie Thr Phe Pro Glu Asn Phe Leu Trp Gly Ala Ala1 5 10 15
Thr Ala Ser Tyr Gln lie Glu Gly Ala Trp Asp Lys His Gly Lys Gly20 25 30
Glu Ser lie Trp Asp Arg Phe Ser His Thr Pro Gly Lys lie Arg Asn35 40 45
Asn Asp Thr Gly Asp Vai Ala Asn Asp His Tyr Arg Leu Trp Lys Lys50 55 60
Asp lie Gly Leu Met Lys Lys lie Gly Leu Lys Ala Tyr Arg Phe Ser65 70 75 80
lie Ser Trp Pro Arg Vai Leu Pro Ala Gly Arg Gly Lys Vai Asn Gln85 90 95
Lys Gly Leu Asp Phe Tyr Asn Arg Leu Vai Asp Ala Leu Leu Lys Glu100 105 110
Asp lie lie Pro Phe Vai Thr Leu Asn His Trp Asp Leu Pro Gln Lys115 120 125
Leu Glu Glu Glu Gly Gly Trp Pro Vai Arg Ser Thr Ala Asp Ala Phe130 135 140Vai Glu Tyr Thr Asp Vai Vai Thr Arg Ser Leu Gly Asp Arg Vai Lys145 150 155 160
Asn Trp lie Thr His Asn Glu Pro Ala Vai Vai Ala Trp Met Gly Tyr165 170 175
Ser Thr Gly Gln His Ala Pro Gly Leu Lys Asp Tyr Gly Leu Gly Vai180 185 190
Arg Ala Ala His His Leu Leu Leu Ser His Gly Gln Ala Vai Pro Vai195 200 205
lie Arg Ser Asn Ser Ala Asp Ala Glu Vai Gly lie Thr Leu Asp lie210 215 220
Ser Trp Arg lie Pro Ala Ser Asn Ser Arg Ala Asp Arg Glu Leu Vai225 230 235 240
Arg Lys Asp Asp Gly Leu Trp Phe Arg Trp Phe Ala Asp Pro Leu Tyr245 250 255
Gly Arg Gly Tyr Pro Ser Asp Lys Vai Thr Asp Phe Thr Lys lie Gly260 265 270
Ala Leu Pro Asn Gly Leu Asp Phe Met Gln Ala Gly Asp Met Asp Ala275 280 285
lie Ala Thr Pro Thr Asp Phe Met Gly Leu Asn Tyr Tyr Phe Arg Asn290 295 300
Vai Tyr Arg Ala Asn Gly Glu Asp Asn Asp Pro Gln Vai Vai Phe Pro305 310 315 320
Gln Pro Lys Met Pro Glu His Trp Thr Glu Met Gly Trp Glu lie Tyr325 330 335
Pro Asp Gly Leu Thr Asn lie Leu Gly Arg Vai Tyr Phe Asn Tyr Gln340 345 350
Pro His Lys Leu Tyr lie Thr Glu Asn Gly Ala Ser Tyr Ser Thr Pro355 360 365
Pro Asp Glu Lys Gly Asn Vai Ala Asp Glu Leu Arg Thr His Tyr Leu370 375 380
Arg Thr His Phe Ala Ala Ala Tyr Arg Ala lie Gln Met Gly Vai Pro385 390 395 400
Leu Ala Gly Tyr Phe Vai Trp Ser Leu Met Asp Asn Phe Glu Trp Ser405 410 415Trp Gly Tyr Met Gln Arg Phe Gly Leu lie Trp Vai Asp Tyr Glu Thr420 425 430
Gln Lys Arg Thr Leu Lys Asp Ser Ala Lys Trp Tyr Lys Arg Vai lie435 440 445
Arg Lys Asn Gly Phe450
<210> 31
<211> 1167
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 31
atggaagacc gcccgcacta ttacagcgac gaccatctct ggggtgtact gtgcgtgacc 60
gcctacatca aggaaactgg ggactttgca ttcctggacg agaaagttca cttttacgag 12 0
aaggacccgg tcgagggcgt gtctgtgctg gatcacgtta aacgggcctt gacctttacc 180
cgcaacaaca tcgggaaaca tggtctgcct ctcctcggct ttgcggattg gaacgacacg 240
atcaatctgg cgaagggcgc cgagtctctt ttcacgtcgc atctatatgg acgcgcgctg 300
ctggagttta ttgatctgct cacatatctt ggcaagaacg atgaagccga tgaatggcag 360
cgagcccacg ttgagatgca gtcccgcgtc gaaaaacatg cctgggatgg cgaatggtat 420
ttcatgtact ttgaccacga cggcagcccg gttgggtctc acacgaatca gtatggaaag 480
atccatctca acggacagag ctgggctgtg ctttcgggct ttgcctctcc gcagcgcgcc 540
cgccaggcca tggactcggt ttacaagcat ctcaacacaa agcacggcat caagctctcc 600
acgccgggct acaatggcta tgaccccaac tacggcggcg tgaccaccta cccaccggga 660
gcaaaggaaa acggcggcat cttcctgcac ccgaatccct gggccatgat cgcagagacc 720
atgctcgggg atggcgatcg cgcctacgag tattactcgc agatcaaccc ggccggcaag 780
aacgatgaca tcgacctgta cgaggtcgag ccatatgttt acgctcaaaa catcctgggc 840
gatgagcatc cgcagttcgg gctgggacgc aactcgtggc tctcgggtac ggcatcctgg 900
tgctatcagg ctgccacaca gtggatcctc ggaatccgcg ccgactatga agggctgcgc 960
atcgacccgt gcattccgtc caagtgggat gggttcaagg caacgcgcct gtatcgcggc 1020
gtgaagtaca acattacggt caccaacccg aagcacatct gcaaaggcgt ggaaaaagtt 1080
ctggtcaacg gcaaaccggt tgaggggaat gtggtccggg cagacgtggg tttgcgcgaa 1140
gtgaacgtgg aagttacctt aggataa 1167
<210> 32
<211> 388
<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SÍTIO<222> (79) . . . (82)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (349) . . . (352)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 32
Met Glu Asp Arg Pro His Tyr Tyr Ser Asp Asp His Leu Trp Gly Vai15 10 15
Leu Cys Vai Thr Ala Tyr lie Lys Glu Thr Gly Asp Phe Ala Phe Leu20 25 30
Asp Glu Lys Vai His Phe Tyr Glu Lys Asp Pro Vai Glu Gly Vai Ser35 40 45
Vai Leu Asp His Vai Lys Arg Ala Leu Thr Phe Thr Arg Asn Asn lie50 55 60
Gly Lys His Gly Leu Pro Leu Leu Gly Phe Ala Asp Trp Asn Asp Thr65 70 75 80
lie Asn Leu Ala Lys Gly Ala Glu Ser Leu Phe Thr Ser His Leu Tyr85 90 95
Gly Arg Ala Leu Leu Glu Phe lie Asp Leu Leu Thr Tyr Leu Gly Lys100 105 110
Asn Asp Glu Ala Asp Glu Trp Gln Arg Ala His Vai Glu Met Gln Ser115 120 125
Arg Vai Glu Lys His Ala Trp Asp Gly Glu Trp Tyr Phe Met Tyr Phe130 y 135 140
Asp His Asp Gly Ser Pro Vai Gly Ser His Thr Asn Gln Tyr Gly Lys145 150 155 160
lie His Leu Asn Gly Gln Ser Trp Ala Vai Leu Ser Gly Phe Ala Ser165 170 175
Pro Gln Arg Ala Arg Gln Ala Met Asp Ser Vai Tyr Lys His Leu Asn180 185 190
Thr Lys His Gly lie Lys Leu Ser Thr Pro Gly Tyr Asn Gly Tyr Asp195 200 205Pro Asn Tyr Gly Gly Vai Thr Thr Tyr Pro Pro Gly Ala Lys Glu Asn210 215 220
Gly Gly lie Phe Leu His Pro Asn Pro Trp Ala Met lie Ala -Glu Thr225 230 235 240
Met Leu Gly Asp Gly Asp Arg Ala Tyr Glu Tyr Tyr Ser Gln lie Asn245 250 255
Pro Ala Gly Lys Asn Asp Asp lie Asp Leu Tyr Glu Vai Glu Pro Tyr260 265 270
Vai Tyr Ala Gln Asn lie Leu Gly Asp Glu His Pro Gln Phe Gly Leu275 280 285
Gly Arg Asn Ser Trp Leu Ser Gly Thr Ala Ser Trp Cys Tyr Gln Ala. 290 295 300
Ala Thr Gln Trp lie Leu Gly lie Arg Ala Asp Tyr Glu Gly Leu Arg305 .310 315 320
lie Asp Pro Cys lie Pro Ser Lys Trp Asp Gly Phe Lys Ala Thr Arg325 330 335
Leu Tyr Arg Gly Vai Lys Tyr Asn lie Thr Vai Thr Asn Pro Lys His340 345 350
lie Cys Lys Gly Vai Glu Lys Vai Leu Vai Asn Gly Lys Pro Vai Glu355 360 365
Gly Asn Vai Vai Arg Ala Asp Vai Gly Leu Arg Glu Vai Asn Vai Glu370 375 380
Vai Thr Leu Gly385
<210> 33
<211> 1362
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 33
atggcaaata aaattctctt ccccgagaac tttctctggg gcacggcgac cgcatcctac 60cagatcgagg gggcttggga taaacatggt aagggcgagt cgacctggga ccgttttacg 120catacacctg gaaagatcaa aaacaatgat acgggcgatg tagcagatga ccattatcga 180ttatggaaaa aagatatcgg cttgatgaag aagctcggct tgaaggctta tcgtttttcg 240acttcctggc cgcgggtgct gccggccggg cgcggtaaga gcaatcaaaa aggactcgat 300ttctacagca agctggttga tgagttgcta aaagcaaata tcatcccatt cgtgacattg 360
aatcactggg acatcccaca aaagttggag gacgagggtg gctgggccgt gcgctcaacg 420
gctgaggcat ttgtggaata tgccgatctc atgtcgcgca cgcttggaga ccgcgtcaag 480
aactggatca cgcacaacga accggccgtc gtcgcctgga tgggatacgg gatgggcatc 540
cacgcgccgg gcttaacgga tttctcgatt gcggtgccgg tctcgcatca tctgctcctt 600
tcgcacggat gggccgtgcc tgtgattcgc ggtaacagcc cggatgccga ggtgggcatt 660
accctcaaca ttcaatgggg cgaagcagca tccaacagcc gggccgacct aaacgccctg 720
cgcctgaacg atggacagtg gttccgctgg tttgccgatc cggtttatgg ccgcggctat 780
ccttccgacg tggtggctga tttcgagaaa atgggcgcgc tgccgaacgg catgaatttc 840
gtgcaacctg gcgatatgga tgtcatcgcc acgccaaccg atttcctcgg gctcaattat 900
tattcccgcc atgtgcatcg cgtcaacaca ccggataacg atcaacaggt tgtgtt-tgcc 960
aaacagcagg gtcccgagaa ctggaccgag atgggctggg agatccatcc tgatggattg 1020
gccggaattt tatccagagc gtatttcaat taccagccgc gcaaagtata tgtgactgaa 1080
aacggtgcca gctattccac cgcgcccgat gagaatggta ttgtcaacga cattcaccgc 1140
gtcaattatc tacggacgca cttcgcggct gcccatcgcg ccctgcaggc gggcgtgcca 1200
ttggcaggat acttcgtctg gtcaatgctc gataacttcg aatggagtca cgggtacagc 1260
cagcgctttg gcatcgttta tgtggactat caaacccaga agcgttactt gaaagacagc 1320
gccaagtggt acaaaggtgt catcaaaaag aatgggttct aa 1362
<210> 34
<211> 453
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (3)...(453)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (11)...(25)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio id =PS00653
<220>
<221> SÍTIO<222> (49)...(52)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (332)...(335)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO<222> (361)...(369)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572<400> 34
Met Ala Asn Lys lie Leu Phe Pro Glu Asn Phe Leu Trp Gly Thr Ala15 10 15
Thr Ala Ser Tyr Gln lie Glu Gly Ala Trp Asp Lys His Gly Lys Gly20 25 30
Glu Ser Thr Trp Asp Arg Phe Thr His Thr Pro Gly Lys lie Lys Asn35 40 45
Asn Asp Thr Gly Asp Vai Ala Asp Asp His Tyr Arg Leu Trp Lys Lys50 55 60
Asp lie Gly Leu Met Lys Lys Leu Gly Leu Lys Ala Tyr Arg Phe Ser65 70 75 80
Thr Ser Trp Pro Arg Vai Leu Pro Ala Gly Arg Gly Lys Ser Asn Gln85 90 95
Lys Gly Leu Asp Phe Tyr Ser Lys Leu Vai Asp Glu Leu Leu Lys Ala100 105 110
Asn lie lie Pro Phe Vai Thr Leu Asn His Trp Asp lie Pro Gln Lys115 120 125
Leu Glu Asp Glu Gly Gly Trp Ala Vai Arg Ser Thr Ala Glu Ala Phe130 135 140
Vai Glu Tyr Ala Asp Leu Met Ser Arg Thr Leu Gly Asp Arg Vai Lys145 150 155 160
Asn Trp lie Thr His Asn Glu Pro Ala Vai Vai Ala Trp Met Gly Tyr165 170 175
Gly Met Gly lie His Ala Pro Gly Leu Thr Asp Phe Ser lie Ala Vai180 185 190
Pro Vai Ser His His Leu Leu Leu Ser His Gly Trp Ala Vai Pro Vai195 200 205
lie Arg Gly Asn Ser Pro Asp Ala Glu Vai Gly lie Thr Leu Asn lie210 215 220
Gln Trp Gly Glu Ala Ala Ser Asn Ser Arg Ala Asp Leu Asn Ala Leu225 230 235 240
Arg Leu Asn Asp Gly Gln Trp Phe Arg Trp Phe Ala Asp Pro Vai Tyr245 250 255Gly Arg Gly Tyr Pro Ser Asp Vai Vai Ala Asp Phe Glu Lys Met Gly260 265 270
Ala Leu Pro Asn Gly Met Asn Phe Vai Gln Pro Gly Asp Met Asp Vai275 280 285
lie Ala Thr Pro Thr Asp Phe Leu Gly Leu Asn Tyr Tyr Ser Arg His290 295 300
Vai His Arg Vai Asn Thr Pro Asp Asn Asp Gln Gln Vai Vai Phe Ala305 310 315 320
Lys Gln Gln Gly Pro Glu Asn Trp Thr Glu Met Gly Trp Glu lie His325 330 335
Pro Asp Gly Leu Ala Gly lie Leu Ser Arg Ala Tyr Phe Asn Tyr Gln340 345 350
Pro Arg Lys Vai Tyr Vai Thr Glu Asn Gly Ala Ser Tyr Ser Thr Ala355 360 365
Pro Asp Glu Asn Gly lie Vai Asn Asp lie His Arg Vai Asn Tyr Leu370 375 380
Arg Thr His Phe Ala Ala Ala His Arg Ala Leu Gln Ala Gly Vai Pro385 390 395 400
Leu Ala Gly Tyr Phe Vai Trp Ser Met Leu Asp Asn Phe Glu Trp Ser405 410 415
His Gly Tyr Ser Gln Arg Phe Gly lie Vai Tyr Vai Asp Tyr Gln Thr420 425 430
Gln Lys Arg Tyr Leu Lys Asp Ser Ala Lys Trp Tyr Lys Gly Vai lie435 440 445
Lys Lys Asn Gly Phe450
<210> 35
<211> 1116
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 35
atgaataaaa tcctcaaact cttcagcagc ctgctgcttt ttgcaggcat ctgtcccgcg 60cttcaggcag agccagtaga aacctacttt cccctgtccc gcgggatcaa catgagccac 120tggctctctc aagtgaatga aaacattccc gaccgttcca cctatgtgac ggagcgggat 180ttgcaatttc tgcgggcagc cggtttcgac catgtgcgtc tgccaatcga tgaggtcgaa 240
ctctgggatg aagagggcaa tcagatcgag gaggcctggc aatacatgca taactttctc 300
cgttggagcc gaaagaacga tctccgggtc attctcgacc tgcacacggt attgtcccac 360
cacttcaacg cggtaaatat gggagaggtc aatacactct tcaatgatcc cagggaacag 420
gaaaagttcc tcaacctatg ggaacaaatc atggatgccg tgggtcacca tccgaatgag 480
tttctcgcct atgaaatgct caatgaggcg gtcgcggaag atgatgaaga ctggaatctg 540
ctcctcaacc gcgccattgt ccgcatccgg gaccgtgagc cttatcgggt gctgattgcg 600
gggtcgaact ggtggcagca tgccgaccgg gtccccaacc tgaggctccc gaaaggagac 660
cccaatatca tcatcagttt tcatttttat tccccttttc tcttcaccca ctaccgcagt 720
agctggactg cgatgcaggc gtaccagggc ttcgtccaat accctggcaa aaccatacct 780
tccatacatc tcgaaggcat gaactacccg gagtccttcg ttcatatgtg ggaagcgcac 840
aatcggtact atgacatcca ttccatgtat gccgaaatgg tcccggcggt gcgttttgcc 900
gaaaagttgg gacttcggct ctattgcgga gaattcgggg ccatgaagac cgttgatcgc 960
gcccagatgc tgcagtggta tcgggatgtt gtcactgtat ttaataaatt gggtattccc 1020
tatactgcct gggattatca gggaaccttc ggaatccgcg atgagctgac cggtgagccc 1080
gatcatgaaa tgatcgatat tctcctcggg cgctga 1116
<210> 36
<211> 371
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL<222> (1)...(23)
<220>
<221> DOMÍNIO<222> (39) . . . (350)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO<222> (37)...(40)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 36
Met Asn Lys lie Leu Lys Leu Phe Ser Ser Leu Leu Leu Phe Ala Gly15 10 15
lie Cys Pro Ala Leu Gln Ala Glu Pro Vai Glu Thr Tyr Phe Pro Leu20 25 30
Ser Arg Gly lie Asn Met Ser His Trp Leu Ser Gln Vai Asn Glu Asn35 40 45lie Pro Asp Arg Ser Thr Tyr Vai Thr Glu Arg Asp Leu Gln Phe Leu50 55 60
Arg Ala Ala Gly Phe Asp His Vai Arg Leu Pro lie Asp Glu Vai Glu65 70 75 80
Leu Trp Asp Glu Glu Gly Asn Gln lie Glu Glu Ala Trp Gln Tyr Met85 90 95
His Asn Phe Leu Arg Trp Ser Arg Lys Asn Asp Leu Arg Vai lie Leu100 105 110
Asp Leu His Thr Vai Leu Ser His His Phe Asn Ala Vai Asn Met Gly115 120 125
Glu Vai Asn Thr Leu Phe Asn Asp Pro Arg Glu Gln Glu Lys Phe Leu130 135 140
Asn Leu Trp Glu Gln lie Met Asp Ala Vai Gly His His Pro Asn Glu145 150 155 160
Phe Leu Ala Tyr Glu Met Leu Asn Glu Ala Vai Ala Glu Asp Asp Glu165 170 175
Asp Trp Asn Leu Leu Leu Asn Arg Ala lie Vai Arg lie Arg Asp Arg180 185 190
Glu Pro Tyr Arg Vai Leu lie Ala Gly Ser Asn Trp Trp Gln His Ala195 200 205
Asp Arg Vai Pro Asn Leu Arg Leu Pro Lys Gly Asp Pro Asn lie lie210 215 220
lie Ser Phe His Phe Tyr Ser Pro Phe Leu Phe Thr His Tyr Arg Ser225 230 235 240
Ser Trp Thr Ala Met Gln Ala Tyr Gln Gly Phe Vai Gln Tyr Pro Gly245 250 255
Lys Thr lie Pro Ser lie His Leu Glu Gly Met Asn Tyr Pro Glu Ser260 265 270
Phe Vai His Met Trp Glu Ala His Asn Arg Tyr Tyr Asp lie His Ser275 280 285
Met Tyr Ala Glu Met Vai Pro Ala Vai Arg Phe Ala Glu Lys Leu Gly290 295 300
Leu Arg Leu Tyr Cys Gly Glu Phe Gly Ala Met Lys Thr Vai Asp Arg305 310 315 320Ala Gln Met Leu Gln Trp Tyr Arg Asp Vai Vai Thr Vai Phe Asn Lys325 330 335
Leu Gly lie Pro Tyr Thr Ala Trp Asp Tyr Gln Gly Thr Phe Gly lie340 345 350
Arg Asp Glu Leu Thr Gly Glu Pro Asp His Glu Met lie Asp lie Leu355 360 365
Leu Gly Arg370
<210> 37<211> 1383<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 37
atgagcaaac tccccaaatt cctctttgga gccggcacct caagttatca gatcgaaggt 60
gcctggaata tagatggcaa aggtccctcc atttgggatt tccacactcg ccatcccggc 120
gcggtttatc ggatgcacaa cggggatatg gcctgcgatc attatcatcg gtatcgaacg 180
gatatcgagc tgatgcagaa gatcggccta gaggcttacc gcttttccat aaactggccc 240
cgggttctgc cggaagggac cggtgccgcc aatgaagcag gtctggactt ttacgaccgg 300
ctggtggacg cactgttgga agcgggaatt cagccttgga tcacccttta tcactgggaa 3 60
ctcccctggg ctctccacct gcgcgggggt tggctcaatc gggacatgcc cgaccacatt 420
gagaactacg ccgccttggt cgccaggtgc ctcggtgacc gggtgaaaaa ctggattact 480
ttgaatgagc ctcaggtttt catcgggctt ggctatgcca gcggggttca tgcccccggc 540
tataagttgt ccttgcggga gtgcctggtc ggttcccacc atgccgtgct ttcccaccac 600
cgggcagtca aggcgatccg ggccaactgc gaaggcagcg tccagatcgg ctcagccccg 660
gtgggtgttg tctgccgacc ggaaacggag tcggcagcag acattgaggc tgcccgccag 720
gccacctacc atatcaacac tcccagcacc cacactcccg acaatctgat cggctgcctc 780
tggaacagca cttggtggat agatccaatg gttctgggga agtatccgga acacgggctg 840
aaagcctttg aaagctatct gccggacaac attcaggccg aactggatgc cgtattcgaa 900
ccgacggact ttgtcggttc caacatctac cacggccgca cggtgcgggc caagcaggat 960
ggtggttttg agtttatcga ccttccgccc ggcagccccc gcaccaccat gggctgggac 1020
atcaccccgg acatcctcta ctggggagga aagtatcttt acgaacgcta tggcaagccg 1080
atgtttatca cggaaaacgg cattgccgtc ccggaactgg tgaatgatga aggccaggtc 1140
gaggataccg tccgtgagca atacatgaag ctgcacctgc gtgggctgca gcgggcccgc 1200gatgaaggca tcccctatgc cggatacttc cactggtccc tgctcgacaa cttcgagtgg 1260
gaacaaggct actcccagcg ctttggcatg gtctacgtcg actaccagac ccaggaacgt 1320
atcctcaaac gttcgggcca gcatttcgct gccatcgtcc gggaaatcac cggaaccgcc 1380
taa 1383
<210> 38
<211> 460
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (1)...(458)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (7)...(21)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<220>
<221> SÍTIO
<222> (266)...(269)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (366)...(374)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572
<400> 38
Met Ser Lys Leu Pro Lys Phe Leu Phe Gly Ala Gly Thr Ser Ser Tyr1 5 10 15
Gln lie Glu Gly Ala Trp Asn lie Asp Gly Lys Gly Pro Ser lie Trp20 25 30
Asp Phe His Thr Arg His Pro Gly Ala Vai Tyr Arg Met His Asn Gly35 40 45
Asp Met Ala Cys Asp His Tyr His Arg Tyr Arg Thr Asp lie Glu Leu50 55 60
Met Gln Lys lie Gly Leu Glu Ala Tyr Arg Phe Ser lie Asn Trp Pro65 70 75 80
Arg Vai Leu Pro Glu Gly Thr Gly Ala Ala Asn Glu Ala Gly Leu Asp85 90 95
Phe Tyr Asp Arg Leu Vai Asp Ala Leu Leu Glu Ala Gly lie Gln Pro100 105 110
Trp lie Thr Leu Tyr His Trp Glu Leu Pro Trp Ala Leu His Leu Arg115 120 125
Gly Gly Trp Leu Asn Arg Asp Met Pro Asp His lie Glu Asn Tyr Ala130 135 140
Ala Leu Vai Ala Arg Cys Leu Gly Asp Arg Vai Lys Asn Trp lie Thr145 150 155 160
Leu Asn Glu Pro Gln Vai Phe lie Gly Leu Gly Tyr Ala Ser Gly Vai165 170 175
His Ala Pro Gly Tyr Lys Leu Ser Leu Arg Glu Cys Leu Vai Gly Ser180 185 190
His His Ala Vai Leu Ser His His Arg Ala Vai Lys Ala lie Arg Ala195 200 205
Asn Cys Glu Gly Ser Vai Gln lie Gly Ser Ala Pro Vai Gly Vai Vai210 215 220
Cys Arg Pro Glu Thr Glu Ser Ala Ala Asp lie Glu Ala Ala Arg Gln225 230 235 240
Ala Thr Tyr His lie Asn Thr Pro Ser Thr His Thr Pro Asp Asn Leu245 250 255
lie Gly Cys Leu Trp Asn Ser Thr Trp Trp lie Asp Pro Met Vai Leu260 265 270
Gly Lys Tyr Pro Glu His Gly Leu Lys Ala Phe Glu Ser Tyr Leu Pro275 280 285
Asp Asn lie Gln Ala Glu Leu Asp Ala Vai Phe Glu Pro Thr Asp Phe290 295 300
Vai Gly Ser Asn lie Tyr His Gly Arg Thr Vai Arg Ala Lys Gln Asp305 310 315 320
Gly Gly Phe Glu Phe lie Asp Leu Pro Pro Gly Ser Pro Arg Thr Thr325 330 335
Met Gly Trp Asp lie Thr Pro Asp lie Leu Tyr Trp Gly Gly Lys Tyr340 345 350
Leu Tyr Glu Arg Tyr Gly Lys Pro Met Phe lie Thr Glu Asn Gly lie355 360 365
Ala Vai Pro Glu Leu Vai Asn Asp Glu Gly Gln Vai Glu Asp Thr Vai370 375 380Arg Glu Gln Tyr Met Lys Leu His Leu Arg Gly Leu Gln Arg Ala Arg385 390 395 400
Asp Glu Gly lie Pro Tyr Ala Gly Tyr Phe His Trp Ser Leu Leu Asp405 410 415
Asn Phe Glu Trp Glu Gln Gly Tyr Ser Gln Arg Phe Gly Met Vai Tyr420 425 430
Vai Asp Tyr Gln Thr Gln Glu Arg lie Leu Lys Arg Ser Gly Gln His435 440 445
Phe Ala Ala lie Vai Arg Glu lie Thr Gly Thr Ala
<210> 39
<211> 1521
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 39
gtgctcgccc ataaccgctc gcaccgtgaa gaactcctca atcgccggcc ggttgaattc 60
atcagcgccc tggaggcccg gggcgagctc cagcgcatca ccgccgaggt ggacccctac 120
ctcgagatca ccgagatctg cgatcgcacc ctgcgcgccg gcggcccggc gctgctgttc 180
gagaacgtca aggggcacga catgcctctg ctcggcaacc tcttcggcac gccgaagcgg 240
gttgccctcg gcatgggcca ggactccgtg gccgccctgc gcgaagtggg cgagctgctc 300
gccttcctca aggagccgga gcctcccaag ggctttcgcg acgcctggga caagctgccg 360
atcttcaagc aggtgatgag catggggccg aagaaggtcc gctcggcgcc ggtgcaggaa 420
aaggtgtacg agggcgacga ggtcgacctc gaccgcctgc cgatccagca ctgctggccc 480
ggcgacgccg cgcccctggt cacctggccg ctggtgatca cccgcgggcc ccacaagaag 540
cgccagaacc tcggcatcta ccgccagcag aagctgtcga agaaccggct gatcatgcgc 600
tggctctccc accgcggcgg ggcgctggac ttcctggagt tccagaaggc ccaccccggc 660
gagcccttcc cggtggcggt ggcgctgggc gccgacccgg cgaccatcct cggcgcggtg 720
accccggtgc cggattcgct ctccgagtac gccttcgccg ggctgctgcg cggctcgcgc 780
accgagctgg tcaagtgcgg ccacgccgac ctggacgtgc cggcctcggc ggagatcatc 840
ctggaggggt tcatctaccc ggatgacatg gcccccgagg gcccctacgg cgaccatacc 900
ggctactaca acgaggtgga taccttcccg gtcttcacgg tgacgcgtat gaccatgcgc 960
cgcgatgcca tctatcactc cacctacacc ggccggccgc ccgacgagcc ggcgatcctt 1020
gggctggcgc tcaacgaggt gttcgtgccg atcctgcgcc gccagttccc ggagatcgtc 1080
gacttctacc tgccgccgga gggctgctcc taccgcatgg cggtggtgac catgaagaag 1140cagtacccgg gccacgccaa gcgggtgatg atgggcgtgt ggagcttcct gcgccagttc 1200
atgtacacca agttcgtggt ggtgctcgac gacgacgtca gcgcccggga ctgggaggac 1260
gtgatctggg ccatcaccac ccgcatggac ccggcccggg acaccgtggt ggtggagaac 1320
acccccatcg actacctgga cttcgcctcg ccggtctccg gcctcggttc caagatgggc 13 80
ctggatgcca ccagcaagtg gcccggcgag accgaccgcg agtggggggt gcccatcgtc 1440
atggacgagg ccgtcaaggc ccgcgtcagc gagcgctgga acgagctggg catcgagctc 1500
cccgacaaca cgaccccctg a 1521
<210> 40
<211> 506
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (21) . . . (445)
<223> 3-octaprenil-4-hidroxibenzoato carbóxiliase<220>
<221> SÍTIO<222> (5)...(8)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 40
Met Leu Ala His Asn Arg Ser.His Arg Glu Glu Leu Leu Asn Arg Arg
1 5. 10 15.
Pró Vai Glu Phe lie Ser Ala Leu Glu Ala Arg Gly Glu Leu Gln Arg20 25 30
lie Thr Ala Glu Vai Asp Pró Tyr Leu Glu lie Thr Glu lie Cys Asp35 40 45
Arg Thr Leu Arg Ala Gly Gly Pro Ala Leu Leu Phe Glu Asn Vai Lys50 55 60
Gly His Asp Met Pro Leu Leu Gly Asn Leu Phe Gly Thr Pro Lys Arg65 70 75 80
Vai Ala Leu Gly Met Gly Gln Asp Ser Vai Ala Ala Leu Arg Glu Vai85 90 95
Gly Glu Leu Leu Ala Phe Leu Lys Glu Pro Glu Pro Pro Lys Gly Phe100 105 110
Arg Asp Ala Trp Asp Lys Leu Pro lie Phe Lys Gln Vai Met Ser Met115 120 125
Gly Pro Lys Lys Vai Arg Ser Ala Pro Vai Gln Glu Lys Vai Tyr Glu130 135 140Gly Asp Glu Vai Asp Leu Asp Arg Leu Pro lie Gln His Cys Trp Pro145 150 155 160
Gly Asp Ala Ala Pro Leu Vai Thr Trp Pro Leu Vai lie Thr Arg Gly165 170 175
Pro His Lys Lys Arg Gln Asn Leu Gly lie Tyr Arg Gln Gln Lys Leu180 185 190
Ser Lys Asn Arg Leu lie Met Arg Trp Leu Ser His Arg Gly Gly Ala195 200 205
Leu Asp Phe Leu Glu Phe Gln Lys Ala His Pro Gly Glu Pro Phe Pro210 215 220
Vai Ala Vai Ala Leu Gly Ala Asp Pro Ala Thr lie Leu Gly Ala Vai225 230 235 240
Thr Pro Vai Pro Asp Ser Leu Ser Glu Tyr Ala Phe Ala Gly Leu Leu245 250 255
Arg Gly Ser Arg Thr Glu Leu Vai Lys Cys Gly His Ala Asp Leu Asp260 265 270
Vai Pro Ala Ser Ala Glu lie lie Leu Glu Gly Phe lie Tyr Pro Asp275 280 285
Asp Met Ala Pro Glu Gly Pro Tyr Gly Asp His Thr Gly Tyr Tyr Asn290 295 300
Glu Vai Asp Thr Phe Pro Vai Phe Thr Vai Thr Arg Met Thr Met Arg305 310 315 320
Arg Asp Ala lie Tyr His Ser Thr Tyr Thr Gly Arg Pro Pro Asp Glu325 330 335
Pro Ala lie Leu Gly Leu Ala Leu Asn Glu Vai Phe Vai Pro lie Leu340 345 350
Arg Arg Gln Phe Pro Glu lie Vai Asp Phe Tyr Leu Pro Pro Glu Gly355 360 365
Cys Ser Tyr Arg Met Ala Vai Vai Thr Met Lys Lys Gln Tyr Pro Gly370 375 380
His Ala Lys Arg Vai Met Met Gly Vai Trp Ser Phe Leu Arg Gln Phe385 390 395 400
Met Tyr Thr Lys Phe Vai Vai Vai Leu Asp Asp Asp Vai Ser Ala ArgAsp Trp Glu Asp Vai lie Trp Ala lie Thr Thr Arg Met Asp Pro Ala420 425 430
Arg Asp Thr Vai Vai Vai Glu Asn Thr Pro lie Asp Tyr Leu Asp Phe435 440 445
Ala Ser Pro Vai Ser Gly Leu Gly Ser Lys Met Gly Leu Asp Ala Thr450 455 460
Ser Lys Trp Pro Gly Glu Thr Asp Arg Glu Trp Gly Vai Pro lie Vai465 470 475 480
Met Asp Glu Ala Vai Lys Ala Arg Vai Ser Glu Arg Trp Asn Glu Leu485 490 495
Gly lie Glu Leu Pro Asp Asn Thr Thr Pro
<210> 41
<211> 1410
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 41
atgaagacgc cttcgatcta cgataccatg acgcggtcgg tgcagccgtt gacacccgcc 60
gacggcgaca ccttccgctt ttattgctgc ggccccaccg tctacgggcc ggcgcatgtc 120
ggcaatttcc gcaccttcat cattcaggac gtgctgcgac gcgttatcga agggtcgggc 180
ctcaaaacga gacacgtacg caacatcacc gatgtggacg acaaaaccat ccgccaatcg 240
caagcggaag gaaaatctct gaaaatcttc acagggtact ggctggaacg gttccacgcc 300
gattgcgacg cgctgaatct gctgcgcccg cacgtcgagc ccggcgccgt tgaccatatc 360
ccggcgcaaa tccggatgat cgaacaactg atcgaaaaág gccacgccta cgtggcggac 420
gacaactcgg tctattatcg cgttgcttcg ttcgaagcgt acggccggtt gtcacgcctg 480
caagaacgac acatcaccac cggctgcgcc gaacacgcgc ataccgacga tgaatacgag 540
cgcgaatcgg ccgccgactt cgccttgtgg aaagcgcata aatccgagga cggcccgaac 600
gcgtggccga gcccgtgggg cgacggacga cccggctggc acatcgagtg cagcgccatg 660
tccgtcgagt atctgggcga gacattcgat ctgcacggcg gcggcgtgga cctgaccttc 720
ccccaccacg aaaacgaaat cgcgcaaagc gaagccgcca ccggcaagcc cttcgcgcgt 780
atctggttcc attccgcgca tctcatggtc gaaggccaca agatgtccaa gagcctcggc 840
aacctgttta cgctcgacga tatccgcgcg cgcggattcg acgccatgac cctgcgctat 900
gtcctgcttt cgggcaatta ccgccaaccc ctcaatttca cgtgggactc ccttaacgcc 960gcgcaaagcg ccttacgccg cctgcgtcag ctcaaccacg atctccagca ggcggcgggc 1020
aagacggtcg cgcccgctga tacttcgtgg gggccgttcg aaccggtgta cgacgcgctt 1080
gccgacaacc tgaacacgcc cgacgccctc ggccgcttat tctccgccct gcacagcatc 1140
gagcgcgcgc ttaacggcaa ggaaaggacg gccgaagagg ccgccctcgc ccgtgcgcag 1200
ttcctgcggg tcatggacct tttcggtttc agcctggacg cgccgccgac cgccgaagcg 1260
cccgaagaag tgcgtgcgct ggcgcagcag cgatgggacg ctaaacaagc gcgcgatttc 1320
gtccgcgccg acgccttgcg caaacaggtc accgacctcg gctggaccat ccgcgacgcc 1380
aaagacggct acgaactcgt ccaagagtaa 1410
<210> 42
<211> 469
<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO
<222> (16)...(323)
<223> tRNA synthetases class I (C) catalytic domínio<220>
<221> SÍTIO
<222> (69)...(72)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (316)...(319)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001
<400> 42
Met Lys Thr Pro Ser lie Tyr Asp Thr Met Thr Arg Ser Vai Gln Pro1 5 10 15
Leu Thr Pro Ala Asp Gly Asp Thr Phe Arg Phe Tyr Cys Cys Gly Pro20 25 30
Thr Vai Tyr Gly Pro Ala His Vai Gly Asn Phe Arg Thr Phe lie lie35 40 45
Gln Asp Vai Leu Arg Arg Vai lie Glu Gly Ser Gly Leu Lys Thr Arg50 55 60
His Vai Arg Asn lie Thr Asp Vai Asp Asp Lys Thr lie Arg Gln Ser65 70 75 80
Gln Ala Glu Gly Lys Ser Leu Lys lie Phe Thr Gly Tyr Trp Leu Glu85 90 95
Arg Phe His Ala Asp Cys Asp Ala Leu Asn Leu Leu Arg Pro His Vai100 105 110Glu Pro Gly Ala Vai Asp His He Pro Ala Gln He Arg Met He Glu115 120 125
Gln Leu He Glu Lys Gly His Ala Tyr Vai Ala Asp Asp Asn Ser Vai130 135 140
Tyr Tyr Arg Vai Ala Ser Phe Glu Ala Tyr Gly Arg Leu Ser Arg Leu145 150 155 160
Gln Glu Arg His He Thr Thr Gly Cys Ala Glu His Ala His Thr Asp165 170 175
Asp Glu Tyr Glu Arg Glu Ser Ala Ala Asp Phe Ala Leu Trp Lys Ala180 185 190
His Lys Ser Glu Asp Gly Pro Asn Ala Trp Pro Ser Pro Trp Gly Asp195 200 205
Gly Arg Pro Gly Trp His He Glu Cys Ser Ala Met Ser Vai Glu Tyr210 215 220
Leu Gly Glu Thr Phe Asp Leu His Gly Gly Gly Vai Asp Leu Thr Phe225 230 235 240
Pro His His Glu Asn Glu He Ala Gln Ser Glu Ala Ala Thr Gly Lys245 250 255
Pro Phe Ala Arg He Trp Phe His Ser Ala His Leu Met Vai Glu Gly260 265 270
His Lys Met Ser Lys Ser Leu Gly Asn Leu Phe Thr Leu Asp Asp He275 280 285
Arg Ala Arg Gly Phe Asp Ala Met Thr Leu Arg Tyr Vai Leu Leu Ser290 295 300
Gly Asn Tyr Arg Gln Pro Leu Asn Phe Thr Trp Asp Ser Leu Asn Ala305 310 315 320
Ala Gln Ser Ala Leu Arg Arg Leu Arg Gln Leu Asn His Asp Leu Gln325 330 335
Gln Ala Àla Gly Lys Thr Vai Ala Pro Ala Asp Thr Ser Trp Gly Pro340 345 350
Phe Glu Pro Vai Tyr Asp Ala Leu Ala Asp Asn Leu Asn Thr Pro Asp355 360 365
Ala Leu Gly Arg Leu Phe Ser Ala Leu His Ser He Glu Arg Ala Leu370 375 380
Asn Gly Lys Glu Arg Thr Ala Glu Glu Ala Ala Leu Ala Arg Ala Gln385 390 395 400
Phe Leu Arg Vai Met Asp Leu Phe Gly Phe Ser Leu Asp Ala Pro Pro405 410 415
Thr Ala Glu Ala Pro Glu Glu Vai Arg Ala Leu Ala Gln Gln Arg Trp420 425 430
Asp Ala Lys Gln Ala Arg Asp Phe Vai Arg Ala Asp Ala Leu Arg Lys435 440 445
Gln Vai Thr Asp Leu Gly Trp Thr lie Arg Asp Ala Lys Asp Gly Tyr
Glu Leu Vai Gln Glu465
<210> 43
<211> 984
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 43
atgacgactg aaaccaaatc caaactgtac ttgcataaag tgaacggcca gaaaggactg 60
gacctgcgcc agacctatca gcgcgacttc accgtgaccg aggcgtatcg cgatacgctg 120
ccggatatgc agaacgcttc cgaggcgttg cagggggcca atgtcgccat ccagaaagtc 180
ggcgtatcca atttcaagct gccactcaag taccgcaccc acacgggcga accgaccacg 240
ctggaaacca gcgtaaccgg cagcgtatcc ctgaagccgg gcctgaaggg catcaacatg 300
tcccgcgtca tgcggacctt ctacgacttc caggacgacg tgttcacgct cgacacgctg 360
gcccgtatac .tggaagcgta caaacgggat gtcgacagca acgacgcaca tcttcggctg 420
agtttctcct acccgctgct tcaaaaaagt ctgcgcagcg aattattcgg ctggcaatat 480
taccaggtcg cattcgaggg acggatcgat gccgaaaatc gagtccgcac gttcattcat 540
tttgacttcg tgtattcctc cgcctgtccc tgttcggctg aactggccga acacgcgcgg 600
gaagtgcgcg gcctatacag catcccccac tcgcaacgca gcaaggcgcg cgtcttcgtg 660
gaagttcagc ccggcgccga actcaccatc gaagacgtgc acatgcactg cctgaacgcg. 720
ctccaaacgg aaacgcaagt gatggtcaaa cgcgaagacg agcaggcgtt cgctgaaatg 780
aacggcgccg ccatcaaatt cgtcgaagac gccgcccgtc tgatctatga gcagttcgac 840
caggatccgc gcatcaagga tttcgaaatc gcctgcgcgc atctggaatc cttgcactcg 900
cacgacgccg tatcggtcat cgccaaaggc gtgcccggcg gcttccgcgc cgacttctcg 960gacttcaaga gtctgatctg ctaa 984
<210> 44
<211> 327
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (39)...(308)
<223> ACR não caracterizado, COG1469<220>
<221> SÍTIO<222> (45)...(48)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (100) .. .(103)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 44
Met Thr Thr Glu Thr Lys Ser Lys Leu Tyr Leu His Lys Vai Asn Gly15 10 15
Gln Lys Gly Leu Asp Leu Arg Gln Thr Tyr Gln Arg Asp Phe Thr Vai20 25 30
Thr Glu Ala Tyr Arg Asp Thr Leu Pro Asp Met Gln Asn Ala Ser Glu35 40 45
Ala Leu Gln Gly Ala Asn Vai Ala lie Gln Lys Vai Gly Vai Ser Asn50 55 60
Phe Lys Leu Pro Leu Lys Tyr Arg Thr His Thr Gly Glu Pro Thr Thr65 70 75 80
Leu Glu Thr Ser Vai Thr Gly Ser Vai Ser Leu Lys Pro Gly Leu Lys85 90 95
Gly lie Asn Met Ser Arg Vai Met Arg Thr Phe Tyr Asp Phe Gln Asp100 105 110
Asp Vai Phe Thr Leu Asp Thr Leu Ala Arg lie Leu Glu Ala Tyr Lys115 120 125
Arg Asp Vai Àsp Ser Asn Asp Ala His Leu Arg Leu Ser Phe Ser Tyr130 135 140
Pro Leu Leu Gln Lys Ser Leu Arg Ser Glu Leu Phe Gly Trp Gln Tyr145 150 155 160Tyr Gln Vai Ala Phe Glu Gly Arg lie Asp Ala Glu Asn Arg Vai Arg165 170 175
Thr Phe lie His Phe Asp Phe Vai Tyr Ser Ser Ala Cys Pro Cys Ser180 185 190
Ala Glu Leu Ala Glu His Ala Arg Glu Vai Arg Gly Leu Tyr Ser lie195 200 205
Pro His Ser Gln Arg Ser Lys Ala Arg Vai Phe Vai Glu Vai Gln Pro210 215 220
Gly Ala Glu Leu Thr lie Glu Asp Vai His Met His Cys Leu Asn Ala225 230 235 240
Leu Gln Thr Glu Thr Gln Vai Met Vai Lys Arg Glu Asp Glu Gln Ala245 250 255
Phe Ala Glu Met Asn Gly Ala Ala lie Lys Phe Vai Glu Asp Ala Ala260 265 270
Arg Leu lie Tyr Glu Gln Phe Asp Gln Asp Pro Arg lie Lys Asp Phe275 280 285
Glu lie Ala Cys Ala His Leu Glu Ser Leu His Ser His Asp Ala Vai290 295 300
Ser Vai lie Ala Lys Gly Vai Pro Gly Gly Phe Arg Ala Asp Phe Ser305 310 315 320
Asp Phe Lys Ser Leu lie Cys325
<210> 45<211> 1377<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 45
atgacacaac tggcttttcc atctaacttc atctggggaa cagctacttc cgcttaccaa 60atcgaaggcg cctggaacgc agacggcaag ggcgaatcta tttgggatcg cttttcccat 120acgcagggga agatcattga cggcagcaac ggcgatgtgg cctgcgatca ctaccaccgc 180tggcgcgagg acgtggccct catgagagac ttgggtatgc aggcatatcg cttctccatc 240tcctggccac gcatcctgcc caccggtcat ggacagatca atcaggctgg gctggacttt 300tacaatcgcc tggtggacgg gttgctggaa gctggcatca agccctttgc caccctctac 360cactgggacc tgccgctggc gctacaggct gacggcggct ggccggagcg ctccacggcc 420aaggcctttg tcgaatacgc cgacgtggtc agccgcgcgc tgggcgatcg ggtgaagagc 480
tggatcaccc ataacgaacc gtggtgcatc agcatgctga gccatcaaat tggggagcat 540
gcgcccggct ggcgggactg gcaggctgcg ttggcggccg cgcaccacgt cctcctttcg 600
catggttggg ccgtgccgga actgcgtcgc aacagccgcg atgcagaaat cggcatcacg 660
ttgaacttta ccccggcgga gccagcttcg aacagcgcag ccgatttcaa ggcctatcgc 720
cagttcgatg gctacttcaa ccgctggttc ctggacccgc tctatggccg ccactatccg 780
gcagatatgg tgcacgatta catcgcgcaa ggctacctgc catcacaggg tttgactttc 840
gtggaagctg gtgacctgga cgcgatcgcg acgcgcaccg atttcctggg tgtgaactat 900
tacacgcgcg aagtggtccg tagccaggaa atcccagaga gtgagaacgc gccgcgcaca 960
gtcttgcgcg cgccacagga agagtggaca gagatgggct gggaagtgta tcctgagggc 1020
ctctacaggt tgctcaatcg gttgcacttt gaataccagc cgcgcaagct ctacgtgacc 1080
gagagcggtt gcagctactc cgatggaccc ggccccaacg gtcggatacc ggaccaacgc 1140
cgtatcaact acctgcgcga tcacttcgca gcggcgcatc aggcgataca atgcggcgtc 1200
ccgctggccg gctacttcgt ctggtcgttc atggacaact tcgagtgggc caaagggtac 1260
acccaacgtt ttggtatcgt atgggtggat tatcaatcgc aacgacggat accgaaagac 1320
agcgcctact ggtatcgcga tgtcgtcgcc gccaacgcgg tgcaagttcc tgattag 1377
<210> 46
<211> 458
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (2)...(454)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (10)...(24)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio id =PS00653
<400> 46
Met Thr Gln Leu Ala Phe Pro Ser Asn Phe lie Trp Gly Thr Ala Thr1 5 10 15
Ser Ala Tyr Gln lie Glu Gly Ala Trp Asn Ala Asp Gly Lys Gly Glu20 25 30
Ser lie Trp Asp Arg Phe Ser His Thr Gln Gly Lys lie lie Asp Gly35 40 45
Ser Asn Gly Asp Vai Ala Cys Asp His Tyr His Arg Trp Arg Glu Asp50 55 60Vai Ala Leu Met Arg Asp Leu Gly Met Gln Ala Tyr Arg Phe Ser lie65 70 75 80
Ser Trp Pro Arg lie Leu Pro Thr Gly His Gly Gln lie Asn Gln Ala85 90 95
Gly Leu Asp Phe Tyr Asn Arg Leu Vai Asp Gly Leu Leu Glu Ala Gly100 105 110
lie Lys Pro Phe Ala Thr Leu Tyr His Trp Asp Leu Pro Leu Ala Leu115 120 125
Gln Ala Asp Gly Gly Trp Pro Glu Arg Ser Thr Ala Lys Ala Phe Vai130 135 140
Glu Tyr Ala Asp Vai Vai Ser Arg Ala Leu Gly Asp Arg Vai Lys Ser145 150 155 160
Trp lie Thr His Asn Glu Pro Trp Cys lie Ser Met Leu Ser His Gln165 170 175
lie Gly Glu His Ala Pro Gly Trp Arg Asp Trp Gln Ala Ala Leu Ala180 185 190
Ala Ala His His Vai Leu Leu Ser His Gly Trp Ala Vai Pro Glu Leu195 200 205
Arg Arg Asn Ser Arg Asp Ala Glu lie Gly lie Thr Leu Asn Phe Thr210 215 220
Pro Ala Glu Pro Ala Ser Asn Ser Ala Ala Asp Phe Lys Ala Tyr Arg225 230 235 240
Gln Phe Asp Gly Tyr Phe Asn Arg Trp Phe Leu Asp Pro Leu Tyr Gly245 250 255
Arg His Tyr Pro Ala Asp Met Vai His Asp Tyr lie Ala Gln Gly Tyr260 265 270
Leu Pro Ser Gln Gly Leu Thr Phe Vai Glu Ala Gly Asp Leu Asp Ala275 280 285
lie Ala Thr Arg Thr Asp Phe Leu Gly Vai Asn Tyr Tyr Thr Arg Glu290 295 300
Vai Vai Arg Ser Gln Glu lie Pro Glu Ser Glu Asn Ala Pro Arg Thr305 310 315 320
Vai Leu Arg Ala Pro Gln Glu Glu Trp Thr Glu Met Gly Trp Glu Vai325 330 335Tyr Pro Glu Gly Leu Tyr Arg Leu Leu Asn Arg Leu His Phe Glu Tyr340 345 350
Gln Pro Arg Lys Leu Tyr Vai Thr Glu Ser Gly Cys Ser Tyr Ser Asp355 360 365
Gly Pro Gly Pro Asn Gly Arg lie Pro Asp Gln Arg Arg lie Asn Tyr370 375 380
Leu Arg Asp His Phe Ala Ala Ala His Gln Ala lie Gln Cys Gly Vai385 390 395 400
Pro Leu Ala Gly Tyr Phe Vai Trp Ser Phe Met Asp Asn Phe Glu Trp405 410 415
Ala Lys Gly Tyr Thr Gln Arg Phe Gly lie Vai Trp Vai Asp Tyr Gln420 425 430
Ser Gln Arg Arg lie Pro Lys Asp Ser Ala Tyr Trp Tyr Arg Asp Vai435 440 445
Vai Ala Ala Asn Ala Vai Gln Vai Pro Asp
<210> 47
<211> 1353
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 47
atgaaaaaat acctttttcc tgaaaatttt ttatggggtg ctgccacagc ttcgtatcaa 60
atcgaaggtt ctccctctgc tgatggcaaa ggtgaatcga tatgggaccg tttttctcac 120
acaccgggga acatttggaa cgctgaaacc ggggatatcg cctgcgatca ttaccggcgt 180
tacgtggatg atgtaaagct gatttcacaa atcgggctta acgcgtaccg tttttcaatt 240
tcctggccca gggtatttcc agaggggaga ggaaaagcaa atgaaaaagg actcgatttt 300
taccgcaggt tgattgaaca gctgcagcaa catcgaatca aaacggcagt gacactttac 3 60
cactgggatc ttccacaagt tctgcaggat cgcggcgggt gggcaaaccg tgatacggcg 420
aagtattttt ctgagtatgc cacctttctc tttgaaaaac tcgatctccc cgttgacatg 480
tggattactc ttaacgaacc atgggttatc gctattctgg ggcatgcttt tggtatccac 540
gctccaggga tgagtgactt cagcacagcc ctccaggtct cgcataacct gcttctgggg 600
cacgggttgg cggttaaagc atttcgggag tctaagaggg gtgatgaacc ggtaggtatt 660
acccttaacc ttgccccggt tgaaccgctg accgaaaagc ccgccgatct aaaggcagct 720ttactttctg acggttttat gaaccgctgg taccttgatc ccctgttcaà aggtggttac 780
cctgaagata tgatggatat ctattcccgg aactttgaac tgcccaaaat tgaaaagggg 840
gatgctcagg ttattgccga accgatcgac ttcctgggca taaataacta taccagggtt 900
ctcgtggaag ccagcggtga tgaaaatgcc tttatgggca accctgtcaa cccccagggc 960
tctgaatata ctgaaatggg ttgggaggtt tatccgcagg gtctctacga cctgctgacc 1020
agggttcacc gggattacgg gccaatgccg ctatatataa ctgaaaacgg ggcagccttt 1080
cccgatgaac ttgacagcaa tgggcagata gatgatccaa ggcggataaa ttacctggaa 1140
acttatcttc atcagtgctg gaaggcagtt caggacggtg tgcctctaaa aggctatttt 1200
gtctggaccc tgatggataa cttcgagtgg gctttcggtt tcagcaagcg atttgggctc 1260
atatacgtag attaccagga tcagaaacgt tacttgaaaa acagcgccta ctggtatagc 1320
aaggttattg ggcgaaacgg cctcgagcta taa 1353
<210> 48
<211> 450
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (4)...(448)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (10)...(24)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio id =PS00653
<220>
<221> SÍTIO
<222> (300)...(303)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (356);. . . (364)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572<400> 48
Met Lys Lys Tyr Leu Phe Pro Glu Asn Phe Leu Trp Gly Ala Ala Thr1 5 10 15
Ala Ser Tyr Gln lie Glu Gly Ser Pro Ser Ala Asp Gly Lys Gly Glu20 25 30
Ser lie Trp Asp Arg Phe Ser His Thr Pro Gly Asn lie Trp Asn Ala35 40 45
Glu Thr Gly Asp lie Ala Cys Asp His Tyr Arg Arg Tyr Vai Asp Asp50 55 60Vai Lys Leu lie Ser Gln lie Gly Leu Asn Ala Tyr Arg Phe Ser lie65 70 75 80
Ser Trp Pro Arg Vai Phe Pro Glu Gly Arg Gly Lys Ala Asn Glu Lys85 90 95
Gly Leu Asp Phe Tyr Arg Arg Leu lie Glu Gln Leu Gln Gln His Arg100 105 110
lie Lys Thr Ala Vai Thr Leu Tyr His Trp Asp Leu Pro Gln Vai Leu115 120 125
Gln Asp Arg Gly Gly Trp Ala Asn Arg Asp Thr Ala Lys Tyr Phe Ser130 135 140
Glu Tyr Ala Thr Phe Leu Phe Glu Lys Leu Asp Leu Pro Vai Asp Met145 150 155 160
Trp lie Thr Leu Asn Glu Pro Trp Vai lie Ala lie Leu Gly His Ala165' 170 175
Phe Gly lie His Ala Pro Gly Met Ser Asp Phe Ser Thr Ala Leu Gln180 185 190
Vai Ser His Asn Leu Leu Leu Gly His Gly Leu Ala Vai Lys Ala Phe195 200 205
Arg Glu Ser Lys Arg Gly Asp Glu Pro Vai Gly lie Thr Leu Asn Leu210 215 220
Ala Pro Vai Glu Pro Leu Thr Glu Lys Pro Ala Asp Leu Lys Ala Ala225 230 235 240
Leu Leu Ser Asp Gly Phe Met Asn Arg Trp Tyr Leu Asp Pro Leu Phe245 250 255
Lys Gly Gly Tyr Pro Glu Asp Met Met Asp lie Tyr Ser Arg Asn Phe260 265 270
Glu Leu Pro Lys lie Glu Lys Gly Asp Ala Gln Vai lie Ala Glu Pro275 280 285
lie Asp Phe Leu Gly lie Asn Asn Tyr Thr Arg Vai Leu Vai Glu Ala290 295 300
Ser Gly Asp Glu Asn Ala Phe Met Gly Asn Pro Vai Asn Pro Gln Gly305 310 315 320
Ser Glu Tyr Thr Glu Met Gly Trp Glu Vai Tyr Pro Gln Gly Leu Tyr325 330 335Asp Leu Leu Thr Arg Vai His Arg Asp Tyr Gly Pro Met Pro Leu Tyr. 340 345 350
lie Thr Glu Asn Gly Ala Ala Phe Pro Asp Glu Leu Asp Ser Asn Gly355 360 365
Gln lie Asp Asp Pro Arg Arg lie Asn Tyr Leu Glu Thr Tyr Leu His370 375 380
Gln Cys Trp Lys Ala Vai Gln Asp Gly Vai Pro Leu Lys Gly Tyr Phe385 390 395 400
Vai Trp Thr Leu Met Asp Asn Phe Glu Trp Ala Phe Gly Phe Ser Lys405. 410 415
Arg Phe Gly Leu lie Tyr Vai Asp Tyr Gln Asp Gln Lys Arg Tyr Leu420 425 430
Lys Asn Ser Ala Tyr Trp Tyr Ser Lys Vai lie Gly Arg Asn Gly Leu435 440 445
Glu Leu450
<210> 49
<211> 591
<212> DNA
<213 > Des conhec ido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 49
atggactttg agcgggcagt tgacaggaat atcattagat tacgctcttc gttaaaggaa 60
gaaatgaagg atctagttgc agttgaagct ccggtaacaa tatttttaaa tggcagcgág 120
ctggtaaccc tgctctgcac cccggagaaa attgatcgtt tggccctcgg tttccttcat 180
tcagaagggc tgcttaactc acttgatgat cttagtatga tcaggaccag ggagagcgaa 240
ggcctggttg aaattgaact taaagaggcc tcgccggcac ttgataaatt atacgggaag 300
aggacaatta cttccggttg cggtaaggga acaatttttt ttaatgttct cgattctctg 360
cgcagtaaac cactcgacgg aaagcttgtg attacaaccg aagagattca taaattaatg 420
gatgacctgc aggggcgggc ggaactgttc aaggctaccg ggggtgttca cagcgctgcg 480
cttgccgaca gaaaggaaat actctttttc agtgaagata tcggccgcca taatgctatc 540
gataaaattg tgggagagtg tttgctggag ggggtatctc ctgaagataa g 591
<210> 50<211> 197<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (17)...(195)<223> FdhD/NarQ family
<220>
<221> SÍTIO<222> (37) . . . (40)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 50
Met Asp Phe Glu Arg Ala Vai Asp Arg Asn lie lie Arg Leu Arg Ser1 5 10 15
Ser Leu Lys Glu Glu Met Lys Asp Leu Vai Ala Vai Glu Ala Pro Vai20 25 30
Thr lie Phe Leu Asn Gly Ser Glu Leu Vai Thr Leu Leu Cys Thr Pro35 40 45
Glu Lys lie Asp Arg Leu Ala Leu Gly Phe Leu His Ser Glu Gly Leu50 55 60
Leu Asn Ser Leu Asp Asp Leu Ser Met lie Arg Thr Arg Glu Ser Glu65 70 75 80
Gly Leu Vai Glu lie Glu Leu Lys Glu Ala Ser Pro Ala Leu Asp Lys85 90 .95
Leu Tyr Gly Lys Arg Thr lie Thr Ser Gly Cys Gly Lys Gly Thr Ilé100 105 110
Phe Phe Asn Vai Leu Asp Ser Leu Arg Ser Lys Pro Leu Asp Gly Lys115 120 125
Leu Vai lie Thr Thr Glu Glu lie His Lys Leu Met Asp Asp Leu Gln130 135 140
Gly Arg Ala Glu Leu Phe Lys Ala Thr Gly Gly Vai His Ser Ala Ala145 150 155 160
Leu Ala Asp Arg Lys Glu lie Leu Phe Phe Ser Glu Asp lie Gly Arg165 170 175
His Asn Ala lie Asp Lys lie Vai Gly Glu Cys Leu Leu Glu Gly Vai180 185 190
Ser Pro Glu Asp Lys195<210> 51
<211> 1014
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 51
atgtccaggg gcatcctgat cctcgtcatg ctgtctgttc tgagcggcgc ggcgctggcc 60
caaccggccg ggctgccgcc gcgttcgccg gtgcagcgct gcatcaacct gggcaatatg 120
ctggaagcgc cggaggaggg ctggtggggg ctgcgcgtcg agcgcgacta cctgacgacg 180
atcgccgggg ccgggttcga tgcggtgcgc atcccgataa gctggtcaac ccatgctgcc 240
agcgagccgc cctacaccat cgatccggct ttcttcgccc gcgttgatga agtcgtcggc 300
tgggcgctgg cggacgggct gaaggccatc atcaacgtgc accactacga ggagatgatg 3 60
agcgatccgg cggggcattt cccccggctg cgcgcgctgt gggcgcagat cgcggagcac 420
tacgccgact acccgcccgc gctgatgttc gagctgctca acgaaccgtt cgaggcgctg 480
acgccgctgc ggtggaacga gtacgccgcc gatctgatcg cgctgatccg ccagaccaac 540
ccggggcgca ccctgatcgt cggcgggggc tggtggaaca gtgtggaagg gctgatgcag 600
ctccgcctgc cggatgatcc cgatctgctg gcgacgttcc attactacca cccgttcgag 660
ttcacgcatc agggggcgga gtggtcaccg gaagtgactg acctgagcgg gatcgcctgg 720
gggacgggcg aggaacggct cgatctggag tccaatatcc gtattgcggc ggcctgggcg 780
gtgtacaacc ggcgcccgct gctgttgggc gaattcggcg tctatggccg ggtggccgat 840
ctcgattcgc gcctgcgctg gacgacggcg gtgcgcgccg aggccgaggc gcagggcatc 900
ggctggtgct actgggaatt cgccgccggc ttcggcattt acgacccgga aagccggaçg 960
ttcaacccgc tgtaccgcgc gctgatcccg caggccgggc cggcgcgccc ctga 1014
<210> 52
<211> 337
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL<222> (1)...(20)
<220>
<221> DOMÍNIO<222> (38)...(314)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO
<222> (150)...(159)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659<400> 52
Met Ser Arg Gly lie Leu lie Leu Vai Met Leu Ser Vai Leu Ser -Gly10 15
Ala Ala Leu Ala Gln Pro Ala Gly Leu Pro Pro Arg Ser Pro Vai Gln20 25 30
Arg Cys lie Asn Leu Gly Asn Met Leu Glu Ala Pro Glu Glu Gly Trp35 40 45
Trp Gly Leu Arg Vai Glu Arg Asp Tyr Leu Thr Thr lie Ala Gly Ala50 55 60
Gly Phe Asp Ala Vai Arg lie Pro lie Ser Trp Ser Thr His Ala Ala65 70 75 80
Ser Glu Pro Pro Tyr Thr lie Asp Pro Ala Phe Phe Ala Arg Vai Asp85 90 95
Glu Vai Vai Gly Trp Ala Leu Ala Asp Gly Leu Lys Ala lie lie Asn100 105 110
Vai His His Tyr Glu Glu Met Met Ser Asp Pro Ala Gly His Phe Pro115 120 125
Arg Leu Arg Ala Leu Trp Ala Gln lie Ala Glu His Tyr Ala Asp Tyr130 135 140
Pro Pro Ala Leu Met Phe Glu Leu Leu Asn Glu Pro Phe Glu Ala Leu145 150 155 160
Thr Pro Leu Arg Trp Asn Glu Tyr Ala Ala Asp Leu lie Ala Leu lie165 170 175
Arg Gln Thr Asn Pro Gly Arg Thr Leu lie Vai Gly Gly Gly Trp Trp180 185 190
Asn Ser Vai Glu Gly Leu Met Gln Leu Arg Leu Pro Asp Asp Pro Asp195 200 205
Leu Leu Ala Thr Phe His Tyr Tyr His Pro Phe Glu Phe Thr His Gln210 215 220
Gly Ala Glu Trp Ser Pro Glu Vai Thr Asp Leu Ser Gly lie Ala Trp225 230 235 240
Gly Thr Gly Glu Glu Arg Leu Asp Leu Glu Ser Asn lie Arg lie Ala245 250 255
Ala Ala Trp Ala Vai Tyr Asn Arg Arg Pro Leu Leu Leu Gly Glu Phe260 265 270Gly Vai Tyr Gly Arg Vai Ala Asp Leu Asp Ser Arg Leu Arg Trp Thr275 280 285
Thr Ala Vai Arg Ala Glu Ala Glu Ala Gln Gly lie Gly Trp Cys Tyr290 295 300
Trp Glu Phe Ala Ala Gly Phe Gly lie Tyr Asp Pro Glu Ser Arg Thr305 310 315 320
Phe Asn Pro Leu Tyr Arg Ala Leu lie Pro Gln Ala Gly Pro Ala Arg325 330 335
Pro
<210> 53
<211> 1377
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 53
atgtggatgg ttcaagcgac atctttaatt caaaaataca atgtgcctgg cccacgctac 60
accagttatc caacggttcc ttattgggaa agtgagaatt tttcactaaa gcagtggcaa 120
caaacgctca aaaaatcctt tgatgagtcg aatcaaagtg aaggcatcag tctgtatatc 180
catttgccat tttgcgaaag tttatgcacc ttctgtggtt gccataaacg tgtgactaaa 240
aagcatgaga tggaaaagcc ttatatccaa gcggtattaa aagaatggga tttatattgc 300
caacttttgg tggataaacc tgtcattaaa gaaattcatt tgggtggggg aactccgaca 360
ttttttagtc ctgaacattt aacgcagctg attaagggga tattggctaa agccgaagtt 420
gcagatgagc atgagtttag ttttgaagga catcccaaca atacgacacg tgaacatttg 480
caagcgctct atgatgttgg atttcgacgt gtcagttatg gcgtgcagga ctataacgaa 540
actgtgcaaa aagccattca ccgcattcag ccctatgaaa atgttaaaaa tgtcaccgag 600
tgggcgcgtg agattggcta tacctctatt tcgcatgatt tggtctt-tgg cctgccgttt 660
caaagtttag acgatgtett aaatacgatt gatcaaacca ataccttaat gccggatcgt 720
ttggctttgt atagctatgc ccatgtgcca tggattaaag gcaatggtca acgcggtttt 780
aaagatgctg atgtcccgaa agacgagatt aaacgtcaat gttatgagga aggcaaaaaa 840
aaattattag aacatggcta tcatgaaatt ggtatggatc attttgctct agaacaagac 900
agtatgtatc agtcttttaa agcagggagc ttgcatcgta atttcatggg ttataccgca 960
tcgaaaacgc aagtgatgat tgggcttggg atttcatcaa ttagtgacag ttggtacagc 1020
tttgcgcaaa acgtgaaaac attagatgaa tattatacct tgctagaaaa aaatcagatt 1080
cccgtgttta aagggcatgt cttgaatcag gaagatttga tcatccgtaa acatatttta 1140aatttgatgt gtggcttcca aacctcatgg gcaaatcccg atatgcaatt tcctgaaatt 1200
cagtctgttt tggcacaatt agcagaaatg cagcaagatg gtttgattca aattgaagac 1260
gcatcggtca cagttttaga agcgggcaag ccttttgttc gaaatatttg tatggccttt 1320
gatttaagac tcaagcgcaa caagcctgag aatcggattt tttcgatgac gatttaa 1377
<210> 54
<211> 458
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO
<222> (59) . . . (233)
<223> Super-família Sam radical
<220>
<221> DOMÍNIO
<222> (316)...(431)
<223> Região c-terminal HemN
<220>
<221> SÍTIO<222> (33)...(36)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO<222> (51)...(54)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (155)...(158)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (181)...(184)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> -SÍTIO
<222> (200) . . . (203)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 54
Met Trp Met Vai Gln Ala Thr Ser Leu lie Gln Lys Tyr Asn Vai Pro15 10 15
Gly Pro Arg Tyr Thr Ser Tyr Pro Thr Vai Pro Tyr Trp Glu Ser Glu20 25 30
Asn Phe Ser Leu Lys Gln Trp Gln Gln Thr Leu Lys Lys Ser Phe Asp35 40 45
Glu Ser Asn Gln Ser Glu Gly lie Ser Leu Tyr lie His Leu Pro Phe50 55 60Cys Glu Ser Leu Cys Thr Phe Cys Gly Cys His Lys Arg Vai Thr Lys65 70 75 80
Lys His Glu Met Glu Lys Pro Tyr lie Gln Ala Vai Leu Lys Glu Trp85 90 95
Asp Leu Tyr Cys Gln Leu Leu Vai Asp Lys Pro Vai lie Lys Glu lie100 105 110
His Leu Gly Gly Gly Thr Pro Thr Phe Phe Ser Pro Glu His Leu Thr115 120 125
Gln Leu lie Lys Gly lie Leu Ala Lys Ala Glu Vai Ala Asp Glu His130 135 140
Glu Phe Ser Phe Glu Gly His Pro Asn Asn Thr Thr Arg Glu His Leu145 150 155 160
Gln Ala Leu Tyr Asp Vai Gly Phe Arg Arg Vai Ser Tyr Gly Vai Gln165 170 175
Asp Tyr Asn Glu Thr Vai Gln Lys Ala lie His Arg lie Gln Pro Tyr180 185 190
Glu Asn Vai Lys Asn Vai Thr Glu Trp Ala Arg Glu lie Gly Tyr Thr195 200 205
Ser lie Ser His Asp Leu Vai Phe Gly Leu Pro Phe Gln Ser Leu Asp210 215 220
Asp Vai Leu Asn Thr lie Asp Gln Thr Asn Thr Leu Met Pro Asp Arg225 230 235 240
Leu Ala Leu Tyr Ser Tyr Ala His Vai Pro Trp lie Lys Gly Asn Gly245 250 255
Gln Arg Gly Phe Lys Asp Ala Asp Vai Pro Lys Asp Glu lie Lys Arg260 265 270
Gln Cys Tyr Glu Glu Gly Lys Lys Lys Leu Leu Glu His Gly Tyr. His275 280 285
Glu lie Gly Met Asp His Phe Ala Leu Glu Gln Asp Ser Met Tyr Gln290 295 300
Ser Phe Lys Ala Gly Ser Leu His Arg Asn Phe Met Gly Tyr Thr Ala305 310 315 320
Ser Lys Thr Gln Vai Met lie Gly Leu Gly lie Ser Ser lie Ser Asp325 330 335Ser Trp Tyr Ser Phe Ala Gln Asn Vai Lys Thr Leu Asp Glu Tyr Tyr
340 345 350
Thr Leu Leu Glu Lys Asn Gln lie Pro Vai Phe Lys Gly His Vai Leu
355 360 365
Asn Gln Glu Asp Leu lie lie Arg Lys His lie Leu Asn Leu Met Cys
370 375 380
Gly Phe Gln Thr Ser Trp Ala Asn Pro Asp Met Gln Phe Pro Glu lie
385 390 395 400
Gln Ser Vai Leu Ala Gln Leu Ala Glu Met Gln Gln Asp Gly Leu lie
405 410 415
Gln lie .Glu Asp Ala Ser Vai Thr Vai Leu Glu Ala Gly Lys Pro Phe
420 425 430
Vai Arg Asn lie Cys Met Ala Phe Asp Leu Arg Leu Lys Arg Asn Lys
435 440 445
Pro Glu Asn Arg lie Phe Ser Met Thr lie
<210> 55
<211> 1389
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 55
atgagcgctt cgagtccctc ccgccccctg tccttcccag agcagttcgt ctggggtgct 60
gccgcggcct cctaccaagt cgagggcgcc gtccacgagg acgggaaggg cccctccgtc 120
tgggacatgt tctgcgagaa gcccggagcg gtcttccagg ggcacgacgg ggcggtggct 180
tgcgaccact atcaccgcta ccgagaggac gtggcgttga tgcgacaggt gggcctgcac 240
gcctaccgcc tgagcgtgtg ctggccccga gtgctcccgg agggcgtcgg gcagcccaac 300
gagaagggcc tcgacttcta ctcgcggttg gtggacgcgc tgctcgaggc agggattacg 360
ccctgggtaa cgctttttca ttgggactac cccttggctc tctatcaccg ggggggctgg 420
ctcaaccggg atagcgcgga ttggtttgcc gagtacgcgg gcctaatcgc cgatcgcctc 480
tccgaccggg tgcagcattt cttcactcag aacgagcccc aggtctatat cggcttcgga 540
cacctcgagg gtaagcatgc tccaggagac accttgccca tgtcccaggt gctgcttgcg 600
gggcatcata gcctactggc gcacggcaag gccgtgcagg cgctccgcgc ccaggcgaag 660
cagcagctgc gcgtcggcta cgctcccgtc ggcatgcccc tccatccctt cacggactcg 720gccgaggacg tggccgctgc gcggaaggcg accttttggg ttcgggagaa gaactcctgg 780
aacaacgcct ggtggatgga cccggtgttc ttgggtgagt acccggctca gggcctcgcc 840
ttcttcggcc gggacgtgcc gcaggtgcgc gagggagaca tgcagctcat cgcgcagccc 900
ttggacttct ttggggtcaa catctaccag agcacccccg tgcgcgcgtc tagcgccgaa 960
agcggcttcg aggtcgtccc ccatccaacg ggctatccta tcactgcctt caactggccg 1020
atcacgcccc aggccctcta ctggggtccg cgcttcttct acgagcgcta ccagaagccg 1080
atcgtcatca cggagaacgg actgtcctgt cgggacgtcg tcgctgtgga cgggaaggtt 1140
cacgatccgg ctcgcatcga tttcaccacc cgctatctgc gcgagctcca ccgagccgtc 1200
gcggacggcg tcgcggtcga gggctacttc cactggtcca tcatggacaa cttcgaatgg 1260
gctgccggct accgcgagcg gttcgggctc attcacgtcg actacgagac cctggcgcgg 1320
acgcccaagg cgtccgctgc gtggtatcgc aaggtaatcg agagcaacgg agcgaccctt 1380
ttcggatga 1389
<210> 56 "<211> 462 <212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (8)...(458)
<223> Família glicosil hidrolase 1 <220>
<221> SÍTIO <222> (16)...(30)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio id = PS00653
<220>
<221> SÍTIO
<222> (366)...(374)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572 <400> 56
Met Ser Ala Ser Ser Pro Ser Arg Pro Leu Ser Phe Pro Glu Gln Phe 1 5 10 15
Vai Trp Gly Ala Ala Ala Ala Ser Tyr Gln Vai Glu Gly Ala Vai His 20 25 30
Glu Asp Gly Lys Gly Pro Ser Vai Trp Asp Met Phe Cys Glu Lys Pro 35 40 45
Gly Ala Vai Phe Gln Gly His Asp Gly Ala Vai Ala Cys Asp His Tyr 50 55 60
His Arg Tyr Arg Glu Asp Vai Ala Leu Met Arg Gln Vai Gly Leu His 65 70 75 80Ala Tyr Arg Leu Ser Vai Cys Trp Pro Arg Vai Leu Pro Glu Gly Vai 85 90 95
Gly Gln Pro Asn Glu Lys Gly Leu Asp Phe Tyr Ser Arg Leu Vai Asp 100 105 110
Ala Leu Leu Glu Ala Gly lie Thr Pro Trp Vai Thr Leu Phe His Trp 115 120 125
Asp Tyr Pro Leu Ala Leu Tyr His Arg Gly Gly Trp Leu Asn Arg Asp 130 135 140
Ser Ala Asp Trp Phe Ala Glu Tyr Ala Gly Leu lie Ala Asp Arg Leu 145 150 155 160
Ser Asp Arg Vai Gln His Phe Phe Thr Gln Asn Glu Pro Gln Vai Tyr 165 170 175
lie Gly Phe Gly His Leu Glu Gly Lys His Ala Pro Gly Asp Thr Leu 180 185 190
Pro Met Ser Gln Vai Leu Leu Ala Gly His His Ser Leu Leu Ala His 195 200 205
Gly Lys Ala Vai Gln Ala Leu Arg Ala Gln Ala Lys Gln Gln Leu Arg 210 215 220
Vai Gly Tyr Ala Pro Vai Gly Met Pro Leu His Pro Phe Thr Asp Ser 225 230 235 240
Ala Glu Asp Vai Ala Ala Ala Arg Lys Ala Thr Phe Trp Vai Arg Glu 245 250 255
Lys Asn Ser Trp Asn Asn Ala Trp Trp Met Asp Pro Vai Phe Leu Gly 260 265 270
Glu Tyr Pro Ala Gln Gly Leu Ala Phe Phe Gly Arg Asp Vai Pro Gln 275 280 285
Vai Arg Glu Gly Asp Met Gln Leu lie Ala Gln Pro Leu Asp Phe Phe 290 295 300
Gly Vai Ásn lie Tyr Gln Ser Thr Pro Vai Arg Ala Ser Ser Ala Glu 305 310 315 320
Ser Gly Phe Glu Vai Vai Pro His Pro Thr Gly Tyr Pro lie Thr Ala 325 330 335
Phe Asn Trp Pro lie Thr Pro Gln Ala Leu Tyr Trp Gly Pro Arg Phe340 345 350
Phe Tyr Glu Arg Tyr Gln Lys Pro lie Vai lie Thr Glu Asn Gly Leu 355 360 365
Ser Cys Arg Asp Vai Vai Ala Vai Asp Gly Lys Vai His Asp Pro Ala 370 375 380
Arg lie Asp Phe Thr Thr Arg Tyr Leu Arg Glu Leu His Arg Ala Vai 385 390 395 400
Ala Asp Gly Vai Ala Vai Glu Gly Tyr Phe His Trp Ser lie Met Asp 405 410 415
Asn Phe Glu Trp Ala Ala Gly Tyr Arg Glu Arg Phe Gly Leu lie His 420 425 430
Vai Asp Tyr Glu Thr Leu Ala Arg Thr Pro Lys Ala Ser Ala Ala Trp 435 440 445
Tyr Arg Lys Vai lie Glu Ser Asn Gly Ala Thr Leu Phe Gly 450 455 460
<210> 57 <211> 414 <212> DNA
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <400> 57
atgattgctt catctatgtt ctatggaacg gttcgtggaa tacaagagct aactcaaaac 60
gttattgcat tggataccgc aatggtttcg cttaccagag ttgctgacgg aagtgatttt 120
gagtttgata gagttattga acgctcgatt gaaaacgtaa ccgaactatc aggtaagcta 180
actgattaca tggatttagt aacggagttt gctagaactg gtaaaacaat agatgaatct 240
tttaatttag .ctaatacaac acaaatgtta atgaatattt ctgaattaac agcagatgaa 300
tcagtaaata gtttaactgc cgcaatgatt gcttttaata ttaacgcaga tgatagtatt 360
agaattgctg ataagttgaa tgaggttaac aatatcagcc tccttttgtg gtaa 414
<210> 58 <211> 137 <212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SÍTIO <222> (52)...(55)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (86) .
<223> Sítio
<220>
<221> SÍTIO
<222> (93) .
<223> Sítio
<220>
<221> SÍTIO
<222> (133)
<223> Sítio
<400> 58
Met lie Ala Ser Ser Met Phe Tyr Gly Thr Vai Arg Gly lie Gln Glu 15 10 15
Leu Thr Gln Asn Vai lie Ala Leu Asp Thr Ala Met Vai Ser Leu Thr 20 25 30
Arg Vai Ala Asp Gly Ser Asp Phe Glu Phe Asp Arg Vai lie Glu Arg 35 40 45
Ser lie Glu Asn Vai Thr Glu Leu Ser Gly Lys Leu Thr Asp Tyr Met 50 55 60
Asp Leu Vai Thr Glu Phe Ala Arg Thr Gly Lys Thr lie Asp Glu Ser 65 70 75 80
Phe Asn Leu Ala Asn Thr Thr Gln Met Leu Met Asn lie Ser Glu Leu 85 90 95
Thr Ala Asp Glu Ser Vai Asn Ser Leu Thr Ala Ala Met lie Ala Phe 100 105 110
Asn lie Asn Ala Asp Asp Ser lie Arg lie Ala Asp Lys Leu Asn Glu 115 120 125
Vai Asn Asn lie Ser Leu Leu Leu Trp 130 135
<210> 59
<211> 1044
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 59
atgagaattt ttgaaggatt tcagcgaggt gtaaaccttg gcggctggat ctcccagttc 60 gacaagtacg accatgagca tttccgcagc tttattacgg aaaatgacat cgccgccatt 120 gcagctcttg gttttgacca tgtccgcgtg ccggtggatt ataacgtgct ggaggatgag 180gagggcaacc gcatcgacag cggatttgtc tacctgagaa gctgctacga gtggtgccgc 240
aaacacgacc tgaacatgct ggtggatctt cacgagtgct acggctactc cttcgatccg 300
ctgaaaaaag atatggaccg caaacgcttc ttctatgccg aagctctgca ggagcgtttt 360
ctgaagctct gggagcagat ctgtgaaacc tttaaagacg atcctgtgca cgtggcattc 420
gagccgctga atgagatcgt tttaggagag gtcgcagacg cctggaacgt gatgatccgc 480
aaatatatca agaccgtccg cgccatctgc ccggagcact atctggtcct tggaagcgtg 540
cactacagcc acgttaccac catccctctt cttgaggcac cggcagatga caagatcgtc 600
ttcaacttcc actgctacga gccgctggtc ttcacccacc agggcgcata ctggctggag 660
gatatgattc cggatttccg catgacctat cctgccacca tggaagagtt ctacgaagca 720
acaaagaaga tcctgccaaa catgagtccg gatggattta aggatttcga tcaggagatg 780
ggtccgggct tctttgagaa gatcttcaca ccggccctga aacgtgccga gcaggacaat 840
gtagccctct actgcggcga gtacggcgtc attgatctgg cagataacca tgccaagatc 900
cgctggctca aagacatcca caccaccttc tccaaatacg gcatcggaag tgccctctgg 960
aactacaagg gcaaggattt cggctatgta gatgatcgct tcgccgagtg cagagaagca 1020
tttatcgagt gcctgaaggc ctga 1044
<210> 60<211> 347<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (14) . . . (330)
<223> Celulase (Família glicosil hidrolase 5)<400> 60
Met Arg lie Phe Glu Gly Phe Glri Arg Gly Vai Asn Leu Gly Gly Trp1 5 10 15
lie Ser Gln Phe Asp Lys Tyr Asp His Glu His Phe Arg Ser Phe lie20 25 30
Thr Glu Asn Asp lie Ala Ala lie Ala Ala Leu Gly Phe Asp His Vai35 40 45
Arg Vai Pro Vai Asp Tyr Asn Vai Leu Glu Asp Glu Glu Gly Asn Arg50 55 60
lie Asp Ser Gly Phe Vai Tyr Leu Arg Ser Cys Tyr Glu Trp Cys Arg65 70 75 80
Lys His Asp Leu Asn Met Leu Vai Asp Leu His Glu Cys Tyr Gly Tyr85 90 95Ser Phe Asp Pro Leu Lys Lys Asp Met Ásp Arg Lys Arg Phe Phe Tyr100 105 110
Ala Glu Ala Leu Gln Glu Arg Phe Leu Lys Leu Trp Glu Gln lie Cys115 120 125
Glu Thr Phe Lys Asp Asp Pro Vai His Vai Ala Phe Glu Pro Leu Asn130 135 140
Glu lie Vai Leu Gly Glu Vai Ala Asp Ala Trp Asn Vai Met lie Arg145 150 155 160
Lys Tyr lie Lys Thr Vai Arg Ala lie Cys Pro Glu His Tyr Leu Vai165 170 175
Leu Gly Ser Vai His Tyr Ser His Vai Thr Thr lie Pro Leu Leu Glu180 185 190
Ala Pro Ala Asp Asp Lys lie Vai Phe Asn Phe His Cys Tyr Glu Pro195 200 205
Leu Vai Phe Thr His Gln Gly Ala Tyr Trp Leu Glu Asp Met lie Pro210 215 220
Asp Phe Arg Met Thr Tyr Pro Ala Thr Met Glu Glu Phe Tyr Glu Ala225 230 235 240
Thr Lys Lys lie Leu Pro Asn Met Ser Pro Asp Gly Phe Lys Asp Phe245 250 255
Asp Gln Glu Met Gly Pro Gly Phe Phe Glu Lys lie Phe Thr Pro Ala260 265 270
Leu Lys Arg Ala Glu Gln Asp Asn Vai Ala Leu Tyr Cys Gly Glu Tyr275 280 285
Gly Vai lie Asp Leu Ala Asp Asn His Ala Lys lie Arg Trp Leu Lys290 295 300
Asp lie His Thr Thr Phe Ser Lys Tyr Gly lie Gly Ser Ala Leu Trp305 310 315 320
Asn Tyr Lys Gly Lys Asp Phe Gly Tyr Vai Asp Asp Arg Phe Ala Glu325 330 335
Cys Arg Glu Ala Phe lie Glu Cys Leu Lys Ala340 345
<210> 61<211> 1230<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 61
ttggtatgga caccagctcg atcaacgctt gctggatctt ctgaaatccc actaatgaca 60
atgaatatat tccccaatag aaaagactca cgaatgtccc tctggatcaa gcttggcata 120
ctttgtatga tggctggaac ggtgatggtt cacggagcgc agactggtca aggagaagca 180
acaatgaatc aagcaaatgg cttcaaggta agcaacggga ccaatatcag ccattggttg 240
tcccagtgtt ttgaaacaat gccaccccgg cgcggatttt tctccgaact ggatgttatc 300
ttcatccgct cgctggggat ggatcatttc cgtcttccgg tggacgagaa ggaactttgg 360
acggaggatc ttgagaagat tcccgaagcg tgggattacc tcaggaatgc tctaagctgg 420
gctagaaagc atgagcttcg tgtgattgtg gatcttcacg tcgtgcggtc ccatcacttt 480
aatgcggcaa atgaaggggg aaccaacact ctgtgggatg atccggaggc gcaggaaagt 540
ttcctcaacc tttggaggca gctttcggca gagctcgcct acaccgatgt ggactgggtg 600
gcctatgaga tcatgaatga ggccgtcgcg gatgatccgg aggactggaa tcgtctcatc 660
gccaaagccc actccttgat ccgcgagcgt gagccaaggc gcacactcgt catcggatcc 720
aaccggtggc aaattccgtc aacgttcccg gatctgaaga ttccggacgg agatccgaac 780
atcctcctga gtttccattt ctacgcgcct ctgcttttca cccactatcg ggcaacctgg 840
gttgcctttt acgattatga tgggccggtt tcctatcctg gcaggatcgt tgatgatgca 900
gctcttgaga aaaatgatta tactcctgca ttcaaagaca agattcgtgc gttgaatggt 960
gtgtatgaca tcgacgctct cgaaaaagaa atgcagccgg ctatcgaata cgcaaaacag 1020
aaagggttac cactgtattg cggagagtgg ggatgttttc atgctgtgga aagaaaacaa 1080
cgcttgcaat ggtacaaaga tatatccact attttgaaac gcaatgggat cgcccatgcc 1140
acatgggatt acaagggcga gttcggcatt gtggacactt ggacactagg tgttgattgg 1200
aatttggtag gagcaatcct gtcagagtag 1230
<210> 62<211> 409<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (62)...(390)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO<222> (73)...(76)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 62
Met Vai Trp Thr Pro Ala Arg Ser Thr Leu Ala Gly Ser Ser Glu lie15 10 15
Pro Leu Met Thr Met Asn lie Phe Pro Asn Arg Lys Asp Ser Arg Met20 25 30
Ser Leu Trp lie Lys Leu Gly lie Leu Cys Met Met Ala Gly Thr Vai35 40 45
Met Vai His Gly Ala Gln Thr Gly Gln Gly Glu Ala Thr Met Asn Gln50 55 60
Ala Asn Gly Phe Lys Vai Ser Asn Gly Thr Asn lie Ser His Trp Leu65 70 75 80
Ser Gln Cys Phe Glu Thr Met Pro Pro Arg Arg Gly Phe Phe Ser Glu85 90 95
Leu Asp Vai lie Phe lie Arg Ser Leu Gly Met Asp His Phe Arg Leu100 105 110
Pro Vai Asp Glu Lys Glu Leu Trp Thr Glu Asp Leu Glu Lys lie Pro115 120 125
Glu Ala Trp Asp Tyr Leu Arg Asn Ala Leu Ser Trp Ala Arg Lys His130 135 140
Glu Leu Arg Vai lie Vai Asp Leu His Vai Vai Arg Ser His His Phe145 150 155 160
Asn Ala Ala Asn Glu Gly Gly Thr Asn Thr Leu Trp Asp Asp Pro Glu165 170 175
Ala Gln Glu Ser Phe Leu Asn Leu Trp Arg Gln Leu Ser Ala Glu Leu180 185 190
Ala Tyr Thr Asp Vai Asp Trp Vai Ala Tyr Glu lie Met Asn Glu Ala195 200 205
Vai Ala Asp Asp Pro Glu Asp Trp Asn Arg Leu lie Ala Lys Ala His210 215 220
Ser Leu lie Arg Glu Arg Glu Pro Arg Arg Thr Leu Vai lie Gly Ser225 230 235 240
Asn Arg Trp Gln lie Pro Ser Thr Phe Pro Asp Leu Lys lie Pro Asp245 250 255
Gly Asp Pro Asn lie Leu Leu Ser Phe His Phe Tyr Ala Pro Leu Leu260 265 270363
Phe Thr His Tyr Arg Ala Thr Trp Vai Ala Phe Tyr Asp Tyr Asp Gly275 280 285
Pro Vai Ser Tyr Pro Gly Arg lie Vai Asp Asp Ala Ala Leu Glu Lys290 295 300
Asn Asp Tyr Thr Pro Ala Phe Lys Asp Lys lie Arg Ala Leu Asn Gly305 310 315 320
Vai Tyr Asp lie Asp Ala Leu Glu Lys Glu Met Gln Pro Ala lie Glu325 330 335
Tyr Ala Lys Gln Lys Gly Leu Pro Leu Tyr Cys Gly Glu Trp Gly Cys340 345 350
Phe His Ala Vai Glu Arg Lys Gln Arg Leu Gln Trp Tyr Lys Asp lie355 360 365
Ser Thr lie Leu Lys Arg Asn Gly lie Ala His Ala Thr Trp Asp Tyr370 375 380
Lys Gly Glu Phe Gly lie Vai Asp Thr Trp Thr Leu Gly Vai Asp Trp385 390 395 400
Asn Leu Vai Gly Ala lie Leu Ser Glu405
<210> 63<211> 1152<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 63
atgaaacgga gggaattcat gttggggggt gcgggtgttg ctgcgttggc atcgactctt 60
ggagtctccg ccggttccac ttccgggcag ggagtgaacg agaatgtgag ggtataccgg 120
aatgcgattc cccgttggag ggggttcaac ctcatgccct ttttctcggc aatgagcacc 180
aacccggaat acaatggtct gacggtgccg gaggatgacc taaactggat ccgcgactgg 240
ggttttgact atgtccggct tccgattgat tactggattc tggttgattc cgattggcga 300
gatgcaaagc gcatgcgggt agaggatgtt cgcaaggccg accagaaggg atattcacgg 360
ctggacgctg tgattgaagc ctgtatcgcg aagggtttgc acctcaacct gaatatgcat 420
cggtgtcccg ggtattgcat caatggctgg gaactggagc cctataacct cttcaaggat 480
gagcaggcgg aggatgattt tgtctaccat tgggagttgc tcgcgagacg ctataaggga 540
atcgatcctt cgctgctgag tttcaatctg ctgaatgagg ctcccaatcc tggagacaag 600atgtcgtcgg aggattatcg tcgggtgatg cttcgatccg ctgctgttat tcgggggata 660
agcccggacc gcatgattat tgtggacggg ctggaaatcg gtaaatcagt tgttccaggg 720
ctgatgcatg agccatttgc ccaagctgtt catgcctacg agccccacga gttgagccat 780
tataatgcgc cttggacgtc ggtgtttatg ggtattcctg agccatcctg gccgacagtt 840
cgtttggatg gttctctgtt cgaccgcaag cgactggagt tgtatttcgc gccgtggggg 900
gagttggtcc gccagggggt aggggtccac tgtggggaga ccggttgcta cattcatacg 960
ccccatcggg tgtttctgtc ctggttcgaa gatgttttgg atatcctgac cggatacgac 1020
atagggtggg ctctatggaa tttccgggga gatttcggaa tacttgattc caaacgcaag 1080
gatgtgcaat atgtcgattg gtatggacac cagctcgatc aacgcttgct ggatcttctg 1140
aaatcccact aa 1152
<210> 64
<211> 383
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1) . . . (24)
<220>
<221>. DOMÍNIO <222> (48)...(357)
<223> Celulase (Família glicosil hidrolase 5) <400> 64
Met Lys Arg Arg Glu Phe Met Leu Gly Gly Ala Gly Vai Ala Ala Leu 15 10 15
Ala Ser Thr Leu Gly Vai Ser Ala Gly Ser Thr Ser Gly Gln Gly Vai 20 25 30
Asn Glu Asn Vai Arg Vai Tyr Arg Asn Ala lie Pro Arg Trp Arg Gly 35 40 45
Phe Asn Leu Met Pro Phe Phe Ser Ala Met Ser Thr Asn Pro Glu Tyr 50 55 60
Asn Gly Leu Thr Vai Pro Glu Asp Asp Leu Asn Trp lie Arg Asp Trp 65 70 75 80
Gly Phe Ásp Tyr Vai Arg Leu Pro lie Asp Tyr Trp lie Leu Vai Asp 85 90 95
Ser Asp Trp Arg Asp Ala Lys Arg Met Arg Vai Glu Asp Vai Arg Lys 100 105 110
Ala Asp Gln Lys Gly Tyr Ser Arg Leu Asp Ala Vai lie Glu Ala Cys115 120 125
lie Ala Lys Gly Leu His Leu Asn Leu Asn Met His Arg Cys Pro Gly 130 135 140
Tyr Cys lie Asn Gly Trp Glu Leu Glu Pro Tyr Asn Leu Phe Lys Asp 145 150 155 160
Glu Gln Ala Glu Asp Asp Phe Vai Tyr His Trp Glu Leu Leu Ala Arg 165 170 175
Arg Tyr Lys Gly lie Asp Pro Ser Leu Leu Ser Phe Asn Leu Leu Asn 180 185 190
Glu Ala Pro Asn Pro Gly Asp Lys Met Ser Ser Glu Asp Tyr Arg Arg 195 200 205
Vai Met Leu Arg Ser Ala Ala Vai lie Arg Gly lie Ser Pro Asp Arg 210 215 220
Met lie lie Vai Asp Gly Leu Glu lie Gly Lys Ser Vai Vai Pro Gly 225 230 235 240
Leu Met His Glu Pro Phe Ala Gln Ala Vai His Ala Tyr Glu Pro His 245 250 255
Glu Leu Ser His Tyr Asn Ala Pro Trp Thr Ser Vai Phe Met Gly lie 260 265 270
Pro Glu Pro Ser Trp Pro Thr Vai Arg Leu Asp Gly Ser Leu Phe Asp 275 280 285
Arg Lys Arg Leu Glu Leu Tyr Phe Ala Pro Trp Gly Glu Leu Vai Arg 290 295 300
Gln Gly Vai Gly Vai His Cys Gly Glu Thr Gly Cys Tyr lie His Thr 305 310 315 320
Pro His Arg Vai Phe Leu Ser Trp Phe Glu Asp Vai Leu Asp lie Leu 325 330 335
Thr Gly Tyr Asp lie Gly Trp Ala Leu Trp Asn Phe Arg Gly Asp Phe 340 345 350
Gly lie Leu Asp Ser Lys Arg Lys Asp Vai Gln Tyr Vai Asp Trp Tyr 355 360 365
Gly His Gln Leu Asp Gln Arg Leu Leu Asp Leu Leu Lys Ser His 370 375 380<210> 65 <211> 1131 <212> DNA
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <400> 65
atgaacacac tcctaccacg gcggcgactg tggtcctcca cggcgatcct gcgcacgctg 60
gcggccgggg cgctggcggc cggtatggtc ctggcacccg tcagtgccgc caacgcggcc 120
accaccctcg gtgcctcggc ggcggagaag ggccggtact tcggtgcggc cgtcgggacg 180
tacaagttca acgacagcac ctacatgtcg gtgctgaacc gcgagttcaa cagcctggtc 240
gccgagaacg agatgaagtg ggacgcgacc gagccccagc gcggcgtgtt caactacagc 300
gccggggacc gcatcgtcaa ccacgcccga tcccagggca tgaaggtacg cggacacgcc 360
ctgttgtggc acgcccagca gccacgctgg acggagggcc tgtccggcgg cgacctgcgc 420
aacgccgcga tcaaccatgt cacccaggtg gccagccact tccgggggca gatctactcc 480
tgggacgtgg tgaacgaggc tttcgccgac ggtggcagcg gtgcccggcg ggactcgaac 540
ctccagcgca ccggcaacga ctggatcgag gcggcgttcc gtgccgcccg ggcagccgat 600
cccaacgcca agctctgcta caacgactac aacaccgacg ggatcaacgc gaagtccacc 660
ggcgtctaca acatggtgcg tgacttcaag tcccgtgggg tgccgatcga ctgcgtgggc 720
ttccagtcac acctgggcac caccctcccc ggtgactacc aggccaacct tcagcgcttc 780
gccgacctgg gcgtcgacgt ggagatcacc gagctggaca tcacccaggg cggaaaccag 840
gccaacatgt acggcgccgt cacccgcgcc tgcctggcga tctcgcgctg caccggcatc 900
accgtgtggg gggtacggga ctgcgactcc tggcgtggtg gggacaacgc cctgctgttc 960
gactgcgccg gcaacaagaa gcccgcgtac acggccgtcc tcgacgccct caacagcggc 1020
tcgaacccga accccaaccc caccggcaac cggctgcgca acgaggcctc cggtcgatgc 1080
ctggacgtca acggcgcaag ctccgccaac gggtcacaaa tgatccaaag a 1131
<210> 66 <211> 377 <212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(39)
<220>
<221> DOMÍNIO <222> (42)...(337)
<223> Familia glicosil hidrolase 10 <220>
<221> SÍTIO
<222> (99)...(102)<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (268)...(278)
<223> Família glicosil hidrolase 10 active sítio. Pró-sitio id = PS00591 <220>
<221> SÍTIO
<222> (375)...(378)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 66
Met Asn Thr Leu Leu Pro Arg Arg Arg Leu Trp Ser Ser Thr Ala lie 15 10 15
Leu Arg Thr Leu Ala Ala Gly Ala Leu Ala Ala Gly Met Vai Leu Ala 20 25 30
Pro Vai Ser Ala Ala Asn Ala Ala Thr Thr Leu Gly Ala Ser Ala Ala 35 40 45
Glu Lys Gly Arg Tyr Phe Gly Ala Ala Vai Gly Thr Tyr Lys Phe Asn 50 55 60
Asp Ser Thr Tyr Met Ser Vai Leu Asn Arg Glu Phe Asn Ser Leu Vai 65 70 75 80
Ala Glu Asn Glu Met Lys Trp Asp Ala Thr Glu Pro Gln Arg Gly Vai 85 90 . 95
Phe Asn Tyr Ser Ala Gly Asp Arg lie Vai Asn His Ala Arg Ser Gln 100 105 110
Gly Met Lys Vai Arg Gly His Ala Leu Leu Trp His Ala Gln Gln Pro 115 120 125
Arg Trp Thr Glu Gly Leu Ser Gly Gly Asp Leu Arg Asn Ala Ala lie 130 135 140
Asn His Vai Thr Gln Vai Ala Ser His Phe Arg Gly Gln lie Tyr Ser 145 150 155 160
Trp Asp Vai Vai Asn Glu Ala Phe Ala Asp Gly Gly Ser Gly Ala Arg 165 170 175
Arg Asp Ser Asn Leu Gln Arg Thr Gly Asn Asp Trp lie Glu Ala Ala 180 185 190
Phe Arg Ala Ala Arg Ala Ala Asp Pro Asn Ala Lys Leu Cys Tyr Asn 195 200 205
Asp Tyr Asn Thr Asp Gly lie Asn Ala Lys Ser Thr Gly Vai Tyr Asn 210 215 220Met Vai Arg Asp Phe Lys Ser Arg Gly Vai Pro lie Asp Cys Vai Gly 225 230 235 240
Phe Gln Ser His Leu Gly Thr Thr Leu Pro Gly Asp Tyr Gln Ala Asn 245 250 255
Leu Gln Arg Phe Ala Asp Leu Gly Vai Asp Vai Glu lie Thr Glu Leu 260 265 270
Asp lie Thr Gln Gly Gly Asn Gln Ala Asn Met Tyr Gly Ala Vai Thr 275 280 285
Arg Ala Cys Leu Ala lie Ser Arg Cys Thr Gly lie Thr Vai Trp Gly 290 295 300
Vai Arg Asp Cys Asp Ser Trp Arg Gly Gly Asp Asn Ala Leu Leu Phe 305 310 315 320
Asp Cys Ala Gly Asn Lys Lys Pro Ala Tyr Thr Ala Vai Leu Asp Ala 325 330 335
Leu Asn Ser Gly Ser Asn Pro Asn Pro Asn Pro Thr Gly Asn Arg Leu 340 345 350
Arg Asn Glu Ala Ser Gly Arg Cys Leu Asp Vai Asn Gly Ala Ser Ser 355 360 365
Ala Asn Gly Ser Gln Met lie Gln Arg 370 375
<210> 67
<211> 1023
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 67
atgaaatata tattttcgta tataataatg atgattttaa tcggttttat accggtctat 60
ggattcggcg attcacctga ccaaacatac tctctcccct tcctcagcgt agaaggaaat 120
tcattcgtcg atgaaaacgg tgaggaggtt attttgcggg gtgtatcgtt tcccgatccc 180
aatcgattgg atgatgctac tcaatggaac aaacggtatt tccaggcagc aaaagattgg 240
aactgtaatg tcgtcagaat accggttcat ccgcaaagat ggcgggaaag gggaaaagaa 300
aattatctga aacttttaga taagggtatc gagtgggccg gtgaactcgg tatgtacgtg 360
atcattgact ggcacactat cggcaatccg attaccgaag tgttcttcgg cgagctctat 420
aatacgaccc agaccgaaac gttccggttc tggagaacaa tagcggagcg atatgcaggt 480aatcccgttg ttgcatttta tgaattgt-tt aatgaaccga ccgattataa cggtcggctc 540
gggaggatga cctgggatca atataaagaa ttcatcgaag agatcattta tataatttat 600 78
gcacacgacg aaaccgtgat accgcttgta ggcggtttcg attggggata tgatctcagg 660
aatgttagag ataatccgat aaatgccccg ggtatcgcgt atgttactca cccgtatccg 720
caaaagcggg accaaccgtg ggaagaaaaa tgggaaaggg atttcggttt cgtagccgac 780
acctaccctg tgtttgctac cgagttcgga tttatgagtg aggatggttt gggtgcacat 840
attcccgtta tcggtgatga aacatacggt gaagcgatca tcagttactt caatgagaaa 900
ggtatatcgt ggacggcctg ggtgttcgat ccgctctggt cgccgcagct tattaaagac 960
tggtatttta ccccgacccg gcagggacag ttttttaaag agaagctaat ggagttgaat 1020
taa 1023
<210> 68
<211> 340
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(23)
<220>
<221> DOMÍNIO <222> (40) . . . (317)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO
<222> (143)...(146)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 68
Met Lys Tyr lie Phe Ser Tyr lie lie Met Met lie Leu lie Gly Phe 1 5 10 ■ 15
lie Pro Vai Tyr Gly Phe Gly Asp Ser Pro Asp Gln Thr Tyr Ser Leu
> 20 25 30
Pro Phe Leu Ser Vai Glu Gly Asn Ser Phe Vai Asp Glu Asn Gly Glu 35 40 45
Glu Vai lie Leu Arg Gly Vai Ser Phe Pro Asp Pro Asn Arg Leu Asp 50 55 60
Asp Ala Thr Gln Trp Asn Lys Arg Tyr Phe Gln Ala Ala Lys Asp Trp 65 70 75 80
Asn Cys Asn Vai Vai Arg lie Pro Vai His Pro Gln Arg Trp Arg Glu 85 90 95Arg Gly Lys Glu Asn Tyr Leu Lys Leu Leu Asp Lys Gly lie Glu Trp 100 105 110
Ala Gly Glu Leu Gly Met Tyr Vai lie lie Asp Trp His Thr lie Gly 115 120 125
Asn Pro lie Thr Glu Vai Phe Phe Gly Glu Leu Tyr Asn Thr Thr Gln 130 135 140
Thr Glu Thr Phe Arg Phe Trp Arg Thr lie Ala Glu Arg Tyr Ala Gly 145 150 155 160
Asn Pro Vai Vai Ala Phe Tyr Glu Leu Phe Asn Glu Pro Thr Asp Tyr 165 170 175
Asn Gly Arg Leu Gly Arg Met Thr Trp Asp Gln Tyr Lys Glu Phe lie 180 185 190
Glu Glu lie lie Tyr lie lie Tyr Ala His Asp Glu Thr Vai lie Pro 195 200 205
Leu Vai Gly Gly Phe Àsp Trp Gly Tyr Asp Leu Arg Asn Vai Arg Asp . 210 215 220
Asn Pro lie Asn Ala Pro Gly lie Ala Tyr Vai Thr His Pro Tyr Pro 225 230 235 240
Gln Lys Arg Asp Gln Pro Trp Glu Glu Lys Trp Glu Arg Asp Phe Gly 245 250 255
Phe Vai Ala Asp Thr Tyr Pro Vai Phe Ala Thr Glu Phe Gly Phe Met 260 265 270
Ser Glu Asp Gly Leu Gly Ala His lie Pro Vai lie Gly Asp Glu Thr 275 280 285
Tyr Gly Glu Ala lie lie Ser Tyr Phe Asn Glu Lys Gly lie Ser Trp 290 295 300
Thr Ala Trp Vai Phe Asp Pro Leu Trp Ser Pro Gln Leu lie Lys Asp 305 310 315 320
Trp Tyr Phe Thr Pro Thr Arg Gln Gly Gln Phe Phe Lys Glu Lys Leu 325 330 335
Met Glu Leu Asn 340
<210> 69 <211> 1182 <212> DNA`<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <400> 69
atgagtttta aaaaccacat acttttgtcg ctcctcatag tattgctttt cttttcagcg 60
tgcgatatcg aagaaccgat cgccggagat tatcatacac ttgtggatca aaacgctata 120
tcgcacaccc gcgcattatt caccaacctc gaacgtatcc gtcacgatca tatcctcttc 180
ggtcatcagg atgcgcttgc atacggtgtt cactggcgca acgatgagcc gggtcgatcg 240
gatgtattcg aagtaaccgg ttcgtatcct gcggtgtatg gctgggagat tggcgatatt 300
gaacttggtg caccggaaaa tctggataac gtaaacttcg atcaaatgca gggctggatt 360
cgcgaagggt acgaacgcgg cggtataatt acgattagct ggcatatgaa caatccggca 420
tcgggtggtg attcgtggga tgtgaatgga ggtcataaag cggtaactaa gatacttccc 480
ggcggagaac ttcacgatac gtttaaagaa tggctggata cgtttgcaaa attcgcgaag 540
agccagattg cttttcccga aacaaataat gaacacctta tcccggtcat attccggccg 600
tatcatgaaa acaccggaag ctggttctgg tggggcgccg accactgtac acctgaagaa 660
tataaaaagt tatggcgatt taccgtcgaa tacctgcgcg atgtaaaagg tgttcacaat 720
ctcctctggg cgtattcacc tgccggcaat gctgcggatt cagaggaagc atattttgct 780
cggtatcccg gcgacgacta tgttgatatt attggattcg acgattacgg cagtgtgcgg 840
aaaccgtatc aaatcgaacg ttttactaac cggattcgaa cgattgtaaa cttcgccgaa 900
gcacgaaata aaatcccggc aataacggaa accggctatg aaactatccc cgatccgcaa 960
tggtggacgg gtacattgct tagtgcactt gatcacgatt tgacaacccg gagaatagca 1020
tacgtacttg tgtggcgaaa ttcaaacaat gctaccgacc ggcagaatca ttattacgct 1080
ccgtatcccg gacatccaag tgctgacgat tttatcgcgt tcaggaatca cccgttgata 1140
gttttcgaag atgatctgcc gggtatgtat acactaccgt aa 1182
<210> 70
<211> 393
<212> PRT ,
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(20)
<220>
<221> DOMÍNIO <222> (35)...(351)
<223> Família glicosil hidrolase 26 <220>
<221> SÍTIO
<222> (355)...(358)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 70
Met Ser Phe Lys Asn His lie Leu Leu Ser Leu Leu lie Vai Leu Leu 15 10 15
Phe Phe Ser Ala Cys Asp lie Glu Glu Pro lie Ala Gly Asp Tyr His 20 25 30
Thr Leu Vai Asp Gln Asn Ala lie Ser His Thr Arg Ala Leu Phe Thr 35 40 45
Asn Leu Glu Arg lie Arg His Asp His lie Leu Phe Gly His Gln Asp 50 55 60
Ala Leu Ala Tyr Gly Vai His Trp Arg Asn Asp Glu Pro Gly Arg Ser 65 70 75 80
Asp Vai Phe Glu Vai Thr Gly Ser Tyr Pro Ala Vai Tyr Gly Trp Glu 85 90 95
lie Gly Asp lie Glu Leu Gly Ala Pro Glu Asn Leu Asp Asn Vai Asn 100 105 110
Phe Asp Gln Met Gln Gly Trp lie Arg Glu Gly Tyr Glu Arg Gly Gly 115 120 125
lie lie Thr lie Ser Trp His Met Asn Asn Pro Ala Ser Gly Gly Asp 130 135 140
Ser Trp Asp Vai Asn Gly Gly His Lys Ala Vai Thr Lys lie Leu Pro 145 150 155 160
Gly Gly Glu Leu His Asp Thr Phe Lys Glu Trp Leu Asp Thr Phe Ala 165 170 175
Lys Phe Ala Lys Ser Gln lie Ala Phe Pro Glu Thr Asn Asn Glu His 180 185 190
Leu lie Pro Vai lie Phe Arg Pro Tyr His Glu Asn Thr Gly Ser Trp 195 200 205
Phe Trp Trp Gly Ala Asp His Cys Thr Pro Glu Glu Tyr Lys Lys Leu 210 215 220
Trp Arg Phe Thr Vai Glu Tyr Leu Arg Asp Vai Lys Gly Vai His Asn 225 230 235 240
Leu Leu Trp Ala Tyr Ser Pro Ala Gly Asn Ala Ala Asp Ser Glu Glu 245 250 255
Ala Tyr Phe Ala Arg Tyr Pro Gly Asp Asp Tyr Vai Asp lie lie Gly260 265 270
Phe Asp Asp Tyr Gly Ser Vai Arg Lys Pro Tyr Gln lie Glu Arg Phe 275 280 285
Thr Asn Arg lie Arg Thr lie Vai Asn Phe Ala Glu Ala Arg Asn Lys 290 295 300
lie Pro Ala lie Thr Glu Thr Gly Tyr Glu Thr lie Pro Asp Pro Gln 305 310 315 320
Trp Trp Thr Gly Thr Leu Leu Ser Ala Leu Asp His Asp Leu Thr Thr 325 330 335
Arg Arg lie Ala Tyr Vai Leu Vai Trp Arg Asn Ser Asn Asn Ala Thr 340 345 350
Asp Arg Gln Asn His Tyr Tyr Ala Pro Tyr Pro Gly His Pro Ser Ala 355 360 365
Asp Asp Phe lie Ala Phe Arg Asn His Pro Leu lie Vai Phe Glu Asp 370 375 380
Asp Leu Pro Gly Met Tyr Thr Leu Pro 385 390
<210> 71
<211> 1089
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 71
atgaaacttt taaaactttt aatctttctc cttattacgg taattttttc tgatgtttcg 60
gctcaaactt ttcaaataca aaaaggcaag aacattagcc attggctgtc ccaaagtaaa 120
agaaggggag .aagagcgaaa agagttcttt actaagaatg acgtagaatt tattgcaggc 180
atcggcttcg atcatattcg tattcctatt gacgaggagc aaatgtggga tgaaaaaggc 240
aacaaagagc ctgaagcgtt tcagttgctg cacaacgcga tagaatggag caggcaatcg 300
aacttaaaag ttattgtgga cctgcatatt ttgaggtcgc attatttcaa cgcggaagaa 360
aaaccgcttt ttacggaccc taaagctcag gaacgttttt accaatgttg ggcggatctg 420
tctggtgaat tgaaaaaata tccgaataca ctggtggctt atgaattaat gaacgaacct 480
gtagccgatg atccggaaga ctggaataga attgtaagag aatcagtaaa aaggctaagg 540
gtgcttgagc ccaatagggt tattgtaatc gggtctaacc gatggcagca ttatgacact 600
ctgaaggatt tatacgtgcc ggaaaacgac aaaaacatca ttttaagctt tcatttttat 660
aaccctatgt tgcttacgca ttacagggcc agctgggtaa atttcggcga ttaccagggt 720cccgttaact acccgggaca gttggtagac tcaaagcatt tgtcgggact gagcgaagat 780
ttaagaaaga aagtcgagca aaacaatggc gtttataata aggctcggat tgagaaaatg 840
atagccgaag ccgttgctgt agcaaaaaag cacaacctcc ctttgtattg tggtgaatgg 900
ggtgcctacg aaaaagcgcc aagggagccc aggctacaat ggtacagaga catggtggat 960
gtgttgaaca aaaacaatat tgcctggact acctgggact ataaaggagg cttcggcata 1020
gttgacgcca aaggaaacaa agacgaacag ttgatcaatg tattaacagg aaaagagaaa 1080
aaaatgtaa 1089
<210> 72
<211> 362
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(21)
<220>
<221> DOMÍNIO <222> (22)____(340)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO <222> (31)...(34)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (154)...(163)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659 <400> 72
Met Lys Leu Leu Lys Leu Leu Ile Phe Leu Leu Ile Thr Vai Ile Phe 1 5 10 15
Ser Asp Vai Ser Ala Gln Thr Phe Gln Ile Gln Lys Gly Lys Asn Ile 20 25 30
Ser His Trp Leu Ser Gln Ser Lys Arg Arg Gly Glu Glu Arg Lys Glu 35 40 45
Phe Phe Thr Lys Asn Asp Vai Glu Phe Ile Ala Gly Ile Gly Phe Asp 50 55 60
His Ile Arg Ile Pro Ile Asp Glu Glu Gln Met Trp Asp Glu Lys Gly 65 70 75 80
Asn Lys Glu Pro Glu Ala Phe Gln Leu Leu His Asn Ala Ile Glu Trp 85 90 95Ser Arg Gln Ser Asn Leu Lys Vai lie Vai Asp Leu His lie Leu Arg 100 105 110
Ser His Tyr Phe Asn Ala Glu Glu Lys Pro Leu Phe Thr Asp Pro Lys 115 120 125
Ala Gln Glu Arg Phe Tyr Gln Cys Trp Ala Asp Leu Ser Gly Glu Leu 130 135 140
Lys Lys Tyr Pro Asn Thr Leu Vai Ala Tyr Glu Leu Met Asn Glu Pro 145 150 155 160
Vai Ala Asp Asp Pro Glu Asp Trp Asn Arg lie Vai Arg Glu Ser Vai 165 170 175
Lys Arg Leu Arg Vai .Leu Glu Pro Asn Arg Vai lie Vai lie Gly Ser 180 185 190
Asn Arg Trp Gln His Tyr Asp Thr Leu Lys Asp Leu Tyr Vai Pro Glu 195 200 205
Asn Asp Lys Asn lie lie Leu Ser Phe His Phe Tyr Asn Pro Met Leu 210 215 220
Leu Thr His Tyr Arg Ala Ser Trp Vai Asn Phe Gly Asp Tyr Gln Gly 225 .230 235 240
Pro Vai Asn Tyr Pro Gly Gln Leu Vai Asp Ser Lys His Leu Ser Gly 245 250 255
Leu Ser Glu Asp Leu Arg Lys Lys Vai Glu Gln Asn Asn Gly Vai Tyr 260 265 270
Asn Lys Ala Arg lie Glu Lys Met lie Ala Glu Ala Vai Ala Vai Ala 275 280 285
Lys Lys His Asn Leu Pro Leu Tyr Cys Gly Glu Trp Gly Ala Tyr Glu 290 295 300
Lys Ala Pro Arg Glu Pro Arg Leu Gln Trp Tyr Arg Asp Met Vai Asp 305 310 315 320
Vai Leu Asn Lys Asn Asn lie Ala Trp Thr Thr Trp Asp Tyr Lys Gly 325 330 335
Gly Phe Gly lie Vai Asp Ala Lys Gly Asn Lys Asp Glu Gln Leu lie 340 345 350
Asn Vai Leu Thr Gly Lys Glu Lys Lys Met 355 360<210> 73
<211> 1146
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 73
gtggatatta ccggacatcc cgaccacatc gccttcgcgc gggaagttgc cgagcaaagc 60
atggtcttgc tgcaaaaccg tgcgaacctc gccccccttt cggtatctga ctattccacc 120
attgccgtga tcggcccgaa tgccaatgac actttgctgg gttcttacag cggcgttccg 180
aaaacctact acacggtact cgacgggata cggtcctatg tcggtgaccg ggcgaatgtg 240
gtttacgctc aggggccgaa gataaccaaa cccggccatc gggaggacaa tgaagtattt 300
ccaccggatc ctgaaaacga ccggagacga ctggccgaag cgatagctgt cgccgagaac 3 60
gccgacctga tcatcctcgc gatcggcggc aatgaactga cgggacgaga ggcatgggcg 420
gcgcatcatc ccggtgatcg accggatctg tcgttgctcg gtttgcagga ggatcttgtt 480
gacgcagttg gagcgatggg ggttccatct gtcgcattgg ttttcggtgc acggccgctg 540
gacctcggca atgtcgccga aaaaattgat gtggtcttcc aaaactggta cctgggccag 600
gaaaccggca atgccgtcgc caatgtgctg tttggcgagg tgtcaccgtc cgccaaactc 660
cccatcagct tcccgcggac tgccgggcac attcctgcct actacaatta caaaccatcg 720
gctcgacggg tctacctttt tgacgatgtc actccgcgtt accatttcgg gtacggcctc 780
agctatacga cgtttgaata cggggaaccg cagctatcgg atacactact gtctggcgat 840
ggtgaaataa ccctctacgt tgaagttacc aacaccggag agcgaggcgg ttcggaagtc 900
gtgcaactgt acatcaacca cgaatacaga tccgtcaccc ggccggtaaa ggagctcaag 960
ggattcgaaa aggtgtatct cgagccgaat gaaactgccg gtgtatcgtt. caccatcact 1020
tcagatcagt tgaggttctg gaatatcgac atggagttta ccgctgaatc cggtaaagtg 1080
aacctgatgg tcggctcatc cagccgtgac gaagacctgc agacgacggc aatttttctt 1140
gaataa 1146
<210> 74 <211> 381 <212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (21). . . (264)
<223> Domínio C-terminal da família glicol hidrolase <220>
<221> SÍTIO <222> (49)... (52)
<223> Sítio de N-glicosilação. Pró-sitio id h PS00001<220>
<221> SÍTIO
<222> (335)...(338)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 74
Met Asp lie Thr Gly His Pro Asp His lie Ala Phe Ala Arg Glu Vai 15 10 15
Ala Glu Gln Ser Met Vai Leu Leu Gln Asn Arg Ala Asn Leu Ala Pro 20 25 30
Leu Ser Vai Ser Asp Tyr Ser Thr lie Ala Vai lie Gly Pro Asn Ala 35 40 45
Asn Asp Thr Leu Leu Gly Ser Tyr Ser Gly Vai Pro Lys Thr Tyr Tyr 50 55 60
Thr Vai Leu Asp Gly lie Arg Ser Tyr Vai Gly Asp Arg Ala Asn Vai 65 70 75 80
Vai Tyr Ala Gln Gly Pro Lys lie Thr Lys Pro Gly His Arg Glu Asp 85 90 95
Asn Glu Vai Phe Pro Pro Asp Pro Glu Asn Asp Arg Arg Arg Leu Ala . 100 105 110
Glu Ala lie Ala Vai Ala Glu Asn Ala Asp Leu lie He Leu Ala He 115 120 125
Gly Gly Asn Glu Leu Thr Gly Arg Glu Ala Trp Ala Ala His His Pro 130 135 140
Gly Asp Arg Pro Asp Leu Ser Leu Leu Gly Leu Gln Glu Asp Leu Vai 145 150 155 160
Asp Ala Vai Gly Ala Met Gly Vai Pro Ser Vai Ala Leu Vai Phe Gly 165 170 175
Ala Arg Pro Leu Asp Leu Gly Asn Vai Ala Glu Lys He Asp Vai Vai 180 185 190
Phe Gln Asn Trp Tyr Leu Gly Gln Glu Thr Gly Asn Ala Vai Ala Asn 195 200 205
Vai Leu Phe Gly Glu Vai Ser Pro Ser Ala Lys Leu Pro He Ser Phe 210 215 220
Pro Arg Thr Ala Gly His He Pro Ala Tyr Tyr Asn Tyr Lys Pro Ser 225 230 235 240Ala Arg Arg Vai Tyr Leu Phe Asp Asp Vai Thr Pro Arg Tyr His Phe 245 250 255
Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Tyr Gly Glu Pro Gln Leu 260 265 270
Ser Asp Thr Leu Leu Ser Gly Asp Gly Glu lie Thr Leu Tyr Vai Glu 275 280 285
Vai Thr Asn Thr Gly Glu Arg Gly Gly Ser Glu Vai Vai Gln Leu Tyr 290 295 300
lie Asn His Glu Tyr Arg Ser Vai Thr Arg Pro Vai Lys Glu Leu Lys 305 310 315 320
Gly Phe Glu Lys Vai Tyr Leu Glu Pro Asn Glu Thr Ala Gly Vai Ser 325 330 335
Phe Thr lie Thr Ser Asp Gln Leu Arg Phe Trp Asn lie Asp Met Glu 340 345 350
Phe Thr Ala Glu Ser Gly Lys Vai Asn Leu Met Vai Gly Ser Ser Ser 355 360 365
Arg Asp Glu Asp Leu Gln Thr Thr Ala lie Phe Leu Glu 370 375 380
<210> 75 <211> 1014 <212> DNA
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <400> 75
atgctgcgca agttgatcgt ctcggtcttc ggcttcgtca tgctgactag tgcggcagcg 60
gcgcagactc ctcccgcctt agcggaatcc gcgcctgctc tccggcgcgg aatgaacgtt 120
ctgggctacg acccaatctg gcacgacccg aagaaaggtc ggttcgaaga gcggcacttc 180
gccgagattc gcaagggcgg cttcgacttc gttcgggtga acctccacgg gttcaaacat 240
atgaacgccg cggacaaact cagtccggag ttcctgagcc gcgtggactg gatcgtgaag 300
cacgccagtg cggcgggcct gtcggtcatc ctagacgagc atgaatatga ggaatgctcg 360
gacgacgtcg caatgtgccg gcggcgtttg gcggcattct ggacgcaggt cgcgccgcgc 420
tacaagggcg cgcccgatac ggttctgttc gagcttctca atgagccgca cgacaagttg 480
gatgccgaca cctggaacgc cttgtttccc gacatcctgg ccatcgtgcg gcagtcgaac 540
ccgaagcgcc gcgtggtgat cggcccgact cagtggaaca acttcagcca gctggacacg •600
ctcaagctgc cggcagacga ccggaacatc gtcgtcacct tccattatta cgatccgttc 660ccgtttaccc accagggcgc gccgtgggtt ccggacatgc tcaaggtgaa aggcatcgag 720
tggaagcccg agcagagggc gaagatcgcc gaggacttcg gcaaggtcgc ggaatggtcg 780
cagaaaaccg gccgcgaaat cttgctcggc gagttcgggg cctacgatgt gagcggtacg 840
ccaaccgcca tgcgttcagc ttatacggaa gcggtggcgc gcgaggcgga acgccacggc 900
ttcgcttggg cctactggca gttcgacagc aatttcctgg cttgggacat gaagacaaac 960
ggctgggtcg agccgatcca caaggcactc atccccgagg cgaagcagcc ttag 1014
<210> 76
<211> 337
<212> PRT
<213> Desconhecido
<220>
<22 3> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (37)...(316)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO
<222> (150)...(159)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659 <400> 76
Met Leu Arg Lys Leu lie Vai Ser Vai Phe Gly Phe Vai Met Leu Thr 15 10 15
Ser Ala Ala Ala Ala Gln Thr Pro Pro Ala Leu Ala Glu Ser Ala Pro 20 25 30
Ala Leu Arg Arg Gly Met Asn Vai Leu Gly Tyr Asp Pro lie Trp His 35 40 45
Asp Pro Lys Lys Gly Arg Phe Glu Glu Arg His Phe Ala Glu lie Arg 50 55 60
Lys Gly Gly Phe Asp Phe Vai Arg Vai Asn Leu His Gly Phe Lys His 65 70 75 80
Met Asn Ala Ala Asp Lys Leu Ser Pro Glu Phe Leu Ser Arg Vai Asp 85 90 95
Trp lie Vai Lys His Ala Ser Ala Ala Gly Leu Ser Vai lie Leu Asp 100 105 110
Glu His Glu Tyr Glu Glu Cys Ser Asp Asp Vai Ala Met Cys Arg Arg 115 120 125
Arg Leu Ala Ala Phe Trp Thr Gln Vai Ala Pro Arg Tyr Lys Gly Ala 130 135 140Pro Asp Thr Vai Leu Phe Glu Leu Leu Asn Glu Pro His Asp Lys Leu 145 150 155 160
Asp Ala Asp Thr Trp Asn Ala Leu Phe Pro Asp lie Leu Ala lie Vai 165 170 175
Arg Gln Ser Asn Pro Lys Arg Arg Vai Vai lie Gly Pro Thr Gln Trp 180 185 190
Asn Asn Phe Ser Gln Leu Asp Thr Leu Lys Leu Pro Ala Asp Asp Arg 195 200 205
Asn lie Vai Vai Thr Phe His Tyr Tyr Asp Pro Phe Pro Phe Thr His 210 215 220
Gln Gly Ala Pro Trp Vai Pro Asp Met Leu Lys Vai Lys Gly lie Glu 225 230 235 240
Trp Lys Pro Glu Gln Arg Ala Lys lie Ala Glu Asp Phe Gly Lys Vai 245 250 255
Ala Glu Trp Ser Gln Lys Thr Gly Arg Glu lie Leu Leu Gly Glu Phe 260 265 270
Gly Ala Tyr Asp Vai Ser Gly Thr Pro Thr Ala Met Arg Ser Ala Tyr 275 280 285
Thr Glu Ala Vai Ala Arg Glu Ala Glu Arg His Gly Phe Ala Trp Ala 290 295 300
Tyr Trp Gln Phe Asp Ser Asn Phe Leu Ala Trp Asp Met Lys Thr Asn 305 310 315 320
Gly Trp Vai Glu Pro lie His Lys Ala Leu lie Pro Glu Ala Lys Gln 325 330 335
Pro
<210> 77
<211> 1125
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 77
atgaaaagga aacgggtttt tattcattct ctaatcgtat tttttttaat gattggttct 60 tttacttctt gtggatcagt cgccgatgat gccgaagaag ggtttgatat ttttagagga 120 accaatatcg ctcattggtt atcacaaagt aatgcaaggg gcgaagagcg aaaaaatttc 180tttaccgaaa atgatataaa atttattgct gatgctggtt ttgatcatat tcgtttgcca 240
attgacgagg ttcatttctg ggatgagaat atgaaccggc accaagatgc atttgatctt 300
atgcatgact gtattaagtg gtcagagaaa catggtctta gggttgtagt ggatttgcat 360
attattcgtt cacattattt tgttggagat gataatacac tatgggatga aagacatgaa 420
caggaaaagt ttgttgatat ttggatggag ttatcatctg aactatctca atattcaaac 480
tcattagtag cttatgagtt aatgaatgaa cctgtagccc cttctcatga tgattggaat 540
agtttggttg cggaaactat agaggcaatt cgtaaagttg aacctgagag atatattgta 600
gttggatcaa atatgtggca aggtattgat acatttgagt atttggaagt tcccgaaaat 660
gatgatagaa taattcttag ttttcatttt tatgatccct ttattttgac tcattatact 720
gcatcttggg ggtatttaag agattactca gggcctgtta actatccggg atatcttgtt 780
acaaatgacc agctgttgga tatgtcaaac gaaatgcaaa agttaattag ggagtttcag 840
acaaattttg atatttatac cattgaagaa ctgatatcta ttccatatag tattgcaaag 900
gaaaaagggt tgaaattata ttgtggagag tttggtgcaa ttgatcaggc tccaagagat 960
gcgagattgg catggtacag agatgttgtt caggtttttg agcgatatgg tatagctcat 1020
gccaactgga attacaaaga ttatggtacg tttgggataa agaactatag cgaggagata 1080
gatcaggaac tgtttgaaat cttaattgga acaaaacata aatag 1125
<210> 78 <211> 374 <212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(28)
<220>
<221> DOMÍNIO <222> (25)...(353)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO
<222> (165)...(174)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659 <220>
<221> SÍTIO
<222> (360)...(363)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 78
Met Lys Arg Lys Arg Vai Phe lie His Ser Leu lie Vai Phe Phe Leu 15 10 15
Met lie Gly Ser Phe Thr Ser Cys Gly Ser Vai Ala Asp Asp Ala Glu 20 25 30Glu Gly Phe Asp lie Phe Arg Gly Thr Asn lie Ala His Trp Leu Ser 35 40 45
Gln Ser Asn Ala Arg Gly Glu Glu Arg Lys Asn Phe Phe Thr Glu Asn 50 55 60
i Asp lie Lys Phe lie Ala Asp Ala Gly Phe Asp His lie Arg Leu Pro
65 70 75 80
lie Asp Glu Vai His Phe Trp Asp Glu Asn Met Asn Arg His Gln Asp 85 90 95
Ala Phe Asp Leu Met His Asp Cys lie Lys Trp Ser Glu Lys His Gly 100 105 110
Leu Arg Vai Vai Vai Asp Leu His lie lie Arg Ser His Tyr Phe Vai 115 120 125
Gly Asp Asp Asn Thr Leu Trp Asp Glu Arg His Glu Gln Glu Lys Phe 130 135 140
Vai Asp lie Trp Met Glu Leu Ser Ser Glu Leu Ser Gln Tyr Ser Asn 145 150 155 160
Ser Leu Vai Ala Tyr Glu Leu Met Asn Glu Pro Vai Ala Pro Ser His 165 170 175
Asp Asp Trp Asn Ser Leu Vai Ala Glu Thr lie Glu Ala lie Arg Lys 180 185 190
Vai Glu Pro Glu Arg Tyr lie Vai Vai Gly Ser Asn Met Trp Gln Gly 195 200 205
lie Asp Thr Phe Glu Tyr Leu Glu Vai Pro Glu Asn Asp Asp Arg lie 210 215 220
lie Leu Ser Phe His Phe Tyr Asp Pro Phe lie Leu Thr His Tyr Thr 225 230 235 240
Ala Ser Trp Gly Tyr Leu Arg Asp Tyr Ser Gly Pro Vai Asn Tyr Pro 245 250 255
Gly Tyr Leu Vai Thr Asn Asp Gln Leu Leu Asp Met Ser Asn Glu Met 260 265 270
Gln Lys Leu lie Arg Glu Phe Gln Thr Asn Phe Asp lie Tyr Thr lie 275 280 285
Glu Glu Leu lie Ser lie Pro Tyr Ser lie Ala Lys Glu Lys Gly Leu 290 295 300Lys Leu Tyr Cys Gly Glu Phe Gly Ala lie Asp Gln Ala Pro Arg Asp 305 310 315 320
Ala Arg Leu Ala Trp Tyr Arg Asp Vai Vai Gln Vai Phe Glu Arg Tyr 325 330 335
Gly lie Ala His Ala Asn Trp Asn Tyr Lys Asp Tyr Gly Thr Phe Gly 340 345 350
lie Lys Asn Tyr Ser Glu Glu lie Asp Gln Glu Leu Phe Glu lie Leu
lie Gly Thr Lys His Lys 370
<210> 79
<211> 1017
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 79
atgaaatata aagctatttt tatatacctt attgttttga ttctatttta ctcaattaat 60
atttatgcta atgcagaaaa caaccccctc cccttcctca gtgtcgaagg aaacaggttc 120
gtcgatgaag atggaaatac ggtaatcctg cgaggtgtat cgttccccga tcccgaccgg 180
ctggctgagg caactcaatg gaacaagcga tacttccagg cggcaaaaga ctggaactgt 240
aatgtcgtcc ggattcctgt ccatccacag aaatggcggg aaagaggcga ggaaaattat 300
ctgaaacttt tagataaggg aattcaatgg gcgggtgaac tcgggatgta tgtaatcatc 360
gactggcata ccatcggtaa tccgataacc gaagtatttt tccgcgaact atacaatacg 420
tcacgtgcgg agaccttcca gttctggaga acaatcgctg agcgctatgc cggtaacccg 480
gttgttgctt tctatgaact gttcaatgaa ccgaccgact acaacggccg tctcggaaga 540
atgaactggg atcagtataa agagtttatc gaggagataa ttcacatcat ctattctcac 600
gacgatacag ttatccctct cgttgccggt ttcgactggg cgtatgaact ccgccatata 660
aaagataaac ctatagattt tcccggcatc gcttatgtga ctcaccccta tccccagaaa 720
cgcgatccgc catgggaaga aaaatgggaa gaggatttcg ggtttgccgc cgatatgtat 780
ccggtgtttg caaccgagtt cggtttcatg ggggaggatg aattaggtgc acacataccc 840
gtcatcggcg atgaaacata cggcgaagcc attatcgatt acttttataa aaaggggata 900
tcgtggactg catgggtatt cgatccgctt tggtcgccgc agcttattag agactggtat 960
tttaccccgt cccgacaggg gcagtttttt aaagagaagt tgatggagtt gaattag 1017
<210> 80 <211> 338<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1) . . . (25)
<220>
<221> DOMÍNIO <222> (38)...(315)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO
<222> (141)...(144)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 80
Met Lys Tyr Lys Ala lie Phe lie Tyr Leu lie Vai Leu lie Leu Phe 15 10 15
Tyr Ser lie Asn lie Tyr Ala Asn Ala Glu Asn Asn Pro Leu Pro Phe 20 25 30
Leu Ser Vai Glu Gly Asn Arg Phe Vai Asp Glu Asp Gly Asn Thr Vai 35 40 45
lie Leu Arg Gly Vai Ser Phe Pro Asp Pro Asp Arg Leu Ala Glu Ala 50 55 60
Thr Gln Trp Asn Lys Arg Tyr Phe Gln Ala Ala Lys Asp Trp Asn Cys 65 70 75 80
Asn Vai Vai Arg lie Pro Vai His Pro Gln Lys Trp Arg Glu Arg Gly 85 90 95
Glu Glu Asn Tyr Leu Lys Leu Leu Asp Lys Gly lie Gln Trp Ala Gly 100 105 110
Glu Leu Gly Met Tyr Vai lie lie Asp Trp His Thr lie Gly Asn Pro 115 120 125
lie Thr Glu Vai Phe Phe Arg Glu Leu Tyr Asn Thr Ser Arg Ala Glu 130 135 140
Thr Phe Gln Phe Trp Arg Thr lie Ala Glu Arg Tyr Ala Gly Asn Pro 145 150 155 160
Vai Vai Ala Phe Tyr Glu Leu Phe Asn Glu Pro Thr Asp Tyr Asn Gly 165 170 175
Arg Leu Gly Arg Met Asn Trp Asp Gln Tyr Lys Glu Phe lie Glu Glu 180 185 190lie lie His lie lie Tyr Ser His Asp Asp Thr Vai lie Pro Leu Vai 195 200 205
Ala Gly Phe Asp Trp Ala Tyr Glu Leu Arg His lie Lys Asp Lys Pro 210 215 220
lie Asp Phe Pro Gly lie Ala Tyr Vai Thr His Pro Tyr Pro Gln Lys 225 230 235 240
Arg Asp Pro Pro Trp Glu Glu Lys Trp Glu Glu Asp Phe Gly Phe Ala 245 250 255
Ala Asp Met Tyr Pro Vai Phe Ala Thr Glu Phe Gly Phe Met Gly Glu 260 265 270
Asp Glu Leu Gly Ala His lie Pro Vai lie Gly Asp Glu Thr Tyr Gly 275 280 285
Glu Ala lie lie Asp Tyr Phe Tyr Lys Lys Gly lie Ser Trp Thr Ala 290 295 300
Trp Vai Phe Asp Pro Leu Trp Ser Pro Gln Leu lie Arg Asp Trp Tyr 305 310 315 320
Phe Thr Pro Ser Arg Gln Gly Gln Phe Phe Lys Glu Lys Leu Met Glu 325 330 335
Leu Asn
<210> 81
<211> 1119
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 81
atgaatttac ttgctcaata cttttccgga ctatttctga tttttttgat ctcaattttt 60
ttcgttagtt ctgcagcgaa tcatcattat gaaaaaaata cagtcaacga attttctgat 120
gatgtaaatc aaacaacatt agtccttcaa cccgggatat ccgaagccca gaatactcaa 180
aacctgccgc ggatttcggt tgaaggaaac caatttgtgg atgaatcggg aaacacagtc 240
acatttcagg gtgtcagtgt tgccgatccg cacaggctta ataatgccgg ccaatggaaa 300
cgggaactgt ttgaagaaat cgcaaactgg ggagcaaacg tcgttcgtct gcccatacac 360
ccgctctggt ggcgggaacg gggagaggag caatacctcg aatggattga tgaagccgtg 420
gagtgggcca aagagctgga gatgtacctc atcatcgact ggcacagtat cgggaacctg 480cggacagaac tctttttcag ggatatctac aacaccaccc gccgtgaaac ttatgaattc 540
tggaggctga tttcggatcg ctatgctgat gaaaccacaa ttgcctttta cgaaatcttt 600
aatgaaccca cacggcagca gggcaggctg ggaaccatga cctggaagca atggaaggaa 660
attctaaccg acattatcac aatcatttat gcccacaatc ctgatgcgat tccgctggta 720
gcaggtttta actgggcgta tgaccttact ccggtccgcc actcacccct cgattttgaa 780
ggtattgcct atgttaccca cccatatccg caaaaaagaa gcaggccctg ggttccaaaa 840
tgggaagaag atttcggttt tgtggctgac aaatatcctg tatttgccac tgaattcggc 900
tatatgaggg agtatgagcg gggcgctcat gtgcccgtaa tcggggacga agaatatggg 960
gaaatcctca tcaattattt ccgcgaaaaa gggatttcgt ggacagcctg ggtattcgat 1020
ccaagctggt cgccacagct cattcaggat tgggattata cacccacacg ctcaggtgag 1080
tttttcagaa atgcgatgag aacgaaaaac aatgaataa 1119
<210> 82 <211> 372 <212> PRT <213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(25)
<220>
<221> DOMÍNIO <222> (70)...(347)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO <222> (43)...(46)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (173)...(176)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 82
Met Asn Leu Leu Ala Gln Tyr Phe Ser Gly Leu Phe Leu lie Phe Leu 15 10 15
lie Ser lie Phe Phe Vai Ser Ser Ala Ala Asn His His Tyr Glu Lys 20 25 30
Asn Thr Vai Asn Glu Phe Ser Asp Asp Vai Asn Gln Thr Thr Leu Vai 35 40 45
Leu Gln Pro Gly lie Ser Glu Ala Gln Asn Thr Gln Asn Leu Pro Arg 50 55 60
lie Ser Vai Glu Gly Asn Gln Phe Vai Asp Glu Ser Gly Asn Thr Vai65 70 75 80
Thr Phe Gln Gly Vai Ser Vai Ala Asp Pro His Arg Leu Asn Asn Ala 85 90 95
Gly Gln Trp Lys Arg Glu Leu Phe Glu Glu lie Ala Asn Trp Gly Ala 100 105 110
Asn Vai Vai Arg Leu Pro lie His Pro Leu Trp Trp Arg Glu Arg Gly 115 120 125
Glu Glu Gln Tyr Leu Glu Trp lie Asp Glu Ala Vai Glu Trp Ala Lys 130 135 140
Glu Leu Glu Met Tyr Leu lie lie Asp Trp His Ser lie Gly Asn Leu 145 150 155 160
Arg Thr Glu Leu Phe Phe Arg Asp lie Tyr Asn Thr Thr Arg Arg Glu 165 170 175
Thr Tyr Glu Phe Trp Arg Leu lie Ser Asp Arg Tyr Ala Asp Glu Thr 180 185 190
Thr lie Ala Phe Tyr Glu lie Phe Asn Glu Pro Thr Arg Gln Gln Gly 195 200 205
Arg Leu Gly Thr Met Thr Trp Lys Gln Trp Lys Glu lie Leu Thr Asp 210 215 220
lie lie Thr lie lie Tyr Ala His Asn Pro Asp Ala lie Pro Leu Vai 225 230 235 240
Ala Gly Phe Asn Trp Ala Tyr Asp Leu Thr Pro Vai Arg His Ser Pro 245 250 255
Leu Asp Phe Glu Gly lie Ala Tyr Vai Thr His Pro Tyr Pro Gln Lys , 260 265 270
Arg Ser Arg Pro Trp Vai Pro Lys Trp Glu Glu Asp Phe Gly Phe Vai 275 280 285
Ala Asp Lys Tyr Pro Vai Phe Ala Thr Glu Phe Gly Tyr Met Arg Glu 290 295 300
Tyr Glu Arg Gly Ala His Vai Pro Vai lie Gly Asp Glu Glu Tyr Gly 305 310 315 320
Glu lie Leu lie Asn Tyr Phe Arg Glu Lys Gly lie Ser Trp Thr Ala 325 330 335Trp Vai Phe Asp Pro Ser Trp Ser Pro Gln Leu lie Gln Asp Trp Asp 340 345 350
Tyr Thr Pro Thr Arg Ser Gly Glu Phe Phe Arg Asn Ala Met Arg Thr 355 360 365
Lys Asn Asn Glu 370
<210> 83
<211> 1089
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 83
atgagccttg gcctgactgc aatcgagttg atcaatcgcg cccgcgccga tctgcgactg 60
ggcgtgccga tcgttctgcg cgagggcgac gtgcaggcgc tggtgctggc ggtcgagcca 120
gtaaccgagg cgcggctggg tgggctgcgc gggctggggc cagggctggt gcttgcaatc 180
acgcagcgcc gcgccacgac actgaaggcg cgcgcctatg atgaggatct tgcgcgagtg 240
gtggtgcccg agggggtagg ctgcgactgg ctgcgggcgg tggcggaccc ctccgacgat 3 00
ctgcgctttc cgatgaaggg cccgctgatg accgctcgcg agggcacggc cgcgctgcat 3 60
cgcgctgcac ttcaactggt gaaatccgcg cagcttcttc cggccgcact tgttcagccg 42 0
cttgcggatc ccgaggcgct gcccgtcacg gggctgacag tgctcgatat cgccgatgtc 480
agccgtgaat tggcgcgcga gacagtgttg tatccagtgg tgcatgcgcg cttgccgatg 540
ctggcggcgc aagcgggccg cgtgcatatc ttccgacccc gcgacggcgg cgttgagcat 600
tacgccatcg agatcggcca gcccgaccgt gccgcgcccg tgctcacgcg gctgcattcg 660
gcctgtttca caggcgatgt gctgggctcg ctcaaatgcg attgcggccc gcaactgcag 720
gcagcactcg cgcagatggg cgaggaaggc gcgggggtgc tgctctatct caatcaggag 7 80
ggtcgcggca tcgggcttgc caacaagatg cgcgcctatt cgctgcagga tcagggcttt 840
gacacggtcg aggccaatca ccgtctgggg ttcgaggatg acgagcggga tttccgcatc 900
ggggccgcgc ttctgcggcg gatggggttc tctcgggcgc ggctgctgac caacaaccct 960
cggaaggtga acatgctgaa tgcgcatcgg gtcgaagtgg tggaacgggt gccgcttcgg 1020
gtgggcgaga cggtcgagaa ccgcgcctat cttgccacca aggccgccaa atccgggcat 1080
ctgttgtga 1089
<210> 84 <211> 362 <212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO
<222> (168)...(339)
<223> GTP cyclohydrolase II
<400> 84
Met Ser Leu Gly Leu Thr Ala lie Glu Leu lie Asn Arg Ala Arg Ala 15 10 15
Asp Leu Arg Leu Gly Vai Pro lie Vai Leu Arg Glu Gly Asp Vai Gln 20 25 30
Ala Leu Vai Leu Ala Vai Glu Pro Vai Thr Glu Ala Arg Leu Gly Gly 35 40 45
Leu Arg Gly Leu Gly Pro Gly Leu Vai Leu Ala lie Thr Gln Arg Arg 50 55 60
Ala Thr Thr Leu Lys Ala Arg Ala Tyr Asp Glu Asp Leu Ala Arg Vai 65 70 75 80
Vai Vai Pro Glu Gly Vai Gly Cys Asp Trp Leu Arg Ala Vai Ala Asp 85 90 95
Pro Ser Asp Asp Leu Arg Phe Pro Met Lys Gly Pro Leu Met Thr Ala 100 105 110
Arg Glu Gly Thr Ala Ala Leu His Arg Ala Ala Leu Gln Leu Vai Lys 115 120 125
Ser Ala Gln Leu Leu Pro Ala Ala Leu Vai Gln Pro Leu Ala Asp Pro 130 135 140
Glu Ala Leu Pro Vai Thr Gly Leu Thr Vai Leu Asp lie Ala Asp Vai 145 150 155 160
Ser Arg Glu Leu Ala Arg Glu Thr Vai Leu Tyr Pro Vai Vai His Ala 165 170 175
Arg Leu Pro Met Leu Ala Ala Gln Ala Gly Arg Vai His lie Phe Arg 180 185 190
Pro Arg Asp Gly Gly Vai Glu His Tyr Ala lie Glu lie Gly Gln Pro 195 200 205
Asp Arg Ala Ala Pro Vai Leu Thr Arg Leu His Ser Ala Cys Phe Thr 210 215 220
Gly Asp Vai Leu Gly Ser Leu Lys Cys Asp Cys Gly Pro Gln Leu Gln 225 230 235 240
Ala Ala Leu Ala Gln Met Gly Glu Glu Gly Ala Gly Vai Leu Leu TyrLeu Asn Gln Glu Gly Arg Gly lie Gly Leu Ala Asn Lys Met Arg Ala 260 265 270
Tyr Ser Leu Gln Asp Gln Gly Phe Asp Thr Vai Glu Ala Asn His Arg 275 280 285
Leu Gly Phe Glu Asp Asp Glu Arg Asp Phe Arg lie Gly Ala Ala Leu 290 295 300
Leu Arg Arg Met Gly Phe Ser Arg Ala Arg Leu Leu Thr Asn Asn Pro 305 310 315 320
Arg Lys Vai Asn Met Leu Asn Ala His Arg Vai Glu Vai Vai Glu Arg 325 330 335
Vai Pro Leu Arg Vai Gly Glu Thr Vai Glu Asn Arg Ala Tyr Leu Ala 340 345 350
Thr Lys Ala Ala Lys Ser Gly His Leu Leu
<210> 85
<211> 1284
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 85
gtgaacaccg cgcatcgcat cgaattccct cggcaattta tcttcggttc cgccactgct 60
gctcaccaag tggagggcaa caacgttcac aatgattggt gggcccacga gcatgccacc 120
gacacgaatg ccgtggagcc gtcgggcctc gcctgcgacc actttcggcg ctttgccgac 180
gacttccgcc tcttacgcca actcggacag ccagcgcacc gcctgtcgct ggaatggagc 240
cgcatcgaac cggcacccgg tgaaatcgat cgttcggcat tgtcccacta ccgccgagtc 300
ctgggtactt tgcgagacct cggaatcgag ccatgggtca ccatccacca cttcacttgc 3 60
cctcgctggt tcgtggaaca gggagggttt acacgcatgg attcagcgcg ctctctcgtt 420
cgccataccg aacgcgtggc gagggagttc tccgacctag tcacaaactg gtgcaccata 480
aatgagccaa acgtcgtggc agaactcggt tatcgcttcg gatactttcc gccgcggttg 540
caggacgatg agctggcagc ggaagtgctc accaacttct ttcgcttaca cgctgaaatg 600
gcagaagttt tgcgcgctca cgcgcagaga tcggcgcaaa tcggtatcac ccttgcgatg 660
caagcacacg agccgctgcg catcgaaagc gaagcggacc gcgcactggc ggcgcggcgc 720
gacgccgaga ccaacggcgt catgctcaac gccttgcgaa ccggtgtatt cgcctacccg 780
ggacgggagc cggtggaaat ccctggactg aaaacgtcat cgaccttcgt gggggtccag 840tactattcgc gggtccgcta cgacgccgag tcgcaaggtc cagcaatgcc cgacttcgag 900
cgcaccctca gccaaatggg atgggaggtg tatcctgagg ggttcggccc cttgctcgag 960
cgcgcagcag aaactggact cgaagtgatc gtcacagaga acgggatggc gcacgacgat 1020
gaccgtgtgc gcgtgcgttt tatcgccgac cacttgcggg tcgttcaccg ccttctggaa 1080
cgcggtgtgc gcatcggagg gtacttttac tggtcgacca tggacaactt cgaatggaac 1140
ttcgggtacg gaccgaagtt cggcctgatc gaagtggacc gttctaccct ggaacgcagg 1200
ccgcggcgaa gcgcgtattt cttccgtgac atgatccagc agcgagtgct cgacgacgac 1260
ctggtcgagc actggactcg ctga 1284
<210> 86 <211> 427 <212> PRT
<213> Desconhecido . <220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (5) . . .(417)
<223> Família glicosil hidrolase 1 <220>
<221> SÍTIO
<222> (334) . . . (342)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572 <400> 86
Met Asn Thr Ala His Arg lie Glu Phe Pro Arg Gln Phe lie Phe Gly 1 5 10 15
Ser Ala Thr Ala Ala His Gln Vai Glu Gly Asn Asn Vai His Asn Asp 20 25 30
Trp Trp Ala His Glu His Ala Thr Asp Thr Asn Ala Vai Glu Pro Ser 35 40 45
Gly Leu Ala Cys Asp His Phe Arg Arg Phe Ala Asp Asp Phe Arg Leu 50 55 60
Leu Arg Gln Leu Gly Gln Pro Ala His Arg Leu Ser Leu Glu Trp Ser 65 70 75 80
Arg lie Glu Pro Ala Pro Gly Glu lie Asp Arg Ser Ala Leu Ser His 85 90 95
Tyr Arg Arg Vai Leu Gly Thr Leu Arg Asp Leu Gly lie Glu Pro Trp 100 105 110
Vai Thr lie His His Phe Thr Cys Pro Arg Trp Phe Vai Glu Gln Gly 115 120 125Gly Phe Thr Arg Met Asp Ser Ala Arg Ser Leu Vai Arg His Thr Glu 130 135 140
Arg Vai Ala Arg Glu Phe Ser Asp Leu Vai Thr Asn Trp Cys Thr lie 145 150 155 160
Asn Glu Pro Asn Vai Vai Ala Glu Leu Gly Tyr Arg Phe Gly Tyr Phe 165 170 175
Pro Pro Arg Leu Gln Asp Asp Glu Leu Ala Ala Glu Vai Leu Thr Asn 180 185 190
Phe Phe Arg Leu His Ala Glu Met Ala Glu Vai Leu Arg Ala His Ala 195 200 205
Gln Arg Ser Ala Gln lie Gly lie Thr Leu Ala Met Gln Ala His Glu 210 215 220
Pro Leu Arg lie Glu Ser Glu Ala Asp Arg Ala Leu Ala Ala Arg Arg 225 230 235 240
Asp Ala Glu Thr Asn Gly Vai Met Leu Asn Ala Leu Arg Thr Gly Vai 245 250 255
Phe Ala Tyr Pro Gly Arg Glu Pro Vai Glu lie Pro Gly Leu Lys Thr 260 265 270
Ser Ser Thr Phe Vai Gly Vai Gln Tyr Tyr Ser Arg Vai Arg Tyr Asp 275 280 285
Ala Glu Ser Gln Gly Pro Ala Met Pro Asp Phe Glu Arg Thr Leu Ser 290 295 300
Gln Met Gly Trp Glu Vai Tyr Pro Glu Gly Phe Gly Pro Leu Leu Glu 305 310 315 320
Arg Ala Ala Glu Thr Gly Leu Glu Vai lie Vai Thr Glu Asn Gly Met 325 330 335
Ala His Asp Asp Asp Arg Vai Arg Vai Arg Phe lie Ala Asp His Leu 340 345 350
Arg Vai Vai His Arg Leu Leu Glu Arg Gly Vai Arg lie Gly Gly Tyr 355 360 365
Phe Tyr Trp Ser Thr Met Asp Asn Phe Glu Trp Asn Phe Gly Tyr Gly 370 375 380
Pro Lys Phe Gly Leu lie Glu Vai Asp Arg Ser Thr Leu Glu Arg Arg 385 390 395 400Pro Arg Arg Ser Ala Tyr Phe Phe Arg Asp Met lie Gln Gln Arg Vai 405 410 415
Leu Asp Asp Asp Leu Vai Glu His Trp Thr Arg 420 425
<210> 87 <211> 1167 <212> DNA
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <400> 87
atgagaaaga gtgtgttcac cctcgccgtg tttttgtcgg cactgtttgc attcacgtct '60
tgtcagaaca agagccagaa cgaggctcaa gaccaggcag gacaagtcaa taacttccgc 120
atcaagcgcg gcacgaacat cagccactgg ctgtcgcagt cggagcagcg cggtgaggct 180
cgcagactgc atatccagga ggacgacttc gcccgtctgg aagagctggg cttcgacttc 240
gtgcgcatcc ccatcgacga ggtgcagttc tgggacgagc agggcaacaa gctgcccgag 300
gcgtgggatc tgctgaacaa cgccctcgac tggagcaaga agcacaacct gcgtgccatc 360
gtcgacctgc acatcatccg tgcgcactat ttcaatgccg tgaatgaggc agâccaggcc 420
gccaataccc tcttcacctc tgaggaggca caggaaggac tccttaacct gtggcgccag 480
ctctccgagt tcctgaagga ccgcagcaac gactgggtgg cctacgagtt catgaacgag 540
ccggtagccc ctgagcacga gatgtggaac cagctggtag ccaaggtaca caaggccctg 600
cgcgaactgg aaccccagcg tacactcgtc gtcggctcga acatgtggca gggacacgag 660
acgatgaagt atctgaaagt gcccgagggc gataagaaca tcatcctctc gttccactac 720
tacaacccga tgctgctgac gcactacggt gcctggtggt cgccgctgtg tgctgcctac 780
aagggtaagg tgaactatcc cggtgtgctc gtgtcgaagg aagactacga tgccgctcct 840
gctgccatca aggatcagct gaagcccttt accgaggaag tatggaacat cgacaagatc 900
cgtgagcagt tcaaggatgc catcgaggcc gccaagaaat atgacctgca actgttctgc 960
ggcgagtggg gtgtctatga gcccgtggac cgtgagctgg cctacaaatg gtatcgtgac 1020
gtgctgacgg tgttcgacga gttcaacatc gcctggacga cctggtgcta cgatgctgac 1080
ttcggtttct gggatcagca gcgccactgc tacaaagact atccgctggt ggagctcctg 1140
atgtcaggaa agaaactggg agaatag 1167
<210> 88 <211> 388 <212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL <222> (1) . . . (23)
<220>
<221> DOMÍNIO <222> (48)...(365)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO <222> (23)...(26)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO <222> (46)...(49)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 88
Met Arg Lys Ser Vai Phe Thr Leu Ala Vai Phe Leu Ser Ala Leu Phe 15 10 15
Ala Phe Thr Ser Cys Gln Asn Lys Ser Gln Asn Glu Ala Gln Asp Gln 20 25 30
Ala Gly Gln Vai Asn Asn Phe Arg lie Lys Arg Gly Thr Asn lie Ser 35 40 45
His Trp Leu Ser Gln Ser Glu Gln Arg Gly Glu Ala Arg Arg Leu His 50 55 60
lie Gln Glu Asp Asp Phe Ala Arg Leu Glu Glu Leu Gly Phe Asp Phe 65 70 75 80
Vai Arg lie Pro lie Asp Glu Vai Gln Phe Trp Asp Glu Gln Gly Asn 85 90 95
Lys Leu Pro Glu Ala Trp Asp Leu Leu Asn Asn Ala Leu Asp Trp Ser 100 105 110
Lys Lys His Asn Leu Arg Ala lie Vai Asp Leu His lie lie Arg Ala 115 120 125
His Tyr Phe Asn Ala Vai Asn Glu Ala Asp Gln Ala Ala Asn Thr Leu 130 135 140
Phe Thr Ser Glu Glu Ala Gln Glu Gly Leu Leu Asn Leu Trp Arg Gln 145 150 155 160
Leu Ser Glu Phe Leu Lys Asp Arg Ser Asn Asp Trp Vai Ala Tyr Glu 165 170 175
Phe Met Asn Glu Pro Vai Ala Pro Glu His Glu Met Trp Asn Gln Leu 180 185 190Vai Ala Lys Vai His Lys Ala Leu Arg Glu Leu Glu Pro Gln Arg Thr 195 200 205
Leu Vai Vai Gly Ser Asn Met Trp Gln Gly His Glu Thr Met Lys Tyr 210 215 220
Leu Lys Vai Pro Glu Gly Asp Lys Asn lie lie Leu Ser Phe His Tyr 225 230 235 240
Tyr Asn Pro Met Leu Leu Thr His Tyr Gly Ala Trp Trp Ser Pro Leu 245 250 255
Cys Ala Ala Tyr Lys Gly Lys Vai Asn Tyr Pro Gly Vai Leu Vai Ser 260 265 270
Lys Glu Asp Tyr Asp Ala Ala Pro Ala Ala lie Lys Asp Gln Leu Lys 275 280 285
Pro Phe Thr Glu Glu Vai Trp Asn lie Asp Lys lie Arg Glu Gln Phe 290 295 300
Lys Asp Ala lie Glu Ala Ala Lys Lys Tyr Asp Leu Gln Leu Phe Cys 305 310 315 320
Gly Glu Trp Gly Vai Tyr Glu Pro Vai Asp Arg Glu Leu Ala Tyr Lys 325 330 335
Trp Tyr Arg Asp Vai Leu Thr Vai Phe Asp Glu Phe Asn lie Ala Trp 340 345 350
Thr Thr Trp Cys Tyr Asp Ala Asp Phe Gly Phe Trp Asp Gln Gln Arg 355 360 365
His Cys Tyr Lys Asp Tyr Pro Leu Vai Glu Leu Leu Met Ser Gly Lys 370 375 380
Lys Leu Gly Glu 385
<210> 89 <211> 1500 <212> DNA
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <400> 89
atgaaacgtt cagtctctat ctttatcgca tgtttattaa tgacagtatt aacaattagc 6.0 ggtgtcgcgg caccagaagc atctgcagca ggggcgaaaa cgcctgtagc ccttaatggc 120
cagcttagca ttaaaggtac tcagctagtc aatcaaaacg gaaaaccggt gcagctgaag 180gggatcagct cacacggttt gcagtggttc ggcgattatg tcaataaaga cactttaaaa 240
tggctaagag acgattgggg aattaccgtc ttccgggcgg caatgtacac ggctgacggc 300
ggttatatcg agaatccgtc tgtgaaaaat aaagtcaaag aagctgttga agcggcaaaa 3 60
gagctcggga tatatgtcat cattgactgg catattttaa atgacggcaa tccaaatcaa 420
aataaagaga aggcgaagga attctttaag gaaatgtcaa gcctttacgg aagctcacca 480
aacgttatat atgaaattgc taatgaaccg aacggtgatg taaattggaa gcgcgatatc 540
aaaccgtatg cggaagaagt gatttctgtt atccgtaaaa atgacccgga taacatcatt 600
attaccggaa caggcacttg gagccaggat gtcaacgatg ctgcggatga tcagcttaag 660
gatgcaaacg tcatgtacgc gcttcatttt tatgccggta cacacggcca gtttttaagg 720
gataaagcgg actatgcgct cagcaaagga gctccgattt ttgtaacgga atgggggacg 780
agtgacgctt ccggaaatgg aggggtatac cttgaccagt cgagggaatg gctgaattat 840
ctcgacagca agaaaatcag ctgggtaaac tggaaccttt ctgataagca ggaatcatcc 900
tcagctttaa agccgggggc atctaaaaca ggcggctggc cgttatcaga tttatccgct 960
tcagggacat ttgtaagaga aaacattcgc ggctcccaaa attcgagtga agacagatct 1020
gagacaccaa agcaagagaa acccgcacag gaaaacagca tctctgtgca atacagaaca 1080
ggggatggaa gtgtgaacag caaccaaatc cgtcctcaga tcaatgtgaa aaacaacagc 1140
aagaccaccg ttaacttaaa aaatgtaact gtccgctact ggtataacac gaaaaacaaa 1200
ggccaaaact tcgactgtga ttacgcgaag atcggatgca gcaatgtgac gcacaagttt 1260
gtgacattac ataaacctgt aaaaggtgca gatgcctatc tggaacttgg gtttagaaac 1320
gggacgctgt caccgggagc aagcaccgga gaaattcaaa ttcgtcttca caatgaggac 1380
tggagcaatt attcacaagc cggggattat tcttttttcc agtcgaatac gtttaaagat 1440
acaaaaaaaa tcacattata taataacgga aaactgattt ggggaacaga acccaaatag 1500
<210> 90 <211> 499 <212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL» <222> (1)...(29)
<220>
<221> DOMÍNIO <222> (47)...(301)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> DOMÍNIO <222> (356)...(437)
<223> Domínio de ligação de celulase<220>
<221> SÍTIO
<222> (164) . . . (173)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659 <220>
<221> SÍTIO
<222> (296)...(299)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (339)...(342)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (383.) . . . (386)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (393)...(396)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (421)...(424)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (446)...(449)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (470)...(473)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 90
Met Lys Arg Ser Vai Ser lie Phe lie Ala Cys Leu Leu Met Thr Vai 1 5 10 15
Leu Thr lie Ser Gly Vai Ala Ala Pro Glu Ala Ser Ala Ala Gly Ala 20 25 30
Lys Thr Pro Vai Ala Leu Asn Gly Gln Leu Ser lie Lys Gly Thr Gln 35 40 45
Leu Vai Asn Gln Asn Gly Lys Pro Vai Gln Leu Lys Gly lie Ser Ser 50 55 60
His Gly Leu Gln Trp Phe Gly Asp Tyr Vai Asn Lys Asp Thr Leu Lys 65 70 75 80
Trp Leu Arg Asp Asp Trp Gly lie Thr Vai Phe Arg Ala Ala Met Tyr 85 90 95
Thr Ala Asp Gly Gly Tyr lie Glu Asn Pro Ser Vai Lys Asn Lys Vai 100 105 110Lys Glu Ala Vai Glu Ala Ala Lys Glu Leu Gly lie Tyr Vai lie lie 115 120 125
Asp Trp His lie Leu Asn Asp Gly Asn Pro Asn Gln Asn Lys Glu Lys 130 135 140
Ala Lys Glu Phe Phe Lys Glu Met Ser Ser Leu Tyr Gly Ser Ser Pro 145 150 155 160
Asn Vai lie Tyr Glu lie Ala Asn Glu Pro Asn Gly Asp Vai Asn Trp 165 170 175
Lys Arg Asp lie Lys Pro Tyr Ala Glu Glu Vai lie Ser Vai lie Arg 180 185 190
Lys Asn Asp Pro Asp Asn lie lie lie Thr Gly Thr Gly Thr Trp Ser 195 200 205
Gln Asp Vai Asn Asp Ala Ala Asp Asp Gln Leu Lys Asp Ala Asn Vai 210 215 220
Met Tyr Ala Leu His Phe Tyr Ala Gly Thr His Gly Gln Phe Leu Arg 225 230 235 240
Asp Lys Ala Asp Tyr Ala Leu Ser Lys Gly Ala Pro lie Phe Vai Thr 245 250 255
Glu Trp Gly Thr Ser Asp Ala Ser Gly Asn Gly Gly Vai Tyr Leu Asp 260 265 270
Gln Ser Arg Glu Trp Leu Asn Tyr Leu Asp Ser Lys Lys lie Ser Trp 275 280 285
Vai Asn Trp Asn Leu Ser Asp Lys Gln Glu Ser Ser Ser Ala Leu Lys 290 295 300
Pro Gly Ala Ser Lys Thr Gly Gly Trp Pro Leu Ser Asp Leu Ser Ala 305 310 315 320
Ser Gly Thr Phe Vai Arg Glu Asn lie Arg Gly Ser Gln Asn Ser Ser 325 330 335
Glu Asp Arg Ser Glu Thr Pro Lys Gln Glu Lys Pro Ala Gln Glu Asn 340 345 350
Ser lie Ser Vai Gln Tyr Arg Thr Gly Asp Gly Ser Vai Asn Ser Asn 355 360 365
Gln lie Arg Pro Gln lie Asn Vai Lys Asn Asn Ser Lys Thr Thr Vai370 375 380
Asn Leu Lys. Asn Vai Thr Vai Arg Tyr Trp Tyr Asn Thr Lys Asn Lys 385 390 395 400
Gly Gln Asn Phe Asp Cys Asp Tyr Ala Lys lie Gly Cys Ser Asn Vai 405 410 415
Thr His Lys Phe Vai Thr Leu His Lys Pro Vai Lys Gly Ala Asp Ala 420 425 430
Tyr Leu Glu Leu Gly Phe Arg Asn Gly Thr Leu Ser Pro Gly Ala Ser 435 440 445
Thr Gly Glu lie Gln lie Arg Leu His Asn Glu Asp Trp Ser Asn Tyr 450 455 460
Ser Gln Ala Gly Asp Tyr Ser Phe Phe Gln Ser Asn Thr Phe Lys Asp 465 470 475 480
Thr Lys Lys lie Thr Leu Tyr Asn Asn Gly Lys Leu lie Trp Gly Thr 485 490 495
Glu Pro Lys
<210> 91
<211> 1725
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 91
atgctgaaat taagtgataa cctaactttc ttgaaaagca aaccattttt tcttaatgaa 60
aaagaaatga agtgggtgga gaaaacactt caatccatgt ccttacatga aaaagtaggg 120
caattatttt gtcccattgg cggttcagat aataaacaag aattagaagc ctttattaag 180
gaatatcatc ctggcggcat catgtaccgt cctaatacag gagcaaaaat acaggaaaca 240
catcggttgt tacaagagct atccccggta cctttattaa tttctgctaa cttagaggcc 300
ggtggtaatg ggattgctac ggatggtact tacttcggaa agcaaatgca ggtggctgca 3 60
acagataatg aagaaatggc ctataaatta ggattagttg ctggccgtga aggccgtgtg 420
gccggttgta actgggcttt tgcaccaatt gttgatattg atatgaacta tcgaaaccca 480
attacaaacg taagaacgta tgggtctgac ccaattagag ttgcccaaat gtctaaagct 540
tttatgaagg gaattcatga aagcggactc gcagcagctg ttaagcattt cccaggggat 600
ggagtggatg atagagatca gcatctttta tcatctgtaa acaccttatc taccgaagaa 660
tgggatcaaa cctttgggat ggtttatcaa gaaatgatag acagtggggc aaaatcgatt 720atggcgggcc atatcatgct ccctgaatat tcaagagaac tattgccggg tattgaagac 780
gaacaaatca tgcccgccac actagcacca gagttactta atggtttatt aagggaaaag 840
ttaggtttta atggtttaat cgtgactgat gcatccccta tgttagggtt cactacttcg 900
gaaagaagag aaattgctgt tcctaaggcg attgcttcgg gctgtgatat gtttctcttc 960
aaccgtaaca taaaagaaga ttatgagttc atgctgaatg gaattgaaac tggaattcta 1020
accttggaaa gagtagatga agctgttact agagtacttg ctcttaaagc atctctaggt 1080
ctgaatgtac aaaaggaatt gggaatatta gtacctgaag aagcggaatt gtcggtatta 1140
caatctgaag aacatttgga ttgggcaaga gaatgtgcag accaatcggt tacattagta 1200
aaggatacac aaaaactgct gcctattagt gctgatcagt ataaacgggt tcgactttat 12 60
gtattgggtg atcaagaagg agggctaaag gaaggcggct ccgtcactca accgtttatc 1320
gattctctta aaaatgctgg ctttgaagta gatttatata atgacaagca agttaatttc 1380
caagaactgt ttatgagtgt aaacgagttt aaaaagaact atgatctgat catttatgtc 1440
gccaaccttg aaaccgctag taaccaaacg acagtcagaa ttaattggca gcagccgcta 1500
aatgccaacg ctccatggtt tgttaaagat ataccgacat tatttatttc ggttgctaac 1560
ccataccatc tacaggacgt accaatggtt aagacctata taaatgctta ttcatctaat 1620
gaatatgtgg tagaagcaat tgtagataaa atcttaggaa aatcagagtt taaagggaag 1680
aatcccgtcg atccgttttg tgggaaatgg gataccagac tttaa 172 5
<210> 92
<211> 574
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (87)...(320)
<223> Família glicosil hidrolase 3 N terminal domínio <220>
<221> SÍTIO <222> (7) . . . (10)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (495)...(498)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 92
Met Leu Lys Leu Ser Asp Asn Leu Thr Phe Leu Lys Ser Lys Pro Phe 15 10 15 -
Phe Leu Asn Glu Lys Glu Met Lys Trp Vai Glu Lys Thr Leu Gln Ser 20 25 30Met Ser Leu His Glu Lys Vai Gly Gln Leu Phe Cys Pro lie Gly Gly 35 40 45
Ser Asp Asn Lys Gln Glu Leu Glu Ala Phe lie Lys Glu Tyr His Pro 50 55 60
Gly Gly lie Met Tyr Arg Pro Asn Thr Gly Ala Lys lie Gln Glu Thr 65 70 75 80
His Arg Leu Leu Gln Glu Leu Ser Pro Vai Pro Leu Leu lie Ser Ala 85 90 95
Asn Leu Glu Ala Gly Gly Asn Gly lie Ala Thr Asp Gly Thr Tyr Phe 100 105 110
Gly Lys Gln Met Gln Vai Ala Ala Thr Asp Asn Glu Glu Met Ala Tyr 115 120 125
Lys Leu Gly Leu Vai Ala Gly Arg Glu Gly Arg Vai Ala Gly Cys Asn 130 135 140
Trp Ala Phe Ala Pro lie Vai Asp lie Asp Met Asn Tyr Arg Asn Pro 145 150 155 160
lie Thr Asn Vai Arg Thr Tyr Gly Ser Asp Pro lie Arg Vai Ala Gln 165 170 175
Met Ser Lys Ala Phe Met Lys Gly lie His Glu Ser Gly Leu Ala Ala 180 185 190
Ala Vai Lys His Phe Pro Gly Asp Gly Vai Asp Asp Arg Asp Gln His 195 200 205
Leu Leu Ser Ser Vai Asn Thr Leu Ser Thr Glu Glu Trp Asp Gln Thr 210 215 220
Phe Gly Met Vai Tyr Gln Glu Met lie Asp Ser Gly Ala Lys Ser lie 225 230 235 240
Met Ala Gly His lie Met Leu Pro Glu Tyr Ser Arg Glu Leu Leu Pro 245 250 255
Gly lie Glu Asp Glu Gln lie Met Pro Ala Thr Leu Ala Pro Glu Leu 260 265 270
Leu Asn Gly Leu Leu Arg Glu Lys Leu Gly Phe Asn Gly Leu lie Vai 275 280 285
Thr Asp Ala Ser Pro Met Leu Gly Phe Thr Thr Ser Glu Arg Arg Glu 290 295 300lie Ala Vai Pro Lys Ala lie Ala Ser Gly Cys Asp Met Phe Leu Phe 305 310 315 320
Asn Arg Asn lie Lys Glu Asp Tyr Glu Phe Met Leu Asn Gly lie Glu 325 330 335
Thr Gly lie Leu Thr Leu Glu Arg Vai Asp Glu Ala Vai Thr Arg Vai 340 345 350
Leu Ala Leu Lys Ala Ser Leu Gly Leu Asn Vai Gln Lys Glu Leu Gly 355 360 365
lie Leu Vai Pro Glu Glu Ala Glu Leu Ser Vai Leu Gln Ser Glu Glu 370 375 380
His Leu Asp Trp Ala Arg Glu Cys Ala Asp Gln Ser Vai Thr Leu Vai 385 390 395 400
Lys Asp Thr Gln Lys Leu Leu Pro lie Ser Ala Asp Gln Tyr Lys Arg 405 410 415
Vai Arg Leu Tyr Vai Leu Gly Asp Gln Glu Gly Gly Leu Lys Glu Gly 420 425 430
Gly Ser Vai Thr Gln Pro Phe lie Asp Ser Leu Lys Asn Ala Gly Phe 435 440 445
Glu Vai Asp Leu Tyr Asn Asp Lys Gln Vai Asn Phe Gln Glu Leu Phe 450 455 460
Met Ser Vai Asn Glu Phe Lys Lys Asn Tyr Asp Leu lie lie Tyr Vai 465 470 475 480
Ala Asn Leu Glu Thr Ala Ser Asn Gln Thr Thr Vai Arg lie Asn Trp 485 490 495
Gln Gln Pro Leu Asn Ala Asn Ala Pro Trp Phe Vai Lys Asp lie Pro 500 505 510
Thr Leu Phe lie Ser Vai Ala Asn Pro Tyr His Leu Gln Asp Vai Pro 515 520 525
Met Vai Lys Thr Tyr lie Asn Ala Tyr Ser Ser Asn Glu Tyr Vai Vai 530 535 540
Glu Ala lie Vai Asp Lys lie Leu Gly Lys Ser Glu Phe Lys Gly Lys 545 550 555 560
Asn Pro Vai Asp Pro Phe Cys Gly Lys Trp Asp Thr Arg Leu 565 570<210> 93 <211> 546 <212> DNA
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <400> 93
atgagaataa aaaatttaaa aacgaaccgt atcacaaacc cgctgggatt tgatatagga 60
aaaccacgta tatcttttgt cacttatgac actacggcta aaaagcaaac agcagcgcaa 120
atacaggttg cgctagatca agagtttacg aacctaacat ttgacagtgg gaaaagcacg 180
gagatagata gtctagcata cgaactgcca tttcaattag agtcttacac tcgctactac 240
tggcgtgtga ccgtttgggc ggataatggg gatgtggcca caagtgaaat tgcttggttt 300
gaaacagcca aactaggcga ttcttgggag gccaagtgga ttacccccga ttttgataag 360
gaaatccatc ccgtactatc aagggaattt gatttgtcaa aagaagtcgt ttctgcccgt 420
gcctatgttt gcggtttggg attatatgaa atggagatta atggtctaaa ggctggggat 480
gaatatctga cccctaattt caacgcctat gataaatggc tgcagtacca gacctatgat 540
attaca 546
<210> 94
<211> 182
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SÍTIO <222> (51)...(54)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 94
Met Arg lie Lys Asn Leu Lys Thr Asn Arg lie Thr Asn Pro Leu Gly 15 10 15
Phe Asp lie Gly Lys Pro Arg lie Ser Phe Vai Thr Tyr Asp Thr Thr 20 25 30
Ala Lys Lys Gln Thr Ala Ala Gln lie Gln Vai Ala Leu Asp Gln Glu 35 40 45
Phe Thr Asn Leu Thr Phe Asp Ser Gly Lys Ser Thr Glu lie Asp Ser 50 55 60
Leu Ala Tyr. Glu Leu Pro Phe Gln Leu Glu Ser Tyr Thr Arg Tyr Tyr 65 70 75 80
Trp Arg Vai Thr Vai Trp Ala Asp Asn Gly Asp Vai Ala Thr Ser Glu 85 90 95lie Ala Trp Phe Glu Thr Ala Lys Leu Gly Asp Ser Trp Glu Ala Lys 100 105 110
Trp lie Thr Pro Asp Phe Asp Lys Glu lie His Pro Vai Leu Ser Arg 115 120 125
Glu Phe Asp Leu Ser Lys Glu Vai Vai Ser Ala Arg Ala Tyr Vai Cys 130 135 140
Gly Leu Gly Leu Tyr Glu Met Glu lie Asn Gly Leu Lys Ala Gly Asp 145 150 155 160
Glu Tyr Leu Thr Pro Asn Phe Asn Ala Tyr Asp Lys Trp Leu Gln Tyr
Gln Thr Tyr Asp lie Thr 180
<210> 95
<211> 2298
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 95
atgatcaatc aagatataaa acaattaatc tcacaaatga ccttggaaga aaaagctggt 60
ctttgttctg gattagattt ttggaattta aaaggtatcg aaagactggg aataccctcg 120
ataatggtaa ccgatggt.cc gcatggactc cgtaaacaaa aaatgggagc agatcattta . 180
gggctgtttg acagtattcc tgcgacatgt ttcccatctg cagccggttt agctagtact 240
tggaataaag agttaatata tgaagttggg gttgcattag gaaaggaatg ccaggcagag 300
gatgtggcaa tacttcttgg ccctggagca aacattaagc gctcacccct ttgtggcaga 360
aactttgaat atttttcgga agatccattc ctttcatcag aaatggctgc gtcccatatc 420
aagggtgttc aaagtgaggg ggttgggaca tcacttaagc acttcgctgc aaataatcaa 480
gaacaccgaa gaatgtcgac agatgctatt gtggatgaaa ggacgttgcg agaaatatat 540
ttggccagct ttgaaaacgc tgtaaagaaa gcgcagccat ggactgtgat gtgcgcctac 600
aacaaggtca atggagactt tgcatcagaa aataaaacat tgttaactga catcctgcga 660
gatgagtggg gctttgaagg aattgttgtt tctgactggg gggcggttaa tgaacctgtt 720
gacggattaa atgccgggtt agacctggaa atgccttcaa gtagtgggat tggtgaaaag 780
aaaatcatca atgctgtaag aaatggtcag cttttagaag ataaactaga tcaggcagtt 840
gaaagaattc tacgtattat cttaatggca gtagaaaaca agaaagaaac cgctgactat 900
gataaagaac aacatcataa gcttgcaaga aaagcagcaa gtgaaagtat ggttttatta 960aagaatgaag ataatatcct gccgttaaag aaagaaggaa ccatttcgat tattggttca 1020
tttgccaaaa aaccaaggta tcaaggcggt ggaagctcac acattaaccc gacaaagctt 1080
gaaaatatct atgaagaaat agagaaaaca gcgggccaaa atgtgaacgt tttatacgcg 1140
gaaggatatc atcttgaaaa ggatttaatc gatgatcaat taattgaaga ggcaaaaaaa 1200
acggcagcaa aatccgatgt aaccgtattg tttgtaggtc ttcctgaccg atatgaatct 1260
gaaggatatg atagagagca cctgaatata ccggagaatc accgtctttt agtcgaagcg 1320
gttgcggaag tacaaaagaa tatagttgtt gtactaagta atggggcacc gcttgttatg 1380
ccatggcttg ataaggtgaa ggggctgctg gaaagttacc tgggaggtca ggcactagga 1440
ggtgcgattg cagacatcct attcggagaa gttaatccaa gtggaaagct tgccgaaact 1500
tttcccgtaa aattaggtga caatccttct tatctcaact ttccaggaga gagggataaa 1560
gttgagtata aagaaggcat ctttgttggt tatcgttatt acgatacaaa acagattgag 1620
ccgctgtttc catttggata tggtttaagc tatacaaact ttgaatataa aaaccttgta 1680
attgataaaa aagaaataaa agatacagaa attgtcacag ttaccgtgaa tgtgaaaaat 1740
acaggaaaag tgcctgggáa agaaatcatc cagttatatg taaaagatat aaaaagcagt 1800
gtagttcgtc ctgaaaaaga gttaaaaggc tttggaaagg tttccttaca gcctggggaa 1860
gacaaaacta tttcctttaa attggataaa cgcgcatttg catattacaa cacggaattg 1920
aaggattggt atgtagaatc aggagaattt gaaattttgg tggggaaatc gtccagagaa 1980
attgaactaa cagaaaaaat tatggttcac tctacttccc cagttttctt ggaggttcac 2040
cgaaattcca cggtcggaga tcttttaact gatccaattc taggtgaaaa agctaatgct 2100
ctaattagag agctaacaaa aggaagtcca ttatttgatg ctgggtcaga tcacggagag 2160
ggtgcagaaa tgatggaagc gatgttaaaa tacatgcctt tgcgtgctct tatgaatttt 2220
agtggtggag acattaccga agagaaacta actgaattta ttaaggaact taattcaact 2280
aattttgtaa gcctttaa 2298
<210> 96
<211> 765
<212> PRT ?
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (30)...(252)
<223> Família glicosil hidrolase 3 N terminal domínio <220>
<221> DOMÍNIO <222> (317)...(531)
<223> Domínio C-terminal da família glicosil hidrolase 3 <220>
<221> SÍTIO
<222> (214)...(217)<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (221)...(238)
<223> Família glicosil hidrolase 3 active sítio. Pró-sitio id = PS00775 <220>
<221> SÍTIO
<222> (692)...(695)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (750)...(753)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (769)...(772)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 96
Met Ile Asn Gln Asp Ile Lys Gln Leu Ile Ser Gln Met Thr Leu Glu 15 10 15
Glu Lys Ala Gly Leu Cys Ser Gly Leu Asp Phe Trp Asn Leu Lys Gly 20 25 30
Ile Glu Arg Leu Gly Ile Pro Ser Ile Met Vai Thr Asp Gly Pro His 35 40 45
Gly Leu Arg Lys Gln Lys Met Gly Ala Asp His Leu Gly Leu Phe Asp 50 55 60
Ser Ile Pro Ala Thr Cys Phe Pro Ser Ala Ala Gly Leu Ala Ser Thr 65 70 75 80
Trp Asn Lys Glu Leu Ile Tyr Glu Vai Gly Vai Ala Leu Gly Lys Glu 85 90 95
Cys Gln Ala Glu Asp Vai Ala Ile Leu Leu Gly Pro Gly Ala Asn Ile 100 105 110
Lys Arg Ser Pro Leu Cys Gly Arg Asn Phe Glu Tyr Phe Ser Glu Asp 115 120 125
Pro Phe Leu Ser Ser Glu Met Ala Ala Ser His Ile Lys Gly Vai Gln 130 135 140
Ser Glu Gly Vai Gly Thr Ser Leu Lys His Phe Ala Ala Asn Asn Gln 145 150 155 160
Glu His Arg Arg Met Ser Thr Asp Ala Ile Vai Asp Glu Arg Thr Leu 165 170 175Arg Glu lie Tyr Leu Ala Ser Phe Glu Asn Ala Vai Lys Lys Ala Gln 180 185 190
Pro Trp Thr Vai Met Cys Ala Tyr Asn Lys Vai Asn Gly Asp Phe Ala 195 200 205
Ser Glu Asn Lys Thr Leu Leu Thr Asp lie Leu Arg Asp Glu Trp Gly 210 215 220
Phe Glu Gly lie Vai Vai Ser Asp Trp Gly Ala Vai Asn Glu Pro Vai 225 230 235 240
Asp Gly Leu Asn Ala Gly Leu Asp Leu Glu Met Pro Ser Ser Ser Gly 245 250 255
lie Gly Glu Lys Lys lie lie Asn Ala Vai Arg Asn Gly Gln Leu Leu 260 265 270
Glu Asp Lys Leu Asp Gln Ala Vai Glu Arg lie Leu Arg lie lie Leu 275 280 285
Met Ala Vai Glu Asn Lys Lys Glu Thr Ala Asp Tyr Asp Lys Glu Gln 290 295 300
His His Lys Leu Ala Arg Lys Ala Ala Ser Glu Ser Met Vai Leu Leu 305 310 315 320
Lys Asn Glu Asp Asn lie Leu Pro Leu Lys Lys Glu Gly Thr lie Ser 325 330 335
lie lie Gly Ser Phe Ala Lys Lys Pro Arg Tyr Gln Gly Gly Gly Ser 340 345 350
Ser His lie Asn Pro Thr Lys Leu Glu Asn lie Tyr Glu Glu lie Glu 355 360 365
Lys Thr Ala Gly Gln Asn Vai Asn Vai Leu Tyr Ala Glu Gly Tyr His 370 375 380
Leu Glu Lys Asp Leu lie Asp Asp Gln Leu lie Glu Glu Ala Lys Lys 385 390 395 400
Thr Ala Ala Lys Ser Asp Vai Thr Vai Leu Phe Vai Gly Leu Pro Asp 405 410 415
Arg Tyr Glu Ser Glu Gly Tyr Asp Arg Glu His Leu Asn lie Pro Glu 420 425 430
Asn His Arg Leu Leu Vai Glu Ala Vai Ala Glu Vai Gln Lys Asn lie 435 440 445Vai Vai Vai Leu Ser Asn Gly Ala Pro Leu Vai Met Pro Trp Leu Asp 450 455 460
Lys Vai Lys Gly Leu Leu Glu Ser Tyr Leu Gly Gly Gln Ala Leu Gly 465 470 475 480
Gly Ala lie Ala Asp lie Leu Phe Gly Glu Vai Asn Pro Ser Gly Lys 485 490 495
Leu Ala Glu Thr Phe Pro Vai Lys Leu Gly Asp Asn Pro Ser Tyr Leu 500 505 510
Asn Phe Pro Gly Glu Arg Asp Lys Vai Glu Tyr Lys Glu Gly lie Phe 515 520 525
Vai Gly Tyr Arg Tyr Tyr Asp Thr Lys Gln lie Glu Pro Leu Phe Pro 530 535 540
Phe Gly Tyr Gly Leu Ser Tyr Thr Asn Phe Glu Tyr Lys Asn Leu Vai 545 550 555 560
lie Asp Lys Lys Glu lie Lys Asp Thr Glu lie Vai Thr Vai Thr Vai 565 570 575
Asn Vai Lys Asn Thr Gly Lys Vai Pro Gly Lys Glu lie lie Gln Leu 580 585 590
Tyr Vai Lys Asp lie Lys Ser Ser Vai Vai Arg Pro Glu Lys Glu Leu 595 600 605
Lys Gly Phe Gly Lys Vai Ser Leu Gln Pro Gly Glu Asp Lys Thr lie 610 615 620
Ser Phe Lys Leu Asp Lys Arg Ala Phe Ala Tyr Tyr Asn Thr Glu Leu 625 630 635 640
Lys Asp Trp Tyr Vai Glu Ser Gly Glu Phe Glu lie Leu Vai Gly Lys 645 650 655
Ser Ser Arg Glu lie Glu Leu Thr Glu Lys lie Met Vai His Ser Thr 660 665 670
Ser Pro Vai Phe Leu Glu Vai His Arg Asn Ser Thr Vai Gly Asp Leu 675 680 685
Leu Thr Asp Pro lie Leu Gly Glu Lys Ala Asn Ala Leu lie Arg Glu 690 695 700
Leu Thr Lys Gly Ser Pro Leu Phe Asp Ala Gly Ser Asp His Gly Glu 705 710 715 720`Gly Ala Glu Met Met Glu Ala Met Leu Lys Tyr Met Pro Leu Arg Ala 725 730 735
Leu Met Asn Phe Ser Gly Gly Asp lie Thr Glu Glu Lys Leu Thr Glu 740 745 750
Phe lie Lys Glu Leu Asn Ser Thr Asn Phe Vai Ser Leu 755 760 765
<210> 97
<211> 615
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 97
atgttatacc caattataac tgaaactcgc agtatcatcg atttaaatgg tatctggaaa 60
tttaaattag ataatggtga aggactgcag gaaaaatggt atgaaaacgg attaacagac 120
acgatcagta tggctgtacc atcttccttt aatgatattg gagtaaatgc cagtatacgc 180
gatcatgttg gctgggtatg gtatgagcgg gaattttctg tccccgccat ccttcaatct 240
gagcgtgtgg ttttgcgatt cggttccgca acacatctag ctaaggtttt cgtaaatggt 300
gaacttgttg ttgaacataa gggcggtttt ttaccgtttg aagcagaaat aaataagttt 360
ttacaaaaag ggaaaaatcg aataacggtt gctgtcaaca atattcttga ttactcaact 420
ttacccgttg gcacagtaàt agaaaaggat attcctggag ttggcaaagt aatacgcaat 480
cagccaaatt ttgacttctt caactacgct ggcttgcacc gtccagtgaa aatatatact 540
acaccgacta cttatgtgaa ggatgtaacc attgtaacgg aaatagatgg acaggttcac 600
tattcaattg attaa 615
<210> 98 <211> 204 <212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (9)... (182)
<223> Família glicosil hidrolase 2, sugar binding domínio <220>
<221> SÍTIO <222> (56)...(59)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 98
Met Leu Tyr Pro lie lie Thr Glu Thr Arg Ser lie lie Asp Leu Asn 15 10 15Gly lie Trp Lys Phe Lys Leu Asp Asn Gly Glu Gly Leu Gln Glu Lys 20 25 30
Trp Tyr Glu Asn Gly Leu Thr Asp Thr lie Ser Met Ala Vai Pro Ser 35 40 45
Ser Phe Asn Asp lie Gly Vai Asn Ala Ser lie Arg Asp His Vai Gly 50 55 60
Trp Vai Trp Tyr Glu Arg Glu Phe Ser Vai Pro Ala lie Leu Gln Ser 65 70 75 80
Glu Arg Vai Vai Leu Arg Phe Gly Ser Ala Thr His Leu Ala Lys Vai 85 90 95
Phe Vai Asn Gly Glu Leu Vai Vai Glu His Lys Gly Gly Phe Leu Pro 100 105 110
Phe Glu Ala Glu lie Asn Lys Phe Leu Gln Lys Gly Lys Asn Arg lie 115 120 125
Thr Vai Ala Vai Asn Asn lie Leu Asp Tyr Ser Thr Leu Pro Vai Gly 130 135 140
Thr Vai lie Glu Lys Asp lie Pro Gly Vai Gly Lys Vai lie Arg Asn 145 150 155 160
Gln Pro Asn Phe Asp Phe Phe Asn Tyr Ala Gly Leu His Arg Pro Vai 165 170 175
Lys lie Tyr Thr Thr Pro Thr Thr Tyr Vai Lys Asp Vai Thr lie Vai 180 185 190
Thr Glu lie Asp Gly Gln Vai His Tyr Ser lie Asp 195 200
<210> 99 <211> 1404 <212> DNA <213> Desconhecido
<220> <223> Obtido a partir de uma amostra ambiental
<400> 99 atgaatcatt ccctttcatt tccgccatcc tttgtatggg gcgcggcaac cgcaagctac 60
caactggaag gatcaaccca aggcgtggac ggctgcgccg agtccgtctg ggatatgcac 120
tgccgaagat ccggcgcgat caaggacggc tcgaacggat tcgtcgcctg cgatcactac 180
catcgctatc gcgaggatgt ggcgctcatg aacgagcttg gcttgaatgc ctatcgattc 240
tcaatcatgt ggccccgcgt catgcccgaa ggcaccggcg cggtgaacga gaagggcatg 300gatttctacg atcggttggt tgatgaactg ctcgccgccg gcatcacacc ttgggttact 360
ttg-ttccact gggactttcc cctagccttg ttccaacgcg gtggctggct gaatgcggat 420
tccccgcaat ggtttgagga ttacactcgg gaagtggtta aacgcttgtc ggatcgtgtg 480
catcactggc taacgctcaa cgaaccggcg tgcttcattg agtttggcca ccgtaccggc 540
atgcatgcac ccggcttgca actggcggac aaggaagcct gccgggtctg gcaccatgcc 600
atgctggccc acggtcgcgc cgttcgcgct attcgccagg aatccgtgca tccatcaccc 660
caggtcggct acgcgccggt cttccgcact accatcccgg acactgaaga tcctgccgac 720
atcgaagcgg cccggacctc gatgtttgct catcaggccg gcaacctgtt cgatacgcgg 780
tggaacctcg acccctgctt tcggggcgcg tatccggaga tcatgatgca gtattggggc 840
gatgccgcgc cgcgcatcca ggacggcgac atggagttga tccgtcagga actcgatttt 900
ctcggcctga atatttacca gtccgagcgc attcgggccg gtgcggatgg cgcacccgag .960
gtggtgccat accctgcgga ttatccgcgc aaccagctcg gttggcccat cacgccggag 1020
gccctgcgct gggcgaccct ctttctcttt gaggagtacg ggaaacccct gatcatcaca 1080
gaaaacggaa tcaccctcga cgacaagccc aatgcagacg gcgaggtgaa tgatgtccag 1140
cggatcgctt ttctgaatga ctatcttagc ggtctccagc gcagcgtgga cgacggcatc 1200
cctgtactgg gctatttcca ctggtcgctg tgcgacaact ttgagtgggc agaaggctat 1260
gtccctcgct tcggcctgat ccatgtggac tatgccagtc aacgcagaac catcaaggcc 1320
tcaggacggt tttaccgcga catcattcgg ggccagacag ccacgccctg catcgcccaa 1380
tccagtcagc cggaaacaac ctaa 1404
<210> 100 <211> 467 <212> PRT <213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (3) . . . (454)
<223> Família glicosil hidrolase 1 <220>
<221> SÍTIO <222> (2)...(5)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO <222> (11)...(25)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio id PS00653
<400> 100
Met Asn His Ser Leu Ser Phe Pro Pro Ser Phe Vai Trp Gly Ala Ala 15 10 15Thr Ala Ser Tyr Gln Leu Glu Gly Ser Thr Gln Gly Vai Asp Gly Cys 20 25 30
Ala Glu Ser Vai Trp Asp Met His Cys Arg Arg Ser Gly Ala lie Lys 35 40 45
Asp Gly Ser Asn Gly Phe Vai Ala Cys Asp His Tyr His Arg Tyr Arg 50 55 60
Glu Asp Vai Ala Leu Met Asn Glu Leu Gly Leu Asn Ala Tyr Arg Phe 65 70 75 80
Ser lie Met Trp Pro Arg Vai Met Pro Glu Gly Thr Gly Ala Vai Asn 85 90 95
Glu Lys Gly Met Asp Phe Tyr Asp Arg Leu Vai Asp Glu Leu Leu Ala 100 105 110
Ala Gly lie Thr Pro Trp Vai Thr Leu Phe His Trp Asp Phe Pro Leu 115 120 125
Ala Leu Phe Gln Arg Gly Gly Trp Leu Asn Ala Asp Ser Pro Gln Trp 130 135 140
Phe Glu Asp Tyr Thr Arg Glu Vai Vai Lys Arg Leu Ser Asp Arg Vai 145 150 155 160
His His Trp Leu Thr Leu Asn Glu Pro Ala Cys Phe lie Glu Phe Gly 165 170 175
His Arg Thr Gly Met His Ala Pro Gly Leu Gln Leu Ala Asp Lys Glu 180 185 190
Ala Cys Arg Vai Trp His His Ala Met Leu Ala His Gly Arg Ala Vai 195 200 205
Arg Ala lie Arg Gln Glu Ser Vai His Pro Ser Pro Gln Vai Gly Tyr 210 215 220
Ala Pro Vai Phe Arg Thr Thr lie Pro Asp Thr Glu Asp Pro Ala Asp 225 230 235 240
lie Glu Ala Ala Arg Thr Ser Met Phe Ala His Gln Ala Gly Asn Leu 245 250 255
Phe Asp Thr Arg Trp Asn Leu Asp Pro Cys Phe Arg Gly Ala Tyr Pro 260 265 270
Glu lie Met Met Gln Tyr Trp Gly Asp Ala Ala Pro Arg lie Gln Asp 275 280 285Gly Asp Met Glu Leu lie Arg Gln Glu Leu Asp Phe Leu Gly Leu Asn 290 295 300
lie Tyr Gln Ser Glu Arg lie Arg Ala Gly Ala Asp Gly Ala Pro Glu 305 310 315 320
Vai Vai Pro Tyr Pro Ala Asp Tyr Pro Arg Asn Gln Leu Gly Trp Pro 325 330 335
lie Thr Pro Glu Ala Leu Arg Trp Ala Thr Leu Phe Leu. Phe Glu Glu 340 345 350
Tyr Gly Lys Pro Leu lie lie Thr Glu Asn Gly lie Thr Leu Asp Asp 355 360 365
Lys Pro Asn Ala Asp Gly Glu Vai Asn Asp Vai Gln Arg lie Ala Phe 370 375 380
Leu Asn Asp Tyr Leu Ser Gly Leu Gln Arg Ser Vai Asp Asp Gly lie 385 390 395 400
Pro Vai Leu Gly Tyr Phe His Trp Ser Leu Cys Asp Asn Phe Glu Trp 405 410 415
Ala Glu Gly Tyr Vai Pro Arg Phe Gly Leu lie His Vai Asp Tyr Ala 420 425 430
Ser Gln Arg Arg Thr lie Lys Ala Ser Gly Arg Phe Tyr Arg Asp lie 435 440 445
lie Arg Gly Gln Thr Ala Thr Pro Cys lie Ala Gln Ser Ser Gln Pro 450 455 460
Glu Thr Thr 465
<210> 101
<211> 1101
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 101
atgagaaatc atctgaatgt acccttttac tttatcttct tttttttaat agcgtcaata 60 tttacagtct gttcatcatc aactgcttct gataacaatg agcatccacc gccagtggaa 120 gtcgcggatc aggacgcttt tcgtgatgct tttgaagtga atgaattact tggacgcggt 180 attaatctgg gtaatgccct tgaagcgccc aatgaaggcg aatggggaat ggtaatccag 240gaagagtttc ttgatctgat acttgcagca ggttttgagt ctgtacgaat tccgattcgc 300
tggaatgccc atgccagtga aagtcaccct ttcaccattc aacgatcgtt ttttgatcgg 360
gttgatgaag tcatccaatg gtcgctggat cgtggccttt ctgtaatgat caatattcat 420
cactacaatg aactgatgca aaacccgcag cagcaccggc agcggttttt gcgactctgg 480
aaccagattg ctacacacta taaagattat ccggataatc tggtttttga aatccttaat 540
gaacctcatg ataatctgac tccttctatc tggaatagtt atttgaggga tgctattggc 600
atgattcgcc agacaaaccc acgcagggtt atcgctatcg gaacagcaaa ctggggtggt 660
ttcggagcat tatcacaact tgaaatcccc tcaaacgatc gccagatcat tgcaactgtt 720
cattattatg aacccttcag gttcacccat cagggggctg aatgggcagg accggaaaca 780
aacgattggc tggggacacg atgggatgga tcggatgagg aaaaatttga tattgaaagt 840
ggttttgatg ccgtacagtc ctgggcagtg acaaataacc ggcctgttca tctcggagaa 900
ttcggtgctt acagtactgc cgataatgaa tcacgcgaac gctggacaac ctttgttcgg 960
gaatccgctg agcaacgcaa tttcagctgg gcatactggg aatttgcagc cggttttggg 1020
atctatgacc gtaatcagtg gcaatggagg gattatctgt tgagggcttt gataccggat 1080
agcccggtcc tgttggagta a 1101
<210> 102 <211> 366 <212> PRT <213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1) . . . (29)
<220>
<221> DOMÍNIO <222> (64) ... (342)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO
<222> (176)...(185)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659 <220>
<221> SÍTIO
<222> (313)...(316)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <220>
<221> SÍTIO
<222> (332) , . . (335)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 102
Met Arg Asn His Leu Asn Vai Pro Phe Tyr Phe lie Phe Phe Phe Leu 15 10 15lie Ala Ser lie Phe Thr Vai Cys Ser Ser Ser Thr Ala Ser Asp Asn 20 25 30
Asn Glu His Pro Pro Pro Vai Glu Vai Ala Asp Gln Asp Ala Phe Arg 35 40 45
Asp Ala Phe Glu Vai Asn Glu Leu Leu Gly Arg Gly lie Asn Leu Gly 50 55 60
Asn Ala Leu Glu Ala Pro Asn Glu Gly Glu Trp Gly Met Vai lie Gln 65 70 75 80
Glu Glu Phe Leu Asp Leu lie Leu Ala Ala Gly Phe Glu Ser Vai Arg 85 90 95
lie Pro lie Arg Trp Asn Ala His Ala Ser Glu Ser His Pro Phe Thr 100 105 110
lie Gln Arg Ser Phe Phe Asp Arg Vai Asp Glu Vai lie Gln Trp Ser 115 120 125
Leu Asp Arg Gly Leu Ser Vai Met lie Asn lie His His Tyr Asn Glu 130 135 140
Leu Met Gln Asn Pro Gln Gln His Arg Gln Arg Phe Leu Arg Leu Trp 145 150 155 160
Asn Gln lie Ala Thr His Tyr Lys Asp Tyr Pro Asp Asn Leu Vai Phe 165 170 175
Glu lie Leu Asn Glu Pro His Asp Asn Leu Thr Pro Ser lie Trp Asn 180 185 190
Ser Tyr Leu Arg Asp Ala lie Gly Met lie Arg Gln Thr Asn Pro Arg 195 200 205
Arg Vai lie Ala lie Gly Thr Ala Asn Trp Gly Gly Phe Gly Ala Leu 210 215 220
Ser Gln Leu Glu lie Pro Ser Asn Asp Arg Gln lie lie Ala Thr Vai 225 230 235 240
His Tyr Tyr Glu Pro Phe Arg Phe Thr His Gln Gly Ala Glu Trp Ala 245 250 255
Gly Pro Glu Thr Asn Asp Trp Leu Gly Thr Arg Trp Asp Gly Ser Asp 260 265 270
Glu Glu Lys Phe Asp lie Glu Ser Gly Phe Asp Ala Vai Gln Ser Trp 275 280 285Ala Vai Thr Asn Asn Arg Pro Vai His Leu Gly Glu Phe Gly Ala Tyr 290 295 300
Ser Thr Ala Asp Asn Glu Ser Arg Glu Arg Trp Thr Thr Phe Vai Arg 305 310 315 320
Glu Ser Ala Glu Gln Arg Asn Phe Ser Trp Ala Tyr Trp Glu Phe Ala 325 330 335
Ala Gly Phe Gly lie Tyr Asp Arg Asn Gln Trp Gln Trp Arg Asp Tyr 340 345 350
Leu Leu Arg Ala Leu lie Pro Asp Ser Pro Vai Leu Leu Glu
<210> 103
<211> 1101
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 103
atgctgataa ttggaggcct tcttgtttta ctgggatttt cttcttgcgg gcggcaggca 60
gaacctgctg ctgactcttt cagggggttt catgactttg acatcaggcg tggggtgaac 120
atcagccact ggttgtcgca gagtggaagg cgtggtgctg atcgggaggc gttctttacc 180
agggcggatg tggaggccat cgccggcttc ggttatgatc acattcgttt gcccattgat 240
gaggagcaga tgtgggatga gtcgggcaac aaggaaccac gtgcctttga attgctgcat 300
gaagccattg gctgggcttt ggacaatgag ctcagggtca ttgtcgacct gcacatcatc 360
aggtcgcact attttaatgc gcctgagaac ccgctttgga ccgatcgtgc tgaacagttg 420
aaatttgttg agatgtggcg acagttgtct gatgagctgc agggctatcc gctcgatagg 480
gtggcctatg aattgatgaa tgaggccgtg gctgatgatc cggacgattg gaaccggctt 540
gtggctgaga cgatggaggc gctacggatg ctggaaccgg agcgcaagat tgtcattggc 600
tccaaccgct ggcagtctgt gcatacattt cctgacctgg tgatcccgga taatgacccg 660
catatcatat tgagttttca cttctacgaa ccatttctgc tgacgcacca caaggcctcc 720
tggacacaca tccgtgatta caccggtccg gtgaactatc cgggtttgac tgtagacccg 780
acccacctgg aggggttgtc tgaagaactg gtgacccgga ttggccatca caatggggtg 840
tatacaaaag aaacgatgga ggagatgatc atgatcccac tgcaatatgc caaagaccgg 900
gggctccccc tttattgtgg agagtgggga tgtttcccga ccatgcccca ggagatgcgc 960
ctgcaatggt acgccgatgt gcgtgcgatc ctggaaaagc atgagattgc ctgggcaaac 1020
tgggattaca agggtggttt cggtgtggtt gaccgcaacg gcgaacccca ccatgattta 1080
ttggaagtgc tcttaaaata a 1101<210> 104 <211> 366 <212> PRT <213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1) . . . (20)
<220>
<221> DOMÍNIO <222> (42) . . . (349)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO <222> (40)...(43)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 104
Met Leu lie lie Gly Gly Leu Leu Vai Leu Leu Gly Phe Ser Ser Cys 1 5 10 15
Gly Arg Gln Ala Glu Pro Ala Ala Asp Ser Phe Arg Gly Phe His Asp 20 25 30
Phe Asp lie Arg Arg Gly Vai Asn lie Ser His Trp Leu Ser Gln Ser 35 40 45
Gly Arg Arg Gly Ala Asp Arg Glu Ala Phe Phe Thr Arg Ala Asp Vai 50 55 60
Glu Ala lie Ala Gly Phe Gly Tyr Asp His lie Arg Leu Pro lie Asp 65 70 75 80
Glu Glu Gln Met Trp Asp Glu Ser Gly Asn Lys Glu Pro Arg Ala Phe 85 90 95
Glu Leu Leu His Glu Ala lie Gly Trp Ala Leu Asp Asn Glu Leu Arg 100 105 110
Vai lie Vai Asp Leu His lie lie Arg Ser His Tyr Phe Asn Ala Pro 115 120 125
Glu Asn Pro Leu Trp Thr Asp Arg Ala Glu Gln Leu Lys Phe Vai Glu 130 135 140
Met Trp Arg Gln Leu Ser Asp Glu Leu Gln Gly Tyr Pro Leu Asp Arg 145 150 155 160
Vai Ala Tyr Glu Leu Met Asn Glu Ala Vai Ala Asp Asp Pro Asp Asp 165 170 175Trp Asn Arg Leu Vai Ala Glu Thr Met Glu Ala Leu Arg Met Leu Glu 180 185 190
Pro Glu Arg Lys lie Vai lie Gly Ser Asn Arg Trp Gln Ser Vai His 195 200 205
Thr Phe Pro Asp Leu Vai lie Pro Asp Asn Asp Pro His lie lie Leu 210 215 220
Ser Phe His Phe Tyr Glu Pro Phe Leu Leu Thr His His Lys Ala Ser 225 230 235 240
Trp Thr His lie Arg Asp Tyr Thr Gly Pro Vai Asn Tyr Pro Gly Leu 245 250 255
Thr Vai Asp Pro Thr His Leu Glu Gly Leu Ser Glu Glu Leu Vai Thr 260 265 270
Arg lie Gly His His Asn Gly Vai Tyr Thr Lys Glu Thr Met Glu Glu 275 280 285
Met lie Met lie Pro Leu Gln Tyr Ala Lys Asp Arg Gly Leu Pro Leu 290 295 300
Tyr Cys Gly Glu Trp Gly Cys Phe Pro Thr Met Pro Gln Glu Met Arg 305 310 315 320
Leu Gln Trp Tyr Ala Asp Vai Arg Ala lie Leu Glu Lys His Glu lie 325 330 335
Ala Trp Ala Asn Trp Asp Tyr Lys Gly Gly Phe Gly Vai Vai Asp Arg 340 345 350
Asn Gly Glu Pro His His Asp Leu Leu Glu Vai Leu Leu Lys 355 360 365
<210> 105 <211> 1047 <212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 105
atgcaacact tcatcaacgg cgtcaacctg ggaggctggc tctcccaata ccagaaatac 60
gaccatgagc acttccgcac cttcatcacc cggcgcgata tcgaacaaat cgcatcctgg 120
ggcttcgacc acatccgcct gccggtcgat tatccggttc tcgaatcgga cgacgcgccc 180
ggtatctatc atgaagatgg ctttgcctat cttgactctt gcctggaatg gtgccaggcc 240
gctgggctgg cagtcgtctt cgacctgcat catgcccccg gctacagttt cacgaacacg 300ctcaagcctg aaaccctgca cctgaacgta ctcttcgagc aggaaatcgc ccaaaatcga 360
tttatcgccc tctgggaaac cattgttcgg cgctaccagg ccgccggctt gcctatcatc 420
tttgaactac tgaatgaaat ggtgctgcca gacagcggcc cctggaacgc cctggcccac 480
aaaaccgtcg ccgccctgcg acagatttcg cccgattgca aaatcatgat tggcggcaat 540
aactacaacg ccgcatccga actcaaaaac ataaccctgc acaacgaccc caacatccta 600
tacaccttcc atttctacga accggccctg ttcacccacc agaaagcccc ctgggtgcag 660
attgctgtcg aatacaacca ggaactcgaa taccctggct cgtacaccaa cctggccgcc 720
tttctccggc gcaatcccca ctatcaagaa tcctatggat ggcaggtcaa ccgccgtatc 780
gaccgcgacc tcctgctcga attcacccaa cccgccctgg actttgtcca gcagaccggg 840
cgcgacctgt actgcggtga attcggcgtc attgaatacg tcgagcctgc cagccgccaa 900
aactggcacg ccgacctgct ggacatcctg cgccagcaga agattggccg cgccgtctgg 960
acttataaac aaatggattt tggcctggtg gacgcggacg gcaaggtggt cgaccccaaa 1020
cttctcgaaa tcttgtgtca atcctga 1047
<210> 106 <211> 348 <212> PRT <213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> DOMÍNIO <222> (2)...(330)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO
<222> (192).,.(195)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 106
Met Gln His Phe lie Asn Gly Vai Asn Leu Gly Gly Trp Leu Ser Gln 15 10 15
Tyr Gln Lys Tyr Asp His Glu His Phe Arg Thr Phe lie Thr Arg Arg 20 25 30
Asp lie Glu Gln lie Ala Ser Trp Gly Phe Asp His lie Arg Leu Pro 35 40 45
Vai Asp Tyr Pro Vai Leu Glu Ser Asp Asp Ala Pro Gly lie Tyr His 50 55 60
Glu Asp Gly Phe Ala Tyr Leu Asp Ser Cys Leu Glu Trp Cys Gln Ala 65 70 75 80
Ala Gly Leu Ala Vai Vai Phe Asp Leu His His Ala Pro Gly Tyr Ser85 90 95
Phe Thr Asn Thr Leu Lys Pro Glu Thr Leu His Leu Asn Vai Leu Phe 100 105 110
Glu Gln Glu lie Ala Gln Asn Arg Phe lie Ala Leu Trp Glu Thr lie 115 120 125
Vai Arg Arg Tyr Gln Ala Ala Gly Leu Pro lie lie Phe Glu Leu Leu 130 ' 135 140
Asn Glu Met Vai Leu Pro Asp Ser Gly Pro Trp Asn Ala Leu Ala His 145 150 155 160
Lys Thr Vai Ala Ala Leu Arg Gln lie Ser Pro Asp Cys Lys lie Met 165 170 175
lie Gly Gly Asn Asn Tyr Asn Ala Ala Ser Glu Leu Lys Asn lie Thr 180 185 190
Leu His Asn Asp Pro Asn lie Leu Tyr Thr Phe His Phe Tyr Glu Pro 195 200 205
Ala Leu Phe Thr His Gln Lys Ala Pro Trp Vai Gln lie Ala Vai Glu 210 215 220
Tyr Asn Gln Glu Leu Glu Tyr Pro Gly Ser Tyr Thr Asn Leu Ala Ala 225 230 235 240
Phe Leu Arg Arg Asn Pro His Tyr Gln Glu Ser Tyr Gly Trp Gln Vai 245 250 255
Asn Arg Arg lie Asp Arg Asp Leu Leu Leu Glu Phe Thr Gln Pro Ala 260 265 270
Leu Asp Phe Vai Gln Gln Thr Gly Arg Asp Leu Tyr Cys Gly Glu Phe 275 280 285
Gly Vai lie Glu Tyr Vai Glu Pro Ala Ser Arg Gln Asn Trp His Ala 290 295 300
Asp Leu Leu Asp lie Leu Arg Gln Gln Lys lie Gly Arg Ala Vai Trp 305 310 315 320
Thr Tyr Lys Gln Met Asp Phe Gly Leu Vai Asp Ala Asp Gly Lys Vai 325 330 335
Vai Asp Pro Lys Leu Leu Glu lie Leu Cys Gln Ser 340 345<210> 107
<211> 1137
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 107
atggaaaagc aaatctgttc aaatgttttc agtacgatgc tgataattgg aggccttctt 60
gttttactgg gattttcttc ttgcgggcgg caggcagaac ctgctgctga ctctttcagg 120
gggtttcacg actttgacat caggcgcggg gtgaacatca gccattggtt gtcgcagagt 180
ggaaggcgtg gtgctgatcg ggaggcgttc tttaccaggg cggatgtgga ggccatcgcc 240
ggcttcggtt atgatcacat tcgtttgccc atcgatgaag agcagatgtg ggatgagtcg 3.00
ggcaacaagg agccacgtgc ctttgaattg ctgcatgagg ccattggctg ggctttggac 360
aatgagctca gggtcattgt tgacctgcac atcatcaggt cgcactattt taatgcgcct 420
gagaacccgc tttggaccga tcgtgctgaa cagttgaaat ttgttgagat gtggcgacag 480
ttgtctgatg agctgcaggg ctatccgctc gatagggtgg cctatgaatt gatgaatgag 540
gccgtggctg atgatccgga cgattggaac cggcttgtgg ctgagacgat ggaggcgcta 600
cggatgctgg aaccggagcg caagattgtc attggctcca accgctggca gtctgtgcat 660
acatttcctg acctggtgat cccggataat gacccgcata tcatattgag ttttcacttc 720
tacgaaccat ttctgctgac gcaccacaag gcctcctgga cacacatccg tgattacacc 780
ggtccggtga actatccggg tttgactgta gacccgaccc acctggaggg gttgtctgaa 840
gaactggtga cccggattgg ccatcacaat ggggtgtata caaaagaaac gatggaggag 900
atgatcatga tcccactgca atatgccaaa gaacgggggc tccccctgta ttgcggggag 960
tggggatgtt tcccgaccat gccccaggag atgcgcctgc aatggtacgc cgatgtgcgt 1020
gcgatcctgg aaaagcatga gattgcctgg gcaaactggg attacaaggg tggtttcggt 1080
gtggttgacc gcaacggcga accccaccat gatttattgg aagtcttact aaaataa 1137
<210> 108
<211> 378 ,
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(32)
<220>
<221> DOMÍNIO <222> (54)...(361)
<223> Celulase (Família glicosil hidrolase 5)
<220>
<221> SÍTIO <222> (52)...(55)<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 108
Met Glu Lys Gln lie Cys Ser Asn Vai Phe Ser Thr Met Leu lie lie 15 10 15
Gly Gly Leu Leu Vai Leu Leu Gly Phe Ser Ser Cys Gly Arg Gln Ala 20 25 30
Glu Pro Ala Ala Asp Ser Phe Arg Gly Phe His Asp Phe Asp lie Arg 35 40 45
Arg Gly Vai Asn lie Ser His Trp Leu Ser Gln Ser Gly Arg Arg Gly 50 55 60
Ala Asp Arg Glu Ala Phe Phe Thr Arg Ala Asp Vai Glu Ala lie Ala 65 70 75 80
Gly Phe Gly Tyr Asp His lie Arg Leu Pro lie Asp Glu Glu Gln Met 85 90 95
Trp Asp Glu Ser Gly Asn Lys Glu Pro Arg Ala Phe Glu Leu Leu His 100 105 110
Glu Ala lie Gly Trp Ala Leu Asp Asn Glu Leu Arg Vai lie Vai Asp 115 120 125
Leu His lie lie Arg Ser His Tyr Phe Asn Ala Pro Glu Asn Pro Leu 130 135 140
Trp Thr Asp Arg Ala Glu Gln Leu Lys Phe Vai Glu Met Trp Arg Gln 145 150 155 160
Leu Ser Asp Glu Leu Gln Gly Tyr Pro Leu Asp Arg Vai Ala Tyr Glu 165 170 175
Leu Met Asn Glu Ala Vai Ala Asp Asp Pro Asp Asp Trp Asn Arg Leu 180 185 190
Vai Ala Glu Thr Met Glu Ala Leu Arg Met Leu Glu Pro Glu Arg Lys 195 200 205
lie Vai lie Gly Ser Asn Arg Trp Gln Ser Vai His Thr Phe Pro Asp 210 215 220
Leu Vai lie Pro Asp Asn Asp Pro His lie lie Leu Ser Phe His Phe 225 230 235 240
Tyr Glu Pro Phe Leu Leu Thr His His Lys Ala Ser Trp Thr His lie 245 250 255Arg Asp Tyr Thr Gly Pro Vai Asn Tyr Pro Gly Leu Thr Vai Asp Pro 260 265 270
Thr His Leu Glu Gly Leu Ser Glu Glu Leu Vai Thr Arg lie Gly His 275 280 285
His Asn Gly Vai Tyr Thr Lys Glu Thr Met Glu Glu Met lie Met lie 290 295 300
Pro Leu Gln Tyr Ala Lys Glu Arg Gly Leu Pro Leu Tyr Cys Gly Glu 305 310 315 320
Trp Gly Cys Phe Pro Thr Met Pro Gln Glu Met Arg Leu Gln Trp Tyr 325 330 335
Ala Asp Vai Arg Ala lie Leu Glu Lys His Glu lie Ala Trp Ala Asn 340 345 350
Trp Asp Tyr Lys Gly Gly Phe Gly Vai Vai Asp Arg Asn Gly Glu Pro 355 360 365
His His Asp Leu Leu Glu Vai Leu Leu Lys
<210> 109
<211> 1248
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 109
atgaagacac atagcttcaa cctcagatca cggatcacct tgttgaccgc ggcactgctt 60
ttcatcgggg caacggccgg ggccgccacg acacctatca ccctcaaaga cgcctacaaa 120
gaccatttcc ttatgggtgt agccatcaac cgcctgattg caatgggcga tacgaatgtc 180
cgggccgaca acgccagccg gaccccggaa cagctcaagg gggacattgc cctggtcaag 240
gcgcagttca acctgatcgt caatgagaac gatctgaaac cgattctcat tcacccgagg 300
ccaggaccgg acgggtacga cttcgcccca gcggatgcct tcgtgaagtt cggcatggac 360
aacaatatgt atatcgtggg ccacaccctc ctctggcaca gccaggtgcc caactggttc 420
ttccaagggt ctgctccggc gactccggaa acgccacctg ctgccacgga cgcggcggtc 480
gcaccccgcg gcggacgagg aggtcgcggc gggattaccg gccccctggc gacccgcgag 540
gagttgatcg aacgcatgcg cgagcacatt cacaccgtcg tcggccgcta taagggaaag 600
atcaaggtct gggacgtcgt caacgaagcc ctcgccgacg gcggcaccga gaccctgcga 660
agcacgtact ggacccaaat catcgggccg gaattcatcg ccatggcctt tcgattcgcc 720
cacgaagccg atccggatgc gatccttcgt tacaacgatt atggcctgga gaaccctgcc 780aagcgtgaga aactcaagaa gctgatcgcg tcgctccagg agcagaacgt tccggttcat 840
gccatcggca cgcaaaccca tatcagcgtc tccacgacgt tcgaaagaat ggatgagacc 900
ttgagggacc tggcatccat cgggcttccc gtccacatca ccgaactgga tgtcaacgcc 960
gccgcggggg gccagagggg caccaatgcg gacattgccg gcactgccga gcgtacggcg 1020
ggcggcgtgg tcagtgaagc cgacaagcgg ctggccgacg cctacgcgaa tctcttccgc 1080
gcgatcatga agcacaagga ctcggtgaag atggtcacgt tctggggcgt caatgacgcg 1140
gtttcgtggc tcgcacgcgg caccccgctg ctgttcgacg gcaacaatca gcccaagccg 1200
gctttcgatg cggtcattcg cgtcgccacg gaggcggcac agaactga 1248
<210> 110 <211> 415 <212> PRT <213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(28)
<220>
<221> DOMÍNIO <222> (34)...(409)
<223> Família glicosil hidrolase 10 <220>
<221> SÍTIO
<222> (312)...(322)
<223> Família glicosil hidrolase 10 active sítio. Pró-sitio id = PS00591 <400> 110
Met Lys Thr His Ser Phe Asn Leu Arg Ser Arg Ile Thr Leu Leu Thr. 15 10 15
Ala Ala Leu Leu Phe Ile Gly Ala Thr Ala Gly Ala Ala Thr Thr Pro 20 25 30
Ile Thr Leu Lys Asp Ala Tyr Lys Asp His Phe Leu Met Gly Vai Ala 35 f 40 45
Ile Asn Arg Leu Ile Ala Met Gly Asp Thr Asn Vai Arg Ala Asp Asn 50 55 60
Ala Ser Arg Thr Pro Glu Gln Leu Lys Gly Asp Ile Ala Leu Vai Lys 65 70 75 80
Ala Gln Phe Àsn Leu Ile Vai Asn Glu Asn Asp Leu Lys Pro Ile Leu 85 90 95
Ile His Pro Arg Pro Gly Pro Asp Gly Tyr Asp Phe Ala Pro Ala Asp 100 105 110Ala Phe Vai Lys Phe Gly Met Asp Asn Asn Met Tyr lie Vai Gly His 115 120 125
Thr Leu Leu Trp His Ser Gln Vai Pro Asn Trp Phe Phe Gln Gly Ser 130 135 140
Ala Pro Ala Thr Pro Glu Thr Pro Pro Ala Ala Thr Asp Ala Ala Vai 145 150 155 160
Ala Pro Arg Gly Gly Arg Gly Gly Arg Gly Gly lie Thr Gly Pro Leu 165 170 175
Ala Thr Arg Glu Glu Leu lie Glu Arg Met Arg Glu His lie His Thr 180 185 190
Vai Vai Gly Arg Tyr Lys Gly Lys lie Lys Vai Trp Asp Vai Vai Asn 195 200 205
Glu Ala Leu Ala Asp Gly Gly Thr Glu Thr Leu Arg Ser Thr Tyr Trp 210 215 220
Thr Gln lie lie Gly Pro Glu Phe lie Ala Met Ala Phe Arg Phe Ala 225 230 235 240
His Glu Ala Asp Pro Asp Ala lie Leu Arg Tyr Asn Asp Tyr Gly Leu 245 250 255
Glu Asn Pro Ala Lys Arg Glu Lys Leu Lys Lys Leu lie Ala Ser Leu 260 265 270
Gln Glu Gln Asn Vai Pro Vai His Ala lie Gly Thr Gln Thr His lie 275 280 285
Ser Vai Ser Thr Thr Phe Glu Arg Met Asp Glu Thr Leu Arg Asp Leu 290 295 300
Ala Ser lie Gly Leu Pro Vai His lie Thr Glu Leu Asp Vai Asn Ala 305 310 315 320
Ala Ala Gly Gly Gln Arg Gly Thr Asn Ala Asp lie Ala Gly Thr Ala 325 330 335
Glu Arg Thr Ala Gly Gly Vai Vai Ser Glu Ala Asp Lys Arg Leu Ala 340 345 350
Asp Ala Tyr Ala Asn Leu Phe Arg Ala lie Met Lys His Lys Asp Ser 355 360 365
Vai Lys Met Vai Thr Phe Trp Gly Vai Asn Asp Ala Vai Ser Trp Leu 370 375 380Ala Arg Gly Thr Pro Leu Leu Phe Asp Gly Asn Asn Gln Pro Lys Pro 385 390 395 400
Ala Phe Asp Ala Vai lie Arg Vai Ala Thr Glu Ala Ala Gln Asn 405 410 415
<210> 111
<211> 1131
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 111
atgcgaagac tgatcaccat catccttgcg acggctgtcg caatcttatc gaccacatca 60
tgctccaaga ccgctgaacg agagggcttc ttgatcaagc gaggaaccaa cctcagccat 120
tggctctccc agagcaagga aaggggagag gctcgcaggc tccatatcca ggaggatgac 180
tttgctcgcc tcgacagcct cggtttcgac catgtgcgca tccctgtcga cgaggaacaa 240
ctctgggacg aggatggcàa caagctcaca gaagcatggg aactgctcga tttcgccctc 300
gacatggcgc gcaagtacaa cctgcgcgct atcgtggacc ttcacatcat ccgcgcccat 3 60
tacttcaacg ccgtcaacga aggcgcgtcg aatactctct tcaccagcga ggaggcgcag 420
cagggcctga tcaacctttg gtaccagctt tccgacttcc tcaaggaccg cagcgtcgac 480
tgggttgcct acgagttcat gaacgagcca gtcgctcctg agcatgagca atggaacgcc 540
ctcgtcgcaa aggtgcacaa ggcgcttcgt gagcgtgaac cggagcgtac cctcgtgatc 600
ggttctaacc tgtggcaggg tcaccagacc ttcaagtacc tccgcgtacc tgagaatgac 660
ccgaacatca tcctgagctt ccactactac aacccttcga tcctcaccca caacatggct 720
ccgtggactc cggtgggcaa atataccggt tccatcaatt atccgggcgt catcgtctct 780
gctgaggatt acgctgcgca gagccctgág gtgcaggccg aggtgaagca gtatacggag 840
atggtctgga accgcgacac gatctacagc cagatgaagg atgcgatcga ggtggctgcc 900
agctatggac .tgcagctctt ctgcggcgaa tggggcgtgt atgaacctgt cgaccgtgag 960
cttgcatacg catggaccaa ggatatgctg tcggtgttcg acgagttcga catcgcatgg 1020
acgacctggt gttacgatgc cgacttcggc ttctgggacc aggcgaaaca tgatttcaag 1080
gacaagcctc ttgtcgatct cctgatgggt tccaagggtc ttgaacaata g 1131
<210> 112
<211> 376
<212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL
<222> (1) . . . (22)<220>
<221> DOMÍNIO <222> (39)...(353)
<223> Celulase (Família glicosil hidrolase 5) <220>
<221> SÍTIO <222> (37)...(40)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 112
Met Arg Arg Leu lie Thr lie lie Leu Ala Thr Ala Vai Ala lie Leu 15 10 15
Ser Thr Thr Ser Cys Ser Lys Thr Ala Glu Arg Glu Gly Phe Leu lie 20 25 30
Lys Arg Gly Thr Asn Leu Ser His Trp Leu Ser Gln Ser Lys Glu Arg 35 40 45
Gly Glu Ala Arg Arg Leu His lie Gln Glu Asp Asp Phe Ala Arg Leu 50 55 60
Asp Ser Leu Gly Phe Asp His Vai Arg lie Pro Vai Asp Glu Glu Gln 65 70 75 80
Leu Trp Asp Glu Asp Gly Asn Lys Leu Thr Glu Ala Trp Glu Leu Leu 85 90 95
Asp Phe Ala Leu Asp Met Ala Arg Lys Tyr Asn Leu Arg.Ala lie Vai 100 105 110
Asp Leu His lie lie Arg Ala His Tyr Phe Asn Ala Vai Asn Glu Gly 115 120 125
Ala Ser Asn Thr Leu Phe Thr Ser Glu Glu Ala Gln Gln Gly Leu lie 130 135 140
Asn Leu Trp Tyr Gln Leu Ser Asp Phe Leu Lys Asp Arg Ser Vai Asp 145 150 155 160
Trp Vai Ala Tyr Glu Phe Met Asn Glu Pro Vai Ala Pro Glu His Glu 165 170 175
Gln Trp Asn Ala Leu Vai Ala Lys Vai His Lys Ala Leu Arg Glu Arg 180 185 190
Glu Pro Glu Arg Thr Leu Vai lie Gly Ser Asn Leu Trp Gln Gly His 195 200 205
Gln Thr Phe Lys Tyr Leu Arg Vai Pro Glu Asn Asp Pro Asn lie lie 210 215 220Leu Ser Phe His Tyr Tyr Asn Pro Ser lie Leu Thr His Asn Met Ala 225 230 235 240
Pro Trp Thr Pro Vai Gly Lys Tyr Thr Gly Ser lie Asn Tyr Pro Gly 245 250 255
Vai lie Vai Ser Ala Glu Asp Tyr Ala Ala Gln Ser Pro Glu Vai Gln 260 265 270
Ala Glu Vai Lys Gln Tyr Thr Glu Met Vai Trp Asn Arg Asp Thr lie 275 280 285
Tyr Ser Gln Met Lys Asp Ala lie Glu Vai Ala Ala Ser Tyr Gly Leu 290 295 300
Gln Leu Phe Cys Gly Glu Trp Gly Vai Tyr Glu Pro Vai Asp Arg Glu 305 310 315 320
Leu Ala Tyr Ala Trp Thr Lys Asp Met Leu Ser Vai Phe Asp Glu Phe 325 : 330 335
Asp lie Ala Trp Thr Thr Trp Cys Tyr Asp Ala Asp Phe Gly Phe Trp 340 345 350
Asp Gln Ala Lys His Asp Phe Lys Asp Lys Pro Leu Vai Asp Leu Leu 355 360 365
Met Gly Ser Lys Gly Leu Glu Gln 370 375
<210> 113
<211> 1095
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental <400> 113
atgaaggtga cccgaacagc tgtcgcgggc attgtcgccg cagcggtcct catcacgatc 60
ggcacgtcga ccgcgtcggc tgaggatgaa ccaaccagcg agaacacgtc gacggatcag 120
ccgttgcgcg tcctggcagc caaagccggg atcgcgttcg gcacggccgt cgacatgaac 180
gcgtacaaca acgacgcgac ctaccgtgag ctcgtcggcc aggagttctc gagcgtcacg 240
gccgagaacg tcatgaagtg gcagctcctc gagccgcagc gaggggtcta caactggggt 300
ccggccgatc agctcgtgcg cgtagccaac gagaacggcc agaaggtgcg cgggcacacg 3 60
ctcatctggc acaaccagct gcccacctgg cttaccagcg gagtcgcctc cggtgagatc 420
acaccggacg agctccggca gctcctgagg aaccacatct tcacggtgat gcgccacttc 480
aagggcgaga tccaccagtg ggatgtcgcc aacgaggtca tcgacgacag cggcaacctg 540cgcaacacga tctggctgca gaacctgggt ccgagctaca tcgcggacgc gttccggtgg 600
gctcgcaagg ccgacccgga cgccgccctc tatctgaacg actacaacgt cgagggcccg 660
aacgccaagg ccgatgcgta ctacgccctg gtcaagcagc tcctcgccga cgacgtgccg 720
gtggacggct tcggaataca ggggcacctc ggtgtgcagt tcggcttctg gcccgcgagt 780
gcggtggccg acaacatggg gcgcttcgag gcactcggcc tgcagacggc ggtcaccgag 840
gcggatgtcc ggatgatcat gccgcccgac gaggacaagc tggccgcaca ggcacgtggc 900
tacagcacgt tggtccaggg ctgcctgatg gccaagcgtt gcaggtcgtt caccgtctgg 960
ggcttcaccg acaagtactc ctgggttccg ggcaccttcc ccggccaggg cgcggcgaac 1020
ctcctggccg aggacttcca gcccaagccg gcttactacg ccgtccagga tgacctcgcg 1080
cgcgccggac ggtag 1095
<210> 114 <211> 364 <212> PRT
<213> Desconhecido <220>
<223> Obtido a partir de uma amostra ambiental <220>
<221> SIGNAL <222> (1)...(27)
<220>
<221> DOMÍNIO <222> (41)...(359)
<223> Família glicosil hidrolase 10 <220>
<221> SÍTIO <222> (35)...(38)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001 <400> 114
Met Lys Vai Thr Arg Thr Ala Vai Ala Gly lie Vai Ala Ala Ala Vai 15 10 15
Leu lie Thr lie Gly Thr Ser Thr Ala Ser Ala Glu Asp Glu Pro Thr 20 25 30
Ser Glu Asn Thr Ser Thr Asp Gln Pro Leu Arg Vai Leu Ala Ala Lys 35 40 45
Ala Gly lie Ala Phe Gly Thr Ala Vai Asp Met Asn Ala Tyr Asn Asn 50 55 60
Asp Ala Thr Tyr Arg Glu Leu Vai Gly Gln Glu Phe Ser Ser Vai Thr 65 70 75 80
Ala Glu Asn Vai Met Lys Trp Gln Leu Leu Glu Pro Gln Arg Gly Vai 85 90 95Tyr Asn Trp Gly Pro Ala Asp Gln Leu Vai Arg Vai Ala Asn Glu Asn 100 105 110
Gly Gln Lys Vai Arg Gly His Thr Leu lie Trp His Asn Gln Leu Pro 115 120 125
Thr Trp Leu Thr Ser Gly Vai Ala Ser Gly Glu lie Thr Pro Asp Glu 130 135 140
Leu Arg Gln Leu Leu Arg Asn His lie Phe Thr Vai Met Arg His Phe 145 150 155 160
Lys Gly Glu lie His Gln Trp Asp Vai Ala Asn Glu Vai lie Asp Asp 165 170 175
Ser Gly Asn Leu Arg Asn Thr lie Trp Leu Gln Asn Leu Gly Pro Ser 180 185 190
Tyr lie Ala Asp Ala Phe Arg Trp Ala Arg Lys Ala Asp Pro Asp Ala 195 200 205
Ala Leu Tyr Leu Asn Asp Tyr Asn Vai Glu Gly Pro Asn Ala Lys Ala 210 215 220
Asp Ala Tyr Tyr Ala Leu Vai Lys Gln Leu Leu Ala Asp Asp Vai Pro 225 230 235 240
Vai Asp Gly Phe Gly lie Gln Gly His Leu Gly Vai Gln Phe Gly Phe 245 250 255
Trp Pro Ala Ser Ala Vai Ala Asp Asn Met Gly Arg Phe Glu Ala Leu 260 265 270
Gly Leu Gln Thr Ala Vai Thr Glu Ala Asp Vai Arg Met lie Met Pro 275 280 285
Pro Asp Glu Asp Lys Leu Ala Ala Gln Ala Arg Gly Tyr Ser Thr Leu 290 295 300
Vai Gln Gly Cys Leu Met Ala Lys Arg Cys Arg Ser Phe Thr Vai Trp 305 310 315 320
Gly Phe Thr Asp Lys Tyr Ser Trp Vai Pro Gly Thr Phe Pro Gly Gln 325 330 335
Gly Ala Ala Asn Leu Leu Ala Glu Asp Phe Gln Pro Lys Pro Ala Tyr 340 345 350
Tyr Ala Vai Gln Asp Asp Leu Ala Arg Ala Gly Arg 355 360<210> 115<211> 774<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 115
atggacttgc agctaggcgg aaagcgcgtg ctgatcacgg gtgcgtccaa aggcatcggc 60
ctggcctgcg ccgtcgcctt tgcgcgcgag ggtgccgacc cgattctggt ggcgcgcgat 120
gatgcggcgt tgcatcacgc cacgtccgcc atccgcgaac aaagcggccg cgcggcacat 180
gccatcacgc tggacctggc cctgcctggc gcggcggaaa agctggccaa ggaaaccggc 240
cccatcgaca tactggtcaa caacgcgggc gcggtgcccg gcggcgcgct ggaccaggtg 300
caagacgaac gctggcgcgc gggctgggaa ttgaaagtgc acggctacat cagcctggcg 3 60
cgctgctact acccgcacat gcgcgaagcg ggcgcgggcg tcatcgccaa catcatcggc 420
atggcgggcg cggcgccccg cgccgactac atctgcggcg cggcggccaa tgcctcactg 480
attgccttta cccgcgcgct gggtggcgaa gcgccccgcc acggcgtgcg cgtçtttggc 540
gtcaacccct cgcgcacgcg gaccgaccgc gtgctgaccc tggcccggca acgcgcgcag 600
gcgcgctggg gcgacgaaac ccgttggcag gaaacgctgt cggacctgcc cttcaaccgg 660
ctgatggaac ccgccgaagt ggccgacatg attgtgttcg gcgcctcgcc gcgcgcgggt 720
tacctgagcg gcacggtcat cgacctggac ggcggcgaac agtacgcgaa atag 774
<210> 116
<211> 257
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (8) . . . (172)
<223> desidrogenase de cadeira curta<220>
<221> SÍTIO
<222> (159)...(162)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 116
Met Asp Leu Gln Leu Gly Gly Lys Arg Vai Leu lie Thr Gly Ala Ser1 5 10 15
Lys Gly lie Gly Leu Ala Cys Ala Vai Ala Phe Ala Arg Glu Gly Ala20 25 30
Asp Pro lie Leu Vai Ala Arg Asp Asp Ala Ala Leu His His Ala Thr35 40 45Ser Ala lie Arg Glu Gln Ser Gly Arg Ala Ala His Ala lie Thr Leu50 55 60
Asp Leu Ala Leu Pro Gly Ala Ala Glu Lys Leu Ala Lys Glu Thr Gly65 70 75 80
Pro lie Asp lie Leu Vai Asn Asn Ala Gly Ala Vai Pro Gly Gly Ala85 90 95
Leu Asp Gln Vai Gln Asp Glu Arg Trp Arg Ala Gly Trp Glu Leu Lys100 105 110
Vai His Gly Tyr lie Ser Leu Ala Arg Cys Tyr Tyr Pro His Met Arg115 120 125
Glu Ala Gly Ala Gly Vai lie Ala Asn lie lie Gly Met Ala Gly Ala130 135 140
Ala Pro Arg Ala Asp Tyr lie Cys Gly Ala Ala Ala Asn Ala Ser Leu145 150 155 160
lie Ala Phe Thr Arg Ala Leu Gly Gly Glu Ala Pro Arg His Gly Vai165 170 175
Arg Vai Phe Gly Vai Asn Pro Ser Arg Thr Arg Thr Asp Arg Vai Leu180 185 190
Thr Leu Ala Arg Gln Arg Ala Gln Ala Arg Trp Gly Asp Glu Thr Arg195 200 205
Trp Gln Glu Thr Leu Ser Asp Leu Pro Phe Asn Arg Leu Met Glu Pro210 215 220"
Ala Glu Vai Ala Asp Met lie Vai Phe Gly Ala Ser Pro Arg Ala Gly225 230 235 240
Tyr Leu Ser Gly Thr Vai lie Asp Leu Asp Gly Gly Glu Gln Tyr Ala245 250 255
Lys
<210> 117<211> 747<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental
<400> 117
atgcccaaag tcatgctcgt taccggcggc agccgtggca tcggcgccgc cgtcgccaagctggccgcgc gccgcggcta cgcggtcggc atcaactacc gcacccattc cgacgccgcc 120
gacgccgtcg tggccgagat ccagcaggcg ggcggcaccg cgctggccat ccaggccgac 180
gtgtcgcaag aagatgacgt gctgcacatg ttccgcacgc tggacgagcg cctgggccgc 240
atcgacgcgc tggtcaataa cgccggcatc ctggaaacgc agatgcgcct ggaccagatg 300
gaagcggacc gcctgctgcg cgtgctgtcc accaacgtca tcggcgcttt cctgtgtgcg 360
cgcgaagcgg tgcgcaggat gtcgacgcgc catggcggcg tgggcggcgc catcgtcaac 420
gtgtcttcgg cggcggcgcg cctgggctcg cccaatgaat acgtggatta cgcggcctcc 480
aagggcgcgc tggacacgat gaccatcggc ctgtccaaag aggtagcgcc cgaaggtatc 540
cgcgtgaatg gcgtgcgccc cggcaccatc tacaccgaca tgcacgcaag cggcggcgag 600
ccgggccggg tggatcgcct gaaaagcgtg atcccgctgc ggcgcggcgg ctcggtggaa 660
gaagtggcgg gcgccgtcat gtggctgttt tccgaagaag ccggctatac cagcggctcg 720
ttcatcgacg tgtccggcgg tagttga 747
<210> 118
<211> 248
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (3) . . . (176)
<223> desidrogenase de cadeira curta<220>
<221> SÍTIO
<222> (142) . ... (145)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (146)...(174)
<223> Assinatura da família das redutases/desidrogenases de cadeia curta.Pró-sitio id = PS00061
<400> 118
Met Pro Lys Vai Met Leu Vai Thr Gly Gly Ser Arg Gly lie Gly Ala1 5 10 15
Ala Vai Ala Lys Leu Ala Ala Arg Arg Gly Tyr Ala Vai Gly lie Asn20 25 30
Tyr Arg Thr His Ser Asp Ala Ala Asp Ala Vai Vai Ala Glu lie Gln35 40 45
Gln Ala Gly Gly Thr Ala Leu Ala lie Gln Ala Asp Vai Ser Gln Glu50 55 60
Asp Asp Vai Leu His Met Phe Arg Thr Leu Asp Glu Arg Leu Gly Arg65 70 75 80
lie Asp Ala Leu Vai Asn Asn Ala Gly lie Leu Glu Thr Gln Met Arg85 90 95
Leu Asp Gln Met Glu Ala Asp Arg Leu Leu Arg Vai Leu Ser Thr Asn100 105 110
Vai lie Gly Ala Phe Leu Cys Ala Arg Glu Ala Vai Arg Arg Met Ser115 120 125
Thr Arg His Gly Gly Vai Gly Gly Ala lie Vai Asn Vai Ser Ser Ala130 135 140
Ala Ala Arg Leu Gly Ser Pro Asn Glu Tyr Vai Asp Tyr Ala Ala Ser145 150 155 160
Lys Gly Ala Leu Asp Thr Met Thr lie Gly Leu Ser Lys Glu Vai Ala165 170 175
Pro Glu Gly lie Arg Vai Asn Gly Vai Arg Pro Gly Thr lie Tyr Thr180 185 190
Asp Met His Ala Ser Gly Gly Glu Pro Gly Arg Vai Asp Arg Leu Lys195 200 205
Ser Vai lie Pro Leu Arg Arg Gly Gly Ser Vai Glu Glu Vai Ala Gly210 215 220
Ala Vai Met Trp Leu Phe Ser Glu Glu Ala Gly Tyr Thr Ser Gly Ser225 230 235 240
Phe lie Asp Vai Ser Gly Gly Ser245
<210> 119
<211> 1611 f
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 119
atgcaaaagc ggtatgacgt cattgtcgtg ggcagcggga tcgccggcct cagttttgcg 60
ctaaaagtcg ccaaggcggg gcatcgcgta gggattttga ccaaaaaaga ccgtgctgaa 120
agcaacacca attatgccca aggcggcatc gcggcagtca cttcgcagac agatgatttc 180
gagctgcatg tgcaggacac attgaccgcg ggagatggac tctgcgacga ggcagtcgtc 240
cgcacgatta tcggcgaggc tcccgcccga atccaggagc tgatcgattt gggggtggcc 300
ttctcacatt tggaagatgg acgggtttcc ctccatcgcg aagggggtca ctcgaaaagg 360cgcattcttc acgttcagga tgtcaccggc aaagcgattg aagaagccct cctccatgcc 420
atcgaacagt cgccgctgat cgacctgaat gagcacgtct ttgccatcga cttactgact 480
gaacgcaagc tggcgctggc gggctttgag gtggaaggtg ctaaaaaccg ggtggtcgga 540
ctctatgcgc tcgatgaagc cactcaggag gttcacgtat ttgaggctcc agtcgtcatg 600
ctggcaacgg gaggcgtcgg gcaggtctac ctctacagca ccaacccaag gatcgcgacc 660
ggtgatggat tggccatggc ttaccgggct ggcgccgaaa tccgcaacct cgagtgtatc 720
caatttcatc ctacagcgct atacaccacc accaatgacc gctttctgat cagcgaagcc 780
gtccggggtg aaggggccat cctccgcaat caggagggag aggctttcat ggctcgctac 840
gatgaccgca aggacctcgc cccccgggat attgtggcca gagcaattga cagtgaaatg 900
aagcagtccg gctcatccca tgtctggctc gacatcactc atcgggatga aaccgatctg 960
cgggagcgtt tccccaacat tttcgaggcc tgcctgaagg tcggagtcaa catggcgcaa 102 0
tcctccatcc cggtggttcc ggcgatgcac tacctctgcg gaggcgtagc caccgacctc 1080
aatgcggcca ccgacatcac tggactgttt gcctgtgggg aagttgcctg cacgggattg 1140
catggtgcca accgtctcgc cagcaacagc ctgctggagg cagtggtcat ggcgcaccgg 1200
gcctccgtcg cagtggatgc atacctcaac agcaaacctc accgctatgc acaattgccg 1260
gaatggacgg atggcaacgt gcaggacagc gacgagcgtg tcgtgatcag ccacaactgg 1320
gatgaactca aacgcacgat gtgggactac gtgggcatcg tccgcaccac caagcggctt 13 8.0
cagcgcgcgc aacgacgcat tcgtcacctc cagcaggaaa tcgaagagta ttactggaat 1440
ttcaaggttg agtcctccct tctggagtta cggaatctgg ttgtggtggc ggatctggtt 1500
atccactgtg ccctccaacg ccatgagagc cgtggcctgc attgcacccg ggattatccc 1560
ggcaagttgc ccaccccgat caataccgcc gttcgcagaa gaaccggtta a 1611
<210> 120<211> 536<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (6)...(260)
<223> Oxidorredutase FAD dependente<220>
<221> DOMÍNIO<222> (6)...(380)
<223> Dissulfeto oxirredutase de nucleotideo de piridina<220>
<221> DOMÍNIO
<222> (6)...(391)
<223> Domínio FAD domínio
<220><221> DOMÍNIO<222> (440) . . . (534)
<223> Domínio C-terminal da plano proteína fumarato redutase/succinato
desidrogenase
<400> 120
Met Gln Lys Arg Tyr Asp Vai lie Vai Vai Gly Ser Gly lie Ala Gly15 10 15
Leu Ser Phe Ala Leu Lys Vai Ala Lys Ala Gly His Arg Vai Gly lie20 25 30
Leu Thr Lys Lys Asp Arg Ala Glu Ser Asn Thr Asn Tyr Ala Gln Gly35 40 45
Gly lie Ala Ala Vai Thr Ser Gln Thr Asp Asp Phe Glu Leu His Vai50 55 60
Gln Asp Thr Leu Thr Ala Gly Asp Gly Leu Cys Asp Glu Ala Vai Vai65 70 75 80
Arg Thr lie lie Gly Glu Ala Pro Ala Arg lie Gln Glu Leu lie Asp85 : 90 95
Leu Gly Vai Ala Phe Ser His Leu Glu Asp Gly Arg Vai Ser Leu His100 105 110
Arg Glu Gly Gly His Ser Lys Arg Arg lie Leu His Vai Gln Asp Vai115 120 125
Thr Gly Lys Ala lie Glu Glu Ala Leu Leu His Ala lie Glu Gln Ser130 135 140
Pro Leu lie Asp Leu Asn Glu His Vai Phe Ala lie Asp Leu Leu Thr145 150 155 160
Glu Arg Lys Leu Ala Leu Ala Gly Phe Glu Vai Glu Gly Ala Lys Asn165 170 175
Arg Vai Vai Gly Leu Tyr Ala Leu Asp Glu Ala Thr Gln Glu Vai His180 185 190
Vai Phe Glu Ala Pro Vai Vai Met Leu Ala Thr Gly Gly Vai Gly Gln195 200 205
Vai Tyr Leu Tyr Ser Thr Asn Pro Arg lie Ala Thr Gly Asp Gly Leu210 215 220
Ala Met Ala. Tyr Arg Ala Gly Ala Glu lie Arg Asn Leu Glu Cys lie225 230 235 240
Gln Phe His Pro Thr Ala Leu Tyr Thr Thr Thr Asn Asp Arg Phe Leu245 250 255lie Ser Glu Ala Vai Arg Gly Glu Gly Ala lie Leu Arg Asn Gln Glu260 265 270
Gly Glu Ala Phe Met Ala Arg Tyr Asp Asp Arg Lys Asp Leu Ala Pro275 280 285
Arg Asp lie Vai Ala Arg Ala lie Asp Ser Glu Met Lys Gln Ser Gly290 295 300
Ser Ser His Vai Trp Leu Asp lie Thr His Arg Asp Glu Thr Asp Leu305 310 315 320
Arg Glu Arg Phe Pro Asn lie Phe Glu Ala Cys Leu Lys Vai Gly Vai325 330 335
Asn Met Ala Gln Ser Ser lie Pro Vai Vai Pro Ala Met His Tyr Leu340 345 350
Cys Gly Gly Vai Ala Thr Asp Leu Asn Ala Ala Thr Asp lie Thr Gly355 360 365
Leu Phe Ala Cys Gly Glu Vai Ala Cys Thr Gly Leu His Gly Ala Asn370 375 380
Arg Leu Ala Ser Asn Ser Leu Leu Glu Ala Vai Vai Met Ala His Arg385 390 395 400
Ala Ser Vai Ala Vai Asp Ala Tyr Leu Asn Ser Lys Pro His Arg Tyr405 410 415
Ala Gln Leu Pro Glu Trp Thr Asp Gly Asn Vai Gln Asp Ser Asp Glu420 425 430
Arg Vai Vai lie Ser His Asn Trp Asp Glu Leu Lys Arg Thr Met Trp435 440 445
Asp Tyr Vai Gly lie Vai Arg Thr Thr Lys Arg Leu Gln Arg Ala Gln450 455 460
Arg Arg lie Arg His Leu Gln Gln Glu lie Glu Glu Tyr Tyr Trp Asn465 470 475 480
Phe Lys Vai Glu Ser Ser Leu Leu Glu Leu Arg Asn Leu Vai Vai Vai485 490 495
Ala Asp Leu Vai lie His Cys Ala Leu Gln Arg His Glu Ser Arg Gly500 505 510
Leu His Cys Thr Arg Asp Tyr Pro Gly Lys Leu Pro Thr Pro lie Asn515 520 525
Thr Ala Vai. Arg Arg Arg Thr Gly530 535
<210> 121<211> 990<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 121
atgccttttg atgccattgg agaaagcttc cgtgccagcc agcaactccc gctgatcaag 60
gtcgacggca accgtttcgt gattgcggag accggtgagc cgatcgtctt ccggggcgtc 120
tccgcctccg acccggctgc gctactggaa cgcggtcaat ggggtcgccg- ttactttgaa 180
gagatggcca agtggaatgc caacgttgtg cgcattcctg ttcacccggc agactggcgt 240
aatctcggcg aagacatcta tctcgcccta ctcgaccagg cgattgaatg gtcggctgaa 3 00
ctcggcatgc acgtcatcat cgactggcac actatcggca atattctgac cggtatttat 360
caccgcgaca tttatgaaac cacccgtgat gagacttacc gtttttggta caccatcgcc 420
attcgttatc agggtaaccc gacagtggcc ttttatgaac tctacaatga gcccaccaac 480
cgaggcggtc gcatgggccc ccttccctgg gaagaatatg cccagttcat cgaagggctg 540
atttccatgc tctacgccat cgacgacacc gttattccac tggtcgctgg cttcgactgg 600
ggatatgatt tgagctatgt tgcggaacgc ccgatccgtt ttccaggagt cgcctatgtc 660
acccaccctt acccgçagaa gcgccccgag ccttgggaac cgatctggca ggaggaatgg 720
ggttttgtcg ccgacaccta tcccatgatc gccactgagt ttggcttcat gagtgaggac 780
ggtcccggag cccacaaccc ggttatcggg gatgaacact atggcgaatc ggtcatccgc 840
tttttcgagg aacgcggcat ttcctggacg gcctgggtgt ttgatcctct ctggtcaccc 900
cagcttttcg aagactggga aacctatacc cccacccggc aaggccgatt ctttaaacag 960
aaaatgatgg aactgaatcc cccgcgttga 990
<210> 122
<211> 329
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (25)...(302)
<223> Celulase (Família glicosil hidrolase 5)<400> 122
Met Pro Phe Asp Ala lie Gly Glu Ser Phe Arg Ala Ser Gln Gln Leu15 10 15Pro Leu lie Lys Vai Asp Gly Asn Arg Phe Vai lie Ala Glu Thr Gly20 25 30
Glu Pro lie Vai Phe Arg Gly Vai Ser Ala Ser Asp Pro Ala Ala Leu35 40 45
Leu Glu Arg Gly Gln Trp Gly Arg Arg Tyr Phe Glu Glu Met Ala Lys50 55 60
Trp Asn Ala Asn Vai Vai Arg lie Pro Vai His Pro Ala Asp Trp Arg65 70 75 80
Asn Leu Gly Glu Asp lie Tyr Leu Ala Leu Leu Asp Gln Ala lie Glu85 90 95
Trp Ser Ala Glu Leu Gly Met His Vai lie lie Asp Trp His Thr lie100 105 110
Gly Asn lie Leu Thr Gly lie Tyr His Arg Asp lie Tyr Glu Thr Thr115 120 125
Arg Asp Glu Thr Tyr Arg Phe Trp Tyr Thr lie Ala lie Arg Tyr Gln130 135 140
Gly Asn Pro Thr Vai Ala Phe Tyr Glu Leu Tyr Asn Glu Pro Thr Asn145 150 155 160
Arg Gly Gly Arg Met Gly Pro Leu Pro Trp Glu Glu Tyr Ala Gln Phe165 170 175
lie Glu Gly Leu lie Ser Met Leu Tyr Ala lie Asp Asp Thr Vai lie180 185 190
Pro Leu Vai Ala Gly Phe Asp Trp Gly Tyr Asp Leu Ser Tyr Vai Ala195 200 205
Glu Arg Pro lie Arg Phe Pro Gly Vai Ala Tyr Vai Thr His Pro Tyr210 215 220
Pro Gln Lys Arg Pro Glu Pro Trp Glu Pro lie Trp Gln Glu Glu Trp225 230 235 240
Gly Phe Vai Ala Asp Thr Tyr Pro Met lie Ala Thr Glu Phe Gly Phe245 250 255
Met Ser Glu Asp Gly Pro Gly Ala His Asn Pro Vai lie Gly Asp Glu260 265 270
His Tyr Gly Glu Ser Vai lie Arg Phe Phe Glu Glu Arg Gly lie Ser275 280 285Trp Thr Ala Trp Vai Phe Asp Pro Leu Trp Ser Pro Gln Leu Phe Glu290 295 300
Asp Trp Glu Thr Tyr Thr Pro Thr Arg Gln Gly Arg Phe Phe Lys Gln
Lys Met Met Glu Leu Asn Pro Pro Arg325
<210> 123<211> 1398<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 123
atgccgatga gcacagaaac gacttttcct tctgatttca cctggggcgc agcaacagcc 60
gcctaccaga tcgaaggggg cgatcgcgct ggcgggcgcg gccgttccgt gtgggacatg 120
ttttgcgaga aacgaggagc tatttgggag gggcatacgg ggcagcgagc gagtctgcat 180
cttcagcgct ggcgtgagga cgtaatgttg atgcaacagc tcggactgcg gggctatcgt 240
tttagcgtca gctggccgcg cgtcttcccg acaggagtcg gcaaagtcaa ccgtgaaggg 300
ttggcctttt acgatcagct cgtagacgcc ttgctcgagg ccggcatcac cccctttata 360
acgctatttc attgggactt cccgctcgat ttgtaccacc gaggcggctg gttgaatcgc 420
gacagcgccg actggtttgc ctcctacgcc gagtgcctcg gcaaggcact gggcgacagg 480
gtcaagcact gggtgaccct caacgagccg caggttttca taggcctcgg tcattacgaa 540
gggcgtcatg ccccggggtt gaagctctcc atcgcggaaa tgctgcgctg cgggcaccac 600
gccttgctcg cgcacgggaa ggccgtgcaa gccctgcgcg cttccgtcga cggcccctgc 660
aagattggat ttgctccggt ggggattccc aagcttccgg cgagtgagag ctcagaggat 720
atcgccgcgg cacgaaaggc ccagttcgcg gcgggagcgc cgccgtattg gacgctgagc 780
tggtgggcgg atccggtgtt tcaggggaca tatcccgctg atgcctgcca ggctctcgga 840
gcggacgcgc cgcaggtggc cgatcacgac atgagcatca tcagcgagcc gactgatttc 900
ctgggcctca acctttatca aggggtggtg gtgcgtgccg atcacacggg tcaaccagaa 960
acggtgccgt ttccgccggg attccccgtg actgcgctca actgggccgt aaccccagag 1020
gcgctgtatt ggggcccgcg ctttgccttc gaacgctaca aaaagccgat tcacatcacg 1080
gaaaacgggc tatcctgtcg tgactggccg tcgctcgacg ggcacgtcca cgacgccgac 1140
cgcatcgact tcatggcccg gcacttgcgc gcagcgcatc gagccattcg cgatgggata 1200
ccgatcgaag gctacttcca ctggtctgcg atcgacaact tcgagtgggc agaaggctac 1260
aaggaacgct tcgggctcat ttacgtcgac tatacgagcg gcgagcgcat tccgaaggac 1320tcgtaccact ggtaccagaa ggtcattgcc tccgaggggc gggcagcgct cggcgcgccc 1380
agtgctgctc gcccataa 1398
<210> 124<211> 465<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (5) . . . (454)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (13)...(27)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<400> 124
Met Pro Met Ser Thr Glu Thr Thr Phe Pro Ser Asp Phe Thr Trp Gly15 10 15
Ala Ala Thr Ala Ala Tyr Gln lie Glu Gly Gly Asp Arg Ala Gly Gly20 25 30
Arg Gly Arg Ser Vai Trp Asp Met Phe Cys Glu Lys Arg Gly Ala lie35 40 45
Trp Glu Gly His Thr Gly Gln Arg Ala Ser Leu His Leu Gln Arg Trp50 55 60
Arg Glu Asp Vai Met Leu Met Gln Gln Leu Gly Leu Arg Gly Tyr Arg65 70 75 80
Phe Ser Vai Ser Trp Pro Arg Vai Phe Pro Thr Gly Vai Gly Lys Vai85 90 95
Asn Arg Glu Gly Leu Ala Phe Tyr Asp Gln Leu Vai Asp Ala Leu Leu100 105 110
Glu Ala Gly lie Thr Pro Phe lie Thr Leu Phe His Trp Asp Phe Pro115 120 125
Leu Asp Leu Tyr His Arg Gly Gly Trp Leu Asn Arg Asp Ser Ala Asp130 135 140
Trp Phe Ala Ser Tyr Ala Glu Cys Leu Gly Lys Ala Leu Gly Asp Arg145 150 155 160
Vai Lys His Trp Vai Thr Leu Asn Glu Pro Gln Vai Phe lie Gly Leu165 170 175Gly His Tyr Glu Gly Arg His Ala Pro Gly Leu Lys Leu Ser lie Ala180 185 190
Glu Met Leu Arg Cys Gly His His Ala Leu Leu Ala His Gly Lys Ala195 200 205
Vai Gln Ala Leu Arg Ala Ser Vai Asp Gly Pro Cys Lys lie Gly Phe210 215 220
Ala Pro Vai Gly lie Pro Lys Leu Pro Ala Ser Glu Ser Ser Glu Asp225 230 235 240
lie Ala Ala Ala Arg Lys Ala Gln Phe Ala Ala Gly Ala Pro Pro Tyr245 250 255
Trp Thr Leu Ser Trp Trp Ala Asp Pro Vai Phe Gln Gly Thr Tyr Pro260 265 270
Ala Asp Ala Cys Gln Ala Leu Gly Ala Asp Ala Pro Gln Vai Ala Asp275 280 285
His Asp Met Ser lie lie Ser Glu Pro Thr Asp Phe Leu Gly Leu Asn290 295 300
Leu Tyr Gln Gly Vai Vai Vai Arg Ala Asp His Thr Gly Gln Pro Glu305 310 315 320
Thr Vai Pro Phe Pro Pro Gly Phe Pro Vai Thr Ala Leu Asn Trp Ala325 330 335
Vai Thr Pro Glu Ala Leu Tyr Trp Gly Pro Arg Phe Ala Phe Glu Arg340 345 350
Tyr Lys Lys Pro lie His lie Thr Glu Asn Gly Leu Ser Cys Arg Asp355 360 365
Trp Pro Ser Leu Asp Gly His Vai His Asp Ala Asp Arg lie Asp Phe370 375 380
Met Ala Arg His Leu Arg Ala Ala His Arg Ala lie Arg Asp Gly lie385 390 395 400
Pro lie Glu Gly Tyr Phe His Trp Ser Ala lie Asp Asn Phe Glu Trp405 410 415
Ala Glu Gly Tyr Lys Glu Arg Phe Gly Leu lie Tyr Vai Asp Tyr Thr420 425 430
Ser Gly Glu Arg lie Pro Lys Asp Ser Tyr His Trp Tyr Gln Lys Vai435 440 445lie Ala Ser Glu Gly Arg Ala Ala Leu Gly Ala Pro Ser Ala Ala Arg
Pro465
<210> 125<211> 1350<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 125
atgtcagatg ccgccccgac tgatccgaaa tccgcaatgc ccagacgctc ggacttcccc 60
gagggttttg tcttcggcgc ggccaccgcg gcctatcaga tcgagggcca tgccttcggc 120
ggcgcgggcc cctgccattg ggacagcttc gccgcaaccg ggcgtaacgt ggtcggcaat 180
gaggatggcg cgcgcgcctg cgagcattac acccgctggc cgcaggatct ggacctgatc 240
cgcgaggccg ggctcgacgc ctaccgcttc tcgacctcct gggcgcgggt gatgcccgat 300
ggcgtgaccc tgaaccccga ggggctggat ttctacgacc gcctcgtcga tggcatgctc 360
gagcgcgggc taaagcccta tctcaccctc taccattggg aattgccctc ggcgcttgcc 420
gacaggggcg gctggaccaa tcgcgacacg gccgagcgct ttgccgattt cgcagcggtg 480
gtgatggagc ggttgggcag ccgcgtcgcc cgcacggcca ccatcaacga gccatggtgc 540
gtgagctggc tctcgcattt cgaaggccat cacgcgccgg gcctgcgcga catccgtgcc 600
accgcacgcg ccatgcatca tgtgcaactg gcgcacggcc tcgcgctcgg gaagctgcgc 660
gcgcaggggc atggcaatct cggcatcgtg ctgaatttct cggaaatcat tcccgccggg 720
cgagagcacg cgaaggcggc tgatctcggc gacgcaatct cgaaccgctg gttcatcgag 780
tcagtcgcgc gtggcaccta tcccgatgtg gtcctcgagg gtctgggcaa gcacatgccc 840
gagggctggc aggatgacat gaaaaccatc gcggccccgc tcgactggct gggtgtgaac 900
tactacaccc gcggcatcgt cgcgcatgac ccggacgcgt cctggccctc gacccgagcg 960
gaggaggggc ccctgcccaa gacgcagatg ggctgggaga tctaccccga gggcttgcgc 1020
aacctgctgg tgcgcatggc gcgcgactat gtgggcgacc ttcccatggt cgtgaccgaa 1080
aacgggatgg cctgggccga cgaggtcgcg gatggcgccg tcagagatac gatccgcacc 1140
gaatatgtcg cagcccatct caacgcgacc cgcgaggcgc tggccggcgg ggcgaatatc 1200
gaaggtttct tctattggtc gctgctcgac aattacgaat gggccttcgg ctatgccaag 1260
cgcttcggcc tcgtccatgt cgatttcgac acgatggcac gcacgccgaa agcctcctac 1320
cacgcgctga gggccgcgct gcagggttga 13 50
<210> 126<211> 449<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (15)...(443)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO
<222> (235)...(238)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (361)...(369)
<223> Sítio ativo da família glicosil hidrolase 1. Pró-sitio id = PS00572<220>
<221> SÍTIO
<222> (393)...(396)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 126
Met Ser Asp Ala Ala Pro Thr Asp Pro Lys Ser Ala Met Pro Arg Arg15 10 15
Ser Asp Phe Pro Glu Gly Phe Vai Phe Gly Ala Ala Thr Ala Ala Tyr20 25 30
Gln lie Glu Gly His Ala Phe Gly Gly Ala Gly Pro Cys His Trp Asp35 40 45
Ser Phe Ala Ala Thr Gly Arg Asn Vai Vai Gly Asn Glu Asp Gly Ala50 55 60
Arg Ala Cys Glu His Tyr Thr Arg Trp Pro Gln Asp Leu Asp Leu lie65 70 75 80
Arg Glu Ala Gly Leu Asp Ala Tyr Arg Phe Ser Thr Ser Trp Ala Arg85 90 95
Vai Met Pro Asp Gly Vai Thr Leu Asn Pro Glu Gly Leu Asp Phe Tyr100 105 110
Asp Arg Leu Vai Asp Gly Met Leu Glu Arg Gly Leu Lys Pro Tyr Leu115 120 125
Thr Leu Tyr His Trp Glu Leu Pro Ser Ala Leu Ala Asp Arg Gly Gly130 135 140
Trp Thr Asn Arg Asp Thr Ala Glu Arg Phe Ala Asp Phe Ala Ala Vai145 150 155 160Vai Met Glu Arg Leu Gly Ser Arg Vai Ala Arg Thr Ala Thr lie Asn165 170 175
Glu Pro Trp Cys Vai Ser Trp Leu Ser His Phe Glu Gly His His Ala180 185 190
Pro Gly Leu Arg Asp lie Arg Ala Thr Ala Arg Ala Met His His Vai195 200 205
Gln Leu Ala His Gly Leu Ala Leu Gly Lys Leu Arg Ala Gln Gly His210 215 220
Gly Asn Leu Gly lie Vai Leu Asn Phe Ser Glu lie lie Pro Ala Gly225 230 235 240
Arg Glu His Ala Lys Ala Ala Asp Leu Gly Asp Ala lie Ser Asn Arg245 250 255
Trp Phe lie Glu Ser Vai Ala Arg Gly Thr Tyr Pro Asp Vai Vai Leu260 265 270
Glu Gly Leu Gly Lys His Met Pro Glu Gly Trp Gln Asp Asp Met Lys275 280 285
Thr lie Ala Ala Pro Leu Asp Trp Leu Gly Vai Asn Tyr Tyr Thr Arg290 295. 300
Gly lie Vai Ala His Asp Pro Asp Ala Ser Trp Pro Ser Thr Arg Ala305 310 315 320
Glu Glu Gly Pro Leu Pro Lys Thr Gln Met Gly Trp Glu lie Tyr Pro325 330 335
Glu Gly Leu Arg Asn Leu Leu Vai Arg Met Ala Arg Asp Tyr Vai Gly340 345 350
Asp Leu Pro Met Vai Vai Thr Glu Asn Gly Met Ala Trp Ala Asp Glu355 360 365
Vai Ala Asp Gly Ala Vai Arg Asp Thr lie Arg Thr Glu Tyr Vai Ala370 375 380
Ala His Leu Asn Ala Thr Arg Glu Ala Leu Ala Gly Gly Ala Asn lie385 390 395 400
Glu Gly Phe Phe Tyr Trp Ser Leu Leu Asp Asn Tyr Glu Trp Ala Phe405 410 415
Gly Tyr Ala Lys Arg Phe Gly Leu Vai His Vai Asp Phe Asp Thr Met420 425 430Ala Arg Thr Pro Lys Ala Ser Tyr His Ala Leu Arg Ala Ala Leu Gln435 440 445
Gly
<210> 127<211> 774<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 127
atggacttgc agctaggcgg aaagcgcgtg ctgatcacgg gtgcgtccaa aggcatcggc 60
ctggcctgcg ccgtcgcctt tgcgcgcgag ggtgccgacc cgattctggt ggcgcgcgat 120
gatgcggcgt tgcatcacgc cacgtccgcc atccgcgaac aaagcggccg cgcggcacat 180
gccatcacgc tggacctggc cctgcctggc gcggcggaaa agctggccaa ggaaaccggc 240
cccatcgaca tactggtcàa caacgcgggc gcggtgcccg gcggcgcgct ggaccaggtg 3 00
caagacgaac gctggcgcgc gggctgggaa ttgaaagtgc acggctacat cagcctggcg 360
cgctgctact acccgcacat gcgcgaagcg ggcgcgggcg tcatcgccaa catcatcggc 420
atggcgggcg cggcgccccg cgccgactac atctgcggcg cggcggccaa tgcctcactg 480
attgccttta cccgcgcgct gggtggcgaa gcgccccgcc acggcgtgcg cgtctttggc 540
gtcaacccct cgcgcacgcg gaccgaccgc gtgctgaccc tggcccggca acgcgcgcag 600
gcgcgctggg gcgacgaaac gcgttggcag gaaacgctgt cggacctgcc cttcaaccgg 660
ctgatggaac ccgccgaagt ggccgacatg attgtgttcg gcgcctcgcc acgcgcgggt 720
tacctgagcg gcacggtcat cgacctggac ggcggcgaac agtacgcgaa atag 774
<210> 128<211> 257<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO
<222> (8) . . .(172)
<223> desidrogenase de cadeira curta
<220>
<221> SÍTIO
<222> (159)...(162)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 128
Met Asp Leu Gln Leu Gly Gly Lys Arg Vai Leu lie Thr Gly Ala Ser15 10 15Lys Gly lie Gly Leu Ala Cys Ala Vai Ala Phe Ala Arg Glu Gly Ala20 25 30
Asp Pro lie Leu Vai Ala Arg Asp Asp Ala Ala Leu His His Ala Thr35 40 45
Ser Ala lie Arg Glu Gln Ser Gly Arg Ala Ala His Ala lie Thr Leu50 55 60
Asp Leu Ala Leu Pro Gly Ala Ala Glu Lys Leu Ala Lys Glu Thr Gly65 70 75 80
Pro lie Asp lie Leu Vai Asn Asn Ala Gly Ala Vai Pro Gly Gly Ala85 90 95
Leu Asp Gln Vai Gln Asp Glu Arg Trp Arg Ala Gly Trp Glu Leu Lys100 105 110
Vai His Gly Tyr lie Ser Leu Ala Arg Cys Tyr Tyr Pro His Met Arg115 120 125
Glu Ala Gly Ala Gly Vai lie Ala Asn lie lie Gly Met Ala Gly Ala130 135 140
Ala Pro Arg Ala Asp Tyr lie Cys Gly Ala Ala Ala Asn Ala Ser Leu145 150 155 160
lie Ala Phe Thr Arg Ala Leu Gly Gly Glu Ala Pro Arg His Gly Vai165 170 175
Arg Vai Phe Gly Vai Asn Pro Ser Arg Thr Arg Thr Asp Arg Vai Leu180 185 190
Thr Leu Ala Arg Gln Arg Ala Gln Ala Arg Trp Gly Asp Glu Thr Arg195 200 205
Trp Gln Glu Thr Leu Ser Asp Leu Pro Phe Asn Arg Leu Met Glu Pro210 215 220
Ala Glu Vai Ala Asp Met lie Vai Phe Gly Ala Ser Pro Arg Ala Gly225 230 235 240
Tyr Leu Ser Gly Thr Vai lie Asp Leu Asp Gly Gly Glu Gln Tyr Ala245 250 255
Lys
<210> 129<211> 747<212> DNA<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 129
atgcccaaag tcatgctcgt taccggcggc agccgtggca tcggcgccgc cgtcgccaag 60
ctggccgcgc gccgcggcta cgcggtcggc atcaactacc gcacccattc cgacgccgcc 120
gacgccgtcg tggccgaaat ccagcaggcg ggcggcaccg cgctggccat ccaggccgac 180
gtgtcgcagg aagacgatgt gctgcacatg ttccgcacgc tggacgagcg cctgggccgc 240
atcgacgcgc tggtcaataa cgccggcatc ctggaaacgc agatgcgcct ggaccagatg 3 00
gaagccgacc gcctgctgcg cgtgctgtcc accaacgtca tcggcgcttt cctatgtgcg 360
cgcgaagccg tgcgcaggat gtcgacgcgc catggcggcg tgggcggcgc catcgtcaac 420
gtgtcttcgg cggcggcgcg cctgggctcg cccaatgaat acgtggatta cgcggcctcc . 480
aagggcgcgc tggacacgat gaccatcggc ctgtcgaaag aggtggcgcc cgaaggtatc 540
cgcgtgaatg gcgtgcgccc cggcaccatc tacaccgaca tgcacgcaag cggcggcgag 600
ccgggccggg tggatcgcct gaaaagcgtg atcccgctgc ggcgcggcgg ctcggtggaa 660
gaagtggcgg gcgccgtcat gtggctgttt tccgaagaag ccggctatac cagcggttcg 720
ttcatcgacg tgtccggcgg tagttga 747
<210> 130
<211> 248
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (3) . . . (176)
<223> desidrogenase de cadeira curta<220>
<221> SÍTIO
<222> (142)...(145)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (146)...(174)
<223> Short-chain dehydrogenases/reductases family signature. Pró-sitio idPS00061
<400> 130
Met Pro Lys Vai Met Leu Vai Thr Gly Gly Ser Arg Gly lie Gly Ala15 10 15
Ala Vai Ala Lys Leu Ala Ala Arg Arg Gly Tyr Ala Vai Gly lie Asn20 25 30
Tyr Arg Thr His Ser Asp Ala Ala Asp Ala Vai Vai Ala Glu lie Gln35 40 45Gln Ala Gly Gly Thr Ala Leu Ala lie Gln Ala Asp Vai Ser Gln Glu50 55 60
Asp Asp Vai Leu His Met Phe Arg Thr Leu Asp Glu Arg Leu Gly Arg65 70 75 80
lie Asp Ala Leu Vai Asn Asn Ala Gly lie Leu Glu Thr Gln Met Arg85 90 95
Leu Asp Gln Met Glu Ala Asp Arg Leu Leu Arg Vai Leu Ser Thr Asn100 105 110
Vai lie Gly Ala Phe Leu Cys Ala Arg Glu Ala Vai Arg Arg Met Ser115 120 125
Thr Arg His Gly Gly Vai Gly Gly Ala lie Vai Asn Vai Ser Ser Ala130 135 140
Ala Ala Arg Leu Gly Ser Pro Asn Glu Tyr Vai Asp Tyr Ala Ala Ser145 150 155 160
Lys Gly Ala Leu Asp Thr Met Thr lie Gly Leu Ser Lys Glu Vai Ala165 170 175
Pro Glu Gly lie Arg Vai Asn Gly Vai Arg Pro Gly Thr lie Tyr Thr180 185 190
Asp Met His Ala Ser Gly Gly Glu Pro Gly Arg Vai Asp Arg Leu Lys195 200 205
Ser Vai lie Pro Leu Arg Arg Gly Gly Ser Vai Glu Glu Vai Ala Gly210 215 220
Ala Vai Met Trp Leu Phe Ser Glu Glu Ala Gly Tyr Thr Ser Gly Ser225 230 235 240
Phe lie Asp Vai Ser Gly Gly Ser245
<210> 131<211> 1041<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental
<400> 131
gtggaaacct attttcccct gcaccgcggg atcaacatga gccactggct ttcgcaagtg
aatgaaaaca ttcccgaccg ttccacctat gtgacggagc gggacctgca atttttgcgggcagcgggct tcgaccatgt gcgtctgccg atcgatgaga tcgaactctg ggatgaggag 180
ggccatcaga tcgaggaggc ctggcaatac atgcacaact ttatgcgctg gagccgaaag 240
aatgacctcc gggttattct cgacctgcac acggtattgt cccaccactt caacgcgatc 300
aacatgggag aggtcaacac cctctttaat gatcccaagg aacaggaaaa attcctcaat 360
ctctgggagc aaatcatgga tgccgtaggg caccacccca acgagtttct cgcttatgaa 420
atgctcaatg aggcggtcgc ggaagatgat gaagactgga acctgctcct caaccgtgcg 480
attgaacgca tccgggaacg tgagccgcat cgcgttctga ttgccggggc caactggtgg 540
cagcatgccg cccgcgttcc caacctgagg cttccccctg gtgatcccaa catcatcatc 600
agttttcact tttactcacc ctttctcttc acgcactatc gcagcagctg gactgccatg 660
cgggcatacc agggtttcgt ccaatacccc ggcattacca ttcccgccat ccatctcgaa 720
ggaatgaact atccggagtc ctttgtccaa atgtgggaag agcacaatca gtattacgac 780
atccattcaa tgtatgccga aatggtcccg gcggtgcgtt ttgccgaaaa gctgggcctt 840
cggctctatt gcggcgaatt tggagccatg aagaccgttg atcgtgccca aatgctgcag 900
tggtatcggg atgtggtcag agtctttgaa atgttggaca ttccctacac tgcctgggat 960
tatcagggaa cctttggaat ccgcgatgag ctgaccggtg agcctgatca tgaactgatc 1020
gacattctcc tcggccgcta a 1041
<210> 132<211> 346<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (14)...(325)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO<222> (12) . . . (15)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 132
Met Glu Thr Tyr Phe Pro Leu His Arg Gly lie Asn Met Ser His Trp15 10 15
Leu Ser Gln Vai Asn Glu Asn lie Pro Asp Arg Ser Thr Tyr Vai Thr20 25 30
Glu Arg Asp Leu Gln Phe Leu Arg Ala Ala Gly Phe Asp His Vai Arg35 40 45
Leu Pro lie Asp Glu lie Glu Leu Trp Asp Glu Glu Gly His Gln lie50 55 60Glu Glu Ala Trp Gln Tyr Met His Asn Phe Met Arg Trp Ser Arg Lys65 70 75 80
Asn Asp Leu Arg Vai lie Leu Asp Leu His Thr Vai Leu Ser His His85 90 95
Phe Asn Ala lie Asn Met Gly Glu Vai Asn Thr Leu Phe Asn Asp Pro100 105 110
Lys Glu Gln Glu Lys Phe Leu Asn Leu Trp Glu Gln lie Met Asp Ala115 120 125
Vai Gly His His Pro Asn Glu Phe Leu Ala Tyr Glu Met Leu Asn Glu130 135 140
Ala Vai Ala Glu Asp Asp Glu Asp Trp Asn Leu Leu Leu Asn Arg Ala145 150 155 160
lie Glu Arg lie Arg Glu Arg Glu Pro His Arg Vai Leu lie Ala Gly165 170 175
Ala Asn Trp Trp Gln His Ala Ala Arg Vai Pro Asn Leu Arg Leu Pro180 185 190
Pro Gly Asp Pro Asn lie lie lie Ser Phe His Phe Tyr Ser Pro Phe195 200 205
Leu Phe Thr His Tyr Arg Ser Ser Trp Thr Ala Met Arg Ala Tyr Gln210 215 220
Gly Phe Vai Gln Tyr Pro Gly lie Thr lie Pro Ala lie His Leu Glu225 230 235 240
Gly Met Asn Tyr Pro Glu Ser Phe Vai Gln Met Trp Glu Glu His Asn245 250 255
Gln Tyr Tyr Asp.Ile His Ser Met Tyr Ala Glu Met Vai Pro Ala Vai260 265 270
Arg Phe Ala Glu Lys Leu Gly Leu Arg Leu Tyr Cys Gly Glu Phe Gly275 280 285
Ala Met Lys Thr Vai Asp Arg Ala Gln Met Leu Gln Trp Tyr Arg Asp290 295 300
Vai Vai Arg Vai Phe Glu Met Leu Asp lie Pro Tyr Thr Ala Trp Asp305 310 315 320
Tyr Gln Gly Thr Phe Gly lie Arg Asp Glu Leu Thr Gly Glu Pro Asp325 330 335His Glu Leu lie Asp lie Leu Leu Gly Arg340 345
<210> 133
<211> 1377
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 133
atgacacaac tggcttttcc atctaacttc atctggggaa cagctacttc cgcttaccaa 60
atcgaaggcg cctggaacgc agacggcaag ggcgaatcta tttgggatcg cttttcccat 120
acgcagggga agatcattga cggcagcaac ggcgatgtgg cctgcgatca ctaccaccgc 180
tggcgcgagg acgtggccct catgagagac ttgggtatgc aggcatatcg cttctccatc 240
tcctggccac gcatcctgcc caccggtcat ggacagatca atcaggctgg gctggacttt 300
tacaatcgcc tggtggacgg gttgctggaa gctggcatca agccctttgc caccctctac 360
cactgggacc tgccgctggc gctacaggct gacggcggct ggccggagcg ctccacggcc 420
aaggcctttg tcgaatacgc cgacgtggtc agccgcgcgc tgggcgatcg ggtgaagagc 480
tggatcaccc ataacgaacc gtggtgcatc agcatgctga gccatcaaat tggggagcat 540
gcgcccggct ggcgggactg gcaggctgcg ttggcggccg cgcaccacgt cctcctttcg 600
catggttggg ccgtgccgga actgcgtcgc aacagccgcg atgcagaaat cggcatcacg 660
ttgaacttta ccccggcgga gccagcttcg aacagcgcag ccgatttcaa ggcctatcgc 720
cagttcgatg gctacttcaa ccgctggttc ctggacccgc tctatggccg ccactatccg 780
gcagatatgg tgcacgatta catcgcgcaa ggctacctgc catcacaggg tttgactttc 840
gtggaagctg gtgacctgga cgcgatcgcg acgcgcaccg atttcctggg tgtgaactat 900
tacacgcgcg aagtggtccg tagccaggaa atcccagaga gtgagaacgc gccgcgcaca 960
gtcttgcgcg cgccacagga agagtggaca gagatgggct gggaagtgta tcctgagggc 1020
ctctacaggt .tgctcaatcg gttgcacttt gaataccagc cgcgcaagct ctacgtgacc 1080
gagagcggtt gcagctactc cgatggaccc ggccccaacg gtcggatacc ggaccaacgc 1140
cgtatcaact acctgcgcga tcacttcgca gcggcgcatc aggcgataca atgcggcgtc 1200
ccgctggccg gctacttcgt ctggtcgttc atggacaact tcgagtgggc caaagggtac 1260
acccaacgtt ttggtatcgt atgggtggat tatcaatcgc aacgacggat accgaaagac 1320
agcgcctact ggtatcgcga tgtcgtcgcc gccaacgcgg tgcaagttcc tgattag 1377
<210> 134<211> 458<212> PRT< 213 > Desconhec ido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (2) .. . (454)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (10)...(24)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<400> 134
Met Thr Gln Leu Ala Phe Pro Ser Asn Phe lie Trp Gly Thr Ala Thr15 10 15
Ser Ala Tyr Gln lie Glu Gly Ala Trp Asn Ala Asp Gly Lys Gly Glu20 25 30
Ser lie Trp Asp Arg Phe Ser His Thr Gln Gly Lys lie lie Asp Gly35 40 45
Ser Asn Gly Asp Vai Ala Cys Asp His Tyr His Arg Trp Arg Glu Asp50 55 60
Vai Ala Leu Met Arg Asp Leu Gly Met Gln Ala Tyr Arg Phe Ser lie65 70 75 80
Ser Trp Pro Arg lie Leu Pro Thr Gly His Gly Gln lie Asn Gln Ala85 90 95
Gly Leu Asp Phe Tyr Asn Arg Leu Vai Asp Gly Leu Leu Glu Ala Gly100 105 110
lie Lys Pro Phe Ala Thr Leu Tyr His Trp Asp Leu Pro Leu Ala Leu115 120 125
Gln Ala Asp Gly Gly Trp Pro Glu Arg Ser Thr Ala Lys Ala Phe Vai130 135 140
Glu Tyr Ala Asp Vai Vai Ser Arg Ala Leu Gly Asp Arg Vai Lys Ser145 150 155 160
Trp lie Thr His Asn Glu Pro Trp Cys lie Ser Met Leu Ser His Gln165 170 175
lie Gly Glu His Ala Pro Gly Trp Arg Asp Trp Gln Ala Ala Leu Ala180 185 190
Ala Ala His His Vai Leu Leu Ser His Gly Trp Ala Vai Pro Glu Leu195 200 205
Arg Arg Asn Ser Arg Asp Ala Glu lie Gly lie Thr Leu Asn Phe Thr210 215 220Pro Ala Glu Pro Ala Ser Asn Ser Ala Ala Asp Phe Lys Ala Tyr Arg225 230 235 240
Gln Phe Asp Gly Tyr Phe Asn Arg Trp Phe Leu Asp Pro Leu Tyr Gly245 250 255
Arg His Tyr Pro Ala Asp Met Vai His Asp Tyr lie Ala Gln Gly Tyr260 265 270
Leu Pro Ser Gln Gly Leu Thr Phe Vai Glu Ala Gly Asp Leu Asp Ala275 280 285
lie Ala Thr Arg Thr Asp Phe Leu Gly Vai Asn Tyr Tyr Thr Arg Glu290 295 300
Vai Vai Arg Ser Gln Glu lie Pro Glu Ser Glu Asn Ala Pro Arg Thr305 310 315 320
Vai Leu Arg Ala Pro Gln Glu Glu Trp Thr Glu Met Gly Trp Glu Vai325 330 335
Tyr Pro Glu Gly Leu Tyr Arg Leu Leu Asn Arg Leu His Phe Glu Tyr340 345 350
Gln Pro Arg Lys Leu Tyr Vai Thr Glu Ser Gly Cys Ser Tyr Ser Asp355 360 365
Gly Pro Gly Pro Asn Gly Arg lie Pro Asp Gln Arg Arg lie Asn Tyr.370 375 380
Leu Arg Asp His Phe Ala Ala Ala His Gln Ala lie Gln Cys Gly Vai385 390 395 400
Pro Leu Ala Gly Tyr Phe Vai Trp Ser Phe Met Asp Asn Phe Glu Trp405 410 415
Ala Lys Gly Tyr Thr Gln Arg Phe Gly lie Vai Trp Vai Asp Tyr Gln420 425 430
Ser Gln Arg Arg lie Pro Lys Asp Ser Ala Tyr Trp Tyr Arg Asp Vai435 440 445
Vai Ala Ala Asn Ala Vai Gln Vai Pro Asp450 455
<210> 135<211> 987<212> DNA<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 135
atggttgagc ctgccgatca gagtcatttt tcagatgctt ttcaggtaaa tcgcactctt 60
ggaaaaggca tcaatcttgg taacacactg gaggctccaa atgaaggcga gtggggattg 120
acaattcgcg aggagtattt tgatgaagtg aaacaagccg gatttgaatc cgtgcgtatt 180
ccgatacgat ggaatgctca tgctctggaa ggttttccat atacgataga tgaatctttt 240
tttgaccggg ttgatgaagt tattggctgg gcttttgatc gtgatcttgc agtcatgatt 300
aacattcatc actacaacga attgatggag cagccacagg atcaccggga tcgctttttg 3 60
aaactttggg agcaaattgc tgcgcactat aaagagtacc cggaagaact ggtattcgag 420
attttaaacg aaccccacga taatctgacc ccggctatct ggaatagctt tttggctgat 480
gctctcggta ttatacgcca aaccaatcca ggaagggtta ttgcagtcgg aacagctgaa 540
tggggcggtt tcgggagttt gcaggatctt gagctgcctg ataatgaccg ccagataatc 600
accaccgttc attaçtataa cccatttcat ttcacgcatc agggggcaga ttgggttgga 660
gatgaagcgg atcagtggct tggaaccgaa tgggatggag cagatcatga aaaagctgaa 72 0
gttgacagcg attttgactc tgtggaacag tgggcccgaa atcatgaccg gccaatacac 780
gtgggagagt tcggagcttt cagcgccgca gatgatttgt cacgtgaaca gtggacggca 840
tacgtacgtg agtcttcgga gaaccggcag tttagctggg cgtattggga gtttgggtca 900
gggttcggtg cctatgatcc cggttccgga gaatggcgtg aatatttact ccgggcgtta 960
atccccgaca gtccggtgat tgattaa 987
<210> 136<211> 328<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (27)...(306)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO<222> (17) . . .(20)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (139)...(148)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659<400> 136
Met Vai Glu Pro Ala Asp Gln Ser His Phe Ser Asp Ala Phe Gln Vai1 5 10 15
Asn Arg Thr Leu Gly Lys Gly lie Asn Leu Gly Asn Thr Leu Glu Ala20 25 30
Pro Asn Glu Gly Glu Trp Gly Leu Thr lie Arg Glu Glu Tyr Phe Asp35 40 45
Glu Vai Lys Gln Ala Gly Phe Glu Ser Vai Arg lie Pro lie Arg Trp50 55 60
Asn Ala His Ala Leu Glu Gly Phe Pro Tyr Thr lie Asp Glu Ser Phe65 70 75 80
Phe Asp Arg Vai Asp Glu Vai lie Gly Trp Ala Phe Asp Arg Asp Leu85 90 95
Ala Vai Met lie Asn lie His His Tyr Asn Glu Leu Met Glu Gln Pro100 105 110
Gln Asp His Arg Asp Arg Phe Leu Lys Leu Trp Glu Gln lie Ala Ala115 120 125
His Tyr Lys Glu Tyr Pro Glu Glu Leu Vai Phe Glu lie Leu Asn Glu130 135 140
Pro His Asp Asn Leu Thr Pro Ala lie Trp Asn Ser Phe Leu Ala Asp145 150 155 160
Ala Leu Gly lie lie Arg Gln Thr Asn Pro Gly Arg Vai lie Ala Vai165 170 175
Gly Thr Ala Glu Trp Gly Gly Phe Gly Ser Leu Gln Asp Leu Glu Leu180 185 190
Pro Asp Asn Asp Arg Gln lie lie Thr Thr Vai His Tyr Tyr Asn Pro195 200 205
Phe His Phe Thr His Gln Gly Ala Asp Trp Vai Gly Asp Glu Ala Asp210 r 215 220
Gln Trp Leu Gly Thr Glu Trp Asp Gly Ala Asp His Glu Lys Ala Glu225 230 235 240
Vai Asp Ser Asp Phe Asp Ser Vai Glu Gln Trp Ala Arg Asn His Asp245 250 255
Arg Pro lie His Vai Gly Glu Phe Gly Ala Phe Ser Ala Ala Asp Asp260 265 270
Leu Ser Arg Glu Gln Trp Thr Ala Tyr Vai Arg Glu Ser Ser Glu Asn275 280 285Àrg Gln Phe Ser Trp Ala Tyr Trp Glu Phe Gly Ser Gly Phe Gly Ala290 295 300
Tyr Asp Pro Gly Ser Gly Glu Trp Arg Glu Tyr Leu Leu Arg Ala Leu305 310 315 320
lie Pro Asp Ser Pro Vai lie Asp325
<210> 137<211> 702<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 137
atgagccacc gatcgcagga attcaacggc cagccactga tggtgtccga agacggccac 60
ttcgtgctcg gattcgggcg cgacgacgag gccacccacc gactgcgcgt tcagctaccg 120
gatgagcgag tctgggagaa gaatctgcgt ccggaatcgc gcgagttcga tattcagcgg 180
atcgacggct tgccgcaaga ccaggtcacc ccaccccact ccgtgctggc gagaatccga 240
gaggacgctt cgctgtcgcg ccgtgcccgc gaacgacgcg atccgcggac cgactggacc 300
gatggctgga tctggccggc cgagggccgc atttccggcg tgtacggcag ccagcgcatc 360
ctcaacggtg agcctcgcaa cccgcactgg gggctggata tcgccgcgcc aaccggcagc 420
ccggtcgtgg cgcctgccgg cggcatcgtc agcctgactc atccggacat gtatttttcc 480
ggcggcaccc tgttaatcga ccacggtcac ggcctggtgt ctgcgttcct ccacctgagt 540
gaaatcctgg tcgaggaagg gcagcgggtc gagcaggggg atctgatcgc acgcattggc 600
gccaccggtc gtgccaccgg gccgcacctg gactggcgga tcaatctcgg cgatgtacgc 660
gtggacccac agctgctgct gccgccgatg gacgcgcagt ga 702
<210> 138<211> 233<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO
<222> (127) . . . (223)
<223> Família peptidase M23
<400> 138
Met Ser His Arg Ser Gln Glu Phe Asn Gly Gln Pro Leu Met Vai Ser15 10 15
Glu Asp Gly His Phe Vai Leu Gly Phe Gly Arg Asp Asp Glu Ala Thr20 25 30His Arg Leu Arg Vai Gln Leu Pro Asp Glu Arg Vai Trp Glu Lys Asn35 40 45
Leu Arg Pro Glu Ser Arg Glu Phe Asp lie Gln Arg lie Asp Gly Leu50 55 60
Pro Gln Asp Gln Vai Thr Pro Pro His Ser Vai Leu Ala Arg lie Arg65 70 75 80
Glu Asp Ala Ser Leu Ser Arg Arg Ala Arg Glu Arg Arg Asp Pro Arg85 90 95
Thr Asp Trp Thr Asp Gly Trp lie Trp Pro Ala Glu Gly Arg lie Ser100 105 110
Gly Vai Tyr Gly Ser.Gln Arg lie Leu Asn Gly Glu Pro Arg Asn Pro115 120 125
His Trp Gly Leu Asp lie Ala Ala Pro Thr Gly Ser Pro Vai Vai Ala130 135 140
Pro Ala Gly Gly lie Vai Ser Leu Thr His Pro Asp Met Tyr Phe Ser145 150 155 160
Gly Gly Thr Leu Leu lie Asp His Gly His Gly Leu Vai Ser Ala Phe165 170 175
Leu His Leu Ser Glu lie Leu Vai Glu Glu Gly Gln Arg Vai Glu Gln180 185 190
Gly Asp Leu lie Ala Arg lie Gly Ala Thr Gly Arg Ala Thr Gly Pro195 200 205
His Leu Asp Trp Arg lie Asn Leu Gly Asp Vai Arg Vai Asp Pro Gln210 215 220
Leu Leu Leu Pro Pro Met Asp Ala Gln225 230
<210> 139<211> 351<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 139
atggaaaaaa ttctcgttat cggatgcgcg ggccagatag gctcagagct tacgctcgaa 60cttcgtaaga tttatggtga tgacaatgtg gtggctactg acattaagcc ggccagcaag 120gaaattaccg agggcggccc ctttgaaatt cttgatgtgc tcgacaccca ccggcttttt 180ggcactgtaa gccgcaacaa gatcacccag atttatcacc ttgcagccat cctttcgggc 240
aatgccgaga aaaaaccact tgcaagctgg cacattaaca tggagagttt gctcaacgtg 300
cttgaactgg cccgtgaact gaagcttcat aaaattttct ggccaagctc a 351
<210> 140<211> 117<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 140
Met Glu Lys lie Leu Vai lie Gly Cys Ala Gly Gln lie Gly Ser Glu15 10 15
Leu Thr Leu Glu Leu Arg Lys lie Tyr Gly Asp Asp Asn Vai Vai Ala20 25 30
Thr Asp lie Lys Pro Ala Ser Lys Glu lie Thr Glu Gly Gly Pro PVie35 40 45
Glu lie Leu Asp Vai Leu Asp Thr His Arg Leu Phe Gly Thr Vai Ser50 55 60
Arg Asn Lys lie Thr Gln lie Tyr His Leu Ala Ala lie Leu Ser Gly65 70 75 80
Asn Ala Glu Lys Lys Pro Leu Ala Ser Trp His lie Asn Met Glu Ser85 90 95
Leu Leu Asn Vai Leu Glu Leu Ala Arg Glu Leu Lys Leu His Lys lie100 105 110
Phe Trp Pro Ser Ser115
<210> 141<211> 1350<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 141
atgctgtcct atacgagtcc gttcccaaag aactttgtct ggggtgtggc gacggcggcg 60ccgcagatcg agggcgctgc gcgagaagac ggaaagggcg aatcgatatg ggatcgcttt 120tgccgcgtgc ccggaaaggt ccacaatggc gatactctcg atgttgcgtg cgaccactac 180caccggttcc gggaggattt cgcgctcatg cgagacttgg gcgtgcgcca ctaccggctt 240tcgcttgcct ggccccgcat attcccggac ggcgacggcg cattgaacca gcgcggagtg 300gatttctacc accggctctt tgaggccatg atcgagcacg ggattacgcc ttgggtgacg 360ctctttcact gggatttgcc gcaggcgctc gaggaccgcg gcggctggtg tgagcgtctc 420
accgtcgatg cattcgggcg ctacgctgac accgtggtga aggcgtttgg cgatcgcgtg 480
aagaattgga tcaccctgaa cgaaatccgc tgcttcacgt tgctcgctta cgatctctgc 540
atcaaggccc cgggccgcaa ggtctcgcgg gcgcagctca accagaccta tcatcacgcg 600
ctgatctgcc atgggcatgg cgtccgggcg gtccgcgaac acggcgggcg aggcgctcgc 660
gtcgggctta ccgacaacag cgacgtatgc gtgcccgtca ccgagaccgc gcccgacatc 720
attgcggcca gatcctggta tgcgtcgcga aatattcatc tgctcgatcc gatctatcgc 780
ggcgagtatg cgccggaata cctcgaacgc tgcggtgcgg acgcgcccca ggtggccgag 840
gacgatttcg cgctgatttc aatgccgacg gattttctcg ggctgaatgt atatacggcg 900
acctttgtgc gtgccgacgc ggagggcagg ccggaggaga ttaaactgcc gcggaattac 960
ccgcgcgcgg atagcgcgtg gttgaatatt gtgccccagt cgatgtactg ggccacacgg 1020
ctggcgcggg aaacctacgg cgtgagatca atctacatca ccgaaaacgg ctgcggctac 1080
gacgacgagc ccgtcgacgg cggcgaggtg ctcgacctgc atcgacgcga ttttctgcgc 1140
aaccaccttc gggaattgca tcgcgccata ggcgacggcg tgcccgttga cgggtatttt 1200
ctctggtcçt tcatggacaa ctacgagtgg gaggacgggt atgcgcggcg gttcggcatc 1260
gttcacgtcg acttcgaaag ccagaaacgg actccaaaac tctcggcgcg ctattacgcg 1320
caggtaatga aagaaaaccg gatcctgtga 1350
<210> 142<211> 449<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (4)...(448)
<223> Família glicosil hidrolase 1<400> 142 ,
Met Leu Ser Tyr Thr Ser Pro Phe Pro Lys Asn Phe Vai Trp Gly Vai15 10 15
Ala Thr Ala Ala Pro Gln lie Glu Gly Ala Ala Arg Glu Asp Gly Lys20 25 30
Gly Glu Ser lie Trp Asp Arg Phe Cys Arg Vai Pro Gly Lys Vai His35 40 45
Asn Gly Asp Thr Leu Asp Vai Ala Cys Asp His Tyr His Arg Phe Arg50 55 60
Glu Asp Phe Ala Leu Met Arg Asp Leu Gly Vai Arg His Tyr Arg Leu65 70 75 80Ser Leu Ala Trp Pro Arg He Phe Pro Asp Gly Asp Gly Ala Leu Asn85 90 95
Gln Arg Gly Vai Asp Phe Tyr His Arg Leu Phe Glu Ala Met He Glu100 105 110
His Gly He Thr Pro Trp Vai Thr Leu Phe His Trp Asp Leu Pro Gln115 120 125
Ala Leu Glu Asp Arg Gly Gly Trp Cys Glu Arg Leu Thr Vai Asp Ala130 135 140
Phe Gly Arg Tyr Ala Asp Thr Vai Vai Lys Ala Phe Gly Asp Arg Vai145 150 155 160
Lys Asn Trp He Thr Leu Asn Glu He Arg Cys Phe Thr Leu Leu Ala165 170 175
Tyr Asp Leu Cys He Lys Ala Pro Gly Arg Lys Vai Ser Arg Ala Gln180 185 190
Leu Asn Gln Thr Tyr His His Ala Leu He Cys His Gly His Gly Vai195 200 205
Arg Ala Vai Arg Glu His Gly Gly Arg Gly Ala Arg Vai Gly Leu Thr210 215 220
Asp Asn Ser Asp Vai Cys Vai Pro Vai Thr Glu Thr Ala Pro Asp He225 230 235 240
He Ala Ala Arg Ser Trp Tyr Ala Ser Arg Asn He His Leu Leu Asp245 250 255
Pro He Tyr Arg Gly Glu Tyr Ala Pro Glu Tyr Leu Glu Arg Cys Gly260 265 270
Ala Asp Ala Pro Gln Vai Ala Glu Asp Asp Phe Ala Leu He Ser Met275 280 285
Pro Thr Asp Phe Leu Gly Leu Asn Vai Tyr Thr Ala Thr Phe Vai Arg290 295 300
Ala Asp Ala Glu Gly Arg Pro Glu Glu He Lys Leu Pro Arg Asn Tyr305 310 315 320
Pro Arg Ala Asp Ser Ala Trp Leu Asn He Vai Pro Gln Ser Met Tyr325 330 335
Trp Ala Thr Arg Leu Ala Arg Glu Thr Tyr Gly Vai Arg Ser He Tyr340 345 350
lie Thr Glu. Asn Gly Cys Gly Tyr Asp Asp Glu Pro Vai Asp Gly Gly355 360 365
Glu Vai Leu Asp Leu His Arg Arg Asp Phe Leu Arg Asn His Leu Arg370 375 380
Glu Leu His Arg Ala lie Gly Asp Gly Vai Pro Vai Asp Gly Tyr Phe385 390 395 400
Leu Trp Ser.Phe Met Asp Asn Tyr Glu Trp Glu Asp Gly Tyr Ala Arg405 410 415
Arg Phe Gly lie Vai His Vai Asp Phe Glu Ser Gln Lys Arg Thr Pro420 425 430
Lys Leu Ser Ala Arg Tyr Tyr Ala Gln Vai Met Lys Glu Asn Arg lie435 440 445
Leu
<210> 143
<211> 1188
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 143
atgaccatca ccttccccga cgggttctgg tgggggacgg cgacggccgc ccaccaggtg 60
gagggcggca actggaacac cgactggtgg gcctacgagc acgccccggg cacccgctgc 120
gcggagccgt ccggcgatgc gtgcgaccac tggcaccgct acccggagga catcgccctc 180
ctcgccgcgc tcgggttcag tgcctaccgc ttctcggtgg aatgggctcg catcgagccc 240
gaggaagggc atttctcccg cgccaccctc gaccactacc ggcgcatgat cgcctgctgc 300
cgcgaccacg ggctggcccc ggtggtgacc ttccaccact tcaccacccc ccgctgggcc 3 60
gcggccgggg gctgctggtc cgacccggtc accgccgagc gcttcgcccg ttactgcgag 420
cgcaccgtgg ccgccctcgg cgacgagatc gcgatggcct gcacgatcaa cgagccgaac 480
atcgtggcca ccctcgggta cttcctcggc gagttcccgc cggccgtcgc cgaccccgac 540
cgctaccggc aggcgaacga cacgctgatc cgcgcccatc gcctcgccta cgaggcgctg 600
aaggccgggc ccggcgagtt ccccgtcggc ctcaccctgt cgatggccga gttcgtcgcc 660
gagcccggcg gcgaggccca cctcgcccag gtccggcaca cgatggagga catcttcctg 720
gaggccgccc ggggcgacga cttcatcggg gtgcagacct acagccgcat gcgcttcggt 780
cccgactcgc cgatcccgct cgggccggcc gagggcgtcg aggtcgtcca gatggggtac 840gagtactggc cgtgggcgct cgaggcgacg atccggcgcg ccgccgaggt caccggcacg 900
gcggtccacg tcaccgagaa cggcatcggg accgccgacg acacgcagcg ggtcgcctac 960
gtcaccgagg ccctccgggg gctgcggcgc tgcctcgacg acggcatcga cgtccgcagc 1020
tacttctact ggacgctgct cgacaacttc gagtggacgc gcggctacgt gccgacgttc 1080
gggctcgtcg ccgtcgaccg caccacccag cgccggtcgg tgaagccgag cgcggtgtgg 1140
ctcggcgagg tcgcccgcac gaaccgcctc gagctcccgg accgctga 1188
<210> 144
<211> 395
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (1)...(390)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<222> (9)...(23)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio idPS00653
<220>
<221> SÍTIO
<222> (188)...(191)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 144
Met Thr Ile Thr Phe Pro Asp Gly Phe Trp Trp Gly Thr Ala Thr Ala15 10 15
Ala His Gln Vai Glu Gly Gly Asn Trp Asn Thr Asp Trp Trp Ala Tyr20 25 30
Glu His Ala Pro Gly Thr Arg Cys Ala Glu Pro Ser Gly Asp Ala Cys35 40 45
Asp His Trp His Arg Tyr Pro Glu Asp Ile Ala Leu Leu Ala Ala Leu50 55 60
Gly Phe Ser Ala Tyr Arg Phe Ser Vai Glu Trp Ala Arg Ile Glu Pro65 70 75 80
Glu Glu Gly His Phe Ser Arg Ala Thr Leu Asp His Tyr Arg Arg Met85 90 95
Ile Ala Cys Cys Arg Asp His Gly Leu Ala Pro Vai Vai Thr Phe His100 105 110
His Phe Thr Thr Pro Arg Trp Ala Ala Ala Gly Gly Cys Trp Ser Asp115 120 125
Pro Vai Thr. Ala Glu Arg Phe Ala Arg Tyr Cys Glu Arg Thr Vai Ala130 135 140
Ala Leu Gly Asp Glu lie Ala Met Ala Cys Thr lie Asn Glu Pro Asn145 150 155 160
lie Vai Ala Thr Leu Gly Tyr Phe Leu Gly Glu Phe Pro Pro Ala Vai165 170 175
Ala Asp Pro Asp Arg Tyr Arg Gln Ala Asn Asp Thr Leu lie Arg Ala180 185 190
His Arg Leu Ala Tyr Glu Ala Leu Lys Ala Gly Pro Gly Glu Phe Pro195 200 205
Vai Gly Leu Thr Leu Ser Met Ala Glu Phe Vai Ala Glu Pro Gly Gly210 215 220
Glu Ala His Leu Ala Gln Vai Arg His Thr Met Glu Asp lie Phe Leu225 230 235 240
Glu Ala Ala Arg Gly Asp Asp Phe lie Gly Vai Gln Thr Tyr Ser Arg245 250 255
Met Arg Phe Gly Pro Asp Ser Pro lie Pro Leu Gly Pro Ala Glu Gly260 265 270
Vai Glu Vai Vai Gln Met Gly Tyr Glu Tyr Trp Pro Trp Ala Leu Glu275 280 285
Ala Thr lie Arg Arg Ala Ala Glu Vai Thr Gly Thr Ala Vai His Vai290 295 300
Thr Glu Asn Gly lie Gly Thr Ala Asp Asp Thr Gln Arg Vai Ala Tyr305 , 310 315 320
Vai Thr Glu Ala Leu Arg Gly Leu Arg Arg Cys Leu Asp Asp Gly lie325 330 335
Asp Vai Arg Ser Tyr Phe Tyr Trp Thr Leu Leu Asp Asn Phe Glu Trp340 345 350
Thr Arg Gly Tyr Vai Pro Thr Phe Gly Leu Vai Ala Vai Asp Arg Thr355 360 365
Thr Gln Arg Arg Ser Vai Lys Pro Ser Ala Vai Trp Leu Gly Glu Vai370 375 380Ala Arg Thr Asn Arg Leu Glu Leu Pro Asp Arg
<210> 145
<211> 1386
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 145
atgtcgtttc cgagaaattt cctgtgggga tcagccacct cctcctacca aatcgaaggc 60
gcctggcaag aagacggcaa aggcccaaat atctgggacg tgttttcaca caccccgggg 120
aaagtcgcca atggcgacac cggtgatatc gccatcgacc actaccaccg ataccgagac 180
gacgttgccc tgatggctga gcttggactt caggcatacc gtttctcgtt ctcctgggcc 240
agaataatgc cggaaggagc aggccccatc gagcaacggg gtctggactt ctacgaccgc 300
ctcattgatg cactgctgga gaaaaacatc caacccatgg ccaccctcta ccactgggat 3 60
ttaccagccg cactgcaaga cagagggggg tggactaacc gcgacagcgc gtcctggttt 420
gctgactact cagccgttgt tcacgacgct ttttctgacc gggtgggaat gtgggcaacg 480
ttgaacgagc cgtgggtgtc tgcatttttg ggccacggaa ctggcatcca cgcacctggc 540
« atcacaagcc cccacgcggc gttcgccgcg gggcatcacc tgcttctggg gcatggcaag 600
gccatccaag cgatgcgcgc tcaatcgtct agcacccaac tgggaattgt tttgaacctc 660
gcccccgtgt atctcgaagg tgacacccct gctgaccacc cggctcacac ctccgtggca 720
ctacacgatg ccattttgaa tgggttgtgg acagagccgc ttctgcgctc cagatacccc 780
gacctgcttc ttcaactagg cgacatggtg acaaaaaaca tccacgacgg tgacctcgcc 840
atcatggccg agccgattga ctggatgggc atcaactact accaggacat tagatttgtg 900
gccactgatg ttgcccccac ggctaacccg atggcccctc cgggtaacga cctgccgggc 960
accgtcgggg tggagcctgc gccagcaatc ggaaacatca ccagctttgg ctggtccacc 1020
acccccgacg gactgcgagt actgttggtg ggcctggatg aggaatacga caacctcccg 1080
ccgatattca ttaccgaaaa cgggtgtgct tacgattacc ccgtcgagga cggtgtcgtc 1140
aacgacaccc ttcgtgtcac atacatgcga gaacacctca ccgcgttgtc gcaggccatt 1200
gaggcgggtg tgaatgtccg gggctatatg cactggtctc tgttcgacaa cttcgagtgg 1260
gccgaagggt atcgccaacg ctttggcatg gtgcacgtcg actttgagac cttggagcgg 1320
actcccaaag cctcagctca ctactattca cgtgtcatca caaataacgc cctctctgac 1380
gactga 1386
<210> 146<211> 461<212> PRT<213> Desconhecido
<220><223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (1) . .. (458)
<223> Família glicosil hidrolase 1<220>
<221> SÍTIO<2.22> (7) . . . (21)
<223> Assinatura N-terminal da família glicosil hidrolase 1. Pró-sítio id =PS00653
<220>
<221> SÍTIO
<222> (337)...(340)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (386) . . . (389)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 146
Met Ser Phe Pro Arg Asn Phe Leu Trp Gly Ser Ala Thr Ser Ser Tyr1 5 10 15
Gln lie Glu Gly Ala Trp Gln Glu Asp Gly Lys Gly Pro Asn lie Trp
20
25
30
Asp Vai Phe Ser His Thr Pro Gly Lys Vai Ala Asn Gly Asp Thr Gly35 40 45
Asp lie Ala lie Asp His Tyr His Arg Tyr Arg Asp Asp Vai Ala Leu50 55 60
Met Ala Glu Leu Gly Leu Gln Ala Tyr Arg Phe Ser Phe Ser Trp Ala65 70 75 80
Arg lie Met Pro Glu Gly Ala Gly Pro lie Glu Gln Arg Gly Leu Asp85 90 95
Phe Tyr Asp.
Arg Leu lie Asp Ala Leu Leu Glu Lys Asn lie Gln Pro100 105 110
Met Ala Thr115
Leu Tyr His Trp Asp Leu Pro Ala Ala Leu Gln Asp Arg120 125
Gly Gly Trp130
Thr Asn Arg Asp Ser Ala Ser Trp Phe Ala Asp Tyr Ser135 140
Ala Vai Vai145
His Asp Ala Phe Ser Asp Arg Vai Gly Met Trp Ala Thr150 155 160
Leu Asn Glu
Pro Trp Vai Ser Ala Phe Leu Gly His Gly Thr Gly lie165 170 175His Ala Pro Gly lie Thr Ser Pro His Ala Ala Phe Ala Ala Gly His180 185 190
His Leu Leu Leu Gly His Gly Lys Ala lie Gln Ala Met Arg Ala Gln195 200 205
Ser Ser Ser Thr Gln Leu Gly lie Vai Leu Asn Leu Ala Pro Vai Tyr210 215 220
Leu Glu Gly Asp Thr Pro Ala Asp His Pro Ala His Thr Ser Vai Ala225 230 235 240
Leu His Asp Ala lie Leu Asn Gly Leu Trp Thr Glu Pro Leu Leu Arg245 250 255
Ser Arg Tyr Pro Asp Leu Leu Leu Gln Leu Gly Asp Met Vai Thr Lys260 265 270
Asn lie His Asp Gly Asp Leu Ala lie Met Ala Glu Pro lie Asp Trp275 280 285
Met Gly lie Asn Tyr Tyr Gln Asp lie Arg Phe Vai Ala Thr Asp Vai290 295 300
Ala Pro Thr Ala Asn Pro Met Ala Pro Pro Gly Asn Asp Leu Pro Gly305 310 315 320
Thr Vai Gly Vai Glu Pro Ala Pro Ala lie Gly Asn lie Thr Ser Phe325 330 335
Gly Trp Ser Thr Thr Pro Asp Gly Leu Arg Vai Leu Leu Vai Gly Leu340 345 350
Asp Glu Glu Tyr Asp Asn Leu Pro Pro lie Phe lie Thr Glu Asn Gly355 360 365
Cys Ala Tyr Asp Tyr Pro Vai Glu Asp Gly Vai Vai Asn Asp Thr Leu370 375 380
Arg Vai Thr Tyr Met Arg Glu His Leu Thr Ala Leu Ser Gln Ala lie385 390 395 400
Glu Ala Gly Vai Asn Vai Arg. Gly Tyr Met His Trp Ser Leu Phe Asp405 410 415
Asn Phe Glu Trp Ala Glu Gly Tyr Arg Gln Arg Phe Gly Met Vai His420 425 430
Vai Asp Phe Glu Thr Leu Glu Arg Thr Pro Lys Ala Ser Ala His Tyr435 440 445Tyr Ser Arg Vai lie Thr Asn Asn Ala Leu Ser Asp Asp450 455 460
<210> 147
<211> 1242
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 147
atgctaaaag ttttacgtaa acctattatt tctggattag ctttagctct attattgccg 60
gcaggggcag ctggtgccga aactaatatt tcaaagaagc caaatâtaag tggattaacc 120
gcgccgcaat tagaccaaag atataaagat tctttcacca ttggtgctgc ggttgagccg 180
tatcaattat tagatgcaaa agattcacaa atgctaaagc ggcattttaa tagtatcgta 240
gcagagaatg tcatgaagcc tagtagttta cagccagtag aaggacaatt caactgggag 300
ccggctgata aacttgttca gtttgcgaag gaaaatggaa tggacatgcg aggtcatacg 3 60
cttgtctggc atagccaggt accggattgg ttctttgaag atgcggcagg aaatccaatg 420
gttgtttggg aaaatggcag gcaagtggtt gccgatccat caaagcttca ggaaaacaaa 480
gagctcttac ttagccgatt acaaaatcat attcaggcag tcgtaacgcg ttataaagat 540
gatataaaat cttgggatgt tgtcaatgaa gtaatcgatg aatggggcgg acattctgaa 600
gggctgcgtc aatctccatg gttcctcatc accggaacgg actatattaa agttgctttt 660
gaaactgcaa gagaatatgc agctccagac gctaagctgt atatcaatga ttacaataca 720
gaagtagaac caaaaaggac gcacctttat aacttagtaa aaagtttaaa agaagaacag 780
aacgttccga ttgatggtgt tgggcatcag tctcacattc aaattggctg gccttcagaa 840
aaagaaattg aagatactat taatatgttt gcagatcttg gtttagataa ccaaatcacc 900
gagcttgatg ttagtatgta tggctggccg gtaaggtcgt atccaactta tgatgcgatc 960
ccagaactta aattcatgga tcaagcagct cgttatgatc gtttatttaa gttatatgag 1020
aaattaggag ataaaatcag taatgtgaca ttctggggta ttgcggataa ccatacatgg 1080
ctgaatgacc gcgcagatgt ttactatgat gaaaatggaa atgttgtatt agatagagaa 1140
acaccaagag tagaaagagg agcaggaaaa gatgcgccat ttgtatttga tcctgaatac 1200
aatgtaaaac cagcttattg ggcaattatc gatcacaaat aa 1242
<210> 148<211> 413<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL<222> (1) . . . (26)<220>
<221> DOMÍNIO<222> (43)...(413)
<223> Família glicosil hidrolase 10<220>
<221> SÍTIO<222> (29)...(32)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO<222> (35)...(38)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (298)...(308)
<223> Família glicosil hidrolase 10 active sítio. Pró-sitio id = PS00591<220>
<221> SÍTIO
<222> (353) . .. (356)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (362)...(365)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 148
Met Leu Lys Vai Leu Arg Lys Pro Ile Ile Ser Gly Leu Ala Leu Ala1 5 10 .15
Leu Leu Leu Pro Ala Gly Ala Ala Gly Ala Glu Thr Asn Ile Ser Lys20 25 30
Lys Pro Asn Ile Ser Gly Leu Thr Ala Pro Gln Leu Asp Gln Arg Tyr35 40 45
Lys Asp Ser Phe Thr Ile Gly Ala Ala Vai Glu Pro Tyr Gln Leu Leu50 55 60
Asp Ala Lys Asp Ser Gln Met Leu Lys Arg His Phe Asn Ser Ile Vai65 70 75 80
Ala Glu Asn Vai Met Lys Pro Ser Ser Leu Gln Pro Vai Glu Gly Gln85 90 95
Phe Asn Trp Glu Pro Ala Asp Lys Leu Vai Gln Phe Ala Lys Glu Asn100 105 110
Gly Met Asp Met Arg Gly His Thr Leu Vai Trp His Ser Gln Vai Pro115 120 125
Asp Trp Phe Phe Glu Asp Ala Ala Gly Asn Pro Met Vai Vai Trp Glu130 135 140Asn Gly Arg Gln Vai Vai Ala Asp Pro Ser Lys Leu Gln Glu Asn Lys145 150 155 160
Glu Leu Leu Leu Ser Arg Leu Gln Asn His lie Gln Ala Vai Vai Thr165 170 175
Arg Tyr Lys Asp Asp lie Lys Ser Trp Asp Vai Vai Asn Glu Vai lie180 185 190
Asp Glu Trp Gly Gly His Ser Glu Gly Leu Arg Gln Ser Pro Trp Phe195 200 205
Leu lie Thr Gly Thr Asp Tyr lie Lys Vai Ala Phe Glu Thr Ala Arg210 215 220
Glu Tyr Ala Ala Pro Asp Ala Lys Leu Tyr lie Asn Asp Tyr Asn Thr225 230 235 240
Glu Vai Glu Pro Lys Arg Thr His Leu Tyr Asn Leu Vai Lys Ser Leu245 250 255
Lys Glu Glu Gln Asn Vai Pro lie Asp Gly Vai Gly His Gln Ser His260 265 270
lie Gln lie Gly Trp Pro Ser Glu Lys Glu lie Glu Asp Thr lie Asn275 280 285
Met Phe Ala Asp Leu Gly Leu Asp Asn Gln lie Thr Glu Leu Asp Vai290 295 300
Ser Met Tyr Gly Trp Pro Vai Arg Ser Tyr Pro Thr Tyr Asp Ala lie305 310 315 320
Pro Glu Leu Lys Phe Met Asp Gln Ala Ala Arg Tyr Asp Arg Leu Phe325 330 335
Lys Leu Tyr Glu Lys Leu Gly Asp Lys lie Ser Asn Vai Thr Phe Trp340 345 350
Gly lie Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala Asp Vai Tyr355 360 365
Tyr Asp Glu Asn Gly Asn Vai Vai Leu Asp Arg Glu Thr Pro Arg Vai370 375 380
Glu Arg Gly Ala Gly Lys Asp Ala Pro Phe Vai Phe Asp Pro Glu Tyr385 390 395 400
Asn Vai Lys Pro Ala Tyr Trp Ala lie lie Asp His Lys405 410
<210> 149
<211> 1068
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 149
atgacccgaa tgcgcgggat aaacatgggc ggctggctca gccaaattga cgccatacag 60
gaaaaagacc ctgatacatt tcccggaaca gacaaacata tggaaacttt tatccagcag 120
aaggattttg ccaatgtcag gagatggggt ttcgatcatg tgcgaattcc aattgacgcg 180
tatctgttct ttaccgaaaa aggagagccg attgaaaaca ggcttgccaa tcttgaccgc 240
gccgtagagt atgcgctgcc cgccggcctc aacatgatat tggacctcca cgagtgtccg 300
gggcacgatt tttcggaagc agtaaaaagc cctgtccaaa aacttttctc gggagatgac 360
acctggataa ggaaaactga aaaaatatgg gcttgccttg ccgagcgtta ttctcaaaag 420
ggccacgtcc tttttgagac gctcaatgag cctgtcgctc ccaccgcgga gatttggaac 480
aatgttaagg acaggctctg ccgcgaaata cggctccacg ccccctggtc gactataatc 540
accggctcca acatgtggaa ctcagcggca accttcgaca gcctcacgcc ctttgacgac 600
gacaacatga tctacagcgt acatttttac gagccgctgc ttttcacgca ccagaacgca 660
ttgtggatcg acaatccgga aatcaggatc gcaaggccgt atccgggcga ttacggtccc 720
ggctttgtcc ccaaagacgg tttgacgctg tcggacggcg tctggaacag ggatcgtctc 780
gccggcgcat tagcgcccgt gaacgcgttc aggaaaaagt acaatgcgaa gattatctgt 840
aacgagttcg gcgtttacgc gcccgtagac cttcaatcgc agctgcgctg gtatgaagat 900
ctgctctcaa tcctcaatga gacggggatc ggtttcacgt actggaacta taaaaatctc 960
gacttcggga taatttccat aggggagaag ctgcacgaag cccttccgca gtacgacaat 1020
agcgatcgaa taaataaatc ggttcttgaa gtgttaaaaa agtattag 1068
<210> 150<211> 355<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (24)...(325)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO
<222> (145)...(154)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659<220><221> SÍTIO
<222> (310) . . . (313)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (350)...(353)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 150
Met Thr Arg Met Arg Gly lie Asn Met Gly Gly Trp Leu Ser Gln lie15 10 15
Asp Ala lie Gln Glu Lys Asp Pro Asp Thr Phe Pro Gly Thr Asp Lys20 25 30
His Met Glu Thr Phe lie Gln Gln Lys Asp Phe Ala Asn Vai Arg Arg35 40 45
Trp Gly Phe Asp His Vai Arg lie Pro lie Asp Ala Tyr Leu Phe Phe50 55 60
Thr Glu Lys Gly Glu Pro lie Glu Asn Arg Leu Ala Asn Leu Asp Arg65 70 75 80
Ala Vai Glu Tyr Ala Leu Pro Ala Gly Leu Asn Met lie Leu Asp Leu85 90 95
His Glu Cys Pro. Gly His Asp Phe Ser Glu Ala Vai Lys Ser Pro Vai100 105 110
Gln Lys Leu Phe Ser Gly Asp Asp Thr Trp lie Arg Lys Thr Glu Lys115 120 125
lie Trp Ala Cys Leu Ala Glu Arg Tyr Ser Gln Lys Gly His Vai Leu130 135 140
Phe Glu Thr Leu Asn Glu Pro Vai Ala Pro Thr Ala Glu lie Trp Asn145 150 155 160
Asn Vai Lys Asp Arg Leu Cys Arg Glu lie Arg Leu His Ala Pro Trp165 170 175
Ser Thr lie lie Thr Gly Ser Asn Met Trp Asn Ser Ala Ala Thr Phe180 185 190
Asp Ser Leu Thr Pro Phe Asp Asp Asp Asn Met lie Tyr Ser Vai His195 200 205
Phe Tyr Glu Pro Leu Leu Phe Thr His Gln Asn Ala Leu Trp lie Asp210 215 220
Asn Pro Glu lie Arg lie Ala Arg Pro Tyr Pro Gly Asp Tyr Gly Pro225 230 235 240
Gly Phe Vai Pro Lys Asp Gly Leu Thr Leu Ser Asp Gly Vai Trp Asn245 250 255
Arg Asp Arg Leu Ala Gly Ala Leu Ala Pro Vai Asn Ala Phe Arg Lys260 265 270
Lys Tyr Asn Ala Lys lie lie Cys Asn Glu Phe Gly Vai Tyr Ala Pro275 280 285
Vai Asp Leu Gln Ser Gln Leu Arg Trp Tyr Glu Asp Leu Leu Ser lie290 295 300
Leu Asn Glu Thr Gly lie Gly Phe Thr Tyr Trp Asn Tyr Lys Asn Leu305 . 310 315 320
Asp Phe Gly lie lie Ser lie Gly Glu Lys Leu His Glu Ala Leu Pro325 330 335
Gln Tyr Asp Asn Ser Asp Arg lie Asn Lys Ser Vai Leu Glu Vai Leu340 345 350
Lys Lys Tyr355
<210> 151
<211> 1068
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 151
atgaccagaa tgcgcggaat aaacatgggc ggctggctca gccagattga cgccatacag 60
gaaaaagacc ccgataaatt tcccggaata gacaaacaca tggaaacatt tatcggttcc 120
aatgattttt ccaatgtcag gaaatggggt ttcgatcatg tgcgaatccc gattgacgcg 180
tacctttttt ttaccgatca ggaagccccg attgaaaaca ggcttgtcca tattgacaac 240
gccgtaaaat acgcgcggag caacggcctc aaggtgatat tggacctcca cgagtgtccg 300
gggcatgatt tttcggacgc ggcaaaaggc cctgtccaga aacttttctc cggagatgac 360
acttatataa aaaagaccga aaaaatatgg gcatgtctgg ccgagcgtta ttcgaaaaac 420
gacaacgtcc tctatgagac tctcaacgag cctgtcgccc ccacgcctga gatttggaac 480
actgttaagg acaggctctg ccgggaaata cgcctgcacg ccccctgggc gacgataatc 540
accggttcca atatgtggaa ttggccgagc acctttgaca gcctgacgcc ctttgacgac 600
gacaacgtga tctacagcgt gcatttttac gagccgctgc tttttacgca ccagaacgcg 660
ccctggatca acaattctga aatcaggatc acaaggccgt atccgggcga ttacggcccc 720ggctttgtcc gcaaatacgg cttaactctg tcagccggcg tctggaacag ggacaggctg 780
gcgaaggaat tcgcgcccgt gaacgcgttc aggaaaaaat acaaggcgca ggttatatgc 840
gacgaattcg gcgtttacgc gcctgtcgag attgaatcgc agcttcgatg gtatgaggat 900
ttgctctcga tcctcaggga gatgggtata gggttttcgt actggaacta taaaaacctg 960
gactttggga taatttccat aggggagaag ctgcacgaaa gccttctgca gtacggcaac 1020
ggcgacagga taaatcatat ggttcttgac ttgctaaaga agtactaa 1068
<210> 152<211> 355<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (19)...(325)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO
<222> (145)...(154)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659<220>
<221> SÍTIO
<222> (227)...(230)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 152
Met Thr Arg Met Arg Gly lie Asn Met Gly Gly Trp Leu Ser Gln lie15 10 15
Asp Ala lie Gln Glu Lys Asp Pr o Asp Lys Phe Pro Gly lie Asp Lys20 25 30
His Met Glu Thr Phe lie Gly Ser Asn Asp Phe Ser Asn Vai Arg Lys35 40 45
Trp Gly Phe Asp His Vai Arg lie Pro lie Asp Ala Tyr Leu Phe Phe50 55 60
Thr Asp Gln Glu Ala Pro lie Glu Asn Arg Leu Vai His lie Asp Asn65 70 75 80
Ala Vai Lys Tyr Ala Arg Ser Asn Gly Leu Lys Vai lie Leu Asp Leu85 90 95 ■
His Glu Cys Pro Gly His Asp Phe Ser Asp Ala Ala Lys Gly Pro Vai100 105 110
Gln Lys Leu Phe Ser Gly Asp Asp Thr Tyr lie Lys Lys Thr Glu Lys115 120 125lie Trp Ala Cys Leu Ala Glu Arg Tyr Ser Lys Asn Asp Asn Vai Leu130 135 140
Tyr Glu Thr Leu Asn Glu Pro Vai Ala Pro Thr Pro Glu lie Trp Asn145 150 155 160
Thr Vai Lys Asp Arg Leu Cys Arg Glu lie Arg Leu His Ala Pro Trp165 170 175
Ala Thr lie lie Thr Gly Ser Asn Met Trp Asn Trp Pro Ser Thr Phe180 185 190
Asp Ser Leu Thr Pro Phe Asp Asp Asp Asn Vai lie Tyr Ser Vai His195 200 205
Phe Tyr Glu Pro Leu Leu Phe Thr His Gln Asn Ala Pro Trp lie Asn210 215 220
Asn Ser Glu lie Arg lie Thr Arg Pro Tyr Pro Gly Asp Tyr Gly Pro225 230 235 240
Gly Phe Vai Arg Lys Tyr Gly Leu Thr Leu Ser Ala Gly Vai Trp Asn245 250 255
Arg Asp Arg Leu Ala Lys Glu Phe Ala Pro Vai Asn Ala Phe Arg Lys260 265 270
Lys Tyr Lys Ala Gln Vai lie Cys Asp Glu Phe Gly Vai Tyr Ala Pro275 280 285
Vai Glu lie Glu Ser Gln Leu Arg Trp Tyr Glu Asp Leu Leu Ser lie290 295 300
Leu Arg Glu Met Gly lie Gly Phe Ser Tyr Trp Asn Tyr Lys Asn Leu305 310 315 320
Asp Phe Gly lie lie Ser lie Gly Glu Lys Leu His Glu Ser Leu Leu325 330 335
Gln Tyr Gly Asn Gly Asp Arg lie Asn His Met Vai Leu Asp Leu Leu340 345 350
Lys Lys Tyr355
<210> 153<211> 1068<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 153
atgcaaagaa tgcgaggctt aaatattggc ggctggctca gccagattga cgccatacag 60
gaaaaggacc ctgagggctt tcccggaata gacaaacaca tggaaacatt cattgtttcc 120
ggagattttt acaatatcag gaaatggggt ttcgaccatg tgcggcttcc cattgactcg 180
tacctgttct ttacggaaga cgatgccccc attgagaaca ggtttgccca tcttgaccgc 240
gccgtacaat tcgcgaagag caacagcctc aagctgatat tggacctcca cgagtgtccg 300
ggacacgatt tttccgaagc cgcgaaagga cccgtccaga aacttttttc gggagatgac 360
gtttacataa aaaaaaccga gaaaatctgg gcctgcctcg ccgagcgtta ttcgaaaaac 420
gaccatgtac tctttgagac tctcaacgaa cctgtcgctc ccactgccga aatttggaac 480
aaggttaagg acaggctctg cagagtaatc cgcatccacg cgccctggtc gaccataatc 540
accggctcca atatgtggaa ctcgccgtcc gccttcgacg gtcttacgcc ctttgacgat 600
ggcaacgtga tctacagcgt gcatttttac gagccgctgc tttttacgca tcagaacgcg 660
ccgtggatcg acaatccgga gatcaggacg gcaaggccct atccgggcga ttacggcccc 720
ggccttgtcc gcaaatacgg tatggcgcag tcggccggca tctggaacaa gaaacggctt 780
gcaaaagaat ttgagcccgt ggacgcgttc aggaaaaaat acaaggcgcg cgttatctgt 840
aacgagtttg gcgtgtacgc ccccgccgat ctggaatcgc agcttcgctg gtatgaggat 900
ctgctctcaa tcctcaacgg gatgcagata ggttactcgt actggaacta caaaaatctg 960
gatttcggaa taatttccat aggggagaaa ctgcacgaaa gactttcgca gtatgacaac 1020
gacgagcgga taaaccaccc ggtgctgaat gtgctgaaga aatattaa 1068
<210> 154<211> 355<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (19)...(325)
<223> Celulase (Família glicosil hidrolase 5)<220>
<221> SÍTIO
<222> (145)...(154)
<223> Assinatura da família glicosil hidrolase 5. Pró-sitio id = PS00659<400> 154
Met Gln Arg Met Arg Gly Leu Asn lie Gly Gly Trp Leu Ser Gln lie15 10 15
Asp Ala lie Gln Glu Lys Asp Pro Glu Gly Phe Pro Gly lie Asp Lys20 25 30His Met Glu Thr Phe lie Vai Ser Gly Asp Phe Tyr Asn lie Arg Lys35 40 45
Trp Gly Phe Asp His Vai Arg Leu Pro lie Asp Ser Tyr Leu Phe Phe50 55 60
Thr Glu Asp Asp Ala Pro lie Glu Asn Arg Phe Ala His Leu Asp Arg65 70 75 80
Ala Vai Gln Phe Ala Lys Ser Asn Ser Leu Lys Leu lie Leu Asp Leu85 90 95
His Glu Cys Pro Gly His Asp Phe Ser Glu Ala Ala Lys Gly Pro Vai100 105 110
Gln Lys Leu Phe Ser Gly Asp Asp Vai Tyr lie Lys Lys Thr Glu Lys115 120 125
lie Trp Ala Cys.Leu Ala Glu Arg Tyr Ser Lys Asn Asp His Vai Leu130 135 140
Phe Glu Thr Leu Asn Glu Pro Vai Ala Pro Thr Ala Glu lie Trp Asn145 150 155 160
Lys Vai Lys Asp Arg Leu Cys Arg Vai lie Arg lie His Ala Pro Trp165 170 175
Ser Thr lie lie Thr Gly Ser Asn Met Trp Asn Ser Pro Ser Ala Phe180 185 190
Asp Gly Leu Thr Pro Phe Asp Asp Gly Asn Vai lie Tyr Ser Vai His195 200 205
Phe Tyr Glu Pro Leu Leu Phe Thr His Gln Asn Ala Pro Trp lie Asp210 215 220
Asn Pro Glu lie Arg Thr Ala Arg Pro Tyr Pro Gly Asp Tyr Gly Pro225 230 235 240
Gly Leu Vai Arg Lys Tyr Gly Met Ala Gln Ser Ala Gly lie Trp Asn245 250 255
Lys Lys Arg Leu Ala Lys Glu Phe Glu Pro Vai Asp Ala Phe Arg Lys260 265 270
Lys Tyr Lys Ala Arg Vai lie Cys Asn Glu Phe Gly Vai Tyr Ala Pro275 280 285
Ala Asp Leu Glu Ser Gln Leu Arg Trp Tyr Glu Asp Leu Leu Ser lie290 295 300Leu Asn Gly Met Gln lie Gly Tyr Ser Tyr Trp Asn Tyr Lys Asn Leu305 310 315 320
Asp Phe Gly lie lie Ser lie Gly Glu Lys Leu His Glu Arg Leu Ser325 330 335
Gln Tyr Asp Asn Asp Glu Arg lie Asn His Pro Vai Leu Asn Vai Leu340 345 350
Lys Lys Tyr355
<210> 155<211> 954<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 155
atgttaaagg attccggttt ttataagggc atcaatctcg gcggctggct gtcccagtgc 60
gactacagcg aggagcgcct gaacagcttc atcaccgaaa aggactttga ggtgatcgcc 120
tcctggggtt ttgaccacgt ccgcctcccg gtggactata atgtcatcca ggatgcggaa 180
ggccgcatga tggagaaagg ccttgcacgc atcgacgccg cgcttcggtt ttgtgagaag 240
accgggcttc acatggttct cgacctgcat aagacaccgg gcttttcctt cgacccgcag 300
gagcaggaga tgggattctt ccggtcggcg cccgaccagc agctcttcta cacgatctgg 360
gagagccttg ctgcccggta tgcagacaaa tcggagatac tcatgttcga tcttctgaac 420
gagatcacgg agccggcgta tctggaggac tggaaccgga tttccgcgga atgcatccgc 480
cgcatccggc gtacgatgcc ggacgtccga attctggtcg gaagctatca ccacaatgcc 540
gtcagcgcgg taaaggacct gcctgcgccg gcagacgata aggtttttta cagctttcac 600
tgttacgacc ctcacaccta tacccaccag ggcgcttact ggatgccgga tgactttgac 660
atcgatgcaa gagtttcctt ccgcgacacc ggcgttaccc ccgtcttctt cgaaaagctg 720
tttgcctccg ccgttgaaaa ggcgcaggcg gaagggacgg aactgtactg cggagaatac 780
ggcgtcatcg acattgttcc gccggaggat gccgttctct ggttccggac cattcatgag 840
gtctttgaag cattcgggat tgcaagaagc gtctggagct ataaggaaat ggatttcggt 900
ctcgccgacc cccgcatgga tgcggtccgg gcagagctgc tgacctgtct ctga 954
<210> 156<211> 317<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220><221> DOMÍNIO<222> (14)...(302)
<223> Celulase (Família glicosil hidrolase 5)<400> 156
Met Leu Lys Asp Ser Gly Phe Tyr Lys Gly lie Asn Leu Gly Gly Trp15 10 15
Leu Ser Gln Cys Asp Tyr Ser Glu Glu Arg Leu Asn Ser Phe lie Thr20 25 30
Glu Lys Asp Phe Glu Vai lie Ala Ser Trp Gly Phe Asp His Vai Arg35 40 45
Leu Pro Vai Asp Tyr Asn Vai lie Gln Asp Ala Glu Gly Arg Met Met50 55 60
Glu Lys Gly Leu Ala Arg lie Asp Ala Ala Leu Arg Phe Cys Glu Lys65 70 75 80
Thr Gly Leu His Met Vai Leu Asp Leu His Lys Thr Pro Gly Phe Ser85 90 95
Phe Asp Pro Gln Glu Gln Glu Met Gly Phe Phe Arg Ser Ala Pro Asp100 105 110
Gln Gln Leu Phe Tyr Thr lie Trp Glu Ser Leu Ala Ala Arg Tyr Ala115 120 125
Asp Lys Ser Glu lie Leu Met Phe Asp Leu Leu Asn Glu lie Thr Glu130 135 140
Pro Ala Tyr Leu Glu Asp Trp Asn Arg lie Ser Ala Glu Cys lie Arg145 150 155 160
Arg lie Arg Arg Thr Met Pro Asp Vai Arg lie Leu Vai Gly Ser Tyr165 170 175
His His Asn Ala Vai Ser Ala Vai Lys Asp Leu Pro Ala Pro Ala Asp180 185 190
Asp Lys Vai Phe Tyr Ser Phe His Cys Tyr Asp Pro His Thr Tyr Thr195 200 205
His Gln Gly Ala Tyr Trp Met Pro Asp Asp Phe Asp lie Asp Ala Arg210 215 220
Vai Ser Phe Arg Asp Thr Gly Vai Thr Pro Vai Phe Phe Glu Lys Leu225 230 235 240
Phe Ala Ser Ala Vai Glu Lys Ala Gln Ala Glu Gly Thr Glu Leu Tyr245 250 255Cys Gly Glu Tyr Gly Vai lie Asp lie Vai Pro Pro Glu Asp Ala Vai260 265 270
Leu Trp Phe Arg Thr lie His Glu Vai Phe Glu Ala Phe Gly lie Ala275 280 285
Arg Ser Vai Trp Ser Tyr Lys Glu Met Asp Phe Gly Leu Ala Asp Pro290 295 300
Arg Met Asp Ala Vai Arg Ala Glu Leu Leu Thr Cys Leu305 310 315
<210> 157<211> 954<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 157
atgttaaagg attccggttt ttataagggc atcaatctcg gcggctggct gtcccagtgc 60
gactacagcg aggagcgcct gaacagcttc atcaccgaaa aagactttga ggtgatcgcc 120
tcctggggtt ttgaccacgt ccgtctgccg gtggactata atgtcatcca ggatgcggaa 180
ggccgcatga tggaggaagg cctcgcacgc atcgacgccg cgcttcggtt ttgtgaaaag 240
accgggcttc acatggttct cgacctgcat aagacaccgg gcttttcctt cgacccgcag 300
gagcaggaga tgggattctt ccggtcggcg cccgaccagc agcgcttcta cacgatctgg 360
gagagccttg ctgcccggta tgcagacaaa tcggagatgc tcatgttcga tcttctgaac 420
gagatcacgg agccggcgta tctgaaggac tggaaccgga tttccgcgga atgcatccgc 480
cgcatccggc gtacgatgcc ggacgtccgg attctggtcg gaagctatca ccacaatgcc 540
gtcagcgcgg taaaggacct gcctgcgccg gcggacgacc gggtttttta cagctttcac 600
tgttacgacc ctcacaccta tacccaccag ggcgcttact ggatgccgga tgactttgac 660
atcgatgcaa gagtttcctt ccgcgacatc ggcgtcaccc ccgccttctt cgaagagctg 720
tttgcatctg ccgttgaaaa ggcgaaggtg gaagggacgg aactgtactg cggagaatac 780
ggcgtcatcg acattgttcc gccggaggat gccgttctct ggttccggac cattcatgag 840
gtctttgaga aatacgggat tgcaagaagc gtctggagct ataaggaaat ggatttcggt 900
ctctccgacc cccgcatgga cgcggtccgg gcagagctgc tgacctgtct ctga 954
<210> 158
<211> 317
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (14)...(302)
<223> Celulase (Família glicosil hidrolase 5)<400> 158
Met Leu Lys Asp Ser Gly Phe Tyr Lys Gly lie Asn Leu Gly Gly Trp15 10 15
Leu Ser Gln Cys Asp Tyr Ser Glu Glu Arg Leu Asn Ser Phe lie Thr20 25 30
Glu Lys Asp Phe Glu Vai lie Ala Ser Trp Gly Phe Asp His Vai Arg35 40 45
Leu Pro Vai Asp Tyr Asn Vai lie Gln Asp Ala Glu Gly Arg Met Met50 55 60
Glu Glu Gly Leu Ala Arg lie Asp Ala Ala Leu Arg Phe Cys Glu Lys65 70 75 80
Thr Gly Leu His Met Vai Leu Asp Leu His Lys Thr Pro Gly Phe Ser85 90 95
Phe Asp Pro Gln Glu Gln Glu Met Gly Phe Phe Arg Ser Ala Pro Asp100 105 110
Gln Gln Arg Phe Tyr Thr lie Trp Glu Ser Leu Ala Ala Arg Tyr Ala115 120 125
Asp Lys Ser Glu Met Leu Met Phe Asp Leu Leu Asn Glu lie Thr Glu130 .135 140
Pro Ala Tyr Leu Lys Asp Trp Asn Arg lie Ser Ala Glu Cys lie Arg145 150 ■ 155 160
Arg lie Arg Arg Thr Met Pro Asp Vai Arg lie Leu Vai Gly Ser Tyr165 170 175
His His Asn Ala Vai Ser Ala Vai Lys Asp Leu Pro Ala Pro Ala Asp180 185 190
Asp Arg Vai Phe Tyr Ser Phe His Cys Tyr Asp Pro His Thr Tyr Thr195 200 205
His Gln Gly Ala Tyr Trp Met Pro Asp Asp Phe Asp lie Asp Ala Arg210 215 220
Vai Ser Phe Arg Asp lie Gly Vai Thr Pro Ala Phe Phe Glu Glu Leu225 230 235 240
Phe Ala Ser Ala Vai Glu Lys Ala Lys Vai Glu Gly Thr Glu Leu Tyr245 250 255
Cys Gly Glu Tyr Gly Vai lie Asp lie Vai Pro Pro Glu Asp Ala Vai260 265 270
Leu Trp Phe Arg Thr lie His Glu Vai Phe Glu Lys Tyr Gly lie Ala275 280 285
Arg Ser Vai Trp Ser Tyr Lys Glu Met Asp Phe Gly Leu Ser Asp Pro290 295 300
Arg Met Asp Ala Vai Arg Ala Glu Leu Leu Thr Cys Leu
<210> 159<211> 1023<212> DNA
.<213 > Des conhec ido<220>
<223> Obtido a partir de uma amostra ambiental<400> 159
atgaatccaa cattcagttc cgtaccggca ttaaaggagc tgtttgcggc ggacttcaac 60
atcggggcgg cggtgaatcc gacgacgatc cggacgcagg aggcgttgct ggcttatcat 120
tttaacagcc tgactgcgga gaacgagatg aagttcgtca gcgtgcatcc ggaggagcag 180
acctatacct tcgaggcggc ggaccggctg gtcgaattcg cccgagagca cggcatggcc 240
atgcggggac acacgctcgt atggcataac cagacgtccg attggctgtt ccaggatcgc 300
caaggcggga gggtaagcaa ggaggtgctg ctcggaaggc tccgggagca tattcatacc 3 60
atagtaggcc ggtacaagaa cgagatctac gcctgggacg tcgtcaacga ggtcatcgcg 420
gacgaagggg aggcgctgct gcgcacttcc aaatggacgg aaatcgcggg acctgaattt 480
atcgctaaag cgttcgagta tgcacatgag gcggatccac aggcgctgtt gttttataac 540
gactacaacg aatcgaatcc tctgaaacgc gataaaattt acacactcgt tcattcgctg 600
ctggagcaag .gggtgccgat ccatggcatc ggattacaag cgcactggaa cctgtacgat 660
ccatcgttgg atgagattaa ggcagcgatt gagaagtatg cttcgctggg tttgcagctg 720
cagctgacgg agctggatct ctcgatgttc cgcttcgatg accggcgaac cgatttgacc 7 80
gcgccagagc cggggatgct ggagcaacag gccgagcgtt atgaagccgt gttccggctg 840
ttgctggagt atcgtgacgt catcagcggc gttaccttct ggggagcggc ggatgattat 900
acctggctgg acaattttcc ggtgcgcggc cggaagaact ggccgtttct gttcgatgcc 960
cagcaccagc cgaaggcagc ttatcaccgt gtggcggcat tggctgcgga gcaacgagca 1020
taa 1023
<210> 160<211> 340<212> PRT<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (10) . . . (335)
<223> Família glicosil hidrolase 10<220>
<221> SÍTIO<222> Í91Í... (94)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SÍTIO
<222> (185) . . . (188)
<223> Sítio de N-glicosilação. Pró-sitio id = PS00001<400> 160
Met Asn Pro Thr Phe Ser Ser Vai Pro Ala Leu Lys Glu Leu Phe Ala15 10 15
Ala Asp Phe Asn lie Gly Ala Ala Vai Asn Pro Thr Thr lie Arg Thr20 25 30
Gln Glu Ala Leu Leu Ala Tyr His Phe Asn Ser Leu Thr Ala Glu Asn35 40 45
Glu Met Lys Phe Vai Ser Vai His Pro Glu Glu Gln Thr Tyr Thr Phe50 55 60
Glu Ala Ala Asp Arg Leu Vai Glu Phe Ala Arg Glu His Gly Met Ala65 70 75 80
Met Arg Gly His Thr Leu Vai Trp His Asn Gln Thr Ser Asp Trp Leu85 90 95
Phe Gln Asp Arg Gln Gly Gly Arg Vai Ser Lys Glu Vai Leu Leu Gly100 105 110
Arg Leu Arg Glu His lie His Thr lie Vai Gly Arg Tyr Lys Asn Glu115 120 125
lie Tyr Ala Trp Asp Vai Vai Asn Glu Vai lie Ala Asp Glu Gly Glu130 135 140
Ala Leu Leu Arg Thr Ser Lys Trp Thr Glu lie Ala Gly Pro Glu Phe145 150 155 160
lie Ala Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Gln Ala Leu165 170 175
Leu Phe Tyr Asn Asp Tyr Asn Glu Ser Asn Pro Leu Lys Arg Asp Lys180 185 190lie Tyr Thr Leu Vai His Ser Leu Leu Glu Gln Gly Vai Pro lie His195 200 205
Gly lie Gly Leu Gln Ala His Trp Asn Leu Tyr Asp Pro Ser Leu Asp210 215 220
Glu lie Lys Ala Ala lie Glu Lys Tyr Ala Ser Leu Gly Leu Gln Leu225 230 235 240
Gln Leu Thr Glu Leu Asp Leu Ser Met Phe Arg Phe Asp Asp Arg Arg245 250 255
Thr Asp Leu Thr Ala Pro Glu Pro Gly Met Leu Glu Gln Gln Ala Glu260 265 270
Arg Tyr Glu Ala Vai Phe Arg Leu Leu Leu Glu Tyr Arg Asp Vai lie275 280 285
Ser Gly Vai Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu Asp290 295 300
Asn Phe Pro Vai Arg Gly Arg Lys Asn Trp Pro Phe Leu Phe Asp Ala305 310 315 320
Gln His Gln Pro Lys Ala Ala Tyr His Arg Vai Ala Ala Leu Ala Ala325 330 335
Glu Gln Arg Ala340
<210> 161
<211> 2820
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 161
atgtcctgcc gcaccctgat gagtaggcgt gtaggatggg gacttttatt gtggggaggt 60
ttattcctca gaaccggttc ggttacagga caaacttaca attatgccga agtcctgcag 120
aaatctatgt ttttctacga atgtcaggag tctaaaattg ccccgggcaa tcgggtgaca 180
tggcgagcta atgcagccat gaacgatggg agcgatgttg gaaaagacct gacaggagga 240
tggtttgatg caggtgacca tgtgaaattt aattttccca tggcgtttac cgctacggcg 3 00
ctggcgtggg gagctattga ctttgctcag ggatacatta gttccgggca aatgcaatac 360
ctgaaacgta atctgcgcta cgtcaatgac tatttcatta aatgtcacac agcccccaac 420
gaattgtatg gtcaggtggg taatggaggc cttgaccatg ccttttgggg accacccgaa 480
gtcatgcgca tggctaggcc tgcctataaa attgatgcgt caaaacccgg atcagatctg 540gctgccgaaa cagctgctgc aatggctgccacctatagcg ctactttgct gaatcatgcaaaaggaaaat attccgacgc tattaccgattataacgatg aactggtatg gggagctatatatctatcta aggcagaatc ctattacgacaaagcctaca aatggaccat tgcatgggatgccaaattga caggtaagga aaaatacaaaaccgatggtt ataatggttc ccggattactatatggggat cgttgcgcta tgctatgaatgcagccactt cagctgctaa aaccacaaaatatgctcttg gatccaatcc gagcaacagacccgttaatc ctcaccatag aggtgcacaccctaccgaaa cacgacatat cctctacggctcctatactg acgaccgatc caattacacccttttctccg gactgcttgc aaagttcgtcttccctgttc gtgaaacccc aaaagatgaaggaaccaatt tctccgaatg gacggtatgggaaggttctg aatataaatt cagattatactatactgcct caaattatgt tgtgcaaacccttttagctg ctgatgcagc taacggcatcaccgaaattt atcctggcgg gcaacagtatttgcccaatg ctccggcttc tgcatgggatacctctacct tgaaacaaat gccgggtataggtaatgagc ctgtcccagg tcagacagttaccctgagtc tgactgtagg acagaccagtgctaccaaca aaaacgtcac ctggagcagcacaggcgttg tcacagccgt agcagccggtggcgctaaaa cagccacctg cgccgtaacgggagtaaccg tatcgcccac cacgctgagtgctaccgtat cgccggctaa tgctaccaacagcgtagcca cggtaagttc aacaggcgtaatcaccgtaa ccaccgtcga tggagctaaaagcactaccg tacccgtcac cggcgtaact
gccagcattg ttttcaaatc cgacgatcct 600
aaacagctgt tttcttttgc cgaaacctat 660
gctgcaggat attataactc ctggagcggc 720
tggctttacc gggctaccgg cgatgcaacc 780
aatctgggta atcagggtca ggaacccgtt 840
gacaaatcct atggctgtta tgccctactg 900
attgacgccg aacgttttct cgactattgg 960
tataccccgg gaggactcgc tttcctcgat 1020
actgcctttg ttgctgccta ctatgccgat 1080
tatctcaact ttgctaaaca acaactgcat 1140
agctatgtct gtggctttgg caataatcct 1200
ggagcatggt ctaataatgt tcaaggacct 1260
gcattagtgg gtggaccagg cagtaatgac 1320
aataacgaag tagcatgtga ctacaatgct 13 80
attgattatg gaggcacacc gttagccaac 1440
tatttcgttg aagcaaaagc aaacgctaca 1500
gtatacaacc acactgcatg gccagcccgt 1560
gtaaatattt cggaaggact ggctgcaggc 1620
aataatgccg gtgtggtaaa ctttacccaa 1680
tattataccg aagtaacctt taaacctggt 1740
gacaagaagg aagctcagat gcgtattagt 1800
ccgactaacg acccgtcatg ggcgggaatc 1860
cccatgtatg tagatggtgt aaaggtattt 1920
cccgtcaccg gagtaaccgt atcgcctacc 1980
acactcaccg ctaccgtatc gccggctaat 2040
agcaatacca gcgtagccac ggtaagctca 2100
tcggccacca tcaccgtaac cacagtcgat 2160
gtaacaggca gcaccaacgt tcccgtcacc 2220
ctgaccgtag ggcagaccgc taccctcacc 2280
aagaacgtta cctggagcag cagcaatacc 2340
gttactgccg tagcggccgg ttcggccacc 2400
accgctacct gcaccgtaac ggtaacgggc 2460
gtatcgccta ccaccctgag tctgaccgtt 2520ggacaaaccg ctaccctgac cgctaccgta tcgccagctg atgctaccaa caagaacgtc 2580
acctggagca gcagcaatac cagcgtagcc acggtaagct caacaggcgt agtcactgcc 2640
gtagcggccg gttcagctac catcaccgtg accacagtcg atggggctaa aactgctacc 2700
tgtgccgtga ccgtaaccgc cggaggttcc accaccccct gcagtaatcc ggtaagcaaa 2760
accctacctc tggtacagga tggtgccggc gaattcaggt tgagtaatag ttttaattaa 2820
<210> 162
<211> 939
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL<222> (1) . . . (30)
<220>
<221> DOMÍNIO<222> (34)...(469)
<223> Família glicosil hidrolase 9<220>
<221> DOMÍNIO<222> (491)...(576)
<223> Domínio de ligação de celulase<220>
<221> DOMÍNIO<222> (738)...(816)
<223> Domínio bateriano semelhante (group 2)<220>
<221> DOMÍNIO<222> (825)...(903)
<223> Dominio bateriano semelhante (group 2)<220>
<221> DOMÍNIO<222> (651)...(729)
<223> Domínio bateriano semelhante (group 2)<400> 162 -
Met Ser Cys Arg Thr Leu Met Ser Arg Arg Vai Gly Trp Gly Leu Leu1 5 10-15
Leu Trp Gly Gly Leu Phe Leu Arg Thr Gly Ser Vai Thr Gly Gln Thr20 25 30
Tyr Asn Tyr Ala Glu Vai Leu Gln Lys Ser Met Phe Phe Tyr Glu Cys35 40 45
Gln Glu Ser Lys lie Ala Pro Gly Asn Arg Vai Thr Trp Arg Ala Asn50 55 60
Ala Ala Met Asn Asp Gly Ser Asp Vai Gly Lys Asp Leu Thr Gly Gly65 70 75 80Trp Phe Asp Ala Gly Asp His Vai Lys Phe Asn Phe Pro Met Ala Phe85 90 95
Thr Ala Thr Ala Leu Ala Trp Gly Ala lie Asp Phe "Ala Gln Gly Tyr100 105 110
lie Ser Ser Gly Gln Met Gln Tyr Leu Lys Arg Asn Leu Arg Tyr Vai115 120 125
Asn Asp Tyr Phe lie Lys Cys His Thr Ala Pro Asn Glu Leu Tyr Gly130 135 140
Gln Vai Gly Asn Gly Gly Leu Asp His Ala Phe Trp Gly Pro Pro Glu145 150 155 160
Vai Met Arg Met Ala Arg Pro Ala Tyr Lys lie Asp Ala Ser Lys Pro165 170 175
Gly Ser Asp Leu Ala Ala Glu Thr Ala Ala Ala Met Ala Ala Ala Ser180 185 190
lie Vai Phe Lys Ser Asp Asp Pro Thr Tyr Ser Ala Thr Leu Leu Asn195 200 205
His Ala Lys Gln Leu Phe Ser Phe Ala Glu Thr Tyr Lys Gly Lys Tyr210 215 220
Ser Asp Ala lie Thr Asp Ala Ala Gly Tyr Tyr Asn Ser Trp Ser Gly225 230 235 240
Tyr Asn Asp Glu.Leu Vai Trp Gly Ala lie Trp Leu Tyr Arg Ala Thr245 250 255
Gly Asp Ala Thr Tyr Leu Ser Lys Ala Glu Ser Tyr Tyr Asp Asn Leu260 265 270
Gly Asn Gln Gly Gln Glu Pro Vai Lys Ala Tyr Lys Trp Thr lie Ala275 280 285
Trp Asp Asp Lys Ser Tyr Gly Cys Tyr Ala Leu Leu Ala Lys Leu Thr290 295 300
Gly Lys Glu Lys Tyr Lys lie Asp Ala Glu Arg Phe Leu Asp Tyr Trp305 310 315 320
Thr Asp Gly Tyr Asn Gly Ser Arg lie Thr Tyr Thr Pro Gly Gly Leu325 330 335
Ala Phe Leu Asp lie Trp -Gly Ser Leu Arg Tyr Ala Met Asn Thr Ala340 345 350
Phe Vai Ala Ala Tyr Tyr Ala Asp Ala Ala Thr Ser Ala Ala Lys Thr355 360 365
Thr Lys Tyr Leu Asn Phe Ala Lys Gln Gln Leu His Tyr Ala Leu Gly370 375 380
Ser Asn Pro Ser Asn Arg Ser Tyr Vai Cys Gly Phe Gly Asn Asn Pro335 330 395 400
Pro Vai Asn Pro His His Arg Gly Ala His Gly Ala Trp Ser Asn Asn405 410 415
Vai Gln Gly Pro Pro Thr Glu Thr Arg His lie Leu Tyr Gly Ala Leu420 425 430
Vai Gly Gly Pro Gly Ser Asn Asp Ser Tyr Thr Asp Asp Arg Ser Asn435 440 445
Tyr Thr Asn Asn Glu Vai Ala Cys Asp Tyr Asn Ala Leu Phe Ser Gly450 455 460
Leu Leu Ala Lys Phe Vai lie Asp Tyr Gly Gly Thr Pro Leu Ala Asn465 470 475 480
Phe Pro Vai Arg Glu Thr Pro Lys Asp Glu Tyr Phe Vai Glu Ala Lys485 490 495
Ala Asn Ala Thr Gly Thr Asn Phe Ser Glu Trp Thr Vai Trp Vai Tyr500 505 510
Asn His Thr Ala Trp Pro Ala Arg Glu Gly Ser Glu Tyr Lys Phe Arg515 520 525
Leu Tyr Vai Asn lie Ser Glu Gly Leu Ala Ala Gly Tyr Thr Ala Ser530 > 535 540
Asn Tyr Vai Vai Gln Thr Asn Asn Ala Gly Vai Vai Asn Phe Thr Gln545 550 555 560
Leu Leu Ala Ala Asp Ala Ala Asn Gly lie Tyr Tyr Thr Glu Vai Thr565 570 575
Phe Lys Pro Gly Thr Glu lie Tyr Pro Gly Gly Gln Gln Tyr Asp Lys580 585 590
Lys Glu Ala Gln Met Arg lie Ser Leu Pro Asn Ala Pro Ala Ser Ala595 600 605Trp Asp Pro Thr Asn Asp Pro Ser Trp Ala Gly lie Thr Ser Thr Leu610 615 620
Lys Gln Met Pro Gly lie Pro Met Tyr Vai Asp Gly Vai Lys Vai Phe625 630 635 640
Gly Asn Glu Pro Vai Pro Gly Gln Thr Vai Pro Vai Thr Gly Vai Thr645 650 655
Vai Ser Fro Thr Thr Leu Ser Leu Thr Vai Gly Gln Thr Ser Thr Leu660 665 670
Thr Ala Thr Vai Ser Pro Ala Asn Ala Thr Asn Lys Asn Vai Thr Trp675 680 685
Ser Ser Ser Asn Thr Ser Vai Ala Thr Vai Ser Ser Thr Gly Vai Vai690 695 700
Thr Ala Vai Ala. Ala Gly Ser Ala Thr lie Thr Vai Thr Thr Vai Asp705 710 715 720
Gly Ala Lys Thr Ala Thr Cys Ala Vai Thr Vai Thr Gly Ser Thr Asn725 730 735
Vai Pro Vai Thr Gly Vai Thr Vai Ser Pro Thr Thr Leu Ser Leu Thr740 745 750
Vai Gly Gln Thr Ala Thr Leu Thr Ala Thr Vai Ser Pro Ala Asn Ala755 760 765
Thr Asn Lys Asn Vai Thr Trp Ser Ser Ser Asn Thr Ser Vai Ala Thr770 775 780
Vai Ser Ser Thr Gly Vai Vai Thr Ala Vai Ala Ala Gly Ser Ala Thr785 790 795 800
lie Thr Vai Thr Thr Vai Asp Gly Ala Lys Thr Ala Thr Cys Thr Vai805 810 815
Thr Vai Thr Gly Ser Thr Thr Vai Pro Vai Thr Gly Vai Thr Vai Ser820 825 830
Pro Thr Thr Leu Ser Leu Thr Vai Gly Gln Thr Ala Thr Leu Thr Ala835 840 845
Thr Vai Ser Pro Ala Asp Ala Thr Asn Lys Asn Vai Thr Trp Ser Ser850 855 860
Ser Asn Thr Ser Vai Ala Thr Vai Ser Ser Thr Gly Vai Vai Thr Ala865 870 875 880Vai Ala Ala Gly Ser Ala Thr lie Thr Vai Thr Thr Vai Asp Gly Ala885 890 895
Lys Thr Ala Thr Cys Ala Vai Thr Vai Thr Ala Gly Gly Ser Thr Thr900 905 910
Pro Cys Ser Asn Pro Vai Ser Lys Thr Leu Pro Leu Vai Gln Asp Gly915 920 925
Ala Gly Glu Phe Arg Leu Ser Asn Ser Phe Asn930 935
<210> 163<211> 2733<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<400> 163
atgcaaactt acaattatgc cgaagtcctg cagaaatcta tgtttttcta cgaatgtcag 60
gagtctaaaa ttgccccggg caatcgggtg acatggcgag ctaatgcagc catgaacgat 120
gggagcgatg ttggaaaaga cctgacagga ggatggtttg atgcaggtga ccatgtgaaa 180
tttaattttc ccatggcgtt taccgctacg gcgctggcgt ggggagctat tgactttgct 240
cagggataca ttagttccgg gcaaatgcaa tacctgaaac gtaatctgcg ctacgtcaat 300
gactatttca ttaaatgtca cacagccccc aacgaattgt atggtcaggt gggtaatgga 360
ggccttgacc atgccttttg gggaccaccc gaagtcatgc gcatggctag gcctgcctat 420
aaaattgatg cgtcaaaacc cggatcagat ctggctgccg aaacagctgc tgcaatggct 480
gccgccagca ttgttttcaa atccgacgat cctacctata gcgctacttt gctgaatcat 540
gcaaaacagc tgttttcttt tgccgaaacc tataaaggaa aatattccga cgctattacc 600
gatgctgcag gatattataa ctcctggagc ggctataacg atgaactggt atggggagct 660
atatggcttt accgggctac cggcgatgca acctatctat ctaaggcaga atcctattac 720
gacaatctgg gtaatcaggg tcaggaaccc gttaaagcct acaaatggac cattgcatgg 780
gatgacaaat cctatggctg ttatgcccta ctggccaaat tgacaggtaa ggaaaaatac 840
aaaattgacg ccgaacgttt tctcgactat tggaccgatg gttataatgg ttcccggatt 900
acttataccc cgggaggact cgctttcctc gatatatggg gatcgttgcg ctatgctatg 960
aatactgcct ttgttgctgc ctactatgcc gatgcagcca cttcagctgc taaaaccaca 1020
aaatatctca actttgctaa acaacaactg cattatgctc ttggatccaa tccgagcaac 1080
agaagctatg tctgtggctt tggcaataat cctcccgtta atcctcacca tagaggtgca 1140
cacggagcat ggtctaataa tgttcaagga cctcctaccg aaacacgaca tatcctctac 1200
ggcgcattag tgggtggacc aggcagtaat gactcctata ctgacgaccg atccaattac 1260accaataacg aagtagcatg tgactacaat gctcttttct ccggactgct tgcaaagttc 1320
gtcattgatt atggaggcac accgttagcc aacttccctg ttcgtgaaac cccaaaagat 1380
gaatatttcg ttgaagcaaa agcaaacgct acaggaacca atttctccga atggacggta 1440
tgggtataca accacactgc atggccagcc cgtgaaggtt ctgaatataa attcagatta 1500
tacgtaaata tttcggaagg actggctgca ggctatactg cctcaaatta tgttgtgcaa 1560
accaataatg ccggtgtggt aaactttacc caacttttag ctgctgatgc agctaacggc 1620
atctattata ccgaagtaac ctttaaacct ggtaccgaaa tttatcctgg cgggcaacag 1680
tatgacaaga aggaagctca gatgcgtatt agtttgccca atgctccggc ttctgcatgg 1740
gatccgacta acgacccgtc atgggcggga atcacctcta ccttgaaaca aatgccgggt 1800
atacccatgt atgtagatgg tgtaaaggta tttggtaatg agcctgtccc aggtcagaca 1860
gttcccgtca ccggagtaac cgtatcgcct accaccctga gtctgactgt aggacagacc 1920
agtacactca ccgctaccgt atcgccggct aatgctacca acaaaaacgt cacctggagc 1980
agcagcaata ccagçgtagc cacggtaagc tcaacaggcg ttgtcacagc cgtagcagcc 2 040
ggttcggcca ccatcaccgt aaccacagtc gatggcgcta aaacagccac ctgcgccgta 2100
acggtaacag gcagcaccaa cgttcccgtc accggagtaa ccgtatcgcc caccacgctg 2160
agtctgaccg tagggcagac cgctaccctc accgctaccg tatcgccggc taatgctacc 2220
aacaagaacg ttacctggag cagcagcaat accagçgtag ccacggtaag ttcaacaggc 2280
gtagttactg ccgtagcggc cggttcggcc accatcaccg taaccaccgt cgatggagct 2340
aaaaccgcta cctgcaccgt aacggtaacg ggcagcacta ccgtacccgt caccggcgta 2400
actgtatcgc ctaccaccct gagtctgacc gttggacaaa ccgctaccct gaccgctacc 2460
gtatcgccag ctgatgctac caacaagaac gtcacctgga gcagcagcaa taccagcgta 2520
gccacggtaa gctcaacagg cgtagtcact gccgtagcgg ccggttcagc taccatcacc 2580
gtgaccacag tcgatggggc taaaactgct acctgtgccg tgaccgtaac cgccggaggt 2640
tccaccaccc cctgcagtaa tccggtaagc aaaaccctac ctctggtaca ggatggtgcc 2700
ggcgaattca ggttgagtaa tagttttaat taa 2733
<210> 164<211> 910<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> DOMÍNIO<222> (5)...(440)
<223> Família glicosil hidrolase 9
<220>
<221> DOMÍNIO<222> (462)...(547)<223> Domínio de ligação de celulase<220>
<221> DOMÍNIO<222> (709) . . . (787)
<223> Domínio bateriano semelhante (group 2)<220>
<221> DOMÍNIO<222> (796) . . .(874)
<223> Domínio bateriano semelhante (group 2)<220>
<221> DOMÍNIO<222> (622)...(700)
<223> Domínio bateriano semelhante (group 2)<400> 164
Met Gln Thr Tyr Asn Tyr Ala Glu Vai Leu Gln Lys Ser Met Phe Phe15 10 15
Tyr Glu Cys Gln Glu Ser Lys lie Ala Pro Gly Asn Arg Vai Thr Trp20 25 30
Arg Ala Asn Ala Ala Met Asn Asp Gly Ser Asp Vai Gly Lys Asp Leu35 40 45
Thr Gly Gly Trp Phe Asp Ala Gly Asp His Vai Lys Phe Asn Phe Pro50 55 60
Met Ala Phe Thr Ala Thr Ala Leu Ala Trp Gly Ala lie Asp Phe Ala65 70 75 80
Gln Gly Tyr lie Ser Ser Gly Gln Met Gln Tyr Leu Lys Arg Asn Leu85 90 95
Arg Tyr Vai Asn Asp Tyr Phe lie Lys Cys His Thr Ala Pro Asn Glu100 105 110
Leu Tyr Gly Gln Vai Gly Asn Gly Gly Leu Asp His Ala Phe Trp Gly115 120 125
Pro Pro Glu Vai Met Arg Met Ala Arg Pro Ala Tyr Lys lie Asp Ala130 135 140
Ser Lys Pro Gly Ser Asp Leu Ala Ala Glu Thr Ala Ala Ala Met Ala145 150 155 160
Ala Ala Ser, lie Vai Phe Lys Ser Asp Asp Pro Thr Tyr Ser Ala Thr165 170 175
Leu Leu Asn His Ala Lys Gln Leu Phe Ser Phe Ala Glu Thr Tyr Lys180 185 190
Gly Lys Tyr Ser Asp Ala lie Thr Asp Ala Ala Gly Tyr Tyr Asn Ser195 200 205
Trp Ser Gly Tyr Asn Asp Glu Leu Vai Trp Gly Ala lie Trp Leu Tyr210 215 220
Arg Ala Thr Gly Asp Ala Thr Tyr Leu Ser Lys Ala Glu Ser Tyr Tyr225 230 235 240
Asp Asn Leu Gly Asn Gln Gly Gln Glu Pro Vai Lys Ala Tyr Lys Trp245 250 255
Thr lie Ala Trp Asp Asp Lys Ser Tyr Gly Cys Tyr Ala Leu Leu Ala260 265 270
Lys Leu Thr Gly Lys Glu Lys Tyr Lys lie Asp Ala Glu Arg Phe Leu275 280 285
Asp Tyr Trp Thr Asp Gly Tyr Asn Gly Ser Arg lie Thr Tyr Thr Pro290 295 300
Gly Gly Leu Ala Phe Leu Asp lie Trp Gly Ser Leu Arg Tyr Ala Met305 310 315 320
Asn Thr Ala Phe Vai Ala Ala Tyr Tyr Ala Asp Ala Ala Thr Ser Ala325 330 335
Ala Lys Thr Thr Lys Tyr Leu Asn Phe Ala Lys Gln Gln Leu His Tyr340 345 350
Ala Leu Gly Ser Asn Pro Ser Asn Arg Ser Tyr Vai Cys Gly Phe Gly355 360 365
Asn Asn Pro Pro Vai Asn Pro His His Arg Gly Ala His Gly Ala Trp370 375 380
Ser Asn Asn Vai Gln Gly Pro Pro Thr Glu Thr Arg His lie Leu Tyr385 390 395 400
Gly Ala Leu Vai Gly Gly Pro Gly Ser Asn Asp Ser Tyr Thr Asp Asp405 410 415
Arg Ser Asn Tyr Thr Asn Asn Glu Vai Ala Cys Asp Tyr Asn Ala Leu420 425 430
Phe Ser Gly Leu Leu Ala Lys Phe Vai lie Asp Tyr Gly Gly Thr Pro435 440 445
Leu Ala Asn Phe Pro Vai Arg Glu Thr Pro Lys Asp Glu Tyr Phe Vai450 455 460
Glu Ala Lys Ala Asn Ala Thr Gly Thr Asn Phe Ser Glu Trp Thr Vai465 470 475 480
Trp Vai Tyr Asn His Thr Ala Trp Pro Ala Arg Glu Gly Ser Glu Tyr485 490 495
Lys Phe Arg Leu Tyr Vai Asn lie Ser Glu Gly Leu Ala Ala Gly Tyr500 505 510
Thr Ala Ser Asn Tyr Vai Vai Gln Thr Asn Asn Ala Gly Vai Vai Asn515 520 525
Phe Thr Gln Leu Leu Ala Ala Asp Ala Ala Asn Gly lie Tyr Tyr Thr530 535 540
Glu Vai Thr Phe Lys Pro Gly Thr Glu lie Tyr Pro Gly Gly Gln Gln545 550 555 560
Tyr Asp Lys Lys Glu Ala Gln Met Arg lie Ser Leu Pro Asn Ala Pro565 570 575
Ala Ser Ala Trp Asp Pro Thr Asn Asp Pro Ser Trp Ala Gly lie Thr580 585 590
Ser Thr Leu Lys Gln Met Pro Gly lie Pro Met Tyr Vai Asp Gly Vai595 600 605
Lys Vai Phe Gly Asn -Glu Pro Vai Pro Gly Gln Thr Vai Pro Vai Thr610 615 620Gly Vai Thr Vai Ser Pro Thr Thr Leu Ser Leu Thr Vai Gly Gln Thr625 630 635 640
Ser Thr Leu Thr Ala Thr Vai Ser Pro Ala Asn Ala Thr Asn Lys Asn645 650 655
Vai Thr Trp Ser Ser Ser Asn Thr Ser Vai Ala Thr Vai Ser Ser Thr660 665 670
Gly Vai Vai Thr Ala Vai Ala Ala Gly Ser Ala Thr lie Thr Vai Thr675 680 685
Thr Vai Asp Gly Ala Lys Thr Ala Thr Cys Ala Vai Thr Vai Thr Gly690 695 700
Ser Thr Asn Vai Pro Vai Thr Gly Vai Thr Vai Ser Pro Thr Thr Leu705 710 715 720
Ser Leu Thr Vai Gly Gln Thr Ala Thr Leu Thr Ala Thr Vai Ser Pro725 730 ' 735
Ala Asn Ala Thr Asn Lys Asn Vai Thr Trp Ser Ser Ser Asn Thr Ser740 745 750
Vai Ala Thr Vai Ser Ser Thr Gly Vai Vai Thr Ala Vai Ala Ala Gly755 760 765
Ser Ala Thr lie Thr Vai Thr Thr Vai Asp Gly Ala Lys Thr Ala Thr770 775 780
Cys Thr Vai Thr Vai Thr Gly Ser Thr Thr Vai Pro Vai Thr Gly Vai785 790 795 800
Thr Vai Ser Pro Thr Thr Leu Ser Leu Thr Vai Gly Gln Thr Ala Thr805 810 815
Leu Thr Ala Thr Vai Ser Pro Ala Asp Ala Thr Asn Lys Asn Vai Thr820 825 830
Trp Ser Ser Ser Asn Thr Ser Vai Ala Thr Vai Ser Ser Thr Gly Vai835 840 845
Vai Thr Ala Vai Ala Ala Gly Ser Ala Thr lie Thr Vai Thr Thr Vai850 855 860
Asp Gly Ala Lys Thr Ala Thr Cys Ala Vai Thr Vai Thr Ala Gly Gly865 870 875 880
Ser Thr Thr Pro Cys Ser Asn Pro Vai Ser Lys Thr Leu Pro Leu Vai885 890 895
Gln Asp Gly Ala Gly Glu Phe Arg Leu Ser Asn Ser Phe Asn900 905 910
<210> 165
<211> 1347
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<400> 165
atgacaatta acaacaaaac tacagcgagt cctagtattc ccagcaccca caattccctc
ccgtcgcttc gcacactgtt taccaccagc ctgctcacgc tggccctgac cgcctgcggtggttcttcca gcagcgacaa ggacccttca agctccagct ccagtgaatc atcaagttcc 180
agcgaatcct cgagctcagc ttccagcgaa tcctcgagca gtgagtccag cagtagctct 240
tccgcgggcc atttctccat cgagccggac ttccagctct acagcctggc caacttcccg 300
gtgggcgtgg cggtctccgc cgccaacgag aacgacagca tcttcaacag tccggatgcc 360
gccgaacgtc aggccgttat tattgagcac ttctctcagc tcaccgccgg caacatcatg 420
aaaatgagct acctgcagcc gagtcaaggc aacttcacct tcgatgacgc cgacgagttg 480
gttaacttcg cccaagccaa tggcatgacc gtacacggcc actccaccat ctggcacgcg 540
gactaccaag taccgaactt catgagaaac tttgaaggtg accaggagga atgggcagaa 600
attctgaccg atcacgtcac taccatcatc gagcacttcc ccgacgatgt ggtcatcagc 660
tgggacgtgg tgaacgaggc tgtcgatcaa ggcacggcga acggctggcg ccattcggtg 720
ttctacaatg cattcgacgc cccggaagaa ggcgacattc ccgaatacat caaagtcgct 780
ttccgcgccg cgcgcgaggc tgacgccaac gtagacctct actacaacga ctacgacaat 840
accgccaatg cccagcgcct ggccaaaaca ctgcaaattg ccgaggtact ggacgccgaa 900
ggcaccattg acggcgtcgg tttccagatg cacgcctaca tggattaccc gagcctgacc 960
cattttgaaa acgccttccg gcaagtcgtc gacctggggc tcaaagtgaa agttaccgag 1020
ctggacgtat ccgtagtcaa cccctacggc ggcgaagcac ctccacaacc ggaatacgac 1080
aaagaactgg ccggcgcgca aaaactgcgc ttctgccaaa tcgccgaagt ttacatgaac 1140
actgtacccg aggagttacg cggtggcttc accgtctggg gcctgaccga tgatgaaagt 1200
tggctgatgc aacagttcag aaacgccacc ggcgccgact acgacgacgt ctggccgtta 1260
ctgttcaatg ccgacaaatc cgccaaaccg gcactgcaag gcgtggccga cgcctttacc 1320
ggacaaacct gcacctccga gttctaa 1347
<210> 166<211> 448<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de uma amostra ambiental<220>
<221> SIGNAL<222> (1)...(45)
<400> 166
Met Thr lie Asn Asn Lys Thr Thr Ala Ser Pro Ser lie Pro Ser Thr
His Asn Ser Leu Pro Ser Leu Arg Thr Leu Phe Thr Thr Ser Leu Leu20 25 30
Thr Leu Ala Leu Thr Ala Cys Gly Gly Ser Ser Ser Ser Asp Lys Asp35 40 45
Pro Ser Ser Ser Ser Ser Ser Glu Ser Ser Ser Ser Ser Glu Ser SerSer Ser Ala Ser Ser Glu Ser Ser Ser Ser Glu Ser Ser Ser Ser Ser65 70 75 80
Ser Ala Gly His Phe Ser lie Glu Pro Asp Phe Gln Leu Tyr Ser Leu85 90 95
Ala Asn Phe Pro Vai Gly Vai Ala Vai Ser Ala Ala Asn Glu Asn Asp100 105 110
Ser lie Phe Asn Ser Pro Asp Ala Ala Glu Arg Gln Ala Vai lie lie115 120 125
Glu His Phe Ser Gln Leu Thr Ala Gly Asn lie Met Lys Met Ser Tyr130 135 140
Leu Gln Pro Ser Gln Gly Asn Phe Thr Phe Asp Asp Ala Asp Glu Leu145 150 155 160
Vai Asn Phe Ala Gln Ala Asn Gly Met Thr Vai His Gly His Ser Thr165 170 175
lie Trp His Ala Asp Tyr Gln Vai Pro Asn Phe Met Arg Asn Phe Glu180 185 190
Gly Asp Gln Glu Glu Trp Ala Glu lie Leu Thr Asp His Vai Thr Thr195 200 205
lie lie Glu His Phe Pro Asp Asp Vai Vai lie Ser Trp Asp Vai Vai210 215 220
Asn Glu Ala Vai Asp Gln Gly Thr Ala Asn Gly Trp Arg His Ser Vai225 230 235 240
Phe Tyr Asn Ala Phe Asp Ala Pro Glu Glu Gly Asp lie Pro Glu Tyr245 250 255
lie Lys Vai Ala Phe Arg Ala Ala Arg Glu Ala Asp Ala.Asn Vai Asp260 265 270
Leu Tyr Tyr Asn Asp Tyr Asp Asn Thr Ala Asn Ala Gln Arg Leu. Ala275 280 285
Lys Thr Leu Gln lie Ala Glu Vai Leu Asp Ala Glu Gly Thr lie Asp290 295 300
Gly Vai Gly Phe Gln Met His Ala Tyr Met Asp Tyr Pro Ser Leu Thr305 310 315 320
His Phe Glu Asn Ala Phe Arg Gln Vai Vai Asp Leu Gly Leu Lys Vai325 330 335
Lys Vai Thr Glu Leu Asp Vai Ser Vai Vai Asn Pro Tyr Gly Gly Glu340 345 350
Ala Pro Pro Gln Pro Glu Tyr Asp Lys Glu Leu Ala Gly Ala Gln Lys355 360 365
Leu Arg Phe Cys Gln lie Ala Glu Vai Tyr Met Asn Thr Vai Pro Glu370 375 380
Glu Leu Arg Gly Gly Phe Thr Vai Trp Gly Leu Thr Asp Asp Glu Ser385 390 395 400
Trp Leu Met Gln Gln Phe Arg Asn Ala Thr Gly Ala Asp Tyr Asp Asp405 410 415Vai Trp Pro Leu420
Gln Gly Vai Ala435
Leu Phe Asn Ala
Asp Ala Phe Thr440
Asp Lys Ser Ala425
Gly Gln Thr Cys
Lys Pro Ala Leu430
Thr Ser Glu Phe445

Claims (162)

1. Ácido nucléico recombinante ou isolado compreendendo(a) uma seqüência de ácidos nucléicos tendo pelo menos 50%,51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%,77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%,90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais ouidentidade de seqüência completa a SEQ ID NO: 1, SEQ ID NO: 3, SEQ IDNO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO:23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO:41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO:59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO:77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO:95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103,SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ IDNO:121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO:129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137,SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ IDNO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO:163 ou SEQ ID NO: 165, sobre uma região de pelo menos cerca de 20, 30,40, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700,750, 800, 850, 900, 950, 1000, 1050, 1100, 1150 ou mais resíduos, em queo ácido nucléico codifica pelo menos um polipeptídeo tendo uma atividadede celulase, e opcionalmente as identidades de seqüência são determinadaspor análise com um algoritmo de comparação de seqüência ou por umainspeção visual; ou(b) uma seqüência de ácidos nucléicos que hibridiza sobcondições rigorosas para dar um ácido nucléico compreendendo SEQ IDNO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19,SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ IDNO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37,SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ IDNO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55,SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO:61, SEQ ID NO: 63, SEQ IDNO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73,SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ IDNO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91,SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ IDNO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO:109, SEQ ID NO: 111, SEQ.ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117,SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO:133, SEQ IDNO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO:143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151,SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQID NO: 161, SEQ ID NO: 163 ou SEQ ID NO: 165, em que o ácido nucléicocodifica um polipeptídeo tendo uma atividade de celulase, e as condiçõesrigorosas incluem um etapa de lavagem compreendendo uma lavagem em 0,2X SSC a uma temperatura de cerca de 65°C por cerca de 15 minutos, eopcionalmente o ácido nucléico é pelo menos cerca de 20, 30, 40, 50, 60,75, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000 ou mais resíduosde comprimento ou o comprimento total do gene ou transcrito;(c) uma seqüência de ácidos nucléicos que codifica um polipeptídeo tendo uma seqüência como indicada na SEQ ID NO: 2, SEQ IDNO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO:22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO:40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO:58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO:76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO:94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102,SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ IDNO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO:128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136,SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 143, SEQID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ IDNO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO:162, SEQ ID NO: 164 ou SEQ ID NO: 166; ou(d) uma seqüência de ácidos nucléicos complementar a (a), (b)ou (c).
2. Ácido nucléico recombinante ou isolado da reivindicação 1,em que a seqüência de ácidos nucléicos compreende uma seqüência comoindicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7,SEQ ID NO: 9, SEQ ID NO: II, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO:17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO:53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO:71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO:89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ IDNO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO:·115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123,SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ IDNO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO:·149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157,SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163 ou SEQ ID NO: 165.
3. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que o algoritmo de comparação de seqüência é umaalgoritmo de BLAST versão 2.2.2 onde um conjunto de filtração é ajustadopara blastall-p blastp-d "nr pataa" -F F, e todas as outras opções sãoajustadas para padronizar.
4. Ácido nucléico recombinante ou isolado de acordo com a reivindicação 1, em que a atividade de celulase compreende uma atividadede endoglucanase.
5. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende uma atividadede celobioidrolase.
6. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende uma atividadede [p]-glicosidase ou manase.
7. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende uma atividade de endocelulase.
8. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celMase compreende hidrolisação deum glucano para produzir um oligômero ou polissacarídeo de peso molecularmais baixo.
9. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende catalisação dehidrólise de ligações de 1,4-beta-D-glicosídicas.
10. Ácido nucléico recombinante ou isolado de acordo com areivindicação 9, em que a atividade de endocelulase compreende umaantividade de an endo-1,4-beta-endocelulase.
11. Ácido nucléico recombinante ou isolado de acordo com a reivindicação 10, em que a atividade de ligação de 1,4- beta-D-glicosídicacompreende hidrólise de uma ligação de 1,4-beta-D-glicosídica em umacelulose, um derivado de celulose, uma liquenina ou um cereal.
12. Ácido nucléico recombinante ou isolado de acordo com areivindicação 11, em que o derivado de celulose compreende um carbóxi metil celulose ou um hidróxi etil celulose.
13. Ácido nucléico recombinante ou isolado de acordo com areivindicação 11, em que o cereal compreende um beta-D-glucano ou umxiloglucano.
14. Ácido nucléico recombinante ou isolado de acordo com a reivindicação 1, em que a atividade de celulase compreende catalisação dehidrólise de ligações de glucanase.
15. Ácido nucléico recombinante ou isolado de acordo com areivindicação 14, em que a atividade de celulase compreende catalisação dehidrólise de ligações de [p] -1,4- e/ou [(3]-1,3- glucanase.
16. Ácido nucléico recombinante ou isolado de acordo com areivindicação 14, em que a atividade de celulase compreende catalisação dehidrólise de ligações de endo-glucanase.
17. Ácido nucléico recombinante ou isolado de acordo com areivindicação 16, em que a atividade de celulase compreende catalisação de hidrólise de atividade de hidrolase deendo-1,4-beta-D-glucan 4-glucano.
18. Ácido nucléico recombinante ou isolado de acordo com areivindicação 16, em que a atividade de celulase compreende catalisação dehidrólise de internai ligações de endó- [p]-1,4-glucanase e/ou ligações de [p]-1,3-glucanase internas.
19. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende catalisação dehidrólise de ligações de [[3]-1,3-glucosídicas internas.
20. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende hidrolisação depolissacarídeos compreendendo glicopiranose.
21. Ácido nucléico recombinante ou isolado de acordo com a reivindicação 20, em que a atividade de celulase compreende hidrolisaçãode polissacarídeos compreendendo D-glicopiranoses ligadas a 1,4-[B]-glicosídeo.
22. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende hidrolisação de uma celulose, um derivado de celulose ou uma hemicelulose.
23. Ácido nucléico recombinante ou isolado de acordo com areivindicação 22, em que a atividade de celulase compreende hidrolisaçãode uma celulose ou uma hemicelulose em uma polpa de papel ou madeiraou em produto de papel ou madeira.
24. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende catalisação dehidrólise de glucano em um alimento, a produto alimentício ou uma bebida.
25. Ácido nucléico recombinante ou isolado de acordo com areivindicação 24, em que o alimento, produto alimentício ou bebida compreende uma ração de animal à base de cereal, um mosto ou umacerveja, uma massa de farinha, uma fruta ou um vegetal.
26. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase compreende catalisação dehidrólise de um glucano em uma célula microbiana, uma célula fúngica, uma célula de mamífero, uma célula de planta ou qualquer material de plantacompreendendo uma parte celulósica.
27. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase é termoestável.
28. Ácido nucléico recombinante ou isolado de acordo com a reivindicação 27, em que o polipeptídeo retém uma atividade de celulase sobcondições compreendendo uma faixa de temperatura de entre cerca de 37°Ca cerca de 95°C, ou entre cerca de 55°C a cerca de 85°C, ou entre cerca de70°C a cerca de 75°C, ou entre cerca de 70°C a cerca de 95°C, ou entrecerca de 90°C a cerca de 95°C, ou retém uma atividade de celulase em umatemperatura na faixa entre cerca de 10°C a cerca de 5°C, entre cerca de 5°Ca cerca de 15°C, entre cerca de 15°C a cerca de 25°C, entre cerca de 25°C a cerca de 37°C, ou entre cerca de 37°C a cerca de 95°C, 96°C, 97°C, 98°Cou 99°C.
29. Ácido nucléico recombinante ou isolado de acordo com areivindicação 1, em que a atividade de celulase é termotolerante.
30. Ácido nucléico recombinante ou isolado de acordo com a reivindicação 29, em que o polipeptídeo retém uma atividade de celulase depois da exposição a uma temperatura na faixa de mais do que 37°C acerca de 95°C, de mais do que 55°C a cerca de 85°C, ou entre cerca de70°C a cerca de 75°C, ou de mais do que 90°C a cerca de 95°C, ou depoisda exposição a uma temperatura na faixa entre cerca de 1°C a cerca de 5°C, entre cerca de 5°C a cerca de 15°C, entre cerca de 15°C a cerca de 25°C,entre cerca de 25°C a cerca de 37°C, ou entre cerca de 37°C a cerca de95°C, 96°C, 97°C, 98°C ou 99°C.
31. Sonda.de ácido nucléico para a identificação de um ácido nucléico que codifica um polipeptídeo com uma atividade de celulase, em que a sonda compreende pelo menos 20, 30, 40, 50, 60, 75, 100 ou 150 oumais bases consecutivas de uma seqüência como definida na reivindicação1, em que a sonda identifica o ácido nucléico por ligação ou hibridização, emque opcionalmente a sonda compreende um oligonucleotídeocompreendendo pelo menos cerca de 10 a 50, cerca de 20 a 60, cerca de 30 a 70, cerca de 40 a 80, cerca de 60 a 100, ou cerca de 550 a 150 basesconsecutivas, em que opcionalmente a sonda compreende basesconsecutivas de uma seqüência como indicada na SEQ ID NO: 1, SEQ IDNO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQID NO: 13, SEQ ID NO: 15.
32. Par de iniciador de ampliação para a ampliação de um ácido nucléico que codifica um polipeptídeo tendo uma atividade de celulase, emque o par de iniciador de ampliação(a) é capaz de ampliar um ácido nucléico compreendendo umaseqüência como definida na reivindicação 1, ou uma sua subseqüência; ou(b) compreende um primeiro membro tendo uma seqüênciacomo indicada por cerca do primeiro (o 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou mais 5 resíduos de SEQ ID NO: 1,SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO:29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO:47, SEQ ID NO: 49, SEQ ID 0 NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO:65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO:83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID 5 NO:101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109,SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO:135, SEQ ID NO: 137, SEQ ID NO: 139,.SEQ ID NO: 141, SEQ ID NO: 143,SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID 0 NO: 151,SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQID NO: 161, SEQ ID NO: 163 ou SEQ ID NO: 165, e um segundo membro tendo uma seqüência como indicada por cerca do primeiro (o 5') 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou mais resíduosdo filamento complementar do primeiro membro, em que opcionalmente ummembro do par de iniciador de ampliação compreende um oligonucleotídeocompreendendo pelo menos cerca de 10 a 50 bases consecutivas da seqüência, ou, cerca de 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25,26, 27, 28, 29, 30 ou mais bases consecutivas da seqüência.
33. Ácido nucléico de codificação de celulase gerado porampliação de um polinucleotídeo usando-se um par de iniciador deampliação como definido na reivindicação 32, em que opcionalmente aampliação é por reação de cadeia de polimerase (PCR).
34. Ácido nucléico de codificação de celulase de acordo com a reivindicação 33, em que o ácido nucléico gerado por ampliação de uma biblioteca de gene, e opcionalmente a biblioteca de gene é uma bibliotecaambiental.
35. Celulase isolada ou recombinante codificada pelo ácidonucléico de codificação de celulase definida na reivindicação 33.
36. Método de ampliação de um ácido nucléico que codifica um polipeptídeo tendo uma atividade de celulase compreendendo ampliação deum ácido nucléico de modelo com um par de iniciador de ampliação comodefinido na reivindicação 32.
37. Cassete de expressão compreendendo um ácido nucléico compreendendo uma seqüência como definida na reivindicação 1.
38. Vetor compreendendo um ácido nucléico compreendendouma seqüência como definida na reivindicação 1, em que opcionalmente oveículo compreende um vetor de expressão.
39. Veículo de clonagem compreendendo a ácido nucléico compreendendo uma seqüência como definida na reivindicação 1, em queopcionalmente o veículo de clonagem compreende um vetor viral, umplasmídio, um fago, um fagomídio, um cosmídio, um fosmídio, umbacteriofago ou um cromossoma artificial, e opcionalmente o vetor viralcompreende um vetor de adenovírus, um vetor retroviral ou um vetor viral adeno-associado, e opcionalmente o veículo de clonagem compreende umcromossoma artificial bacteriano (BAC), um plasmídio, um vetor derivado debacteriofago PI (PAC), um cromossoma artificial de levedura (YAC), ou umcromossoma artificial de mamífero (MAC).
40. Célula transformada compreendendo um ácido nucléico compreendendo uma seqüência como definida na reivindicação 1, ou um cassete de expressão como definido na reivindicação 37, o vector dareivindicação 38, ou um veículo de clonagem como definido na reivindicação·39, em que opcionalmente a célula é uma célula bacteriana, uma célula demamífero, uma célula fúngica, uma célula de levedura, uma célula de insetoou uma célula de planta.
41. Animal não humano transgênico compreendendo uma seqüência como definida na reivindicação 1, em que opcionalmente o animalnão humano transgênico é um camundongo ou um rato.
42. Planta transgênica compreendendo uma seqüência comodefinida na reivindicação 1, em que opcionalmente a planta é uma planta demilho, uma planta de sorgo, uma planta de batata, uma planta de tomate, um planta de trigo, uma planta de semente oleosa, uma planta de colza, umaplanta de soja, uma planta de arroz, uma planta de cevada, um capim, ouuma planta de tabaco.
43. Semente transgênica compreendendo uma seqüência comodefinida na reivindicação 1, em que opcionalmente a semente é é umasemente de milho, uma semente de trigo, uma semente oleosa, umasemente de colza, uma semente de soja, uma semente de palma, umasemente de girassol, uma semente de gergelim, uma semente de planta dearroz, cevada, amendoim ou tabaco.
44. Oligonucleotídeo anti-sentido compreendendo umaseqüência de ácidos nucléicos complementar a ou capaz de hibridizar sobcondições rigorosas para dar uma seqüência como definida na reivindicação1, ou uma sua subseqüência em que opcionalmente o oligonucleotídeo anti-sentido tem um comprimento de entre cerca de 10 a 50, cerca de 20 a 60,cerca de 30 a 70, cerca de 40 a 80, ou cerca de 60 a 100 bases.
45. Método de inibição da tradução de uma mensagem decelulase em uma célula compreendendo administração à célula ouexpressão na célula de um oligonucleotídeo anti-sentido compreendendouma seqüência de ácidos nucléicos complementar a ou capaz de hibridizarsob condições rigorosas para dar uma seqüência como definida na reivindicação 1.
46. Molécula de RNA de interferência de filamento duplo (RNAi)compreendendo uma subseqüência de uma seqüência como definida nareivindicação 1, em que opcionalmente o RNAi compreende um siRNA ouum miRNA, e opcionalmente a molécula de RNAi é cerca de 11, 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 ou mais nucleotídeos dúplex decomprimento.
47. Método de inibição da expressão de uma celulase em umacélula compreendendo administração à célula ou expressão na célula deuma molécula de RNA de interferência de filamento duplo (RNAi) comodefinida na reivindicação 46.
48. Polipeptídeo recombinante ou isolado (i) tendo uma seqüência de aminoácidos tendo pelo menos 50%,51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%,77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%,90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ou 100% de identidade de seqüência a SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6,SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ IDNO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24,SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ IDNO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42,SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ IDNO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60,SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ IDNO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78,SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96,SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ IDNO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO:122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQID NO: 140, SEQ ID NO: 142, SEQ ID NO: 143, SEQ ID NO: 146, SEQ IDNO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO:`156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164ou SEQ ID NO: 166, sobre uma região de pelo menos cerca de 20, 25, 30,`35, 40, 45, 50, 55, 60, 75, 100, 150, 200, 250, 300 ou mais resíduos, em queopcionalmente as identidades de seqüência são determinadas por análise com um algoritmo de comparação de seqüência ou por uma inspeção visual,e opcionalmente o algoritmo de comparação de seqüência é um algoritmo deBLAST versão 2.2.2 onde um conjunto de filtração é ajustado para blastall -pblastp -d "nr pataa" -F F, e todas as outras opções são ajustadas parapadronizar; (ii) tendo uma seqüência de aminoácidos codificada por umácido nucléico como definido na reivindicação 1, em que o polipeptídeo temuma atividade de celulase ou tem atividade imunogênica pelo fato de que eleé capaz de gerar um anticorpo que especificamente se liga a umpolipeptídeo tendo uma seqüência como indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO:`22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO:`40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO:`58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO:`76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: `94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102,SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ IDNO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO:`128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 143, SEQID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ IDNO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO:(162, SEQ ID NO: 164 ou SEQ ID NO: 166; ou(iii) tendo uma seqüência de aminoácidos como indicada na (i)ou (ii), ou um polipeptídeo codificado por um ácido nucleico como definido nareivindicação 1, e compreendendo pelo menos uma substituição conservadora de resíduo de aminoacido, em que substituição opcionalmenteconservadora compreende substituição de um aminoacido alifático com umoutro aminoacido alifático; substituição de uma serina com uma treonina ouvice versa; substituição de um resíduo ácido com um outro resíduo ácido;substituição de um resíduo que porta um grupo amida com um outro resíduo que porta um grupo amida; troca de um resíduo básico com um outroresíduo básico; ou, substituição de um resíduo aromático com um outroresíduo aromático, ou uma sua combinação, e opcionalmente o resíduoalifático compreende Alanina, Valina, Leucina, Isoleucina ou um seuequivalente sintético; o resíduo ácido compreende ácido aspártico, Ácido glutâmico ou um seu equivalente sintético; o resíduo compreendendo umgrupo amida compreende ácido aspártico, Ácido glutâmico ou um seuequivalente sintético; o resíduo básico compreende Lysina, Arginina ou umseu equivalente sintético; ou, o resíduo aromático compreende fenilalanina,Tirosina ou um seu equivalente sintético.
49. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase compreende uma atividadede endoglucanase.
50. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase compreende uma atividade de celobioidrolase.
51. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase compreende uma atividadede [B]-glicosidase ou de manase.
52. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 48, em que a atividade de celulase compreende uma atividade de endocelulase.
53. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase compreende hidrolisaçãode um glucano para produzir um oligômero ou polissacarídeo de pesomolecular mais baixo.
54. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 48, em que a atividade de celulase compreende catalisação dehidrólise de ligações de 1,4-beta-D-glicosídicas.
55. Polipeptídeo recombinante ou isolado de acordo com areivindicação 54, em que a atividade de endocelulase compreende umaantividade de endo-1,4-beta-endocelulase.
56. Polipeptídeo recombinante ou isolado de acordo com areivindicação 54, em que a atividade de ligação de 1,4-beta-D-glicosídicacompreende hidrólise de uma ligação de 1,4-beta-D-glicosídica em umacelulose, um derivado de celulose, uma liquenina ou um cereal.
57. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 56, em que o derivado de celulose compreende um carbóxi metil celulose ou um hidróxi etil celulose.
58. Polipeptídeo recombinante ou isolado de acordo com areivindicação 56, em que o cereal compreende um beta-D-glucano ou umxiloglucano.
59. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 48, em que a atividade de celulase compreende catalisação dehidrólise de ligações de glucanase.
60. Polipeptídeo recombinante ou isolado de acordo com areivindicação 59, em que a atividade de celulase compreende catalisação de hidrólise de ligações de [0]-1,4- e/ou [(3]-1,3-glucanase.
61. Polipeptídeo recombinante ou isolado de acordo com areivindicação 59, em que a atividade de celulase compreende catalisação dehidrólise de ligações de endo-glucanase.
62. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 61, em que a atividade de celulase compreende catalisação dehidrólise de atividade de hidrolase de endo-1,4-beta-D-glucan 4-glucano.
63. Polipeptídeo recombinante ou isolado de acordo com areivindicação 61, em que a atividade de celulase compreende catalisação dehidrólise de ligações de endo- [p]-1,4- glucanase e/ou [p]-1,3-glucanaseinternas.
64. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 48, em que a atividade de celulase compreende catalisação de hidrólise de ligações de [B]-1,3-glucosídica internas.
65. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase compreende hidrolisaçãode polissacarídeos compreendendo glicopiranose.
66. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 65, em que a atividade de celulase compreende hidrolisaçãode polissacarídeos compreendendo D-glicopiranoses ligadas a 1,4-[B]-glicosídeo.
67. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 48, em que a atividade de celulase compreende hidrolisação de uma celulose, um derivado de celulose ou uma hemicelulose.
68. Polipeptídeo recombinante ou isolado de acordo com areivindicação 67, em que a atividade de celulase compreende hidrolisaçãode uma celulose ou uma hemicelulose em uma polpa de papel ou madeira ou em produto de papel ou madeira.
69. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase compreende catalisação dehidrólise de glucano em um alimento, a produto alimentício ou uma bebida.
70. Polipeptídeo recombinante ou isolado de acordo com a reivindicação 69, em que o alimento, produto alimentício ou bebida compreende uma ração de animal à base de cereal, um mosto ou umacerveja, uma massa de farinha, uma fruta ou um vegetal.
71. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase compreende catalisação de hidrólise de um glucano em uma célula microbiana, uma célula fúngica, umacélula de mamífero, uma célula de planta ou qualquer material de plantacompreendendo uma parte celulósica.
72. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase é termoestável.
73. Polipeptídeo recombinante ou isolado de acordo com areivindicação 72, em que o polipeptídeo retém uma atividade de celulase sobcondições compreendendo uma faixa de temperatura de entre cerca de 37°Ca cerca de 95°C, ou entre cerca de 55°C a cerca de 85°C, ou entre cerca de70°C a cerca de 75°C, ou entre cerca de 70°C a cerca de 95°C, ou entrecerca de 90°C a cerca de 95°C, ou retém uma atividade de celulase em umatemperatura na faixa entre cerca de 1°C a cerca de 5°C, entre cerca de 5°C10 a cerca de 15°C, entre cerca de 15°C a cerca de 25°C, 0 entre cerca de25°C a cerca de 37°C, ou entre cerca de 37°C a cerca de 95°C, 96°C, 97°C,98°C ou 99°C.
74. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase é termotolerante.
75. Polipeptídeo recombinante ou isolado de acordo com areivindicação 74, em que o polipeptídeo retém uma atividade de celulasedepois da exposição a uma temperatura na faixa de mais do que 37°C acerca de 95°C, de mais do que 55°C a cerca de 85°C, ou entre cerca de70°C a cerca de 75°C, ou de mais do que 90°C a cerca de 95°C, ou depois da exposição a uma temperatura na faixa entre cerca de 1°C a cerca de 5°C,entre cerca de 5°C a cerca de 15°C, entre cerca de 15°C a cerca de 25°C,entre cerca de 25°C a cerca de 37°C, ou entre 0 cerca de 37°C a cerca de95°C, 96°C, 97°C, 98°C ou 99°C.
76. Polipeptídeo recombinante ou isolado compreendendo umpolipeptídeo de acordo com a reivindicação 48, e carecendo de umaseqüência de sinal ou líder ou uma pré-pró seqüência.
77. Polipeptídeo recombinante ou isolado compreendendo umpolipeptídeo como definido na reivindicação 48, e tendo uma seqüência desinal ou líder heteróloga ou uma pré-pró seqüência heteróloga.
78. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a atividade de celulase compreende uma atividadeespecífica de cerca de 37°C na faixa de cerca de 100 a cerca de 1000unidades por miligrama de proteína, de cerca de 500 a cerca de 750unidades por miligrama de proteína, de cerca de 500 a cerca de 1200unidades por miligrama de proteína, ou de cerca de 750 a cerca de 1000unidades por miligrama de proteína.
79. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que a termotolerância compreende retenção de pelomenos metade da atividade específica da celulase a 37°C depois de seraquecida até uma temperatura elevada, ou, em que a termotolerânciacompreende retenção de atividade específica a 37°C na faixa de cerca de 500 a cerca de 1200 unidades por miligrama de proteína depois de seraquecida até uma temperatura elevada.
80. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que o polipeptídeo compreende pelo menos um sítio deglicosilação, e opcionalmente a glicosilação é uma glicolisação N-ligada, e opcionalmente o polipeptídeo é glicosilado depois de ser expresso em um P.pastoris ou um S. pombe.
81. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que o polipeptídeo retém uma atividade de celulase sobcondições compreendendo cerca de pH 6,5, pH 6,0, 0 pH 5,5, 5,0, pH 4,5 ou 4,0 ou mais acídico, ou depois da exposição a condições compreendendocerca de pH 6,5, pH 6,0, pH 5,5, 5,0, pH 4,5 ou 4,0 ou mais acídico.
82. Polipeptídeo recombinante ou isolado de acordo com areivindicação 48, em que o polipeptídeo retém uma atividade de celulase sobcondições compreendendo cerca de pH 7,5, pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10 ou pH 10,5 ou mais básico, ou depois da exposição a condiçõescompreendendo cerca de pH 7,5, pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10 ou pH10,5 ou mais básico.
83. Preparação de proteína compreendendo um polipeptídeocomo definido na reivindicação 48, em que a preparação de proteína compreende um líquido, um sólido ou um gel.
84. Heterodímero compreendendo um polipeptídeo comodefinido na reivindicação 48, e um segundo domínio, em que opcionalmenteo segundo domínio é um polipeptídeo e o heterodímero é uma proteína defusão, e opcionalmente o segundo domínio compreende um epitopo, umpeptídeo imunogênico ou uma etiqueta.
85. Homodímero compreendendo um polipeptídeo como definido na reivindicação 48.
86. Polipeptídeo imobilizado ou um ácido nucleico imobilizado,em que o polipeptídeo compreende uma seqüência como definida nareivindicação 48, ou uma sua subseqüência, ou o ácido nucleicocompreende uma seqüência como definida na reivindicação 1, ou uma sua subseqüência, ou a sonda como definida na reivindicação 31, em queopcionalmente o polipeptídeo ou ácido nucleico é imobilizado sobre umacélula, um metal, uma resina, um polímero, uma cerâmica, um vidro, ummicroeletrodo, uma partícula de grafite, uma conta, um gel, uma placa, umconjunto ou um tubo capilar.
87. Conjunto compreendendo um polipeptídeo imobilizado comodefinido na reivindicação 86, ou, um ácido nucleico imobilizado comodefinido na reivindicação 86.
88. Anticorpo isolado ou recombinante que especificamente seliga a um polipeptídeo como definido na reivindicação 48, em que opcionalmente o anticorpo é um anticorpo monoclonal ou policlonal.
89. Hibrodoma compreendendo um anticorpo queespecificamente se liga a um polipeptídeo como definido na reivindicação48.
90. Um método de isolamento ou identificação de um polipeptídeo com uma atividade de celulase compreendendo as etapas de:(a) provisão de um anticorpo como definido na reivindicação 88;(b) provisão de uma amostra compreendendo polipeptídeos; e(c) contato da amostra da etapa (b) com o anticorpo da etapa (a)sob condições em que o anticorpo pode especificamente se ligar ao polipeptídeo, desse modo isolando ou identificando um polipeptídeo tendouma atividade de celulase.
91. Método de produção de um anticorpo de anticelulasecompreendendo(a) administração a um animal não humano de um ácidonucléico como definida na reivindicação 1, ou uma sua subseqüência emuma quantidade suficiente para gerar uma resposta humoral, desse modo produzindo um anticorpo de anticelulase, ou(b) administração a um animal não humano de um polipeptídeocomo definido na reivindicação 48, ou uma sua subseqüência em umaquantidade suficiente para gerar uma resposta humoral, desse modoproduzindo um anticorpo de anticelulase.
92. Método de produção de um polipeptídeo recombinante compreendendo as etapas de: (a) provisão de um ácido nucléico operavelmente ligado a umpromotor, em que o ácido nucléico compreende uma seqüência comodefinida na reivindicação 1; e (b) expressão do ácido nucléico da etapa (a) sob condições que permitem expressão do polipeptídeo, desse modo produzindo umpolipeptídeo recombinante, em que opcionalmente o método ulteriormentecompreende a transconstrução de uma célula hospedeira com o ácidonucléico da etapa (a) seguido por expressão do ácido nucléico da etapa (a), desse modo produzindo um polipeptídeo recombinante em uma célulatransformada.
93. Método para a identificação de um polipeptídeo tendo umaatividade de celulase compreendendo as seguintes etapas:' (a) provisão de um polipeptídeo como definido na reivindicação 48;(b) provisão de um substrato de celulase; e(c) contato do polipeptídeo com o substrato da etapa (b) edetecção de uma diminuição na quantidade de substrato ou um aumento naquantidade de um produto de reação, em que uma diminuição na quantidade do substrato ou um aumento na quantidade do produto de reação detectaum polipeptídeo tendo uma atividade de celulase.
94. Método para a identificação de um substrato de celulasecompreendendo as seguintes etapas:(a) provisão de um polipeptídeo como definido na reivindicação48;(b) provisão de um substrato de teste; e (c) contato do polipeptídeo da etapa (a) com o substrato de testeda etapa (b) e detecção de uma diminuição na quantidade de substrato ouum aumento na quantidade de produto de reação, em que uma diminuiçãona quantidade do substrato ou um aumento na quantidade de um produto dereação identifica o substrato de teste como um substrato de celulase.
95. Método de determinação se um composto de teste especificamente se liga a um polipeptídeo compreendendo as seguintesetapas:(a) expressão de um ácido nucléico ou de um vetorcompreendendo o ácido nucléico sob condições permissivas para a tradução do ácido nucléico para um polipeptídeo, em que o ácido nucléico tem umaseqüência como definida na reivindicação 1;(b) provisão de um composto de teste;(c) contato do polipeptídeo com o composto de teste; e(d) determinação de se o composto de teste da etapa (b) especificamente se liga ao polipeptídeo.
96. Método de determinação de se um composto de testeespecificamente se liga a um polipeptídeo compreendendo as seguintesetapas:(a) provisão de um polipeptídeo como definido na reivindicação 48;(b) provisão de um composto de teste;(c) contato do polipeptídeo com o composto de teste; e(d) determinação de se o composto de teste da etapa (b)especificamente se liga ao polipeptídeo.
97. Método para a identificação de um modulador de umaatividade de celulase compreendendo as seguintes etapas:(a) provisão de um polipeptídeo como definido na reivindicação48;(b) provisão de um composto de teste;(c) contato do polipeptídeo da etapa (a) com o composto deteste da etapa (b) e medição de uma atividade dum glucanase, em que uma mudança na atividade de celulase medida na presença do composto deteste em comparação com a atividade na ausência do composto de testeprove uma determinação que o composto de teste modula a atividade decelulase.
98. Método de acordo com a reivindicação 97, em que a atividade de celulase é medida por provisão de um substrato de celulase edetecção de uma diminuição na quantidade do substrato ou o um aumentona quantidade de um produto de reação, ou, um aumento na quantidade dosubstrato ou uma diminuição na quantidade de um produto de reação, emque opcionalmente uma diminuição na quantidade do substrato ou um aumento na quantidade do produto de reação com o composto de testequando comparado com a quantidade de substrato ou produto de reaçãosem o composto de teste identifica o composto de teste como um ativadorde uma atividade de celulase, e opcionalmente um aumento na quantidadedo substrato ou uma diminuição na quantidade do produto de reação com o composto de teste quando comparado com a quantidade de substrato ouproduto de reação sem o composto de teste identifica o composto de testecomo um inibidor de uma atividade de celulase.
99. Sistema de computador compreendendo um processador eum dispositivo de armazenagem de dados tem armazenado no mesmo uma seqüência de polipeptídeos ou uma seqüência de ácidos nucléicos, em quea seqüência de polipeptídeos compreende seqüência como definida nareivindicação 48, um polipeptídeo codificado por um ácido nucléico comodefinido na reivindicação 1, em que opcionalmente o método ulteriormentecompreende um algoritmo de comparação de seqüência e um dispositivo de armazenagem de dados tendo pelo menos uma seqüência de referênciaarmazenada no mesmo, ou ulteriormente compreende um identificador queidentifica uma ou mais característica na dita seqüência e opcionalmente oalgoritmo de comparação de seqüência compreende um programa decomputador que indica polimorfismos.
100. Meio legível de computador tendo armazendo no mesmouma seqüência de polipeptídeos ou uma seqüência de ácidos nucléicos, em que a seqüência de polipeptídeos compreende um polipeptídeo comodefinido na reivindicação 48, ou um polipeptídeo codificado por um ácidonucléico como definido na reivindicação 1.
101. Método para a identificação de uma característica em umaseqüência compreendendo as etapas de: (a) leitura da seqüência usando-se um programa de computador que identifica uma ou mais características emuma seqüência, em que a seqüência compreende uma seqüência depolipeptídeos ou uma seqüência de ácidos nucléicos, em que a seqüênciade polipeptídeos compreende um polipeptídeo como definido nareivindicação 48; um polipeptídeo codificado por um ácido nucléico comodefinido na reivindicação. 1; e (b) identificação de uma ou maiscaracterísticas na seqüência com o programa de computador.
102. Método para a comparação de uma primeira seqüênciacom uma segunda seqüência compreendendo as etapas de: (a) leitura daprimeira seqüência e da segunda seqüência através do uso de um programade computador que compara seqüências, em que a primeira seqüênciacompreende uma seqüência de polipeptídeos ou uma seqüência de ácidosnucléicos, em que a seqüência de polipeptídeos compreende umpolipeptídeo como definido na reivindicação 48 ou um polipeptídeocodificado por um ácido nucléico como definido na reivindicação 1; e (b) determinação das diferenças entre a primeira seqüência e a segundaseqüência com o programa de computador, em que opcionalmente o métodoulteriormente compreende uma etapa de determinação das diferenças entrea primeira seqüência e a segunda seqüência, ou opcionalmente o métodoulteriormente compreende a etapa de identificação de polimorfismos, ou opcionalmente o método ulteriormente compreende o uso de umidentificador que identifica uma ou mais características em uma seqüência, eopcionalmente o método compreende leitura da primeira seqüência usando-se um programa de computador e identificação de uma ou maiscaracterísticas na seqüência.
103. Método para o isolamento ou recuperação de um ácidonucléico que codifica um polipeptídeo com uma atividade de celulase de uma amostra ambiental compreendendo as etapas de:(a) provisão de um par de iniciador de ampliação como definidana reivindicação 32;(b) isolamento de um ácido nucléico da amostra ambiental outratamento da amostra ambiental tal que ácido nucléico na amostra é acessível para a hibridização para dar o par de iniciador de ampliação; e,(c) combinação do ácido nucléico da etapa (b) com o par deiniciador de ampliação da etapa (a) e ampliação de ácido nucléico daamostra ambiental, desse modo isolando ou recuperando um ácido nucléicoque codifica um polipeptídeo com uma atividade de celulase de uma amostra ambiental.
104. Método para o isolamento ou recuperação de um ácido nucléico quecodifica um polipeptídeo com uma atividade de celulase de uma amostraambiental compreendendo as etapas de:(a) provisão de uma sonda de polinucleotídeos compreendendo uma seqüência como definida na reivindicação 1, ou uma sua subseqüência,ou uma sonda como definida na reivindicação 31;(b) isolamento de um ácido nucléico da amostra ambiental outratamento da amostra ambiental tal que ácido nucléico na amostra éacessível para a hibridização para dar uma sonda de polinucleotídeos da etapa (a);(c) combinação do ácido nucléico isolado ou a amostraambiental tratada da etapa (b) com a sonda de polinucleotídeo da etapa (a);e(d) isolamento de um ácido nucléico que especificamente hibridiza com a sonda de polinucleotídeo da etapa (a), desse modo isolandoou recuperando um ácido nucléico que codifica um polipeptídeo com umaatividade de celulase de uma amostra ambiental.
105. Método de acordo com a reivindicação 103 ou reivindicação104, em que a amostra ambiental compreende uma amostra de água, umaamostra de líquido, uma amostra de solo, uma amostra de ar ou umaamostra biológica, e opcionalmente a amostra biológica é derivada de uma célula bacteriana, uma célula protozoária, uma célula de inseto, uma célulade levedura, uma célula de planta, uma célula fúngica ou uma célula demamífero.
106. Método de geração de uma variante de um ácido nucléicoque codifica um polipeptídeo com uma atividade de celulase compreendendo as etapas de:(a) provisão de um ácido nucléico de modelo compreendendouma seqüência como definida na reivindicação 1; e(b) modificação, deleção ou adição de um ou mais nucleotídeosna seqüência de modelo, ou uma sua combinação, para gerar uma variante do ácido nucléico de modelo em que opcionalmente o método ulteriormentecompreende expressão do ácido nucléico variante para gerar umpolipeptídeo de celulase variante, e opcionalmente as modificações, adiçõesou deleções são introduzidas por um método compreendendo PCRpropenso a erro, embaralhamento, mutagênese oligonucleotídeo-dirigida, PCR de conjunto, mutagênese de PCR sexual, mutagênese in vivo,mutagênese de cassete, mutagênese de conjunto repetida, mutagênese deconjunto exponencial, mutagênese específica de sítio, remonatagem degene, mutagênese de saturação de sítio de gene(GSSM), remontagem deligação sintética (SLR), recombinação, recombinação de seqüência repetida, mutagênese de DNA modificada por fosfotioato, mutagênese de modelocontendo uracila, mutagênese dúplex etiquetado, mutagênese de reparo deemparelhamento de ponto, mutagênese de cepa hospedeira deficiente dereparo, mutagênese química, mutagênese radiogênica, mutagênese pordeleção, mutagênese de seleção por restrição, mutagênese de purificação por restrição, síntese de gene artificial, mutagênese de conjunto, criação demultímero de ácido nucléico quimérico e uma sua combinação eopcionalmente o método é interativamente repetido até que uma celulasetivesse uma atividade alterada ou diferente ou uma estabilidade alterada oudiferente daquela de um polipeptídeo codificado por o ácido nucleico demodelo é produzido.
107. Método de acordo com a reivindicação 106, em que o polipeptídeo de celulase variante: (a) é termotolerante, e retém algumaatividade depois de ser exposto a uma temperatura elevada; (b) temglicosilação aumentada em comparação com a celulase codificada por umácido nucleico de modelo; ou, (c) tem uma atividade de celulase sob umaalta temperatura, em que a celulase codificada pelo ácido nucleico de modelo não é ativo sob alta temperatura.
108. Método de acordo com a reivindicação 106, em que ométodo é interativamente repetido até que (a) uma seqüência de codificaçãode celulase tendo um uso de códon alterado daquele do ácido nucleico demodelo é produzida, ou, (b) um gene de celulase tendo nível mais alto oumais baixo de expressão de mensagem ou estabilidade daquele do ácidonucleico de modelo é produzido.
109. Método para a modificação de códons em um ácidonucleico que codifica um polipeptídeo com uma atividade de celulase paraaumentar sua expressão em uma célula hospedeira, o método compreendendo as seguintes etapas:(a) provisão de um ácido nucleico que codifica um polipeptídeocom uma atividade de celulase compreendendo uma seqüência comodefinida na reivindicação 1; e,•■ (b) identificação de um códon não preferido ou menos preferido no ácido nucleico da etapa (a) e substituição dele com um códon preferidoou neutralmente usado que codifica o mesmo aminoácido como o códonsubstituído, em que um códon preferido é um códon ultra-representado nasseqüências de codificação em genes na célula hospedeira e códon nãopreferido ou menos preferido é um códon sub-representado nas seqüênciasde codificação em genes na célula hospedeira, desse modo modificando oácido nucleico para aumentar sua expressão em uma célula hospedeira.
110. Método para a modificação de códons em um ácidonucléico que codifica um polipeptídeo de celulase, o método compreendendoas seguintes etapas:(a) provisão de um ácido nucléico que codifica um polipeptídeocom uma atividade de celulase compreendendo uma seqüência como definida na reivindicação 1; e,(b) identificação de um códon no ácido nucléico da etapa (a) esubstituição dele com um códon diferente que codifica o mesmo aminoácidocomo o códon substituído, desse modo modificando códons em um ácidonucléico que codifica uma celulase.
111. Método para a modificação de códons em um ácidonucléico que codifica um polipeptídeo de celulase para aumentar suaexpressão em uma célula hospedeira, o método compreendendo asseguintes etapas:(a) provisão de um ácido nucléico que codifica um polipeptídeo de celulase compreendendo uma seqüência como definida na reivindicação1;e,(b) identificação de um códon não preferido ou menos preferidono ácido nucléico da etapa (a) e substituição dele com um códon preferidoou neutralmente usado que codifica o mesmo aminoácido como o códon substituído, em que um códon preferido é um códon ultra-representado nasseqüências de codificação em genes na célula hospedeira e códon nãopreferido ou menos preferido é um códon sub-representado nas seqüênciasde codificação em genes na célula hospedeira, desse modo modificação oácido nucléico para aumentar sua expressão em uma célula hospedeira.
112. Método para a modificação de um códon em um ácido nucléico que codifica um polipeptídeo tendo uma atividade de celulase paradiminuir sua expressão em uma célula hospedeira, o métodocompreendendo as seguintes etapas:(a) provisão de um ácido nucléico que codifica um polipeptídeo de celulase compreendendo uma seqüência como definida na reivindicação1;e(b) identificação de pelo menos um códon preferido no ácidonucléico da etapa (a) e substituição dele com um códon não preferido oumenos preferido que codifica o mesmo aminoácido o como o códonsubstituído, em que um códon preferido é um códon ultra-representado nasseqüências de codificação em genes em uma célula hospedeira e códon não preferido ou menos preferido é um códon sub-representado nas seqüênciasde codificação em genes na célula hospedeira, desse modo modificação oácido nucléico para diminuir sua expressão em uma célula hospedeira, emque opcionalmente a célula hospedeira é uma célula bacteriana, uma célulafúngica, uma célula de inseto, uma célula de levedura, uma célula de planta ou uma célula de mamífero.
113. Método para a produção de uma biblioteca de ácidonucléicos que codifica uma pluralidade de sítios ativos de celulasemodificados ou sítios de ligação de substrato, em que os sítios ativosmodificados ou sítios de ligação de substrato são derivados de um primeiro ácido nucléico compreendendo uma seqüência que codifica um primeiro sítioativo ou um primeiro sítio de ligação de substrato o método compreendendoas seguintes etapas: (a) provisão de um primeiro ácido nucléico que codifica umprimeiro sítio ativo ou primeiro sítio de ligação de substrato, em que a primeira seqüência de ácidos nucléicos compreende uma seqüência quehibridiza sob condições rigorosas para dar uma seqüência como indicada naSEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9,SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID 5 NO: 15, SEQ ID NO: 17, SEQ IDNO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ IDNO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45,SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ IDNO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63,SEQ ID 0 NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81,SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ IDNO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99,SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ IDNO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO:125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141 SEQID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ IDNO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO:159, SEQ ID NO: 161, SEQ ID NO: 163 ou SEQ ID NO: 165, ou uma suasubseqüência, e o ácido nucléico codifica um sítio ativo de celulase ou um substrato de sítio de ligação de celulase;(b) provisão de um conjunto de oligonucleotídeos mutagênicosque codificam variantes de aminoácido de ocorrência natural a umapluralidade de códons direcionados em um primeiro ácido nucléico; e, o (c)usando-se o conjunto de oligonucleotídeos mutagênicos para gerar um conjunto de ácidos nucléicos variantes de codificação de sítio de ligação desubstrato ou de codificação de sítio ativo que codificam uma faixa devariações de aminoácidos em cada códon de aminoácido que foimutagenizado, desse modo produzindo uma biblioteca de ácidos nucléicosque codifica uma pluralidade de sítios ativos de celulase modificados ou sítios de ligação de substrato, em que opcionalmente um oligonucleotídeomutagênico ou uma variante de ácido nucléico é gerado por um métodocompreendendo um sistema de evolução dirigido otimizado, Mutagenese desaturação de sítio de gene (GSSM), ou uma remontagem de ligação sintética(SLR), PCR propenso a erro, embaralhamento, mutagenese oligonucleotídeo-dirigida, PCR de conjunto, mutagenese de PCR sexual,mutagenese in vivo, mutagenese de cassete, mutagenese de conjuntorepetida, 0 mutagenese de conjunto exponencial, mutagenese específica desítio, remonatagem de gene, recombinaçao, recombinaçao de seqüênciarepetida, mutagenese de DNA modificado por fosfotioato, mutagenese demodelo contendo uracila, mutagenese dúplex etiquetado, mutagenese dereparo de emparelhamento de ponto, mutagenese de cepa hospedeiradeficiente de reparo, mutagenese química, mutagenese radiogênica,mutagênese por deleção, mutagênese de seleção por restrição, mutagênesede purificação por restrição, síntese de gene artificial, mutagênese deconjunto, criação de multímero de ácido nucléico quimérico e uma suacombinação.
114. Método para a produção de uma molécula pequenacompreendendo as seguintes etapas:(a) provisão de uma pluralidade de enzimas biossintéticascapazes de sintetizar ou modificar uma molécula pequena, em que uma dasenzimas compreende uma enzima de celulase codificada por um ácido nucléico compreendendo uma seqüência como definida na reivindicação 1;(b) provisão de um substrato pelo menos uma das enzimas daetapa (a); e(c) reação do substrato da etapa (b) com as enzimas sobcondições que facilitam uma pluralidade de reações biocatalíticas para gerar uma molécula pequena por uma série de reações biocatalíticas.
115. Método para a modificação de uma molécula pequenacompreendendo as seguintes etapas:(a) provisão de uma enzima de celulase, em que a enzimacompreende um polipeptídeo como definido na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico compreendendo umaseqüência de ácidos nucléicos como definida na reivindicação 1; (b) provisãode uma molécula pequena; e(c) reação da enzima da etapa (a) com a molécula pequena daetapa (b) sob condições que facilitam uma reação enzimática catalisada pela enzima de celulase, desse modo modificando uma molécula pequena poruma reação enzimática de celulase, em que opcionalmente a etapa (b)compreende provisão de uma pluralidade de substratos de moléculapequena para a enzima da etapa (a), desse modo gerando uma biblioteca demoléculas pequenas modificadas produzidas por pelo menos uma reação enzimática catalisada pela enzima de celulase; e opcionalmente o métodoulteriormente compreende provisão de uma pluralidade de enzimasadicionais sob condições que facilitam uma pluralidade de reaçõesbiocatalíticas pelas enzimas para formar uma biblioteca de moléculaspequenas modificadas produzidas pela pluralidade de reações enzimáticas;e opcionalmente o método ulteriormente compreende a etapa de testagemda biblioteca para determinar se uma molécula pequena modificada particular que exibe uma atividade desejada está presente dentro dabiblioteca, em que opcionalmente a etapa de testagem da bibliotecaulteriormente compreende as etapas de eliminação sistemática todas excetouma das.reações biocatalíticas usadas para produzir uma porção dapluralidade das moléculas pequenas modificadas dentro da biblioteca por testagem da porção da molécula pequena modificada quanto a presença ouausência da molécula pequena modificada particular com uma atividadedesejada, e identificação de pelo menos uma reação biocatalítica que produza molécula pequena modificada particular da atividade desejada.
116. Método para a determinação de um fragmento funcional deuma enzima de celulase compreendendo as etapas de:(a) provisão de uma enzima de celulase, em que a enzimacompreende um polipeptídeo como definido na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico como definido na reivindicação1; e (b) deleção uma pluralidade de resíduos de aminoácidos da seqüência da etapa (a) e testagem da subseqüência restante quanto a umaatividade de celulase, desse modo determinado um fragmento funcional deuma enzima de celulase, em que opcionalmente a atividade de celulase émedida por provisão de um substrato de celulase e detecção de uma diminuição na quantidade do substrato ou um aumento na quantidade de umproduto de reação.
117. Método para o engenheiramento de célula inteira de novosfenótipos ou fenótipos modificados por usando-se análise de fluxometabólico de tempo real, o método compreendendo as seguintes etapas: (a) produção de uma célula modificada por modificação da composição genética de uma célula, em que a composição genética émodificada por adição à célula de um ácido nucléico compreendendo umaseqüência como definida na reivindicação 1;(b) cultivo da célula modificada para gerar uma pluralidade decélulas modificadas;(c) medição de pelo menos um parâmetro metabólico da célula por monitoração da cultura de célula da etapa (b) em tempo real; e,(d) análise dos dados da etapa (c) para determinar se oparâmetro medido difere de uma medição comparável em uma célula nãomodificada sob condições similares, desse modo identificando um fenótipoengenheirado na célula usando-se análise de fluxo metabólico de tempo real, em que opcionalmente a composição genética da célula é modificadapor um método compreendendo deleção de uma seqüência ou modificaçãode uma seqüência na célula, ou, inativação da expressão de um gene, eopcionalmente o método ulteriormente compreende seleção de uma célulacompreendendo um fenótipo recentemente engenheirado, e opcionalmente o método ulteriormente compreende cultivo da célula selecionada, dessemodo gerando uma nova cepa de célula compreendendo um fenótiporecentemente engenheirado.
118. Seqüência de sinal ou líder isolada ou recombinante queconsiste em uma seqüência de aminoacidos como indicada nos resíduos amino-terminais 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21,`1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 5 a 28, 1 a 28, 1 a 30, 1 a 31,`1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1a 43 ou 1 a 44, de (a) uma seqüência de aminoacidos como definida nareivindicação 48; ou, (b) uma seqüência de aminoacidos como indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO:`10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID ID NO: 26, SEQ ID NO:`28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: `46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO:`64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ`ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO:(82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO:(100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID`NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO:(134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142,SEQ ID NO: 143, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID`NO: 160, SEQ ID NO: 162, SEQ ID NO: 164 ou SEQ ID NO: 166.
119. Polipeptídeo quimérico compreendendo pelo menos umprimeiro domínio compreendendo um peptídeo de sinal (SP) ou umaseqüência líder tendo uma seqüência de aminoácidos como definida na reivindicação 118, e pelo menos um segundo domínio compreendendo umpeptídeo ou polipeptídeo heterologo, em que o peptídeo ou polipeptídeoheterologo não está naturalmente associado ao peptídeo de sinal (SP) ouseqüência líder, e opcionalmente o peptídeo ou polipeptídeo heterologo nãoé uma celulase, e opcionalmente o peptídeo ou polipeptídeo heterologo é amino terminal a, carbóxi terminal a ou em ambas as extremidade dopeptídeo de sinal (SP) ou da seqüência líder.
120. Ácido nucléico recombinante ou isolado que codifica umpolipeptídeo quimérico, em que o polipeptídeo quimérico compreende pelomenos um primeiro domínio compreendendo peptídeo de sinal (SP) ou seqüência líder tendo uma seqüência de aminoácidos como definida nareivindicação 118, e pelo menos um segundo domínio compreendendo apeptídeo ou polipeptídeo heterologo, em que o peptídeo ou polipeptídeoheterologo não está naturalmente associado ao peptídeo de sinal (SP) ouseqüência líder.
121. Ácido nucléico recombinante ou isolado compreendendo uma seqüência que codifica um polipeptídeo tendo uma atividade decelulase e uma seqüência de sinal, em que o ácido nucléico compreendeuma seqüência como definida na reivindicação 1.
122. Ácido nucléico recombinante ou isolado de acordo com areivindicação 121, em que a seqüência de sinal é derivada de uma outraenzima de celulase ou de não celulase.
123. Ácido nucléico recombinante ou isolado compreendendouma seqüência que codifica um polipeptídeo tendo uma atividade decelulase, em que a seqüência não contém uma seqüência de sinal e o ácidonucléico compreende uma seqüência como definida na reivindicação 1.
124. Método de aumento de termotolerância outermoestabilidade de um polipeptídeo de celulase, o método compreendendoglicolisação de uma celulase, em que o polipeptídeo compreende pelomenos trinta aminoácidos contíguos de um polipeptídeo como definido nareivindicação 48, ou um polipeptídeo codificado por um ácido nucléico comodefinido na reivindicação 1, desse modo aumentando a termotolerância outermoestabilidade da celulase.
125. Método para ultra-expressão de uma celulase recombinanteem uma célula compreendendo expressão de um vetor compreendendo umaseqüência de ácidos nucléicos como definida na reivindicação 1, em queultra-expressão é efetuada por uso de um promotor de alta atividade, umvetor dicistrônico ou por ampliação de gene do vetor.
126. Método de produção de uma planta transgênicacompreendendo as seguintes etapas:(a) introdução de uma seqüência heteróloga de ácidos nucléicospara dentro da célula, em que a seqüência nucléica heteróloga compreendeuma seqüência como definida na reivindicação 1, desse modo produzindouma célula de planta transformada;(b) produção de uma planta transgênica a partir da célulatransformada, em que opcionalmente a etapa (a) ulteriormente compreendeintrodução da seqüência de ácidos nucléicos heteróloga por eletroporaçãoou microinjeção dos protoplastos de célula de planta, e opcionalmente aetapa (a) compreende introdução da seqüência de ácidos nucléicosheteróloga diertamente para tecido de planta por bombardeamento departículas de DNA ou por uso de um hospedeiro Agrobacterium tumefaciens.
127. Método de expressão uma seqüência heterologa de ácidosnucléicos em uma célula de planta compreendendo as seguintes etapas:(a) a transconstrução da célula de planta com uma seqüência heterologa de ácidos nucléicos operavelmente ligada a um promotor, em quea seqüência nucleica heterologa compreende uma seqüência como definidana reivindicação 1;(b) o crescimento da planta sob condições em que aa seqüênciade ácidos nucléicos heterologa é expressa na célula da planta.
128. Método para a hidrolisação, fragmentação ou rompimentode uma composição contendo glucano ou celulose compreendendo asseguintes etapas:(a) provisão de um polipeptídeo tendo uma atividade de celulasecomo definida na reivindicação 48, ou um polipeptídeo codificado por um ácido nucleico como definido na reivindicação 1;(b) provisão de uma composição compreendendo uma celuloseou um glucano; e(c) contato do polipeptídeo da etapa (a) com a composição daetapa (b) sob condições em que a celulase hidrolisa, fragmenta ou rompe a composição contendo glucano ou celulose, em que opcionalmente acomposição compreende uma célula de planta, uma célula bacteriana, umacélula de levedura, uma célula de inseto, ou uma célula de animal, eopcionalmente o polipeptídeo tem atividade de endoglucanase,celobioidrolase, manase e/ou beta-glicosidase.
129. Uma massa de farinha ou um produto de pão compreendendo umpolipeptídeo como definido na reivindicação 48, ou um polipeptídeocodificado por um ácido nucleico como definido na reivindicação 1, em queopcionalmente o polipeptídeo tem atividade de celulase, endoglucanase,celobioidrolase, manase e/ou beta- glicosidase.
130. Método de condicionamento de massa de farinha compreendendo o contato de uma massa de farinha ou um produto de pãocom pelo menos um polipeptídeo como definido na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico como definido na reivindicação1, sob condições suficientes para o condicionamento da massa de farinha.
131. Bebida compreendendo um polipeptídeo como definido nareivindicação 48, ou um polipeptídeo codificado por um ácido nucléico como definido na reivindicação 1, em que opcionalmente o polipeptídeo tematividade de endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
132. Método de produção de bebida compreendendoadministração de pelo menos um polipeptídeo como definido nareivindicação 48, ou um polipeptídeo codificado por um ácido nucléico como definido na reivindicação 1, a uma bebida ou um precursor de bebida sobcondições suficientes para a diminuição da viscosidade da bebida, em queopcionalmente a bebida ou precursor de bebida é um mosto ou uma cerveja.
133. Comida, um alimento ou um suplemento nutriconalcompreendendo um polipeptídeo como definido na reivindicação 48, ou um polipeptídeo codificado por um ácido nucléico como definido na reivindicação1, em que opcionalmente o polipeptídeo tem atividade de celulase,endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
134. Método para a utilização de uma celulase como umsuplemento nutriconal em uma dieta de animal, o método compreendendo: a preparação de um suplemento nutriconal contendo umaenzima de celulase compreendendo pelo menos trinta aminoácidoscontíguos de um polipeptídeo como definido na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico como definido na reivindicação1;e a administração do suplemento nutricional a um animal para aumentar a utilização de um xilano contido em um alimento ou uma comidadigerida pelo animal,em que opcionalmente o animal é um ser humano, ou o animal éum ruminante ou um animal monogástrico, e opcionalmente uma enzima de celulase é preparado porexpressão de um polinucleotídeo que codifica a celulase no organismoselecionado do grupo que consiste em uma bactéria, uma levedura, umaplanta, um inseto, um fungo, e um animal, e opcionalmente o organismo éselecionado do grupo que consiste em um S. pombe, S. cerevisiae, Pichiapastoris, E. coli, Streptomyces sp., Bacillus sp. e Lactobacillus sp.
135. Pélete ou matriz de fornecimento de enzima comestível compreendendo uma enzima de celulase recombinante termoestávelcompreendendo um polipeptídeo como definido na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico como definido na reivindicação1, em que opcionalmente o polipeptídeo tem atividade celulase,endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
136. Método para o fornecimento de um suplemento de celulasea um animal, o método compreendendo: preparação de péletes ou matriz dede fornecimento de enzima cosmetíveis compreendendo um veículocosmetível granulado e uma enzima de celulase recombinante termoestável,em que os péletes prontamente dispersam uma enzima de celulase contida ali em meio aquoso, e a enzima de celulase recombinante compreende umpolipeptídeo como definido na reivindicação 48, ou um polipeptídeocodificado por um ácido nucléico como definido na reivindicação 1; e,administração do pélete ou_matriz de fornecimento de enzima comestível aoanimal, em que opcionalmente o veículo comestível granuladocompreende um veículo selecionado do grupo que consiste em um germe degrão, um germe de grão é consumido de óleo, um feno, uma alfalfa, umcapim-rabo-de-rato, uma casca de soja, uma farinha grossa de semente degirassol e um farelo de trigo, e opcionalmente o veículo comestível compreende germe de grão cujo óleo foi consumido,e opcionalmente uma enzima de celulase é glicosilada parapromover termoestabilidade nas condições de transconstruçao em péletes,e opcionalmente a matriz de fornecimento é formada por transconstruçao em péletes de uma mistura compreendendo um germe degrão e uma celulase,e opcionalmente as condições de transconstruçao em péletesincluem aplicação de vapor,e opcionalmente as condições de transconstrução em péletescompreendem aplicação de uma temperatura em excesso de cerca de 80°Cpor cerca de 5 minutos e a enzima retém a atividade específica de pelo menos 350 a cerca de 900 unidades por miligrama de enzima.
137. Composição derivada de celulose ou celulosecompreendendo um polipeptídeo como definido na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico como definido na reivindicação1, em que opcionalmente o polipeptídeo tem atividade de celulase, endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
138. Madeira, polpa de madeira ou produto de madeiracompreendendo uma celulase como definida na reivindicação 48, ou umacelulase codificada por um ácido nucléico como definido na reivindicação 1,em-que opcionalmente a atividade de celulase compreende atividade de endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
139. Papel, polpa de madeira ou produto de madeiracompreendendo um polipeptídeo como definido na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico como definido na reivindicação1, em que opcionalmente o polipeptídeo tem atividade de celulase, endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
140. Método para redução da quantidade de celulose em umpapel, uma madeira ou um produto de madeira compreendendo o cotanto dopapel, da madeira ou do produto de madeira com uma celulase de acordocom a reivindicação 48, ou uma celulase codificada por um ácido nucléico como definido na reivindicação 1, em que opcionalmente a atividade decelulase compreende atividade de endoglucanase, celobioidrolase, manasee/ou beta-glicosidase.
141. Composição de detergente compreendendo uma celulasede acordo com a reivindicação 48, ou uma celulase codificada por um ácido nucléico como definido na reivindicação 1,em que opcionalmente o polipeptídeo é formulado em umacomposição líquida não aquosa, um sólido fundido, uma forma granular, umaforma em partículas, a um comprimido, uma forma de gel, uma forma depasta ou líquida,e opcionalmente a atividade de atividade de celulasecompreende endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
142. Composição farmacêutica ou um suplemento de dietacompreendendo uma celulase de acordo com a reivindicação 48, ou umacelulase codificada por um ácido nucléico como definido na reivindicação 1,em que opcionalmente a celulase é formulada como umcomprimido, gel, pílula, implante, líquido, spray, pó, alimento, pélete de alimento ou como uma formulação encapsuladae opcionalmente a atividade de celulase compreende atividadede endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
143. Combustível compreendendo um polipeptídeo comodefinido na reivindicação 48, ou um polipeptídeo codificado por um ácido nucléico como definido na reivindicação 1, em que opcionalmente opolipeptídeo tem atividade compreendendo atividade de celulase,endoglucanase, celobioidrolase, manase e/ou beta- glicosidase,em que opcionalmente o combustível é derivado de um materialde planta, que opcionalmente compreende batatas, soja (semente de colza), cevada, arroz, milho, aveia, trigo, beterrabas ou cana de açúcar, eopcionalmente o combustível compreende a bioetanol ou uma mistura degasolina-etanol.
144. Método para a produção de um combustívelcompreendendo o contato de uma composição compreendendo uma celulose ou um açúcar fermentável com um polipeptídeo como definido nareivindicação 48, ou um polipeptídeo codificado por um ácido nucléico comodefinido na reivindicação 1,em que opcionalmente a composição compreendendo umacelulose ou um açúcar fermentável compreende uma planta, produto de planta ou derivado de planta, e opcionalmente a planta ou produto de plantacompreende plantas de cana de açúcar ou produtos de planta, beterrabas ouaçúcar de beterraba, trigo, milho, sojas, batata, arroz ou cevada,e opcionalmente o polipeptídeo tem atividade compreendendoatividade de celulase, endoglucanase, celobioidrolase, manase e/ou beta-glicosidase, e opcionalmente o combustível compreende um bioetanol ouuma mistura de gasolina-etanol.
145. Método para a produção de bioetanol compreendendo ocontato de uma composição compreendendo uma celulose ou um açúcarfermentável com um polipeptídeo como definido na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico como definido na reivindicação1, em que opcionalmente a composição compreendendo umacelulose ou um açúcar fermentável compreende uma planta, produto deplanta ouderivado de planta, e opcionalmente a planta ou produto de plantacompreende plantas de cana de açúcar ou produto de plantas, beterrabas ouaçúcar de beterraba, trigo, milho, sojas, batata, arroz ou cevada, eopcionalmente o polipeptídeo tem atividade compreendendo atividade decelulase, endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
146. Conjunto de enzima para despolimerização de polímeroscelulósicos e hemicelulósicos em porções de carbono metabolizáveiscompreendendo um polipeptídeo como definido na reivindicação 48, ou um polipeptídeo codificado por um ácido nucléico como definido na reivindicação1, em que opcionalmente o polipeptídeo tem atividade compreendendoatividade de celulase, endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
147. Método para o processamento de um material de biomassacompreendendo lignocelulose compreendendo o contato de umacomposição compreendendo uma celulose ou um açúcar fermentável comum polipeptídeo como definido na reivindicação 48, ou um polipeptídeocodificado por um ácido nucléico como definido na reivindicação 1, em queopcionalmente o material de biomassa compreendendo lignocelulose éderivado de uma colheita agrícola, é um subproduto de uma produção decomida ou alimento, é um produto residual lignocelulósico ou é um resíduode planta, um papel residual, ou produto de papel residual, e opcionalmenteo polipeptídeo tem atividade compreendendo atividade de celulase,endoglucanase, celobioidrolase, manase e/ou beta-glicosidase, eopcionalmente um resíduo de planta compreendem troncos, folhas, cascas,palhas de milho, sabugos, madeira, lascas de madeira, polpa de madeira e serragem, e opcionalmente o resíduo de papel compreende papel defotocópia usado ou descartado, papel de impressora de computador, papelde notebook, papel de notepad, papel de máquina de escrever, jornais,revistas, papelão e materiais de embalagem com base em papel, eopcionalmente o processamento do material de biomassa gera um bioetanol.
148. Produto de laticínio compreendendo um polipeptídeo comodefinido na reivindicação 48, ou um polipeptídeo codificado por um ácidonucléico como definido na reivindicação 1, em que opcionalmente o produtode laticínio compreende um leite, um sorvete, um queijo ou um iogurte, eopcionalmente o polipeptídeo tem atividade compreendendo atividade de celulase, endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
149. Método para o aperfeiçoamento de textura e sabor de umproduto de laticínio compreendendo as seguintes etapas: (a) provisão de umpolipeptídeo como definido na reivindicação 48, ou um polipeptídeocodificado por um ácido nucléico como definido na reivindicação 1; (b)provisão de um produto de laticínio; e (c) contato do polipeptídeo da etapa(a) e o produto de laticínio da etapa (b) sob condições em que a celulasepode aperfeiçoar a textura ou sabor do produto de laticínio.
150. Têxtil ou tecido compreendendo um polipeptídeo comodefinido na reivindicação 48, ou um polipeptídeo codificado por um ácido nucléico como definido na reivindicação 1, em que opcionalmente o têxtil outecido compreende uma fibra contendo celulose, e opcionalmente opolipeptídeo tem atividade compreendendo atividade de celulase,endoglucanase, celobioidrolase, manase e/ou beta- glicosidase.
151. Método para o tratamento de produtos residuais de animais sólidos ou líquidos compreendendo as seguintes etapas:(a) provisão de um polipeptídeo como definido na reivindicação48, ou um polipeptídeo codificado por um ácido nucléico como definido nareivindicação 1, em que opcionalmente o polipeptídeo tem atividadecompreendendo atividade de celulase, endoglucanase, celobioidrolase,manase e/ou beta- glicosidase;(b) provisão de um sólido ou um resíduo de animal líquido; e(c) contato do polipeptídeo da etapa (a) e o resíduo líquido ousólido da etapa (b) sob condições em que a protease pode tratar o resíduo.
152. Produto residual processado compreendendo umpolipeptídeo como definido na reivindicação 48, ou um polipeptídeocodificado por um ácido nucléico como definido na reivindicação 1, em queopcionalmente o polipeptídeo tem atividade compreendendo atividade decelulase, endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
153. Desinfetante compreendendo um polipeptídeo tendo umaatividade de celulase, em que o polipeptídeo compreende uma seqüênciacomo definida na reivindicação 48, ou um polipeptídeo codificado por um ácido nucléico como definido na reivindicação 1, em que opcionalmente opolipeptídeo tem atividade compreendendo atividade de endoglucanase,celobioidrolase, manase e/ou beta- glicosidase.
154. Agente de biodesentoxicação ou biodefesa compreendendoum polipeptídeo tendo uma atividade de celulase, em que o polipeptídeo compreende uma seqüência como definida na reivindicação 48, ou umpolipeptídeo codificado por um ácido nucléico como definido na reivindicação1, em que opcionalmente o polipeptídeo tem atividade compreendendoatividade de endoglucanase, celobioidrolase, manase e/ou beta-glicosidase.
155. Ácido nucléico recombinante ou isolado tendo umaseqüência compreendendo pelo menos uma modificação de resíduo de base de nucleotídeo de SEQ ID NO: 163, em que a modificação compreende umaou mais das seguintes mudanças: um nucleotídeo em qualquer uma das posições de 265 a 267 émodificado em CGT, CGC, CGA, CGG, AGA ou AGG;um nucleotídeo em qualquer uma das posições de 307 a 309 é modificado em GGT, GGC, GGA ou GGG; um nucleotídeo em qualquer uma das posições de 328 a 330 émodificado em GGT, GGC, GGA ou GGG;um nucleotídeo em qualquer uma das posições de 340 a 342 émodificado em TTA, TTG, CTT, CTC, CTA ou CTG,um nucleotídeo em qualquer uma das posições de 469 a 471 é modificado em TCT, TCC, TCA, TCG, AGT ou AGC;um nucleotídeo em qualquer uma das posições de 1441 a 1443é modificado em TFT ou TTC;um nucleotídeo em qualquer uma das posições de 1648 a 1650é modificado em AAT ou A AC; ou um nucleotídeo em qualquer uma das posições de 1768 a 1770 é modificado em CGT, CGC, CGA, CGG, AGA ou AGG.
156. Polipeptídeo recombinante ou isolado tendo uma seqüênciacompreendendo pelo menos uma modificação de resíduo de aminoácido deSEQ ID NO: 164, em que a modificação compreende uma ou mais das seguintes mudanças: uma metionina na posição de aminoácido 89 émodificada em arginina; uma fenilalanina na posição de aminoácido 103 émodificada em glicina; uma prolina na posição de aminoácido 110 émodificada em glicina; uma tirosina na posição de aminoácido 114 émodificada em leucina; uma alanina na posição de aminoácido 157 é modificada em serina; um triptofano na posição de aminoácido 481 émodificado em fenilalanina; uma prolina na posição de aminoácido 550 émodificada em asparagina; ou uma glicina na posição de aminoácido 590 émodificada em arginina.
157. Ácido nucléico recombinante ou isolado tendo uma seqüência compreendendo uma modificação de seqüência de resíduo denucleotídeos de SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO:7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ IDNO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25,SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43,SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ IDNO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61,SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ IDNO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79,SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ IDNO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQID NO: 107, SEQ ID NO: 109, SEQ ID NOr III, SEQ ID NO: 113, SEQ ID NO:115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123,SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO:149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157,SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163 ou SEQ ID NO: 165,em que a modificação compreende uma ou mais das seguintes mudanças:um nucleotídeo no equivalente de qualquer uma das posições de265 a 267 de SEQ ID NO: 163 são mudadas em CGT, CGC, CGA, CGG,AGAouAGG;um nucleotídeo no equivalente de qualquer uma das posições de307 a 309 de SEQ ID NO: 163 são mudadas em GGT, GGC, GGA ou GGG;um nucleotídeo no equivalente de qualquer uma das posições de328 a 330 de SEQ ID NO: 163 são mudadas em GGT, GGC, GGA ou GGG;um nucleotídeo no equivalente de qualquer uma das posições de340 a 342 de SEQ ID NO: 163 são mudadas em TTA, TTG, CTT, CTC, CTAou CTG;- um nucleotídeo no equivalente de qualquer uma das posições de469 a 471 de SEQ ID NO: 163 são mudadas em TCT, TCC, TC A, TCG, AGTou AGC;um nucleotídeo no equivalente das posições de 1441 a 1443 de SEQ ID NO:163 são mudadas em TTT ou TTC;um nucleotídeo no equivalente de qualquer uma das posições de1648 a 1650 de SEQ ID NO: 163 são mudadas em AAT ou A AC; ouum nucleotídeo no equivalente de qualquer uma das posições de1768 to 1770 de SEQ ID NO: 163 são mudadas em CGT, CGC, CGA, CGG,AGAouAGG.
158. Ácido nucléico recombinante ou isolado tendo umaseqüência compreendendo uma modificação de seqüência de resíduo denucleotídeos de um ácido nucléico como definido na reivindicação 1, em que a modificação compreende uma ou mais das seguintes mudanças:um nucleotídeo no equivalente de qualquer uma das posições de 265 a 267 de SEQ ID NO: 163 são mudadas em CGT3 CGC, CGA, CGG,AGAouAGG;um nucleotídeo no equivalente de qualquer uma das posições de 307 a 309 de SEQ ID NO: 163 são mudadas em GGT, GGC, GGA ou GGG;um nucleotídeo no equivalente de qualquer uma das posições de328 a 330 de SEQ ID NO: 163 são mudadas em GGT, GGC, GGA ou GGG;um nucleotídeo no equivalente de qualquer uma das posições de 340 a 342de SEQ ID NO: 163 são mudadas em TTA, TTG, CTT, CTC, CTA ou CTG; um nucleotídeo no equivalente de qualquer uma das posições de 469 a 471 de SEQ ID NO: 163 são mudadas em TCT, TCC, TC A, TCG, AGTou AGC;um nucleotídeo no equivalente das posições de 1441 a 1443 deSEQ ID NO: 163 são mudadas em TTT ou TTC; um nucleotídeo no equivalente de qualquer uma das posições de1648 a 1650 de SEQ ID NO: 163 são mudadas em AAT ou AAC; ouum nucleotídeo no equivalente de qualquer uma das posições de 1768 a 1770 de SEQ ID NO: 163 são mudadas em CGT, CGC, CGA, CGG,AG A ou AGG.
159. Polipeptídeo recombinante ou isolado tendo uma seqüênciacompreendendo uma modiicação de resíduo de aminoácido de SEQ ID NO:2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ IDNO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20,SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38,SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ IDNO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56,SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ IDNO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ IDNO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ IDNO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO:110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: -118,SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQID NO: 128, SEQ ID NO: -130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO:143, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO:152;SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160,SEQ ID NO: 162, SEQ ID NO: 164 ou SEQ ID NO: 166, em que amodificação compreende uma ou mais das seguintes mudanças: um aminoácido no equivalente da metionina na posição deaminoácido 89 de SEQ ID NO: 164 é mudado em uma arginina;um aminoácido no equivalente da fenilalanina na posição deaminoácido 103 de SEQ ID NO: 164 é mudado em uma glicina;um aminoácido no equivalente da prolina na posição de aminoácido 110 de SEQ ID NO: 164 é mudado em uma glicina;um aminoácido no equivalente da tirosina na posição deaminoácido 114 de SEQ ID NO: 164 é mudado em uma leucina;um aminoácido no equivalente da alanina na posição deaminoácido 157 de SEQ ID NO: 164 é mudado em uma serina; um aminoácido no equivalente do triptofano na posição deaminoácido 481 de SEQ ID NO: 164 é mudado em uma fenilalanina;um aminoácido no equivalente da prolina na posição deaminoácido 550 de SEQ ID NO: 164 é mudado em uma asparagina; ouum aminoácido no equivalente da glicina na posição de aminoácido590 de SEQ ID NO: 164 é mudado em uma arginina.
160. Polipeptídeo recombinante ou isolado tendo uma seqüênciacompreendendo uma modiicação de resíduo de aminoácido de umpolipeptídeo como definido na reivindicação 48, em que a modificaçãocompreende uma ou mais das seguintes mudanças:um aminoácido no equivalente da metionina na posição deaminoácido89 de SEQ ID NO: 164 é mudado em uma arginina; um aminoácido no equivalente da fenilalanina na posição deaminoácido 103 de SEQ ID NO: 164 é mudado em uma glicina;um aminoácido no equivalente da prolina na posição deaminoácido 110 de SEQ ID NO: 164 é mudado em uma glicina;um aminoácido no equivalente da tirosina na posição de aminoácidol 14 de SEQ ID NO: 164 é mudado em uma leucina;um aminoácido no equivalente da alanina na posição deaminoácidol57 de SEQ ID NO: 164 é mudado em uma serina;um aminoácido no equivalente do triptofano na posição deaminoácido 481 de SEQ ID NO: 164 é mudado em uma fenilalanina; um aminoácido no equivalente da prolina na posição deaminoácido 550 de SEQ ID NO: 164 é mudado em uma asparagina; ouum aminoácido no equivalente da glicina na posição deaminoácido 590 de SEQ ID NO: 164 é mudado em uma arginina.
161.
Polipeptídeo recombinante ou isolado de acordo com a reivindicação 48, em que o polipeptídeo tendo uma seqüência como indicadana:(i) SEQ ID NO: 164, tem atividade de celulase/endoglucanasealcalina;(ii) SEQ. ID NO: 110, tem atividade de xilanase; (iii) SEQ. ID NO: tem atividade de oxidorredutase de ligação deNAD;(iv) SEQ. ID NO: 118, tem atividade desidrogenase de cadeiacurta;(v) SEQ. ID NO: 14, tem atividade de desidrogenase depedente de NADH;(vi) SEQ. ID NO: 138, tem atividade de peptidase;(vii) SEQ. ID NO: 162, tem atividade de endoglucanase alcalina(viii) SEQ. ID NO: 42, tem atividade de sintetase de tRNA decisteínila;(viii) SEQ. ID NO: 32, tem atividade de fosforilase decelodextrina;(ix) SEQ. ID NO: 50, tem atividade de oxidorredutase defdhd/narq;(x) SEQ. ID NO: 54, tem uma atividade de metiltransferase de S-adenosilmetionina (SAM) de radical; ou(xi) SEQ. ID NO: 58, tem atividade de tipo subtilisina.
BRPI0609140-7A 2005-03-15 2006-01-13 celulases, ácidos nucléicos que codificam eles e métodos para a produção e uso deles BRPI0609140A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US66222405P 2005-03-15 2005-03-15
US60/662,224 2005-03-15
PCT/US2006/002516 WO2006101584A2 (en) 2005-03-15 2006-01-13 Cellulases, nucleic acids encoding them and methods for making and using them

Publications (1)

Publication Number Publication Date
BRPI0609140A2 true BRPI0609140A2 (pt) 2010-02-17

Family

ID=37024271

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0609140-7A BRPI0609140A2 (pt) 2005-03-15 2006-01-13 celulases, ácidos nucléicos que codificam eles e métodos para a produção e uso deles

Country Status (15)

Country Link
US (3) US8426184B2 (pt)
EP (2) EP2949756A3 (pt)
JP (1) JP5343212B2 (pt)
KR (1) KR101393679B1 (pt)
CN (2) CN102943085A (pt)
AU (2) AU2006227965B2 (pt)
BR (1) BRPI0609140A2 (pt)
CA (2) CA2861310A1 (pt)
DK (1) DK1861506T3 (pt)
EA (2) EA018577B1 (pt)
MX (1) MX300732B (pt)
NZ (3) NZ583532A (pt)
PH (1) PH12007501986B1 (pt)
WO (1) WO2006101584A2 (pt)
ZA (1) ZA200707804B (pt)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040005673A1 (en) 2001-06-29 2004-01-08 Kevin Jarrell System for manipulating nucleic acids
US7435562B2 (en) 2000-07-21 2008-10-14 Modular Genetics, Inc. Modular vector systems
JP2007529993A (ja) 2003-07-02 2007-11-01 シンジェンタ パーティシペーションズ アーゲー グルカナーゼ、それらをコードする核酸並びにそれらを製造及び使用する方法
EP1817413B1 (en) 2004-11-11 2012-01-04 Modular Genetics, Inc. Oligonucleotide ladder assembly and system for generating molecular diversity
CA2861310A1 (en) 2005-03-15 2006-09-28 Bp Corporation North America Inc. Cellulases, nucleic acids encoding them and methods for making and using them
US20150328347A1 (en) 2005-03-24 2015-11-19 Xyleco, Inc. Fibrous materials and composites
US7708214B2 (en) 2005-08-24 2010-05-04 Xyleco, Inc. Fibrous materials and composites
CN103602692A (zh) 2006-02-10 2014-02-26 维莱尼姆公司 纤维素分解酶、其编码核酸及制备和使用它们的方法
CA3020590A1 (en) 2006-08-04 2009-02-12 Bp Corporation North America Inc. Glucanases, nucleic acids encoding them and methods for making and using them
JP4839231B2 (ja) * 2007-01-15 2011-12-21 清本鐵工株式会社 セサミノール配糖体のグルコシド結合分解酵素および前記酵素を産生する微生物
BRPI0807132A2 (pt) * 2007-01-30 2018-12-04 Syngenta Participations Ag enzimas para o tratamento de lignocelulósicos, ácidos nucléicos que codificam as mesmas, e metodos e uso das mesmas
SG148934A1 (en) 2007-06-11 2009-01-29 Novozymes As A process for combined biopolishing and bleach clean-up
US20090205075A1 (en) 2008-01-30 2009-08-13 Stacy Miles Use of plastid transit peptides derived from glaucocystophytes
EP2260130B1 (en) * 2008-04-04 2013-10-23 Allopartis Biotechnologies, Inc. Method of enhancing enzyme activity
US9012186B2 (en) 2009-04-27 2015-04-21 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
IT1394539B1 (it) * 2009-05-19 2012-07-05 Sentinel Ch S P A Uso di uno stabilizzante delle polimerasi per la liofilizzazione e la preparazione di kit pronti per l'uso
WO2011008785A2 (en) * 2009-07-17 2011-01-20 Novozymes A/S A method of analyzing cellulose decay in cellulosic material hydrolysis
JP5551780B2 (ja) * 2009-09-22 2014-07-16 メディカゴ インコーポレイテッド 植物由来のタンパク質を調製する方法
BR112013002381A2 (pt) * 2010-07-30 2018-01-23 Univ California polipeptídeos para uso na desconstrução de celulose.
WO2012021883A2 (en) * 2010-08-13 2012-02-16 Dyadic International, Inc. Novel fungal enzymes
WO2012027374A2 (en) * 2010-08-23 2012-03-01 Dyadic International (Usa) Inc. Novel fungal carbohydrate hydrolases
KR101479698B1 (ko) * 2011-12-15 2015-01-08 대한민국 흑염소 반추위 미생물 유래의 셀룰라아제 유전자 cel-KG20 및 이의 용도
KR101483584B1 (ko) * 2011-12-15 2015-01-19 대한민국 흑염소 반추위 미생물 유래의 셀룰라아제 유전자 cel-KG19 및 이의 용도
KR101479687B1 (ko) * 2011-12-15 2015-01-08 대한민국 흑염소 반추위 미생물 유래의 셀룰라아제 유전자 cel-KG52 및 이의 용도
EP2831100A4 (en) 2012-03-26 2016-02-10 Pronutria Inc NUTRIENT PROTEINS AND METHODS
US9700071B2 (en) 2012-03-26 2017-07-11 Axcella Health Inc. Nutritive fragments, proteins and methods
RU2634407C2 (ru) 2012-03-26 2017-10-26 Эксселла Хелт Инк. Фрагменты пищевых белков и способы их применения
EP2831098A4 (en) 2012-03-26 2016-12-07 Axcella Health Inc LOADED NUTRIENT PROTEINS AND METHODS
EP2831235B1 (en) * 2012-03-30 2018-10-24 BASF Enzymes LLC Genes encoding cellulase
CN104114765B (zh) * 2012-05-21 2016-03-30 王子控股株式会社 微细纤维的制造方法和微细纤维和无纺布以及微细纤维状纤维素
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
KR101503860B1 (ko) * 2013-06-26 2015-03-18 대한민국 흑염소 반추위 미생물 유래의 섬유소분해효소 cel45-KG80 유전자 및 이의 용도
WO2015048334A2 (en) 2013-09-25 2015-04-02 Pronutria, Inc. Edible species nutritive polypeptides and methods of production and use thereof
CN103834627B (zh) * 2014-03-11 2015-05-13 云南师范大学 一种低温木聚糖酶XynAGN16及其基因、重组载体、重组菌株
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
JP6345779B2 (ja) * 2014-07-08 2018-06-20 国立研究開発法人産業技術総合研究所 採水装置および採水方法
CN105154416B (zh) * 2015-10-21 2018-07-17 青岛蔚蓝生物集团有限公司 一种纤维二糖水解酶突变体及其应用
EP3192866A1 (en) * 2016-01-15 2017-07-19 CIC nanoGUNE - Asociación Centro de Investigación Cooperativa en Nanociencias Endocellulases and uses thereof
EP3512995A2 (en) 2016-09-16 2019-07-24 Basf Se Methods of modifying pulp comprising cellulase enzymes and products thereof
KR102010839B1 (ko) 2016-12-26 2019-08-16 대한민국 흑염소 반추위 미생물 유래의 에스터라제-kg01 유전자 및 이의 용도
KR102019987B1 (ko) 2016-12-26 2019-09-16 대한민국 흑염소 반추위 미생물 유래의 펙틴 분해효소 cel35-KG100 유전자 및 이의 용도
KR102010838B1 (ko) 2016-12-26 2019-08-16 대한민국 흑염소 반추위 미생물 유래의 알파 갈락토시다아제 cel36-KG101 유전자 및 이의 용도
KR102010836B1 (ko) 2016-12-26 2019-08-16 대한민국 흑염소 반추위 미생물 유래의 프로테아제-kg01 유전자 및 이의 용도
CN106951735B (zh) * 2017-03-10 2019-06-04 上海交通大学 一种基于分层混合模型的信号肽及其切割位点的预测方法
CN111593064B (zh) * 2019-02-01 2021-08-31 中国科学院植物研究所 一种通过抑制OsSDM基因表达提高水稻耐盐性的方法
CN110093331B (zh) * 2019-05-06 2022-04-01 武汉轻工大学 一种耐高温宽pH稳定性的甘露聚糖酶ManGold及基因与应用
CN111662831A (zh) * 2020-06-12 2020-09-15 浙江工业大学 黑曲霉Rha-N1及其应用
CN113529495B (zh) * 2021-07-22 2023-03-24 广西大学 一种高水稳定性的生物质基餐具的制备方法
CN113736807B (zh) * 2021-08-26 2023-05-02 中山大学 一种纤维二糖水解酶及其编码基因与应用
CN113930377B (zh) * 2021-10-14 2023-12-26 广西大学 一株全细胞催化提高莱鲍迪苷a含量的工程菌
CN114015676B (zh) * 2021-11-26 2023-09-22 中农华威生物制药(湖北)有限公司 一种适配中药饲料添加剂的纤维素酶的构建方法
CN115156169B (zh) * 2022-07-06 2023-07-28 杭州临港化纤有限公司 一种假捻盘的清洗工艺

Family Cites Families (206)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR790001609B1 (ko) * 1978-09-18 1979-11-23 천병두 셀루로즈를 함유하는 물질을 원료로한 자이로즈 및 에틸알코올의 동시 제조방법
US5366558A (en) 1979-03-23 1994-11-22 Brink David L Method of treating biomass material
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US5021246A (en) 1984-03-30 1991-06-04 Anheuser-Busch, Incorporated Step mashing process for producing low alcohol beer
US5087571A (en) 1984-06-22 1992-02-11 President And Fellows Of Harvard College Method for providing a cell culture from a transgenic non-human mammal
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
DE3587814T2 (de) 1985-03-30 1994-11-10 Marc Ballivet Verfahren zum erhalten von dns, rns, peptiden, polypeptiden oder proteinen durch dns-rekombinant-verfahren.
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5573933A (en) 1987-04-14 1996-11-12 Luminis Pty, Ltd. Transgenic pigs
US4788066A (en) * 1987-12-14 1988-11-29 Grain Processing Corporation Preparation of low alcohol beer
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5094951A (en) * 1988-06-21 1992-03-10 Chiron Corporation Production of glucose oxidase in recombinant systems
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
SU1685376A1 (ru) * 1989-04-14 1991-10-23 Вильнюсский Государственный Педагогический Институт Способ кормлени цыпл т-бройлеров
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5589583A (en) 1990-01-11 1996-12-31 Monsanto Company Plant promoter
EP0528881A4 (en) 1990-04-24 1993-05-26 Stratagene Methods for phenotype creation from multiple gene populations
US5326477A (en) * 1990-05-07 1994-07-05 Bio-Sep, Inc. Process for digesting solid waste
KR100237148B1 (ko) * 1990-05-09 2000-01-15 한센 핀 베네드 엔도글루칸아제 효소를 함유하는 셀룰라제 제조물
JPH06507782A (ja) 1990-06-15 1994-09-08 サイオス ノバ インコーポレイテッド アルツハイマー病のアミロイド形成開症状を示すヒト以外の組換え哺乳動物
ATE191931T1 (de) 1990-11-23 2000-05-15 Plant Genetic Systems Nv Verfahren zur transformation monokotyler pflanzen
ES2322032T3 (es) * 1990-12-10 2009-06-16 Genencor Int Sacrificacion mejorada de celulosa por clonacion y amplificacion del gen de beta-glucosidasa de trichoderma reesei.
AU9166691A (en) 1990-12-20 1992-07-22 Ixsys, Inc. Optimization of binding proteins
SU1789167A1 (en) * 1990-12-28 1993-01-23 Mo T I Pishchevoj Promy Method of preparing dough for bread articles
NL9100050A (nl) 1991-01-11 1992-08-03 Heineken Technische Beheer Bv Werkwijze voor het continu bereiden van wort.
US5405624A (en) 1991-02-14 1995-04-11 Bio-Technical Resources Process for producing a product with an intensified beer flavor
US6110700A (en) 1991-03-11 2000-08-29 The General Hospital Corporation PRAD1 cyclin and its cDNA
US5922854A (en) 1991-06-14 1999-07-13 Kumar; Ramesh Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids
CA2075135A1 (en) 1991-08-02 1993-02-03 David E. Ellis Particle-mediated transformation of gymnosperms
US5632957A (en) 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
JPH05236997A (ja) 1992-02-28 1993-09-17 Hitachi Ltd ポリヌクレオチド捕捉用チップ
US5550046A (en) 1992-03-27 1996-08-27 Toyo Boseki Kabushiki Kaisha DNA encoding α-glucosidase and method of producing same by genetic engineering
EP0625006A4 (en) 1992-11-20 1996-04-24 Agracetus Transgenic cotton plants producing heterologous bioplastic.
BR9307805A (pt) 1992-12-31 1996-07-30 Metallgesellschaft Ag Processo para a preparaçao de cerveja
AU7925094A (en) 1993-09-30 1995-04-18 Agracetus, Inc. Transgenic cotton plants producing heterologous peroxidase
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US6468742B2 (en) 1993-11-01 2002-10-22 Nanogen, Inc. Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip
US5965452A (en) 1996-07-09 1999-10-12 Nanogen, Inc. Multiplexed active biologic array
DK131193D0 (pt) 1993-11-23 1993-11-23 Novo Nordisk As
US5571703A (en) 1993-12-23 1996-11-05 Controlled Environmental Systems Corporation Municipal solid waste processing facility and commercial ethanol production process
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5639940A (en) 1994-03-03 1997-06-17 Pharmaceutical Proteins Ltd. Production of fibrinogen in transgenic animals
EP0750671A1 (en) 1994-03-09 1997-01-02 Abbott Laboratories Transgenic animals producing oligosaccharides and glycoconjugates
NZ279676A (en) 1994-03-09 1998-04-27 Abbott Lab Humanized milk produced by non-human transgenic mammal transformed with a heterologous gene coding for human enzyme producing human oligosaccharides and glycoconjugates
AU2067795A (en) 1994-03-29 1995-10-17 Novo Nordisk A/S Alkaline bacillus amylase
US5750870A (en) 1994-06-17 1998-05-12 Agritope, Inc. Plant genetic transformation methods and transgenic plants
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5582681A (en) * 1994-06-29 1996-12-10 Kimberly-Clark Corporation Production of soft paper products from old newspaper
US5959171A (en) 1994-08-17 1999-09-28 Pharming B.V. Method for the production of biologically active polypeptides in a mammal's
US6211428B1 (en) 1994-09-01 2001-04-03 Merck & Co., Inc. Transgenic mouse expressing a familial form of human amyloid precursor protein
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US6111166A (en) 1994-09-19 2000-08-29 Medarex, Incorporated Transgenic mice expressing human Fcα and β receptors
US5880327A (en) 1994-09-21 1999-03-09 American National Red Cross Transgenic mammals expressing human coagulation factor VIII
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US6187992B1 (en) 1994-12-05 2001-02-13 Merck & Co., Inc. Transgenic mouse having a disrupted amyloid precursor protein gene
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US5633440A (en) 1994-12-20 1997-05-27 Dna Plant Technology Corporation P119 promoters and their uses
US5705369A (en) 1994-12-27 1998-01-06 Midwest Research Institute Prehydrolysis of lignocellulose
CA2209617C (en) 1995-01-26 2002-05-28 Novo Nordisk A/S Animal feed additives comprising xylanase
US6093562A (en) 1996-02-05 2000-07-25 Novo Nordisk A/S Amylase variants
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
EP0831854A4 (en) 1995-06-06 2001-01-24 Isis Pharmaceuticals Inc OLIGONUCLEOTIDS WITH PHOSPHOROTHIOATE BINDINGS OF HIGH CHIRAL PURITY
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
FR2736359B1 (fr) * 1995-07-06 1997-10-03 Agronomique Inst Nat Rech Beta-glucosidase de champignons filamenteaux, et ses utilisations
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
AU6513096A (en) 1995-07-19 1997-02-18 Novo Nordisk A/S Treatment of fabrics
EP0758135A3 (en) * 1995-08-08 2000-01-05 Teikoku Tsushin Kogyo Co. Ltd. Rotary switch
US5962258A (en) 1995-08-23 1999-10-05 Diversa Corporation Carboxymethyl cellulase fromthermotoga maritima
WO1997016533A1 (en) 1995-10-31 1997-05-09 The Regents Of The University Of California Mammalian artificial chromosomes and methods of using same
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US6358709B1 (en) 1995-12-07 2002-03-19 Diversa Corporation End selection in directed evolution
US6361974B1 (en) 1995-12-07 2002-03-26 Diversa Corporation Exonuclease-mediated nucleic acid reassembly in directed evolution
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US6939689B2 (en) 1995-12-07 2005-09-06 Diversa Corporation Exonuclease-mediated nucleic acid reassembly in directed evolution
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US6740506B2 (en) 1995-12-07 2004-05-25 Diversa Corporation End selection in directed evolution
US20030215798A1 (en) 1997-06-16 2003-11-20 Diversa Corporation High throughput fluorescence-based screening for novel enzymes
US6022963A (en) 1995-12-15 2000-02-08 Affymetrix, Inc. Synthesis of oligonucleotide arrays using photocleavable protecting groups
US6013440A (en) 1996-03-11 2000-01-11 Affymetrix, Inc. Nucleic acid affinity columns
JP3962805B2 (ja) * 1996-03-14 2007-08-22 独立行政法人産業技術総合研究所 セルラーゼ活性を有するタンパク質およびその製造法
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6025155A (en) 1996-04-10 2000-02-15 Chromos Molecular Systems, Inc. Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes
EP0910631B1 (en) * 1996-04-12 2005-03-16 Novozymes A/S Enzyme-containing granules and process for the production thereof
US5697987A (en) 1996-05-10 1997-12-16 The Trustees Of Princeton University Alternative fuel
US6197070B1 (en) 1996-05-15 2001-03-06 The Procter & Gamble Company Detergent compositions comprising alpha combination of α-amylases for malodor stripping
WO1997046313A1 (en) 1996-06-07 1997-12-11 Eos Biotechnology, Inc. Immobilised linear oligonucleotide arrays
US5833857A (en) 1996-06-07 1998-11-10 Lytal Family Trust Mobile Bioreactor and Biogenerator
US5747320A (en) * 1996-08-02 1998-05-05 The United States Of America, As Represented By The Secretary Of Agriculture Glucose and cellobiose tolerant β-glucosidase from Candida peltata
WO1998006892A1 (en) * 1996-08-16 1998-02-19 International Paper Company Enzymatic freeness enhancement
US6326341B1 (en) 1996-09-11 2001-12-04 The Procter & Gamble Company Low foaming automatic dishwashing compositions
ES2242234T3 (es) * 1996-09-12 2005-11-01 Syngenta Participations Ag Plantas transgenicas que expresan enzimas celuloliticas.
ES2242986T3 (es) * 1996-12-06 2005-11-16 Diversa Corporation Enzimas glicosidasa.
US6069122A (en) 1997-06-16 2000-05-30 The Procter & Gamble Company Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution
JP4062366B2 (ja) 1997-01-17 2008-03-19 マキシジェン,インコーポレイテッド 再帰的配列組換えによる全細胞および生物の進化
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
DE19703364A1 (de) 1997-01-30 1998-08-06 Henkel Ecolab Gmbh & Co Ohg Pastenförmiges Wasch- und Reinigungsmittel
JP2001515356A (ja) 1997-03-18 2001-09-18 ノボ ノルディスク アクティーゼルスカブ Dnaライブラリーの試験管内作製方法
ATE274596T1 (de) 1997-03-18 2004-09-15 2B Biotec Ag Verfahren zur verwertung von pflanzlicher biomasse und schneckenpresse zur durchführung dieses verfahrens
DE69840382D1 (de) 1997-03-18 2009-02-05 Novozymes As Methode zur herstellung einer bibliothek mittels dna-shuffling
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6333181B1 (en) 1997-04-07 2001-12-25 University Of Florida Research Foundation, Inc. Ethanol production from lignocellulose
RU2127760C1 (ru) * 1997-04-22 1999-03-20 Акционерное общество открытого типа "Туласпирт" спиртоводочный завод "Лужковский" Способ производства этилового спирта из зернового сырья
US5916780A (en) * 1997-06-09 1999-06-29 Iogen Corporation Pretreatment process for conversion of cellulose to fuel ethanol
US7019827B2 (en) 1997-06-16 2006-03-28 Diversa Corporation GigaMatrix holding tray having through-hole wells
AUPO758297A0 (en) 1997-06-27 1997-07-24 Rowe, James Baber Control of acidic gut syndrome
NZ328434A (en) * 1997-07-24 1998-05-27 Univ British Columbia Substitu Coniferin beta-glucosidase cdna for modifying lignin content in plants
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
NZ512199A (en) * 1997-07-27 2001-11-30 Yissum Res Dev Co Method of producing transgenic plants of altered morphology by expressing a recombinant nucleic acid encoding a cell wall modulation protein fused to a secretion signal peptide
US5958758A (en) * 1997-08-04 1999-09-28 Biosun Systems Corporation Treatment of animal waste
RU2238324C2 (ru) * 1997-08-07 2004-10-20 Оберн Юниверсити Универсальный вектор для стабильной трансформации хлоропластного генома, способ стабильной трансформации растения-мишени, способ придания устойчивости к гербициду растению-мишени, способ определения трансформации хлоропласта и стабильно трансформированный хлоропластный геном
WO1999009217A1 (en) 1997-08-15 1999-02-25 Hyseq, Inc. Methods and compositions for detection or quantification of nucleic acid species
US5871550A (en) * 1997-08-26 1999-02-16 Genencor International, Inc. Mutant Thermonospora spp. cellulase
JP2001515735A (ja) 1997-09-11 2001-09-25 ジェノベイションズ, インコーポレイテッド 高密度アレイを作製する方法
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
US6399383B1 (en) 1997-10-28 2002-06-04 Maxygen, Inc. Human papilloma virus vectors
CN1163597C (zh) 1997-10-30 2004-08-25 诺维信公司 α-淀粉酶突变体
WO1999023107A1 (en) 1997-10-31 1999-05-14 Maxygen, Incorporated Modification of virus tropism and host range by viral genome shuffling
ATE234913T1 (de) 1997-11-10 2003-04-15 Procter & Gamble Verfahren zur herstellung einer waschmitteltablette
EP0921189B1 (en) 1997-11-14 2005-01-12 Sankyo Company Limited Transgenic animal allergy models and methods for their use
DK1036198T3 (da) 1997-12-08 2013-01-02 California Inst Of Techn Fremgangsmåde til fremstilling af polynukleotid- og polypeptidsekvenser
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
JP2002507393A (ja) 1998-02-11 2002-03-12 マキシジェン, インコーポレイテッド 抗原ライブラリー免疫
MXPA00007889A (es) 1998-02-11 2002-09-18 Maxygen Inc Optimizacion de las propiedades inmunomoduladoras de las vacunas geneticas.
US6537749B2 (en) 1998-04-03 2003-03-25 Phylos, Inc. Addressable protein arrays
US6156952A (en) 1998-04-09 2000-12-05 Constituent Institution Of The University Of Maryland System HIV transgenic animals and uses therefor
JP2003527450A (ja) 1998-05-01 2003-09-16 ノボ ノルディスク アクティーゼルスカブ N−ヒドロキシアセトアニリドの様な増強剤
US6048695A (en) 1998-05-04 2000-04-11 Baylor College Of Medicine Chemically modified nucleic acids and methods for coupling nucleic acids to solid support
EP0976838A1 (en) * 1998-05-06 2000-02-02 Rhone-Poulenc Nutrition Animale Enzymes mixture
CA2326403A1 (en) * 1998-05-06 1999-11-11 University Of Georgia Research Foundation, Inc. Beta-glucosidase coding sequences and protein from orpinomyces pc-2
DE19824705A1 (de) 1998-06-03 1999-12-09 Henkel Kgaa Amylase und Protease enthaltende Wasch- und Reinigungsmittel
JP4700805B2 (ja) 1998-06-29 2011-06-15 ブリストル−マイヤーズ スクウィブ カンパニー 多様性の高いライブラリーを製造する方法
US6268329B1 (en) * 1998-06-30 2001-07-31 Nouozymes A/S Enzyme containing granule
JP4335995B2 (ja) 1998-07-22 2009-09-30 昭 神谷 環境保全型粒状洗浄用組成物
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
GB2340755B (en) 1998-08-24 2002-09-25 Cannon Rubber Ltd Breast pump insert
US6602700B1 (en) * 1998-09-04 2003-08-05 University Of Georgia Research Foundation, Inc. Phenolic acid esterases, coding sequences and methods
AU6046199A (en) * 1998-09-17 2000-04-03 Novozymes North America, Inc. Methods for deinking and decolorizing printed paper
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
WO2000024879A1 (fr) * 1998-10-23 2000-05-04 Meiji Seika Kaisha, Ltd. Preparations a base d'endoglucanases et de cellulase
RU2246295C2 (ru) * 1998-11-02 2005-02-20 Элзэ Копэрейшн Лекарственная форма c постоянной скоростью высвобождения лекарственного вещества, ядро лекарственной формы и способ обеспечения облегченного высвобождения лекарственного вещества из лекарственной формы
US6277489B1 (en) 1998-12-04 2001-08-21 The Regents Of The University Of California Support for high performance affinity chromatography and other uses
US7220542B2 (en) * 2000-07-17 2007-05-22 Van Den Brink Johannes Maarten Expression cloning in filamentous fungi
US6566113B1 (en) * 1998-12-24 2003-05-20 Takara Shuzo Co., Ltd. Polypeptide having cellobiohydrolase activity
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
US6309871B1 (en) 1999-03-31 2001-10-30 Novozymes A/S Polypeptides having alkaline α-amylase activity
US6221653B1 (en) 1999-04-27 2001-04-24 Agilent Technologies, Inc. Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids
GB2394350B (en) * 1999-07-05 2004-06-16 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
US6409841B1 (en) 1999-11-02 2002-06-25 Waste Energy Integrated Systems, Llc. Process for the production of organic products from diverse biomass sources
CA2360750A1 (en) 1999-11-22 2001-05-31 Diversa Corporation Capillary array-based sample screening
US20010008765A1 (en) 1999-12-06 2001-07-19 Fuji Photo Film Co., Ltd. DNA chip and reactive solid carrier
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
CA2689798C (en) * 2000-03-20 2015-01-20 Basf Aktiengesellschaft Talaromyces emersonii beta-glucanases
CA2413022A1 (en) 2000-06-14 2001-12-20 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
RU2170253C1 (ru) * 2000-06-22 2001-07-10 Некоммерческое партнерство "Институт биотехнологии" Мультиэнзимная композиция для животноводства
US6423145B1 (en) * 2000-08-09 2002-07-23 Midwest Research Institute Dilute acid/metal salt hydrolysis of lignocellulosics
RU2167193C1 (ru) * 2000-09-22 2001-05-20 Пермское открытое акционерное общество "ПЕМОС" Синтетическое моющее средство для стирки детского белья
US7419809B2 (en) 2000-09-25 2008-09-02 Iogen Energy Corporation Method for glucose production with a modified cellulase mixture
WO2002029032A2 (en) 2000-09-30 2002-04-11 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
MXPA02005717A (es) 2000-10-10 2003-10-14 Diversa Corp Analisis de alto rendimiento o a base de capilares para bioactividad o biomoleuclas.
EP1332153A4 (en) 2000-10-12 2006-01-11 Exelixis Inc HUMAN ECT2 AND METHOD OF USE THEREOF
US6309872B1 (en) 2000-11-01 2001-10-30 Novozymes Biotech, Inc Polypeptides having glucoamylase activity and nucleic acids encoding same
EP1347770A4 (en) 2000-11-30 2005-10-19 Diversa Corp PROCESS FOR PREPARING A PROTEIN POLYMER AND USE OF THE POLYMER
RU2189387C1 (ru) * 2001-03-05 2002-09-20 Открытое акционерное общество "Пивоваренная компания "Балтика" Способ производства светлого пива "арсенальное легкое № 1"
WO2002099091A2 (en) 2001-06-06 2002-12-12 Novozymes A/S Endo-beta-1,4-glucanase from bacillus
ES2397267T3 (es) 2001-06-26 2013-03-05 Novozymes A/S Polipéptidos con actividad de celobiohidrolasa I y polinucleótidos que codifican los mismos
US7393673B2 (en) * 2001-07-28 2008-07-01 Midwest Research Institute Thermal tolerant exoglucanase from Acidothermus cellulolyticus
WO2003012109A1 (en) 2001-07-28 2003-02-13 Midwest Research Institute Thermal tolerant cellulase from acidothermus cellulolyticus
JP2005508619A (ja) * 2001-08-03 2005-04-07 ディヴァーサ コーポレイション エポキシドヒドロラーゼ、それらをコードした核酸及びそれらの作製法と利用法
DE02786364T1 (de) 2001-10-01 2005-01-13 Diversa Inc., San Diego Konstruktion ganzer zellen unter verwendung einer echtzeitanalyse des metabolischen flusses
JP2005517427A (ja) * 2002-02-20 2005-06-16 サーナ・セラピューティクス・インコーポレイテッド 短干渉核酸(siNA)を用いるC型肝炎ウイルス(HCV)遺伝子発現のRNA干渉媒介性阻害
US7314974B2 (en) * 2002-02-21 2008-01-01 Monsanto Technology, Llc Expression of microbial proteins in plants for production of plants with improved properties
US6918738B2 (en) 2002-03-11 2005-07-19 Diversa Corporation Stackable sample holding plate with robot removable lid
US20040005674A1 (en) 2002-04-30 2004-01-08 Athenix Corporation Methods for enzymatic hydrolysis of lignocellulose
USD480814S1 (en) 2002-06-11 2003-10-14 Diversa Corporation Gigamatrix holding tray
EP2305800B1 (en) 2002-08-16 2015-05-27 Danisco US Inc. Novel variant hyprocrea jecorina CBH1 cellulases
US6776979B2 (en) 2002-12-30 2004-08-17 Marvin B. Frager Periodontal treatment compound and method of use
WO2004066945A2 (en) * 2003-01-24 2004-08-12 Diversa Corporation Enzymes and the nucleic acids encoding them and methods for making and using them
AU2003219956A1 (en) 2003-02-27 2004-09-28 Midwest Research Institute Superactive cellulase formulation using cellobiohydrolase-1 from penicillium funiculosum
US20040231060A1 (en) 2003-03-07 2004-11-25 Athenix Corporation Methods to enhance the activity of lignocellulose-degrading enzymes
JP2007529993A (ja) 2003-07-02 2007-11-01 シンジェンタ パーティシペーションズ アーゲー グルカナーゼ、それらをコードする核酸並びにそれらを製造及び使用する方法
DK2213732T3 (da) * 2003-10-28 2014-08-18 Novozymes North America Inc Hybride glucoamylaser
US7338763B2 (en) 2004-06-02 2008-03-04 Eppendorf Array Technologies S.A. Method and kit for the detection and/or quantification of homologous nucleotide sequences on arrays
US20060147581A1 (en) * 2004-12-22 2006-07-06 Novozymes A/S Hybrid enzymes
CA2861310A1 (en) 2005-03-15 2006-09-28 Bp Corporation North America Inc. Cellulases, nucleic acids encoding them and methods for making and using them
US9409174B2 (en) 2013-06-21 2016-08-09 Bio-Rad Laboratories, Inc. Microfluidic system with fluid pickups

Also Published As

Publication number Publication date
CN102943085A (zh) 2013-02-27
US20100003234A1 (en) 2010-01-07
EP1861506A4 (en) 2009-12-09
MX2007011260A (es) 2008-04-17
EA013540B1 (ru) 2010-06-30
AU2006227965B2 (en) 2013-01-31
WO2006101584A2 (en) 2006-09-28
NZ583532A (en) 2011-09-30
KR101393679B1 (ko) 2014-05-21
US20160168552A1 (en) 2016-06-16
DK1861506T3 (en) 2015-07-20
US8426184B2 (en) 2013-04-23
CA2611859C (en) 2015-03-31
CA2611859A1 (en) 2006-09-28
KR20070116881A (ko) 2007-12-11
ZA200707804B (en) 2011-11-30
US20130330783A1 (en) 2013-12-12
EP2949756A2 (en) 2015-12-02
NZ594810A (en) 2012-12-21
WO2006101584A3 (en) 2007-09-13
EA201000255A1 (ru) 2010-08-30
CN101175860B (zh) 2012-12-05
AU2015204305A1 (en) 2015-08-06
CN101175860A (zh) 2008-05-07
EA200701981A1 (ru) 2008-06-30
EP2949756A3 (en) 2016-02-24
CA2861310A1 (en) 2006-09-28
JP5343212B2 (ja) 2013-11-13
AU2006227965A1 (en) 2006-09-28
NZ561247A (en) 2010-06-25
JP2008538176A (ja) 2008-10-16
EP1861506A2 (en) 2007-12-05
MX300732B (es) 2012-06-28
EA018577B1 (ru) 2013-09-30
EP1861506B1 (en) 2015-04-15
PH12007501986B1 (en) 2013-11-29

Similar Documents

Publication Publication Date Title
JP5343212B2 (ja) セルラーゼ、それらをコードする核酸、並びにそれらを作製及び使用する方法
JP6436946B2 (ja) グルカナーゼ、それらをコードする核酸並びにそれらを製造及び使用する方法
DK2420570T3 (en) Arabinofuranosidaseenzymer, nucleic acids encoding them, and methods for making and using them
BRPI0707784A2 (pt) xilanases, ácidos nucléicos que as codificam e métodos para produzì-las e usá-las
MX2008011442A (es) Aldolasas, acidos nucleicos que las codifican, y metodos para hacer y usar las mismas.
JP2013176393A (ja) リグノセルロース性物質を処理する酵素、前記をコードする核酸並びに前記を製造及び使用する方法
MX2010003600A (es) Xilanasas, acidos nucleicos que las codifican, y metodos para hacerlas y usarlas.
CN104651381A (zh) 转移酶和氧化还原酶、编码它们的核酸以及其制备和应用方法
AU2013201861B2 (en) Cellulases, nucleic acids encoding them and methods for making and using them
AU2013202674B2 (en) Glucanases, nucleic acids encoding them and methods for making and using them
AU2013205505B2 (en) Cellulolytic enzymes, nucleic acids encoding them and methods for making and using them
AU2008201402A1 (en) Xylanases, nucleic acids encoding them and methods for making and using them

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application fees: application dismissed [chapter 8.6 patent gazette]
B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]