BRPI0921956A2 - reagentes relacionados à celulase cel5h e seu uso em micro-organismos - Google Patents

reagentes relacionados à celulase cel5h e seu uso em micro-organismos Download PDF

Info

Publication number
BRPI0921956A2
BRPI0921956A2 BRPI0921956-0A BRPI0921956A BRPI0921956A2 BR PI0921956 A2 BRPI0921956 A2 BR PI0921956A2 BR PI0921956 A BRPI0921956 A BR PI0921956A BR PI0921956 A2 BRPI0921956 A2 BR PI0921956A2
Authority
BR
Brazil
Prior art keywords
cel5h
domain
polypeptide
cellulose
recombinant
Prior art date
Application number
BRPI0921956-0A
Other languages
English (en)
Inventor
Henri-Pierre Fierobe
Angélique Chanal-Vial
Anne-Laure Molinier
Chantal Tardif
Luc Dedieu
Original Assignee
Total S.A
L' Universite De Provence
L'universite De La Mediterranee
L'institut National Des Sciences Appliquees (Insa)
Le Centre National De Recherche Scientifique (Cnrs)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Total S.A, L' Universite De Provence, L'universite De La Mediterranee, L'institut National Des Sciences Appliquees (Insa), Le Centre National De Recherche Scientifique (Cnrs) filed Critical Total S.A
Publication of BRPI0921956A2 publication Critical patent/BRPI0921956A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

REAGENTES RELACIONADOS À CELULASE CEL5H E SEU USO EM MICRO-ORGANISMOS. A presente invenção refere-se a aplicações da celulase Cel5H de Saccharophagus degradans e seus homólogos, fragmentos funcionais e/ou variantes e formas engenheiradas da mesma, no contexto de micro-organismos recombinantes, mais particularmente solventogênico, mais particularmente C. acetobutylicum. A invenção também caracteriza um novo domínio da celulase Cel5H com uma função de módulo de ligação à celulose putativa e seus usos em proteínas quiméricas para despolimerização de substratos contendo celulose.

Description

Relatório Descritivo da Patente de lnvenção para "REAGENTES RELACIONADOS À CELULASE CEL5H E SEU USO EM MICRO- ORGANISMOS". Campo da lnvenção 5 A presente invenção refere-se à área de biotecnologia e enge- nharia genética e particularmente refere-se a estratégias para utilização de materiais celulósicos e lignocelulósicos por meio de agentes enzimáticos adequados e micro-organismos que expressam os mesmos. Mais especifi- camente, a invenção refere-se a aplicações da celulase Cel5H de Saccharo- lO phagus degradans e seus homólogos, fragmentos funcionais e/ou variantes no contexto de micro-organismos solventogênicos, assim como a novos do-
W mínios e reagentes derivados da Cel5H e homólogos da mesma. Antecedentes da lnvenção Materiais celulósicos e lignocelulósicos são os principais consti- » 15 tuintes de biomassa vegetal, e polímeros de celulose aí encontrados podem proporcionar uma fonte significante de glicose ou outros mono e oligossaca- rídeos fermentáveis que podem, por sua vez, ser metabolizados por orga- nismos solventogênicos para produzir solventes úteis, como etanol, acetona ou butanol. 20 Polímeros de celulose podem ser hidrolisados por enzimas des- poIimerizantes de celulose comumente conhecidas como enzimas celulósi- cas ou celulases. Por exemplo, a hidrólise de celulose nativa envolve princi- palmente quatro tipos de celulase: celobio-hidrolase (1,4-j3-D-glucan celobio- hidrolase, EC 3.2-1-91), endo-|3-1,4-glucanase (endo-1,4-[3-D-glucan 4- 25 glucano-hidrolase, EC 3.2.1.4), celulases endoprocessivas (EC
3.2.1.4/3.2.1.91) e Í3-g|LIcosidase (EC 3.2.1.21). Celulases e enzimas rela- cionadas têm sido amplamente utilizadas em diversas áreas de biotecnolo- gia, inclusiva na produção de alimentos, cerveja, vinho, alirnentos para ani- mais, têxtil e lavanderia, indústria de celulose e papel, indústria agrícola e 30 outros (para revisão veja Bhat 2000. Biotechnical Advances 18:355-383). Celulases podem variar em suas características, como, inter a/ia, elas podem atuar como endoglucanases ou como exoglucanases processi-
= vas, elas podem gerar monômeros ou oligômeros de diversos comprimentos, elas podem ter capacidades contrastantes para hidrolisar formas distintas de celulose como celulose cristalina, celulose semicristalina, celulose amorfa ou hemicelulose, elas podem ainda exibir diferente força de ligação a substratos 5 de celulose, diferentes parâmetros cinéticos, etc.
Portanto, é preciso investir esforço significante na caracterização adicional de celulases, de modo a i- dentificar partes funcionais ou domínios das mesmas, o que pode fundamen- tar as propriedades interessantes dessas enzimas.
Tais domínios funcionais podem ser combinados de maneira vantajosa com outras celulases ou do- lO mínios das mesmas para gerar enzimas quiméricas com atividades deseja- das.
Em adição, a expressão recombinante de celulases em micro- . organismos solventogênicos - para permitir a produção de solventes úteis
_ 4, incluindo, inter alia, etanol por esses micro-organismos diretamente a partir 15 de materiais contendo celulose — não é ainda satisfatoriamente avançada.
Para alcançar maiores aperfeiçoamentos, celulases particularmente ade- quadas para ou vantajosas em tais aplicações precisam ser reconhecidas, caracterizadas e selecionadas.
Cepa 2-40 de Saccharophagus degradans, anteriormente co- 20 nhecida como cepa 2-40 de Microbifu/ber degradans e depositada com o American Type Cu/ture Co/lection sob número de acesso ATCC 43961, é uma y-proteobactéria marinha capaz de degradar pelo menos dez polissaca- rídeos complexos diferentes incluindo, inter alia, celulose (Andrykovitch & Marx 1988. Appl Environ Microbiol 54: 3-4; Ensor et al. 1999. J lnd Microbiol 25 Biotechnol 23:123-126). O genoma de S. degradans foi sequenciado e seu sistema de celulase identificado, incluindo, entre muitas outras, uma' celulase indicada como Cel5H (Taylor et al. 2006. j.
Bacteriol 188: 3849-61). Em adição, US 2007/0292929 genericamente contempla micro-organismos incluindo bacté- 30 rias etanologênicas que expressam as proteínas degradantes de celulose de S. degradans.
Entretanto, apenas a atividade de enzimas expressas por S. degradans é demonstrada e não fica claro que qualquer dessas enzimas funcionaria de maneira apropriada quando expressa em bactérias etanolo- gênicas.
Sumário da lnvenção Os inventores realizaram extensiva caracterização da estrutura e 5 atividade da celulase CeI5H da cepa 2-40 de S. degradans e determinaram de maneira conclusiva que a Cel5H exibe uma elevada atividade sobre celu- lose cristalina.
Portanto, Cel5H é vantajosa para produção heteróloga em micro-organismos produtores de solvente (solventogênicos), mais particu- larmente em micro-organismos etanologênicos, como bactérias etanologêni- 1O cas de espécies de C/ostridium incluindo C. acetobuty/icum.
Por isso, a ex- pressão (e opcionalmente secreção) de Cel5H nesses micro-organismos possibilita seu crescimento em substratos de celulose que compreendem ou enriquecidos em celulose cristalina, semicristalina ou amorfa, desse modo
- -. permitindo a produção direta de solventes úteis como etanol a partir de subs- 15 tratos contendo celulose.
Outros dados gerados pelos inventores indicaram que Cel5H pode atuar como uma exoglucanase ou celulase endoprocessiva, em vez de uma endoglucanase, como seria esperado de seu domínio catalítico da faml- lia 5 (GH5) de glicosídeo hidrolase.
Além disso, Cel5H parece liberar princi- 20 palmente glicose, celobiose e celotriose de celulose.
Dada a natureza apa- rentemente processiva da Cel5H e a geração de derivados de celulose de baixa complexidade pela mesma, sua expressão recombinante em bactérias solventogênicas pode ser altamente vantajosa.
Por exemplo, os produtos da ação de Cel5H podem ou ser diretamente utilizados por micro-organismos 25 solventogênicos ou requerer ação mínima por outra(s) celulase(s) heterólo- ga(s), desse modo simplificando o projeto dos micro-organismos recombi- nantes e aumento a eficácia do processo.
A invenção integra as realizações inesperadas acima em seus diversos aspectos. 30 Portanto, um aspecto proporciona um micro-organismo recombi- nante que expressa o polipeptídeo Cel5H da cepa 2-40 de Saccharophagus degradans ou um homólogo do mesmo, ou um fragmento funcional e/ou va-
riante do dito polipeptídeo Cel5H ou do dito homólogo.
Mais particularmente, a invenção proporciona tais micro-organismos recombinantes que são capa- zes de degradar celulose ou material contendo celulose pelo dito polipeptí- deo Cel5H expresso. 5 De acordo com modalidades particulares, o micro-organismo é uma bactéria, mais particularmente uma bactéria soIventogênica.
Em modalidades particulares, os micro-organismos recombinan- tes compreendem uma molécula de ácido nucleico recombinante que codifi- ca o polipeptídeo Cel5H ou homólogo da mesma, ou que codifica o fragmen- lO to funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo, operavelmente ligada a sequências regulatórias que permitem a expressão m no dito micro-organismo.
Em outras modalidades particulares, o micro-organismo recom- binante produz um ou mais soIventes, combustíveis e/ou intermediários quí- 15 micos, mais particularmente solventes escolhidos a partir de etanol, acetona, butanol, ácido propiônico, ácido butirico, éter e glicerina.
Em outras modalidades, o micro-organismo solventogênico re- combinante pode produzir, ou pode ser engenheirado para produzir, pelo menos ou principalmente etanol.
A importância industrial do etanol está 20 crescendo de maneira rápida em grande parte devido a sua utilidade como um combustível ambientalmente aceitável.
Portanto, em uma modalidade, o micro-organismo solventogêni- co recombinante pode ser um micro-organismo etanologênico.
Em modalidades particulares, o micro-organismo recombinante 25 pode ser uma bactéria.
Em uma modalidade, a bactéria solventogênica re- combinante pode ser uma bactéria etanologênica.
De maneira alternativa, o micro-organismo soIventogênico recombinante pode ser levedura, mais par- ticularmente levedura etanologênica.
Por exemplo, a dita bactéria pode ser Gram-positiva, tal como, 30 por exemplo, uma bactéria da espécie de C/ostridium.
A invenção, portanto, também inclui introduzir L|ma celulase originária de uma bactéria Gram- negativa em uma bactéria Gram-positiva, o que não foi sugerido anterior-
m mente.
Alternativamente, a dita bactéria pode ser Gram-negativa.
Em modalidades particulares, o micro-organismo solventogênico recombinante e preferivelmente etanologênico é uma espécie de C/ostridium acetobuty/icum.
Essas bactérias são particularmente proficientes como bac- 5 térias produtoras de solvente e particularmente etanol.
Em uma modalidade, o polipeptídeo Cel5H ou homólogo do mesmo, ou o fragmento funcional e/ou variante do dito polipeptídeo Ce15H ou do dito homólogo, pode ser secretado pelo dito micro-organismo.
Polipep- tídeos assim secretados podem vantajosamente atuar diretamente sobre e, 10 desse modo, despolimerizar ou de outro modo interagir com ou alterar polí- meros de celulose aos quais o micro-organismo é exposto.
Entretanto, mo- dalidades onde os polipeptídeos são expressos de maneira intracelular tam- bém são contempladas.
Por exemplo, polipeptídeos assim expressos podem
- atuar sobre polímeros de celulose de outra forma internalizados pelo micro- - 15 organismo ou podem ser tornar liberados mediante lise de pelo menos uma fração dos micro-organismos.
O micro-organismo recombinante previsto aqui pode compreen- der uma molécula de ácido nucleico recombinante que codifica o polipeptí- deo Cel5H ou homólogo da mesma, ou que codifica o fragrnento funcional 20 e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo, operavelmen- te ligada a uma sequência de sinal de secreção, opcionalmente combinada com um ou mais módulos, o que permite a secreção nos ditos micro- organismos, e operavelmente ligada a sequências regulatórias que permitem a expressão no dito micro-organismo. 25 Conforme notado, a invenção também trata de homólogos de Cel5H e fragmentos funcionais e/ou variantes dos ditos homólogos, e seus usos em micro-organismos recombinantes, mais particularmente micro- organismos solventogênicos.
Preferivelmente, um homólogo de Cel5H con- forme contemplado aqui pode compreender um domlnio homólogo ao domí- 30 nio DZ de Cel5H.
Modalidades particulares proporcionam o micro-organismo re- combinante conforme ensinado aqui, em que o dito homólogo do polipeptí-
deo Cel5H é o polipeptídeo ACLA de Pseudomonas sp.
ND137. Em adição, conforme realizado pelos inventores, a estrutura de domínio do polipeptideo Cel5H nativo pode ser delineada como GH5-PSL- CBM6-EPR-DZ, em que GH5 significa seu dominio da família 5 de glicosi- 5 deo hidrolase, PSL significa o ligante de polisserina, CBM6 significa domínio da família 6 do módulo de ligação a carboidrato, EPR significa a região rica em ácido glutâmico-prolina e, sem estar limitado a esta interpretação, DZ representa um domínio C-terminal identificado pelos presentes inventores como módulo de ligação a carboidrato putativo. 10 Portanto, em modalidades particulares, o micro-organismo re- combinante conforme ensinado aqui pode expressar um fragmento funcional compreendendo um ou mais domínios escolhidos a partir de ou correspon- dentes ao domínio GH5, ao domínio CBM6 e ao domínio DZ de Cel5H.
A
- -. _ presença de um ou mais ditos domínios no fragmento pode dotar o último 15 com as funcionalidades atribuídas aos respectivos domínios.
A invenção também contempla formas engenheiradas do poli- peptídeo Cel5H, seus homóiogos, fragmentos e/ou variantes, fundidas a um ou mais domínios heterólogos que podem fornecer outras funções e ativida- des úteis em metabolismo de polímero de carboidrato, e particularmente me- 20 tabolismo de celulose, tal como despolimerização de celulose, ligação à ce- lulose, formação de celulossoma ou outras atividades.
Portanto, modalida- des particulares proporcionam micro-organismos solventogênicos recombi- nantes conforme ensinados aqui, em que o polipeptídeo Cel5H ou homólogo do mesmo, ou o fragmento funcional e/ou variante do dito polipeptídeo 25 Ce15H ou do dito homólogo, é fundido a um ou mais domínios heterólogos ao polipeptídeo Cel5H ou homólogo do mesmo, escolhido a partir de um domínio catalítico de glicosídeo hidrolase (GH), um domínio do módulo de ligação a carboidrato (CBM), um domínio de ligação à coesina tal como um domínio doquerina e um domínio hidrofílico (módulo X) de uma proteina ar- 30 cabouço celulossomal.
De maneira adicional ou alternativa, o polipeptídeo Cel5H ou homólogo do mesmo, ou o fragmento funcional e/ou variante do dito polipeptídeo Cel5H ou dito homólogo é fundido a um heterólogo ou seu peptídeo de sinal natural.
Em adição, a invenção também contempla vantagens de coex- pressar o Cel5H ou polipeptídeos relacionados com outros polipeptídeos ou enzimas, preferivelmente poiipeptídeos ou enzimas recombinantes, úteis em 5 metabolismo de poIímero de carboidrato, e particularmente metabolismo de celulose, como com polipeptídeos despolimerizantes de celulose, de Iigação à celulose, formadores de celulossoma (como, por exemplo, arcabouço) ou outros polipeptídeos.
Tal coexpresssão, e opcionalmente e particularmente cossecreção, pode proporcionar atividades e funções aditivas ou comple- lO mentares, levando a despolimerização e utilização mais eficientes da celulo- se pelos micro-organismos em questão.
Assim, outras modalidades proporcionam micro-organismos re- combinantes conforme ensinados aqui que coexpressam e opcionalmente
, -_ cossecretam o polipeptídeo Cel5H ou homólogo do mesmo, ou o fragmento 15 funcional e/ou variante do dito polipeptideo Cel5H ou do dito homólogo, com um ou mais polipeptídeos (também referidos aqui como polipeptídeos coex- pressos), preferivelmente poIipeptídeos recombinantes que participam no metabolismo de poIímero de carboidrato, e particularmente metabolismo de celulose, particularmente com uma ou mais enzimas capazes de degradar 20 material lignocelulósico, mais particularmente com uma ou mais glicosídeo hidrolases, ainda mais particularmente com Llma ou mais celulases.
Em modalidades particulares, a ação catalítica dos ditos um ou mais polipeptídeos coexpressos, como enzimas coexpressas, mais particu- Iarmente celulases coexpressas, pode ser aditiva ou complementar, preferi- 25 velmente complementar, à atividade enzimática do polipeptídeo Cel5H ou homólogo do mesmo, ou o fragmento funcional e/ou variante do dito polipep- tídeo Cel5H ou do dito homólogo.
A título de exemplo e não limitação, uma primeira celulase pode ser considerada como tendo atividade complementar a uma segunda celulase se as primeira e segunda celulases atuais preferi- 30 velmente sobre substratos distintos (tal como, por exemplo, celulose cristali- na, celulose semicristalina, celulose amorfa ou hemicelulose), ou se as pri- meira e segunda celulases produzem produtos distintos (por exemplo, popu-
lações distintas de monômeros de açúcar e/ou oligômeros), ou se a primeira celulase atua preferivelmente sobre produtos de reação da segunda celulase ou vice-versa, etc.
Em outras modalidades, a uma ou mais celulases coexpressas 5 podem ser escolhidas a partir das celulases das famílias 5, 6, 8, 9 e 48. Em outras modalidades particulares, a uma ou mais celulases coexpressas po- dem ser escolhidas a partir de celulases Cel48F, Cef9G, Cel9R, Cel9P, CeI9E, Cel9H, Cel9j, Cel9M, Cel8C, Cel5N e Cel5A de C/ostridium ce//u/o/y- ticum, e celulases Cel9A, Cel98, Cel5j, Cel5l, Cel5F, Cel5D, Cel58, Cel9G, Cel5E, Cel5A, Cel5C e Cel6A da cepa 2-40 de Saccharophagus degradans, e fragmentos funcionais e/ou variantes de qualquer uma das ditas celulases.
Outras modalidades proporcionam micro-organismos recombi- nantes conforme tratados aqui, mais particularmente micro-organismos sol- ventogênicos recombinantes, em que o polipeptideo Cel5H ou homólogo do mesmo, ou o fragmento funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo, e opciorialmente o um ou mais polipeptídeos coex- pressos, mais particularmente uma ou mais celulases coexpressas conforme tratadas aqui, estão compreendidos em um celulossoma ou minicelulossoma híbrido e/ou covalente (ambos abrangidos neste relatório descritivo pela re- ferência genérica a celulossoma). Celulossomas podem proporcionar orga- nização supramolecular de, inter a/ia, atividades de ligação a celulose e des- polimerizante de celulose, desse modo alcançando maior eficiência de me- tabolismo de poIímero de carboidrato, particularmente metabolismo de celu- lose.
Em um aspecto adicional, a invenção proporciona métodos para a degradação de um substrato compreendendo celulose, tal como material lignocelulósico ou celulósico ou biomassa, compreendendo contatar a dita substância com o micro-organismo recombinante conforme ensinado aqui.
Em modalidades particulares, a substância compreende ou é enriquecida quanto à celulose cristalina.
Um aspecto relacionado proporciona métodos para produzir um solvente, combustível ou intermediário químico a partir de um substrato m compreendendo celulose, tal como material lignocelulósico ou celulósico ou biomassa, compreendendo tratar a dita substância com um ou mais micro- organismos conforme ensinados aqui.
Em modalidades particulares, a subs- tância compreende ou é enriquecida quanto à celulose cristalina.
Em moda- 5 lidades mais particulares, o soIvente é etanol e o micro-organismo é um mi- cro-organismo etanologênico.
Em modalidades particulares, os métodos da invenção compre- endem cultivar micro-organismos recombinantes conforme descritos aqui sobre substratos de celulose compreendendo ou enriquecidos em celulose cristalina, semicristalina ou amorfa, assim garantindo a produção direta de soIventes úteis como etanol a partir de substratos contendo celulose.
Deve ser apreciado que embora nos aspectos e nas modalida- des acima mencionados a invenção tenha sido descrita principalmente em relação aos micro-organismos recombinantes, a invenção também abrange aspectos relacionados a meios e reagentes recombinantes úteis para obter os micro-organismos recombinantes, métodos para obter os micro- organismos recombinantes usando tais meios e reagentes recombinantes, métodos para expressar os polipeptídeos desejados nos micro-organismos recombinantes, assim como aos polipeptídeos expressos e combinações dos mesmos per se e métodos para preparação dos mesmos.
Em consequência, um aspecto adicional proporciona polipeptí- deos CeI5H isolados de cepa 2-40 de Saccharophagus degradans ou um homólogo dos mesmos, ou um fragmento funcional e/ou variante do dito po- lipeptídeo Cel5H ou do dito homólogo.
Um outro aspecto proporciona molé- culas de ácido nucleico recombinante que codificam o polipeptídeo Cel5H ou homólogo do mesmo, ou que codificam o fragmento funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo.
Outras modalidades deste aspecto da invenção proporcionam moléculas de ácido nucleico recombinante que codificam o polipeptídeo Ce15H ou homólogo do mesmo, ou que codificam o fragmento funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo, operavelmente Ii- gadas a sequências regulatórias que permitem a expressão em um micro-
organismo hospedeiro de interesse.
Em modalidades particulares, o dito hospedeiro é um micro-organismo solventogênico.
Em modalidades mais particulares, o dito hospedeiro é um micro-organismo solventogênico con- forme tratado neste relatório descritivo.
Em modalidades particulares das 5 moléculas de ácido nucleico recombinante providas aqui, a sequência de ácido nucleico que codifica o polipeptídeo Cel5H ou homólogo do mesmo, ou que codifica o fragmento funcional e/ou variante do dito polipeptídeo Cel5l-l ou do dito homólogo, é adaptada a uma polarização de códon de micro- organismo hospedeiro.
Outras modalidades proporcionam moléculas de ácido nucleico recombinante que codificam o polipeptídeo Cel5H ou homólogo do mesmo, ou que codificam o fragmento funcional e/ou variante do dito poIipeptídeo Cel5H ou dito homólogo, operavelmente ligadas a uma sequência de sinal de secreção que permite a secreção em um micro-organismo hospedeiro de interesse, particularmente em um micro-organismo recombinante, mais par- ticularmente em um micro-organismo solventogênico e mais preferivelmente etanologênico, conforme ensinado neste relatório descritivo.
Outras modalidades proporcionam moléculas de ácido nucleico recombinante que codificam o polipeptídeo Cel5H ou homólogo das mes- mas, ou que codificam o fragmento funcional e/ou variante do dito polipeptí- deo Cel5H ou do dito homólogo, operavelmente ligadas a uma sequência de sinal de secreção que permite a secreção em um micro-organismo hospedei- ro de interesse, e operavelmente ligadas a sequências regulatórias que per- mitem a expressão no micro-organismo hospedeiro de interesse, particular- mente em um micro-organismo soIventogênico e mais particularmente em um etanologênico conforme ensinado neste relatório descritivo.
Outro aspecto é um vetor, tal como, por exemplo, um vetor de clonagem, um vetor de transferência e/ou um vetor de expressão, compre- endendo um ou mais dos ácidos nucleicos recombinantes conforme descrito acima.
Outro aspecto proporciona micro-organismos hospedeiros de in- teresse transformados com um ou mais dos ácidos nucleicos recombinantes ou com um vetor conforme descrito acima.
Em uma modalidade, o micro- organismo pode ser uma bactéria, mais particularmente uma bactéria esco- lhida a partir de Escherichia co/i, Salmonel/a tympbimurium, Serratia mar- cescens, Sa/mone//a typhimurium e Baci//us subti/is.
Tais bactérias são parti- 5 cularmente adequadas para superprodução de polipeptídeos recombinantes, por exemplo, para fins de purificação.
Em modalidades particulares, o micro- organismo hospedeiro é um micro-organismo solventogênico e preferivel- mente um etanofogênico conforme ensinado neste relatório descritivo.
Outro aspecto proporciona um Iisato celular ou extrato celular diretamente obtido 10 ou obtenível a partir de micro-organismos assim transformados.
Portanto, também são proporcionados métodos para obter mi- cro-organismos recombinantes de acordo com a invenção, preferivelmente micro-organismos solventogênicos e mais preferivelmente etanologênicos
_ ", conforme ensinado neste relatório descritivo, compreendendo transformar 15 um micro-organismo hospedeiro com um ácido nucleico recombinante ou vetor conforme ensinado aqui.
Ainda providos são métodos para produção, e opcionalmente e mais particularmente secreção, de um ou mais polipeptídeos Cel5H, ou fragmentos funcionais e/ou variantes dos ditos polipeptídeos CeI5H ou dos 20 ditos homólogos, compreendendo transformar um micro-organismo hospe- deiro com um ou mais dos respectivos ácidos nucleicos ou vetores conforme ensinado aqui, e cultivar ou manter os micro-organismos assim transforma- dos sob condições eficazes para causar expressão dos respectivos polipep- tídeos.
Vantajosamente, os respectivos polipeptídeos são produzidos em 25 uma forma biologicamente ativa.
Opcionalmente, os métodos podem com- preender uma etapa de isolar os respectivos polipeptídeos.
Portanto, também contemplado é o uso dos ácidos nucleicos re- combinantes, vetores ou células hospedeiras conforme descrito aqui para a produção, e opcionalmente e particularmente secreção de polipeptídeo 30 CeI5H ou homólogo do mesmo, ou fragmento funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo.
Preferivelmente, os respectivos polipeptídeos são produzidos em uma forma biologicamente ativa.
Em modalidades particulares dos poIipeptídeos acima, ácidos nucleicos recombinantes, vetores, micro-organismos hospedeiros transfor- mados, métodos e usos são caracterizados por uma ou mais das caracterís- ticas a seguir: 5 - o homólogo de Cel5H compreende um domínio homólogo ao domínio DZ de Cel5H; e/ou - o homólogo Cel5H é o polipeptídeo ACLA de Pseudomonas sp.
ND137; e/ou - o fragmento funcional compreende um ou mais domínios esco- lO lhidos a partir de ou correspondentes ao domínio GH5, ao domínio CBM6 e ao domínio DZ de Cel5l-1; e/ou - o um ou mais polipeptídeos Cel5H ou homólogos do mesmo, ou os fragmentos funcionais e/ou variantes do um ou mais polipeptÍdeos
_ -_ CeI5H ou do dito homólogo, é fundido a um ou mais dominios heterólogos 15 ao polipeptideo Cel5H ou homólogo do mesmo, escolhido a partir de um domínio GH catalítico, um domínio CBM, um domínio de ligação à coesina tal como um dominio doquerina e um domínio de módulo X de uma proteína arcabouço celulossomal; e/ou - o um ou mais poIipeptídeos Cel5H ou homólogos do mesmo, 20 ou o fragmento funcional e/ou variante do dito um ou mais polipeptídeos Cel5H ou dos ditos homólogos, podem ser coexpressos e opcionalmente cossecretados com um ou mais polipeptídeos, preferivelmente polipeptídeos recombinantes ou enzimas, que participam em metabolismo de polímero de carboidrato, particularmente metabolismo de celulose, preferivelmente com 25 uma ou mais enzimas capazes de degradar material lignocelulósico, mais preferivelmente com uma ou mais celulases heterólogas conforme ensinado aqui; e/ou - o um ou mais poIipeptídeos Cel5H ou homólogos do mesmo, ou o fragmento funcional e/ou variante dos ditos polipeptídeos CeI5H ou dos 30 ditos homólogos, e opcionalmente o um ou mais polipeptídeos coexpressos, mais particularmente celulases coexpressas, conforme ensinado acima, es- tão compreendidos em um celulossoma híbrido e/ou covalente.
Por isso, um aspecto proporciona composições isoladas com- preendendo o polipeptídeo Cel5H ou um homólogo do mesmo, ou um frag- mento funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólo- go, e também compreendendo um ou mais polipeptídeos que participam em 5 metabolismo de polímero de carboidrato, e particularmente metabolismo de celulose, preferivelmente uma ou mais enzimas capazes de degradar mate- rial lignocelulósico, mais preferivelmente uma ou mais celulases heterólogas conforme ensinado aqui.
Em modalidades particulares da dita composição, os componentes enumerados estão presentes como polipeptídeos discretos 10 ou Iivres.
Em outras modalidades, os poIipeptideos enumerados estão com- preendidos em um celulossoma híbrido e/ou covalente.
Os inventores também realizaram uma análise geral da estrutura - e da organização do polipeptideo Cel5H e identificaram a presença de um
_ -_ novo domínio não anteriormente identificado como tal, próximo à extremida- 15 de C-terminal do polipeptídeo Cel5H (denominado domínio DZ daqui por di- ante). Sem limitação, os dados dos inventores sugerem un7 módulo de liga- ção a carboidrato putativo (e/ou função de módulo de oIigomerização) para o domínio DZ e indica que sua presença pode ser pelo menos parcialmente responsável pela boa capacidade do Cel5H para despolimerizar celulose 20 cristalina.
Portanto, é outra realização da invenção que o domínio DZ ou porções do polipeptideo Cel5H compreendendo o domínio DZ pode ser em- pregado em uma variedade de sistemas enzimáticos para melhorar sua ca- pacidade de digerir e degradar celulose cristalina.
Em consequência, outro aspecto é um domínio isolado (domínio 25 DZ) do polipeptídeo Cel5H de cepa 2-40 de Saccharophagus degradans do aminoácido 496 ao aminoácido 596 do dito polipeptídeo Cel5l-l (tal como, por exemplo, na SEQ ID NO. 3 de polipeptídeo Cel5H madura exemplar mostra- da na figura lC) ou um domínio isolado homólogo à mesma, ou um fragmen- to funcional e/ou variante do dito domínio DZ ou do dito domínio homólogo. 30 Em modalidades particulares, um dominio homólogo ao DZ de Cel5H é um domínio que se alonga do aminoácido 463 ao aminoácido 558 do polipeptideo ACLA de Pseudmnonas sp.
ND137 (tal como, por exemplo,
na SEQ ID NO: 5 de polipeptídeo ACLA madura, exemplar mostrada na figu- ra IE). Modalidades particulares providas para um fragmento isolado do polipeptídeo Cel5H ou de um homólogo ou variante do mesmo, tendo a es- 5 trutura EPR-DZ, CBM6-EPR-DZ ou PSL-CBM6-EPR-DZ, em que EPR, CBM6 e PSL têm os significados conforme explicados neste relatório descri- tivo.
Tais fragmentos compreendem o domínio DZ que proporciona suas funções vantajosas, e opcionalmente, tal fragmento pode incluir o módulo CBM6 de ligação a carboidrato que pode ainda estimular a capacidade de 10 degradar celulose cristalina ou substratos hemicelulósicos.
AJém disso, se- quências ligantes endógenas podem proporcionar meios vantajosos para fundir o DZ e opcionalmente domínios CBM6 a outros polipeptldeos ao - mesmo tempo retendo sua estrutura e função- m Por isso, modalidades particulares proporcionam um fragmento 15 isolado do polipeptídeo ACLA compreendendo um domínio homólogo ao domínio DZ de Ce!5H.
Também contemplados são usos do domínio DZ isolado ou o fragmento funcional e/ou variante do mesmo, ou do fragmento isolado con- forme ensinado acima, como um módulo de ligação a carboidrato.
Tal uso 20 pode conferir novas propriedades de ligação a carboidrato ou à celulose em diversos sistemas de enzima.
Outro aspecto refere-se a polipeptídeos quiméricos compreen- dendo um domínio DZ isolado mais particularmente de Cel5H ou um frag- mento funcional e/ou variante do mesmo, ou compreendendo um fragmento 25 isolado de Cel5l-l compreendendo o domínio DZ, e também compreendendo um ou mais domínios heterólogos ao polipeptídeo Cel5H ou homólogo .ao mesmo, escolhidos dentre um domínio catalítico GH, um domlnio CBM, um domlnio de ligação à coesina tal como um domínio doquerina, e um domínio de módulo X de uma proteína-arcabouço celulossomal.
Tais combinações 30 modulares permitem a geração de novas enzimas degradantes de celulose com atividade útil perante celulose cristalina ou substratos hemicelulósicos.
Outros aspectos proporcionam polipeptídeos quiméricos com-
preendendo o domínio DZ isolado ou o fragmento funcional e/ou variante do mesmo, ou um fragmento isolado de Cel5H compreendendo o dominio DZ, fundido a um ou mais polipeptídeos que participam em metabolismo de po- límero de carboidrato, particularmente metabolismo de celulose, preferivel- 5 mente a uma ou mais enzimas capazes de degradar material hgnocelulósico, mais preferivelmente a uma ou mais glicosídeo hidrolases, ainda mais prefe- rivelmente a uma ou mais celulases, que é(SãO) heteróloga(s) ao polipeptí- deo Cel5H ou homólogo do mesmo.
Todavia, fusões de domínio(s) DZ adi- cional(ais) com um polipeptídeo Cel5H ou um homólogo do mesmo, ou fragmentos e/ou variantes do mesmo conforme descrito aqui, também são contempladas.
Outro aspecto proporcior)a moléculas de ácido nucleico recom- binante que codificam o domínio DZ isolado ou o domínio isolado homólogo ao mesmo ou o fragmento funcional e/ou variante do mesmo, ou que codifica um fragmento isolado de CeI5H compreendendo o domínio DZ ou homólogo do mesmo, ou que codifica o poIipeptideo quimérico conforme descrito aqui.
Uma modalidade particular deste aspecto proporciona uma mo- lécula de ácido nucleico recombinante que codifica o domínio DZ isolado ou o domínio isolado homólogo ao mesmo ou o fragmento funcional e/ou vari- ante do mesmo, ou que codifica o fragmento isolado de Cel5H compreen- dendo o domínio DZ ou um homólogo do mesmo, ou que codifica o polipep- tídeo quimérico conforme descrito acima, operavelmente ligada a sequên- cias regulatórias que permitem a expressão em um micro-organismo hospe- deiro de interesse, preferivelmente em um micro-organismo solventogênico e mais preferivelmente em um etanologênico conforme ensinado neste relató- rio descritivo.
Outra modalidade proporciona uma molécula de ácido nucleico recombinante que codifica o dominio DZ isolado ou o domínio isolado homó- logo ao mesmo ou o fragmento funcional e/ou variante do mesmo, ou que codifica o fragmento isolado de Cel5H compreendendo o domínio DZ ou um homólogo do mesmo, ou que codifica o polipeptídeo quimérico conforme descrito acima, operavelmente Iigada a uma sequência de sinal de secreção que permite secreção em um micro-organismo hospedeiro de interesse, pre- ferivelmente em um micro-organismo soIventogênico e mais preferivelmente em um etanologênico conforme ensinado neste relatório descritivo.
Ainda outra modalidade deste aspecto proporciona uma molécu- 5 la de ácido nucleico recombinante que codifica o domínio DZ isolado ou o domínio isolado homólogo ao mesmo ou o fragmento funcional e/ou variante do mesmo, ou que codifica o fragmento isolado de Cel5H compreendendo o domínio DZ ou um homólogo do mesmo, ou que codifica o poIipeptídeo qui- mérico conforme descrito acima, operavelmente ligada a uma sequência de sinal de secreção que permite secreção em um micro-organismo hospedeiro de interesse, e operavelmente ligada a sequências regulatórias que permi- tem expressão no micro-organismo hospedeiro de interesse, preferivelmente em um micro-organismo solventogênico e mais preferivelmente em um eta- nologênico conforme ensinado neste relatório descritivo.
Outro aspecto proporciona vetores, como, por exemplo, um vetor de clonagem, um vetor de transferência e/ou um vetor de expressão, com- preendendo qualquer das moléculas de ácido nucleico recombinante acima.
Outro aspecto proporciona um micro-organismo hospedeiro de interesse transformado com a molécula de ácido nucleico recombinante aci- ma ou vetor.
Em modalidades particulares, o micro-organismo é uma bacté- ria, mais preferivelmente uma bactéria escolhida a partir de Escherichia co/i, Sa/mone//a tymphimurium, Serratia marcescens, Sa/mone//a typhimurium e Bacil/us subti/is.
Em modalidades particulares, o micro-organismo pode ser um solventogênico e é preferivelmente um micro-organismo etanologênico conforme ensinado neste relatório descritivo.
Outro aspecto proporciona um lisato celular ou extrato celular diretamente obtido ou obtenível a partir de micro-organismos assim transformados.
Em modalidades particulares, o domínio DZ isolado ou o domí- nio isolado homólogo ao mesmo ou o fragmento funcional e/ou variante do mesmo, ou o fragmento isolado de Cel5H compreendendo o domínio DZ ou um homólogo do mesmo, ou o polipeptldeo quimérico conforme descrito a- cima, e opcionalmente o um ou mais poIipeptídeos coexpressos envolvidos em metabolismo de polímero de carboidrato, particularmente metabolismo de celulose, podem estar compreendidos em um celulossoma híbrido e/ou covalente.
Em outro aspecto, a invenção proporciona métodos para a de- 5 gradação de uma substância compreendendo celulose, tal como material |ignoce|u|ósico ou celulósico ou biomassa, compreendendo contatar a dita substância com o domínio DZ isolado ou o domínio isolado homólogo ao mesmo ou o fragmento funcional e/ou variante do mesmo, ou com o frag- mento isolado de Cel5H compreendendo o domínio DZ ou um homólogo do mesmo, ou com o polipeptídeo quimérico conforme descrito acima, ou com um micro-organismo recombinante que expressa o mesmo.
Em uma modali- dade, a substância pode compreender ou ser enriquecida quanto à celulose, celulose semicristalina ou celulose amorfa.
Um aspecto relacionado proporciona métodos para produzir um solvente, um combustível ou um intermediário químico a partir de uma subs- tância compreendendo celulose, tal como material lignocelulósico ou celuló- sico ou biomassa, compreendendo tratar a dita substância com o domínio DZ isolado ou o domínio isolado homólogo ao mesmo ou o fragmento fun- cional e/ou variante do mesmo, ou com o fragmento isolado de Cel5H com- preendendo o domínio DZ ou um homólogo do mesmo, ou com o polipeptí- deo quimérico conforme descrito acima, ou com um micro-organismo solven- togênico recombinante que expressa o mesmo.
Em uma modalidade, a substância pode compreender ou ser enriquecida quanto à celulose cristali- na.
Em modalidades particulares, métodos são providos para produzir um solvente, mais particularmente etanol, e o micro-organismo pode ser um mi- cro-organismo etanologênico.
Outro aspecto proporciona composições compreendendo produ- tos de degradação de celulose e/ou solventes, mais particularmente etanol, obtidos ou obteníveis através dos métodos descritos aqui.
Tais composições podem ser meios de cultivo brutos ou (pelo menos) parcialmente eririqueci- dos e/ou purificados para a produção do polipeptídeo Cel5H (ou homólogo ou fragmento do mesmo) ou parcialmente enriquecidos e/ou purificados quanto ao solvente, combustível ou intermediário químico.
Em modalidades particulares, tais composições são caracterizadas pelo teor aumentado de glicose, celobiose e celotriose.
Em outras modalidades particL|lares, são pro- vidas composições em que o teor de glicose, celobiose e/ou celotriose é 5 maior do que 1O°/o em peso, maior do que 2Ó°/o em peso, maior do que 30% em peso, maior do que 4O°/j em peso, maior do que 50% em peso, maior do que 6Õ°/o em peso, maior do que 70% em peso, maior do que 80% em peso, maior do que 90% em peso ou mais.
Em outras modalidades particulares, tais composições são ca- lO racterizadas pelo alto teor em solvente, combustível ou intermediário qulmi- co de interesse.
Em outras modalidades particulares, são providas composi- ções em que o teor de solvente, combustível ou intermediário químico é maior do que 1O°/o em peso, maior do que 2Õ°/o em peso, maior do que 3O°/, em peso, maior do que 4Ó°/o em peso, maior do que 5Õ°/o em peso, maior do que 60% em peso, maior do que 7Õ°/o em peso, maior do que 80°6 em peso, maior do que 90°6 em peso ou entre 96°6 e 99,9% em peso.
Em modalida- des particulares, a concentração do solvente, combustível ou intermediário químico na composição é maior do que cerca de 10 g/L, e preferivelmente maior do que cerca de 15 g/L.
Esses e outros aspectos e modalidades da invenção são ainda explicados aqui abaixo e nas reivindicações anexas, assim como ilustrados pelos exemplos não limitantes.
Breve Descrição das Fiçjuras A figura 1 ilustra sequência de ácido nucleico codificante (A) e sequência de aminoácido (B-C) exemplares de poIipeptídeo CeI5H nativo de cepa 2-40 de Saccharophagus degradans contendo (B) ou não contebdo (C) a sequência de sinal de secreção N-terminal; sequência de aminoácido e- xemplar de proteina ACLA nativa de Pseudomonas sp.
ND137 contendo (D) ou não contendo (E) a sequência de sinal de secreção N-terminal; sequência de ácido nucleico codificante de Cel5H engenheirada (F) e sequência de aminoácido (G) exemplares adaptadas à polarização de códon de C/ostr/di- um acetobuty/icum e contendo códons 6xHis ou uma etiqueta na extremida-
de 3' (C-term). A figura 2 ilustra de maneira esquemática diversos fragmentos e derivados de Cel5H que foram ou são engenheirados para expressão, de acordo com modalidades particulares da invenção. 5 A figura 3 ilustra atividades das diversas formas de Cel5H con- tra CMC a 37°, de acordo com modalidades particulares da invenção- A figura 4 ilustra atividade das diversas formas de Cel5H contra Celulose lnchada com Ácido Fosfórico a 37°, de acordo com modalidades particulares da invenção. 10 A figura 5 ilustra atividade das diversas formas de Cel5H contra Avicel PH1O1 a 37°, de acordo com modalidades particulares da invenção. A figura 6 ilustra comparação entre atividade de avicelase de Cel5H com celulases do tipo selvagem e engenheiradas de C. ce//u/o/yticum,
À de acordo com modalidades particulares da invenção. 15 A figura 7 ilustra representação esquemática de formas enge- nheiradas de Cel5A de C. ce//u/o/yticum compreendendo domínios adiciona- dos de Cel5H, de acordo com modaiidades particulares da invenção. Legen- da: veja figura 2.
A figura 8 ilustra a degradação de Avicel (3,5 g/L de Tris- 20 maleato a 20 mM pH 6 e CaC|2 a 1 mM) por diferentes formas engenheira- das de Cel5A a partir de C. ce//u/o/yticum compreendendo domínios adicio- nados de Cel5H, de acordo com modalidades particulares da invenção- Le- ' genda: veja figura 2.
A figura 9 mostra a degradação de Avicel por Cel5H e pelo me- 25 nos uma outra enzima celulase de acordo com modalidades particulares da invenção.
A figura 10 ilustra de maneira esquemática um minicelulossoma híbrido incluindo Cel5H, de acordo com uma modalidade particular da inven- ção. 30 A figura 11 mostra a degradação de PASC, o consumo de celo- biose residual e o crescimento bacteriano de C. acetobuty/icum, tendo sua sequência de peptideo de sinal de Cel5H substituída pela sequência de pep-
tídeo de sinal de Cel5H de C. ce//u/o/yticum em um fermentador com 3 g/L de 2YT-PASC e pH 5,5, de acordo com modalidades particulares da inven- ção.
A figura 12 mostra o consumo de celobiose residual e o cresci- 5 mento bacteriano de C. acetobuty/icum, tendo sua sequência de peptídeo de sinal de Cel5H substituída pela sequência de peptídeo de sinal de Cel5H de C. ce/lu/o/yticum em um fermentador na presença de 2YT e pH 5,5, porém sem qualquer PASC, de acordo com modalidades particulares da invenção.
A figura 13 é uma representação esquemática de diferentes 10 construtos de acordo com modalidades particulares da invenção.
Os cons- trutos compreendem um polipeptideo de interesse (celulase "Cel5H") fundida a um domínio carreador e uma sequência de sinal.
O domínio carreador compreende um módulo de Iigação a carboidrato (C8M3a) de uma proteína 4 arcabouço celulossomal fundida a um ou dois módulos X (Xa). Celulase 15 Cel5H compreende um domínio da família 5 de glicosideo hidrolase ("5"), um ligante de polisserina ("sss"), um domínio da família 6 de módulo de ligação a carboidrato ("6"), uma região rica em ácido glutâmico-prolina ("eppv") e um domínio C-terminal identificado pelos presentes inventores como um módulo de ligação a carboidrato putativo ("DZ")- 20 A figura 14 demonstra a secreção de Cel5H do tipo selvagem e Cel5H fundidas a um domínio carreador, em comparação a uma cepa de controle.
O domínio carreador abrange um módulo de ligação a carboidrato (CBM3) de uma proteína arcabouço celulossomal fundida a dois domínios hidrofílicos (Xa). A atividade do sobrenadante da cultura foi medida quanto 25 ao substrato solúvel para-nitrofenii-celobiose.
A figura 15 demonstra a atividade de diferentes proteínas inclu- indo as proteínas de fusão de acordo com modalidades particulares da in- venção sobre diferentes substratos celulósicos; (a) atividade de proteínas compreendendo Cel5H sobre substrato solúvel para-nitrofenol-celobiose; 30 Cel5H do tipo selvagem (linha cheia), fusão com um módulo X (CBM-Xa-5H; linha pontilhada), proteína de fusão com dois módulos X (CBM-Xa-Xa-5H, Iinha tracejada) (b) atividade de proteínas compreendendo Cel5H sobre celu-
lose cristalina Avicel. A figura 16 ilustra de maneira esquemática comparação de do- mínios de CeI5H e ACLA, de acordo com modalidades particulares da inven- ção. 5 Descrição Detalhada da lnvenção Conforme usadas aqui, as formas singulares "um", "uma" e "o", "a" incluem ambas referências plural e singular, a menos que o contexto cla- ramente indique o contrário. Os termos "compreendendo", "compreende" e "compreendido 10 de" conforme usados aqui são sinônimos com "incluindo", "inclui" ou "con- tendo", "contém", e são inclusivos ou em aberto e não excluem membros,
A elementos ou etapas de método adicionais, não enumerados. A enumeração de faixas numéricas por pontos finais inclui todos . "^ os números e frações classificados dentro das respectivas faixas, assim co- 15 mo pontos finais enumerados. O termo "cerca de" conforme usado aqui quando fazendo refe- rência a um valor mensurável, tal como um parâmetro, uma quantidade, uma duração temporal, e similares, deve abranger variações de +/- 1O°/o ou me- nos, preferivelmente +/- 5°/, ou menos, mais preferivelmente +/- 1°/, ou me- 20 nos, e ainda mais preferivelmente +/ 0,1% ou menos de e a partir do valor especificado, na medida em que tais variações são apropriadas para realizar a invenção descrita. Deve ser entendido que o valor ao qual o modificador "cerca de" se refere é ele mesmo também especificamente, e preferivelmen- te, descrito. 25 Todos os documentos citados no presente relatório descritivo são aqui incorporados por referência em sua totalidade. A menos que indicado de outra forma, todos os termos usados na descrição da invenção, incluindo termos técnicos e científicos, têm o sig- nificado conforme comumente entendido por aquele de conhecimento co- 30 mum na técnica à qual esta invenção pertence. Por meio de orientação adi- cional, definições de termos estão incluídas para melhor apreciar o ensina- mento da presente invenção.
Conforme usados aqui, os termos "Cel5H", "polipeptideo Cel5H" ou "proteína Cel5H" se refere ao polipeptídeo ou proteína de cepa 2-40 de Saccharophagus degradans conhecida sob essas designações na técnica (veja, em particular, Taylor et al. 2006, supra). As designações acima se re- 5 ferem a tais polipeptídeos com uma sequência nativa, isto é, polipeptídeos dos quais a sequência primária é a mesma que aquela da proteína CeI5H de cepa 2-40 de S. degradans encontrada ou derivada da natureza.
Um versa- do na técnica entende que sequências nativas de CeI5H devem diferir entre diferentes subcepas ou subculturas de cepa 2-40 de S. degradans devido a d ivergência genética ou mutação(ões) espontânea(s). As sequências nativas de Cel5H podem ainda divergir devido a modificações pós-transcricionais ou pós-translacionais.
Em consequência, todas as sequências de Cel5H encon- tradas ou derivadas da natureza são consideradas "nativas". As designações acima abrangem o polipeptídeo Cel5H quando formando uma parte de um organismo, micro-organismo ou células vivas, assim como quando pelo menos parcialmente isofados de tais fontes.
Os termos também abrangem polipeptídeos Cel5H quando produzidos por mei- os recombinantes ou sintéticos.
O polipeptídeo Cel5H é normalmente secretor e pode existir em uma forma precursora compreendendo uma sequência de sinal de secreção N-terminal clivável, ou em uma forma madura sem a dita sequência de sinal.
Dependendo do contexto prontamente entendido por um versado na técnica, uma referência aqui ao polipeptídeo Cel5H pode abranger a dita forma ma- dura e/ou as ditas formas precursoras.
Polipeptídeos Cel5H exemplares incluem, sem Iimitação, o poli- peptídeo codificado pela sequência de codificação de ácido nucleico confor- me anotado sob o banco de dados NCBI Entrez Gene (http://wwwmcbi.nlm.nih-gov/sites/entrez?db=qene ) locus tag Sde _ 3237 (GenelD:3965710), e sob o NCBI Genbank (http://www.ncbi.nlm.nih.qov/Genbank/index.html ) número de acesso NC 007912 (versão de sequência 1, entrada de banco de dados atualizada em 20 de julho de 2008), também reproduzida na Fig. 1A (SEQ ID NO: 1); e o polipeptídeo CeI5H conforme anotado sob o número de acesso Genbank NCBI YP 528706 (versão de sequência 1, entrada de banco de dados atuali- zada em 20 de julho de 2008) e o número de acesso Uniprot/Swissprot (http://expasy.org/) Q21FN5 (versão de sequência 1 inserida em 18 de abril 5 de 2006), conforme reproduzido de maneira exemplar na Fig. 1B (SEQ ID NO: 2). Esta sequência corresponde a um precursor de Cel5H compre- endendo a sequência de sinal.
Um polipeptídeo Cel5H maduro exemplar, isto é, com a sequência de sinal processada à distância, é representado pe- lO Ias posições 35 a 630 de aminoácido da dita sequência precursora, confor- me reproduzido de maneira exemplar na figura lC (SEQ ID NO. 3). Deve ser apreciado que a clivagem real por peptidase de sinal pode potencialmente ocorrer em uma ligação de peptídeo próxima ao sÍtio de clivagem previs'to entre aminoácidos 34 e 35 do precursor Cel5H, con- forme mostrado na figura 1B.
Por exemplo, a clivagem real deve ocorrer em qualquer das ligações de peptideo dentro da região de aminoácido da posi- ção 30 a 40, preferivelmente 32 a 39, mais preferivelmente 32 a 38, ainda mais preferivelmente 32 a 37, ainda mais preferivelmente 33 a 36, do pre- cursor Cel5H, conforme mostrado na figura 1B.
Em adição, a menos que expressamente indicado de outra for- ma ou através do contexto, sempre que domínios ou outros motivos de Cel5H são identificados aqui por referência a posições de aminoácido, tal referência é à forma madura de Cel5H, tal como, em particular, aquela mos- trada em SEQ ID NO: 3. Conforme usado aqui, o termo "homologia" significa similaridade estrutural entre duas macromoléculas, particularmente entre dois polipepti- deos ou polinucleotídeos, dos mesmos táxons ou diferentes, em que a dita similaridade é devido à ancestralidade comum.
Portanto, o termo "homólogo" denota macromoléculas assim relacionadas tendo a dita similaridade estrutu- ral.
De preferência, homólogos do polipeptídeo Cel5H conforme desejado aqui abrangem os ditos homólogos com sequência nativa.
Um peptldeo homólogo do polipeptídeo Cel5H pode preferivel-
mente mostrar pelo menos cerca de 30%, mais preferivelmente pelo menos 4Õ°/o, ainda mais preferivelmente pelo menos 5Õ°/o, ainda mais preferivel- mente pelo menos 60%, ainda mais preferlvelmente pelo menos 70°6, tal como muito preferivelmente pelo menos 80% ou pelo menos 90% ou pelo 5 menos 95% de identidade de sequência conforme definido neste relatório descritivo para o polipeptídeo Cel5H.
Alternativamente ou preferivelmente em adição, um polipeptídeo homólogo do polipeptídeo Cel5H pode mostrar pelo menos cerca de 50%, mais preferivelmente pelo menos 60%, ainda mais preferivelmente pelo menos 7Õ°/o, ainda mais preferivelmente pelo me- lO nos 8Ó°/o, ainda mais preferivelmente pelo menos 9Õ°/o, tal como muito prefe- rivelmente pelo menos 95°/o de similaridade de sequência conforme definido neste relatório descritivo para o poIipeptídeo Cel5H.
Mais preferivelmente, um poIipeptídeo homólogo do polipeptideo Cel5H pode compreender um ou mais dornínios funcionais correspondentes a domínios do polipeptídeo Cel5H, e preferivelmente um ou mais do domínio catalítico GH da família 5, domínio CBM da família 6. Preferivelmente, os ditos domínios podem ter or- ganização análoga a Cel5H, em particular GH5-CBM6-DZ, usualmente com ligantes de interposição.
Conforme notado, homólogos preferidos do polipeptídeo Ce15H são os polipeptídeos ACLA de Pseudomonas sp.
ND137. Polipeptídeos A- CLA exemplares incluem, sem limitação, a sequência conforme anotada sob o número de acesso Uniprot/Swissprot Q8VUT3 (versão de sequência 1 in- serida em 01 de março de 2002) também reproduzida na Fig. 1D (SEQ ID NO: 4). Esta sequência corresponde a um precursor de ACLA compreen- dendo a sequência de sinal.
Um polipeptídeo ACLA maduro, isto é, com a sequência de sinal processada à distância, está representado pelas posi- ções 28 a 585 de aminoácido do respectivo precursor, conforme reproduzido de maneira exemplar na figura 1E (SEQ ID NO: 5). Deve ser apreciado que a clivagem real por peptidase de sinal pode potencialmente ocorrer em uma ligação de peptídeo próxima ao sÍtio de clivagem previsto entre aminoácidos 27 e 28 do precursor ACLA confor- me mostrado na figura 1D (SEQ ID NO: 4). Por exemplo, a clivagem real deve ocorrer em qualquer das ligações de peptídeo dentro da região do ami- noácido da posição 23 e 32, preferivelmente 24 a 31, mais preferivelmente 25 a 30, ainda mais preferivelmente 26 a 29, do precursor ACLA, conforme mostrado na figura 1D. 5 Dependendo do contexto prontamente entendido por um versa- do na técnica, uma referência aqui ao polipeptídeo ACLA pode abranger a dita forma madura e/ou as ditas formas precursoras.
Em adição, a menos que expressamente indicado em contrário ou pelo contexto, sempre que domínios e outros motivos de ACLA são identificados aqui por referência a posições de aminoácido, tal referência é à forma madura de ACLA, tal como em particular aquela mostrada em SEQ ID NO: 5. O termo "fragmento" com referência a um dado polipeptídeo tal como Cel5H ou um homólogo do mesmo, ou com referência a um dado do- mínio tal como o domínio DZ do Cel5H ou homólogo do mesmo, em geral se refere a uma forma truncada do dito polipeptídeo que tem uma deleção N- terminal e/ou C-terminal de um ou mais resíduos de aminoácido em compa- ração ao dito polipeptídeo tal como o dito Cel5H ou homólogo ou o dito do- mínio, porém onde a sequência primária restante do fragmento é idêntica às posições correspondentes na sequência de aminoácido do dito polipeptídeo tal como o dito Cel5H ou homólogo ou o dito domínio.
Por exemplo, um fragmento de um dado polipeptídeo tal como Cel5H ou um homólogo do mesmo pode incluir uma sequência de cerca de z 5 aminoácidos consecutivos, preferivelmente z 10 aminoácidos consecuti- vos, mais preferivelmente z 20 aminoácidos consecutivos, ainda mais prefe- rivelmente z 30 aminoácidos consecutivos, por exemplo, z 40 aminoácidos consecutivos e mais preferivelmente z 50 aminoácidos consecutivos, por exemplo, z 60, z 70, z 80, z 90, z 100, z 200 ou z 500 aminoácidos conse- cutivos tal como o dito CeI5H ou homólogo.
Por exemplo, um fragmento do domínio DZ de Cel5H ou um ho- mólogo do mesmo pode incluir uma sequência de cerca de z 5 aminoácidos consecutivos, preferivelmente z 10 aminoácidos consecutivos, mais preferi- velmente z 20 aminoácidos consecutivos, ainda mais preferivelmente z 30 aminoácidos consecutivos, por exemplo, z 40 aminoácidos consecutivos e mais preferivelmente z 50 aminoácidos consecutivos, por exemplo, z 60, z 70, z 80 ou z 90 aminoácidos consecutivos do dito domínio DZ ou homólogo do mesmo. 5 Em adição, um fragmento de um dado polipeptídeo tal como Cel5H ou um homólogo do mesmo ou domínio DZ pode representar pelo menos cerca de 30%, por exemplo, pelo menos 50% ou pelo menos 7O°/j, preferivelmente pelo menos 80%, por exemplo, pelo menos 85%, mais prefe- rivelmente pelo menos 90 °/) e ainda mais preferivelmente pelo menos 95°6 10 ou até cerca de 99% da sequência de aminoácido do dito polipeptídeo, tal como o dito Cel5l-l ou homólogo ou dominio DZ.
O termo "variante" de um dado polipeptídeo tal como CeI5H ou um homólogo do mesmo ou de um domínio DZ se refere a poIipeptídeos cu- r ja sequência de aminoácido é substancialmente idêntica (isto é, em grande 15 parte, porém não totalmente idêntica) a uma sequência nativa do dito poli- peptídeo, tal como o dito Cel5H ou um homólogo do mesmo ou um domínio DZ. "Substancialmente idêntica" refere-se a pelo menos cerca de 85% idên- tica, por exemplo, preferivelmente pelo menos 90% idêntica, por exemplo, pelo menos 91% idêntica, 92% idêntica, mais preferivelmente pelo menos 20 93% idêntica, por exemplo, 94% idêntica, ainda mais preferivelmente pelo menos 95% idêntica, por exemplo, pelo menos 96% idêntica, ainda mais pre- ferivelmente pelo menos 97% idêntica, por exemplo, pelo menos 98% idênti- ca, e mais preferivelmente pelo menos 99% idêntica. ldentidade de sequência entre dois polipeptídeos pode ser de- 25 terminada alinhando-se de maneira ótima (alinhamento ótimo de duas se- quências de proteína é o alinhamento que maximiza a soma de pontuações de par menos qualquer penalidade para lacunas introduzidas; e pode ser preferivelmente conduzida por implementações computadorizadas de algo- ritmos, tal como "Gap", usando o algoritmo de Needleman and Wunsch 1970 30 (J mol Biol 48:443-453), ou "Bestfit", usando o algoritmo de Smith e Water- man 1981 (J Mol Biol 147: 195-197), conforme disponível em, por exemplo, GCG® v. 11.1,2 package da Accelrys) as sequências de aminoácido dos po-
lipeptídeos e pontuação, por um lado, o número de posições no alinhamento em que os polipeptídeos contêm o mesmo resíduo de aminoácido e, por ou- tro lado, o número de posições no alinhamento em que os dois polipeptídeos diferem em sua sequência.
Os dois polipeptídeos diferem em sua sequência 5 em uma dada posição no alinhamento quando os polipeptídeos contêm dife- rentes resíduos de aminoácidos nessa posição (substituição de aminoácido), ou quando um dos polipeptídeos contém um resíduo de aminoácido nessa posição enquanto o outro não tem ou vice-versa (inserção ou deleção de aminoácido). ldentidade de sequência é calculada como a proporção (per- lO centual) de posições no alinhamento em que os polipeptídeos contêm a mesmo resíduo de aminoácido versus o número total de posições no ali- nhamento.
Algoritmos também adequados para realizar alinhamentos de sequência e determinação de identidade de sequência incluem aqueles com base em Basic Local Alignment Search ToOI (BLAST) originalmente descri- tos por Altschul et al. 1990 (J Mol Biol 215: 403-10), tal como o algoritmo "Blast 2 sequences" descrito por Tatusova e Madden 1999 (FEMS Microbiol Lett 174: 247-250), tal como usando ajustes-padrão dos mesmos.
A variante de um dado polipeptídeo tal como Cel5H ou um ho- mólogo do mesmo ou um domínio DZ, conforme usada aqui, também abran- ge especificamente polipeptídeos com um determinado grau de similaridade ao dito polipeptídeo, tal como o dito Cel5H ou um homólogo do mesmo ou um domínio DZ.
Preferivelmente, tais variantes podem ser pelo menos cerca de 90% similares, por exemplo, preferivelmente pelo menos 91% similares, por exemplo, pelo menos 92% similares, 93% similares, mais preferivelmen- te pelo menos 94% similares, por exemplo, 95% similares, ainda mais prefe- rivelmente pelo menos 96% similares, por exemplo, pelo menos 97% simila- res, ainda mais preferivelmente pelo menos 98% similares, por exemplo, pelo menos 99°/o similares.
A similaridade de sequência entre dois polipeptídeos pode ser determinada alinhando-se de maneira ótima (veja acima) as sequências de aminoácido dos polipeptídeos e pontuando, por um lado, o número de posi- ções no alinhamento em que os polipeptídeos contêm o mesmo residuo de aminoácido ou similar (isto é, conservadoramente substituído) e, por outro lado, o número de posições no alinhamento, em que os dois polipeptídeos, de outra maneira, diferem em sua sequência.
Os dois polipeptídeos de outra forma diferem em sua sequência em uma dada posição no alinhamento 5 quando os polipeptídeos contêm resíduos de aminoácido não conservadores nessa posição, ou quando um dos polipeptídeos contém um resíduo de ami- noácido nessa posição enquanto o outro não ou vice-versa (inserção ou de- leção de aminoácido). A similaridade de sequência é calculada como a pro- porção (percentual) de posições no alinhamento, em que os polipeptldeos 10 contêm o mesmo ou resíduo de aminoácido similar versus o número total de posições no alinhamento.
Deve ser entendido que, sob referência a fragmentos e/ou vari- antes, o relatório descritivo também amplamente contempla fragmentos de
. ". variantes de um dado polipeptídeo, tal como Cel5H ou um homólogo do 15 mesmo ou um domínio DZ, assim como variantes de fragmentos de tal poIi- peptídeo.
O termo "funcional" com referência aos fragmentos e/ou varian- tes de um dado polipeptídeo tal como CeI5H ou um homólogo do mesmo ou um domlnio DZ denota que tais fragmentos e variantes pelo menos parcial- 20 mente retêm a atividade biológica ou funcionalidade do polipeptídeo corres- pondente, tal como o dito Cel5H ou homólogo do mesmo ou domínio DZ.
Preferivelmente, tais fragmentos funcionais e/ou variantes podem reter pelo menos cerca de 20°6, por exemplo, pelo menos 30% ou pelo menos 40%, ou pelo menos 50%, por exemplo, pelo menos 60%, mais preferivelmente pelo 25 menos 7Õ°/o, por exemplo, pelo menos 8O°/j, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e mais preferivel- mente pelo menos 95°6 ou até 1OO°/o da atividade do polipeptídeo corres- pondente tal como o dito Cel5H ou homólogo do mesmo ou domínio DZ.
Po- tencialmente, tais fragmentos funcionais e/ou variantes podem ainda ter ati- 30 vidade superior ao polipeptídeo correspondente tal como o dito Cel5H ou homólogo ou domínio DZ.
Fragmentos funcionais e/ou variantes de um dado polipeptideo tal como Cel5H ou homólogo do mesmo ou domínio DZ podem ser funcio- nalmente equivalentes ao dito polipeptideo em pelo menos um e preferivel- mente mais ou todos os aspectos de sua atividade ou função biológica.
As- pectos relevantes de função biológica do dito Cel5H ou homólogo do mesmo 5 incluem, em particular, porém sem limitação, atividade despolimerizante de celulose ou de celulase, perfil de atividade com relação a diferentes substra- tos de celulose (por exemplo, celulose cristalina, semicristalina ou amorfa ou hemicelulose), capacidade ou preferência para degradar substratos de celu- lose cristalina e capacidade de interagir com ou se ligar a substratos de celu- lO lose.
Aspectos relevantes de função biológica do dito domínio DZ de Cel5H ou homólogo do mesmo incluem, em particular, porém sem limitação, ativi- dades de ligação à celulose, e particularmente de ligação à celulose cristali- na e/ou de oligomerização.
A atividade biológica de um dado fragmento e/ou
"t variante de Cel5H ou de homólogo do mesmo ou de domínio DZ, incluindo 15 os aspectos acima de tal atividade, pode ser determinada por testes-padrão, tal como, por exemplo, os testes de atividade de enzima apresentados na seção exemplos.
Os termos "solventogênico" e "produtor de soIvente" têm seu significado estabelecido na técnica e, em particular, denotam a capacidade 20 de micro-organismos, tal como bactérias (isto é, bactérias solventogênicas), de produzir um ou mais líquidos ou solventes orgânicos não gasosos, tal como, inter a/ia, etanol, acetona, butanol, ácido propiônico, ácido butírico, éter ou glicerina, a partir de uma fonte de carboidrato tal como, por exemplo, hexoses, pentoses ou oligossacarídeos.
Em particular, o termo abrange or- 25 ganismos soiventogênicos de ocorrência natural, organismos solventogêni- cos com mutações de ocorrência natural ou induzidas e organismos solven- togênicos que foram geneticamente modificados.
Os termos "etanologênico" e "produtor de etanol" destinam-se a denotar a capacidade de micro-organismos, tal como bactérias (isto é, bacté- 30 rias etanologênicas), de produzir pelo menos ou preferivelmente principal- mente etanol a partir de uma fonte de carboidrato, tal como, por exemplo, hexose, pentose ou oligossacarídeo, mais preferivelmente de produzir etanol a partir de carboidratos como o produto de fermentação não gasoso mais abundante.
Em particular, o termo abrange organismos etanologênicos de ocorrência natural, organismos etanologênicos com mutações de ocorrência natural ou induzidas, e organismos etanologênicos que foram geneticamente 5 modificados.
Exemplos de micro-organismo solventogênico adequado inclu- em, mas não estão limitados a, cepas de C/ostridium e Zymomonas, tal co- mo, porém não limitados àque|eg exemplificados aqui.
O termo "isoiar" com referência a um componente em particular em geral denota separar esse componente de pelo menos outro componente de uma composição da qua! o último componente é assim "isolado". Em par- ticular, os termos "isolar" e "isolado" podem se referir aqui a aumentar a quantidade de uma proteína(s) ou polipeptídeo(s) desejado em uma amos- tra.
A quantidade relativa pode ser expressa como a razão entre a concen- tração ou quantidade da(s) proteína(s) ou polipeptídeo(s) desejados a ser isolada e a concentração ou quantidade de proteínas totais na amostra.
Em adição, o termo pode abranger separar proteina(s) ou polipeptldeo(s) dese- jados de componentes celulares de não proteína (por exemplo, paredes ce- lulares, lipídios, ácidos nucleicos, etc.). Os termos "ácido nucleico recombinante" ou "molécula de ácido nucleico recombinante" conforme usados aqui em geral referem-se a molé- culas de ácido nucleico (tal como, por exemplo, moléculas de DNA, CDNA ou RNA) compreendendo segmentos gerados e/ou unidos usando tecnologia de DNA recombinante, tal como, por exemplo, clonagem molecular e amplifica- ção de ácido nucleico.
Usualmente, uma molécula de ácido nucleico recom- binante pode compreender uma ou mais sequências de ocorrência não natu- ral e/ou pode compreender segmentos correspondentes a sequências de ocorrência natural que não estão posicionadas como elas estariam posicio- nadas em um genoma original que não foi modificado.
Quando uma molécu- la de ácido nucleico recombinante se replica no organismo hospedeiro ao qual ela foi introduzida, a(s) molécula(s) de ácido nucleico descendente(s) também estão abrangidas no termo "molécula de ácido nucleico recombi- nante".
Em modalidades particulares, uma molécula de ácido nucleico recombinante pode ser integrada de maneira estável ao genoma de um or- ganismo hospedeiro, tal como, por exemplo, integrada em uma ou mais po- sições randômicas ou integrada de uma maneira alvo, tal como, por exem- 5 plo, por meio de recombinação homóloga, ou a molécula de ácido nucleico recombinante pode estar presente ou compreendida em um elemento extra- cromossomal, em que o último pode ser autorreplicante.
Trabalhos de referência padrão que demonstram os princípios gerais de tecnologia de DNA recombinante incluem Mo/ecu/ar C/oning." A 10 Laboratory Manual, 2" ed., vol. 1-3, ed.
Sambrook et al., Cold Spring Harbor Laboratory Press, CoId Spring Harbor, N.
Y., 1989; Current Protoco/s in Mo- /ecu/ar Bio/ogy, ed.
Ausubel et al., Greene Publishing and Wiley- lnterscien- ce, Nova Iorque, 1992 (com atualizações periódicas); lnnis et al., PCR Proto-
_ "- CO/S A Guide to Methods and App/ications, Academic Press: San Diego, 15 1990. General principles of microbiology são demonstrados, por exemplo, em Davis, B.
D. et al., Microbiology, 3" edição, Harper & Row, publishers, Filadélfia, Pa. (1980). O termo "polipeptídeo recombinante" conforme usado aqui refe- re-se a um polipeptídeo ou proteína produzida por um organismo hospedeiro 20 através da expressão de uma molécula de ácido nucleico recombinante, que foi introduzida ao dito organismo hospedeiro ou um progenitor do mesmo, e que compreende uma sequência que codifica o dito poIipeptideo ou proteína.
Em adição, os termos "recombinante" ou "transformado" confor- me usados aqui com referência a organismos hospedeiros, micro- 25 organismos ou células abrangem tais organismos, micro-organismos ou cé- tulas aos quais uma molécula de ácido nucleico recombinante foi introduzida, assim como o progenitor recombinante de tais organismos hospedeiros, mi- cro-organismos ou células.
Por isso, o termo "transformação" abrange a introdução ou trans- 30 ferência de um ácido nucleico estranho, tal como um ácido nucleico recom- binante em um organismo hospedeiro, micro-organismo ou célula.
O ácido nucleico assim introduzido pode ser preferivelmente mantido por todo o crescimento ad icional e d ivisão celular do dito organismo hospedeiro, micro- organismo ou célula.
Quaisquer métodos de transferência de gene conven- cionais podem ser usados para alcançar transformação, tal como, sem limi- tação, eleroporação, eletropermeação, transformação quimica, lipofecção, 5 transfecção mediada por vÍrus ou bacteriófago, etc.
Por "codificação" deve ser entendida que uma sequência de áci- do nucleico ou parte(s) da mesma corresponde, em virtude do código gené- tico de um organismo em questão, a uma sequência de aminoácido particu- lar, por exemplo, a sequência de aminoácido de um polipeptídeo ou proteína desejada.
Por meio de exemplo, ácidos nucleicos "que codificam" um poli- peptídeo ou proteína particular podem abranger ácidos nucleicos genômicos, hnRNA, pré-mRNA, mRNA, CDNA, recombinantes ou sintéticos.
Preferivelmente, um ácido nucleico que codifica um polipeptldeo ou proteína particular pode compreender um quadro de leitura aberto (ORF) que codifica o dito poIipeptídeo ou proteína.
Um "quadro de leitura aberto" ou "ORF" se refere a uma sucessão de trios de nucleotídeos de codificação (códons) que iniciam com um códon de iniciação de tradução e que encer- ram com um códon de término de tradução conhecido per se, e não conten- do qualquer códon de término de tradução em-quadro interno, e potencial- mente capaz de codificar um polipeptídeo.
Por isso, o termo pode ser sinô- nimo com "sequência de codificação" conforme usado na técnica.
Em uma modalidade, a sequência de ácido nucleico ou ORF que codifica O(S) presente(s) poIipeptídeo(s) pode ser códon otimizado conforme conhecido per se para expressão em um organismo particular, por exemplo, micro-organismo, mais particularmente uma bactéria de interesse.
Polariza- ção de uso de códon e frequências de códon a partir de diversos organismos estão disponíveis, por exemplo, através do Codon Usage Database (http://www.kazusa.or.jp/codon/) descrito por Nakamura et al. 2000 (Nucl Acids Res 28:292). Expressão de polipeptídeos de interesse em micro-organismos recombinantes conforme ensinado aqui pode ser alcançada através de liga- ção operável das sequências de ácido nucleico ou ORF(s) que codificam os bk%h ditos polipeptídeos com sequências regulatórias que permitem a expressão nos ditos micro-organismos.
Neste sentido, o termo "expressando" um poli- peptídeo quando se referindo a um organismo recombinante abrange orga- nismos recombinantes capazes de expressar o polipeptídeo, por exemplo, 5 sob condições de cultura adequadas ou mediante adição de indutores (por exemplo, onde sequências regulatórias induzíveis são usadas)- Uma "ligação operável" é uma ligação em que sequências de á- cido nucleico regulatórias e sequências procuradas ser expressas são co- nectadas de forma a permitir a dita expressão.
Por exemplo, sequências, tal como, por exemplo, um promotor e um ORF, podem ser ditas como sendo operavelmente ligadas se a natureza da ligação entre as ditas sequências não: (1) resulta na introdução de uma mutação de troca de quadro, (2) inter- fere com a capacidade do promotor de direcionar a transcrição do ORF, (3) interfere com a capacidade do ORF ser transcrito a partir da sequência pro- motora.
A natureza precisa de sequências ou elementos regulatórios ne- cessários para expressão pode variar entre organismos, porém tipicamente incluem um promotor e um terminador de transcrição, e opcionalmente um intensificador.
Referência a um "promotor" ou "intensificador" deve ser tomada em seu contexto mais amplo e inclui sequências regulatórias transcricionais necessárias para início de transcrição preciso e, onde aplicável, controle es- pacial e/ou temporal preciso de expressão genética ou sua resposta a, por exemplo, estímulos internos ou externos (por exemplo, exógenos). Mais par- ticularmente, "promotor" pode retratar uma região em uma molécula de ácido nucleico, preferivelmente molécula de DNA, à qual um RNA poIimerase se liga e inicia transcrição.
Um promotor é preferivelmente, porém não necessa- riamente, posicionado a montante, isto é, 5', da sequência cuja transcrição controla.
Tipicamente, em procariontes uma região promotora pode conter ambos o promotor per se e sequências que, quando transcritas em RNA, irão sinalizar o início de sÍntese de proteína (por exemplo, sequência de Shi- ne-Da/gamo).
Em modalidades, promotores contemplados aqui podem ser constitutivos ou induzlveis.
Por meio de exemplo, promotores constitutivos adequados para expressão em espécies de C/ostridium tal como C/ostridium acetobuty/icum 5 incluem, sem Iimitação, o promotor do gene da tiolase de C. acetobuty/icum (promotor Pth|), o promotor do gene da acetoacetato descarboxilase (promo- tor Padc), o promotor do gene da fosfotransbutirilase (promotor Pptb), o promo- tor induzível por xilose do operon xilose de Staphy/ococcus xy/osus (promo- tor XXy|)· Portanto, em modalidades particulares, um promotor é propor- cionado, o qual é um promotor controlado por um operador. Conforme usado aqui, o termo "operador" se refere a uma sequência de nucleotídeo, preferi- velmente sequência de DNA, que controla o início e/ou manutenção da transcrição de uma sequência a partir de um promotor. Tipicamente, um 0- perador pode ser em geral colocado entre um promotor e uma sequência a jusante cuja transcrição o promotor controla. Usualmente, um operador é capaz de ligar um polipeptídeo repressor, através do que reduz a transcrição do dito promotor. Um repressor útil pode alternar entre um estado em que liga o operador e um estado em que não Iiga e tal alternação pode ser vanta- josamente controlada por uma condição externa, por exemplo, uma substân- cia externa ou um metabolito particular. Em consequência, em células hos- pedeiras compreendendo um repressor compatível, a inclusão de um opera- dor no ácido nucleico da invenção pode permitir o controle da atividade do promotor e expressão a partir do mesmo. Sequências operadoras podem ser em geral derivadas de cromossomos bacterianos.
Deve ser apreciado que os ácidos nucleicos da invenção podem codificar um ou mais de um polipeptídeo de interesse. Além disso, onde a expressão de dois ou mais polipeptídeos é desejada, a dita expressão pode ser a partir de unidades de expressão independentes, ou pode ser a partir de uma única unidade de expressão (isto é, expressão multicistrônica) compre- endendo dois ou mais ORFs sequenciais controlados por elementos regula- tórios comuns. Por meio de exemplo, uma unidade de expressão que codifi-
ca dois ou mais polipeptídeos pode ser gerada associando-se códons de início de tradução dos respectivos ORFS com sequências que controlam iní- cio de tradução (por exemplo, sequências de entrada de ribossomo)- Os termos "terminador" e "terminador de transcrição" em geral 5 referem-se a um elemento de sequência no final de uma unidade transcri- cional que sinaliza término de transcrição.
Por exemplo, um terminador está usualmente posicionado a jusante de, isto é, 3' de ORF(s) que codificam um polipeptídeo de interesse.
Por exemplo, onde um ácido nucleico recombinan- te contém dois ou mais ORFs, por exemplo, sucessivamente ordenados e juntos formando uma unidade de transcrição multicistrônica, um terminador de transcrição pode ser vantajosamente posicionado 3' ao ORF mais a ju- sante.
Em uma modalidade preferida, sequências regulatórias que con- trolam a expressão de polipeptídeo(s) conforme ensinado aqui podem ser vantajosamente provida no ácido nucleico recombinante a ser usado para transformar os presentes micro-organismos.
Entretanto, também contempla- das são modalidades em que o ácido nucleico recombinante proporciona sequência(s) de codificação sem uma ou mais sequências regulatórias, ao passo que as sequências regulatórias necessárias são providas pelo micro- organismo transformado (tal como, por exemplo, em que as inserções de ácido nucleico recombinante em uma região cromossomal ou epissomal compreendendo sequências regulatórias adequadas). C/ostridium e C/ostridium acetobutylicum conforme usados aqui se referem a táxons bacterianos conhecidos como tal na técnica, e particu- larmente abrangem bactérias, espécies de bactérias, cepas, subespécies e cultura pertencentes aos ditos táxons, assim como modificados ou engenhei- rados, tal como, por exemplo, mutados ou geneticamente engenheirados, derivados de espécimes de ocorrência natural ou do tipo selvagem.
Por meio de orientação e não limitação, cepas isoladas de C/ostridium disponíveis por American Type Culture Collection (ATCC) podem ser ordenadas, inter alia, sob números de acesso ATCC 842, ATCC 4259, ATCC 39236 ou ATCC 43084 para C/ostn'dium acetobuty/icum.
Cepas isoladas de C/ostridium bei)'e-
rinckii podem, por exemplo, ser ordenadas, thter a/ia, sob números de aces- so ATCC 858 e ATCC 25752. Conforme notado, os polipeptídeos expressos pelos presentes micro-organismos solventogênicos podem ser direcionados para secreção. 5 Para alcançar secreção, uma sequência de ácido nucleico que codifica um polipeptídeo pode ser operavelmente ligada a uma sequência que codifica uma sequência de sinal de secreção. Neste sentido, "operavelmente ligada" significa que a sequência que codifica a sequência de sinal e a sequência que codifica o polipeptídeo a ser secretado são conectadas em quadro ou 10 em fase, de modo que mediante expressão o peptídeo de sinal facilita a se- creção do polipeptídeo assim ligado ao mesmo.
í. Deve ser apreciado que sequências de sinal adequadas podem depender do tipo de micro-organismo em que a secreção é desejada. Por exemplo, sequências de sinal distintas podem ser necessárias em bactérias 15 Gram-positivas versus bactérias Gram-negativas. Por meio de exemplo e não Iimitação, a secreção em bactérias Gram-positivas, e em particular em C/ostridium tal como C. acetobuty/icum, pode ser alcançada usando a sequência de sinal do polipeptídeo precursor de Ceí5A de C. ce/lu/olyticum (sequência exemplar: Genbank acc. No. AA- 20 A51444, versão de seq. 1 revisada em 31 de outubro de 1994(, ou da proteí- na-arcabouço precursora CipC de C ce//u/o/yticum (sequência exemplar: Genbank acc- no- AAC28899, versão de seq. 2 revisada em 5 de dezembro de 2005), ou da proteína arcabouço precursora C1pA de S. acetobuty/icum (sequência exempfar: Genbank acc. no. AAK78886, versão de seq. 1 revi- 25 sada em 19 de janeiro de 2006). Também sem limitação, a secreção em bactérias Gram- negativas pode ser aicançada através da via Sec, por exemplo, usando a sequência de sinal do polipeptídeo precursor de gluconolactonase de Z. mo- bi/is (sequência exemplar: Genbank acc. no. CAA47637, versão de seq. 1 30 revisada em 19 de outubro de 2006) ou do Opr8 porine seletivo de carboi- drato (sequência exemplar: Genbank acc. no. AAV88688, versão de seq. 1 revisada em 25 de janeiro de 2005), ou através da via de translocação de dupla arginina (Tat), por exemplo, usando a sequência de sinal do polipeptí- deo precursor de gluco frutose oxidoredutase e Z. mobiliz (sequência exem- pIar: Genbank acc. no.
CAB02496, versão de seq. 1 revisada em 19 de ou- tubro de 2006). 5 Deve ser apreciado que peptídeos de sinal nativos (ou homólo- gos, endógenos) de polipeptídeos a serem expressos pelos micro- organismos conforme ensinado aqui podem ser empregados, desde que e- les sejam funcionais nos ditos micro-organismos.
Por isso, por meio de e- xemplo, a secreção de Cel5H ou polipeptídeos relacionados pode ser alcan- lO çada usando a sequência de sinal de secreção endógena ou homóloga do polipeptídeo precursor de Cel5H.
Em particular, visto que S. degradans é uma bactéria Gram-negativa, a sequência de sinal endógena ou homóloga de Cel5H pode ser particularmente adequada para secreção da mesma em
- "- outras bactérias Gram-negativas.
Em outras modalidades, polipeptídeos co- 15 mo Cel5H e polipeptídeos relacionados podem seF secretados usando se- quências de sinal heterólogas.
A estrutura de domínio do polipeptídeo Cel5i-l nativo pode ser delineada como GH5-PSL-CBM6-EPR-DZ, com indicação esquemática dos limites de domínio em CeI5H maduro mostrado na figura 9. Fragmentos fun- 20 cionais de Cel5H ou homólogos do mesmo preferivelmente contêm um ou mais dos domínios GH5, CBM6 e DZ, ou domínios correspondentes aos mesmos (por exemplo, domínios análogos dentro de um homólogo e/ou va- riante de Cel5H)- Preferivelmente, domínios compreendidos em tais frag- mentos podem ser funcionais conforme desejado aqui.
Por isso, em modali- 25 dades particulares a invenção contempla fragmentos como aqueles corres- pondentes das organizações de domínio a seguir: GH5, GH5-PSL, GH5- PSL-CBM6, GH5-PSL-CBM6-EPR, PSL-CBM6, PSL-CBM6-EPR, PSL- CBM6-EPR-DZ, CBM6, CBM6-EPR, CBM6-EPR-DZ e EPR-DZ, DZ.
A in- venção também visa fragmentos correspondentes a combinações dos domí- 30 nios de Cel5H maduro, tal como, porém não limitado a EPR-DZ-EPR-DZ.
Conforme notado, a invenção também se refere a diversas fu- sões de Cel5H e polipeptideo relacionados com dominios heterólogos úteis.
Nesse contexto, o termo "heterólogo" denota que O(s) dito(s) domínio(s) são derivados de polipeptídeos que não o poIipeptídeo Cel5H ou o homólogo do mesmo. Em consequência, "heterólogos" quando fazendo referência a com- binações de domínios se refere ao fato de que os diferentes domínios não se 5 originam de (ou não ocorrem naturalmente em) a mesma proteína. Entretan- to, fusões de domlnio(s) derivado(s) de Cel5H adicionais com polipeptideo Cel5H ou homólogo do mesmo, ou fragmentos e/ou variantes do mesmo, também podem ser contempladas. O termo "fusão" é amplamente contemplado aqui como abran- lO gendo, inter a/ia, fusões genéticas (isto é, fundindo partes distintas em um único quadro de leitura aberto) assim como fusões induzidas por meios quí- micos e/ou físicos (por exemplo, reticulação química ou fotoacoplamento). Além disso, fusão inclui fusão direta ou fusão através de um ligante. Ligantes adequados podem incluir, sem limitação, sequências de peptídeo de pelo . 15 menos 3, preferivelmente pelo menos 4 ou 5, mais preferivelmente pelo me- nos 7 e ainda mais preferivelmente pelo menos 12 aminoácidos, tal como entre 3 e 15 aminoácidos, e preferivelmente compreendendo, sendo enri- quecido quanto a ou consistindo em aminoácidos não carregados, preferi- velmente escolhidos a partir de glicina, serina, cisteina, asparagina, tirosina, 20 glutamina, alanina, valina, prolina, treonina e mais preferivelmente glicina ou serina. Domínios catalíticos de glicosídeo hidrolase (GH) podem ser de- rivados de glicosídeo hidroiases (glicosidases) conhecidos per se ou aqueles futuros identificados e isolados inter alia usando procedimentos estabeleci- 25 dos. Glicosidases exemplares incluem aquelas agrupadas sob o EC 3.2.1. A classificação "glicosidases" de NC-IUBMB, mais preferivelmente glicosida- ses capazes de despolimerizar substratos celulósicos e |ingoce|u|ósicos, tal como, por exemplo, celulases (EC 3-2-1.4), celulose 1,4-(3-celobiosidase (EC
3.2.1.91) e endocelulases processivas (EC 3.2.1.4/EC 3.2.1.91). 30 O termo "módu1o(s) de ligação a carboidrato" (CBM) é conhecido na técnica e comumente cobre de maneira ampla todos os módulos não ca- talíticos de ligação a açúcar ou carboidrato encontrados em ou derivados de glicosídeo hidrolases.
Módulos CBM preferidos aqui podem incluir aqueles que se ligam especificamente a celulose ou substratos celulósicos e alterna- tivamente referidos como domínios de Iigação a celulose (CBD). CMB e suas propriedades estruturais e funcionais são revistas, inter ah'a, em Tomme et 5 al. 1995 ("Cellulose-binding domains: classification and properties", em Enzymatic Degradation of lnsoluble Polysaccharides, Saddler JN & Penner M, eds., pp. 142-163, American Chemical Society, Washington) e Boraston et al. 2004 ("Carbohydrate-binding modules: fine tuning polysaccharide re- cognition". Biochem J 382: 769-81). Domínios de ligação à coesina conforme usados aqui referem-se em geral a todos os domínios de polipeptídeo capazes de especificamente se ligar a um ou mais domínios receptores (coesina) de subunidades- arcabouço celulossomal.
Domínios de ligação à coesina exemplares incluem domínios doquerina encontrados em ou derivados de glicosídeo hidrolases que se assemelham a celulossomas.
Ambos os dominios doquerina tipo I e tipo ll são contemplados aqui.
Domínios doquerina são explicados, inter alia, em Lytle et al. 2001 ("Solution structure of a type I dockerin domain, a novel prokaryotic, extracellular calcium-binding domain". J Mol Biol 307: 745-753), Adams et al. 2005 ("Structural characterization of type ll dockerin module from the cellulosome of Clostridium thermocellum: calcium-induced effects on conformation and target recognition". Biochemistry 44: 2173-82) e em Ba- yer et al- 1998 ("Cellulosomes-structure and ultrastructure". J Struct Biol 124: 221-234). Um ensaio adequado para determiner interações doquerina- coesina, tal como para orientar a escolha de uma domínio doquerina ade- quado aqui, é descri'to, inter a/ia, em Haimovitz et al. 2008 ("Cohesin- dockerin microarray: Diverse specificities between two complementary fami- Iies of interacting protein modules". Proteomics 8: 968-979). Também contemplada é a coexpressão e opcionalmente cosse- creção de polipeptídeo ensinados aqui com outros polipeptídeos ou enzimas, preferivelmente polipeptídeos ou enzimas recombinantes, úteis em metabo- lismo de pollmero de carboidrato, particularmente em metabolismo de celu- lose.
O termo "coexpressão" em geral refere-se à expressão de duas ou mais proteínas ou polipeptÍdeos (dito serem coexpressos) pelo menos micro- organismo, particularmente por uma mesma célula do dito micro-organisrno.
Sistemas adequados para alcançar a coexpressão de dois ou mais polipep- tídeos são conhecidos per se.
Sem Iimitação, polipeptídeos co-expressos 5 podem ser codificados por cistrons separados controlados pelos mesmos elementos regulatórios ou diferentes, ou podem ser codificados por um único elemento multicistrônico; tais cistrons podem estar em um cromossomo ou nos mesmos elementos epigenéticos ou diferentes ou combinações dos mesmos. 10 Os termos "glicosídeo hidrolase" ou "glicosidase" em geral a- brangem enzimas e complexos de enzima capazes de hidrolisar iigações glicosídicas, mais particularmente ligações glicosídicas O-, N- ou S-, ainda mais preferivelmente tais ligações em substratos oligossacarídeos e/ou po-
- "- lissacarídeos.
Os termos abrangem exoglicosidases assim como endoglico- 15 sidases.
Os termos particularmente abrangem glicosidases agrupadas sob o EC 3.2.1. A classificação "glicosidases" de NC-IUBMB.
O termo "celulase" em geral abrange enzimas e comptexos de enzima capazes de hidrolisar celulose e substratos contendo celulose.
O termo abrange, setn limitação, os tipos de celulase a seguir: celobio- 20 hidrolase (1,4-f3-D-glucan celobio-hidrolase, EC 3.2.1.91), endo-j3-1,4- glucanase (endo-1,4-B-D-g|ucan 4-glucano-hidrolase, EC 3.2.1.4), endocelu- lase processiva (EC 3.2.1.4./EC 3-2.1.91-) e |3-glucosidase (EC 3.2.1.21). Celulases também abrangem endoglucanases assim como (processivas) exoglucanases, e cobrem enzimas que produzem monômeros e/ou oligôme- 25 ros de diversos comprimentos.
O termo também pode abranger celobiases, celulases oxidativas, glucosidases, celulose fosforilases e outras enzimas comumente assim denotadas.
O termo abrange enzimas capazes de degra- dar diversas formas de celulose, tal como, sem limitação, celulose cristalina, celulose semicristalina, celulose amorfa, hemicelulose e/ou formas de celu- 30 lose quimicamente ou biologicamente modificadas.
Por meio de exemplo e não limitação, o sistema celulósico de C/ostridium ce//u/o/yticum foi revisto por Belaich et al. 1997 ("The cellulolytic system of Clostridium celluldyticum". J Biotechnol 57: 3-14); e de Saccharo- phagus degradans em Taylor et al. 2006 (supra). A invenção também contempla celulossomas engenheirados compreendendo poIipeptídeos, particularmente Cel5H e polipeptídeos rela- 5 cionados (por exemplo, domínio DZ e polipeptídeos compreendendo o mes- mo), conforme ensinado aqui.
Conforme conhecido na técnica, celulossomas nativos representam complexos celulolíticos de múltiplas enzimas, extracelu- lares de determinados táxons bacterianos, tal como, inter a/ia, C/ostridium e Bacteróides.
A organização básica de celulossomas nativos envolve um po- lO lipeptídeo de organização (arcabouço), comumente compreendendo um ou mais módulos de ligação a carboidrato (CBM) iguais ou distintos e um ou mais domínios receptores distintos (coesina) que facilitam a integração de glicosidases ou enzimas celulolÍticas ao complexo de celulossoma através de interação com domínios de doquerina cognatos nas ditas enzimas.
Essas características estruturais de celulossomas nativos tam- bém podem ser empregadas em celulossomas engenheirados, pelo que ati- vidades de ligação a carboidrato e despolimerizante de carboidrato podem ser integradas em celulossomas engenheirados.
Técnicas para produzir ce- lulossomas engenheirados são estabelecidas na arte (veja, por exemplo, Fierobe et al. 2002 ("Degradation of cellulose substrates by cellulosome chi- meras.
Substrate targeting versus proximity of enzyme components". J Biol Chem 27'7: 49621-30); Fierobe et al, 2005 ("Action of designer cellulosomes on homogeneous versus complex substrates: controlled incorporation of t- hree distinct enzymes into a defined trifunctional scaffoldin". j Biol Chem 280: 16325-34): e Perret et al. 2004 ("Production of heterologous and chime- ric scaffoldins by Clostridium acetobutylicum ATCC 824". j Bacteriol 186: 253-7))- De maneira comum, um celulossoma engenheirado pode conter um polipeptídeo arcabouço híbrido ou quimérico compreendendo um ou mais módulos CBM da mesma ou divergente especificidade de substrato de carboidrato., e um ou mais domínios de coesina capazes de ligar os mesmos dominios de doquerina cognatos ou divergentes.
Enzimas, tal como particu-
larmente glicosidases ou enzimas celulohticas, podem ser incorporadas ao celulossoma por meio de módulos de doquerina cognatos (normalmente presentes em e/ou engenheirados nas ditas enzimas) para os domínios de coesina encontrados em polipeptídeo arcabouço.
As ditas enzimas também 5 podem compreender CBM ou outros domínios não catalíticos.
Tais celulos- somas engenheirados são comumente conhecidos na técnica como celulos- sornas "quiméricos" ou "híbridos" ou "minicelulossomas". De maneira alternativa ou adiciona!, a uma ou mais enzimas, tal como glicosidases ou enzimas celulolíticas, podem ser ligadas de maneira covalente com estrutura arcabouço, tal como, por exemplo, sendo expressas como uma parte da mesma cadeia de polipeptídeo (isto é, fusão genética). Tais celulossomas são comumente conhecidos como "covalentes" (Mingar- don et al. 2007, "Exploration of new geometries in cellulosomejike chimeras" Appl.
Environ.
Microbiol. 73: 7138-7149). Portanto, celulossomas engenheirados, tal como celulossomas híbridos, quiméricos, mini ou covalentes, ou qualquer combinação dessas modalidades, ou quaisquer outras formas engenheiradas de celulossomas, são contemplados para uso com os poIipeptídeo ensinados aqui.
O termo "celulose" é conhecido per se na técnica.
Por meio de explicação adicional e não limitação, o termo pode abranger todas as formas de celulose, tal como, sem limitação, formas de celulose de ocorrência natu- ral e não natural, tal como, por exemplo, celulose cristalina, celulose semi- cristalina, celulose microcristalina, celulose amorfa, hemicelulose, celulose regenerada, e/ou formas de celulose quimicamente ou biologicamente modi- ficadas ou derivatizadas, tal como, por exemplo, éteres ou ésteres das mesmas, etc.
Uma substância enriquecida em celulose cristalina pode com- preender, sem limitação, pelo menos cerca de 1°/0 (p/p), por exemplo, z 5% (p/p), preferivelmente pelo menos cerca de 1O°/o (p/p), por exemplo, z 20°/o, z 30% ou z 4O°/j (p/p), mais preferivelmente pelo menos cerca de 50% (p/p), por exemplo, z 60% ou z 70% (p/p), ainda mais preferivelmente pelo menos cerca de 80°6 (p/p), por exemplo, z 90% (p/p) de celulose cristalina, semi-
cristalina e/ou celulose microcristalina conforme entendido na técnica, mais preferivelmente de celulose cristalina.
Métodos e processos para tratar ou contatar substâncias con- tendo celulose com micro-organismos recombinantes tal como ensinado aqui 5 são em geral conhecidos na técnica, e podem, sem limitação, compreender processos de fermentação industrial de diversas escalas.
O material a ser assim fermentado pode ser provido, por exemplo, em forma sólida, semissó- lida, líquida ou solúvel, ou como um homogenato ou extrato, ou como uma dispersão ou suspensão (aquosa), ou como substratos lignocelulósicos ou substratos celulósicos ou celulose (parcialmente) isolada ou purificada e/ou pré-tratada (por exemplo, por pré-tratamento com ácido diluído, pré- tratamento com hidróxido de sódio, pré-tratamento com cal, pré-tratamento com solventes orgânicos com água, processos hidrotérmicos ou AFEX) ou em outras formas usadas per se para despolimerização e/ou fermentação de materiais celulósicos e biomassa.
Em consequência, a invenção também contempla culturas iniciadoras compreendendo os micro-organismos da in- venção, opcionalmente em combinação com um ou mais dos micro- organismos desejados.
Abordagens biotecnológicas para utilização de celu- lose são revistas, inter a/ia, em Lynd et al. 2002 ("Microbial ceHulose utilizati- on: fundamentals and biotechnology". Microbiol Mol Biol Rev 66: 506-77), e em Himmel et al. 2007 ("Biomass recalcitrance: engineering plants and enzymes for biofuels production" Science 315: 804- 807). Os aspectos e as modalidades acima são ainda suportados pe- los exemplos não limitantes a seguir.
Exemplos Exemplo 1: identificação do novo domínio DZ de Cel5H A análise publicada das celuloses putativas produzidas por S. degradans (Taylor et al, 2006, supra) indicaram a seguinte organização para Cel5H (das extremidades N-terminal para C-terminal da enzima): módulo de sequência de sinaVcatalítico (família GH 5/ligante rico em serina/módulo de ligação a carboidrato pertencente a família CBM 6/ligante rico em ácido glu- tâmico e prolina, em outra denotação de sequência de sinal-GH5-PSL-
MÊh e PR Foi realizada uma análise de sequência mais aprofundada que revelou a existência de um novo domínio com cerca de 100 aminoácidos de comprimento denominado DZ no C-terminal de Cel5H, isto é, da posição 496 5 para a posição 596 em SEQ ID NO: 2 (figura IB). Portanto, a organização de Cel5H pode ser denotada como sequência de sinal-GH5-PSL-CBM6-EPR- DZ. Visto que o domínio DZ é rico em resíduos aromáticos (Trp, Tyr), ele pode aceitavelmente representar um novo tipo de módulo de ligação a car- boidrato (CBM). Uma pesquisa quanto a domínios heterólogos em base de dados de sequência de DNA não redundante revelou um domínio altamente homó- logo na celulase putativa codificada pelo gene aclA da bactéria Pseudomo- nas sp. ND137 (posições 465 a 558 de SEQ ID NO: 4, figura ID). Outras proteínas contendo este domínio particular se originam de S. degradans. Outra característica atípica de CeI5H está relacionada ao módu- lo catalítico GH5 cujo comprimento é estimado em 300 aminoácidos, ao pas- so que outras enzimas da família 5 exibem módulos catalíticos de 380-450 resíduos. Este módulo é, portanto, não usualmente curto e sem uma exten- são importante de resíduos altamente conservados entre enzimas da família
5. Exemplo 2: Produção de Cel5H truncado, inteiro (do tipo selva- çjem), e formas engenheiradas de Cel5H em E. coli Usando técnicas de biologia molecular, o DNA que codifica a forma madura de Cel5H (sem sequência de sinal) foi amplificado e clonado em um vetor de expressão de E. co/i (pET22b(+), Novagen). O vetor resul- tante foi usado para transformar a cepa BL21 (DE3) de E. co/i (Novagen). De maneira similar, genes modificados que codificam formas truncadas ou en- genheiradas de Cel5H foram obtidos por PCR e clonados em pET22b(+), antes de transformação da cepa BL(21) (DE3) de E. co/i. Em todos os casos, seis códons His foram enxertados na extremidade C-terminal das protelnas recombinantes para facilitar sua purificação sobre resina Nickel (N1-NTA, Qiagen)- As diversas formas engenheiradas de Cel5H estão resumidas na figura 2. As cepas recombinantes foram cultivadas em meio Luria Bertani e a expressão dos genes clonados foi iniciada usando IPTG como o indutor.
A sÍntese do Cel5H recombinante foi verificada por eletroforese em gel de 5 poliacrilamida (SDS-PAGE) desnaturante.
As culturas foram centrifugadas e as células coletadas foram quebradas em uma prensa francesa.
Exemplo 3: purificação e caracterização das diversas formas de Cel5H e avaliação da atividade sobre diversos substratos incluindo carboxi- metil celulose (CMC), celulose inchada com ácido fosfórico (PASC), Avicel e um substrato bruto, a palha eclodida Ce!5H, Cel5Ht e Cel5Ht-CBM3a foram purificados carregando-se o extrato bruto em N1-NTA (Qiagen), e eluição da proteína de interesse u- sando concentrações crescentes de imidazólio.
A purificação foi alcançada usando FPLC Q-sefarose (resina Hitrap Q HP, GE Healthcare) conforme descrito abaixo.
De maneira alternativa, construtos de Cel5H, mas também Cel5H-CBM3 e CBM3A-Cel5H foram purificados usando um procedimento diferente.
O extrato bruto contendo essas proteínas foi incubado com PASC a 4°C e centrifugado. pélete de celulose foi lavado diversas vezes por centri- fugação em tampão de fosfato, e as proteínas especificamente ligadas à ce- lulose foram eluídas a partir da matriz usando água pura ou trietilamina a 1%. A purificação foi alcançada carregando-se a fração contendo a proteína de interesse sobre uma resina trocadora de ânion (Hitrap Q HP, GE Health- care) a pH 8 usando um dispositivo FPLC- A proteína foi eluída a partir da coluna usando um gradiente linear de NaCl.
Em todos os casos, a pureza foi avaliada por SDS-PAGE, e a proteína concentrada, dividida em alíquotas e armazenada a -80°C.
A atividade das enzimas purificadas foi testada sobre CMC, PASC, Avicel e palha eclodida usando condições padrão (37°C). Para avaliação da atividade sobre CMC, a concentração de en- zima estava a 1 nM e o substrato estava a 8 g/L CMC (pH 6,0). A atividade das diversas formas de CeI5H contra CMC a 37°C está mostrada na figura 3.
O padrão de atividade obtido em todos os casos sugere um modo exo de ação para Cel5H em vez de modo endo de ação. Conforme na figura 3, to- das as enzimas são caracterizadas por uma importante liberação de açúca- res dentro dos primeiros minutos ou segundos da cinética, então a atividade 5 enzimática é consideravelmente reduzida (platô observado após 5 minutos), que é mais típico de uma enzima de atuação exo ou processiva. Com base na velocidade inicial, a atividade específica de Cel5H foi estimada em 20.000 iulµmol sobre CMC. Para avaliação da atividade sobre PASC, a concentração da en- lO zima estava a 5 nM e o substrato estava a 3,5 g/L (pH 6,0). A atividade das diversas formas de Cel5H contra PASC a 37°C está mostrada na figura 4. Remoção do domínio Z (Cel5Ht) reduziu a atividade especifica em aproximadamente 7Ó°/o, mostrando que este domínio desempenha um papel importante durante a hidrólise de PASC por Cel5H. Com base nessa cinética, a atividade específica de Cel5Hwt sobre PASC é aproximadamente
1.000 iu/µmol. Enxertando um CBM3a no N-terminal (CBM3a-CeI5H), o C- terminal (Cel5H-CBM3a) ou em vez do módulo DZ (Cel5Ht-CBM3a) também reduziu a atividade da enzima. Para testar a atividade sobre Avice!, a concentração de enzima estava a 100 nM e o substrato estava a 3,5 g/L (pH 6,0). A atividade das di- versas formas de Cel5H contra Avicel a 37" está mostrada na figura 5. Conforme observado para os outros dois substratos, a atividade do Cel5H do tipo selvagem é superior às formas engenheiradas, e especial- mente em comparação à forma truncada sem o domínio DZ do C-terminal, também confirmando o papel do domínio DZ na degradação de celulose cris- talina. Sua substituição pelo C8M3a potente restaura apenas parcialmente a atividade da avicelase em comparação ao Cel5H do tipo selvagem. A ativi- dade do Cel5H sobre Avicel é elevada, sendo calculada com relação a da- dos obtidos durante a primeira hora da cinética se revela como uma ativida- de específica de 8,5 ± 2 iu/µmol. A atividade enzimática de Cel5H também foi testada com rela- ção ao substrato cromogênico solúvel, para-nitrofeni|-B-D-ce[obiose. Median-
te clivagem pela enzima da ligação entre o grupo para-nitrofenil e a celobio- se, para-nitrofenol e celobiose é Iiberada e sua concentração pode ser dire- tamente determinada por meio de análise espectrofotométrica, A atividade especifica foi cerca de 14 iu/µmol para Cel5H sobre este substrato.
A ativi- 5 dade é cerca de 13 vezes superior à atividade de Cel5A de C. ce//u/o/yt/'cum, que também pertence à família 5 de glicosídeo hidrolases.
Exemplo 4: comparação da atividade de Cel5H avicelase com as celulases do tipo selvaqem e enqenheiradas de C. ce//ulolyticum Usando um projeto de ensaio conforme descrito no exemplo 3, a atividade da Cel5H avicelase foi comparada com celulases do tipo selvagem e engenheiradas de C. ce//ulo/yticum.
A concentração da enzima estava a 100 nM e substrato estava a 3,5g/L(pH6,0). Conforme mostrado na figura 6, Cel5Hwt é quase 6 vezes mais ativa do que Cel9G, uma das celulases mais ativas de C. ce/lu/o/yticum so- bre Avicel- Em comparação à forma engenheirada de Cel9G que contém um módulo C8M3a e um X2 (C8M-X-Cel9G, Mingardon et al. 2007. Appl Envi- ron Microbiol 73:7138-49), Cel5Hwt ainda permanece 25% mais ativa sobre celulose cristalina.
Ao contrário, o celulossoma covalente (que inclui os mó- dulos catallticos de Cel9G e Cel48F e o CBM3a potente; Mingardon et al. 2007, supra) é meramente 36% mais ativo do que Cel5H.
Análise por dionex dos açúcares solúveis liberados por Cel5Hwt sobre Avicel indica que, após 24 horas de incubação, a última enzima Iibera principalmente celobiose (67%), celotriose (26,5%) e glicose (6,5%), isto é, açúcares solúveis de complexidade relativamente baixa, porém nenhuma celotetraose.
A atividade de Cel5H (Cel5Hwt) também foi testada sobre palha eclodida (enzima e substrato a 100 nM e 3,5 g/L, respectivamente). Após 24 horas de incubação, aproximadamente 70 µM de açúcares solúveis foram liberados por CeI5Hwt.
Análise dos açúcares solúveis por dionex indicou que glicose (90%) foi principalmente liberada por Cel5H sobre este substrato bru- to.
Todos os experimentos cinéticos descritos acima foram realiza- dos a 37°C em Tris-maleato a 20 mM pH 6,0; tampão CaC|2 a 1 mM (azida a 0,01% p/v). A atividade da avicelase de Ce!5H também foi medida na pre- sença de cloreto de sódio a i°/o (NaCl a 171 mM) no mesmo tanipão.
Na 5 presença de NaCl, Cel5H foi verificado como sendo 10°/o mais ativo.
A atividade da enzima é consideravelmente reduzida a 50°C em comparação a 37°C, possivelmente devido a desdobramento da enzima a 50°C.
Em resumo, Cel5H exibe uma elevada atividade sobre celulose cristalina e é, portanto, um candidato adequado para produção heteróloga em bactérias produtoras de solvente como C. acetobuçy/icum, para possibili- tar o crescimento desta cepa sobre celulose cristalina ou celulose amorfa.
Os resultados sugerem que o módulo DZ atua como um módulo de ligação a celulose (CBM), que pode vantajosamente ancorar a celulase na superfície do substrato.
Os dados obtidos até agora indicam que esta enzima é prová- vel de ser uma exoglucanase ou uma celulase endoprocessiva (e não uma endoglucanase). Vale notar que celulases da família 5 são usuaknente des- critas como endoglucanases.
Cel5H não libera qualquer celotetraose a partir de celulose pura, porém produz celobiose, glicose e celotriose.
Exemplo 5: domínios suplementares de 4 enxertos e/ou ligantes de Cel5H a outra(s) enzima(s) O módulo DZ de S. degradans sozinho ou com o CBM6 a mon- tante e opcionalmente um Iigante (veja CeI5Hwt na figura 1) foi unido a ou- tra(s) enzima(s) sem tais módulos, usando técnicas de genética molecular.
A celulase selecionada para esses experimentos foi Cel5A de C. ce//u/o/yticum, que de maneira análoga a Cel5H também exibe um módulo catalítico da familia 5 no N-terminal.
Cel5A é uma endoglucanase genulna com atividade moderada sobre Avicel (Fierobe et al. 1991 J Bacteriol 173:7956-62). As enzimas híbridas que foram construídas estão mostradas na figura 7. As diversas formas engenheiradas de Cel5A foram purificadas e sua atividade foi testada sobre Avicel e comparada a Cel5Awt e Cel5At (figu-
ra 8). Os perfis de atividade observados indicaram que a presença de um domlnio DZ melhora a atividade de Cel5A (isto é, hidrólise de Avicel por Cel5A). Em particular, após 24 horas de incubação, a quantidade de açúca- 5 res liberados por Cel5At-DZ ou Cel5At-DZ2 é três vezes superior à quanti- dade de açúcares liberados por Cel5At.
Esses resultados sugerem que a enzima é fixa ou presa pelo domínio DZ sobre a celulose.
Portanto, sugere- se que o domlnio DZ é um novo tipo de domínio de fixação.
Entretanto, as atividades observadas são 20% mais baixas do 10 que a atividade de Cel5At-CBM3. O domínio CBM arcabouço, assim, parece também ser relevante para a melhora da atividade de CeI5A sobre celulose cristalina. . A adição de dois domínios DZ não aumenta de maneira signifi- cativa a atividade da enzima em comparação a construtos de enzima tendo 15 apenas um domínio DZ.
Também é notado que um construto de Cel5A com um ou mais domínios DZ adicionais é quatro vezes menos ativo do que celulase Cel5H do tipo selvagem sobre celulose cristalina.
Portanto, um construto de Cel5A, compreendendo ambos o do- 20 mínio CBM (CBM6) e o domínio DZ de Cel5H, é feito.
A introdução de um domínio CBM6 entre o dominio Cel5A catalítico e o dominio DZ de Cel5H aumenta a atividade da enzima com relação à degradação de celulose cris- talina.
Exemplo 6: atividade de Cel5H é complementar ou aditiva à ati- 25 vidade de outras celulases sobre celulose cristalina, no estado livre ou incor- porada a um celulossoma híbrido Experimentos cinéticos foram realizados para investigar se a ati- vidade de Cel5H é complementar ou aditiva àquela de outras enzimas celu- lase na degradação de celulose cristalina pura. 30 Nesses experimentos, as enzimas a seguir foram testadas: - enzimas do tipo selvagem de C. ce//ulo/yticum: Cel5A (endo), Cel9G (endo), Cel9M (endo), Cel9P (endo), Cel48F (processiva) e Cel9E
(processiva)- -enzimas isoladas de organismos que não C. ce//u/o/yticum : Cel6A (exo) de Neoca//imastix patriciarum (cogumelo)- A quantidade de açúcares soÍúveis que foram liberados pelas 5 enzimas após 24 horas de incubação sobre celulose cristalina Avicel (3,5 g/L de tampão (tampon), Tris-maleato a 20 mM pH 6, CaC|2 1 a 1 mM) estão mostradas na figura 9. Para cada combinação de enzimas, a primeira barra indica a soma das atividades individuais de ambas as enzimas, ao passo que a segunda barra indica a atividade de uma mistura de ambas as enzi- lO mas (cada enzima estando presente a uma concentração de 0,1 mM). Esses resultados indicam que as atividades de outras celuloses são na maioria dos casos complementares ou aditivas à atividade da celulo- se de Cel5H.
Outros experimentos incluem a degradação de Avicel por mini- - . 15 celulossomas hlbridos compreendendo CeI5H anexo a um módulo doquerina adequando (tal como, por exemplo, na figura 2), uma ou duas outras celula- ses complementares portando doquerinas cognatas e ligadas a um arcabou- ço hibrido que exibe um módulo C8M3a opcional (veja figL|ra 10)- É demons- trada a degradação aumentada de substrato em comparação ao Cel5H ou 20 outras celulases sozinhas.
Exemplo 7: produção e secreção de Cel5H (tipo selvagem, en- genheirada, com sequência de sinal modificada) sozinho ou com outras celu- lases (e/ou arcabouço) por C- acetobuty/icum O gene do tipo selvagem que codifica Cel5H foi amplificado por 25 PCR a partir da cepa S. degradans, e clonado no vetor de transferência pSOS952 de E. co/i-C. acetobuty/icum.
Esse plasmídeo é um vetor de ex- pressão para C. acetobuty/icum (Perret et al. 2004. j Bacteriol 186: 253-7). A expressão do gene de interesse está sob o controle do promotor forte e constitutivo (pthA do gene que codifica a enzima tiolase.
Dois operadores lac 30 foram introduzidos a montante e a jusante do pthl para impedir qualquer ex- pressão do gene em E. co/i.
O vetor foi subsequentemente metilado (in vivo usando a cepa ER2275[pAN1] e in vitro usando a metilase CpG) e usado para eletro-transformar cepa de C. acetobuty/icum conforme anteriormente descrito.
Clones recombinantes foram obtidos e testes de PCR em colônias indicaram que o vetor permanece intacto no C/ostridium solventogênico.
Di- versos clones foram cultivados em meio 2YTC, porém nenhuma atividade 5 adicional de CMCase foi detectada no sobrenadante da cultura em compa- ração à cepa de controle que abriga o pSOS952 "vazio" (teste de CMCase sobre placas). Visto que o teor de CG de S. degradans é em torno de 46%, ao passo que C. acetobuty/icum exibe um teor de CG de 31%, foi previsto que o 10 gene do tipo selvagem que codifica Cel5H pode não ser adaptado à polari- zação de códon de C. acetobutylicum.
Um gene sintético que codifica Cel5H do tipo selvagem, porém adaptado à polarização de códon de C. acetobuty/i- cum foi feito e cIonado conforme descrito acima em pSOS952. 4 O Cel5H de códon otimizado que codifica a sequência para C. 15 acetobuty/icum está mostrado na figura 1F (SEQ ID NO: 6) e a sequência de polipeptídeo correspondente está mostrada na figura 1G (SEQ ID NO: 7). As sequências contêm um marcador 6xHis C-terminal, engenheirado para facili- tar a detecção e/ou isolamento.
Transformação de C. acetobutylicum com esse novo vetor (após 20 metilação) gerou colônias recombinantes.
Análise do sobrenadante após crescimento em 2YTC revelou um atividade aumentada de CMCase, assim mostrando que Cel5H ativa foi secretada pela cepa recombinante.
O rendi- mento de secreção parece atualmente permanecer abaixo de 1 mg/L S. degradans é uma bactéria Gram-negativa que exibe duas 25 membranas (membrana externa e membrana citoplasmática), ao passo que C. acetobuty/icum (bactéria Gram-positiva) possui apenas uma membrana citoplasmática.
A sequência de sinal nativa de Cel5H é, portanto, projetada para lidar com a secreção através das duas membranas, porém pode não ser adequada para secreção eficiente por C. acetobuty/icum.
Por esta razão, 30 usando técnicas de biologia molecular, substituiu-se a sequência de sinal nativa de Cei5H por aquela de CeI5A de C. ce/lu/o/yticum, visto que a última é bem secretada por C. acetobuty/icum (até 5 mg/L). Transformou-se C. ace-
tobutylicum com o vetor contendo o gene híbrido. O rendimento da secreção de Cel5H usando a sequência de sinal de Cel5A foi investigado. Foi de- monstrado que níveis de secreção foram aumentados através da substitui- ção da sequência de sinal nativa de Cel5H por aquela de Cel5A de C. ce/lu- 5 /o/yticum. Devido à forte atividade de Cel5H sobre pNP-celobiosídeo, foi possÍvel medir níveis de secreção de cerca de 0,5 mg/L. Uma cultura da cepa bacteriana recombinante foi cultivada em um fermentador em um ambiente de 3 g/L de 2YT-PASC com um pH fixo a
5.5. Foi medida a degradação de PASC, o consumo de celobiose residual e crescimento bacteriano. Os resultados estão mostrados nas figuras 11 e 12. Um significante crescimento bacteriano foi observado durante as primeiras 40 horas até que um valor OD de 0,45 foi alcançado. Subsequen- temente, ocorreu lise celular. Ao mesmo tempo, uma degradação crescente de PASC foi observada- Após 117 horas, 68% do PASC foram consumidos, porém nenhum mono ou oligossacarldeo pôde ser detectado. lsso sugeriu que os açúcares liberados por Cel5H através de hidrólise de PASC foram imediatamente consumidos pelas bactérias. Esses resultados mostraram que foi bem sucedida a construção de uma cepa que é capaz de crescer sobre meio suplementado com PASC. Uma segunda cultura da cepa bacteriana recombinante foi culti- vada em um fermentador em um ambiente de 2YT (entretanto não contendo qualquer PASC) com um pH fixo a 5,5. o objetivo deste experimento foi ava- liar a correlação entre crescimento bacteriano e o consumo de PASC. Os resultados estão mostrados na figura 12. Conforme esperado, nenhum cres- cimento bacteriano pôde ser observado nesse caso. Portanto, é possível concluir que o crescimento bacteriano ob- servado é devido à degradação de PASC e subsequente consumo de açúca- res liberados. Além disso, uma terceira cultura é estabelecida, para verificar se o crescimento bacteriano observado é devido à atividade de Cel5H e não à atividade do sistema enzimático endógeno de C. acetobuty/icum. Portanto, uma cultura de uma cepa contendo um vetor vazio (pSOS) é cultivada em um fermentador em um ambiente de 3 g/L de 2YT-PASC com um pH fixo a 5,5. Por fim, uma quarta cultura é cultivada em um fermentador em um ambiente de 5 g/L de 2YT-PASC com um pH fixo a 5.5 para verificar se a 5 concentração de PASC é o fator Iimitante para crescimento bacteriano.
As- sim, uma concentração superior de PASC pode potencialmente resultar em valores OD superiores (isto é, superiores ao valor OD máximo de 0,45 ob- servado no experimento anterior). O gene que codifica Cel5H é clonado em combinação com ge- lO nes que codificam outras celulases que atuam de maneira independente de Cel5l-l no estado livre.
De maneira alternativa, os genes que codificam mini- celulossomas eficientes compreendidos de Cel5H (anexos a uma doqueri- na), um arcabouço e uma ou duas outras celulases portando doquerinas a- dequadas são clonados e expressos em C. acetobuty/icum.
Quando três ou quatro genes diferentes são clonados, um se- gundo vetor de expressão chamado pMTL é também usado.
Esse vetor foi mostrado como sendo compatível com pSOS952 em C. acetobuty/icum.
De maneira alternativa, os genes são integrados no cromossomo em locais es- pecíficos (tal como ensinado, inter a/ia, no PCT/EP2006/066997), ou aleato- riamente.
Além disso, celulases com módulos adicionados de CeI5H (par- ticularmente DZ e, opcionalmente CBM6, veja Exemplo 4) são clonados e expressos em C. acetobuty/jcum, para alcançar uma degradação aumentada e utilização de celulose cristalina.
Foram usadas ambas as cepas do tipo selvagem e diversas en- genheiradas de C. acetobutylicum, tal como, por exemplo, cepas com meca- nismo de secreção modificado, otimizadas para a secreção de proteínas he- terólogas e/ou metabolismo modificado para produção otimizada de etanol (ou butanol). Os C. acetobutylicum recombinantes correspondentes são mos- trados como exibindo e secretando as enzimas engenheiradas, e exibem capacidade de crescer sobre e/ou degradar um ou mais substratos celulósi-
COS.
Exemplo 8: aumento da secreção de Cel5H por C. acetobuty/i- cum Diversas construções foram feitas e estão representadas de ma- 5 neira esquemática na figura 13, em que foram usados módulos obtidos de diferentes proteínas arcabouço. Em um primeiro construto, o ácido polinucleico sintético adapta- do à poIarização de códon de C. acetobuty/icum e que codifica a Cel5H celu- lase de Saccharophagus degradans foi fundido a um ácido polinucleico que codifica um domínio carreador e que compreende o módulo C8M3a, os pri- meiro (Xa) e segundo (Xa') módulos X obtidos da proteína C1pA de C. aceto- buty/icum e o peptídeo de sinal da proteína arcabouço CipC de C. ce//ulo/yti- cum. Sequências ligantes adequadas são usadas para ligar os diferentes módulos entre si. A estrutura de domínio do polipeptldeo Cel5H nativo pode ser delineada como GH5-PSL-CBM6-EPR-DZ, em que GH5 significa seu domí- nio da família 5 de glicosídeo hidrolase, PSL significa o ligante de polisseri- na, CBM6 significa domínio da família 6 do módulo de ligação a carboidrato, EPR significa a região rica em ácido glutâmico-prolina e, sem estar limitado a esta interpretação, DZ representa um domínio C-terminal identificado pelos presentes inventores como um módulo de ligação a carboidrato putativo. Esse construto foi constru ído usando técnica Overlap Extension PCR, e cIonado no vetor de expressão de transferência pSOS952, que con- fere resistência ao antibiótico eritromicina, desse modo gerando o plasmídeo pSOS952-CBM-Xa-Xa'-5H. Os construtos foram avaliados por sequencia- mento e metilados in vivo e in vitro. O vetor metilado foi subsequentemente usado para eletrotransformar cepa ATCC 824 de C. acetobuty/icum. A secreção por C. acetobuty/icum da proteína Cel5H do tipo sel- vagem anexa ao peptídeo de sinal da CipC arcabouço de C. ce//u/o/yticum foi 0,5-0,9 mg/L (valores com base na atividade do sobrenadante da cultura sobre para-nitrofenil-celobiose). Entretanto, cepas de C. acetobuty/icum por- tando os dois construtos que codificam a proteína de fusão compreendendo a proteína Cel5H ligada ao domínio carreador secretaram uma proteína de fusão contendo a celulase 5H em seu meio de crescimento em quantidades significantemente superiores, mais particularmente até 6,1 mg/L (valor com base na atividade do sobrenadante da cultura sobre para-nitrofenil- 5 Celobiosídeo, veja figura 14(3). Esses resultados demonstram a produção e secreção de Cel5l-l por C. acetobuty/icum.
Exemplo 9: demonstração da atividade das proteínas de fusão de acordo com a invenção sobre celulose Usando técnicas de biologia molecular, o DNA que codifica os 10 diferentes construtos de proteína descritos no Exemplo 8 foi amplificado e clonado em um vetor de expressão de E. coli (pET22b(+), Novagen). O vetor resultante foi usado para transformar a cepa BL21 de E co/i (DE3) (Nova- - gen). Em todos os seis casos, seis códons His foram enxertados da extremi-
, "- dade C-terminal das proteínas recombinantes para facilitar sua purificação 15 sobre resina Nickel (N1-NTA, Qiagen). As cepas recombinantes foram cultivadas em meio Luria Bertabi e a expressão dos genes clonados foi iniciada usando IPTG como o indutor.
A sintese das proteínas recombinantes foi verificada por eletroforese em gel de poliacrilamida desnaturante (SDS-PAGE). As culturas foram centrifuga- 20 das e as células coletadas foram quebradas em uma prensa francesa.
As proteínas recombinantes foram purificadas por carregamento do extrato bruto em N1-NTA (Qiagen), e eluição da proteína de interesse u- sando concentrações crescentes de imidazólio.
A purificação foi alcançada usando FPLC Q-sefarose (resina Hitrap Q HP, GE Healthcare). 25 A atividade da enzima Cel5H purificada foi testada quando a pa- ra-nitrofenil-celobiose e os resultados estão apresentados na figura 15a.
De maneira alternativa, a atividade foi medida sobre Avicel (celulose microcrista- Iina) usando condições padrão (37°C). Os resultados estão ilustrados na fi- gura 15b. 30 Exemplo 10: as estratéçjias de clonaçjem e expressão conforme descritas nos exemplo 2 a 7 são usadas com homóloqos de Cel5H, particu- larmente com ACLA de Pseudomonas sp ND 137 codificado pelo çjene ac/A
A mesma estratégia é aplicada com enzimas que exibem uma importante homologia geral com Cel5H de S. degradans, e em particular possuem um domínio DZ. lsso é exemplificado pela enzima (ACLA) codificada pelo gene 5 ac/A de Pseudomonas sp ND137. A figura 16 compara a organização geral de ACLA com aquela de Cel5H.
O gene que codifica ACLA já foi clonado e superexpresso em E. co/i, porém a enzima correspondente não foi totalmen- te caracterizada (Aoki & kamei 2006. European Journal of Phycology 41: 321-328). Com relação ao alto grau de homologia entre essas duas enzi- mas (com a exceção dos ligantes), é esperado que elas compartilhem pro- priedades / atividades similares.
Em consequência, as estratégias de cIona- gem e expressão descritas nos Exemplos 2 a 7 são aplicadas a ACLA, e produzem um sistema de degradação de celulose adicional, particularmente em C. acetobutylicum.
Exemplo 11: avaliação da atividade de ACLA sobre diversos substratos incluindo para-nitrofeni|-B-D-ce|objose (pNPC), celulose inchada com ácido fosfórico (PASC) e Avicel A atividade da enzima ACLA purificada foi testada quanto a uma variedade de substratos usando condições padrão (27°C) e comparada à atividade de Cel5H recombinante purificado sobre os mesmos substratos.
A atividade enzimática de ACLA foi testada sobre o substrato cromogênico solúvel, para-nitrofenil-B-D-ce|obiose (pNPC) e comparada à- quela de Cel5H (a 95% de pureza). Mediante cIivagem pela da ligação entre o grupo para-nitrofenil e a celobiose, para-nitrofenol e celobiose é liberada e sua concentração pode ser diretamente deterrninada por meio de análise espectrofotométrica.
A atividade enzimática de ACLA sobre para-nitrofenil-[3- D-celobiose estava a 17,9 ui/µmol, ao passo que a atividade enzimática de Cel5H sobre o mesmo substrato estava a 18,2 ui/µmol.
Em consequência, ACLA mostrou 98% de atividade enzimática em comparação a Cel5H sobre substrato de para-nitrofeni|-B-D-ce|obiose.
Para testar a atividade sobre PASC (celulose amorfa), a concen-
tração de enzima usada estava a 5 nM e a concentração de substrato estava a 3,5 g/L (pH 6,0). A atividade enzimática de ACLA sobre PASC estava a 780 ui/µmol, ao passo que a atividade enzimática de CeI5H sobre o mesmo substrato estava a 1600 ui/µmol.
Em consequência, ACLA mostrou 49°6 de 5 atividade enzimática em comparação a Cel5H sobre PASC.
Para avaliação da atividade sobre Avicel (celulose cristalina), a concentração de enzima é 100 nM e substrato é a 3,5 g/L (pH 6,0). A ativi- dade enzimática de ACLA sobre Avicel estava a 56 µM/24h, ao passo que a atividade enzimática de Cel5H sobre o mesmo substrato estava a 140 µM/24h.
Em consequência, ACLA mostrou 40°6 de atividade enzimática em comparação a CeI5H sobre Avicel.

Claims (16)

REIVINDICAÇÕES
1. Bactéria recombinante que expressa o polipeptídeo Cel5H de cepa 2-40 de Saccharophagus degradans ou um homólogo do mesmo, ou um fragmento funcional e/ou variante do dito polipeptideo Cel5H ou do dito 5 homólogo, cuja bactéria recombinante é capaz de degradar celulose.
2. Bactéria recombinante, de acordo com a reivindicação 1, compreendendo uma molécula de ácido nucleico recombinante que codifica o polipeptídeo Cel51-l ou homólogo do mesmo, ou que codifica o fragmento funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo, ope- lO ravelmente ligada a sequências regulatórias que permitem a expressão no d ito micro-organismo-
3. Bactéria recombinante, de acordo com qualquer uma das rei- vindicações 1 e 2, que é uma bactéria solventogênica, mais particularmente uma bactéria etanologênica.
4. Bactéria recombinante, de acordo com qualquer uma das rei- vindicações 1 a 3, que é C/ostridium acetobuty/icum.
5. Bactéria recombinante, de acordo com qualquer uma das rei- vindicações 1 a 4, em que o polipeptídeo Cel5H ou homólogo do mesmo, ou o fragmento funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo, é fundida a um ou mais domínios heterólogos ao polipeptídeo Cel5H ou homólogo do mesmo, escolhido a partir de um domínio catalítico de glicosídeo hidrolase (GH), um domínio de módulo de Iigação a carboidra- to (CBM), um domínio de ligação à coesina tal como um domínio doquerina, e um domínio hidrofílico (módulo X) de uma proteína arcabouço celulosso- mal.
6. Bactéria recombinante, de acordo com qualquer uma das rei- vindicações 1 a 5, em que o polipeptídeo Cel5H ou homólogo do mesmo, ou o fragmento funcional e/ou variante do dito polipeptídeo Cel5H ou do dito homólogo, e opcionalmente a uma ou mais enzimas capazes de degradar uma substância contendo celulose, estão compreendidos em um celulosso- ma híbrido e/ou covalente ou minicelulossoma.
7. Domínio isolado (domínio DZ) do polipeptídeo CeI5H de cepa m 2-40 de Saccharophagus degradans do aminoácido 496 ao aminoácido 596 do dito polipeptídeo Cel5H ou um domínio isolado homólogo ao mesmo, ou um fragmento funcional e/ou variante do dito domínio DZ ou do dito domínio homólogo. 5
8. Fragmento isolado do polipeptídeo Cel5H ou de um homólogo ou variante do mesmo, tendo a estrutura EPR-DZ, CBM6-EPR-DZ ou PSL- CBM6-EPR-DZ, em que EPR significa uma região rica em ácido glutâmico- prolina e PSL significa ligante de polisserina.
9. Polipeptídeo quimérico compreendendo o domínio isolado ou fragmento funcional e/ou variante do mesmo como definido na reivindicação 7, ou o fragmento isolado como definido na reivindicação 8, do polipeptldeo Cel5H, e ainda compreendendo um ou mais dominios heterólogos ao poli- peptídeo Cel5H ou homólogo do mesmo, escolhido a partir de um domínio catalítico GH, um domínio CBM, um domínio de ligação à coesina tal como um domínio doquerina e um domínio hidrofílico (módulo X) de uma proteína arcabouço celulossomal.
10. Ácido nucleico recombinante que codifica o domínio isotado ou fragmento funcional e/ou variante do mesmo como definido na reivindica- ção 7, ou o fragmento isolado como definido na reivindicação 8, do polipep- tídeo Cel5H ou o polipeptídeo quimérico como definido na reivindicação 9.
11. Ácido nucleico recombinante de acordo com a reivindicação 10, adicionalmente compreendendo sequências regulatórias que permitem a expressão em uma bactéria hospedeira.
12. Bactéria hospedeira transformada com o ácido nucleico re- combinante como definido na reivindicaçãolO ou 11.
13. Bactéria hospedeira de acordo com a reivindicação 12, que é Clostridium acetobuty/icum.
14. Método para a degradação de uma substância compreen- dendo celulose, que compreende contatar a dita substância com a bactéria recombinante como definida em qualquer uma das reivindicações 1 a 6, ou com o domínio isolado ou fragmento funcional e/ou variante do mesmo como definido na reivindicação 7, ou o fragmento isolado como definido na reivin-
dicação 8, do polipeptídeo Cel5H, ou o polipeptídeo quimérico como definido na reivindicação 9, ou o peptideo quimérico como definido na reivindicação 9, ou a bactéria hospedeira como definida na reivindicação 12 ou 13.
15. Método para produzir um solvente, combustível ou interme- diário químico a partir de uma substância compreendendo celulose, que compreende tratar a dita substância com o micro-organismo recombinante como definido em qualquer uma das reivindicações 1 a 6, ou corn a bactéria hospedeira como definida na reivindicação 11 ou 12.
16. Método de acordo com a reivindicação 14 ou 15, em que a dita substância compreende ou é enriquecida em celulose cristalina.
BRPI0921956-0A 2008-11-28 2009-11-26 reagentes relacionados à celulase cel5h e seu uso em micro-organismos BRPI0921956A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08291120A EP2192177A1 (en) 2008-11-28 2008-11-28 Cellulase Cel5H related reagents and their use in microorganisms
EP08291120.7 2008-11-28
PCT/EP2009/065922 WO2010060964A2 (en) 2008-11-28 2009-11-26 Cellulase cel5h related reagents and their use in microorganisms

Publications (1)

Publication Number Publication Date
BRPI0921956A2 true BRPI0921956A2 (pt) 2020-11-03

Family

ID=40810820

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0921334A BRPI0921334A2 (pt) 2008-11-28 2009-11-26 polipeptídeos celulolíticos e seu uso em micro-organismos para a produção de solventes e combustíveis.
BRPI0921956-0A BRPI0921956A2 (pt) 2008-11-28 2009-11-26 reagentes relacionados à celulase cel5h e seu uso em micro-organismos

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BRPI0921334A BRPI0921334A2 (pt) 2008-11-28 2009-11-26 polipeptídeos celulolíticos e seu uso em micro-organismos para a produção de solventes e combustíveis.

Country Status (10)

Country Link
US (2) US8871479B2 (pt)
EP (3) EP2192177A1 (pt)
JP (2) JP2012510262A (pt)
CN (2) CN102227498A (pt)
AU (2) AU2009318985B2 (pt)
BR (2) BRPI0921334A2 (pt)
CA (2) CA2744659A1 (pt)
NZ (2) NZ592751A (pt)
RU (2) RU2011123156A (pt)
WO (2) WO2010060964A2 (pt)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2192177A1 (en) * 2008-11-28 2010-06-02 Total S.A. Cellulase Cel5H related reagents and their use in microorganisms
EP2194120A1 (en) * 2008-12-02 2010-06-09 Total S.A. Bioprocessing ligno-cellulose into ethanol with recombinant clostridium
US8431371B2 (en) * 2009-11-19 2013-04-30 Academia Sinica Expression system for producing multi-enzyme complexes and uses thereof
WO2012055863A1 (en) * 2010-10-25 2012-05-03 Total S.A. Covalent cellulosomes and uses thereof
EP2824177B1 (en) * 2012-03-08 2017-07-12 Japan Agency for Marine-Earth Science and Technology Novel cellulase
KR101646741B1 (ko) * 2013-04-26 2016-08-09 고려대학교 산학협력단 신규 재조합 셀룰레이즈 및 그의 용도
CN109975220A (zh) * 2019-02-15 2019-07-05 深圳华康生物医学工程有限公司 一种精浆中性α-葡萄糖苷酶测定试剂盒
CN111944787B (zh) * 2020-07-30 2022-03-29 华南理工大学 一种融合碳水化合物结合模块的几丁质酶及其制备方法与应用
CN116254189B (zh) * 2022-11-04 2024-04-02 四川轻化工大学 一种利用拜氏梭菌半固态发酵油菜秸秆产丁酸的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8273557B2 (en) 2004-05-04 2012-09-25 University Of Maryland Hydrolytic enzyme mixtures for saccharification of lignocellulosic polysaccharides
JP5437631B2 (ja) 2005-07-01 2014-03-12 ザ ユニバーシティー オブ フロリダ リサーチ ファンデーション インク エタノール産生のための組み換えホスト細胞及び培地
WO2008021141A2 (en) * 2006-08-09 2008-02-21 The University Of Florida Research Foundation, Inc. Re-engineering bacteria for ethanol production
CN101528930B (zh) 2006-10-03 2013-12-11 代谢探索者公司 用于在梭菌属中进行染色体整合和dna序列替换的方法
CN101688189A (zh) 2007-04-30 2010-03-31 马里兰大学 在变形菌降解整个植物材料过程中糖酶的表达
EP2192177A1 (en) * 2008-11-28 2010-06-02 Total S.A. Cellulase Cel5H related reagents and their use in microorganisms
JP2011529336A (ja) * 2008-07-31 2011-12-08 トータル エス.アー. ポリペプチドを産生及び分泌させるための構築物及び方法

Also Published As

Publication number Publication date
AU2009318985B2 (en) 2014-07-24
CN102227499A (zh) 2011-10-26
US20110294184A1 (en) 2011-12-01
US20120122176A1 (en) 2012-05-17
JP2012510262A (ja) 2012-05-10
CA2744659A1 (en) 2010-06-03
WO2010060964A3 (en) 2010-07-29
AU2009318986A1 (en) 2010-06-03
WO2010060964A2 (en) 2010-06-03
US8871479B2 (en) 2014-10-28
CN102227498A (zh) 2011-10-26
AU2009318985A1 (en) 2010-06-03
NZ592751A (en) 2013-01-25
RU2011123157A (ru) 2013-01-10
WO2010060965A1 (en) 2010-06-03
BRPI0921334A2 (pt) 2019-09-24
EP2370570A2 (en) 2011-10-05
EP2370571A1 (en) 2011-10-05
RU2011123156A (ru) 2013-01-10
JP2012510263A (ja) 2012-05-10
EP2370570B1 (en) 2017-11-01
CA2744607A1 (en) 2010-06-03
EP2192177A1 (en) 2010-06-02
NZ592750A (en) 2013-01-25

Similar Documents

Publication Publication Date Title
BRPI0921956A2 (pt) reagentes relacionados à celulase cel5h e seu uso em micro-organismos
Doi et al. Cellulosomes: plant-cell-wall-degrading enzyme complexes
Wu et al. Processivity and enzymatic mechanism of a multifunctional family 5 endoglucanase from Bacillus subtilis BS-5 with potential applications in the saccharification of cellulosic substrates
Bayer et al. Cellulosomes—structure and ultrastructure
Gal et al. CelG from Clostridium cellulolyticum: a multidomain endoglucanase acting efficiently on crystalline cellulose
Demain et al. Cellulase, clostridia, and ethanol
CA2657684C (en) Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
Liu et al. Cloning and functional characterization of a novel endo-β-1, 4-glucanase gene from a soil-derived metagenomic library
WO2010075529A2 (en) Heterologous biomass degrading enzyme expression in thermoanaerobacterium saccharolyticum
Zhu et al. Characterization of a family 5 glycoside hydrolase isolated from the outer membrane of cellulolytic Cytophaga hutchinsonii
CN104011214B (zh) C.bescii耐热酶
US9512414B2 (en) Thermostable beta-glucosidase
Simpson et al. Functional analysis of the carbohydrate-binding domains of Erwinia chrysanthemi Cel5 (Endoglucanase Z) and an Escherichia coli putative chitinase
Todhanakasem et al. Expression and extracellular secretion of endo-glucanase and xylanase by Zymomonas mobilis
Louime et al. Molecular cloning and biochemical characterization of a family-9 endoglucanase with an unusual structure from the gliding bacteria Cytophaga hut chinsonii
EP2995686B1 (en) Thermostable beta-glucosidase
US9322007B2 (en) Stable fungal Cel6 enzyme variants
EP3133156B1 (en) Hyperthermostable endoglucanase
Conway In Vitro and In Vivo Analyses of the Role of Multi-Domain Glycoside Hydrolases from Extremely Thermophilic Caldicellulosiruptor Species in the Degradation of Plant Biomass.
Bjølgerud Molecular evolution of the substrate specificity of bacterial lytic polysaccharide monooxygenases (LPMOs)
Stern Characterization and application of elaborate designer cellulosome structures
Doi et al. The Clostridium cellulovorans cellulosome.
Bista Cloning and Characterization of a Novel Thermostable Endoglucanase from Caldicellulosiruptor Bescii in Heterologous Host Escherichia Coli
Kahna et al. Color: Fig 1-9 SuppInfo: 3 Table Glycosylation of hyperthermostable designer cellulosome components yields enhanced stability and cellulose hydrolysis Running Title: Glycosylation improves designer cellulosomes
Saleem Activity and synergistic action on cellulosic substrates of engineered product-site variants of Hypocrea jecorina Cel7A

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 10A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2601 DE 10-11-2020 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.

B25B Requested transfer of rights rejected

Owner name: TOTAL S.A (FR) ; L' UNIVERSITE DE PROVENCE (FR) ; L'UNIVERSITE DE LA MEDITERRANEE (FR) ; L'INSTITUT NATIONAL DES SCIENCES APPLIQUEES (INSA) (FR) ; LE CENTRE NATIONAL DE RECHERCHE SCIENTIFIQUE (CNRS) (FR)

Free format text: INDEFERIDO O PEDIDO DE TRANSFERENCIA CONTIDO NA PETICAO 20130067611 DE 07/08/2013, EM VIRTUDE DA MANUTENCAO DO ARQUIVAMENTO (8.11) PUBLICADO NA RPI2617 DE 02/03/2021.

B25E Requested change of name of applicant rejected

Owner name: TOTAL S.A (FR) ; L' UNIVERSITE DE PROVENCE (FR) ; L'UNIVERSITE DE LA MEDITERRANEE (FR) ; L'INSTITUT NATIONAL DES SCIENCES APPLIQUEES (INSA) (FR) ; LE CENTRE NATIONAL DE RECHERCHE SCIENTIFIQUE (CNRS) (FR)

Free format text: INDEFERIDO O PEDIDO DE ALTERACAO DE NOME CONTIDO NA PETICAO 860140030515 DE 14/03/2014, EM VIRTUDE DA MANUTENCAO DO ARQUIVAMENTO (8.11) PUBLICADO NA RPI2617 DE 02/03/2021.

B350 Update of information on the portal [chapter 15.35 patent gazette]