BRPI0817853B1 - Variantes de glucoamilase com propriedades alteradas, método de produção das mesmas, composição de enzima e microorganismo transgênico - Google Patents
Variantes de glucoamilase com propriedades alteradas, método de produção das mesmas, composição de enzima e microorganismo transgênico Download PDFInfo
- Publication number
- BRPI0817853B1 BRPI0817853B1 BRPI0817853-4A BRPI0817853A BRPI0817853B1 BR PI0817853 B1 BRPI0817853 B1 BR PI0817853B1 BR PI0817853 A BRPI0817853 A BR PI0817853A BR PI0817853 B1 BRPI0817853 B1 BR PI0817853B1
- Authority
- BR
- Brazil
- Prior art keywords
- glucoamylase
- seq
- sequence
- variant
- trga
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2411—Amylases
- C12N9/2428—Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Fodder In General (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
VARIANTES DE GLUCOAMILASE COM PROPRIEDADES ALTERADAS. A presente invenção refere-se a variantes de glucoamilase no qual a variante tem propriedades alteradas (por exemplo, termoestabilidade e/ou atividade específica aperfeiçoadas) comparadas a uma glucoamilase de origem correspondente. A presente invenção também se refere a composições de enzima compreendendo uma glucoamilase variante (por exemplo, composições de hidrolisação de amido); construtos de DNA compreendendo polinucleotídeos que codificam as variantes; e métodos de produção de variantes de glucoamilase em células hospedeiras.
Description
Este pedido reivindica prioridade ao Pedido de Patente Internacional PCT/US07/21683, depositado em 9 de outubro de 2007, que reivindica prioridade ao pedido Provisório U.S. 60/850.431, depositado em 10 de outubro de 2006, os conteúdos de ambos sendo incorporados por referência em sua totalidade aqui.
A presente invenção refere-se a variantes de uma glucoamilase de origem tendo propriedades alteradas (por exemplo, termo estabilidade e/ou atividade específica aperfeiçoadas). Em particular, a presente invenção proporciona composições compreendendo as variantes glucoamilases, incluindo composições de hidrolisação de amido, composições de alimentação animal e composições de limpeza. A invenção também se refere a constru- tos de DNA que codificam as variantes e métodos de produção das variantes de glucoamilase em células hospedeiras.
Enzimas glucoamilase (glucan 1,4-a-glucohidrolases, EC 3.2.1.3) são carbohidrases de exo-ação de hidrolisação de amido, que catalisam a remoção de unidades sucessivas de glicose a partir das extremidades de não-redução de amido ou moléculas relacionadas de oligo e polissacarídeo. As glucoamilases podem hidrolisar ambas as ligações glicosídicas lineares e ramificadas de amido (por exemplo, amilose e amilopectina).
As glucoamilases são produzidas por numerosas cepas de bactéria, fungos, levedura e plantas. Particularmente interessantes, e comercialmente importantes, as glucoamilases são enzimas fungais que são extracelularmente produzidas, por exemplo, de cepas de Aspergillus (Svensson et al. (1983) Carlsberg Res. Commun. 48:529 - 544; Boel et al., (1984) EMBOJ. 3:1097 - 1102; Hayashida et al., (1989) Agric. Biol. Chem. 53:923 - 929; USP Segue-se na folha 1 a Biol. Chem. 50:957 - 964; Ashikari et al., (\9%9) App. Microbiol, e Biotech. 32:129-133 e USP 4.863.864); Humicola (WO 05/052148 e USP 4.618.579) e Mucor (Houghton-Larsen et al., (2003) Appl. Microbiol. Biotechnol. 62:210 - 217). Muitos dos genes que codificam estas enzimas foram clonados e expressos em levedura, fungos e/ou células bacteriais.
Comercialmente, as glucoamilases são enzimas muito importantes e têm sido usadas em uma ampla variedade de aplicações que requerem a hidrólise de amido (por exemplo, para produção de glicose e outros mo- nossacarídeos de amido). As glucoamilases são usadas para produzir adoçantes de milho de alta frutose, que compreendem mais de 50% do mercado de adoçante nos Estados Unidos. Em geral, as glucoamilases podem ser, e comumente são, usadas com alfa amilases em processos de hidrolisação de amido para hidrolisar amido a dextrins e, em seguida, a glicose. A glicose pode, então, ser convertida em frutose por outras enzimas (por exemplo, glicose isomerases); cristalizada; ou usada em fermentações para produzir numerosos produtos finais (por exemplo, etanol, ácido cítrico, ácido láctico, succinato, intermediários de ácido ascórbico, ácido glutâmico, glicerol e 1,3- propanodiol). O etanol produzido pelo uso de glucoamilases na fermentação de amido e/ou material contendo celulose pode ser usado como uma fonte de combustível ou para consumo alcoólico.
Embora as glucoamilases tenham sido usadas bem-sucedidamente em aplicações comerciais por muito anos, existe ainda uma necessidade de novas glucoamilases tendo propriedades alteradas.
Em alguns aspectos, a presente invenção se refere a variantes de glucoamilase isoladas tendo uma ou mais substituições de aminoácido em uma posição correspondente a posição de resíduo: 10, 14, 15, 23, 42, 45, 46, 59,60,61,67,68,72,73,97,98,99, 102, 108, 110, 113, 114, 122, 124, 125, 133, 140, 144, 145, 147, 152, 153, 164, 175, 182, 204, 205, 214, 216, 219, 228, 229, 230, 231,236, 239, 240, 241,242, 244, 263, 264, 265, 268, 269, 276, 284, 291,300, 301,303, 310, 311,313, 316, 338, 342, 344, 346, 349, 359, 361,364, 379, 382, 390, 391,393, 394, 408, 410, 415, 417, 418, 430, 431,433, 436, 442, 443, 444, 448 e 451 de SEQ ID NO: 2 ou SEQ ID NO: 3 ou uma posição equivalente em uma glucoamilase de origem. Em algumas concretizações, a glucoamilase de origem compreende a sequência de SEQ ID NOs: 1,4, 5, 6, 7, 8, ou 9. Em algumas concretizações, uma glucoamilase de origem compreende SEQ ID NO: 2. Em algumas concretizações, a glucoamilase de origem é obtida de uma Tríchoderma spp., uma Aspergillus spp., uma Humicola spp., uma Penicillium spp., uma Talaromyces spp, ou uma Schizosaccharmyces spp. Em concretizações adicionais, a posição equivalente em uma origem é determinada por identidade de sequência. Em outras concretizações, a glucoamilase de origem tem pelo menos 80% de identidade de sequência para SEQ ID NO: 2. Em concretizações adicionais, a posição equivalente em uma origem é determinada por identidade estrutural para SEQ ID NOs: 2 ou 3. Em ainda outras concretizações deste aspecto, a variante tem uma substituição em uma posição escolhida de: T10D/F/G/K/L/M/P/R/S; L14E/H; N15D/N; P23A/G; F59A/G; K60F/H; N61D/I/L/Q/V/W; R65A/C/G/I/K/M/S/V/Y; T67C/I/K/MAT; E68I/M/W; A72E/G/UM/Q/R/W/Y; G73C/L/W; S97F/M/N/P/R/S/V/W/Y; L98H/M; A99C/L/M/N/P; S102A/C/I/L7M/N/RA//W/Y; El 10Q/S/W; LI 13E/N; Kl 14C/D/E/L/M/Q/S/T/V; I133K/R/S/T; K140A/E/F/H/K7L/M/N/Q/R/SA//W/Y; N144C/D/E/I/K; N145A/C/E/I/K/UM/Q/R/V/W/Y; Y147A/M/R; S152H/M; N153C/D/K/L/W/Y; N164A/G; N182C/E/K/P/R; A204C/D/G/I/M/Q/T; T205A/D/H/I/K/M/N/P/Q/S/V/W/Y; S214P/T; V216C/G/H/K/N/Y; Q219D/G/H/N/P/S; W228A/F/G/H/l/UM/Q/SnVV/Y; V229E/I/M/N/Q; S230C/D/E/F/G/H/I/K/UN/P/Q/R/T/V/Y; S231C/D/F/UM/N/Q/R/S/V/Y; D236F/G/L/M/N/P/S/T/V; I239M/Q/S/V/W/Y; T241C/E/H/UM/P/S/T/V; N242C/T7H/M/T/V/W; N263H/K/P; L264A/C/E/F/US; G265E/G/H/I/K/R/T; A268C/D/E/F/G/I/K/L/P/R/T/W; G269E; D276S; V284R/T/V/Y/A/E/F/H/K/N/P/W; P300K/R; A301E/K/UP/S/W; A303C/D/F/H/I/K/L/N/R/T/V/W/Y; A311N/P/Q/S/Y; V338P/Q/S/Y; T342N/V; S344A/T; T346G/H/M/N/P/Q/Y; A349M/K/M/N/Q/R/W; G361H/UR; A364M/W; N379A/C/D/G/I/M/P/S; S382A/N/P/V/W; S390A/Y; E391A/E/I/K/UM/Q/R/V/W/Y; A393E/G/H/I/K/UM/N/Q/R/S/TA//W/Y; K394A/H/K/L/M/Q/R/S/T/V/W; S410E/H/N; L417A/D/E/F/G/I/K/Q/R/S/T/V/W/Y; H418E/M; T430A/E/F/G/H/I/K/M/N/Q/FW; A431C/E/H/I/UM/Q/R/S/W/Y; R433A/C/E/F/G/K/L/M/N/S/V/W/Y; I436E/F/G/H/K/PVR/S/T/V/Y; S444M/N/P/Q/R/T/V/W; T448F/G/I/P/QH7V; e S451E/H/K/UQ/T de SEQ ID NO: 2 ou SEQ ID NO: 3, ou uma posição equivalente em uma glucoamilase de origem.
Em outro aspecto, a presente invenção se refere a uma variante de glucoamilase isolada compreendendo uma ou mais substituições de ami- noácido em uma posição correspondente às posições 10, 14, 15, 23, 42, 45, 46, 59,60,61,67,68,72,73,97,98,99, 102, 108, 110, 113, 114, 122, 124, 125, 133,140, 144, 145, 147, 152, 153, 164, 175, 182, 204, 205, 214, 216, 219, 228, 229, 230, 231, 236, 239, 240, 241, 242, 244, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 310, 311, 313, 316, 338, 342, 344, 346, 349, 359, 361, 364, 379, 382, 390, 391, 393, 394, 408, 410, 415, 417, 418, 430, 431, 433, 436, 442, 443, 444, 448 e 451 de SEQ ID NO: 2 ou SEQ ID NO: 3. Em uma concretização deste aspecto, as variantes de glucoamilase compreendem uma ou mais substituições de aminoácido correspondentes a uma posição escolhida das posições 10, 14, 15,23,59,60,61,65,67,68,72,73, 97,98,99, 102, 110, 113, 133, 140, 144, 145, 147, 152, 153, 164, 182, 204, 205, 214, 216, 219, 228, 229, 230, 231, 236, 239, 241, 242, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 311, 338, 342, 344, 346, 349, 359, 361, 364, 379, 382, 390, 391, 393, 394, 410, 417, 418, 430, 431,433, 442, 444, 448, e 451 de SEQ ID NO: 2 ou 3. Em outras concretizações deste aspecto, as variantes de glucoamilase compreendem uma ou mais substituições de aminoácido em uma posição correspondente às posições 61, 67, 72, 97, 102, 133, 205, 219, 228, 230, 231,239, 263, 268, 291,342, 394, 430, 431 e 451 de SEQ ID NO: 2 ou SEQ ID NO: 3. Em ainda outras concretizações deste aspecto, as variantes de glucoamilase têm uma ou mais substituições de aminoácido correspondentes a pelo menos uma das seguintes: T67M, A72Y, S97N, S102M, I133T, T205Q, Q219S, W228M, S230F, S230G, S230N, S230R, S231L, I239V, I239Y, N263P, A268C, A268G, A268K, S291A, T342V, K394S, T430K, A431Q, S451K de SEQ ID NO: 2 ou SEQ IDNO: 3.
Em outros aspectos, as variantes de glucoamilase da invenção têm uma propriedade alterada comparada a uma glucoamilase de origem. Em algumas concretizações, a propriedade alterada é um aumento na atividade específica comparada a uma glucoamilase compreendendo a sequência de SEQ ID NO: 2, SEQ ID NO: 3 ou uma glucoamilase de origem tendo pelo menos 80% de identidade de sequência para SEQ ID NO: 2. Em algumas concretizações, a variante de glucoamilase tem atividade específica aumentada comparada a glucoamilase compreendendo SEQ ID NO: 2. Em outras concretizações deste aspecto, as variantes de glucoamilase compreendem uma ou mais substituições de aminoácido correspondentes a uma posição escolhida das posições: 10, 14, 15, 23, 59, 60, 61, 65, 67, 68, 72, 73,97,98,99, 102, 110, 113, 133, 140, 144, 145, 147, 152, 153, 164, 182,204,205,214,216,219,228, 229, 230, 231, 236, 239, 241, 242, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 311, 338, 342, 344, 346, 349, 359, 361, 364, 379, 382, 390, 391, 393, 394, 410, 417, 418, 430, 431, 433, 442, 444, 448, e 451 de SEQ ID NO: 2 ou 3.
Em ainda outros aspectos, as variantes de glucoamilase da invenção têm termo estabilidade aumentada comparada a uma glucoamilase compreendendo a sequência de SEQ ID NO: 2, SEQ ID NO: 3 ou uma glucoamilase de origem tendo pelo menos 80% de identidade de sequência para SEQ ID NO: 2. Em algumas concretizações, a variante de glucoamilase tem termo estabilidade aumentada comparada a glucoamilase compreendendo SEQ ID NO: 2 ou SEQ ID NO: 3. Em algumas concretizações deste aspecto, as variantes de glucoamilase da invenção compreendem uma ou mais substituições de aminoácido correspondentes a uma posição escolhida das posições: 10, 15, 23,42,59,60,61,68,72,73,97,98,99, 102,114, 133,140, 144, 147, 152, 153,164, 182,204,205,214, 216, 228, 229, 230, 231,236, 241, 242, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 311, 338, 342, 344, 346, 349, 359, 361, 364, 379, 382, 390, 391, 393, 394, 410, 417, 430, 431,433, 436, 442, 443, 444, 448, e 451 de SEQ ID NO: 2 ou SEQ ID NO: 3.
Em outras concretizações deste aspecto, as variantes de glucoamilase da invenção compreendem uma ou mais substituições de aminoácido correspondentes a uma posição escolhida das posições: 10, 42, 68, 73, 97, 114, 153, 229, 231,236, 264, 291, 301, 344, 361,364, 417, e 433 de SEQ ID NO: 2 ou SEQ ID NO: 3. Em ainda outras concretizações deste aspecto, as variantes de glucoamilase compreendem uma ou mais substituições de aminoácido correspondentes a uma posição escolhida das posições 68, 73, 114, 153, 236, 344, 361,364 e 433 de SEQ ID NO: 2 ou SEQ ID NO: 3. Em ainda algumas concretizações deste aspecto, as variantes de glucoamilase compreendem uma ou mais substituições de aminoácido correspondentes a pelo menos uma das seguintes: T10S, T42V, E68C, E68M, G73F, G73W, Kl 14M, Kl 14T, N153A, N153S, N153V, W228V, D236R, G361D, G361E, G361P, G361Y, A364D, A364E, A364F, A364G, A364K, A365L, A365R, R433C, R433G, R433L, R433N, R433S, R433V, e I436H de SEQ ID NO: 2 ou SEQ ID NO: 3.
Em aspectos adicionais, as variantes de glucoamilase da invenção têm atividade específica aumentada e termo estabilidade aumentada comparadas a uma glucoamilase compreendendo a sequência de SEQ ID NO: 2, SEQ ID NO: 3 ou um glucoamilase de origem tendo pelo menos 80% de identidade de sequência para SEQ ID NO: 2. Em algumas concretizações deste aspecto, as variantes de glucoamilase da invenção compreendem uma ou mais substituições de aminoácido correspondentes a uma posição escolhida das posições: 10, 15, 59, 61, 68, 72, 73, 97, 99, 102, 133, 140, 153, 182, 204, 205, 214, 228, 229, 230, 231, 236, 241, 242, 264, 265, 268, 275, 284, 291, 300, 301, 303, 311, 338, 344, 346, 359, 361, 364, 370, 382, 391, 393, 394, 410, 417, 430, 431,433, 444, 448, e 451 de SEQ ID NO: 2 ou SEQ ID NO: 3. Em outras concretizações deste aspecto, as variantes de glucoamilase compreendem uma ou mais substituições de aminoácido correspondentes a uma posição escolhida da posição 228, 230, 231, 268, 291, 417, 433, e 451 de SEQ ID NO: 2 ou SEQ ID NO: 3. Em concretizações adicionais deste aspecto, as variantes de glucoamilase têm uma ou mais substituições de aminoácido correspondentes a pelo menos uma das seguintes: W228A, W228F, W228H, W228M, S230F, S230G, S230R, S231L, A268C, A268G, S291A, L417R, R433Y, e S451K de SEQ ID NO: 2 ou SEQ ID NO: 3.
Em um outro aspecto, a invenção se refere a um polinucleotídeo isolado que codifica qualquer uma das variantes de glucoamilase envolvidas pela invenção. Em algumas concretizações, a invenção se refere a uma célula hospedeira compreendendo a polinucleotídeo que codifica a glucoamilase envolvida pela invenção.
Em outros aspectos, a invenção é relacionada a composições de enzima compreendendo uma ou more variantes de glucoamilase envolvidas pela invenção. Em algumas concretizações as composições de enzima incluirão enzimas adicionais tais como uma ou mais alfa amilases. Em algumas concretizações, as composições de enzima serão usadas em um processo de conversão de amido, um processo de fermentação de álcool e/ou uma formulação de alimentação de animal.
Em alguns aspectos, a invenção se refere a um método de produção de uma variante de glucoamilase envolvida pela invenção compreendendo transformar uma célula hospedeira com um polinucleotídeo que codifica uma variante de glucoamilase da invenção; cultura da célula hospedeira sob condições adequadas para a expressão e produção de referida variante de glucoamilase e produção de referida variante. Em algumas concretizações, a variante de glucoamilase é recuperada a partir da cultura.
Figura 1A ilustra uma Trichoderma reesei glucoamilase (TrGA) tendo 632 aminoácidos (SEQ ID NO: 1). O peptídeo de sinal é sublinhado, a região catalítica (SEQ ID NO: 3) começando com resíduos de aminoácido SVDDFI (SEQ ID NO: 12) e tendo 453 resíduos de aminoácido está em negrito; a região ligadora está em itálico e o domínio de ligação de amido (SBD) está ambos em itálico e sublinhado. A proteína madura que inclui o domínio catalítico (SEQ ID NO: 3), região ligadora (SEQ ID NO: 10) e domínio de ligação de amido (SEQ ID NO: 11) é representada por SEQ ID NO: 2.
Figura 1B ilustra o cDNA (SEQ ID NO: 4) que codifica para o TrGA. Figura 1C ilustra domínios de TrGA de proteína precursora e madura.
Figura 2 ilustra o plasmídeo pDONR-TrGA de destinação que inclui o cDNA (SEQ ID NO: 4) do TrGA. Figura 3 ilustra o plasmídeo pTTT-Dest.
Figura 4 ilustra o vetor de expressão final pTTT-TrGA. Figura 5 A - 5B ilustram um alinhamento comparando os domínios catalíticos de glucoamilases de origem incluindo glucoamilases derivadas de Aspergillus awamorí (AaGA) (SEQ ID NO: 5); Aspergillus niger (An- GA) (SEQ ID NO: 6); Aspergillus oryzae (AoGA) (SEQ ID NO: 7); Trichoderma reesei (TrGA) (SEQ ID NO: 3); Humicola grisea (HgGA) (SEQ ID NO: 8); e Hypocrea vinosa (HvGA) (SEQ ID NO: 9). Aminoácidos idênticos são indicados por um asterisco (*).
Figura 5C ilustra uma Talaromyces glucoamilase (TeGA) de sequência madura de proteína (SEQ ID NO: 308). Figura 6 é uma comparação das estruturas tridimensionais de Trichoderma glucoamilase (negro) (SEQ ID NO: 2) e Aspergillus awamorí glucoamilase (cinza) vistas da lateral.
A lateral é medida em referência ao local ativo. Por exemplo, nas Figuras 6-8 a entrada de local ativo é definida como o "topo" da molécula. Figura 7 é uma comparação das estruturas tridimensionais de Trichoderma glucoamilase (negro) e Aspergillus awamorí glucoamilase (cinza) vistas do topo. A entrada local ativa está no "topo" da molécula.
A menos que de outro modo definido, todos os termo técnicos e científicos aqui usados têm os mesmos significados conforme comumente compreendidos por um técnico no assunto ao qual esta invenção pertence. Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED., John Wiley e Sons, New York (1994), e Hale & Mar kham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N.Y. (1991) proporciona um técnico com o significado geral de muitos dos termos aqui usado. Ainda, certos termos são definidos abaixo para a proposta de clareza e facilidade de referência.
Conforme aqui usado, o termo "glucoamilase (EC 3.2.1.3)" se refere a uma enzima que catalisa a liberação de D-glucose a partir das extremidades de não-redução de amido e oligo-e polissacarídeos relacionados.
O termo "origem" ou "sequência de origem" se refere a uma sequência nativa ou que ocorre naturalmente ou sequência de referência tendo sequência e/ou de identidade estrutural com TrGA (SEQ ED NOs:1, 2 e/ou 3) e é uma sequência nativa ou que ocorre naturalmente em uma célula hospedeira.
Conforme aqui usado, o termo "TrGA" se refere a uma sequência de origem de Tríchoderma reesei glucoamilase tendo a sequência de proteína madura ilustrada em SEQ ID NO: 2 que inclui o domínio catalítico tendo a sequência ilustrada em SEQ ID NO: 3. O isolamento, clonagem e expressão do TrGA são descritos em WO 2006/060062 e Publicação de Patente U.S. No. 2006/0094080, publicada em 4 de maio de 2006, que são incorporados aqui por referência. O TrGA é também considerado uma sequência de glucoamilase de origem. Em algumas concretizações, a sequência de origem se refere a um TrGA que é o ponto de partida para engenharia de proteína. A numeração dos aminoácidos de glucoamilase é baseada na sequência da sequência de glucoamilase de TrGA (SEQ ID NO: 2 e SEQ ID NO: 3).
A frase "forma madura de uma proteína ou polipeptídeo" se refere à forma funcional final da proteína ou polipeptídeo. Para exemplificar, uma forma madura do TrGA inclui o domínio catalítico, região ligadora e domínio de ligação de amido tendo a sequência de aminoácido de SEQ ID NO: 2.
O termo "Tríchoderma glucoamilase homóloga" se refere a glu-coamilases de origem tendo pelo menos 50% de identidade de sequência, pelo menos 60% de identidade de sequência, pelo menos 70% de identidade de sequência, pelo menos 80% de identidade de sequência de aminoácido para a sequência de TrGA (SEQ ID NO: 2), e que glucoamilases retêm as características funcionais de uma glucoamilase.
Conforme aqui usado, uma "sequência homóloga" significa um ácido nucleico ou sequência de polipeptídeo tendo pelo menos 100%, pelo menos 99%, pelo menos 98%, pelo menos 97%, pelo menos 96%, pelo menos 95%, pelo menos 94%, pelo menos 93%, pelo menos 92%, pelo menos 91%, pelo menos 90%, pelo menos 88%, pelo menos 85%, pelo menos 80%, pelo menos 75%, pelo menos 70%, pelo menos 65%, pelo menos 60%, pelo menos 55%, pelo menos 50%, ou pelo menos 45% de identidade de sequência a uma sequência de ácido nucleico ou sequência de polipeptídeo quando otimamente alinhada para comparação, no qual a função da sequência de ácido nucleico candidata ou sequência de polipeptídeo é essencialmente mesma conforme a sequência de ácido nucleico ou sequência de polipeptídeo, referida sequência homóloga candidata está sendo comparada com. Em algumas concretizações, sequências homólogas têm entre 85% e 100% de identidade de sequência, enquanto que em outras concretizações existe entre 90% e 100% de identidade de sequência, e em outras concretizações, existem 95% e 100% de identidade de sequência. Em algu-mas concretizações, a sequência homóloga candidata (por exemplo, sequência de referência) ou de origem é comparada com a sequência de ácido nucleico de TrGA ou sequência de proteína madura. A de identidade de sequência pode ser medida sobre o comprimento total da sequência de origem ou homóloga.
Conforme aqui usado, os termos "variante de glucoamilase", "variante de SBD" e "variante de TrGA" são usados em referência a glucoamilases que são similares a uma sequência de glucoamilase de origem ou de referência (por exemplo, a TrGA ou Trichoderma glucoamilase homóloga), mas tem pelo menos uma substituição, anulação ou inserção na sequência de aminoácido que os tornam diferentes na sequência de uma glucoamilase de origem.
Conforme aqui usado, o termo "domínio catalítico" se refere a uma região estrutural de um polipeptídeo que contém o local ativo para hi- drólise de substrato.
O termo "ligante" se refere a uma sequência de aminoácido curta geralmente tendo entre 3 e 40 resíduos de aminoácidos que se ligam co- valentemente a uma sequência de aminoácido compreendendo um domínio de ligação de amido com uma sequência de aminoácido compreendendo um domínio catalítico. O termo "domínio de ligação de amido" se refere a uma sequência de aminoácido que se liga preferencialmente a um substrato de amido.
Conforme aqui usado, os termos "sequência mutante" e "gene mutante" são usados permutavelmente e se referem a uma sequência de polinucleotídeo que tem uma alteração em pelo menos um códon que ocorre em uma sequência de origem de célula hospedeira. O produto de expressão da sequência mutante é uma proteína variante com uma sequência de aminoácido alterada relativa à origem. O produto de expressão pode ter uma capacidade de função alterada (por exemplo, capacidade enzimática aumentada).
O termo "propriedade" ou equivalentes gramaticais desta no contexto de um polipeptídeo, conforme aqui usado, se refere a qualquer característica ou atributo de um polipeptídeo que pode ser selecionado ou anulado. Estas propriedades incluem, mas não são limitadas a, estabilidade oxi- dativa, especificidade de substrato, atividade catalítica, estabilidade térmica, perfil de atividade de pH, resistência à degradação proteolítica, proporção de KM, KCAT> KCAT/KM, desdobramento de proteína, capacidade de e ligar a um substrato e capacidade de ser secretada.
O termo "propriedade" ou equivalente gramatical desta no contexto de um ácido nucleico, conforme aqui usado, se refere a qualquer característica ou atributo de um ácido nucleico que pode ser selecionado ou detectado. Estas propriedades incluem, mas não estão limitadas a, uma propriedade que afeta transcrição de gene (por exemplo, resistência do promotor ou reconhecimento do promotor), uma propriedade que afeta processamento de RNA (por exemplo, união de RNA e estabilidade de RNA), uma propriedade que afeta translação (por exemplo, regulação, ligação de mRNA a proteínas ribossomais).
Os termos "termicamente estável" e "termoestável" se referem às variantes de glucoamilase da presente invenção que retêm uma quantidade especificada de atividade enzimática após exposição a temperaturas identificadas sobre um dado período de tempo sob condições que prevalecem durante a hidrólise de substratos de amido, por exemplo, enquanto que expostos a temperaturas alteradas.
O termo "estabilidade aumentada" no contexto de uma propriedade tal como termoestabilidade se refere a uma atividade hidrolítica de a- mido mais alta retida sobre o tempo conforme comparada a outra glucoamilase de referência (por exemplo, glucoamilase de origem).
O termo "estabilidade diminuída" no contexto de uma propriedade tal como termoestabilidade se refere a uma atividade hidrolítica de amido inferior retida sobre o tempo conforme comparada a outra glucoamilase de referência.
O termo "atividade específica" é definido como a atividade por mg de proteína ativa glucoamilase. Em algumas concretizações, a atividade é determinada usando-se o ensaio de etanol conforme descrito aqui e expresso como a quantidade de glicose que é produzida a partir do substrato de amido. Em algumas concretizações, a concentração de proteína pode ser determinada usando-se o ensaio de Caliper aqui descrito.
Os termos "ativo" e "biologicamente ativo" se referem à atividade biológica associada com uma proteína particular. Segue que a atividade biológica de uma dada proteína se refere a qualquer atividade biológica tipicamente atribuída àquela proteína pelo técnico no assunto. Por exemplo, uma atividade enzimática associada com uma glucoamilase é hidrolítica e, desse modo, uma glucoamilase ativa tem atividade hidrolítica.
Os termos "polinucleotídeo" e "ácido nucleico", usados permuta- velmente aqui, se referem a uma forma polimérica de nucleotídeos de qualquer comprimento, ou ribonucleotídeos ou deoxirribonucleotídeos. Estes termos incluem, mas não são limitados a, um filamento único de DNA, duplo ou triplo, DNA genômico, cDNA, RNA, DNA-RNA híbridos, ou um polímero compreendendo bases de purina e pirimidina, ou outras bases de nucleotí- deo quimicamente naturais, bioquimicamente modificadas, não-naturais ou derivatizadas.
Conforme aqui usado, os termos "construto de DNA ", "DNA transformante" e "vetor de expressão" são usados trocavelmente para se referirem a DNA usado para introduzir sequências em uma célula hospedeira ou organismo. O DNA pode ser gerado in vitro por y PCR ou qualquer ou- tra(s) técnica(s) conhecida(s) àqueles técnicos no assunto. A construto de DNA, DNA transformante ou cassete de expressão recombinante podem ser incorporados em um plasmídeo, cromossomo, DNA de mitocôndria, DNA de plastídeo, vírus, ou fragmento de ácido nucleico. Tipicamente, a porção de cassete de expressão recombinante de um vetor de expressão, construto de DNA ou DNA transformante incluem, entre outras sequências, uma sequência de ácido nucleico a ser transcrita e um promotor. Em algumas concretizações, vetores de expressão têm a capacidade de incorporar e expressar fragmentos de DNA heterólogos em uma célula hospedeira.
Conforme aqui usado, o termo "vetor" se refere a um construto de polinucleotídeo designada para introduzir ácidos nucleicos em um ou mais tipos de célula. Vetores incluem vetores de clonagem, vetores de expressão, vetores de lançadeira, plasmídeos, cassetes, e similares.
Conforme aqui usado no contexto de introdução de uma sequência de ácido nucleico em uma célula, o termo "introduzido" se refere a qualquer método adequado para transferência da sequência de ácido nucleico na célula. Tais métodos para introdução incluem, mas não estão limitados a, fusão de protoplasto, transfecção, transformação, conjugação, e transdu- ção.
Conforme aqui usado, os termos "transformados" e "estavelmen- te transformados" se referem a uma célula que tem uma sequência não- nativa (heteróloga) de polinucleotídeo integrada em seu genoma ou como um plasmídeo epissomal que é mantido por pelo menos duas gerações.
Conforme aqui usado, os termos "marcador selecionável" e "marcador seletivo" se referem a um ácido nucleico (por exemplo, um gene) capaz de expressão em células hospedeiras que permitem facilidade de seleção daqueles hospedeiros contendo o vetor. Tipicamente, marcadores selecionáveis são que conferem resistência antimicrobial ou uma vantagem metabólica na célula hospedeira para permitir que as células contendo o DNA exógeno seja distinguida de células que não receberam qualquer sequência exógena durante a transformação.
Conforme aqui usado, o termo "promotor" se refere a uma sequência de ácido nucleico que funciona para direcionar transcrição de um gene a jusante. O promotor, junto com outras sequências de ácido nucleico transcricional e translacional regulatória (também denominadas "sequências de controle"), é necessário expressar um dado gene. Em geral, as sequências transcricionais e translacionais regulatórias incluem, mas não são limitadas a, sequências promotoras, locais de ligação ribossomal, sequências de partida e de parada, e sequências intensificadoras ou ativadoras.
Um ácido nucleico é "operavelmente ligado" quando ele é colocado em um relacionamento funcional com outra sequência de ácido nucleico. Por exemplo, DNA que codifica um condutor secretório (isto é, um peptídeo de sinal), é operavelmente ligado a DNA para um polipeptídeo se ele é expresso como uma pré-proteína que participa na secreção do polipeptídeo. Geralmente, "operavelmente ligado" significa que as sequências de DNA sendo ligadas são contíguas, e, no caso de um condutor secretório, contíguas e em fase de leitura.
Conforme aqui usado, o termo "gene" se refere a um polinucleotídeo (por exemplo, um segmento de DNA), que codifica um polipeptídeo e inclui regiões precedentes e seguintes às regiões de codificação, bem como sequências de intervenção (introns) entre segmentos de codificação individuais (éxons).
Conforme aqui usado, "genes homólogos" se referem a um par de genes de espécies diferentes, mas usualmente relacionados, que correspondem entre si e que são idênticos ou muito similares entre si. O termo envolve genes que são separados por evolução de novas espécies (isto é, o desenvolvimento de novas espécies) (por exemplo, genes ortólogos), bem como genes que foram separados por duplicação genética (por exemplo, genes paralogos).
Conforme aqui usado, "ortólogo" e "genes ortólogos" se referem a genes em espécies diferentes que se desenvolvem de um gene ancestral comum (isto é, um gene homólogo) por evolução de novas espécies. Tipicamente, ortólogos retêm a mesma função durante o curso de evolução. A identificação de ortólogos encontra uso no prognóstico seguro de função de gene em genomas recentemente sequenciados.
Conforme aqui usado, "paralogo" e "genes paralogos" se referem a genes que são relacionados por duplicação dentro de um genoma. Enquanto que ortólogos retêm a mesma função através do curso de evolução, paralogos envolvem novas funções, mesmo embora algumas funções sejam frequentemente relacionadas à função original. Exemplos de genes paralogos incluem, mas não estão limitados a, genes que codificam tripsina, chimotripsina, elastase, e trombina, que são todos serina proteinases e ocorrem juntas dentro da mesma espécie.
Conforme aqui usado, "homologia" se refere à similaridade ou de identidade de sequência, com de identidade sendo preferida. Esta homologia é determinada usando-se técnicas padrão conhecidas na técnica (Ver, por exemplo, Smith e Waterman, Adv. Appl. Math., 2:482 [1981]; Needleman e Wunsch, J. Mol. Biol., 48:443 [1970]; Pearson e Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]; programas tais como GAP, BESTFIT, FASTA, e TFASTA no Wisconsin Genetics Software Package (Genetics Computer Group, Madison, Wl); e Devereux et al., Nucl. Acid Res., 12:387-395).
A "percentagem (%) de identidade de sequência de ácido nuclei- co" ou "percentagem (%) de identidade de sequência de aminoácido" é definida como a percentagem de resíduos de nucleotídeo ou resíduos de aminoácido em uma sequência candidata que são idênticas com os resíduos de nucleotídeo ou resíduos de aminoácido da sequência de partida (isto é, TrGA). A identidade de sequência pode ser medida sobre o comprimento total da sequência de partida (isto é, TrGA SEQ ID NO: 2 ou 3).
Sequências homólogas são determinadas por métodos conheci- dos de alinhamento de sequência. Um método de alinhamento comumente usado é BLAST descrito por Altschul et al., (Altschul et al., (1990) J. Mol. Biol., 215:403-410,; e Karlin et al., (1993) Proc. Natl. Acad. Sci. USA 90:5873-5787). Um programa BLAST particularmente útil é o programa WU- BLAST-2 (Ver, Altschul et al., (1996) Meth. Enzymol., 266:460-480). WU- BLAST-2 usa vários parâmetros de pesquisa, muitos dos quais são ajustados aos valores de falta. Os parâmetros ajustáveis são ajustados com os seguintes valores: extensão de sobreposição =1, fração de sobreposição = 0,125, limite de palavra (T) =11. Os parâmetros HSP S e HSP S2 são valores dinâmicos e são estabelecidos pelo próprio programa dependendo da composição da sequência particular e composição da base de dados particular contra qual a sequência de interesse está sendo pesquisada. Contudo, os valores podem ser ajustados para aumentar a sensibilidade. Uma % de valor de identidade de sequência de aminoácido é determinada pelo número de equiparação de resíduos idênticos divididos pelo número total de resíduos da sequência "mais longa" na região alinhada. A sequência "mais longa" é a região tendo resíduos mais atuais na região alinhada (folgas introduzidas por WU-Blast-2 para maximizar a contagem de alinhamento são ignoradas).
Outros métodos encontram uso em alinhamento de sequências. Um exemplo de um algoritmo útil é PILEUP. PILEUP cria um alinhamento de sequência múltiplo de um grupo de sequências relacionadas usando alinhamentos de par progressivo. PILEUP usa uma simplificação do método de alinhamento progressivo de Feng e Doolittle (Feng e Doolittle, J. Mol. Evol., 35:351-360 [1987]). O método é similar àquele descrito por Higgins and Sharp (Higgins and Sharp, CABIOS 5:151-153 [1989]). Parâmetros de PILEUP úteis incluindo um peso de folga de falta de 3,00, um peso de comprimento de folga de falta de 0,10, e folgas terminais pesadas.
O termo "alinhamento ótimo" se refere ao alinhamento dando a contagem de identidade de percentagem mis alta. Uma "posição equivalente" se refere a um alinhamento entre duas sequências no qual o alinhamento é ótimo. Por exemplo, usando-se as Figuras 5D e 5E, a posição 491 em TrGA (SEQ ID NO: 2) é C491; a posição equivalente para Aspergillus niger é posição C509; e a posição equivalente para Aspergillus awamori é posição Q538. Ver Figura 8 para um alinhamento exemplar da sequência tridimensional.
Conforme aqui usado, o termo '‘hibridização" se refere ao processo pelo qual um trançado de ácido nucleico se une com um trançado complementar através de emparelhamento base, conforme conhecido na técnica.
Uma sequência de ácido nucleico é considerada ser "seletivamente hibridizável" para uma sequência de ácido nucleico se as duas sequências hibridizam especificamente entre si sob condições de hibridização de estringência moderada a alta e de lavagem. As condições de hibridização são baseadas na temperatura de fusão (Tm) do complexo ou sonda de ligação de ácido nucleico. Por exemplo, "estringência máxima" ocorre tipicamente a cerca de Tm-5°C (5o abaixo da Tm da sonda); "estringência alta" a cerca de 5-10°C abaixo da Tm; "estringência intermediária" a cerca de 10-20°C abaixo da Tm da sonda; e "estringência baixa" a cerca de 20-25°C abaixo da Tm. Funcionalmente, as condições de estringência máxima podem ser usadas para identificar sequências tendo de identidade estrita de identidade quase estrita com a sonda de hibridização; enquanto que uma hibridização de estringência intermediária ou baixa pode ser usada para identificar ou detectar sequência de polinucleotídeos homólogos.
Condições de estringência moderada e alta são bem conhecidas na técnica. Um exemplo de condições de alta estringência incluem hibridização a cerca de 42°C em 50% de formamida, 5X de SSC, 5X de solução de Denhardt, 0,5% de SDS e 100)J.g/ml de DNA transportador desnaturado seguido por lavagem duas vezes em 2X de SSC e 0,5% de SDS à temperatura ambiente e duas vezes adicionais em 0,1 X de SSC e 0,5% de SDS a 42°C. Um exemplo de condições de estringência moderada incluem uma incubação durante a noite a 37°C em uma solution compreendendo 20% de formamida, 5 x de SSC (150 mM de NaCl, 15 mM de citrato de trisódio), 50 mM de fosfato de sódio (pH 7,6), 5 x de solução de Denhardt, 10% de sulfato de dextran e 20 mg/ml de DNA de esperma de salmão desnaturado, seguido por lavagem dos filtros em lx de SSC a cerca de 37 - 50°C. Aqueles versados na técnica sabem como ajustar a temperatura, resistência iônica, etc., conforme necessário para acomodar fatores tais como comprimento de sonda e similares.
Conforme aqui usado, "recombinante" inclui referência a uma célula ou vetor, que foi modificado pela introdução de uma sequência de ácido nucleico heteróloga ou homóloga ou que a célula é derivada de uma célula desse modo modificada. Desse modo, por exemplo, células recombinantes expressam genes que não são encontrados na forma idêntica dentro da forma nativa (não-recombinante) da célula ou expressam genes nativos que são, de outro modo, anormalmente expressos, sob expressos ou não expressos no todo como um resultado de intervenção humana deliberada.
Em algumas concretizações da invenção, sequências de DNA que sofreram mutação são geradas com mutagênese de saturação de local em pelo menos um códon. Em outra concretização, mutagênese de saturação de local é realizada para dois ou mais códons. Em uma concretização adicional, sequências de DNA mutantes têm mais do que 50%, mais do que 55%, mais do que 60%, mais do que 65%, mais do que 70%, mais do que 75%, mais do que 80%, mais do que 85%, mais do que 90%, mais do que 95%, mais do que 98%, ou mais do que 99% de homologia com a sequência de origem. Em concretizações alternativas, DNA mutante é gerado in vivo usando-se qualquer procedimento mutagênico conhecido tal como, por e- xemplo, radiação, nitrosoguanidina e similares. A sequência de DNA desejada é então isolada e usada nos métodos aqui providos.
Conforme aqui usado, "proteína heteróloga" se refere a uma proteína ou polipeptídeo que não ocorre naturalmente na célula hospedeira.
Conforme aqui usado, "proteína homóloga" se refere a uma proteína ou polipeptídeo nativo ou que ocorre naturalmente em uma célula e inclui proteínas nativas que são sobre-expressas na célula sempre que por tecnologia de DNA recombinante ou naturalmente.
Uma enzima é "sobre-expressa" em uma célula hospedeira se a enzima é expressa na célula em um nível mais alto do que o nível no qual ela é expressa em uma célula tipo selvagem correspondente.
Os termos "proteína" e "polipeptídeo" são usados permutavel- mente aqui. Na presente descrição e reivindicações, os códigos de uma letra e três letras para resíduos de aminoácido são usados. O código de 3 letras para aminoácidos conforme definido em conformidade com a IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). É também compreendido que um polipeptídeo pode ser codificado por mais do que uma sequência de nucleotídeo para a degeneração do código genético.
Variantes da invenção são descritas pela seguinte nomenclatura: [resíduo de aminoácido original/posição/resíduo de aminoácido substituído]. Por exemplo, a substituição de leucina por arginina na posição 76 é representada como R76L. Quando mais do que um aminoácido é substituído a uma dada posição, a substituição é representada como 1) Q172C, Q172D ou Q172R; 2) Q172C, D, ou R ou c) Q172C/D/R. Quando uma posição adequada para substituição é identificada aqui sem um aminoácido específico sugerido, é para ser compreendido que quaisquer resíduos de aminoácido podem ser substituídos pelo resíduo de aminoácido presente na posição. Onde uma glucoamilase variante contém uma anulação em comparação com outras glucoamilases, a anulação é indicada com "*". Por exemplo, uma anulação na posição R76 é representada como R76*. Uma anulação de dois ou mais aminoácidos consecutivos é indicada, por exemplo, como (76 - 78)*.
Uma "pró-sequência" é uma sequência de aminoácido entre a sequência de sinal e proteína madura que é necessária para o íon secreta da proteína. A clivagem da pró-sequência resultará em uma proteína ativa madura.
O termo "sequência de sinal" ou "peptídeo de sinal" se refere a qualquer sequência de nucleotídeos e/ou aminoácidos que pode participar na secreção da forma madura ou formas precursoras da proteína. Esta definição de sequência de sinal é uma definição funcional, significa incluir aquelas sequências de aminoácido codificadas pela porção N-terminal do gene de proteína, que participa na efetuação da secreção de proteína. Elas são frequentemente, mas não universalmente, ligadas a porção N-terminal de uma proteína ou a porção N-terminal de uma proteína precursora. A sequência de sinal pode ser endógena ou exógena. A sequência de sinal pode ser aquela normalmente associada com a proteína (por exemplo, glucoamilase), ou pode ser de um gene que codifica outra proteína secretada.
O termo forma "precursora" de uma proteína ou peptídeo se refere a uma forma madura da proteína tendo uma pró-sequência operavel- mente ligada ao terminal amino ou carbonila da proteína. O precursor pode também ter uma sequência de "sinal" operavelmente ligada ao terminal amino da pró-sequência. O precursor pode também ter polipeptídeos adicionais que são envolvidos na atividade pós-translacional (por exemplo, polipeptídeos clivados a partir destes para deixar a forma madura de uma proteína ou peptídeo).
"Cepa de hospedeiro" ou "célula hospedeira" se referem a um hospedeiro adequado para um vetor de expressão compreendendo o DNA de acordo com a presente invenção.
Os termos "derivados de" e "obtidos de" se referem a não somente uma glucoamilase produzida ou produtível por uma cepa do organismo em questão, mas também uma glucoamilase codificada por uma sequência de DNA isolada de tal cepa e produzida em um organismo hospedeiro contendo tal sequência de DNA. Adicionalmente, o termo se refere a uma glucoamilase que é codificada por uma sequência de DNA de origem sintética e/ou de cDNA e que tem as características de identificação da glucoamilase em questão.
Um "derivado" dentro do escopo desta definição geralmente retém a atividade de hidrolisação característica observada na forma tipo selvagem, nativa ou de origem para a extensão que o derivado é útil para proposta similar como a forma tipo selvagem, nativa ou de origem. Derivados funcionais de glucoamilases envolvem peptídeos que ocorrem naturalmente, sinteticamente ou recombinantemente produzidos ou fragmentos de peptídeo que têm as características gerais das glucoamilases da presente invenção.
O termo "isolado" ou "purificado" se referem a um material que é removido de seu ambiente original (por exemplo, o ambiente natural se ele está ocorrendo é naturalmente). Em algumas concretizações, uma proteína isolada é mais do que 10% pura, preferivelmente mais do que 20% pura, e ainda mais preferivelmente mais do que 30% pura, conforme determinado por SDS-PAGE. Aspectos adicionais da invenção envolvem a proteína em uma forma altamente purificada (isto é, mais do que 40% pura, mais do que 60% pura, mais do que 80% pura, mais do que 90% pura, mais do que 95% pura, mais do que 97% pura, e mais do que 99% pura) conforme determinado por SDS-PAGE.
Conforme aqui usado, o termo, "metagênese combinatorial" se refere a métodos em que bibliotecas cujas bibliotecas de variantes de uma sequência de partida são geradas. Nestas bibliotecas, as variantes contêm uma ou várias mutações escolhidas de um conjunto predefinido de mutações. Em adição, os métodos providos significam introduzir mutações aleatórias que não eram membros do conjunto predefinido de mutações. Em algumas concretizações, os métodos incluem aqueles colocados na USP 6.582.914, aqui incorporado por referência. Em concretizações alternativas, métodos de mutagênese combinatorial envolvem kits comercialmente disponíveis (por exemplo, QuikChange® Multisite, Stratagene, San Diego, CA).
Conforme aqui usado, o termo "bibliotecas de mutantes" se refere a uma população de células que são idênticas em muito de seu genoma, mas incluem homólogos diferentes de um ou mais genes. Tais bibliotecas podem ser usadas, por exemplo, para identificar genes ou operons com traços aperfeiçoados.
Conforme aqui usado o termo "teor de sólidos secos (DS ou ds)" se refere aos sólidos totais de uma pasta fluida em % em uma base de peso seca.
Conforme aqui usado, o termo "colisão inicial" se refere a uma variante que foi identificada por classificação de uma biblioteca de mutagênese de consenso combinatorial. Em concretizações, colisões iniciais têm características de resistência aperfeiçoadas, conforme comparado ao gene de partida.
Conforme aqui usado, o termo "colisão aperfeiçoada" se refere a uma variante que foi identificada por classificação de uma biblioteca de mu- tagênese de consenso combinatorial aumentada.
Conforme aqui usado, o termo "propriedade-alvo" se refere a propriedade do gene de partida que é para ser alterada. Não é pretendido que a presente invenção seja limitada a qualquer propriedade-alvo particular.
Contudo, em algumas concretizações, a propriedade-alvo é a estabilidade de um produto de gene (por exemplo, resistência à desnaturação, proteólise ou outros fatores degradativos), enquanto que em outras concretizações, o nível de produção em um hospedeiro de a produção é alterado. De fato, é contemplado que qualquer propriedade de um gene de partida encontrará uso na presente invenção. Outras definições de termos podem aparecer através de todo relatório descritivo.
Antes das concretizações exemplares serem descritas em maiores detalhes, é para ser compreendido que esta invenção não é limitada às concretizações particulares descritas e como tal podem naturalmente variar. É também para ser compreendido que a terminologia aqui usada é para a proposta de descrever concretizações particulares semente, e não é pretendida para ser limitante.
Onde uma faixa de valores é provida, é compreendido que cada valor de intervenção, ao décimo da unidade do limite inferior a menos que o contexto indique claramente de outro modo entre os limites superior e inferior daquela faixa, é também especificamente revelado. Cada faixa menor entre qualquer valor citado ou valor de intervenção em uma faixa citada e qualquer outro valor citado ou de intervenção naquela faixa está envolvido dentro da invenção.
Os limites superior e inferior destas faixas menores podem inde-pendentemente estar incluídos ou excluídos na faixa, e cada faixa onde ou, nenhum ou ambos os limites são incluídos nas faixas menores está também envolvido dentro da invenção, sujeita a qualquer limite especificamente excluído na faixa citada. Onde a faixa citada inclui um ou ambos dos limites, as faixas excluindo qualquer ou ambos daqueles limites incluídos são também incluídas na invenção.
Embora quaisquer métodos e materiais similares ou equivalentes àqueles aqui descritos possam ser usados na prática ou teste da presente invenção, métodos exemplares e preferidos são agora descritos. Todas as publicações aqui mencionadas são incorporadas por referência para revelar e descrever os métodos e/ou materiais em conjunto com os quais as publicações são citadas.
Conforme aqui usado e nas reivindicações em anexo, as formas singulares "um", "uma", e "o" incluem referentes plurais a menos que o contexto determine claramente de outro modo. Desse modo, por exemplo, referência a "um gene" inclui uma pluralidade de tais agentes candidatos e referência à "célula" incluem referência a uma ou mais células e equivalentes destas conhecidas àqueles versados na técnica, e assim por diante.
As publicações aqui discutidas são providas somente para sua descrição antes da data de depósito do presente pedido. Nada aqui é para ser construído como uma admissão que a presente invenção não é intitulada para antecipar tal publicação em virtude da invenção anterior.
Um objetivo da presente invenção foi alterar propriedades, tais como a estabilidade térmica e/ou atividade específica de glucoamilases de origem e, em particular, glucoamilase de Tríchoderma reesei (TrGA), para obter variantes de glucoamilase tendo as propriedades alteradas que seriam úteis em várias aplicações tais como processos de conversão de amido ou de fermentação de álcool.
Glucoamilases de origem: Em algumas concretizações, a presente invenção proporciona uma variante de glucoamilase de uma glucoamilase de origem. A glucoamilase de origem pode compreender uma sequência que tem sequência e/ou identidade estrutural com TrGA (SEQ ID NOs: 2 e/ou 3). Em algumas concretizações, a glucoamilase de origem compreende uma sequência de ami- noácido conforme ilustrada em SEQ ID NOs: 1, 2, 3, 5, 6, 7, 8 ou 9. Em algumas concretizações, a glucoamilase de origem é homolóloga. Em algu- mas concretizações, a glucoamilase de origem tem pelo menos 50% de i- dentidade de sequência, pelo menos 60% de identidade de sequência, pelo menos 70% de identidade de sequência, pelo menos 80% de identidade de sequência, pelo menos 85% de identidade de sequência, pelo menos 88% de identidade de sequência, pelo menos 90% de identidade de sequência, pelo menos 93% de identidade de sequência, pelo menos 95% de identidade de sequência, pelo menos 96% de identidade de sequência, pelo menos 97% de identidade de sequência, pelo menos 98% de identidade de sequência e também pelo menos 99% de identidade de sequência com a sequência de aminoácido de TrGA de SEQ ID NO: 2.
Em algumas concretizações, a glucoamilase de origem compreende um domínio catalítico tendo uma sequência de aminoácido tendo pelo menos 50% de identidade de sequência de aminoácido, pelo menos 60% de identidade de sequência de aminoácido, pelo menos 70% de identidade de sequência de aminoácido, pelo menos 80% de sequência de aminoácido, pelo menos 85% de identidade de sequência de aminoácido, pelo menos 90% de identidade de sequência de aminoácido, pelo menos 93% de identidade de sequência de aminoácido, pelo menos 95% de identidade de aminoácido, pelo menos 97% de identidade de sequência de aminoácido e pelo menos 99% de identidade de sequência de aminoácido com uma ou mais das sequências de aminoácido ilustradas em SEQ ID NO: 1,2, 3, 5, 6, 7, ou 8. Em outras concretizações, a glucoamilase de origem terá pelo menos 80% de identidade de sequência, pelo menos 85% de identidade de sequência, pelo menos 90% de identidade de sequência, pelo menos 95% de identidade de sequência, pelo menos 97% de identidade de sequência, e também pelo menos 98% de identidade de sequência com o domínio catalítico da sequência de aminoácido de TrGA de SEQ ID NO: 3.
A glucoamilase de origem pode ser codificada por uma sequência de DNA que hibridiza sob condições de estringência médias, altas com um DNA que codifica uma glucoamilase tendo uma das sequências de aminoácido de SEQ ID NO: 1, 2 ou 3. Em algumas concretizações, a glucoamilase de origem com pelo menos 50% de identidade de sequência, pelo me- nos 60% de identidade de sequência de aminoácido, pelo menos 70% de identidade de sequência de aminoácido, pelo menos 80% de identidade de sequência de aminoácido, pelo menos 90% de identidade de sequência de aminoácido, pelo menos 95% de identidade de aminoácido, e pelo menos 97% de identidade de sequência de aminoácido também tem identidade estrutural com SEQ ID NOs: 2 e/ou 3. Enquanto a glucoamilase de origem é uma sequência nativa ou que ocorre naturalmente em uma célula hospedeira, em algumas concretizações, a glucoamilase de origem é uma variante que ocorre naturalmente. Em algumas concretizações, a glucoamilase de origem é uma variante que foi projetada e/ou uma glucoamilase híbrida.
Estruturas prognosticadas e sequências conhecidas de glucoamilases são conservadas entre espécies fungais (Coutinho et al., (1994) Protein Eng., 7:393 - 400 e Coutinho et al., (1994), Protein Eng., 7: 749-760). Em algumas concretizações, a glucoamilase de origem é uma glucoamilase fungai filamentosa. Em algumas concretizações, a glucoamilase de origem é obtida de uma cepa Trichoderma (por exemplo, T. reesei, T. longibrachia- tum, T. stríctipilis, T. asperellum, T. konilangbra e T. hazianum), uma cepa Aspergillus (por exemplo, A. niger, A. nidulans, A. kawachi, A. awamorí e, 4. orzyae), uma cepa Talaromyces (por exemplo T. emersonii, T. thermophilus, e T. duponti), uma cepa Hypocrea (por exemplo H. gelatinosa, H. orientalis, H. vinosa, e H. citrina), uma cepa Fusarium (por exemplo, F. oxysporum, F. roseum, e F. venenatum), uma cepa Neurospora (por exemplo, N. crassa) e uma cepa Humicola (por exemplo, H. grisea, H. insolens e H. lanuginosa), uma cepa Penicillium (por exemplo, P. notatum ou P. chrysogenum), ou uma cepa Saccharomycopsis (por exemplo, S. fibuligera).
Em algumas concretizações, a glucoamilase de origem pode ser uma glucoamilase bacterial. Por exemplo, a glucoamilase pode ser obtida de cepas bacteriais gram positivas tais como Bacillus (por exemplo, B. alkalo- philus, B. amyloliquefaciens, B. lentus, B. licheniformis, B. stearothermophi- lus, B. subtilis e B. thuringiensis) ou uma cepa de Streptomyces (por exemplo, S. lividans).
Em algumas outras concretizações, a glucoamilase de origem compreenderá uma sequência de aminoácido tendo pelo menos 90% de i- dentidade de sequência, pelo menos 93% de identidade de sequência, pelo menos 95% de identidade de sequência, pelo menos 96% de identidade de sequência, pelo menos 97% de identidade de sequência, pelo menos 98% de identidade de sequência, e também pelo menos 99% de identidade de sequência com o domínio catalítico da glucoamilase de origem de Aspergillus de SEQ ID NO: 5 ou SEQ ID NO: 6.
Em outras concretizações, a glucoamilase de origem compreenderá uma sequência de aminoácido tendo pelo menos 90% de identidade de sequência, pelo menos 95% de identidade de sequência, pelo menos 97% de identidade de sequência, e também pelo menos 99% de identidade de sequência com o domínio catalítico da glucoamilase de origem da Humicola grisea (HgGA) de SEQ ID NO: 8.
Em algumas concretizações, a glucoamilase de origem tem pelo menos 50% de identidade de sequência, pelo menos 60% de identidade de sequência, pelo menos 70% de identidade de sequência, pelo menos 80% de identidade de sequência, pelo menos 85% de identidade de sequência, pelo menos 88% de identidade de sequência, pelo menos 90% de identidade de sequência, pelo menos 93% de identidade de sequência, pelo menos 95% de identidade de sequência, pelo menos 96% de identidade de sequência, pelo menos 97% de identidade de sequência, pelo menos 98% de identidade de sequência, e também pelo menos 99% de identidade de sequência com a sequência de aminoácido de TrGA de SEQ ID NO: 2 ou 3, e tem identidade estrutural para a glucoamilase de SEQ ID NO: 2 ou 3.
Em outras concretizações, uma Tríchoderma glucoamilase homóloga será obtida de uma cepa de Tríchoderma ou Hypocrea. Algumas Tríchoderma glucoamilase homólogas são descritas na Publicação de patente U.S. N- 2006/0094080 e referência é feita especificamente às sequências de aminoácido colocadas em SEQ ID NOs: 17-22 e 43 -47 de referida referência.
Em algumas concretizações, a glucoamilase de origem é TrGA compreendendo a sequência de aminoácido de SEQ ID NO: 2 ou uma Tri- choderma glucoamilase homóloga tendo pelo menos 80%, pelo menos 85%, pelo menos 88%, pelo menos 90%, pelo menos 93%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99% de identidade de sequência para a sequência de TrGA.
Uma glucoamilase de origem pode ser isolada e/ou identificada usando-se técnicas de DNA recombinante padrões. Quaisquer técnicas padrão podem ser usadas que são conhecidas ao técnico no assunto. Por e- xemplo, sondas e/ou iniciadores específicos para áreas conservadas da glucoamilase podem ser usadas para identificar homólogos em células bacteri- ais ou fungais (o domínio catalítico, o local ativo, etc.). Alternativamente PCR degenerado pode ser usado para identificar homólogos em células bacteriais ou fungais. Em alguns casos, sequências conhecidas, tais como em uma base de dados, podem ser analisadas para sequência e/ou identidade estrutural para uma das glucoamilases conhecidas, incluindo SEQ ID NO: 2 ou um domínio de ligação de amido conhecido, incluindo SEQ ID NO: 11. Ensaios funcionais podem também serem usados para identificar atividade de glucoamilase em uma célula bacterial ou fungai. Proteínas tendo atividade de glucoamilase podem ser isoladas e sequenciadas reversas para isolar a sequência de DNA correspondente. Tais métodos são conhecidos ao técnico no assunto.
O dogma central de biologia molecular é que a sequência de DNA que codifica um gene para uma enzima particular, determina a sequência de aminoácido da proteína, esta sequência por sua vez determina o desdobramento tridimensional da enzima. Este desdobramento junto dispara resíduos que criam um centro catalítico e superfície de ligação de substrato e isto resulta na especificidade alta e atividade das enzimas em questão.
Glucoamilases consistem de mais de três domínios estruturais distintos, um domínio catalítico de aproximadamente 450 resíduos que é es-truturalmente conservado em glucoamilases, geralmente seguido por uma região ligadora consistindo em entre 30 e 80 resíduos que são conectados a um domínio de ligação de amido de aproximadamente 100 resíduos. A estru- tura do Trichoderma reesei glucoamilase com todas estas regiões intactas foi determinada a uma resolução aqui de 1,8 Angstrõns (ver Tabela 9 e E- xemplo 8 e 9). Usando-se as coordenadas (ver Tabela 9) a estrutura catalítica foi alinhada com as coordenadas do domínio catalítico de cepa de Aspergillus awamorí X100 que foi determinada previamente (Aleshin, A.E., Hoffman, C, Firsov, L.M., e Honzatko, R.B. 1994 Refined crystal structures of glucoamilase from Aspergillus awamorí var. X100. J Mol Biol 238: 575-591.). A estrutura de cristal de Aspergillus awamorí somente inclui o domínio catalítico. Conforme visto nas Figuras 6 e 7, a estrutura dos domínios catalíticos se sobrepõem muito proximamente e é possível identificar resíduos equivalentes baseados nesta superposição estrutural. Os inventores acreditam que glucoamilases compartilham a estrutura básica representada nas Figuras 6 e 7. A conservação de estrutura na molécula de glucoamilase se correlaciona com a conservação de atividade e um mecanismo conservado de ação para todas as glucoamilases. Dada esta alta homologia, variantes específicas lo-cais da glucoamilase de Trichoderma resultando em função alterada também teria consequências similares estruturais e, portanto, funcionais em outras glucoamilases.
A presente invenção, contudo, não é limitada às variantes da glucoamilase de Trichoderma de origem revelada na Figure 1, mas se estende às variantes de glucoamilases de origem compreendendo resíduos de aminoácido em posições que são "equivalentes" a resíduos identificados particulares em glucoamilase de Trichoderma reesei (SEQ ID NO: 2). Em algumas concretizações da presente invenção, a glucoamilase de origem é uma GA de Talaromyces e as substituições são feitas nas posições de resíduo de aminoácido equivalentes em glucoamilase de Talaromyces (ver, por exemplo, SEQ ID NO: 308, Figura 5C) conforme aquela descrita aqui. Em outras concretizações, a glucoamilase de origem compreende SEQ ID NO: 5; SEQ ID NO: 6; SEQ ID NO: 7; SEQ ID NO: 3; SEQ ID NO: 8; e SEQ ID NO: 9 (Ver Figures 5A- 5B). Em outras concretizações, a glucoamilase de origem é uma glucoamilase de Penicillium, tal como Penicillium chrysoge- num.
A identidade estrutural determina se os resíduos de aminoácido são equivalentes. A identidade estrutural é um equivalente topológico um a um quando as duas estruturas (estruturas tridimensional e de aminoácido) são alinhadas. Uma posição de resíduo (aminoácido) de uma glucoamilase é equivalente a um resíduo de T. reesei glucoamilase se ela é ou homóloga (isto é, correspondente em posição em ou estrutura primária ou terciária) ou análoga a um resíduo específico ou porção de que resíduo em T. reesei glucoamilase (tendo a mesma ou capacidade funcional similar para combinar, reagir, ou interagir quimicamente).
De modo a estabelecer identidade para a estrutura primária, a sequência de aminoácido de uma glucoamilase pode ser diretamente comparada a sequência primária de Trichoderma reesei glucoamilase e particularmente a um conjunto de resíduos conhecidos para serem invariantes em glucoamilases para qual sequência é conhecida. Por exemplo, as Figuras 5A e B aqui mostram os resíduos conservados entre domínios catalíticos de glucoamilase. As Figuras 5D e E mostram um alinhamento de domínios de ligação de amido de glucoamilases. Após alinhamento dos resíduos conservados, permitindo inserções e anulações necessárias de modo a manter alinhamento (isto é, evitando a eliminação de resíduos conservados através de anulação e inserção arbitrária), os resíduos equivalentes a aminoácidos particulares na sequência primária de Trichoderma reesei glucoamilase são definidos. O alinhamento de resíduos conservados pode conservar 100% de tais resíduos. Contudo, alinhamento de mais do que 75% ou pouco mais de 50% de resíduos conservados é também adequado para definir resíduos equivalentes, particularmente quando alinhamento baseado na identidade estrutural é incluído.
Por exemplo, na Figura 5, glucoamilases de seis organismos são alinhadas para proporcionar a quantidade máxima de homologia entre sequências de aminoácido. Uma comparação destas sequências mostra que existem um número de resíduos conservados contidos em cada sequência conforme designado por um asterisco. Estes resíduos conservados, desse modo, podem ser usados para definir os resíduos equivalentes correspon dentes de aminoácido de Tríchoderma reesei glucoamilase em outras glucoamilases tal como glucoamilase de Aspergillus niger.
A identidade estrutural envolve a identificação de resíduos equivalentes entre as duas estruturas. "Resíduos equivalentes" podem ser definidos pela determinação de homologia no nível de estrutura terciária (identidade estrutural) para uma enzima cuja estrutura terciária foi determinada por técnicas de RMN e/ou cristalografia de raio X. Resíduos equivalentes são definidos como aqueles para qual as coordenadas atômicas de dois ou mais átomos de cadeia de um resíduo de aminoácido particular da Tríchoderma reeseiglucoamilase (N em N, CA em CA, C em C e O em O) estão dentro de 0,13 nm e preferivelmente 0,1 nm após alinhamento. Alinhamento é alcançado após o melhor modelo ter sido orientado e posicionado para dar a sobreposição máxima de coordenadas atômicas de átomos de proteína não- hidrogênio da glucoamilase em questão para o Tríchoderma reesei glucoamilase. O melhor modelo é o modelo cristalográfico dando o fator R mais baixo para dados de difração experimental na resolução mais alta disponível.
Resíduos equivalentes que são funcionalmente análogos a um resíduo específico de Tríchoderma reesei glucoamilase são definidos como aqueles aminoácidos da enzima que podem adotar uma conformação tal que eles ou alteram, modificam ou contribuem para estrutura de proteína, ligação de substrato ou catálise em uma maneira definida e atribuída a um resíduo específico do Tríchoderma reesei glucoamilase. Adicionalmente, eles são aqueles resíduos da enzima (para qual uma estrutura terciária foi obtida por cristalografia de raio X) que ocupam uma posição análoga a extensão que, embora os átomos de cadeia principal do dado resíduo não podem satisfazer o critério de equivalência na base de ocupação de uma posição homóloga, as coordenadas atômicas de pelo menos dois átomos de cadeia lateral do resíduo ocorre com 0,13 nm dos átomos de cadeia lateral correspondentes de Trichoderma reesei glucoamilase. As coordenadas da estrutura tridimensional de Trichoderma reesei glucoamilase são colocadas na Tabela 9 e podem ser usadas conforme esboçado acima para determinar resíduos equivalentes no nível de estrutura terciária.
As variantes de acordo com a invenção incluem pelo menos uma substituição, anulação ou inserção na sequência de aminoácido do SBD de uma glucoamilase de origem. Em algumas concretizações, as variantes de SBD da invenção terão pelo menos 20%, pelo menos 40%, pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95% pelo menos 97%, e também pelo menos 100% da atividade de glucoamilase conforme comparado a atividade de glucoamilase de TrGA (SEQ ID NO: 2). Em algumas concretizações, as variantes de SBD de acordo com a invenção compreenderão uma substituição, anulação ou inserção em pelo menos uma posição de aminoácido do SBD do TrGA de origem (SEQ ID NO: 2), ou em uma posição equivalente na sequência de outra glucoamilase de origem. Em algumas concretizações, a glucoamilase de origem tem pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90% de identidade de sequência para a sequência de TrGA, incluindo, mas não limitada a; pelo menos 93% de identidade de sequência, pelo menos 95%, pelo menos 97%, e pelo menos 99% de identidade de sequência com o domínio catalítico de TrGA (SEQ ID NO: 3). Em algumas concretizações, as variantes de acordo com a invenção compreenderão uma substituição, anulação ou inserção em pelo menos uma posição de aminoácido do TrGA de origem (SEQ ID NO: 2), ou em uma posição equivalente na sequência de outra glucoamilase de origem tendo pelo menos 50%, pelo menos 60%, pelo menos 70%), pelo menos 80%, pelo menos 90% identidade de sequência para a sequência de TrGA, incluindo, mas não limitado a; pelo menos 93% de identidade de sequência, pelo menos 95%, pelo menos 97%, e pelo menos 99% de identidade de sequência. Em algumas concretizações, a glucoamilase de origem terá identidade estrutural para a sequência de TrGA.
Em outras concretizações, a variante de acordo com a invenção compreenderá uma substituição, anulação ou inserção em pelo menos uma posição de aminoácido de um fragmento do TrGA de origem, no qual o fragmento compreende o domínio catalítico da sequência de TrGA (SEQ ID NO: 3), ou em uma posição equivalente em um fragmento compreendendo o domínio catalítico de uma glucoamilase de origem tendo pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80% identidade de sequência para o fragmento da sequência de TrGA, pelo menos 90%, pelo menos 95%, pelo menos 97%, e pelo menos 99% de identidade de sequência. Em algumas concretizações, o fragmento compreenderá pelo menos 400, 425, 450, e/ou 500 resíduos de aminoácido. Em algumas concretizações, quando a glucoamilase de origem inclui um domínio catalítico, região ligadora e domínio de ligação de amido, o fragmento pode incluir parte da região ligadora. Em algumas concretizações, a variante compreenderá uma substituição, anulação ou inserção na sequência de aminoácido de um fragmento da sequência de TrGA (SEQ ID NO: 2 ou SEQ ID NO: 3). Em algumas concretiza-ções, a variante terá identidade estrutural com a sequência de TrGA (SEQ ID NOs: 2 ou 3).
Identidade estrutural com referência a uma substituição de aminoácido significa que a substituição ocorre na posição de aminoácido equivalente na glucoamilase homóloga ou glucoamilase de origem.
O termo posição equivalente significa uma posição que é comum a duas sequências de origem que é baseada em um alinhamento da sequência de aminoácido da glucoamilase de origem em questão, bem como alinhamento da estrutura tridimensional da glucoamilase de origem em questão com a sequência de aminoácido de glucoamilase de referência de TrGA e sequência tridimensional. Por exemplo, com referência à Figura 5, a posição 24 em TrGA (SEQ ID NO: 3) é D24 e a posição equivalente para Aspergillus niger (SEQ ID NO. 6) é posição D25 e a posição equivalente para Aspergillus oryzae (SEQ ID NO: 7) é posição D26. Ver Figuras 6 e 7 para um alinhamento exemplar da sequência tridimensional sequência.
Em algumas concretizações, a variante de glucoamilase terá mais do que uma substituição (por exemplo, duas, três ou quatro substituições) conforme comparada a uma glucoamilase de origem correspondente.
Em algumas concretizações, uma variante de glucoamilase compreende uma substituição, anulação ou inserção em pelo menos uma posição de aminoácido em uma posição correspondente às regiões de ami- noácidos não-conservados conforme ilustrado nas Figuras 5A e 5B (por e- xemplo, posições de aminoácido correspondentes àquelas posições que não são designadas por nas Figuras 5A e 5B). Em algumas concretizações, a variante compreende uma substituição em pelo menos uma posição de aminoácido em uma posição correspondente às regiões de aminoácidos não- conservadas conforme ilustrado nas Figuras 5A e 5B.
Enquanto que as variantes podem estar em qualquer posição na sequência madura de proteína (SEQ ID NO: 2 ou 3), em algumas concretizações, uma variante de glucoamilase compreende uma ou mais substituições nas seguintes posições na sequência de aminoácido colocada em SEQ ID NO: 2 ou 3: 10, 14, 15, 23, 42, 45, 46, 59, 60, 61, 67,68,72,73,97,98,99, 102, 108, 110, 113, 114,122, 124, 125, 133, 140, 144, 145, 147, 152, 153, 164, 175, 182, 204, 205, 214, 216, 219, 228, 229, 230, 231, 236, 239, 240, 241, 242, 244, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 310, 311, 313, 316, 338, 342, 344, 346, 349, 359, 361, 364, 375, 379, 382, 390, 391, 393, 394, 408, 410, 415, 417, 418, 430, 431, 433, 436, 442, 443, 444, 448 e 451, ou em uma posição equivalente em uma glucoamilase de origem.
Em algumas concretizações, uma variante de glucoamilase compreende uma ou mais substituições de aminoácido correspondente a posição 493, 494, 495, 502, 503, 508, 511, 518, 519, 520, 527, 531, 535, 536, 537, 539, 563, e 577 de SEQ ID NO: 2, ou uma posição equivalente em uma glucoamilase de origem. Em algumas concretizações, a glucoamilase de origem terá pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97% pelo menos 98%, e pelo menos 99% de identidade de sequência com SEQ ID NO: 2 ou SEQ ID NO: 3. Em outras concretizações, a glucoamilase de origem será uma Tríchoderma glucoamilase homóloga. Em algumas concretizações, a variante terá propriedades alteradas. Em algumas concretizações, a glucoamilase de origem terá identidade estrutural com a glucoamilase de SEQ ID NOs: 2 ou 3.
Em algumas concretizações, a variante de glucoamilase compreende uma ou mais substituições nas seguintes posições na sequência de aminoácido colocada em SEQ ID NO: 2 ou 3: T10, L14, N15, P23, T42, P45, D46, F59, K60, N61, T67, E68, A72, G73, S97, L98, A99, S102, K108, El 10, LI 13, Kl 14, R122, Q124, R125, 1133, K140, N144, N145, Y147, SI 52, N153, N164, F175, N182, A204, T205, S214, V216, Q219, W228, V229, S230, S231, D236,1239, N240, T241, N242, G244, N263, L264, G265, A268, G269, D276, V284, S291, P300, A301, A303, Y310, A311, D313, Y316, V338, T342, S344, T346, A349, V359, G361, A364, T375, N379, S382, S390, E391, A393, K394, R408, S410, S415, L417, H418, T430, A431, R433.1436, A442, N443, S444, T448 e S451, ou uma posição equivalente em glucoamilase de origem (por exemplo, uma Trichoderma glucoamilase homóloga). Em algumas concretizações, a variante terá propriedades alteradas conforme comparada à glucoamilase de origem.
Em outras concretizações, a variante de uma glucoamilase de origem compreende uma ou mais substituições nas seguintes posições na sequência de aminoácido colocada em SEQ ID NO: 2 ou 3: 10, 14, 15, 23, 59, 60, 61, 65, 67, 68, 72, 73, 97, 98, 99, 102, 110, 113, 133,140, 144, 145, 147, 152,153, 164, 182,204, 205, 214, 216, 219, 228, 229, 230, 231, 236, 239, 241, 242, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 311, 338, 342, 344, 346, 349, 359, 361, 364, 375, 379, 382, 390, 391, 393, 394, 410, 417, 418, 430, 431,433, 442, 444, 448, e 451, ou uma posição equivalente em uma glucoamilase de origem. Em algumas concretizações, a glucoamilase de origem terá 50%, pelo menos 60%, pelo menos 70%, pelo me-nos 80%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97% pelo menos 98%, e pelo menos 99% de identidade de sequência com SEQ ID NO: 2 ou SEQ ID NO: 3. Em outras concretizações, a glucoamilase de origem será uma Trichoderma glucoamilase homóloga. Em algumas concretizações, a variante terá pelo menos uma propriedade alterada conforme comparada à glucoamilase de origem. Em algumas concretizações, a pelo menos uma propriedade alterada é atividade específica. Em algumas concretizações, a variante tem uma ou mais substituições correspondentes a uma das seguintes posições: 61, 67, 72, 97, 102, 133, 205, 219, 228, 230, 231, 239, 263, 268, 291,342, 394, 430, 431 e 451 de SEQ ID NO: 2 e/ou 3. Em algumas concretizações, a substituição nestas posições é escolhida de: N61I, T67M, A72Y, S97N, S102M, I133T, T205Q, Q219S, W228H, W228M, S230F, S230G, S230N, S230R, S231L, I239V, I239Y, N263P, A268C, A268G, A268K, S291A, T342V, K394S, T430K, A431Q, e S451K de SEQ ID NO: 2 e/ou 3. Em algumas concretizações, a variante tem uma ou mais substituições correspondentes a uma das seguintes posições: 72, 133, 219, 228, 230, 231, 239, 263, 268, e 451 de SEQ ID NO: 2 e/ou 3. Em algumas concretizações, a substituição nestas posições é escolhida de: A72Y, I133T, Q219S, W228H, W228M, S230R, S230F, S230G, S231L, I239V, N263P, A268C, A268G, e S451K de SEQ ID NO: 2 e/ou 3. Em algumas concretizações, a variante tem pelo menos uma propriedade alterada e a pelo menos uma propriedade alterada é uma atividade específica aumentada conforme comparada à glucoamilase de origem.
Em outras concretizações, a variante de uma glucoamilase de origem compreende pelo menos uma das seguintes substituições nas seguintes posições em uma sequência de aminoácido colocada em SEQ ID NO: 2 ou 3: T10D/F/G/K/UM/P/R/S; L14E/H; N15D/N; P23A/G; F59A/G; K60F/H; N61D/I/L/QA/AV; R65A/C/G/I/K/M/SA7Y; T67C/I/K/M/T; E68I/M/W; A72E/G/L/M/Q/RAVA7; G73C/LAV; S97F/M/N/P/R/SA,AVAZ; L98H/M; A99C/L/M/N/P; S102A/C/I/UM/N/PJV/WA7; El 10Q/S/W; LI 13E/N; Kl 14C/D/E/UM/Q/S/TA'; I133K/R/S/T; KUOA/E/F/H/K/L/M/N/Q/R/SA^VA'; N144C/D/E/I/K; NUδA/C/E/l/K/UM/Q/RA/AVA7; Y147A/M/R; S152H/M; N153C/D/K/LAVA'; N164A/G; N182C/E/K/P/R; A204C/D/G/I/M/Q/T; T205A/D/H/I/K/M/N/P/Q/SAAVA7; S214P/T; V216C/G/H/K/NA7; Q219D/G/H/N/P/S; W228A/F/G/H/I/UM/Q/SA7VA7; V229E/I/M/N/Q; S230C/D/E/F/G/H/l/K/L/N/P/Q/R/TAlA'; S231C/D/F/UM/N/Q/R/SA/A7; D236F/G/L/M/N/P/SnW; I239M/Q/SAAVA'; T241C/E/H/L/M/P/SAVV; N242C/F/H/M/TA/AV; N263H/K/P; L264A/C/E/F/L/S; G265E/G/H/I/K/RAT; A268C/D/E/F/G/I/K/UP/R/TAV; G269E; D276S; V284RyTW A7A/E/F/H/K/N/PAV; P300K/R; A301E/K/UP/S/W; A303C/D/F/H/I/K/L/N/R/TA/AVA'; A311N/P/Q/SA7; Vin?IQISfY; T342NW; S344A/T; T346G/H/M/N/P/QA7; A349UI/K/M/N/Q/RAV; G361H/UR; A364MAV; T375C/D/E/HA/AVA7; N379A/C/D/G/I/M/P/S; S382A/N/PAW; S390AA7; E391A/E/I/K/UM/Q/RA/AVA7; ASOSE/G/H/I/K/L/M/N/Q/R/S/TA^VA'; K394A/H/K/L/M/Q/R/Sn7VAV; S410E/H/N; L417 A/D/E/F/G/I/K/Q/R/S/TA/AWY; H418E/M; T430A/E/F/G/H/I/K/M/N/Q/RA; A431C/E/H/I/UM/Q/R/SAVA'; R433A/C/E/F/G/K/UM/N/SAAVA'; I436E/F/G/H/K/P/R/S/TAVY; S444M/N/P/Q/R/I7VAV; T448F/G/I/P/Q/TA/; e S451E/H/K/L7Q/T, ou uma substituição em uma posição equivalente em uma glucoamilase de origem.
Em outras concretizações, a variante de uma glucoamilase de origem compreende uma ou mais substituições nas seguintes posições na sequência de aminoácido colocada em SEQ ID NO: 2 ou 3: 10, 15, 23, 42, 59, 60, 61, 68, 72, 73, 97, 98, 99, 102, 114, 133, 140, 144, 147, 152, 153, 164, 182, 204, 205, 214, 216, 228, 229, 230, 231, 236, 241, 242, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 311, 338, 342, 344, 346, 349, 359, 361, 364, 375, 379, 382, 390, 391, 393, 394, 410, 417, 430, 431, 433, 436, 442, 443, 444, 448, e 451, ou uma posição equivalente em uma gluco amilase de origem (por exemplo, Tríchoderma glucoamilase homóloga).
Em algumas concretizações, a glucoamilase de origem terá pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97% pelo menos 98%, e pelo menos 99% o de identidade de sequência com SEQ ID NO: 2 ou SEQ ID NO: 3. Em algumas concretizações, a glucoamilase de origem também mostra identidade estrutural com a glucoamilase de SEQ ID NOs: 2 e/ou 3. Em outras concretizações, a glucoamilase de origem será uma Tríchoderma glucoamilase homóloga. Em algumas concretizações, a variante tem uma ou mais substituições correspondentes a uma das seguintes posições: 10, 42, 68, 73, 97, 114, 153, 229, 231, 236, 264, 291, 301, 344, 361, 364, 375, 417, e 433 de SEQ ID NO: 2 e/ou 3. Em algumas concretizações, a substituição nestas posições é escolhida de: T10S, T42V, E68C, E68M, G73F, G73W, K1 14M, K1 14T, N153A, N153S, N153V, W228V, D236R, G361D, G361E, G361P, G361Y,A364D, A364E, A364F, A364G, A364K, A365L, A365R, R433C, R433G, R433L, R433N, R433S, R433V, e I436H de SEQ ID NO: 2 e/ou 3. Em algumas concretizações, a variante tem uma ou mais substituições correspondentes a uma das seguintes posições: 42, 68, 73, 114, 153, 236, 361, e 364 de SEQ ID NOs: 2 e/ou 3. Em algumas concretizações, a substituição nestas posições é escolhida de: T42V, E68M, G73F, G73W, Kl 14T, N153S, N153V, D236R, G361D, A364F, e A364L de SEQ ED NO: 2 e/ou 3. Em algumas concretizações, a variante tem pelo menos uma propriedade alterada e a pelo menos uma propriedade alterada é uma termo esta-bilidade aumentada conforme comparada à glucoamilase de origem.
Em outras concretizações, a variante de uma glucoamilase de origem compreende uma ou mais substituições nas seguintes posições na sequência de aminoácido colocada na SEQ ID NOs: 2 ou 3: 10, 15, 59, 61, 68, 72, 73, 97, 99, 102, 133, 140, 153, 182, 204, 205, 214, 228, 229, 230, 231, 236, 241, 242, 264, 265, 268, 275, 284, 291, 300, 301, 303, 311, 338, 344, 346, 359, 361, 364, 375, 370, 382, 391, 393, 394, 410, 417, 430, 431, 433, 444, 448, e 451, e/ou uma posição equivalente em uma glucoamilase de origem {por exemplo, Trichoderma glucoamilase homóloga). Em algumas concretizações, a glucoamilase de origem terá pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97% pelo menos 98%, e pelo menos 99% de identidade de sequência com SEQ ID NO: 2 ou SEQ ID NO: 3. Em algumas concretizações, a glucoamilase de origem também terá identidade estrutural com a glucoamilase de SEQ ID NOs: 2 e/ou 3. Em outras concretizações, a glucoamilase de origem era uma Trichoderma glucoamilase homóloga. Em algumas concretizações, a variante terá pelo menos uma propriedade alterada conforme comparada à glucoamilase de origem. Em algumas concretizações, a variante tem uma ou mais substituições correspondentes a uma das seguintes posições: 228, 230, 231, 268, 291, 417, 433, e 451 de
SEQ ID NOs: 2 e/ou 3. Em algumas concretizações, a substituição nestas posições é escolhida de: W228H, W228M, S230F, S230G, S230R, S231L, A268C, A268G, S291A, L417R, R433Y, e S451K de SEQ ID NOs: 2 e/ou 3. Em algumas concretizações, a variante tem pelo menos uma propriedade alterada e a pelo menos uma propriedade alterada é uma termo estabilidade aumentada ou atividade específica conforme comparadas à glucoamilase de origem. Em algumas concretizações, a variante tem ambas termo estabilidade aumentada e uma atividade específica aumentada conforme comparadas à glucoamilase de origem.
Variantes de glucoamilase da invenção podem também incluírem glucoamilases quiméricas ou híbridas com, por exemplo, um domínio de ligação de amido (SBD) de uma glucoamilase e um domínio catalítico e liga- dor de outro. Por exemplo, uma glucoamilase híbrida pode ser produzida por troca do SBD de AnGA com o SBD de TrGA, produzindo um híbrido com o AnGA SBD e o TrGA domínio catalítico e ligador.
Alternativamente, o SBD e ligador de AnGA pode ser trocado pelo SBD e ligador de TrGA. Em alguns aspectos, a variante de glucoamilase exibe termo es-tabilidade aumentada conforme comparada à glucoamilase de origem. Em algumas concretizações, a propriedade alterada é atividade específica aumentada comparada à glucoamilase de origem. Em algumas concretizações, a propriedade alterada é termo estabilidade aumentada em temperaturas inferiores conforme comparada à glucoamilase de origem. Em algumas concretizações, a propriedade alterada é ambas atividade específica aumentada e termo estabilidade aumentada conforme comparada à glucoamilase de origem.
Um número de glucoamilases de origem foi alinhado com a sequência de aminoácido de TrGA. A Figura 5 inclui o domínio catalítico das seguintes glucoamilases de origem Aspergillus awamorí (AaGA) (SEQ ID NO: 5); Aspergillus niger (AnGA) (SEQ ID NO: 6); Aspergillus orzyae (AoGA) (SEQ ID NO: 7), Humicola grisea (HgGA) (SEQ ID NO: 8) e Hypocrea vinosa (HvGA) (SEQ ID NO: 9). A % de identidade dos domínios catalíticos é repre- sentada na Tabela 1 abaixo. Tabela 1
Em algumas concretizações, por exemplo, a variante de glucoamilase será derivada de uma glucoamilase de origem que é uma Aspergillus glucoamilase e a variante incluirá pelo menos uma substituição em uma posição equivalente a uma posição colocada em SEQ ID NO: 2 ou SEQ ID NO: 3 e, particularmente, em uma posição correspondente a: T10, L14, N15, P23, T42, P45, D46, F59, K60, N61, R65, T67, E68, A72, G73, S97, L98, A99, S102, K108, E110, L113, K114, R122, Q124, R125, 1133, K140, N144, N145, Y147, S152, N153, N164, F175, N182, A204, T205, S214, V216, Q219, W228, V229, S230, S231, D236,1239, N240, T241, N242, G244, N263, L264, G265, A268, G269, D276, V284, S291, P300, A301, A303, Y310, A311, D313, Y316, V338, T342, S344, T346, A349, V359, G361, A364, T375, N379, S382, S390, E391, A393, K394, R408, S410, S415, L417, H418, T430, A431, R433,1436, A442, N443, S444, T448 e S451.
A presente invenção também proporciona variantes de glucoamilase tendo pelo menos uma propriedade alterada (por exemplo, propriedade aperfeiçoada) conforme comparada a uma glucoamilase de origem e, parti-cularmente ao TrGA. Em algumas concretizações, pelo menos uma propriedade alterada (por exemplo, propriedade aperfeiçoada) é escolhida de estabilidade ácida, estabilidade térmica e atividade específica. Em algumas concretizações, a propriedade alterada é estabilidade ácida aumentada, estabilidade térmica aumentada e/ou atividade específica aumentada. Em algumas concretizações, a estabilidade térmica aumentada é em temperaturas mais altas. Em algumas concretizações, a estabilidade de pH aumentada é um pH alto. Em outras concretizações, a estabilidade de pH aumentada é em pH baixo.
As variantes de glucoamilase da invenção podem também proporcionar taxas mais altas de hidrólise de amido a concentrações baixas de substrato conforme comparado à glucoamilase de origem. A variante pode ter um Vmáx mais alto ou Km mais baixo do que uma glucoamilase de origem quando testada sob as mesmas condições. Por exemplo, a variante de glucoamilase pode ter um Vmáx mais alto a uma faixa de temperatura de 25°C a 70°C (por exemplo, a 25°C a 35°C; 30°C - 35°C; 40°C a 50°C; a 50°C a 55°C e a 55°C a 62°C). A constante de Michaelis-Menten, valores de Km e Vmáx podem ser facilmente determinados usando-se procedimentos conhecidos padrões.
Estabilidade térmica (Variantes termoestáveis): Em alguns aspectos, a invenção se refere a uma variante de glucoamilase tendo estabilidade térmica alterada conforme comparada a uma origem (tipo selvagem). Termo estabilidade alterada pode ser em temperaturas aumentadas ou em temperaturas diminuídas. Termo estabilidade é medida como a % de atividade residual após incubação por 1 hora a 64 graus centígrados em tampão de NaAc pH 4,5. Sob estas condições, TrGA tem uma atividade residual de entre cerca de 15% e 44% devido a variação dia a dia conforme comparada a atividade inicial antes de incubação. Desse modo, em algumas concretizações, variantes com termo estabilidade aumentada têm uma atividade residual que está entre pelo menos 1% e pelo menos 50% mais do que aquela da origem (após incubação por 1 hora a 64 graus centígrado em tampão de NaAc pH 4,5), incluindo 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%,48%, 49%, e 50%, conforme comparada a atividade inicial antes de incubação. Por exemplo, quando a atividade residual de origem é 15%, uma variante com termo estabilidade aumentada pode ter uma atividade re- sidual de entre cerca de 16% e cerca de 75%. Em algumas concretizações, a variante de glucoamilase terá termo estabilidade aperfeiçoada tal como retendo pelo menos 50%, 60%, 70%, 75%, 80%, 85%, 90%, 92%, 95%, 96%, 97%, 98% ou 99% de atividade enzimática após exposição a temperaturas alteradas sobre um dado período de tempo, por exemplo, pelo menos 60 minutos, 120 minutos, 180 minutos, 240 minutos, 300 minutos, etc. Em algumas concretizações, a variante tem estabilidade térmica aumentada comparada à glucoamilase de origem a temperaturas selecionadas na faixa de 40 a 80°C, também na faixa de 50 a 75°C, e na faixa de 60 a 70°C, e em uma faixa de pH de 4,0 a 6,0. Em algumas concretizações, a termo estabilidade é determinada conforme descrito nos Exemplos. Em algumas concretizações, a variante tem estabilidade térmica aumentada à temperatura inferior comparada à glucoamilase de origem a temperatura selecionada na faixa de 20 a 50°C, incluindo 35 a 45 e 30°C a 40°C.
Em algumas concretizações, variantes tendo um aperfeiçoamento em termoestabilidade incluem uma ou mais anulações, substituições ou inserções e, particularmente, substituições nas seguintes posições na sequência de aminoácido colocada na SEQ ID NO: 2 ou SEQ ID NO: 3: T10, N15, P23, T42, F59, K60, N61, E68, A72, G73, S97, L98, A99, S102, Kl 14,1133, K140, N144, Y147, S152, N153, N164, N182, A204, T205, S214, V216, W228, V229, S230, S231, D236, T241, N242, N263, L264, G265, A268, G269, D276, V284, S291, P300, A301, A303, A311, V338, T342, S344, T346, A349, V359, G361, A364, T375.N379, S382, S390, E391, A393, K394, S410, L417, T430, A431, R433.1436, A442,N443, S444, T448 e S451, e/ou uma posição equivalente em uma glucoamilase de origem. Em algumas concretizações, a glucoamilase de origem será uma Trichoderma glucoamilase homóloga e em outras concretizações, a glucoamilase de origem terá pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95% e pelo menos 98% de identidade de sequência para SEQ ID NOs: 2 ou 3. Em algumas concretizações, a glucoamilase de origem também terá identidade estrutural para SEQ ID NOs: 2 e/ou 3. Em algumas concretizações, a variante tendo termo estabilidade aumentada tem uma substituição em pelo menos uma das posições: 10, 42, 68, 73, 97, 153, 229, 231, 236, 264, 291,301,344, 361,364, 375, e/ou 417 de SEQ ID NO: 2 e/ou 3. Em algumas concretizações, a variante tendo termo estabilidade tem uma substituição em pelo menos uma das posições: 42, 68, 73, 153, 236, 344, 361,364, e 365 de SEQ ID NO: 2 ou SEQ ID NO: 3.
Conforme aqui usado, atividade específica é a atividade da glu-coamilase por mg de proteína. A atividade foi determinada usando o ensaio de etanol. A classificação de variantes identificadas tendo um índice de Desempenho (PI) > 1,0 comparado ao PI de TrGA de origem. O PI é calculado a partir das atividade específicas (atividade/mg enzima) do tipo selvagem (WT) e as enzimas variantes. Ele é o quociente "Variante-atividade específi- ca/WT-atividade específica" e pode ser uma medida do aumento na atividade específica da variante. Um PI de 2 deve ser cerca de 2 vezes melhor do que o WT. Em alguns aspectos, a invenção se refere a uma variante de glucoamilase tendo atividade específica alterada conforme comparada a uma glucoamilase de origem ou tipo selvagem. Em algumas concretizações, a atividade específica alterada é atividade específica aumentada. Atividade específica aumentada pode ser definida como um índice de desempenho aumentado de mais do que ou igual a cerca de 1, incluindo maio do que ou igual a cerca de 1,1, 1,2, 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, e 2. Em algumas concretizações, a atividade específica aumentada é de cerca de 1,0 a cerca de 5,0, incluindo 1,1, 1,2, 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, 2,0, 2,1, 2,2, 2,3, 2,4, 2,5, 2,6, 2,7, 2,8, 2,9, 3,0, 3,1, 3,2, 3,3, 3,4, 3,5, 3,6, 3,7, 3,8, 3,9, 4,0, 4,1, 4,2, 4,3, 4,4, 4,5, 4,6, 4,7, 4,8, e 4,9. Em algumas concretizações, a variante tem pelo menos atividade específica mais alta uma vez do que a glucoamilase de origem, incluindo pelo menos 1,1 vezes, 1,2 vezes, 1,3 vezes, 1,4 vezes, 1,5 vezes, 1,6 vezes, 1,7 vezes, 1,8 vezes, 1,9 vezes, 2 vezes, 2,2 vezes, 2,5 vezes, 2,7 vezes, 2,9 vezes, 3 vezes, 4 vezes, e 5 vezes.
Em algumas concretizações, variantes tendo um aperfeiçoamento na atividade específica incluem uma ou mais anulações, substituições ou inserções nas seguintes posições na sequência de aminoácido colocada em SEQ ID NO: 2 e/ou 3: T10, L14, N15, P23, F59, K60, N61, T67, E68, A72, G73, S97, L98, A99, S102, El 10, L113,1133, K140, N144, N145, Y147, S152, N153, N164, N182, A204, T205, S214, V216, Q219, W228, V229, S230, S231, D236,1239, T241, N242, N263, L264, G265, A268, G269, D276, V284, S291, P300, A301, A311, V338, T342, S344, T346, A349, V359, G361, A364, T375, N379, S382, S390, E391, A393, K394, S410, S415, L417, H418, T430, A431, R433, A442, S444, T448 e/ou S451 e/ou uma posição equivalente em uma glucoamilase de origem. Em algumas concretizações, variantes da invenção tendo atividade específica aperfeiçoada incluem uma substituição nas seguintes posições na sequência de aminoácido colocada em SEQ ID NO: 2 ou 3: 61,67, 72, 97, 102, 133, 205, 219, 228, 230, 231,239, 263, 268, 291, 342, 394, 430, 431 e 451, e/ou uma posição equivalente em uma glucoamilase de origem. Em algumas concretizações, a glucoamilase de origem compreenderá uma sequência tendo pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90% ou 95% de identidade de sequência para a sequência de SEQ ID NO: 2 ou 3. Em algumas concretizações, a glucoamilase de origem também terá identidade estrutural para SEQ ID NO: 2 e/ou 3. Em algumas concreti-zações, a variante tendo atividade específica aumentada tem uma substituição em pelo menos uma das posições: 72, 133, 219, 228, 230, 231, 239, 263, 268, e 451 de SEQ ID NO: 2 e/ou 3.
Em alguns aspectos, a invenção se refere a uma variante de glucoamilase tendo ambas termo estabilidade alterada e atividade específica alterada conforme comparada a uma origem (por exemplo, tipo selvagem). Em algumas concretizações, a atividade específica alterada é uma atividade específica aumentada. Em algumas concretizações, a termoestabilidade alterada é uma termoestabilidade aumentada a temperaturas altas (por exemplo, a temperaturas acima de 80°C) conforme comparada à glucoamilase de origem.
Em algumas concretizações, variantes com uma termo estabilidade aumentada e atividade específica aumentada incluem uma ou mais anulações, substituições ou inserções e substituições nas seguintes posições na sequência de aminoácido colocada em SEQ ID NOs: 2 ou 3: T10, N15, F59, N61, E68, A72, G73, S97, A99, S102, 1133, K140, N153, N182, A204, T205, S214, W228, V229, S230, S231, D236, T241, N242, L264, G265, A268, D276, V284, S291, P300, A301, A303, A311, V338, S344, T346, V359, G361, A364, T375, N379, S382, E391, A393, K394, S410, L417, T430, A431, R433, S444, T448 e/ou S451 e/ou uma posição equivalente em uma glucoamilase de origem. Em algumas concretizações, a glucoamilase de origem será uma Tríchoderma glucoamilase homóloga e em outras concretizações, a glucoamilase de origem terá pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95% e pelo menos 98% de identidade de sequência para SEQ ID NO: 2 ou 3. Em algumas concretizações, a glucoamilase de origem também terá identidade estrutural para EQ ID NO: 2 e/ou 3. Em algumas concretizações, a variante tendo termo estabilidade aumentada e atividade específica tem uma substituição em pelo menos uma das posições: 228, 230, 231, 268, 291,417, 433, e 451 de SEQ ID NO: 2 e/ou 3. Polinucleotídeos:
A presente invenção também se refere a polinucleotídeos isolados que codifica uma variante de glucoamilase de SBD da invenção. Os polinucleotídeos podem ser preparados pelas técnicas estabelecidas conhecidas na técnica. Os polinucleotídeos podem ser preparados sinteticamente, tal como por um sintetizador de DNA automático. A sequência de DNA pode ser de genômico misturado (ou cDNA) e origem sintética preparado por fragmentos que ligam juntos. Os polinucleotídeos podem também serem preparados por reação de cadeia de polimerase (PCR) usando-se iniciadores específicos. Em geral, referência é feita a Minshull J., et al., (2004), Methods 32(4):416 - 427). DNA pode também ser sintetizado por um número de companhias comerciais, tal como Geneart AG, Regensburg, Alemanha.
A presente invenção também proporciona polinucleotídeos isolados compreendendo uma sequência de nucleotídeo (i) tendo pelo menos 50% de identidade para SEQ ID NO: 4, incluindo pelo menos 60%, pelo me- nos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, e pelo menos 99%, ou (ii) sendo capaz de hibridizar a uma sonda derivada da sequência de nucleotídeo colocada na SEQ ID NO: 4, sob condições de estringên- cia intermediária a alta, ou (iii) sendo complementar a uma sequência de nucleotídeo tendo pelo menos 90% de identidade de sequência para a sequência colocada em SEQ ID NO: 4. Sondas úteis de acordo com a invenção podem incluir pelo menos 50, 100, 150, 200, 250, 300 ou mais nucleotídeo contíguos de SEQ ID NO: 4. Em algumas concretizações, o polipeptídeo codificado também tem identidade estrutural para SEQ ID NOs: 2 e/ou 3.
A presente invenção adicionalmente proporciona polinucleotí- deos isolados que codificam variantes de glucoamilase que compreendem uma sequência de aminoácido compreendendo pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 93%, pelo menos 95%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% identidade de sequência de aminoácido para SEQ ID NO: 2. Adicionalmente, a presente invenção proporciona vetores de expressão compreendendo qualquer um dos polinucleotídeos provido acima.
A presente invenção também proporciona fragmentos (isto é, porções) do DNA que codifica a variante de glucoamilases provida aqui. Estes fragmentos encontram uso na obtenção de fragmentos de DNA de comprimento parcial capazes de ser usados para isolar ou identificar polinucleotídeos que codificam enzimas de glucoamilase maduras aqui descritas de células fungais filamentosas (por exemplo, Trichoderma, Aspergillus, Fusarium, Penicillium, e Humicold), ou um segmento destas tendo atividade de glucoamilase. Em algumas concretizações, fragmentos do DNA podem compreender pelo menos 50, 100, 150, 200, 250 300 ou mais nucleotídeos contíguos. Em algumas concretizações, porções do DNA provido em SEQ ID NO: 4 encontram uso na obtenção de glucoamilase de origem e particularmente Trichoderma glucoamilase homólogas de outras espécies, tais como fungos filamentosos que codificam uma glucoamilase.
Construtos e Vetores de DNA: De acordo com algumas concretizações da invenção, uma cons- truto de DNA compreendendo um polinucleotídeo conforme descrito acima que codifica uma glucoamilase variante envolvida pela invenção e operavelmente ligada a uma sequência promotora é montada para transferir em uma célula hospedeira.
O construto de DNA pode ser introduzido em uma célula hospedeira usando um vetor. O vetor pode ser qualquer vetor que, quando introduzido em uma célula hospedeira pode ser integrado no genoma da célula hospedeira e é replicado. Em algumas concretizações, o vetor é integrado no genoma da célula hospedeira e é replicado. Vetores incluem vetores de clonagem, vetores de expressão, vetores de lançadeira, plasmídeos, partículas de fago, cassetes, e similares. Em algumas concretizações, o vetor é um vetor de expressão que compreende sequências regulatórias operavelmente ligadas a sequência de codificação de glucoamilase.
Exemplos de vetores de expressão e/ou de integração adequados são providos em Sambrook et al., (1989) supra, e Ausubel (1987) supra, e van den Hondel et al. (1991) em Bennett and Lasure (Eds.) MORE GENE MANIPULATIONS IN FUNGI, Academic Press pp. 396-428 e Patente U.S. N2 5.874,276. Referência é também feita a Fungal Genetics Stock Center Catalogue of Strains (FGSC, < www.fgsc.net>) para uma lista de vetores. Vetores particularmente úteis incluem vetores obtidos de, por exemplo, Invitrogen e Promega.
Plasmídeos adequados para uso em células bacteriais incluem pBR322 e pUC19 que permitem replicação em E.colie pE194, por exemplo, que permitem replicação em Bacillus. Outros vetores específicos adequados para uso em células hospedeiras de E. coll incluem vetores tais como pFB6, pBR322, pUC18, pUClOO, pDONR®201, pDONR®221, pENTR®, pGEM®3Z e pGEM®4Z.
Vetores específicos adequados para uso em células fungais incluem pRAX, um vetor de expressão de proposta geral útil em Aspergillus, pRAX com um g/aA promotor, e em Hypocrea/Trichoderma incluem pTrex3g com um cbh\ promotor.
Em algumas concretizações, o promotor mostra atividade trans- cricional em uma célula hospedeira bacterial ou uma célula hospedeira fungai e pode ser derivado de genes que codificam proteínas ou homólogas ou heterólogas para a célula hospedeira. O promotor pode ser um promotor mutante, truncado e/ou híbrido. Os promotores acima mencionados são conhecidos na técnica. Exemplos de promotores adequados úteis em células fungais e particularmente células filamentosas fungais tais como células Trichoderma ou Aspergillus incluem tais promotores exemplares como os promotores T. reesei cbh\, cbhl, egll, egl2, eg5, xln\ e xlnl. Outros exemplos de promotores úteis incluem promotores de genes de A. awamorí e A. niger gluco-amilase (glaA) (Ver, Nunberg et al., (1984) Mol. CelIBiol. 4:2306-2315 e Boel et al., (1984) EMBOJ. 3:1581-1585), o promotor de oryzae TAKA amylase, o promotor TPI (triose fosfato isomerase) de S. cerevisiae, o promotor de genes de Aspergillus nidulans acetamidase e genes Rhizomucor miehei lipase. Exemplos de promotores adequados úteis em células bacteriais incluem a- queles obtidos de E. coli lac operon; gene de Bacillus licheniformis alfa ami- lase (amyL), gene de B. stearothermophilus amylase (amyS); genes de Bacillus subtilis xylA e xylB, o gene de beta-lactamase, e o promotor tac. Em algumas concretizações, o promotor é um que é nativo à célula hospedeira. Por exemplo, quando T. reesei é o hospedeiro, o promotor é um promotor de T. reesei nativo. Em outras concretizações, o promotor é um que é heterólo- go à célula hospedeira fungai. Em algumas concretizações, o promotor será o promotor de glucoamilase de origem (por exemplo, o promotor de TrGA).
Em algumas concretizações, o construto de DNA inclui ácidos nucleicos que codificam uma sequência de sinal, isto é, uma sequência de aminoácido ligada ao amino terminal do polipeptídeo que direciona o polipeptídeo codificado na trajetória secretória da célula. A extremidade 51 da sequência de codificação da sequência de ácido nucleico pode naturalmente incluir uma região de codificação de peptídeo de sinal que é naturalmente ligada em estrutura de leitura de translação com o segmento da sequência de codificação de glucoamilase que codifica a glucoamilase secretada ou a extremidade 5‘ da sequência de codificação da sequência de ácido nucleico pode incluir um peptídeo de sinal que é estranho à sequência de codificação.
Em algumas concretizações, o construto de DNA inclui uma sequência de sinal que é naturalmente associada com um gene de glucoamilase de origem do qual uma glucoamilase variante foi obtida. Em algumas concretizações, a sequência de sinal será a sequência representada em SEQ ID NO: 1 ou uma sequência tendo pelo menos 90%, pelo menos 94% e pelo menos 98% de identidade de sequência. Sequências de sinal efetivas podem incluir as sequências de sinal obtidas de outras enzimas fungais filamentosas, tal como de Tríchoderma (T. reesei glucoamilase, Humicola (H. insolens celula- se ou H. grisea glucoamilase), Aspergillus (A. niger glucoamilase e A. oryzae TAKA amylase), e Rhizopus.
Em concretizações adicionais, um construto de DNA ou vetor compreendendo uma sequência de sinal e uma sequência promotora a serem introduzidas em uma célula hospedeira são derivadas da mesma fonte. Em algumas concretizações, a sequência de sinal de glucoamilase nativa de uma Tríchoderma glucoamilase homóloga, tal como uma sequência de sinal de uma cepa de Hypocrea pode ser usada.
Em algumas concretizações, o vetor de expressão também inclui uma sequência de terminação. Qualquer sequência de terminação funcional na célula hospedeira pode ser usada na presente invenção. Em algumas concretizações, a sequência de terminação e a sequência promotora são derivadas da mesma fonte. Em outra concretização, a sequência de terminação é homóloga à célula hospedeira. Sequências de terminação úteis incluem sequências de terminação obtidas a partir dos genes de Tríchoderma reesei cbh\; A. niger ou A. awamori glucoamilase (Nunberg et al. (1984) supra, e Boel et al., (1984) supra), Aspergillus nidulans antranilato sintase, Aspergillus oryzae TAKA amylase, ou A. nidulans trpC (Punt et al., (1987) Gene 56:117-124).
Em algumas concretizações, um vetor de expressão inclui um marcador selecionável. Exemplos de marcadores selecionáveis incluem marcadores que conferem resistência antimicrobial (por exemplo, higromici- na e fleomicina). Marcadores seletivos nutricionais também encontram uso na presente invenção incluindo aqueles marcadores conhecidos na técnica como amdS (acetamidase), argB (ornitina carbamoiltransferase) e pyrG (oro- tidine-5'fosfato decarboxilase). Marcadores úteis em sistemas de vetor para transformação de Trichoderma são conhecidos na técnica (Ver, por exemplo, Finkelstein, capítulo 6 em BIOTECHNOLOGY OF FILAMENTOUS FUNGI, Finkelstein et al. Eds. Butterworth-Heinemann, Boston, MA (1992); Kinghorn et al. (1992) APPLIED MOLECULAR GENETICS OF FILAMENTOUS FUNGI, Blackie Academic e Professional, Chapman e Hall, London; Berges e Barreau (1991) Curr. Genet. 19:359 - 365; e van Hartingsveldt et al., (1987) Mol. Gen. Genet. 206:71 - 75). Em algumas concretizações, o marcador seletivo é o gene amdS, que codifica a enzima acetamidase, permitindo que células transformadas cresçam na acetamida como uma fonte de nitrogênio. O uso de um gene de A. nidulans amdS como um marcador seletivo é descrito em Kelley et al., (1985) EMBOJ. 4:475 - 479 e Penttila et al., (1987) Gene 61:155-164.
Os métodos usados para ligar o construto de DNA compreendendo uma sequência de ácido nucleico que codifica uma glucoamilase variante, um promotor, uma sequência de terminação e outras sequências e para inseri-los em um vetor adequado são bem conhecidos na técnica. A ligação é geralmente acompanhada por ligação em locais de restrição convenientes. Se tais locais não existem, ligantes de oligonucleotídeos sintéticos são usados de acordo com a prática convencional. (Ver, Sambrook (1989) supra, e Bennett e Lasure, MORE GENE MANIPULATIONS IN FUNGI, Academic Press, San Diego (1991) pp 70 - 76.). Adicionalmente, vetores podem ser construídos usando-se técnicas de recombinação conhecidas (por exemplo, Invitrogen Life Technologies, Gateway Technology).
A presente invenção também se refere a células hospedeiras compreendendo um polinucleotídeo que codifica uma variante de glucoamilase da invenção. Em algumas concretizações, as células hospedeiras são escolhidas de células bacteriais, fungais, de planta e de levedura. O termo célula hospedeira inclui ambas as células, progénie das células e protoplas- tos criados a partir das células que são usadas para produzir uma variante de glucoamilase de acordo com a invenção.
Em algumas concretizações, as células hospedeiras são células fungais. Em algumas concretizações, as células hospedeiras são células hospedeiras fungais filamentosas. O termo "fungos filamentosos" se referem a todas as formas filamentosas da subdivisão Eumycotina (Ver, Alexopoulos, C. J. (1962), INTRODUCTORY MYCOLOGY, Wiley, New York). Estes fungos são caracterizados por uma micélia vegetativa com uma parede de célula composta de chitin, celulose, e outros polissacarídeos complexos. Os fungos filamentosos da presente invenção são morfologicamente, fisiologica- mente, e geneticamente distintos das leveduras. O crescimento vegetativo por fungos filamentosos é por alongamento hifal e catabolismo de carbono é obrigatoriamente aeróbico. Na presente invenção, a célula de origem fungai filamentosa pode ser uma célula de uma espécie de, mas não limitado a, Tríchoderma, (por exemplo, Tríchoderma reesei, a morph assexual de Hypo- crea jecorina, previamente classificada como T. longibrachiatum, Trichoder- ma viride, Tríchoderma koningii, Tríchoderma harzianum) (Sheir-Neirs et. al., (1984) Appl. Microbiol. Biotechnol 20:46 - 53; ATCC No. 56765 e ATCC Ne 26921); Penicillium sp., Humicola sp. (por exemplo, H. insolens, H. lanuginosa e H. grised); Chrysosporium sp. (por exemplo, C. lucknowense), Gliocla- dium sp., Aspergillus sp. (por exemplo, A. oryzae, A. niger, A sojae, A. japo- nicus, A. nidulans, e A. awamori) (Ward et al., (1993) Appl. Microbiol. Biotechnol. 39:738 - 743 e Goedegebuur et al., (2002) Genet 41:89 -98), Fusarium sp., (por exemplo, F. roseum, F. graminum F. cerealis, F. oxysporum e F. venenatum), Neurospora sp., (N. crassa), Hypocrea sp., Mucor sp.,(M. mie- hei), fíhizopus sp. e Emericella sp. (Ver também, Innis et al., (1985) Sei. 228:21 -26). O termo "Tríchoderma" ou "Tríchoderma sp." ou "Tríchoderma spp." se refere a qualquer gênero fungai previamente ou correntemente classificado como Tríchoderma.
Em algumas concretizações, as células hospedeiras serão célu-las bacteriais gram-positivas. Exemplos não-limitativos incluem cepas de Streptomyces, (por exemplo, S. lividans , S. coelicolor e S. griseus) e Bacil-lus. Conforme aqui usado, "o gênero Bacillus" inclui todas as espécies aden- tro do gênero "Bacillus," conforme conhecido àqueles técnicos no assunto, incluindo, mas não limitados a, B. subtilis, B. licheniformis, B. lentus, B. brevis, B. stearothermophilus, B. alkalophilus, B. amyloliquefaciens, B. clausii, B. halodurans, B. megaterium, B. coagulans, B. circulans, B. lautus, e B. thu- 5 ringiensis. É reconhecido que o gênero Bacillus continua a suportar reorga-nização taxonômica. Desse modo, é pretendido que o gênero inclui espécies que foram reclassificadas, incluindo, mas não limitada a, tais organismos como B. stearothermophilus, que é agora denominado "Geobacillus stearothermophilus".
Em algumas concretizações, a célula hospedeira é uma cepa bacterial gram-negativa, tais como E. coli ou Pseudomonas sp. Em outras concretizações, as células hospedeiras podem ser células de levedura tais como Saccharomyces sp., Schizosaccharomyces sp., Pichia sp., ou Candida sp.
Em outras concretizações, a célula hospedeira será uma célula hospedeira geneticamente projetada no qual genes nativos foram inativa- dos, por exemplo, por anulação em células bacteriais ou fungais. Onde é desejado obter-se uma célula hospedeira fungai tendo um ou mais métodos conhecidos de genes inativados podem ser usados (por exemplo, mé- 20 todos revelados na Patente U.S. N- 5.246.853, Patente U.S. N2 5.475.101 e WO 92/06209). A inativação de gene pode ser acompanhada por anulação complete ou parcial, por inativação insercional ou por qualquer outro meio que se torna um gene não-funcional para sua proposta pretendida (tal que o gene é impedido de expressão de uma proteína funcional). Em al- 25 gumas concretizações, quando a célula hospedeira é uma célula de Trichoderma e particularmente uma célula hospedeira de T. reesei, os genes de cbh\, cbh2, egl\ e eg/2 serão inativados e podem ser anulados. Em algumas concretizações, as células hospedeiras de Trichoderma reesei têm codificação de gene quad-anulada para proteínas tais como aquelas colo- 30 cadas e descritas nos USP 5.847.276 e WO 05/001036. Em outras concretizações, a célula hospedeira é uma protease deficiente ou protease menos cepa.
A introdução de um construto de DNA ou vetor em uma célula hospedeira inclui técnicas tais como transformação; eletroporação; microin- jeção nuclear; transdução; transfecção, (por exemplo, transfecção mediada por lipofecção e mediada por DEAE-Dextrin); incubação com precipitado de DNA de fosfato de cálcio; bombardeio de alta velocidade com microprojéteis revestidos com DNA; e fusão de protoplasto. Técnicas de transformação geral são conhecidas na técnica (Ver, por exemplo, Ausubel et al., (1987), supra, capítulo 9; e Sambrook (1989) supra, e Campbell et al., (1989) Curr. Genet. 16:53-56).
Métodos de transformação para Bacillus são revelados em nu-merosas referências incluindo Anagnostopoulos C e J. Spizizen (1961) J. Bacteriol. 81:741 - 746 e WO 02/14490.
Métodos de transformação para Aspergillus são descritos em Yelton et al (1984) Proc. Natl. Acad. Sei. USA 81:1470 - 1474; Berka et al., (1991) em Applications of Enzyme Biotechnology, Eds. Kelly e Baldwin, Ple-num Press (NY); Cao et al., (2000) Sci. 9:991 - 1001; Campbell et al., (1989) Curr. Genet. 16:53-56 e EP 238 023. A expressão de proteína heteróloga em Trichoderma é descrita em USP 6.022.725; USP 6.268.328; Harkki et al. (1991); Enzyme Microb. Technol. 13:227-233; Harkki et al., (1989) Bio Tech- nol. 7:596-603; EP 244.234; EP 215.594; e Nevalainen et al., "The Molecular Biology of Trichoderma e its Application to the Expression of Both Homolog-ous e Heterologous Genes", in MOLECULAR INDUSTRIAL MYCOLOGY, Eds. Leong e Berka, Marcel Dekker Inc., NY (1992) pp. 129 - 148). Referência é também feita a W096/00787 e Bajar et al., (1991) Proc. Natl. Acad. Sci. USA 88:8202 - 28212 para transformação de cepas de Fusarium.
Em uma concretização específica, a preparação de Trichoderma sp. para transformação envolve a preparação de protoplastos de micélia fungai (Ver, Campbell et al., (1989) Curr. Genet. 16:53-56; Pentilla et al., (1987) Gene 61:155 - 164). Transformação mediada por Agrobacterium tu- mefaciens de fungos filamentosos é conhecida (Ver, de Groot et al., (1998) Nat. Biotechnol. 16:839 - 842). Referência é também feita a USP 6.022.725 e USP 6.268.328 para procedimentos de transformação usados com hospe-deiros fungais filamentosos.
Em algumas concretizações, transformantes geneticamente es-táveis são construídos com sistemas de vetor pelo que o ácido nucleico que codifica a glucoamilase variante é estavelmente integrado em um cromossomo de cepa de hospedeiro. Os transformantes são então purificados por técnicas conhecidas.
Em algumas outras concretizações, as células hospedeiras são células de planta, tais como células de uma planta monocot (por exemplo, milho, trigo e sorgo) ou células de uma planta dicot (por exemplo, soja). Mé-todos para produção de construtos de DNA úteis na transformação de plan-tas e métodos para transformação de planta são conhecidos. Alguns destes métodos incluem transferência de gene mediada por Agrobacterium tumefa- ciens; bombardeio de microprojétil, transformação mediada por PEG de pro- toplastos, eletroporação, e similares. Referência é feita a USP 6.803.499, USP 6.777.589; Fromm et al. (1990) Biotechnol. 8:833-839; Potrykus et al. (1985) Mol.Gen. Genet. 199:169-177.
A presente invenção adicionalmente se relaciona a métodos de produção da variante de glucoamilases, que compreende transformar uma célula hospedeira com um vetor de expressão compreendendo um polinu- cleotídeo que codifica uma variante de glucoamilase de acordo com a invenção, cultura da célula hospedeira sob condições adequadas para expressão e produção da variante de glucoamilase e opcionalmente recuperação da variante de glucoamilase.
Nos métodos de expressão e produção da presente invenção, as células hospedeiras são cultivadas sob condições de cultura adequadas em cultivo de frasco de agitar, fermentações de pequena escala e de grande escala (incluindo fermentações contínuas, de batelada e de batelada alimentada) em fermentadores de laboratório ou industriais, com meio adequado contendo sais fisiológicos e nutrientes (Ver, por exemplo, Pourquie, J. et al., BIOCHEMISTRY AND GENETICS OF CELLULOSE DEGRADATION, eds. Aubert, J. P. et al., Academic Press, pp. 71-86,1988 e Ilmen, M. et al., (1997) Appl. Environ. Microbiol. 63:1298-1306). Meio preparado comercialmente comum (por exemplo, caldo de Extrato de Malte de Levedura (YM), Luria Bertani (LB) caldo e caldo de Sabouraud Dextrose (SD)) encontram uso na presente invenção. As condições de cultura para células fungais bacteriais e filamen-tosas são conhecidas na técnica e podem ser encontradas na literatura cien-tífica e/ou a partir da fonte dos fungos tais como a American Type Culture Collection e Fungal Genetics Stock Center. Nos casos onde uma sequência de codificação de glucoamilase está sob o controle de um promotor induzi- vel, o agente de indução (por exemplo, um açúcar, sal de metal ou antimi-crobial), é adicionado ao meio a uma concentração efetiva para induzir ex-pressão de glucoamilase.
Em algumas concretizações, ensaios são efetuados para avaliar a expressão de uma variante de glucoamilase por uma linha de célula que foi transformada com um polinucleotídeo que codifica uma variante envolvida pela invenção. Os ensaios podem ser efetuados no nível de proteína, o nível de RNA e/ou pelo uso de bioensaios funcionais particulares para atividade de glucoamilase e/ou produção. Alguns destes ensaios incluem mancha- mento de Northern, manchamento por ponto (análise de DNA ou RNA), RT- PCR (reação de cadeia de transcriptase polimerase reversa), hibridização in situ usando uma sonda apropriadamente etiquetada (baseada na sequência de codificação de ácido nucleico) e manchamento de Southern convencional e autorradiografia.
Em adição, a produção e/ou expressão de uma glucoamilase variante envolvida pela invenção pode ser medida em uma amostra diretamente, por exemplo, por ensaios diretamente medindo redução de açúcares tal como glicose no meio de cultura e por ensaios para medição de atividade de glucoamilase, expressão e/ou produção. Em particular, atividade de glucoamilase pode ser ensaiada pelo método de ácido 3,5-dinitrosalicílico (DNS) (Ver, Goto et al., (1994) Biosci. Biotechnol. Biochem. 58:49 - 54). Em concretizações adicionais, expressão de proteína é avaliada por métodos imunoló- gicos tais como manchamento imunohistoquímico de células, seções de te- eido ou imunoensaio de meio de cultura de tecido, (por exemplo, por mancha de Western ou ELISA). Tais imunoensaios podem ser usados para avaliar qualitativamente e quantitativamente expressão de uma glucoamilase. Os detalhes de tais métodos são conhecidos àqueles técnicos no assunto e muitos reagentes para praticar tais métodos são comercialmente disponí-veis.
As glucoamilases variantes de SBD da presente invenção po-dem ser recuperadas ou purificadas do meio de cultura por uma variedade de procedimentos conhecidos na técnica incluindo centrifugação, filtração, extração, precipitação, e similares. Composições:
As variantes de glucoamilase podem ser usadas nas composi-ções de enzima, incluindo, mas não limitadas a, hidrolisação de amido e composições de sacarificação, composições detergentes e de limpeza (por exemplo, detergentes de lavanderia, detergentes de lavagem de prato, e composições de limpeza de superfície dura), composições de fermentação de álcool, composições de alimentação de animal, e composições de bebida. Adicionalmente as variantes podem ser usadas em aplicações de cozimento, tais como produção de pão e bolo, preparação de bebida fermentada, cuidado de saúde, têxtil, processos de conversão de despejo ambiental, processamento de biopolpa, e aplicações de conversão de biomassa.
Em algumas concretizações, uma composição de enzima inclu-indo uma variante envolvida pela invenção será obtida em meio de cultura ou recuperada e purificada a partir do meio de cultura. Em algumas concreti-zações, a variante será usada em combinação com qualquer uma ou combi-nação das seguintes enzimas - alfa amilases, proteases, pululanases, isoa- milases, celulases, hemicelulases, xilanases, ciclodextrin glicotransferases, Upases, fitases, lacases, oxidases, esterases, cutinases, xilanases, enzima de hidrolisação de amido granular e outras glucoamilases.
Em algumas concretizações, a composição de enzima incluirá uma alfa amilase, tal como alfa amilases fungais (por exemplo, Aspergillus sp.) ou alfa amilases bacteriais (por exemplo, Bacillus sp. tais como B. stea- rothermophilus, B. amyloliquefaciens e B. licheniformis) e variantes e híbridos destes. Em algumas concretizações a alfa amilase é uma alfa amilase ácida estável. Em algumas concretizações, a alfa amilase é uma enzima de hidrolisação de amido granular (GSHE). Em algumas concretizações, a alfa amilase é Aspergillus kawachi atfa amilase (AKAA), ver US 7.037.704. A alfa amilases comercialmente disponíveis contempladas para uso nas composi-ções da invenção são conhecidas e incluem GZYME G997, SPEZYME FRED, SPEZYME XTRA, STARGEN (Danisco US, Inc, Genencor Division), TERMAMYL 120-L e SUPRA (Novozymes, Biotech).
Em algumas concretizações, a composição de enzima incluirá uma protease fungai ácida. Em uma concretização adicional, a protease fun-gai ácida é derivada de uma Trichoderma sp e pode ser qualquer uma das proteases reveladas na US 2006/015342, publicado em 13/7/2006(por e- xemplo, SEQ ID NO: 10). Em uma concretização adicional, a composição de enzima incluirá uma fitase (por exemplo, uma Buttiauxiella spp. ou variante desta (por exemplo, ver publicação de patente PCT WO 2006/043178).
Em outras concretizações, as variantes de glucoamilase da in-venção podem ser combinadas com outras glucoamilases. Em algumas concretizações, as glucoamilases da invenção serão combinadas com uma ou mais glucoamilases derivadas de cepas de Aspergillus ou variantes desta, tais como A. oryzae, A. niger, A. kawachi, e A. awamori; glucoamilases derivadas de cepas de Humicola ou variantes desta, particularmente H. grisea, tais como a glucoamilase tendo pelo menos 90%, 93%, 95%, 96%, 97%, 98% e 99% de identidade de sequência para SEQ ID NO: 3 revelada no WO 05/052148; glucoamilases derivadas de cepas de Talaromyces ou variantes desta, particularmente T. emersonii; glucoamilases derivadas de cepas de Athelia e particularmente A. rolfsii; glucoamilases derivada de cepas de Pe- nicillium, particularmente P. chrysogenum.
Em particular, as variantes de glucomilase podem ser usadas para processos de conversão de amido e, e particularmente na produção de dextrose para xaropes de frutose, açúcares especialmente e em álcool (por exemplo, etanol e butanol) e outra produção de produto final (por exemplo, ácido orgânico, ácido ascórbico, e aminoácidos) de fermentação de substratos contendo amido (G.M.A van Beynum et al., Eds. (1985) STARCH CONVERSION TECHNOLOGY, Marcel Dekker Inc. NY). Dextrins produzidas u- sando-se composições de variante de glucoamilase da invenção podem resultar em rendimentos de glicose de pelo menos 80%, pelo menos 85%, pelo menos 90% e pelo menos 95%. A produção de álcool a partir da fermentação de substratos de amido usando-se glucoamilases envolvidas pela invenção pode incluir a produção de álcool combustível ou álcool bebível. Em algumas concretizações, a produção de álcool será maior quando a variante de glucoamilase é usada sob as mesmas condições como a glucoamilase de origem. Em algumas concretizações, a produção de álcool será entre cerca de 0,5% e 2,5% maior, incluindo, mas não limitada a, 0,6%, 0,7%, 0,8%, 0,9%, 1,0%, 1,1%, 1,2%, 1,3%, 1,4%, 1,5%, 1,6%, 1,7%, 1,8%, 1,9%, 2,0%, 2,1%, 2,2%, 2,3%, e 2,4% mais álcool do que a glucoamilase de origem.
Em algumas concretizações, as glucoamilases variantes da in-venção encontrarão uso na hidrólise de amido de vários substratos basea-dos em planta, que são usados para produção de álcool. Em algumas con-cretizações, os substratos baseados em planta incluirão milho, trigo, cevada, centeio, milho, arroz, cana-de-açúcar, batatas e combinações destes. Em algumas concretizações, o substrato baseado em planta será material de planta fracionado, por exemplo, um grão de cereal tal como milho, que é fracionado em componentes tais como fibra, germe, proteína e amido (endos- perma) (USP 6.254.914 e USP 6.899.910). Métodos de fermentações de álcool são descritos em THE ALCOHOL TEXTBOOK, A REFERENCE FOR THE BEVERAGE, FUEL E INDUSTRIAL ALCOHOL INDUSTRIES, 3- Ed., Eds K.A. Jacques et al., 1999, Nottingham University Press, UK. Em certas concretizações, o álcool será etanol. Em particular, processos de produção de fermentação de álcool são caracterizados como processos de moagem úmida ou de moagem seca. Em algumas concretizações, a glucoamilase variante será usada em um processo de fermentação de moagem úmida e em outras concretizações a glucoamilase variante encontrará uso em um processo de moagem seca.
A moagem de grão seca envolve um número de etapas básicas, que geralmente incluem: moagem, cozimento, liquefação, sacarificação, fermentação e separação de líquido e sólido para produzir álcool e outros coprodutos. O material de planta e particularmente grãos de cereal totais, tal como milho, trigo ou centeio são moídos. Em alguns casos o grão pode ser primeiro fracionado em partes de componente. O material de planta moído pode ser moído para obter uma partícula mais grossa ou fina. O material de planta moído é misturado com líquido (por exemplo, água e/ou resíduos de grãos delgados) em um tanque de pasta fluida. A pasta fluida é submetida a altas temperaturas (por exemplo, 90°C a 105°C ou mais alta) em um coze- dor a jato junto com enzimas de liquefação (por exemplo, alfa amilases) para solubilizar e hidrolisar o amido no grão a dextrinas. A mistura é resfriada e adicionalmente tratada com enzimas de sacarificação, tais como glucoamilases envolvidas pela presente invenção, para produzir glicose. A glicose contendo mistura pode então ser fermentada por aproximadamente 24 a 120 horas na presença de micro-organismos de fermentação, tais como micro- organismo de produção de etanol e particularmente levedura (Saccharomy- ces spp). Os sólidos na mistura são separados a partir da fase líquida e álcool tal como etanol e coprodutos úteis tais como grãos de destiladores são obtidos.
Em algumas concretizações, a etapa de sacarificação e etapa de fermentação são combinadas e o processo é referido como sacarificação simultânea e fermentação ou sacarificação simultânea, propagação e fermentação de levedura.
Em outras concretizações, a glucoamilase variante de SBD é usada em um processo para hidrólise de amido no qual a temperatura do processo está entre 30°C e 75°C, em algumas concretizações, entre 40°C e 65°C. Em algumas concretizações, a glucoamilase variante é usada em um processo para hidrólise de amido a um pH de entre pH 3,0 e pH 6,5. Os pro-cessos de fermentação em algumas concretizações incluem moagem de um grão de cereal ou grão fracionado e combinação do grão de cereal moído com líquido para formar uma pasta fluida que é então misturada em um vaso simples com uma glucoamilase variante de acordo com a invenção e opcionalmente outras enzimas tais como, mas não limitadas a, alfa amilases, outras glucoamilases, fitases, proteases, pululanases, isoamilases ou outras enzimas tendo atividade de hidrolisação de amido granular e levedura para produzir etanol e outros coprodutos (Ver, por exemplo, USP 4.514.496, WO 04/081193 e WO 04/080923).
Em algumas concretizações, a invenção pertence a um método de sacarificação de uma solução de amido líquida que compreende uma e- tapa de sacarificação enzimática usando uma variante de glucoamilase da invenção.
A presente invenção também proporciona uma composição ou formulação de alimentação de animal compreendendo pelo menos uma vari-ante de glucoamilase envolvida pela invenção. Métodos de uso de uma en-zima de glucoamilase variante de SBD na produção de alimentações com-preendendo amido são providos no WO 03/049550 (aqui incorporado por referência em sua totalidade). Brevemente, a variante de glucoamilase de SBD é misturada com uma alimentação compreendendo amido. A variante de glucoamilase de SBD é capaz de degradar a resistência de amido para uso pelo animal. Outros objetivos e vantagens da presente invenção são aparen-tes do presente Relatório.
Na seção de descrição e experimental que se segue, as seguin-tes abreviações se aplicam: GA (glucoamilase); GAU (unidade de glucoami-lase); % em peso (percentagem por peso); °C (graus Centígrados); rpm (re-voluções por minuto); H20 (água); dH2O (água deionizada); dlH2O (água dei- onizada, Milli-Q filtração); aa ou AA (aminoácido); bp (par base; kb (par de kilobase; kD (kilodáltons); g ou gm (gramas); μg (microgramas); mg (mili-gramas); μL (microlitros); ml e mL (mililitros); mm (milímetros); μm (micrôme- tro); M (molar); mM (milimolar); μM (micromolar); U (unidades); V (volts); MW (peso molecular); seg(s) ou s(s) (segundo/segundos); min(s) ou m(s) (minu- to/minutos); hr(s) ou h(s) (hora/horas); DO (oxigênio dissolvido); ABS (Ab- sorvência); EtOH (etanol); PSS (solução de sal fisiológica); m/v (mas- sa/volume); e MTP (placa de microtitulação); N (Normal); DPI (monossacarf- deos); DP2 (dissacarideos); DP>3 (oligossacarfdeos, açúcares tendo um grau de polimerização maior do que 3); ppm (partes por milhão).
Ensaios e métodos usados nos exemplos abaixo são providos. Contudo, deve ser notado que métodos diferentes podem ser usados para proporcionar variantes de uma molécula de origem e a invenção não é limi-tada aos métodos usados nos exemplos. É pretendido que qualquer meio adequado para produção de variantes e seleção de variantes pode ser usa-do.
Ensaio de atividade de pNPG glucoamilase para placas de microtitulação de 96 poços: As soluções reagentes foram: tampão de NaAc (200 mM de tampão de acetato de sódio pH 4,5); Substrato (50 mM de p-nitrofenil-a-D- glucopiranosida (Sigma N-1377) em tampão de NaAc (0,3 g/20ml)) e solução de parada (800 mM de tampão de glicina-NaOH pH 10). 30 μl de sobrena- dante filtrado foi colocado em um MTP de fundo plano de 96 poços fresco. A cada poço 50 μl de tampão de NaAc e 120 μl de substrato foi adicionado e incubado por 30 minutos a 50°C (Thermolab systems iEMS Incubator/shaker HT). A reação foi terminada pela adição de 100 μl de solução de parada. A absorvência foi medida a 405 nm em uma MTP-leitora (Molecular Devices Spectramax 384 plus) e a atividade foi calculada usando-se um coeficiente de extinção molar de 0,011 μM/cm.
Ensaio de termoestabilidade: Sobrenadante bruto (8 μl) foi adicionado a 280 μl 50 mM de tampão de NaAc pH 4,5. A amostra diluída foi igualmente dividida em 2 MTPs. Uma MTP (placa inicial) foi incubada por 1 hora a 4°C e a outra MTP (placa residual) foi incubada a 64°C (Thermolab systems iEMS Incuba- tor/Shaker HT) por 1 hora. A placa residual foi resfriada por 10 min em gelo. A atividade foi medida de ambas as placas usando-se o ensaio de classificação de etanol descrito abaixo. 60 μl da placa inicial ou placa residual foi adi- cionado a 120 μl 4% de amido de milho solúvel e incubada por 2 horas a 32°C 900 rpm (Thermolabsystems iEMS Incubator/Shaker HT).
A termoestabilidade foi calculada como % de atividade residual conforme segue: O material sobrenadante bruto foi testado para glicose remanes-cente no meio de cultura após período de crescimento. A termoestabilidade não foi calculada se glicose remanescente foi encontrada no meio de cultura.
Baseado na atividade residual de WT e mutante, o índice de de-sempenho (PI) para a termoestabilidade foi calculado. O PI de uma variante é o quociente "Variante-atividade residual/WT-atividade residual." O PI de WT é 1,0 e uma variante com um Pl> 1,0 tem uma atividade específica que é maior do que WT.
Determinação de proteína Caliper Análise de dados e cálculo de índice de desempenho de ensaio de aplicação de etanol. Níveis de proteína foram medidos usando-se um instrumento de eletroforese microfluídico (Caliper Life Sciences, Hopkinton, MA, USA). O chip microfluídico e amostras de proteína foram preparados de acordo com as instruções do fabricante (LabChip® HT Proteína Express, P/N 760301). Os sobrenadantes de cultura foram preparados e armazenados em placas de microtitulação de 96 poços a -20°C até uso, quando elas foram descon-geladas por aquecimento em uma incubadora a 37°C por 30 minutos. Após agitação breve, 2 μl de cada amostra de cultura foi transferido para uma pla-ca de PCR de 96 poços (Bio-Rad, Hercules, CA,USA) contendo 7 μl de tam-pão de amostras (Caliper), seguido por aquecimento da placa a 90°C por 5 minutos em um aquecedor de placa termo estaticamente controlado. A placa foi permitida resfriar antes da adição de 40 μl de água a cada amostra. A placa foi colocada no instrumento junto com uma proteína padrão fornecida e calibrada pelo fabricante. À medida que a proteínas se move e passa de em um ponto focal no chip, o sinal de fluorescência foi registrado e a con- centração de proteína foi determinada por quantificação do sinal relativo ao sinal gerado pelo conjunto calibrado de padrões de proteína.
Após a determinação de proteína por Caliper, o dado foi processado do seguinte modo. As escadas de calibração foram verificadas para correção do modelo de pico. Se a escada de calibração que estava associada com o curso não satisfaz, ela foi substituída por uma escada de calibração de um curso adjacente. Para detecção de pico, os ajustes de falta pico global encontram opção do software de caliper foram usados. O pico de interesse foi selecionado a 75 kDA +/-10%.
O resultado foi exportado para um programa de folha de difusão e a área de pico estava relacionada à atividade 0 correspondente (medição de vazio de ABS340) no ensaio de aplicação de etanol.
Com a área e números de atividade de 12 amostras Tipo Selva-gem, uma linha de calibração foi feita usando-se a equação de "Cinéticas de Enzima" do programa Versão Grafit (Erithacus Software, Horley, UK) em combinação com uma função de ajuste não-linear. Os ajustes de falta foram usados para calcular os parâmetros de Km e Vmáx. Baseado nestes dois parâmetros, uma linha de referência de Michaelis-Menten foi feita e a ativi-dade específica de cada variante foi calculada baseada nesta linha de refe-rência.
Baseado na atividade específica de WT e variantes, o índice de desempenho (PI) para a atividade específica foi calculado. O PI de uma va-riante foi calculado como o quociente "Variante-atividade específica/WT- atividade específica". Usando-se este quociente, o PI de WT é 1,0 e uma variante com um PI > 1,0 tem uma atividade específica que é maior do que WT.
Ensaio de atividade de hexoquinase: Coquetel de hexoquinase: 10-15 minutos antes de uso, 90 ml de água foi adicionado a um recipiente BoatIL de glicose HK RI (kit de EL de teste de glicose (HK), Instrument Laboratory # 182507-40) e misturado bran-damente. 100 μl de coquetel de hexoquinase foi adicionado a 85 μl de dH2O. 15 μl de amostra foram adicionados às misturas e incubados por 10 minutos no escuro à temperatura ambiente. A absorvência foi lida a 340 nm em uma leitora MTP. As concentrações de glicose foram calculadas de a- cordo com a curva-padrão de glicose (0-2 mg/ml).
Condições de ensaio de ensaio de classificação de etanol: 8% de solução de estoque: 8 g de amido de milho solúvel (Sig-ma #S4180) foram suspensos em 40 ml de dH20 à temperatura ambiente. 50 ml de dH2O de ebulição foi adicionado à pasta fluida em um frasco de 250 ml e cozida por 5 minutos. A solução de amido foi resfriada a 25°C e o volume ajustado a 100 ml com dH2O.
Solução de parada: 800 mM de tampão de Glicina-NaOH, pH 10. 4% (m/v) de solução de operação de amido solúvel: solução de estoque foi diluída (1:1) com 100 mM de tampão de acetato de sódio pH 3.7.
5 μl de sobrenadante bruto foi diluído com 175 μl de 50 mM de tampão de NaAc pH 4,5 em uma MTP de 96 poços de fundo plano. 60 μl desta diluição foi adicionado a 120 μl de 4% de amido de milho solúvel e incubado por 2 horas a 32°C 900 rpm (Thermolabsystems iEMS Incuba- tor/Shaker HT). A reação foi cessada por adição de 90 μl 4°C-de Solução de Parada fria. A amostra foi colocada no gelo. O amido foi centrifugado a 1118xg a 15°C por 5 minutos (SIGMA 6K15) e 15 μl de sobrenadante foi u- sado no ensaio de atividade de Hexoquinase descrito acima para determinar o teor de glicose.
O material de sobrenadante bruto foi testado para glicose rema-nescente no meio de cultura após o período de crescimento. A quantidade de glicose produzida pela glucoamilase não foi calculada se glicose rema-nescente foi encontrada no meio de cultura.
Os seguintes exemplos são providos de modo a demonstrar e i- lustrar adicionalmente certas concretizações e aspectos da presente inven-ção e não são para serem construídos como limitando o escopo desta. Exemplo 1
Construção de bibliotecas de avaliação de local de TrGA (SELs) no vetor pTTT para expressão em Tríchoderma reesei Uma sequência de cDNA de Tríchoderma reesei (SEQ ID NO: 4) foi clonada em pDONR®201 via a reação de recombinação de Gateway® BP (Invitrogen, Carlsbad, CA, USA) resultando no vetor de entrada pDONR- TrGA (Figura 2). A sequência de cDNA (SEQ ID NO: 4) codifica o peptídeo de sinal de TrGA, a pró-sequência, e a proteína madura, incluindo o domínio catalítico, região ligadora e domínio de ligação de amido (SEQ ID NO: I). SEQ ID NO: 4 e SEQ ID NO: 1 são mostradas na Figura IB e 1 A. A Figura 1C ilustra o precursor e domínios de TrGA de proteína madura.
Para expressar a proteína de TrGA em Tríchoderma reesei, a sequência de codificação de TrGA (SEQ ID NO: 4) foi clonada no vetor de destinação compatível Gateway pTTT-Dest (Figura 3) via a reação de re-combinação GATEWAY® LR. O vetor de expressão continha um promoter derivado de T. reesei cbhl e regiões terminadoras que permitem expressão induzível forte de um gene de interesse. O vetor também contém o marcador seletivo de Aspergillus nidulans amdS que permite crescimento dos trans- formantes na acetamida como uma fonte de nitrogênio somente. O vetor de expressão também contém regiões de T. reesei telomere que permitem ma-nutenção de plasmídeo não-cromossomal em uma célula fungai. Na destina-ção de pTTT-Dest plasmídeo, o promotor cbhl e regiões terminadoras foram separadas pelo gene de resistência de cloranfecicol, CmR, e o gene letal E. coli, ccdB, flanqueado pelos locais de recombinação baseados em bacterió- fago lambda attRI, attR2. Esta configuração permite seleção direta de re- combinantes contendo o gene TrGA sob controle dos elementos regulatórios cbhl na orientação correta via a reação de recombinação GATEWAY® LR. O vetor de expressão final pTTT-TrGA é mostrado na Figura 4.
TrGA SELs foram construídos usando-se o vetor de entrada pDONR-TrGA (Figura 2) como um gabarito e os iniciadores listados na Ta-bela 1. Todos os iniciadores usados nos experimentos de mutagênese conti-dos no trio NNS (N= A,C,T,G e S=C ou G) na posição que se alinha com o códon da sequência de TrGA designada para ser mudada (SEQ ID NO: 1), permitindo uma incorporação aleatória de nucleotídeos na posição pré- selecionada. A construção de cada SEL se inicia com duas amplificações de PCR independentes no vetor de entrada pDONR-TrGA: um usando o Gateway F (pDONR201 - FW) e um iniciador de mutagênese específica R (Tabela 2), e o outro - o iniciador Gateway R (pDONR201 - RV) e um iniciador de mutagênese específico F (Tabela 2). Polimerase de DNA PHUSION de alta fidelidade (Finnzymes OY, Espoo, Finland) foi usada em uma reação de amplificação de PCR incluindo 0,2 μM de iniciadores. As reações foram efetuadas por 25 ciclos de acordo com o protocolo provido por Finnzymes. Alíquotas de 1 μl de fragmentos de PCR obtidos foram usadas como gabaritos para uma reação de PCR de fusão subsequente junto com os iniciadores de Gateway FW e Gateway RV (Invitrogen). Esta amplificação de PCR, após 22 ciclos, produziram uma população dos fragmentos de DNA de TrGA linear de comprimento total aleatoriamente mudados na posição de códon específica. Os fragmentos foram flanqueados pelos locais de recombinação Gate- way-específico attLI, attl_2 em ambas as extremidades. Os fragmentos de DNA foram purificados com um kit de limpeza CHARGESWITCH® PCR (Invitrogen, Carlsbad USA) e então recombinado com 100 ng do vetor de desti- nação pTTT (Figura 3) usando a mistura de enzima LR CLONASE® II de a- cordo com o protocolo fornecido por Invitrogen. Os produtos de recombinação que foram gerados transformados em E.coli Max Efficiency DH5a, conforme descrito pelo fornecedor (Invitrogen). Os construtos de expressão final pTTT-TrGA com mutações na posição desejada foram selecionados por colocação de bactéria em placas de Ágar 2xYT (16 g/L Bacto Tryptone (Difco), 10 g/L de Bacto Yeast Extract (Difco), 5 g/L de NaCl, 16 g/L de Bacto Agar (Difco)) com I00 μ/ml de ampicilina.
96 colônias simples de cada biblioteca foram crescidas por 24 horas a 37°C em MTP contendo 200 μL de meio 2xYT com 100 μg/ml de ampicilina. As culturas foram usadas diretamente para amplificar fragmentos de PCR que envolvem a região onde uma mutação específica foi introduzi-da. Os produtos de PCR específicos obtidos foram sequenciados usando-se um analisador de sequência ABI3100 (Applied Biosystems). Cada biblioteca contém de 15 a 19 variantes de TrGA diferentes no vetor de expressão final.
Estas variantes foram individualmente transformadas em T. reesei, conforme descrito abaixo. As bibliotecas são numeradas de 1 a 182 que referenciam o resíduo de aminoácido específico na sequência de TrGA que foi aleatoria-mente mudado. Tabela 2 - Iniciadores usados para gerar TrGA SELs F = Avanço; R = Reverso
Os SELs foram transformados em T. reesei usando o método de PEG-protoplasto (Ver, por exemplo, Pentilla et al. (1987) Gene 61:155-164). Os clones de E.coli dos SMM's confirmados por análise de sequência foram crescidos durante a noite a 37°C em placas de microtitulação de poço profunda (Greiner Art. N2 780271) contendo 1,200 μl de meio de 2xYT com am- picilina (100 μg/ml) e canamicina (50 μg/ml). Os DNAs de plasm ideo foram isolados das culturas usando Mini Kit CHEMAGIC® Plasmid (Chemagen - Biopolymer Technologie AG, Baesweiler, Germany) e foram transformados individualmente em uma cepa de hospedeiro de T. reesei derivada de RL- P37 suportando quatro anulações de gene, Acbh2, Aegll, Aeg12, isto é, "quad-anulado"; ver USP 5.847.276, WO 92/06184 e WO 05/001036) usando o método de PEG-Protoplasto com as seguintes modificações. 1) Para preparação de protoplasto, esporos foram crescidos por 16-24 horas a 24°C em Meio Mínimo de Trichoderma (MM) (20g/L de glicose, 15g/L de KH2PO4, pH 4,5, 5g/L de (NH4)2SO4, 0,6g/L de MgS04x7H2O, 0,6 g/L de CaCI2x2H2O, 1 ml de 1000X solução de elementos de Traço de T. reesei {5 g/L de Fe- SO4X7H2O, 1,4 g/L de ZnSO4x7H20, 1,6 g/L de MnSO4xH2O, 3,7 g/L de Co- CI2X6H2O }) com sacudimento a 150 rpm. As germinações de esporos foram coletadas por centrifugação e tratadas com 15mg/ml de solução de β-D- glucanase-G (Interspex -Art.No. 0439-1) para lisar as paredes de célula fungais. Preparação adicional de protoplastos foi realizada por um método padrão, conforme descrito por Penttila et al. (1987 supra). 2) O método de transformação foi escalado 10 vezes. Em geral, misturas de transformação contendo até 600 ng de DNA e l-5x 105 protoplastos em um volume total de 25 μl foram tratadas com 200 ml de 25% de solução de PEG, diluídas com 2 volumes de 1,2 M de solução de sorbitol, misturadas com 3% de agarose de topo seletiva MM com acetamida (o mesmo Meio Mínimo conforme mencionado acima, mas (NrLi)2SO4 foi substituído com 20 mM de acetamida) e derramado em 2% de agarose seletiva com acetamida ou em 24 placas de mi- crotitulação de poço ou em uma Q-bandeja de 20x20 cm em 48 poços. As placas foram incubadas a 28°C por 5 a 8 dias. Os esporos a partir da população total de transformantes regenerados em cada poço individual foram coletados a partir das placas usando-se uma solução de 0,85% de NaCl, 0,015% de Tween 80. Suspensões de esporo foram usadas para inocular fermentações em MTPs de 96 poços. No caso de MTPs de 24 poços, uma etapa de colocação adicional em uma MTP de 24 poços fresca com MM de acetamida seletiva foi introduzida de modo a enriquecer os números de esporo. Exemplo 3 Fermentação de transformantes de T. reesei expressando variantes de TrGA em um formato de MTP
Os transformantes foram fermentados em placas de filtro de mi- crotitulação e os sobrenadantes de cultura contendo as variantes de proteína expressas de TrGA obtidas foram usados para ensaios. Brevemente, placas de filtro de 96 poços (Corning Art. N2 3505) contendo 200 μl de meio de LD- GSM (5,0 g/L (NH,)2SO4, 33 g/L de 1,4-Piperazina bis(ácido propanossulfô- nico), pH 5,5, 9,0 g/L de Casaminoácidos, 1,0 g/L de KH2PO4, 1,0 g/L de CaCI2x2H2O, 1,0 g/L de MgSO4x7H2O, 2,5 ml/L de 1000X de elementos de traço de T.reesei, 20 g/L de Glicose, 10 g/L de Sophorose) foram inoculados em quadruplicata com suspensões de esporo de transformantes de T. reesei expressando variantes de TrGA (mais do que 104 esporos por poço). As placas foram incubadas a 28°C com 230 rpm de sacudimento e 80% de umidade por 6 dias. Os sobrenadantes de cultura foram coletados por filtração a vácuo. Os sobrenadantes foram usados em ensaios diferentes para classificação de variantes com propriedades aperfeiçoadas.
Exemplo 4 Preparação das amostras de caldo totais de transformantes de produção de GA
Transformantes de produção de TrGA foram inicialmente pré- crescidas em frascos de sacudir de 250 ml contendo 30 ml de meio de Pro- flo. O meio de Proflo contém: 30 g/L de α-lactose, 6,5 g/L de (NH4SO4, 2 g/L de KH2PO4J 0,3 g/L de MgS04x7H2O, 0,2 g/L de CaCI2 x2H2O, 1 ml/L de 1000X de solução de sal de elemento de traço conforme mencionado acima, 2 ml/L de 10% de Tween 80, 22,5 g/L de farinha de semente de algodão ProFIo (Traders protein, Memphis, TN), 0,72 g/L de CaCO3. Após dois dias de crescimento a 28°C e 140 rpm, 10% da cultura de Proflo foi transferida em um frasco de sacudir de 250 ml contendo 30 ml de Meio Definido de Lactose. A composição do Meio definido de Lactose era conforme segue: 5 g/L de (NH4)2SO4, 33 g/L de tampão de 1,4-Piperazinobis (ácido propanossulfô- nico), pH 5,5, 9 g/L de casaminoácidos, 4,5 g/L de KH2P04, 1,0 g/L de MgSO^HA 5 ml/L de anti-espuma Mazu DF60-P (Mazur Chemicals, IL), 1ml/L de 1000X de solução de elemento de traço. 40 ml/L de 40% (w/v) de solução de lactose foi adicionada ao meio após esterilização. Flocos de sacudir com p meio Definido de Lactose foram incubados a 28°C, 140 rpm por 4 - 5 dias.
Micélia foi removida das amostras de cultura por centrifugação e o sobrenadante foi analisado para teor de proteína total (Kit de Ensaio de Proteína BCA, Pierce Cat. N2 23225) e atividade de GA, conforme descrito acima na seção Experimental.
O perfil de proteína das amostras de caldo totais foi determinado por eletroforese de SDS PAGE. As amostras do sobrenadante de cultura foram misturadas com um volume igual de 2X tampão de carregamento de amostra com agente de redução e separadas em NUPAGE® Novex 10% Bis- Tris Gel com Tampão de Operação de MES SDS (Invitrogen, Carlsbad, CA, USA). Faixas de polipeptídeo foram visualizadas mo gel de SDS com SIM- PLYBLUE SafeStain (Invitrogen, Carlsbad, CA, USA).
Exemplo 5: Variantes com estabilidade térmica aperfeiçoada A molécula de TrGA de origem tinha uma atividade residual entre 15 e 44 % (variação dia a dia) sob as condições descritas. O índice de desempenho foi calculado baseado na termoestabilidade de WT TrGA da mesma batelada. Os índices de desempenho são os quocientes PI = (Variante atividade residual)/(WT TrGA atividade residual). Usando-se este quociente, um índice de desempenho >1 indica uma estabilidade aperfeiçoada. As variantes que tinham um índice de desempenho de estabilidade térmica 5 de mais do que 1,0 são mostradas na seguinte Tabela 3. Tabela 3 - Classificação de estabilidade térmica
A Tabela 3 inclui aquelas variantes que, quando testadas, mos-tram um índice de desempenho aumentado sobre a glucoamilase de origem. Estas incluem os seguintes locais: 10,42, 59, 60, 61, 68, 72, 73, 97, 98, 99, 102, 114, 133, 140, 144, 147, 152, 153, 164, 182, 204, 205, 214, 216, 228, 229, 230, 231, 236, 241, 242, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 311, 338, 342, 344, 346, 349, 359, 361, 364, 375, 379, 382, 390, 391, 393, 394, 410, 417, 430, 431, 433, 436, 442, 443, 444, 448, e 451. Os locais com substituições mostrando o aumento mais alto incluem: T10S, T42V, E68C, E68M, G73F, G73W, K114M, K114T, U33V, N153A, N153S, 10 N153V, W228V, V229I, V229L, S231V, D236R, L264D, S291M, S291T, A301P, A301R, S344M, S344P, S344Q, S344V, G361D, G361E, G361F, G361I, G361L, G361M, G361P, G361S, G361W, G361Y, A364D, A364E, A364F, A364G, A364K, A364L, A354R, A364S, A364V, A364W, T375N, R433C, R433G, R433N, R433S, R433V, e I436H.
Example 6: Variantes com atividade específica aperfeiçoada (SA) em ensaio de classificação de etanol Variantes foram testadas em um ensaio de classificação de eta-nol usando-se os ensaios descritos acima. A Tabela 3 mostra os resultados do ensaio de classificação para variantes com um índice de desempenho (PI) > 1,0 comparado ao TrGA PI de origem. O PI da atividade específica é o 5 quociente "Variante-atividade específica/WT-atividade específica". Usando- se isto, o PI da atividade específica para o TrGA tipo selvagem é 1,0 e uma variante com um PI > 1.0 tem uma atividade específica maior do que o TrGA de origem. A atividade específica foi determinada neste exemplo como a atividade medida pelo ensaio de classificação de etanol dividido pelos resul- 10 tados obtidos no ensaio de Caliper descrito acima. Tabela 4 - Classificação de Etanol
A Tabela 4 proporciona as variantes tendo um índice de desem-penho de pelo menos 1.0. Estas incluem os seguintes locais: 10, 14,15,23,59,60,61,65,67,68,72,73,97,98,99, 102, 110, 113, 133, 140, 144, 145, 147, 152, 153, 164, 182, 204, 205, 214, 216, 219, 228, 229, 230, 231, 5 236, 239, 241, 242, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 311, 338, 342, 344, 346, 349, 359, 361, 364, 375, 379, 382, 390, 391, 393, 394, 410, 417, 418, 430, 431, 433, 442, 444, 448, e 451. Os locais mostran do a atividade específica mais alta (tendo um índice de desempenho acima de 1,2) incluem: 61, 67, 72, 97, 102, 133, 145, 153, 205, 219, 228, 230, 231, 10 239, 263, 268, 291,311,342, 394, 430, 431 e 451.
Exemplo 7: Atividade específica combinada e variantes de termoestabilidade A Tabela 5 mostra as variantes que tinham um índice de desempenho (PI) de 1,0 ou melhor conforme comparado a origem de ambas pro-priedades: atividade específica e termoestabilidade. Estas incluem os se- 15 guintes locais: 10, 15, 59, 61, 68, 72, 73, 97, 99, 102, 133, 140, 153, 182, 204, 205, 214, 228, 229, 230, 231, 236, 241, 242, 264, 265, 268, 275, 284, 291, 300, 301, 303, 311, 338, 344, 346, 359, 361, 364, 375, 370, 382, 391, 393, 394, 410, 417, 430, 431, 433, 444, 448, θ 451. Os locais mostrando a atividade específica e termoestabilidade mais altas combinadas incluem: 5 228, 230, 231,268, 291,417, 433, e 451. Tabela 5: Variantes Combinadas
A estrutura tridimensional complete de Trichoderma reesei (Hy- pocrea jecorina) glucoamilase (TrGA) foi determinada a 1,9 A de resolução. A Tabela 8 mostra as coordenadas para a estrutura de cristal de Trichoderma glucoamilase. TrGA foi cristalizado em uma forma intacta contendo 599 resíduos e todas as modificações pós-translacional que normalmente ocorreria no hospedeiro natural. A estrutura de cristal foi produzida e analisada conforme segue:
Expressão e purificação de proteína - O gene que codifica H. je-corina GA foi clonado e expresso de acordo com os protocolos descritos na publicação de pedido de patente U.S. No.: US 2006/0094080 Al, Dunn- Coleman et al. May 4, 2006.
O material de proteína de TrGA usado para todos os experimentos de cristalização foi inicialmente purificado em uma etapa por cromatogra- fia de troca de ânion conforme segue: sobrenadantes de cultura concentrados de TrGA expresso, consistindo em 180 mg/ml de proteína total, foram preparados por diluição de amostra 1:10 em um 25 mM de Tris-HCI, pH 8,0 tampão. Uma coluna HIPREP 16/10 Q Sepharose FF (GE Helthcare) foi empregada para a purificação de troca de ânion. A coluna HIPREP foi equilibrada com 4 volumes de coluna (CV) partindo-se de tampão (25 mM de Tris- HCI, pH 8,0), seguido por aplicação de 10 ml da amostra de proteína diluída. Um gradiente linear de 8 CV de 0 a 140 mM de NaCl no tampão de operação (25 mM de Tris-HCI, pH 8,0) foi aplicado para eluir proteína ligada.
TrGA ligado eluído a partir da coluna HIPREP Q sepharose a uma concentração de sal de aproximadamente 80 mM de NaCl. Frações contendo proteína de TrGA pura foram reunidas e concentradas a 50 mg/ml usando-se um tubo de concentração centrífugo de 25 ml VIVASPIN (Viva Science) com um corte de peso molecular (MWCO) de 10 kD. Material de
TrGA purificado e concentrado foi trocado com tampão usando uma coluna de desalgação DG-10 (Bio-Rad) equilibrada com 50 mM de tampão de acetato de sódio, pH 4,3. Concentrações de proteína foram determinadas por medição da absorvência a 280 nm. O estoque de proteína de TrGA inicialmente purificado e concentrado foi armazenado a -20°C.
Duas etapas de purificação adicionais, uma purificação de troca de ânion adicional, e uma purificação de exclusão de tamanho, foram introduzidas para aumentar a propensidade de material de proteína de TrGA a formar cristais. Estas duas etapas de purificação adicionais foram realizadas conforme segue: Na primeira etapa de purificação de troca de ânion, uma coluna de 10 ml MONOQ (GE Helthcare) foi empregada. Uma amostra de 1 ml do material de TrGA inicialmente purificado e congelado (50 mg de proteína) foi descongelada e o tampão foi mudado para 20 mM de Tris-HCI, pH 8,0, por diluição repetida da amostra a 6 ml no novo tampão, seguido por uma concentração da amostra novamente a 0,5 ml usando-se 6 ml 5 kD de tubo de concentração de MWCO. A amostra de TrGA foi diluída após a última etapa de concentração em água destilada até que uma condutividade da amostra de proteína foi alcançada que corresponde a condutividade do tampão de partida da purificação de ânion, isto é, 25 mM de Tris-HCI, pH 8,0. A coluna MONOQ foi primeiro equilibrada com 4 volumes de coluna (CV) de tampão de partida, seguido por aplicação da amostra de proteína diluída para a coluna. A proteína ligada foi eluída a partir da coluna MONOQ por dois gradientes diferentes. Na primeiro, um gradiente de pH linear de 4 CV foi aplicado onde o pH do tampão de partida foi diminuído de 8,0 para 6,0. Na Segundo gradiente, um gradiente de sal longo de 8 CV foi aplicado em que a concentração de sal foi aumentada de 0 para 350 mM de NaCl no tampão de operação (25 mM de Tris-HCI, pH 6.0). TrGA ligado foi verificado eluir da coluna durante o segundo gradiente de sal a uma concentração aproximada de NaCl de 150 mM. Frações contendo TrGA foram reunidas e concentradas a 2 ml usando-se um tubo de concentração de 6 ml 5 kD MWCO VIVASPIN. A amostra de TrGA concentrada foi em seguida aplicada a uma coluna de exclusão de tamanho Superdex 200 16/60 (GE Helthcare) equilibrada com 4 CV de 20 mM de Tris-CI, pH 8,0, e 50 mM de NaCI, que também foi usada como tampão de operação. Frações a partir do pico de eluição principal após a purificação de exclusão de tamanho foram reunidas e concentradas a uma concentração de proteína aproximada de 7,5 mg/ml usando-se um tubo de concentração de 6 ml 5 kD MWCO VrVASPFN.
Cristalização de proteína - A amostra de proteína que foi usada para encontrar as condições de cristalização de TrGA iniciais foi uma amostra do material de TrGA que foi purificado uma vez por purificação de troca de ânion e em seguida armazenado a -20°C. A amostra de proteína de TrGA foi descongelada e diluída com 50 mM de tampão de acetato de sódio, pH 4,3, para aproximadamente 12 mg/ml, antes dos experimentos de cristalização inicial. O conjunto de dados de raio X ortorrômbico foi usado para dissolver a estrutura de TrGA por substituição molecular (MR), e o conjunto de dados ortorrômbico de alta resolução usado para o modelo de estrutura de TrGA de grupo de espaço ortorrômbico final. Os cristais de TrGA ortorrômbico foram verificados crescerem em solução consistindo de 25% de PEG 3350, 0,20M de acetato de amónia, 0,10M de Bis-Tris pH 5,5 (solução de reservatório), usando-se o método de difusão de vapor com gotas de suspensão (McPherson 1982), a 20° C. Gotas de cristalização foram preparadas por mistura de quantidades iguais de solução de proteína (12 mg/ml) e solução de reservatório a um volume final de 10 X. Os cristais de TrGA foram verificadas pertencerem ao grupo de espaço ortorrômbico P212121 com dimensões de célula aproximadas: a = 52,2 K,b = 99,2 A, c = 121,2 A, e têm um Vm calculado de 2,3 (Matthews 1968) com uma molécula na unidade assimétrica.
Cristalização de proteína - A amostra de proteína que foi usada para encontrar as condições de cristalização de TrGA iniciais foi uma amostra do material de TrGA que foi purificado uma vez por purificação de troca de ânion e em seguida armazenado a -20°C. A amostra de proteína de TrGA foi descongelada e diluída com 50 mM de tampão de acetato de sódio, pH 4,3, para aproximadamente 12 mg/ml, antes dos experimentos de cristalização inicial. O conjunto de dados de raio X ortorrômbico foi usado para dis- solver a estrutura de TrGA por substituição molecular (MR), e o conjunto de dados ortorrômbico de alta resolução usado para o modelo de estrutura de TrGA de grupo de espaço ortorrômbico final. Os cristais de TrGA ortorrômbico foram verificados crescerem em solução consistindo de 25% de PEG 3350, 0,20M de acetato de amónia, 0,10M de Bis-Tris pH 5,5 (solução de reservatório), usando-se o método de difusão de vapor com gotas de sus-pensão (McPherson 1982), a 20° C.
Gotas de cristalização foram preparadas por mistura de quanti-dades iguais de solução de proteína (12 mg/ml) e solução de reservatório a um volume final de 10 X. Os cristais de TrGA foram verificadas pertencerem ao grupo de espaço ortorrômbico P212121 com dimensões de célula apro-ximadas: a = 52,2 K,b = 99,2 A, c = 121,2 A, e têm um Vm calculado de 2,3 (Matthews 1968) com uma molécula na unidade assimétrica.
Coleta de dados de raio X - Os dois conjuntos de dados de TrGA ortorrômbicos foram coletados de cristais simples montados em tubos capila-res montados, à temperatura ambiente. O conjunto de dados de raios X de TrGA ortorrômbico de lo-resolução inicial, usado para dissolver a estrutura por métodos de substituição molecular (MR) foi coletado em uma fonte de raios X, um MSC/Rigaku (Molecular Structures Corp., The Woodlands, Texas) detector de placa de imagem Raxis IV++ com focalização de espelhos usando radiação Cu Ka de um gerador de anodo de rotação Rigaku RU200. Este conjunto de dados foi processado, escalado, e calculado a media usan- do-se o software d*trek provido por MSC/Rigaku. O conjunto de dados mo- nocíclico centrado foi coletado de um cristal de TrGA congelado simples a 100K, equilibrado em um agente crioprotetor compreendido de 25% de PEG 3350, 15% de Glicerol 50 mM de CaCI2 e 0,1 M de Bis-Tris pH 5,5 como crioprotetor, montado em circuitos fechados de fibra rayon, e imersão congelada em nitrogênio líquido antes do transporte para o sincrotron. O conjunto de dados (1.9 A) ortorrômbico de alta resolução e o conjunto de dados monocí- clicos cêntricos C (1.8 A) foram ambos coletados em uma fonte sincrotron, linha de feixe 911:5 a MAX LAB em Lund, Sweden. Ambos conjuntos de dados que foram coletados a uma fonte sincrotron foram processados com
MOSFLM, e escalados com programa SCALA incluído no pacote de programa CCP4 (Collaborative Computational Project Number 4 1994). Todo o processamento de dados subsequente foi realizado usando-se o pacote de programa CCP4 (Collaborative Computational Project Number 4 1994), a menos que de outro modo citado. Um conjunto de 5% das reflexões de cada conjunto de dados foi ajustado aparte e usado para monitoramento do R- livre (Bruger et al. (1992) 355: 472-475).
Solução de estrutura - A estrutura de TrGA foi inicialmente dis-solvida por MR com o programa de substituição automática MOLREP (Col-laborative Computational Project Number 4 1994), incluído no pacote de programa CCP4, usando o conjunto de dados ortorrômbico de lo-resolução inicial, e usando as coordenadas de Aspergillus awamori GA (AaGA) variante XI00 (pdb entrada 1GLM (Aleshin et al. (1994) JMo/ Biol 238: 575-591) como modelo de pesquisa. O modelo de pesquisa de A. awamori GA foi editado para remover todas as porções de glicosilação fixadas à molécula de proteína como N- e O-glicosilações, e todas as moléculas de solvente antes de efetuar os experimentos de MR. Todas as reflexões entre 36,8 e 2,8 A de resolução, a partir do conjunto de dados de TrGA de resolução baixa inicial, foram usadas para a solução de MR. O programa de MR encontrou uma solução de função de rotação simples, com um máximo de 11,1 do antecedente acima, a próxima máxima mais alta foi 3,8a acima do antecedente. A solução de função de translação deu um fator R de 48,7% e tinha um fator de contraste de 17,4. A solução de MR foi refinada para 10 ciclos de refine de mínimo quadrado restrito usando o programa Refmac 5.0 (Murshudov et al. (1997) Ada Crystallogr., D53: 240-255). Isto abaixou o fator-R cristalográfico para 31,1%, enquanto que o valor R-livre caiu de 42,2% para 41,1%.
A resolução do modelo de estrutura de TrGA inicial foi prolongada para a resolução do conjunto de dados ortorrômbico de alta resolução (1.9A) por refino do modelo de estrutura de TrGA inicial contra o conjunto de dados de alta resolução para 10 ciclos de refino restrito usando o programa Refmac 5.0. Muitas moléculas de água nos modelos de estrutura foram localizados automaticamente pelo uso de protocolos de captação de água nos programas de refino, e então manualmente selecionados ou descartados por inspeção pelo olho. Todas as comparações estruturais foram feitas com ou Coot (Emsley et al., supra) ou O (Jones et &\.{\99\) Acta Crystallogr. A47: 110-119), e figuras foram preparadas com PyMOL (DeLano et al. (2002) O sistema de Gráficos PyMOL Molecular. Paio Alto, CA USA: DeLano Scientific).
A partir destes resultados, pode ser visto que o segmento de nú-cleo catalítico de TrGA seguiu a mesma topologia (a/a)5-barril descrita por Aleshin et al. {supra) para o AaGA, consistindo em um barril duplo de alfa helicoidais com o C-terminal da helicoidal externa conduzindo no N-terminal de uma helicoidal interna. Foi possível identificar diferenças-chaves na densidade de elétron tal como a ponte de disulfeto entre resíduos 19 e 26 e inserção ai (resíduos 257-260) relativo a AaGA. O segmento compreendendo 80-100 também suporta recomposição de modelo extensivo. Um local de glicosilação maior foi identificado em Asn 171, que tinha até quatro porções de glicoside fixadas. Um local de glicosilação similar foi identificado em AaGA. Adicionalmente, o núcleo catalítico contendo três cis-peptídeos entre resíduos 22-23, 44-45 e 122-123 foram conservados entre TrGA e AaGA. Além de tudo, existe uma variação rms de 0,535 A entre 409 fora de 453 átomos de Ca quando comparando as coordenadas dos núcleos catalíticos de TrGA e AaGA.
A estrutura de cristal do TrGA identificado no Exemplo 11 foi su-perposta na estrutura de cristal previamente identificada do Aspergillus a- wamori GA (AaGA). A estrutura de cristal de AaGA foi obtida a partir da base de dados de proteína (PDB) e a forma de AaGa que foi cristalizada foi a forma contendo somente um domínio catalítico. A estrutura do Trichoderma reesei glucoamilase com todas as três regiões intactas foi determinada para resolução de 1,8 Angstrom aqui (ver Tabela 6 e Exemplo 8). Usando-se as coordenadas (ver Tabela 6), a estrutura foi alinhada com as coordenadas do domínio catalítico de cepa de Aspergillus awamori XI00 que foi determinada previamente (Aleshin, (1994) J Mol Biol 238:575-591 e PDB). Conforme vis- to nas Figuras 6 e 7, a estrutura do domínio catalítico sobrepõe muito proxi-mamente e permite a identificação de resíduos equivalentes baseados nesta superposição estrutural.
Baseado nesta análise, os locais foram identificados que Baseado nesta análise, os locais foram identificados que podem ser mudados no domínio catalítico de TrGA e resultam em estabilidade aumentada e/ou ativi-dade específica. Estes locais incluem 108, 124, 175 e 316 no local ativo. Também identificados foram variantes de pares específicas Y47W/Y315F e Y47F/Y315W. Outros locais identificados foram 143, D44, P45, D46, R122, R125, V181, E242, Y310, D313, V314, N317, R408, e N409. Devido a alta homologia estrutural é esperado que variantes benéficas encontradas em locais em Tríchoderma reesei GA teria consequências similares em Aspergillus awamori e outras glucoamilases homólogas.
Baseado nesta análise, os locais foram identificados que podem ser mudados no domínio catalítico de TrGA e resultam em estabilidade au-mentada e/ou atividade específica. Estes locais incluem 108, 124, 175 e 316 no local ativo. Também identificados foram variantes de pares específicas Y47W/Y315F e Y47F/Y315W. Outros locais identificados foram 143, D44, P45, D46, R122, R125, V181, E242, Y310, D313, V314, N317, R408, e N409. Devido a alta homologia estrutural é esperado que variantes benéficas encontradas em locais em Tríchoderma reesei GA teria consequências similares em Aspergillus awamori e outras glucoamilases homólogas.
Várias modificações e variações dos métodos e sistema descritos da invenção serão aparentes àqueles versados na técnica sem fugir do escopo e espírito da invenção. Embora a invenção tenha sido descrita em conjunto com concretizações preferidas específicas, deve ser compreendido que a invenção conforme reivindicada não deve ser indevidamente limitada a tais concretizações específicas. De fato, várias modificações dos modos descritos para efetuar a invenção que são técnicas óbvias são pretendidas estarem dentro do escopo das reivindicações que se seguem. Tabela 6
Claims (11)
1. Variante de glucoamilase, caracterizada pelo fato de que compreende a sequência de aminoácidos de SEQ ID NO: 2 e uma, duas três ou quatro substituições, em que as referidas substituições compreendem uma substituição selecionada a partir do grupo consistindo em T430A, T430E, T430F, T430G, T430H, T430I, T430K, T430M, T430N, T430Q, T430R e T430V.
2. Variante de glucoamilase de acordo com a reivindicação 1, caracterizada pelo fato de que as substituições adicionais são selecionadas a partir de substituições em uma posição correspondendo à posição 10, 14, 15, 23, 42, 45, 59, 60, 61,67, 68, 72, 73, 97, 98, 99, 102, 110, 113, 114, 122, 124, 125, 133, 140, 144, 145, 147, 152, 153, 164, 182, 204, 205, 214, 216, 219, 228, 229, 230, 231, 236, 239, 241, 242, 263, 264, 265, 268, 269, 276, 284, 291, 300, 301, 303, 311, 313, 316, 338, 342, 344, 346, 349, 359, 361, 364, 379, 382, 390, 391, 393, 394, 410, 415, 417, 418, 431, 433, 442, 443, 444, 448, e 451 de SEQ ID NO: 2.
3. Variante de glucoamilase de acordo com a reivindicação 1, caracterizado pelo fato de que tem atividade específica aumentada comparada à glucoamilase compreendendo SEQ ID NO: 2.
4. Variante de glucoamilase de acordo com a reivindicação 1, caracterizado pelo fato de que tem termo estabilidade aumentada comparada à glucoamilase compreendendo SEQ ID NO: 2.
5. Variante de glucoamilase de acordo com a reivindicação 1, caracterizado pelo fato de que tem atividade específica aumentada e termo estabilidade aumentada comparadas à glucoamilase compreendendo SEQ ID NO: 2.
6. Micro-organismo transgênico, caracterizado pelo fato de que expressa uma variante de glucoamilase como definida em qualquer uma das reivindicações 1 a 5.
7. Composição de enzima, caracterizada pelo fato de que compreende a variante de glucoamilase como definida na reivindicação 1.
8. Composição de enzima de acordo com a reivindicação 7, ca- racterizada pelo fato de que é adequada para uso em um processo de conversão de amido, uma composição de alimentação animal, ou um processo de fermentação de um substrato contendo amido.
9. Composição de enzima de acordo com a reivindicação 8, ca- 5 racterizada pelo fato de que compreende ainda uma alfa amilase.
10. Método de produção de uma variante de glucoamilase em uma célula hospedeira, caracterizado pelo fato de que compreende a cultura de um micro-organismo transgênico como definido na reivindicação 6 sob condições adequadas para a expressão e produção de referida variante de 10 glucoamilase e produção da referida variante.
11. Método de acordo com a reivindicação 10, caracterizado pelo fato de que compreende ainda recuperar a variante de glucoamilase de referida cultura.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2007/021683 WO2008045489A2 (en) | 2006-10-10 | 2007-10-09 | Glucoamylase variants with altered properties |
USPCT/US2007/021683 | 2007-10-09 | ||
PCT/US2008/004574 WO2009048488A1 (en) | 2007-10-09 | 2008-04-08 | Glucoamylase variants with altered properties |
Publications (2)
Publication Number | Publication Date |
---|---|
BRPI0817853A2 BRPI0817853A2 (pt) | 2014-10-14 |
BRPI0817853B1 true BRPI0817853B1 (pt) | 2022-05-10 |
Family
ID=39720559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0817853-4A BRPI0817853B1 (pt) | 2007-10-09 | 2008-04-08 | Variantes de glucoamilase com propriedades alteradas, método de produção das mesmas, composição de enzima e microorganismo transgênico |
Country Status (9)
Country | Link |
---|---|
EP (6) | EP2514818B1 (pt) |
JP (2) | JP5463292B2 (pt) |
CN (1) | CN102776164B (pt) |
BR (1) | BRPI0817853B1 (pt) |
CA (5) | CA2948231C (pt) |
DK (3) | DK2481796T3 (pt) |
ES (4) | ES2502743T3 (pt) |
PL (4) | PL2479265T3 (pt) |
WO (2) | WO2009048487A1 (pt) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120062643A (ko) | 2009-06-03 | 2012-06-14 | 다니스코 유에스 인크. | 향상된 발현, 활성 및/또는 안정성을 갖는 셀룰라아제 변이체, 및 이의 용도 |
WO2011022465A1 (en) * | 2009-08-19 | 2011-02-24 | Danisco Us Inc. | Combinatorial variants of glucoamylase with improved specific activity and/or thermostability |
CA2770607C (en) * | 2009-08-19 | 2019-02-26 | Danisco A/S | Variants of glucoamylase |
DK2599863T3 (da) | 2009-11-20 | 2017-11-06 | Danisco Us Inc | Beta-glucosidasevarianter med forbedrede egenskaber |
ES2565060T3 (es) * | 2010-04-14 | 2016-03-31 | Novozymes A/S | Polipéptidos que tienen actividad de glucoamilasa y polinucleótidos que codifican los mismos |
CA2807558A1 (en) | 2010-08-06 | 2012-02-09 | Danisco Us Inc. | Production of isoprene under neutral ph conditions |
WO2012019159A1 (en) | 2010-08-06 | 2012-02-09 | Danisco Us Inc. | Neutral ph saccharification and fermentation |
SG192025A1 (en) | 2011-03-17 | 2013-08-30 | Danisco Us Inc | Glycosyl hydrolase enzymes and uses thereof for biomass hydrolysis |
WO2012149288A1 (en) | 2011-04-29 | 2012-11-01 | Danisco Us Inc. | Single ph process for starch liquefaction and saccharification for high-density glucose syrups |
EP2739742A1 (en) | 2011-08-05 | 2014-06-11 | Danisco US Inc. | PRODUCTION OF ISOPRENOIDS UNDER NEUTRAL pH CONDITIONS |
DK2884853T3 (da) * | 2012-08-14 | 2017-11-13 | Danisco Us Inc | Trichoderma reesei-glucoamylasevarianter, der er resistente over for oxideringsrelateret aktivitetstab og anvendelse deraf |
MX2015002099A (es) | 2012-08-22 | 2015-05-11 | Dupont Nutrition Biosci Aps | Variantes que tienen actividad glucoamilasa. |
CN102994476B (zh) * | 2012-11-27 | 2014-03-12 | 山东蔚蓝生物科技有限公司 | 一种糖化酶 |
EP2931887A1 (en) | 2012-12-12 | 2015-10-21 | Danisco US Inc. | Variants of cellobiohydrolases |
CA2893059A1 (en) | 2012-12-12 | 2014-06-19 | Danisco Us Inc. | Variants of cellobiohydrolases |
MX2015007225A (es) | 2012-12-12 | 2015-10-29 | Danisco Us Inc | Variantes de celobiohidrolasas. |
CN104870638A (zh) | 2012-12-12 | 2015-08-26 | 丹尼斯科美国公司 | 纤维二糖水解酶的变体 |
US20160122735A1 (en) | 2012-12-12 | 2016-05-05 | Danisco Us Inc. | Variants of cellobiohydrolases |
CN105121638A (zh) * | 2013-03-07 | 2015-12-02 | 诺维信公司 | 葡糖淀粉酶变体和编码它们的多核苷酸 |
AU2014296572A1 (en) | 2013-07-29 | 2016-02-18 | Danisco Us Inc. | Variant enzymes |
US10584323B2 (en) | 2013-12-04 | 2020-03-10 | Danisco Us Inc | Glucoamylase variants |
CA2937818C (en) | 2014-02-07 | 2023-08-01 | Novozymes A/S | Compositions for producing glucose syrups |
EP3227452A1 (en) | 2014-12-01 | 2017-10-11 | Novozymes A/S | Improved production of glucose syrups |
CN107429267B (zh) | 2014-12-19 | 2021-07-16 | 丹尼斯科美国公司 | 葡糖淀粉酶共混物 |
WO2018106656A1 (en) | 2016-12-06 | 2018-06-14 | Danisco Us Inc | Truncated lpmo enzymes and use thereof |
CZ308536B6 (cs) * | 2017-10-10 | 2020-11-11 | Fyzikální ústav AV ČR, v.v.i. | Luminofory na bázi Eu2+ a Eu2+/Ce3+ dopovaných granátů |
BR112022000351A2 (pt) | 2019-07-09 | 2022-05-10 | Dupont Nutrition Biosci Aps | Composições de enzima particuladas revestidas de gordura |
WO2021046073A1 (en) | 2019-09-05 | 2021-03-11 | Dupont Nutrition Biosciences Aps | Feed composition |
IL311750A (en) | 2021-09-27 | 2024-05-01 | Int N& H Denmark Aps | Feed additive preparations and methods of using them |
WO2023225510A1 (en) | 2022-05-17 | 2023-11-23 | Dupont Nutrition Biosciences Aps | Feed additive comprising enzyme combinations |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5534046A (en) | 1978-09-01 | 1980-03-10 | Cpc International Inc | Novel glucoamyrase having excellent heat resistance and production |
GB2089836B (en) | 1980-12-16 | 1984-06-20 | Suntory Ltd | Process for producing alcohol by fermentation without cooking |
US4794175A (en) | 1983-12-20 | 1988-12-27 | Cetus Corporation | Glucoamylase CDNA |
US4618579A (en) | 1984-09-28 | 1986-10-21 | Genencor, Inc. | Raw starch saccharification |
JPH0630586B2 (ja) | 1984-12-15 | 1994-04-27 | サントリー株式会社 | グルコアミラ−ゼ遺伝子 |
AU607398B2 (en) | 1985-08-29 | 1991-03-07 | Genencor Inc. | Heterologous polypeptides expressed in filamentous fungi, processes for making same, and vectors for making same |
US5024941A (en) | 1985-12-18 | 1991-06-18 | Biotechnica International, Inc. | Expression and secretion vector for yeast containing a glucoamylase signal sequence |
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
GB8610600D0 (en) | 1986-04-30 | 1986-06-04 | Novo Industri As | Transformation of trichoderma |
EP0316444B1 (en) | 1987-06-06 | 1995-08-02 | Omnigene Inc | Yeast expression vector |
US6803499B1 (en) | 1989-08-09 | 2004-10-12 | Dekalb Genetics Corporation | Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof |
US6777589B1 (en) | 1990-01-22 | 2004-08-17 | Dekalb Genetics Corporation | Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof |
US5290474A (en) | 1990-10-05 | 1994-03-01 | Genencor International, Inc. | Detergent composition for treating cotton-containing fabrics containing a surfactant and a cellulase composition containing endolucanase III from trichoderma ssp |
US5475101A (en) | 1990-10-05 | 1995-12-12 | Genencor International, Inc. | DNA sequence encoding endoglucanase III cellulase |
US5246853A (en) | 1990-10-05 | 1993-09-21 | Genencor International, Inc. | Method for treating cotton-containing fabric with a cellulase composition containing endoglucanase components and which composition is free of exo-cellobiohydrolase I |
ES2170748T3 (es) | 1990-10-05 | 2002-08-16 | Genencor Int | Procedimientos para el tratamiento de tejidos que contienen algodon con celulasa. |
ES2182818T5 (es) | 1990-12-10 | 2015-07-06 | Danisco Us Inc. | Sacarificación mejorada de celulosa por clonación y amplificación del gen de beta-glucosidasa de Trichoderma reesei |
US5861271A (en) | 1993-12-17 | 1999-01-19 | Fowler; Timothy | Cellulase enzymes and systems for their expressions |
EP1559776A3 (en) | 1994-06-30 | 2006-01-11 | Novozymes Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein |
US5744716A (en) | 1995-06-08 | 1998-04-28 | Scp Global Technologies, A Division Of Preco, Inc. | Fluid displacement level, density and concentration measurement system |
US6255084B1 (en) | 1997-11-26 | 2001-07-03 | Novozymes A/S | Thermostable glucoamylase |
WO1999028448A1 (en) * | 1997-11-26 | 1999-06-10 | Novo Nordisk A/S | Thermostable glucoamylase |
WO2000004136A1 (en) * | 1998-07-15 | 2000-01-27 | Novozymes A/S | Glucoamylase variants |
US6268328B1 (en) | 1998-12-18 | 2001-07-31 | Genencor International, Inc. | Variant EGIII-like cellulase compositions |
US6254914B1 (en) | 1999-07-02 | 2001-07-03 | The Board Of Trustees Of The University Of Illinois | Process for recovery of corn coarse fiber (pericarp) |
JP2003504046A (ja) * | 1999-07-09 | 2003-02-04 | ノボザイムス アクティーゼルスカブ | グルコアミラーゼ変異体 |
CA2418317A1 (en) | 2000-08-11 | 2002-02-21 | Genencor International, Inc. | Bacillus transformation, transformants and mutant libraries |
US6582914B1 (en) | 2000-10-26 | 2003-06-24 | Genencor International, Inc. | Method for generating a library of oligonucleotides comprising a controlled distribution of mutations |
US6309872B1 (en) * | 2000-11-01 | 2001-10-30 | Novozymes Biotech, Inc | Polypeptides having glucoamylase activity and nucleic acids encoding same |
EP1434861A2 (en) * | 2001-10-01 | 2004-07-07 | Novozymes A/S | Glucoamylase variants |
GB0129864D0 (en) | 2001-12-13 | 2002-02-06 | Danisco | Animal feed |
CN102277341B (zh) | 2003-03-10 | 2015-07-22 | 诺维信公司 | 酒精产品生产方法 |
CA2517920C (en) | 2003-03-10 | 2012-12-18 | Broin And Associates, Inc. | Method for producing ethanol using raw starch |
ES2340588T3 (es) | 2003-05-29 | 2010-06-07 | Genencor Int | Genes nuevos de trichoderma. |
US6899910B2 (en) | 2003-06-12 | 2005-05-31 | The United States Of America As Represented By The Secretary Of Agriculture | Processes for recovery of corn germ and optionally corn coarse fiber (pericarp) |
NZ526666A (en) | 2003-07-14 | 2004-11-26 | Propeller Jet Ltd | Impeller drive for a jet propulsion unit |
SI1685244T1 (sl) | 2003-11-21 | 2012-06-29 | Danisco Us Inc | Ekspresija encimov, ki hidrolizirajo zrnat škrob, v Trichodermi in postopek za proizvajanje glukoze iz zrnatih škrobnih substratov |
US9236043B2 (en) | 2004-04-02 | 2016-01-12 | Knfb Reader, Llc | Document mode processing for portable reading machine enabling document navigation |
WO2005118800A1 (en) | 2004-05-27 | 2005-12-15 | Genencor International, Inc. | Heterologous expression of an aspergillus kawachi acid-stable alpha amylase and applications in granular starch hydrolysis |
US7413887B2 (en) | 2004-05-27 | 2008-08-19 | Genecor International, Inc. | Trichoderma reesei glucoamylase and homologs thereof |
GB0423139D0 (en) | 2004-10-18 | 2004-11-17 | Danisco | Enzymes |
RU2394101C2 (ru) * | 2004-11-30 | 2010-07-10 | Джененкор Интернэшнл, Инк. | Глюкоамилаза trichoderma reesei и ее гомологи |
US20080280328A1 (en) * | 2005-11-18 | 2008-11-13 | Novozymes A/S | Glucoamylase Variants |
-
2008
- 2008-04-08 DK DK12157549.2T patent/DK2481796T3/da active
- 2008-04-08 DK DK12164776.2T patent/DK2479264T3/da active
- 2008-04-08 JP JP2010528856A patent/JP5463292B2/ja not_active Expired - Fee Related
- 2008-04-08 CN CN201210042998.2A patent/CN102776164B/zh active Active
- 2008-04-08 CA CA2948231A patent/CA2948231C/en active Active
- 2008-04-08 EP EP12169318.8A patent/EP2514818B1/en not_active Not-in-force
- 2008-04-08 EP EP08742678A patent/EP2195423A1/en not_active Withdrawn
- 2008-04-08 PL PL12164788T patent/PL2479265T3/pl unknown
- 2008-04-08 CA CA2702019A patent/CA2702019C/en active Active
- 2008-04-08 EP EP12164788.7A patent/EP2479265B1/en active Active
- 2008-04-08 ES ES12157549.2T patent/ES2502743T3/es active Active
- 2008-04-08 WO PCT/US2008/004556 patent/WO2009048487A1/en active Application Filing
- 2008-04-08 WO PCT/US2008/004574 patent/WO2009048488A1/en active Application Filing
- 2008-04-08 CA CA2702024A patent/CA2702024C/en active Active
- 2008-04-08 EP EP08742666A patent/EP2195422A1/en not_active Withdrawn
- 2008-04-08 CA CA3069377A patent/CA3069377C/en active Active
- 2008-04-08 CA CA3069361A patent/CA3069361C/en active Active
- 2008-04-08 BR BRPI0817853-4A patent/BRPI0817853B1/pt active IP Right Grant
- 2008-04-08 ES ES12164788.7T patent/ES2518916T3/es active Active
- 2008-04-08 EP EP12157549.2A patent/EP2481796B1/en active Active
- 2008-04-08 EP EP12164776.2A patent/EP2479264B1/en active Active
- 2008-04-08 ES ES12169318.8T patent/ES2504983T3/es active Active
- 2008-04-08 JP JP2010528857A patent/JP5594898B2/ja not_active Expired - Fee Related
- 2008-04-08 ES ES12164776.2T patent/ES2516265T3/es active Active
- 2008-04-08 PL PL12157549T patent/PL2481796T3/pl unknown
- 2008-04-08 PL PL12169318T patent/PL2514818T3/pl unknown
- 2008-04-08 DK DK12169318.8T patent/DK2514818T3/da active
- 2008-04-08 PL PL12164776T patent/PL2479264T3/pl unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BRPI0817853B1 (pt) | Variantes de glucoamilase com propriedades alteradas, método de produção das mesmas, composição de enzima e microorganismo transgênico | |
US9029116B2 (en) | Glucoamylase variants | |
US8592194B2 (en) | Glucoamylase variants with altered properties | |
JP5594899B2 (ja) | 変更された性質を有するグルコアミラーゼ変異体 | |
US20120164695A1 (en) | Combinatorial variants of glucoamylase with improved specific activity and/or thermostability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
B09B | Patent application refused [chapter 9.2 patent gazette] | ||
B12B | Appeal against refusal [chapter 12.2 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 08/04/2008, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO. |