ES2884155T3 - Variantes de serina proteasa y polinucleótidos que codifican las mismas - Google Patents

Variantes de serina proteasa y polinucleótidos que codifican las mismas Download PDF

Info

Publication number
ES2884155T3
ES2884155T3 ES17746004T ES17746004T ES2884155T3 ES 2884155 T3 ES2884155 T3 ES 2884155T3 ES 17746004 T ES17746004 T ES 17746004T ES 17746004 T ES17746004 T ES 17746004T ES 2884155 T3 ES2884155 T3 ES 2884155T3
Authority
ES
Spain
Prior art keywords
variant
protease
seq
substitution
positions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17746004T
Other languages
English (en)
Inventor
Dorte Klitgaard
Roland Pache
Martin Gudmand
Anders SANDSTRÖM
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes AS filed Critical Novozymes AS
Application granted granted Critical
Publication of ES2884155T3 publication Critical patent/ES2884155T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)

Abstract

Una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41, 42, 45, 46, 49, 50, 53, 54, 55, 57, 59, 60, 61, 62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185, 199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 262, 266, 267, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325, 326, 329, 330, 331, 333, 336, 338, 341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una termoestabilidad incrementada medida como factor de mejora, HIF, en comparación con la proteasa de SEQ ID NO: 3, en donde la variante comprende al menos una sustitución seleccionada del grupo que consiste en : A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, 139G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N1571, N157L, Y159H, Q161E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,4.

Description

DESCRIPCIÓN
Variantes de serina proteasa y polinucleótidos que codifican las mismas
REFERENCIA A UN LISTADO DE SECUENCIAS
Esta solicitud contiene un Listado de Secuencias en formato legible por computadora.
ANTECEDENTES DE LA INVENCIÓN
La producción de productos de fermentación, tales como etanol, a partir de material que contiene almidón es bien
conocida en la técnica. Generalmente se utilizan dos tipos diferentes de procedimientos. El procedimiento más
comúnmente utilizado, al que se alude a menudo como un "procedimiento convencional", incluye licuar almidón
gelatinizado a alta temperatura utilizando típicamente una alfa-amilasa bacteriana, seguido de sacarificación y
fermentación simultáneas llevadas a cabo en presencia de una glucoamilasa y un organismo fermentador. Otro
procedimiento bien conocido, al que se alude a menudo como un procedimiento de "hidrólisis de almidón bruto"
(procedimiento RSH) incluye sacarificar y fermentar simultáneamente almidón granular por debajo de la temperatura
de gelatinización inicial, típicamente en presencia de una alfa-amilasa fúngica ácida y una glucoamilasa.
La patente de EE.UU. N° 5.231.017-A describe el uso de una proteasa fúngica ácida durante la fermentación de etanol
en un procedimiento que comprende licuar almidón gelatinizado con una alfa-amilasa.
El documento WO 2003/066826 describe un procedimiento de hidrólisis de almidón bruto (procedimiento RSH) llevado
a cabo en maceración no cocida en presencia de glucoamilasa fúngica, alfa-amilasa y proteasa fúngica.
El documento WO 2007/145912 describe un procedimiento para producir etanol que comprende poner en contacto
una suspensión que comprende almidón granular obtenido de material vegetal con una alfa-amilasa capaz de
solubilizar almidón granular a un pH de 3,5 a 7,0 y a una temperatura por debajo de la temperatura de gelatinización
del almidón durante un período. de 5 minutos a 24 horas; obtener un sustrato que comprende más del 20% de glucosa,
y fermentar el sustrato en presencia de un organismo fermentador y enzimas que hidrolizan el almidón a una
temperatura entre 10°C y 40°C durante un período de 10 horas a 250 horas. Enzimas adicionales añadidas durante
la etapa de contacto pueden incluir proteasa.
El documento WO 2014/037438 describe serina proteasas de tipo salvaje derivadas de Meripilus giganteus, Trametes
versicolor, y Dichomitus squalens y su uso en la alimentación animal. La proteasa de T. versicolor comparte
aproximadamente un 86% de identidad con las proteasas variantes de la invención.
El documento WO 2015/197871 describe una secuencia de aminoácidos madura de una proteasa de Meripilus
giganteus. Esta proteasa es idéntica a la proteasa parental de tipo salvaje utilizada como punto de partida de acuerdo
con la presente invención para desarrollar proteasas variantes que tienen propiedades mejoradas.
Es un objeto de la presente invención identificar variantes de las proteasas de M. giganteus S53 que darán como
resultado una estabilidad de almacenamiento incrementada (p. ej., estabilidad térmica incrementada) y un rendimiento
de expresión mejorado de la proteasa variante en comparación con la enzima parental de tipo salvaje.
La presente invención proporciona variantes de proteasa con propiedades mejoradas en comparación con su parental.
SUMARIO DE LA INVENCIÓN
En un primer aspecto, la presente invención se refiere a variantes de proteasa que comprenden una sustitución en
una o más posiciones correspondientes a las posiciones 1,5, 9, 25, 29,30, 32, 38, 39, 40, 41,42, 45, 46, 49, 50, 53,
54, 55, 57, 59, 60, 61, 62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169,
175, 182, 185, 199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258,
262, 266, 267, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322,
324, 325, 326, 329, 330, 331, 333, 336, 338, 341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, y 364 del
polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al
menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la
secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una termoestabilidad incrementada
medida como factor de mejora, HIF, en comparación con la proteasa de SEQ ID NO: 3, en donde la variante
comprende al menos una sustitución seleccionada del grupo que consiste en : A1T, S5I, S5K, S5L, S5Y, T9H, K25P,
S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C,
F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V,
Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P, T64G,
T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L,
E81 P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V,
I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N157I, N157L, Y159H, Q161 E, T167F, I169F,
I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L,
V271 R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, y en donde la sustitución en una o más posiciones proporciona una variante de proteasa que tiene un aumento en la termoestabilidad medida como factor de mejora, HIF, de al menos
1,4.
En un segundo aspecto, la presente invención se refiere a variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55, 58, 59, 60, 61,
62, 66, 69, 76, 81,87, 93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145,
146, 148, 149, 150, 153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211,
213, 216, 219, 228, 231, 237, 244, 249, 252, 253, 261, 266, 267, 272, 275, 276, 277, 280, 285, 294, 296, 299, 303, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 358, 359, 361,362, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una actividad específica incrementada medida como factor de mejora, AIF, en comparación con la proteasa de SEQ
ID NO: 3, en donde la variante comprende al menos una sustitución seleccionada del grupo que consiste en : G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y, K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101 F, P101L, P101M, P101 R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157F, N157M, N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, S183L, S183M, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M,
I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361 E, L361M, L361 P, L361 R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364I, V364L, V364M, y V364S y en donde la sustitución en una o más posiciones proporciona una variante de proteasa que tiene un aumento en la actividad específica medida como factor de mejora, AIF, de al menos 1,37.
En un tercer aspecto, la presente invención se refiere a variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66,
69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211,
213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 294, 296, 301, 307, 314,
329, 331, 333, 336, 362, y 363 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene un nivel de expresión incrementado medido como factor de mejora, EIF, en comparación con la proteasa de SEQ ID
NO: 3, y en donde la variante comprende una sustitución en una o más posiciones seleccionada del grupo que consiste
en : I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V2711, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, I301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, y A363T, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en el nivel de expresión en Aspergillus oryzae medido como factor de mejora, EIF, de al menos 1,38.
La presente invención también se refiere a polinucleótidos que codifican las variantes; construcciones de ácido nucleico, vectores y células huésped que comprenden los polinucleótidos; y métodos para producir las variantes. En un aspecto adicional, la presente invención se refiere a composiciones que comprenden las variantes de la invención.
La presente invención también se refiere a un procedimiento para preparar un producto de fermentación a partir de material que contiene almidón, que comprende sacarificar y fermentar simultáneamente material que contiene almidón utilizando enzimas que generan una fuente de hidratos de carbono y un organismo fermentador a una temperatura por debajo de la temperatura de gelatinización inicial de dicho material que contiene almidón en presencia de una proteasa variante. En otro aspecto, la presente invención se refiere a un procedimiento para preparar un producto de fermentación a partir de material que contiene almidón, que comprende las etapas de:
(a) licuar material que contiene almidón en presencia de una alfa-amilasa;
(b) sacarificar el material licuado obtenido en la etapa (a) utilizando una glucoamilasa;
(c) fermentar utilizando un organismo fermentador;
en donde una proteasa variante de la invención está presente durante la etapa b) y/o c).
DEFINICIONES
Proteasa: El término "proteasa" (también denominada peptidasas, proteinasas, péptido hidrolasas o enzimas proteolíticas) significa una actividad proteolítica (EC 3.4) que cataliza la escisión de enlaces peptídicos. Para los fines de la presente invención, la actividad de la serina proteasa se determina de acuerdo con el procedimiento descrito en los Ejemplos. En un aspecto, las variantes de la presente invención tienen al menos el 20%, p. ej., al menos el 40%, al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos 95% o al menos 100% de la actividad de proteasa del polipéptido maduro de SEQ ID NO: 2.
Actividad de proteasa: La expresión "actividad de proteasa" significa actividad proteolítica (EC 3.4). Existen varios tipos de actividad de proteasa, tales como proteasas de tipo tripsina que se escinden en el lado carboxi-terminal de los residuos de Arg y Lys, y proteasas de tipo quimotripsina que se escinden en el lado carboxi-terminal de los residuos de aminoácidos hidrófobos. Las proteasas de la invención son serina endopeptidasas (EC 3.4.21) con pH óptimo ácido (pH óptimo < pH 7).
La actividad de proteasa se puede medir utilizando cualquier ensayo, en el que se emplee un sustrato, que incluya enlaces peptídicos relevantes para la especificidad de la proteasa en cuestión. Asimismo, el pH del ensayo y la temperatura del ensayo deben adaptarse a la proteasa en cuestión. Ejemplos de valores de pH del ensayo son pH 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 o 12. Ejemplos de temperaturas de ensayo son 15, 20, 25, 30, 35, 37, 40, 45, 50, 55, 60, 65, 70, 80, 90 o 95°C. Ejemplos de sustratos de proteasa generales son caseína, albúmina de suero bovino y hemoglobina. En el método clásico de Anson y Mirsky se utiliza hemoglobina desnaturalizada como sustrato y, tras la incubación del ensayo con la proteasa en cuestión, se determina la cantidad de hemoglobina soluble en ácido tricloroacético como medida de la actividad de la proteasa (Anson, M.L. y Mirsky, A.E., 1932, J. Gen. Physiol. 16: 59 y Anson, M.L., 1938, J. Gen. Physiol. 22: 79).
Para el fin de la presente invención, la actividad de proteasa se determinó utilizando ensayos que se describen en "Materiales y Métodos", tales como el ensayo Kinetic Suc-AAPF-pNA, ensayo Protazyme AK, ensayo Kinetic Suc-AAPX-pNA y o-ftaldialdehído (OPA). Para el ensayo de Protazyme AK, el sustrato insoluble de Protazyme AK (caseína reticulada con azurina) libera un color azul cuando se incuba con la proteasa y el color se determina como una medida de la actividad de proteasa. Para el ensayo de Suc-AAPF-pNA, el sustrato incoloro de Suc-AAPF-pNA libera paranitroanilina amarilla cuando se incuba con la proteasa y el color amarillo se determina como una medida de la actividad de proteasa.
Endo-proteasas/Exo-proteasas: Polipéptidos que tienen actividad proteasa, o proteasas, a veces también se denominan peptidasas, proteinasas, péptido hidrolasas o enzimas proteolíticas. Las proteasas pueden ser del tipo exo (exopeptidasas) que hidrolizan péptidos comenzando en cualquiera de sus extremos, o del tipo endo que actúan internamente en cadenas polipeptídicas (endopeptidasas).
Proteasa S53: El término "S53" significa una actividad de proteasa seleccionada de:
(a) proteasas que pertenecen al grupo de enzimas EC 3.4.21; y/o
(b) proteasas que pertenecen al grupo de enzimas EC 3.4.14; y/o
(c) serina proteasas de la familia de peptidasas S53 que comprende dos tipos diferentes de peptidasas: tripeptidil aminopeptidasas (tipo exo) y endo-peptidasas; tal como se describe en 1993, Biochem. J. 290: 205-218 y en la base de datos de proteasas MEROPS, versión 9.4 (31 de enero de 2011) (www.merops.ac.uk). La base de datos se describe en Rawlings, N.D., Barrett, A.J. and Bateman, A., 2010, "MEROPS: the peptidase database", Nucl. Acids Res. 38: D227-D233.
Para determinar si una proteasa dada es una Serina proteasa y una proteasa de la familia S53, se hace referencia al Manual anterior y los principios indicados en el mismo. Una determinación de este tipo se puede llevar a cabo para todos los tipos de proteasas, ya sean proteasas que se producen de forma natural o de tipo salvaje; o proteasas genéticamente modificadas o sintéticas.
Variante alélica: La expresión "variante alélica" significa cualquiera de dos o más formas alternativas de un gen que ocupa el mismo locus cromosómico. La variación alélica surge de forma natural a través de mutación y puede resultar en polimorfismo dentro de las poblaciones. Las mutaciones génicas pueden ser silenciosas (sin cambios en el polipéptido codificado) o pueden codificar polipéptidos que tienen secuencias de aminoácidos alteradas. Una variante alélica de un polipéptido es un polipéptido codificado por una variante alélica de un gen.
ADNc: El término "ADNc" significa una molécula de ADN que puede prepararse mediante transcripción inversa a partir de una molécula de ARNm madura, cortada y empalmada, obtenida de una célula eucariota o procariota. El ADNc carece de secuencias intrónicas que pueden estar presentes en el ADN genómico correspondiente. La transcripción de ARN primaria inicial es un precursor del ARNm que se procesa a través de una serie de etapas, incluyendo el corte y empalme, antes de aparecer como ARNm maduro cortado y empalmado.
Secuencia codificante La expresión "secuencia codificante" significa un polinucleótido, que especifica directamente la secuencia de aminoácidos de una variante. Los límites de la secuencia codificante se determinan generalmente mediante un marco de lectura abierto, que comienza con un codón de inicio tal como ATG, GTG o TTG y termina con un codón de terminación tal como TAA, TAG o TGA. La secuencia codificante puede ser un ADN genómico, ADNc, ADN sintético o una combinación de los mismos.
Secuencias de control: La expresión "secuencias de control" significa secuencias de ácido nucleico necesarias para la expresión de un polinucleótido que codifica una variante de la presente invención. Cada una de las secuencias de control puede ser nativa (es decir, del mismo gen) o heteróloga (es decir, de un gen diferente) al polinucleótido que codifica la variante o nativa o extraña entre sí. Secuencias de control de este tipo incluyen, pero no se limitan a una secuencia conductora, de poliadenilación, secuencia propeptídica, promotor, secuencia de péptido señal y terminador de la transcripción. Como mínimo, las secuencias de control incluyen un promotor y señales de parada de la transcripción y la traducción. Las secuencias de control se pueden proporcionar con enlazadores con el fin de introducir sitios de restricción específicos que faciliten el ligamiento con las secuencias de control con la región codificante del polinucleótido que codifica una variante.
Expresión: El término "expresión" incluye cualquier etapa implicada en la producción de una variante que incluye, pero no se limita a transcripción, modificación pos-transcripcional, traducción, modificación pos-traduccional y secreción.
Vector de expresión: La expresión "vector de expresión" significa una molécula de ADN lineal o circular que comprende un polinucleótido que codifica una variante y está operativamente enlazado a secuencias de control que proporcionan su expresión.
Fragmento: El término "fragmento" significa un polipéptido que tiene uno o más (p. ej., varios) aminoácidos ausentes del extremo amino y/o carboxilo de un polipéptido maduro; en donde el fragmento tiene actividad proteasa.
Condiciones de alta rigurosidad: La expresión "condiciones de alta rigurosidad" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 50 % de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 65°C.
Célula huésped: La expresión "célula huésped" significa cualquier tipo de célula que sea susceptible de transformación, transfección, transducción o similar con una construcción de ácido nucleico o vector de expresión que comprende un polinucleótido de la presente invención. La expresión "célula huésped" abarca cualquier progenie de una célula madre que no sea idéntica a la célula madre debido a mutaciones que se producen durante la replicación.
Propiedad mejorada: La expresión "propiedad mejorada" significa una característica asociada con una variante que está mejorada en comparación con el parental. Propiedades mejoradas de este tipo incluyen, pero no se limitan a actividad específica incrementada, estabilidad incrementada en condiciones de almacenamiento, termoestabilidad incrementada y niveles de expresión incrementados en una célula huésped de expresión recombinante.
Aislada: El término "aislado" significa una sustancia en una forma o entorno que no se produce en la naturaleza. Ejemplos no limitantes de sustancias aisladas incluyen (1) cualquier sustancia que se produce de forma no natural, (2) cualquier sustancia que incluya, pero no se limite a cualquier enzima, variante, ácido nucleico, proteína, péptido o cofactor, que se haya eliminado, al menos parcialmente, de uno o más o todos los constituyentes que se producen de forma natural con los que está asociado en la naturaleza; (3) cualquier sustancia modificada por la mano del hombre en relación con la sustancia que se encuentra en la naturaleza o (4) cualquier sustancia modificada al incrementar la cantidad de la sustancia en relación con otros componentes con los que está asociada de forma natural (p. ej., múltiples copias de un gen que codifica la sustancia; uso de un promotor más fuerte que el promotor asociado de forma natural con el gen que codifica la sustancia). . Una sustancia aislada puede estar presente en una muestra de caldo de fermentación.
Condiciones de baja rigurosidad: La expresión "condiciones de baja rigurosidad" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 25% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 50°C.
Polipéptido maduro: La expresión "polipéptido maduro" significa un polipéptido en su forma final después de la traducción y cualquier modificación pos-traduccional, tal como procesamiento N-terminal, truncamiento C-terminal, glicosilación, fosforilación, etc. En un aspecto, el polipéptido maduro es los aminoácidos 199 a 564 de SEQ ID NO: 2. Los aminoácidos 1 a 17 de SEQ ID NO: 2 son un péptido señal y los aminoácidos 18 a 198 son un propéptido. Los N-terminales de los polipéptidos S53 maduros utilizados de acuerdo con la presente invención se confirmaron experimentalmente basándose en los datos de secuenciación N-terminal de EDMAN y los datos de MS intacta. Los polipéptidos maduros también se incluyen como SEQ ID NO: 3 (proteasa 3 S53 madura de Meripilus giganteus. Se sabe en la técnica que una célula huésped puede producir una mezcla de dos o más polipéptidos maduros diferentes (es decir, con un aminoácido C.terminal y/o N-terminal diferente), expresado por el mismo polinucleótido.
Secuencia codificante de polipéptido maduro: La expresión "secuencia codificante de polipéptido maduro" significa un polinucleótido que codifica un polipéptido maduro que tiene actividad de proteasa. En un aspecto, la secuencia codificante de polipéptido maduro son los nucleótidos 595 a 1692 de SEQ ID NO: 1. Los nucleótidos 1 a 51 de SEQ ID NO: 1 codifican un péptido señal y los nucleótidos 52 a 594 codifican un propéptido.
Condiciones de rigurosidad media: La expresión "condiciones de rigurosidad" media significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 35% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 55°C.
Condiciones de rigurosidad media-alta: La expresión "condiciones de rigurosidad media-alta" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 35% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 60°C.
Mutante: El término "mutante" significa un polinucleótido que codifica una variante.
Construcción de ácido nucleico: La expresión "construcción de ácido nucleico" significa una molécula de ácido nucleico, ya sea de cadena sencilla o de doble cadena, que se aísla de un gen que se produce de forma natural o se modifica para contener segmentos de ácidos nucleicos de una manera que de otra manera no existiría en la naturaleza o que es sintética, que comprende una o más secuencias de control. En una realización, la una o más secuencias de control son heterólogas (de diferente origen/especie) a la secuencia codificante que codifica el polipéptido de la invención.
Enlazada operativamente: La expresión "enlazada operativamente" significa una configuración en la que una secuencia de control está colocada en una posición apropiada con respecto a la secuencia codificante de un polinucleótido de manera que la secuencia de control dirige la expresión de la secuencia codificante.
Parental o proteasa parental: El término "parental" o la expresión "proteasa parental" significa cualquier polipéptido con actividad de proteasa en el que se realiza una alteración para producir las variantes enzimáticas de la presente invención.
Identidad de la secuencia: La relación entre dos secuencias de aminoácidos o entre dos secuencias de nucleótidos se describe mediante el parámetro "identidad de la secuencia".
Para los fines de la presente invención, la identidad de la secuencia entre dos secuencias de aminoácidos se determina utilizando el algoritmo de Needleman-Wunsch (Needleman y Wunsch, 1970, J. Mol. Biol. 48: 443-453) como se implementa en el programa Needle del paquete EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), preferiblemente versión 5.0.0 o posterior. Los parámetros utilizados son penalización por apertura de hueco de 10, penalización por extensión de hueco de 0,5 y la matriz de sustitución EBLOSUM62 (versión EMBOSS de BLOSUM62). La salida de Needle marcada como "identidad más larga" (obtenida utilizando la opción -nobrief) se utiliza como el porcentaje de identidad y se calcula de la siguiente manera:
(Residuos Idénticos x 100)/(Longitud de Alineamiento - Número Total de Huecos en Alineamiento)
Para los fines de la presente invención, la identidad de la secuencia entre dos secuencias de desoxirribonucleótidos se determina utilizando el algoritmo de Needleman-Wunsch (Needleman y Wunsch, 1970, supra) implementado en el programa Needle del paquete EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, supra), preferiblemente versión 5.0.0 o posterior. Los parámetros utilizados son penalización por apertura de hueco de 10, penalización por extensión de hueco de 0,5 y la matriz de sustitución EDNAFULL (versión EMBOSS de NCBI NUC4.4). La salida de Needle marcada como "identidad más larga" (obtenida utilizando la opción -nobrief) se utiliza como el porcentaje de identidad y se calcula de la siguiente manera: (Desoxirribonucleótidos Idénticos x 100)/(Longitud de Alineamiento - Número Total de Huecos en Alineamiento)
Subsecuencia: El término "subsecuencia" significa un polinucleótido que tiene uno o más (p. ej., varios) nucleótidos ausentes del extremo 5’ y/o 3’ de una secuencia codificante de polipéptido maduro; en donde la subsecuencia codifica un fragmento que tiene actividad de proteasa. En un aspecto, una subsecuencia contiene al menos 1098 nucleótidos (p. ej., nucleótidos 595 a 1692 de SEQ ID NO: 1).
Variante: El término "variante" significa un polipéptido que tiene actividad de proteasa que comprende una sustitución en una o más (p. ej., varias) posiciones. Una sustitución significa el reemplazo del aminoácido que ocupa una posición por un aminoácido diferente. Las variantes de la presente invención tienen al menos el 20%, p. ej., al menos el 40%, al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos 95% o al menos 100% de la actividad de proteasa del polipéptido maduro de SEQ ID NO: 2, descrita en esta memoria como SEQ ID NO: 3.
Condiciones de rigurosidad muy alta: La expresión "condiciones de rigurosidad muy alta" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 50% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 70°C.
Condiciones de rigurosidad muy baja: La expresión "condiciones de rigurosidad muy baja" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 25% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 45°C.
Proteasa de tipo salvaje: La expresión proteasa "de tipo salvaje" significa una proteasa expresada por un microorganismo que se produce de forma natural, tal como una bacteria, levadura u hongo filamentoso que se encuentra en la naturaleza.
Convenciones para la Designación de Variantes
Para los fines de la presente invención, el polipéptido maduro comprendido en SEQ ID NO: 2 se utiliza para determinar el residuo de aminoácido correspondiente en otra proteasa. La secuencia de aminoácidos de otra proteasa se alinea con el polipéptido maduro comprendido en SEQ ID NO: 2 (descrita en esta memoria como SEQ ID NO: 3), y basado en el alineamiento, el número de posición de aminoácido correspondiente a cualquier residuo de aminoácido en el polipéptido maduro descrito como SEQ ID NO: 3 se determina utilizando el algoritmo de Needleman-Wunsch (Needleman y Wunsch, 1970, J. Mol. Biol. 48: 443-453) como se implementa en el programa Needle del paquete EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276­ 277), preferiblemente versión 5.0.0 o posterior. Los parámetros utilizados son penalización por apertura de hueco de 10, penalización por extensión de hueco de 0,5 y la matriz de sustitución EBLOSUM62 (versión EMBOSS de BLOSUM62).
La identificación del residuo de aminoácido correspondiente en otra proteasa que no sea la proteasa S53 de Meripilus giganteus puede determinarse mediante un alineamiento de múltiples secuencias de polipéptidos utilizando varios programas informáticos que incluyen, pero no se limitan a MUSCLE (comparación de secuencias múltiples por expectativa de registro; versión 3.5 o posterior; Edgar, 2004, Nucleic Acids Research 32: 1792-1797), MAFFT (versión 6.857 o posterior; Katoh y Kuma, 2002, Nucleic Acids Research 30: 3059-3066; Katoh et a/., 2005, Nucleic Acids Research 33: 511-518; Katoh y Toh, 2007, Bioinformatics 23: 372-374; Katoh et a/., 2009, Methods in Molecular Biology 537: 39-64; Katoh y Toh, 2010, Bioinformatics 26:_1899-1900), y EMBOSS EMMA empleando ClustalW (1.83 o posterior; Thompson et al., 1994, Nucleic Acids Research 22: 4673-4680), utilizando sus respectivos parámetros por defecto.
Cuando la otra enzima ha divergido del polipéptido maduro de SEQ ID NO: 2 de manera que la comparación tradicional basada en secuencia no detecta su relación (Lindahl y Elofsson, 2000, J. Mol. Biol. 295: 613-615), se pueden utilizar otros algoritmos de comparación de secuencias. Se puede lograr una mayor sensibilidad en la búsqueda basada en secuencias utilizando programas de búsqueda que utilizan representaciones probabilísticas de familias (perfiles) de polipéptidos para buscar en bases de datos. Por ejemplo, el programa PSI-BLAST genera perfiles a través de un proceso de búsqueda de base de datos iterativo y es capaz de detectar homólogos remotos (Atschul et al., 1997, Nucleic Acids Res. 25: 3389-3402). Se puede lograr una sensibilidad incluso mayor si la familia o superfamilia del polipéptido tiene uno o más representantes en las bases de datos de estructura de proteínas. Programas tales como GenTHREADER (Jones, 1999, J. Mol. Biol. 287: 797-815; McGuffin y Jones, 2003, Bioinformatics 19: 874-881) utilizan información de una diversidad de fuentes (PSI-BLAST, predicción de estructura secundaria, perfiles de alineamiento estructural y potenciales de solvatación) como entrada a una red neuronal que predice el pliegue estructural de una secuencia de consulta. . De manera similar, el método de Gough et al., 2000, J. Mol. Biol. 313: 903-919, se puede utilizar para alinear una secuencia de estructura desconocida con los modelos de superfamilia presentes en la base de datos SCOP. Estos alineamientos, a su vez, pueden utilizarse para generar modelos de homología para el polipéptido, y la precisión de este tipo de modelos puede evaluarse utilizando una diversidad de herramientas desarrolladas para ese fin.
Para proteínas de estructura conocida, se encuentran disponibles varias herramientas y recursos para recuperar y generar alineamientos estructurales. Por ejemplo, las superfamilias de proteínas SCOP se han alineado estructuralmente, y esos alineamientos son accesibles y descargables. Se pueden alinear dos o más estructuras de proteínas utilizando una diversidad de algoritmos tales como la matriz de alineamiento de distancia (Holm y Sander, 1998, Proteins 33: 88-96) o la extensión combinatoria (Shindyalov y Bourne, 1998, Protein Engineering 11: 739-747), y la implementación de estos algoritmos se puede utilizar adicionalmente para consultar bases de datos de estructura con una estructura de interés con el fin de descubrir posibles homólogos estructurales (p. ej., Holm y Park, 2000, Bioinformatics 16: 566-567).
Al describir las variantes de la presente invención, la nomenclatura descrita más adelante se adapta para facilitar la referencia. Se emplea la abreviatura de aminoácidos de una sola letra o de tres letras aceptada por la IUPAC.
Sustituciones. Para una sustitución de aminoácidos se utiliza la siguiente nomenclatura: aminoácido original, posición, aminoácido sustituido. Por consiguiente, la sustitución de treonina en la posición 226 con alanina se designa como "Thr226Ala" o "T226A". Las mutaciones múltiples están separadas por marcas de adición ("+"), p. ej., "Gly205Arg Ser411 Phe" o "G205R S411F", que representan sustituciones en las posiciones 205 y 411 de glicina (G) con arginina (R) y serina (S) con fenilalanina (F), respectivamente.
Deleciones. Para una deleción de aminoácidos se utiliza la siguiente nomenclatura: Aminoácido original, posición, *. Por consiguiente, la deleción de glicina en la posición 195 con se designa como "Gly195*" o "G195*". Las deleciones múltiples están separadas por marcas de adición («+»), p. ej., "Gly195* Ser411*" o "G195* S411 *".
Inserciones. Para una inserción de aminoácidos se utiliza la siguiente nomenclatura: Aminoácido original, posición, aminoácido original, aminoácido insertado. Por consiguiente la inserción de lisina después de glicina en la posición 195 se designa "Gly195GlyLys" o "G195GK". Una inserción de múltiples aminoácidos se designa [Aminoácido original, posición, aminoácido original, aminoácido insertado n° 1, aminoácido insertado n° 2; etc.]. Por ejemplo, la inserción de lisina después de glicina en la posición 195 se indica como "Gly195GlyLysAla" o "G195GKA".
En tales casos, el o los residuos de aminoácido insertados se numeran mediante la adición de letras minúsculas al número de posición del residuo de aminoácido que precede al o a los residuos de aminoácido insertado. En el ejemplo anterior, la secuencia sería:
Figure imgf000009_0001
Alteraciones múltiples. Variantes que comprenden múltiples alteraciones están separadas por marcas de adición ("+"), p. ej., "Arg170Tyr Gly195Glu" o "R170Y G195E" que representan una sustitución de arginina y glicina en las posiciones 170 y 195 con tirosina y ácido glutámico, respectivamente.
Alteraciones diferentes. En los casos en los que se pueden introducir diferentes alteraciones en una posición, las diferentes alteraciones se separan con una coma, p. ej., "Arg170Tyr, Glu" representa una sustitución de arginina en la posición 170 con tirosina o ácido glutámico. Por lo tanto, "Tyr167Gly,Ala Arg170Gly,Ala" designa las siguientes variantes:
"Tyr167Gly+Arg170Gly", "Tyr167Gly+Arg170Ala", "Tyr167Ala+Arg170Gly" y "Tyr167Ala+Arg170Ala".
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
La presente divulgación se refiere a variantes de proteasa que comprenden una sustitución en una o más (p. ej., varias) posiciones correspondientes a posiciones específicas del polipéptido maduro de SEQ ID NO: 2 (una proteasa parental), en donde la variante tiene actividad de proteasa. Como se explica en esta memoria, los números de posición específicos pueden cambiar en caso de que la proteasa parental madura sea diferente de la SEQ ID NO: 3. Las propiedades mejoradas de las variantes de la invención se incluyen en las siguientes categorías, p. ej., actividad específica incrementada, estabilidad incrementada, p. ej., estabilidad al almacenamiento incrementada o termoestabilidad incrementada (medida como incremento en la semivida después de estrés térmico (5 minutos a 60°C) como se describe en los ejemplos) y niveles de expresión incrementados en una célula huésped de expresión recombinante.
Variantes
La presente divulgación proporciona variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41,42, 45, 46, 49, 50, 53, 54, 55, 57, 59, 60, 61,
62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185, 199, 200,
205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 262, 266, 267, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325, 326, 331, 333, 336, 338, 341,343, 345, 347, 348, 355, 358, 359, 361, 362, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad de proteasa. En una realización, la variante tiene una termoestabilidad incrementada medida como factor de mejora, HIF, en comparación con la proteasa de SEQ ID NO: 3.
En un aspecto de la divulgación, la variante tiene una identidad de secuencia de al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de la secuencia de aminoácidos de la proteasa parental madura.
En otro aspecto, las variantes tienen al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, tal como al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de secuencia con el polipéptido de SEQ ID NO: 3.
En un aspecto, el número de sustituciones en las variantes de la presente invención es 1-20 p. ej., 1-10 y 1-5, tales como 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 sustituciones.
En un aspecto, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41,42, 45, 46, 49, 50, 53, 54, 55, 57,
59, 60, 61,62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81,82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115,
117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185,
199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 329, 330, 331,333, 336, 338, 341,343, 345, 347, 348, 355, 358, 359, 361,362, 363, y 364 del polipéptido de SEQ ID
NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una termoestabilidad incrementada medida como factor de mejora, HIF, en comparación con la proteasa de SEQ ID NO: 3.
Más específicamente, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N157I, N157L, Y159H, Q161E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y2311, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,4, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización más específica, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S5K, S5L, S5Y, T9H, K25P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81 P, E81Y, A82M, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, Q112R, G114L, N115C, N115K, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122R, N124L, G128F, G128S, S130G, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146L, T146N, I147S, K150L, N153M, N153P, N153R, Q154I, Q154L, Q154N, Q154T, Q154V, N157L, Q161E, T167F, I169F, D175N, Q182C, Q182T, Q182V, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213R, F217I, V225Y, I228L, I228T, I228W, S234Q, S237F, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272K, S272L, S272R, S272V, S272Y, T276Y, G278P, D280N, D280S, D280T, C284G, F289Y, I293T, V296A, R299N, K305S, L308V, F314L, S317E, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, D326P, S329C, S329H, S329I, S329L, S329N, S329W, G330Q, S331W, S331Y, S336K, S336N, P341S, K343A, K343H, K343S, K343T, G345S, D347I, P348Y, P355I, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, A363G, A363L, y V364I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,6, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S5K, S5L, S5Y, T9H, K25P, S30E, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42K, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54L, Q54M, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61 P, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, E81A, E81K, E81L, E81P, E81Y, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, Q112R, G114L, N115R, E117G, E117H, E117N, E117Q, E117S, I122R, N124L, G128S, S130G, S130N, S130P, L136K, Q142A, Q142L, Q142N, N145V, T146A, T146L, I147S, K150L, N153M, N153R, Q154I, Q154L, Q154N, Q154T, Q154V, N157L, Q161E, T167F, I169F, D175N, Q182C, Q182V, F199L, F199M, M200S, Q207H, S210T, T213R, F217I, I228L, I228T, I228W, S237F, G244S, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267N, V271 R, S272K, S272L, S272R, S272V, S272Y, T276Y, G278P, D280N, D280S, D280T, C284G, F289Y, I293T, V296A, K305S, L308V, F314L, S317E, S317W, S318P, A319F, A319Q, L324S, D326P, S329C, S329I, S329L, S329N, S329W, G330Q, S331W, S331Y, S336N, P341S, K343H, K343S, K343T, G345S, D347I, P355I, A358P, A358R, A358Y, K359L, K359S, T362L, A363L, y V364I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,8, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S5K, S5Y, K25P, S30E, I39G, I39L, I39Y, D40F, D40G, D40H, D40N, D40P, Q411, Q41V, F42K, K45M, K45Y, A46C, S50I, S50L, S50M, S50Q, A53C, A53V, Q54M, F55H, F55L, K57P, K57S, I59M, I59P, S60P, S61P, T64I, Q68V, Q68Y, E74R, D76L, D76R, S78D, P79Y, E81A, E81K, E81L, E81P, A82P, N87S, T93L, V94S, T102L, T102V, T103I, T103K, T103V, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, G114L, N115R, E117G, E117H, E117N, I122R, G128S, S130G, S130N, L136K, Q142L, Q142N, N145V, T146A, T146L, I147S, K150L, N153M, N153R, Q154L, Q154N, Q154T, Q154V, N157L, I169F, D175N, F199L, M200S, S210T, T213R, F217I, I228L, I228W, S237F, G244S, T246S, S262P, V266K, D267H, D267N, V271R, S272L, S272V, S272Y, T276Y, G278P, D280S, D280T, C284G, F289Y, I293T, V296A, S317E, S317W, S318P, A319F, L324S, D326P, S329C, S329I, S329W, G330Q, S331Y, S336N, P341S, K343T, D347I, P355I, A358P, A358R, A358Y, K359L, T362L, y A363L, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 2,2, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización más específica, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S5K, I39G, I39L, I39Y, D40H, F42K, K45M, A46C, S50I, S50M, A53C, Q54M, F55H, F55L, K57P, K57S, I59M, I59P, T64I, Q68Y, E74R, D76L, S78D, P79Y, E81K, E81L, N87S, T93L, T102V, T103I, T103K, T103V, D109H, D109Y, F111H, F111K, F111S, N115R, E117G, E117H, I122R, L136K, Q142L, Q142N, T146L, I147S, N153R, Q154L, Q154N, Q154T, N157L, I169F, D175N, F199L, M200S, S210T, T213R, I228L, S237F, T246S, S262P, D267N, V271 R, S272V, S272Y, T276Y, D280S, D280T, C284G, F289Y, I293T, V296A, S317E, S317W, A319F, L324S, S329I, S329W, S331Y, S336N, P341S, D347I, P355I, y T362L, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 3,2, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: I39G, D40H, K45M, A46C, S50I, A53C, F55H, F55L, K57P, T64I, E74R, P79Y, T102V, N115R, E117H, I147S, N157L, D175N, F199L, S210T, I228L, D267N, D280T, C284G, V296A, S317E, A319F, S329I, P341S, D347I, y P355I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 6,4, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En otro aspecto, la variante comprende o consiste en una sustitución seleccionada del grupo que consiste en A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N157I, N157L, Y159H, Q161E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,4 en comparación con la proteasa parental.
La presente divulgación proporciona variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55, 58, 59, 60, 61,62, 66, 69, 76, 81,87,
93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145, 146, 148, 149, 150,
153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211, 231, 237, 244, 249, 252, 253, 261, 266, 267, 272, 275, 276,
Figure imgf000012_0001
277, 280, 285, 288, 291, 292, 293, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 344, 345, 348, 356, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad de proteasa. En una realización, las variantes tienen una actividad específica incrementada medida como factor de mejora, AIF, en comparación con la proteasa de
SEQ ID NO: 3.
En un aspecto de la divulgación, la variante tiene una identidad de secuencia de al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de la secuencia de aminoácidos de la proteasa parental madura.
En otro aspecto, las variantes tienen al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, tal como al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de secuencia con el polipéptido de SEQ ID NO: 3.
En un aspecto, el número de sustituciones en las variantes de la presente invención es 1-20 p. ej., 1-10 y 1-5, tales como 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 sustituciones.
En un aspecto específico, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 20, 27, 29, 34, 40, 42, 45, 46, 50,
66, 69, 76, 81, 87, 93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127,
146, 148, 149, 150, 153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 1 208, 209, 210, 213, 216, 219, 228, 231, 237, 244, 249, 252, 253, 261, 266, 267, 272, 2 288, 291, 292, 294, 296, 299, 303, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 3
Figure imgf000012_0002
344, 345, 348, 358, 359, 361,362, 363, y 364del polipéptido de SeQ ID NO: 3, y la variante tiene actividad de proteasa, y en donde la variante tiene al menos el 80%, al menos el 85%, al menos el 90%, al menos el 95%, al menos el 96%, al menos el
97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una actividad específica incrementada medida como factor de mejora, AIF, en comparación con la proteasa de SEQ ID NO: 3.
Más específicamente, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y,
K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157F, N157M, N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, S183L, S183M, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361 E, L361M, L361 P, L361 R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364i, V364L, V364m , y V364S, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 1,37, y además, en donde las variantes tienen al menos el 90%, al menos el 95%
de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, F42Y, K45L, K45Y, A46E, A46K, S50A, S50L, A53L, Q54L, F55R, I59M, I59P, S60E, S60P, S61 D, S61 P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153Y, Q154I, Q154K, Q154L, Q154M, Q154R, Q154W, N157F, N157Y, Y159H, Y159S, Q161A, T167D, Q182F, A184F, A184I, A184K, A184V, A184W, H185A, N188L, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211F, T213F, T213I, T213L, T213N, T213R, T213S, T213W, A216F, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, G249C, N252F, V261A, V261G, V266C, V266R, D267S, S272I, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285S, T288C, T288V, I293Y, S294T, S294V, A303F, G304H, G304K, G304P, G304R, G304S, K305C, K305F, K305H, K305I, K305S, K305T, S306L, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358L, K359S, K359W, L361P, L361R, T362C, T362H, T362I, T362K, T362M, T362R, T362Y, A363F, y V364M, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 2,0, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, K45Y, A46E, S50L, A53L, F55R, I59M, S60E, S60P, S61P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, N124I, N124K, N124L, N124M, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, N153Y, Q154I, Q154L, Q154R, N157F, Y159H, Y159S, T167D, Q182F, A184F, A184I, A184K, A184W, F199L, M200L, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209Y, S210E, S210L, T213F, T213I, T213N, T213R, I228F, I228L, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, G249C, V261A, V266R, D267S, S272I, S272L, S272Q, S272R, S272T, S272Y, Q275K, Q275L, Q275R, Q275V, T276F, T276V, I277L, D280F, D280M, D280N, D280S, D280T, A285S, T288V, I293Y, S294T, S294V, G304H, G304K, G304P, G304R, G304S, K305F, K305H, K305I, K305T, S306L, P307C, L308P, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358L, K359S, L361P, L361R, T362C, T362H, T362I, T362Y, y V364M, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 2,2, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: G20L, G20R, S29A, S29C, S29N, S29P, A34N, A34R, A46E, S50L, F55R, I59M, S60E, S60P, S61P, S62N, S66M, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, N115A, N115D, N115G, E117D, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, N124I, N124K, N124V, F125L, F125M, L127P, G128N, G128S, G128W, G128Y, S130D, S130F, G141A, G141F, G141L, G141M, G141Q, G141R, Q142A, Q142L, Q142M, Q142S, Q142W, N145G, N145I, N145S, N145W, T146A, T146H, T146N, T146V, T146W, Q154R, Y159H, Y159S, T167D, Q182F, F199L, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209Y, S210L, T213I, I228L, I228Q, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, V261A, V266R, D267S, S272L, S272T, S272Y, Q275K, Q275R, T276F, T276V, I277L, D280F, D280N, D280S, D280T, A285S, S294T, G304H, G304K, G304P, G304R, G304S, K305H, K305I, L308P, F310M, F310P, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, A319F, K321S, D326P, V327C, S336R, N338H, P341I, P341N, P341R, G345K, G345S, P348G, P348S, N356Y, A358L, L361P, T362I, y V364M, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 2,6, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S29N, A34N, A34R, I59M, S60P, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, N87F, L96F, L96S, T98L, P101L, P101M, T102C, T102I, D109P, N115A, E117D, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, N124I, N124K, N124V, F125L, G128N, G128W, S130D, S130F, G141F, G141L, G141M, G141Q, G141R, Q142A, Q142L, Q142M, Q142S, Q142W, N145I, N145S, T146H, T146N, T146W, Q154R, Y159S, T167D, Q182F, V209F, V209H, V209L, I228Q, Y231S, S237I, S237L, D267S, S272T, S272Y, T276F, T276V, D280F, D280S, D280T, A285S, S294T, G304H, G304P, K305H, F310M, F310P, S317C, S317G, S317I, S317K, S317L, S317R, S317W, S317Y, A319F, D326P, V327C, N338H, P341N, P341 R, G345K, G345S, P348S, N356Y, y L361 P, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 3,0, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S29N, A34N, A34R, I59M, S60P, D76A, D76K, D76L, D76N, D76P, D76Y, N87F, L96F, D109P, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, N124V, G141F, G141L, G141M, G141R, Q142L, Q142M, Q142S, Q142W, T146H, T146N, Q154R, V209F, V209H, I228Q, T276F, D280T, A285S, S294T, F310M, F310P, S317C, S317I, S317K, S317L, S317R, S317W, D326P, N338H, P341N, P341R, G345K, G345S, P348S, N356Y, y L361P, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 3,8, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: A34N, A34R, D76A, D76K, D76L, D76N, D76Y, N87F, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, G141L, G141M, Q142L, Q142M, Q142S, Q142W, T146H, T146N, Q154R, V209H, T276F, A285S, S294T, F310M, F310P, S317I, S317K, S317R, S317W, N338H, y G345S, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 4,5, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En otro aspecto, la variante comprende o consiste en una sustitución seleccionada del grupo que consiste en: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y, K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101 F, P101L, P101M, P101 R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157F, N157M, N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, S183L, S183M, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361 E, L361M, L361 P, L361 R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364I, V364L, V364M, y V364S, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 1,37 en comparación con la proteasa parental.
En un aspecto particular adicional, la presente divulgación se refiere a una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 o 280 del polipéptido de SEQ ID NO: 3 y la variante tiene actividad de proteasa, y en donde la variante comprende una sustitución seleccionada del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S,y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia de aminoácidos de SEQ ID NO: 3.
Particularmente, la divulgación se refiere a una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 o 280 del polipéptido de SEQ ID NO: 3 y la variante tiene actividad de proteasa, y en donde la variante comprende una sustitución seleccionada del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S,y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C.
En otro aspecto, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 o 280 del polipéptido de SEQ ID NO: 3 y la variante tiene actividad de proteasa, y en donde la variante comprende una sustitución seleccionada del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S,y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C, en donde la actividad residual es al menos 50%, particularmente al menos 60%, al menos 70%, al menos 80%.
En otro aspecto, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 o 280 del polipéptido de SEQ ID NO: 3 y la variante tiene actividad de proteasa, y en donde la variante comprende al menos tres sustituciones seleccionadas del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S,y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C, en donde la actividad residual es al menos 50%, particularmente al menos 60%, al menos 70%, al menos 80%.
En otro aspecto, la divulgación se refiere a una variante de proteasa que comprende las sustituciones correspondientes a I39L+S66T+T102V o D267N+S272Y Q275K+D280S del polipéptido de SEQ ID NO: 3 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C, en donde la actividad residual es al menos 50%, particularmente al menos 60%, al menos 70%, al menos 80%.
En otro aspecto, la divulgación se refiere a una variante de proteasa que comprende las sustituciones correspondientes a:
I39L+ S66T T102V;
I39L+S66T+T102V+D267N S272Y+D280S;
I39L+K57P+I59M+S66T+T102V F111H+N115K+D267N+S272Y,
I39L+K57P+159M+S66T+T102V+F111H+N115K+D280S; o
D267N+S272Y+Q275K+D280S en el polipéptido de SEQ ID NO: 3 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C, en donde la actividad residual es al menos 50%, particularmente al menos 60%, al menos 70%, al menos 80%.
La presente divulgación proporciona variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 294, 296, 301, 307, 314, 329, 331, 333, 336, 362, y 363 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad de proteasa. En una realización, las variantes tienen un nivel de expresión incrementado medido como factor de mejora, EIF, en comparación con la proteasa de SEQ ID NO: 3.
En un aspecto de la divulgación, la variante tiene una identidad de secuencia de al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de la secuencia de aminoácidos de la proteasa parental madura.
En otro aspecto, la variante tiene al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, tal como al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de secuencia con el polipéptido de SEQ ID NO: 3.
En un aspecto, el número de sustituciones en las variantes de la presente invención es 1-20 p. ej., 1-10 y 1-5, tales como 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 sustituciones.
En un aspecto específico, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 294, 296, 301, 307, 314, 329, 331, 333, 336, 362, y 363 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene un nivel de expresión incrementado medido como factor de mejora, EIF, en comparación con la proteasa de SEQ ID NO: 3.
Más específicamente, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271 F, V2711, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, I301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, y A363T, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,38 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: I2L, A17P, P22V, Q41L, Q41Y, F42R, Q54R, Q54S, Q54Y, F55N, F55T, K57L, K57V, I59D, I59S, I59V, S60L, S60Q, S60R, S60Y, S61F, S62L, S62V, T63A, T63E, T63R, T64C, T64D, T64M, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, T167A, T167S, T167W, F199Y, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271 F, V2711, V271K, V271M, S272A, G274R, G278S, T288A, T288C, T288G, V296P, V296R, V296T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, y S336T, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,6 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: I2L, A17P, P22V, Q41Y, F42R, K57L, I59S, T63A, T63R, Q112H, Q112M, Q112R, Q112S, G114A, G114L, G114P, E129L, E129S, E129Y, N131I, N131S, N131V, Q134L, Q134R, T167W, K250R, V266A, V266L, V266T, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269T, Q269V, Q269X, I270A, I270L, I270S, V271I, V271M, G274R, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,75 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: Q112M, Q112S, G114L, E129Y, N131I, Q134R, K250R, D267F, D267L, D267V, Q269C, Q269V, I270A, I270L, V271I, G274R, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,9 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
En otro aspecto, la variante comprende o consiste en una sustitución seleccionada del grupo que consiste en: I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V271I, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, I301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, y A363T, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,38 en comparación con la proteasa parental.
Las variantes pueden comprender, además, una o más alteraciones adicionales en una o más (p. ej., varias) otras posiciones.
Los cambios de aminoácidos pueden ser de naturaleza menor, es decir, sustituciones o inserciones conservadoras de aminoácidos que no afectan significativamente al plegamiento y/o a la actividad de la proteína; pequeñas deleciones, típicamente de 1-30 aminoácidos; pequeñas extensiones amino- o carboxilo-terminales, tales como un residuo metionina amino-terminal; un péptido enlazador pequeño de hasta 20-25 residuos; o una pequeña extensión que facilita la purificación cambiando la carga neta u otra función, tal como un tracto de poli-histidina, un epítopo antigénico o un dominio de unión.
Por lo tanto, incluso aunque las variantes de proteasa de acuerdo con la invención solo puedan comprender una sustitución específica que proporcione la propiedad mejorada de acuerdo con la invención, aún pueden tener modificaciones de adición que conduzcan a una proteasa variante que tenga al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de secuencia, con la secuencia de aminoácidos de la proteasa parental madura, p. ej., la proteasa de SEQ ID NO: 3. Preferiblemente, estas modificaciones adicionales no deberían cambiar significativamente las propiedades mejoradas de la proteasa variante.
Ejemplos de sustituciones conservadoras están dentro de los grupos de aminoácidos de carácter básico (arginina, lisina e histidina), aminoácidos de carácter ácido (ácido glutámico y ácido aspártico), aminoácidos polares (glutamina y asparagina), aminoácidos hidrófobos (leucina, isoleucina y valina), aminoácidos aromáticos (fenilalanina, triptófano y tirosina) y pequeños aminoácidos (glicina, alanina, serina, treonina y metionina). Las sustituciones de aminoácidos que generalmente no alteran la actividad específica son conocidas en la técnica y están descritas, por ejemplo, por H. Neurath y R.L. Hill, 1979, En, The Proteins, Academic Press, Nueva York. Sustituciones comunes son Ala/Ser, Val/Ile, Asp/Glu, Thr/Ser, Ala/Gly, Ala/Thr, Ser/Asn, Ala/Val, Ser/Gly, Tyr/Phe, Ala/Pro, Lys/Arg, Asp/Asn, Leu/Ile, Leu/Val, Ala/Glu y Asp/Gly.
Aminoácidos esenciales en un polipéptido pueden identificarse de acuerdo con procedimientos conocidos en la técnica, tales como mutagénesis dirigida al sitio o mutagénesis de exploración de alanina (Cunningham y Wells, 1989, Science 244: 1081 -1085). En esta última técnica, se introducen mutaciones únicas de alanina en cada uno de los residuos de la molécula, y las moléculas mutantes resultantes se testan para determinar la actividad de proteasa para identificar residuos de aminoácidos que son críticos para la actividad de la molécula. Véase también, Hilton et al., 1996, J. Biol. Chem. 271: 4699-4708. El sitio activo de la enzima u otra interacción biológica también se puede determinar mediante análisis físico de la estructura, según se determina mediante técnicas tales como resonancia magnética nuclear, cristalografía, difracción de electrones o marcaje por fotoafinidad, junto con la mutación de los aminoácidos del sitio de contacto putativo. Véase, por ejemplo, de Vos et al., 1992, Science 255: 306-312; Smith et al., 1992, J. Mol. Biol.
224: 899-904; Wlodaver et a/., 1992, FEBS Lett. 309: 59-64.
En un aspecto, la variante ha mejorado (incrementado) la actividad específica en comparación con la enzima parental.
En un aspecto, la variante ha mejorado (incrementado) la estabilidad al almacenamiento en comparación con la enzima parental.
En un aspecto, la variante ha mejorado (incrementado) la termoestabilidad en comparación con la enzima parental.
En un aspecto, la variante ha mejorado (incrementado) los niveles de expresión en una célula huésped de expresión recombinante.
Proteasas parentales
La proteasa parental puede ser (a) un polipéptido que tiene al menos un 80% de identidad de secuencia con el polipéptido maduro de SEQ ID NO: 2; (b) un polipéptido codificado por un polinucleótido que se hibrida en condiciones de alta rigurosidad con (i) la secuencia codificante del polipéptido maduro de SEQ ID NO: 1, (ii) la secuencia de ADNc de la misma, o (iii) el complemento de longitud completa de ( i) o (ii); o (c) un polipéptido codificado por un polinucleótido que tiene al menos un 80% de identidad de secuencia con la secuencia codificante del polipéptido maduro de SEQ ID NO: 1.
En un aspecto, el parental tiene una identidad de secuencia con el polipéptido maduro de SEQ ID NO: 2 de al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93% , al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o el 100%, que tienen actividad de proteasa. En un aspecto, la secuencia de aminoácidos del parental difiere hasta en 10 aminoácidos, p. ej., 1,2, 3, 4, 5, 6, 7, 8, 9 o 10, del polipéptido maduro de SEQ ID 2.
En otro aspecto, el parental comprende o consiste en la secuencia de aminoácidos de SEQ ID NO: 3. En otro aspecto, el parental comprende o consiste en los aminoácidos 199 a 564 de SEQ ID NO: 2.
En otro aspecto, el parental es codificado por un polinucleótido que se hibrida en condiciones de alta rigurosidad, o condiciones de muy alta rigurosidad con (i) la secuencia codificante del polipéptido maduro de SEQ ID NO: 1, (ii) la secuencia de ADNc de la misma, o (iii) el complemento de longitud completa de (i) o (ii) (Sambrook et a/., 1989, Molecular Cloning, A Laboratory Manual, 2a edición, Cold Spring Harbor, Nueva York).
El polinucleótido de SEQ ID NO: 1 o una subsecuencia del mismo, así como el polipéptido de SEQ ID NO: 2 o un fragmento del mismo, se pueden utilizar para diseñar sondas de ácido nucleico para identificar y clonar ADN que codifica un parental de cepas de diferentes géneros o especies de acuerdo con métodos bien conocidos en la técnica. En particular, sondas de este tipo se pueden utilizar para la hibridación con el ADN genómico o el ADNc de una célula de interés, siguiendo procedimientos estándares de transferencia Southern, con el fin de identificar y aislar el gen correspondiente en la misma. Sondas de este tipo pueden ser considerablemente más cortas que la secuencia completa, pero deberían tener al menos 15, p. ej., al menos 25, al menos 35 o al menos 70 nucleótidos de longitud. Preferiblemente, la sonda de ácido nucleico tiene al menos 100 nucleótidos de longitud, p. ej., al menos 200 nucleótidos, al menos 300 nucleótidos, al menos 400 nucleótidos, al menos 500 nucleótidos, al menos 600 nucleótidos, al menos 700 nucleótidos, al menos 800 nucleótidos o al menos 900 nucleótidos de longitud. Se pueden utilizar sondas tanto de ADN como de ARN. Las sondas se marcan típicamente para detectar el gen correspondiente (por ejemplo, con 32P, 3H, 35S, biotina o avidina). Sondas de este tipo quedan abarcadas por la presente invención.
Una colección de ADN genómico o ADNc preparada a partir de tales otras cepas puede rastrearse en busca de ADN que se hibrida con las sondas arriba descritas y codifica un parental. El ADN genómico o de otro tipo de estas otras cepas puede separarse mediante electroforesis en gel de agarosa o poliacrilamida u otras técnicas de separación. El ADN de las colecciones o el ADN separado puede transferirse e inmovilizarse en nitrocelulosa u otro material de soporte adecuado. Con el fin de identificar un clon o ADN que se hibrida con SEQ ID NO: 1 o una subsecuencia de la misma, el material de soporte se utiliza en un borrón de transferencia Southern.
Para los fines de la presente divulgación, la hibridación indica que el polinucleótido se híbrida a una sonda de ácido nucleico marcada correspondiente a (i) SEQ ID NO: 1; (ii) la secuencia codificante del polipéptido maduro de SEQ ID NO: 1; (iii) la secuencia de ADNc del mismo; (iv) el complemento de longitud completa del mismo; o (v) una subsecuencia del mismo; bajo condiciones de rigurosidad alta a muy alta. Moléculas con las que se hibrida la sonda de ácido nucleico bajo estas condiciones pueden detectarse utilizando, por ejemplo, película de rayos X o cualquier otro medio de detección conocido en la técnica.
En un aspecto, la sonda de ácido nucleico es la secuencia codificante del polipéptido maduro de SEQ ID NO: 1. En otro aspecto, la sonda de ácido nucleico son los nucleótidos 595 a 1692 de SEQ ID NO: 1. En otro aspecto, la sonda de ácido nucleico es un polinucleótido que codifica el polipéptido de SEQ ID NO: 2; el polipéptido maduro del mismo; o un fragmento del mismo. En otro aspecto, la sonda de ácido nucleico es SEQ ID NO: 1 o la secuencia de ADNc de la misma.
En otro aspecto de la divulgación, el parental es codificado por un polinucleótido que tiene una identidad de secuencia con la secuencia codificante del polipéptido maduro de SEQ ID NO: 1 de al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93% , al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o el 100%.
El polipéptido puede ser un polipéptido híbrido en el que una región de un polipéptido se fusiona en el extremo N o en el extremo C de una región de otro polipéptido.
El parental puede ser un polipéptido de fusión o un polipéptido de fusión escindible en el que otro polipéptido se fusiona en el extremo N o en el extremo C del polipéptido de la presente invención. Un polipéptido de fusión se produce fusionando un polinucleótido que codifica otro polipéptido a un polinucleótido de la presente invención. Técnicas para producir polipéptidos de fusión se conocen en la técnica e incluyen ligar las secuencias codificantes que codifican los polipéptidos para que estén en el marco y que la expresión del polipéptido de fusión esté bajo el control del o de los mismos promotores y terminador. Polipéptidos de fusión también se pueden construir utilizando tecnología inteína, en la que los polipéptidos de fusión se crean post-traduccionalmente (Cooper et al., 1993, EMBO J. 12: 2575-2583; Dawson et al., 1994, Science 266: 776-779).
Un polipéptido de fusión puede comprender, además, un sitio de escisión entre los dos polipéptidos. Tras la secreción de la proteína de fusión, el sitio se escinde liberando los dos polipéptidos. Ejemplos de sitios de escisión incluyen, pero no se limitan a los sitios descritos en Martin et al., 2003, J. Ind. Microbiol. Biotechnol. 3: 568-576; Svetina et al., 2000, J. Biotechnol. 76: 245-251; Rasmussen-Wilson et al., 1997, Appl. Environ. Microbiol. 63: 3488-3493; Ward et al., 1995, Biotechnology 13: 498-503; y Contreras et al., 1991, Biotechnology 9: 378-381; Eaton et al., 1986, Biochemistry 25: 505-512; Collins-Racie et al., 1995, Biotechnology 13: 982-987; Carter et al., 1989, Proteins: Structure, Function, and Genetics 6: 240-248; y Stevens, 2003, Drug Discovery World 4: 35-48.
En otro aspecto, el parental es una proteasa S53 de Meripilus giganteus, p. ej., la proteasa de SEQ ID NO: 2 o el polipéptido maduro de la misma, descrito en esta memoria como SEQ ID NO: 3.
Preparación de Variantes
Las variantes se pueden preparar utilizando cualquier proceso de mutagénesis conocido en la técnica, tal como mutagénesis dirigida al sitio, construcción de genes sintéticos, construcción de genes semi-sintéticos, mutagénesis aleatoria, transposición, etc.
La mutagénesis dirigida al sitio es una técnica en la que se introducen una o más (p. ej., varias) mutaciones en uno o más sitios definidos en un polinucleótido que codifica el parental.
La mutagénesis dirigida al sitio se puede lograr in vitro mediante PCR que implica el uso de cebadores oligonucleotídicos que contienen la mutación deseada. La mutagénesis dirigida al sitio también se puede realizar in vitro mediante mutagénesis en casete que implica la escisión por una enzima de restricción en un sitio en el plásmido que comprende un polinucleótido que codifica el parental y ligamiento posterior de un oligonucleótido que contiene la mutación en el polinucleótido. Habitualmente, la enzima de restricción que digiere el plásmido y el oligonucleótido es la misma, lo que permite que los extremos pegajosos del plásmido y la inserción se liguen entre sí. Véase, p. ej., Scherer y Davis, 1979, Proc. Natl. Acad. Sci. USA 76: 4949-4955; y Barton et al., 1990, Nucleic Acids Res. 18: 7349­ 4966.
La mutagénesis dirigida al sitio también se puede lograr in vivo mediante métodos conocidos en la técnica. Véase, p. ej., la Publicación de Solicitud de Patente de EE.UU. N° 2004/0171154; Storici et al., 2001, Nature Biotechnol. 19: 773­ 776; Kren et al., 1998, Nat. Med. 4: 285-290; y Calissano y Macino, 1996, Fungal Genet. Newslett. 43: 15-16.
En la presente invención se puede utilizar cualquier proceso de mutagénesis dirigida al sitio. Hay muchos kits comerciales disponibles que se pueden utilizar para preparar variantes.
La construcción de genes sintéticos implica la síntesis in vitro de una molécula de polinucleótido diseñada para codificar un polipéptido de interés. La síntesis de genes se puede realizar utilizando un cierto número de técnicas, tales como la tecnología basada en microchip multiplex descrita por Tian et al. (2004, Nature 432: 1050-1054) y tecnologías similares, en donde los oligonucleótidos se sintetizan y ensamblan en chips de microfluidos fotoprogramables.
Se pueden realizar y testar sustituciones, deleciones y/o inserciones de aminoácidos únicos o múltiples utilizando métodos conocidos de mutagénesis, recombinación y/o transposición, seguidos de un procedimiento de rastreo relevante, tales como los descritos por Reidhaar-Olson y Sauer, 1988, Science 241: 53-57; Bowie y Sauer, 1989, Proc. Natl. Acad. Sci. USA 86: 2152-2156; documentos WO 95/17413; o w O 95/22625. Otros métodos que pueden utilizarse incluyen PCR propensa a errores, presentación de fagos (p. ej., Lowman et a/., 1991, Biochemistry 30: 10832-10837; Patente de EE.UU. N° 5,223,409; documento WO 92/06204) y mutagénesis dirigida a la región (Derbyshire et al., 1986, Gene 46: 145; Ner et al., 1988, DNA 7: 127).
Métodos de mutagénesis / transposición pueden combinarse con métodos de rastreo automatizados de alto rendimiento para detectar la actividad de polipéptidos mutagenizados clonados expresados por células huésped (Ness et al., 1999, Nature Biotechnology 17: 893-896). Moléculas de ADN mutagenizado que codifican polipéptidos activos pueden recuperarse de las células huésped y secuenciarse rápidamente utilizando métodos estándares en la técnica. Estos métodos permiten la determinación rápida de la importancia de los residuos de aminoácidos individuales en un polipéptido.
La construcción de genes semisintéticos se logra combinando aspectos de la construcción de genes sintéticos y/o mutagénesis dirigida al sitio y/o mutagénesis aleatoria y/o transposición. La construcción semisintética se tipifica por un procedimiento que utiliza fragmentos de polinucleótidos que se sintetizan, en combinación con técnicas de PCR. Por lo tanto, regiones definidas de genes pueden sintetizarse de novo, mientras que otras regiones pueden amplificarse utilizando cebadores mutagénicos específicos para el sitio, mientras que aún otras regiones pueden someterse a amplificación por PCR propensa a errores o por PCR no propensa a errores. Las subsecuencias de polinucleótidos pueden luego transponerse.
Polinucleótidos
La presente invención también se refiere a polinucleótidos que codifican una variante de la presente invención.
Construcciones de Ácidos Nucleicos
La presente invención también se refiere a construcciones de ácidos nucleicos que comprenden un polinucleótido que codifica una variante de la presente invención operativamente enlazada a una o más secuencias de control que dirigen la expresión de la secuencia codificante en una célula huésped adecuada bajo condiciones compatibles con las secuencias de control.
El polinucleótido puede manipularse de diversas formas para proporcionar la expresión de una variante. La manipulación del polinucleótido antes de su inserción en un vector puede ser deseable o necesaria dependiendo del vector de expresión. Las técnicas para modificar polinucleótidos utilizando métodos de ADN recombinante son bien conocidas en la técnica.
La secuencia de control puede ser un promotor, un polinucleótido que es reconocido por una célula huésped para la expresión del polinucleótido. El promotor contiene secuencias de control de la transcripción que median en la expresión de la variante. El promotor puede ser cualquier polinucleótido que muestre actividad transcripcional en la célula huésped, incluyendo promotores mutantes, truncados e híbridos, y puede obtenerse de genes que codifican polipéptidos extracelulares o intracelulares homólogos o heterólogos a la célula huésped.
Ejemplos de promotores adecuados para dirigir la transcripción de las construcciones de ácidos nucleicos de la presente invención en una célula huésped filamentosa fúngica son promotores obtenidos de los genes para acetamidasa de Aspergillus nidulans, alfa-amilasa neutra de Aspergillus niger, alfa-amilasa estable a los ácidos de Aspergillus niger, glucoamilasa de Aspergillus niger o Aspergillus awamori (glaA), TAKA amilasa de Aspergillus oryzae, proteasa alcalina de Aspergillus oryzae, triosa fosfato isomerasa de Aspergillus oryzae, proteasa tipo tripsina de Fusarium oxysporum (documento WO 96/00787), amiloglucosidasa de Fusarium venenatum (documento WO 00/56900), Daria de Fusarium venenatum (documento WO 00/56900), Quinn de Fusarium venenatum (documento WO 00/56900), lipasa de Rhizomucor miehei, proteinasa aspártica de Rhizomucor miehei, beta-glucosidasa de Trichoderma reesei, celiobiohidrolasa I de Trichoderma reesei, celiobiohidrolasa II de Trichoderma reesei, endoglucanasa I de Trichoderma reesei, endoglucanasa II deTrichoderma reesei, endoglucanasa III deTrichoderma reesei, endoglucanasa IV de Trichoderma reesei, endoglucanasa V de Trichoderma reesei, xilanasa I de Trichoderma reesei, xilanasa II de Trichoderma reesei, beta-xilosidasa de Trichoderma reesei, así como el promotor NA2-tpi (un promotor modificado de un gen de alfa-amilasa neutro de Aspergillus, en el que el conductor no traducido ha sido reemplazado por un conductor no traducido de un gen de triosa fosfato isomerasa de Aspergillus; ejemplos no limitantes incluyen promotores modificados de un gen de alfa-amilasa neutra de Aspergillus niger en el que el conductor no traducido ha sido reemplazado por un conductor no traducido de un gen de triosa fosfato isomerasa de Aspergillus nidulans o Aspergillus oryzae); y promotores mutantes, truncados e híbridos de los mismos.
La secuencia de control también puede ser un terminador de la transcripción, que es reconocido por una célula huésped para terminar la transcripción. La secuencia del terminador está enlazada operativamente al extremo 3’ del polinucleótido que codifica la variante. Puede utilizarse cualquier terminador que sea funcional en la célula huésped.
Terminadores preferidos para células huéspedes filamentosas fúngicas se obtienen de los genes para antranilato sintasa de Aspergillus nidulans, glucoamilasa de Aspergillus niger, alfa-glucosidasa de Aspergillus niger, TAKA amilasa de Aspergillus oryzae y proteasa tipo tripsina de Fusarium oxysporum.
La secuencia de control también puede ser una región estabilizadora de ARNm aguas abajo de un promotor y aguas arriba de la secuencia codificante de un gen que aumenta la expresión del gen.
La secuencia de control también puede ser un conductor, una región no traducida de un ARNm que es importante para la traducción por parte de la célula huésped. La secuencia del conductor está enlazada operativamente al extremo 5’ del polinucleótido que codifica la variante. Puede utilizarse cualquier conductor que sea funcional en la célula huésped.
Conductores preferidos para las células huésped fúngicas filamentosas se obtienen a partir de los genes de la TAKA amilasa de Aspergillus oryzae y la triosa fosfato isomerasa de Aspergillus nidulans.
La secuencia de control también puede ser una secuencia de poliadenilación, una secuencia enlazada operativamente al extremo 3’ de la secuencia que codifica la variante y, cuando se transcribe, es reconocida por la célula huésped como una señal para añadir residuos de poliadenosina al ARNm transcrito. Puede utilizarse cualquier secuencia de poliadenilación que sea funcional en la célula huésped.
Secuencias de poliadenilación preferidas para células huéspedes filamentosas fúngicas se obtienen de los genes para antranilato sintasa de Aspergillus nidulans, glucoamilasa de Aspergillus niger, alfa-glucosidasa de Aspergillus niger, TAKA amilasa de Aspergillus oryzae y proteasa tipo tripsina de Fusarium oxysporum.
La secuencia de control también puede ser una región codificante de péptido señal que codifica un péptido señal enlazado al extremo N de una variante y dirige la variante hacia la vía secretora de la célula. El extremo 5’ de la secuencia codificante del polinucleótido puede contener inherentemente una secuencia codificante del péptido señal enlazada de forma natural en el marco de lectura de traducción con el segmento de la secuencia codificante que codifica la variante. Alternativamente, el extremo 5’ de la secuencia codificante puede contener una secuencia codificante del péptido señal que es extraña a la secuencia codificante. Puede ser necesaria una secuencia codificante de péptido señal extraña, en los casos en los que la secuencia codificante no contiene de forma natural una secuencia codificante de péptido señal. Alternativamente, una secuencia codificante del péptido señal extraña puede simplemente reemplazar la secuencia codificante del péptido señal natural con el fin de potenciar la secreción de la variante. Sin embargo, puede utilizarse cualquier secuencia codificante de péptido señal que dirija la variante expresada hacia la vía secretora de una célula huésped.
Secuencias codificantes para el péptido señal eficaces para las células huéspedes filamentosas fúngicas son las secuencias codificantes de péptido señal obtenidas de los genes para amilasa neutra de Aspergillus niger, nigerglucoamilasa de Aspergillus, TAKA amilasa de Aspergillus oryzae, celulasa de Humicola insolens, endoglucanasa V de Humicola insolens, lipasa de Humicola lanuginosa proteinasa aspártica de Rhizomucor miehei.
La secuencia de control también puede ser una secuencia codificante de propéptido que codifica un propéptido situado en el extremo N de una variante. El polipéptido resultante se conoce como una proenzima o propolipéptido (o un zimógeno en algunos casos). Un propolipéptido es generalmente inactivo y puede convertirse en un polipéptido activo por escisión catalítica o autocatalítica del propéptido del propolipéptido. La secuencia codificante del propéptido puede obtenerse de los genes de lacasa de Myceliophthora thermophila (documento WO 95/33836), proteinasa aspártica de Rhizomucor miehei.
En los casos en los que están presentes tanto el péptido señal como las secuencias propéptido, la secuencia del propéptido está dispuesta junto al extremo N de la variante y la secuencia del péptido señal está dispuesta junto al extremo N de la secuencia del propéptido.
También puede ser deseable añadir secuencias reguladoras que regulen la expresión de la variante en relación con el crecimiento de la célula huésped. Ejemplos de sistemas reguladores son aquellos que provocan que la expresión del gen se active o desactive en respuesta a un estímulo químico o físico, incluyendo la presencia de un compuesto regulador. Sistemas reguladores en los sistemas procarióticos incluyen los sistemas de operador lac, tac y trp. En levaduras se puede utilizar el sistema ADH2 o el sistema GAL1. En hongos filamentosos se pueden utilizar el promotor de glucoamilasa de Aspergillus niger, el promotor de TAKA alfa-amilasa de Aspergillus oryzae y el promotor de glucoamilasa de Aspergillus oryzae. Otros ejemplos de secuencias reguladoras son aquellas que permiten la amplificación de genes. En los sistemas eucariotas, estas secuencias reguladoras incluyen el gen de la dihidrofolato reductasa que se amplifica en presencia de metotrexato y los genes de metalotioneína que se amplifican con metales pesados. En estos casos, el polinucleótido que codifica la variante estaría operativamente enlazado con la secuencia reguladora.
Vectores de Expresión
La presente invención también se refiere a vectores de expresión recombinantes que comprenden un polinucleótido que codifica una variante de la presente invención, un promotor y señales de parada transcripcionales y traduccionales. Las diversas secuencias de nucleótidos y de control pueden unirse para producir un vector de expresión recombinante que puede incluir uno o más sitios de restricción convenientes para permitir la inserción o sustitución del polinucleótido que codifica la variante en dichos sitios. Alternativamente, el polinucleótido puede expresarse insertando el polinucleótido o una construcción de ácido nucleico que comprende el polinucleótido en un vector apropiado para la expresión. Al crear el vector de expresión, la secuencia codificante se localiza en el vector de modo que la secuencia codificante esté enlazada operativamente con las secuencias de control apropiadas para la expresión.
El vector de expresión recombinante puede ser cualquier vector (p..ej, un plásmido o virus) que pueda someterse convenientemente a procesos de ADN recombinante y pueda provocar la expresión del polinucleótido. La elección del vector dependerá típicamente de la compatibilidad del vector con la célula huésped en la que se ha de introducir el vector. El vector puede ser un plásmido lineal o circular cerrado.
El vector puede ser un vector de replicación autónoma, es decir, un vector que existe como una entidad extracromosómica, cuya replicación es independiente de la replicación cromosómica, p..ej, un plásmido, un elemento extracromosómico, un minicromosoma o un cromosoma artificial. El vector puede contener cualquier medio para asegurar la autorreplicación. Alternativamente, el vector puede ser uno que, cuando se introduce en la célula huésped, se integra en el genoma y se replica junto con el o los cromosomas en los que se ha integrado. Además, se puede utilizar un solo vector o plásmido o dos o más vectores o plásmidos que juntos contienen el ADN total a introducir en el genoma de la célula huésped, o un transposón.
El vector contiene preferiblemente uno o más marcadores seleccionables que permiten una fácil selección de células transformadas, transfectadas, transducidas o similares. Un marcador seleccionable es un gen cuyo producto proporciona resistencia a biocidas o virus, resistencia a metales pesados, prototrofia a auxótrofos y similares.
Marcadores seleccionables para el uso en una célula huésped filamentosa fúngica incluyen, pero no se limitan a amdS (acetamidasa), argB (ornitina carbamoiltransferasa), bar (fosfinotricina acetiltransferasa), hph (higromicina fosfotransferasa), niaD (nitrato reductasa), pyrG (orotidina -5’-fosfato descarboxilasa), sC (sulfato adeniltransferasa) y trpC (antranilato sintasa), así como equivalentes de los mismos. Uso preferido en una célula de Aspergillus son genes de Aspergillus nidulans o Aspergillus oryzae niaD, niiA, amdS y pyrG y un gen de Streptomyces hygroscopicus bar
El vector contiene preferiblemente un o unos elementos que permiten la integración del vector en el genoma de la célula huésped o la replicación autónoma del vector en la célula independientemente del genoma.
Para la integración en el genoma de la célula huésped, el vector puede depender de la secuencia del polinucleótido que codifica la variante o cualquier otro elemento del vector para la integración en el genoma mediante recombinación homóloga o no homóloga. Alternativamente, el vector puede contener polinucleótidos adicionales para dirigir la integración mediante recombinación homóloga en el genoma de la célula huésped en una ubicación o ubicaciones precisas en el o los cromosomas. Para aumentar la probabilidad de integración en una ubicación precisa, los elementos integradores deben contener un número suficiente de ácidos nucleicos, tal como 100 a 10.000 pares de bases, 400 a 10.000 pares de bases y 800 a 10.000 pares de bases, que tienen un alto grado de identidad de secuencia con la secuencia diana correspondiente para potenciar la probabilidad de recombinación homóloga. Los elementos de integración pueden ser cualquier secuencia que sea homóloga a la secuencia diana en el genoma de la célula huésped. Además, los elementos de integración pueden ser polinucleótidos no codificantes o codificantes. Por otro lado, el vector puede integrarse en el genoma de la célula huésped mediante recombinación no homóloga.
Para la replicación autónoma, el vector puede comprender, además, un origen de replicación que permite que el vector se replique de forma autónoma en la célula huésped en cuestión. El origen de la replicación puede ser cualquier replicador de plásmido que medie en la replicación autónoma que funcione en una célula. La expresión "origen de replicación" o "replicador de plásmido" significa un polinucleótido que permite que un plásmido o vector se replique in vivo.
Ejemplos de orígenes de replicación útiles en una célula fúngica filamentosa son AMA1 y ANS1 (Gems et a/., 1991, Gene 98: 61-67; Cullen et al., 1987, Nucleic Acids Res. 15: 9163-9175; documento WO 00/24883). El aislamiento del gen AMA1 y la construcción de plásmidos o vectores que comprenden el gen se pueden lograr de acuerdo con los métodos descritos en el documento WO 00/24883.
Puede insertarse más de una copia de un polinucleótido de la presente invención en una célula huésped para aumentar la producción de una variante. Se puede obtener un aumento en el número de copias del polinucleótido integrando al menos una copia adicional de la secuencia en el genoma de la célula huésped o incluyendo un gen marcador seleccionable amplificable con el polinucleótido en los casos en los que células que contienen copias amplificadas del gen marcador seleccionable y, con ello, copias adicionales del polinucleótido se pueden seleccionar cultivando las células en presencia del agente seleccionable apropiado.
Los procesos utilizados para ligar los elementos arriba descritos para construir los vectores de expresión recombinantes de la presente invención son bien conocidos por los expertos en la técnica (véase, p. ej., Sambrook et al., 1989, supra).
Célula Huéspedes
La presente invención también se refiere a células huéspedes recombinantes que comprenden un polinucleótido que codifica una variante de la presente invención operativamente enlazada a una o más secuencias de control que dirigen la expresión de una variante de la presente invención. En una realización particular, la célula huésped recombinante comprende el polinucleótido que codifica un polipéptido de trehalasa de la presente invención, en el que dicho polinucleótido es heterólogo (de diferente origen/especie) a la célula huésped. Una construcción o vector que comprende un polinucleótido se introduce en una célula huésped, de modo que la construcción o el vector se mantenga como un integrante cromosómico o como un vector extra-cromosómico autorreplicante tal como se describió anteriormente. La expresión "célula huésped" abarca cualquier progenie de una célula madre que no sea idéntica a la célula madre debido a mutaciones que se producen durante la replicación. La elección de una célula huésped dependerá en gran medida del gen que codifica la variante y su fuente.
La célula huésped puede ser cualquier célula útil en la producción recombinante de una variante, p. ej., un procariota o un eucariota.
La célula huésped puede ser una célula fúngica. "Hongos", tal como se utiliza en esta memoria incluye los filos Ascomycota, Basidiomycota, Chytridiomycota y Zygomycota, así como el Oomycota y todos los hongos mitospóricos (tal como se define por Hawksworth et al., En, Dictionary of The Fungi de Ainsworth y Bisby, 8a edición, 1995, CAB International, University Press, Cambridge, Reino Unido).
La célula huésped fúngica puede ser una célula de levadura. "Levadura", tal como se utiliza en esta memoria, incluye levadura ascosporógena (Endomycetales), levadura basidiosporógena y levadura perteneciente a los hongos imperfectos (Blastomycetes). Dado que la clasificación de las levaduras puede cambiar en el futuro, para los fines de esta invención la levadura se definirá como se describe en Biology and Activities of Yeast (Skinner, Passmore y Davenport, editores, Soc. App. Bacteriol. Symposium Series N°. 9, 1980).
La célula huésped de levadura puede ser una célula de Candida, Hansenula, Kluyveromyces, Pichia, Saccharomyces, Schizosaccharomyces, o Yarrowia , tal como una célula de Kluyveromyces lactis, Saccharomyces carlsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccharomyces oviformis, o Yarrowia lipolytica.
La célula huésped fúngica puede ser una célula fúngica filamentosa. "Hongos filamentosos" incluyen todas las formas filamentosas de la subdivisión Eumycota y Oomycota (tal como se define por Hawksworth et al., 1995, supra).. Los hongos filamentosos se caracterizan generalmente por una pared micelial compuesta de quitina, celulosa, glucano, quitosano, manano y otros polisacáridos complejos. El crecimiento vegetativo se produce por elongación de las hifas y el catabolismo de carbono es obligatoriamente aerobio. Por el contrario, el crecimiento vegetativo de levaduras tales como Saccharomyces cerevisiae se produce mediante la gemación de un talo unicelular y el catabolismo del carbono puede ser fermentativo.
La célula fúngica filamentosa puede ser una célula de Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filibasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trametes, o Trichoderma.
Por ejemplo, la célula fúngica filamentosa puede ser una célula de Aspergillus awamori, Aspergillus foetidus, Aspergillus fumigatus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis pannocinta, Ceriporiopsis rivulosa, Ceriporiopsis subrufa, Ceriporiopsis subvermispora, Chrysosporium inops, Chrysosporium keratinophilum, Chrysosporium lucknowense, Chrysosporium merdarium, Chrysosporium pannicola, Chrysosporium queenslandicum, Chrysosporium tropicum, Chrysosporium zonatum, Coprinus cinereus, Coriolus hirsutus, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporíum, Phlebia radiata, Pleurotus eryngii, Thielavia terrestris, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, o Trichoderma viride
Las células fúngicas se pueden transformar mediante un procedimiento que implica la formación de protoplastos, la transformación de los protoplastos y la regeneración de la pared celular de una manera conocida per se. Procesos adecuados para la transformación de células huésped de Aspergillus yTrichoderma se describen en el documento EP 238023, Yelton et al., 1984, Proc. Natl. Acad. Sci. USA 81: 1470-1474, y Christensen et al., 1988, Bio/Technology 6: 1419-1422. Métodos adecuados para transformar especies de Fusarium se describen por Malardier et al., 1989, Gene 78: 147-156, y documento WO 96/00787. La levadura se puede transformar utilizando los procesos descritos por Becker y Guarente, In Abelson, J.N. y Simon, M.I., editores, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volumen 194, pp 182-187, Academic Press, Inc., Nueva York; Ito et al., 1983, J. Bacteriol. 153: 163; y Hinnen et al., 1978, Proc. Natl. Acad. Sci. USA 75: 1920.
Métodos de Producción
La presente invención también se refiere a métodos para producir una variante, que comprenden: (a) cultivar una célula huésped recombinante de la presente invención en condiciones adecuadas para la expresión de la variante; y (b) recuperar la variante.
Las células huésped se cultivan en un medio nutritivo adecuado para la producción de la variante utilizando métodos conocidos en la técnica. Por ejemplo, la célula puede cultivarse mediante cultivo en matraz de agitación o fermentación a pequeña o gran escala (incluyendo fermentaciones continuas, por lotes, por lotes alimentados o en estado sólido) en fermentadores de laboratorio o industriales realizados en un medio adecuado y en condiciones que permiten expresar y/o aislar la variante. El cultivo tiene lugar en un medio nutriente adecuado que comprende fuentes de carbono y nitrógeno y sales inorgánicas, utilizando procedimientos conocidos en la técnica. Medios adecuados están disponibles de proveedores comerciales o pueden prepararse de acuerdo con composiciones publicadas (p. ej., en catálogos de American Type Culture Collection). Si la variante se secreta en el medio nutritivo, la variante se puede recuperar directamente del medio. Si la variante no se secreta, se puede recuperar de los lisados celulares.
La variante puede detectarse utilizando métodos conocidos en la técnica que son específicos para las variantes. Estos métodos de detección incluyen, pero no se limitan al uso de anticuerpos específicos, la formación de un producto enzimático o la desaparición de un sustrato enzimático. Por ejemplo, puede utilizarse un ensayo enzimático para determinar la actividad de la variante.
La variante se puede recuperar utilizando métodos conocidos en la técnica. Por ejemplo, la variante puede recuperarse del medio nutriente mediante procesos convencionales que incluyen, pero no se limitan a recogida, centrifugación, filtración, extracción, secado por pulverización, evaporación o precipitación.
La variante puede purificarse mediante una diversidad de procedimientos conocidos en la técnica que incluyen, pero no se limitan a cromatografía (p. ej., de intercambio iónico, de afinidad, hidrofóbica, de cromatoenfoque y de exclusión por tamaño), procesos electroforéticos (p. ej., enfoque isoeléctrico preparativo), solubilidad diferencial. (p. ej., precipitación con sulfato de amonio), SDS-PAGE, o extracción (véase, p. ej., Protein Purification, Janson y Ryden, editores, VCH Publishers, Nueva York, 1989) para obtener variantes sustancialmente puras.
En un aspecto alternativo, la variante no se recupera, sino que se utiliza una célula huésped de la presente invención que expresa la variante como una fuente de la variante.
Composiciones Enzimáticas
La presente invención también se refiere a composiciones que comprenden una proteasa variante de la invención. Preferiblemente, las composiciones están enriquecidas en una proteasa de este tipo. El término "enriquecido" indica que la actividad pululanasa de la composición se ha incrementado, p. ej., con un factor de enriquecimiento de al menos 1,1.
Las composiciones pueden comprender la proteasa variante S53 como componente enzimático principal, p. ej., una composición mono-componente. Alternativamente, las composiciones pueden comprender múltiples actividades enzimáticas, tales como la proteasa variante S53 y una o más (p. ej., varias) enzimas seleccionadas del grupo que consiste en hidrolasa, isomerasa, ligasa, liasa, oxidorreductasa o transferasa, p. ej., una alfa- galactosidasa, alfaglucosidasa, aminopeptidasa, alfa-amilasa, beta-amilasa, beta-galactosidasa, beta-glucosidasa, beta-xilosidasa, carbohidrasa, carboxipeptidasa, catalasa, celobiohidrolasa, celulasa, quitinasa, cutinasa, ciclodextrina glicosiltransferasa, glucoamilasa, invertasa, lacasa, lipasa, manosidasa, mutanasa, oxidasa, enzima pectinolítica, peroxidasa, fitasa, polifenoloxidasa, proteasa, ribonucleasa, transglutaminasa o xilanasa. En una realización, la composición comprende una proteasa S53 variante de la invención y una enzima generadora de fuente de hidratos de carbono y opcionalmente una alfa-amilasa. En una realización particular, la composición comprende una proteasa variante S53 y una glucoamilasa. Preferiblemente, las actividades enzimáticas comprendidas en la composición se seleccionan de la proteasa S53 variante de la invención y una o más enzimas seleccionadas del grupo que consiste en glucoamilasa, alfa-amilasa fúngica.
En una realización, la glucoamilasa comprendida en la composición es de origen fúngico, preferiblemente de una cepa de Aspergillus, preferiblemente A. niger, A. awamori, o A. oryzae; o una cepa de Trichoderma, preferiblemente T. reesei;o una cepa de Talaromyces, preferiblemente T. emersoniio una cepa de Trametes, preferiblemente T. cingulata, o una cepa de Pycnoporus, preferiblemente P. sanguineus, o una cepa de Gloeophyllum, tal como G. serpiarium o G. trabeum, o una cepa de Nigrofomes.
En una realización, la glucoamilasa se deriva de Trametes, tal como una cepa de Trametes cingulata, tal como la que se muestra en la SEQ ID NO: 4 en esta memoria.
En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 4 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 4 en esta memoria.
En una realización, la glucoamilasa se deriva de Talaromyces, tal como una cepa de Talaromyces emersonii, tal como la que se muestra en la SEQ ID NO: 5 en esta memoria.
En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 5 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 5 en esta memoria.
En una realización, la glucoamilasa se deriva de una cepa del género Pycnoporus, en particular una cepa de Pycnoporus sanguineus descrita en el documento WO 2011/066576 (SEQ ID NOs 2, 4 o 6), tal como la que se muestra como SEQ ID NO: 4 en el documento WO 2011/066576.
En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 6 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 6 en esta memoria.
En una realización, la glucoamilasa se deriva de una cepa del género Gloeophyllum, tal como una cepa de Gloeophyllum sepiarium o Gloeophyllum trabeum, en particular una cepa de Gloeophyllum, tal como se describe en el documento WO 2011/068803 (SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 o 16). En una realización preferida, la glucoamilasa es Gloeophyllum sepiarium mostrada en SEQ iD NO: 2 en el documento WO 2011/068803 o SEQ ID NO: 7 en esta memoria.
En una realización, la glucoamilasa se deriva de Gloeophyllum serpiarium, tal como la que se muestra en la SEQ ID NO: 7 en esta memoria. En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 7 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 7 en esta memoria.
En otra realización, la glucoamilasa se deriva de Gloeophyllum trabeum tal como la que se muestra en la SEQ ID NO: 8 en esta memoria. En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 8 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p. ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 8 en esta memoria.
En una realización, la glucoamilasa se deriva de una cepa del género Nigrofomes,, en particular una cepa de Nigrofomes sp. descrita en el documento WO 2012/064351.
En una realización, las glucoamilasas pueden añadirse a la sacarificación y/o fermentación en una cantidad de 0,0001­ 20 AGU/g DS, preferiblemente 0,001 -10 AGU/g DS, especialmente entre 0,01 -5 AGU/g DS, tal como 0,1-2 AGU/g DS.
Composiciones disponibles comercialmente que comprenden glucoamilasa incluyen AMG 200L; AMG 300 L; SAN™ SUPER, SAN™ EXTRA L, SPIRIZYME™ PLUS, SPIRIZYME™ FUEL, SPIRIZYME™ B4U, SPIRIZYME™ ULTRA, SPIRIZYME™ EXCEL y AMG™ E (de Novozymes A/S); OPTIDEX™ 300, GC480, GC417 (de DuPont.); AMIGASE™ y AMIGASE™ PLUS (de DSM); G-ZYME™ G900, G-ZYME™ y G990 ZR (de DuPont).
Además de una glucoamilasa, la composición puede comprender, además, una alfa-amilasa. Particularmente, la alfaamilasa es una alfa-amilasa fúngica ácida. Una alfa-amilasa estable al ácido fúngico es una alfa-amilasa que tiene actividad en el intervalo de pH de 3,0 a 7,0 y preferiblemente en el intervalo de pH de 3,5 a 6,5, incluida la actividad a un pH de aproximadamente 4,0, 4,5, 5,0, 5,5 y 6,0.
Preferiblemente, la alfa-amilasa fúngica ácida se deriva del género Aspergillus, especialmente una cepa de A. terreus, A. niger, A. oryzae, A. awamori, o Aspergillus kawachii, o del género Rhizomucor, preferiblemente una cepa de Rhizomucorpusillus,, o el género Meripilus,, preferiblemente una cepa de Meripilus giganteus.
En una realización preferida, la alfa-amilasa se deriva de una cepa del género Rhizomucor, preferiblemente una cepa de Rhizomucor pusillus, tal como la que se muestra en la SEQ ID NO: 3 en el documento WO 2013/006756, tal como un híbrido de alfa-amilasa de Rhizomucor pusillus que tiene un enlazador de Aspergillus niger y un dominio de unión a almidón, tal como el que se muestra en la SEQ ID NO: 9 en esta memoria, o una variante del mismo.
En una realización, la alfa-amilasa se selecciona del grupo que consiste en:
(i) una alfa-amilasa que comprende el polipéptido de SEQ ID NO: 9 en esta memoria;
(ii) una alfa-amilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 9 en esta memoria.
En una realización preferida, la alfa-amilasa es una variante de la alfa-amilasa mostrada en SEQ ID NO: 9 que tiene al menos una de las siguientes sustituciones o combinaciones de sustituciones: D165M; Y141W; Y141R; K136F; K192R; P224A; P224R; S123H Y141W; G20S Y141W; A76G Y141W; G128D Y141W; G128D D143N; P219C Y141W; N142D D143N; Y141W K192R; Y141W D143N; Y141W N383R; Y141W P219C A265C; Y141W N142D D143N; Y141W K192R V410A; G128D Y141W D143N; Y141W D143N P219C; Y141W D143N K192R; G128D D143N K192R; Y141W D143N K192R P219C; G128D Y141W D143N K192R; o G128D Y141W D143N K192R P219C (utilizando la SEQ ID NO: 9 para la numeración).
En una realización, la alfa-amilasa se deriva de un Rhizomucor pusillus con un enlazador de glucoamilasa de Aspergillus niger y un dominio de unión a almidón (SBD), preferiblemente descrito como SEC ID NO: 9 en esta memoria, preferiblemente con una o más de las siguientes sustituciones: G128D, D143N, preferiblemente G128D D143N (utilizando SEQ ID NO: 9 para numeración), y en donde la variante de alfa-amilasa tiene al menos 75% de identidad preferiblemente al menos 80%, más preferiblemente al menos 85%, más preferiblemente al menos 90%, más preferiblemente al menos 91%, más preferiblemente al menos 92%, incluso más preferiblemente al menos 93%, lo más preferiblemente al menos 94%, e incluso lo más preferiblemente al menos 95%, tal como incluso al menos 96%, al menos 97% , al menos 98%, al menos 99%, pero menos del 100% de identidad con el polipéptido de SEQ ID NO: 9 en esta memoria.
En una realización preferida, la relación entre glucoamilasa y alfa-amilasa presente y/o añadida durante la sacarificación y/o fermentación puede estar preferiblemente en el intervalo de 500:1 a 1:1, tal como de 250:1 a 1:1, tal como como de 100:1 a 1: 1, tal como de 100: 2 a 100:50, tal como de 100:3 a 100:70.
Las composiciones se pueden preparar de acuerdo con métodos conocidos en la técnica y pueden estar en forma de una composición líquida o seca. Por ejemplo, la composición puede estar en forma de granulado o microgranulado. La variante puede estabilizarse de acuerdo con métodos conocidos en la técnica.
Las composiciones se pueden preparar de acuerdo con métodos conocidos en la técnica y pueden estar en forma de una composición líquida o seca. Las composiciones se pueden estabilizar de acuerdo con métodos conocidos en la técnica.
La composición enzimática de la presente invención puede estar en cualquier forma adecuada para su uso, tal como, por ejemplo, un caldo de fermentación bruto con o sin células eliminadas, un lisado celular con o sin desechos celulares, una composición enzimática semi-purificada o purificada, o una célula huésped, como fuente de las enzimas.
La composición enzimática puede ser un polvo o granulado seco, un granulado que no espolvorea, un líquido, un líquido estabilizado o una enzima protegida estabilizada. Composiciones líquidas de enzimas pueden, por ejemplo, estabilizarse añadiendo estabilizadores tales como un azúcar, un alcohol de azúcar u otro poliol y/o ácido láctico u otro ácido orgánico de acuerdo con procesos establecidos.
Uso de las proteasas variantes de la invención
Procesamiento de Almidón
El almidón nativo consiste en gránulos microscópicos, que son insolubles en agua a temperatura ambiente. Cuando se calienta la suspensión acuosa de almidón, los gránulos se hinchan y finalmente estallan, dispersando las moléculas de almidón en la solución. A temperaturas de hasta aproximadamente 50°C a 75°C, el hinchamiento puede ser reversible. Sin embargo, con temperaturas más altas comienza un hinchamiento irreversible denominado "gelatinización". Durante este proceso de "gelatinización" hay un aumento drástico de la viscosidad. El almidón granular a procesar puede ser una calidad de almidón altamente refinado, preferiblemente al menos 90%, al menos 95%, al menos 97% o al menos 99,5% puro o puede ser materiales que contengan almidón más bruto que comprenda (p. ej., molidos) cereales integrales, incluyendo las fracciones que no contienen almidón, tales como residuos de gérmenes y fibras. El material bruto, como los cereales integrales, puede reducirse en tamaño de partícula, p. ej., mediante molienda, con el fin de abrir la estructura y permitir un procesamiento adicional. En la molienda en seco, se muelen y utilizan granos enteros. La molienda húmeda da una buena separación de germen y harina (gránulos de almidón y proteína) y a menudo se aplica en lugares en los que el hidrolizado de almidón se utiliza en la producción de, p. ej., jarabes. Tanto la trituración en seco como en húmedo es bien conocida en la técnica del procesamiento de almidón y puede utilizarse en un procedimiento de la invención. Los métodos para reducir el tamaño de partícula del material que contiene almidón son bien conocidos por los expertos en la técnica.
Como el nivel de sólidos es del 30-40% en un procedimiento industrial típico, el almidón debe diluirse o "licuarse" para que pueda procesarse adecuadamente. Esta reducción de la viscosidad se logra principalmente mediante la degradación enzimática en la práctica comercial actual.
La licuefacción se lleva a cabo en presencia de una alfa-amilasa, preferiblemente una alfa-amilasa bacteriana y/o alfaamilasa fúngica ácida. En una realización, también está presente una fitasa durante la licuefacción. En una realización, también están presentes durante la licuefacción enzimas reductoras de la viscosidad tales como xilanasa y/o betaglucanasa.
Durante la licuefacción, el almidón de cadena larga se degrada en unidades más cortas ramificadas y lineales (maltodextrinas) mediante una alfa-amilasa. La licuefacción se puede llevar a cabo como un procedimiento de suspensión caliente de tres etapas. La suspensión se calienta entre 60-95°C (p. ej., 70-90°C, tal como 77-86°C, 80-85°C, 83-85°C) y se añade una alfa-amilasa para iniciar la licuefacción (dilución).
En una realización, la suspensión se puede cocer a chorro a entre 95-140°C, p. ej., 105-125°C, durante aproximadamente 1-15 minutos, p.ej., aproximadamente 3-10 minutos, especialmente alrededor de 5 minutos. Luego, la suspensión se enfría a 60-95°C y se añade más alfa-amilasa para obtener la hidrólisis final (licuefacción secundaria). El procedimiento de cocción a chorro se lleva a cabo a pH 4,5-6,5, típicamente a un pH entre 5 y 6. La alfa-amilasa se puede añadir como una dosis única, p. ej., antes de la cocción a chorro.
El procedimiento de licuefacción se lleva a cabo entre 70-95°C, tal como 80-90°C, tal como alrededor de 85°C, durante aproximadamente 10 minutos a 5 horas, típicamente durante 1-2 horas. El pH está entre 4 y 7, tal como entre 4,5 y 5,5. Con el fin de asegurar una estabilidad enzimática óptima bajo estas condiciones, se puede añadir opcionalmente calcio (para proporcionar 1 -60 ppm de iones calcio libres, tales como aproximadamente 40 ppm de iones calcio libres). Después de un tratamiento de este tipo, el almidón licuado tendrá típicamente un "equivalente de dextrosa" (DE) de 10-15.
Generalmente, la licuefacción y las condiciones de licuefacción son bien conocidas en la técnica.
Alfa-amilasas para uso en licuefacción son preferiblemente alfa-amilasas estables a los ácidos bacterianas. Particularmente, la alfa-amilasa es de una Exiguobacterium sp. o una Bacillus sp., tal como, p, ej., Bacillus stearothermophilus o Bacillus licheniformis..
En una realización, la alfa-amilasa es del género Bacillus,, tal como una cepa de Bacillus stearothermophilus, en particular una variante de una alfa-amilasa de Bacillus stearothermophilus, tal como la que se muestra en SEQ ID NO: 3 en el documento WO 99/019467 o SEQ ID NO: 10 en esta memoria.
En una realización, la alfa-amilasa de Bacillus stearothermophilus tiene una deleción doble de dos aminoácidos en la región de la posición 179 a 182, más particularmente una deleción doble en las posiciones 1181 G182, R179 G180, G180 1181, R179 1181 o G180 G182, preferiblemente 1181 G182, y opcionalmente una sustitución N193F (utilizando la SEQ ID NO: 10 para la numeración).
En una realización, la alfa-amilasa de Bacillus stearothermophilus tiene una sustitución en la posición S242, preferiblemente una sustitución S242Q.
En una realización, la alfa-amilasa de Bacillus stearothermophilus tiene una sustitución en la posición E188, preferiblemente una sustitución E188P.
En una realización, la alfa-amilasa se selecciona del grupo de variantes de alfa-amilasa de Bacillus stearothermophilus con las siguientes mutaciones:
• I181*+G182*+N193F+E129V+K177L+R179E;
• I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L Q254S;
• I181*+G182*+N193F V59A Q89R+ E129V+ K177L+ R179E+ Q254S+ M284V; y
• I181*+G182*+N193F+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S (utilizando la SEQ ID NO: 10 para la numeración).
En una realización, la variante de alfa-amilasa tiene al menos 75% de identidad, preferiblemente al menos 80%, más preferiblemente al menos 85%, más preferiblemente al menos 90%, más preferiblemente al menos 91%, más preferiblemente al menos 92%, incluso más preferiblemente al menos 93%, lo más preferiblemente al menos 94%, e incluso lo más preferiblemente al menos 95%, tal como incluso al menos 96%, al menos 97% , al menos 98%, al menos 99%, pero menos del 100% de identidad con el polipéptido de SEQ ID NO: 10.
Debe entenderse que cuando se hace referencia a la alfa-amilasa de Bacillus stearothermophilus y variantes de la misma, normalmente se producen en forma truncada. En particular, el truncamiento puede ser tal que la alfa-amilasa de Bacillus stearothermophilus mostrada en SEQ ID NO: 3 en el documento WO 99/19467 o SEQ ID NO: 10 en esta memoria, o variantes de la misma, se truncan en el C terminal preferiblemente para tener alrededor de 490 aminoácidos, tal como 482-493 aminoácidos. Preferiblemente, la alfa-amilasa variante de Bacillus stearothermophilus está truncada, preferiblemente después de la posición 484 de SEQ ID NO: 10, particularmente después de la posición 485, particularmente después de la posición 486, particularmente después de la posición 487, particularmente después de la posición 488, particularmente después de la posición 489, particularmente después de la posición 490, particularmente después de la posición 491, particularmente después de la posición 492, más particularmente después de la posición 493.
La sacarificación se puede llevar a cabo utilizando condiciones bien conocidas en la técnica con una enzima generadora de fuente de hidratos de carbono, en particular una glucoamilasa o una beta-amilasa y opcionalmente una enzima desramificante, tal como una isoamilasa o una pululanasa. Por ejemplo, una etapa de sacarificación completa puede durar de aproximadamente 24 a aproximadamente 72 horas. Sin embargo, es común hacer una pre­ sacarificación de típicamente 40-90 minutos a una temperatura entre 30-65°C, típicamente alrededor de 60°C, seguida de sacarificación completa durante la fermentación en un procedimiento de sacarificación y fermentación simultánea (SSF). La sacarificación se lleva a cabo típicamente a una temperatura en el intervalo de 20-75°C, p. ej., 25-65°C y 40-70°C, típicamente alrededor de 60°C, y a un pH entre aproximadamente 4 y 5, normalmente a aproximadamente pH 4,5.
Las etapas de sacarificación y fermentación se pueden llevar a cabo de forma secuencial o simultánea. En una forma de realización, la sacarificación y la fermentación se realizan simultáneamente (a lo que se alude como "SSF"). Sin embargo, es común realizar una etapa de pre-sacarificación durante aproximadamente 30 minutos a 2 horas (p. e j, 30 a 90 minutos) a una temperatura de 30 a 65°C, típicamente alrededor de 60°C, seguido de una sacarificación completa durante la fermentación, conocida como sacarificación y fermentación simultáneas (SSF). El pH está habitualmente entre 4,2 y 4,8, p. ej., pH 4,5. En un procedimiento de sacarificación y fermentación simultáneas (SSF), no hay una fase de retención para la sacarificación, más bien la levadura y las enzimas se añaden juntas.
En un procedimiento de sacarificación típico, las maltodextrinas producidas durante la licuefacción se convierten en dextrosa mediante la adición de una glucoamilasa y una enzima desramificante, tal como una isoamilasa (Patente de EE.UU. N° 4.335.208) o una pululanasa. La temperatura se reduce a 60°C antes de la adición de glucoamilasa y enzima desramificante. El procedimiento de sacarificación continúa durante 24-72 horas. Antes de la adición de las enzimas sacarificantes, el pH se reduce por debajo de 4,5, mientras se mantiene una temperatura alta (por encima de 95°C), para inactivar la alfa-amilasa licuante. Este procedimiento reduce la formación de oligosacáridos cortos denominados "precursores de panosa", que no pueden ser hidrolizados adecuadamente por la enzima desramificante. Normalmente, aproximadamente el 0,2-0,5% del producto de sacarificación es el trisacárido panosa ramificado (Glc pa1-6Glc pa1-4Glc), que no puede ser degradado por una pululanasa. Si la amilasa activa de la licuefacción permanece presente durante la sacarificación ( es decir, sin desnaturalización), la cantidad de panosa puede ser tan alta como 1-2%, lo cual es altamente indeseable, ya que reduce significativamente el rendimiento de sacarificación.
Otros productos de fermentación pueden fermentarse en condiciones y temperaturas bien conocidas por las personas expertas en la técnica, adecuadas para el organismo fermentador en cuestión.
El producto de la fermentación puede recuperarse mediante métodos bien conocidos en la técnica, p. ej., mediante destilación. Se describen ejemplos de enzimas generadoras de fuentes de hidratos de carbono en la sección "Enzimas" que figura más adelante.
En un aspecto particular, el procedimiento de la invención comprende, además, antes de la conversión de un material que contiene almidón en azúcares/dextrinas las etapas de:
(x) reducir el tamaño de partícula del material que contiene almidón; e
(y) formar una suspensión que comprende el material que contiene almidón y agua.
En una realización, el material que contiene almidón se muele para reducir el tamaño de partícula. En una realización, el tamaño de partícula se reduce a entre 0,05-3,0 mm, preferiblemente 0,1-0,5 mm, o de modo que al menos el 30%, preferiblemente al menos el 50%, más preferiblemente al menos el 70%, incluso más preferiblemente al menos el 90% del material que contiene almidón pase a través de un tamiz con una malla de 0,05-3,0 mm, preferiblemente una malla de 0,1-0,5 mm.
La suspensión acuosa puede contener de 10-55% en peso de sólidos secos (DS), preferiblemente 25-45% en peso de sólidos secos (DS), más preferiblemente 30-40% en peso de sólidos secos (DS) de material que contiene almidón. Procedimientos de conversión de almidón convencionales, tales como procedimientos de licuefacción y sacarificación, se describen, p. ej., en la Patente de EE.UU. N° 3.912.590, los documentos EP 252730 y EP 063909.
En una realización, el procedimiento de conversión que degrada el almidón en componentes de hidratos de carbono de menor peso molecular, tales como azúcares o sustitutos de grasas, incluye una etapa de desramificación.
En el caso de convertir almidón en un azúcar, el almidón se despolimeriza. Un procedimiento de despolimerización de este tipo consiste, p. ej., en una etapa de pretratamiento y dos o tres etapas de procedimiento consecutivas, es decir, un procedimiento de licuefacción, un procedimiento de sacarificación y, dependiendo del producto final deseado, un procedimiento de isomerización opcional.
Cuando el producto de azúcar final deseado es, p. ej., un jarabe con alto contenido en fructosa, el jarabe de dextrosa se puede convertir en fructosa. Después del procedimiento de sacarificación, el pH se incrementa a un valor en el intervalo de 6-8, p. ej., pH 7,5, y el calcio se elimina mediante intercambio iónico. El jarabe de dextrosa se convierte luego en jarabe de alto contenido en fructosa utilizando, p. ej., una glucosa isomerasa inmovilizada.
Producción de Productos de Fermentación
Los azúcares fermentables (p. ej., dextrinas, monosacáridos, particularmente glucosa) se producen a partir de la sacarificación enzimática. Estos azúcares fermentables pueden purificarse adicionalmente y/o convertirse en productos azucarados útiles. Además, los azúcares se pueden utilizar como material de alimentación de la fermentación en un procedimiento de fermentación microbiana para producir productos finales, tales como alcohol (p. ej., etanol y butanol), ácidos orgánicos (p. ej.,, ácido succínico, 3-HP y ácido láctico), alcoholes de azúcar (p. ej., glicerol), compuestos intermedios del ácido ascórbico (p. ej., gluconato, 2-ceto-D-gluconato, 2,5-diceto-D-gluconato y ácido 2-ceto-L-glucónico), aminoácidos (p. ej.,, lisina), proteínas (p. ej., anticuerpos y fragmentos de los mismos). En una realización, los azúcares fermentables obtenidos durante las etapas del procedimiento de licuefacción se utilizan para producir alcohol y particularmente etanol. En la producción de etanol se utiliza comúnmente un procedimiento SSF, en el que las enzimas sacarificantes y los organismos fermentadores (p. ej., levadura) se añaden juntos y luego se llevan a cabo a una temperatura de 30-40°C.
El organismo utilizado en la fermentación dependerá del producto final deseado. Típicamente, si el etanol es el producto final deseado, se utilizará levadura como organismo fermentador. En algunas realizaciones preferidas, el microorganismo productor de etanol es una levadura y específicamente Saccharomyces tal como cepas de S. cerevisiae (Patente de EE.UU. N° 4.316.956). Está disponible comercialmente una diversidad de S. cerevisiae y éstas incluyen, pero no se limitan a FALI (levadura de Fleischmann), SUPERSTART (Alltech), FERMIOL (DSM Specialties), RED STAR (Lesaffre) y levadura de alcohol Angel (Angel Yeast Company, China) . La cantidad de levadura inicial empleada en los métodos es una cantidad eficaz para producir una cantidad comercialmente significativa de etanol en una cantidad de tiempo adecuada, (p. ej.,, para producir al menos un 10% de etanol a partir de un sustrato que tiene entre 25-40% de DS en menos de 72 horas). Las células de levadura se suministran generalmente en cantidades de aproximadamente 104 a aproximadamente 1012 , y preferiblemente de aproximadamente 107 a aproximadamente 1010 recuento de levaduras viables por mL de caldo de fermentación. Después de añadir la levadura al macerado, esto se somete típicamente a fermentación durante aproximadamente 24-96 horas, p. ej., 35-60 horas. La temperatura está entre aproximadamente 26-34°C, típicamente a aproximadamente 32°C, y el pH es de pH 3-6, p. ej., alrededor de pH 4-5.
La fermentación puede incluir, además de microorganismos fermentadores (p. ej., levadura), nutrientes y enzimas adicionales, incluyendo fitasas. El uso de levadura en la fermentación es bien conocido en la técnica.
En realizaciones adicionales, el uso de microorganismos fermentadores apropiados, como se conoce en la técnica, puede resultar en un producto final de la fermentación que incluye, p. ej., glicerol, 1,3-propanodiol, gluconato, 2-ceto-D-gluconato, 2,5-diceto-D-gluconato, ácido 2-ceto-L-glucónico, ácido succínico, ácido láctico, aminoácidos y derivados de los mismos. Más específicamente, cuando el ácido láctico es el producto final deseado, puede utilizarse un Lactobacillus sp. (L. casei) cuando los productos finales deseados son glicerol o 1,3-propanodiol, se puede utilizar E. coli; y cuando los productos finales deseados son 2-ceto-D-gluconato, 2,5-diceto-D-gluconato y ácido 2-ceto-L-glucónico, se puede utilizar Pantoea citrea como el microorganismo fermentador. La lista arriba enumerada es solo ejemplos y un experto en la técnica conocerá un cierto número de microorganismos fermentadores que pueden utilizarse para obtener un producto final deseado.
Procedimientos para producir productos de la fermentación a partir de material que contiene almidón no gelatinizado
La invención se refiere a procedimientos para producir productos de la fermentación a partir de material que contiene almidón sin gelatinización ( es decir, sin cocción) del material que contiene almidón (al que a menudo se alude como procedimiento de "hidrólisis de almidón bruto"). El producto de la fermentación, tal como etanol, se puede producir sin licuar la suspensión acuosa que contiene el material que contiene almidón y agua. En una realización, un procedimiento de la invención incluye sacarificar material que contiene almidón (p. ej., molido), p. ej., almidón granular, por debajo de la temperatura de gelatinización inicial, preferiblemente en presencia de alfa-amilasa y/o enzimas generadoras de fuentes de hidratos de carbono para producir azúcares que puedan ser fermentados en el producto de la fermentación por un organismo de fermentación adecuado. En esta realización, el producto de fermentación deseado, p. ej., etanol, se produce a partir de granos de cereales sin gelatinizar ( es decir, sin cocer), preferiblemente molidos, tales como maíz.
Por consiguiente, en un aspecto, la invención se refiere a procedimientos para producir un producto de fermentación a partir de material que contiene almidón, que comprende sacarificar y fermentar simultáneamente material que contiene almidón utilizando una fuente de hidratos de carbono que genera enzimas y un organismo fermentador a una temperatura por debajo de la temperatura de gelatinización inicial de dicho material que contiene almidón en presencia de una proteasa variante de la invención. La sacarificación y la fermentación también pueden estar separadas. Así, en otro aspecto, la invención se refiere a procedimientos de preparar productos de la fermentación, que comprende las siguientes etapas:
(i) sacarificar un material que contiene almidón a una temperatura por debajo de la temperatura de gelatinización inicial utilizando una enzima generadora de fuente de hidratos de carbono, p. ej., una glucoamilasa; y
(ii) fermentar utilizando un organismo de la fermentación;
en donde la etapa (i) se lleva a cabo utilizando al menos una glucoamilasa y una proteasa variante de la invención.
En una realización, el organismo fermentador expresa la proteasa variante de la invención.
En una realización, también se añade una alfa amilasa en la etapa (i). Las etapas (i) y (ii) pueden realizarse simultáneamente.
El producto de la fermentación, p. ej., etanol, puede recuperarse opcionalmente después de la fermentación, p. ej., mediante destilación. Típicamente, la o las amilasas, tales como glucoamilasa(s) y/u otras enzimas generadoras de fuentes de hidratos de carbono, y/o alfa-amilasa(s), están presentes durante la fermentación. Ejemplos de glucoamilasas y otras enzimas generadoras de fuentes de hidratos de carbono incluyen glucoamilasas que hidrolizan almidón bruto. Ejemplos de alfa-amilasa(s) incluyen alfa-amilasas ácidas, tales como alfa-amilasas fúngicas ácidas. Ejemplos de organismos fermentadores incluyen levaduras, p. ej., una cepa de Saccharomyces cerevisiae. La expresión "temperatura de gelatinización inicial" significa la temperatura más baja a la que comienza la gelatinización del almidón. En general, el almidón calentado en agua comienza a gelatinizar entre aproximadamente 50°C y 75°C; la temperatura exacta de gelatinización depende del almidón específico y puede ser determinada fácilmente por el experto en la materia. Por lo tanto, la temperatura de gelatinización inicial puede variar de acuerdo con la especie vegetal, la variedad particular de la especie vegetal, así como con las condiciones de crecimiento. En el contexto de esta invención, la temperatura de gelatinización inicial de un material que contiene almidón dado se puede determinar como la temperatura a la que se pierde la birrefringencia en el 5% de los gránulos de almidón utilizando el método descrito por Gorinstein y Lii, 1992, Starch/Starke 44(12): 461-466. Antes de iniciar el procedimiento, se puede preparar una suspensión de material que contiene almidón, tal como almidón granulado, que tiene 10-55% p/p de sólidos secos (DS), preferiblemente 25-45% p/p de sólidos secos, más preferiblemente 30-40% p/p de sólidos secos de material que contiene almidón. La suspensión puede incluir agua y/o aguas de procedimiento, tales como vinaza (retroceso), agua de depuración, condensado o destilado del evaporador, agua de extracción lateral de destilación o agua de procedimiento de otras plantas de productos de la fermentación. Debido a que el procedimiento de la invención se lleva a cabo por debajo de la temperatura de gelatinización inicial y, por lo tanto, no tiene lugar un aumento significativo de la viscosidad, se pueden usar altos niveles de vinaza si se desea. En una realización, la suspensión acuosa contiene de aproximadamente 1 a aproximadamente 70% en vol., preferiblemente 15-60% en vol., especialmente de aproximadamente 30 a 50% en vol. de agua y/o aguas del procedimiento, tales como vinaza (retroceso), agua de lavado, condensado o destilado del evaporador, agua de extracción lateral de destilación o agua de procedimiento de otras plantas de productos de la fermentación, o combinaciones de los mismos, o similares. El material que contiene almidón se puede preparar reduciendo el tamaño de partícula, preferiblemente mediante molienda en seco o en húmedo, a 0,05 a 3,0 mm, preferiblemente 0,1-0,5 mm. Después de haber sido sometido a un procedimiento de la invención, al menos el 85%, al menos el 86%, al menos el 87%, al menos el 88%, al menos el 89%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, o preferiblemente al menos el 99% de los sólidos secos en el material que contiene almidón se convierten en un hidrolizado de almidón soluble. Un procedimiento en este aspecto de la invención se realiza a una temperatura por debajo de la temperatura de gelatinización inicial, lo que significa que la temperatura se encuentra típicamente en el intervalo entre 30-75°C, preferiblemente entre 45-60°C. En una realización preferida, el procedimiento se llevó a cabo a una temperatura de 25°C a 40°C, tal como de 28°C a 35°C, tal como de 30°C a 34°C, preferiblemente alrededor de 32°C. En una realización, el procedimiento se lleva a cabo de manera que el nivel de azúcar, tal como el nivel de glucosa, se mantenga a un nivel bajo, tal como por debajo del 6% p/p, tal como por debajo de aproximadamente el 3% p/p, tal como por debajo de aproximadamente 2% p/p, tal como por debajo de aproximadamente 1% p/p., tal como por debajo de aproximadamente 0,5% p/p, o por debajo de 0,25% p/p, tal como por debajo de aproximadamente 0,1% p/p. Niveles bajos de azúcar de este tipo se pueden lograr simplemente empleando cantidades ajustadas de enzima y organismo fermentador. Una persona experta en la técnica puede determinar fácilmente qué dosis/cantidades de enzima y organismo fermentador utilizar. Las cantidades empleadas de enzima y organismo fermentador también pueden seleccionarse para mantener bajas concentraciones de maltosa en el caldo de fermentación. Por ejemplo, el nivel de maltosa puede mantenerse por debajo de aproximadamente 0,5% p/p, tal como por debajo de aproximadamente 0,2% p/p. El procedimiento de la invención se puede llevar a cabo a un pH de aproximadamente 3 y 7, preferiblemente de pH 3,5 a 6, o más preferiblemente de pH 4 a 5. En una realización, la fermentación está en curso durante 6 a 120 horas, en particular 24 a 96 horas.
Procedimientos para producir productos de la fermentación a partir de material que contiene almidón gelatinizado
En este aspecto, la invención se refiere a procedimientos para producir productos de la fermentación, especialmente etanol, a partir de material que contiene almidón, procedimiento que incluye una etapa de licuefacción y etapas de sacarificación y fermentación realizadas secuencial o simultáneamente. En consecuencia,, la invención se refiere a un procedimiento para preparar un producto de la fermentación a partir de material que contiene almidón, que comprende las etapas de:
(a) licuar material que contiene almidón en presencia de una alfa-amilasa;
(b) sacarificar el material licuado obtenido en la etapa (a) utilizando una enzima generadora de una fuente de hidratos de carbono;
(c) fermentar utilizando un organismo fermentador;
en donde una proteasa variante de la invención está presente durante la etapa b) o c).
En una realización, el organismo fermentador expresa la proteasa variante de la invención.
El producto de la fermentación, tal como especialmente etanol, puede recuperarse opcionalmente después de la fermentación, p. ej., mediante destilación. El organismo fermentador es preferiblemente levadura, preferiblemente una cepa de Saccharomyces cerevisiae. En un aspecto particular, el procedimiento de la invención comprende, además, antes de la etapa (a), las etapas de:
x) reducir el tamaño de partícula del material que contiene almidón, preferiblemente moliendo (p. ej., utilizando un molino de martillos);
y) formar una suspensión que comprende el material que contiene almidón y agua.
En una realización, el tamaño de partícula es más pequeño que un tamiz n° 7, p. ej., un tamiz n° 6. En los procedimientos convencionales de la técnica anterior se utiliza habitualmente un tamiz n° 7. La suspensión acuosa puede contener de 10 a 55, p. ej., 25-45 y 30-40% p/p de sólidos secos (DS) de material que contiene almidón. La suspensión se calienta por encima de la temperatura de gelatinización y se puede añadir una variante de alfa-amilasa para iniciar la licuefacción (dilución). En una realización, la suspensión se puede cocer a chorro para gelatinizar adicionalmente la suspensión antes de someterla a alfa-amilasa en la etapa (a). La licuefacción se puede llevar a cabo, en una realización, como un procedimiento en suspensión caliente de tres etapas. La suspensión se calienta entre 60-95°C, preferiblemente entre 70-90°C, tal como preferiblemente entre 80-85°C a pH 4-6, preferiblemente 4,5-5,5, y variante de alfa-amilasa, opcionalmente junto con una pululanasa. y/o proteasa, preferiblemente metaloproteasa, se añaden para iniciar la licuefacción (dilución). En una realización, la suspensión se puede entonces cocer a chorro a una temperatura entre 95-140°C, preferiblemente 100-135°C, tal como 105-125°C, durante aproximadamente 1-15 minutos, preferiblemente durante aproximadamente 3-10 minutos, especialmente alrededor de aproximadamente 5 minutos. La suspensión se enfría a 60-95°C y se añade más variante de alfa-amilasa y opcionalmente variante de pululanasa y/o proteasa, preferiblemente metaloproteasa, para finalizar la hidrólisis (licuefacción secundaria). El procedimiento de licuefacción se lleva a cabo habitualmente a pH 4,0-6, en particular a un pH de 4,5 a 5,5. La etapa de sacarificación (b) se puede llevar a cabo utilizando condiciones bien conocidas en la técnica. Por ejemplo, un procedimiento de sacarificación completo puede durar de aproximadamente 24 a aproximadamente 72 horas, sin embargo, es habitual hacer solo una pre-sacarificación de típicamente 40-90 minutos a una temperatura entre 30-65°C, típicamente de aproximadamente 60°C, seguida de sacarificación completa durante la fermentación en un procedimiento simultáneo de sacarificación y fermentación (procedimiento SSF). La sacarificación se lleva a cabo típicamente a una temperatura de 20-75°C, preferiblemente de 40-70°C, típicamente alrededor de 60°C, y a un pH entre 4 y 5, normalmente a aproximadamente pH 4,5. El procedimiento más ampliamente utilizado para producir un producto de la fermentación, especialmente etanol, es un procedimiento de sacarificación y fermentación simultánea (SSF), en el que no hay una fase de retención para la sacarificación, lo que significa que pueden sumarse un organismo fermentador, tal como la levadura, y enzima o enzimas. La SSF se puede llevar a cabo típicamente a una temperatura de 25°C a 40°C, tal como de 28°C a 35°C, tal como de 30°C a 34°C, preferiblemente alrededor de aproximadamente 32°C. En una realización, la fermentación se lleva a cabo durante 6 a 120 horas, en particular 24 a 96 horas.
Glucoamilasa Presente y/o Añadida En La Sacarificación y/o La Fermentación
La enzima generadora de la fuente de hidratos de carbono presente durante la sacarificación puede ser, en una realización, una glucoamilasa. Una glucoamilasa está presente y/o se añade en la sacarificación y/o la fermentación, preferiblemente sacarificación y fermentación simultáneas (SSF), en un procedimiento de la invención (es decir, sacarificación y fermentación de material de almidón no gelatinizado o gelatinizado).
En una realización, la glucoamilasa presente y/o añadida en la sacarificación y/o fermentación es de origen fúngico, preferiblemente de una cepa de Aspergillus, preferiblemente A. niger, A. awamori, or A. oryzae; o una cepa de Trichoderma, preferiblemente T. reesei; o una cepa de Talaromyces, preferiblemente T. emersonii o una cepa de Trametes, preferiblemente T. cingulata, o una cepa de Pycnoporus, preferiblemente P. sanguineus, o una cepa de Gloeophyllum,, tales como G. serpiarium o G. trabeum, o una cepa de Nigrofomes.
En una realización, la glucoamilasa se deriva de Trametes, tal como una cepa de Trametes cingulata, tal como la que se muestra en la SEQ ID NO: 4 en esta memoria.
En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 4 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 4 en esta memoria.
En una realización, la glucoamilasa se deriva de Talaromyces, tal como una cepa de Talaromyces emersonii, tal como la que se muestra en la SEQ ID NO: 5 en esta memoria.
En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 5 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 5 en esta memoria.
En una realización, la glucoamilasa se deriva de una cepa del género Pycnoporus, en particular una cepa de Pycnoporus sanguineus descrita en el documento WO 2011/066576 (SEQ ID NOs 2, 4 o 6), tal como la que se muestra como SEQ ID NO: 4 en el documento WO 2011/066576.
En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 6 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 6 en esta memoria.
En una realización, la glucoamilasa se deriva de una cepa del género Gloeophyllum, tal como una cepa de Gloeophyllum sepiarium o Gloeophyllum trabeum, en particular una cepa de Gloeophyllum, tal como se describe en el documento WO 2011/068803 (SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 o 16). En una realización preferida, la glucoamilasa es Gloeophyllum sepiarium mostrada en SeQ iD No : 2 en el documento WO 2011/068803 o SEQ ID NO: 7 en esta memoria.
En una realización, la glucoamilasa se deriva de Gloeophyllum serpiarium, tal como la que se muestra en la SEQ ID NO: 7 en esta memoria. En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 7 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 7 en esta memoria.
En otra realización, la glucoamilasa se deriva de Gloeophyllum trabeum tal como la que se muestra en la SEQ ID NO: 8 en esta memoria. En una realización, la glucoamilasa se selecciona del grupo que consiste en:
(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 8 en esta memoria;
(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 8 en esta memoria.
En una realización, la glucoamilasa se deriva de una cepa del género Nigrofomes,, en particular una cepa de Nigrofomes sp. descrita en el documento WO 2012/064351.
En una realización, las glucoamilasas pueden añadirse a la sacarificación y/o fermentación en una cantidad de 0,0001 -20 AGU/g DS, preferiblemente 0,001 -10 AGU/g DS, especialmente entre 0,01 -5 AGU/g DS, tal como 0,1-2 AGU/g DS. Composiciones disponibles comercialmente que comprenden glucoamilasa incluyen AMG 200L; AMG 300 L; SAN™ SUPER, SAN™ EXTRA L, SPIRIZYME™ PLUS, SPIRIZYME™ FUEL, SPIRIZYME™ B4U, SPIRIZYME™ ULTRA, SPIRIZYME™ EXCEL y AMG™ E (de Novozymes A/S); OPTIDEX™ 300, GC480, GC417 (de DuPont.); AMIGASE™ y AMIGASE™ PLUS (de DSM); G-ZYME™ G900, G-ZYME™ y G990 ZR (de DuPont).
De acuerdo con una realización preferida de la invención, la glucoamilasa está presente y/o se añade en la sacarificación y/o la fermentación en combinación con una alfa-amilasa. A continuación se describen ejemplos de alfa-amilasa adecuada.
Alfa-Amilasa Presente y/o Añadida En La Sacarificación y/o La Fermentación
En una realización, una alfa-amilasa está presente y/o se añade en la sacarificación y/o la fermentación en los procedimientos de la invención. En una realización preferida, la alfa-amilasa es de origen fúngico o bacteriano. En una realización preferida, la alfa-amilasa es una alfa-amilasa fúngica estable a los ácidos. Una alfa-amilasa estable al ácido fúngico es una alfa-amilasa que tiene actividad en el intervalo de pH de 3,0 a 7,0 y preferiblemente en el intervalo de pH de 3,5 a 6,5, incluida la actividad a un pH de aproximadamente 4,0, 4,5, 5,0, 5,5 y 6,0.
En una realización preferida, la alfa-amilasa presente y/o añadida en la sacarificación y/o fermentación se deriva de una cepa del género Rhizomucor, preferiblemente una cepa de Rhizomucorpusillus, tal como la que se muestra en la SEQ ID NO: 3 en el documento WO 2013/006756, tal como un híbrido de alfa-amilasa de Rhizomucor pusillus que tiene un enlazador de Aspergillus nigery un dominio de unión a almidón, tal como el que se muestra en la SEQ ID NO: 9 en esta memoria, o una variante del mismo.
En una realización, la alfa-amilasa está presente y/o se añade en la sacarificación y/o la fermentación se selecciona del grupo que consiste en:
(i) una alfa-amilasa que comprende el polipéptido de SEQ ID NO: 9 en esta memoria;
(ii) una alfa-amilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.
ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 9 en esta memoria.
En una realización preferida, la alfa-amilasa es una variante de la alfa-amilasa mostrada en SEQ ID NO: 9 que tiene al menos una de las siguientes sustituciones o combinaciones de sustituciones: D165M; Y141W; Y141R; K136F; K192R; P224A; P224R; S123H Y141W; G20S Y141W; A76G Y141W; G128D Y141W; G128D D143N; P219C Y141W; N142D D143N; Y141W K192R; Y141W D143N; Y141W N383R; Y141W P219C A265C; Y141W N142D D143N; Y141W K192R V410A; G128D Y141W D143N; Y141W D143N P219C; Y141W D143N K192R; G128D D143N K192R; Y141W D143N K192R P219C; G128D Y141W D143N K192R; o G128D Y141W D143N K192R P219C (utilizando la SEQ ID NO: 9 para la numeración).
En una realización, la alfa-amilasa se deriva de un Rhizomucor pusillus con un enlazador de glucoamilasa de Aspergillus niger y un dominio de unión a almidón (SBD), preferiblemente descrito como SEC ID NO: 9 en esta memoria, preferiblemente con una o más de las siguientes sustituciones: G128D, D143N, preferiblemente G128D D143N (utilizando SEQ ID NO: 9 para numeración), y en donde la variante de alfa-amilasa presente y/o añadida en la sacarificación y/o la fermentación tiene al menos 75% de identidad, preferiblemente al menos 80%, más preferiblemente al menos 85%, más preferiblemente al menos 90%, más preferiblemente al menos 91%, más preferiblemente al menos 92%, incluso más preferiblemente al menos 93%, lo más preferiblemente al menos 94%, e incluso lo más preferiblemente al menos 95%, tal como incluso al menos 96%, al menos 97% , al menos 98%, al menos 99%, pero menos del 100% de identidad con el polipéptido de SEQ ID NO: 9 en esta memoria.
En una realización preferida, la relación entre glucoamilasa y alfa-amilasa presente y/o añadida durante la sacarificación y/o fermentación puede estar preferiblemente en el intervalo de 500:1 a 1:1, tal como de 250:1 a 1:1, tal como como de 100:1 a 1: 1, tal como de 100: 2 a 100:50, tal como de 100:3 a 100:70.
Materiales que Contienen Almidón
Se puede usar cualquier material de partida que contenga almidón adecuado en un procedimiento de la presente invención. El material de partida se selecciona generalmente en base al producto de fermentación deseado. Ejemplos de materiales de partida que contienen almidón, adecuados para uso en los procedimientos de la presente invención, incluyen cebada, habas, mandioca, cereales, maíz, milo, guisantes, patatas, arroz, centeno, sagú, sorgo, batatas, tapioca, trigo. y cereales integrales o cualquier mezcla de los mismos. El material que contiene almidón también puede ser un tipo de maíz y cebada céreo o no céreo. En una realización preferida, el material que contiene almidón es maíz. En una realización preferida, el material que contiene almidón es trigo.
Productos de la Fermentación
La expresión "producto de fermentación" significa un producto producido mediante un método o procedimiento que incluye la fermentación utilizando un organismo fermentador. Los productos de fermentación incluyen alcoholes (p. ej., etanol, metanol, butanol); ácidos orgánicos (p. ej., ácido cítrico, ácido acético, ácido itacónico, ácido láctico, ácido succínico, ácido glucónico); cetonas (p. ej., acetona); aminoácidos (p. ej., ácido glutámico); gases (p. ej., H2 y CO2 ); antibióticos (p. ej., penicilina y tetraciclina); enzimas; vitaminas (p. ej., riboflavina, B12 , betacaroteno); y hormonas. En una realización preferida, el producto de fermentación es etanol, p. ej., etanol combustible; etanol bebible, es decir, bebidas espirituosas neutras potables; o etanol industrial o productos utilizados en la industria del alcohol consumible (p. ej., cerveza y vino), industria láctea (p. ej., productos lácteos fermentados), industria del cuero e industria del tabaco. Tipos de cerveza preferidos comprenden ales, stouts, porters, lagers, bitters, licores de malta, happoushu, cerveza con alto contenido de alcohol, cerveza con bajo contenido de alcohol, cerveza con bajo contenido de calorías o cerveza light. En una realización preferida, el producto de fermentación es etanol.
Organismos Fermentadores
La expresión «organismo fermentador» se refiere a cualquier organismo, incluyendo organismos bacterianos y fúngicos, tales como levaduras y hongos filamentosos, adecuados para producir un producto de la fermentación deseado. Organismos de fermentación adecuados son capaces de fermentar, es decir, convertir, azúcares fermentables, tales como arabinosa, fructosa, glucosa, maltosa, manosa o xilosa, directa o indirectamente en el producto de la fermentación deseado.
Ejemplos de organismos termentadores incluyen organismos fúngicos tales como la levadura. Levaduras preferidas incluyen cepas de Saccharomyces, en particular Saccharomyces cerevisiae o Saccharomyces uvarum; cepas de Pichia, en particular Pichia stipitis tales como Pichia stipitis CBS 5773 o Pichia pastoris;cepas de Candida, en particular Candida arabinofermentans, Candida boidinii, Candida diddensii, Candida shehatae, Candida sonorensis, Candida tropicalis, o Candida utilis. Otros organismos termentadores incluyen cepas de Hansenula, en particular Hansenula anomala o Hansenula polymorpha; cepas de Kluyveromyces, en particular Kluyveromyces fragilis o Kluyveromyces marxianus; y cepas de Schizosaccharomyces, en particular Schizosaccharomyces pombe.
Organismos termentadores bacterianos preferidos incluyen cepas de Escherichia, en particular Escherichia coli, cepas de Zymomonas, en particular Zymomonas mobilis, cepas de Zymobacter, en particular Zymobactorpalmae, cepas de Klebsiella en particular Klebsiella oxytoca, cepas de Leuconostoc, en particular Leuconostoc mesenteroides, cepas de Clostridium, en particular Clostridium butyricum, cepas de Enterobacter, en particular Enterobacteraerogenes, y cepas de Thermoanaerobacter, en particular Thermoanaerobacter BG1L1 (Appl. Microbiol. Biotech. 77: 61-86), Thermoanarobacter ethanolicus, Thermoanaerobacter mathranii, o Thermoanaerobacter thermosaccharolyticum. También se prevén cepas de Lactobacillus, así como cepas de Corynebacterium glutamicum R, Bacillus thermoglucosidaisus, y Geobacillus thermoglucosidasius.
En una realización, el organismo termentador es un organismo termentador de azúcar C6, tal como una cepa de, p. ej., Saccharomyces cerevisiae.
En una realización, el organismo termentador es un organismo termentador de azúcar C5, tal como una cepa de, p. ej., Saccharomyces cerevisiae.
En una realización, el organismo termentador se añade al medio de termentación de modo que el recuento de organismos de termentación viables, tales como levaduras, por mL de medio de termentación esté en el intervalo de 105 a 1012, preteriblemente de 107 a 1010, especialmente de aproximadamente 5x107.
La levadura es el organismo termentador preterido para la termentación del etanol. Se pretieren las cepas de Saccharomyces,, especialmente cepas de la especie Saccharomyces cerevisiae,, preteriblemente las cepas que son resistentes a niveles elevados de etanol, es decir, hasta, p. ej., aproximadamente 10, 12, 15 o 20% en vol. o más de etanol.
En una realización, la levadura que utiliza C5 es una cepa de Saccharomyces cerevisiae descrita en el documento WO 2004/085627.
En una realización, el organismo termentador es una célula microbiana eucariota C5 a la que se retiere el documento WO 2010/074577 (Nedalco).
En una realización, el organismo termentador es una célula eucariota C5 transformada capaz de isomerizar directamente la xilosa en xilulosa descrita en el documento US 2008/0014620.
En una realización, el organismo termentador es una célula termentadora de azúcar C5 descrita en el documento WO 2009/109633.
Levaduras comercialmente disponibles incluyen LNF SA-1, LNF BG-1, LNF PE-2 y LNF CAT-1 (disponible de LNF Brazil), RED STAR™ y levadura ETHANOL RED™ (disponible de Fermentis/Lesattre, EE.UU.), Fa LI (disponible de Fleischmann’s Yeast, Ee .UU.), levadura tresca SUPERSTART y THERMOSACC™ (disponible de Ethanol Technology, Wl, EE.UU.), BIOFERM AFT y XR (disponible de NABC - North American Bioproducts Corporation, GA, EE.UU.), GERT STrAn D (disponible de Gert Strand AB, Suecia) y FERMIOL (disponible de DSM Specialties).
El organismo termentador capaz de producir un producto de la termentación deseado a partir de azúcares termentables se cultiva preteriblemente bajo condiciones precisas a una tasa de crecimiento particular. Cuando el organismo termentador se introduce o se añade al medio de termentación, el organismo termentador inoculado pasa por una serie de tases. Inicialmente no se produce crecimiento. Este período se denomina "tase de retraso" y puede considerarse un período de adaptación. Durante la siguiente tase, denominada "tase exponencial", la tasa de crecimiento aumenta gradualmente. Después de un período de crecimiento máximo, la velocidad cesa y el organismo termentador entra en la "tase estacionaria". Después de un período de tiempo adicional, el organismo termentador entra en la "tase de muerte" en donde disminuye el número de células viables.
Fermentación
Las condiciones de termentación se determinan basándose, p. ej., en el tipo de material vegetal, los azúcares termentables disponibles, el organismo u organismos termentadores y/o el producto de la termentación deseado. Un experto en la técnica puede determinar tácilmente las condiciones de termentación adecuadas. La termentación se puede llevar a cabo en las condiciones de uso convencional. Procedimientos de fermentación preferidos son los procedimientos anaerobios.
Por ejemplo, las fermentaciones se pueden llevar a cabo a temperaturas tan altas como 75°C, p. ej., entre 40-70°C, tal como entre 50-60°C. Sin embargo, también se conocen bacterias con una temperatura óptima significativamente más baja hasta alrededor de la temperatura ambiente (alrededor de 20°C). Se pueden encontrar ejemplos de organismos fermentadores adecuados en la sección anterior "Organismos Fermentadores''.
Para la producción de etanol utilizando levadura, la fermentación puede durar de 24 a 96 horas, en particular de 35 a 60 horas. En una realización, la fermentación se lleva a cabo a una temperatura entre 20 y 40°C, preferiblemente entre 26 y 34°C, en particular alrededor de 32°C. En una realización, el pH es de 3 a 6, preferiblemente alrededor de pH 4 a 5.
Otros productos de la fermentación pueden fermentarse a temperaturas conocidas por la persona experta en la técnica, adecuadas para el organismo fermentador en cuestión.
La fermentación se lleva a cabo típicamente a un pH en el intervalo entre 3 y 7, preferiblemente de pH 3,5 a 6, tal como alrededor de pH 5. Las fermentaciones se llevan a cabo típicamente durante 6-96 horas.
Los procedimientos de la invención se pueden realizar como un procedimiento por lotes o como un procedimiento continuo. Las fermentaciones se pueden realizar en un sistema de ultrafiltración en el que el material retenido se mantiene en recirculación en presencia de sólidos, agua y el organismo fermentador, y en donde el material permeado es el líquido que contiene el producto de la fermentación deseado. Igualmente se contemplan métodos/procedimientos llevados a cabo en reactores de membrana continua con membranas de ultrafiltración y en que el material retenido se mantiene en recirculación en presencia de sólidos, agua y el organismo o los organismos fermentadores y en que el material permeado es el producto de fermentación que contiene líquido. Después de la fermentación, el organismo fermentador puede separarse de la suspensión fermentada y reciclarse.
Medio de Fermentación
La expresión "medios de fermentación" o "medio de fermentación" se refiere al entorno en el que se lleva a cabo la fermentación y comprende el sustrato de fermentación, es decir, la fuente de hidratos de carbono que es metabolizada por el organismo u organismos fermentadores.
El medio de fermentación puede comprender otros nutrientes y un estimulador o estimuladores del crecimiento para el organismo o los organismos fermentadores. Nutriente y estimuladores del crecimiento se utilizan ampliamente en la técnica de la fermentación e incluyen fuentes de nitrógeno, tales como amoniaco; vitaminas y minerales, o combinaciones de los mismos.
Recuperación
Después de la fermentación, el producto de fermentación puede separarse del medio de fermentación. El medio de fermentación puede destilarse para extraer el producto de la fermentación deseado o el producto de la fermentación deseado puede extraerse del medio de fermentación mediante técnicas de microfiltración o filtración por membrana. Alternativamente, el producto de la fermentación se puede recuperar mediante extracción. Métodos de recuperación son bien conocidos en la técnica.
La presente invención se describe adicionalmente mediante los siguientes ejemplos.
EJEMPLOS
Ejemplo 1: Clonación y expresión de la proteasa III de Meripilus giganteus de tipo salvaje en A soeraillus oryzae
La clonación y expresión de la serina proteasa III de tipo salvaje de Meripilus giganteus (MgP3) perteneciente a la familia S53 se describió en el documento WO 2014/037438. El gen clonado se transfirió posteriormente como un producto de la reacción en cadena de la polimerasa (PCR) con colgantes adecuadas para la inserción en P_BGMH0016, descrito en el documento WO2013/119302 (ejemplo 18 y figura 10), mediante la clonación USER™ (New England Biolabs, Ipswich, MA, EE.UU.) para su expresión en Aspergillus oryzae. Se utilizó ADN plasmídico como molde en la reacción PCR. La secuencia del cebador directo fue 5’-AGAGCGAUaccatggtcgccaccagc-3’ (SEQ ID NO: 11), y la secuencia del cebador inverso fue 5’- AACGTCACGUtcacaggccgaccgcggt-3’ (SEQ ID NO: 12). Se utilizó ADN polimerasa Phusion U (Thermo Fischer Scientific, Grand Island, NY, EE. UU.) para la reacción PCR
La reacción de PCR consistió en: 10 ng de ADN del molde, 0,5 pM de cada uno de los cebadores, 1 U de polimerasa Phusion U, dNTP 0,25 mM, tampón 1x Phusion HF, agua hasta 50 pl. El programa de PCR consistió en una desnaturalización inicial durante 30 segundos a 98°C, 35 ciclos de amplificación (20 segundos a 98°C; 20 segundos a 60°C; 2 minutos a 72°C) y una extensión final de 5 minutos a 72°C.
El gen amplificado se purificó (QIAquick, QIAGEN) y se insertó en P_BGMH0016 mediante la clonación USER™. La reacción contenía: 100 ng de vector P_BGMH0016 como un producto de la PCR, 500 ng de producto de la PCR purificado, 1 gl de enzima USER™, 1 gl de tampón Phusion HF, agua hasta 10 gl. El programa consistió en 25 minutos a 37°C y 25 minutos a 25°C. La mezcla se transformó en 50 gl de células de Escherichia coli TOP10 (DH10p) químicamente competentes , seleccionadas por su resistencia a ampicilina, y los clones correctos se verificaron mediante secuenciación. El plásmido se transformó en protoplastos de Aspergillus oryzae Cols1300 descritos en el documento WO2013/119302, seleccionados por crecimiento en nitrato como única fuente de nitrógeno, y los clones correctos se verificaron mediante secuenciación de Sanger. El uso del plásmido BGMH0016
aprovecha el denominado sistema de marcador doble dividido (DSMS) o sistema de marcador de selección bi-partita (Nielsen et al. 2006, (Efficient PCR-based gene targeting with a reciclable marker for Aspergillus nidulans, Fungal Genetics and Biology, 2006(43) 54 a 64)). El sistema de marcador de doble división en pBGMH0016 consiste en dos marcadores doble divididos en la cepa COLS1300 de Aspergillus oryzae: niaüú and niiAú, que flanquean el marcador de selección amdS. Solo la inserción correcta del ADN del donante a través de una doble recombinación homóloga en los genes niaD y niiA parciales, respectivamente, en la célula huésped COLS1300 restaurará la funcionalidad de ambos genes y ambos genes son necesarios para que la célula crezca en un medio que contenga nitrato de sodio como única fuente de nitrógeno. Esto también asegura una inserción fijada como objetivo en lugar del gen amdS en una sola copia
Cada una de las variantes específicas de MgP3 de acuerdo con la invención puede clonarse y expresarse como se describe arriba.
Ejemplo 2: Ensayo de estabilidad para variantes específicas de acuerdo con la invención
La estabilidad de las variantes de sustitución de MgP3 con respecto a MgP3 que tiene la secuencia de aminoácidos de SEQ ID NO: 3 se determina incubando las muestras de proteasa en condiciones definidas ("condiciones de estrés") en una solución tamponada. La temperatura y la duración de la incubación se eligen de modo que la actividad restante del tipo salvaje después de la incubación sea igual a aproximadamente el 20% de la actividad de una muestra similar incubada bajo condiciones definidas ("condiciones de referencia") que no conducen a pérdida de actividad cuando se incuba durante la misma duración. La actividad después de la incubación bajo condiciones de estrés o condiciones de referencia se determina utilizando el ensayo Suc-AAPF-pNA descrito a continuación.
A. Determinación de la actividad de proteasa utilizando el ensayo Suc-AAPF-pNA
Con el fin de determinar la actividad de proteasa de la proteasa MgP3 y variantes de la misma, se midió la hidrólisis de N-succinil-L-alanil-L-alanil-L-propil-L-fenil-p-nitroanilida (Suc-AAPF-pNA).
Las soluciones de reactivo utilizadas son:
Tampón de Dilución: Ácido succínico 100 mM, CaCl2 1 mM, KCI 150 mM, Triton X-100 al 0,01% , pH 4,5. Tampón de Ensayo: Tampón de dilución con Suc-AAPF-pNA (N-succinil-L-alanil-L-alanil-L-propil-L-fenil-p-nitroanilida 1 mM, Bachem 4002299.1000), 12.5 gL mL-1 DMSO (Amresco 0231).
Se cultivaron variantes de MgP3 en placas de microtitulación de 96 pocillos para producir sobrenadante de cultivo. En cada una de las placas, cuatro pocillos contenían sobrenadante de cultivo con MgP3 de tipo salvaje (SEQ ID NO: 3).
El ensayo Suc-AAPF-pNA se realiza en microplacas desechables de poliestireno de fondo plano de 384 pocillos (Perkin-Elmer 6007649). Primero, muestras de proteasa (sobrenadante de cultivo) se diluyen 5 veces en Tampón de Dilución. Posteriormente, se añaden 25 gL de la muestra de proteasa diluida a cada uno de los pocillos de la microplaca de ensayo de 384 pocillos, seguido de la adición de 25 gL de Tampón de Ensayo. Las soluciones se mezclan a fondo y la absorbancia se registró a 405 nm durante 5 minutos, y se calculó la velocidad inicial por pocillo a partir de la velocidad máxima de una ventana de 270 segundos.
B. Ensayo de estabilidad
La estabilidad de las variantes de MgP3 en tampón se determina determinando la semivida de estabilidad de las variantes de proteasa como el valor negativo del tiempo de estrés en horas, dividido por el logaritmo en base 2 de la relación de la actividad de proteasa de las variantes bajo condiciones de desestabilización. ("condiciones de estrés") a la actividad de proteasa de las mismas variantes en condiciones no desestabilizadoras ("condiciones de referencia"). Las pendientes cinéticas se sometieron a control de calidad y se eliminaron muestras variantes que 1) mostraban un R2 de ajuste lineal que estaba por debajo del cuartil del 25% del ajuste R2 del control de tipo salvaje en a) condición estresada o b) condición no estresada, o 2) mostraban una Vmáx por debajo del cuartil del 75% de Vmáx de los controles que no expresan, en a) la condición estresada o b) la condición no estresada. La relación de la tasa inicial de los sobrenadantes estresados y no estresados que proceden del mismo clon se definió como
Vmáx Estresada
Relación =
Vmáx No estresada
Las muestras que mostraban una relación por encima del cuantil del 90% del control de tipo salvaje se contaron como aciertos, y se recogieron, se volvieron a cultivar y se secuenciaron. La semivida a 60°C i v t 5 V 0 ¿ . c) /se calculó en base a la
Ln (0.5 )
L 7 l ( Relación)^
5 ' ecuación, en que la semivida se proporciona en minutos.
Las soluciones de reactivo utilizadas son:
Tampón de Dilución: como se describe en A.
Tampón de Ensayo: como se describe en A.
El ensayo se realiza en placas de PCR desechables de poliestireno de 96 pocillos (p. ej., Thermo Scientific AB-0601), excepto el ensayo Suc-AAPF-pNA descrito en A, que se realiza en microplacas de 384 pocillos.
Primero se transfieren 25 pl de los sobrenadantes del cultivo que contienen la proteasa a dos placas nuevas: una denominada "Placa de Estrés" y otra denominada "Placa de Referencia". La Placa de Estrés está dotada con una tapa y se incuba en un termociclador durante 5 minutos a 60°C. La Placa de Referencia está dotada con una tapa y mientras tanto se incuba a 21°C (temperatura ambiente). Después de la incubación, los sobrenadantes de cultivo de la Placa de Estrés y la Placa de Referencia se transfieren a placas de 384 pocillos y se añaden 25 pL de tampón de ensayo a cada uno de los pocillos de la Placa de Estrés y de la Placa de Referencia, y se mezclan bien.
Factor de Mejora de la Semivida (HIF)
El factor de mejora de la semivida (HIF) correlaciona la Semivida de Estabilidad de una proteasa variante con la de la proteasa de referencia. El cálculo del factor de mejora basado en la Semivida de Estabilidad (SH) se realizó de acuerdo con la siguiente ecuación: HIF = (SH de la variante) / (SH de MgP3 (SEQ ID NO: 3)).
Un factor de mejora de la semivida mayor que 1 (HIF > 1) indica una estabilidad mejorada de una variante en comparación con la referencia, mientras que un HIF de 1 (HIF = 1) identifica una variante que está a la par con la referencia. y un HIF de menos de 1 (HIF < 1) identifica una variante que es menos estable que la referencia. E1HIF de todas las mutaciones con estabilidad mejorada se muestra en la tabla 1 que figura más adelante. Si se observó una sustitución dada más de una vez, se muestra la HIF mediana de todas las observaciones.
Tabla 1
Figure imgf000038_0001
Figure imgf000039_0001
Figure imgf000040_0001
Figure imgf000041_0001
Figure imgf000042_0001
Figure imgf000043_0001
Figure imgf000044_0001
Figure imgf000045_0001
Ejemplo 3: Ensayo de actividad específica para variantes específicas de acuerdo con la invención
La actividad específica de las variantes de sustitución de MgP3 con respecto a MgP3 que tiene la secuencia de aminoácidos de SEQ ID NO: 3 se determina comparando la actividad total de las muestras de proteasa con la cantidad de proteína en la muestra. La actividad en los sobrenadantes del cultivo se determina utilizando el ensayo Suc-AAPF-pNA y la concentración de proteína se determinó mediante el ensayo inmunoabsorbente ligado a enzimas (ELISA), ambos descritos a continuación.
A. Determinación de la actividad de proteasa utilizando el ensayo Suc-AAPF-pNA
Con el fin de determinar la actividad de proteasa de la proteasa MgP3 y variantes de la misma, se midió la hidrólisis de N-succinil-L-alanil-L-alanil-L-propil-L-fenil-p-nitroanilida (Suc-AAPF-pNA).
Las soluciones de reactivo utilizadas son:
Tampón de Dilución: Ácido succínico 100 mM, CaCl2 1 mM, KCI 150 mM, Triton X-100 al 0,01% , pH 4,5. Tampón de Ensayo: Tampón de dilución con Suc-AAPF-pNA (N-succinil-L-alanil-L-alanil-L-propil-L-fenil-p-nitroanilida 1 mM, Bachem 4002299.1000), 12.5 pL mL-1 DMSO (Amresco 0231).
Se cultivaron variantes de MgP3 en placas de microtitulación de 96 pocillos para producir sobrenadante de cultivo. En cada una de las placas, cuatro pocillos contenían sobrenadante de cultivo con MgP3 de tipo salvaje (SEQ ID NO: 3). El ensayo Suc-AAPF-pNA se realiza en microplacas desechables de poliestireno de fondo plano de 384 pocillos (Perkin-Elmer 6007649). Primero, muestras de proteasa (sobrenadante de cultivo) se diluyen 5 veces en Tampón de Dilución. Posteriormente, se añaden 25 pL de la muestra de proteasa diluida a cada uno de los pocillos de la microplaca de ensayo de 384 pocillos, seguido de la adición de 25 pL de Tampón de Ensayo. Las soluciones se mezclan a fondo y la absorbancia se registró a 405 nm durante 5 minutos, y se calculó la velocidad inicial por pocillo a partir de la velocidad máxima de una ventana de 270 segundos.
B. Cuantificación de proteínas mediante ensayo inmunoabsorbente ligado a enzima (ELISA)
Las soluciones de reactivo utilizadas son:
TBS-T: Tris 20 mM , NaCl 150 mM, Tween-20 al 0,1% , pH 7,5.
Tampón PBS: NaCl 137 mM , KCI 2,7 mM, Na2HPO410 mM , KH2 PO4 1,8 mM
TMB plus 2 (KemEnTech diagnostics A/S) está prefabricado y listo para su uso.
La muestra de proteasa (sobrenadante de cultivo) se diluyó 2000 veces en TBS-T y se analizó mediante ELISA, utilizando un anticuerpo MgP3 conjugado con HRP producido en conejo. La cuantificación ELISA se lleva a cabo en una placa de microtitulación 384 bloqueada (Nunc MaxiSorp) recubierta con anticuerpos policlonales anti-MgP3 de conejo purificados con "proteína A". Las muestras de enzima diluidas (así como los patrones y controles) se transfieren a la placa de anticuerpos, se incubaron y, a continuación, se lavaron repetidamente enérgicamente con tampón PBS. La detección se lleva a cabo utilizando los mismos anticuerpos policlonales, pero en una forma marcada con HRP (conjugación LL-HRP). Se añade conjugado anti-MgP3: HRP en TBS-T en la dilución apropiada, seguido de lavado con PBS. La señal se lee como el punto final OD-(620 nM) después de la adición de sustrato TMB plus 2.
Las concentraciones se calcularon a partir del uso de una función no lineal que se derivó de las muestras estándares que contenían MgP3 que se ubicaron en placas externas, así como de los pocillos estándares de MgP3 que se añadieron a cada una de las placas en el flujo de rastreo.
C.Cálculo de la actividad específica de proteasa para variantes
Se calculó un ajuste lineal por placa en base a la tasa inicial y las concentraciones estándares de las muestras estándares. Se eliminaron las placas que estaban fuera del intervalo de cuantiles de 2,5-97,5% para los parámetros de ajuste pendiente e intersección. Se derivó una predicción de concentración a partir de la Vmáx introduciéndola en el ajuste lineal invertido de los patrones (por placa). La actividad específica se calculó como
Concentración (Predicha)
Actividad específica =
Concentración [ELISA}
Para la selección de aciertos, solo se consideraron las muestras que mostraron una concentración de ELISA < 30 pg mL-1. Las muestras que mostraban una actividad específica por encima del cuantil del 95% del control de tipo salvaje se contaron como aciertos, y se secuenciaron.
Factor de mejora para actividad específica (AIF)
El factor de mejora para la actividad específica (AIF) se correlaciona con al actividad específica de una proteasa variante con la de la proteasa de referencia. El cálculo del factor de mejora basado en la actividad específica (SA) se realizó de acuerdo con la siguiente ecuación: AIF = (SA de la variante) / (SA de MgP3 (SEQ ID NO: 3)).
Un factor de mejora de la actividad específica mayor que 1 (AIF > 1) indica una actividad específica mejorada de una variante en comparación con la referencia, mientras que un AIF de 1 (AIF = 1) identifica una variante que está a la par con la referencia. y un AIF de menos de 1 (AIF < 1) identifica una variante con una actividad específica menor que la referencia. El AIF de todas las mutaciones con actividad específica mejorada se muestra en la tabla 2 que figura más adelante. Si se observó una sustitución dada más de una vez, se muestra la AIF mediana de todas las observaciones.
Tabla 2
Figure imgf000046_0001
Figure imgf000047_0001
Figure imgf000048_0001
Figure imgf000049_0001
Figure imgf000050_0001
Figure imgf000051_0001
Figure imgf000052_0001
Figure imgf000053_0001
Figure imgf000054_0001
Figure imgf000055_0001
Ejemplo 4: Determinación del nivel de expresión para variantes específicas de acuerdo con la invención Los niveles de expresión de variantes de sustitución de MgP3 con respecto a MgP3 que tiene la secuencia de aminoácidos de SEQ ID NO: 3 se determinan por la cantidad total de proteína MgP3 en el sobrenadante del cultivo. Utilizando un sistema en el que precisamente una copia de la variante está integrada en un locus definido, y dicho locus es idéntico para todas las variantes, permite la comparación directa de los niveles de expresión entre variantes específicas. Un sistema de este tipo podría ser el sistema DSMS descrito en el ejemplo 1. La concentración de proteína se determinó mediante un ensayo inmunoabsorbente ligado a enzimas (ELISA), que se describe más adelante.
A.
Cuantificación de proteínas mediante ensayo inmunoabsorbente ligado a enzimas (ELISA)
Las soluciones de reactivo utilizadas son:
TBS-T: Tris 20 mM , NaCl 150 mM, Tween-20 al 0,1% , pH 7,5.
Tampón PBS: NaCl 137 mM , KCI 2,7 mM, Na2HPO410 mM , KH2 PO4 1,8 mM
TMB plus 2 (KemEnTech diagnostics A/S) está prefabricado y listo para su uso.
La muestra de proteasa (sobrenadante de cultivo) se diluyó 2000 veces en TBS-T y se analizó mediante ELISA, utilizando un anticuerpo MgP3 conjugado con HRP producido en conejo. La cuantificación ELISA se lleva a cabo en una placa de microtitulación 384 bloqueada (Nunc MaxiSorp) recubierta con anticuerpos policlonales anti-MgP3 de conejo purificados con "proteína A". Las muestras de enzima diluidas (así como los patrones y controles) se transfieren a la placa de anticuerpos, se incubaron y, a continuación, se lavaron repetidamente enérgicamente con tampón PBS. La detección se lleva a cabo utilizando los mismos anticuerpos policlonales, pero en una forma marcada con HRP (conjugación LL-HRP). Se añade conjugado anti-MgP3: HRP en TBS-T en la dilución apropiada, seguido de lavado con PBS. La señal se lee como el punto final OD-(620 nM) después de la adición de sustrato TMB plus 2.
Las concentraciones se calcularon a partir del uso de una función no lineal que se derivó de las muestras estándares que contenían MgP3 que se ubicaron en placas externas, así como de los pocillos estándares de MgP3 que se añadieron a cada una de las placas en el flujo de rastreo.
Factor de mejora para el nivel de expresión (EIF)
El factor de mejora del nivel de expresión (EIF) correlaciona el nivel de expresión de una proteasa variante con el de la proteasa de referencia. El cálculo del factor de mejora EIF basado en el nivel de expresión (EL) se realizó de acuerdo con la siguiente ecuación: ID = (EL de la variante) / (EL de MgP3 (SEQ ID NO: 3)).
Un factor de mejora del nivel de expresión que es mayor que 1 (EIF > 1) indica un nivel de expresión mejorado de una variante en comparación con la referencia, mientras que un EIF de 1 (EIF = 1) identifica una variante que está a la par con la referencia. y un EIF de menos de 1 (EIF < 1) identifica una variante que tiene un nivel de expresión menor que la referencia. El EIF de todas las mutaciones con niveles de expresión mejorados se muestra en la tabla 3 que figura más adelante. Si se observó una sustitución dada más de una vez, se muestra la EIF mediana de todas las observaciones.
Tabla 3
Figure imgf000055_0002
Figure imgf000056_0001
Figure imgf000057_0001
Figure imgf000058_0001
Figure imgf000059_0001
Ejemplo 5: Variantes que tienen termoestabilidad incrementada según se determina por la actividad residual para combinaciones específicas de sustituciones después de estrés térmico
En base a los datos obtenidos para variantes de sustitución únicas de acuerdo con la invención, varias variantes que tienen múltiples sustituciones y muestran un aumento en la actividad residual después de la incubación a temperaturas seleccionadas en el intervalo de 56°C a 70°C durante 20 min.
Las variantes que albergan sustituciones en comparación con MgP3 de tipo salvaje (SEQ ID NO: 3) como se muestra en la Tabla 4, se construyeron y expresaron en A. oryzae. Las cepas de MgP3 de A. oryzae que albergan y expresan las variantes de combinación de MgP3, se cultivaron en placas de microtitulación (MTP) en MDU-2 (225 pL / pocillo de MTP) para expresión, durante 5 días a 30°C en MTP con tapa de 96 pocillos sin agitación. Las placas de expresión también contenían MgP3 control de tipo salvaje expresado en A. oryzae. El material filamentoso se eliminó presionando una placa Biopress® hacia abajo en los pocillos. El sobrenadante se diluyó en tampón de ensayo (ácido succínico 100 mM, CaCh1 mM, KCl 150 mM, Triton X-100 al 0,01%, pH 4,5). Una fracción del sobrenadante diluido se transfirió a una placa termocicladora de 96 pocillos. La placa de 96 pocillos se transfirió a un termociclador TRobot® (Biometra) y se calentó a las temperaturas anotadas en la Tabla 4 (56°C, 60°C o 70°C) durante 20 min, seguido de un enfriamiento a 25°C durante 2 min. Se transfirieron volúmenes (25 pL) del sobrenadante estresado y no estresado a una placa MTP transparente de 384 pocillos. La solución de ensayo (25 pL, tampón de ensayo, con succinil-AAPF-pNA 1 mM, 12,5 pL mL-1 DMSO) se distribuye en la MTP de 384 pocillos. Se registró la absorbancia a 405 nm durante 10 minutos y se calculó la velocidad inicial por pocillo a partir de la velocidad máxima de una ventana de 9 min. La relación de la tasa inicial de los sobrenadantes estresados y no estresados que proceden del mismo clon se definió como
Vmáx Estresada
Relación =
Vmáx No estresada
que se traduce en actividad residual (%), que se muestra en la Tabla 4.

Claims (27)

REIVINDICACIONES
1. Una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las
posiciones 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41, 42, 45, 46, 49, 50, 53, 54, 55, 57, 59, 60, 61, 62, 64, 67, 68, 69, 74,
76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130,
136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185, 199, 200, 205, 207, 209, 210,
213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 262, 266, 267, 269, 271, 272, 276, 278, 280,
284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325, 326, 329, 330, 331, 333, 336, 338,
341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene
actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos
98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y
en donde la variante tiene una termoestabilidad incrementada medida como factor de mejora, HIF, en comparación
con la proteasa de SEQ ID NO: 3, en donde la variante comprende al menos una sustitución seleccionada del grupo
que consiste en : A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, 139G, I39L, I39V,
I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E,
K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S,
I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L,
D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L,
T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H,
F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G,
E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D,
S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N,
I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M,
Q154N, Q154T, Q154V, N1571, N157L, Y159H, Q161 E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V,
H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y,
I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P,
S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272I, S272K, S272L, S272R, S272T, S272V,
S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N,
K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D,
L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W,
S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S,
D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L,
y V364I, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un
aumento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,4.
2. La variante de la reivindicación 1, que comprende al menos una sustitución seleccionada del grupo que consiste
en : S5K, S5L, S5Y, T9H, K25P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P,
Q411, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E,
A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P,
T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L,
E81P, E81Y, A82M, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K,
D109M, D109Y, F111H, F111K, F111S, Q112R, G114L, N115C, N115K, N115R, N115T, N115Y, E117D, E117G,
E117H, E117N, E117Q, E117S, I122R, N124L, G128F, G128S, S130G, S130N, S130P, L136K, G141T, Q142A,
Q142F, Q142L, Q142N, N145V, T146A, T146L, T146N, I147S, K150L, N153M, N153P, N153R, Q154I, Q154L, Q154N,
Q154T, Q154V, N157L, Q161E, T167F, I169F, D175N, Q182C, Q182T, Q182V, F199L, F199M, M200S, A205S,
Q207H, Q207L, V209F, S210T, T213R, F217I, V225Y, I228L, I228T, I228W, S234Q, S237F, G244S, S245P, T246S,
S248Y, F258P, S262P,V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272K, S272L, S272R, S272V,
S272Y, T276Y, G278P, D280N, D280S, D280T, C284G, F289Y, I293T, V296A, R299N, K305S, L308V, F314L, S317E,
S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, D326P, S329C, S329H, S329I, S329L,
S329N, S329W, G330Q, S331W, S331Y, S336K, S336N, P341S, K343A, K343H, K343S, K343T, G345S, D347I,
P348Y, P355I, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, A363G, A363L, y V364I, y en donde la
sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la
termoestabilidad medida como factor de mejora, HIF, de al menos 1,6.
3. Una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las
posiciones 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55, 58, 59, 60, 61, 62, 66, 69, 76, 81, 87, 93, 96, 98, 101, 102,
103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145, 146, 148, 149, 150, 153, 154, 157, 159,
161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211, 213, 216, 219, 228, 231, 252, 253, 261, 266, 267, 272, 275, 276, 277, 280, 285, 288, 291, 292, 293, 294, 296, 299, 303,
308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 344, 345, 348, 356, 358, 359, 361, 362, 363, y 364 del
polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al
menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la
secuencia con el polipéptido maduro de SEQ ID NO: 3, en donde la variante comprende al menos una sustitución
seleccionada del grupo que consiste en : G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N,
A34R, D40S, D40Y, F42Y, K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157F, N157M, N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, S183L, S183M, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M, I228F, I228H, I228L, I228M, I228Q, 1228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361 E, L361M, L361 P, L361 R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364i, V364L, V364M, y V364S, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la actividad específica medida como factor de mejora, AIF, de al menos 1,37.
4. La variante de la reivindicación 3, que comprende al menos una sustitución seleccionada del grupo que consiste en : G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, F42Y, K45L, K45Y, A46E, A46K, S50A, S50L, A53L, Q54L, F55R, I59M, I59P, S60E, S60P, S61D, S61P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101 F, P101L, P101M, P101 R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153Y, Q154I, Q154K, Q154L, Q154M, Q154R, Q154W, N157F, N157Y, Y159H, Y159S, Q161A, T167D, Q182F,A184F,A184I, A184K, A184V, A184W, H185A, N188L, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211F, T213F, T213I, T213L, T213N, T213R, T213S, T213W, A216F, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, G249C, N252F, V261A, V261G, V266C, V266R, D267S, S272I, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285S, T288C, T288V, I293Y, S294T, S294V, A303F, G304H, G304K, G304P, G304R, G304S, K305C, K305F, K305H, K305I, K305S, K305T, S306L, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358L, K359S, K359W, L361 P, L361 R, T362C, T362H, T362I, T362K, T362M, T362R, T362Y, A363F, y V364M, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la actividad específica medida como factor de mejora, AIF, de al menos 2,0.
5. La variante de la reivindicación 3, que comprende al menos una sustitución seleccionada del grupo que consiste en : A34N, A34R, D76A, D76K, D76L, D76N, D76Y, N87F, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, G141L, G141M, Q142L, Q142M, Q142S, Q142W, T146H, T146N, Q154R, V209H, T276F, A285S, S294T, F310M, F310P, S317I, S317K, S317R, S317W, N338H, y G345S, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la actividad específica medida como factor de mejora, AIF, de al menos 4,5.
6. La variante de cualquiera de las reivindicaciones 1-3, en donde la variante comprende una sustitución seleccionada del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S.
7. La variante de acuerdo con la reivindicación 6, en donde la variante tiene una termoestabilidad incrementada medida como actividad residual después de estrés térmico durante 20 min a 56°C.
8. La variante de acuerdo con la reivindicación 7, en donde la actividad residual es de al menos el 50%, en particular al menos el 60%, al menos el 70%, al menos el 80%.
9. La variante de cualquiera de las reivindicaciones 6-8, en donde la variante comprende al menos tres sustituciones seleccionadas del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S.
10. La variante de la reivindicación 9, que comprende las sustituciones I39L+S66T+T102V o D267N+S272Y Q275K+D280S.
11. Las variantes de la reivindicación 10, que comprenden las sustituciones:
139L+S66T T102V;
139L+S66T+T102V+D267N S272Y+D280S;
I39L+K57P+I59M+S66T+T102V F111H+N115K+D267N+S272Y,
139L+K57P+I59M+S66T+T102V+ F111H+N115K+D280S; o
D267N+S272Y+Q275K+D280S.
12. Una variante de proteasa que comprende al menos una sustitución correspondiente a las posiciones 2, 17, 22, 41, 41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291,292, 294, 296, 301, 307, 314, 329, 331,333, 336, 362, y 363 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante comprende una sustitución en una o más posiciones seleccionada del grupo que consiste en : I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271 F, V271I, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, 1301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, y A363T, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en el nivel de expresión en Aspergillus oryzae medido como factor de mejora, EIF, de al menos 1,38.
13. La variante de la reivindicación 12, que comprende al menos una sustitución seleccionada del grupo que consiste en : I2L, A17P, P22V, Q41L, Q41Y, F42R, Q54R, Q54S, Q54Y, F55N, F55T, K57L, K57V, I59D, I59S, I59V, S60L, S60Q, S60R, S60Y, S61F, S62L, S62V, T63A, T63E, T63R, T64C, T64D, T64M, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, T167A, T167S, T167W, F199Y, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V271I, V271K, V271M, S272A, G274R, G278S, T288A, T288C, T288G, V296P, V296R, V296T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, y S336T, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,6.
14. Las variantes de cualquiera de las reivindicaciones 1-13, que tiene al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.
15. La variante de cualquiera de las reivindicaciones 1-14, en donde el número de sustituciones es 1-20, p. ej., 1-10 y 1 -5, tal como 1,2, 3, 4, 5, 6, 7, 8, 9 o 10 sustituciones.
16. Un polinucleótido que codifica la variante de cualquiera de las reivindicaciones 1 -15.
17. Una construcción de ácido nucleico que comprende el polinucleótido de la reivindicación 16.
18. Un vector de expresión, que comprende el polinucleótido de la reivindicación 16.
19. Una célula huésped recombinante que comprende el polinucleótido de la reivindicación 16.
20. Un método para producir una variante de proteasa, que comprende: cultivar la célula huésped de la reivindicación 19 bajo condiciones adecuadas para la expresión de la variante y, opcionalmente, recuperar la variante.
21. Una composición que comprende una variante de cualquiera de las reivindicaciones 1 -15.
22. La composición de la reivindicación 21, que comprende, además, una glucoamilasa y opcionalmente una alfaamilasa fúngica.
23. Un procedimiento para preparar un producto de la fermentación a partir de material que contiene almidón, que comprende sacarificar y fermentar simultáneamente material que contiene almidón utilizando enzimas que generan una fuente de hidratos de carbono y un organismo fermentador a una temperatura por debajo de la temperatura de gelatinización inicial de dicho material que contiene almidón en presencia de una proteasa variante de cualquiera de las reivindicaciones 1-15.
24. Un procedimiento para preparar un producto de la fermentación a partir de material que contiene almidón, que comprende las etapas de:
(a) licuar material que contiene almidón en presencia de una alfa-amilasa;
(b) sacarificar el material licuado obtenido en la etapa (a) utilizando una glucoamilasa;
(c) fermentar utilizando un organismo fermentador;
en donde una proteasa variante de cualquiera de las reivindicaciones 1 -15 está presente durante la etapa b) y/o c).
25. El procedimiento de cualquiera de las reivindicaciones 23-24, en el que el producto de la fermentación es etanol y el organismo de fermentación es Saccharomyces cerevisiae.
26. Célula huésped de acuerdo con la reivindicación 19, que expresa las variantes de cualquiera de las reivindicaciones 1-15, en donde la célula huésped es una célula de levadura, particularmente un Saccharomyces, tal como Saccharomyces cerevisiae.
27. El procedimiento de cualquiera de las reivindicaciones 23-24, en el que la célula huésped de la reivindicación 26 se aplica como el organismo fermentador en la etapa de fermentación y el producto de fermentación es etanol.
ES17746004T 2016-07-21 2017-07-14 Variantes de serina proteasa y polinucleótidos que codifican las mismas Active ES2884155T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16180498 2016-07-21
EP16195087 2016-10-21
PCT/EP2017/067881 WO2018015303A1 (en) 2016-07-21 2017-07-14 Serine protease variants and polynucleotides encoding same

Publications (1)

Publication Number Publication Date
ES2884155T3 true ES2884155T3 (es) 2021-12-10

Family

ID=59501395

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17746004T Active ES2884155T3 (es) 2016-07-21 2017-07-14 Variantes de serina proteasa y polinucleótidos que codifican las mismas

Country Status (8)

Country Link
US (1) US11891645B2 (es)
EP (1) EP3487995B1 (es)
CN (1) CN109661465A (es)
CA (1) CA3029479A1 (es)
DK (1) DK3487995T3 (es)
ES (1) ES2884155T3 (es)
MX (1) MX2019000743A (es)
WO (1) WO2018015303A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3487995B1 (en) 2016-07-21 2021-05-26 Novozymes A/S Serine protease variants and polynucleotides encoding same
EP3487996B1 (en) * 2016-07-21 2024-04-10 Novozymes A/S Serine protease variants and polynucleotides encoding same
KR102316445B1 (ko) * 2019-11-29 2021-10-26 씨제이제일제당 주식회사 신규 세린 프로테아제 변이체
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3912590A (en) 1973-01-03 1975-10-14 Novo Industri As Procedure for liquefying starch
US4316956A (en) 1980-02-06 1982-02-23 Novo Industri A/S Fermentation process
US4335208A (en) 1980-03-11 1982-06-15 Novo Industri A/S Saccharification of starch hydrolysates
JPS57174089A (en) 1981-04-20 1982-10-26 Novo Industri As Chain dividing enzyme product
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
ES2052565T3 (es) 1986-07-09 1994-07-16 Novo Nordisk As Un procedimiento para licuar una suspension de almidon o granos amilaceos.
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
JP3016587B2 (ja) 1989-12-04 2000-03-06 ザ・リサーチ・ファンデーション・オブ・ステート・ユニバーシティ・オブ・ニューヨーク 非ステロイド抗炎症剤及びテトラサイクリンの配合
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
US5231017A (en) 1991-05-17 1993-07-27 Solvay Enzymes, Inc. Process for producing ethanol
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
DK0765394T3 (da) 1994-06-03 2001-12-10 Novozymes As Oprensede Myceliopthora-laccaser og nukleinsyrer der koder for disse
AU2705895A (en) 1994-06-30 1996-01-25 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
DE69840577D1 (de) 1997-10-13 2009-04-02 Novozymes As MUTANTEN DER alpha-AMYLASE
AU6188599A (en) 1998-10-26 2000-05-15 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
CN100532561C (zh) 1999-03-22 2009-08-26 诺沃奇梅兹有限公司 新的葡糖淀粉酶及编码它的核酸序列
ATE375388T1 (de) 2001-07-27 2007-10-15 Us Gov Health & Human Serv Systeme zur stellengerichteten in-vivo-mutagenese mit oligonukleotiden
DE60325457D1 (de) 2002-01-23 2009-02-05 Royal Nedalco B V Fermentation von pentosezuckern
CN100564534C (zh) 2002-02-08 2009-12-02 金克克国际有限公司 以碳底物生产乙醇的方法
WO2004085627A1 (en) 2003-03-26 2004-10-07 Forskarpatent I Syd Ab New saccharomyces cerevisiae strains utilizing xylose
US7968318B2 (en) 2006-06-06 2011-06-28 Genencor International, Inc. Process for conversion of granular starch to ethanol
CN104017741B (zh) 2008-03-07 2018-03-09 帝斯曼知识产权资产管理有限公司 发酵戊糖的细胞
EP2326723B1 (en) 2008-08-20 2016-07-06 Novozymes A/S Processes for producing fermentation products
US9334488B2 (en) 2008-12-24 2016-05-10 Dsm Ip Assets B.V. Xylose isomerase genes and their use in fermentation of pentose sugars
US8916359B2 (en) 2009-11-30 2014-12-23 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
WO2011068803A1 (en) 2009-12-01 2011-06-09 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
CN102753680B (zh) 2009-12-11 2015-05-13 诺维信公司 蛋白酶变体
US9732332B2 (en) 2010-11-08 2017-08-15 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
EA201490216A1 (ru) 2011-07-06 2014-07-30 Новозимс А/С Варианты альфа-амилазы и кодирующие их полинуклеотиды
EP3597736A1 (en) 2011-11-21 2020-01-22 Novozymes A/S Gh61 polypeptide variants and polynucleotides encoding same
US9771570B2 (en) * 2012-09-05 2017-09-26 Novozymes A/S Polypeptides having protease activity
CN106455630B (zh) * 2014-06-27 2021-08-24 帝斯曼知识产权资产管理有限公司 改进动物饲料的营养价值的方法
EP3353292A4 (en) 2015-09-25 2019-04-03 Novozymes A/S USE OF SERINE PROTEASE TO ENHANCE ETHANOL YIELD
EP3487995B1 (en) 2016-07-21 2021-05-26 Novozymes A/S Serine protease variants and polynucleotides encoding same
EP3487996B1 (en) 2016-07-21 2024-04-10 Novozymes A/S Serine protease variants and polynucleotides encoding same

Also Published As

Publication number Publication date
US20230193327A1 (en) 2023-06-22
MX2019000743A (es) 2019-05-20
US11891645B2 (en) 2024-02-06
WO2018015303A1 (en) 2018-01-25
CN109661465A (zh) 2019-04-19
EP3487995B1 (en) 2021-05-26
DK3487995T3 (da) 2021-07-26
CA3029479A1 (en) 2018-01-25
EP3487995A1 (en) 2019-05-29

Similar Documents

Publication Publication Date Title
CA2904022C (en) Glucoamylase variants and polynucleotides encoding same
ES2656556T3 (es) Variantes de glucoamilasa y polinucleótidos que codifican las mismas
US11447763B2 (en) Serine protease variants and polynucleotides encoding same
US11203790B2 (en) Glucoamylase variants and polynucleotides encoding same
US10724054B2 (en) Use of serine proteases for improving ethanol yield
ES2884155T3 (es) Variantes de serina proteasa y polinucleótidos que codifican las mismas
US20200165591A1 (en) Combined use of at least one endo-protease and at least one exo-protease in an ssf process for improving ethanol yield
US11279921B2 (en) Glucoamylase variants and polynucleotides encoding same
US10316308B2 (en) Glucoamylase variants and polynucleotides encoding same and uses thereof